Vodné mučenie - analógia analytiky zachádza príliš ďaleko

kvapková analytika

Dáta, podobne ako voda, majú veľa podôb. Ľudská myseľ sa vyvinula tak, aby odfiltrovala väčšinu údajov, ktoré sa k nám dostanú, pretože je ich jednoducho toľko.

Keď otvoríte oči a uši, dáta sú všade. Farba steny, zvuk klimatizácie a vôňa kávy vášho suseda sa považujú za vlhkosť. Voda je stále vo vzduchu, ale nie je užitočné venovať jej veľkú pozornosť.

Keď sa voda skondenzuje na hmlu, prinúti vás to vidieť a o to zložitejšie porozumenie svetu okolo vás urobíte. Neúplné súbory údajov, poškodené údaje, zlá veda, falošné závery a kognitívne predsudky - to všetko vedie k tomu, že sa strácate v hmle.

Dáta padajú ako dážď. Keď je toho málo, je to divne neuspokojivé - stačí to na to, aby ste si zašpinili auto a zamiešali rozhovor. Pristihnete sa, že si utierate miesto na okuliaroch, keď niekto chrlí nejaký náhodný údajový bod zozbieraný z nejakého nejasného zdroja.

  • Zatuchnutá voda v plytkom rybníku je nebezpečné. Údaje zhromaždené z nespoľahlivej dodávky, ktoré nie sú očistené ani normalizované a nechajú stagnovať, môžu ľahko viesť k chybným záverom.
  • A stály pramienok vody môže stačiť na vyplnenie jedálne alebo na udržanie lesného ekosystému. Iba tri dátové body (počet odoslaných e-mailov, oproti otvoreným a kliknutým) môžu udržať marketingový program.
  • A zdravší tok na kúpanie je možné použiť množstvo údajov vo forme malého potoka. Nepretržitý tok údajov umožňuje porovnávanie a historické porovnanie. Optimalizáciu cieľovej stránky je možné dosiahnuť pomocou stabilných údajov o konverziách.
    A skromná rieka môže poháňať mlyn na pílenie dreva alebo na mletie pšenice. Nástroju na odporúčanie stačí spoľahlivý príspevok od niekoľkých prítokov, aby sa zvýšila hodnota nákupných košíkov.
  • A vodopád dokáže poháňať obrovské vodné koleso a dostatočný prílev informácií môže riadiť systém s dynamickým obsahom v reálnom čase.
  • A rieka je dostatočne široký a hlboký, aby podporil celé odvetvie dopravy. Dostatočné množstvo údajov môže vyplávať na nákladné člny a nákladné lode v podobe zbierky súborov cookie z reklamných sietí, agregátorov údajov programu vernostných kariet a sprostredkovateľov údajov.

Keď údaje prídu v očakávanom množstve v predpokladanom čase, môžu sa zachytiť, nasmerovať a použiť. Zavlažovacie systémy, priehrady a nádrže poskytujú pocit kontroly a umožňujú výstavbu neustále sa rozširujúcej infraštruktúry s kanálmi, plavebnými komorami a priehradami. Dátové sklady boli postavené na menej dôveryhodných tokoch.

Čistota je vedľa zbožnosti

Čistá voda je nevyhnutná pre úspech života, zavlažovanie, prevádzkovanie elektrární atď. Definícia pojmu „čistá“ sa môže pre tento účel zmeniť; je v poriadku, ak sú vo vode riasy, ktoré ochladzujú elektráreň, a je neprijateľné, ak je v pitnej vode viac ako 10 častí na miliardu arzénu.

Údaje sú rovnaké. V aplikácii priamej pošty je to, či máte titul osoby (pán, pani, pani), bezvýznamné ... pokiaľ nepošlete poštou lekárom. Špinavé dáta vás však zakaždým potknú.

Ako hlavný vedecký pracovník v USA DJ Patil, prednesené na samite prvého kola CTO: „Ak nepremýšľate o tom, ako udržať svoje údaje čisté od samého začiatku, ste f ^ ¢ & ed. Zaručujem to. Pokúšať sa to vyčistiť, potom to bude trvať minimálne mesiace. “

Ak ohrejete vodu na teplotu varu, môže to byť energiou celej priemyselnej revolúcie. Zdá sa, že dáta robia to isté. Od okamihu, keď počítače mohli ukladať aj počítať, sa údaje zhromažďovali tak rýchlo, ako je možné na ich vytvorenie vytvoriť pamäťové zariadenie.

Dátové jazero

Keď údaje z týchto prítokov prúdia cez motory mlynov, všetko končí v jazere za priehradou. Pretože dáta sú riadene poskytované, napájajú turbíny v dátovom priemysle; tie obrovské motory spracovania údajov s názvami ako Google a Facebook. Nebude tu sucho.

A nakoniec je tu hlboká kaluža vody, ktorá čaká na ponorenie analytika. Potápačská výbava a oštepová zbraň v ruke, analytik skúma hlbinu, mapuje novú zem a objavuje nové druhy. Je to veľmi vzrušujúce obdobie byť prieskumníkom údajov.

Preto sa toľko z nich dostavuje na konferenciu Summit eMetrics od roku 2002. Ďalšia príležitosť je v Bostone od 27. septembra do 1. októbra 2015.

Registrácia na samit eMetrics

Príliš ďaleko

A čo sila dát na vytesanie ďalšieho Grand Canyonu? A čo ľadové topenie štruktúrovaných dát? Ako zaobchádzame s odpadovou vodou vo svete, ktorý si čoraz viac uvedomuje svoje súkromie?

To sú otázky na inokedy a voda pod mostom.

Čo si myslíte?

Táto stránka používa Akismet na zníženie spamu. Zistite, ako sa spracúvajú údaje vašich komentárov.