https://frosthead.com

Big data of teveel informatie?

We weten allemaal dat er veel meer informatie in onze werelden is dan vroeger. Over hoeveel meer, nou ja, de meesten van ons hebben geen idee.

gerelateerde inhoud

  • Infographics door de eeuwen heen Markeer de visuele schoonheid van de wetenschap
  • Waarom Google-grieptrends de griep (nog) niet kunnen volgen

Hier is een onschatbare goudklomp over al die info, complimenten van Dave Turek, de man die verantwoordelijk is voor de ontwikkeling van supercomputers bij IBM: vanaf het jaar 2003 en terugwerkend tot het begin van de menselijke geschiedenis, hebben we volgens IBM's berekeningen vijf exabytes gegenereerd - dat is vijf miljard gigabytes aan informatie. Vorig jaar hadden we om de twee dagen zoveel gegevens verzameld. Voor volgend jaar, voorspelt Turek, zullen we het om de 10 minuten doen.

Maar hoe is dit mogelijk? Hoe zijn gegevens zo'n digitale kudzu geworden? Eenvoudig gezegd: elke keer dat uw mobiele telefoon zijn GPS-locatie verzendt, elke keer dat u iets online koopt, elke keer dat u op de knop Vind ik leuk op Facebook klikt, plaatst u nog een digitaal bericht in een fles. En nu zijn de oceanen zo goed als bedekt.

En dat is slechts een deel van het verhaal. Tekstberichten, klantrecords, ATM-transacties, beveiligingscamera-afbeeldingen ... de lijst gaat maar door. Het modewoord om dit te beschrijven is 'Big Data', hoewel dat nauwelijks recht doet aan de schaal van het monster dat we hebben gecreëerd.

Het is het nieuwste voorbeeld van technologie die ons vermogen overtreft om het te gebruiken. In dit geval zijn we niet begonnen met het inhalen van ons vermogen om informatie vast te leggen, daarom is een favoriete trope van management experts tegenwoordig dat de toekomst toebehoort aan bedrijven en overheden die alle gegevens kunnen begrijpen die ze verzamelen, bij voorkeur in realtime.

Bedrijven die elke digitale broodkruimel die hun klanten achterlaten kunnen interpreteren, hebben een voorsprong, niet alleen wie wat het afgelopen uur heeft gekocht, maar of ze erover hebben getweet of ergens een foto in de werveling van sociale netwerken hebben gepost. Hetzelfde geldt voor de steden die gegevens kunnen verzamelen van de duizenden sensoren die nu stedelijke landschappen stippelen en de grillen van het stadsleven, zoals verkeersstromen, in een wetenschap veranderen.

Het is niet verwonderlijk dat politieke campagnes al een duik nemen en woedend mijnen verzamelen als onderdeel van hun focus op “nanotargeting” kiezers, zodat ze precies weten hoe ze ze kunnen pitchen voor hun stemmen en geld. Een van de conclusies die analisten hebben getrokken, volgens de New York Times- columnist Thomas Edsall, is dat Republikeinen een voorkeur tonen voor "The Office" en Cracker Barrel restaurants, terwijl Democraten vaker kijken naar "Late Night With David Letterman" en eten bij Chuck E . Kaas.

Deze haast om digitaal flotsam te interpreteren verklaart waarom Google vorige week aankondigde dat het een product gaat verkopen dat het BigQuery noemt, software die terabytes aan informatie in seconden kan scannen. En waarom een ​​startup met de naam Splunk, die technologie heeft die enorme hoeveelheden klant- en transactiegegevens kan analyseren, de waarde van zijn aandelen zag stijgen met bijna 90 procent toen het vorige maand openbaar werd gemaakt. Dit voor een bedrijf dat vorig jaar $ 11 miljoen verloor.

Opkomst van de datawetenschapper

Maar zelfs toegang tot de beste tools voor het ontcijferen van gegevens is geen garantie voor grote wijsheid. Zeer weinig bedrijven hebben mensen in dienst bij de training, niet alleen om enorme hoeveelheden gegevens te evalueren, inclusief heel veel ongestructureerde weetjes van miljoenen Facebook-pagina's en smartphones, maar ook om er daadwerkelijk iets mee te doen.

Vorig jaar bracht het McKinsey Global Insitute een rapport uit waarin "Big Data" werd beschreven als de "volgende grens voor innovatie", maar ook werd voorspeld dat in 2018 bedrijven in de VS een ernstig tekort aan talent zullen hebben als het gaat om de nodige analytische vaardigheden - zoveel 190.000 mensen. En het beweert dat nog eens 1, 5 miljoen managers moeten worden getraind om strategische beslissingen te nemen met de stroom van gegevens die op hen afkomt.

Niet iedereen gelooft echter in de magie van Big Data. Peter Fader, professor marketing aan Penn's Wharton School of Business, is er niet van overtuigd dat meer gegevens beter zijn. Niet dat hij vindt dat een bedrijf niet moet proberen zoveel mogelijk te leren over zijn klanten. Het is alleen dat er nu zoveel aandacht is voor het verzamelen van alle gegevens dat hij denkt dat volume wordt gewaardeerd boven echte analyse.

Dit is de samenvatting van Fader uit een recent interview met MIT's Technology Review: “Zelfs met oneindige kennis van gedrag uit het verleden hebben we vaak niet genoeg informatie om zinvolle voorspellingen te doen over de toekomst. In feite, hoe meer gegevens we hebben, hoe meer vals vertrouwen we zullen hebben ... Het belangrijke deel is om te begrijpen wat onze limieten zijn en om de best mogelijke wetenschap te gebruiken om de gaten te vullen. Alle gegevens ter wereld zullen dat doel nooit voor ons bereiken. ”

Wie zijn je gegevens?

Hier is een voorbeeld van hoe Big Data wordt gebruikt om grote problemen op te lossen:

  • Ze weten wanneer ze slecht of goed zijn geweest: terwijl de meeste bedrijven zich richten op het analyseren van hun klanten, scoort Amazon punten door Big Data te gebruiken om die van hen te helpen.
  • De studie van hengsten: wil je weten welke stieren de meest productieve melkkoeien voortbrengen? De zuivelindustrie heeft een manier bedacht om de cijfers te kraken.
  • Diagnose door gegevens: Onderzoekers van SUNY Buffalo analyseren enorme hoeveelheden gegevens in hun poging om te bepalen of er een verband is tussen multiple sclerose en omgevingsfactoren, zoals onvoldoende blootstelling aan zonlicht.
  • Op zoek naar problemen: een bedrijf genaamd Recorded Future verzamelt informatie van sociale netwerken en overheids- en financiële sites om voorspellingen te doen over hoe bevolkingsgroei, watertekorten en extreem weer kunnen leiden tot toekomstige politieke onrust en terrorisme.

Videobonus: gegevens vastleggen is één ding. Het aantrekkelijk maken en begrijpelijk maken is een hele andere uitdaging. David McCandless zet in op de kracht van 'informatiekaarten' in deze TED-talk.

Big data of teveel informatie?