https://frosthead.com

Je tweets kunnen voorspellen wanneer je griep krijgt

In 1854 introduceerde de Britse arts John Snow, in reactie op een verwoestende cholera-epidemie die door Londen vloog, een idee dat een revolutie teweeg zou brengen op het gebied van de volksgezondheid: de epidemiologische kaart. Door gevallen van cholera in verschillende wijken van de stad vast te leggen en op een kaart te zetten op basis van de residenties van patiënten, ontdekte hij dat een enkele besmette waterpomp verantwoordelijk was voor een groot deel van de infecties.

De kaart overtuigde hem - en uiteindelijk de overheid - dat de miasmatheorie van de ziekte (die beweerde dat ziekten zich verspreiden via schadelijke gassen) onjuist was, en dat de kiemtheorie (die terecht beweerde dat micro-organismen de schuld hadden) waar was. Ze vergrendelden de hendel van de pomp die verantwoordelijk was voor de uitbraak en signaleerden een paradigmaverschuiving die de manier waarop we omgaan met besmettelijke ziekten en dus sanitaire voorzieningen permanent veranderde.

De kaarttechnologie is heel anders, net als de ziekte, maar er is een zekere overeenkomst tussen de kaart van Snow en een nieuw project uitgevoerd door een groep onderzoekers onder leiding van Henry Kautz van de Universiteit van Rochester. Door algoritmen te creëren die grieptrends kunnen herkennen en voorspellingen kunnen doen op basis van trefwoorden in openbaar beschikbare geotagged tweets, nemen ze een nieuwe benadering van het bestuderen van de overdracht van ziekte - een die de manier waarop we de ziekte in de samenleving bestuderen en volgen kan veranderen .

"We kunnen mensen beschouwen als sensoren die naar de wereld om hen heen kijken en vervolgens rapporteren wat ze op sociale media zien en ervaren", legt Kautz uit. "Hierdoor kunnen we gedetailleerde metingen op populatieschaal uitvoeren en is geen actieve gebruikersparticipatie vereist."

Met andere woorden, wanneer we tweeten dat we zojuist zijn bedrogen door een pijnlijke hoest en koorts, verstrekken we onbewust rijke gegevens voor een enorm experiment voor de volksgezondheid, informatie die onderzoekers kunnen gebruiken om de beweging van ziekten zoals griep te volgen in hoge resolutie en realtime.

Het project van Kautz, genaamd SocialHealth, heeft tweets en andere soorten sociale media gebruikt om een ​​reeks volksgezondheidsproblemen bij te houden. Onlangs begonnen ze tweets te gebruiken om gevallen van voedselvergiftiging in restaurants in New York City te volgen door iedereen te registreren die berichten had geplaatst geotagged tweets uit een restaurant, gevolgd door hun tweets voor de komende 72 uur, controleren op vermeldingen van braken, diarree, buikpijn, koorts of koude rillingen. Daarbij ontdekten ze 480 waarschijnlijke gevallen van voedselvergiftiging.

Maar naarmate het seizoen verandert, is het hun werk om het griepvirus te volgen dat het meest in het oog springt. Google Grieptrends heeft op dezelfde manier getracht Google-zoekers te gebruiken om de griepbewegingen bij te houden, maar het model overschatte de uitbraak van vorig jaar aanzienlijk, misschien omdat de media-aandacht voor griep mensen ertoe bracht om griepgerelateerde vragen te stellen. Twitter-analyse vertegenwoordigt een nieuwe gegevensset met een paar kwaliteiten - een hogere geografische resolutie en de mogelijkheid om de bewegingen van een gebruiker in de loop van de tijd vast te leggen - die betere voorspellingen kunnen opleveren.

Om hun griepopsporingsproject te beginnen, keken de onderzoekers van SocialHealth specifiek naar New York, waar ze gedurende drie maanden ongeveer 16 miljoen geotagged publieke tweets per maand verzamelden van 600.000 gebruikers. Hieronder is een time-lapse van een New York Twitter-dag, met verschillende kleuren die verschillende frequenties van tweets op die locatie vertegenwoordigen (blauw en groen betekenen minder tweets, oranje en rood betekenen meer):

Om gebruik te maken van al deze gegevens, ontwikkelde zijn team een ​​algoritme dat bepaalt of elke tweet een rapport van griepachtige symptomen vertegenwoordigt. Eerder hadden andere onderzoekers dit eenvoudigweg gedaan door te zoeken naar trefwoorden in tweets (bijvoorbeeld 'ziek'), maar zijn team ontdekte dat de aanpak tot vals positief leidt: veel meer gebruikers tweeten dat ze ziek zijn van huiswerk dan dat ze ziek voelen.

Om dit te verklaren, zoekt het algoritme van zijn team drie woorden op een rij (in plaats van één) en overweegt hoe vaak de specifieke reeks indicatief is voor een ziekte, op basis van een set tweets die ze handmatig hadden gelabeld. De uitdrukking 'ziek van griep' is bijvoorbeeld sterk gecorreleerd met ziekte, terwijl 'ziek en moe' minder zo is. Sommige specifieke woorden - hoofdpijn, koorts, hoesten - zijn sterk verbonden met ziekte, ongeacht de volgorde van drie woorden.

Nadat deze miljoenen tweets waren gecodeerd, konden de onderzoekers er een paar intrigerende dingen mee doen. Voor starters keken ze naar veranderingen in griepgerelateerde tweets in de loop van de tijd en vergeleken ze met griepniveaus zoals gerapporteerd door de CDC, bevestigend dat de tweets nauwkeurig de algemene trend in grieppercentages vastlegden. In tegenstelling tot CDC-gegevens zijn deze echter bijna realtime beschikbaar, in plaats van een week of twee na het feit.

Maar ze gingen ook dieper en keken naar de interacties tussen verschillende gebruikers - zoals vertegenwoordigd door twee gebruikers die vanaf dezelfde locatie tweeten (de GPS-resolutie is ongeveer een half stadsblok) binnen hetzelfde uur - om te modelleren hoe waarschijnlijk het is dat een gezond persoon ziek zou worden na contact met iemand met de griep. Het is duidelijk dat twee mensen die 40 minuten van elkaar uit hetzelfde blok twitterden, niet noodzakelijkerwijs elkaar persoonlijk ontmoetten, maar de kans dat ze elkaar hebben ontmoet, is iets hoger dan twee willekeurige gebruikers.

Als gevolg hiervan, wanneer u naar een voldoende grote gegevensset van interacties kijkt, ontstaat een beeld van transmissie. Ze ontdekten dat als een gezonde gebruiker 40 andere gebruikers tegenkomt die zich ziek melden met griepsymptomen, de kans dat ze de volgende dag griepsymptomen krijgen van minder dan één procent tot 20 procent stijgt. Met 60 interacties stijgt dat aantal tot 50 procent.

Het team keek ook naar interacties op Twitter zelf, waardoor paren van gebruikers die elkaar volgen isoleerden en ze 'vriendschappen' noemden. Hoewel veel Twitter-relaties alleen op internet bestaan, komen sommige overeen met real-life interacties, en ze ontdekten dat een gebruiker die tien vrienden heeft die zichzelf als ziek melden, hebben 28 procent meer kans om de volgende dag ziek te worden. In totaal kon hun algoritme met beide soorten interacties voorspellen of een gezond persoon ziek zou worden (en erover zou tweeten) met een nauwkeurigheid van 90 procent.

We zijn nog in de vroege stadia van dit onderzoek en er zijn veel beperkingen: de meeste mensen gebruiken Twitter nog steeds niet (ja, echt) en zelfs als ze dat doen, tweeten ze misschien niet over ziek worden.

Maar als dit soort systeem verder zou kunnen worden ontwikkeld, is het gemakkelijk om allerlei toepassingen voor te stellen. Je smartphone kan je bijvoorbeeld automatisch waarschuwen als je te veel tijd hebt doorgebracht op de plaatsen die worden bezet door mensen met griep, waardoor je wordt gevraagd naar huis te gaan om te stoppen met jezelf op het pad van infectie te plaatsen. De inwoners van een hele stad kunnen zelfs worden gewaarschuwd als ze op het punt van een uitbraak staan.

Ondanks de 150 jaar dat we verwijderd zijn van de doorbraak van de ziekte-mapping van John Snow, is het duidelijk dat er nog steeds aspecten van ziekte-informatie zijn die we niet volledig begrijpen. Nu, net als toen, kon het in kaart brengen van de gegevens de antwoorden helpen opleveren.

Je tweets kunnen voorspellen wanneer je griep krijgt