In 2015 schokte een spraakmakende uitbraak van mazelen in Disneyland ouders tot een fundamentele verandering in het perspectief van vaccinaties. In de jaren daarvoor was de waargenomen behoefte aan het MMR-vaccin gedaald, en daarmee ook het percentage kinderen dat tegen mazelen werd beschermd. Nadat honderden mensen ziek werden en ouders aanzetten tot vaccinatie, klommen de tarieven weer.
Misschien zou het duidelijk moeten zijn dat het overslaan van vaccinaties tot meer zieke kinderen zou leiden, maar de meeste Amerikaanse ouders hebben zich tegenwoordig nooit zorgen hoeven te maken over mazelen. Er is een dynamische interactie tussen waargenomen risico op ziekte en waargenomen risico op vaccins, legt Chris Bauch uit. Bauch, professor in de toegepaste wiskunde aan de Universiteit van Waterloo, keek naar trends in de sociale media voor en na de uitbraak van Disneyland en merkte op dat hij, statistisch gezien, het publieke sentiment ten aanzien van vaccins kon volgen en het verhoogde ziekterisico kon zien voordat het gebeurde. Hij en zijn medewerkers publiceerden het werk in november in de Proceedings van de National Academy of Sciences .
“Iedereen heeft enige intuïtie voor kantelpunten van wipwapens. Als je aan de ene kant meer gewicht hebt dan aan de andere kant, kantelt het naar de zwaardere kant. Maar als je steeds meer gewicht toevoegt aan de andere kant, zal het uiteindelijk omvallen, 'zegt hij. "Deze kantelpunten vertonen karakteristieke signalen voordat ze zich voordoen ... de vraag is, kunnen we zoeken naar de aanwezigheid van een kantelpunt dat leidt tot een grote afname van de vaccinopname, zoals een vaccin bang?"
Vaccin schrikken zijn slechts een voorbeeld. Epidemiologen, computerwetenschappers en gezondheidswerkers passen nu computerleren toe op gegevens uit nieuwe bronnen - vooral sociale media - om voorspellende modellen te maken die vergelijkbaar zijn met de CDC's, maar veel sneller. Tweets over keelpijn of doktersbezoeken, Google zoekt naar koude remedies en zelfs uw Fitbit of Apple Watch kunnen allemaal hints geven over de gezondheidstrends in een gebied, indien gekoppeld aan locatiegegevens. En mensen volgen het en uploaden het.
"Plots hebben we toegang tot sommige gegevens", zegt Marcel Salathe, hoofd van het laboratorium voor digitale epidemiologie van het EPFL-instituut in Zwitserland. "Dat is voor mij echt een groter beeld van wat hier gebeurt, want tot op zekere hoogte is dit een ingrijpende verandering in de gegevensstroom van de traditionele epidemiologie."
Voor Bauch en Salathe, die aan het onderzoek hebben meegewerkt, was Twitter de primaire gegevensbron. Ze bouwden een bot om te zoeken naar tweets die vaccins vermelden en het sentiment van die tweets te beoordelen - of ze nu acceptatie of twijfel van vaccins aangaven. Vervolgens keken ze naar de resultaten als een complex systeem met een feedbacklus, waarbij ze een wiskundig model toepasten om te zien of het met terugwerkende kracht de vertraging van de vaccinatie zou voorspellen die tot de uitbraak van Disneyland leidde. Het deed.
In systemen als deze komen bepaalde meetbare signalen voor als het systeem een omslagpunt nadert. In dit geval zagen de onderzoekers een "kritieke vertraging", waarbij het sentiment over vaccins langzamer terugkeerde naar normaal nadat een nieuwsartikel of een tweet van een beroemdheid het had beïnvloed. Het kunnen zien van deze aanloop naar het omslagpunt betekent dat, gezien locatiegegevens, ambtenaren van de volksgezondheid campagnes zouden kunnen opzetten gericht op gebieden die een verhoogd risico lopen op een vaccin-schrik en dus een uitbraak.
Er zijn natuurlijk barrières voor het gebruik van openbaar beschikbare gegevens uit sociale mediabronnen, waaronder privacy, hoewel de onderzoekers die Twitter-gegevens gebruiken erop wijzen dat er een soort van wordt aangenomen dat als je tweet over je gezondheid, iemand deze kan lezen. Het kan ook een uitdaging zijn om computerprogramma's te maken om de informatie te ontleden, wijst Graham Dodge, mede-oprichter en CEO van Sickweather, een app-gebaseerde service die gezondheidsvoorspellingen genereert en live kaarten van ziekteverslagen.
Dodge en zijn mede-oprichters werkten samen met onderzoekers van Johns Hopkins om miljarden tweets over ziekten te analyseren. Het proces omvatte het scheiden van opzettelijke, gekwalificeerde rapporten ("Ik heb griep") van meer vage opmerkingen ("Ik voel me ziek") en zelfs misleidende bewoordingen ("Ik heb Bieber-koorts"). Ze moesten ook compenseren voor afwezige of onnauwkeurige locatiegegevens - alle Twitter-gebruikers die gewoon 'Seattle' markeren als hun locatie, bijvoorbeeld, laten ze vallen in een kleine postcode in het centrum van Seattle in plaats van verspreid over de stad.
Sickweather werd in 2013 gelanceerd met een mobiele app waarmee gebruikers ziekten rechtstreeks aan Sickweather kunnen melden en de omstandigheden op hun locatie kunnen bekijken. Klinische onderzoekers en farmaceutische bedrijven gebruiken het voorspellingsmodel van de app om enkele weken voorafgaand aan de CDC te anticiperen op ziektepieken, maar met vergelijkbare nauwkeurigheid.
"Als dit eenmaal in handen is van miljoenen mensen, in plaats van 270.000, kan dit op grote schaal de verspreiding van ziekten op veel plaatsen voorkomen", zegt Dodge.
Andere projecten hebben verschillende benaderingen geprobeerd. Griep Near You legt symptomen vast door een zelfgerapporteerde enquête, GoViral heeft een kit gestuurd voor zelfanalyse van slijm en speeksel en Google Grieptrends heeft de gegevens van dat bedrijf gebruikt om de griep te volgen en publiceerde de resultaten in de natuur, hoewel het project stopte na een misvuur in 2013. Het experiment, waarbij Google griepgerelateerde zoekopdrachten gebruikte om te schatten hoeveel mensen ziek waren, overschatte de prevalentie van de ziekte, mogelijk omdat media-aandacht voor een slecht griepseizoen ervoor zorgde dat mensen griepgerelateerde termen zochten vaker.
Hoewel Twitter kan worden gebruikt om de ziekten zelf te volgen, zegt Salathe dat enkele van de door Dodge genoemde uitdagingen verklaren waarom de meta-analyse van vaccinacceptatie zinvoller is dan zelfgerapporteerde ziekten.
"Ik weet niet zeker of Twitter daarvoor de beste gegevensbron is, omdat mensen zulke rare uitspraken over zichzelf doen wanneer ze zelf een diagnose moeten stellen", zegt Salathe. "Het gaat eigenlijk niet zozeer om het volgen van de ziekte zelf, maar eerder om het volgen van de menselijke reactie daarop."
GoViral heeft nog een voordeel, legt Rumi Chunara uit, de professor in informatica en engineering van de NYU die dat project runt. Het is niet afhankelijk van zelfrapportage, maar van laboratoriumtests die de verspreiding van virussen definitief beoordelen en deze vergelijken met symptoomrapporten.
"Er is veel kans, maar er zijn ook uitdagingen, en ik denk dat dat is waar veel van de wetenschap zich op zou kunnen concentreren, " zegt Chunara. Hoe is het een aanvulling op klinische gegevens? Hoe verminderen we ruis en passen we de informatie toe? Naar welke meer specifieke velden of menselijk gedrag kunnen we kijken?
Nieuwere technologieën - met name fitnesstrackers en andere directe gezondheidsmetingen - zullen meer, betere gegevens opleveren die minder subjectief zijn, zegt ze.
"Vaak krijgen we deze buzz van, dit is iets geweldigs, sociale media gezondheid, " zegt ze. "De vraag om eraan te wennen is iets waarvan ik denk dat de hele gemeenschap ernaar moet uitkijken."