https://frosthead.com

Hoe een computerprogramma alles over u kan leren van alleen uw Facebook-likes

De kans is groot dat je, toen je besloot een tv-programma, band, lokaal bedrijf of de Facebook-pagina van een product te 'liken', niet had gedacht dat die klik veel gevolgen zou hebben. Het kan uw vrienden een beetje laten zien wat uw interesses zijn en kan er soms toe leiden dat statusupdates van de pagina in uw nieuwsfeed verschijnen.

'Likes' zijn echter voor iedereen zichtbaar op Facebook, zelfs mensen die je niet als vrienden hebt goedgekeurd. En voor een nieuwe studie die vandaag is gepubliceerd in de Proceedings van de National Academy of Sciences, heeft een groep onderzoekers een computerprogramma ontwikkeld dat gebruikers 'leuk' vindt en nauwkeurig een enorme hoeveelheid informatie over hem of haar afleidt - inclusief leeftijd, etniciteit, IQ, politieke neigingen, niveau van drugsgebruik en zelfs seksuele geaardheid.

Voor de studie analyseerde de onderzoeksgroep - een samenwerking tussen het Psychometrics Lab aan de Universiteit van Cambridge en Microsoft Research Cambridge - de gegevens van 58.000 Amerikaanse Facebook-gebruikers die ervoor hadden gekozen hun profielen en 'likes' te leveren voor analyse via de myPersonality-app van Facebook. De onderzoekers voerden deze “likes” in een algoritme, speciaal gebouwd voor dit project, en vergeleken vervolgens de voorspellingen van het model over een reeks kenmerken met wat ze zeker wisten over de gebruikers, die de inhoud van hun Facebook-profielen hadden ingediend voor analyse ook.

Voor elk paar onderzochte kenmerken - bijvoorbeeld Kaukasisch of Afrikaans-Amerikaans, of Democratisch of Republikeins - kozen de onderzoekers een paar gebruikers, waarvan er één tot elke categorie behoorde, en het algoritme moest blindelings kiezen welke gebruiker past in welke categorie alleen op basis van hun 'likes'. Het was niet 100 procent perfect in het afleiden van een van de categorieën, maar het was ongelofelijk nauwkeurig in het voorspellen van vele, inclusief enkele kenmerken waarvan je waarschijnlijk niet zou denken dat ze kunnen worden geraden door je 'likes'.

Het heeft bijvoorbeeld correct afgeleid welke 95% van de tijd blanke en Afro-Amerikaan was, 88% van de tijd democraat en republikeins en 82% van de christenen en moslims. Een uitsplitsing van de nauwkeurigheid bij het voorspellen van veel van de beschouwde kenmerken (ter herinnering, een waarde van 1 zou betekenen dat het model 100 procent nauwkeurig is) is hieronder.

Het model voorspelde een reeks gebruikerskenmerken met een griezelige nauwkeurigheid. Het model voorspelde een reeks gebruikerskenmerken met een griezelige nauwkeurigheid. (Afbeelding via PNAS / Kosinski et. Al.)

Voor de meeste gebruikers was dit nauwkeurigheidsniveau niet afhankelijk van voor de hand liggende “likes” die men zou kunnen koppelen aan de beschouwde eigenschap. Bijvoorbeeld, minder dan 5 procent van de gebruikers die als homo waren geïdentificeerd, hadden het homohuwelijk of andere gerelateerde pagina's 'leuk' gevonden.

Het algoritme verzamelde in plaats daarvan tonnen schijnbaar niet-gerelateerde "likes" om gebruikers te groeperen in klassen die voorspelbare overeenkomsten deelden. Door 'likes' te vergelijken met de resultaten van een persoonlijkheidstest (ook onderdeel van de myPersonality-app), ontdekten de onderzoekers dat gebruikers die 'Thunderstorms', 'The Colbert Report', 'Science' of 'Curly Fries' 'leuk vinden' iets meer kans op een hoog IQ dan degenen die dat niet hebben. Op dezelfde manier waren mannelijke gebruikers die “Mac Cosmetics” of “Wicked The Musical” “leuk vonden” iets meer homoseksueel, terwijl degenen die “Wu-Tang Clan” of “Shaq” leuk vonden iets minder waarschijnlijk waren.

Door alle 'likes' van een gebruiker te analyseren, kon het algoritme een algemeen portret van hen maken, maar de nauwkeurigheid werd sterk beïnvloed door het aantal 'likes' voor elke gebruiker. Voor degenen aan de lage kant, met 1-10 likes, waren de voorspellingen niet beter dan kans, maar voor degenen met 150 tot 300 "likes", kon het algoritme zijn vermogen verbeteren om de gebruikerskenmerken nog beter te raden. .

De onderzoekers voerden het onderzoek voornamelijk uit om te laten zien hoeveel onze openbaar beschikbare informatie over ons kan vertellen. Je publiceert misschien niet publiekelijk je seksuele geaardheid, politieke opvattingen of dat je drugs gebruikt, maar dit soort programma kan je 'likes' analyseren en ongeacht de aardige schattingen maken.

Hoewel de gebruikers hun 'likes' en profielen hadden ingediend voor analyse via een app van derden, betekenen de standaard privacy-instellingen van Facebook dat je 'likes' voor iedereen openbaar zijn. Al gebruiken Facebook's eigen algoritmen deze likes om te dicteren welke verhalen in de nieuwsfeeds van gebruikers terechtkomen, en adverteerders hebben er toegang toe om te bepalen welke de meest effectieve advertenties zijn om u te tonen tijdens het browsen.

Hoe een computerprogramma alles over u kan leren van alleen uw Facebook-likes