![Twitter-kaart 1](http://frosthead.com/img/articles-blogs-surprising-science/87/world-according-twitter-2.jpg)
Tweets van over de hele wereld, uitgezet op locatie als onderdeel van een nieuwe studie. Klik om te vergroten. Afbeelding via First Monday / Leetaru et. al.
Het is moeilijk te begrijpen hoe snel en grondig Twitter de wereld heeft overgenomen. Slechts zeven jaar geleden, in 2006, was het een idee dat op een stuk papier werd geschetst. Nu wordt de service gebruikt door naar schatting 554 miljoen gebruikers - een aantal dat neerkomt op bijna 8 procent van alle mensen op de planeet - en naar schatting 170 miljard tweets zijn verzonden, met dat aantal met ongeveer 58 miljoen elke dag .
Al deze tweets bieden een onschatbare bron van nieuws, entertainment, conversatie en verbinding tussen mensen. Maar voor wetenschappers zijn ze ook waardevol als iets heel anders: onbewerkte gegevens.
Omdat Twitter een open API heeft (waarmee tweets kunnen worden gedownload als onbewerkte, analyseerbare gegevens) en veel tweets geotagged zijn, kunnen onderzoekers miljarden van deze tweets gebruiken en ze per locatie analyseren om meer te weten te komen over de geografie van mensen over de hele wereld. Afgelopen herfst analyseerde een team van de University of Illinois, als onderdeel van de Global Twitter Heartbeat, de taal en locatie van meer dan een miljard tweets uit de VS om geavanceerde kaarten te maken van dingen zoals positieve en negatieve emoties die werden uitgedrukt tijdens orkaan Sandy, of ondersteuning voor Barack Obama of Mitt Romney tijdens de presidentsverkiezingen.
Zoals Joshua Keating opmerkte op het blog War of Ideas van Buitenlands beleid, zijn leden van dezelfde groep, geleid door Kalev Leetaru, onlangs nog een stap verder gegaan. Zoals eerder deze week gepubliceerd in een online tijdschrift First Monday, analyseerden ze de locaties en talen van 46.672.798 tweets die tussen 23 oktober en 30 november van vorig jaar werden gepost om een prachtig portret van menselijke activiteit op de planeet te creëren, getoond op de bovenaan het bericht. Ze maakten gebruik van de Twitter-decahose, een gegevensstroom die op elk willekeurig moment 10 procent van alle tweets over de hele wereld vangt (die in totaal 1.535.929.521 bedroeg voor de periode), en zich eenvoudig richtten op de tweets met bijbehorende geografische gegevens.
Zoals de onderzoekers opmerken, komt de geografische dichtheid van tweets in veel regio's - vooral in de westerse wereld, waar computers, mobiele apparaten en Twitter allemaal op topniveau worden gebruikt - nauw overeen met de tarieven van elektrificatie en verlichtingsgebruik. Als gevolg hiervan lijken de kaarten van tweets (zoals de detailweergave van de continentale VS hieronder) veel op satellietbeelden van kunstlicht 's nachts.
![Twitter-kaart 2](http://frosthead.com/img/articles-blogs-surprising-science/87/world-according-twitter-3.jpg)
Klik om te vergroten. Afbeelding via First Monday / Leetaru et. al.
Als een test om te zien hoe goed tweets overeenkwamen met het gebruik van kunstlicht, creëerden ze de samengestelde kaart hieronder, waarin tweets worden weergegeven als rode stippen en nachtverlichting wordt weergegeven als blauw. Gebieden waar ze in frequentie overeenkomen (en elkaar effectief opheffen) worden als wit weergegeven, en gebieden waar de ene opweegt tegen de andere, blijven rood of blauw. Veel gebieden zien er uiteindelijk vrij wit uit, met enkele belangrijke uitzonderingen: Iran en China, waar Twitter is verboden, zijn opvallend blauw, terwijl veel landen met relatief lage elektrificatiesnelheden (maar waar Twitter nog steeds populair is) rood worden weergegeven.
![Twitter-kaart 3](http://frosthead.com/img/articles-blogs-surprising-science/87/world-according-twitter-4.jpg)
Klik om te vergroten. Afbeelding via First Monday / Leetaru et. al.
Het project werd nog interessanter toen de onderzoekers een geautomatiseerd systeem gebruikten om tweets per taal op te splitsen. De meest voorkomende taal op Twitter is Engels, dat wordt vertegenwoordigd in 38, 25 procent van alle tweets. Daarna kwamen Japans (11, 84 procent), Spaans (11, 37 procent), Indonesisch (8, 84 procent), Noors (7, 74 procent) en Portugees (5, 58 procent).
Het team heeft een kaart gemaakt van alle tweets geschreven in de 26 populairste talen, elk met een andere kleur, hieronder:
![Twitter-kaart 4](http://frosthead.com/img/articles-blogs-surprising-science/87/world-according-twitter-5.jpg)
Klik om te vergroten. Afbeelding via First Monday / Leetaru et. al.
Hoewel de tweets van de meeste landen worden gedomineerd door hun officiële talen, wordt in veel landen tweets in verschillende andere talen vermeld. Kijk goed genoeg en je ziet een regenboog van kleuren subtiel opduiken uit de grijze stippen (Engelse tweets) die de VS bedekken:
![Twitter-kaart 5](http://frosthead.com/img/articles-blogs-surprising-science/87/world-according-twitter-6.jpg)
Klik om te vergroten. Afbeelding via First Monday / Leetaru et. al.
Onder andere analyses keek het onderzoeksteam zelfs naar de geografie van retweeten en refereren - de gemiddelde afstand tussen een gebruiker en iemand die hij of zij retweets, evenals de gemiddelde afstand tussen die gebruiker en iemand waarnaar hij of zij eenvoudigweg verwijst in een tweet. Gemiddeld was de afstand voor een retweet 1, 115 mijl en 1, 118 voor een referentie. Er was echter een positieve relatie tussen het aantal keren dat een bepaalde gebruiker een andere gebruiker heeft geretweet of ernaar heeft verwezen en hun afstand: paren gebruikers met slechts een handvol interacties waren over het algemeen waarschijnlijk dichter bij elkaar (500- 600 mijl uit elkaar) dan die met tientallen retweets en referenties daartussen.
Dit geeft aan dat gebruikers die ver uit elkaar wonen, vaker Twitter gebruiken om regelmatig te communiceren. Een verklaring zou kunnen zijn dat de entiteiten met de meeste volgers - en dus de meeste referenties en retweets - vaak beroemdheden, organisaties of bedrijven zijn, gebruikers die mensen kennen, maar waar ze eigenlijk geen persoonlijke relatie mee hebben. Een globale kaart van retweets tussen gebruikers is hieronder:
![Twitter-kaart 6](http://frosthead.com/img/articles-blogs-surprising-science/87/world-according-twitter-7.jpg)
Klik om te vergroten. Afbeelding via First Monday / Leetaru et. al.
De krant ging nog dieper in op andere gegevens in verband met tweets: de verhouding tussen reguliere berichtgeving en het aantal tweets in een land (Europa en de VS krijgen onevenredige berichtgeving in de media, terwijl Latijns-Amerika en Indonesië over het hoofd worden gezien), de plaatsen waar Twitter heeft voegde onlangs de meeste gebruikers toe (het Midden-Oosten en Spanje) en de plaatsen waar gebruikers gemiddeld de meeste volgers hebben (Zuid-Amerika en de westkust).
Er zijn enkele kanttekeningen bij al deze gegevens. Ten eerste, hoewel het aantal geanalyseerde tweets in de tientallen miljoenen is, zijn ze nog steeds slechts 0, 3 procent van alle verzonden tweets, dus vertegenwoordigen ze mogelijk niet alle Twitter-patronen, vooral als gebruikers die geotagging inschakelen zich anders gedragen dan anderen. Bovendien zijn in de snel veranderende wereld van Twitter sommige trends mogelijk al aanzienlijk veranderd sinds vorig najaar. Maar naarmate Twitter blijft groeien en er meer gegevens beschikbaar komen, is het logisch dat dit soort analyses alleen maar populairder zal worden voor demografen, computerwetenschappers en andere onderzoekers.