Terwijl de verkiezingen van 2016 naderen, horen we veel over 'rode staten' en 'blauwe staten'. Dat idioom is zo ingebakken dat we bijna zijn vergeten waar het oorspronkelijk vandaan kwam: een datavisualisatie.
Van dit verhaal
De natie in kaart brengen
KopenBij de presidentsverkiezingen van 2000 was de race tussen Al Gore en George W. Bush zo scherp dat omroepen de kaarten van de kiescolleges doorzochten, die ze meestal rood en blauw kleurden. Bovendien spraken ze over die schaduwen. Tim Russert van NBC vroeg zich hardop af hoe George Bush "die resterende 61 kiesstaten zou krijgen, als je wilt", en die taal werd ingebed in de populaire verbeelding. Amerika werd verdeeld in twee kleuren - gegevens gesponnen in pure metafoor. Nu praten Amerikanen zelfs routinematig over 'paarse' staten, een mentale visualisatie van politieke informatie.
We leven in een tijdperk van datavisualisatie. Ga naar een nieuwswebsite en u ziet grafische kaartondersteuning voor de presidentskandidaten; open je iPhone en de Health-app genereert gepersonaliseerde grafieken die laten zien hoe actief je deze week, maand of jaar bent geweest. Sites publiceren grafieken die laten zien hoe het klimaat verandert, hoe scholen scheiden, hoeveel huishoudelijk werk moeders doen versus vaders. En kranten merken steeds vaker dat lezers dol zijn op 'dataviz': in 2013 was het meest gelezen verhaal van de New York Times het hele jaar een visualisatie van regionale accenten in de Verenigde Staten. Het is logisch. We leven in een tijdperk van Big Data. Als we onze complexe wereld gaan begrijpen, is een krachtige manier om deze in kaart te brengen.
Maar dit is niet de eerste keer dat we de geneugten ontdekken van het omzetten van informatie in foto's. Meer dan honderd jaar geleden verdronken wetenschappers en denkers in hun eigen stroom gegevens - en om het te helpen begrijpen, bedachten ze het idee van infographics.
**********
Het idee om gegevens te visualiseren is oud: dat is tenslotte een kaart - een weergave van geografische informatie - en we hebben al ongeveer 8.000 jaar kaarten. Maar het was zeldzaam om iets anders te tekenen dan geografie. Er zijn slechts een paar voorbeelden: rond de 11e eeuw maakte een nu anonieme schrijver een grafiek van hoe de planeten door de lucht bewogen. Tegen de 18e eeuw, begonnen wetenschappers zich te concentreren op het idee om kennis visueel te ordenen. De Britse polymath Joseph Priestley produceerde een 'Chart of Biography', waarin de levens van ongeveer 2.000 historische figuren op een tijdlijn werden uitgezet. Een foto, betoogde hij, bracht de informatie over "met meer nauwkeurigheid en in veel minder tijd dan het zou [lezen] door te lezen."
Toch was datavisualisatie zeldzaam omdat gegevens zeldzaam waren. Dat begon snel te veranderen in het begin van de 19e eeuw, omdat landen informatie over hun weer, economische activiteit en bevolking begonnen te verzamelen en te publiceren. “Voor het eerst zou je met sociale feiten belangrijke sociale problemen kunnen aanpakken, als je een manier zou vinden om het te analyseren”, zegt Michael Friendly, een professor in de psychologie aan de Universiteit van York die de geschiedenis van datavisualisatie bestudeert. "De leeftijd van gegevens begon echt."
Abonneer je nu op het Smithsonian magazine voor slechts $ 12
Dit artikel is een selectie uit het juli / augustus nummer van Smithsonian magazine
KopenEen vroege innovator was de Schotse uitvinder en econoom William Playfair. Als tiener ging hij in de leer bij James Watt, de Schotse uitvinder die de stoommachine perfectioneerde. Playfair kreeg de taak patenten op te stellen, waardoor hij uitstekende teken- en tekenvaardigheden moest ontwikkelen. Nadat hij Watts laboratorium verliet, raakte Playfair geïnteresseerd in economie en ervan overtuigd dat hij zijn faciliteit ter illustratie kon gebruiken om gegevens tot leven te brengen.
"Een gemiddelde politieke econoom zou zeker een tabel hebben kunnen maken voor publicatie, maar niet noodzakelijkerwijs een grafiek, " merkt Ian Spence op, een psycholoog aan de Universiteit van Toronto die een biografie van Playfair schrijft. Playfair, die zowel gegevens als kunst begreep, was perfect gepositioneerd om deze nieuwe discipline te creëren.
In een beroemde grafiek berekende hij de prijs van tarwe in het Verenigd Koninkrijk tegen de arbeidskosten. Mensen klaagden vaak over de hoge kosten van tarwe en dachten dat de lonen de prijs opdreven. Uit de grafiek van Playfair bleek dat dit niet waar was: de lonen stegen veel langzamer dan de kosten van het product.
Playfair's handelsbalans tijd-serie grafiek, gepubliceerd in zijn Commercial and Political Atlas, 1786 (Wikipedia)"Hij wilde ontdekken, " merkt Spence op. "Hij wilde regelmatigheden of punten van verandering vinden." De illustraties van Playfair zien er vaak verbazingwekkend modern uit: in één tekende hij cirkeldiagrammen - ook zijn uitvinding - en lijnen die de grootte van de bevolking van verschillende landen vergeleken met hun belastinginkomsten. Nogmaals, de grafiek produceerde een nieuwe, scherpe analyse: de Britten betaalden veel hogere belastingen dan burgers van andere landen.
Neurologie was nog geen robuuste wetenschap, maar Playfair leek enkele van zijn principes te begrijpen. Hij vermoedde dat de hersenen afbeeldingen sneller verwerkten dan woorden: een foto was echt duizend woorden waard. "Hij zei dingen die bijna klinken als een 20e-eeuwse visieonderzoeker, " voegt Spence eraan toe. Volgens Playfair zouden gegevens 'met de ogen moeten spreken' - omdat ze 'de beste rechter van de verhoudingen waren en in staat waren om deze sneller en nauwkeuriger te schatten dan alle andere organen.' "Produceert vorm en vorm aan een aantal afzonderlijke ideeën, die anders abstract en niet verbonden zijn."
Al snel gebruikten intellectuelen in heel Europa datavisualisatie om te worstelen met de gevolgen van verstedelijking, zoals misdaad en ziekte. In Frankrijk in de jaren 1830 maakte een advocaat met de naam André-Michel Guerry kaarten met 'morele statistieken'. Hij was een van de eersten die schaduwen gebruikte om gegevens weer te geven - donkerder waar de misdaad slechter was of analfabetisme hoger bijvoorbeeld. Zijn kaarten waren controversieel, omdat ze conventionele wijsheid weerlegden. Franse sociale critici geloofden dat lager onderwijs tot criminaliteit leidde, maar de kaarten suggereerden dat dit niet waar was. "Het is duidelijk, " schreef Guerry, "de relatie waar mensen over praten bestaat niet." Data-gebaseerde sociale wetenschap was geboren.
Tegen het midden van de 19e eeuw waren de 'morele statistieken' booming en gebruikten wetenschappers datavisualisatie om epidemieën te vernietigen. Toen cholera Londen in 1854 verwoestte, bracht de arts John Snow incidenten in kaart en zag een groot cluster rond de waterpomp in Broad Street. De sceptische gemeenteraad sloot de pomp, de epidemie nam af en de kaart van Snow hielp een cruciaal idee naar voren te brengen: dat ziekten kunnen worden veroorzaakt door contact met een tot nu toe onbekende besmetting - bacteriën.
De 'roosdiagrammen' van Florence Nightingale toonden sterfgevallen door ziekte (blauw), oorlogswonden (rood) en andere oorzaken (zwart). (Wellcome Library, Londen)**********
In het midden van de 19e eeuw was slavernij een van de grootste sociale kwesties. En het was de slavernij die enkele van de meest opmerkelijke datavisualisaties van het land voortstuwde: 'slavenkaarten'.
Toen de zuidelijke staten zich in 1860 en 1861 begonnen af te scheiden, vielen de unietroepen Virginia binnen om te proberen de secessionisten terug te slaan. Maar waar moeten ze hun krachten concentreren? Te midden van de gevechten in juni 1861 produceerde de Coast Survey-afdeling van de federale overheid een fascinerende kaart van Virginia die een strategie suggereerde. Met behulp van gegevens uit de laatste volkstelling, liet de kaart de concentratie van slaven zien in elk district van Virginia: hoe donkerder het district, hoe hoger het percentage van de bevolking tot slaaf gemaakt.
Eén trend sprong meteen uit: Oost-Virginia was de hotspot van de slavernij. De westelijke regio was relatief slaafvrij. Dit suggereerde dat het Westen minder zou geven om te vechten om de slavernij te behouden; inderdaad, het zou zelfs van kant kunnen wisselen en zich bij de Unionisten aansluiten. De kaart was een diep politieke visualisatie van gegevens, wijst Susan Schulten, een historicus aan de Universiteit van Denver en auteur van Mapping the Nation . Het probeerde aan te tonen dat slechts een relatieve minderheid van Virginiërs slavernij ondersteunde en daarvan profiteerde. Het suggereerde ook een militaire strategie: probeer het westen tegen het oosten te plaatsen.
"Het was een doorbraakkaart", merkt Schulten op. “Het was een poging om te beïnvloeden hoe de regering de natie zag en hoe het leger het begreep. Het trok Lincoln's aandacht naar waar de slavernij het zwakst was. '
Kort daarna produceerde de US Coast Survey nog een andere kaart met de slavendichtheid, behalve dat deze alle zuidelijke staten omvatte. President Lincoln was gefascineerd door deze kaart en raadpleegde hem zo vaak tijdens de Burgeroorlog dat hij 'de sporen van veel dienst' toonde, zoals een officiële portretschilder, Francis Bicknell Carpenter, later herinnerde. Op een dag had Timmerman de kaart geleend om hem te onderzoeken, toen Lincoln de kamer binnenkwam.
" Je hebt me mijn kaart toegeëigend, nietwaar?" Zei Lincoln. "Ik heb er overal naar gezocht." De president zette zijn bril op, "en ging op een koffer zitten en begon er serieus over te porren", schreef Carpenter later. Lincoln wees naar de positie waar de cavaleriedivisie van Judson Kilpatrick nu tegen Confederate troepen vocht. "Het is precies zoals ik dacht dat het was", zei hij. “Hij is dichtbij ___County, waar de slaven het dikst zijn. Nu zouden we er een 'hoop' van moeten krijgen, wanneer hij terugkeert. 'Net als bij de Virginia-kaart gebruikte Lincoln de kaart om het land op een nieuwe manier te begrijpen - om te zien waar zuiderlingen het meest, en het minst, graag wilden vecht tegen het noorden.
**********
Tegen het einde van de 19e eeuw had datavisualisatie een nieuw type burger gecreëerd. Hoogopgeleiden in de VS of Europa voelden zich steeds comfortabeler om statistisch te denken. "De twee dominante woorden van onze tijd, " schreef Oliver Wendell Holmes in 1860, "zijn wet en gemiddeld."
Een echte gelovige was de Britse verpleegster Florence Nightingale. Als kind was ze zo betoverd door wiskunde dat ze informatie over haar tuinieren in tabellen organiseerde. Statistieken, zei ze, waren een hulpmiddel om 'de gedachte aan God' te kennen; als je moe was, was een blik op een tabel met getallen "perfect nieuw leven ingeblazen".
Tijdens de Krimoorlog kreeg ze de kans om haar datavaardigheden te gebruiken. Terwijl in het veld, werd Nightingale geschokt door de smerige omstandigheden van legerziekenhuizen en soldatenkazernes, die vervuild waren met uitwerpselen en ongedierte. Ze haalde koningin Victoria over om haar de kwestie te laten bestuderen, en Nightingale werkte samen met haar vriend William Farr, de belangrijkste statisticus van het land, om de sterftecijfers van het leger te analyseren. Ze ontdekten een verbluffend feit: de meeste soldaten in de Krimoorlog waren niet in de strijd omgekomen. Ze waren gestorven aan 'te voorkomen ziektes' - precies het soort veroorzaakt door vreselijke hygiëne. Ruim de hygiëne op en je redt levens.
Nightingale besefte behendig dat tabellen met cijfers en tekst te moeilijk te ontleden zouden zijn. Ze hadden, zei ze, een datavisualisatie nodig - 'om de ogen te beïnvloeden wat we niet aan het publiek kunnen overbrengen via hun woordvrije oren.' Haar uitvinding was de elegante 'poolkaart', een nieuwe variant van de taart grafiek: elk deel van de taart toonde sterfgevallen gedurende een maand van de oorlog, groter wordend naarmate de sterfgevallen toenamen, en kleurgecodeerd om de doodsoorzaken te tonen. Fans noemden het het 'roosdiagram', omdat het eruit zag als een bloem.
De koningin en het parlement konden in één oogopslag het belang van hygiëne zien; ze stelden snel een sanitaire commissie in om de omstandigheden te verbeteren en het sterftecijfer daalde. Nightingale werd een van de eerste mensen die datavisualisatie met succes gebruikte om te overtuigen - om het overheidsbeleid te beïnvloeden.
"Ze was een activiste en ze wilde het verschil maken", zegt Lynn McDonald, emeritus hoogleraar aan de Universiteit van Guelph in Ontario en redacteur van The Collected Works of Florence Nightingale .
Visualisatie regeerde zelfs hoe het Amerikaanse grondgebied zich uitbreidde. Veel Amerikanen wilden naar het westen trekken, maar elites wisten niet zeker of het binnenland geschikt was voor de landbouw. Sommigen geloofden dat het een "Great American Desert" was; Joseph Henry, een wetenschapper en secretaris van het Smithsonian Institution, beschouwde het Westen als 'een dorre afval ... ongeschikt voor landbouw', en hij produceerde kaarten die de regenvalgegevens van het leger analyseerden om zijn bewering te ondersteunen. Anderen schoten terug met hun eigen datavisualisaties die het tegenovergestelde beweerden: regenpatronen in het Westen waren cyclisch, betoogden ze, dus het land daar kon grazende dieren zeker ondersteunen. De expansionisten hebben uiteindelijk gewonnen. De visie van Manifest Destiny is niet alleen gebouwd met toespraken, maar met infographics.
**********
Dit voorjaar produceerde de Wall Street Journal een fascinerende datavisualisatie getiteld "Blue Feed, Red Feed". Op de website van het Journal creëerde "visuele correspondent" Jon Keegan een interactieve pagina die laat zien hoe Facebook eruitziet voor gebruikers die "zeer liberaal" waren of 'zeer conservatief'. Omdat de nieuwsfeed van Facebook de nadruk legt op verhalen die vrienden leuk vinden, krijgen mensen met veel liberale vrienden de neiging om veel links nieuws te zien, en vice versa. Keegan wilde lezers helpen te zien hoe hard het was in de echokamer.
De resultaten waren grimmig: toen je naar de 'blauwe feed' keek, toonde deze foto's van een sterke, vastberaden ogende Hillary Clinton. De "rode feed" toonde een post over "Hillary's giftige plannen voor het tweede amendement" met de titel "ronduit kwaad."
Het tijdperk van data lijkt zelfs een nieuwe baan te hebben gecreëerd: de datajournalist, die zich niet alleen prettig voelt om te bellen en verhalen te schrijven, maar ook om code te schrijven en gegevens te kraken. Voor het verhaal 'Blue Feed, Red Feed' analyseerde Keegan een grote reeks academische gegevens over Facebook-berichten. Dankzij programmeertalen zoals R of Python kunnen hedendaagse datajournalisten een datavisualisatie op een dagelijkse deadline maken.
"Vroeger was het nog geen tien jaar geleden dat we een geavanceerde gegevensanalyse konden maken met dezelfde snelheid waarmee iemand een verhaal kan schrijven", zegt Scott Klein, een datajournalist bij ProPublica. "En nu kunnen we dat." Nieuwsuitzendingen publiceren nu vaak hele databases met een zoekinterface, omdat lezers graag rondneuzen in de grote rivier met gegevens zelf.
"We kunnen vertrouwen op een niveau van gegevenskennis waarop we 100 jaar geleden, of zelfs 40 jaar geleden, niet konden vertrouwen", voegt Klein toe. Elke dag hebben mensen hulpmiddelen om de info van hun leven in kaart te brengen. Google heeft bijvoorbeeld onlangs zijn online spreadsheetapplicatie geüpgraded zodat zijn gebruikers automatisch visualisaties kunnen genereren op basis van alle gegevens die ze erin stoppen.
De volgende stap? Virtuele realiteit. Alberto Cairo, hoogleraar journalistiek aan de Universiteit van Miami, stelt zich voor dat hij een VR-headset opzet om een rapport te lezen of tv te kijken en visualisaties voor zich uit ziet zwemmen in 3D. "Hoe kun je een gegevensafbeelding boven een echte afbeelding plaatsen?" Vraagt hij zich af. Dat zal de vraag zijn voor de William Playfairs van deze eeuw.