Heb je de Watson-supercomputer van IBM vorige week twee mensen zien bespelen die Jeopardy spelen en ben je nu bang voor een toekomst bestuurd door deze wirwar van draden en circuits met echt saaie stemmen? Nee? Ik ook niet. En niet alleen omdat ik weiger te worden geïntimideerd door een uitvinding die meer informatie bevat dan ik me zou kunnen herinneren en sneller reflexen heeft dan enig ander mens. Zie je, computers zijn gewoon niet goed in sommige dingen, waaronder wetenschap, zoals ik onlangs werd herinnerd tijdens een sessie bij de recente bijeenkomst van de American Association for the Advancement of Science.
Ontdekkingen in de wetenschap hangen vaak af van het vinden van een stukje gegevens, zoals een rare groene wolk in een afbeelding van een sterrenstelsel, en zeggen: "dat is grappig." Computers zijn daar niet zo goed in en mensen zijn ook veel beter in het visueel herkennen van patronen. Dat maakt ons veel beter voorbereid om bijvoorbeeld een afbeelding van een melkwegstelsel te bekijken en deze correct te classificeren. Dat is hoe de eerste Galaxy Zoo werd geboren - uit de noodzaak om alle sterrenstelsels te identificeren die worden afgebeeld door de Sloan Digital Sky Survey.
Dat eerste project eindigde in 2007 met de classificatie van 10 miljoen sterrenstelsels (en de identificatie van tal van vreemde dingen, waaronder Hanny's Voorwerp, de rare groene wolk die ik hierboven noemde), en nu is er een hele Zooniverse, waar je wetenschappers kunt helpen om voltooi taken zoals het vinden van planeten, het bestuderen van de maan of het terugkrijgen van weerobservaties van schepen van de Royal Navy uit de Eerste Wereldoorlog. Maar zelfs mensen die niet actief deelnemen aan projecten zoals deze, worden gedolven als menselijke computers voor grote projecten - hoewel je het misschien niet beseft.
Weet je wanneer je online een formulier invult en in dat vak komt met het moeilijk te lezen wirwar van letters of woorden? Dat wordt een CAPTCHA genoemd. Je kunt erachter komen wat de letters zeggen of spellen, maar een computer kan dat niet. Het is een blok voor spammers. De nieuwste iteratie wordt een reCAPTCHA genoemd en deze vakken bevatten twee woorden. Wat je misschien niet is opgevallen, is dat wanneer je die woorden decodeert, je Google helpt om boeken te digitaliseren. Google stopt een woord dat het kent en een tweede woord dat zijn digitaliseringsprogramma als een woord heeft gemarkeerd, maar zich niet in dat vak kan identificeren en u vraagt wat beide zijn. Door elke dag 200 miljoen van die woorden te decoderen, hebben we Google geholpen miljoenen boeken te digitaliseren.
Chris Lintott, een astronoom in Oxford en een van de oprichters van Zooniverse, merkte op dat het tij aan gegevens binnenkort zo groot zal zijn dat het zal overweldigen wat mensen aankunnen. Wanneer de Large Synoptic Survey-telescoop over een paar jaar online gaat, zal deze bijvoorbeeld om de drie dagen de lucht scannen en evenveel gegevens produceren als de Sloan Digital Sky Survey in jaren. Op dat moment zullen mensen nog steeds nodig zijn, zei Lintott, om de machines te trainen.