Vorig jaar versloeg een kunstmatige intelligentieprogramma genaamd AlphaGo, gemaakt door het DeepMind-team van Google, een menselijke kampioen bij Go, een eeuwenoude Chinese strategiespel die in veel opzichten complexer is dan schaken. Zoals Emily Matchar destijds voor Smithsonian.com rapporteerde, was het een verbluffende prestatie, aangezien sommige mensen al in 1997 voorspelden dat het 100 jaar zou duren voordat een computer een mens zou verslaan bij Go.
Hoewel de prestatie indrukwekkend is, heeft AlphaGo de game leren spelen door eerdere games van mensen te analyseren. Maar zoals Merrit Kennedy bij NPR meldt, heeft een nieuwe versie van de kunstmatige intelligentie, AlphaGo Zero genaamd, ontdekt hoe het spel zelfstandig te beheersen, zonder menselijke input of manipulatie - een vooruitgang die grote implicaties heeft voor toekomstige AI-ontwikkeling.
Volgens een persbericht van DeepMind hebben eerdere versies van AlphaGo geleerd het spel te spelen door wedstrijden tussen professionele en sterke amateurspelers te bestuderen, waarbij de spelregels en succesvolle speelstrategieën werden geabsorbeerd. AlphaGo Zero keek echter niet naar spellen die door mensen werden gespeeld. In plaats daarvan kreeg het de regels van het spel en speelde het vervolgens tegen zichzelf, met behulp van versterkingsleren om zichzelf goede en verkeerde bewegingen en langetermijnstrategieën te leren. Terwijl de AI het spel speelde, heeft het zijn geavanceerde neurale netwerk bijgewerkt om de bewegingen van zijn tegenstander beter te voorspellen.
De onderzoekers keken toe hoe de AI het spel in realtime beheerste. Na drie dagen was het in staat om een eerdere versie genaamd AlphaGo Lee te verslaan, die de Koreaanse Go-meester Lee Sedol versloeg in 4 van de 5 spellen in 2016. Na 21 dagen overtrof het AlphaGo Master, de versie die 60 beste Go-spelers online versloeg en de 's werelds beste speler Ke Jie eerder dit jaar. De nieuwste versie versloeg AlphaGo Master 100-spellen tot 0. Na 40 dagen bereikte het spelniveaus die niemand eerder heeft gezien. Het onderzoek verschijnt in het tijdschrift Nature.
"In een korte tijd heeft AlphaGo Zero alle Go-kennis begrepen die door mensen is verzameld tijdens duizenden jaren spelen, " zegt hoofdonderzoeker David Silver van DeepMind van Google in een YouTube-video. "Soms is er eigenlijk voor gekozen om verder te gaan en iets ontdekt dat de mensen in deze periode niet eens hadden ontdekt en nieuwe kennis ontdekt die op veel manieren creatief en nieuw is."
Zoals Agence France-Presse meldt, bereikte AlphaGo Zero dit beheersingsniveau veel efficiënter dan zijn voorgangers. Terwijl de vorige iteratie 48 gegevensverwerkingseenheden had en 30 miljoen trainingsgames speelde in de loop van enkele maanden, had Zero slechts 4 verwerkingseenheden en speelde 4, 9 miljoen traininggames gedurende drie dagen. "Mensen gaan er vaak van uit dat machine learning draait om big data en enorme hoeveelheden berekeningen, maar eigenlijk zagen we bij AlphaGo Zero dat algoritmen er veel meer toe doen, " vertelt Silver aan AFP.
Maar het onderzoek gaat over meer dan alleen een bordspel beheersen. Zoals Ian Sample bij The Guardian meldt, kan dit type tabula rasa of blanco leisteen leren leiden tot een nieuwe generatie kunstmatige intelligentie voor algemene doeleinden die kan helpen bij het oplossen van problemen in velden die goed kunnen worden gesimuleerd in een computer, zoals de samenstelling van medicijnen, eiwitvouwing of deeltjesfysica. Door zijn kennis van de grond af op te bouwen zonder menselijke vooroordelen of beperkingen, kunnen de algoritmen de richting uitgaan die mensen nog niet hadden gedacht te kijken.
Hoewel veel mensen in de AI-gemeenschap AlphaGo Zero als een grote prestatie zien, vertelt Gary Marcus, psychologieprofessor aan de New York University die gespecialiseerd is in kunstmatige intelligentie, de Kennedy van NPR dat hij niet denkt dat het algoritme echt tabula rasa is omdat eerdere menselijke kennis ging in de constructie van het algoritme. Hij vindt ook niet dat Tabula Rasa AI zo belangrijk is als het lijkt. "In de biologie zijn echte menselijke hersenen geen tabula rasa ... Ik zie niet de belangrijkste theoretische reden waarom je dat zou moeten doen, waarom je veel kennis die we over de wereld hebben, zou moeten opgeven", zegt hij.
Toch is de snelle beheersing van de game Alpha Go indrukwekkend - en een beetje beangstigend.