https://frosthead.com

De Turing-test van computerintelligentie is te eenvoudig

Alan Turing, een Engelse wiskundige die een sleutelrol speelde als codebreker tijdens de Tweede Wereldoorlog, wordt soms de vader van computerprogrammering genoemd. Hij staat bekend om het voorstellen van een test voor computerintelligentie die was gebaseerd op een gezelschapsspel waarin een vragensteller het geslacht van twee mensen achter een gordijn probeerde af te leiden. Het gezelschapsspel was eenvoudig: schriftelijke vragen en antwoorden werden heen en weer gestuurd, zodat toon en toonhoogte de mensen achter het gordijn niet verraadden. De voorgestelde test van Turing schakelt een van de verborgen mensen voor een computer. Het spel moet uitzoeken welk gordijn een mens verbergt en welk kunstmatige intelligentie verbergt.

We noemen dit nu de Turing-test en deze wordt meestal op een computer gespeeld via een gesprek met een chatbot. Afgelopen zomer, een programma dat de persoonlijkheid van een 13-jarige Oekraïense jongen, "Eugene Goostman", overtuigt 33 procent van de juryleden dat het menselijk was, meldt Dan Falk voor Smithsonian .

Turing voorspelde optimistisch dat tegen het jaar 2000 een computerprogramma de jury 30 procent van de tijd zou misleiden. Maar tot nu toe worstelen de meeste chatbots om de mens echt te 'klinken'. De prestatie van dit jaar kreeg kritiek, omdat Eugene zijn aard kan verbergen achter de fouten die een tiener die niet perfect Engels spreekt, zou kunnen maken. Falk schrijft:

In een van mijn gesprekken in 2012 typte ik een simpele grap in - en de entiteit waarmee ik aan het praten was veranderde het onderwerp onmiddellijk in hamburgers. (Computerwetenschapper Scott Aaronson had onlangs een vergelijkbare ervaring toen hij met Eugene praatte via de website van de bot. Aaronson vroeg Eugene hoeveel benen een kameel heeft; het antwoordde: "Iets tussen 2 en 4. Misschien, drie? :-))") Later, toen Aaronson vroeg hoeveel benen een mier heeft, hoestte Eugene exact hetzelfde antwoord, driedubbele smiley en zo.)

Als mensen voor de gek kunnen worden gehouden door een computer die onzin spuit - niet bepaald een teken van intelligentie - moeten we waarschijnlijk een betere manier bedenken om AI te testen Voer de Lovelace-test uit, genoemd naar Ada Lovelace, de eerste computerprogrammeur.

Lovelace schreef in 1843 dat computers niet als intelligent kunnen worden beschouwd totdat ze iets origineels kunnen maken, iets waarvoor ze niet zijn geprogrammeerd, meldt Jordan Pearson voor moederbord. De Lovelace-test werd voor het eerst voorgesteld in 2001, maar Mark Riedl, een AI-onderzoeker, legt uit dat deze test, zoals oorspronkelijk bedacht, ook niet perfect is. "Ik weet niet zeker of de test echt werkt, omdat het zeer onwaarschijnlijk is dat de programmeur niet kon achterhalen hoe hun AI iets heeft gemaakt", zei hij tegen New Scientist .

Zijn update, de Lovelace 2.0-test, zou de computer eenvoudig vragen om iets origineels en creatiefs te maken: een verhaal, gedicht of afbeelding. Hij schrijft:

Als de rechter tevreden is met het resultaat, doen ze een ander, moeilijker verzoek. Dit gaat door totdat de AI wordt geacht een taak te hebben mislukt of de rechter ervan overtuigd is dat deze voldoende intelligentie heeft aangetoond. De meerdere rondes betekent dat je een score krijgt in tegenstelling tot een pass of een mislukking. En we kunnen de verschillende verzoeken van een rechter opnemen, zodat ze kunnen worden getest met veel verschillende AI's

De test dient meer als een vergelijkingsinstrument tussen AI-systemen, zegt de nieuwe wetenschapper . Maar het lijkt tenminste dat het niet kan worden belemmerd door trucs zoals de Turing-test kan. Ook vermeldenswaardig: de esthetiek van de creatie doet er niet toe. Niet alle levende, ademende mensen kunnen immers meesterwerken schilderen. Maar de meeste kunnen Pictionary spelen, merkt Riedl op.

De Turing-test van computerintelligentie is te eenvoudig