https://frosthead.com

Deze AI die poker speelt, weet wanneer ze moeten worden vastgehouden en wanneer ze moeten worden gevouwen

Een computerprogramma genaamd Pluribus heeft pokerprofs overtroffen in een reeks Texas Hold'em-spellen zonder limiet voor zes spelers, die een mijlpaal bereiken in onderzoek naar kunstmatige intelligentie. Het is de eerste bot die mensen verslaat in een complexe multiplayer-competitie.

Zoals onderzoekers van Facebook's AI-lab en Carnegie Mellon University verslag uitbrengen in het tijdschrift Science, kwam Pluribus als overwinnaar te staan ​​in zowel door mensen als door algoritmen gedomineerde wedstrijden. Aanvankelijk schrijft Merrit Kennedy voor NPR, vijf versies van de bot tegen één professionele pokerspeler; in de volgende ronde van experimenten speelde één bot versus vijf mensen. Per Facebook-blog won de AI gemiddeld ongeveer $ 5 per hand of $ 1.000 per uur bij het spelen tegen vijf menselijke tegenstanders. Dit percentage wordt door pokerprofessionals beschouwd als een "beslissende winstmarge".

Sprekend met Kennedy, legt viervoudig World Poker Tour-kampioen Darren Elias uit dat hij Pluribus heeft helpen trainen door te concurreren tegen vier tafels van botrivalen en wetenschappers te waarschuwen wanneer de AI een fout maakte. Al snel verbeterde de bot "zeer snel, [veranderde] van een middelmatige speler in feite een pokerspeler van wereldklasse in een kwestie van dagen en weken." De ervaring, zegt Elias, was "behoorlijk eng".

Volgens James Vincent van de Verge, heeft Pluribus - een verrassend goedkope AI getraind met minder dan $ 150 aan cloud computing-middelen - de pokerstrategie verder onder de knie door tegen zichzelf te spelen en met vallen en opstaan ​​te leren. Zoals Jennifer Ouellette voor Ars Technica opmerkt, besefte de bot al snel dat zijn beste manier van handelen een combinatie van gameplay en onvoorspelbare bewegingen was.

De meeste menselijke professionals vermijden 'donk-inzetten', waarbij een speler de ene ronde eindigt met een call en de volgende begint met een bet, maar Pluribus omarmde de impopulaire strategie. Tegelijkertijd, meldt Ouellette, bood de AI ook ongebruikelijke inzetgroottes en vertoonde een betere randomisatie dan tegenstanders.

"De grote kracht is het vermogen om gemengde strategieën te gebruiken, " zei Elias volgens een CMU-verklaring. “Dat is hetzelfde wat mensen proberen te doen. Het is een kwestie van uitvoering voor de mens - om dit op een volkomen willekeurige manier te doen en consequent te doen. De meeste mensen kunnen het gewoon niet. '

Pluribus is niet de eerste poker spelende AI die menselijke professionals verslaat. In 2017 ontwikkelden de makers van de bot, Noam Brown en Tuomas Sandholm, een eerdere iteratie van het programma genaamd Libratus. Deze AI versloeg beslist vier pokerprofs in 120.000 handen van Texas Hold'em voor twee spelers, maar zoals de Facebook-blogpost verklaart, werd beperkt door het feit dat het slechts met één tegenstander tegelijk werd geconfronteerd.

Volgens Will Knight van de MIT Technology Review vormt poker een uitdaging voor AI omdat het meerdere spelers en een overvloed aan verborgen informatie omvat. Ter vergelijking: bij spellen als schaken en Go zijn slechts twee deelnemers betrokken en de posities van spelers zijn voor iedereen zichtbaar.

Om deze obstakels te overwinnen, creëerden Brown en Sandholm een ​​algoritme dat was ontworpen om de volgende twee of drie zetten van de tegenstander te voorspellen in plaats van hun stappen aan het einde van het spel te peilen. Hoewel deze strategie misschien prioriteit geeft aan winst op korte termijn boven winst op lange termijn, is de Vincent van Verge schrijft dat "kortdurende incisiviteit echt alles is wat je nodig hebt."

In de toekomst kunnen multiplayer-programma's zoals Pluribus worden gebruikt om medicijnen te ontwikkelen die antibioticaresistente bacteriën kunnen bestrijden en om cybersecurity en militaire robotsystemen te verbeteren. Zoals De opmerkingen van Ars Technica over Ouellette, andere mogelijke toepassingen zijn onder meer toezicht houden op onderhandelingen met meerdere partijen, prijsbepaling van producten en brainstormen over biedstrategieën voor veilingen.

Voorlopig vertelt Brown aan Knight dat het algoritme grotendeels geheim blijft, voornamelijk om de online pokerindustrie te beschermen tegen verwoestende financiële verliezen.

De onderzoeker concludeert: "Het kan erg gevaarlijk zijn voor de pokergemeenschap."

Deze AI die poker speelt, weet wanneer ze moeten worden vastgehouden en wanneer ze moeten worden gevouwen