https://frosthead.com

Acest joc de joacă de poker știe când să le țineți și când să le pliați

Un program de calculator numit Pluribus a reușit să beneficieze de profesorii de poker într-o serie de jocuri Texas Hold'em cu șase jucători, fără a atinge un punct de reper în cercetarea inteligenței artificiale. Este primul bot care a bătut oamenii într-o competiție multiplayer complexă.

După cum raportează cercetătorii de la laboratorul AI al Facebook și Universitatea Carnegie Mellon în revista Science, Pluribus a ieșit victorios atât în ​​meciurile dominate de algoritmi, cât și de oameni. Inițial, Merrit Kennedy scrie pentru NPR, cinci versiuni ale bot-ului înfruntat împotriva unui jucător de poker profesionist; în runda următoare de experimente, un bot a jucat față de cinci oameni. Pe o postare pe blogul Facebook, AI-ul a câștigat în medie aproximativ 5 dolari pe mână, sau 1.000 de dolari pe oră, când juca împotriva a cinci adversari umani. Această rată este considerată o „marjă decisivă de victorie” în rândul profesioniștilor de poker.

Vorbind cu Kennedy, Darren Elias, campionul mondial de poker de patru ori, explică faptul că a ajutat la antrenamentul Pluribus, concurând împotriva a patru tabele de rivali de bot și alertând oamenii de știință atunci când AI a greșit. Curând, botul „s-a îmbunătățit foarte repede, [de la] a fi un jucător mediocru la un jucător de poker la nivel mondial în câteva zile și săptămâni”. Experiența, spune Elias, a fost „destul de înfricoșătoare”.

Potrivit lui James Vincent de la Verge, Pluribus - o AI surprinzător de scăzută, antrenată cu o valoare mai mică de 150 USD de resurse de calcul cloud, a stăpânit în continuare strategia de poker, jucând împotriva copiilor de sine și învățând prin încercare și eroare. După cum remarcă Jennifer Ouellette pentru Ars Technica, botul și-a dat seama rapid că cel mai bun curs de acțiune a fost o combinație între joc și mișcări imprevizibile.

Majoritatea profesioniștilor umani evită „pariul la donk”, care găsește un jucător care încheie un tur cu un apel și începe următorul cu un pariu, dar Pluribus a îmbrățișat cu ușurință strategia nepopulară. În același timp, relatează Ouellette, AI-ul a oferit, de asemenea, dimensiuni neobișnuite de pariuri și a prezentat o randomizare mai bună decât adversarii.

„Punctul său forte este capacitatea sa de a utiliza strategii mixte”, a spus Elias, potrivit unui comunicat al CMU. „Același lucru încearcă să facă oamenii. Este o problemă de execuție pentru oameni - să facă acest lucru într-un mod perfect aleatoriu și să facă acest lucru în mod consecvent. Majoritatea oamenilor nu pot. ”

Pluribus nu este primul AI care joacă poker care învinge profesioniștii umani. În 2017, creatorii botului, Noam Brown și Tuomas Sandholm, au dezvoltat o iterație anterioară a programului numit Libratus. Această AI a învins în mod decisiv patru profesioniști de poker pe 120.000 de mâini ale Texas Hold'em cu doi jucători, dar după cum explică postarea de pe Facebook, era limitată de faptul că se confrunta doar cu un adversar la un moment dat.

Conform Will Knight a revizuirii MIT Technology Review, pokerul reprezintă o provocare pentru AI, deoarece implică mai mulți jucători și o multitudine de informații ascunse. Comparativ, jocuri precum șah și Go implică doar doi participanți, iar pozițiile jucătorilor sunt vizibile pentru toți.

Pentru a depăși aceste obstacole, Brown și Sandholm au creat un algoritm conceput pentru a prezice următoarele două sau trei mișcări ale adversarilor, în loc să măsoare pașii până la sfârșitul jocului. Deși această strategie poate părea să acorde prioritate câștigului pe termen scurt față de câștigurile pe termen lung, Vincent de Verge scrie că „incisivitatea pe termen scurt este cu adevărat tot ce ai nevoie.”

Mergând mai departe, programe multiplayer precum Pluribus ar putea fi utilizate pentru a proiecta medicamente capabile să combată bacteriile rezistente la antibiotice, precum și pentru a îmbunătăți cibersecuritatea și sistemele robotice militare. La fel de Notele Ouellette ale Ars Technica, alte aplicații potențiale includ supravegherea negocierilor multi-partide, a prețurilor produselor și a strategiilor de licitație pentru licitații.

Deocamdată, spune Brown pentru Knight, algoritmul va rămâne în mare măsură sub incidență - în principal pentru a proteja industria de poker online de a produce pierderi financiare devastatoare.

Cercetătorul concluzionează: „Ar putea fi foarte periculos pentru comunitatea de poker.”

Acest joc de joacă de poker știe când să le țineți și când să le pliați