https://frosthead.com

AI învăță munca în echipă prin dominarea jocurilor video multiplayer

Calculatoarele au dominat oamenii în jocuri unu la unu ca șahul de zeci de ani, dar obținerea inteligenței artificiale (AI) pentru a coopera cu coechipierii este un pic mai complicat. Acum, cercetătorii proiectului DeepMind Google au învățat jucătorii AI să lucreze împreună în echipe, atât cu oameni, cât și cu alte computere, pentru a concura în 1999 jocul video Quake III Arena .

Edd Gent la Science raportează că atunci când AI are doar un adversar, de obicei se descurcă destul de bine, deoarece anticipează doar mișcările posibile ale unei singure minți. Dar munca în echipă este cu totul altă problemă, deoarece include acțiuni la care computerele nu sunt în mod tradițional bune, cum ar fi prezicerea cum se va comporta un grup de coechipieri. Pentru a face AI cu adevărat utilă, trebuie să învețe cum să coopereze cu alte inteligențe.

Echipa DeepMind Google explică într-o postare pe blog:

„Miliarde de oameni locuiesc pe planetă, fiecare cu propriile obiective și acțiuni individuale, dar încă capabile să se reunească prin echipe, organizații și societăți în afișe impresionante de inteligență colectivă. Aceasta este o setare pe care o numim învățare multi-agenți: mulți agenți individuali trebuie să acționeze independent, totuși învață să interacționeze și să coopereze cu alți agenți. Aceasta este o problemă extrem de dificilă - pentru că, în cazul co-adaptarea agenților, lumea se schimbă în mod constant. ”

Jocuri video multiplayer, pentru prima persoană, în care echipe de jucători aleargă în jurul lumilor virtuale, de obicei, trag tiruri sau lansatoare de grenade unul pe celălalt, este locul perfect pentru AI pentru a învăța complexitatea muncii în echipă. Fiecare jucător trebuie să acționeze individual și să ia alegeri care să beneficieze echipa în ansamblu.

Pentru studiu, echipa a instruit AI-ul pentru a juca să surprindă steagul pe platforma Quake III Arena . Regulile sunt destul de simple: Două echipe se confruntă pe un câmp de luptă asemănător labirintului. Obiectivul este să surprindă cât mai multe dintre celelalte echipe steaguri virtuale în timp ce să-și protejeze propriile, iar oricare dintre echipe surprinde cele mai multe steaguri în cinci minute de victorii. În practică, însă, lucrurile se pot complica rapid.

Echipa DeepMind a creat 30 de algoritmi de rețea neuronală și i-a determinat să se lupte reciproc pe o serie de hărți de joc generate la întâmplare. Bots au marcat puncte prin surprinderea steagurilor și împușcarea altor jucători, trimițându-i înapoi într-o zonă reînviată unde personajul lor este repornit. La început, acțiunile robotilor au apărut la întâmplare. Cu toate acestea, cu cât jucau mai mult, cu atât devin mai buni. Orice rețele neuronale care au pierdut în mod constant au fost eliminate și au fost înlocuite cu versiuni modificate ale câștigării AI La sfârșitul celor 450.000 de jocuri, echipa a încununat o rețea neurală - denumită For The Win (FTW) - a fost campioana.

Grupul DeepMind a jucat algoritmul FTW împotriva a ceea ce se numește roboți oglindă, cărora le lipsește abilitățile de învățare AI și apoi și împotriva echipelor umane. FTW a zdrobit toți provocatorii.

Apoi, grupul a organizat un turneu în care 40 de jucători umani au fost aliniați la întâmplare în calitate de coechipieri și adversari ai botului. Potrivit postării de pe blog, jucătorii umani au descoperit că roboții erau mai colaboratori decât colegii lor de echipă din viața reală. Jucătorii umani împerecheați cu agenții FTW au reușit să bată războinicii cibernetici în aproximativ 5 la sută din meciuri.

În timp ce au aflat, roboții au descoperit câteva strategii îmbrățișate mult timp de jucătorii umani, cum ar fi să stea lângă un punct reînviat al unui steag pentru a-l apuca atunci când reapare. Echipele FTW au găsit, de asemenea, o eroare pe care ar putea să o exploateze: dacă își împușcau propriul coechipier în spate, le oferea un impuls de viteză, lucru pe care îl foloseau în avantajul lor.

„Ceea ce a fost uimitor în timpul dezvoltării acestui proiect, a fost apariția unor comportamente la nivel înalt”, a declarat, pentru Gent, cercetătorul DeepMind și autorul principal Max Jaderberg. „Acestea sunt lucruri la care ne putem raporta ca jucători umani.”

Unul dintre motivele principale pentru că roboții au fost mai buni decât jucătorii umani este faptul că au fost repere rapide și precise, ceea ce le face mai rapide la egalitate decât adversarii lor umani. Dar acesta nu a fost singurul factor în reușita lor. Potrivit blogului, atunci când cercetătorii au construit într-un sfert de secundă timpul de reacție întârziat în robo-shooters, cei mai buni oameni ar putea încă să-i bată doar aproximativ 21 la sută din timp.

De la acest studiu inițial, FTW și urmașii săi au fost dezlănțuiți pe câmpul de luptă complet al Quake III Arena și au arătat că pot stăpâni o lume și mai complexă, cu mai multe opțiuni și nuanțe. De asemenea, au creat un bot care excelează la jocul de strategie ultra-complex Starcraft II.

Dar cercetarea nu se rezumă doar la crearea unor algoritmi de jocuri video mai bune. Învățarea despre munca în echipă ar putea ajuta în cele din urmă AI să lucreze în flote de mașini cu autovehicule sau poate într-o zi să devină asistenți robotici care ajută la anticiparea nevoilor chirurgilor, relatează Science 's Gent.

Totuși, nu toată lumea crede că roboții cu arcade reprezintă o adevărată muncă în echipă. Cercetătorul AI, Mark Riedl, din Georgia Tech, spune pentru The New York Times că roboții sunt atât de buni la joc, deoarece fiecare înțelege în profunzime strategiile. Dar aceasta nu este neapărat cooperarea, deoarece echipele AI nu au un element crucial al muncii în echipă umane: comunicarea și cooperarea intenționată.

Și, desigur, le lipsește și cealaltă caracteristică a experienței de joc video cooperatist: gunoi vorbind cealaltă echipă.

AI învăță munca în echipă prin dominarea jocurilor video multiplayer