Pentru oameni, șahul poate dura toată viața să stăpânească. Însă noul program de inteligență artificială Google DeepMind, AlphaZero, se poate învăța să cucerească tabloul în câteva ore.
Bazându-se pe succesul său trecut cu suita AlphaGo - o serie de programe de calculator concepute pentru a juca jocul de bord chinez Go - Google se mândrește cu faptul că noul său AlphaZero atinge un nivel de „performanță supraumană” la nu doar un joc de masă, ci trei: Go, șah și shogi (în esență, șah japonez). Echipa de oameni de informatică și ingineri, condusă de David Silver de la Google, și-a raportat concluziile recent în revista Science .
„Înainte de aceasta, cu ajutorul învățării automate, ai putea să-ți faci o mașină să facă exact ceea ce îți dorești, dar numai acest lucru”, spune Ayanna Howard, expertă în calculatoare interactive și inteligență artificială la Institutul de Tehnologie din Georgia, care nu a participat la cercetare. „Dar AlphaZero arată că puteți avea un algoritm care nu este atât de [specific], și că puteți învăța în anumiți parametri.”
Programarea inteligentă a AlphaZero crește cu siguranță antepusul asupra gameplay-ului pentru oameni și mașini, dar Google și-a pus multă vreme privirea pe ceva mai mare: inteligența în domeniul ingineriei.
Cercetătorii sunt atenți să nu susțină că AlphaZero este pe punctul de a domina lumea (alții au fost puțin mai repede să sară arma). Cu toate acestea, Silver și restul echipei DeepMind sunt deja speranți că vor vedea într-o zi un sistem similar aplicat proiectării medicamentelor sau științei materialelor.
Deci, ce face AlphaZero atât de impresionant?
Jocul a fost mult timp venerat ca un standard de aur în cercetarea inteligenței artificiale. Jocurile structurate și interactive sunt simplificări ale scenariilor din lumea reală: Deciziile dificile trebuie luate; câștigurile și pierderile cresc miza; și predicția, gândirea critică și strategia sunt cheie.
Codificarea acestui tip de abilitate este dificilă. IA-uri mai vechi de joc - incluzând primele prototipuri ale AlphaGo-ului inițial - au fost în mod tradițional pompate de coduri și date pentru a imita experiența obținută în mod obișnuit în anii de joc natural, uman (în esență, un pasiv, un program de cunoștințe derivat din programator). Cu AlphaGo Zero (cea mai recentă versiune a AlphaGo) și acum AlphaZero, cercetătorii au oferit programului o singură intrare: regulile jocului în cauză. Apoi, sistemul a coborât și a învățat activ trucurile comerțului însuși.

Această strategie, numită învățare de consolidare a jocului de sine, este exact exact cum pare: Pentru a se antrena pentru ligi mari, AlphaZero s-a jucat în iterație după iterație, respectându-și abilitățile prin încercare și eroare. Iar abordarea brute-force a dat rezultate. Spre deosebire de AlphaGo Zero, AlphaZero nu joacă doar Go: Poate să bată și cele mai bune AIs din business la șah și shogi. Procesul de învățare este, de asemenea, impresionant de eficient, necesitând doar două, patru sau 30 de ore de auto-tutelare pentru a depăși programe special concepute pentru maestrul shogi, șah și, respectiv, Go. Howard spune că autorii studiului nu au raportat nicio situație în care AlphaZero se va descurca în cap cu un om real. (Cercetătorii ar fi putut presupune că, având în vedere că aceste programe își clocotesc în consecință omologii lor umani, o astfel de potrivire ar fi fost inutilă.)
AlphaZero a putut, de asemenea, să-și găsească Stockfish (actualul maestru de șah al AI nedorit) și Elmo (fostul expert AI în shogi), în ciuda evaluării a mai puține mișcări posibile pe fiecare tură în timpul jocului. Dar, deoarece algoritmii în cauză sunt diferiți în mod inerent și pot consuma cantități diferite de putere, este dificil să comparăm direct AlphaZero cu alte programe mai vechi, subliniază Joanna Bryson, care studiază inteligența artificială la Universitatea din Bath din Regatul Unit și a făcut-o. nu contribuie la AlphaZero.
Google păstrează mămica despre o mulțime de printuri fine pe software-ul său, iar AlphaZero nu face excepție. Cu toate că nu știm totul despre consumul de energie al programului, ceea ce este clar este acesta: AlphaZero trebuie să împacheteze muniție serioasă de calcul. În acele ore slabe de antrenament, programul s-a menținut foarte ocupat, angajându-se în zeci sau sute de mii de runde de antrenament pentru ca strategia sa de joc de masă să fie înglobată - mult mai mult decât ar avea nevoie de un jucător uman (sau, în cele mai multe cazuri, ar putea chiar realizează) în urmărirea competenței.
Acest regim intensiv a folosit, de asemenea, 5.000 din unitățile de procesare de învățare automată a mașinilor, sau TPU-uri, care, conform unor estimări, consumă aproximativ 200 de wați pe cip. Indiferent de felul în care îl feliați, AlphaZero necesită mult mai multă energie decât un creier uman, care rulează pe aproximativ 20 de wați.
Trebuie luat în considerare consumul absolut de energie al AlphaZero, adaugă Bin Yu, care lucrează la interfața statisticilor, a învățării automate și a inteligenței artificiale la Universitatea din California, Berkeley. AlphaZero este puternic, dar s-ar putea să nu fie bun pentru buck - mai ales atunci când se adaugă în orele de persoană care au intrat în crearea și execuția sa.
Din punct de vedere energetic scump sau nu, AlphaZero face un splash: majoritatea AIs sunt hiper-specializate pe o singură sarcină, ceea ce face ca acest nou program - cu tripla sa amenințare de joc - să fie remarcabil de flexibil. „Este impresionant faptul că AlphaZero a putut folosi aceeași arhitectură pentru trei jocuri diferite”, spune Yu.
Deci da. Noua IA Google a stabilit o nouă marcă în mai multe moduri. E rapid. Este puternic. Dar asta face inteligent?
Acesta este locul în care definițiile încep să se obosească. "AlphaZero a putut să învețe, pornind de la zero fără cunoștințe umane, să joace fiecare dintre aceste jocuri la nivel suprauman", a spus DeepMind Silver într-o declarație pentru presă.
Chiar dacă expertiza jocului de masă necesită acuitate mentală, toate reprezentanții pentru lumea reală își au limitele. În iterația sa actuală, AlphaZero iese în joc câștigând jocuri create de oameni - ceea ce nu poate justifica eticheta potențial alarmantă de „suprauman”. În plus, dacă este surprins cu un nou set de reguli de la jumătatea jocului, AlphaZero ar putea să se încurce. Pe de altă parte, creierul uman real poate stoca mult mai mult de trei jocuri de masă în repertoriul său.
Mai mult, compararea valorii de bază a AlphaZero cu o tabula rasa (ardezie goală) - așa cum fac cercetătorii - este o întindere, spune Bryson. Programatorii o alimentează în continuare cu un morsel crucial al cunoștințelor umane: regulile jocului pe care urmează să îl joace. „Mai are mult mai puțin să continuăm decât a avut orice”, adaugă Bryson, „dar cel mai fundamental este că este totuși dat reguli. Acestea sunt explicite. ”
Și acele reguli neplăcute ar putea constitui o cârcă importantă. „Chiar dacă aceste programe învață să funcționeze, au nevoie de regulile drumului”, spune Howard. „Lumea este plină de sarcini care nu au aceste reguli.”
Când vine push to shove, AlphaZero este o actualizare a unui program deja puternic - AlphaGo Zero, explică JoAnn Paul, care studiază inteligența artificială și vise de calcul la Institutul Politehnic din Virginia și la Universitatea de Stat și nu a fost implicat în noile cercetări. AlphaZero folosește multe dintre aceleași blocuri de construcție și algoritmi ca AlphaGo Zero și constituie în continuare doar un subset de adevărate smart-uri. „Am crezut că această nouă dezvoltare a fost mai evolutivă decât revoluționară”, adaugă ea. „Niciunul dintre acești algoritmi nu poate crea . Inteligența se referă și la povestiri. Își imaginează lucruri care încă nu sunt acolo. Nu ne gândim în acești termeni în computere. "
O parte a problemei este că nu există încă un consens asupra unei adevărate definiții a „inteligenței”, spune Yu - și nu doar în domeniul tehnologiei. „Încă nu este clar cum ne antrenăm ființele cu gândire critică sau cum folosim creierul inconștient”, adaugă ea.
În acest punct, mulți cercetători cred că există probabil mai multe tipuri de informații. Și atingerea într-una departe de a garanta ingredientele pentru alta. De exemplu, unii dintre cei mai deștepți oameni acolo sunt îngrozitori la șah.
Cu aceste limitări, viziunea lui Yu despre viitorul inteligenței artificiale partenerează oamenii și mașinile într-un fel de coevoluție. Mașinile vor continua cu siguranță să exceleze la anumite sarcini, explică ea, dar intrarea și supravegherea umană pot fi întotdeauna necesare pentru a compensa neautomatele.
Desigur, nu se spune cum se vor agita lucrurile în arena AI. Între timp, avem multe de gândit. „Aceste computere sunt puternice și pot face anumite lucruri mai bine decât o poate omul”, spune Paul. „Dar asta rămâne în lipsa misterului inteligenței”.
Acest articol a fost publicat inițial pe NOVA.