În urmă cu aproape 20 de ani, computerul IBM Deep Blue a bătut campionul mondial de șah Garry Kasparov la propriul său joc. A fost un moment esențial în istoria inteligenței artificiale - prima dată când un computer a învins în mod rotund un campion de șah uman.
Dar, pentru toți cei care au văzut acest lucru ca un semn că revoluția AI a fost la distanță, criticii au spus „nu atât de repede.” Șahul a fost relativ simplu de spart, au spus ei. Adevăratul test al AI ar fi un computer care ar putea să bată un campion uman la Go, complexul joc de strategie antic chinez gândit să implice intuiția și înțelegerea esteticii. Și în ziua aceea nu era probabil să vină în curând.
'' Poate trece o sută de ani înainte ca un computer să bată oamenii de la Go - poate chiar mai mult timp '', a declarat pentru New York Times astrofizicianul și fanul lui Piet Hut , în 1997. 'Dacă o persoană destul de inteligentă ar învăța să joace Go, într-un câteva luni a putut bate toate programele de calculator existente. Nu trebuie să fiți Kasparov. ''
Dacă un computer l-ar învinge pe un campion Go, Times s-a oprit, ar fi „un semn că inteligența artificială începe cu adevărat să devină la fel de bună ca realul.”
Ei bine, oameni buni, acel moment a sosit, cu o sută de ani înainte de termen. AlphaGo, un program dezvoltat de echipa de inteligență artificială DeepMind de la Google, a bătut campionul European Go, Fan Hui 5 la 0.
Descoperirile au fost raportate astăzi în revista Nature .
Go începe pur și simplu, cu o grilă de 19 pe 19 și două culori de piese (numite pietre), negru pentru un jucător, alb pentru celălalt. Jucătorii se întorc punându-și pietrele pe intersecții goale - punctele de trecere a două linii de grilă. Încet, fiecare jucător încearcă să încercuiască pietrele celuilalt jucător, moment în care sunt capturate și mutate de pe bord. În cadrul unui moment dat, pot exista mai multe cercuri în curs și este adesea dificil de spus cine este pe cale să surprindă cine.
"Jocul lui Go a fost privit de multă vreme ca cel mai provocator dintre jocurile clasice pentru inteligența artificială, datorită spațiului său de căutare enorm și a dificultății de a evalua pozițiile și mișcările de bord", scriu autorii lucrării.
AlphaGo „învață” atât prin instruirea de la experți umani, cât și prin practică, jucând împotriva ei înșiși. Întrucât Go are prea multe mișcări posibile pentru ca un computer să creeze pur și simplu datele atunci când ia următoarea decizie - un punct important care se bazează pe eforturile anterioare de a juca Go-AI - AlphaGo folosește în schimb două „rețele neuronale profunde”. O rețea se numește „Rețeaua de politici” - aceasta oferă computerului o mână de mișcări promițătoare pe care trebuie să le ia în considerare, bazate pe jocuri trecute, astfel încât nu trebuie să se zguduie prin fiecare mișcare posibilă. „Rețeaua valorică” reduce adâncimea căutării - adică, în loc să caute până la sfârșitul jocului, la sute de mutări, programul poate arăta doar o mână de mișcări pentru a alege.
Aceasta este o afacere mare: pe lângă faptul că a fost un test al puterilor AI, crearea unui program Go-playing capabil să bată campioni umani a fost ceva de cursă armamentară. Ani de zile, diverși programatori și companii s-au clamorat pentru a crea versiunea Go a Deep Blue. Unii s-au apropiat. Un program francez numit Crazy Stone a bătut campionul japonez Go de cinci ori Yoshio Ishida în 2013, deși Crazy Stone a primit un handicap (AlphaGo nu a fost) și Ishida nu a fost considerată un jucător de top în câteva decenii. Până în prezent, AlphaGo a bătut alte programe Go cu 99, 8 la sută din timp.
Cu doar câteva ore înainte ca Google să își publice oficial știrile, Facebook, fără îndoială că ar fi fost bătut cu pumnul, a renunțat la anunțul că propria AI se „apropia” pentru a-i învinge pe campionii umani.
Deci, de ce este considerat Go un test atât de puternic al AI? Ar fi prea reductiv să spunem că Go este mai ușor decât șahul.
"Jocul reflectă abilitățile jucătorilor în echilibrarea atacului și a apărării, făcând pietrele să funcționeze eficient, rămânând flexibile ca răspuns la situații în schimbare, sincronizare, analizând cu exactitate și recunoscând punctele tari și punctele slabe ale adversarului", explică Asociația britanică Go despre site-ul web, contabilizând apelul complex al lui Go.
În timp ce șahul are o medie de 35 de mutări legale pe rotație, Go are o medie de 200. Și în timp ce există aproximativ 10 ³ configurații posibile ale unei plăci de șah, o placă Go are cel puțin 2, 08 X 10¹⁷⁰ - mai multe configurații decât există atomi în univers. Spre deosebire de șah, unde numărul de piese de pe tablă este un indicator foarte bun al cine câștigă, este foarte greu de știut cine este înainte în Go.
„Nu există un euristic bun pentru a stabili dacă o poziție este bună sau rea pentru un jucător”, explică Jon Diamond, președintele Asociației Go, Jon Diamond. „Este parțial analiză și parțial recunoașterea modelului. Dumneavoastră evaluați placa într-un mod complicat în care nu am calculat cum să reproducem calculatoarele. ”
Diamond spune că a fost destul de surprins să afle de succesul AlphaGo. „Cred că nu mă așteptam să fiu sincer acest lucru între cinci și zece ani”, spune el. „Au făcut o treabă bună.”
Succesul AlphaGo poate însemna că suntem mult mai apropiați decât am crezut anterior de a avea AIs care să poată performa la nivel uman în alte domenii. AlphaGo poate fi o „piatră de pas” către alte tipuri de API, spun dezvoltatorii săi. O AI care poate lua tipurile de decizii complexe, intuitive și care par necesare pentru a câștiga Go, ar putea fi, de exemplu, să diagnostice un pacient bolnav și să prescrie un curs individualizat de tratament, în conformitate cu dezvoltatorii.
În luna martie, AlphaGo își va testa din nou metoda, când va merge din cap cu coreea Lee Sedol, considerată jucătorul de top din lume.
„Indiferent de rezultat, va fi un eveniment semnificativ în istoria baduk (Go)”, spune Lee într-un comunicat de presă. "Am auzit că AI-ul Google DeepMind este surprinzător de puternic și din ce în ce mai puternic, dar sunt sigur că pot câștiga cel puțin de data asta."