https://frosthead.com

Ultimele AI-uri învață să se joace fără a fi nevoie de ajutor uman

Anul trecut, un program de inteligență artificială numit AlphaGo creat de echipa DeepMind de la Google a bătut un campion uman la Go, un vechi joc de strategie chinez, care este în multe privințe mai complex decât șahul. După cum a raportat Emily Matchar pentru Smithsonian.com la acea vreme, a fost o realizare uimitoare, deoarece în 1997, unii oameni au prezis că va dura 100 de ani pentru ca un computer să bată un om la Go.

În timp ce feat-ul este impresionant, AlphaGo a învățat să joace jocul analizând jocurile anterioare jucate de oameni. Dar, după cum raportează Merrit Kennedy la NPR, o nouă versiune a inteligenței artificiale numită AlphaGo Zero și-a dat seama cum să stăpânească jocul singur, fără niciun aport uman sau manipulare - un avans care are implicații mari pentru dezvoltarea viitoare a AI.

Potrivit unui comunicat de presă al DeepMind, versiunile anterioare ale AlphaGo au învățat să joace jocul studiind meciuri între jucători profesioniști și jucători amatori puternici, absorbind regulile jocului și strategii de succes. AlphaGo Zero, însă, nu s-a uitat la niciun joc jucat de oameni. În schimb, i s-au dat regulile jocului și apoi s-a jucat împotriva ei înșiși, folosind învățarea de consolidare pentru a se învăța în mișcare corectă și greșită și strategii pe termen lung. Pe măsură ce AI a jucat jocul, și-a actualizat rețeaua neuronală avansată pentru a prezice mai bine mișcările adversarului.

Cercetătorii au urmărit cum IA stăpânea jocul în timp real. După trei zile, a reușit să învingă o versiune anterioară, numită AlphaGo Lee, care a învins maestrul coreean Go Lee Lee Sedol în 4 din 5 jocuri în 2016. După 21 de zile, a reușit să se fi remarcat cu AlphaGo Master, versiunea care a bătut 60 de jucători de top Go online și Cel mai bun jucător din lume Ke Jie la începutul acestui an. Cea mai recentă versiune a redat jocurile AlphaGo Master 100 la 0. După 40 de zile, a atins niveluri de joc pe care nimeni nu le-a mai văzut. Cercetarea apare în revista Nature.

"Într-un timp scurt, AlphaGo Zero a înțeles toate cunoștințele Go care au fost acumulate de oameni de-a lungul a mii de ani de joc", spune cercetătorul principal David Silver, de la DeepMind de la Google, într-un videoclip YouTube. „Uneori, a fost ales să treacă dincolo de asta și a descoperit ceva pe care oamenii nici măcar nu l-au descoperit în această perioadă și a descoperit noi cunoștințe care sunt creative și in multe feluri.”

După cum raportează Agence France-Presse, AlphaGo Zero a atins acest nivel de măiestrie mult mai eficient decât predecesorii săi. În timp ce iterația anterioară avea 48 de unități de prelucrare a datelor și a jucat 30 de milioane de jocuri de instruire pe parcursul mai multor luni, Zero a avut doar 4 unități de procesare și a jucat 4, 9 milioane de jocuri de antrenament în trei zile. „Oamenii au tendința de a presupune că învățarea automată se referă la date mari și cantități masive de calcul, dar de fapt ceea ce am văzut cu AlphaGo Zero este că algoritmii contează mult mai mult”, spune Silver pentru AFP.

Însă cercetarea se referă la ceva mai mult decât la stăpânirea unui joc de masă. După cum raportează Ian Sample la The Guardian, acest tip de tabula rasa, sau ardezie goală, învățarea ar putea duce la o nouă generație de inteligență artificială cu scop general, care ar putea ajuta la rezolvarea problemelor în câmpuri care pot fi bine simulate într-un computer, precum compoziția medicamentelor., plierea proteinelor sau fizica particulelor. Construindu-și cunoștințele de la sol, fără prejudecăți sau limitări umane, algoritmii ar putea merge în direcții pe care oamenii încă nu s-au gândit să le privească.

În timp ce mulți oameni din comunitatea AI văd AlphaGo Zero ca o mare realizare, Gary Marcus, profesor de psihologie la Universitatea New York, specializată în inteligență artificială, îi spune lui Kennedy NPR că nu crede că algoritmul este cu adevărat tabula rasa, deoarece cunoștințele umane anterioare au fost în construcția algoritmului. De asemenea, el nu crede că tabula rasa AI este atât de importantă pe cât pare. „[În] biologie, creierele umane reale nu sunt tabula rasa ... Nu văd principalul motiv teoretic de ce ar trebui să faci asta, de ce ar trebui să abandonezi multe cunoștințe pe care le avem despre lume”, spune el.

Chiar și așa, măiestria rapidă a jocului Alpha Go este impresionantă - și un pic înspăimântătoare.

Ultimele AI-uri învață să se joace fără a fi nevoie de ajutor uman