https://frosthead.com

Testul de Turing măsoară ceva, dar nu este „inteligență”

Alan Turing, unul dintre tații epocii calculatorului, era un om extraordinar de deștept. Atât de inteligent, de fapt, încât a înțeles că termenul „inteligență mașină” era aproape lipsit de sens. Mai bine, a motivat el, să vorbească despre ceea ce poate face o mașină: Poate vorbi? Poate ține o conversație? Cel puțin asta putem încerca să studiem. În cele din urmă, Turing a propus ceea ce a fost cunoscut sub numele de „Turing test”: Dacă un judecător nu poate spune care dintre două entități ascunse este un om și care este un artificial, mașina a „trecut” testul - ceea ce este exact ceea ce se spune ca s-a intamplat sambata trecuta la Londra.

Continut Asemanator

  • Silicon Valley datorează succesul acestui gen de tehnică de care nu ai auzit niciodată
  • Predicția de 60 de ani a lui Alan Turing despre modelele din natură s-a dovedit adevărată

„Suntem… mândri să afirmăm că testul lui Alan Turing a fost trecut pentru prima dată”, a spus unul dintre organizatori, Kevin Warwick, de la Universitatea Reading, pe măsură ce rezultatele au fost anunțate. Chatbot-ul câștigător se numește „Eugene Goostman”, un program de calculator care emulează personalitatea unui băiat ucrainean de 13 ani. „Eugene” a reușit să convingă 33% dintre judecători că a fost uman la evenimentul de sâmbătă, organizat la birourile Royal Society din Londra, la 60 de ani de la moartea lui Turing. (Turing, un homosexual, a fost condamnat pentru o indecență gravă în 1952 și i s-a ordonat să se supună „tratamentului hormonal” ca parte a unui acord de pledoarie. Doi ani mai târziu a murit din cauza intoxicației cu cianură în urma unei sinucideri aparente.)

Dar un cuvânt de precauție este în ordine. „Inteligența” a fost întotdeauna un subiect alunecos, iar testul Turing, în special, a fost plin de controverse. Turing a descris cum va funcționa într-o lucrare din 1950, intitulată „Mașini de calcul și informații.” El a luat ideea dintr-un joc tradițional victorian de salon, în care încercați să vă dați seama dacă persoana ascunsă în spatele unei perdele este un bărbat sau o femeie, doar punând întrebări. (Răspunsurile la întrebări trebuiau să fie notate, pentru că vocea ar fi un cadou.) Iată cum ar funcționa versiunea lui Turing: Aș avea un judecător, așezat în fața a două perdele, fără niciun fel de a ști ce se află în spatele lor . În spatele unei perdele este un om; în spatele celuilalt se află un computer. Judecătorul poate pune întrebări oricăreia dintre cele două entități ascunse. Pe baza răspunsurilor, judecătorul încearcă să-și dea seama dacă entitatea ascunsă este un om sau o mașină. (Turing a avut în vedere conversația ca fiind mediată de aparatele de tip teletip; astăzi, putem folosi orice fel de interfață electronică, bazată pe text, cum ar fi cea utilizată în camerele de chat pe Internet sau de mesagerie instant.)

Turing a speculat că, până în anul 2000, „un interogator mediu nu va avea mai mult de 70 la sută șanse de a face identificarea corectă” - adică programele de calculator ar îndepărta judecătorii cu 30% din timp - după cinci minute de interogatoriu. Cele „cinci minute” sunt importante. Turing nu a vorbit despre o limită de timp ca fiind o parte inerentă a testului și s-ar putea susține că pentru ca o mașină să treacă cu adevărat testul, ar trebui să poată face față oricărei întrebări. Probabil că criteriile de cinci minute au fost o limită arbitrară, dar necesară. Anul 2000 a venit și a mers, chat-urile făcând doar să oprească progresul. (Într-un moment mai sobru, răspunzând la o întrebare de la un intervievator BBC din 1952, Turing a spus că vor trece 100 de ani înainte ca o mașină să treacă testul.)

În 2012, eram judecător la un „maraton de testare Turing”, cel mai mare set de teste Turing efectuat la un moment dat; a avut loc la Parcul Bletchley, în Anglia, locul activității vitale de rupere a codurilor din Turing în ultimii ani ai celui de-al Doilea Război Mondial. (A fost organizat de aceeași echipă care a organizat evenimentul de sâmbătă, iar o versiune anterioară a lui Eugene a fost câștigător și în acea perioadă.) Configurarea pentru evenimentul de sâmbătă a fost aceeași ca în 2012: judecătorii au tastat întrebările lor pe un computer, apoi au așteptat ca răspunsurile să apară pe ecranele lor; chatboturile, împreună cu „oamenii ascunși”, se aflau într-o altă cameră, la vedere.

Primul lucru de care am devenit hiperconștient este că atunci când ești judecător într-un test de Turing, cinci minute trec destul de repede. Și conversația este mai scurtă, cu atât avantajul computerului este mai mare; cu cât este mai lungă interogarea, cu atât este mai mare probabilitatea ca computerul să se dea. Îmi place să numesc acest efect manechin: Ți-ai cerut vreodată scuze unui manechin de la un magazin, presupunând că tocmai ai intrat într-o ființă vie? Dacă întâlnirea durează doar o fracțiune de secundă, cu tine îndreptându-te în sens invers, poți să-ți imaginezi că tocmai te-ai prins de un om. Cu cât întâlnirea este mai lungă, cu atât este mai evidentă manevra manechinului.

Este la fel cu chatbots. Un schimb de hellos nu dezvăluie nimic - dar cu cât veți intra în el, cu atât apar mai multe probleme. Am descoperit că chatbot-urile par predispuse la schimbarea subiectului fără niciun motiv. Adesea, ei nu pot răspunde la întrebări simple. Cu riscul de a suna vag, pur și simplu nu sună uman . Într-una din conversațiile mele din 2012, am tastat o simplă glumă - iar entitatea cu care conversam a schimbat instantaneu subiectul hamburgerilor. (Informaticianul Scott Aaronson a avut recent o experiență similară când a discutat cu Eugene prin intermediul site-ului web al botului. Aaronson l-a întrebat pe Eugene câte picioare are o cămilă; acesta a răspuns: „Ceva între 2 și 4. Poate, trei? :-)))” Mai târziu, când Aaronson a întrebat câte picioare are o furnică, Eugene a tăiat exact aceeași replică, tripla zâmbet și toate.)

Rețineți, de asemenea, că Eugene nu imită un adult nativ de limbă engleză; se preface că este o adolescentă ucraineană tânără și oarecum fragedă, conversând într-o engleză rezonabil de bună (dar departe de a fi perfectă). După cum a declarat Vladimir Veselov, unul dintre dezvoltatorii programului, pentru Mashable.com : „Am petrecut mult timp dezvoltând un personaj cu o personalitate credibilă. Deși Eugene va implica pe oricine pe orice subiect, vârsta lui„ face perfect rezonabil că nu „Nu știu totul”. Eugene nu iese bine și își anunță vârsta și naționalitatea; dar o va dezvălui dacă i se va cere - iar rezultatul final poate fi o anumită clemență din partea judecătorilor, în special în ceea ce privește gramatica engleză și utilizarea cuvintelor. (Presupun că majoritatea judecătorilor de sâmbătă erau vorbitori nativi de limba engleză, deși nu știu acest lucru cu siguranță.) Mesele ar fi fost transformate dacă Eugene ar fi întâlnit vreodată un vorbitor nativ ucrainean ca judecător.

Lupta de a construi o mașină vorbitoare evidențiază cât de complex este limbajul. Nu este doar o chestiune de a vorbi - trebuie să vorbești despre ceva, iar ceea ce spui trebuie să aibă sens - și trebuie să aibă sens în contextul celor ce tocmai a spus celălalt . Pentru noi, este ușor; pentru calculatoare, nu atât. Și astfel, chatbot-urile se bazează pe o varietate de trucuri: Memorizarea megabytes-urilor de răspunsuri în conserve sau căutarea internetului pentru un dialog care ar putea aproxima conversația în care sunt în prezent. Cu alte cuvinte, ceea ce o mașină lipsește de inteligență poate fi în măsură să facă față puterii de calcul brute. Acesta este motivul pentru care Google sau Siri (asistentul personal pentru iPhone) ni se pot părea atât de isteți: Siri ar putea să nu aibă o „minte”, dar are acces la o bază de date atât de vastă de informații, poate acționa ca și cum ar fi. A fost același fel de abordare a forței brute care a permis „Watson”-ului IBM să câștige la Jeopardy! în 2011.

Toate acestea ridică o întrebare crucială: Ce anume este măsurarea testului Turing? Unii critici au sugerat că este vorba de recompense mai degrabă decât de inteligență. Psihologul NYU, Gary Marcus, scriind la NewYorker.com, spune că Eugene reușește „prin executarea unei serii de„ trucuri ”concepute pentru a masca limitările programului. Steven Harnad, psiholog și informatician la Universitatea din Quebec din Montreal, a fost și mai mult sceptic, spunându-i The Guardian că este „un nonsens complet” să afirmi că Eugene a trecut testul Turing. (În opinia lui, Turing era bine cunoscut de această problemă; el și-a numit ideea „jocul de imitație” și a vorbit despre inteligență doar cu cruzime.) Și mai incomod, computerul, spre deosebire de om, este obligat să înșele. „Testul de Turing este într-adevăr un test de a fi un mincinos de succes”, mi-a spus Pat Hayes, un om de informatică de la Institutul pentru Cognition Human and Machine din Pensacola, Florida, în urma maratonului de testare 2012. „Dacă ai avea ceva care ar putea trece cu adevărat jocul de imitație al lui Turing, ar fi un„ imitat uman ”foarte reușit.”

Iar „omul” este celălalt punct cheie: nu este posibil să existe și alte tipuri de informații în lume, dincolo de cele afișate de specia noastră? O mașină cu adevărat inteligentă ar avea nenumărate aplicații practice, dar de ce să se concentreze pe crearea mai multor „oameni”? La urma urmei, avem deja o mulțime de oameni. Așa cum a subliniat lingvistul Noam Chomsky, atunci când ne străduim să construim o mașină care se mișcă sub apă, nu avem nevoie să „înoate” - iar un submarin nu este o realizare pentru incapacitatea sa de a face atacul.

Da, Eugene este impresionant, cel puțin în explozii mici. Și totuși, chiar și cei mai buni chatbots se poticnesc cu întrebări pe care un copil de jumătate din vârsta pretinsă a lui Eugeniu le-ar putea face față. Poate că nu este surprinzător, cei mai mulți cercetători ai AI își petrec puțin timp obsedând testul Turing. Inteligența mașinii este, de fapt, înaintează și destul de rapid. Software-ul de traducere voce-text, care a fost destul de patetic acum doar câțiva ani, se îmbunătățește rapid, la fel ca și programele de traducere a limbilor. Amazon are adesea o idee destul de bună despre ceea ce vrei să cumperi chiar înainte de a face. Și mașina de auto-conducere Google ar fi fost o fantezie în urmă cu un deceniu. Dar conversația, pe măsură ce continuăm să le descoperim, este cu adevărat grea și nu este probabil să fie frontiera în care AI strălucește cel mai puternic. Deocamdată, dacă sunteți în căutarea cu cineva cu care să discutați, vă recomand un om adevărat.

Dan Falk este un jurnalist științific cu sediul în Toronto.

Testul de Turing măsoară ceva, dar nu este „inteligență”