Algoritmii Facebook vă pot alege chipul dintr-o mulțime (sau încercați cel puțin), dar tot nu vă poate spune dacă sunteți în portret de familie sau beți cu amicii - nu vă poate spune cum interacționați cu ceilalți . În viitor, însă, calculatoarele ar putea să poată face asta. Acum, cercetătorii au propus o modalitate de a descoperi cât de inteligente sunt calculatoarele inteligente la identificarea vizuală. Ei numesc testul lor un test vizual Turing, după testul informaticianului Alan Turing dacă un computer poate afișa informații similare omului.
Percepția populară a testului este că este folosit pentru a distinge oamenii de computere - și o versiune este folosită în acest sens, atunci când faceți un CAPTCHA pentru a vă înscrie la un nou e-mail. Dar cercetătorii de inteligență artificială cred cu adevărat la test ca o modalitate de a măsura cât de avansată este informația computerizată.
„Au fost câteva progrese impresionante în viziunea computerizată în ultimii ani”, spune într-un comunicat de presă Stuart Geman, profesor de matematică la Brown University și unul dintre cercetătorii care propun noua evaluare. „Am considerat că ar fi timpul să ridicăm bara în ceea ce privește modul în care aceste sisteme sunt evaluate și analizate.
În loc să recunoască pur și simplu că o imagine arată două persoane, testul vede dacă calculatoarele pot da seama că cele două persoane au o conversație sau chiar un argument. În prezent, cercetătorii folosesc seturi de date disponibile publicului pentru a testa programele lor - MIT are LableMe, care folosește crowdsourcing pentru a identifica „mașina”, „copacul” și „construirea” în imagini, de exemplu. Pentru a îmbunătăți acest aspect și a oferi o provocare mai mare, cercetătorii cu sediul la Brown au creat un cadru pentru un test de Turing vizual standardizat.
Lee Gomes pentru rapoartele Spectrum IEEE :
Metoda propusă solicită proiectanților de testare umană să dezvolte o listă de anumite atribute pe care le poate avea o imagine, cum ar fi dacă o scenă de stradă are oameni în ea, sau dacă oamenii poartă ceva sau vorbesc între ei. Fotografiile ar fi mai întâi notate manual de către oameni pe aceste criterii; un sistem de vizionare pe computer ar putea fi arătat aceeași imagine, fără „răspunsuri”, pentru a determina dacă a fost capabil să descopere ceea ce oamenii au observat.
Inițial, întrebările ar fi rudimentare, întrebându-se dacă există o persoană într-o regiune desemnată a imaginii, de exemplu. Dar întrebările vor crește în complexitate, pe măsură ce programele devin mai sofisticate; o întrebare mai complicată ar putea implica natura unei interacțiuni între diferite persoane din imagine.
Echipa a descris testul în Proceedings of the National Academy of Sciences . De acum, germanul spune că niciun sistem informatic nu ar putea trece nici măcar versiunile simple ale noului test. Dar vor face în viitor. Întrucât există multe atribute posibile pentru orice fotografie, cercetătorii ar trebui să vină cu modalități inovatoare pentru calculatoarele lor de a învăța să evalueze fotografiile.
„În calitate de cercetători, avem tendința de a„ învăța la test ”, spune Geman în declarație. „Dacă există anumite concursuri pe care toată lumea intră și acestea sunt măsurile succesului, atunci pe care ne concentrăm. Așadar, ar putea fi înțelept să schimbi testul, să-l pui la îndemâna sistemelor de viziune actuale.