https://frosthead.com

Zâmbet, încruntat, grimase și rânjet - expresia ta facială este următoarea frontieră a datelor mari

Fața umană este alimentată, în funcție de modul în care le numeri, cu între 23 și 43 de mușchi, mulți dintre ei atașându-se pe piele, care nu servește nicio funcție evidentă pentru supraviețuire. Un extraterestru care examinează un exemplar uman în mod izolat nu ar ști ce să facă din ele. Tragând pe frunte, sprâncene, buze și obraji, mușchii transmit o mulțime de informații despre starea noastră emoțională, nivelul de interes și alertă. Este un mijloc de comunicare extrem de eficient - aproape instantaneu, de obicei exact, care transcende majoritatea barierelor lingvistice și culturale. Dar, uneori, datele sunt pierdute, ignorate sau interpretate greșit. Dacă un exploatator zâmbește în pădure cu nimeni în jur să-l vadă, era de fapt fericit?

Din această poveste

[×] ÎNCHIS

Emoticoni atât de lungi. Omul de știință dezvoltă tehnologie care poate detecta și citi expresiile noastre

Video: Smithsonian Ingenuity Awards 2015: Rana el Kaliouby

Citiri conexe

Preview thumbnail for video 'Emotional Intelligence: Why It Can Matter More Than IQ

Inteligența emoțională: de ce poate importa mai mult decât IQ

A cumpara

Rana el Kaliouby urăște să vadă că aceste informații duc la risipă. Întâlnindu-l cu Kaliouby în micul ei birou din Waltham, Massachusetts, îi văd contractul cu mușchiul ei major de zygomaticus, ridicând colțurile gurii și orbicularis oculi, scârțâind colțurile exterioare ale ochilor. Ea zâmbește și deduc că mă întâmpină, înainte să scoată chiar și cuvântul „salut”. Dar multe schimburi sociale de astăzi au loc fără interacțiuni față în față în timp real. Acolo intră el Kaliouby și compania ei.

El Kaliouby, care are 37 de ani, zâmbește des. Are o față rotundă, plăcută, expresivă și o manieră solicitantă, bazându-și poziția de co-fondator al unei start-up-uri în creștere rapidă a tehnologiei - un anti-Bezos, un Zuckerberg. Compania ei, Affectiva, pe care a fondat-o în 2009 cu o colegă de atunci la MIT Media Lab, Rosalind Picard, ocupă o poziție de vârf a tehnologiei pentru a utiliza calculatoare pentru detectarea și interpretarea expresiilor faciale umane. Acest câmp, cunoscut sub numele de „calcul afectiv”, încearcă să reducă decalajul de comunicare dintre ființele umane și mașini prin adăugarea unui nou mod de interacțiune, incluzând limbajul nonverbal al zâmbetelor, al zâmbetului și al sprâncenelor ridicate. „Premisa a ceea ce facem este că emoțiile sunt importante”, spune el Kaliouby. „Emoțiile nu perturbă gândirea noastră rațională, ci o îndrumă și o informează. Dar lipsesc din experiența noastră digitală. Smartphone-ul dvs. știe cine sunteți și unde sunteți, dar nu știe cum vă simțiți. Ne propunem să remediem asta. ”

De ce smartphone-ul dvs. trebuie să știe cum vă simțiți? El Kaliouby are o mulțime de răspunsuri, toate bazate pe integrarea aparent nelimitată a computerelor în rutinele vieții noastre de zi cu zi. Ea are în vedere „tehnologie pentru controlul iluminatului, temperaturii și muzicii din casele noastre, ca răspuns la dispozițiile noastre”, sau aplicații care pot adapta conținutul unui film pe baza reacțiilor subconștiente la acesta în timp ce vizionați. Ea își imaginează programe care vă pot monitoriza expresia în timp ce conduceți și avertizați despre neatenție, somnolență sau furie. Zâmbește la mențiunea ideii ei preferate - „un frigider care poate simți când ești stresat și blochează înghețata.”

În special, consideră că Affectiva, iar tehnologia pe care o ajută să o aducă în mainstream, va fi un element important pentru îngrijirea sănătății. Un cercetător care testează un medicament nou, sau un terapeut care tratează un pacient, primește feedback doar la intervale de timp, sub rezerva tuturor problemelor de auto-raportare - dorința inconștientă de a-i face pe plac medicului, de exemplu, sau reamintirea selectivă care favorizează cele mai recente amintiri . El Kaliouby are în vedere un program care rulează pe fundalul laptopului sau telefonului subiectului, care ar putea compila o înregistrare moment la moment a stării sale de spirit pe parcursul unei perioade de timp (o zi, o lună) și să o coreleze cu timpul sau orice altceva dispozitivul dvs. poate măsura sau urmări. „Nici măcar nu ar trebui să facă parte dintr-un program de tratament”, spune ea. „Poți să-l ai doar pe telefon și îți spune, de fiecare dată când apelează„ X ”, ai o expresie negativă și asta îți spune ceva ce poate nu ai știut.”

Preview thumbnail for video 'Subscribe to Smithsonian magazine now for just $12

Abonați-vă la revista Smithsonian acum pentru doar 12 dolari

Această poveste este o selecție din numărul din decembrie al revistei Smithsonian.

A cumpara

El Kaliouby promovează calculul afectiv ca următorul pas logic în progresia de la tastatură la mouse la ecran tactil până la recunoașterea vocală. În primăvară, Affectiva a lansat primul său kit de dezvoltare de software comercial, pe care dezvoltatorii, interesați de stările emoționale în timp real ale utilizatorilor, le pot încorpora în propriile programe - playere muzicale sau aplicații de jocuri sau dating, de exemplu. Și tocmai în această toamnă, Affectiva a lansat Emotion As a Service, un program bazat pe cloud în care clienții pot încărca videoclipuri pentru analiză. Cine ar putea folosi asta? Un candidat care urmează să fie intervievat pentru un loc de muncă, care este îngrijorat să pară neliniștit sau plictisit sau chiar să zâmbească prea mult. Sau o companie aeriană care angajează însoțitori de zbor, cu sute de aplicații video pe care să le selecționeze în căutarea celor care pot gestiona un zâmbet convingător în timp ce își iau rămas bun de la pasageri. (Un zâmbet autentic, care implică o contracție a mușchilor de la colțurile ochilor, este numit un zâmbet „Duchenne”, numit pentru anatomistul secolului al XIX-lea; opusul său, un zâmbet forțat care folosește doar gura, este de fapt uneori numit un zâmbet „Pan Am”.)

Și, desigur, dispozitivele care rulează acest software sunt conectate la Internet, astfel încât informațiile pe care le adună sunt agregate, cernute și conectate instantaneu în modul în care aplicațiile de social media identifică subiecte sau personalități populare. S-a compilat, poate, în ceva ca un Index afectiv al stării de spirit, o citire numerică asupra fericirii naționale brute, sau defalcată în regiuni în care în prezent sunt tendințe zâmbetele sau încruntările.

DEC2015_H05_TechnologyRanaElKaliouby-WEB-RESIZE.jpg Programul de bază al Affectiva analizează fața de 20 de ori pe secundă pentru 46 de expresii localizate de fericire, tristețe, surpriză, frică, furie, dezgust și dispreț, plus interes și confuzie. (Naomi Shavin / Smithsonian)

Până acum, principalii clienți ai Affectiva au fost companiile de publicitate, marketing și mass-media. Software-ul său automatizează procesul de derulare a unui focus grup, ritualul greoi de a aduna o duzină de oameni într-o cameră pentru a-și da părerea despre un nou produs, seriale TV sau campanie publicitară; înregistrează direct reacțiile, fără ca un participant să fie nevoit să răsucească un cadran sau să răspundă la un chestionar ca răspuns la o prezentare. Mai mult, software-ul extinde grupul de focus potențial în întreaga lume, sau cel puțin fracția substanțială din acesta care are un computer sau un dispozitiv mobil activat pe webcam.

Feedbackul de la ochiul neobosit și atrăgător al Affectiva a ajutat la modelarea unei sitcom-uri în rețea TV, transmitând două personaje în uitare pentru păcatul de a nu face zâmbetul spectatorilor. (El Kaliouby nu va identifica emisiunea sau personajele.) Software-ul său a fost folosit pentru a construi un „sampler de zâmbet”, o mașină care a distribuit bomboane cumpărătorilor care au zâmbit în camera sa. Cu mai multe cercetări, probabil că ar putea fi utilă pentru supravegherea aglomerării în aeroporturi sau pentru identificarea potențialilor producători de magazine sau ca detector de minciuni.

Însă el Kaliouby a rezistat acestor aplicații subreptitive, oricât de profitabile ar fi acestea. Ea crede că calculul afectiv va schimba lumea, incluzând, dar în niciun caz, vânzarea de bomboane. „Etosul companiei noastre”, spune ea, „este să folosească această tehnologie pentru a îmbunătăți viața oamenilor și a le ajuta să comunice mai bine, nu doar pentru a ajuta agenții de publicitate să vândă mai multe produse.”

**********

Spre deosebire de mulți antreprenori din domeniul tehnologiei, a te îmbogăți nu a fost pe agenda inițială a lui Kaliouby. Născută la Cairo din părinții egipteni care lucrează amândoi în tehnologie, ea a studiat calculatoarele la Universitatea Americană din Cairo, unde a absolvit în 1998, în timp ce calculatoarele deveneau suficient de puternice pentru ca cercetătorii să se gândească să le învețe ceea ce în termeni umani este. numită inteligență emoțională.

Ea a continuat să studieze informatică la Universitatea din Cambridge, ajungând chiar după atacurile asupra Americii din 11 septembrie 2001. Părinții ei au crezut că riscă să fie arestați, hărțuiți sau mai răi din cauza moștenirii. Dar, deși a purtat un cap musulman până în urmă cu câțiva ani, nici la Cambridge, Anglia, nici la Cambridge, Massachusetts, unde s-a mutat în 2006, pentru a se alătura MIT Media Lab, a fost vreodată deranjat de religia sau aspectul ei . „Cred că este pentru că zâmbesc mult”, spune ea zâmbind.

DEC2015_H07_TechnologyRanaElKaliouby.jpg Anatomistul francez Duchenne a publicat studii de reper ale expresiilor faciale umane. (Imagini Bridgeman)

În timp ce se afla la Cambridge, ea devenise interesată de problema autismului, în special de dificultățile pe care le au copiii cu autism în citirea expresiilor faciale. Ea a propus construirea unui „aparat auditiv emoțional” care să poată fi purtat pentru a citi fețele și pentru a le purta comportamentelor potrivite. La început a renunțat la o finanțare acordată de Fundația Națională de Știință pe motiv că proiectul a fost prea dificil, ea și colegii ei au construit un prototip, format dintr-o pereche de ochelari echipate cu o cameră minusculă, lumini intermitente și căști, nu spre deosebire de o versiune timpurie a Google Glass. O a doua cerere de subvenție a avut succes și, după ce s-a mutat în MIT, ea și echipa sa au lucrat pentru următorii trei ani pentru a o perfecționa și a o testa la o școală din Rhode Island. El Kaliouby îl descrie drept „un proiect de cercetare și unul de succes” - copiii autiști care l-au folosit au avut experiențe copleșitoare de pozitive - dar în 2008, pe măsură ce subvenția s-a încheiat, s-a confruntat cu un moment de socoteală. Interesul comercial pentru calculul afectiv era în creștere și voia să-l vadă extinderea și înflorirea; punerea eforturilor sale în dezvoltarea ochelarilor ar limita-o la o felie minusculă a utilizărilor sale potențiale. Așa că, împreună cu Picard, s-a abătut de la Affectiva, în timp ce a arătat speranța că o altă companie va ridica aparatul auditiv emoțional și îl va scoate pe piață.

Când s-a format Affectiva, mână de „membri ai echipei” care au alcătuit compania au ales fiecare o valoare pe care doreau să o încorporeze, cum ar fi „învățarea”, „responsabilitatea socială” sau „distracția”. Hers, în calitate de șef de strategie și știință, a fost „pasiune”. Compania formată din 20 de persoane este condusă ca o cvasi-democrație, cu ședințe semianuale la care angajații votează prioritățile de urmat în următoarele șase luni. Biroul ei are o tablă acoperită cu desene de fiica cea mică a unuia dintre colegii ei; ea are un fiu de 6 ani, Adam, și o fiică de 12 ani, Jana, care locuiesc cu ea în suburbiile Bostonului (tatăl lor locuiește în Egipt). Maniera ei este blândă și atentă; o oră într-o ședință de dimineață, pe care o oferă pentru a comanda un sandviș pentru vizitator, chiar dacă ea însăși sări prânzul. "Este Ramadan pentru mine", spune ea, zâmbind, "dar nu este Ramadan pentru tine."

Ea așază vizitatorii la un birou, cu fața unui monitor și a unei camere web; software-ul localizează fața vizitatorului și atrage o casetă în jurul lui pe ecran. Identifică un set de puncte de urmărit: colțurile ochilor și gurii, vârful nasului și așa mai departe. De douăzeci de ori pe secundă, software-ul caută „unități de acțiune”, jocul deseori trecătoare al mușchilor de pe față. Există 46 dintre acestea, conform sistemului standard de clasificare, sistemul de codare a acțiunilor faciale (FACS). Acestea includ stafidele interioare și exterioare, dimplers, clipiri, scrâșnituri și buzunare, pâlnii, presoare și sucuri. Programul standard al Affectiva probează în fiecare moment aproximativ 15 dintre acestea și le analizează pentru expresii a șapte emoții de bază: fericire, tristețe, surpriză, frică, furie, dezgust și dispreț, plus interes și confuzie. Zâmbește și poți vedea măsura fericirii trage în sus; ondulați-vă buza într-o adulmecare și programul vă observă dezgustul.

Sau, mai exact, expresia ta de dezgust. Întreaga premisă a calculului afectiv se bazează pe ceea ce înseamnă un salt de credință, că zâmbetul transmite un sentiment de fericire, plăcere sau distracție. Desigur, ființele umane sunt în aceeași poziție: Putem fi păcăliți de un zâmbet fals sau o mânie prefăcută, așa că nu ne putem aștepta mai mult de la un program de calculator, cel puțin nu încă.

De-a lungul timpului, Affectiva a construit o arhivă cu peste trei milioane de videoclipuri cu fețe, încărcate de internauți recrutați din aproximativ 75 de țări din întreaga lume. Sute de mii dintre acestea au fost analizate de observatori instruiți și codificate pentru unitățile de acțiune FACS - o întreprindere monumentală, deoarece videoclipurile sunt în medie de aproximativ 45 de secunde și fiecare durează de aproximativ cinci ori mai mult până la procesare. Rezultatele codificatorilor umani, la rândul lor, au fost folosite pentru a „antrena” algoritmii companiei, care au procesat restul în timp real. Întreaga bază de date cuprinde acum aproximativ 40 de miliarde de „puncte de date despre emoție”, o resursă, el Kaliouby se mândrește, care diferențiază Affectiva de alte companii din același domeniu, cum ar fi Emotientul din California, probabil cel mai apropiat concurent.

smile.chart.jpg (Grafic: Infografie 5W; Sursa: Daniel McDuff, MIT Media Lab, Affectiva)

Daniel McDuff, care s-a alăturat Affectiva de la MIT Media Lab și servește ca director al cercetării, studiază în mod continuu această situație pentru a oferi informații suplimentare despre exprimarea emoțiilor. Cum se diferențiază în funcție de vârstă, sex și cultură? (Poate surprinzător, McDuff a descoperit că persoanele în vârstă sunt mai expresive, în special în ceea ce privește emoțiile pozitive, decât cele mai tinere.) Putem măsura în mod fiabil disprețul, jena, plictiseala, anxietatea? Când indică o brazdă de sprâncene confuzie și când indică concentrare? Cum putem distinge între o expresie a fricii și una care semnifică surpriză? (Sugestie: Unitatea de acțiune 1, „ridicarea frunții interioare”, este markerul fricii; unitatea de acțiune 2, „ridicarea frunții exterioare” indică surpriză.) Există, spune el, toate motivele de a crede că programul va continua pentru a obține mai bine la detectarea expresiilor (deși poate nu depășește niciodată complet cel mai mare obstacol dintre toate: Botox).

La cererea mea, McDuff a oferit programului una dintre marile probleme clasice ale detectării emoțiilor, Mona Lisa, al cărei enigmatic cvasi-zâmbet i-a intrigat pe telespectatori de 500 de ani. Datorită faptului că software-ul funcționează cel mai bine la expresii schimbătoare, nu la imagini statice, el a raportat că nu a găsit nicio dovadă a unui zâmbet autentic al lui La Gioconda, ci mai degrabă o combinație de unitate de acțiune 28 (rola de buze) și 24 (buzele apăsate împreună), posibil să sugereze un anumit nivel de disconfort.

**********

„Vorbesc acum cu tine”, spune el Kaliouby, „și te urmăresc să îți apreciezi interesul pentru ceea ce spun. Ar trebui să încetinesc și să explic mai mult? Ar trebui să merg la un alt subiect? Acum, imaginați-vă că dau un webinar unui grup mare pe care nu-l pot vedea sau auzi. Nu primesc niciun feedback, nu există nicio modalitate de a spune dacă o glumă a funcționat sau s-a defectat, dacă oamenii sunt angajați sau plictisiți. Nu ar fi grozav să obții acel feedback în timp real, agregat, din moment în moment în timp ce merg pe parcurs? ”

Ea joacă o reclamă pentru Jibo, un „robot social” disponibil pentru precomandare pe site-ul de finanțare a mulțimilor Indiegogo și dezvoltat de un fost coleg de MIT, Cynthia Breazeal. Arătând ca o lampă de lavă de înaltă tehnologie, Jibo stă pe o masă și scanează împrejurimile, identificând indivizii prin față și interacționând cu ei - redarea mesajelor, emiterea de memento-uri, efectuarea de apeluri telefonice de rutină, chiar discuții. Aceasta este o altă aplicație potențială pentru software-ul Affectiva - companiile sunt în discuții - și este „o perspectivă foarte interesantă”, spune el Kaliouby.

Unii sunt încântători, dar roboții de procesare a emoțiilor sunt alarmanți pentru alții. Sherry Turkle, care a studiat demult modul în care oamenii se raportează la computere, avertizează în noua sa carte, Reclaiming Conversation: The Power of Talk in a Digital Age, despre „momentul robotic”, când mașinile încep să se substituie companiei umane. Turkle consideră că oamenii de știință precum el Kaliouby și echipa ei pot face ceea ce spun ei că vor. „Toți aceștia sunt oameni strălucitori, dotați care lucrează strălucit”, spune ea. Și ea este de acord că în anumite contexte - medii periculoase, cum ar fi spațiul exterior sau în jurul utilajelor grele, unde doriți să înscrieți fiecare mod posibil de comunicare - un computer afectiv are un rol de jucat. „Dar următorul pas”, spune ea, „nu urmează deloc. Următorul pas este: Să facem un robot robot. Am intervievat părinții care sunt mulțumiți de faptul că copiii lor vorbesc cu Siri și cred că asta nu ne duce pe un drum unde vrem să mergem. Ne definim pe noi înșine ca ființe umane cu cine ne asociem și nu are niciun sens să-ți formăm sentimentul de autoestimare în raport cu o mașină. De ce ai vrea un computer să știe dacă ești trist? ”

Chiar și el Kaliouby este înclinat să fie de acord că „petrecem mai mult timp decât ar trebui cu dispozitivele noastre”, având în vedere, în mod firesc, fiica ei preadolescentă, a cărei privire se blochează pe ecranul smartphone-ului.

Dar consideră tendința către o conectivitate tot mai mare ca fiind ireversibilă și consideră că, deși utilizatorii ar trebui să participe întotdeauna, am putea face tot posibilul. Ea prezice că dispozitivele noastre vor avea „un cip de emoție și o suită de aplicații care îl folosesc într-un mod care să adauge suficientă valoare vieții noastre, care depășește preocupările oamenilor în ceea ce privește împărtășirea acestor date.” Desenează o analogie cu dispozitivele GPS: calculul afectiv poate ajută-ne să navigăm în spațiul emoțional în același mod în care aplicațiile de telefon ne ajută să ne ocolim în spațiul fizic. „Toți sunt îngrijorați de dispozitivele de detectare a locației, atunci când au ieșit, de asemenea: ne invadau confidențialitatea, ne urmăreau tot timpul”, spune ea. „Abia acum, am fi pierduți fără Google Maps pe telefoanele noastre. Cred că va fi la fel. ”

**********

Zâmbet, încruntat, grimase și rânjet - expresia ta facială este următoarea frontieră a datelor mari