https://frosthead.com

Vorbind cu mașini

Un software de recunoaștere vocală, probabil că majoritatea dintre noi ar fi de acord, este un lucru destul de fain. Dar vorbirea cu mașinile - fie smartphone, ecran TV sau tablou de bord - bine, nu atât. Solicitați sfatul unui dispozitiv? Sărbători de geek. Enunțarea fiecărui cuvânt pentru a fi înțeles? Cât de cool poți fi cu adevărat?

Dar Apple, adevărat de format, a preluat acest lucru prin angajarea a trei icoane cool pentru a juca în ultima lor campanie publicitară pentru Siri, vocea iPhone 4S. Există Zooey Deschanel (Adorable Cool) și John Malkovich (Cerebral Cool) și Samuel L. Jackson (Ultimate Cool), iar toți fac implicarea în jocul word cu un telefon să pară sportul zeilor.

Totuși, criticii subliniază că, în viața reală, Siri nu este nici la fel de sensibilă și atotștiutoră așa cum este înfățișată în reclame. Și tu, sunt sigur, ești șocat să aud asta. Alții văd totul ca fiind matur pentru parodie - îl văd pe fratele lui Zooey, Jooey, face o versiune Funny sau Die a zilei ploioase a lui Zooey și a lui Siri împreună.

Nu conteaza. Siri a devenit un cântăreț principal în corul robotului, vocea „You Got Mail” a unei noi generații.

În unele cercuri este la modă să sugerezi că Siri nu este demn de Steve Jobs, că dacă ar fi încă în viață, Jobs l-ar fi scos de pe piață sau, cel puțin, nu ar fi aprobat niciodată un anunț atât de înalt. campanie pentru un produs atât de defectuos.

Dar, cum a spus succesorul lui Jobs, Tim Cook, la începutul acestei săptămâni, proprietarii iPhone 4S ca Siri. Potrivit unui sondaj publicat în martie, aproape 90 la sută spun că îl folosesc cel puțin o dată pe lună. Și rețineți că Siri, unul dintre foarte puținele produse Apple a spus că este în beta când a fost lansat, nu va sărbători prima ei zi de naștere până în octombrie. Încă învață limbajul și, chiar mai important, abia începe să aplice potențialul inteligenței artificiale.

Siri va fi probabil o piesă centrală a Apple TV, care se așteaptă să debuteze în decembrie. Dar șansele sunt, locul în care vorbim cu mașinile vor intra în mainstream este în mașinile noastre.

Conduce, a spus ea

Sigur, asta deja se întâmplă, dar totuși trebuie să treceți la robot vorbind dacă doriți să fiți înțeleși. Și chiar atunci nu există nicio garanție. Asta va începe să se schimbe în această vară, când unele modele noi vor veni echipate cu ceva numit Dragon Drive!

Este invenția Nuance Communications, o companie cu sediul în Massachusetts, care a devenit o centrală în activitatea de recunoaștere vocală. (Se crede că sunt creierele din spatele lui Siri.) Nuance și recunoașterea vocii în mașini au făcut un salt important înainte săptămâna trecută, când firma a anunțat că Dragon Drive! va putea atinge în nor.

Ceea ce înseamnă asta este că sistemul își va ridica dramatic puterea de calcul și capacitatea de memorie. Și asta înseamnă că vocea din tabloul de bord va deveni mai asemănătoare cu Siri și vă va permite să conversați efectiv cu acesta. Nu mai strigă monosilabice. Se va apropia ziua când vei putea menționa întâmplător că simți ca unii Allman Brothers și câteva secunde mai târziu „Whipping Post” va veni pompând printre difuzoare.

Cheia este cât de bine reușim să învățăm contextul mașinilor și pragmatica - cum este folosit limbajul în situații sociale. Și asta este o afacere complicată. Pentru început, chiar și cel mai sofisticat dispozitiv de recunoaștere vocală trebuie să aștepte ca un om să termine vorbirea, astfel încât să poată analiza și interpreta întreaga propoziție. Apoi, există „teoria minții”, capacitatea de a înțelege că alți oameni pot avea credințe și intenții diferite decât ale noastre. Din câte știm, numai oamenii pot face acest lucru.

Un studiu recent realizat de doi psihologi Stanford vă poate da o idee despre ceea ce este implicat în a ajuta utilajele să intuiască. Cercetătorii Michael Frank și Noah Goodman au pus la punct un experiment online în care participanții au fost rugați să se uite la un set de obiecte și apoi să selecteze la care a fost menționat un anumit cuvânt. De exemplu, un grup de participanți a văzut un pătrat albastru, un cerc albastru și un pătrat roșu. Întrebarea pentru acel grup a fost: Imaginează-ți că vorbești cu cineva și vrei să te referi la obiectul din mijloc. Ce cuvânt ați folosi, „albastru” sau „cerc”?

Celălalt grup a fost întrebat: Imaginează-ți că cineva îți vorbește și folosește cuvântul „albastru” pentru a se referi la unul dintre aceste obiecte. Despre ce obiect vorbesc?

Răspunsurile au ajutat cercetătorii să aibă o imagine mai clară a modului în care un ascultător înțelege un vorbitor și cum un vorbitor decide ce să spună. Din aceasta, ei au dezvoltat genul de model matematic care poate extinde și perfecționa procesul de gândire al unui computer.

Frank a spus: „Va fi nevoie de ani de muncă, dar visul este un computer care se gândește cu adevărat la ceea ce vrei și ce vrei să spui, mai degrabă decât la ceea ce ai spus.”

Un mod de vorbire

Iată câteva evoluții mai recente în recunoașterea vocală:

  • Siri rămâne tăcut: IBM tinde să fie foarte nervos pentru secretele companiilor să iasă, așa că acum le interzice angajaților săi să folosească site-uri publice de transfer de fișiere, cum ar fi Dropbox. Dar are, de asemenea, interdicția de a folosi Siri în birou, deoarece executivii de securitate își fac griji că cineva, în timp ce vorbește cu telefonul său, ar putea dezvălui informații sensibile care se termină pe serverele Apple.
  • Luați asta, Apple !: Samsung a lansat săptămâna trecută la Londra noul său smartphone Galaxy X III și, în timp ce ecranul său tactil mare primește multă atenție, acesta oferă și software nou de recunoaștere a vocii și a feței.
  • Fă ce spun, nu ceea ce fac: Și Samsung nu se oprește acolo. De curând a depus o cerere de brevet pentru un robot care înțelege vorbirea umană. Robotul va fi capabil să își ajusteze capacitățile de „ascultare” pentru a ține cont de zgomotul ambiental care ar putea întrerupe sau perturba comenzile pe care le-a fost dat. De asemenea, ar putea să recunoască cine îi vorbește, chiar dacă zgomotul de fundal este foarte puternic.

Bonus infografic: credeți că mașina dvs. este computerizată acum. Așteptați până când este complet conectat la internet. Obțineți reducerea la ceea ce poate face o mașină conectată.

Vorbind cu mașini