https://frosthead.com

Cum învață GPS-ul să vorbească limba ta

Karen Jacobsen, o cântăreață și actriță vocală australiană, a obținut concertul în 2000, la scurt timp după sosirea la New York. Producătorii - tipuri corporative - au trimis-o la un studio de înregistrări timp de trei săptămâni, unde a petrecut patru ore pe zi spunând lucruri de genul „la următoarea intersecție, întoarce la stânga” și „recalculează”. La final, nu a fost vocea ei asta era încordat. "Am spus 'de aproximativ 186 de ori", își amintește Jacobsen. „Genul ăsta de lucruri te pot face să te bucuri.”

Continut Asemanator

  • De la Ptolemeu la GPS, Scurt istoric al hărților

Doi ani mai târziu, a primit un telefon de la un prieten. „Karen”, a răbufnit palma. „Mi-am cumpărat soțului unul dintre acele lucruri GPS noi și l-am pus pe vocea australiană. Ești tu! ”Așa a aflat că Jacobsen vocea ei dădea indicații pentru 400 de milioane de oameni din întreaga lume.

Lucrarea ei evidențiază hibridul de sânge și tehnologie care intră în vocile acum omniprezente, spunându-ne unde să ne îndreptăm: Peste un miliard de oameni se bazează pe Google Maps în fiecare lună și 80% activează opțiunea vocală.

În primele zile ale sintezei vocale - gândiți-vă la sunetele robotice ale unui Speak & Spell de la sfârșitul anilor 1970 - un algoritm convertit text într-un flux monoton. Apoi, pe măsură ce bazele de date creșteau, puteți înregistra un actor vocal precum Jacobsen pronunțând un corpus de silabe și cuvinte, care algoritmi ar combina și modifica în conformitate cu regulile de bază. Mai recent, codificatoare software la firme precum Nuance, care proiectează interfețe de navigație pentru mașini, au dezvoltat o a treia abordare - aplicarea învățării profunde la sinteza vorbirii. Amestecă cuvinte înregistrate și fragmente sintetizate, bazându-se pe inteligența artificială pentru a face pronunția și mai umană. „Sună în mod nesigur”, spune directorul tehnologic Nuance, Vlad Sejnoha.

Desigur, întrebările lingvistice rămân o provocare pentru sistemele de voce. „Gândește-te„ ciudat ”versus„ cumpărat ”sau„ citit ”versus„ citit ”, spune un purtător de cuvânt al Google. „Dar să sperăm că utilizatorul poate ghici întotdeauna ce ne-am propus.” Acum, că AI învață sistemele de navigație auto să vorbească mai inteligent, următorul va căuta în lumea online și își va da seama unde doriți să mergeți chiar înainte.

Preview thumbnail for video 'Subscribe to Smithsonian magazine now for just $12

Abonați-vă la revista Smithsonian acum pentru doar 12 dolari

Acest articol este o selecție din numărul iulie / august al revistei Smithsonian

A cumpara
Cum învață GPS-ul să vorbească limba ta