https://frosthead.com

La revedere bariere lingvistice sărutare

Multă vreme, traducătorul universal a fost o obsesie a culturii pop. Star Trek o prezintă ca o mașină de mână, asemănătoare cu un microfon, care poate traduce imediat majoritatea limbilor . Ghidul Hitchhiker's to the Galaxy se mândrește cu un pește Babel, o creatură care, atunci când este blocat în urechea cuiva, oferă traducere instantanee a oricărei limbi din galaxie.

Așadar, nu ar trebui să surprindem că oamenii din zilele noastre încearcă să creeze un dispozitiv care să funcționeze la fel de bine. Zeci de aplicații pentru smartphone-uri de traducere există, dar majoritatea traduc cuvinte pe o bază simplă, unu la unu; un utilizator tipează sau vorbește un cuvânt, iar aplicația revine cu o traducere. Acum, obiectivul și adevărata cădere monetară este ca inginerii și antreprenorii să facă posibilă conversația a două persoane în diferite limbi, în timp ce un dispozitiv mic scutește traduceri în timp real.

Aplicații de traducere existente

Într-o călătorie în Grecia, Andrew Lauder, vorbitor de engleză, s-a îmbolnăvit.

„Am mers la farmacie și nu au putut înțelege nicio engleză, așa că nu am medicamente”, spune Lauder, CEO al Vocre Translate. Etichetele medicamentelor îi erau literalmente grecești. Barierele lingvistice sunt comune pentru călătorii din lume. Într-o țară străină, tranzacții mici, cum ar fi cumpărarea de medicamente sau obținerea de instrucțiuni - o altă dificultate cu care se confruntă Lauder - devin sarcini hercule.

La întoarcerea statului, Lauder a creat Vocre Translate, o aplicație de traducere vocală și text. A început ca o aplicație text-la-text (numită MyLangauge), apoi s-a transformat inițial într-un model vorbire-text care, ca și alte aplicații, inclusiv SayHi Translate, a folosit un model tradițional în care un cuvânt se traduce direct într-un alt cuvânt. Spune „Bună ziua”, iar smartphone-ul sau tableta fac din nou un „Hola” automat. „La revedere” devine „Sayonara”. Și așa mai departe, la fel ca un traducător de text.

Pentru a crea o simplă traducere audio, creatorii acestor aplicații aveau nevoie de date. Vocre și-a extras informațiile din înregistrări și documente pe domenii publice, cum ar fi filme vechi sau audieri publice. „Practic am cerut un serviciu de transcriere a mesajelor vocale pentru a ne permite să folosim norul lor pentru recunoașterea vorbirii”, spune CEO-ul SayHi, Lee Bossier.

Odată ce inginerii au avut date audio și text, au asociat audio și text, cuvânt cu cuvânt. Programul de recunoaștere vocală recunoaște „brânza” și îl transformă în text. Aceasta este transformată în franceză, iar aplicația găsește pronunția franceză pentru „fromage”.

Acestea fiind spuse, dacă un utilizator numește în mod obișnuit ceva „înșelător”, traducătorul nu funcționează la fel de bine, deoarece limba vorbită nu este la fel de statică ca cea scrisă. Cadența, argoul, inflexiunea, pronunția, dialectul și fluxul conversațional pot schimba sensul

Cu timpul însă, Lauder și-a dorit un dispozitiv mai conversațional. Într-un e-mail, el spune: „Pe baza datelor noastre de utilizare, am descoperit că oamenii vorbesc foarte diferit de modul în care scriu. Cuvântul vorbit este mult mai spontan și mult mai puțin formal și literal. ”Așadar, a folosit statistică traducere automată, o abordare folosită și de Google care folosește date pentru a găsi o utilizare obișnuită a cuvintelor, continuând modelul tradițional de traducere cuvânt cu cuvânt. Practic, Vocre învață așa cum este folosit. „Învață pe baza fiecărei conversații, a fiecărei fraze care o parcurg. Este ceva care devine mai isteț în timp ”, spune Lauder.

Totuși, în prezent, ambele aplicații au nevoie de câteva secunde pentru a traduce, dar sunt fără îndoială eficiente, în special în concertul cu limbajul corporal, pentru conversații tranzacționale, cum ar fi comandarea unei mese. La urma urmei, oamenii au comandat ani de zile alimente în limbi non-native și reușesc întotdeauna să mănânce în continuare. Dar nu au reușit să aibă conversații aprofundate și complexe.

Cu Vocre și SayHi, conversațiile se pot împovăra dur, dar nu este același lucru cu chatul în limba ta maternă. Google intenționează să schimbe acest lucru în întregime.

Abordare Google (traducere automată statistică)

Când învățăm o limbă nouă în școală, începem cu termeni de vocabular individual. Dar limbajul este mai fluid - cuvintele au nevoie de context.

„Abordarea [Google] este o abordare mai generală”, spune Josh Estelle, inginer software pentru Google Translate. „În loc să încercăm să codăm hardcore toate aceste reguli, încercăm să învățăm regulile privind prin date.”

Compania tehnologică evită metoda unu-la-unu, cuvânt-pentru-cuvânt și, în schimb, folosește traducere automată statistică, nu uitându-se la ce înseamnă cuvinte, ci la modul în care limbajul este modelat, pe care îl învață prin date . Așadar, își propune pădurea, nu copacii. Un exemplu în limba engleză: cunoaștem definițiile cuvântului „break” și „up”. Dar fraza „break up” nu este combinația literală a celor două cuvinte.

Traducerea automată statistică necesită date. Munții din ea. Pentru metoda de lucru, nu este nevoie doar de faptul că „fromage” este franceză pentru brânză, ci 100 de exemple atât de „fromage” cât și de brânză folosite în propoziții reale.

Estelle spune că dacă un vorbitor de engleză are două meniuri, identice, cu excepția faptului că unul este tipărit în engleză și unul în chineză, „poți probabil să-ți dai seama care este caracterul chinezesc pentru„ supă ”. Contextul este rege. Dar pentru a crea acel context, aveți nevoie de acces la milioane de meniuri și la orice alt document imaginabil.

Care este exact ceea ce Google are. Fără gigantul web să adune o mulțime de date, un pește Babel din lume real nu ar putea exista. Rastrează web-ul și colectează tot - text și audio. Apoi, alimentează aceste date în algoritmi care compară totul cu orice altceva. Aceste comparații ajută la rădăcina modului în care funcționează limbajul în mod natural.

„Un lucru care îi surprinde pe oameni când vorbim despre Traduceri este că echipa noastră nu are niciun lingvist în acest sens”, spune Estelle. „Am lansat 71 de limbi și aș spune că echipa noastră nu știe să vorbească marea majoritate a acestora. Un traducător uman nu va putea să învețe toți acești termeni și lucruri atât de repede [datele noastre] pot învăța de pe web. ”

Care-i rostul?

La fel ca Google, Facebook vede avantaje. Luați în considerare propria incursiune a site-ului social media în traducere.

„Misiunea Facebook a fost conectarea întregii lumi, iar una dintre barierele conectării lumii este că nu toată lumea vorbește aceeași limbă”, spune Tom Stocky, director de inginerie la Facebook. „În ceea ce privește traducerea, cred că viziunea cu adevărat ambițioasă pentru viitor este dacă ai putea folosi Facebook în limba ta maternă și să interacționezi cu orice altă limbă.”

În august trecut, Facebook a achiziționat Jibbigo, o aplicație de traducere vorbire în vorbire, care este disponibilă pentru dispozitivele Android și iOS.

Utilizatorii interesați de Facebook vor nota că site-ul social are deja o traducere. Dacă ați avut vreodată o postare spaniolă pe pagina dvs. din engleză, vi s-a oferit imediat posibilitatea de a o traduce în limba maternă.

Dar Stocky vede componenta vocală ca un potențial schimbător de jocuri. Creșterea smartphone-urilor și tabletelor salută o lume perpetuă interconectată, iar creșterea software-ului de recunoaștere a vorbirii invită noi mijloace de interacțiune web. Stocky are în vedere un viitor în care utilizatorii pot doar să vorbească o comandă pentru smartphone-urile lor și să interacționeze cu alți utilizatori, diferențele de limbă deoparte.

„În cele din urmă, nu există nicio întrebare, deoarece singurele limitări sunt puterea motorului limbajului și, desigur, timpul de procesare și puterea de procesare”, spune el.

Laura Murphy, profesor în departamentul de sisteme de sănătate globală și dezvoltare la Universitatea Tulane și o sceptică tehnologică admisă, pune la îndoială valoarea unui traducător universal și nu este nevoie să cunoască mai multe limbi.

Ea consideră că dispozitivul ar putea fi oarecum util în ceea ce privește călătoriile, relațiile de afaceri și relațiile internaționale, dar nu înovatoare La un anumit nivel, avem deja traducători (oameni) în loc, iar majoritatea care lucrează în relații externe cunosc limbile corespunzătoare. Un dispozitiv, crede Murphy, ar putea avea consecințe negative.

„Cred că îi poate face pe oameni leneși”, spune Murphy. Traducerea limbilor poate fi dificilă din punct de vedere mental, forțând creierul - în special cel care cunoaște mai mult de două limbi - să funcționeze într-un mod diferit, dar exercițiul este plin de satisfacții. Creierul se trage dintr-un loc de empatie lingvistică pe care nici cel mai fin traducător de voce nu l-ar putea atinge niciodată.

Deși această comunicare universală ar putea fi una pozitivă, recunoaște Murphy, „ar putea duce oamenii să creadă că comunică atunci când nu”. Cultura nu este întotdeauna complet întruchipată în limbaj (luăm sarcasmul, de exemplu), iar comunicarea nu este întotdeauna despre informațiile transmise.

Când ne putem aștepta să vedem această tehnologie?

„În 2005, ne-a luat 40 de ore să traducem 1.000 de propoziții”, spune Estelle, de la Google. „Astăzi, traducem echivalentul a 1.000 de propoziții la fiecare 10 milisecunde.”

Așa cum spune Richard Anderson în celebrul serial TV din anii ’70 The Six Million Dollar Man, „Avem tehnologia.” Acum, abia așteptăm să colectăm și să analizăm datele. Cât timp va dura acest lucru rămâne necunoscut, potrivit Estelle. Dar estimări prudente au pus un astfel de dispozitiv în mâinile noastre într-un deceniu.

Deși creatorii de aplicații precum Bossier sau companii gigante precum Google și Facebook nu vor să-și construiască propriile versiuni ale Biblical Tower of Babel, însă vor să pună capăt balonării. Acesta prevede o lume în care comunicăm cu toții, despre medicină, despre politică, despre idei.

Și, această lume ar putea să nu fie departe.

Nota editorului: Am actualizat această poveste pe 4 aprilie 2014, pentru a descrie cu exactitate tehnologia Vocre Translate.

La revedere bariere lingvistice sărutare