https://frosthead.com

Calculatoarele pot descifra o limbă veche de 5.000 de ani?

Civilizația Indus, care a înflorit în mare parte din mileniul al treilea î.Hr., a fost cea mai extinsă societate a timpului său. La înălțimea sa, a cuprins o suprafață de peste o jumătate de milion de mile pătrate centrată pe ceea ce este astăzi granița India-Pakistan. Rămășițe din Indus au fost găsite la nord de Himalaya și la sud de Mumbai. Era cea mai veche cultură urbană a subcontinentului și se mândrea a două orașe mari, unul la Harappa și altul la Mohenjo-daro. Cu toate acestea, în ciuda dimensiunii și longevității sale și, în ciuda a aproape un secol de investigații arheologice, multe despre Indus rămân învăluite în mister.

Ceea ce știm puțin a venit din săpăturile arheologice care au început în anii 1920 și continuă și astăzi. De-a lungul deceniilor, arheologii au descoperit numeroase artefacte, inclusiv sigilări de timbre, amulete și tablete mici. Multe dintre aceste artefacte poartă ceea ce par a fi exemplare de scris - figuri gravate care seamănă, printre altele, cu potcoavele înaripate, roți cu raze și pești verticali. Totuși, ceea ce ar însemna exact aceste simboluri, rămâne una dintre cele mai faimoase ghicitori nesoluționate din bursa civilizațiilor antice.

Au existat alte coduri grele pentru a sparge în istorie. Egiptologii păcăliti au prins o pauză norocoasă cu descoperirea celebrei pietre Rosetta în 1799, care conținea text atât în ​​egiptean, cât și în grec. Studiul hieroglifelor maya s-a stins până când un lingvist rus, numit Yury Knorozov, a folosit în mod inteligent maia vorbită contemporană în anii '50. Dar nu există o piatră Rosetta a Indusului, iar savanții nu știu care, dacă este cazul, limbile ar fi putut să descindă din cea vorbită de indus.

În urmă cu aproximativ 22 de ani, în Hyderabad, India, un student de clasa a opta pe nume Rajesh Rao a întors pagina unui manual de istorie și a aflat pentru prima dată despre această fascinantă civilizație și despre scenariul ei misterios. În anii care au urmat, școala și profesia lui Rao l-au luat într-o direcție diferită - s-a terminat urmărind informatica, pe care o predă astăzi la Universitatea din Washington din Seattle, dar a monitorizat cu atenție bursa Indus, păstrând filele pe zecile de nereușite. încercări de a da sens scenariului. Chiar în timp ce a studiat inteligența artificială și robotica, Rao a reunit o mică bibliotecă de cărți și monografii pe scenariul Indus, aproximativ 30 dintre ele. Pe un raft de cărți din apropiere, a păstrat și prețuitul manual de istorie din clasa a opta, care l-a introdus în Indus.

„A fost uimitor să văd numărul de idei diferite pe care oamenii le-au sugerat”, spune el. Unii cercetători au susținut că scrierea era un fel de scenariu sumerian; alții o situau în familia Dravidianului; încă alții credeau că este legat de o limbă a insulei de Paște. Rao a ajuns să aprecieze că aceasta a fost „probabil una dintre cele mai provocatoare probleme din punct de vedere al istoriei antice.”

Cum încercarea după încercarea a eșuat la descifrarea scenariului, unii experți au început să-și piardă speranța că poate fi decodificat. În 2004, trei savanți au argumentat într-o lucrare controversată că simbolurile Indus nu aveau deloc conținut lingvistic. În schimb, simbolurile pot fi doar mai mult decât pictograme reprezentând figuri politice sau religioase. Autorii au mers până să sugereze că Indus nu a fost deloc o civilizație alfabetizată. Pentru unii din domeniu, întreaga încercare de a încerca să găsească limbajul în spatele acelor gravuri Indus a început să semene cu un exercițiu inutil.

Câțiva ani mai târziu, Rao a intrat în față. Până atunci, oamenii care studiază scenariul erau arheologi, istorici, lingviști sau criptologi. Dar Rao a decis să ascundă secretele scenariului Indus folosind instrumentul pe care îl știa cel mai bine - informatica.

Fascinat de civilizația Indus încă din clasa a VIII-a, Rajesh Rao folosește informatica și un concept numit „entropie condiționată” pentru a ajuta la decodarea scenariului Indus. (Cu amabilitatea lui David Zax) De-a lungul deceniilor, arheologii au descoperit numeroase artefacte din civilizația Indus, inclusiv etanșări de timbre, amulete și tablete mici. (Robert Harding / Robert Harding Imagerie Mondială / Corbis) Rao și colaboratorii săi și-au publicat descoperirile în revista Science în mai. Ei nu au descifrat limba, dar descoperirile lor au accentuat înțelegerea acesteia. (Robert Harding / Robert Harding Imagerie Mondială / Corbis) Rao și colegii săi se uită acum la șiruri mai lungi de personaje decât au analizat în lucrarea Știință . Găsirea tiparelor ar ajuta la rândul lor să determine ce familii de limbi ar putea aparține scriptul. (Cu amabilitatea lui David Zax)

Într-o zi de vară la Seattle, Rao m-a întâmpinat în biroul său pentru a-mi arăta cum el și colegii săi au abordat problema. El a stabilit o colecție de replici de impresii de sigiliu de argilă, pe care arheologii le-au descoperit de pe siturile Indus. Sunt mici - ca niște bomboane mici de ciocolată pătrate - și majoritatea prezintă o imagine a unui animal sub o serie de simboluri Indus. Majoritatea mostrelor din scenariul Indus sunt miniaturi ca acestea, având doar câteva personaje; nu s-au descoperit mari monoliti. Cercetătorii nu sunt siguri de funcția sigiliilor mici, mi-a spus Rao, dar o teorie este că s-ar putea să fi fost folosite pentru a certifica calitatea mărfurilor tranzacționate. Un alt lucru sugerează că sigiliile ar fi putut fi o modalitate de a se asigura că comercianții au plătit impozite la intrarea sau la ieșirea dintr-un oraș - multe sigilii au fost găsite printre ruinele caselor de la poartă, care ar fi putut funcționa ca niște cabine de taxare antice.

Rao și colegii săi nu au căutat să facă minuni - știau că nu aveau informații suficiente pentru a descifra scenariul antic - dar au ipotezat că, folosind metode de calcul, ar putea cel puțin să înceapă să stabilească ce fel de scriere a Indusului scriptul a fost: a codat limbajul, sau nu? Au făcut acest lucru folosind un concept numit „entropie condiționată”.

În ciuda numelui impunător, entropia condiționată este un concept destul de simplu: este o măsură a cantității de aleatoriu dintr-o secvență. Luați în considerare alfabetul nostru. Dacă ar fi să iei plăcile Scrabble și să le arunci în aer, s-ar putea să găsești o scrisoare veche care apare după alta. Dar în cuvintele englezești, anumite litere sunt mai probabil să apară după altele. Un q în engleză este aproape întotdeauna urmat de un u . A poate fi urmată de r sau e, dar este mai puțin probabil să fie urmată de un n sau un b .

Rao și colaboratorii săi - un grup internațional care include informaticieni, astrofizicieni și matematicieni - au folosit un program de calculator pentru a măsura entropia condiționată a scenariului Indus. Apoi au măsurat entropia condiționată a altor tipuri de sisteme - limbaje naturale (sumeriană, tamilă, sanscrită și engleză), un limbaj artificial (limbajul de programare computer Fortran) și sisteme non-lingvistice (secvențe ADN umane, secvențe de proteine ​​bacteriene și două seturi de date artificiale reprezentând extremele înalte și joase ale entropiei condiționate). Atunci când au comparat cantitatea aleatorie din scriptul Indus cu cel al celorlalte sisteme, au descoperit că seamănă cel mai mult cu ratele găsite în limbile naturale. Și-au publicat descoperirile în mai în revista Science .

Dacă arată ca o limbă și acționează ca o limbă, atunci este probabil o limbă, sugerează lucrarea lor. Descoperirile nu descifrează scenariul, desigur, dar ne accentuează înțelegerea acestuia și au acordat reasigurare arheologilor care au lucrat sub presupunerea că scriptul Indus codifică limbajul.

După publicarea lucrării, Rao a primit o surpriză. Se pare că întrebarea din ce limbă face parte scenariul, este una sensibilă: datorită vârstei și semnificației civilizației Indus, multe grupuri contemporane din India ar dori să o revendice ca strămoș direct. De exemplu, indienii care vorbesc tamilii din sud ar prefera să învețe că scriptul Indus a fost un fel de proto-dravidian, întrucât tamila este descendentă din proto-dravidian. Vorbitorii de hindi din nord ar prefera să fie o formă veche de sanscrită, un strămoș al hindi. Lucrarea lui Rao nu concluzionează din ce limbă face parte scenariul, deși notează că entropia condiționată este similară cu Old Tamil - ceea ce face ca unii critici să ne „acuze” că suntem naționali dravidieni ”, spune Rao. "Ferocitatea acuzațiilor și atacurilor a fost complet neașteptată."

Uneori, Rao ia ușurare în revenirea în lumea neuroștiinței și roboticii mai puțin contestate. Dar apelul scenariului Indus rămâne atrăgător, iar „ceea ce a fost un hobby este acum monopolizarea mai mult de o treime a timpului meu”, spune el. Rao și colegii săi se uită acum la șiruri mai lungi de personaje decât au analizat în lucrarea Știință . „Dacă există tipare, ” spune Rao, „am putea veni cu reguli gramaticale. La rândul său, acest lucru ar genera constrângeri la ce tipuri de familii de limbi ”ar putea aparține scenariul.

El speră că descoperirile sale viitoare vor vorbi de la sine, incitând mai puțini rancori de la adversarii care se înrădăcină pentru o regiune a Indiei versus alta. La rândul său, când Rao vorbește despre ce înseamnă scenariul Indus pentru el, el tinde să vorbească în termeni de India în ansamblu. „Moștenirea Indiei s-ar îmbogăți considerabil dacă am putea înțelege civilizația Indus”, spune el. Rao și colaboratorii săi lucrează la el, o linie de cod sursă la un moment dat.

Calculatoarele pot descifra o limbă veche de 5.000 de ani?