https://frosthead.com

Acest lucru poate fi cel mai mare arbore genealogic din lume

Creșterea testării ADN prin servicii precum 23andme arată că există o piață mare acolo pentru istoria familiei.

Acum, oamenii de știință s-au bazat pe aceste date publicând ceea ce cred că este cea mai mare bază de date genealogice din lume, cu un arbore genealogic care leagă 13 milioane de oameni și se întinde mai mult de cinci secole.

După cum raportează Jocelyn Kaiser pentru revista Science, Yaniv Erlich, un genetician de calcul la Universitatea Columbia, a gândit proiectul în urmă cu șapte ani, după ce a primit un e-mail de la o veriță îndepărtată, prin Geni.com, unul dintre numeroasele site-uri unde se căuta legături de familie.

Cu sprijinul directorului tehnologic Gemi.com, Erlich a descărcat profilurile publice ale site-ului - zeci de milioane dintre ele. Deși nu oferea date ADN, informațiile includeau numele unei persoane, sexul, data și locul nașterii, data morții și rudele imediate.

Natura a scris despre proiectul lui Erlich în primele etape din 2013, iar anul trecut, Sarah Zhang, din Atlantic, a raportat că cercetătorii au lansat o amprentă a arborelui masiv. Acum, scrie Kaiser, echipa lui Erlich a publicat un studiu asupra lucrărilor lor în revista Science. Folosind datele, au ajuns cu 5, 3 milioane de copaci, dintre care cel mai mare leagă aproximativ 13 milioane de rude, în mare parte cu descendență europeană.

De la începerea proiectului, Erlich a devenit ofițerul științific al MyHeritage, o companie de genealogie și testare ADN care deține Geni.com. El a făcut un Reddit Ask Me Anything cu privire la constatările sale, corectând concepțiile greșite și explicând metodologia din spatele proiectului. El a menționat, de asemenea, că cea mai interesantă parte a experienței pentru el a fost să descopere cum să traduceți toate datele disponibile în ceva personal.

Într-un interviu cu Nicole Wetsman de la National Geographic, Erlich spune că a înțelege cum să lucrezi cu aceste date a fost și partea cea mai provocatoare a proiectului. „Seturile de date genomice au instrumente specifice, structuri de date, metode, dar nu am avut nimic pentru asta. Inventam roata în timp ce mergeam ", spune el.

În cele din urmă, cercetătorii au folosit teoria graficului matematic pentru a organiza și verifica informațiile, relatează Laura Geggel pentru Live Science . De asemenea, au comparat profilurile cu aproximativ 80.000 de certificate de deces disponibile publicului de la Vermont pe o perioadă de 25 de ani pentru a se asigura că nu au fost doar profiluri bogate încărcate în Geni.com.

Apoi, echipa a decis ce informații doresc să caute pentru a testa baza de date, scrie Wetsman.

Au început să privească tiparele și au constatat fluctuații în durata de viață, lucru pe care îl anticipaseră. De exemplu, au văzut o cădere de tineri în timpul Războiului Civil și al Războaielor Mondiale I și II și o creștere a supraviețuirii copilăriei în anii 1900. De asemenea, au fost capabili să urmărească migrația, cum ar fi sosirea Mayflower în 1620 în ceea ce este acum Massachusetts, urmată de o creștere a nașterilor în acea zonă.

De asemenea, cercetătorii au descoperit că longevitatea are mai mult de-a face cu mediul și comportamentul decât cu genetica; de fapt, datele dezvăluite genele sunt responsabile doar cu 16% pentru durata de viață. Paola Sebastiani, profesor de biostatistică la Școala Universității de Sănătate Publică din Boston, însă, avertizează să tragă concluzii în jurul acestor date într-un interviu acordat lui Wetsman. „Există o mulțime de confuzii cu privire la definițiile longevității”, spune ea.

Geneticianul Peter Visscher de la Universitatea din Queensland din Brisbane, Australia, îi spune lui Kaiser datele echipei lui Erlich respectate are potențialul de a oferi o perspectivă asupra rolului geneticii asupra bolilor, dacă datele sunt legate de informații despre sănătate.

Echipa de cercetare a început deja să combine copacul cu informații din ADN.Land, care adună date ADN, ceea ce ar putea însemna că un copac chiar mai mare ar putea veni în curând. Cercetătorii prognozează că, dacă baza de date ar putea merge înapoi 65 de generații, vor putea completa arborele.

Acest lucru poate fi cel mai mare arbore genealogic din lume