https://frosthead.com

Cea mai mare majoritate de date brute din vechile studii științifice poate lipsi

Unul dintre fundamentele metodei științifice este reproductibilitatea rezultatelor. Într-un laborator din orice parte a lumii, un cercetător ar trebui să poată studia același subiect ca un alt om de știință și să reproducă aceleași date sau să analizeze aceleași date și să observe aceleași tipare.

Acesta este motivul pentru care concluziile unui studiu publicat astăzi în Biology Current sunt atât de preocupante. Când un grup de cercetători au încercat să trimită prin email autorii a 516 studii biologice publicate între 1991 și 2011 și să solicite datele brute, au fost consternați să constate că mai mult de 90 la sută dintre cele mai vechi date (din lucrări scrise cu mai mult de 20 de ani în urmă) erau inaccesibil. În total, chiar și în articolele publicate încă din 2011, acestea au putut doar să urmărească datele pentru 23 la sută.

„Toată lumea știe că, dacă cereți unui cercetător date din studii vechi, se vor bate și vorbește, pentru că nu știu unde este”, spune Timothy Vines, zoolog la Universitatea din Columbia Britanică, care a condus efortul. "Dar nu au existat niciodată estimări sistematice despre cât de rapid dispar datele deținute de autori."

Pentru a le face estimarea, grupul său a ales un tip de date care au fost relativ consistente de-a lungul timpului - măsurători anatomice ale plantelor și animalelor - și au dezgropat între 25 și 40 de lucrări pentru fiecare an ciudat în perioada care a utilizat acest tip de date, pentru a vedea dacă ar putea vâna numerele prime.

O mare parte surprinzătoare a anchetelor lor a fost oprită la prima etapă: pentru 25 la sută dintre studii, adresele de e-mail active nu au putut fi găsite, adresele defuncte fiind listate pe hârtie în sine și căutările de pe web nu apar pe cele actuale. Pentru alte 38% din studii, întrebările lor nu au dus la niciun răspuns. Un alt 7% din seturile de date au fost pierdute sau inaccesibile.

"Unele din timp, de exemplu, a fost salvat pe dischete de trei centimetri și jumătate, astfel încât nimeni nu a putut accesa, pentru că nu mai aveau unități adecvate", spune Vines. Deoarece ideea de bază a păstrării datelor este astfel încât să poată fi folosite de alții în cercetările viitoare, acest tip de obsolescență face ca datele să fie inutile.

Acestea pot părea obstacole mundane, dar oamenii de știință sunt la fel ca ceilalți dintre noi - schimbă adresele de e-mail, primesc computere noi cu unități diferite, își pierd backup-urile de fișiere - deci aceste tendințe reflectă probleme sistemice grave în știință.

Și păstrarea datelor este atât de importantă, merită să ne amintim, pentru că este imposibil de prezis în ce direcții se va muta cercetarea în viitor. Vines, de exemplu, și-a desfășurat propriile cercetări cu privire la o pereche de specii de ciuperci native din Europa de Est care par a fi în proces de hibridizare. În anii 1980, spune el, o echipă separată de cercetători lucra la același subiect și a dat peste o lucrare veche care documenta distribuția acestor broaște în anii '30. Știind că distribuția lor s-a schimbat relativ puțin în deceniile intervenite le-a permis oamenilor de știință să facă tot felul de calcule care altfel nu ar fi fost posibile. "Datele originale disponibile, dintr-un studiu vechi foarte mic scris în poloneză, au fost incredibil de utile cercetătorilor care au venit de-a lungul a 70 de ani mai târziu", spune el.

Există, de asemenea, faptul că o mare parte din această cercetare este plătită cu finanțare publică, o mare parte din acestea se realizează prin subvenții care stipulează ca datele rezultate să fie puse la dispoziția publicului liber. În plus, datele de câmp sunt afectate de circumstanțele mediului în care sunt colectate - astfel, este imposibil de reprodus perfect mai târziu, atunci când condițiile s-au schimbat.

Care este soluția? Unele reviste - inclusiv Ecologia moleculară, dintre care Vines este un editor de gestionare - au adoptat politici care solicită autorilor să prezinte date brute împreună cu lucrările lor, permițând jurnalului propriu să arhiveze datele în permanență. Deși jurnalele, la fel ca oamenii, sunt susceptibile la schimbarea adreselor de e-mail și la obsolescența tehnologică, aceste probleme pot fi mult mai ușor gestionate la scară instituțională.

Cea mai mare majoritate de date brute din vechile studii științifice poate lipsi