https://frosthead.com

Date mari sau prea multe informații?

Știm cu toții că în lumea noastră există mult mai multe informații decât existau. În ceea ce privește cât de mult, bine, majoritatea dintre noi suntem destul de neîncrezători.

Continut Asemanator

  • Infografie De-a lungul veacului evidențiază frumusețea vizuală a științei
  • De ce tendințele gripei Google nu pot urmări gripa (totuși)

Iată un aspect neprețuit despre toate acele informații, complimente ale lui Dave Turek, tipul responsabil de dezvoltarea supercomputerului la IBM: Din anul 2003 și lucrând înapoi până la începutul istoriei umane, am generat, conform calculelor IBM, cinci exabytes - adică. cinci miliarde de gigabyte - de informații. Până anul trecut, am dat peste aceste date la fiecare două zile. Până anul viitor, prevede Turek, îl vom face la fiecare 10 minute.

Dar cum este posibil acest lucru? Cum au devenit datele un astfel de kudzu digital? Puneți pur și simplu, de fiecare dată când telefonul mobil își expediază locația GPS, de fiecare dată când cumpărați ceva online, de fiecare dată când faceți clic pe butonul Like pe Facebook, introduceți un alt mesaj digital într-o sticlă. Și acum oceanele sunt aproape acoperite cu ele.

Și asta este doar o parte din poveste. Mesaje text, înregistrări clienți, tranzacții bancomate, imagini cu camere de securitate ... lista continuă și continuă. Cuvântul cheie pentru a descrie acest lucru este „Big Data”, deși acest lucru nu face justiție cu amploarea monstrului pe care l-am creat.

Este cel mai recent exemplu de tehnologie care ne întrece capacitatea de a o folosi. În acest caz, nu am început să ne ocupăm de capacitatea noastră de a capta informații, motiv pentru care, în aceste zile, un grup preferat de pundituri de management este faptul că viitorul aparține companiilor și guvernelor care pot da sens tuturor tuturor datelor. colectare, de preferință în timp real.

Întreprinderile care pot interpreta fiecare pâine digitală pe care clienții lor o lasă în urmă vor avea un avantaj, gândirea merge - nu doar cine a cumpărat de unde în ultima oră - ci și dacă au făcut un tweet despre asta sau au postat o fotografie undeva în vârtejul rețelelor de socializare. Același lucru este valabil și pentru orașele care pot strânge date din miile de senzori care acum dotează peisajele urbane și transformă variațiile vieții orașului, cum ar fi fluxul de trafic, într-o știință.

Nu este surprinzător, campaniile politice sunt deja înrădăcinate, extrăgând furios datele ca parte a atenției lor asupra alegătorilor „nanotargeting”, astfel încât să știe exact cum să le adune pentru voturi și bani. Dintre concluziile pe care analistii au tras-o, conform editorialistului de la New York Times, Thomas Edsall, este faptul că republicanii arată o preferință pentru restaurantele „The Office” și Cracker Barrel, în timp ce democrații au mai multe șanse să privească „Noaptea târziu cu David Letterman” și să mănânce la Chuck E Brânză.

Această grabă de a interpreta flotsam-ul digital explică de ce săptămâna trecută Google a anunțat că va începe să vândă un produs pe care îl numește BigQuery, software care poate scana terabyte de informații în câteva secunde. Și de ce un startup numit Splunk, care are o tehnologie care poate analiza cantități uriașe de date despre clienți și tranzacții, a văzut că valoarea acțiunilor sale a crescut aproape 90% în ziua în care a fost publică luna trecută. Aceasta, pentru o companie care a pierdut anul trecut 11 milioane de dolari.

Creșterea omului de date

Dar chiar și accesul la cele mai bune instrumente de descifrare a datelor nu este o garanție de mare înțelepciune. Foarte puține companii au angajați cu instruire nu numai pentru a evalua munții de date - inclusiv o mulțime de echipamente nestructurate din milioane de pagini Facebook și telefoane inteligente - dar și pentru a efectua ceva cu aceasta.

Anul trecut, McKinsey Global Insitute a emis un raport care descrie „Big Data” drept „următoarea frontieră pentru inovare”, dar a prezis și că până în 2018, companiile din SUA vor avea o deficiență serioasă de talent atunci când vine vorba de abilitățile analitice necesare - la fel de mulți 190.000 de oameni. Și susține că încă 1, 5 milioane de manageri vor trebui instruiți pentru a lua decizii strategice odată cu torentul de date care vor veni.

Cu toate acestea, nu toată lumea este credincioasă în magia Big Data. Peter Fader, profesor de marketing la Wharton School of Business de la Penn, nu este convins că mai multe date sunt mai bune. Nu că crede că o companie nu ar trebui să încerce să învețe cât poate despre clienții săi. Doar că acum se concentrează atât de mult pe agregarea fiecărui bit de date încât consideră că volumul este valorizat în raport cu analiza adevărată.

Iată analiza lui Fader dintr-un interviu recent cu revizuirea tehnologiei MIT : „Chiar și cu cunoașterea infinită a comportamentului trecut, deseori nu vom avea suficiente informații pentru a face predicții semnificative despre viitor. De fapt, cu cât avem mai multe date, cu atât vom avea încredere falsă ... Partea importantă este să înțelegem care sunt limitele noastre și să folosim cea mai bună știință posibilă pentru a umple golurile. Toate datele din lume nu vor atinge niciodată acest obiectiv pentru noi. ”

Cine vă sunt datele?

Iată un eșantion despre modul în care Big Data este utilizat pentru a rezolva problemele mari:

  • Ei știu când au fost răi sau buni: În timp ce majoritatea companiilor se concentrează pe analizarea clienților lor, Amazon notează puncte folosind Big Data pentru a-i ajuta pe ai lor.
  • Studiul de pui: Vrei să știi care tauri nasc cele mai productive vaci de lapte? Industria produselor lactate a conceput o modalitate de a zdrobi numerele.
  • Diagnostic pe date: Cercetătorii de la SUNY Buffalo analizează seturi masive de date în efortul lor de a determina dacă există o legătură între scleroza multiplă și factorii de mediu, cum ar fi o expunere suficientă la lumina soarelui.
  • În căutarea problemelor: O companie numită Recorded Future este o informare minieră de pe rețelele sociale și de pe site-urile guvernamentale și financiare pentru a face prognoze cu privire la modul în care creșterea populației, penuria de apă și vremea extremă pot duce la tulburări politice viitoare și terorism.

Bonus video: Captarea datelor este un lucru. A face să pară atrăgătoare și de înțeles este o altă provocare. David McCandless cerea puterea „hărților informaționale” în această discuție TED.

Date mari sau prea multe informații?