Statisticienii și oamenii de știință politică au avut o zi de teren cu rezultatele alegerilor iraniene la începutul acestei luni. Alegerile au fost riglate? Poate că nu știm niciodată, dar există suficientă îngropare în matematică pentru a ne face să credem că ar fi fost așa. Chiar și atunci, totuși, există și suficiente pentru a ne face să credem că totul este legitim. Iată câteva analize care mi s-au părut deosebit de interesante:
Curățați date
Imediat după alegeri, s-au ridicat îndoieli cu privire la legitimitatea datelor, deoarece de fiecare dată a fost lansat un nou lot de rezultate ale votului (acestea apar în bucăți în Iran, similar cu Statele Unite), procentul de voturi se va adresa președintelui Mahmoud Ahmadinejad era la fel: 67 la sută. De obicei, datele nu sunt curate, iar unii au început să se întrebe dacă rezultatele au fost fabricate.
O analiză a profesorului de matematică de la Universitatea din Wisconsin, Jordan Ellenberg, în Ardezie, însă, aprofundează mai mult datele pentru a arăta că era de fapt mai dezordonat decât se putea aștepta. Rezultatele nu au ieșit oraș cu oraș, ci în loturi mari care au combinat date din mai multe domenii, ceea ce a însemnat că totalul voturilor lui Ahmadinejad au fost într-adevăr medii. Iar Legea numerelor mari dictează, după cum scria Ellenberg:
Mediile de cantități variate pot produce și, de obicei, rezultate obținute care arată aproape perfect uniforme. Având în vedere suficiente date, valorile tind să se anuleze reciproc.
Ellenberg concluzionează că datele sunt „cu siguranță destul de dezordonate pentru a fi adevărate”.
Legea lui Benford
Mai multe analize au analizat primele cifre ale rezultatelor alegerilor din Iran pentru a vedea dacă respectă Legea lui Benford, care este:
În listele de numere din multe surse de date reale (dar nu toate), cifra de frunte este distribuită într-un mod specific, neuniform. Conform acestei legi, prima cifră este de 1 aproape o treime din timp, iar cifrele mai mari apar ca cifră principală cu frecvență mai mică și mai mică, până la punctul în care 9 ca primă cifră apare mai puțin de o dată la douăzeci. Această distribuție a primelor cifre apare logic, ori de câte ori un set de valori este distribuit în mod logaritmic.
O analiză folosind această abordare, realizată de Boudewijn Roukema, de la Universitatea Nicolaus Copernicus din Polonia, a ajuns la concluzia că au existat aproape de două ori mai multe număr de voturi începând cu cifra 7 pentru Mehdi Karroubi decât se aștepta cu Legea lui Benford. În plus, Roukema a bănuit că rezultatele pentru Ahmadinejad, în care au fost mai puține 1s și mai multe 2s și 3s decât se așteptau, ar fi fost probabil dacă cineva a ales să manipuleze rezultatele schimbând 1s la începutul votului total la 2s și 3s. De asemenea, ar fi dus la o supraestimare a totalului lui Ahmadinejad cu câteva milioane de voturi.
Walter Mebane, politolog și statisticist la Universitatea din Michigan, a folosit de asemenea legea lui Benford în analiza sa, în care constată, de asemenea, mai multe nereguli în rezultatele alegerilor din Iran. Dar chiar recunoaște că, deși rezultatele sale sunt „compatibile cu frauda răspândită”, ele sunt, de asemenea, „compatibile cu Ahmadinejad care a câștigat de fapt”.
Ultimele două cifre
Doi studenți absolvenți în științe politice de la Universitatea Columbia au luat încă o a treia informație. Într-o analiză pe care au rezumat-o într-un Washington Post, au examinat ultimele două cifre ale numărului de voturi din 29 de provincii pentru fiecare dintre cei patru candidați (de exemplu, dacă cineva a primit 14.579 de voturi, numai cei 7 și 9 au fost luați în considerare în analiza).
Ultimele două cifre din rezultatele alegerilor sunt zgomotul aleatoriu, iar distribuția cifrelor ar trebui să fie echitabilă - fiecare cifră ar trebui să apară în jur de 10 la sută din timp. Oamenii, însă, sunt generatori de numere aleatorii slabe și atunci când formăm numere, avem tendința de a alege unele numere mai frecvent decât altele. În rezultatele Iranului, doar 4 la sută din numere se termină în cifra 5, în timp ce cifra 7 apare cu 17% din timp. Rezultatele care deviază acest lucru ar fi de așteptat la aproximativ patru din fiecare 100 de alegeri.
Oamenii au, de asemenea, probleme la crearea de numere care au cifre care nu sunt adiacente (adică, ai mai puține șanse să vină cu 72 decât cu 23), dar aceste numere ar trebui să urmeze, de asemenea, modele aleatorii și aproximativ 70 la sută dintre perechi ar trebui să fie alese. cifre. Cu toate acestea, în rezultatele Iranului, doar 62 la sută o fac. Din nou, aceste rezultate vor fi așteptate în aproximativ 4 din 100 alegeri. Însă combinarea celor două rezultate ar fi așteptată doar la 1 din 200 de alegeri. E posibil, probabil, dar nu imposibil.
Unde ne lasă asta? Este posibil să nu știm niciodată dacă rezultatele raportate sunt reale sau nu. Datele mele personale preferate din toate acestea, totuși, nu necesită calcule pentru a duce la întrebări de legitimitate electorală. Acest citat, de la Abbas-Ali Kadkhodaei, un purtător de cuvânt al Consiliului de pază al Iranului, ar face aproape pe oricine să se gândească de două ori:
Statisticile furnizate de Mohsen Resaei în care susține că peste 100% dintre cei eligibili au votat în 170 de orașe nu sunt exacte - incidentul s-a întâmplat în doar 50 de orașe.
(Pentru mai multe despre analizele rezultatelor alegerilor din Iran, consultați Nate Silver pe fivethirtyeight.com)