https://frosthead.com

Un scriitor s-a folosit de statistici pentru dezvăluirea secretelor a ceea ce face o scriere grozavă

În majoritatea cursurilor de literatură la nivel de colegiu, găsești studenți care disecționează mici porțiuni de clasici literari: solilociele lui Shakespeare, fluxul de conștiință al lui Joyce și propozițiile staccato ale lui Hemingway. Fără îndoială, există multe lucruri care pot fi învățate despre un scriitor, despre meseria sa și despre semnificația unei povești prin acest tip de lectură atentă.

Dar Ben Blatt susține un argument puternic pentru o altă abordare. Concentrându-se pe anumite propoziții și paragrafe, el pozează în noua sa carte, Cuvântul preferat al lui Nabokov este Mauve, cititorii neglijând toate celelalte cuvinte, care, într-un roman de lungime medie, însumează zeci de mii de puncte de date.

Jurnalistul și statisticianul au creat o bază de date a textului dintr-o serie de clasici și bestselleruri din secolul XX pentru a răspunde cantitativ la o serie de întrebări de interes. Analiza sa a scos la iveală câteva modele ciudate care altfel ar putea trece neobservate:

După numere, cele mai bune propoziții la romane tind să fie scurte. Autorul prolific James Patterson are o medie de 160 de clișee la 100.000 de cuvinte (adică cu 115 mai mult decât venerata Jane Austen), iar Vladimir Nabokov a folosit cuvântul mauve de 44 de ori mai des decât scriitorul mediu din ultimele două secole.

Smithsonian.com a discutat cu Blatt despre metoda sa, unele dintre concluziile sale cheie și de ce datele mari sunt importante pentru studiul literaturii.

Ați luat o abordare statistică pentru a studia totul, de la Where’s Waldo la Seinfeld, articole de fast-food la melodii pop. Poți să-ți explici metoda și de ce faci ceea ce faci?

Sunt jurnalist de date și mă uit la lucrurile din cultura și arta pop. Îmi place foarte mult să privesc lucruri cantitative și nepărtinitoare, care au multe informații prin care oamenii nu au trecut. Dacă ați dori să aflați despre cum este persoana obișnuită din Statele Unite, ar fi util, dar nu ați vorbi doar cu o persoană, să știți totul despre ele și apoi să presupuneți că totul despre oamenii din Statele Unite sunt la fel. Cred că un lucru cu scrierea că se pierde este acela că poți să te concentrezi asupra unei singure propoziții a unui autor, în special la orele de scriere creativă sau la un pasaj și pierzi imaginea mai mare pentru a vedea aceste tipare și tendințe generale pe care le folosesc scriitorii. de nenumărate ori, de sute și poate de mii de ori în propria lor scriere.

Preview thumbnail for video 'Nabokov's Favorite Word Is Mauve: What the Numbers Reveal About the Classics, Bestsellers, and Our Own Writing

Cuvântul preferat al lui Nabokov este Mauve: ce dezvăluie numerele despre clasici, bestselleruri și despre propria noastră scriere

A cumpara

Deci, ce te-a determinat să apelezi la literatură?

Fundalul meu este în matematică și informatică, dar întotdeauna mi-a plăcut să citesc și să scriu. Pe măsură ce scriam din ce în ce mai mult, am devenit foarte interesat de modul în care diferiți scriitori și oameni dau sfaturi de scriere. Există o mulțime de lucruri care aveau sens, dar păreau că nu sunt susținute de informații și multe dintre acestea intrau în conflict între ele. M-am gândit doar că trebuie să existe o modalitate de a lua aceste subiecte în scris despre care oamenii erau deja conștienți și vorbesc și să le testeze pe mari autori și autori populari pentru a vedea dacă acest sfat este real sau dacă este vorba de sfaturi prescriptive care nu ” nu înseamnă cu adevărat nimic în cărțile reale și în paginile reale.

Care a fost prima întrebare pe care ai vrut să o pui despre clasicii literari și bestseller-urile?

Primul capitol al cărții este pe sfatul dacă ar trebui să folosiți sau nu - adverbe. Acesta este și primul capitol pe care l-am scris cronologic. Este în mare parte sfatul lui Stephen King de a nu folosi - adverbe în cartea sa despre scriere, care pentru mulți scriitori este cartea despre scris. Dar o mulțime de alți scriitori - Toni Morrison, Chuck Palahniuk - și orice clasă de scriere creativă sfătuiește să nu folosească un adverb - pentru că este un cuvânt inutil și un semn că nu ești concis. În loc să spui: „El a alergat repede”, poți spune, „El a sprinten”.

Vroiam să știu, este adevărat acest lucru? Dacă acesta este un sfat atât de bun, te-ai aștepta ca marii autori să-l folosească mai puțin. Te-ai aștepta ca scriitorii amatori să-l folosească mai mult decât autorii publicati. Am vrut doar să știu, stilistic, mai întâi dacă Ștefan King a urmat propriile sfaturi și apoi dacă se aplică tuturor celorlalți autori mari și venerati.

Deci, ce ai găsit?

De fapt, există o tendință în care autori precum Hemingway, Morrison și Steinbeck, cele mai bune cărți ale lor, cele care sunt păstrate și care au cea mai mare atenție asupra lor sunt cărțile cu cea mai mică cantitate de adverbe. De asemenea, dacă compari scrisul amator de ficțiune și scrierea online care nu a fost modificată cu bestseller-urile și câștigătorii premiului Pulitzer din vremurile recente, există o discrepanță, în care adverbe mai puțin utilizate sunt folosite de autorii publicate. Nu sunt chiar unilateral, cred că poți să scoți doar adverbe dintr-o carte bună și să devină o carte minunată. În mod evident, nu funcționează. Există însă ceva în legătură cu faptul că scriitorii care scriu într-o manieră foarte directă produc cărți care în general trăiesc cel mai mult.

p13 - Adverbe.JPG

Cum te-ai gândit la crearea unei baze de date cu opere literare?

Pentru multe dintre întrebări, foloseam aceleași 50 de autori pe care îi alesesem oarecum în mod arbitrar. În esență, s-a bazat pe autori care se aflau în topul listei de best-seller-uri, autori care se aflau în topul celor mai mari autori ai listelor de timp și autori care reprezentau doar o serie de genuri și momente diferite și cititori. Astfel, în întreaga carte, îi poți compara pe acești autori și îi poți cunoaște.

Pentru mine a fost foarte important că, dacă am spus ceva de genul „Toni Morrison folosește acest cuvânt în acest ritm”, vorbeam despre fiecare roman pe care l-a scris vreodată și nu doar despre cele trei pe care le am deja. În cartea mea, sunt 50 până la 100 de autori la care se face referire. Le-am găsit bibliografiile și apoi am găsit toate romanele pe care le-au scris până la acel moment ca înregistrare completă. În unele moduri, este un pic ca păstrarea statisticilor sportive, în care fiecare carte este ca un sezon și apoi toate aceste sezoane sau cărți se reunesc ca o carieră. Puteți vedea cum se schimbă autorii în timp și cum fac lucrurile în general. După ce aveți toate cărțile în fișier, atunci răspundeți la aceste întrebări care, în unele moduri, sunt foarte descurajante este foarte simplu.

Și cum ați procesat tot acel text?

Există un limbaj de programare numit Python și, în cadrul acestuia, există un set de instrumente numite Natural Language Toolkit, adesea prescurtat NLTK. Instrumentele implicate sunt disponibile gratuit oricui. Puteți descărca pachetul online și îl puteți folosi în Python sau în alte limbi. Nu puteți obține în special multe dintre întrebările de scriere, dar puteți spune, de câte ori apare acest cuvânt în text? Se poate parcurge și identifica unde se termină propozițiile și unde încep propozițiile și părțile de vorbire - adjectiv vs. adverb vs. verb. Deci, după ce aveți aceste instrumente, puteți obține datele.

Ce statistici ați compilat manual? Care a fost cel mai obositor?

Există o secțiune în care mă uit la deschiderea propozițiilor. Elmore Leonard, care a fost un romancier de mare succes, a spus: „Nu deschideți niciodată o carte cu vreme”. Acesta este și sfatul găsit în multe ghiduri de scriere. Așa că am trecut prin sute de autori pentru a vedea cât de des își deschid cartea pe vreme. De exemplu, Danielle Steel, cred că 45% din primele propoziții din cărți sunt despre vreme. De multe ori este doar „A fost o zi magnifică” sau „A fost luminos și însorit”, așa ceva. Pentru asta, nu exista nicio modalitate de a face asta automat fără a avea vreo eroare, așa că aș trece doar prin toate fișierele de carte și am marca dacă este vremea implicată. Puteți spune că a fost obositor, pentru că a fost o mulțime de date colectate, dar a fost un fel de distractiv să parcurgeți și să citiți sute de propoziții deschise simultan. Există alte tipare care ies în mod clar de la autori în timp.

P207 --- Weather.jpg

Cum zici tu, obositor pentru unii, distractiv pentru alții. Unii ar putea crede că această abordare analitică este plictisitoare, dar susțineți că poate fi „amuzant” și „de multe ori amuzant”. Care a fost cea mai amuzantă constatare a voastră?

Titlul cărții, Cuvântul preferat al lui Nabokov este Mauve, este despre modul în care, după numere, cuvântul pe care îl folosește la cel mai mare ritm în comparație cu engleza este malva. Asta sfârșește să aibă mult sens dacă te uiți la fundalul lui, pentru că avea sinestezie. A vorbit, în autobiografia sa, despre cum atunci când a auzit litere și sunete diferite, creierul său va conjura automat culorile.

Am repetat acel experiment pe alți 100 de autori pentru a vedea care este cuvântul lor preferat. Drept urmare, obțineți trei cuvinte reprezentative pentru scrierea lor prin cuvintele pe care le folosesc cel mai mult. Civilitate, fantezie și imprudență. Aceasta este Jane Austen. Cred că dacă ai vedea acele cuvinte, Jane Austen ar putea fi una dintre primele tale convingeri. Și apoi ai un autor ca John Updike, care este ceva mai gresit și real și de altfel. Cuvintele sale preferate sunt înțepate, înțepate și futute. Cred că a vedea personalitatea răspândită pe baza acestor întrebări matematice simple este foarte interesant. Dacă aveți un autor preferat, trecând prin acesta, se dezvăluie ceva despre personalitatea lor, poate nu ați observat până acum.

Ray Bradbury scrisese că cuvântul său preferat era scorțișoară. După numere, el folosește foarte mult. Explicația lui de ce i-a plăcut scorțișoara a fost aceea că i-a amintit de cămara bunicii sale. Așa că am trecut și am găsit alte cuvinte condimentate și mirosind cuvinte care ar putea fi asociate cu cămară ale bunicii, iar Ray Bradbury folosește majoritatea acestor cuvinte într-un ritm foarte mare. Într-un anumit sens, puteți obține acest aspect ciudat și freudian în ceva despre copilăria autorilor. Dacă Ray Bradbury nu ar fi spus asta, poate vă puteți da seama.

Ați comparat scriitorii americani și britanici, confirmând un stereotip potrivit căruia americanii sunt tare. Poți să explici asta?

Acesta s-a bazat de fapt inițial pe un studiu realizat de un student absolvent la Stanford. El a identificat cuvinte care sunt folosite pentru a descrie dialogul în cărți și le-a descris ca fiind tare, neutre sau liniștite. „Șoptit” și „murmurat” ar fi liniștit. Neutral ar fi „el a spus” sau „a spus ea”, iar tare ar fi „a exclamat” sau „a strigat”. Am trecut prin cei 50 de autori pe care i-am privit, precum și mostre mari de ficțiune fan, și am găsit, nu printr-o marjă nebună, dar o marjă semnificativă, că americanii au un raport mai mare dintre cuvintele zgomotoase și cuvintele liniștite. Există câteva explicații. S-ar putea ca așa vorbește americanii de-a lungul întregii vieți, așa că scriitorii îi descriu vorbind frecvent. Ați putea vedea, de asemenea, doar scriitori americani care au preferința pentru povești mai mari bazate pe acțiune, thriller, cu ritm înalt, comparativ cu cele mai subtile. Americanii sunt într-adevăr mai tare după numere.

Blatt_author photo_Credit Sierra Katow.JPG Ben Blatt, autorul cuvântului preferat al lui Nabokov este Mauve (Sierra Katow)

De ce credeți că aplicarea matematicii la scris este o modalitate bună de a studia literatura?

Cu siguranță nu susțin că acesta ar trebui să fie primul mod în care studiați literatura dacă încercați să vă îmbunătățiți scrierea. Dar chiar și un roman cu lungime moderată este probabil de 50.000 de cuvinte și asta înseamnă 50.000 de puncte de date. Nu veți putea să înmuiați totul în același timp și vor exista câteva întrebări la care pur și simplu nu puteți răspunde la citire. Este bine să vezi imaginea mai mare. Dacă stai jos și studiezi un paragraf, ești în clasa ta de scriere creativă vorbind cu profesorul tău, dacă există o modalitate setată de a privi asta, vei vedea asta în tot. Dar, cu datele, acest tip te eliberează și poți răspunde la unele întrebări fără aceste prejudecăți și vei primi cu adevărat informații noi.

Menționați că v-ați gândit înapoi la „Marele gramatizator” al lui Roald Dahl.

Există o poveste grozavă a lui Roald Dahl în care, în esență, un inginer concepe o modalitate de a scrie o poveste. În acest scenariu de zi cu zi, cineva poate doar să ofere mașinii un complot și va scuipa un roman final. Insinuarea este că produc romane atât de formulare și de bază. Protagonistul din acea poveste alege să nu se alăture operațiunii mașinii și luptă împotriva ei prin crearea propriei sale scrieri și artă.

Cu siguranță cred că această carte, dacă sunteți în scris, va răspunde la o mulțime de întrebări pentru dvs. și va schimba cu siguranță modul în care gândiți despre unele lucruri, dar în cele din urmă nu există în realitate nicio înlocuire pentru idei care îi fac pe oameni să gândească și scene care îi fac pe oameni fricos sau conectați-vă cu personajele. Această carte privește meșteșugul scrisului și nu neapărat cum să creezi o poveste memorabilă. Această carte nu încearcă să creeze un roman perfect și nu cred că suntem la fel de aproape de cât se poate teme unii.

Un scriitor s-a folosit de statistici pentru dezvăluirea secretelor a ceea ce face o scriere grozavă