La ce foloseşte jurnalismul de date
Acum vreo zece ani, cînd m-am apucat de blog și analize media, m-am simțit ca un amator, fiindcă trebuia să lucrez cam băbește cu rating-uri, tiraje și alte cifre legate de piață, culegînd date de pe Internet sau din fișiere pdf, în speranța că voi sfîrși în Excel cu ceva folosibil, ordonabil, sumabil, fără a introduce prea multe cifre manual, lucru care costă timp și produce erori. Nu știam pe vremea aceea că treaba asta se cheamă jurnalism de date. Un gen care folosește tehnici din ce în ce mai sofisticate, dar continuă să se poticnească de incompatibilitatea fișierelor cu cifre și, pe alocuri, lipsa de informații. Presa s-a împrietenit cu calculatoarele într-un mod mai puțin spectaculos, dar cu zece ani mai devreme. Wikipedia spune că un lucru care poartă numele englezesc, dar ușor de înțeles în română, computer assisted reporting, a început în 1952, cînd celebra rețea de televiziune americană CBS a folosit o mașinărie pe nume UNIVAC, primul calculator disponibil la modul comercial, pentru a analiza rezultatele alegerilor prezidențiale din SUA. E vorba de cele în care republicanul Dwight Eisenhower a curmat un șir de victorii ale democraților, învingîndu-l pe Adlai Stevenson.
Folosite în primul rînd pentru introducerea textelor și un gen de punere în pagină mai curat, mai aspectuos și mai subtil decît o permiteau vechile procedee de tipar pe plumb, computerele știu să facă multe lucruri cu și mai multe cifre, lucru evident astăzi majorității alfabetizaților digital, care au folosit cu siguranță un program de tip Excel sau ceva asemănător măcar o dată în viață. Dar, de la adunări și ordonări în funcție de mărime, jurnalismul de date a devenit în timp ceva spectaculos.
Dacă e să-l definim simplu, la componenta de prelucrare a datelor pe care am numit-o mai sus computer assisted reporting se adaugă diferite tipuri de vizualizări. Graficele simple au fost înlocuite în ultimii ani de așa-numitele infografice sau infografii, evidențieri estetice și uneori interactive ale datelor, de la demografie și economie la studii de consum. Ca să înțelegem complexitatea genului, cîteva exemple sînt relevante.
● Wikileaks/Swissleaks/Panama Papers. În acest gen de demers jurnalistic, concluziile inteligibile uman apar în urma examinării unor seturi de documente și înregistrări în documente care pot fi de ordinul milioanelor. Instrumente mai mult sau mai puțin sofisticate pot ajuta la extragerea datelor referitoare la anumite țări, anumite nume de persoană și așa mai departe. Încercați o căutare cu „Romania“ pe Wikileaks.org și veți vedea cam ce poate face un calculator în situația dată: peste 72.000 de rezultate, care pot fi filtrate în funcție de proveniența documentelor: așa-numitele Guantanamo Files întorc, de exemplu, doar trei mențiuni. Aici, dificultatea constă mai degrabă în cantitatea imensă de date, adică prelucrarea și aducerea ei la un numitor comun.
● Hărți ale criminalității. Prin 2012, trei hackeri ruși au cîștigat un premiu pentru o hartă a orașului Novosibirsk, în care incluseseră incidentele violente din oraș, disponibile și cronologic. Harta a provocat o revoluție pe piața imobiliară, fiindcă prețurile locuințelor au fost influențate de zona mai liniștită sau mai agitată în care acestea se aflau.
● Watchdog împotriva FBI. Cam prin aceiași ani, Mother Jones, revistă investigativă celebră în America, a făcut furori cu o secțiune interactivă a site-ului, în care prezenta peste 500 de cazuri ajunse în justiție pentru terorism pentru a obține o concluzie surprinzătoare: în peste jumătate din aceste cazuri, în rețelele teroriste era prezent cel puțin cîte un informator FBI, iar 158 dintre ele se bazau pe flagranturi. Asta, în condițiile în care personalul FBI a crescut de zece ori după 11 septembrie 2001, ceea ce sugerează că agenția federală își crea, prin intermediul proceselor, propria justificare.
● Predicții electorale cu metode din baseball. Prin 2008, specialistul în statistici de baseball Nate Silver dădea lovitura cu FiveThirtyEight.com, site care își trage numele de la cei 538 de electori care participă la prezidențialele din SUA. Obiectul principal de activitate: estimări pentru alegerile prezidențiale, realizate printr-o metodă diferită de exit-poll-uri, inspirată din sportul amintit. E vorba de votul de la scrutinurile anterioare, ponderat cu modificările demografice apărute. Metoda a dat rezultate spectaculoase și poartă numele de sabermetrics, de la Society of American Baseball Research.
Dincolo de sclipirile teoretice, în spatele tuturor acestor eforturi se ascunde o cantitate importantă de muncă brută, de felul celei despre care vă povesteam la început. Problema compatibilității și a prelucrabilității datelor e, poate, cea mai frecventă în data journalism. O altă problemă este completitudinea acestui gen de date, dintre care multe provin din surse guvernamentale, uneori zgîrcite și totdeauna neglijente cu publicarea lor. De aici inițiativele de tip Open Data, care militează pentru punerea la dispoziția tuturor a statisticilor guvernamentale, în formate cît mai compatibile și ușor de utilizat. În fine, un al treilea aspect problematic e pur și simplu cantitatea datelor, care adesea depășesc posibilitățile de stocare și procesare ale unui calculator bun, contemporan. Aici vine vorba de ceva numit big data, legat nu doar de jurnalism, ci și de nenumărate aplicații științifice. Or, una din cele mai ușor de reținut definiții, chiar dacă nu cea mai riguroasă, pentru big data e „set de date care nu încape pe un calculator“.
Jurnalismul de date e considerat de unii teoreticieni ca o reacție la noul jurnalism, cel care pune accentul pe tehnici literare în scrierea unui articol. Înlocuind subiectivitatea asumată a naratorului, obiectivitatea datelor tinde să ne ancoreze mai bine în felul cum „stăm“ cu privire la diferite probleme generale, de interes public. Calculatoarele și Internetul, mijloace ideale de creare și propagare a glumelor și video-urilor amuzante, memetice, pot fi din cînd în cînd și serioase ca în vremurile apariției lor, cînd erau folosite doar de oameni de știință. Iar asta se poate numi, uneori, jurnalism.
Iulian Comanescu este analist media, autor al volumului Cum să devii un Nimeni (Humanitas, 2009).