Copiatul şi plagiatul în era Internetului – o dezbatere

14 decembrie 2016   Tema săptămînii

Pe 28 noiembrie, Dilema veche a organizat, la Biblioteca Națională, o dezbatere cu titlul „Copiatul la români. Plagiat. Antiplagiat. Postplagiat“. Am încercat să discutăm fondul acestui fenomen și implicațiile sale, nu cazurile concrete care au creat o mare vîlvă mediatică. Am încercat să analizăm legătura dintre plagiat și obișnuința tot mai mare de a copia, de a prelua (de pe Internet, mai ales) fără a indica sursa. E o obișnuință căpătată, în bună măsură, în școală. Reproducem aici, într-o formă abreviată și editată, cele mai semnificative momente ale dezbaterii.

Vintilă Mihăilescu: Mă văd obligat să fac pe avocatul diavolului și să lărgesc sfera discuției. Nu știu dacă s-a discutat într-adevăr despre plagiat și copiat; s-a discutat despre „n“ plagiatori și, prin urmare, s-a considerat că plagiatul este un fapt politic. Nu. Plagiatul este furt și furtul nu este politic – nici de stînga, nici de dreapta. Dacă vorbim despre copiat – și mai ales despre copiatul de pe Internet –, lucrurile se complică. Așa că aș face o diferențiere între plagiat și copiat, păstrînd termenul de plagiat pentru furt, care înseamnă că ai preluat un text cu autor fără să te referi la autor. Dar în momentul în care informația este anonimă, lucrurile devin mai complicate. Nu e același lucru un plagiat într-o teză de doctorat (sau oriunde) și un copiat de pe Wikipedia. Moral e același lucru. Dar aș face totuși o diferență. Lărgind sfera și mai mult, copiatul și plagiatul se încadrează în problematica mult mai dificilă, mult mai complicată a dreptului intelectual. Există o ordonanță de guvern – 2491 din 2009 – care se referă la tezaure umane vii și ține de acest domeniu foarte interesant, la care noi nu ne-am gîndit niciodată din această perspectivă, dar care în America, în Canada și în multe alte părți reprezintă o problemă contondentă, și anume valorificarea tradițiilor: de către cine și cu ce drept. În America lucrurile sînt foarte dezvoltate, populațiile băștinașe și-au cerut drepturile pentru patrimoniul lor care a fost preluat, trecut în design. Aceasta este sfera mult mai largă a problematicii, în care plagiatul este un vîrf mai ușor de identificat și ca atare mai ușor de operat. Legal, poate fi operat chirurgical. Tot ce este sub acest vîrf e mult mai complicat. Aș încheia cu o provocare venită de la Umberto Eco, care a constatat că nu ai cum să-i faci pe cei din tînăra generație „să nu se inspire“ din ceea ce le oferă Internetul. Așa că Umberto Eco propunea acest lucru: dat fiind că nu-i putem împiedica, tot ce putem să facem este să-i învățăm să copieze inteligent, cu discernămînt. Drept care studenților mei le dau jumătate din notă pentru cei care copiază cea mai bună definiție a antropologiei. Dar trebuie să argumenteze de ce e cea mai bună. Sigur că este jumătate joc, jumătate serios, dar am încercat să lărgesc puțin cîmpul acestei problematici.

Liviu Dinu: Dacă tot efortul care s a depus pentru a-i prinde pe cîțiva plagiatori s-ar fi îndreptat spre școală, am fi fost mult mai departe. Știu cazuri de copii de clasa a doua la care s-au găsit fițuici. Așa încît cred că ar trebui să li se explice încă din clasele mici ce înseamnă copiatul.

Soft-urile antiplagiat sînt pentru noi, cei care lucrăm în sfera informaticii sau – cum e cazul meu – în domeniul lingvisticii computaționale, foarte utile, pentru că ne dau ceva de lucru, ne oferă teme de care să ne ocupăm. Există o competiție antiplagiat care se desfășoară din 2009 – este competiția Pan organizată de Paolo Rosso. În 2009, au fost 7000 de documente de mărimea unei cărți care erau plagiate (plagiate făcute intenționat și serios, de către profesioniști) în care trebuia găsit plagiatul cu cît mai multă acuratețe. Soft-urile antiplagiat îi detectează de cele mai multe ori pe plagiatorii „de bună credință“, care copiază fără să facă vreun efort sistematic de a-și masca plagiatul. La competiția despre care vorbeam, cîștigată de doi colegi din Germania și de doi colegi de-ai noștri de la Universitatea din București, totul se baza mai ales pe analiza unor secvențe de caractere, nu pe căutarea unor cuvinte. În aceeași competiție a fost și o echipă din Ucraina care a prezentat un soft numit „Killer“, proiectat pentru a distruge plagiatul din Ucraina. În acea vreme, Ucraina achiziționase cu bani mulți – căci erau bani guvernamentali – un soft care să analizeze plagiatele din Kiev. Această echipă a distrus acest soft cu o idee simplă, o chichiță: luau secvențe de text în care înlocuiau unele caractere din limba ucraineană cu caractere din belarusă sau rusă. Din acel moment, acele cuvinte erau identice pentru om, dar pentru mașină erau lucruri complet diferite. Al doilea lucru: luau cuvintele și unde găseau spațiile dintre cuvinte le schimbau cu niște caractere ciudate (din afara seriei A-Z) și le colorau în alb. Omul vedea, evident, același lucru, dar pentru mașină era cu totul altceva.

Nici un soft antiplagiat nu poate spune dacă o lucrare e valoroasă sau nu. Paolo Rosso a scris, în Computational Linguistics, acum doi ani, un articol foarte interesant despre detectarea plagiatului prin parafrazare. El spune că 30-40% din producția studenților din lume este plagiat. Pe Internet, 20-30% din site-uri se află în această situație, sînt de fapt mirror duplicates.

Mircea Vasilescu: Mulți au impresia că soft-urile antiplagiat pot detecta tot și sînt infailibile. De fapt, soft-urile compară ceea ce „știu“ deja: nu pot compara ceea ce nu există în baza lor de date, în versiune digitală. În ce măsură pot detecta plagiatul din alte lucrări? Căci cineva poate plagia dintr-o carte apărută la 1900 și care nu e digitalizată…

Liviu Dinu: Asta e partea cea mai interesantă pentru noi, cei care lucrăm în această sferă. Această competiție despre care am vorbit are două componente, pentru că există două tipuri de plagiate: plagiatul extrinsec, în care plagiezi și știi de unde, iei din surse, și atunci scopul soft-ului antiplagiat este să detecteze ce s-a preluat din ceea ce se găsește; și apoi există varianta mult mai interesantă cu care ne luptăm și noi, plagiatul intrinsec, care ține de zona identificării de autor, în care ți se dă un text și vrei să verifici dacă acel text are unitate stilistică. Se discută deja despre stilomul uman, despre amprenta stilistică. Trebuie să detectezi dacă un text este unitar. Pentru plagiatul intrinsec, deocamdată rezultatele nu sînt foarte sus, dar nici nesemnificative.

Marian Popescu: Cel mai performant soft antiplagiat în acest moment este Urkund, un soft suedez care funcționează și pentru limba română, dar se leagă de chestiunea stilisticii textului. Soft-ul e în stare să vadă dacă ai preluat dintr-o carte de la 1900 pe care nu o are scanată în baza lui de date, dar recunoaște că stilistica unui text de la 1900 nu este la fel cu cea a unui articol științific din revistele de astăzi. Am discutat cu șefa vînzărilor de la firma care realizează acest soft și mi-a explicat că s-a lucrat foarte mult timp la algoritmii săi, și rata de succes este de 93%. Celelalte soft-uri, care au fost ierarhizate recent de o agenție berlineză, se duc de la 70% spre 15-20%. Noi ne bazăm de multe ori, în România, pe raportul de similitudine rezultat în urma unui test. Raportul arată textul din lucrarea-țintă și textul din lucrarea-sursă. Dar tehnologia plagiatului nu constă numai în asta. Aici, factorul uman, care ar trebui să fie coordonatorul științific al lucrării (fie ea de licență, de masterat ori de doctorat), trebuie să își dea seama că ceva nu e în regulă cu lucrarea respectivă. Problema e că, de multe ori, profesorul coordonator doar bifează o activitate pentru care este plătit. Mulți sînt tentați să creadă că un soft antiplagiat rezolvă problema. Nici pe departe. Nici măcar un sfert din problemă nu se rezolvă.

Constantin Vică: O comisie de etică a dat, de curînd, un comunicat halucinant despre un plagiat: că autorul copiase, dar de pe Internet, iar Internetul nu e persoană. Automat, problemele care țin de proprietatea intelectuală dispar. În primă instanță, ni se pare un răspuns rizibil. Dar ascunde ceva: o păcăleală pe care ne-o luăm cu toții cum că Internetul a schimbat radical lumea și este cauza multor probleme de astăzi. Internetul nu este o cauză a copiatului sau plagiatului, dar este o fabuloasă condiție de posibilitate. Nu poți copia dacă nu ai o carte în casă. În cazul de față, Internetul este raiul oricărui copiator. Dar nu el ca atare îi face pe oameni să copieze. Americanii au un termen cînd vorbesc despre tehnologii: le spun affordancies – un set de posibilități. Una dintre posibilitățile aduse de Internet este abundența de informații, faptul că ai mii de documente într-un singur loc. Dar Internetul nu este organizat ca o bibliotecă, ceea ce face dificilă munca unui copiator, pentru că nu știe cum să copieze mai bine. Una este să te duci într-o bibliotecă, unde documentele sînt puse într-o anumită ordine, catalogate, și alta este să folosești un motor de căutare. Motorul de căutare nu cataloghează documentele, el pur și simplu găsește acele pagini care sînt mai bine conectate unele la altele. Abundența informației se combină cu o totală neclaritate asupra calității informației. Internetul mai aduce o anumită dinamică – și asta s-ar putea să ni se transmită și nouă, persoanelor – pentru că un document azi este, mîine nu mai este. Doar vreo 40% din site-urile existente acum zece ani mai sînt online, restul au dispărut. Asta lasă impresia că poți copia, pentru că oricum nu durează mult și oricum nu are cine să refacă drumul înapoi. Un alt lucru pe care l-a adus piața digitală a fost faptul că trăim într-o lume a post-auctorității. A devenit clar aproape tuturor că nu mai contează sursa. Toate acestea, luate împreună, creează condițiile materiale de posibilitate ale copiatului și plagiatului. Dar cred că nu aici sînt cauzele; cînd scoatem Internetul vinovat, ne am spălat pe mîini. Ar trebui să căutăm cauzele în alt loc.

Cred că prima cauză este lipsa de timp a profesorilor. Cînd ai, de pildă, multe grupe de studenți, nu poți lucra cu toți la lucrările finale. Există și o lipsă de interes, scade și încrederea studentului că ar putea face ceva cu mintea sa. Studenții nu sînt destul de antrenați pentru a lucra, intră în criză de timp și ajung la varianta cea mai scurtă: copy-paste. Dar privind la aceste cauze, cred că ratăm o anumită filogenie a copiatului. Copiatul vine pe un întreg front cultural, și nu numai la noi. Citeam recent că principala problemă a universității americane este că a apărut „cultura copy-paste“ și nu există cultura cititului.

Ar trebui să ne întrebăm și care este funcția copiatului și plagiatului. Și cred că este adaptarea la mediu. Pur și simplu, dîndu-ți seama că nu vei fi niciodată pedepsit și s-ar putea să nu fii nici măcar găsit, pentru că nu prea există o memorie instituțională, îți vine foarte ușor să te apuci de copiat. Internetul nu face decît să îți ofere tot mai multe căi de a copia, mai multe decît îți oferă biblioteca. Pe de altă parte, Internetul ne ajută să descoperim cazurile de plagiat. Soft-ul antiplagiat are nevoie de o bază de date foarte mare cu lucrări, cărți, articole. Dacă am avea date deschise, ar fi mult mai ușor să descoperim plagiatul extrinsec.

Ar fi o greșeală să punem laolaltă sau în paralel pirateria digitală cu plagiatul, care este o fraudă intelectuală. Pirateria digitală încalcă, ce-i drept, niște drepturi patrimoniale ale cuiva, dar îi respectă, involuntar, dreptul moral, căci orice piratare a unui document nu face decît să arate cît de important este acel document, e o formă de recunoaștere. Cel care face file sharing sau piraterie digitală vrea să citească sau să asculte sau să urmărească anumiți autori, cărora le dă credit. Plagiatul anulează acest credit.

Marian Popescu: Internetul a favorizat între altele și dezvoltarea unui business: ghost writing. L-am ascultat, la o universitate din Scoția, pe profesorul Phil Newton, care spunea că există peste 1000 de site-uri în limba engleză care oferă ceea ce în literatura de specialitate se numește contract cheating. A intrat pe Internet, pe unul dintre cele mai mari site-uri de acest fel, s-a dat drept masterand și a cerut o lucrare de disertație pe o anumită temă; a primit răspuns că e livrabilă în cinci zile și costă între 250 și 400 de lire sterline. Sistemul legislativ permite astfel de breșe. Discutăm despre plagiat ca și cum ar fi o temă în sine. Nu. Plagiatul se referă la modul în care este construită o societate. Cîtă vreme o societate nu este vertebrată moral și nu are un mecanism de checks and balances care să contracareze expansiunea unui astfel de fenomen, plagiatul își va continua marșul triumfal. N-aș zice că lipsa de timp a profesorilor e o cauză. Este vorba despre faptul că sistemul de evaluare este prost gîndit, cîtă vreme funcționăm în cultura textuală și nu în cultura digitală, în care foarte puțini profesori își instruiesc studenții. Ar trebui măcar să le indice care sînt site-uril științifice și serioase în domeniul lor, nu să-i trimită la Wikipedia (în universitățile de limbă engleză, Wikipedia este dată drept prima sursă a plagiatului). Trebuie revăzut sistemul de evaluare și sistemul calificărilor, al diplomelor. Chestiunea plagiatului nu se rezumă la cei cîțiva politicieni, ci e mult mai serioasă și se afectează întreaga societate românească.

Vintilă Mihăilescu: Cu riscul de a părea din paleolitic, readuc în discuție resursa umană. Noi, oamenii, ce facem? E o performanță extraordinară ca un soft să aibă un randament de 93% pentru a constata că s-a copiat. Dar dacă un profesor, un coordonator de doctorat, nu-și poate da seama, fără nici un soft, că s-a copiat, atunci trebuie să-și schimbe meseria. Ori e prost – că se întîmplă și asta – ori e și prost, și escroc. Dar există și profesori corecți. Și-atunci e un lucru neplăcut: totul pornește de la prezumția de vinovăție. Fiecare școală doctorală, fiecare facultate trebuie să își ia măsuri de precauție pentru tezele de doctorat. Cu alte cuvinte, eu nu pot să spun dacă această teză e bună dacă nu o citește tot departamentul, după aceea trece prin toată facultatea, după care este votată în Senatul universității. Adică profesorul coordonator trebuie verificat. Știm cu toții că în lumea academică mai există și rîci profesionale. Și atunci, ce a scris amărîtul de doctorand nu mai contează. Important e să fie verificat profesorul, pentru că pe această prezumție de vinovăție, el este un corupt care dă diplome. Or, nu cred că lucrurile se pot rezolva așa și nu cred că doar sancțiunea poate să fie soluția. Mijloacele de comunicare digitală au schimbat natura cunoașterii și natura circulației ideilor și cunoștințelor. Există un decalaj foarte mare între cei care apelează la cunoașterea digitală și cei care nu. Ar fi necesară o reciclare a profesorilor, care să-i învețe pe elevi cum poate fi folosită profesionist această resursă uriașă care este Internetul. Căci cei mai mulți elevi și studenți nu știu să treacă de prima pagină a unei căutări simple, nici nu știu să treacă de prima pagină cu rezultate, cu atît mai puțin să facă o minimă colaționare a surselor.

Constantin Vică: În mod surprinzător, mulți tineri între 18 și 25 de ani nu știu să-și folosească browser-ul ori telefonul, nu știu să folosească motoare de căutare în mod profesionist. Nu doar noi, profesorii, sîntem depășiți. Noi, la seminar, îi învățăm din prima săptămînă să dea la o parte Google și să caute pe Google Scholar. Am colegi care au aplicat o metodă foarte simplă: le-au cerut studenților să activeze funcția „track changes“ și apoi, cînd trimit documentul electronic, profesorul poate vedea ce modificări au făcut, cît timp au lucrat etc.

Liviu Dinu: A fost o competiție prin care li se cerea mașinilor să identifice perioada de timp în care a fost scris un anumit text. Am participat împreună cu cîțiva colegi și studenți și am cîștigat locul I: am identificat perioada cînd au fost scrise unele documente pînă la secolul al XV-lea, cu o acuratețe de 20-30 de ani.

Foto: C. Ştefan

Mai multe