Despre cantitate în limbă

4 februarie 2022
Despre cantitate în limbă jpeg

În general vorbind, în limba engleză, cuvintele din fondul autohton, anglo-saxon, sînt monosilabice ori cel mult bisilabice, iar ce este mai lung de atît provine din culturi străine. Elementele latinești și grecești, în special, sînt printre cele mai lungi. Tendința englezilor de a prescurta, de a abrevia, de a face cuvintele să ocupe cît mai puțin timp în pronunție și spațiu în scriere a fost observată de multă vreme. În secolul al XVII-lea, Jonathan Swift tuna și fulgera împotriva numeroaselor lexeme monosilabice care, pierzîndu-și „demnitatea polisilabică”, deveniseră „rușinea limbii noastre”. În secolul următor, George Campbell critica omiterea, de către vorbitori, a tuturor silabelor cu excepția celei inițiale sau a primelor două: hypochondriac era acum hyp, reputation – rep, incognito – incog, extraordinary – extra, ultimate – ult, iar penultimate – penult. Nu a scăpat de oprobriu nici pronunția, la verbe, a terminației -ed, de trecut, care își pierdea vocala, lipind consoana finală de silaba anterioară și scurtînd astfel cuvîntul (pronunție care, de altfel, a devenit normă).

Dar ce importanță are, în limbă, aspectul unui cuvînt? După ce, în analiza lingvistică de pretutindeni, sensul a primat, timp de mii de ani, forma ocupă, la americani, un loc central începînd cu cel de-al Doilea Război Mondial, cînd noul context istoric și tehnologic cere imperios formalizarea limbii engleze (și ruse) în limbaje matematice, pentru construirea unor mașini automate de stenografiat și tradus; datele extrase prin excluderea sensului din descrierea lingvistică și concentrarea pe aspectele cantitative sînt necesare și pentru găsirea unor căi de a transmite mesaje (în context de război „cald” sau „rece”) rapid și fără pierdere de informație. De proprietățile statistice ale limbii engleze se ocupă însuși Claude Shannon, într-un studiu din 1948, prin care inginerul american fundamentează teoria informației (numită și „teorie a comunicației” sau „cibernetică”).

Ca orice alt fenomen, limba are proprietăți numerice, lucru care justifică aplicarea metodelor matematice, între care cea mai cunoscută e statistica. Cu ajutorul acesteia, spune Solomon Marcus, s-a pus în evidență „strînsa legătură care există în mod natural între vorbire și cibernetică. [...] în vorbirea curentă acționează diferite legi, care fac ca transmiterea informației prin limbaj să se facă în conformitate cu anumite principii de extrem”. Una dintre aceste legi, care poartă numele lui George Kingsley Zipf, profesorul de la Harvard care a formulat-o, privește frecvența cu care cuvintele apar într-un text: acest parametru (notat f) e invers proporțional cu rangul lexical (notat n). Rangul 1 revine cuvîntului care apare cel mai des, rangul 2 aparține celui a cărui frecvență vine imediat după acesta, și așa mai departe, astfel încît produsul dintre n și f(n) va fi o constantă (P).

Dicționarul Collins listează primele zece cele mai frecvente cuvinte din limba engleză: the, of, and, a, to, in, is, you, that, it. The va avea rangul n = 1, of are n = 2, ... it are n = 10. Conform legii lui Zipf, f(1) = P∕1, f(2) = P∕2, ... f (10) = P∕10. Sau the este de două ori mai frecvent decît of, de trei ori mai frecvent decît and și de zece ori mai frecvent decît it. S-a calculat, de exemplu, că articolul hotărît the apare în vorbire cu o frecvență de 7%, pe cînd prepoziția of cu circa 3,5%. Dacă ne uităm la lungimea acestor elemente (unitatea de măsură fiind silaba), observăm că toate sînt monosilabice, formate fiind din unul, două sau trei sunete. Astfel ajungem la altă lege lingvistică, privitoare la lungimea cuvintelor: cele mai scurte lexeme tind să fie și cele mai frecvente.

De exemplu, cercetările făcute pe un corpus de limbă română compus din Luceafărul lui Eminescu, poeziile lui Arghezi, Hanul Ancuței al lui Sadoveanu, un Îndreptar de punctuație și un Cod Civil converg spre aceeași concluzie: din numărul total de silabe din fiecare, frecvența cuvintelor monosilabice este cea mai mare. Concret, în Luceafărul, lexemele monosilabice reprezintă 58% din total, cele bisilabice 26,3%, cele trisilabice 11,9%, cele din patru silabe 3,4%, din cinci silabe 0,3%, cuvinte mai lungi de atît nefiind folosite deloc. Bineînțeles că, în orice domeniu, nu numai în lingvistică, acuratețea datelor statistice (pe baza cărora se formulează legi cu scopul de a prezice comportamentul) depinde de numărul de elemente luate în calcul: cu cît ele vor fi mai numeroase, cu atît rezultatul va fi mai exact, și invers. Pentru totalitatea vocabularului românesc s-a stabilit că frecvența cea mai mare o au cuvintele monosilabice (39,37%), urmate de cele bisilabice (24,11%).

Zipf explică circulația mare a cuvintelor scurte prin presiunea pusă de o comunicare eficientă: concizia maximă în transmiterea informației poate fi obținută prin folosirea celor mai frecvente sensuri, codificate în cele mai scurte cuvinte. Solomon Marcus pare să sugereze același lucru cînd spune că, „deoarece în limbajul curent este necesar ca informațiile să se transmită cît mai rapid, în mod spontan fondul de bază este format în special din cuvinte scurte”. Zipf dă un nume acestei legi fundamentale care „guvernează orice tip de comportament individual și colectiv, inclusiv comportamentul lingvistic”: „principiul minimului efort”, prin care are în vedere efortul fizic de articulare, de pronunțare. Însă cercetări de ultim deceniu făcute la Massachusetts Institute of Technology arată că un alt factor s-ar corela, mai bine decît frecvența, cu lungimea unui cuvînt – anume, cantitatea de informație conținută.

Într-un studiu din 2011, cercetătorii de la MIT (Steven Piantadosi, Harry Tily și Edward Gibson) spun că teoria lor diferă de cea a lui Zipf în două moduri cruciale. În primul rînd, un vocabular în care lungimea elementelor depinde de informația conținută „nu ar fi cel mai concis posibil, pentru că lexemele foarte informative nu ar fi scurtate, chiar dacă ar exista și cuvinte distinctive mai scurte”. În al doilea rînd, „ar ține cantitatea de informații transmise în comunicare la o valoare cît mai constantă posibil”, astfel încît să nu fie depășite nici posibilitățile aparatului fonator și nici cele ale creierului. Daniel Everett vede în această teorie o puternică dovadă a faptului că, în limbă, la fel ca în orice altceva, „forma urmează funcția”. Lingvistul american invocă părerea unui arhitect american faimos, Louis Sullivan, care spune: „În toate lucrurile organice și anorganice, în toate lucrurile fizice și metafizice, în toate lucrurile umane și supraumane, în toate manifestările minții, ale inimii și ale sufletului, în toate vedem aceeași lege fundamentală: viața se recunoaște în expresia ei, forma urmează funcției. Aceasta este legea”. Aplicat la limbă, acest principiu ar explica de ce, atunci cînd funcția principală a limbii este una utilitară, de transmitere de informație, scurtimea elementelor este esențială.

Datele din lingvistica statistică au fost extrapolate în alte domenii: recent a fost publicat un studiu în care autorii susțin că au identificat tipare similare sau chiar identice legilor din limbă în sistemele biologice, de la molecule (genom, gene, proteine) la organisme (comportamentul animal) și ecologie (populații și ecosisteme): de exemplu, legea frecvenței, a lui Zipf, ar fi aparentă în distribuția elementelor de floră și faună sau chiar în ratele de infecție COVID în rîndul populațiilor echivalente demografic, în funcție de mărimea teritoriilor ocupate; corelația lungimii cu frecvența s-ar vedea în ecologie, în faptul că, într-un spațiu dat, cele mai numeroase specii sînt și cele mai mici.

Întorcîndu-mă acum la obiecția lui Jonathan Swift, cu care am început textul de față: e de la sine înțeles că, într-o limbă, e nevoie de tot felul de elemente. O comunitate are, în sistemul lingvistic nativ, cuvintele care corespund cel mai bine nevoilor proprii, fie că sînt scurte sau lungi, ori au o sonoritate solemnă sau caraghioasă. Scopurile cu care e folosită limba depășesc cu mult elementara nevoie de transmitere de informație și se reflectă în bogăția lexicală distribuită pe paliere fixate de stiluri funcționale și registre de vorbire. Dar aceasta e o idee care va fi dezvoltată în articolul din numărul viitor, în care vom vedea cum atenția se mută de pe lungimea (sau scurtimea) cuvintelor pe sonoritatea acestora.

Laura Carmen Cuțitaru este conferențiar la Literele ieșene, specializată în lingvistică americană.

Foto: George Kingsley Zipf 

image png
Ceasurile organismelor
Majoritatea organismelor vii au astfel de ritmuri sincronizate cu o durată de aproximativ 24 de ore, cea a unei zile pe Pămînt.
image png
Scrierea și scrisul
Cînd unii «intelectuali» catadicsesc (nu catadixesc!) să scrie cîteva rînduri, îți pui mîinile în cap! Dixi!...”
p 22 la Necsulescu jpg
Mama, între Leagăn și Lege
Cu alte cuvinte, a seta o limită fermă și apoi a putea fi alături de copil în stările lui de revoltă, furie și neputință în timp ce asimilează limita.
image png
De la supă la politică
Anul trecut, o investigație jurnalistică a WELT a scos la iveală țelul principal al asociației: acela de a se transforma într-un partid politic.
p 22 jpg
Limba trădătoare
Și, cu toate acestea, ce capacitate formidabilă au de a distruge vieți…”.
image png
Casă bună
Însă, de bună seamă, pe vremea lui Socrate, și casele erau mai... reziliente, și timpul avea mai multă răbdare...
p 22 Radu Paraschivescu WC jpg
Radu Paraschivescu. Portret sumar
Cărţile lui Radu Paraschivescu sînt mărturia unei curiozităţi insaţiabile, a unui umor inefabil şi a unei verve torenţiale.
p 22 WC jpg
„Trecutul e o țară străină“
Ethos creștin? Indiferent de explicație, gestul este de o noblețe spirituală pe care ar trebui să o invidiem de-a dreptul.
image png
Cînd trădarea e familiară
Filmul devine astfel o restituire simbolică pentru experiențele trăite.
p 7 coperta 1 jpg
Sfîrșitul visului african
Începutul „oficial” al Françafrique e considerat anul 1962, cînd Charles de Gaulle l-a însărcinat pe Jacques Foccart, întemeietorul unei firme de import-export de succes, cu coordonarea politicii africane a Franței.
p 22 la Gherghina WC jpg
Cabinetul de curiozități al evoluției
În ciuda spectaculoasei diversități a organismelor vii, evoluția a făcut ca, prin înrudirea lor, acestea să se asemene ramurilor unui singur arbore.
image png
Sofisme combinate
Și în cazul comunicării interpersonale, distincția dintre „public” și „privat” contează.
fbman png
Testul omului-facebook
Dar să identificăm oamenii-facebook din lumea noastră și să îi tratăm ca atare, încă mai putem.
image png
Încăpățînare discursivă
Altminteri, cînd politicienii nu-și înțeleg misiunea, cheltuindu-și energia în dispute stupide și inutile, rezultatul poate fi ușor de ghicit.
1031 22 23 jpg
O lume schizoidă
Laura Carmen Cuțitaru este conferențiar la Literele ieșene, specializată în lingvistică americană.
the running man jpg
Arta figurativă și teoria recapitulării
Totodată, ambele dezvăluie peisaje unice, de o frumusețe nemaiîntîlnită.
image png
Dezamăgirea ca „dezvrăjire”
Este o deșteptare amară, dar deșteptare. Ni se pare că ni s-a luat un solz de pe ochi.
image png
De ce 2 și nu 1
Ajunși în acest ultim punct, tot ceea ce putem, așadar, conștientiza e că nu sîntem niciodată 1, ci 2, că nu sîntem niciodată singuri
image png
Oglinzile sparte ale organismelor
Astfel, poate că natura se repetă, dar nu vrea mereu să spună același lucru.
image png
Topografia iertării
Uneori, poate să apară efectul iertării de sine pentru neputința de a ierta pe alții din afară.
p 23 WC jpg
Etică și igienă
Revenind acum la psihologie și experimente, Arie Bos notează că „acolo unde miroase a substanțe de igienă, oamenii se comportă mai sociabil și mai generos”.
p 21 Viktor E  Frankl WC jpg
Pustiul refuzat
Nimic de adăugat, nimic de comentat.
p 22 jpg
Contradicțiile dreptului proprietății intelectuale
Ce înseamnă, mai exact, forma radicală a ideii? Înseamnă forma simplificată și agresivă a ideii.
p 7 LibertÔÇÜ 6 jpg
Dreptate pentru vînzătorii stradali
Comerțul stradal e o activitate economică legitimă prin care își cîștigă existența milioane de oameni.

Parteneri

alcool vin bere. foto pixabay
Alcoolul nu mai e „cool” când vine nota de plată. Iar plata se face în sănătate
Deși alcoolul este prezent în majoritatea contextelor sociale, cercetările arată că reducerea consumului acestuia are beneficii reale pentru sănătate.
Castelul Pogany si imprejurimile sale  Foto Daniel Guță ADEVĂRUL (5) JPG
Secretele castelului Pogany din Țara Hațegului. Fosta moșie a grofilor din secolul al XIX-lea, readusă la viață
Castelul Pogány din județul Hunedoara va fi redat circuitului turistic. Construit în urmă cu aproape două secole, edificiul a fost naționalizat de regimul comunist, care l-a folosit ca spital. După 1990, acesta a fost retrocedat moștenitorilor familiei Pogány.
image png
Cum să păstrezi cartofii astfel încât să nu încolțească. Cel mai bun truc
Cartofii sunt unul dintre cele mai consumate și versatile alimente din bucătoria noastră, însă problema majoră a acestora rămâne germinarea rapidă. Un cartof încolțit nu mai arată bine, iar uneori poate pune în discuție și siguranța consumului.
lingouri de aur Foto Magnor png
Experți: Prețul aurului se va dubla în 5 ani. Românii să nu se grăbească să vândă
Volatilitatea prețului aurului din ultimul an a făcut ca mulți oameni să decidă să vândă sau să cumpere masiv cantități din metalul prețios, cu atât mai mult cu cât la nivel internațional valoarea unei uncii a crescut de la 2.000 de dolari în februarie 2025, la 5.000 dolari în prezent.
image png
Secretul pieptului de pui care se topește în gură. Cum să obții suculența perfectă de fiecare dată
Pieptul de pui este unul dintre cele mai populare ingrediente din bucătărie, apreciat pentru valoarea sa proteică, versatilitate și ușurința de a se integra în aproape orice dietă. Cu toate acestea, multe persoane se confruntă cu aceeași problemă: pieptul de pui uscat și fad.
Șantierul Autostrăzii Lugoj Deva  Foto Daniel Guță ADEVĂRUL (12) jpg
Ce se ascunde sub șantierul Autostrăzii Vestului. Descoperirea impresionantă la săparea primului tunel de la Holdea
Dealurile străpunse pentru construcția noilor tuneluri de autostradă din vestul României au scos la iveală informații uimitoare despre geologia zonei Holdea–Margina, dar și despre riscurile asociate solurilor excavate de constructori.
nicusor dan trump jpg
Soluția pentru România când americanii insistă să fim în Consiliul de Pace, iar europenii ar vrea să refuzăm. „Să fim și noi o dată inteligenți”
România e invitată să se alăture Consiliului de Pace promovat de administrația americană, însă partenerii europeni ezită. Doi cunoscuți experți explică, într-o analiză pentru „Adevărul”, modul în care ar trebui să cântărească Bucureștiul între securitate, interese economice și echilibrul alianțelor
autobu sofer istock jpg
Pedo, șoferul de microbuz școlar care agresa eleve, condamnat după 7 ani — iar sentința încă nu e definitivă
Un șofer de microbuz școlar care agresa sexual eleve de gimnaziu a fost condamnat, după șapte ani, la închisoare cu executare. Procesul nu este nici acum la final.
image png
Truc pentru curățarea fierului de călcat. Cum să îndepărtezi acele pete maronii încăpățânate în mai puțin de 2 minute
Un fier de călcat murdar poate transforma chiar și cea mai proaspăt spălată cămașă într-o sursă de frustrare. Petele maronii sau gri care apar pe țesături nu sunt doar neplăcute vizual, ci indică faptul că talpa fierului s-a murdărit cu reziduuri arse de detergent, fibre sau amidon.