Despre cantitate în limbă

4 februarie 2022
Despre cantitate în limbă jpeg

În general vorbind, în limba engleză, cuvintele din fondul autohton, anglo-saxon, sînt monosilabice ori cel mult bisilabice, iar ce este mai lung de atît provine din culturi străine. Elementele latinești și grecești, în special, sînt printre cele mai lungi. Tendința englezilor de a prescurta, de a abrevia, de a face cuvintele să ocupe cît mai puțin timp în pronunție și spațiu în scriere a fost observată de multă vreme. În secolul al XVII-lea, Jonathan Swift tuna și fulgera împotriva numeroaselor lexeme monosilabice care, pierzîndu-și „demnitatea polisilabică”, deveniseră „rușinea limbii noastre”. În secolul următor, George Campbell critica omiterea, de către vorbitori, a tuturor silabelor cu excepția celei inițiale sau a primelor două: hypochondriac era acum hyp, reputation – rep, incognito – incog, extraordinary – extra, ultimate – ult, iar penultimate – penult. Nu a scăpat de oprobriu nici pronunția, la verbe, a terminației -ed, de trecut, care își pierdea vocala, lipind consoana finală de silaba anterioară și scurtînd astfel cuvîntul (pronunție care, de altfel, a devenit normă).

Dar ce importanță are, în limbă, aspectul unui cuvînt? După ce, în analiza lingvistică de pretutindeni, sensul a primat, timp de mii de ani, forma ocupă, la americani, un loc central începînd cu cel de-al Doilea Război Mondial, cînd noul context istoric și tehnologic cere imperios formalizarea limbii engleze (și ruse) în limbaje matematice, pentru construirea unor mașini automate de stenografiat și tradus; datele extrase prin excluderea sensului din descrierea lingvistică și concentrarea pe aspectele cantitative sînt necesare și pentru găsirea unor căi de a transmite mesaje (în context de război „cald” sau „rece”) rapid și fără pierdere de informație. De proprietățile statistice ale limbii engleze se ocupă însuși Claude Shannon, într-un studiu din 1948, prin care inginerul american fundamentează teoria informației (numită și „teorie a comunicației” sau „cibernetică”).

Ca orice alt fenomen, limba are proprietăți numerice, lucru care justifică aplicarea metodelor matematice, între care cea mai cunoscută e statistica. Cu ajutorul acesteia, spune Solomon Marcus, s-a pus în evidență „strînsa legătură care există în mod natural între vorbire și cibernetică. [...] în vorbirea curentă acționează diferite legi, care fac ca transmiterea informației prin limbaj să se facă în conformitate cu anumite principii de extrem”. Una dintre aceste legi, care poartă numele lui George Kingsley Zipf, profesorul de la Harvard care a formulat-o, privește frecvența cu care cuvintele apar într-un text: acest parametru (notat f) e invers proporțional cu rangul lexical (notat n). Rangul 1 revine cuvîntului care apare cel mai des, rangul 2 aparține celui a cărui frecvență vine imediat după acesta, și așa mai departe, astfel încît produsul dintre n și f(n) va fi o constantă (P).

Dicționarul Collins listează primele zece cele mai frecvente cuvinte din limba engleză: the, of, and, a, to, in, is, you, that, it. The va avea rangul n = 1, of are n = 2, ... it are n = 10. Conform legii lui Zipf, f(1) = P∕1, f(2) = P∕2, ... f (10) = P∕10. Sau the este de două ori mai frecvent decît of, de trei ori mai frecvent decît and și de zece ori mai frecvent decît it. S-a calculat, de exemplu, că articolul hotărît the apare în vorbire cu o frecvență de 7%, pe cînd prepoziția of cu circa 3,5%. Dacă ne uităm la lungimea acestor elemente (unitatea de măsură fiind silaba), observăm că toate sînt monosilabice, formate fiind din unul, două sau trei sunete. Astfel ajungem la altă lege lingvistică, privitoare la lungimea cuvintelor: cele mai scurte lexeme tind să fie și cele mai frecvente.

De exemplu, cercetările făcute pe un corpus de limbă română compus din Luceafărul lui Eminescu, poeziile lui Arghezi, Hanul Ancuței al lui Sadoveanu, un Îndreptar de punctuație și un Cod Civil converg spre aceeași concluzie: din numărul total de silabe din fiecare, frecvența cuvintelor monosilabice este cea mai mare. Concret, în Luceafărul, lexemele monosilabice reprezintă 58% din total, cele bisilabice 26,3%, cele trisilabice 11,9%, cele din patru silabe 3,4%, din cinci silabe 0,3%, cuvinte mai lungi de atît nefiind folosite deloc. Bineînțeles că, în orice domeniu, nu numai în lingvistică, acuratețea datelor statistice (pe baza cărora se formulează legi cu scopul de a prezice comportamentul) depinde de numărul de elemente luate în calcul: cu cît ele vor fi mai numeroase, cu atît rezultatul va fi mai exact, și invers. Pentru totalitatea vocabularului românesc s-a stabilit că frecvența cea mai mare o au cuvintele monosilabice (39,37%), urmate de cele bisilabice (24,11%).

Zipf explică circulația mare a cuvintelor scurte prin presiunea pusă de o comunicare eficientă: concizia maximă în transmiterea informației poate fi obținută prin folosirea celor mai frecvente sensuri, codificate în cele mai scurte cuvinte. Solomon Marcus pare să sugereze același lucru cînd spune că, „deoarece în limbajul curent este necesar ca informațiile să se transmită cît mai rapid, în mod spontan fondul de bază este format în special din cuvinte scurte”. Zipf dă un nume acestei legi fundamentale care „guvernează orice tip de comportament individual și colectiv, inclusiv comportamentul lingvistic”: „principiul minimului efort”, prin care are în vedere efortul fizic de articulare, de pronunțare. Însă cercetări de ultim deceniu făcute la Massachusetts Institute of Technology arată că un alt factor s-ar corela, mai bine decît frecvența, cu lungimea unui cuvînt – anume, cantitatea de informație conținută.

Într-un studiu din 2011, cercetătorii de la MIT (Steven Piantadosi, Harry Tily și Edward Gibson) spun că teoria lor diferă de cea a lui Zipf în două moduri cruciale. În primul rînd, un vocabular în care lungimea elementelor depinde de informația conținută „nu ar fi cel mai concis posibil, pentru că lexemele foarte informative nu ar fi scurtate, chiar dacă ar exista și cuvinte distinctive mai scurte”. În al doilea rînd, „ar ține cantitatea de informații transmise în comunicare la o valoare cît mai constantă posibil”, astfel încît să nu fie depășite nici posibilitățile aparatului fonator și nici cele ale creierului. Daniel Everett vede în această teorie o puternică dovadă a faptului că, în limbă, la fel ca în orice altceva, „forma urmează funcția”. Lingvistul american invocă părerea unui arhitect american faimos, Louis Sullivan, care spune: „În toate lucrurile organice și anorganice, în toate lucrurile fizice și metafizice, în toate lucrurile umane și supraumane, în toate manifestările minții, ale inimii și ale sufletului, în toate vedem aceeași lege fundamentală: viața se recunoaște în expresia ei, forma urmează funcției. Aceasta este legea”. Aplicat la limbă, acest principiu ar explica de ce, atunci cînd funcția principală a limbii este una utilitară, de transmitere de informație, scurtimea elementelor este esențială.

Datele din lingvistica statistică au fost extrapolate în alte domenii: recent a fost publicat un studiu în care autorii susțin că au identificat tipare similare sau chiar identice legilor din limbă în sistemele biologice, de la molecule (genom, gene, proteine) la organisme (comportamentul animal) și ecologie (populații și ecosisteme): de exemplu, legea frecvenței, a lui Zipf, ar fi aparentă în distribuția elementelor de floră și faună sau chiar în ratele de infecție COVID în rîndul populațiilor echivalente demografic, în funcție de mărimea teritoriilor ocupate; corelația lungimii cu frecvența s-ar vedea în ecologie, în faptul că, într-un spațiu dat, cele mai numeroase specii sînt și cele mai mici.

Întorcîndu-mă acum la obiecția lui Jonathan Swift, cu care am început textul de față: e de la sine înțeles că, într-o limbă, e nevoie de tot felul de elemente. O comunitate are, în sistemul lingvistic nativ, cuvintele care corespund cel mai bine nevoilor proprii, fie că sînt scurte sau lungi, ori au o sonoritate solemnă sau caraghioasă. Scopurile cu care e folosită limba depășesc cu mult elementara nevoie de transmitere de informație și se reflectă în bogăția lexicală distribuită pe paliere fixate de stiluri funcționale și registre de vorbire. Dar aceasta e o idee care va fi dezvoltată în articolul din numărul viitor, în care vom vedea cum atenția se mută de pe lungimea (sau scurtimea) cuvintelor pe sonoritatea acestora.

Laura Carmen Cuțitaru este conferențiar la Literele ieșene, specializată în lingvistică americană.

Foto: George Kingsley Zipf 

image png
Ceasurile organismelor
Majoritatea organismelor vii au astfel de ritmuri sincronizate cu o durată de aproximativ 24 de ore, cea a unei zile pe Pămînt.
image png
Scrierea și scrisul
Cînd unii «intelectuali» catadicsesc (nu catadixesc!) să scrie cîteva rînduri, îți pui mîinile în cap! Dixi!...”
p 22 la Necsulescu jpg
Mama, între Leagăn și Lege
Cu alte cuvinte, a seta o limită fermă și apoi a putea fi alături de copil în stările lui de revoltă, furie și neputință în timp ce asimilează limita.
image png
De la supă la politică
Anul trecut, o investigație jurnalistică a WELT a scos la iveală țelul principal al asociației: acela de a se transforma într-un partid politic.
p 22 jpg
Limba trădătoare
Și, cu toate acestea, ce capacitate formidabilă au de a distruge vieți…”.
image png
Casă bună
Însă, de bună seamă, pe vremea lui Socrate, și casele erau mai... reziliente, și timpul avea mai multă răbdare...
p 22 Radu Paraschivescu WC jpg
Radu Paraschivescu. Portret sumar
Cărţile lui Radu Paraschivescu sînt mărturia unei curiozităţi insaţiabile, a unui umor inefabil şi a unei verve torenţiale.
p 22 WC jpg
„Trecutul e o țară străină“
Ethos creștin? Indiferent de explicație, gestul este de o noblețe spirituală pe care ar trebui să o invidiem de-a dreptul.
image png
Cînd trădarea e familiară
Filmul devine astfel o restituire simbolică pentru experiențele trăite.
p 7 coperta 1 jpg
Sfîrșitul visului african
Începutul „oficial” al Françafrique e considerat anul 1962, cînd Charles de Gaulle l-a însărcinat pe Jacques Foccart, întemeietorul unei firme de import-export de succes, cu coordonarea politicii africane a Franței.
p 22 la Gherghina WC jpg
Cabinetul de curiozități al evoluției
În ciuda spectaculoasei diversități a organismelor vii, evoluția a făcut ca, prin înrudirea lor, acestea să se asemene ramurilor unui singur arbore.
image png
Sofisme combinate
Și în cazul comunicării interpersonale, distincția dintre „public” și „privat” contează.
fbman png
Testul omului-facebook
Dar să identificăm oamenii-facebook din lumea noastră și să îi tratăm ca atare, încă mai putem.
image png
Încăpățînare discursivă
Altminteri, cînd politicienii nu-și înțeleg misiunea, cheltuindu-și energia în dispute stupide și inutile, rezultatul poate fi ușor de ghicit.
1031 22 23 jpg
O lume schizoidă
Laura Carmen Cuțitaru este conferențiar la Literele ieșene, specializată în lingvistică americană.
the running man jpg
Arta figurativă și teoria recapitulării
Totodată, ambele dezvăluie peisaje unice, de o frumusețe nemaiîntîlnită.
image png
Dezamăgirea ca „dezvrăjire”
Este o deșteptare amară, dar deșteptare. Ni se pare că ni s-a luat un solz de pe ochi.
image png
De ce 2 și nu 1
Ajunși în acest ultim punct, tot ceea ce putem, așadar, conștientiza e că nu sîntem niciodată 1, ci 2, că nu sîntem niciodată singuri
image png
Oglinzile sparte ale organismelor
Astfel, poate că natura se repetă, dar nu vrea mereu să spună același lucru.
image png
Topografia iertării
Uneori, poate să apară efectul iertării de sine pentru neputința de a ierta pe alții din afară.
p 23 WC jpg
Etică și igienă
Revenind acum la psihologie și experimente, Arie Bos notează că „acolo unde miroase a substanțe de igienă, oamenii se comportă mai sociabil și mai generos”.
p 21 Viktor E  Frankl WC jpg
Pustiul refuzat
Nimic de adăugat, nimic de comentat.
p 22 jpg
Contradicțiile dreptului proprietății intelectuale
Ce înseamnă, mai exact, forma radicală a ideii? Înseamnă forma simplificată și agresivă a ideii.
p 7 LibertÔÇÜ 6 jpg
Dreptate pentru vînzătorii stradali
Comerțul stradal e o activitate economică legitimă prin care își cîștigă existența milioane de oameni.

Parteneri

Matanza templo2 jpg
Măcelul cumplit care a dus la prăbușirea celui mai mare imperiu al Americii. Totul cu doar 500 de soldați
Cel mai mare imperiu al Americii a sfârșit într-o baie de sânge. Acum 505 ani, un festival aparent inofensiv a declanșat cele mai sângeroase confruntări dintre europeni și populațiile native, cu fapte de o cruzime ieșită din comun. Una dintre cele mai mari civilizații ale lumii se prăbușea.
colesterol istock jpg
Semne pe care ți le dă corpul dacă ai colosterol mare. La ce trebuie să fii atent
Colesterolul mărit este unul dintre cei mai importanți factori de risc pentru bolile cardiovasculare, precum infarctul de miocard sau accidentul vascular cerebral.
Dunărea reprezenta una din zonele sensibile ale Romaniei JPG
Pericolele înfruntate de românii plecați din țară, spre Vest: „Emigrantul lasă impresia unui pachet de marfă aruncat din colț în colț”
Mai accesibilă acum ca oricând în ultimul secol, emigrarea românilor spre Occident păstrează o istorie tulburătoare. Mii de români au sfârșit în trecut în încercările temerare de a părăsi România, iar alții au avut de înfruntat provocările extreme ale unor lumi dure, complet necunoscute lor.
Votul în diaspora. FOTO Inquam Photos / Alex Nicodim
Discuții aprinse despre românii din diaspora care-și taie buletinele: „Ce căutați în Europa aia pe care o huliți? Mergeți în Rusia!”
Clipurile de pe rețelele sociale cu români din diaspora care-și distrug buletinele sau pașapoartele au atras sute de comentarii. Dacă unii fac haz de necaz, alții avertizează că este o infracțiune, în timp ce unii se întreabă de ce continuă să locuiască în Europa pe care o hulesc atât de mult.
nunta mortului jpeg
Tradiția neobișnuită din Maramureș de care puțini români au auzit. Ce este „nunta mortului”?
De-a lungul țării noastre există nenumărate tradiții fascinante, pe care fiecare dintre noi încercăm să le respectăm. Însă, altele rămân de-a dreptul bizare, iar în ziua de astăzi nu foarte mulți oameni au auzit de ele.
declaratia unica
Ce riscă românii care nu își declară veniturile la ANAF până pe 26 mai
Românii care au obținut în 2024 venituri din surse precum chirii, dividende, acțiuni, criptomonede, drepturi de autor sau activități independente sunt obligați să depună Declarația Unică până cel târziu 26 mai 2025.
Sistemul de rachete Foudre FOTO Turgis Gaillard png
Un rival european la HIMARS, dezvoltat de o companie franceză. Lecția oferită de câmpul de luptă din Ucraina
O companie franceză dezvoltă o alternativă la sistemul american HIMARS, în măsura în care Europa consideră necesar să-și reduce dependența de SUA și să-și consolideze propria industrie de apărare, relatează Business Insider.
Praful din casă Foto Real Shop gr jpg
Trucul natural care elimină praful și dezinfectează casa în doar un minut, fără chimicale sau efort
Descoperă trucul natural care elimină praful și dezinfectează casa în doar 1 minut, fără chimicale sau efort! O soluție simplă, rapidă și eco-friendly pentru un cămin curat, sănătos și plin de prospețime.
strada petrolistilor1 jpeg
Cea mai lungă stradă din România, unică în Europa. Măsoară 18 kilometri, include 31 de podețe și 21 de poduri, depășind un record impresionant
În țara noastră există câteva străzi care impresionează prin lungimea pe care o au. Însă, titlul de cea mai lungă stradă din România revine unei străzi de-a dreptul neașteptate, dintr-un loc la care nu ne-am fi așteptat niciodată! Aceasta se întinde de-a lungul a zeci de kilometri!