Despre cantitate în limbă

4 februarie 2022
Despre cantitate în limbă jpeg

În general vorbind, în limba engleză, cuvintele din fondul autohton, anglo-saxon, sînt monosilabice ori cel mult bisilabice, iar ce este mai lung de atît provine din culturi străine. Elementele latinești și grecești, în special, sînt printre cele mai lungi. Tendința englezilor de a prescurta, de a abrevia, de a face cuvintele să ocupe cît mai puțin timp în pronunție și spațiu în scriere a fost observată de multă vreme. În secolul al XVII-lea, Jonathan Swift tuna și fulgera împotriva numeroaselor lexeme monosilabice care, pierzîndu-și „demnitatea polisilabică”, deveniseră „rușinea limbii noastre”. În secolul următor, George Campbell critica omiterea, de către vorbitori, a tuturor silabelor cu excepția celei inițiale sau a primelor două: hypochondriac era acum hyp, reputation – rep, incognito – incog, extraordinary – extra, ultimate – ult, iar penultimate – penult. Nu a scăpat de oprobriu nici pronunția, la verbe, a terminației -ed, de trecut, care își pierdea vocala, lipind consoana finală de silaba anterioară și scurtînd astfel cuvîntul (pronunție care, de altfel, a devenit normă).

Dar ce importanță are, în limbă, aspectul unui cuvînt? După ce, în analiza lingvistică de pretutindeni, sensul a primat, timp de mii de ani, forma ocupă, la americani, un loc central începînd cu cel de-al Doilea Război Mondial, cînd noul context istoric și tehnologic cere imperios formalizarea limbii engleze (și ruse) în limbaje matematice, pentru construirea unor mașini automate de stenografiat și tradus; datele extrase prin excluderea sensului din descrierea lingvistică și concentrarea pe aspectele cantitative sînt necesare și pentru găsirea unor căi de a transmite mesaje (în context de război „cald” sau „rece”) rapid și fără pierdere de informație. De proprietățile statistice ale limbii engleze se ocupă însuși Claude Shannon, într-un studiu din 1948, prin care inginerul american fundamentează teoria informației (numită și „teorie a comunicației” sau „cibernetică”).

Ca orice alt fenomen, limba are proprietăți numerice, lucru care justifică aplicarea metodelor matematice, între care cea mai cunoscută e statistica. Cu ajutorul acesteia, spune Solomon Marcus, s-a pus în evidență „strînsa legătură care există în mod natural între vorbire și cibernetică. [...] în vorbirea curentă acționează diferite legi, care fac ca transmiterea informației prin limbaj să se facă în conformitate cu anumite principii de extrem”. Una dintre aceste legi, care poartă numele lui George Kingsley Zipf, profesorul de la Harvard care a formulat-o, privește frecvența cu care cuvintele apar într-un text: acest parametru (notat f) e invers proporțional cu rangul lexical (notat n). Rangul 1 revine cuvîntului care apare cel mai des, rangul 2 aparține celui a cărui frecvență vine imediat după acesta, și așa mai departe, astfel încît produsul dintre n și f(n) va fi o constantă (P).

Dicționarul Collins listează primele zece cele mai frecvente cuvinte din limba engleză: the, of, and, a, to, in, is, you, that, it. The va avea rangul n = 1, of are n = 2, ... it are n = 10. Conform legii lui Zipf, f(1) = P∕1, f(2) = P∕2, ... f (10) = P∕10. Sau the este de două ori mai frecvent decît of, de trei ori mai frecvent decît and și de zece ori mai frecvent decît it. S-a calculat, de exemplu, că articolul hotărît the apare în vorbire cu o frecvență de 7%, pe cînd prepoziția of cu circa 3,5%. Dacă ne uităm la lungimea acestor elemente (unitatea de măsură fiind silaba), observăm că toate sînt monosilabice, formate fiind din unul, două sau trei sunete. Astfel ajungem la altă lege lingvistică, privitoare la lungimea cuvintelor: cele mai scurte lexeme tind să fie și cele mai frecvente.

De exemplu, cercetările făcute pe un corpus de limbă română compus din Luceafărul lui Eminescu, poeziile lui Arghezi, Hanul Ancuței al lui Sadoveanu, un Îndreptar de punctuație și un Cod Civil converg spre aceeași concluzie: din numărul total de silabe din fiecare, frecvența cuvintelor monosilabice este cea mai mare. Concret, în Luceafărul, lexemele monosilabice reprezintă 58% din total, cele bisilabice 26,3%, cele trisilabice 11,9%, cele din patru silabe 3,4%, din cinci silabe 0,3%, cuvinte mai lungi de atît nefiind folosite deloc. Bineînțeles că, în orice domeniu, nu numai în lingvistică, acuratețea datelor statistice (pe baza cărora se formulează legi cu scopul de a prezice comportamentul) depinde de numărul de elemente luate în calcul: cu cît ele vor fi mai numeroase, cu atît rezultatul va fi mai exact, și invers. Pentru totalitatea vocabularului românesc s-a stabilit că frecvența cea mai mare o au cuvintele monosilabice (39,37%), urmate de cele bisilabice (24,11%).

Zipf explică circulația mare a cuvintelor scurte prin presiunea pusă de o comunicare eficientă: concizia maximă în transmiterea informației poate fi obținută prin folosirea celor mai frecvente sensuri, codificate în cele mai scurte cuvinte. Solomon Marcus pare să sugereze același lucru cînd spune că, „deoarece în limbajul curent este necesar ca informațiile să se transmită cît mai rapid, în mod spontan fondul de bază este format în special din cuvinte scurte”. Zipf dă un nume acestei legi fundamentale care „guvernează orice tip de comportament individual și colectiv, inclusiv comportamentul lingvistic”: „principiul minimului efort”, prin care are în vedere efortul fizic de articulare, de pronunțare. Însă cercetări de ultim deceniu făcute la Massachusetts Institute of Technology arată că un alt factor s-ar corela, mai bine decît frecvența, cu lungimea unui cuvînt – anume, cantitatea de informație conținută.

Într-un studiu din 2011, cercetătorii de la MIT (Steven Piantadosi, Harry Tily și Edward Gibson) spun că teoria lor diferă de cea a lui Zipf în două moduri cruciale. În primul rînd, un vocabular în care lungimea elementelor depinde de informația conținută „nu ar fi cel mai concis posibil, pentru că lexemele foarte informative nu ar fi scurtate, chiar dacă ar exista și cuvinte distinctive mai scurte”. În al doilea rînd, „ar ține cantitatea de informații transmise în comunicare la o valoare cît mai constantă posibil”, astfel încît să nu fie depășite nici posibilitățile aparatului fonator și nici cele ale creierului. Daniel Everett vede în această teorie o puternică dovadă a faptului că, în limbă, la fel ca în orice altceva, „forma urmează funcția”. Lingvistul american invocă părerea unui arhitect american faimos, Louis Sullivan, care spune: „În toate lucrurile organice și anorganice, în toate lucrurile fizice și metafizice, în toate lucrurile umane și supraumane, în toate manifestările minții, ale inimii și ale sufletului, în toate vedem aceeași lege fundamentală: viața se recunoaște în expresia ei, forma urmează funcției. Aceasta este legea”. Aplicat la limbă, acest principiu ar explica de ce, atunci cînd funcția principală a limbii este una utilitară, de transmitere de informație, scurtimea elementelor este esențială.

Datele din lingvistica statistică au fost extrapolate în alte domenii: recent a fost publicat un studiu în care autorii susțin că au identificat tipare similare sau chiar identice legilor din limbă în sistemele biologice, de la molecule (genom, gene, proteine) la organisme (comportamentul animal) și ecologie (populații și ecosisteme): de exemplu, legea frecvenței, a lui Zipf, ar fi aparentă în distribuția elementelor de floră și faună sau chiar în ratele de infecție COVID în rîndul populațiilor echivalente demografic, în funcție de mărimea teritoriilor ocupate; corelația lungimii cu frecvența s-ar vedea în ecologie, în faptul că, într-un spațiu dat, cele mai numeroase specii sînt și cele mai mici.

Întorcîndu-mă acum la obiecția lui Jonathan Swift, cu care am început textul de față: e de la sine înțeles că, într-o limbă, e nevoie de tot felul de elemente. O comunitate are, în sistemul lingvistic nativ, cuvintele care corespund cel mai bine nevoilor proprii, fie că sînt scurte sau lungi, ori au o sonoritate solemnă sau caraghioasă. Scopurile cu care e folosită limba depășesc cu mult elementara nevoie de transmitere de informație și se reflectă în bogăția lexicală distribuită pe paliere fixate de stiluri funcționale și registre de vorbire. Dar aceasta e o idee care va fi dezvoltată în articolul din numărul viitor, în care vom vedea cum atenția se mută de pe lungimea (sau scurtimea) cuvintelor pe sonoritatea acestora.

Laura Carmen Cuțitaru este conferențiar la Literele ieșene, specializată în lingvistică americană.

Foto: George Kingsley Zipf 

image png
Ceasurile organismelor
Majoritatea organismelor vii au astfel de ritmuri sincronizate cu o durată de aproximativ 24 de ore, cea a unei zile pe Pămînt.
image png
Scrierea și scrisul
Cînd unii «intelectuali» catadicsesc (nu catadixesc!) să scrie cîteva rînduri, îți pui mîinile în cap! Dixi!...”
p 22 la Necsulescu jpg
Mama, între Leagăn și Lege
Cu alte cuvinte, a seta o limită fermă și apoi a putea fi alături de copil în stările lui de revoltă, furie și neputință în timp ce asimilează limita.
image png
De la supă la politică
Anul trecut, o investigație jurnalistică a WELT a scos la iveală țelul principal al asociației: acela de a se transforma într-un partid politic.
p 22 jpg
Limba trădătoare
Și, cu toate acestea, ce capacitate formidabilă au de a distruge vieți…”.
image png
Casă bună
Însă, de bună seamă, pe vremea lui Socrate, și casele erau mai... reziliente, și timpul avea mai multă răbdare...
p 22 Radu Paraschivescu WC jpg
Radu Paraschivescu. Portret sumar
Cărţile lui Radu Paraschivescu sînt mărturia unei curiozităţi insaţiabile, a unui umor inefabil şi a unei verve torenţiale.
p 22 WC jpg
„Trecutul e o țară străină“
Ethos creștin? Indiferent de explicație, gestul este de o noblețe spirituală pe care ar trebui să o invidiem de-a dreptul.
image png
Cînd trădarea e familiară
Filmul devine astfel o restituire simbolică pentru experiențele trăite.
p 7 coperta 1 jpg
Sfîrșitul visului african
Începutul „oficial” al Françafrique e considerat anul 1962, cînd Charles de Gaulle l-a însărcinat pe Jacques Foccart, întemeietorul unei firme de import-export de succes, cu coordonarea politicii africane a Franței.
p 22 la Gherghina WC jpg
Cabinetul de curiozități al evoluției
În ciuda spectaculoasei diversități a organismelor vii, evoluția a făcut ca, prin înrudirea lor, acestea să se asemene ramurilor unui singur arbore.
image png
Sofisme combinate
Și în cazul comunicării interpersonale, distincția dintre „public” și „privat” contează.
fbman png
Testul omului-facebook
Dar să identificăm oamenii-facebook din lumea noastră și să îi tratăm ca atare, încă mai putem.
image png
Încăpățînare discursivă
Altminteri, cînd politicienii nu-și înțeleg misiunea, cheltuindu-și energia în dispute stupide și inutile, rezultatul poate fi ușor de ghicit.
1031 22 23 jpg
O lume schizoidă
Laura Carmen Cuțitaru este conferențiar la Literele ieșene, specializată în lingvistică americană.
the running man jpg
Arta figurativă și teoria recapitulării
Totodată, ambele dezvăluie peisaje unice, de o frumusețe nemaiîntîlnită.
image png
Dezamăgirea ca „dezvrăjire”
Este o deșteptare amară, dar deșteptare. Ni se pare că ni s-a luat un solz de pe ochi.
image png
De ce 2 și nu 1
Ajunși în acest ultim punct, tot ceea ce putem, așadar, conștientiza e că nu sîntem niciodată 1, ci 2, că nu sîntem niciodată singuri
image png
Oglinzile sparte ale organismelor
Astfel, poate că natura se repetă, dar nu vrea mereu să spună același lucru.
image png
Topografia iertării
Uneori, poate să apară efectul iertării de sine pentru neputința de a ierta pe alții din afară.
p 23 WC jpg
Etică și igienă
Revenind acum la psihologie și experimente, Arie Bos notează că „acolo unde miroase a substanțe de igienă, oamenii se comportă mai sociabil și mai generos”.
p 21 Viktor E  Frankl WC jpg
Pustiul refuzat
Nimic de adăugat, nimic de comentat.
p 22 jpg
Contradicțiile dreptului proprietății intelectuale
Ce înseamnă, mai exact, forma radicală a ideii? Înseamnă forma simplificată și agresivă a ideii.
p 7 LibertÔÇÜ 6 jpg
Dreptate pentru vînzătorii stradali
Comerțul stradal e o activitate economică legitimă prin care își cîștigă existența milioane de oameni.

Adevarul.ro

image
Germania a arestat doi cetăţeni ruşi care ar fi conspirat să atace o bază militară americană
Doi cetățeni ruși au fost arestați în sudul Germaniei, fiind suspectați că au plănuit atacuri de sabotaj împotriva unor instalații militare americane, au anunțat joi procurorii germani.
image
O româncă se judecă de zece ani cu Elon Musk. Inițialele numelui său sunt pe acumulatorii mașinilor Tesla Model S
Brașoveanca Cristina Bălan a fost un inginer de mare viitor la Tesla, dar a fost concediată pentru că a atras atenția asupra unor defecte de fabricație. După zece ani încă se judecă cu Elon Musk
image
Cum arată interiorul „celei mai scumpe case” din lume, cu 100 de camere. Pentru ce sumă fabuloasă este scoasă la vânzare VIDEO
Castelul vast Chateau d'Armainvilliers din Seine-et-Marne, Franța, considerat a fi cea mai scumpă casă din lume, este scos la vânzare pentru 363 de milioane de lire sterline, potrivit Express.co.uk.

HIstoria.ro

image
Cine erau bancherii de altădată?
Zorii activităților de natură financiară au apărut în proximitatea și la adăpostul Scaunului domnesc, unde se puteau controla birurile și plățile cu rapiditate și se puteau schimba diferitele monede sau efecte aduse de funcționari ori trimiși străini ce roiau în jurul curții cetății Bucureștilor. 

image
A știut Churchill despre intenția germanilor de a bombarda orașul Coventry?
Datorită decriptărilor Enigma, aparent, Churchill a aflat că germanii pregăteau un raid aerian asupra orașului Coventry. Cu toate acestea, nu a ordonat evacuarea orașului și nici nu a suplimentat mijloacele de apărare antiaeriană.
image
Căderea lui Cuza și „monstruoasa coaliţie”
„Monstruoasa coaliţie“, așa cum a rămas în istorie, l-a detronat pe Alexandru Ioan Cuza prin lovitura de palat din 11 februarie.