Despre cantitate în limbă

4 februarie 2022
Despre cantitate în limbă jpeg

În general vorbind, în limba engleză, cuvintele din fondul autohton, anglo-saxon, sînt monosilabice ori cel mult bisilabice, iar ce este mai lung de atît provine din culturi străine. Elementele latinești și grecești, în special, sînt printre cele mai lungi. Tendința englezilor de a prescurta, de a abrevia, de a face cuvintele să ocupe cît mai puțin timp în pronunție și spațiu în scriere a fost observată de multă vreme. În secolul al XVII-lea, Jonathan Swift tuna și fulgera împotriva numeroaselor lexeme monosilabice care, pierzîndu-și „demnitatea polisilabică”, deveniseră „rușinea limbii noastre”. În secolul următor, George Campbell critica omiterea, de către vorbitori, a tuturor silabelor cu excepția celei inițiale sau a primelor două: hypochondriac era acum hyp, reputation – rep, incognito – incog, extraordinary – extra, ultimate – ult, iar penultimate – penult. Nu a scăpat de oprobriu nici pronunția, la verbe, a terminației -ed, de trecut, care își pierdea vocala, lipind consoana finală de silaba anterioară și scurtînd astfel cuvîntul (pronunție care, de altfel, a devenit normă).

Dar ce importanță are, în limbă, aspectul unui cuvînt? După ce, în analiza lingvistică de pretutindeni, sensul a primat, timp de mii de ani, forma ocupă, la americani, un loc central începînd cu cel de-al Doilea Război Mondial, cînd noul context istoric și tehnologic cere imperios formalizarea limbii engleze (și ruse) în limbaje matematice, pentru construirea unor mașini automate de stenografiat și tradus; datele extrase prin excluderea sensului din descrierea lingvistică și concentrarea pe aspectele cantitative sînt necesare și pentru găsirea unor căi de a transmite mesaje (în context de război „cald” sau „rece”) rapid și fără pierdere de informație. De proprietățile statistice ale limbii engleze se ocupă însuși Claude Shannon, într-un studiu din 1948, prin care inginerul american fundamentează teoria informației (numită și „teorie a comunicației” sau „cibernetică”).

Ca orice alt fenomen, limba are proprietăți numerice, lucru care justifică aplicarea metodelor matematice, între care cea mai cunoscută e statistica. Cu ajutorul acesteia, spune Solomon Marcus, s-a pus în evidență „strînsa legătură care există în mod natural între vorbire și cibernetică. [...] în vorbirea curentă acționează diferite legi, care fac ca transmiterea informației prin limbaj să se facă în conformitate cu anumite principii de extrem”. Una dintre aceste legi, care poartă numele lui George Kingsley Zipf, profesorul de la Harvard care a formulat-o, privește frecvența cu care cuvintele apar într-un text: acest parametru (notat f) e invers proporțional cu rangul lexical (notat n). Rangul 1 revine cuvîntului care apare cel mai des, rangul 2 aparține celui a cărui frecvență vine imediat după acesta, și așa mai departe, astfel încît produsul dintre n și f(n) va fi o constantă (P).

Dicționarul Collins listează primele zece cele mai frecvente cuvinte din limba engleză: the, of, and, a, to, in, is, you, that, it. The va avea rangul n = 1, of are n = 2, ... it are n = 10. Conform legii lui Zipf, f(1) = P∕1, f(2) = P∕2, ... f (10) = P∕10. Sau the este de două ori mai frecvent decît of, de trei ori mai frecvent decît and și de zece ori mai frecvent decît it. S-a calculat, de exemplu, că articolul hotărît the apare în vorbire cu o frecvență de 7%, pe cînd prepoziția of cu circa 3,5%. Dacă ne uităm la lungimea acestor elemente (unitatea de măsură fiind silaba), observăm că toate sînt monosilabice, formate fiind din unul, două sau trei sunete. Astfel ajungem la altă lege lingvistică, privitoare la lungimea cuvintelor: cele mai scurte lexeme tind să fie și cele mai frecvente.

De exemplu, cercetările făcute pe un corpus de limbă română compus din Luceafărul lui Eminescu, poeziile lui Arghezi, Hanul Ancuței al lui Sadoveanu, un Îndreptar de punctuație și un Cod Civil converg spre aceeași concluzie: din numărul total de silabe din fiecare, frecvența cuvintelor monosilabice este cea mai mare. Concret, în Luceafărul, lexemele monosilabice reprezintă 58% din total, cele bisilabice 26,3%, cele trisilabice 11,9%, cele din patru silabe 3,4%, din cinci silabe 0,3%, cuvinte mai lungi de atît nefiind folosite deloc. Bineînțeles că, în orice domeniu, nu numai în lingvistică, acuratețea datelor statistice (pe baza cărora se formulează legi cu scopul de a prezice comportamentul) depinde de numărul de elemente luate în calcul: cu cît ele vor fi mai numeroase, cu atît rezultatul va fi mai exact, și invers. Pentru totalitatea vocabularului românesc s-a stabilit că frecvența cea mai mare o au cuvintele monosilabice (39,37%), urmate de cele bisilabice (24,11%).

Zipf explică circulația mare a cuvintelor scurte prin presiunea pusă de o comunicare eficientă: concizia maximă în transmiterea informației poate fi obținută prin folosirea celor mai frecvente sensuri, codificate în cele mai scurte cuvinte. Solomon Marcus pare să sugereze același lucru cînd spune că, „deoarece în limbajul curent este necesar ca informațiile să se transmită cît mai rapid, în mod spontan fondul de bază este format în special din cuvinte scurte”. Zipf dă un nume acestei legi fundamentale care „guvernează orice tip de comportament individual și colectiv, inclusiv comportamentul lingvistic”: „principiul minimului efort”, prin care are în vedere efortul fizic de articulare, de pronunțare. Însă cercetări de ultim deceniu făcute la Massachusetts Institute of Technology arată că un alt factor s-ar corela, mai bine decît frecvența, cu lungimea unui cuvînt – anume, cantitatea de informație conținută.

Într-un studiu din 2011, cercetătorii de la MIT (Steven Piantadosi, Harry Tily și Edward Gibson) spun că teoria lor diferă de cea a lui Zipf în două moduri cruciale. În primul rînd, un vocabular în care lungimea elementelor depinde de informația conținută „nu ar fi cel mai concis posibil, pentru că lexemele foarte informative nu ar fi scurtate, chiar dacă ar exista și cuvinte distinctive mai scurte”. În al doilea rînd, „ar ține cantitatea de informații transmise în comunicare la o valoare cît mai constantă posibil”, astfel încît să nu fie depășite nici posibilitățile aparatului fonator și nici cele ale creierului. Daniel Everett vede în această teorie o puternică dovadă a faptului că, în limbă, la fel ca în orice altceva, „forma urmează funcția”. Lingvistul american invocă părerea unui arhitect american faimos, Louis Sullivan, care spune: „În toate lucrurile organice și anorganice, în toate lucrurile fizice și metafizice, în toate lucrurile umane și supraumane, în toate manifestările minții, ale inimii și ale sufletului, în toate vedem aceeași lege fundamentală: viața se recunoaște în expresia ei, forma urmează funcției. Aceasta este legea”. Aplicat la limbă, acest principiu ar explica de ce, atunci cînd funcția principală a limbii este una utilitară, de transmitere de informație, scurtimea elementelor este esențială.

Datele din lingvistica statistică au fost extrapolate în alte domenii: recent a fost publicat un studiu în care autorii susțin că au identificat tipare similare sau chiar identice legilor din limbă în sistemele biologice, de la molecule (genom, gene, proteine) la organisme (comportamentul animal) și ecologie (populații și ecosisteme): de exemplu, legea frecvenței, a lui Zipf, ar fi aparentă în distribuția elementelor de floră și faună sau chiar în ratele de infecție COVID în rîndul populațiilor echivalente demografic, în funcție de mărimea teritoriilor ocupate; corelația lungimii cu frecvența s-ar vedea în ecologie, în faptul că, într-un spațiu dat, cele mai numeroase specii sînt și cele mai mici.

Întorcîndu-mă acum la obiecția lui Jonathan Swift, cu care am început textul de față: e de la sine înțeles că, într-o limbă, e nevoie de tot felul de elemente. O comunitate are, în sistemul lingvistic nativ, cuvintele care corespund cel mai bine nevoilor proprii, fie că sînt scurte sau lungi, ori au o sonoritate solemnă sau caraghioasă. Scopurile cu care e folosită limba depășesc cu mult elementara nevoie de transmitere de informație și se reflectă în bogăția lexicală distribuită pe paliere fixate de stiluri funcționale și registre de vorbire. Dar aceasta e o idee care va fi dezvoltată în articolul din numărul viitor, în care vom vedea cum atenția se mută de pe lungimea (sau scurtimea) cuvintelor pe sonoritatea acestora.

Laura Carmen Cuțitaru este conferențiar la Literele ieșene, specializată în lingvistică americană.

Foto: George Kingsley Zipf 

image png
Ceasurile organismelor
Majoritatea organismelor vii au astfel de ritmuri sincronizate cu o durată de aproximativ 24 de ore, cea a unei zile pe Pămînt.
image png
Scrierea și scrisul
Cînd unii «intelectuali» catadicsesc (nu catadixesc!) să scrie cîteva rînduri, îți pui mîinile în cap! Dixi!...”
p 22 la Necsulescu jpg
Mama, între Leagăn și Lege
Cu alte cuvinte, a seta o limită fermă și apoi a putea fi alături de copil în stările lui de revoltă, furie și neputință în timp ce asimilează limita.
image png
De la supă la politică
Anul trecut, o investigație jurnalistică a WELT a scos la iveală țelul principal al asociației: acela de a se transforma într-un partid politic.
p 22 jpg
Limba trădătoare
Și, cu toate acestea, ce capacitate formidabilă au de a distruge vieți…”.
image png
Casă bună
Însă, de bună seamă, pe vremea lui Socrate, și casele erau mai... reziliente, și timpul avea mai multă răbdare...
p 22 Radu Paraschivescu WC jpg
Radu Paraschivescu. Portret sumar
Cărţile lui Radu Paraschivescu sînt mărturia unei curiozităţi insaţiabile, a unui umor inefabil şi a unei verve torenţiale.
p 22 WC jpg
„Trecutul e o țară străină“
Ethos creștin? Indiferent de explicație, gestul este de o noblețe spirituală pe care ar trebui să o invidiem de-a dreptul.
image png
Cînd trădarea e familiară
Filmul devine astfel o restituire simbolică pentru experiențele trăite.
p 7 coperta 1 jpg
Sfîrșitul visului african
Începutul „oficial” al Françafrique e considerat anul 1962, cînd Charles de Gaulle l-a însărcinat pe Jacques Foccart, întemeietorul unei firme de import-export de succes, cu coordonarea politicii africane a Franței.
p 22 la Gherghina WC jpg
Cabinetul de curiozități al evoluției
În ciuda spectaculoasei diversități a organismelor vii, evoluția a făcut ca, prin înrudirea lor, acestea să se asemene ramurilor unui singur arbore.
image png
Sofisme combinate
Și în cazul comunicării interpersonale, distincția dintre „public” și „privat” contează.
fbman png
Testul omului-facebook
Dar să identificăm oamenii-facebook din lumea noastră și să îi tratăm ca atare, încă mai putem.
image png
Încăpățînare discursivă
Altminteri, cînd politicienii nu-și înțeleg misiunea, cheltuindu-și energia în dispute stupide și inutile, rezultatul poate fi ușor de ghicit.
1031 22 23 jpg
O lume schizoidă
Laura Carmen Cuțitaru este conferențiar la Literele ieșene, specializată în lingvistică americană.
the running man jpg
Arta figurativă și teoria recapitulării
Totodată, ambele dezvăluie peisaje unice, de o frumusețe nemaiîntîlnită.
image png
Dezamăgirea ca „dezvrăjire”
Este o deșteptare amară, dar deșteptare. Ni se pare că ni s-a luat un solz de pe ochi.
image png
De ce 2 și nu 1
Ajunși în acest ultim punct, tot ceea ce putem, așadar, conștientiza e că nu sîntem niciodată 1, ci 2, că nu sîntem niciodată singuri
image png
Oglinzile sparte ale organismelor
Astfel, poate că natura se repetă, dar nu vrea mereu să spună același lucru.
image png
Topografia iertării
Uneori, poate să apară efectul iertării de sine pentru neputința de a ierta pe alții din afară.
p 23 WC jpg
Etică și igienă
Revenind acum la psihologie și experimente, Arie Bos notează că „acolo unde miroase a substanțe de igienă, oamenii se comportă mai sociabil și mai generos”.
p 21 Viktor E  Frankl WC jpg
Pustiul refuzat
Nimic de adăugat, nimic de comentat.
p 22 jpg
Contradicțiile dreptului proprietății intelectuale
Ce înseamnă, mai exact, forma radicală a ideii? Înseamnă forma simplificată și agresivă a ideii.
p 7 LibertÔÇÜ 6 jpg
Dreptate pentru vînzătorii stradali
Comerțul stradal e o activitate economică legitimă prin care își cîștigă existența milioane de oameni.

Parteneri

femeie batrana in spital foto pexels Engin Akyurt png
Colegiul Medicilor cere autorităţilor „soluţii şi măsuri viabile” pentru ca serviciile medicale să poată fi asigurate în Prahova
Colegiul Medicilor din România cere autorităţilor „soluţii şi măsuri viabile” pentru ca serviciile medicale să poată fi asigurate în Prahova, județ afectat de lipsa apei.
ID326356 INQUAM Photos Octav Ganea jpg
Campania electorală se încheie sub semnul acuzațiilor de înțelegeri ascunse. Bucureștenii își aleg duminică noul primar general
Astăzi este ultima zi de campanie electorală pentru candidații la Primăria Capitalei, Consiliul Județean Buzău și alte 12 localități. Un fost consilier prezidențial a criticat strategia unui candidat la București, sugerând că refuzul acestuia de a se retrage ar putea ascunde o înțelegere tacită.
Avion MIG 29 distrus in Crimeea FOTO Captura jpg
Forțele speciale ucrainene au distrus un avion de vânătoare MiG-29 pe un aerodrom din Crimeea
Unitatea de elită a forțelor speciale ucrainene „Fantomele” a anunțat că a distrus un avion de vânătoare rusesc MiG-29 pe aerodromul militar Kacea din Crimeea, relatează Kyiv Post.
ou fabrege furat jpg
Bărbatul care a înghițit oul Fabergé cu 60 de diamante l-a eliminat pe cale naturală, cu tot cu etichetă|FOTO
După șase zile de așteptare tensionată, poliția din Noua Zeelandă a reușit să recupereze bijuteria Fabergé, relatează BBC și AP. Bărbatul de 32 de ani, acuzat că a furat-o din magazin, înghițind-o,
Ilan Sor blocul Victorie FOTO Facebook jpeg
Cum ajută Ilan Șor și criptomoneda A7A5 Rusia să eludeze sancțiunile și să-și construiască un nou sistem financiar
A7A5, criptomoneda legată de oligarhul fugar Ilan Șor și de banca rusă Promsviazbank, a devenit un instrument esențial prin care Rusia eludează sancțiunile occidentale. Companii și structuri înregistrate în Kârgâzstan, Moldova și Rusia sunt implicate într-o rețea financiară opacă menită să creeze un
somn dormit adobestock jpg
Cât de bine dorm și cât de stresați sunt tinerii din România
La nivelul Generației Z, femeile au somnul mai fragmentat și sunt mai stresate la locul de muncă și mult mai stresate acasă, în timp ce bărbații adorm mai greu, sunt oarecum stresați la locul de muncă și mai deloc acasă, potrivit unui studiu de specialitate.
trafic Bucuresti 5 jpg
Șefa Transporturilor din Primăria Capitalei a mărturisit că este agresivă în trafic. Dezvăluirile făcute într-o ședință: „L-am trântit şi i-am pus pistolul la cap” | Audio
Șefa Departamentului Transporturi din Primăria Capitalei, a recunoscut că are un comportament agresiv în trafic, incluzând amenințări cu pistolul sau atacuri cu bâta.
Telefon - factura FOTO Shutterstock
Ce fac românii ca să nu explodeze facturile. Trucuri după eliminarea plafonării la energie
După eliminarea plafonării la energie, facturile la curent au crescut în medie cu 60%, potrivit unui sondaj recent. În fața scumpirilor, românii au început să caute soluții rapide, accesibile și eficiente pentru reducerea consumului. Cele mai multe dintre aceste măsuri sunt simple și pot genera econ
Zelenski  vizita in Irlanda FOTO profimedia jpg
Dronele care au urmărit avionul lui Zelenski erau de uz militar. Comunicatul biroului președintelui ucrainean
Dronele observate în Irlanda în zona în care zbura avionul lui Volodimir Zelenski erau de mari dimensiuni și ar fi fost drone de uz militar, a relatat presa locală. Biroul lui Zelenski a transmis un comunicat privind incidentul, relatează RBC Ucraina.