Care sunt cuvintele românești cu origine necunoscută?
Pentru a vorbi despre etimologie necunoscută trebuie să înțelegem exact ce înseamnă această expresie. Etimologia este știința care studiază originea cuvintelor sau, altfel spus, este cercetarea relațiilor – formale și semantice – care leagă un cuvânt de altă unitate lexicală care o precedă istoric și de la care derivă. Această altă unitate poate fi din latină, limba pe care o continuă româna, sau din diverse limbi de la care româna a împrumutat cuvinte; nu trebuie uitate nici cuvintele formate în română, așa numitele creații interne, de la cuvintele existente în română, prin procedee ca derivarea (cu sufixe sau cu prefixe) ori compunerea.
În această definiție apare, așadar, ideea de relație, care poate fi formală (fonetică) sau/și semantică. Cu alte cuvinte, în stabilirea originii unui cuvânt se apelează la două criterii fundamentale: concordanța fonetică și concordanța semantică între cuvântul avut în vedere și cuvântul din care se presupune că acesta provine.
Exemplul clasic este cel al cuvântului soare provenit din lat. solem. Etimologia este corectă pentru că: a) termenul românesc are același înțeles ca lat. solem; b) prezintă o transformare fonetică întâlnită și la alte cuvinte moștenite din latină, unde - l - intervocalic devine - r - (de exemplu, lat. mola care a devenit moară). Dacă se procedează așa, nu se va putea spune că bilă „fiere”, termen folosit de medici, vine din lat. bilis „fiere”, pentru că - l - nu s-a transformat în - r -. Etimologia lui bilă trebuie căutată în altă parte; este un împrumut ulterior din franceză, unde este la rândul lui împrumutat din latină.
Cuvinte fără etimologie?
Termenul necunoscut din expresia etimologie necunoscută are diverse accepțiuni: se folosește referitor la cuvintele, puțin numeroase, pentru care nu s-a propus nicio etimologie, dar și la cuvintele care au primit mai multe explicații, fără însă ca vreuna să fie acceptată de majoritatea lingviștilor. Pentru ultima accepțiune se folosesc și termenii „etimologie nesigură / îndoielnică / incertă / discutabilă”. Unii autori de dicționare preferă, în astfel de cazuri, să nu dea nicio etimologie. I. A. Candrea, în excelentul Dicționar enciclopedic ilustrat „Cartea Românească” (19261931), precizează:
„Acolo unde lipsește orice informațiune cu privire la etimologie înseamnă că originea este necunoscută sau că cea propusă de filologi este foarte dubioasă” (p. XIII).
Celor care se întreabă de ce s-a ajuns la acest impas, le răspund că sunt mai multe cauze care explică situația. Un răspuns general ar putea fi formulat astfel: nu avem informațiile necesare pentru a stabili relațiile formale sau/și semantice dintre cuvântul românesc și cel din care provine, condiție fundamentală a unei etimologii corecte. Remarca este valabilă atât pentru cuvintele moștenite din latină, cât și pentru, mai numeroase, cuvintele împrumutate.
Orice lingvist care încearcă să dea o etimologie pentru un cuvânt românesc caută, în primul rând, în latină un cuvânt de la care să pornească explicația. Dacă nu găsește nimic în latină, face apel la limbile cu care româna a intrat în contact. Pentru cuvintele dialectale se apelează la limbile învecinate cu dialectul respectiv (de exemplu, în nordul țării se apelează în primul rând la ucraineană).
Moșteniri latine cu mai multe etimoane
Se știe că româna a moștenit din latină aproximativ același număr de cuvinte (în jur de 2 000) ca și fiecare din celelalte limbi romanice. Între acestea, cele mai multe au un etimon acceptat de toată lumea: apă, ochi, a vedea, pe provin din lat. aqua, oculus, videre, per.
Există însă o serie de cuvinte moștenite din latină pentru care s-au propus mai multe etimoane. Astfel, frământa a fost explicat prin lat. fermentare „a dospi”, lat. fragmentare „a fărămița” și cuvântul neatestat *frementare, derivat de la frementum „sfărâmare, fărâmițare”; la fel, lepăda a fost explicat de la lat. liquidare, cu dificultăți de ordin fonetic, sau dintr-un neatestat *lepidare. Din ultimele două exemple rezultă că niciunul dintre etimoanele latinești propuse nu corespunde exigențelor unei etimologii sigure. Ele sunt cel puțin discutabile, iar pentru unii, îndoielnice.
Se observă că uneori se reconstituie ca etimon forme neatestate. Limba latină este foarte bine cunoscută; ea are un dicționar, Thesaurus Linguae Latinae, început din 1900, în care sunt înregistrate toate cuvintele existente în texte. În ciuda acestei bogate surse de informație, se mai descoperă, în unele texte, câte o formă presupusă doar a fi existat și care, de aceea, era precedată de un asterisc. Maria Iliescu, în 1959, a găsit atestat cuvântul latinesc disculcius într-un manuscris din Lex Salica, publicat în 1953. Deci desculț, pentru care până în 1959 dicționarele dădeau ca etimon o formă cu asterisc *disculcius, are etimonul atestat.
Este foarte posibil să se găsească și alte cuvinte, mai ales în textele latinești vulgare, care să explice originea unor cuvinte romanice.
În ceea ce privește unele cuvinte împrumutate (mă refer, în primul rând, la cuvintele care provin din limbi vechi, unele dispărute), acestea au putut lăsa urme în latina care stă la baza limbilor romanice. Să nu uităm că limbile care reprezintă substratul limbilor romanice nu au avut scrieri; în cazul românei, nu avem texte din traco-dacă. În latină există multe cuvinte care nu sunt moșteni te din indo-europeană, ci sunt împrumuturi din limbi preindo-europene necunoscute (exemplul cel mai des invocat este vinum, cuvânt mediteraneean transmis tuturor limbilor romanice, inclusiv românei).
Un cuvânt – o istorie
Lingviștii spun, de obicei, că fiecare cuvânt are istoria lui. Afirmația presupune că e nevoie de o bună cunoaștere a acestei istorii. Pentru cuvintele mai neobișnuite, trebuie să avem în vedere diverse le variante, pentru că nu întotdeauna varianta dată în dicționare este cea mai apropiată de etimon. Din motive similare, trebuie cunoscute diversele sensuri ale cuvântului. În măsura posibilului, trebuie să avem informații și despre cele mai vechi atestări ale termenului în discuție.
Observația este valabilă și pentru istoria cuvinte lor în limbile de unde au fost împrumutate. De exemplu, trebuie să știm dacă un cuvânt din bulgară, presupus a sta la baza unui cuvânt românesc, este vechi sau recent. Astfel, românescul rochie nu poate fi împrumutat din bulgară sau/și sârbă, fiindcă în ambele limbi este un împrumut din secolul al XIX-lea, în timp ce roche este atestat în română din 1721 și vine din germană. Mai clar este cazul lui cană, atestat în română la Dosoftei, în timp ce în bulgară este recent.
„Fiecare cuvânt are istoria lui” înseamnă și altceva. De multe ori, formele unui cuvânt suferă transformări care nu reflectă acțiunea legilor fonetice cunoscute, ci se datorează așa-numitelor accidente fonetice. Acestea pot fi asimilări (așa se explică de ce fr. chausson a devenit șoșon în loc de șoson), disimilări (fenomen opus asimilării, care explică forma mărunt în loc de mănunt provenit din lat. minutus), metateza, adică schimbarea locului unui sunet în cuvânt (prin care se explică forma literară actuală castravete în loc de crastavete, care este forma etimologică, păstrată în graiuri).
Andrei Avram (în Contribuții etimologice, 1997) a explicat multe cuvinte considerate, în dicționarul tezaur al limbii române, cu etimologie necunoscută, pornind de la accidente fonetice ca cele exemplificate mai sus, care pot să îngreuneze descoperirea etimonului. Un fenomen mai complex este etimologia populară, asupra căruia a insistat Th. Hristea; de exemplu, forma chiară provenită din lat. clara a devenit chioară în construcția apă chioară, sub influența cuvântului mai cunoscut chior.
În sfârșit, unele împrumuturi nu rămân cum au fost moștenite sau împrumutate fie pentru că prezintă greutăți de pronunțare, fie pentru că se schimbă împrejurările în care sunt folosite, fie pentru că nu au fost înțelese cum trebuie. Cu cât un cuvânt trece prin mai multe limbi, cu atât are mai multe șanse de a suferi modificări. Al. Graur a atras atenția asupra faptului că multe dintre cuvintele împrumutate au fost, la rândul lor, împrumutate.
Pentru schimbările de înțeles nu avem reguli așa de stricte cum sunt cele referitoare la schimbările fonetice. Uneori trebuie cunoscute întâmplări, povești care explică schimbările de sens, unele atât de importante încât la „punctul de sosire” nu mai apare nimic din înțelesul inițial. Un caz bine cunoscut este cel al cuvântului românesc otuzbir „om violent, abuziv” sau „violență, abuz” din expresia vine (procedează) ca otuzbir sau cu otuzbiru, explicat de Al. Graur, în 1934, prin tc. otuz biru care înseamnă „31”, fără niciun argument care să justifice diferența de sens dintre „31” și „violent”. Ulterior, a aflat despre un document prin care consulul austriac de la Iași relata guvernului său, în 1821, că Regimentul 31 de ieniceri, zis și Otuzbir, s-a dedat, ca de obicei, la tulburări și dezordini în oraș!
Situația din limbile romanice
Cuvintele cu etimologie necunoscută sunt numeroase și în celelalte limbi romanice. Aduc ca exemplu limba franceză, care este cel mai bine studiată din acest punct de vedere. Are cel mai bun dicționar etimologic al unei limbi romanice, este vorba de opera lui W. von Wartburg, Französisches Etymologisches Wörterbuch (FEW). Eine Darstellung des galloromanischen Sprachschatzes, care apare din 1928 și a ajuns la 25 de volume; trei dintre acestea (volumele 21 – 23) conțin cuvintele cu etimologie necunoscută sau nesigură! Este interesant de semnalat că P. Guiraud a publicat un Dictionnaire des etymologies obscures (1982).
Cuvinte românești cu etimologie necunoscută
Nu există un inventar al lor, pentru că cele mai multe sunt diferite de la un dicționar la altul. Cel mai bun dicționar etimologic românesc (A. Ciorănescu, Dicționarul etimologic al limbii române, 2001, publicat inițial în spaniolă, 1958-1966) este uneori prudent și preferă să spună „etimologie necunoscută” sau „origine îndoielnică” chiar la cuvinte acceptate de lingviștii români ca având o origine destul de clară (de ex. baligă, baltă).
În DEX sunt multe cuvinte despre care se spune că au etimologie necunoscută, deși al te dicționare sau alți autori le explică. Acesta este motivul pentru care, în vocabularul reprezentativ al românei, care a fost în toc mit pornind de la DEX, există 70 de cuvinte cu etimologie incertă.
Iată o selecție reprezentativă: adică, a atârna, bade, baltă, ban, a băga, băiat, a bârfi, biet, bot, brânză, bubă, burduf, burtă, butuc, cârlig, a cicăli, ciocoi, a ciupi, creț, dar (conj.), de (conj.), a ghici, hoț, iar, a izbuti, înăuntru, jumătate, măi, mălai, mămăligă, mătură, a migăli, a mișca, moț, pălărie, petic, a pișca, pânză, pungă, puțin, a rezema, sas, a scotoci, sculă, a socoti, stăpân, stâncă, stuf, șold, taler, tâlhar, țeapă, a țipa, a ului, urmă, a zăpăci, a zburda, a zgâria, a zgudui, zmeură.
Unele, ca a băga, sunt considerate de mai mulți lingviști drept cuvinte cu etimologie necunoscută. Altele, ca a bârfi, bubă, a cicăli, a ciupi, pot fi creații expresive. Cuvinte de felul lui mălai sau mămăligă au fost explicate convingător de Andrei Avram, iar a socoti, de E. Coșeriu.
În loc de concluzii
O abordare generală a problemei este foarte complicat de realizat. Un tânăr coleg, Ștefan Colceriu, a făcut o remarcă interesantă: ca și în justiție, și aici sunt mai ușor de prezentat și de sistematizat probele pozitive decât cele negative. Îmi permit să adaug că unele „duhuri neostoite” din lingvistica românească (după expresia aceluiași coleg) consideră că termenii cu etimologia necunoscută trebuie să fie din traco-dacă (uneori chiar termeni pentru care s-au propus și etimologii latine).
La sfârșit, iată și o anecdotă. La un moment dat, unii tracomani au declarat că un cuvânt ultraregional (din zona Ploiești-Prahova), geamblac cu sensul „ansamblu format din mai mulți scripeți ficși și o ramă, montat pe turla unei sonde” (folosit în expresia Mă duc la geamblac), ar fi de origine dacă. Nu știau că la originea cuvântului era numele proprietarului unei firme petroliere care concesionase terenurile petrolifere din zonă, în perioada interbelică.