13.04.2013 Views

Analiza silabelor din limba romana.pdf - Profs.info.uaic.ro

Analiza silabelor din limba romana.pdf - Profs.info.uaic.ro

Analiza silabelor din limba romana.pdf - Profs.info.uaic.ro

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

DESPARTIREA AUTOMATA IN SILABE A CUVINTELOR DIN<br />

LIMBA ROMANA. APLICATII IN CONSTRUCTIA BAZEI DE<br />

DATE A SILABELOR LIMBII ROMANE<br />

cod AT217/2004<br />

Raport de cercetare<br />

Liviu P. Dinu<br />

University of Bucharest, Faculty of Mathematics<br />

Academiei 14, 70109, Bucharest, Romania<br />

l<st<strong>ro</strong>ng>din</st<strong>ro</strong>ng>u@funinf.cs.unibuc.<strong>ro</strong><br />

P<strong>ro</strong>iectul pe care l-am p<strong>ro</strong>pus si-a p<strong>ro</strong>pus sa realizeze un algoritm de despartire<br />

in silabe a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng> <st<strong>ro</strong>ng><strong>ro</strong>mana</st<strong>ro</strong>ng> si, cu ajutorul acestuia, sa inventariam<br />

toate silabele limbii <strong>ro</strong>mane. P<strong>ro</strong>blema s-a dovedit a fi extrem de interesanta si<br />

incitanta iar rezultatele obtinute in urma acestui p<strong>ro</strong>iect le vom sintetiza in cele<br />

ce urmeaza.<br />

Int<strong>ro</strong>ducere<br />

Silabei i s-a refuzat statutul de unitate structurala a limbii, fapt care a contrastat cu<br />

acceptarea acestui statut pentru fonem si morfem. In consecinta, nici modelarea<br />

matematica si computationala a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> nu a ajuns la complexitatea modelelor<br />

p<strong>ro</strong>puse pentru fonem si morfem. In deficit la intelegerea calitativa, logica, a<br />

p<strong>ro</strong>blemei silabei, cercetarea s-a orientat cu precadere spre aspectele cantitative,<br />

statistice. De exemplu, V. V. Ivanov atragea atentia asupra pozitiei mediane pe care<br />

silaba o are, intre fonem si morfem: daca numarul fonemelor este, in orice <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng>,<br />

cuprins intre 10 si 100 iar cel al morfemelor intre 1000 si 10000,<br />

numarul <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> se afla in intervalul <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng>tre 100 si 1000. Exista deci o armonie<br />

combinatoriala care urmeaza principiul minimului efort, aflat la baza multor legi<br />

cantitative care guverneaza <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng>jul uman. Dar detaliile acestui fenomen se lasa cu<br />

greu identificate iar cercetarea <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> ultimele decenii incearca sa sporeasca lumina in<br />

aceste directii.<br />

O cercetare rigu<strong>ro</strong>asa a structurii si a caracteristicilor silabei <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng>tr-o <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng> nu se poate<br />

face in lipsa unei baze de date complete a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> limbii respective. Existenta unei<br />

baze de date nu are insa doar un <strong>ro</strong>l pasiv, descriptiv, care sa ne dea o imagine cat<br />

mai completa despre o anumita <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng>; ea este folosita cu succes in aplicatii concrete,<br />

ca de exemplu analiza si sinteza de voce. De asemenea, investigatiile psiholingvistice<br />

asupra p<strong>ro</strong>ducerii vorbirii sunt mult ajutate de existenta unei baze de date<br />

a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng>. Tocmai de aceea ne-am p<strong>ro</strong>pus sa realizam o baza de date a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng><br />

limbii <strong>ro</strong>mane. De la inceput ne-am confruntat cu doua p<strong>ro</strong>bleme majore:<br />

1. Ce corpus sa folosim pentru a obtine respectiva baza de date? Evident,<br />

p<strong>ro</strong>blema reprezentativitatii bazei de date a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> limbii <strong>ro</strong>mane poate fi<br />

mult influentata de corpusul <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> care extragem respectivele silabe<br />

1


2. In ipoteza identificarii unui corpus reprezentativ, acesta va fi suficient de mare<br />

pentru a descuraja orice tentativa manuala de silabificare a lui. Apare asadar<br />

p<strong>ro</strong>blema identificarii unui segmentator in silabe automat.<br />

Solutia pe care am ales-o pentru prima p<strong>ro</strong>blema a fost aceea de a folosi ca date de<br />

intrare DOOM. Datorita acestei alegeri vom avea siguranta ca am silabificat toate<br />

cuvintele limbii <strong>ro</strong>mane (cel putin cele existente la momentul realizarii dictionarului<br />

amintit). Pe baza acestor silabificari am format baza de date la care ne vom referi in<br />

continuare. Desigur, ca orice alegere, si aceasta alegere are defectele ei: daca in<br />

ceea ce priveste tipul <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng>, avem siguranta prezentei tutu<strong>ro</strong>r <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> limbii<br />

<strong>ro</strong>mane in baza pe care am construit-o, pot exista unele obiectii in ceea ce priveste<br />

frecventa totala a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng>. Noi prezentam aici frecventa totala a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> asa cum<br />

se regaseste ea la nivelul tutu<strong>ro</strong>r cuvintelor limbii <strong>ro</strong>mane, fiecare cuvant avand<br />

aceeasi importanta si fiind luat in considerare o singura data pentru silabificare. Se<br />

poate obiecta aici ca <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng> <st<strong>ro</strong>ng><strong>ro</strong>mana</st<strong>ro</strong>ng>, ca toate celelalte limbi de altfel, are unele<br />

predilectii pentru anumite cuvinte care au pondere mai mare in <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng>. Aceasta<br />

pondere poate fi data, de exemplu, de capacitatea lor de a forma locutiuni, de<br />

polisemia lor, de frecventa lor in <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng> curenta, etc. (v. criteriile de stabilire a fondului<br />

lexical principal, M. Dinu, 1997). Acest lucru ar presupune ca datele de intrare sa fie<br />

formate <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng>tr-un corpus reprezentativ pentru <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng> vorbita, corpus care sa contina<br />

beletristica, lucrari stiintifice, drama, lucrari jurnalistice, etc. Faptul ca astazi nu avem<br />

un corpus reprezentativ si unanim acceptat pentru <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng> <st<strong>ro</strong>ng><strong>ro</strong>mana</st<strong>ro</strong>ng>, cat si dorinta de a<br />

avea o baza de date exhaustiva a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> limbii <strong>ro</strong>mane, co<strong>ro</strong>borata cu aparitia in<br />

format elect<strong>ro</strong>nic a intrarilor <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> DOOM a inclinat decisiv pentru a alege varianta<br />

prezenta in aceasta lucrare. Intr-o lucrare viitoare speram sa putem prezenta si<br />

rezultatele obtinute in urma analizei unui corpus al limbii vorbite; evident, va fi de un<br />

real interes sa comparam cele doua baze de date.<br />

In ceea ce priveste a doua p<strong>ro</strong>blema, principalul obstacol cu care ne-am confruntat a<br />

fost sa stabilim si sa adaptam cerintelor calculatorului regulile de despartire in silabe<br />

in lipsa cunoasterii accentului. Pentru a depasi acest impediment am impartit regulile<br />

de silabificare in doua mari clase: o prima clasa cuprindea regulile care asigurau<br />

taietura silabica a unui lant consonantic cu lungime cuprinsa intre 1 si 5 (lungimea<br />

maxima a unui lant consonantic in <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng> <st<strong>ro</strong>ng><strong>ro</strong>mana</st<strong>ro</strong>ng>). Aceste reguli au putut fi<br />

formalizate in totalitate pentru cerintele calculatorului si prin urmare algoritmul p<strong>ro</strong>pus<br />

desparte corect in silabe orice lant consonantic. Pentru a segmenta a doua clasa, neam<br />

bazat pe urmatoarea idee: un lant de vocale se segmenteaza in silabe in functie<br />

de grupurile de litere care il preced si il succed, respectiv.<br />

Am observat ca acelasi lant vocalic are comportari regulate in ceea ce priveste<br />

segmentarea silabica in functie de literele care il succed si cele care il preced. Am<br />

analizat astfel grupurile de vocale intalnite si am p<strong>ro</strong>pus reguli de segmentare<br />

silabica, reguli care au putut fi formalizate cerintelor calculatorului. Trebuie spus ca<br />

regulile p<strong>ro</strong>puse de noi nu asigura o segmentare corecta in p<strong>ro</strong>portie de 100%, si <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng><br />

aceasta cauza unele silabe pot fi silabe false (contribuind astfel la aparitia unor<br />

perturbari in ceea ce<br />

priveste frecventa <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng>). Totusi, aceste perturbari sunt acceptabile si nu<br />

influenteaza semnificativ baza de date pe care o p<strong>ro</strong>punem.<br />

2


<st<strong>ro</strong>ng>Analiza</st<strong>ro</strong>ng> Bazei de Date a Silabelor Limbii Romane<br />

Corpusul cu care am lucrat a fost DOOM (1982). Acesta contine un numar de<br />

Nwords = 74.276 de cuvinte. Cuvintele au fost despartite in silabe si acestea au fost<br />

int<strong>ro</strong>duse intr-o baza de date cu urmatoarele campuri:<br />

1. silaba p<strong>ro</strong>priu-zisa,<br />

2. lungimea silabei,<br />

3. structura consoana-vocala a silabei,<br />

4. frecventa de aparitie pe pozitia prima, mediana, respectiv finala,<br />

5. frecventa de aparitie ca silaba singulara,<br />

6. frecventa totala (i.e. suma frecventelor anterioare),<br />

7. posibilitatile de combinare ale silabei (i.e. care sunt silabele dupa care<br />

urmeaza si care sunt silabele care pot urma dupa ea).<br />

<st<strong>ro</strong>ng>Analiza</st<strong>ro</strong>ng> acestei baze de date ne permite sa facem o serie de caracterizari cantitative<br />

si descriptive ale <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> limbii <strong>ro</strong>mane.<br />

au fost identificate un numar de NStype = 6496 de silabe (silabe type) in <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng><br />

<st<strong>ro</strong>ng><strong>ro</strong>mana</st<strong>ro</strong>ng>.<br />

Numarul total de silabe (silabe token) a fost de NStoken = 273261. Obtinem<br />

de aici ca lungimea medie in silabe a cuvintelor este Lwordssyl =<br />

NStoken/Nwords = 273261/74276 = 3, 678.<br />

Cele 74276 de cuvinte au fost formate <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> Nletters = 632702 litere. Rezulta de<br />

aici ca lungimea medie in litere a cuvintelor este Lwordslet =Nletters/Nwords =<br />

632702/74276 = 8,518.<br />

Pentru a caracteriza lungimea medie in litere a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> luam in considerare<br />

doua cazuri:<br />

a) lungimea medie in litere a tutu<strong>ro</strong>r <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> (silabe token): Lsyltoken<br />

=Nletters/NStoken = 632706/273261 = 2,315<br />

b) Silabele type sunt formate <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng>tr-un total de NTletters = 24406. Asadar,<br />

lungimea medie in litere a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> type este Lsyltype =NTletters/NStype =<br />

24406/6496 = 3,757<br />

Au fost identificate un numar de 56 de tipuri consoana-vocala care intra in<br />

componenta <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng>. Si aici avem doua caracterizari a frecventei de aparitie a lor<br />

in functie de silabele type-token la care ne raportam:<br />

daca ne raportam la silabele type, cele mai frecvente tipuri silabice sunt: cvc<br />

(frecventa: 1448, p<strong>ro</strong>cent: 22%), ccvc (frecventa: 913, p<strong>ro</strong>cent: 14%), cvcc<br />

(frecventa: 705, p<strong>ro</strong>cent: 11%), cvcv (fecvrenta: 523, p<strong>ro</strong>ecent: 8%), cvvc<br />

(fecventa: 357, p<strong>ro</strong>ecent: 5%).<br />

daca ne raportam la silabele token, cele mai frecvente 7 tipuri silabice sunt<br />

urmatoarele: cv (fecventa: 146744, p<strong>ro</strong>cent: 53%), cvc (freventa: 48139, p<strong>ro</strong>cent:<br />

17%), v (frecventa: 23707, p<strong>ro</strong>cent: 8%), ccv (frecventa: 17418, p<strong>ro</strong>cent: 6%), vc<br />

(frecventa: 11048, p<strong>ro</strong>cent: 4%), cvv (frecventa: 6660, p<strong>ro</strong>cent: 3%), cvcc<br />

(frecventa: 5684, p<strong>ro</strong>cent: 2%). De remarcat faptul ca aceste 7 tipuri (i.e. 12% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng><br />

cele 56 de tipuri) acopera ap<strong>ro</strong>ape 95% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> totalul <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> existente!<br />

cele mai frecvente 50 de silabe (i.e. 0,7% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> numarul <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> NStype)<br />

totalizeaza 137662 aparitii, i.e. 50,03% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> totalul NStoken.<br />

cele mai frecvente 200 de silabe acopera 76% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> totalul NStoken, cele mai<br />

frecvente 400 acopera 85% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> totalul NStoken, iar cele mai frecvente 500 de<br />

3


silabe (7,7 % <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> totalul NStype) acopera 87% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> totalul NStoken. De remarcat<br />

ca dupa acest prag p<strong>ro</strong>centul de acoperire creste lent.<br />

primele 1200 de silabe in or<st<strong>ro</strong>ng>din</st<strong>ro</strong>ng>ea frecventei acopera 95% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> totalul <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng><br />

token.<br />

un numar de 2651 de silabe <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> totalul NStype de silabe apar o singura data<br />

(hapax legomena).<br />

un numar de 5060 de silabe (i.e. 78%) <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> totalul NStype de silabe apar de<br />

mai putin de 10 ori. Acestea insumeaza un numar total de 11960 silabe (4% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng><br />

totalul NStoken).<br />

in ceea ce priveste lungimea in litere a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng>, 158941 de silabe (58% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng><br />

totalul <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> token) au lungimea 2; pe urmatoarele locuri se situeaza cele de<br />

lungime 3 (27%), 1 (9%), 4 (6%).<br />

In ceea ce priveste ent<strong>ro</strong>pia <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng>, am folosit urmatoarea formula: Hsyl =<br />

∑i=1, 6496 pi log2 pi ,<br />

unde pi este p<strong>ro</strong>babilitatea de aparitie a silabei aflate pe pozitia i in<br />

clasamentul obtinut <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> ordonarea descrescatoare a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> dupa frecventa<br />

lor totala. P<strong>ro</strong>babilitatea pi este calculata ca raportul <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng>tre<br />

frecventa totala a silabei aflate pe pozitia i si numarul total de aparitii, NStoken.<br />

Am obtinut astfel ca ent<strong>ro</strong>pia la nivelul silabei este: Hsyl = 8,621<br />

Am calculat ent<strong>ro</strong>pia silabei si raportandu-ne la tipurile CV <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> care sunt<br />

formate silabele. De aceasta data formula folosita a fost: Hcv = ∑i=1,56 pi log2 pi ,,<br />

unde pi este p<strong>ro</strong>babilitatea de aparitie a tipului silabei aflat pe pozitia i in or<st<strong>ro</strong>ng>din</st<strong>ro</strong>ng>ea<br />

frecventei de aparitie. Valoarea obtinuta a fost: Hcv = 2,30, o valoare<br />

comparabila cu valorile obtinute de Edmond Nicolau sau Alexandra Roceric<br />

(valoarea acestora era egala cu 2,63).<br />

Apecte generative<br />

Un alt rezultat al p<strong>ro</strong>iectului nostru a fost p<strong>ro</strong>iectarea unui model generativ al silabei<br />

si p<strong>ro</strong>punerea unui automat care sa realizeze silabificarea cuvintelor. Modelul<br />

generativ a plecat de la observatia prezentata in sectiunea anterioara, conform<br />

careia locul in care se face silabificarea unui cuvant depinde de o segmentare<br />

simultana in trei parti a cuvantului respectiv, fiecare parte contribuind la identificarea<br />

corecta a locului in care se face silabificarea. Aceasta observatie ne-a condus la<br />

utilizarea gramaticilor contextuale totale in investigarea silabificarii cuvintelor si a<br />

p<strong>ro</strong>punerii unui model generativ al silabei bazat pe tehnicile gramaticilor contextuale.<br />

Plecand de la observatia ca silabificarea este influentata doar de anumite parti ale<br />

celor trei subcuvinte, am int<strong>ro</strong>dus gramaticile contextuale silabice; utilizand definitia<br />

acestor gramatici, am reusit sa adaptam automatele go-th<strong>ro</strong>ugh la silabificarea<br />

cuvintelor limbii <strong>ro</strong>mane. Am obtinut cu aceasta ocazie o extindere a ariei de<br />

aplicabilitate a acestor automate.<br />

Totusi, aceasta modelare nu ne-a multumit intru totul si am incercat o imbunatatire a<br />

sa. Principala p<strong>ro</strong>blema a noastra a fost aceea ca tehnica de silabificare era in<br />

continuare una secventiala; noi credem ca creierul uman are suficenta putere de<br />

calcul sa realizeze o segmentare paralela a cuvintelor, lucru ce ar putea contribui la<br />

reducerea timpului de p<strong>ro</strong>ducere a vorbirii. Plecand de la aceasta idee, bazandu-ne<br />

pe modelele realizate anterior, am int<strong>ro</strong>dus o extindere paralela a gramaticilor de<br />

insertie (gramaticile de insertie sunt un model dual al gramaticilor contextuale si au<br />

fost int<strong>ro</strong>duse de catre Galiushov in in 1982); utilizand derivarea paralela maximala a<br />

4


acestor gramatici am obtinut un model paralele de silabificare a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> limbii<br />

<strong>ro</strong>mane. Acest model s-a dovedit a fi extrem de interesant, dac ar fi sa amintim doar<br />

faptul ca familia <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng>jelor generate in acest mod este strict inclusa in familia<br />

<st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng>jelor dependente de context si incomparabila cu cele independente de context.<br />

Comparatia acestei familii de <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng>je cu alte familii de <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng>je formale se afla in lucru.<br />

Concluzii<br />

In acest rezumat am prezentat unele observatii de natura cantitativa si calitativa<br />

facute in urma studierii primei baze de date a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> limbii <strong>ro</strong>mane, baza rezultata<br />

in urma realizarii p<strong>ro</strong>iectului DESPARTIREA AUTOMATA IN SILABE A<br />

CUVINTELOR DIN LIMBA ROMANA. APLICATII IN CONSTRUCTIA BAZEI DE<br />

DATE A SILABELOR LIMBII ROMAN, cod AT217/2004. Putem spune ca rezultatele<br />

pe care le-am obtinut si prezentat aici concorda in mare masura cu rezultate similare<br />

obtinute in alte limbi. Avem aici in vedere limbi diverse, cum ar fi franceza, olandeza,<br />

engleza, dar si coreana. Legea lui Zipf si legea lui Menzerath sunt verificate de catre<br />

silabele limbii <strong>ro</strong>mane. O cercetare ulterioara va avea in vedere construirea si analiza<br />

unei baze de date construita in urma despartirii unui corpus format <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> texte<br />

excerptate <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> domenii diverse. Va fi interesant de analizat daca datele statistice<br />

obtinute aici se vor pastra sau vor suferi unele modificari. Acestea, ca si alte studii pe<br />

care le avem in vedere (cum ar fi analiza separata a anumitor parti de vorbire,<br />

capacitatile de combinare intre ele a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng>, etc.) vor contribui la o mai buna<br />

descriere a limbii <strong>ro</strong>mane dar vor aduce un plus de cunoastere si in domenii conexe,<br />

cum ar fi analiza si sinteza de voce sau stiintele cognitive.<br />

Bibliografie:<br />

1. Anca Dinu, Liviu P. Dinu. On the Syllabic Similarities of Romance<br />

Languages. Lecture Notes in Computer Science, vol.3406, 2005, 785-788,<br />

Springer-Verlag Berlin, ISSN: 0302-9743<br />

2. Liviu P. Dinu, Anca Dinu A parallel app<strong>ro</strong>ach to syllabification. Lecture<br />

Notes in Computer Science, vol. 3406, 2005, 83-89, Springer-Verlag Berlin,<br />

ISSN: 0302-9743<br />

3. Liviu P. Dinu, Rank distance with applications in similarities of languages,<br />

Fundamenta Informaticae, vol 64, 2005, pp 135-149, ISSN: 0169-2968<br />

4. Liviu P. Dinu, On the data base of Romanian Syllables, (trimis spre<br />

publicare)<br />

5. Liviu P. Dinu, Baza de date a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> limbii <strong>ro</strong>mane. Aspecte matematice si<br />

computationale. (manuscris)<br />

6. Liviu P. Dinu, Radu Gramatovici, Florin Manea. On the syllabification via<br />

go-th<strong>ro</strong>ugh Automata (trimis spre publicare).<br />

5

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!