Analiza silabelor din limba romana.pdf - Profs.info.uaic.ro
Analiza silabelor din limba romana.pdf - Profs.info.uaic.ro
Analiza silabelor din limba romana.pdf - Profs.info.uaic.ro
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
DESPARTIREA AUTOMATA IN SILABE A CUVINTELOR DIN<br />
LIMBA ROMANA. APLICATII IN CONSTRUCTIA BAZEI DE<br />
DATE A SILABELOR LIMBII ROMANE<br />
cod AT217/2004<br />
Raport de cercetare<br />
Liviu P. Dinu<br />
University of Bucharest, Faculty of Mathematics<br />
Academiei 14, 70109, Bucharest, Romania<br />
l<st<strong>ro</strong>ng>din</st<strong>ro</strong>ng>u@funinf.cs.unibuc.<strong>ro</strong><br />
P<strong>ro</strong>iectul pe care l-am p<strong>ro</strong>pus si-a p<strong>ro</strong>pus sa realizeze un algoritm de despartire<br />
in silabe a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng> <st<strong>ro</strong>ng><strong>ro</strong>mana</st<strong>ro</strong>ng> si, cu ajutorul acestuia, sa inventariam<br />
toate silabele limbii <strong>ro</strong>mane. P<strong>ro</strong>blema s-a dovedit a fi extrem de interesanta si<br />
incitanta iar rezultatele obtinute in urma acestui p<strong>ro</strong>iect le vom sintetiza in cele<br />
ce urmeaza.<br />
Int<strong>ro</strong>ducere<br />
Silabei i s-a refuzat statutul de unitate structurala a limbii, fapt care a contrastat cu<br />
acceptarea acestui statut pentru fonem si morfem. In consecinta, nici modelarea<br />
matematica si computationala a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> nu a ajuns la complexitatea modelelor<br />
p<strong>ro</strong>puse pentru fonem si morfem. In deficit la intelegerea calitativa, logica, a<br />
p<strong>ro</strong>blemei silabei, cercetarea s-a orientat cu precadere spre aspectele cantitative,<br />
statistice. De exemplu, V. V. Ivanov atragea atentia asupra pozitiei mediane pe care<br />
silaba o are, intre fonem si morfem: daca numarul fonemelor este, in orice <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng>,<br />
cuprins intre 10 si 100 iar cel al morfemelor intre 1000 si 10000,<br />
numarul <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> se afla in intervalul <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng>tre 100 si 1000. Exista deci o armonie<br />
combinatoriala care urmeaza principiul minimului efort, aflat la baza multor legi<br />
cantitative care guverneaza <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng>jul uman. Dar detaliile acestui fenomen se lasa cu<br />
greu identificate iar cercetarea <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> ultimele decenii incearca sa sporeasca lumina in<br />
aceste directii.<br />
O cercetare rigu<strong>ro</strong>asa a structurii si a caracteristicilor silabei <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng>tr-o <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng> nu se poate<br />
face in lipsa unei baze de date complete a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> limbii respective. Existenta unei<br />
baze de date nu are insa doar un <strong>ro</strong>l pasiv, descriptiv, care sa ne dea o imagine cat<br />
mai completa despre o anumita <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng>; ea este folosita cu succes in aplicatii concrete,<br />
ca de exemplu analiza si sinteza de voce. De asemenea, investigatiile psiholingvistice<br />
asupra p<strong>ro</strong>ducerii vorbirii sunt mult ajutate de existenta unei baze de date<br />
a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng>. Tocmai de aceea ne-am p<strong>ro</strong>pus sa realizam o baza de date a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng><br />
limbii <strong>ro</strong>mane. De la inceput ne-am confruntat cu doua p<strong>ro</strong>bleme majore:<br />
1. Ce corpus sa folosim pentru a obtine respectiva baza de date? Evident,<br />
p<strong>ro</strong>blema reprezentativitatii bazei de date a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> limbii <strong>ro</strong>mane poate fi<br />
mult influentata de corpusul <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> care extragem respectivele silabe<br />
1
2. In ipoteza identificarii unui corpus reprezentativ, acesta va fi suficient de mare<br />
pentru a descuraja orice tentativa manuala de silabificare a lui. Apare asadar<br />
p<strong>ro</strong>blema identificarii unui segmentator in silabe automat.<br />
Solutia pe care am ales-o pentru prima p<strong>ro</strong>blema a fost aceea de a folosi ca date de<br />
intrare DOOM. Datorita acestei alegeri vom avea siguranta ca am silabificat toate<br />
cuvintele limbii <strong>ro</strong>mane (cel putin cele existente la momentul realizarii dictionarului<br />
amintit). Pe baza acestor silabificari am format baza de date la care ne vom referi in<br />
continuare. Desigur, ca orice alegere, si aceasta alegere are defectele ei: daca in<br />
ceea ce priveste tipul <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng>, avem siguranta prezentei tutu<strong>ro</strong>r <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> limbii<br />
<strong>ro</strong>mane in baza pe care am construit-o, pot exista unele obiectii in ceea ce priveste<br />
frecventa totala a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng>. Noi prezentam aici frecventa totala a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> asa cum<br />
se regaseste ea la nivelul tutu<strong>ro</strong>r cuvintelor limbii <strong>ro</strong>mane, fiecare cuvant avand<br />
aceeasi importanta si fiind luat in considerare o singura data pentru silabificare. Se<br />
poate obiecta aici ca <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng> <st<strong>ro</strong>ng><strong>ro</strong>mana</st<strong>ro</strong>ng>, ca toate celelalte limbi de altfel, are unele<br />
predilectii pentru anumite cuvinte care au pondere mai mare in <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng>. Aceasta<br />
pondere poate fi data, de exemplu, de capacitatea lor de a forma locutiuni, de<br />
polisemia lor, de frecventa lor in <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng> curenta, etc. (v. criteriile de stabilire a fondului<br />
lexical principal, M. Dinu, 1997). Acest lucru ar presupune ca datele de intrare sa fie<br />
formate <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng>tr-un corpus reprezentativ pentru <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng> vorbita, corpus care sa contina<br />
beletristica, lucrari stiintifice, drama, lucrari jurnalistice, etc. Faptul ca astazi nu avem<br />
un corpus reprezentativ si unanim acceptat pentru <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng> <st<strong>ro</strong>ng><strong>ro</strong>mana</st<strong>ro</strong>ng>, cat si dorinta de a<br />
avea o baza de date exhaustiva a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> limbii <strong>ro</strong>mane, co<strong>ro</strong>borata cu aparitia in<br />
format elect<strong>ro</strong>nic a intrarilor <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> DOOM a inclinat decisiv pentru a alege varianta<br />
prezenta in aceasta lucrare. Intr-o lucrare viitoare speram sa putem prezenta si<br />
rezultatele obtinute in urma analizei unui corpus al limbii vorbite; evident, va fi de un<br />
real interes sa comparam cele doua baze de date.<br />
In ceea ce priveste a doua p<strong>ro</strong>blema, principalul obstacol cu care ne-am confruntat a<br />
fost sa stabilim si sa adaptam cerintelor calculatorului regulile de despartire in silabe<br />
in lipsa cunoasterii accentului. Pentru a depasi acest impediment am impartit regulile<br />
de silabificare in doua mari clase: o prima clasa cuprindea regulile care asigurau<br />
taietura silabica a unui lant consonantic cu lungime cuprinsa intre 1 si 5 (lungimea<br />
maxima a unui lant consonantic in <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng> <st<strong>ro</strong>ng><strong>ro</strong>mana</st<strong>ro</strong>ng>). Aceste reguli au putut fi<br />
formalizate in totalitate pentru cerintele calculatorului si prin urmare algoritmul p<strong>ro</strong>pus<br />
desparte corect in silabe orice lant consonantic. Pentru a segmenta a doua clasa, neam<br />
bazat pe urmatoarea idee: un lant de vocale se segmenteaza in silabe in functie<br />
de grupurile de litere care il preced si il succed, respectiv.<br />
Am observat ca acelasi lant vocalic are comportari regulate in ceea ce priveste<br />
segmentarea silabica in functie de literele care il succed si cele care il preced. Am<br />
analizat astfel grupurile de vocale intalnite si am p<strong>ro</strong>pus reguli de segmentare<br />
silabica, reguli care au putut fi formalizate cerintelor calculatorului. Trebuie spus ca<br />
regulile p<strong>ro</strong>puse de noi nu asigura o segmentare corecta in p<strong>ro</strong>portie de 100%, si <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng><br />
aceasta cauza unele silabe pot fi silabe false (contribuind astfel la aparitia unor<br />
perturbari in ceea ce<br />
priveste frecventa <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng>). Totusi, aceste perturbari sunt acceptabile si nu<br />
influenteaza semnificativ baza de date pe care o p<strong>ro</strong>punem.<br />
2
<st<strong>ro</strong>ng>Analiza</st<strong>ro</strong>ng> Bazei de Date a Silabelor Limbii Romane<br />
Corpusul cu care am lucrat a fost DOOM (1982). Acesta contine un numar de<br />
Nwords = 74.276 de cuvinte. Cuvintele au fost despartite in silabe si acestea au fost<br />
int<strong>ro</strong>duse intr-o baza de date cu urmatoarele campuri:<br />
1. silaba p<strong>ro</strong>priu-zisa,<br />
2. lungimea silabei,<br />
3. structura consoana-vocala a silabei,<br />
4. frecventa de aparitie pe pozitia prima, mediana, respectiv finala,<br />
5. frecventa de aparitie ca silaba singulara,<br />
6. frecventa totala (i.e. suma frecventelor anterioare),<br />
7. posibilitatile de combinare ale silabei (i.e. care sunt silabele dupa care<br />
urmeaza si care sunt silabele care pot urma dupa ea).<br />
<st<strong>ro</strong>ng>Analiza</st<strong>ro</strong>ng> acestei baze de date ne permite sa facem o serie de caracterizari cantitative<br />
si descriptive ale <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> limbii <strong>ro</strong>mane.<br />
au fost identificate un numar de NStype = 6496 de silabe (silabe type) in <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng><br />
<st<strong>ro</strong>ng><strong>ro</strong>mana</st<strong>ro</strong>ng>.<br />
Numarul total de silabe (silabe token) a fost de NStoken = 273261. Obtinem<br />
de aici ca lungimea medie in silabe a cuvintelor este Lwordssyl =<br />
NStoken/Nwords = 273261/74276 = 3, 678.<br />
Cele 74276 de cuvinte au fost formate <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> Nletters = 632702 litere. Rezulta de<br />
aici ca lungimea medie in litere a cuvintelor este Lwordslet =Nletters/Nwords =<br />
632702/74276 = 8,518.<br />
Pentru a caracteriza lungimea medie in litere a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> luam in considerare<br />
doua cazuri:<br />
a) lungimea medie in litere a tutu<strong>ro</strong>r <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> (silabe token): Lsyltoken<br />
=Nletters/NStoken = 632706/273261 = 2,315<br />
b) Silabele type sunt formate <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng>tr-un total de NTletters = 24406. Asadar,<br />
lungimea medie in litere a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> type este Lsyltype =NTletters/NStype =<br />
24406/6496 = 3,757<br />
Au fost identificate un numar de 56 de tipuri consoana-vocala care intra in<br />
componenta <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng>. Si aici avem doua caracterizari a frecventei de aparitie a lor<br />
in functie de silabele type-token la care ne raportam:<br />
daca ne raportam la silabele type, cele mai frecvente tipuri silabice sunt: cvc<br />
(frecventa: 1448, p<strong>ro</strong>cent: 22%), ccvc (frecventa: 913, p<strong>ro</strong>cent: 14%), cvcc<br />
(frecventa: 705, p<strong>ro</strong>cent: 11%), cvcv (fecvrenta: 523, p<strong>ro</strong>ecent: 8%), cvvc<br />
(fecventa: 357, p<strong>ro</strong>ecent: 5%).<br />
daca ne raportam la silabele token, cele mai frecvente 7 tipuri silabice sunt<br />
urmatoarele: cv (fecventa: 146744, p<strong>ro</strong>cent: 53%), cvc (freventa: 48139, p<strong>ro</strong>cent:<br />
17%), v (frecventa: 23707, p<strong>ro</strong>cent: 8%), ccv (frecventa: 17418, p<strong>ro</strong>cent: 6%), vc<br />
(frecventa: 11048, p<strong>ro</strong>cent: 4%), cvv (frecventa: 6660, p<strong>ro</strong>cent: 3%), cvcc<br />
(frecventa: 5684, p<strong>ro</strong>cent: 2%). De remarcat faptul ca aceste 7 tipuri (i.e. 12% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng><br />
cele 56 de tipuri) acopera ap<strong>ro</strong>ape 95% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> totalul <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> existente!<br />
cele mai frecvente 50 de silabe (i.e. 0,7% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> numarul <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> NStype)<br />
totalizeaza 137662 aparitii, i.e. 50,03% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> totalul NStoken.<br />
cele mai frecvente 200 de silabe acopera 76% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> totalul NStoken, cele mai<br />
frecvente 400 acopera 85% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> totalul NStoken, iar cele mai frecvente 500 de<br />
3
silabe (7,7 % <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> totalul NStype) acopera 87% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> totalul NStoken. De remarcat<br />
ca dupa acest prag p<strong>ro</strong>centul de acoperire creste lent.<br />
primele 1200 de silabe in or<st<strong>ro</strong>ng>din</st<strong>ro</strong>ng>ea frecventei acopera 95% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> totalul <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng><br />
token.<br />
un numar de 2651 de silabe <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> totalul NStype de silabe apar o singura data<br />
(hapax legomena).<br />
un numar de 5060 de silabe (i.e. 78%) <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> totalul NStype de silabe apar de<br />
mai putin de 10 ori. Acestea insumeaza un numar total de 11960 silabe (4% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng><br />
totalul NStoken).<br />
in ceea ce priveste lungimea in litere a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng>, 158941 de silabe (58% <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng><br />
totalul <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> token) au lungimea 2; pe urmatoarele locuri se situeaza cele de<br />
lungime 3 (27%), 1 (9%), 4 (6%).<br />
In ceea ce priveste ent<strong>ro</strong>pia <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng>, am folosit urmatoarea formula: Hsyl =<br />
∑i=1, 6496 pi log2 pi ,<br />
unde pi este p<strong>ro</strong>babilitatea de aparitie a silabei aflate pe pozitia i in<br />
clasamentul obtinut <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> ordonarea descrescatoare a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> dupa frecventa<br />
lor totala. P<strong>ro</strong>babilitatea pi este calculata ca raportul <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng>tre<br />
frecventa totala a silabei aflate pe pozitia i si numarul total de aparitii, NStoken.<br />
Am obtinut astfel ca ent<strong>ro</strong>pia la nivelul silabei este: Hsyl = 8,621<br />
Am calculat ent<strong>ro</strong>pia silabei si raportandu-ne la tipurile CV <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> care sunt<br />
formate silabele. De aceasta data formula folosita a fost: Hcv = ∑i=1,56 pi log2 pi ,,<br />
unde pi este p<strong>ro</strong>babilitatea de aparitie a tipului silabei aflat pe pozitia i in or<st<strong>ro</strong>ng>din</st<strong>ro</strong>ng>ea<br />
frecventei de aparitie. Valoarea obtinuta a fost: Hcv = 2,30, o valoare<br />
comparabila cu valorile obtinute de Edmond Nicolau sau Alexandra Roceric<br />
(valoarea acestora era egala cu 2,63).<br />
Apecte generative<br />
Un alt rezultat al p<strong>ro</strong>iectului nostru a fost p<strong>ro</strong>iectarea unui model generativ al silabei<br />
si p<strong>ro</strong>punerea unui automat care sa realizeze silabificarea cuvintelor. Modelul<br />
generativ a plecat de la observatia prezentata in sectiunea anterioara, conform<br />
careia locul in care se face silabificarea unui cuvant depinde de o segmentare<br />
simultana in trei parti a cuvantului respectiv, fiecare parte contribuind la identificarea<br />
corecta a locului in care se face silabificarea. Aceasta observatie ne-a condus la<br />
utilizarea gramaticilor contextuale totale in investigarea silabificarii cuvintelor si a<br />
p<strong>ro</strong>punerii unui model generativ al silabei bazat pe tehnicile gramaticilor contextuale.<br />
Plecand de la observatia ca silabificarea este influentata doar de anumite parti ale<br />
celor trei subcuvinte, am int<strong>ro</strong>dus gramaticile contextuale silabice; utilizand definitia<br />
acestor gramatici, am reusit sa adaptam automatele go-th<strong>ro</strong>ugh la silabificarea<br />
cuvintelor limbii <strong>ro</strong>mane. Am obtinut cu aceasta ocazie o extindere a ariei de<br />
aplicabilitate a acestor automate.<br />
Totusi, aceasta modelare nu ne-a multumit intru totul si am incercat o imbunatatire a<br />
sa. Principala p<strong>ro</strong>blema a noastra a fost aceea ca tehnica de silabificare era in<br />
continuare una secventiala; noi credem ca creierul uman are suficenta putere de<br />
calcul sa realizeze o segmentare paralela a cuvintelor, lucru ce ar putea contribui la<br />
reducerea timpului de p<strong>ro</strong>ducere a vorbirii. Plecand de la aceasta idee, bazandu-ne<br />
pe modelele realizate anterior, am int<strong>ro</strong>dus o extindere paralela a gramaticilor de<br />
insertie (gramaticile de insertie sunt un model dual al gramaticilor contextuale si au<br />
fost int<strong>ro</strong>duse de catre Galiushov in in 1982); utilizand derivarea paralela maximala a<br />
4
acestor gramatici am obtinut un model paralele de silabificare a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> limbii<br />
<strong>ro</strong>mane. Acest model s-a dovedit a fi extrem de interesant, dac ar fi sa amintim doar<br />
faptul ca familia <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng>jelor generate in acest mod este strict inclusa in familia<br />
<st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng>jelor dependente de context si incomparabila cu cele independente de context.<br />
Comparatia acestei familii de <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng>je cu alte familii de <st<strong>ro</strong>ng>limba</st<strong>ro</strong>ng>je formale se afla in lucru.<br />
Concluzii<br />
In acest rezumat am prezentat unele observatii de natura cantitativa si calitativa<br />
facute in urma studierii primei baze de date a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> limbii <strong>ro</strong>mane, baza rezultata<br />
in urma realizarii p<strong>ro</strong>iectului DESPARTIREA AUTOMATA IN SILABE A<br />
CUVINTELOR DIN LIMBA ROMANA. APLICATII IN CONSTRUCTIA BAZEI DE<br />
DATE A SILABELOR LIMBII ROMAN, cod AT217/2004. Putem spune ca rezultatele<br />
pe care le-am obtinut si prezentat aici concorda in mare masura cu rezultate similare<br />
obtinute in alte limbi. Avem aici in vedere limbi diverse, cum ar fi franceza, olandeza,<br />
engleza, dar si coreana. Legea lui Zipf si legea lui Menzerath sunt verificate de catre<br />
silabele limbii <strong>ro</strong>mane. O cercetare ulterioara va avea in vedere construirea si analiza<br />
unei baze de date construita in urma despartirii unui corpus format <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> texte<br />
excerptate <st<strong>ro</strong>ng>din</st<strong>ro</strong>ng> domenii diverse. Va fi interesant de analizat daca datele statistice<br />
obtinute aici se vor pastra sau vor suferi unele modificari. Acestea, ca si alte studii pe<br />
care le avem in vedere (cum ar fi analiza separata a anumitor parti de vorbire,<br />
capacitatile de combinare intre ele a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng>, etc.) vor contribui la o mai buna<br />
descriere a limbii <strong>ro</strong>mane dar vor aduce un plus de cunoastere si in domenii conexe,<br />
cum ar fi analiza si sinteza de voce sau stiintele cognitive.<br />
Bibliografie:<br />
1. Anca Dinu, Liviu P. Dinu. On the Syllabic Similarities of Romance<br />
Languages. Lecture Notes in Computer Science, vol.3406, 2005, 785-788,<br />
Springer-Verlag Berlin, ISSN: 0302-9743<br />
2. Liviu P. Dinu, Anca Dinu A parallel app<strong>ro</strong>ach to syllabification. Lecture<br />
Notes in Computer Science, vol. 3406, 2005, 83-89, Springer-Verlag Berlin,<br />
ISSN: 0302-9743<br />
3. Liviu P. Dinu, Rank distance with applications in similarities of languages,<br />
Fundamenta Informaticae, vol 64, 2005, pp 135-149, ISSN: 0169-2968<br />
4. Liviu P. Dinu, On the data base of Romanian Syllables, (trimis spre<br />
publicare)<br />
5. Liviu P. Dinu, Baza de date a <st<strong>ro</strong>ng>silabelor</st<strong>ro</strong>ng> limbii <strong>ro</strong>mane. Aspecte matematice si<br />
computationale. (manuscris)<br />
6. Liviu P. Dinu, Radu Gramatovici, Florin Manea. On the syllabification via<br />
go-th<strong>ro</strong>ugh Automata (trimis spre publicare).<br />
5