07.05.2014 Views

Teme de licenta 2012 - Universitatea Alexandru Ioan Cuza

Teme de licenta 2012 - Universitatea Alexandru Ioan Cuza

Teme de licenta 2012 - Universitatea Alexandru Ioan Cuza

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

A5. Integrarea morfologiei flexionare româneşti în browserele eDTLR: in<strong>de</strong>xarea în <br />

surse a variantelor lexicale (forme vechi ale cuvintelor) <br />

În cadrul colectivului FII-­‐NLP s-­‐a <strong>de</strong>zvoltat un program capabil să flexioneze orice <br />

cuvânt al limbii române. Există în <strong>de</strong>rulare un proiect care adaugă la funcţționalitatea <br />

menţționată şi capacitatea <strong>de</strong> generare a formelor vechi ale cuvintelor româneşti. <br />

Marele dicţționar tezaur (eDTLR) inclu<strong>de</strong> extrem <strong>de</strong> multe variante <strong>de</strong> cuvinte <br />

româneşti care au o răspândire regională ori constituie forme arhaice. Se doreşte ca <br />

accesul în dicţționar să se poată face prin orice formă flexionată, indiferent dacă ea <br />

este una aflată în uzul curent al limbii sau este una <strong>de</strong> circulaţție restrânsă. Aceasta <br />

presupune reconstituirea formei <strong>de</strong> bază plecând <strong>de</strong> la forma flexionată şi corelarea <br />

acesteia cu intrarea corespunzătoare din eDTLR. Proiectul va urmări realizarea <strong>de</strong> <br />

algoritmi <strong>de</strong> <strong>de</strong>tectare a similarităţții între cuvinte, urmat <strong>de</strong> aplicarea lor la regăsirea <br />

paradigmelor complete ale cuvintelor din eDTLR. <br />

Bibliografie: Cosman, 2001; Cristea&Răschip, 2008. <br />

Îndrumare: Dan Cristea <br />

A6. Mo<strong>de</strong>l <strong>de</strong> centru <strong>de</strong> prelucrări lingvistice <br />

Se va continua un proiect finalizat în 2010 (Florin Serediuc, <br />

florin.serediuc@info.uaic.ro), care-­‐şi propunea configurarea, din punct <strong>de</strong> ve<strong>de</strong>re <br />

tehnic şi informaţțional, a un centru capabil să prelucreze mulţținea textelor <br />

româneşti care se tipăresc zilnic în România. Se presupune că o lege obligă editurile <br />

să <strong>de</strong>pună o copie electronică a tuturor tipăriturilor, înainte <strong>de</strong> publicarea propriu-­zisă.<br />

<br />

Proiectul ar trebui să implementeze tehnici <strong>de</strong> prelucrare on-­‐line a textelor <br />

româneşti: <br />

-­‐ adnotări: formate XML (v. TEI-­‐P5), hea<strong>de</strong>r-­‐e în care trebuie îmbrăcate <br />

documentele; <br />

-­‐ prelucrări cu <strong>de</strong>stinaţție <strong>de</strong> cercetare: <strong>de</strong>terminarea formei lemă a cuvintelor, <br />

inventarul lemelor, i<strong>de</strong>ntificarea cuvintelor străine, i<strong>de</strong>ntificarea sensurilor cuvintelor <br />

în context, statistici, tipuri <strong>de</strong> acces în colecţție; <br />

-­‐ mo<strong>de</strong>le <strong>de</strong> business: utilizări comerciale în beneficiul contribuabililor. <br />

Bibliografie: Cristea, 2010. <br />

Îndrumare: Dan Cristea <br />

Pot fi formulate și alte lucrări din zona prelucrării limbajului natural și al <br />

inteligenţței artificiale.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!