13.05.2013 Views

Método general de la lematización con una gramática mínima y un ...

Método general de la lematización con una gramática mínima y un ...

Método general de la lematización con una gramática mínima y un ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

información gramatical: <strong>la</strong> categoría <strong>de</strong> partes <strong>de</strong> oración.<br />

2.2. Lista <strong>de</strong> Lema-Formas<br />

Una <strong>de</strong> <strong>la</strong>s características com<strong>un</strong>es <strong>de</strong> <strong>la</strong>s lenguas indoeuropeas es su morfología verbal<br />

basada en <strong>la</strong> <strong>con</strong>jugación, flexión <strong>de</strong> <strong>la</strong>s formas terminales. Es <strong>de</strong>cir, cada forma verbal<br />

está <strong>con</strong>stituida básicamente por <strong><strong>un</strong>a</strong> parte anterior invariable (Raíz) y otra posterior<br />

variable (Terminación). Es <strong><strong>un</strong>a</strong> reg<strong>la</strong> morfológica sencil<strong>la</strong>, aparte <strong>de</strong> los casos <strong>de</strong> cambios<br />

<strong>de</strong> radicales, por ejemplo, hago, haces, hice, hecho, etc. <strong>de</strong>l verbo español hacer; o faig,<br />

fas, fa, fem feu, fan <strong>de</strong>l catalán fer; y <strong>de</strong> supletismo, voy, vas, va ... <strong>de</strong>l verbo español ir y<br />

vaig, vas, va, anem, aneu, van <strong>de</strong>l verbo catalán anar. Nuestra i<strong>de</strong>a es preparar<br />

provisionalmente <strong><strong>un</strong>a</strong> bolsa <strong>de</strong> infinitivos más frecuentes y, a partir <strong>de</strong> esta bolsa, asignar<br />

automáticamente <strong>un</strong> lema a <strong>la</strong>s nuevas formas que aparecen en el texto eligiendo <strong>la</strong> forma<br />

más parecida posible. Por ejemplo, <strong>la</strong> voz abeuren <strong>de</strong>be correspon<strong>de</strong>r al lema abeurar<br />

„abrevar‟ por tener <strong><strong>un</strong>a</strong> parte común abeur.<br />

Con tal <strong>de</strong> que esté preparada <strong><strong>un</strong>a</strong> buena lista <strong>de</strong> correspon<strong>de</strong>ncia Raíz - Lema, en<br />

<strong>general</strong> <strong>la</strong> mayoría <strong>de</strong> <strong>la</strong>s veces <strong><strong>un</strong>a</strong> forma se i<strong>de</strong>ntifica <strong>con</strong> su lema correcto. Ahora bien,<br />

nuestro trabajo manual ya no es asignar <strong>un</strong>o por <strong>un</strong>o el lema correspondiente a <strong>la</strong> nueva<br />

forma que aparece en el nuevo texto, sino simplemente registrar <strong>la</strong> nueva forma <strong>de</strong> <strong>la</strong> raíz<br />

en <strong>la</strong> lista <strong>de</strong> raíces:<br />

Fig. 1. Lista <strong>de</strong> Lema-Formas<br />

La Figura 2 muestra <strong><strong>un</strong>a</strong> parte <strong>de</strong>l resultado <strong>de</strong>l análisis <strong>de</strong>l Texto:<br />

5

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!