13.05.2013 Views

Método general de la lematización con una gramática mínima y un ...

Método general de la lematización con una gramática mínima y un ...

Método general de la lematización con una gramática mínima y un ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Fig. 2. Lista <strong>de</strong>l resultado<br />

don<strong>de</strong> observamos que amichs se ha i<strong>de</strong>ntificado correctamente <strong>con</strong> el lema<br />

amich, 5 a<strong>un</strong>que <strong>la</strong> forma plural no figure en <strong>la</strong> lista. Las pa<strong>la</strong>bras que no han sido<br />

analizadas por falta <strong>de</strong> los datos <strong>de</strong>l Diccionario aparecen <strong>con</strong> el signo <strong>de</strong> arroba (@), lo<br />

cual quiere <strong>de</strong>cir que se <strong>de</strong>bería asignar <strong>la</strong> categoría y lema en el Diccionario. El caso <strong>de</strong><br />

“borlins”, asignado equivocadamente <strong>con</strong> “A_bo”, se <strong>de</strong>be a que el programa ha buscado<br />

el adjetivo “bo” como último recurso. Con <strong>la</strong> inclusión <strong>de</strong> borlin en el Diccionario se<br />

resuelve este problema. 6<br />

Nuestro programa también pue<strong>de</strong> ofrecer <strong>un</strong> texto <strong>de</strong> resultado. En este caso nos<br />

limitaremos a presentar <strong>la</strong> asignación automática <strong>de</strong> <strong>la</strong> categoría gramatical. 7<br />

22 (...) Bo_A es_T_V_X <strong>de</strong>_P veure_V que_C quedam_V amichs_S. Mostra_S_V a_P<br />

l_T_X‟alemanya_A <strong>un</strong>es_T castanyetes_S noves_A ab @<strong>un</strong>s_T grans_A flochs_S y_C<br />

borlins_A. —Això_X no_D es_T_V_X <strong>de</strong>_P Catal<strong>un</strong>ya_E, li_X dich_V. —No_D, diu_V ell_X,<br />

es_T_V_X d_P‟Andalusia_E. [...]<br />

2.3. Casos ambiguos y <strong>de</strong>sambiguación<br />

Texto. 2. Texto asignado <strong>de</strong> Categorías<br />

Al observar el Texto 2, nos damos cuenta <strong>de</strong> que alg<strong><strong>un</strong>a</strong>s Formas poseen más <strong>de</strong> <strong><strong>un</strong>a</strong><br />

asignación, por ejemplo, “es_T_V_X”, “l_T_X”, “alemanya_S_A”, etc. Se trata <strong>de</strong> casos<br />

ambiguos respecto a <strong>la</strong> categoría, puesto que se ha hecho a partir <strong>de</strong> <strong>la</strong> lista <strong>de</strong> formas, sin<br />

5 La grafia amich correspon<strong>de</strong> a amic <strong>de</strong>l catalán estándar.<br />

6 El caso anterior <strong>de</strong> ab @ es distinto. No se i<strong>de</strong>ntifica <strong>con</strong> a (P_a), puesto que <strong>la</strong> preposición exige <strong><strong>un</strong>a</strong><br />

i<strong>de</strong>ntificación total, mientras que <strong>la</strong>s pa<strong>la</strong>bras variables (verbos, adjetivos, sustantivos) permiten <strong><strong>un</strong>a</strong><br />

i<strong>de</strong>ntificación parcial. La i<strong>de</strong>ntificación <strong>de</strong> borlins <strong>con</strong> bo podría evitarse asignando alg<strong><strong>un</strong>a</strong>s <strong>con</strong>diciones<br />

especiales <strong>de</strong> <strong>la</strong> terminación <strong>de</strong> adjetivos. De momento, sin embargo, seguimos trabajando sin<br />

especificaciones <strong>de</strong> <strong>con</strong>diciones específicas para <strong>con</strong>servar <strong>la</strong> característica <strong>general</strong>izadora <strong>de</strong>l programa,<br />

aplicable a distintas lenguas.<br />

7 Los signos utilizados son: A: Adjetivo, C: Conj<strong>un</strong>ción, D: Adverbio, I: Interjección, M: Demostrativo,<br />

N: Numeral, O: Posesivo, P: Preposición, R: Re<strong>la</strong>tivo, S: Sustantivo, T: Artículo, V: Verbo, X: Pronombre.<br />

Naturalmente estos signos se pue<strong>de</strong>n cambiar según <strong>la</strong> <strong>con</strong>veniencia <strong>de</strong>l usuario.<br />

6

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!