Método general de la lematización con una gramática mínima y un ...
Método general de la lematización con una gramática mínima y un ...
Método general de la lematización con una gramática mínima y un ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Fig. 2. Lista <strong>de</strong>l resultado<br />
don<strong>de</strong> observamos que amichs se ha i<strong>de</strong>ntificado correctamente <strong>con</strong> el lema<br />
amich, 5 a<strong>un</strong>que <strong>la</strong> forma plural no figure en <strong>la</strong> lista. Las pa<strong>la</strong>bras que no han sido<br />
analizadas por falta <strong>de</strong> los datos <strong>de</strong>l Diccionario aparecen <strong>con</strong> el signo <strong>de</strong> arroba (@), lo<br />
cual quiere <strong>de</strong>cir que se <strong>de</strong>bería asignar <strong>la</strong> categoría y lema en el Diccionario. El caso <strong>de</strong><br />
“borlins”, asignado equivocadamente <strong>con</strong> “A_bo”, se <strong>de</strong>be a que el programa ha buscado<br />
el adjetivo “bo” como último recurso. Con <strong>la</strong> inclusión <strong>de</strong> borlin en el Diccionario se<br />
resuelve este problema. 6<br />
Nuestro programa también pue<strong>de</strong> ofrecer <strong>un</strong> texto <strong>de</strong> resultado. En este caso nos<br />
limitaremos a presentar <strong>la</strong> asignación automática <strong>de</strong> <strong>la</strong> categoría gramatical. 7<br />
22 (...) Bo_A es_T_V_X <strong>de</strong>_P veure_V que_C quedam_V amichs_S. Mostra_S_V a_P<br />
l_T_X‟alemanya_A <strong>un</strong>es_T castanyetes_S noves_A ab @<strong>un</strong>s_T grans_A flochs_S y_C<br />
borlins_A. —Això_X no_D es_T_V_X <strong>de</strong>_P Catal<strong>un</strong>ya_E, li_X dich_V. —No_D, diu_V ell_X,<br />
es_T_V_X d_P‟Andalusia_E. [...]<br />
2.3. Casos ambiguos y <strong>de</strong>sambiguación<br />
Texto. 2. Texto asignado <strong>de</strong> Categorías<br />
Al observar el Texto 2, nos damos cuenta <strong>de</strong> que alg<strong><strong>un</strong>a</strong>s Formas poseen más <strong>de</strong> <strong><strong>un</strong>a</strong><br />
asignación, por ejemplo, “es_T_V_X”, “l_T_X”, “alemanya_S_A”, etc. Se trata <strong>de</strong> casos<br />
ambiguos respecto a <strong>la</strong> categoría, puesto que se ha hecho a partir <strong>de</strong> <strong>la</strong> lista <strong>de</strong> formas, sin<br />
5 La grafia amich correspon<strong>de</strong> a amic <strong>de</strong>l catalán estándar.<br />
6 El caso anterior <strong>de</strong> ab @ es distinto. No se i<strong>de</strong>ntifica <strong>con</strong> a (P_a), puesto que <strong>la</strong> preposición exige <strong><strong>un</strong>a</strong><br />
i<strong>de</strong>ntificación total, mientras que <strong>la</strong>s pa<strong>la</strong>bras variables (verbos, adjetivos, sustantivos) permiten <strong><strong>un</strong>a</strong><br />
i<strong>de</strong>ntificación parcial. La i<strong>de</strong>ntificación <strong>de</strong> borlins <strong>con</strong> bo podría evitarse asignando alg<strong><strong>un</strong>a</strong>s <strong>con</strong>diciones<br />
especiales <strong>de</strong> <strong>la</strong> terminación <strong>de</strong> adjetivos. De momento, sin embargo, seguimos trabajando sin<br />
especificaciones <strong>de</strong> <strong>con</strong>diciones específicas para <strong>con</strong>servar <strong>la</strong> característica <strong>general</strong>izadora <strong>de</strong>l programa,<br />
aplicable a distintas lenguas.<br />
7 Los signos utilizados son: A: Adjetivo, C: Conj<strong>un</strong>ción, D: Adverbio, I: Interjección, M: Demostrativo,<br />
N: Numeral, O: Posesivo, P: Preposición, R: Re<strong>la</strong>tivo, S: Sustantivo, T: Artículo, V: Verbo, X: Pronombre.<br />
Naturalmente estos signos se pue<strong>de</strong>n cambiar según <strong>la</strong> <strong>con</strong>veniencia <strong>de</strong>l usuario.<br />
6