08.05.2013 Views

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

18 2. Estado <strong>del</strong> arte<br />

fican en sistemas estadísticos y en sistemas basados en reglas de PLN o<br />

<strong>conocimiento</strong> lingüístico. Los sistemas híbridos, debido a que a pesar de<br />

tener una parte matemática hacen uso de las <strong>técnicas</strong> de PLN, se clasifican<br />

dentro de los sistemas basados en reglas de PLN. Seguidamente<br />

se presentan las características básicas de estos dos tipos de sistemas,<br />

según su metodología, y a lo largo de este capítulo se comentarán diferentes<br />

sistemas concretos de PLN, tanto estadísticos como basados en<br />

<strong>conocimiento</strong> lingüístico, atendiendo al enfoque empleado para llevar a<br />

cabo la representación formal <strong>del</strong> texto.<br />

2.1.1 Sistemas estadísticos<br />

Los sistemas estadísticos involucran colecciones de muestras <strong>del</strong> lenguaje<br />

(corpus), las cuales son etiquetadas y usadas para crear mo<strong>del</strong>os<br />

estadísticos. El propósito perseguido por los sistemas estadísticos consiste<br />

en la aplicación de los mo<strong>del</strong>os de probabilidad y estadísticos para<br />

inferir <strong>conocimiento</strong> directamente de los datos, buscando irregularidades<br />

significativas. Los mo<strong>del</strong>os estadísticos empleados por este tipo de<br />

sistemas (Marquez, 2001) se basan en los conceptos básicos de la teoría<br />

de probabilidad: probabilidad condicionada e independencia de sucesos.<br />

Las <strong>técnicas</strong> básicas consisten en calcular las frecuencias de las palabras<br />

que aparecen en un conjunto de textos, y deducir todas las probabilidades<br />

medias y condicionadas, por ejemplo, calcular el parsing más<br />

probable de una frase a partir de los parsings anteriores.<br />

El método de estimación más sencillo consiste en el manejo de frecuencias<br />

relativas extraídas de un corpus lingüístico. Este método tiene tres<br />

fases claramente diferenciadas: recolección de datos, anotación de las<br />

unidades <strong>del</strong> corpus y cálculo de frecuencias de las unidades. También<br />

existen otras <strong>técnicas</strong> más avanzadas (Rumelhart et al. , 1994), basadas<br />

en la utilización de redes neuronales y algoritmos evolutivos, cuyo<br />

propósito principal se basa en la idea de simular la capacidad lingüística,<br />

el aprendizaje y la evolución <strong>del</strong> lenguaje natural. Para ello, se trata<br />

de simular la propia naturalidad <strong>del</strong> lenguaje, y se aplican <strong>técnicas</strong> de<br />

aprendizaje y representaciones simbólicas que evolucionan.<br />

2.1.2 Sistemas basados en reglas de PLN o <strong>conocimiento</strong><br />

lingüístico<br />

En contrapartida con los sistemas estadísticos, los sistemas basados en<br />

reglas de PLN utilizan <strong>conocimiento</strong> lingüístico para realizar su cometido.<br />

Estas <strong>técnicas</strong> lingüísticas pueden ser de diversa índole (POS,<br />

morfología, dependencias, sintaxis, ...) incluso se pueden combinar varias<br />

de ellas. Básicamente, el funcionamiento de los sistemas basados en

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!