08.05.2013 Views

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

2 1. Introducción<br />

1.1 La independencia <strong>del</strong> dominio en los sistemas de<br />

PLN<br />

Tradicionalmente, la información requerida por los sistemas basados en <strong>conocimiento</strong><br />

se ha adquirido manualmente en colaboración con expertos <strong>del</strong><br />

área tratada, con el alto coste que ello supone. Sin embargo, la creciente disponibilidad<br />

de recursos <strong>textual</strong>es on-line y el número potencial de aplicaciones<br />

de adquisición de <strong>conocimiento</strong> a partir de datos <strong>textual</strong>es ha derivado hacia<br />

un incremento en la investigación en el campo de la Extracción de Información.<br />

Uno de los principales inconvenientes de la aplicación de la Extracción de<br />

Información es su dependencia <strong>del</strong> dominio. Hay que considerar, por ejemplo,<br />

la definición de qué contenido se considera relevante para cada dominio con<br />

anterioridad al proceso de Extracción de Información. El intento de reducir<br />

el alto coste de adaptación manual de las aplicaciones de Extracción de Información<br />

a nuevos dominios ha conducido a la reciente investigación en la<br />

aplicación de diferentes <strong>técnicas</strong> de aprendizaje automático (Riloff & Jones,<br />

1999) (Yangarber, 2003).<br />

En relación al tratamiento de textos en los dominios restringidos, por ejemplo<br />

en el campo de la biomedicina, desde la última década se está prestando<br />

especial interés en la utilización de <strong>técnicas</strong> de PLN para la minería de textos,<br />

es decir, para el análisis, la extracción y la estructuración de la información<br />

contenida en colecciones de textos biomédicos.<br />

Tomando como ejemplo el marco de la Extracción de Información, se acaba<br />

de introducir que ésta está cobrando gran importancia tanto en el dominio<br />

abierto como en los dominios restringidos. Es por ello por lo que los sistemas<br />

de Extracción de Información deben ser capaces de trabajar sobre cualquier<br />

dominio, tanto en el dominio abierto como en cualquier dominio restringido.<br />

Para ello, deben disponer de un mecanismo de representación formal <strong>del</strong> texto<br />

capaz de abstraer el <strong>conocimiento</strong> <strong>del</strong> texto independientemente de cuál sea su<br />

dominio.<br />

Por ejemplo, si se considera como marco de referencia el dominio biomédico,<br />

las <strong>técnicas</strong> de Extracción de Información son de indudable interés para la ayuda<br />

a la construcción de recursos de utilidad para los investigadores biomédicos:<br />

bases de datos de entidades biológicas (genes, proteínas, compuestos químicos,<br />

enfermedades, etc.) y relaciones entre éstas, ontologías y tesauros que clasifican<br />

conceptos biomédicos, o redes de interacción entre entidades biomédicas.<br />

Estas <strong>técnicas</strong> también pueden ser útiles para la clasificación y recuperación<br />

de documentos biomédicos o el análisis y estructuración de historiales clínicos.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!