08.05.2013 Views

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

2.5 La representación formal <strong>del</strong> texto en los sistemas de PLN 39<br />

to que maneja tanto información sintáctica como conceptual. Para ello<br />

utiliza un análisis sintáctico con una gramática basada en lingüística<br />

(linguistically based grammar) para capturar la sintaxis y la conceptualización<br />

de las expresiones de entrada al sistema.<br />

Además, la representación <strong>del</strong> <strong>conocimiento</strong> <strong>del</strong> dominio y la representación<br />

<strong>del</strong> discurso se realiza en un framework uniforme como una red<br />

semántica proposicional. En este framework la información se representa<br />

como un grafo compuesto de nodos y arcos dirigidos etiquetados que<br />

cumplen las siguientes propiedades:<br />

cada nodo representa un único concepto.<br />

cada concepto representado en la red tiene un único nodo asociado.<br />

el <strong>conocimiento</strong> representado sobre cada concepto es representado por<br />

la estructura de toda la red conectada al nodo que representa el concepto.<br />

El sistema de Diálogo propuesto por Poesio et al. (1994) utiliza un<br />

análisis sintáctico para representar la semántica léxica. A esta representación<br />

la llama “episódica lógica” (episodic logic) y la define como<br />

una “lógica situacional desarrollada como una representación semántica<br />

y <strong>del</strong> <strong>conocimiento</strong> adecuada para la comprensión general <strong>del</strong> lenguaje<br />

natural”. Para ello, cada una de las reglas de la gramática se empareja<br />

con una regla semántica, y de este modo se construye el árbol de análisis<br />

sintáctico de la frase.<br />

El sistema de Diálogo DIHANA (2005) obtiene una representación basada<br />

en frames de las expresiones de usuario. Los frames se obtienen en<br />

dos pasos: el primero de ellos consiste en obtener una frase semántica<br />

definida como una “sequential Intermediate Semantic Language (ISL)”<br />

de la expresión de entrada al sistema; el segundo paso consiste en traducir<br />

esta frase semántica en su correspondiente frame asociado. Para<br />

ello utiliza un procesamiento totalmente estocástico basado en los mo<strong>del</strong>os<br />

ocultos de Markov y el uso de n-gramas sobre un amplio corpus<br />

de aprendizaje.<br />

2.5.6 La representación formal <strong>del</strong> texto en los sistemas de<br />

Extracción de Información<br />

En este apartado se detallan los mo<strong>del</strong>os de representación formal <strong>del</strong><br />

texto que utilizan los sistemas de Extracción de Información desarrollados<br />

en los centros de investigación de Chennai, París y Sheffield bajo<br />

la supervisión de los investigadores Manjula Dhevi, Patrick Gallinari y

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!