08.05.2013 Views

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

2.3 <strong>Representación</strong> <strong>textual</strong> con contenido lingüístico 29<br />

<strong>del</strong> marco es muy simple: un marco representa un objeto o un concepto.<br />

Las relaciones entre objetos y conceptos vienen denotadas por los<br />

huecos (slots). Los atributos permiten determinar las propiedades de<br />

los objetos y/o conceptos.<br />

2.3.6 Mo<strong>del</strong>o basado en ontología<br />

Atendiendo a la propia composición <strong>del</strong> lenguaje humano, un concepto<br />

puede ser expresado <strong>mediante</strong> distintas palabras sinónimas, y también,<br />

dada una palabra, ésta puede tener diferentes significados según su contexto.<br />

Los mo<strong>del</strong>os de representación vistos hasta ahora no tienen en<br />

cuenta ninguna de estas consideraciones. Los mo<strong>del</strong>os de representación<br />

<strong>del</strong> texto basados en ontología tienen, por una parte, una componente<br />

matemática y, por otra parte, una fuerte componente basada en la<br />

exploración de alguna ontología que permite la consideración todo tipo<br />

de características semánticas <strong>del</strong> lenguaje. La ontología clásica utilizada<br />

en este mo<strong>del</strong>o de representación formal <strong>del</strong> texto suele ser WordNet<br />

(Miller, 1995).<br />

Siguiendo el mo<strong>del</strong>o basado en ontología, en la representación <strong>del</strong> texto,<br />

sólo se tienen en cuenta aquellas palabras cuyas categorías gramaticales<br />

son sustantivo, adjetivo, verbo o adverbio, ya que la base de datos léxica<br />

WordNet sólo tiene entradas de este tipo de palabras. Las entradas<br />

de WordNet se agrupan en synsets según su categoría gramatical. Un<br />

synset agrupa a una serie de palabras sinónimas de la misma categoría<br />

gramatical incluyendo su número de sentido. Cada synset de WordNet<br />

está identificado exclusivamente por un identificador de synset, que es<br />

un número de ocho dígitos. Por ejemplo, el synset 02853224 agruparía<br />

las palabras car, auto, automotive y motorcar con sentido 1, y machine<br />

con sentido 2.<br />

Diferentes autores han utilizado este mo<strong>del</strong>o de representación en sus<br />

investigaciones tales como Gonzalo et al. (1998), Scott et al. (1999),<br />

Junker et al. (1997), Vicedo (2002) y Petridis et al. (2001). Sanderson<br />

(2000) hace un buen estudio de las diferentes variaciones de este mo<strong>del</strong>o<br />

aplicadas a la Recuperación de Información. A continuación se muestra<br />

el ejemplo 10 en el que se presenta la representación formal <strong>del</strong> texto<br />

según el mo<strong>del</strong>o híbrido considerando únicamente el sentido de las palabras<br />

en WordNet.<br />

(10) Frase: A bank is an institution that lends money to<br />

business establishments and plays an important role<br />

in commerce.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!