08.05.2013 Views

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

Representación del conocimiento textual mediante técnicas lógico ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

82 4. La forma <strong>lógico</strong>-conceptual<br />

Identificador Conceptos <strong>del</strong> synset<br />

02958343 car#1, auto#1, automobile#1, machine#6, motorcar#1<br />

02959942 car#2, railcar#1, railway car#1, railroad car#1<br />

02960501 car#3, gondola#3<br />

02960352 car#4, elevator car#1<br />

02934451 cable car#1, car#5<br />

Tabla 4.1. Synsets <strong>del</strong> sustantivo car<br />

valencias a una estructura interlingüística, el Inter-Lingual-Index (ILI).<br />

Es decir, el ILI conecta los synsets de las diferentes lenguas. Como<br />

ejemplo, la figura 4.1 muestra las relaciones existentes entre la lengua<br />

inglesa y la lengua española <strong>del</strong> sustantivo prohibition. En este ejemplo,<br />

el sustantivo prohibition tiene cuatro entradas de synset en el WordNet<br />

inglés, dos de las cuales (la segunda y la cuarta) están relacionadas con<br />

synsets <strong>del</strong> WordNet español a través <strong>del</strong> ILI. Diferentes autores han<br />

utilizado el ILI de EuroWordNet para tratar los aspectos relevantes de<br />

la multilingualidad en sus investigaciones en PLN (Soria et al. , 2006)<br />

(Marchetti et al. , 2006) (Ferrández et al. , 2006b).<br />

4.1.2 UMLS<br />

En el dominio médico existen distintos recursos que aportan <strong>conocimiento</strong><br />

relativo a su terminología. El más extendido es UMLS (Unified<br />

Medical Language System) (Humphreys & Lindberg, 1993). Este recurso<br />

está compuesto a partir de la integración de tres fuentes de <strong>conocimiento</strong>:<br />

el Metatesauro, el Lexicón Especializado y la Red Semántica que<br />

cabe describir brevemente a continuación:<br />

El Metatesauro es el núcleo de UMLS y consta de una colección de<br />

conceptos y términos extraídos de diferentes vocabularios controlados,<br />

incluyendo también sus relaciones.<br />

El Lexicón Especializado es una base de datos de información léxicográfica<br />

para el uso en PLN.<br />

La Red Semántica consta de un conjunto de categorías y sus relaciones<br />

cuya utilidad es la de clasificar y relacionar las entradas <strong>del</strong><br />

metatesauro.<br />

De entre estos tres recursos de UMLS, el que mejor se adapta a la necesidad<br />

de extracción de los conceptos es el Metateusauro, que será el<br />

que se utilizará. Además, cabe destacar que, tal y como se acaba de<br />

describir, UMLS incorpora una Red Semántica en la que los conceptos

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!