13.11.2013 Views

´Indice general

´Indice general

´Indice general

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

26<br />

CAPÍTULO 3. GATE<br />

y un conjunto de módulos reusables (como el tokenizador, el delimitador de<br />

oraciones, y el analizador morfosintáctico o Part-Of-Speech Tagger). Estas<br />

herramientas permiten que el desarrollador no tenga que volver a programarlas<br />

cada vez que las necesite. Es decir, GATE nos da un punto de partida<br />

para construir aplicaciones más complejas.<br />

Es importante aclarar, sin embargo, que algunos componentes de GATE<br />

son dependientes del idioma inglés. En particular, los módulos de Extracción<br />

de Información, precisamente el problema abordado en esta tesis. Debido a<br />

esa restricción, para poder utilizar GATE para Extracción de Información<br />

de textos en español, fue necesario programar el módulo de análisis morfosintáctico<br />

para el español 1 como un primer paso para poder utilizar la<br />

arquitectura de GATE para extracción de información de textos en este<br />

idioma (ver figura 1.1).<br />

Los módulos de GATE se clasifican en Recursos de Lenguaje, Recursos<br />

de Procesamiento y Recursos Visuales. Los Recursos de Lenguaje son entidades<br />

tales como lexicones y corpus. Los de Procesamiento son entidades<br />

primordialmente algorítmicas, como parsers y tokenizadores. Los Recursos<br />

Visuales son los componentes usados en la interfaz gráfica. De esta forma<br />

GATE separa los datos, los algoritmos y las formas de visualizarlos.<br />

3.2. El modelo de componentes de GATE<br />

La arquitectura GATE está basada en componentes (módulos) de software<br />

con interfaces bien definidas que permiten su acoplamiento para formar<br />

sistemas modulares de software usables en distintos contextos.<br />

Los componentes de GATE pueden implementarse en varios lenguajes de<br />

programación, pero deben ser llamados y reconocidos por el sistema como<br />

una clase de Java. Esta clase puede ser el componente en sí o bien ser un<br />

wrapper que sirva como enlace para acoplar el componente con GATE.<br />

3.2.1. Wrapper<br />

Un wrapper es un objeto que encapsula a otro para para permitir la<br />

comunicación entre el objeto encapsulado y un programa llamador.<br />

Un wrapper actúa como interfaz entre su llamador y el código encapsulado<br />

o envuelto. Esta interfaz puede ser necesaria principalmente por tres<br />

razones:<br />

1 De hecho, está pensado para usarse en cualquier idioma, pero yo lo entrené para el<br />

español.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!