´Indice general
´Indice general
´Indice general
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
26<br />
CAPÍTULO 3. GATE<br />
y un conjunto de módulos reusables (como el tokenizador, el delimitador de<br />
oraciones, y el analizador morfosintáctico o Part-Of-Speech Tagger). Estas<br />
herramientas permiten que el desarrollador no tenga que volver a programarlas<br />
cada vez que las necesite. Es decir, GATE nos da un punto de partida<br />
para construir aplicaciones más complejas.<br />
Es importante aclarar, sin embargo, que algunos componentes de GATE<br />
son dependientes del idioma inglés. En particular, los módulos de Extracción<br />
de Información, precisamente el problema abordado en esta tesis. Debido a<br />
esa restricción, para poder utilizar GATE para Extracción de Información<br />
de textos en español, fue necesario programar el módulo de análisis morfosintáctico<br />
para el español 1 como un primer paso para poder utilizar la<br />
arquitectura de GATE para extracción de información de textos en este<br />
idioma (ver figura 1.1).<br />
Los módulos de GATE se clasifican en Recursos de Lenguaje, Recursos<br />
de Procesamiento y Recursos Visuales. Los Recursos de Lenguaje son entidades<br />
tales como lexicones y corpus. Los de Procesamiento son entidades<br />
primordialmente algorítmicas, como parsers y tokenizadores. Los Recursos<br />
Visuales son los componentes usados en la interfaz gráfica. De esta forma<br />
GATE separa los datos, los algoritmos y las formas de visualizarlos.<br />
3.2. El modelo de componentes de GATE<br />
La arquitectura GATE está basada en componentes (módulos) de software<br />
con interfaces bien definidas que permiten su acoplamiento para formar<br />
sistemas modulares de software usables en distintos contextos.<br />
Los componentes de GATE pueden implementarse en varios lenguajes de<br />
programación, pero deben ser llamados y reconocidos por el sistema como<br />
una clase de Java. Esta clase puede ser el componente en sí o bien ser un<br />
wrapper que sirva como enlace para acoplar el componente con GATE.<br />
3.2.1. Wrapper<br />
Un wrapper es un objeto que encapsula a otro para para permitir la<br />
comunicación entre el objeto encapsulado y un programa llamador.<br />
Un wrapper actúa como interfaz entre su llamador y el código encapsulado<br />
o envuelto. Esta interfaz puede ser necesaria principalmente por tres<br />
razones:<br />
1 De hecho, está pensado para usarse en cualquier idioma, pero yo lo entrené para el<br />
español.