27.09.2015 Views

CONSTRUCCION Y MANEJO DE UNA BASE DE DATOS EN ...

CONSTRUCCION Y MANEJO DE UNA BASE DE DATOS EN ...

CONSTRUCCION Y MANEJO DE UNA BASE DE DATOS EN ...

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>CONSTRUCCION</strong> Y <strong>MANEJO</strong> <strong>DE</strong> <strong>UNA</strong> <strong>BASE</strong> <strong>DE</strong> <strong>DATOS</strong> <strong>EN</strong> TEXTO COMPLETO<br />

Maria Teresa Astroza. M.S.L.Sc.,<br />

Jefe Biblioteca Sede, OPS, Washington, D.C.3<br />

astrozam@paho.org<br />

RESUM<strong>EN</strong>:<br />

La nueva tecnología de texto completo se presenta como una de las mejores opciones en la<br />

actualidad para la recopilación, preservación, recuperación y diseminación electrónica de la<br />

información. Con esta tecnología se amplía la visión del acceso a la información desde un libro, que<br />

es pasivo, al hipertexto, que es activo. A través de la experiencia de la Biblioteca de la Sede de la<br />

Organización Panamericana de la Salud (OPS), se observa el desarrollo de un proyecto ambicioso, a<br />

bajo costo, de la construcción de una base de datos en texto completo, incluyendo imágenes,<br />

cuyos resultados bien podrían ser replicados en otras instituciones de la Región.<br />

INTRODUCCION:<br />

En el mundo dinámico de hoy, en el cual el cambio es cada vez más acelerado, existe una apremiante<br />

necesidad por adquirir más conocimiento para resolver problemas. Esto influye significativamente<br />

en cómo nos enfrentamos a situaciones que tienen que ver con almacenar, preservar y compartir la<br />

gran masa de información disponible.<br />

Este desafío, unido a la gran variedad de tecnologías disponibles, crea nuevas oportunidades e<br />

inquietudes en el campo de la ciencias de la información, estimulando la investigación y el<br />

desarrollo de nuevos proyectos. El desafío más grande no está sólo en almacenar y preservar la<br />

información, sino en cómo conseguir más rápidamente lo más relevante y en cómo llegar al<br />

usuario preciso para transformarla en conocimiento, propiciando finalmente, una toma de<br />

decisiones más eficiente y efectiva.<br />

La biblioteca tradicional, basada en colecciones en papel, de pronto se enfrenta a la necesidad<br />

imperiosa de transformarse en una biblioteca electrónica. El nuevo bibliotecario se vé obligado a<br />

explorar nuevas formas de llegar a los usuarios de acuerdo a las exigencias de las comunicaciones y<br />

cambiar su papel de simple guardián y catalogador a innovador para agregar valor a la<br />

información, representando "una mezcla de tradición e innovación:<br />

tradición en el sentido de preservar y promover el beneficio de lo que existió antes; innovación en<br />

el sentido de ajustar las relaciones, misiones y acceso entre usuarios, materiales, ideas y<br />

trabajadores del conocimiento" (1)<br />

En contraste con la biblioteca tradicional, el uso de la información electrónica es atractiva porque<br />

puede ser facilmente puesta al día, diseminada y compartida. Los libros en texto completo y las<br />

bibliotecas electrónicas ofrecen ventajas no posibles a traves de medios convencionales, tales<br />

como realizar búsquedas con una rapidez y exactitud nunca sospechadas.<br />

El concepto de texto completo no es nuevo. Hace ya varios años que grandes firmas<br />

norteamericanas, instituciones privadas y organismos internacionales, incluso Naciones Unidas, lo<br />

han estado desarrollando, aunque a costos muy elevados. Lo novedoso es que su demanda y<br />

disponibilidad sigue aumentando considerablemente, especialmente las revistas en texto completo.<br />

Aparecen nuevos equipos a bajo costo que lo vuelven más accesible a pequeñas empresas. De<br />

pronto se transforma en la tecnología preferida para compartir información. (2)<br />

Los documentos electrónicos podrán definirse como una colección de páginas dinámicas (cambian<br />

su forma), con información interactiva (reaccionan de varias maneras en respuesta al usuario) (3).<br />

La mayoría de los documentos electrónicos se originan de archivos producidos por procesadores de<br />

palabras, que a su vez generan la copia impresa. En este proceso se convierten textos marcados


para ser impresos convencionalmente, a bases de datos que permiten su recuperación y<br />

diseminación, incluyendo imágenes (gráficos, tablas estadísticas, fotos, etc).<br />

La dinámica del texto completo surge de los productos en el mercado que permiten marcar partes<br />

del texto, insertar anotaciones, leer página por página, saltar de una página a otra, cambiar de<br />

estilos, colocar líneas o espacios para acomodar preferencias individuales, y colocar enlaces de<br />

hipertexto, ya sea pre-definidos o propios.<br />

El hipertexto, elemental para la recuperación en texto completo, (dirige al usuario a las fuentes de<br />

información), consiste en unidades de información que se llaman "nodos" conectados por<br />

relaciones llamadas "lazos".<br />

El valor de la búsqueda en texto completo se demuestra en numerosos estudios de comparación de<br />

este tipo de bases con bases de datos bibliográficas, en el cual se prueba que se encuentra más<br />

material relevante, especialmente cuando éste va acompañado de descriptores asignados<br />

manualmente (4).<br />

<strong>BASE</strong> <strong>DE</strong> <strong>DATOS</strong> <strong>EN</strong> TEXTO COMPLETO <strong>DE</strong> LA MEMORIA INSTITUCIONAL <strong>DE</strong> OPS.<br />

PROPOSITO FINAL:<br />

Ofrecer al personal de la OPS, de la Región y a otros usuarios, un sistema electrónico eficiente y<br />

eficaz para recoger, organizar, preservar, recuperar y diseminar los valiosos documentos técnicos<br />

originados por la Organización, incluyendo imágenes.<br />

OBJETIVO PRINCIPAL:<br />

Ayudar a fortalecer la capacidad de la OPS al prestar cooperación técnica a los países de América<br />

Latina y del Caribe y servir de instrumento para facilitar la toma de decisiones, no sólo al personal<br />

de la OPS, sino también a todos los actores envueltos en mejorar la salud de los pueblos de la<br />

Región.<br />

El desarrollo de una base de datos de texto completo, exclusiva para la documentación técnica<br />

generada por OPS, se concibe como un medio eficaz para resolver grandes problemas de acceso a<br />

esta información, tales como la falta de una recolección integral de documentos, la falta de<br />

uniformidad en la presentación de los datos bibliográficos mínimos, su lenta búsqueda,<br />

recuperación y diseminación. Como resultado se intenta evitar la duplicación de las investigaciones<br />

y de los proyectos de desarrollo, consultorías y otros productos y ayudar al personal interno, así<br />

como a sus contrapartes en los países de la Región, en la toma de decisiones.<br />

También se consideró la urgente necesidad de ahorrar espacio físico en las oficinas de OPS, ahorrar<br />

en los costos de producción y de diseminación de la información, y en esfuerzo humano al evitar la<br />

duplicación en la entrada de datos bibliográficos.<br />

Para esto se establecio que la base de datos deberá llenar los siguientes requisitos: (a) ser un<br />

sistema electrónico y amistoso, a bajo costo; (b) accesible a traves de LAN y del WEB; (c) proveer<br />

rapidez en la recuperación; (d) permitir recuperaci\n desde registros bibliográficos con los campos<br />

utilizados por BIREME; (e) permitir la entrada de datos bibliográficos en forma rápida y lo más<br />

automatizada posible; (f) utilizar al máximo la tecnología que está en uso en OPS.<br />

El proyecto se inició en 1995 con la contratación de consultores con gran experiencia y prestigio<br />

profesional. Se contemplaron tres etapas en el desarrollo e implementaci\n de este proyecto:


1. IMPLEM<strong>EN</strong>TACION Y <strong>DE</strong>SARROLLO - BIBLIOTECA <strong>DE</strong> LA SE<strong>DE</strong>.<br />

Objetivo: Desarrollar todos los elementos necesarios, incluyendo productos de prueba. Fecha: 1996.<br />

Se incluyo la evaluación y elección de un programa comercial a bajo costo, la preparación de los<br />

formatos base y macros para el procesador de palabras, pruebas de recuperación de información,<br />

preparación de manuales, guías y entrenamiento. Paralelamente, se estudió el acceso a través de<br />

LAN, WEB (con diseño de pantallas para LAN y el WEB) y el uso de SGML para producir discos<br />

compactos.<br />

2. IMPLEM<strong>EN</strong>TACION <strong>EN</strong> LA OFICINA C<strong>EN</strong>TRAL (Washington, D.C.)<br />

Objetivo: Operacionalizar la base de datos en texto completo incluyendo todos los Programas<br />

Técnicos de la Oficina Central. Fecha: 1997. Incluyó entrenamiento y preparación de guías.<br />

3. IMPLEM<strong>EN</strong>TACION <strong>EN</strong> LAS OFICINAS <strong>DE</strong> PAISES.<br />

Objetivo: Operacionalizar la base de datos en las Oficinas OPS en la Región. Prevista para<br />

1998-1999. Esto incluye asesoría por parte de la Biblioteca, especialmente entrenamiento.<br />

<strong>DE</strong>SARROLLO <strong>DE</strong>L PROYECTO:<br />

Se estudiaron las necesidades básicas de manejo de documentación de la OPS (tipo de<br />

documentos,etc). Se evaluaron los programas de recuperación en texto completo disponibles en el<br />

mercado, considerando su costo/beneficio. (Se compar\ TMS Inner View, InterMAX, TMS Quickview,<br />

InfoAccess Kinetic EBT, CJS/Wordkeeper + Acrobat y FolioVIEWS).<br />

Como procesador de palabras se eligió WordPerfect 5.1 (programa utilizado por la OPS, aunque<br />

posteriormente se cambiaría a WORD).<br />

Para preservar en disco compacto, se escogió SGML (Standard Generalized Markup Language),<br />

estandar universal para archivos de texto e intercambio de información y una de las técnicas más<br />

novedosas en el mundo de la publicación y diseminación electrónica. Presenta flexibilidad para<br />

adaptarse a nuevos softwares y tecnologías de comunicación que aparezcan en el futuro (5).<br />

Para la recuperaci\n del texto completo, con imágenes, se eligió FolioVIEWS (Folio Corporation).<br />

Además de ser compatible con DOS, WINDOWS y Macintosh, presenta códigos para formatear<br />

compatibles con procesadores de palabras, es multiusuario y multieditor.<br />

Opera con discos compactos, en el WEB, y se puede colocar multimedios dentro del texto o en<br />

ventanas separadas.<br />

Sin embargo, una de las mayores ventajas de FolioVIEWS está en la bdsqueda y recuperación:<br />

recupera cada palabra del texto (cada palabra es indizada, y su índice se pone al dRa<br />

automaticamente), permite búsqueda booleana, proximidad, truncaciones, bdsqueda por frases y/o<br />

limitada a campos específicos, y tiene un excelente tiempo de respuesta. Además presenta<br />

despliegue adecuado de pantallas, tiene interface multilingüe, acepta diacríticos, notas y tablas en<br />

"pop-up". También permite buscar bajo "QUERY" por cada palabra en el texto, y preparar pantallas<br />

de búsquedas con elementos propios.<br />

Como parte del proyecto se prepararon estas pantallas de búsquedas en FolioVIEWS según las<br />

necesidades de la OPS (ligadas a los datos bibliogr


metodología LILACS con instrucciones en línea. También se utilizó el Autor de SGML para WORD,<br />

para convertir texto a SGML.<br />

Por último se entrenó al personal de la Biblioteca, se realizaron presentaciones a nivel de la<br />

Dirección y se asignaron puntos focales en las oficinas generadoras de documentos.<br />

PROCESO TECNICO<br />

El proceso técnico se realiza en dos puntos principales: En las oficinas de los Programas Técnicos y<br />

en la Biblioteca de la Sede. (Vease Fig.)<br />

1. PROGRAMAS TECNICOS: Al iniciarse un nuevo documento, el personal asignado en los<br />

Programas Técnicos: (a) llama el formato de entrada bibliográfica en MS ACESS desde el menú del<br />

LAN y entra los datos bibliográficos; (b) envía a la Biblioteca el cuerpo de la versión FINAL del<br />

documento en formato electrónico, preferentemente en WORD con las imágenes (colocadas dentro o<br />

fuera de WORD). Si el documento es enviado en WordPerfect, PageMaker or PDF (Portable Data File),<br />

la Biblioteca lo convierte a WORD;(c) envía copia en papel a la Biblioteca para asegurar que se<br />

incluye completo.<br />

2. BIBLIOTECA <strong>DE</strong> LA SE<strong>DE</strong>: La Biblioteca de la Sede recibe la información bibliográfica en MS<br />

ACCESS a través del LAN: (a) Chequea la información, corrige y agrega lo que falta y la transfiere a<br />

WORD; (b) Prepara el texto del documento, asignando a cada párrafo el nivel de categoría de los<br />

subtítulos; (c) Prepara los grupos y enlaces a la tabla de contenido; (d) Reformatea las tablas y<br />

gráficas; (e) Valida la indización por frases; (f) Crea una nueva INFO<strong>BASE</strong> desde el archivo ASCII para<br />

su precisión y consistencia; (g)Traspasa todo a la base de producción y la copia para acceso en el<br />

LAN; (j) Realiza el rastreo de las imágenes si ellas no vienen incorporadas en el texto en WORD.<br />

Fig.<br />

Flujo del proceso de desarrollo de la base de datos desde la creación del documento hasta su<br />

recuperación.<br />

REQUISITOS MINIMOS PARA LA CREACION <strong>DE</strong> LA <strong>BASE</strong> <strong>DE</strong> <strong>DATOS</strong> <strong>EN</strong> TEXTO COMPLETO:<br />

De la experiencia de la Biblioteca de la Sede se desprende que para implementar un tipo de base<br />

de datos semejante a la de OPS, se requiere como mínimo:<br />

1. RECURSOS ADMINISTRATIVOS: (a) Apoyo de la Dirección (lo que es fundamental; (b)<br />

Identificación y formulación de guías y políticas institucionales para iniciar el proyecto en toda la<br />

institución; (c) Definición del contenido de la base de datos y los niveles de confidencialidad; (d)<br />

Establecimiento de los elementos de entrada bibliográfica y de recuperación deseados.<br />

2. RECURSOS HUMANOS: Contar con el número necesario de personal calificado. En el caso de la<br />

Biblioteca de la Sede, que genera un promedio de 120 docs. al mes, se necesita un bibliotecario<br />

profesional a cargo de todo el proceso, un bibliotecario para el procesamiento del material, un<br />

ayudante para la entrada de datos y una persona de sistema para resolver problemas de rutina. Al<br />

establecerse la rutina de trabajo, el tiempo estimado de procesamiento para un documento en la<br />

base en texto completo deberRa llegar a ser m


consideró el equipo que ya estaba instalado en la Organización: PC 486 e impresora, procesador de<br />

palabras, INTERNET WEB). El equipo que se adquirió fue: FolioVIEWS (PIDK) en versi\n para una<br />

sola terminal (US$ 3.195), PC Pentium (modelo 1200W, 16 mb RAM, 1 mb video DRAM, 1.2 gb disco<br />

duro (US$ 2.339), escritor de disco compacto (US$ 1.500), editor de WINDOWS (US$ 600), "scanner"<br />

(US$ 600). La producción de cada disco compacto confeccionado dentro de la OPS tendría un costo<br />

de alrededor de US$ 1.45 (realizada por fuentes externas costaría alrededor de US$ 2.500).<br />

Se estimó que en cada oficina de OPS en los países se necesitaría una inversión inicial de equipo a<br />

un costo mínimo, ya que gran parte del equipo ya está instalado y que las copias de FolioVIEWS se<br />

pueden obtener a bajo costo (hay acuerdo para usarlo sin fines comerciales).<br />

ESTADO ACTUAL <strong>DE</strong>L PROYECTO:<br />

La implementación de la base de datos se desarrolló exitosamente.<br />

La base de datos en texto completo tiene alrededor de 150 docs., accesibles a través de LAN.<br />

Dentro de 1998 estará accesible en Internet/WEB e Intranet, y muy pronto se empezar< su<br />

implementación en las oficinas de OPS en los países.<br />

La recuperaci\n de la información probó ser rápida y efectiva, ya que además de navegar por todo el<br />

texto (capítulos, subcapítulos párrafos, etc.), de recuperar las im


CITAS BIBLIOGRAFICAS<br />

1. Manville, Phillip Brook. Tradition and Innovation in the<br />

Management of Professional Knowledge: A Case Study of a<br />

"Virtual Library". Harvard Library Bulletin, Vol 4, No. 1,<br />

Spring 1993. p. 29.<br />

2. Sievert, Mary Ellen C. Full-Text Information Retrieval:<br />

Introduction. (Journal of the American Society for<br />

Information Science, Vol. 47 No. 4, 1966, p. 261-262)<br />

3. Barker, Phillip. Living Books and Dynamic Electronic<br />

Libraries. (The Electronic Library, Vol 14, No.6, December<br />

1996, p. 491-502)<br />

4. Fidel, Raya, Truli Bellardo Han, Edie M. Rasmussen and<br />

Phillip J. Smith, eds. Challenges in Indexing Electronic<br />

Text and Images. Medford, N.J, American Society for<br />

Information Science, 1994.<br />

5. Sahffstall, Anthony L. SGML: What it is and its benefits<br />

(En: Hegelson, Linda W. CD-ROM: Facilitating Electronic<br />

Publishing. New York, Van Nostrand Reinhold, 1992, p.410)

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!