CONSTRUCCION Y MANEJO DE UNA BASE DE DATOS EN ...
CONSTRUCCION Y MANEJO DE UNA BASE DE DATOS EN ...
CONSTRUCCION Y MANEJO DE UNA BASE DE DATOS EN ...
- No tags were found...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>CONSTRUCCION</strong> Y <strong>MANEJO</strong> <strong>DE</strong> <strong>UNA</strong> <strong>BASE</strong> <strong>DE</strong> <strong>DATOS</strong> <strong>EN</strong> TEXTO COMPLETO<br />
Maria Teresa Astroza. M.S.L.Sc.,<br />
Jefe Biblioteca Sede, OPS, Washington, D.C.3<br />
astrozam@paho.org<br />
RESUM<strong>EN</strong>:<br />
La nueva tecnología de texto completo se presenta como una de las mejores opciones en la<br />
actualidad para la recopilación, preservación, recuperación y diseminación electrónica de la<br />
información. Con esta tecnología se amplía la visión del acceso a la información desde un libro, que<br />
es pasivo, al hipertexto, que es activo. A través de la experiencia de la Biblioteca de la Sede de la<br />
Organización Panamericana de la Salud (OPS), se observa el desarrollo de un proyecto ambicioso, a<br />
bajo costo, de la construcción de una base de datos en texto completo, incluyendo imágenes,<br />
cuyos resultados bien podrían ser replicados en otras instituciones de la Región.<br />
INTRODUCCION:<br />
En el mundo dinámico de hoy, en el cual el cambio es cada vez más acelerado, existe una apremiante<br />
necesidad por adquirir más conocimiento para resolver problemas. Esto influye significativamente<br />
en cómo nos enfrentamos a situaciones que tienen que ver con almacenar, preservar y compartir la<br />
gran masa de información disponible.<br />
Este desafío, unido a la gran variedad de tecnologías disponibles, crea nuevas oportunidades e<br />
inquietudes en el campo de la ciencias de la información, estimulando la investigación y el<br />
desarrollo de nuevos proyectos. El desafío más grande no está sólo en almacenar y preservar la<br />
información, sino en cómo conseguir más rápidamente lo más relevante y en cómo llegar al<br />
usuario preciso para transformarla en conocimiento, propiciando finalmente, una toma de<br />
decisiones más eficiente y efectiva.<br />
La biblioteca tradicional, basada en colecciones en papel, de pronto se enfrenta a la necesidad<br />
imperiosa de transformarse en una biblioteca electrónica. El nuevo bibliotecario se vé obligado a<br />
explorar nuevas formas de llegar a los usuarios de acuerdo a las exigencias de las comunicaciones y<br />
cambiar su papel de simple guardián y catalogador a innovador para agregar valor a la<br />
información, representando "una mezcla de tradición e innovación:<br />
tradición en el sentido de preservar y promover el beneficio de lo que existió antes; innovación en<br />
el sentido de ajustar las relaciones, misiones y acceso entre usuarios, materiales, ideas y<br />
trabajadores del conocimiento" (1)<br />
En contraste con la biblioteca tradicional, el uso de la información electrónica es atractiva porque<br />
puede ser facilmente puesta al día, diseminada y compartida. Los libros en texto completo y las<br />
bibliotecas electrónicas ofrecen ventajas no posibles a traves de medios convencionales, tales<br />
como realizar búsquedas con una rapidez y exactitud nunca sospechadas.<br />
El concepto de texto completo no es nuevo. Hace ya varios años que grandes firmas<br />
norteamericanas, instituciones privadas y organismos internacionales, incluso Naciones Unidas, lo<br />
han estado desarrollando, aunque a costos muy elevados. Lo novedoso es que su demanda y<br />
disponibilidad sigue aumentando considerablemente, especialmente las revistas en texto completo.<br />
Aparecen nuevos equipos a bajo costo que lo vuelven más accesible a pequeñas empresas. De<br />
pronto se transforma en la tecnología preferida para compartir información. (2)<br />
Los documentos electrónicos podrán definirse como una colección de páginas dinámicas (cambian<br />
su forma), con información interactiva (reaccionan de varias maneras en respuesta al usuario) (3).<br />
La mayoría de los documentos electrónicos se originan de archivos producidos por procesadores de<br />
palabras, que a su vez generan la copia impresa. En este proceso se convierten textos marcados
para ser impresos convencionalmente, a bases de datos que permiten su recuperación y<br />
diseminación, incluyendo imágenes (gráficos, tablas estadísticas, fotos, etc).<br />
La dinámica del texto completo surge de los productos en el mercado que permiten marcar partes<br />
del texto, insertar anotaciones, leer página por página, saltar de una página a otra, cambiar de<br />
estilos, colocar líneas o espacios para acomodar preferencias individuales, y colocar enlaces de<br />
hipertexto, ya sea pre-definidos o propios.<br />
El hipertexto, elemental para la recuperación en texto completo, (dirige al usuario a las fuentes de<br />
información), consiste en unidades de información que se llaman "nodos" conectados por<br />
relaciones llamadas "lazos".<br />
El valor de la búsqueda en texto completo se demuestra en numerosos estudios de comparación de<br />
este tipo de bases con bases de datos bibliográficas, en el cual se prueba que se encuentra más<br />
material relevante, especialmente cuando éste va acompañado de descriptores asignados<br />
manualmente (4).<br />
<strong>BASE</strong> <strong>DE</strong> <strong>DATOS</strong> <strong>EN</strong> TEXTO COMPLETO <strong>DE</strong> LA MEMORIA INSTITUCIONAL <strong>DE</strong> OPS.<br />
PROPOSITO FINAL:<br />
Ofrecer al personal de la OPS, de la Región y a otros usuarios, un sistema electrónico eficiente y<br />
eficaz para recoger, organizar, preservar, recuperar y diseminar los valiosos documentos técnicos<br />
originados por la Organización, incluyendo imágenes.<br />
OBJETIVO PRINCIPAL:<br />
Ayudar a fortalecer la capacidad de la OPS al prestar cooperación técnica a los países de América<br />
Latina y del Caribe y servir de instrumento para facilitar la toma de decisiones, no sólo al personal<br />
de la OPS, sino también a todos los actores envueltos en mejorar la salud de los pueblos de la<br />
Región.<br />
El desarrollo de una base de datos de texto completo, exclusiva para la documentación técnica<br />
generada por OPS, se concibe como un medio eficaz para resolver grandes problemas de acceso a<br />
esta información, tales como la falta de una recolección integral de documentos, la falta de<br />
uniformidad en la presentación de los datos bibliográficos mínimos, su lenta búsqueda,<br />
recuperación y diseminación. Como resultado se intenta evitar la duplicación de las investigaciones<br />
y de los proyectos de desarrollo, consultorías y otros productos y ayudar al personal interno, así<br />
como a sus contrapartes en los países de la Región, en la toma de decisiones.<br />
También se consideró la urgente necesidad de ahorrar espacio físico en las oficinas de OPS, ahorrar<br />
en los costos de producción y de diseminación de la información, y en esfuerzo humano al evitar la<br />
duplicación en la entrada de datos bibliográficos.<br />
Para esto se establecio que la base de datos deberá llenar los siguientes requisitos: (a) ser un<br />
sistema electrónico y amistoso, a bajo costo; (b) accesible a traves de LAN y del WEB; (c) proveer<br />
rapidez en la recuperación; (d) permitir recuperaci\n desde registros bibliográficos con los campos<br />
utilizados por BIREME; (e) permitir la entrada de datos bibliográficos en forma rápida y lo más<br />
automatizada posible; (f) utilizar al máximo la tecnología que está en uso en OPS.<br />
El proyecto se inició en 1995 con la contratación de consultores con gran experiencia y prestigio<br />
profesional. Se contemplaron tres etapas en el desarrollo e implementaci\n de este proyecto:
1. IMPLEM<strong>EN</strong>TACION Y <strong>DE</strong>SARROLLO - BIBLIOTECA <strong>DE</strong> LA SE<strong>DE</strong>.<br />
Objetivo: Desarrollar todos los elementos necesarios, incluyendo productos de prueba. Fecha: 1996.<br />
Se incluyo la evaluación y elección de un programa comercial a bajo costo, la preparación de los<br />
formatos base y macros para el procesador de palabras, pruebas de recuperación de información,<br />
preparación de manuales, guías y entrenamiento. Paralelamente, se estudió el acceso a través de<br />
LAN, WEB (con diseño de pantallas para LAN y el WEB) y el uso de SGML para producir discos<br />
compactos.<br />
2. IMPLEM<strong>EN</strong>TACION <strong>EN</strong> LA OFICINA C<strong>EN</strong>TRAL (Washington, D.C.)<br />
Objetivo: Operacionalizar la base de datos en texto completo incluyendo todos los Programas<br />
Técnicos de la Oficina Central. Fecha: 1997. Incluyó entrenamiento y preparación de guías.<br />
3. IMPLEM<strong>EN</strong>TACION <strong>EN</strong> LAS OFICINAS <strong>DE</strong> PAISES.<br />
Objetivo: Operacionalizar la base de datos en las Oficinas OPS en la Región. Prevista para<br />
1998-1999. Esto incluye asesoría por parte de la Biblioteca, especialmente entrenamiento.<br />
<strong>DE</strong>SARROLLO <strong>DE</strong>L PROYECTO:<br />
Se estudiaron las necesidades básicas de manejo de documentación de la OPS (tipo de<br />
documentos,etc). Se evaluaron los programas de recuperación en texto completo disponibles en el<br />
mercado, considerando su costo/beneficio. (Se compar\ TMS Inner View, InterMAX, TMS Quickview,<br />
InfoAccess Kinetic EBT, CJS/Wordkeeper + Acrobat y FolioVIEWS).<br />
Como procesador de palabras se eligió WordPerfect 5.1 (programa utilizado por la OPS, aunque<br />
posteriormente se cambiaría a WORD).<br />
Para preservar en disco compacto, se escogió SGML (Standard Generalized Markup Language),<br />
estandar universal para archivos de texto e intercambio de información y una de las técnicas más<br />
novedosas en el mundo de la publicación y diseminación electrónica. Presenta flexibilidad para<br />
adaptarse a nuevos softwares y tecnologías de comunicación que aparezcan en el futuro (5).<br />
Para la recuperaci\n del texto completo, con imágenes, se eligió FolioVIEWS (Folio Corporation).<br />
Además de ser compatible con DOS, WINDOWS y Macintosh, presenta códigos para formatear<br />
compatibles con procesadores de palabras, es multiusuario y multieditor.<br />
Opera con discos compactos, en el WEB, y se puede colocar multimedios dentro del texto o en<br />
ventanas separadas.<br />
Sin embargo, una de las mayores ventajas de FolioVIEWS está en la bdsqueda y recuperación:<br />
recupera cada palabra del texto (cada palabra es indizada, y su índice se pone al dRa<br />
automaticamente), permite búsqueda booleana, proximidad, truncaciones, bdsqueda por frases y/o<br />
limitada a campos específicos, y tiene un excelente tiempo de respuesta. Además presenta<br />
despliegue adecuado de pantallas, tiene interface multilingüe, acepta diacríticos, notas y tablas en<br />
"pop-up". También permite buscar bajo "QUERY" por cada palabra en el texto, y preparar pantallas<br />
de búsquedas con elementos propios.<br />
Como parte del proyecto se prepararon estas pantallas de búsquedas en FolioVIEWS según las<br />
necesidades de la OPS (ligadas a los datos bibliogr
metodología LILACS con instrucciones en línea. También se utilizó el Autor de SGML para WORD,<br />
para convertir texto a SGML.<br />
Por último se entrenó al personal de la Biblioteca, se realizaron presentaciones a nivel de la<br />
Dirección y se asignaron puntos focales en las oficinas generadoras de documentos.<br />
PROCESO TECNICO<br />
El proceso técnico se realiza en dos puntos principales: En las oficinas de los Programas Técnicos y<br />
en la Biblioteca de la Sede. (Vease Fig.)<br />
1. PROGRAMAS TECNICOS: Al iniciarse un nuevo documento, el personal asignado en los<br />
Programas Técnicos: (a) llama el formato de entrada bibliográfica en MS ACESS desde el menú del<br />
LAN y entra los datos bibliográficos; (b) envía a la Biblioteca el cuerpo de la versión FINAL del<br />
documento en formato electrónico, preferentemente en WORD con las imágenes (colocadas dentro o<br />
fuera de WORD). Si el documento es enviado en WordPerfect, PageMaker or PDF (Portable Data File),<br />
la Biblioteca lo convierte a WORD;(c) envía copia en papel a la Biblioteca para asegurar que se<br />
incluye completo.<br />
2. BIBLIOTECA <strong>DE</strong> LA SE<strong>DE</strong>: La Biblioteca de la Sede recibe la información bibliográfica en MS<br />
ACCESS a través del LAN: (a) Chequea la información, corrige y agrega lo que falta y la transfiere a<br />
WORD; (b) Prepara el texto del documento, asignando a cada párrafo el nivel de categoría de los<br />
subtítulos; (c) Prepara los grupos y enlaces a la tabla de contenido; (d) Reformatea las tablas y<br />
gráficas; (e) Valida la indización por frases; (f) Crea una nueva INFO<strong>BASE</strong> desde el archivo ASCII para<br />
su precisión y consistencia; (g)Traspasa todo a la base de producción y la copia para acceso en el<br />
LAN; (j) Realiza el rastreo de las imágenes si ellas no vienen incorporadas en el texto en WORD.<br />
Fig.<br />
Flujo del proceso de desarrollo de la base de datos desde la creación del documento hasta su<br />
recuperación.<br />
REQUISITOS MINIMOS PARA LA CREACION <strong>DE</strong> LA <strong>BASE</strong> <strong>DE</strong> <strong>DATOS</strong> <strong>EN</strong> TEXTO COMPLETO:<br />
De la experiencia de la Biblioteca de la Sede se desprende que para implementar un tipo de base<br />
de datos semejante a la de OPS, se requiere como mínimo:<br />
1. RECURSOS ADMINISTRATIVOS: (a) Apoyo de la Dirección (lo que es fundamental; (b)<br />
Identificación y formulación de guías y políticas institucionales para iniciar el proyecto en toda la<br />
institución; (c) Definición del contenido de la base de datos y los niveles de confidencialidad; (d)<br />
Establecimiento de los elementos de entrada bibliográfica y de recuperación deseados.<br />
2. RECURSOS HUMANOS: Contar con el número necesario de personal calificado. En el caso de la<br />
Biblioteca de la Sede, que genera un promedio de 120 docs. al mes, se necesita un bibliotecario<br />
profesional a cargo de todo el proceso, un bibliotecario para el procesamiento del material, un<br />
ayudante para la entrada de datos y una persona de sistema para resolver problemas de rutina. Al<br />
establecerse la rutina de trabajo, el tiempo estimado de procesamiento para un documento en la<br />
base en texto completo deberRa llegar a ser m
consideró el equipo que ya estaba instalado en la Organización: PC 486 e impresora, procesador de<br />
palabras, INTERNET WEB). El equipo que se adquirió fue: FolioVIEWS (PIDK) en versi\n para una<br />
sola terminal (US$ 3.195), PC Pentium (modelo 1200W, 16 mb RAM, 1 mb video DRAM, 1.2 gb disco<br />
duro (US$ 2.339), escritor de disco compacto (US$ 1.500), editor de WINDOWS (US$ 600), "scanner"<br />
(US$ 600). La producción de cada disco compacto confeccionado dentro de la OPS tendría un costo<br />
de alrededor de US$ 1.45 (realizada por fuentes externas costaría alrededor de US$ 2.500).<br />
Se estimó que en cada oficina de OPS en los países se necesitaría una inversión inicial de equipo a<br />
un costo mínimo, ya que gran parte del equipo ya está instalado y que las copias de FolioVIEWS se<br />
pueden obtener a bajo costo (hay acuerdo para usarlo sin fines comerciales).<br />
ESTADO ACTUAL <strong>DE</strong>L PROYECTO:<br />
La implementación de la base de datos se desarrolló exitosamente.<br />
La base de datos en texto completo tiene alrededor de 150 docs., accesibles a través de LAN.<br />
Dentro de 1998 estará accesible en Internet/WEB e Intranet, y muy pronto se empezar< su<br />
implementación en las oficinas de OPS en los países.<br />
La recuperaci\n de la información probó ser rápida y efectiva, ya que además de navegar por todo el<br />
texto (capítulos, subcapítulos párrafos, etc.), de recuperar las im
CITAS BIBLIOGRAFICAS<br />
1. Manville, Phillip Brook. Tradition and Innovation in the<br />
Management of Professional Knowledge: A Case Study of a<br />
"Virtual Library". Harvard Library Bulletin, Vol 4, No. 1,<br />
Spring 1993. p. 29.<br />
2. Sievert, Mary Ellen C. Full-Text Information Retrieval:<br />
Introduction. (Journal of the American Society for<br />
Information Science, Vol. 47 No. 4, 1966, p. 261-262)<br />
3. Barker, Phillip. Living Books and Dynamic Electronic<br />
Libraries. (The Electronic Library, Vol 14, No.6, December<br />
1996, p. 491-502)<br />
4. Fidel, Raya, Truli Bellardo Han, Edie M. Rasmussen and<br />
Phillip J. Smith, eds. Challenges in Indexing Electronic<br />
Text and Images. Medford, N.J, American Society for<br />
Information Science, 1994.<br />
5. Sahffstall, Anthony L. SGML: What it is and its benefits<br />
(En: Hegelson, Linda W. CD-ROM: Facilitating Electronic<br />
Publishing. New York, Van Nostrand Reinhold, 1992, p.410)