Funcionalidad 4: Almacenes de Datos y Bases de Datos XML ...

UNIVERSIDAD DE CASTILLA-LA MANCHA 

ESCUELA SUPERIOR DE INFORMÁTICA 

Funcionalidad 4: 

Almacenes de Datos y Bases de Datos XML 

Eduardo Fernández Almodóvar 

Miguel Gómez Ortiz 

Quiteria López López 

Alberto Morillo Balcázar 

Nicolás Novalvos Novalvos 

Javier Rosado Quintanilla 

Asignatura: Modelos Avanzados de Bases de Datos 

Titulación: Ingeniería Informática 

Fecha:

MMAABBDD Funcionalidad 4: 


Índice 

ALMACENES DE DATOS ............................................................................................. 3 

2 

Introducción ............................................................................................................................ 3 

Conceptos Básicos................................................................................................................... 3 

Diseño y Construcciones......................................................................................................... 4 

1. Diseño en Estrella......................................................................................................................4 

1.1. Tablas Factuales y Dimensionales........................................................................................5 

2. Modelo Conceptual de Almacenes de Datos.............................................................................5 

2.1. Metodología para el Diseño de Almacenes de Datos de Golfarelli y rizzi ...........................5 

2.2. Perfil UML para el Modelado de Almacenes de Datos de Trujillo ......................................6 

Componentes ........................................................................................................................... 7 

1. Metadatos ..................................................................................................................................7 

2. Middleware................................................................................................................................7 

3. Mecanismos de Extracción........................................................................................................8 

4. Mecanismos de Carga ...............................................................................................................8 

Importancia en las Empresas................................................................................................. 8 

Ejemplo de Almacén de Datos ............................................................................................... 9 

BASES DE DATOS XML ............................................................................................. 10 

Introducción .......................................................................................................................... 10 

Documentos XML................................................................................................................. 10 

Lenguajes de navegación...................................................................................................... 11 

Almacenamiento en Bases de Datos XML .......................................................................... 14 

1. Bases de Datos XML Nativas..................................................................................................14 

2. Almacenamiento en bases de datos XML construidas a partir de tecnologías existentes........15 

Extensión del estándar SQL................................................................................................. 15 

Ejemplo de Bases de Datos XML ........................................................................................ 16 

COMPARACIÓN DE AMBOS MODELOS ................................................................ 17 

BIBLIOGRAFÍA ........................................................................................................... 18



Introducción 

3 

ALMACENES DE DATOS 

Los almacenes de datos son el centro de atención para las grandes empresas de hoy en 

día, ya que constituyen uno de los soportes fundamentales para el proceso de toma de decisiones 

gerenciales; de ahí la importancia de que la información guardada en ellos sea confiable y con 

calidad. Uno de los procesos en la construcción de estos y que contribuye a lograr este objetivo 

es la limpieza de datos, y junto con ella la estandarización. 

Conceptos Básicos 

Un Almacén de Datos o Data Warehouse (DW) es un almacén de información temática 

orientado a cubrir las necesidades de aplicaciones de los sistemas de Soporte de Decisiones 

(DSS) y e la Información de Ejecutivos (EIS), que permite acceder a la información corporativa 

para la gestión, control y apoyo a la toma de decisiones. Dicha información es construida a 

partir de bases de datos que registran las transacciones de los negocios de las organizaciones 

(bases de datos operacionales), y su importancia reside en elementos como los siguientes: 

características: 

Contribuye a la toma de decisiones tácticas y estratégicas proporcionando un 

sentido automatizado para identificar información clave desde volúmenes de datos 

generados por procesos tradicionales o elementos de software. 

Posibilita medir las acciones y los resultados de una mejor forma. 

Los procesos empresariales pueden ser optimizados. El tiempo perdido esperando 

por información que finalmente es incorrecta o no encontrada, es eliminada. 

Permite a los usuarios dar prioridad a decisiones y acciones, por ejemplo, a qué 

segmentos de clientes deben ir dirigidas las siguientes acciones de marketing. 

En general un almacén de datos es un conjunto de datos con las siguientes 

Temático: Los datos están almacenados por materias o temas (clientes, campañas, 

productos). Estos se organizan desde la perspectiva del usuario final, mientras que 

en las Bases de Datos operacionales se organizan desde la perspectiva de la 

aplicación con vistas a lograr una mayor eficiencia en el acceso a los datos. 

Integrado: Todos los datos almacenados en el DW están integrados. Las bases de 

datos operacionales orientadas hacia las aplicaciones fueron creadas sin pensar en 

su integración, por lo que un mismo tipo de datos puede ser expresado de diferente 

forma en dos bases de datos operacionales distintas. Por ejemplo, para representar el 

sexo: ‘Femenino’ y ‘Masculino’ o ‘F’ y ‘M’.



4 

No volátil: Únicamente hay dos tipos de operaciones en el DW: la carga de los 

datos procedentes de los entornos operacionales (carga inicial y carga periódica) y 

la consulta de los mismos. La actualización de datos no forma parte de la operativa 

normal de un DW. 

Histórico: El tiempo debe estar presente en todos los registros contenidos en un 

DW. Las bases de datos operacionales contienen los valores actuales de los datos, 

mientras que los DW contienen información actual y resúmenes de esta en el 

tiempo. 

Diseño y Construcciones 

Existen actualmente 2 tendencias en cuanto al diseño de almacenes de datos: 

Diseño directo (“en estrella”) de estructuras lógicas de datos (sobre el modelo 

relacional). 

Utilización de una etapa previa basada en un modelo conceptual, de forma análoga 

al diseño de bases de datos. 

1. Diseño en Estrella 

Este método se basa en el “esquema en estrella”, que consiste en un modelo asimétrico con 

una tabla grande dominante en el centro del esquema, que se encarga de conectar las otras 

tablas. 

Figura 1. Ejemplo de diseño en estrella. 

El esquema en estrella básico tiene 4 componentes: hechos, dimensiones, atributos y 

jerarquías de atributo. Cada uno de estos componentes se describe a continuación: 

Los hechos son mediciones numéricas que representan un aspecto o actividad de 

negocio específica. Por ejemplo, las cifras de ventas. 

Las dimensiones son características calificadoras que proporcionan perspectivas 

adicionales de un hecho dado. Por ejemplo, las ventas podrían compararse por 

producto de una región a otra.



5 

Cada tabla de dimensiones contiene atributos. Con frecuencia se utilizan los 

atributos para buscar, filtrar o clasificar hechos. Por consiguiente, el diseñador del 

almacén de datos debe definir atributos de negocio comunes que serán utilizados 

por el analista de datos para limitar una búsqueda, agrupar información o describir 

dimensiones. Si seguimos utilizando un ejemplo de ventas tendríamos: 

o Dimensión producto: ID del producto, descripción, tipo de producto, etc. 

o Dimensión ubicación: región, estado, ciudad y número de tienda. 

o Dimensión tiempo: año, trimestre, mes, semana, etc. 

Los atributos dentro de las dimensiones pueden ordenarse en una jerarquía bien 

definida. La jerarquía de atributos proporciona una organización descendente que 

se utiliza para dos propósitos principales: agregación, análisis de datos con mayores 

y menores niveles de agregación. 

1.1. Tablas Factuales y Dimensionales 

Tabla Factual: Es la tabla central que contiene los datos (hechos) sobre las diferentes 

combinaciones de las dimensiones. Su clave primaria se crea combinando las claves primarias 

de sus dimensiones relacionadas. Puede suceder que la tabla factual no tenga hechos y que se 

utilice simplemente para registrar las relaciones entre las diferentes dimensiones. 

Dimensiones: Para cada una de las dimensiones se crea una tabla, almacenado así las 

descripciones de las dimensiones. Los atributos de las tablas dimensionales son textuales, 

discretas y se utilizan para restricciones y cabeceras de filas en el conjunto de respuesta del 

usuario. 

2. Modelo Conceptual de Almacenes de Datos 

2.1. Metodología para el Diseño de Almacenes de Datos de Golfarelli y rizzi 

Consta de siete fases: 

1. Análisis y reconciliación de las fuentes de datos. En esta fase se analizan los 

esquemas locales y se normalizan para posteriormente integrase. 

2. Análisis de requisitos, mediante entrevistas y reuniones coordinadas con los 

usuarios de datamart. 

3. Modelado conceptual, para el que proponen el modelo factual dimensional. Este 

está compuesto por varios esquemas de hechos.



6 

Figura 2. Esquema de hechos. 

Para cada hecho se construye un “árbol de atributos”, para posteriormente “podar e 

injertar” este árbol definiendo las dimensiones y las medias correspondientes. 

4. Refinamiento de la carga de trabajo y validación del esquema conceptual. La 

carga de trabajo es un conjunto de pares formados por consultas y su 

correspondiente frecuencia o importancia para el usuario. 

5. Diseño lógico, en esta fase se pasa de los esquemas de hecho a los esquemas en 

estrella, de forma casi directa. 

6. Diseño de alimentación. Consiste en definir los procedimientos necesarios para 

cargar el datamart a partir de los datos provenientes de las fuentes operacionales. 

7. Diseño físico, consistente en la elección de los índices y en la ubicación de los datos 

en los soportes físicos. 

2.2. Perfil UML para el Modelado de Almacenes de Datos de Trujillo 

El perfil de UML contiene estereotipos necesarios para acometer con éxito el modelado 

conceptual de almacenes de datos. 

NOMBRE DESCRIPCIÓN ICONO 

Fact Las clases de este estereotipo representan hechos 

Dimension Las clases de este estereotipo representan dimensiones 

Base 

Las clases de este estereotipo representan niveles de una 

jerarquía dimensional 

Tabla 1. Estereotipos de clases.



7 

NOMBRE DESCRIPCIÓN ICONO 

OID 

FactAttribute 

Descriptor 

DimensiónAttribute 

Los atributos con este estereotipo representan los 

OID de clases factuales, dimensionales o base 

Los atributos con este estereotipo representan 

atributos de clases factuales 


atributos descriptores de clases dimensionales o base 


atributos de clases dimensionales 

Tabla 2. Estereotipos para atributos. 

Las clases de hechos se definen como clases compuestas en una relación de agregación 

de n clases de dimensión. La cardinalidad mínima en el rol de las clases de dimensión es 1 para 

indicar que todo hecho ha de estar siempre relacionado con todas las dimensiones. 

Componentes 

1. Metadatos 

Uno de los componentes más importantes de la arquitectura de un DW es el Metadato. 

Es definido comúnmente como "datos acerca de los datos", en el sentido de que se trata de datos 

que describen cuál es la estructura de los datos y cómo se relacionan. 

El Metadato documenta exactamente, entre otras cosas, qué tablas existen para esa 

aplicación, qué columnas posee cada una de las tablas y qué tipo de datos se pueden almacenar. 

Los datos son de interés para el usuario final, el Metadato es de interés para los programas que 

tienen que manejar estos datos. Sin embargo, el rol que cumple el Metadato en un ambiente de 

DW es muy diferente al rol que cumple en los ambientes operacionales. En un ambiente de DW 

el Metadato juega un papel fundamental. 

El papel del Metadato es recoger todas las definiciones de la organización y concepto 

de los datos en un "almacén de datos", debe contener toda la información concerniente a: 

Tablas, Columnas de tablas, Relaciones entre tablas, Jerarquías y Dimensiones de datos, 

Entidades y Relaciones. 

2. Middleware 

El Middleware es un software de conectividad que ofrece un conjunto de servicios que 

hacen posible el funcionamiento de aplicaciones distribuidas sobre plataformas heterogéneas. 

La función del Middleware es la de asegurar la conectividad entre todos los componentes de la 

arquitectura de un DW. El Middleware puede verse como una capa Application Programming 

Interface (API), con base a la cual los programadores pueden desarrollar aplicaciones que



trabajen en diferentes ambientes sin preocuparse de los protocolos de red y comunicaciones en 

que se correrán. De esta manera se ofrece una mejor relación costo/rendimiento que pasa por el 

desarrollo de aplicaciones más complejas, en menos tiempo. 

8 

3. Mecanismos de Extracción 

Otro de los componentes de la arquitectura de un DW son los sistemas OLAP. Los 

sistemas OLAP se enmarcan en lo que podríamos llamar las bases de datos corporativas. Los 

objetivos fundamentales en este entorno son el análisis de la información, es decir, el sistema en 

que almacenemos la información ha de proveer de funciones de consulta analítica y de apoyo a 

la toma de decisiones. Este tipo de consultas en Sistemas Gestores de bases de datos (SGBD) 

relacionales son complejas e involucran cruzar información de varias tablas, lo que se traduce 

en un pobre rendimiento. 

En los sistemas OLAP la información ya no se almacena en tablas, sino en cubos de n 

dimensiones. Se construye a partir de una tabla principal, llamada tabla de hechos, que enumera 

los hechos ciertos en el sistema. A ella se va añadiendo una dimensión por relación cuya 

información que se quiera almacenar, de manera que todas están precalculadas en el sistema. 

4. Mecanismos de Carga 

Existen dos formas básicas de desarrollar esta tarea: 

Acumulación simple. La acumulación simple es, sin duda, la más sencilla y común, 

y consiste en realizar una sumarización o resumen de todas las transacciones 

comprendidas en el período de tiempo seleccionado y transportar el resultado como 

una única transacción hacia el DW. 

Rolling. El proceso de Rolling por su parte, se aplica en los casos en que se opta por 

mantener varios niveles de granularidad. Para ello se almacena información 

resumida a distintos niveles, correspondientes a distintas agrupaciones de la unidad 

de tiempo. 

Importancia en las Empresas 

Los almacenes de datos son el centro de atención para las grandes empresas de hoy en 

día, ya que constituyen uno de los soportes fundamentales para el proceso de toma de decisiones 

gerenciales; de ahí la importancia de que la información guardada en ellos sea confiable y con 

calidad. Uno de los procesos en la construcción de estos y que contribuye a lograr este objetivo 

es la limpieza de datos, y junto con ella la estandarización de direcciones. Para comunicarse 

efectivamente con sus clientes, por teléfono o por correo, una empresa debe mantener una lista 

de sus clientes extraordinariamente limpia y con sus direcciones normalizadas. Esto evita 

problemas como el de la pérdida de credibilidad o de imagen de la organización, al hacer envíos 

precisos y al brindarle al cliente un servicio más rápido y profesional.



¿QUE ES ESTANDARIZACION? IMPORTANCIA DE LA ESTANDARIZACION DE 

DIRECCIONES PARA LAS EMPRESAS DE HOY EN DIA 

9 

La estandarización forma parte de los seis pasos necesarios para llevar a cabo la 

limpieza de datos. Esta consiste en separar la información en diferentes campos, así como 

unificar ciertos criterios para un mejor manejo y manipulación de los datos. 

Hay muchos ejemplos de aplicaciones basadas en la información del cliente que 

necesitan que sus datos, y principalmente sus direcciones tengan integridad, algunos de ellos 

son: Sistemas CRM (Customer Relationship Management, Gestión de las Relaciones con el 

Cliente), E-Business (Negocios electrónicos), Call Centers (Oficina o compañía centralizada 

que responde llamadas telefónicas de clientes o que hacen llamadas a clientes (Telemarketing)), 

Sistemas de Marketing. 

Del mismo modo, podemos mencionar algunas de las organizaciones que mayormente 

son beneficiadas por la limpieza de los datos de sus clientes: Bancos y Finanzas, Gobierno, 

Salud, Telecomunicaciones. 

Ejemplo de Almacén de Datos 

Figura 3. Ventas Figura 4. Esquema de hechos de ventas



10 

BASES DE DATOS XML 

Introducción 

El Lenguaje de marcas extensible (XML) no se concibió como una tecnología para 

bases de datos inicialmente. Al igual que el lenguaje HTML, XML tiene sus raíces en la gestión 

de documentos y está derivado de un lenguaje para estructurar documentos grandes. Sin 

embargo, XML puede representar datos de bases de datos, así como muchas clases de datos 

estructurados. Resulta de gran utilidad como formato de datos cuando las aplicaciones se deben 

comunicar con otra aplicación o integrar información de varias aplicaciones. 

Los principales motivos de la aparición de las bases de datos XML son la proliferación 

de la Web y la necesidad creciente de compartir información estructurada dentro de las 

empresas ó con otras empresas. Por lo tanto se deduce la necesidad de crear un nuevo tipo de 

base de datos que resuelva estos problemas. 

Para comprender las bases de datos XML es importante conocer sus raíces como un 

lenguaje de marcas de documentos. Por el concepto de marca entendemos cualquier elemento en 

un documento del que no se tiene intención que sea parte de la salida impresa. Las bases de 

datos XML permiten presentar información estructurada, ya que esta viene definida por las 

marcas de los distintos archivos. 

Documentos XML 

El constructor en un documento XML es el elemento. Los documentos XML deben de 

tener un único elemento raíz que abarque al resto de elementos donde los elementos hijos del 

elemento raíz se deben anidar adecuadamente. Las representaciones anidadas se usan 

ampliamente en las aplicaciones de intercambio de datos XML. Por tanto, la estructura de 

etiquetas anidadas dentro de un archivo XML hace que se disponga de una estructura de árbol. 

Características de los documentos XML: 

Posee mensajes auto-documentados: no se tiene que consultar un esquema para 

comprender el significado del texto. 

El formato del documento no es rígido: se puede agregar información adicional tal 

como etiquetas 

XML permite estructuras anidadas: En un modelo relacional el anidamiento lo 

tendríamos que incluir en una tabla aparte, por lo que en bases de datos relacionales 

esto no era posible 

Gran variedad de herramientas disponibles para ayudar a su procesamiento



11 

Esquema de los documentos XML: 

Definición de tipos de documentos (DTD): Es una parte opcional de un documento 

XML. Su propósito es restringir el tipo de información presente en el documento, de 

forma que restringe el aspecto de los subelementos y atributos de un elemento. 

XML Schema: Se trata de un intento de reparar las deficiencias del mecanismo 

DTD, ampliando el sistema de tipos. XML Schema define varios tipos predefinidos 

como string, integer, bolean, etc y también permite tipos definidos por el usuario. 

Lenguajes de navegación 

Los lenguajes utilizados para transformar y consultar los datos son esenciales para la 

extracción de información de datos XML así como para convertir los datos entre distintas 

representaciones en XML. Dado que XML representa datos semiestructurados, es importante la 

existencia de lenguajes de consulta que combinen las características de los lenguajes 

tradicionales de consulta de datos con los lenguajes de recuperación de información. 

En todos los lenguajes se usa un modelo de árbol de datos XML a la hora de realizar las 

consultas. Cada documento es por tanto un árbol con nodos siendo los nodos elementos o 

atributos con las siguientes propiedades: 

Tan solo en el caso de que el nodo sea un elemento puede tener nodos hijos. (Cada 

nodo distinto del nodo raíz tiene un nodo padre que es un elemento). 

El orden de elementos y atributos en el documento XML se modela ordenando los 

nodos hijos del árbol. 

El nodo raíz tiene un único hijo, que es el elemento raíz del documento.



Los lenguajes que proporcionan más capacidades de consulta y transformación son: 

12 

XPath: Trata partes de los documentos XML mediante expresiones de rutas de acceso, 

recorriendo documentos XML a partir de dichas rutas. Cada expresión de ruta XPath es 

una secuencia de pasos de ubicación separados por el carácter“/” (que indica la raíz del 

documento). Como resultado de la expresión se obtiene una lista de nodos. Se puede 

acceder a los valores de los atributos usando el símbolo @. 

Ejemplo: /banco-2/cuenta/@numero_cuenta devuelve un conjunto de nodos con todos 

los valores del atributo numero_cuenta de los elementos de cuenta. 

XPath permite incluir restricciones para devolver una lista de nodos según las 

condiciones deseadas. 

Ejemplo: /banco-2/cuenta[saldo>400] devuelve los elementos de cuenta con un valor de 

saldo mayor que 400. 

Otras funciones disponibles para XPath son: 

o Comprobación de la posición de un nodo en el orden de los hermanos 

o Función de agregación Count() que cuenta el número de nodos coincidentes con 

la expresión a la que se aplica. 

o El operador “|” permite unir resultados de expresiones 

o Las expresiones XPath pueden saltar varios niveles de nodos mediante el uso de 

“//”. Resulta de gran utilidad para poder buscar los datos necesarios sin un 

conocimiento completo de un esquema. 

o La función predeterminada doc(nombre) devuelve la raíz de un documento con 

nombre, siendo el nombre el de un archivo o una URL. 

XQuery: Se trata del lenguaje de consulta estandarizado de XML. XQuery procede de 

un lenguaje de consulta denominado Quilt, el cual incluye características de lenguajes 

como XPath o SQL. 

Las consultas tienen una sintaxis similar a la de SQL. Cada consulta se escribe mediante 

una expresión denominada FLWOR. Una expresión de éste tipo consta de las siguientes 

cláusulas: 

o For: Es como la cláusula from de SQL y proporciona una serie de variables 

cuyos valores son los resultados de expresiones XPath 

o Let: Permite asignar el resultado de expresiones Xpath al nombre de las 

variables. No tiene equivalente en SQL. 

o Where: Es igual que la cláusula where de SQL 

o Order by: Permite la ordenación de las tuplas de salida.



13 

o Return: Permite la construcción de resultados en XML de la expresión devuelta. 

Cuando en la cláusula return se encuentra un elemento como 

que inicia una expresión, trata su contenido como texto XML normal, excepto 

partes encerradas entre llaves, que se evalúan como expresiones. 

XQuery proporciona otra forma de construir elementos usando constructores element y 

attribute dentro de la cláusula return. Además, las expresiones FLWOR de XQuery se 

pueden anidar en la cláusula return con el fin de generar anidamientos de elementos que 

no aparecen en el documento origen. Son similares a las subconsultas anidadas en la 

cláusula from de las consultas SQL 

XQuery no proporciona un constructor group by, las consultas de agregación se pueden 

escribir usando funciones de agregado sobre expresiones de ruta anidadas dentro de la 

cláusula return. En cambio los resultados se pueden ordenar si se incluye una cláusula 

order by. XQuery también soporta funciones definidas por el usuario 

Otras propiedades relevantes son: 

o El resultado de una consulta XQuery es un conjunto de nodos en el que pueden 

existir nodos repetidos. Para eliminar duplicados se utiliza la funcion distinct() 

o Se permiten funciones definidas por el usuario. 

o Posibilidad de incluir cuantificadores some y any. 

XSLT: XSL, que se trata de un lenguaje de hojas del estilo de XML, incluye un 

lenguaje de transformación de propósito general denominado XSLT. Éste lenguaje 

permite convertir documentos XML de una sintaxis a otra (por ejemplo, de un XML a 

otro o a un documento HTML). 

En XSLT las transformaciones se expresan utilizando reglas recursivas denominadas 

plantillas. Las plantillas permiten seleccionar contenido de los documentos XML 

mediante la utilización de expresiones Xpath. 

Existe un mecanismo importante denominado recursividad estructural que permite que 

cuando una plantilla coincide con un elemento en la estructura del árbol, las reglas de 

esa plantilla se aplican a los subelementos del árbol. 

 

 

 

 



14 

Produce como salida los títulos que existan en la referencia bibliográfica. 

XPointer: Es una extensión de XPath. Proporciona una forma de identificar de forma 

única fragmentos de un documento XML con el objeto de realizar vínculos. 

La extensión XPointer permite a XPath: 

o Seleccionar puntos, intervalos y nodos. 

o Utilizar coincidencias de cadenas para buscar información. 

o Utilizar expresiones de direccionamiento en referencias de URI como 

Ejemplo: 

identificadores de fragmentos. 

documento.xml#xpointer(/libro/capitulo[@public])xpointer(/libro/capitulo[@num="1"]) 

Almacenamiento en Bases de Datos XML 

La aparición de las BD XML proporcionan una alternativa directa para almacenar y 

gestionar los documentos XML. Existen diferentes soluciones para el almacenamiento de 

documentos XML 

1. Bases de Datos XML Nativas 

Surgen por la necesidad de almacenar documentos XML y por los problemas que 

existen para almacenarlos en un sistema relacional. Las bases de datos XML nativas soportan 

transacciones, acceso multi-usuario, lenguajes de consulta, etc., diseñadas especialmente para 

almacenar documentos XML. Algunos ejemplos son eXcelon Xis, Tamino, dbXML o GoXML. 

Las bases de datos nativas están centradas en el almacenamiento y en la gestión de 

documentos XML. Estos gestores tienen las siguientes características: 

Se define un modelo para la estructura de los documentos XML (DTD, XML 

Schema, etc.). 

Almacena y recupera documentos de acuerdo a ese modelo. 

Como mínimo el modelo debe incluir elementos, atributos, manejo de 

PCDATA y el orden del documento. 

No existe una restricción para el modelo de almacenamiento físico. 

Además el SGBD XML Nativo debe soportar concurrencia, recuperación de los 

documentos, seguridad, etc. También, debería soportar tecnologías relacionadas con XML 

como XPath o XQuery.



15 

Clasificación: 

Almacenamiento basado en texto. Almacena el documento XML entero en 

forma de texto y proporciona alguna funcionalidad de base de datos para 

acceder a él. 

o Aplican técnicas de compresión para reducir el tamaño. 

o Se mantiene índices para aumentar la eficiencia en el acceso. 

o Se pueden construir sobre un sistema de bases de datos relacional o 

sobre un sistema de archivos de texto. 

Almacenamiento basado en el modelo. Se define un modelo de datos lógico 

para la estructura de un documento XML, como por ejemplo DOM, y se utiliza 

este modelo para realizar el almacenamiento. 

2. Almacenamiento en bases de datos XML construidas a partir de tecnologías 

existentes 

Permiten el almacenamiento y la gestión de documentos XML en SGBD 

convencionales. Ejemplos de estas bases de datos son Oracle XMl DB, IBM DB2 XML 

Extender o Microsoft SQLXML. Existen dos aproximaciones para el almacenamiento: 

Almacenamiento no estructurado. 

o Los documentos XML se almacenan directamente en formato de texto 

como atributo de tipo fichero. 

o El SGBD proporciona funciones para poder acceder a la información 

dentro de los documentos XML. 

Almacenamiento estructurado. 

o La estructura de un documento XML se convierte a un esquema de la 

base de datos. 

o Para acceder al contenido de los documentos XML el SGBD 

proporciona funciones. 

Extensión del estándar SQL 

El estándar SQL:2003 ha definido una serie de extensiones para soportar XML. 

En estas se extensiones se define: 

Un tipo de dato XML nativo llamado XML 

Un conjunto de operadores para dicho tipo de datos. 

Un conjunto implícito de mapeos de los datos relacionales a XML



viceversa. 

16 

El tipo de dato XML permite tratar los documentos XML como: 

Valores relacionales dentro de las columnas de las tablas. 

Atributos definidos por el usuario. 

Variables. 

Parámetros de funciones. 

Algunas de las operaciones definidas son: 

XMLELEMENT para generar un valor xml . 

XMLCONCAT para concatenar una lista de valores xml. 

XMLPARSE para realizar un análisis sintáctico de una cadena de 

caracteres para generar un documento xml. 

XMLSERIALIZE para generar una cadena de caracteres a partir de un 

documento xml. 

El conjunto de mapeos que se definen es el siguiente: 

Mapeo de los identificadores SQL a nombres XML. 

Mapeo de tipo de datos SQL a tipos de datos XML Schema. 

Mapeo de tablas a documentos XML. 

Generación de un esquema XML. 

Estos mapeos se usan para convertir bases de datos relacionales a documentos XML y 

El problema es que si el documento XML no proviene de una bases de datos o se puede 

convertir a un esquema relacional. 

Ejemplo de Bases de Datos XML 

La siguiente consulta devuelve los títulos de los libros del año 2.000. Como “año” es un 

atributo y no una etiqueta se le antecede con un carácter “@”. 

for $b in doc("libros.xml")//libro 

where $b/@año = "2000" 

return $b/titulo



17 

COMPARACIÓN DE AMBOS MODELOS 

Mientras los almacenes de datos están enfocados a facilitar las consultas sobre grandes 

cantidades de datos con un tiempo de respuesta relativamente pequeño, las bases de datos XML 

tienen el objetivo de almacenar documentos XML, siendo los tiempos de respuesta mayores y 

las consultas más complejas. En ambos modelos, el estándar SQL se ha extendido para darles 

soporte. 

En principio ambos modelos no están normalizados, aunque existen algunas iniciativas 

de normalización para XML y bases de datos XML. 

La implantación de las bases de datos XML es elevada en el caso de las bases de datos 

que se han ampliado para dar soporte al almacenamiento de datos XML y baja en el caso de las 

bases de datos XML nativas. 

Los almacenes de datos están implantados en empresas con grandes volúmenes de 

información, ya que estos surgen como la solución para obtener un sistema capaz de dar soporte 

a la toma de decisiones estratégicas y tácticas, recibiendo datos de múltiples bases de datos 

operacionales.



18 

BIBLIOGRAFÍA 

Piattini, M., Marcos, E., Calero, C. y Vela, B. Tecnología y Diseño de Bases de 

Datos. RA_MA 

Connolly, Thomas M.. Sistemas de bases de datos: un enfoque práctico para diseño, 

implementación y gestión. Pearson, D.L. 2005 

Silberschatz, A., Korth, H.F. y Sudarshan, S. Fundamentos de Bases de Datos. 

McGraw-Hill 

Rob, Peter y Coronel, Carlos. Sistemas de Bases de Datos: Diseño, implementación y 

administración. 

http://150.185.75.30/atiwiki/index.php/BASES_DE_DATOS_XML 

http://es.wikipedia.org/wiki/Bases_de_datos_nativas_XML 

http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos 

http://www.monografias.com/trabajos31/almacenes-datos/almacenes-datos.shtml 

http://www.error500.net/garbagecollector/archives/categorias/bases_de_datos/ 

sistemas_olap.php 

http://kybele.escet.urjc.es/docencia/AplicBD/2007-2008/Material/%5BAplicBD-2007- 

08%5DDW_Parte2.pdf

Funcionalidad 4: Almacenes de Datos y Bases de Datos XML ...

Create successful ePaper yourself

Delete template?

Save as template?