Requêtes OLAP sur une base de données XML native - Cercle ...
Requêtes OLAP sur une base de données XML native - Cercle ...
Requêtes OLAP sur une base de données XML native - Cercle ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
2.2 Définitions 4<br />
2.2 Définitions<br />
Un entrepôt <strong>de</strong> <strong>données</strong> (data warehouse) est un lieu <strong>de</strong> stockage intermédiaire <strong>de</strong> différentes<br />
<strong>données</strong> en vue <strong>de</strong> la constitution d’un système d’informations décisionnelles. Un <strong>de</strong>s précurseurs<br />
du concept d’entrepôt <strong>de</strong> <strong>données</strong>, Bill Inmon [1], le définit comme suit :<br />
« Un entrepôt est <strong>une</strong> collection <strong>de</strong> <strong>données</strong> orientées sujet, intégrées, non volatiles<br />
et historisées, organisées pour le support d’un processus d’ai<strong>de</strong> à la décision. »<br />
Analysons point par point cette définition. Les <strong>données</strong> d’un entrepôt sont donc :<br />
⊲ Orientées sujet Les <strong>données</strong> sont orientées métier et donc triées par thèmes. L’intégration<br />
dans <strong>une</strong> structure unique est indispensable pour éviter aux <strong>données</strong> concernées par<br />
plusieurs sujets d’être dupliquées. Cependant, dans la pratique, il existe également <strong>de</strong>s<br />
entrepôts plus petits, les magasins <strong>de</strong> <strong>données</strong> (data marts) : l’entrepôt est fragmenté en<br />
plusieurs <strong>base</strong>s qui supportent l’orientation sujet.<br />
⊲ Intégrées Les <strong>données</strong> proviennent <strong>de</strong> plusieurs sources hétérogènes. Avant d’être intégrées<br />
dans l’entrepôt, les <strong>données</strong> doivent êtres mises en forme et unifiées afin d’avoir un<br />
état cohérent. Cela nécessite un gros travail <strong>de</strong> normalisation, <strong>de</strong> gestion <strong>de</strong>s référentiels<br />
et <strong>de</strong> cohérence.<br />
⊲ Non volatiles Les <strong>données</strong> sont stables et non modifiables. Un entrepôt <strong>de</strong> <strong>données</strong> doit<br />
garantir qu’<strong>une</strong> requête lancée à différentes dates <strong>sur</strong> les mêmes <strong>données</strong> donne toujours<br />
les mêmes résultats. De plus, les <strong>données</strong> d’un entrepôt sont mise à jour périodiquement,<br />
ce ne sont donc pas <strong>de</strong>s informations en temps réel.<br />
⊲ Historisées Les <strong>données</strong> sont historisées et donc datées : l’historisation est nécessaire<br />
pour suivre dans le temps l’évolution <strong>de</strong>s différentes valeurs <strong>de</strong>s indicateurs à analyser.<br />
Ainsi, un référentiel temps doit être associé aux <strong>données</strong> afin <strong>de</strong> permettre l’i<strong>de</strong>ntification<br />
<strong>de</strong> valeurs précises dans la durée.<br />
Un entrepôt est donc <strong>une</strong> sorte <strong>de</strong> point focal stockant en un point unique toute l’information<br />
utile provenant <strong>de</strong>s systèmes <strong>de</strong> production et <strong>de</strong>s sources externes. Avant d’être intégrée,<br />
l’information doit être extraite <strong>de</strong>s différentes sources et nettoyée.<br />
Ralph Kimball, l’auteur <strong>de</strong> The Data Warehouse Toolkit [2], propose <strong>une</strong> autre définition :<br />
« A data warehouse is a copy of transaction data specifically structured for query<br />
and analysis. »<br />
« Un entrepôt <strong>de</strong> <strong>données</strong> est <strong>une</strong> copie <strong>de</strong> <strong>données</strong> transactionnelles spécifiquement<br />
structurée pour l’interrogation et l’analyse. »<br />
Un entrepôt <strong>de</strong> <strong>données</strong>, comme indiqué dans les motivations, doit permettre l’analyse <strong>de</strong><br />
<strong>données</strong> suivant plusieurs dimensions. Il convient donc d’utiliser un modèle multidimensionnel.<br />
Avant <strong>de</strong> pouvoir intégrer les <strong>données</strong>, il faut concevoir intelligemment l’entrepôt en fonction<br />
<strong>de</strong>s analyses que l’on veut pouvoir réaliser.<br />
Trois fonctions essentielles sont donc nécessaires pour créer et utiliser un entrepôt :