13.07.2013 Views

Requêtes OLAP sur une base de données XML native - Cercle ...

Requêtes OLAP sur une base de données XML native - Cercle ...

Requêtes OLAP sur une base de données XML native - Cercle ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

2.2 Définitions 4<br />

2.2 Définitions<br />

Un entrepôt <strong>de</strong> <strong>données</strong> (data warehouse) est un lieu <strong>de</strong> stockage intermédiaire <strong>de</strong> différentes<br />

<strong>données</strong> en vue <strong>de</strong> la constitution d’un système d’informations décisionnelles. Un <strong>de</strong>s précurseurs<br />

du concept d’entrepôt <strong>de</strong> <strong>données</strong>, Bill Inmon [1], le définit comme suit :<br />

« Un entrepôt est <strong>une</strong> collection <strong>de</strong> <strong>données</strong> orientées sujet, intégrées, non volatiles<br />

et historisées, organisées pour le support d’un processus d’ai<strong>de</strong> à la décision. »<br />

Analysons point par point cette définition. Les <strong>données</strong> d’un entrepôt sont donc :<br />

⊲ Orientées sujet Les <strong>données</strong> sont orientées métier et donc triées par thèmes. L’intégration<br />

dans <strong>une</strong> structure unique est indispensable pour éviter aux <strong>données</strong> concernées par<br />

plusieurs sujets d’être dupliquées. Cependant, dans la pratique, il existe également <strong>de</strong>s<br />

entrepôts plus petits, les magasins <strong>de</strong> <strong>données</strong> (data marts) : l’entrepôt est fragmenté en<br />

plusieurs <strong>base</strong>s qui supportent l’orientation sujet.<br />

⊲ Intégrées Les <strong>données</strong> proviennent <strong>de</strong> plusieurs sources hétérogènes. Avant d’être intégrées<br />

dans l’entrepôt, les <strong>données</strong> doivent êtres mises en forme et unifiées afin d’avoir un<br />

état cohérent. Cela nécessite un gros travail <strong>de</strong> normalisation, <strong>de</strong> gestion <strong>de</strong>s référentiels<br />

et <strong>de</strong> cohérence.<br />

⊲ Non volatiles Les <strong>données</strong> sont stables et non modifiables. Un entrepôt <strong>de</strong> <strong>données</strong> doit<br />

garantir qu’<strong>une</strong> requête lancée à différentes dates <strong>sur</strong> les mêmes <strong>données</strong> donne toujours<br />

les mêmes résultats. De plus, les <strong>données</strong> d’un entrepôt sont mise à jour périodiquement,<br />

ce ne sont donc pas <strong>de</strong>s informations en temps réel.<br />

⊲ Historisées Les <strong>données</strong> sont historisées et donc datées : l’historisation est nécessaire<br />

pour suivre dans le temps l’évolution <strong>de</strong>s différentes valeurs <strong>de</strong>s indicateurs à analyser.<br />

Ainsi, un référentiel temps doit être associé aux <strong>données</strong> afin <strong>de</strong> permettre l’i<strong>de</strong>ntification<br />

<strong>de</strong> valeurs précises dans la durée.<br />

Un entrepôt est donc <strong>une</strong> sorte <strong>de</strong> point focal stockant en un point unique toute l’information<br />

utile provenant <strong>de</strong>s systèmes <strong>de</strong> production et <strong>de</strong>s sources externes. Avant d’être intégrée,<br />

l’information doit être extraite <strong>de</strong>s différentes sources et nettoyée.<br />

Ralph Kimball, l’auteur <strong>de</strong> The Data Warehouse Toolkit [2], propose <strong>une</strong> autre définition :<br />

« A data warehouse is a copy of transaction data specifically structured for query<br />

and analysis. »<br />

« Un entrepôt <strong>de</strong> <strong>données</strong> est <strong>une</strong> copie <strong>de</strong> <strong>données</strong> transactionnelles spécifiquement<br />

structurée pour l’interrogation et l’analyse. »<br />

Un entrepôt <strong>de</strong> <strong>données</strong>, comme indiqué dans les motivations, doit permettre l’analyse <strong>de</strong><br />

<strong>données</strong> suivant plusieurs dimensions. Il convient donc d’utiliser un modèle multidimensionnel.<br />

Avant <strong>de</strong> pouvoir intégrer les <strong>données</strong>, il faut concevoir intelligemment l’entrepôt en fonction<br />

<strong>de</strong>s analyses que l’on veut pouvoir réaliser.<br />

Trois fonctions essentielles sont donc nécessaires pour créer et utiliser un entrepôt :

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!