13.07.2013 Views

Requêtes OLAP sur une base de données XML native - Cercle ...

Requêtes OLAP sur une base de données XML native - Cercle ...

Requêtes OLAP sur une base de données XML native - Cercle ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

3.4 Le document <strong>XML</strong> 18<br />

Documents orientés <strong>données</strong><br />

Les documents orientés <strong>données</strong> (data-centric) sont ceux où <strong>XML</strong> est utilisé pour transporter<br />

<strong>de</strong>s <strong>données</strong>. Ils incluent les ordres <strong>de</strong> ventes, les enregistrements <strong>de</strong> patients et les <strong>données</strong> scientifiques.<br />

Leur structure physique (l’ordre <strong>de</strong>s éléments, l’utilisation <strong>de</strong> PCDATA ou d’attributs)<br />

n’est pas importante dans la majorité <strong>de</strong>s cas.<br />

Documents orientés présentation<br />

Les documents orientés présentation (document-centric) sont ceux dans lesquels <strong>XML</strong> est<br />

utilisé pour ses capacités similaires à SGML, comme dans un manuel d’utilisateur, <strong>une</strong> page<br />

web statique en XHTML ou <strong>de</strong>s brochures. Ils sont caractérisés par leur structure irrégulière<br />

et leur contenu mixte. A l’opposé <strong>de</strong>s documents orientés <strong>données</strong>, leur structure physique est<br />

importante. Par exemple, pour un manuel d’utilisateur, l’ordre <strong>de</strong>s chapitres est important. Par<br />

contre, pour <strong>une</strong> facture, l’ordre <strong>de</strong>s articles ne l’est pas ou l’est moins.<br />

3.4.4 Les éléments, ses attributs et les <strong>données</strong> textuelles<br />

Dans le document <strong>XML</strong>, après le prologue, se trouve <strong>une</strong> série d’éléments. Un élément est<br />

l’unité <strong>de</strong> <strong>base</strong> d’un document <strong>XML</strong>, composé <strong>de</strong> <strong>données</strong> textuelles et <strong>de</strong> balises. Les frontières<br />

d’un élément sont définies par <strong>une</strong> balise <strong>de</strong> début et <strong>une</strong> balise <strong>de</strong> fin. Un élément peut contenir<br />

<strong>de</strong>s attributs additionnels. Par exemple, Jean Dupond est un élément<br />

et Jean Dupond est un élément contenant un attribut.<br />

Notons qu’<strong>XML</strong> permet la définition d’éléments vi<strong>de</strong>s : ils n’ont pas <strong>de</strong> contenu et pas <strong>de</strong><br />

balise fermante. Ces éléments sont formés en ajoutant <strong>une</strong> barre oblique à la fin <strong>de</strong> la balise<br />

ouvrante. est un élément vi<strong>de</strong>.<br />

Du point <strong>de</strong> vue <strong>de</strong> la syntaxe, le nom d’un élément doit toujours commencer par <strong>une</strong> lettre<br />

et est sensible à la casse. Un élément ne peut contenir que du texte ou <strong>une</strong> combinaison <strong>de</strong> textes<br />

d’autres éléments : Jean Dupont18 est <strong>une</strong> combinaison<br />

vali<strong>de</strong>.<br />

Un document <strong>XML</strong> bien formé doit contenir au moins un, et un seul élément non vi<strong>de</strong>, appelé<br />

élément racine. Celui-ci peut contenir d’autres éléments définissant ainsi un arbre.<br />

Comme le précise la spécification <strong>XML</strong>, tout texte qui n’est pas du balisage est <strong>une</strong> donnée<br />

textuelle du document. Précisons toutefois que certains symboles sont interdits comme et<br />

&. Pour utiliser ces caractères, il faut les remplacer par leur représentation hexadécimale.<br />

Les éléments peuvent, comme indiqué plus haut, contenir <strong>de</strong>s attributs qui fournissent<br />

<strong>de</strong>s informations supplémentaires. Ces attributs sont <strong>de</strong>s couples (nom, valeur) <strong>de</strong> la forme<br />

nom="valeur". Ils doivent se trouver dans la balise ouvrante après le nom <strong>de</strong> l’élément. Notons<br />

que les noms d’attributs sont aussi sensibles à la casse, qu’ils doivent être uniques au sein d’un<br />

même élément et que les valeurs <strong>de</strong>s attributs se trouvent obligatoirement entre guillemets. La<br />

décision d’utiliser un attribut plutôt qu’un élément peut être un problème complexe car leurs

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!