12.07.2015 Views

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

106 CHAPITRE 5 — In<strong>de</strong>xation <strong>de</strong> donnéesCette technique est parfois considérée <strong>comme</strong> la meilleure structure d’in<strong>de</strong>x pour les données<strong>de</strong> faible dimension, notamment bidimensionnelles [20, 100].R1p4b2R4b5R3p2p3R5b4b1p1p5R6b9b7R2p6b8R7R3R4R5R1R2R6R7p1 p2 b1 p3 b2 p4 b3 b4 b5 b6 p5 b9 p6 b7 b8b3b6Figure 5.10 – R ∗ -TreeX-Tree La technique du X-Tree est une variante du R ∗ -Tree spécifiquement conçue pour lesgran<strong>de</strong>s dimensions (typiquement, supérieures à 10). Cette structure, proposée par Berchtold,Keim et Kriegel [13], vise le principal problème <strong>de</strong>s gran<strong>de</strong>s dimensions : le recouvrement(voir la section 5.2.3.3). Elle introduit <strong>de</strong>ux notions originales, le super-nœud et l’historique <strong>de</strong>spartitionnements.<strong>Le</strong>s travaux effectués sur l’in<strong>de</strong>xation <strong>de</strong> données ont permis <strong>de</strong> tirer <strong>de</strong>s conclusions quantà l’organisation d’in<strong>de</strong>x la plus adaptée suivant la nature <strong>de</strong>s données. Ces conclusions, quiseront exploitées par l’X-Tree, montrent qu’une hiérarchie est l’organisation la plus efficacepour les données <strong>de</strong> faible dimension (par exemple, l’arbre B+ en monodimensionnel et le R ∗ -Tree pour 2 à 6 dimensions). À l’inverse, une organisation linéaire (sous forme <strong>de</strong> tableau) estplus efficace en moyenne pour <strong>de</strong>s données <strong>de</strong> gran<strong>de</strong> dimension. C’est typiquement le cas duparcours séquentiel. Une hiérarchie peut être efficace sur <strong>de</strong> gran<strong>de</strong>s dimensions, à la conditionque les recouvrements entre les unités d’in<strong>de</strong>xation (c’est-à-dire les cellules) soient inexistants.Une telle condition est insatisfaisable dès lors que <strong>de</strong>s objets spatiaux sont représentés par <strong>de</strong>svolumes englobants. On peut dériver une organisation linéaire d’une organisation hiérarchiqueen limitant l’arbre à ses feuilles, les niveaux supérieurs étant ignorés.Un nœud qui a atteint sa capacité maximale et auquel est affectée une entrée d’in<strong>de</strong>x supplémentairedoit être partitionné. Mais cette opération a tendance à engendrer <strong>de</strong>s recouvrements<strong>de</strong> REM. Dans un X-Tree, l’algorithme d’insertion essaie <strong>de</strong> partitionner le nœud en limitantle pourcentage <strong>de</strong> recouvrement produit en <strong>de</strong>ssous d’un taux paramétrable T x . Idéalement,T x = 0. Si une telle possibilité n’existe pas, l’opération <strong>de</strong> partitionnement est reportée et lenœud est promu au rang <strong>de</strong> super-nœud. <strong>Le</strong> super-nœud est différent d’un nœud « normal » en

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!