12.07.2015 Views

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

CHAPITRE 5 — In<strong>de</strong>xation <strong>de</strong> données 117ton [61], la technique d’in<strong>de</strong>xation multidimensionnelle idéale <strong>de</strong>vrait préserver les propriétés<strong>de</strong> l’arbre B :• il existe un chemin d’accès unique à un objet ;• une mise-à-jour se fait en temps logarithmique par rapport au volume <strong>de</strong> données ;• les modifications structurelles <strong>de</strong> l’arbre sont locales et non globales ;• un taux d’occupation (voir section 5.2.3.7) minimum est garanti.De telles propriétés permettent <strong>de</strong> fixer <strong>de</strong>s limites, en temps <strong>comme</strong> en espace <strong>de</strong> stockage, auxbesoins d’une technique particulière et <strong>de</strong> la rendre « entièrement prévisible » et donc utilisablepour <strong>de</strong>s applications critiques.<strong>Le</strong>s complexités théoriques <strong>de</strong>s in<strong>de</strong>x sont très rarement disponibles dans les publicationscorrespondantes. On notera que les techniques d’in<strong>de</strong>xation multidimensionnelle ont une complexitéspatiale exponentielle dans le pire <strong>de</strong>s cas. Cependant, on relève quelques exceptionsdans la littérature, liées à <strong>de</strong>s techniques procédant par transformation <strong>de</strong> l’espace multidimensionnelvers un espace monodimensionnel traité par un arbre B+. Par conséquent, elles héritent<strong>de</strong>s propriétés <strong>de</strong> l’arbre B+. C’est ainsi que le Pyramid-Tree [12] (voir section 5.2.2.2) et l’UB-Tree [4] ont une complexité spatiale linéaire en fonction du nombre d’objets à in<strong>de</strong>xer, et unecomplexité temporelle logarithmique.Weber, Schek et Blott montrent dans [147] que les techniques utilisées pour la recherche <strong>de</strong>plus proches voisins ont une complexité temporelle linéaire en fonction du volume <strong>de</strong> données.Ils mentionnent, <strong>comme</strong> résultat <strong>de</strong> l’expérimentation menée, que la recherche séquentielle estmeilleure que toutes les métho<strong>de</strong>s d’in<strong>de</strong>xation testées à partir <strong>de</strong> 10 dimensions pour la recherche<strong>de</strong> plus proches voisins.5.2.3.10 ÉquilibreCette propriété est généralement entendue <strong>comme</strong> la faculté d’une structure à placer lesfeuilles <strong>de</strong> l’arbre à une même distance <strong>de</strong> la racine. Mais Michael Freeston, dans son articlesur le BANG File, la définit différemment (voir section 5.2.2.5) : l’équilibre <strong>de</strong>vient la propriétéd’un arbre à placer dans ses branches gauche et droite à peu près le même nombre d’objets.L’équilibre <strong>de</strong> l’arbre d’in<strong>de</strong>xation, lorsqu’il désigne la hauteur <strong>de</strong>s feuilles, permet <strong>de</strong> bornersa profon<strong>de</strong>ur, d’estimer sa taille et les temps <strong>de</strong> réponse. Mais Berrani et al. [14] montrentque l’équilibre <strong>de</strong> l’arbre n’implique pas automatiquement que la complexité est calculable etvice-versa.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!