12.07.2015 Views

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

CHAPITRE 5 — In<strong>de</strong>xation <strong>de</strong> données 121ddabcp1 p2abdcp1p2abcp1p2Projections orthogonalesPerspective coniqueFigure 5.15 – Projections sur <strong>de</strong>s espaces <strong>de</strong> dimensions inférieuresefficaces. Mais plus que l’aspect géométrique <strong>de</strong> la notion <strong>de</strong> recouvrement, c’est la possibilité<strong>de</strong> chemins multiples vers un même objet (par exemple, b1 dans la figure 5.9 en section 5.2.2.1),synonyme d’entrées multiples, qui est à éviter.5.2.4.4 PerformanceÀ propos <strong>de</strong> la performance, on note que les métho<strong>de</strong>s par hachage <strong>de</strong>vancent les métho<strong>de</strong>sen arbre grâce au nombre d’accès disque constant (voir sections 5.1.4 et 5.2.2.5). Malheureusement,les métho<strong>de</strong>s d’in<strong>de</strong>xation par hachage ne sont efficaces que pour les recherches exacteset les fonctions adéquates sont difficiles à trouver dans un contexte dynamique. Aucune technique(arborescente ou par hachage) ne répond à tous les besoins qui motivent l’utilisationd’in<strong>de</strong>x multidimensionnels. Même le Pyramid-Tree, qui est la seule technique échappant à lamalédiction <strong>de</strong> la dimensionnalité (voir section 5.2.2.2), ne traite efficacement que les donnéesuniformes et les requêtes par intervalles. Berchtold et al. montrent dans [11] qu’il n’existe pas,pour <strong>de</strong>s données uniformes, une structure d’in<strong>de</strong>x qui soit performante sur toutes les dimensionspour les recherches <strong>de</strong> plus proches voisins. Dans [147], les auteurs vont plus loin etconsidèrent qu’il vaut mieux tenter d’améliorer la recherche séquentielle que <strong>de</strong> « se battre pourune guerre déjà perdue » contre les difficultés <strong>de</strong>s gran<strong>de</strong>s dimensions (dont on peut trouver une<strong>de</strong>scription dans le même article). Bien que ces conclusions ne concernent que la recherche <strong>de</strong>plus proches voisins, l’examen <strong>de</strong>s propositions <strong>de</strong> techniques d’in<strong>de</strong>xation dans leur ensemble(16 techniques recensées entre 1990 et 1999 contre 3 [10, 113, 144] entre 2000 et 2007) sembleles confirmer.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!