Le resume linguistique de donnees structurees comme ... - APMD

More documents

Recommendations

Info

120 CHAPITRE 5 — Indexation de donnéesplein et équilibré sur 3 niveaux autorise donc 15 3 = 3.375 cellules, sur 4 niveaux, 15 4 = 50.625cellules. Ces valeurs sont en retrait par rapport à une subdivision régulière de l’espace par n hyperplanspar dimension. En effet, les nombres de cellules obtenues seraient de (n + 1) 8 cellules,soit 3 8 = 6.561 et 4 8 = 65.536 cellules pour une subdivision par deux et trois hyperplans respectivement.On constate ainsi que les index multidimensionnels ont une hauteur relativement plusgrande que les index monodimensionnels pour un même nombre d’enregistrements indexés. Cefait peut être atténué par des représentations incomplètes ou hiérarchisées des cellules, ou parl’utilisation de techniques de compression. Mais en règle générale, un index multidimensionnelrequiert plus d’accès disque qu’un index monodimensionnel pour une recherche exacte d’unmême enregistrement.5.2.4.3 RecouvrementOn constate que les index multidimensionnels ne sont pas groupés (voir section 5.1 pourla définition d’un index groupé). Autrement dit, les enregistrements ayant des valeurs prochesne sont pas nécessairement voisins sur le support physique. En général, une unité d’indexationélémentaire (une feuille) regroupe les objets dont les valeurs sur les attributs d’indexation sontproches. Si la distinction entre nœuds se fait sur la base de d dimensions, toute sélection surk attributs avec k < d réalise une projection de l’espace de données initial sur un espace dedimension inférieure. Ce phénomène est une autre déclinaison des collisions des fonctions dehachage (voir section 5.1.4) et des projections sur la droite ou le plan (figure 5.15). Une sélectionsur k dimensions désigne implicitement plusieurs unités d’indexation de même que le point p1de la figure 5.15 désigne plusieurs points de la droite (a, d).Les feuilles correspondant à une sélection sur k dimensions sont éparpillées dans l’arbre.Des critères particuliers peuvent permettre de circonscrire les résultats à une région de l’arbred’indexation, mais l’expérience n’est pas reproductible sur tous les critères. Dans le cas général,les feuilles sélectionnées se retrouveront sur toute la largeur de l’arbre. Cependant, une sélectionsur d attributs désignera une unique feuille pour les techniques sans recouvrements. Par conséquent,le chemin suivi par la recherche est unique et le nombre de nœuds parcourus, équivalentau nombre d’accès disque, est minimal. Dans les autres cas de sélections, la recherche est moinsefficace : les feuilles résultats sont dispersées en cas de sélection sur un nombre de dimensionsinférieur à d et, en cas de recouvrement, certains des nœuds visités apportent des informationsredondantes.Par conséquent, il est préférable qu’une technique d’indexation n’admette pas de recouvrement.On évite ainsi des opérations (recherches, insertions, modifications et suppressions) peu
CHAPITRE 5 — Indexation de données 121ddabcp1 p2abdcp1p2abcp1p2Projections orthogonalesPerspective coniqueFigure 5.15 – Projections sur des espaces de dimensions inférieuresefficaces. Mais plus que l’aspect géométrique de la notion de recouvrement, c’est la possibilitéde chemins multiples vers un même objet (par exemple, b1 dans la figure 5.9 en section 5.2.2.1),synonyme d’entrées multiples, qui est à éviter.5.2.4.4 PerformanceÀ propos de la performance, on note que les méthodes par hachage devancent les méthodesen arbre grâce au nombre d’accès disque constant (voir sections 5.1.4 et 5.2.2.5). Malheureusement,les méthodes d’indexation par hachage ne sont efficaces que pour les recherches exacteset les fonctions adéquates sont difficiles à trouver dans un contexte dynamique. Aucune technique(arborescente ou par hachage) ne répond à tous les besoins qui motivent l’utilisationd’index multidimensionnels. Même le Pyramid-Tree, qui est la seule technique échappant à lamalédiction de la dimensionnalité (voir section 5.2.2.2), ne traite efficacement que les donnéesuniformes et les requêtes par intervalles. Berchtold et al. montrent dans [11] qu’il n’existe pas,pour des données uniformes, une structure d’index qui soit performante sur toutes les dimensionspour les recherches de plus proches voisins. Dans [147], les auteurs vont plus loin etconsidèrent qu’il vaut mieux tenter d’améliorer la recherche séquentielle que de « se battre pourune guerre déjà perdue » contre les difficultés des grandes dimensions (dont on peut trouver unedescription dans le même article). Bien que ces conclusions ne concernent que la recherche deplus proches voisins, l’examen des propositions de techniques d’indexation dans leur ensemble(16 techniques recensées entre 1990 et 1999 contre 3 [10, 113, 144] entre 2000 et 2007) sembleles confirmer.
Page 1:
École Centrale de Nantes Universit
Page 5:
W. Amenel Abraham VOGLOZINLe résum
Page 9:
RemerciementsMes remerciements vont
Page 13 and 14:
IntroductionProblématique, motivat
Page 15 and 16:
Introduction 3du modèle SAINTETIQ,
Page 17:
Introduction 5structure d’index b
Page 20 and 21:
8 CHAPITRE 1 — Les résumés du m
Page 22 and 23:
10 CHAPITRE 1 — Les résumés du
Page 24 and 25:
Page 26 and 27:
Page 28:
Page 32 and 33:
Page 34 and 35:
Page 36 and 37:
Page 38 and 39:
Page 40 and 41:
28 CHAPITRE 2 — Algorithme d’in
Page 42 and 43:
Page 44 and 45:
Page 46 and 47:
Page 48 and 49:
Page 50 and 51:
Page 52 and 53:
Page 54 and 55:
Page 56 and 57:
44 CHAPITRE 3 — Interrogation fle
Page 58 and 59:
Page 60:
Page 65 and 66:
CHAPITRE 3 — Interrogation flexib
Page 67 and 68:
Page 69 and 70:
Page 71 and 72:
Page 73 and 74:
Page 75 and 76:
CHAPITRE 4Application des résumés
Page 77 and 78:
CHAPITRE 4 — Application des rés
Page 79 and 80:
CHAPITRE 4 — Application des rés
Page 81 and 82: CHAPITRE 4 — Application des rés
Page 101: CHAPITRE 4 — Application des rés
Page 104 and 105: 92 CHAPITRE 5 — Indexation de don
Page 112 and 113: 100 CHAPITRE 5 — Indexation de do
Page 140 and 141: 128 CHAPITRE 6 — Implémentation
Page 161 and 162: Conclusion généraleRésuméDurant
Page 163 and 164: Conclusion générale 151tinence vi
Page 165 and 166: Bibliographie[1] Paul M. AOKI.Gener
Page 167 and 168: BIBLIOGRAPHIE 155Dans Proceedings o
Page 169 and 170: BIBLIOGRAPHIE 157CoBase: a scalable
Page 171 and 172: BIBLIOGRAPHIE 159ACM TODS, 4(3):315
Page 173 and 174: BIBLIOGRAPHIE 161R-trees: a dynamic
Page 175 and 176: BIBLIOGRAPHIE 163Dans Proeedings of
Page 177 and 178: BIBLIOGRAPHIE 165Thèse de doctorat
Page 179 and 180: BIBLIOGRAPHIE 167[135] THE POSTGRES
Page 181: BIBLIOGRAPHIE 169Information and Co
Page 185 and 186:
Liste des figures—Corps du docume
Page 187 and 188:
Table des matières—Corps du docu
Page 189 and 190:
TABLE DES MATIÈRES 1775 Indexation
Page 192:
Le résumé linguistique de donnée
show all

Le resume linguistique de donnees structurees comme ... - APMD

Create successful ePaper yourself

Delete template?

Save as template?