12.07.2015 Views

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

118 CHAPITRE 5 — In<strong>de</strong>xation <strong>de</strong> données5.2.3.11 RéglagesL’existence <strong>de</strong> paramètres dans une technique d’in<strong>de</strong>xation pose un problème difficile, celui<strong>de</strong> leur détermination. Un fonctionnement optimal (par rapport à d’autres caractéristiques<strong>comme</strong> la complexité ou l’équilibre <strong>de</strong> l’arbre) requiert souvent d’adapter les paramètres au jeu<strong>de</strong> données. À ce titre, les réglages semblent « porter préjudice aux techniques paramétrées »d’après Zobel et al. [155]. <strong>Le</strong> X-Tree [13] est un exemple <strong>de</strong> technique à paramètres pouvantdégénérer en d’autres structures moins performantes si le paramètre est mal fixé (voir [14] pourplus <strong>de</strong> détails).5.2.3.12 Stabilité <strong>de</strong> la structure <strong>de</strong> donnéesCette caractéristique se réfère à l’augmentation en volume <strong>de</strong> l’in<strong>de</strong>x en fonction <strong>de</strong> la quantité<strong>de</strong> données. Dans certaines techniques, la simple insertion d’un objet peut provoquer le doublementen taille <strong>de</strong> la structure d’in<strong>de</strong>x. C’est le cas pour la technique EXCELL [133]. D’autrestechniques inspirées du Grid File [105] (section 5.2.2.5) souffrent également d’une croissancerapi<strong>de</strong> du nombre <strong>de</strong> cellules in<strong>de</strong>xées, la croissance étant cette fois sans rapport avec le nombre<strong>de</strong> dimensions.Cette croissance du volume <strong>de</strong>s structures d’in<strong>de</strong>x survient pour les techniques dans lesquellesles partitionnements causés par une insertion ont une portée globale plutôt que locale.5.2.3.13 Coût CPULa plupart <strong>de</strong>s techniques semblent se préoccuper d’éléments <strong>de</strong> performance <strong>comme</strong> la profon<strong>de</strong>ur<strong>de</strong>s arbres, la complexité spatiale et temporelle ou le nombre d’accès disque, mais pasdu coût CPU induit par les calculs inhérents aux techniques. Bien au contraire, le M-Tree [37]vise à « réduire le coût CPU <strong>de</strong>s calculs <strong>de</strong> distance » par l’utilisation <strong>de</strong> l’inégalité triangulaire.La technique évite d’effectuer les calculs <strong>de</strong> distance, particulièrement coûteux dans <strong>de</strong> gran<strong>de</strong>sdimensions, qui se révéleraient inutiles.5.2.4 Discussion5.2.4.1 Types <strong>de</strong> recherches<strong>Le</strong>s types <strong>de</strong> recherches que permet une technique d’in<strong>de</strong>xation dépen<strong>de</strong>nt <strong>de</strong> l’organisation<strong>de</strong> la structure d’in<strong>de</strong>x. La recherche exacte est la plus simple à implémenter puisqu’elleconsiste en une simple comparaison avec les critères <strong>de</strong> sélection. La recherche par intervalles,

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!