12.07.2015 Views

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

CHAPITRE 5 — In<strong>de</strong>xation <strong>de</strong> données 95Adresse0EmplacementABIBWDAbileneBrawnwoodDFWDallas Fort WorthPages <strong>de</strong> données123AMABROAUSAmarilloBrownsvilleAustinDALDRTDallas Love FieldDel ReoCLLCollege StationBPTBeaumontCRPCorpus ChristiFigure 5.3 – Table <strong>de</strong> hachageDans le cas général, il n’est pas possible <strong>de</strong> garantir que le nombre d’enregistrements placésdans toute section n’excé<strong>de</strong>ra pas la capacité <strong>de</strong> l’emplacement. C’est pourquoi les in<strong>de</strong>x par hachageprévoient <strong>de</strong>s zones <strong>de</strong> débor<strong>de</strong>ment où placer les enregistrements affectés à une sectionpleine. Cependant, ces zones <strong>de</strong> débor<strong>de</strong>ment réduisent l’efficacité <strong>de</strong> la métho<strong>de</strong> d’in<strong>de</strong>xation :l’accès à une section est direct mais la recherche au sein <strong>de</strong> la section reste séquentielle.<strong>Le</strong> hachage a <strong>comme</strong> avantage d’être très rapi<strong>de</strong>. Mais la réorganisation physique nécessairepour réduire les zones <strong>de</strong> débor<strong>de</strong>ment réserve les métho<strong>de</strong>s <strong>de</strong> hachage aux tables <strong>de</strong> donnéesplutôt statiques et <strong>de</strong> faible taille. De plus, la séquence <strong>de</strong>s valeurs <strong>de</strong> l’attribut <strong>de</strong> hachagen’est pas conservée sur le support <strong>de</strong> stockage dans le cas général, ce qui limite les critères<strong>de</strong> recherche aux critères d’égalité. Par exemple, la séquence <strong>de</strong> données Abilene - Amarillo -Austin - Beaumont - Brawnwood - Brownsville détermine la séquence <strong>de</strong> pages 1 - 2 - 3 - 4 -1 - 2. Il est néanmoins possible <strong>de</strong> construire <strong>de</strong>s fonctions <strong>de</strong> hachage qui garantissent que laséquence physique <strong>de</strong>s enregistrements correspond à la séquence logique <strong>de</strong>s valeurs d’attribut(voir [72] par exemple). <strong>Le</strong>s recherches par intervalles <strong>de</strong> valeurs ne peuvent être supportéesqu’à cette condition.<strong>Le</strong>s améliorations <strong>de</strong>s tables <strong>de</strong> hachage (par exemple, [56]) visent spécifiquement le problème<strong>de</strong>s collisions. Ces métho<strong>de</strong>s permettent <strong>de</strong> faire varier le nombre <strong>de</strong>s emplacementset d’assigner dynamiquement <strong>de</strong>s enregistrements aux emplacements qui optimisent la partieséquentielle <strong>de</strong>s recherches.On notera que toute métho<strong>de</strong> d’in<strong>de</strong>xation monodimensionnelle par table <strong>de</strong> hachage garantitl’extraction <strong>de</strong> l’enregistrement recherché en un maximum <strong>de</strong> 2 accès disque (s’il n’y apas <strong>de</strong> débor<strong>de</strong>ment) : un accès pour lire l’emplacement adéquat dans la table <strong>de</strong> hachage et unaccès pour lire l’enregistrement.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!