12.07.2015 Views

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

CHAPITRE 5 — In<strong>de</strong>xation <strong>de</strong> données 1155.2.3.5 ContractionLa contraction d’un espace E permet <strong>de</strong> ne pas conserver d’informations à propos <strong>de</strong>s cellulesvi<strong>de</strong>s. L’in<strong>de</strong>x ne renseigne plus que sur E réduit aux cellules non-vi<strong>de</strong>s. Cette propriétéest satisfaite par la plupart <strong>de</strong>s métho<strong>de</strong>s d’in<strong>de</strong>xation. Cependant, d’après Freeston [61], lesmétho<strong>de</strong>s basées sur une transformation <strong>de</strong> E en un espace linéaire ordonné (par exemple le Zor<strong>de</strong>ring [107] ou le Grid File, traité en section 5.2.2.5) en sont dépourvues.Dans un espace <strong>de</strong> dimension d, la subdivision la plus simple partitionne l’espace en <strong>de</strong>uxsous-espaces sur chaque dimension. Il y a donc au minimum 2 d cellules. Ce nombre <strong>de</strong> cellules<strong>de</strong>vient non-négligeable pour une certaine valeur <strong>de</strong> d et dépasse très rapi<strong>de</strong>ment le nombred’objets. Il est donc important pour un in<strong>de</strong>x <strong>de</strong> possé<strong>de</strong>r cette propriété.5.2.3.6 Pouvoir <strong>de</strong> séparationCette caractéristique est liée à l’organisation physique <strong>de</strong>s nœuds <strong>de</strong> l’arbre (voir section5.2.3.7). Elle désigne la proportion d’objets définitivement écartés à chaque étape <strong>de</strong> progressiondans l’arbre lors d’une recherche. Elle est liée au fan-out (envergure) <strong>de</strong> chaque nœud : plusle nombre <strong>de</strong> sous-espaces référencés dans un nœud est élevé, plus le pouvoir <strong>de</strong> séparation estgrand.<strong>Le</strong>s travaux sur les in<strong>de</strong>x négligent les traitements effectués en mémoire centrale et accor<strong>de</strong>ntplus d’importance aux accès disque. Un bloc (ou page) disque chargé en mémoire offreun certain nombre d’entrées d’in<strong>de</strong>x, contenant chacune <strong>de</strong>s informations sur le sous-espacereprésenté. La détermination du sous-espace contenant l’objet recherché étant considérée négligeableen termes <strong>de</strong> coût, il est important que la page d’in<strong>de</strong>x offre le maximum d’informationspossible. Pour une même taille <strong>de</strong> bloc physique, une technique discriminant les nœuds filssur une dimension (par exemple, le k-D-B-Tree [119] ou l’Hybrid-Tree [33]) a un fan-out plusimportant qu’une technique utilisant plus <strong>de</strong> dimensions (c’est le cas <strong>de</strong>s autres techniques arborescentes).Ceci s’explique par le fait que les données décrivant <strong>de</strong>s cellules sur plusieursdimensions occupent un espace <strong>de</strong> stockage plus grand que la <strong>de</strong>scription du même nombre<strong>de</strong> cellules sur une dimension : sur une même page, on peut donc stocker moins <strong>de</strong> <strong>de</strong>scripteursmultidimensionnels que <strong>de</strong> <strong>de</strong>scripteurs monodimensionnels (voir la discussion en section5.2.4.2 plus loin).<strong>Le</strong> fan-out est un paramètre important <strong>de</strong> la forme <strong>de</strong> l’arbre pour un même jeu <strong>de</strong> données.S’il est faible, la profon<strong>de</strong>ur <strong>de</strong> l’arbre augmente. Il en est <strong>de</strong> même pour le nombre <strong>de</strong> nœudsvisités lors d’une recherche. La performance générale <strong>de</strong> la technique en est affectée, sachant

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!