12.07.2015 Views

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

CHAPITRE 6 — Implémentation <strong>de</strong>s résumés SAINTETIQ en tant que métho<strong>de</strong> d’accès 141• le temps mis par l’in<strong>de</strong>x pour transformer les critères SQL sous la forme exposée en section2.1.1, explorer la structure d’in<strong>de</strong>x et fournir au SGBD tous les tuples <strong>de</strong> la réponse ;• le nombre <strong>de</strong> résumés soumis aux tests d’appariement (section 2.2.2) ; il est équivalent aunombre <strong>de</strong> nœuds visités ;• le nombre d’enregistrements répondant à la requête ;• le volume <strong>de</strong> l’extension <strong>de</strong>s résumés qui subissent l’étape <strong>de</strong> filtrage (voir section 6.1.1) ;• le nombre d’accès disque effectués.<strong>Le</strong>s tableaux 6.12 à 6.14 présentent les statistiques obtenues en exécutant la totalité <strong>de</strong>s jeux<strong>de</strong> requêtes. Ils indiquent pour chaque nombre d’attributs dans la requête SQL :• le nombre <strong>de</strong> requêtes présentant ce nombre d’attributs ;• la valeur minimale, la valeur maximale, la moyenne et l’écart-type <strong>de</strong>s accès disque ;• la valeur minimale, la valeur maximale, la moyenne et l’écart-type <strong>de</strong>s temps d’exécution.Table 6.8 – Résultats pour ’CIO’Attributs Temps Appariements Résultats Tuples filtrés Nombre d’E/S1 120 ms 9393 (34,4%) 373 7338 4391 80 ms 6118 (24,4%) 284 5363 3552 30 ms 3063 (11,2%) 79 1695 2663 20 ms 3063 (11,2%) 1 1695 2664+ 10 ms 3063 (11,2%) 1 1695 2666.5.3 Analyse<strong>Le</strong>s tableaux <strong>de</strong> résultats montrent une décroissance très nette du temps <strong>de</strong> réponse moyendès que le nombre d’attributs est supérieur à 1. Ceci s’explique par le fait que les in<strong>de</strong>x multicritèresne peuvent pas être groupés pour un nombre <strong>de</strong> critères inférieur à la dimension gérée(les in<strong>de</strong>x dits « groupés » sont discutés en section 5.2.4). <strong>Le</strong> phénomène est plus marquélorsqu’il n’y a qu’un critère. <strong>Le</strong>s résultats sont alors répartis dans la plupart <strong>de</strong>s feuilles <strong>de</strong>l’arbre : près <strong>de</strong> la moitié <strong>de</strong>s nœuds <strong>de</strong> l’in<strong>de</strong>x est testée pour les jeux <strong>de</strong> données aléatoires.Il est également corroboré par le fait que le nombre d’appariements effectués décroît lorsque ladimension augmente.On note que le nombre <strong>de</strong> tuples résultats décroît lorsque la dimension croît, ce qui esten adéquation avec le fait que chaque dimension équivaut à une contrainte supplémentaire sur

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!