Le resume linguistique de donnees structurees comme ... - APMD

More documents

Recommendations

Info

140 CHAPITRE 6 — Implémentation des résumés SAINTETIQ en tant que méthode d’accès6.5.2 Requêtes et résultatsLe jeu de requêtes utilisé couvre l’ensemble des attributs pour chaque jeu de données aléatoires.Les enregistrements identifiés selon le jeu de données interrogé sont les mêmes. En effet,les enregistrements des tables à 4 attributs reprennent les valeurs des quatre premiers champsdes enregistrements à 8 attributs.Le nombre d’attributs des requêtes varie de 1 à la dimension de la table. Pour garantir unrésultat non vide, les requêtes de test sont construites à partir d’un enregistrement aléatoirementchoisi. Les critères de sélection des requêtes sont des égalités des attributs avec leur valeur dansl’enregistrement. Garantir que les requêtes ont un résultat non-vide permet que l’explorationdes résumés ne sera pas arrêtée rapidement en raison d’une détection précoce de l’absence derésultat. Par exemple, les requêtes suivantes (où « [Table] » sera instancié respectivement par« d0404 », « d0406 » et « d0804 ») peuvent être dérivées de l’enregistrement 1 du tableau 6.6 :• SELECT * FROM [Table] WHERE Attr1 = 106 ;• SELECT * FROM [Table] WHERE Attr2 = 21 ;• SELECT * FROM [Table] WHERE Attr3 = 62 ;• SELECT * FROM [Table] WHERE Attr4 = 88 ;• SELECT * FROM [Table] WHERE Attr1 = 106 AND Attr2 = 21 ;• SELECT * FROM [Table] WHERE Attr1 = 106 AND Attr3 = 62 ;• ...• SELECT * FROM [Table] WHERE Attr1 = 106 AND Attr2 = 21AND Attr3 = 62 AND Attr4 = 88 ;Les requêtes sont générées aléatoirement en reprenant le schéma d’énumération déjà utilisé ensection 4.1.2. D’abord, un enregistrement est tiré au sort parmi les 100.000 enregistrements dujeu de données. L’énumération de ses attributs permet d’énumérer toutes les requêtes ayant sesvaleurs d’attribut comme critères. Suivant la dimension de la table de données, cet enregistrementpermet de composer 15 (table à 4 attributs) ou 255 (8 attributs) requêtes. Cette procédurede tirage aléatoire et de génération exhaustive des requêtes permet d’obtenir deux jeux de requêtes,Q04 et Q08, avec respectivement 5.336 et 5.120 requêtes, utilisés pour interroger lestables appropriées (d0404 et d0406 pour Q04, et d0804 pour Q08).Les tableaux 6.8 à 6.11 présentent les résultats obtenus avec une taille de buffer de 8 Ko.Une entrée/sortie disque équivaut à un chargement du buffer. Les colonnes des tableaux représentent:• le nombre d’attributs dans la requête SQL ;
CHAPITRE 6 — Implémentation des résumés SAINTETIQ en tant que méthode d’accès 141• le temps mis par l’index pour transformer les critères SQL sous la forme exposée en section2.1.1, explorer la structure d’index et fournir au SGBD tous les tuples de la réponse ;• le nombre de résumés soumis aux tests d’appariement (section 2.2.2) ; il est équivalent aunombre de nœuds visités ;• le nombre d’enregistrements répondant à la requête ;• le volume de l’extension des résumés qui subissent l’étape de filtrage (voir section 6.1.1) ;• le nombre d’accès disque effectués.Les tableaux 6.12 à 6.14 présentent les statistiques obtenues en exécutant la totalité des jeuxde requêtes. Ils indiquent pour chaque nombre d’attributs dans la requête SQL :• le nombre de requêtes présentant ce nombre d’attributs ;• la valeur minimale, la valeur maximale, la moyenne et l’écart-type des accès disque ;• la valeur minimale, la valeur maximale, la moyenne et l’écart-type des temps d’exécution.Table 6.8 – Résultats pour ’CIO’Attributs Temps Appariements Résultats Tuples filtrés Nombre d’E/S1 120 ms 9393 (34,4%) 373 7338 4391 80 ms 6118 (24,4%) 284 5363 3552 30 ms 3063 (11,2%) 79 1695 2663 20 ms 3063 (11,2%) 1 1695 2664+ 10 ms 3063 (11,2%) 1 1695 2666.5.3 AnalyseLes tableaux de résultats montrent une décroissance très nette du temps de réponse moyendès que le nombre d’attributs est supérieur à 1. Ceci s’explique par le fait que les index multicritèresne peuvent pas être groupés pour un nombre de critères inférieur à la dimension gérée(les index dits « groupés » sont discutés en section 5.2.4). Le phénomène est plus marquélorsqu’il n’y a qu’un critère. Les résultats sont alors répartis dans la plupart des feuilles del’arbre : près de la moitié des nœuds de l’index est testée pour les jeux de données aléatoires.Il est également corroboré par le fait que le nombre d’appariements effectués décroît lorsque ladimension augmente.On note que le nombre de tuples résultats décroît lorsque la dimension croît, ce qui esten adéquation avec le fait que chaque dimension équivaut à une contrainte supplémentaire sur
Page 1:
École Centrale de Nantes Universit
Page 5:
W. Amenel Abraham VOGLOZINLe résum
Page 9:
RemerciementsMes remerciements vont
Page 13 and 14:
IntroductionProblématique, motivat
Page 15 and 16:
Introduction 3du modèle SAINTETIQ,
Page 17:
Introduction 5structure d’index b
Page 20 and 21:
8 CHAPITRE 1 — Les résumés du m
Page 22 and 23:
10 CHAPITRE 1 — Les résumés du
Page 24 and 25:
Page 26 and 27:
Page 28:
Page 32 and 33:
Page 34 and 35:
Page 36 and 37:
Page 38 and 39:
Page 40 and 41:
28 CHAPITRE 2 — Algorithme d’in
Page 42 and 43:
Page 44 and 45:
Page 46 and 47:
Page 48 and 49:
Page 50 and 51:
Page 52 and 53:
Page 54 and 55:
Page 56 and 57:
44 CHAPITRE 3 — Interrogation fle
Page 58 and 59:
Page 60:
Page 65 and 66:
CHAPITRE 3 — Interrogation flexib
Page 67 and 68:
Page 69 and 70:
Page 71 and 72:
Page 73 and 74:
Page 75 and 76:
CHAPITRE 4Application des résumés
Page 77 and 78:
CHAPITRE 4 — Application des rés
Page 79 and 80:
Page 81 and 82:
Page 83 and 84:
Page 85 and 86:
Page 87 and 88:
Page 89 and 90:
Page 91 and 92:
Page 93 and 94:
Page 95 and 96:
Page 97 and 98:
Page 99 and 100:
Page 101: CHAPITRE 4 — Application des rés
Page 104 and 105: 92 CHAPITRE 5 — Indexation de don
Page 112 and 113: 100 CHAPITRE 5 — Indexation de do
Page 140 and 141: 128 CHAPITRE 6 — Implémentation
Page 161 and 162: Conclusion généraleRésuméDurant
Page 163 and 164: Conclusion générale 151tinence vi
Page 165 and 166: Bibliographie[1] Paul M. AOKI.Gener
Page 167 and 168: BIBLIOGRAPHIE 155Dans Proceedings o
Page 169 and 170: BIBLIOGRAPHIE 157CoBase: a scalable
Page 171 and 172: BIBLIOGRAPHIE 159ACM TODS, 4(3):315
Page 173 and 174: BIBLIOGRAPHIE 161R-trees: a dynamic
Page 175 and 176: BIBLIOGRAPHIE 163Dans Proeedings of
Page 177 and 178: BIBLIOGRAPHIE 165Thèse de doctorat
Page 179 and 180: BIBLIOGRAPHIE 167[135] THE POSTGRES
Page 181: BIBLIOGRAPHIE 169Information and Co
Page 185 and 186: Liste des figures—Corps du docume
Page 187 and 188: Table des matières—Corps du docu
Page 189 and 190: TABLE DES MATIÈRES 1775 Indexation
Page 192: Le résumé linguistique de donnée
show all

Le resume linguistique de donnees structurees comme ... - APMD

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?