12.07.2015 Views

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

138 CHAPITRE 6 — Implémentation <strong>de</strong>s résumés SAINTETIQ en tant que métho<strong>de</strong> d’accèsTable 6.4 – Déclaration <strong>de</strong>s classes d’opérateurs supportéesCREATE OPERATOR CLASS seq_int4_ops DEFAULT FOR TYPE int4USING saintetiq AS OPERATOR 1 = ;CREATE OPERATOR CLASS seq_char_ops DEFAULT FOR TYPE charUSING saintetiq AS OPERATOR 1 = ;6.5 Expérimentation6.5.1 Données d’expérimentationL’expérimentation que nous détaillons ici a été menée sur plusieurs jeux <strong>de</strong> données présentésdans le tableau 6.5, correspondant chacun à une table relationnelle. La table CIO contient<strong>de</strong>s données bancaires réelles détaillées dans [126]. <strong>Le</strong>s autres tables contiennent <strong>de</strong>s donnéesgénérées aléatoirement sur le domaine entier [0, 127] sans autre contrainte statistique qu’unemoyenne centrée sur le domaine. <strong>Le</strong> choix arbitraire <strong>de</strong> ce domaine se justifie par le fait queles valeurs <strong>de</strong>s champs n’interviennent pas dans le processus d’interrogation qui ne manipuleque les étiquettes <strong>linguistique</strong>s. Autrement dit, ce domaine est équivalent à n’importe quel autreplage <strong>de</strong> valeurs dès lors que les variables <strong>linguistique</strong>s définies sur les domaines ont la mêmeforme géométrique à l’échelle près.Table 6.5 – Jeux <strong>de</strong> donnéesJeu <strong>de</strong> donnéesHiérarchie <strong>de</strong> résumésNom Dimension Termes Tuples Nœuds Feuilles Profon<strong>de</strong>urCIO 10 34 33.733 27.304 14.269 23d0404 4 16 100.000 1.119 572 12d0406 4 24 100.000 13.048 6.598 18d0804 8 16 100.000 139.364 72.621 22Sur une plage <strong>de</strong> valeurs aussi faible, il est inévitable que chaque valeur soit représentéeplusieurs fois. En raison du nombre <strong>de</strong> tuples (voir tableau 6.5), ceci augmente d’autant laprobabilité d’avoir <strong>de</strong>s enregistrements dont les champs ont <strong>de</strong>s valeurs i<strong>de</strong>ntiques. En consé-

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!