12.07.2015 Views

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

CHAPITRE 6 — Implémentation <strong>de</strong>s résumés SAINTETIQ en tant que métho<strong>de</strong> d’accès 147pace creux, ceci afin <strong>de</strong> simuler <strong>de</strong>s données réelles. Ce taux correspond à la proportion <strong>de</strong>scellules non vi<strong>de</strong>s par rapport au nombre total <strong>de</strong> cellules. Dans les données réelles, cette proportionest faible : 2% pour le jeu <strong>de</strong> données bancaires.Pour l’heure, un taux fixé (par exemple, 10% sur un jeu <strong>de</strong> données à 8 dimensions) estobtenu en « désactivant » certains <strong>de</strong>scripteurs. La désactivation consiste à rejeter toute valeuraléatoirement générée qui serait décrite par le <strong>de</strong>scripteur désactivé, permettant ainsi <strong>de</strong> réduirele nombre <strong>de</strong>s cellules contenant <strong>de</strong>s données. La figure 6.4 offre un point <strong>de</strong> comparaisonavec la figure 5.16 (en page 122) en montrant, en grisé, les cellules qui seront vi<strong>de</strong>s. Sur cetexemple à 2 dimensions, le nombre <strong>de</strong> cellules est <strong>de</strong> 12 contre 25 sans désactivation. Une foisque <strong>de</strong>s hypothèses auront été formulées et confirmées quant aux facteurs <strong>de</strong> performance, ilsera possible d’adapter la construction <strong>de</strong>s résumés dans l’optique d’une utilisation effective entant que structure d’in<strong>de</strong>x. Entreront alors en ligne <strong>de</strong> compte les opérations <strong>de</strong> mises à jourproposées dans [125].

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!