12.07.2015 Views

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

CHAPITRE 1 — <strong>Le</strong>s résumés du modèle SAINTETIQ 11besoins <strong>de</strong> cet exemple. A la première itération, on obtient <strong>de</strong>ux vecteurs VS 1 et V D 1 , dont la taillerespective est la moitié <strong>de</strong> celle <strong>de</strong> V : VS 1 = [11, 19, 17, 10] et V D 1 = [1, 0, −1, −1]. L’itérationsuivante utilise VS 1 <strong>comme</strong> vecteur initial et produit V S 2 = [15, 13] et V D 2 = [4, −3]. Par la suite,on a VS 3 = [14] et V D 3 = [−1]. <strong>Le</strong> vecteur initial étant réduit à une valeur, la récursion est arrêtée.La transformée est constituée <strong>de</strong> ce <strong>de</strong>rnier vecteur (VS 3) et <strong>de</strong>s vecteurs V D dans l’ordre inverse(V 3 D , V 2 D , V 1 D ), soit V ∗ = [14, −1, 4, −3, 1, 0, −1, −1]. Dans cet exemple, la première valeurdans V ∗ (14) est représentative <strong>de</strong> celles dans V , les autres valeurs caractérisent la valeur 14.Un <strong>de</strong>rnier type d’approximation, illustré par la suite <strong>de</strong> ce chapitre, est celui <strong>de</strong>s métho<strong>de</strong>s<strong>de</strong> résumé par agrégation ou classification. Ici, l’objectif est d’obtenir une vision plus globale<strong>de</strong>s données que l’exposition <strong>de</strong> valeurs spécifiques. <strong>Le</strong> détail <strong>de</strong>s données, subsidiaire, peutcependant être disponible. Nous classons dans cette catégorie les in<strong>de</strong>x <strong>de</strong> bases <strong>de</strong> données (quipeuvent être étendus <strong>de</strong> manière à conserver <strong>de</strong>s informations agrégatives sur les données [1]),les métho<strong>de</strong>s <strong>de</strong> classification et les métho<strong>de</strong>s statistiques <strong>de</strong> calcul d’agrégats (OLAP [42],Quotient Cube [95]).Notons qu’une technique <strong>de</strong> réduction <strong>de</strong> données peut néanmoins fournir <strong>de</strong>s résultatsexacts et non approximatifs. C’est le cas <strong>de</strong>s in<strong>de</strong>x, discutés au chapitre 5 pour leur usageprincipal d’accès aux données. De même, certaines transformées sont réversibles [71, 154] ;le taux d’erreur <strong>de</strong> l’approximation est alors nul. C’est ainsi que la transformée <strong>de</strong> Haar dansl’exemple 2 peut permettre <strong>de</strong> retrouver à l’i<strong>de</strong>ntique le vecteur initial : il suffirait <strong>de</strong> choisir<strong>de</strong>s fonctions S et D sans arrondi. Autre exemple, la représentation d’un sous-ensemble floutrapézoïdal par quatre valeurs <strong>de</strong> son domaine <strong>de</strong> définition (exemple 1) fournit exactement lesmêmes informations qu’une énumération complète <strong>de</strong> ses éléments.1.1.3 Résumés <strong>de</strong> données<strong>Le</strong>s métho<strong>de</strong>s <strong>de</strong> résumé <strong>de</strong> données structurées réalisent également une approximation <strong>de</strong>sdonnées auxquelles elles s’appliquent, c’est-à-dire <strong>de</strong>s enregistrements <strong>de</strong> bases <strong>de</strong> données.Ces métho<strong>de</strong>s ont <strong>comme</strong> point commun <strong>de</strong> recourir à la théorie <strong>de</strong>s sous-ensembles flous,proposée par Za<strong>de</strong>h [151], pour exprimer <strong>de</strong>s concepts vagues. Pour ce faire, <strong>de</strong>s termes dulangage naturel sont modélisés par <strong>de</strong>s sous-ensembles flous, ce qui permet <strong>de</strong> décrire les valeursd’attribut par ces termes. <strong>Le</strong>s <strong>de</strong>scriptions obtenues matérialisent les concepts qui existent ausein <strong>de</strong>s enregistrements, par exemple, « les personnes jeunes et bien payées ». Chacun <strong>de</strong>senregistrements est rattaché à un ou plusieurs concepts suivant l’adéquation entre ses valeursd’attribut et les termes qui étiquettent le concept (jeune et bien payé). Ces métho<strong>de</strong>s s’inscriventdans le cadre <strong>de</strong>s résumés <strong>linguistique</strong>s <strong>de</strong> Yager [150].

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!