24.06.2013 Views

Atelier Visualisation et extraction de connaissances - Irisa

Atelier Visualisation et extraction de connaissances - Irisa

Atelier Visualisation et extraction de connaissances - Irisa

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

E. Cuvelier <strong>et</strong> M-A. Aufaure<br />

FIG. 5 – Affichage réduit du treillis <strong>de</strong> Galois <strong>de</strong>s espèces animales <strong>de</strong> la table 1.<br />

pour chaque concept trouvé l’ensemble <strong>de</strong> ses concepts-fils. Pour voir une revue <strong>de</strong>s autres<br />

algorithmes pour la génération <strong>de</strong> treillis, voir l’article <strong>de</strong> Kuzn<strong>et</strong>sov <strong>et</strong> Obedkov (2001) qui<br />

effectue aussi une comparaison <strong>de</strong>s performances.<br />

Un <strong>de</strong>s avantages non négligeable <strong>de</strong> la classification basée sur les treillis est que pour<br />

une table <strong>de</strong> contexte donnée le treillis résultant est unique (pas d’instabilité à l’exécution), <strong>et</strong><br />

il est exhaustif (tous les concepts existants s’y trouvent). Dans le cas qui nous occupe c<strong>et</strong>te<br />

classification va nous perm<strong>et</strong>tre <strong>de</strong> r<strong>et</strong>rouver tous les groupes <strong>de</strong> mots présents dans un groupe<br />

<strong>de</strong> twe<strong>et</strong>s <strong>et</strong> <strong>de</strong> les représenter <strong>de</strong> façon similaire à la figure 3.<br />

4 E-buzz Monitoring<br />

Dans ce qui suit nous proposons d’analyser un groupe <strong>de</strong> twe<strong>et</strong>s, afin d’y repérer les termes<br />

<strong>et</strong> groupes <strong>de</strong> termes les plus twe<strong>et</strong>és dans le groupe considéré. Pour ce faire nous proposons<br />

une démarche en quatre étapes :<br />

1. Récupération <strong>de</strong>s twe<strong>et</strong>s contenant un ou plusieurs mots clés ;<br />

2. N<strong>et</strong>toyage <strong>de</strong>s twe<strong>et</strong>s (suppression <strong>de</strong>s mots <strong>de</strong> liaisons, ponctuations,...) ;<br />

3. Établissement d’une table <strong>de</strong> contexte où les obj<strong>et</strong>s sont les twe<strong>et</strong>s <strong>et</strong>, les attributs les<br />

mots contenus dans ces <strong>de</strong>rniers ;<br />

4. Calcul du treillis <strong>de</strong> Galois correspondant ;<br />

5. <strong>Visualisation</strong> <strong>de</strong>s résultats.<br />

Pour illustrer notre technique nous utiliserons un ensemble <strong>de</strong> 50 twe<strong>et</strong>s récupérés en faisant<br />

une recherche sur le mot clé “#ereputation”. Nous donnons ci <strong>de</strong>ssous, en guise d’illustration<br />

les 5 premiers twe<strong>et</strong>s <strong>de</strong> c<strong>et</strong> ensemble :<br />

F.Poul<strong>et</strong>, B.Le Grand : 9e <strong>Atelier</strong> <strong>Visualisation</strong> <strong>et</strong> Extraction <strong>de</strong> Connaissances 7

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!