24.06.2013 Views

Atelier Visualisation et extraction de connaissances - Irisa

Atelier Visualisation et extraction de connaissances - Irisa

Atelier Visualisation et extraction de connaissances - Irisa

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Juan David Cruz <strong>et</strong> al.<br />

La complexité <strong>de</strong> l'algorithme est proportionnelle au nombre d'attributs du point <strong>de</strong> vue<br />

utilisé, au nombre <strong>de</strong> nœuds <strong>et</strong> la taille du réseau <strong>de</strong> neurones. Elle peut s'exprimer ainsi :<br />

T = O(f 3 .n) (4)<br />

avec n le nombre <strong>de</strong> nœuds du graphe <strong>et</strong> f le nombre d'attributs utilisés dans le point <strong>de</strong><br />

vue.<br />

En sortie <strong>de</strong> l'algorithme, on obtient une partition CSOM <strong>de</strong>s nœuds assignés aux neurones.<br />

4.2 Deuxième phase : clustering structurel <strong>et</strong> détection <strong>de</strong> communautés<br />

Une fois la partition sémantique CSOM calculée on peut alors entrer dans la secon<strong>de</strong> phase <strong>de</strong><br />

la métho<strong>de</strong>. Dans c<strong>et</strong>te étape, on utilise un algorithme classique <strong>de</strong> détection <strong>de</strong><br />

communautés, le "fast unfolding algorithm", proposé par (Blon<strong>de</strong>l <strong>et</strong> al., 2008) <strong>et</strong> présenté<br />

dans la section 2. C<strong>et</strong> algorithme utilise la modularité Q, présentée par (Newman <strong>et</strong> al.,<br />

2004), comme mesure <strong>de</strong> qualité.<br />

Avant l'exécution du "fast unfolding algorithm", on inclue les informations obtenues lors<br />

<strong>de</strong> la première phase. Cela est effectué par le changement <strong>de</strong>s poids <strong>de</strong>s arêtes en fonction <strong>de</strong><br />

la partition obtenue CSOM. Pour chaque paire <strong>de</strong> somm<strong>et</strong>s vi, vj ∋ V, ∀ vi ≠ vj , le poids <strong>de</strong><br />

l'arête e(vi, vj) est modifiée par la distance euclidienne <strong>de</strong>s instances du point <strong>de</strong> vue PoV<br />

correspondant à chaque nœud :<br />

wij = 1 + α (1 − d (Nij)) δij (5)<br />

avec α ≥ 1 une constante, d (Nij) est la distance entre les neurones i <strong>et</strong> j, <strong>et</strong> δij = 1 si vi <strong>et</strong><br />

vj appartiennent au même cluster dans CSOM <strong>et</strong> 0 sinon. L'algorithme 1 montre comment<br />

l'information sémantique est utilisée dans le graphe G.<br />

Une fois que les poids sont modifiés selon l'équation 5, une partition, CSOMFU est calculée<br />

en utilisant le "fast unfolding algorithm". C<strong>et</strong>te nouvelle partition contient l'ensemble <strong>de</strong>s<br />

communautés finales <strong>et</strong> l'information structurelle.<br />

Comme notre approche ajoute un pré-traitement pour trouver une partition sémantique,<br />

CSOM la complexité globale <strong>de</strong> l'algorithme est fonction <strong>de</strong> la complexité du clustering<br />

sémantique <strong>et</strong> <strong>de</strong> celle <strong>de</strong> l'algorithme <strong>de</strong> fast unfolding.<br />

La complexité <strong>de</strong> l'étape <strong>de</strong> clustering sémantique est donnée par l'équation 4 <strong>et</strong> celle <strong>de</strong><br />

l'algorithme <strong>de</strong> fast unfolding est linéaire en nombres <strong>de</strong> nœuds dans le cas <strong>de</strong> matrices<br />

d'adjacences creuses selon (Blon<strong>de</strong>l <strong>et</strong> al., 2008).<br />

Donc, comme les matrices <strong>de</strong>s réseaux sociaux sont en général creuses (Bouklit, 2006), la<br />

complexité globale <strong>de</strong> notre algorithme est en O(|FV | 3 |V|), avec V le nombre <strong>de</strong> nœuds <strong>et</strong> FV<br />

le nombre d'attributs sémantiques utilisés.<br />

5 Premières expérimentations<br />

Nos premières expérimentations ont été réalisées sur trois graphes générés artificiellement.<br />

Le tableau 2 décrit les caractéristiques <strong>de</strong>s graphes générés, la mesure <strong>de</strong> <strong>de</strong>nsité utilisée est :<br />

F.Poul<strong>et</strong>, B.Le Grand : 9e <strong>Atelier</strong> <strong>Visualisation</strong> <strong>et</strong> Extraction <strong>de</strong> Connaissances 31

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!