Atelier Visualisation et extraction de connaissances - Irisa
Atelier Visualisation et extraction de connaissances - Irisa
Atelier Visualisation et extraction de connaissances - Irisa
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Juan David Cruz <strong>et</strong> al.<br />
La complexité <strong>de</strong> l'algorithme est proportionnelle au nombre d'attributs du point <strong>de</strong> vue<br />
utilisé, au nombre <strong>de</strong> nœuds <strong>et</strong> la taille du réseau <strong>de</strong> neurones. Elle peut s'exprimer ainsi :<br />
T = O(f 3 .n) (4)<br />
avec n le nombre <strong>de</strong> nœuds du graphe <strong>et</strong> f le nombre d'attributs utilisés dans le point <strong>de</strong><br />
vue.<br />
En sortie <strong>de</strong> l'algorithme, on obtient une partition CSOM <strong>de</strong>s nœuds assignés aux neurones.<br />
4.2 Deuxième phase : clustering structurel <strong>et</strong> détection <strong>de</strong> communautés<br />
Une fois la partition sémantique CSOM calculée on peut alors entrer dans la secon<strong>de</strong> phase <strong>de</strong><br />
la métho<strong>de</strong>. Dans c<strong>et</strong>te étape, on utilise un algorithme classique <strong>de</strong> détection <strong>de</strong><br />
communautés, le "fast unfolding algorithm", proposé par (Blon<strong>de</strong>l <strong>et</strong> al., 2008) <strong>et</strong> présenté<br />
dans la section 2. C<strong>et</strong> algorithme utilise la modularité Q, présentée par (Newman <strong>et</strong> al.,<br />
2004), comme mesure <strong>de</strong> qualité.<br />
Avant l'exécution du "fast unfolding algorithm", on inclue les informations obtenues lors<br />
<strong>de</strong> la première phase. Cela est effectué par le changement <strong>de</strong>s poids <strong>de</strong>s arêtes en fonction <strong>de</strong><br />
la partition obtenue CSOM. Pour chaque paire <strong>de</strong> somm<strong>et</strong>s vi, vj ∋ V, ∀ vi ≠ vj , le poids <strong>de</strong><br />
l'arête e(vi, vj) est modifiée par la distance euclidienne <strong>de</strong>s instances du point <strong>de</strong> vue PoV<br />
correspondant à chaque nœud :<br />
wij = 1 + α (1 − d (Nij)) δij (5)<br />
avec α ≥ 1 une constante, d (Nij) est la distance entre les neurones i <strong>et</strong> j, <strong>et</strong> δij = 1 si vi <strong>et</strong><br />
vj appartiennent au même cluster dans CSOM <strong>et</strong> 0 sinon. L'algorithme 1 montre comment<br />
l'information sémantique est utilisée dans le graphe G.<br />
Une fois que les poids sont modifiés selon l'équation 5, une partition, CSOMFU est calculée<br />
en utilisant le "fast unfolding algorithm". C<strong>et</strong>te nouvelle partition contient l'ensemble <strong>de</strong>s<br />
communautés finales <strong>et</strong> l'information structurelle.<br />
Comme notre approche ajoute un pré-traitement pour trouver une partition sémantique,<br />
CSOM la complexité globale <strong>de</strong> l'algorithme est fonction <strong>de</strong> la complexité du clustering<br />
sémantique <strong>et</strong> <strong>de</strong> celle <strong>de</strong> l'algorithme <strong>de</strong> fast unfolding.<br />
La complexité <strong>de</strong> l'étape <strong>de</strong> clustering sémantique est donnée par l'équation 4 <strong>et</strong> celle <strong>de</strong><br />
l'algorithme <strong>de</strong> fast unfolding est linéaire en nombres <strong>de</strong> nœuds dans le cas <strong>de</strong> matrices<br />
d'adjacences creuses selon (Blon<strong>de</strong>l <strong>et</strong> al., 2008).<br />
Donc, comme les matrices <strong>de</strong>s réseaux sociaux sont en général creuses (Bouklit, 2006), la<br />
complexité globale <strong>de</strong> notre algorithme est en O(|FV | 3 |V|), avec V le nombre <strong>de</strong> nœuds <strong>et</strong> FV<br />
le nombre d'attributs sémantiques utilisés.<br />
5 Premières expérimentations<br />
Nos premières expérimentations ont été réalisées sur trois graphes générés artificiellement.<br />
Le tableau 2 décrit les caractéristiques <strong>de</strong>s graphes générés, la mesure <strong>de</strong> <strong>de</strong>nsité utilisée est :<br />
F.Poul<strong>et</strong>, B.Le Grand : 9e <strong>Atelier</strong> <strong>Visualisation</strong> <strong>et</strong> Extraction <strong>de</strong> Connaissances 31