Interrogation récursive du Web sémantique - CoDE - Université ...
Interrogation récursive du Web sémantique - CoDE - Université ...
Interrogation récursive du Web sémantique - CoDE - Université ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
2.4 Linking Open Data 16<br />
Mois et année Nombre de triplets RDF Nombre de liens RDF<br />
Mai 2007 500.000.000 120.000<br />
Avril 2008 2.000.000.000 3.000.000<br />
Septembre 2011 31.000.000.000 504.000.000<br />
Table 2.1 – Évolution des ensembles de données publiés grâce à Linking Open Data<br />
2.4 Linking Open Data<br />
Linking Open Data est un projet communautaire collectif visant à publier un maxi-<br />
mum de données libres de droits sur le <strong>Web</strong> de données selon les principes de Linked<br />
Data, en interconnectant des données de différentes sources de données [8, 9]. Une source<br />
de données centrale très populée est DBpedia, l’équivalent de Wikipédia pour le <strong>Web</strong> de<br />
données. Une fois ce réseau de sources de données créé, il est alors intéressant de dévelop-<br />
per des clients Linked Data permettant de naviguer parmi ces données interconnectées.<br />
Il existe actuellement déjà des outils de navigation interactive des données permettant<br />
cela. Les organisations participant à la publication de ce contenu sont, d’une part, des<br />
universités (principalement des États-Unis, d’Allemagne et <strong>du</strong> Royaume-Uni en 2008)<br />
et, d’autre part, des sociétés (telles que la BBC, Renault, etc) [4].<br />
Il est intéressant d’observer l’évolution des ensembles de données publiés grâce au<br />
projet au fil <strong>du</strong> temps, illustrée à la table 2.4. Des représentations graphiques de ces en-<br />
sembles de données interconnectés (linked datasets, ou LDS) ont été réalisées, comme il<br />
est possible de le voir à la figure 2.6. Chaque flèche liant deux sources de données indique<br />
que ces sources ont été liées entre elles, et ont défini un ensemble de liens sameAs, afin<br />
de signifier à l’utilisateur qu’une ressource définie par la première source est conceptuel-<br />
lement équivalente à une autre ressource définie par la deuxième source.<br />
Le projet vise à connecter un maximum de sources de données entre elles, afin d’ob-<br />
tenir “UN” grand et unique <strong>Web</strong> de données. Les sources de données peuvent cependant<br />
être regroupées par noeuds ou clusters, c’est-à-dire par thématique. Par exemple, toutes<br />
les sources contenant de l’information sur les génomes peuvent être regroupées en un<br />
cluster propre à ce thème, toutes les sources à vocation cinématographique dans un clus-<br />
ter spécifique au cinéma, etc. Si l’on observe la figure 2.6, on remarque que les cercles<br />
représentant les sources ont chacun une couleur de fond. Ces couleurs représentent les<br />
clusters cités ci-dessus.<br />
Il est fort intéressant d’observer l’évolution au cours <strong>du</strong> temps des sources de données<br />
interconnectées grâce au projet Linking Open Data. Les graphes représentant les sources