13.07.2013 Views

Interrogation récursive du Web sémantique - CoDE - Université ...

Interrogation récursive du Web sémantique - CoDE - Université ...

Interrogation récursive du Web sémantique - CoDE - Université ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

2.4 Linking Open Data 16<br />

Mois et année Nombre de triplets RDF Nombre de liens RDF<br />

Mai 2007 500.000.000 120.000<br />

Avril 2008 2.000.000.000 3.000.000<br />

Septembre 2011 31.000.000.000 504.000.000<br />

Table 2.1 – Évolution des ensembles de données publiés grâce à Linking Open Data<br />

2.4 Linking Open Data<br />

Linking Open Data est un projet communautaire collectif visant à publier un maxi-<br />

mum de données libres de droits sur le <strong>Web</strong> de données selon les principes de Linked<br />

Data, en interconnectant des données de différentes sources de données [8, 9]. Une source<br />

de données centrale très populée est DBpedia, l’équivalent de Wikipédia pour le <strong>Web</strong> de<br />

données. Une fois ce réseau de sources de données créé, il est alors intéressant de dévelop-<br />

per des clients Linked Data permettant de naviguer parmi ces données interconnectées.<br />

Il existe actuellement déjà des outils de navigation interactive des données permettant<br />

cela. Les organisations participant à la publication de ce contenu sont, d’une part, des<br />

universités (principalement des États-Unis, d’Allemagne et <strong>du</strong> Royaume-Uni en 2008)<br />

et, d’autre part, des sociétés (telles que la BBC, Renault, etc) [4].<br />

Il est intéressant d’observer l’évolution des ensembles de données publiés grâce au<br />

projet au fil <strong>du</strong> temps, illustrée à la table 2.4. Des représentations graphiques de ces en-<br />

sembles de données interconnectés (linked datasets, ou LDS) ont été réalisées, comme il<br />

est possible de le voir à la figure 2.6. Chaque flèche liant deux sources de données indique<br />

que ces sources ont été liées entre elles, et ont défini un ensemble de liens sameAs, afin<br />

de signifier à l’utilisateur qu’une ressource définie par la première source est conceptuel-<br />

lement équivalente à une autre ressource définie par la deuxième source.<br />

Le projet vise à connecter un maximum de sources de données entre elles, afin d’ob-<br />

tenir “UN” grand et unique <strong>Web</strong> de données. Les sources de données peuvent cependant<br />

être regroupées par noeuds ou clusters, c’est-à-dire par thématique. Par exemple, toutes<br />

les sources contenant de l’information sur les génomes peuvent être regroupées en un<br />

cluster propre à ce thème, toutes les sources à vocation cinématographique dans un clus-<br />

ter spécifique au cinéma, etc. Si l’on observe la figure 2.6, on remarque que les cercles<br />

représentant les sources ont chacun une couleur de fond. Ces couleurs représentent les<br />

clusters cités ci-dessus.<br />

Il est fort intéressant d’observer l’évolution au cours <strong>du</strong> temps des sources de données<br />

interconnectées grâce au projet Linking Open Data. Les graphes représentant les sources

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!