13.07.2013 Views

Interrogation récursive du Web sémantique - CoDE - Université ...

Interrogation récursive du Web sémantique - CoDE - Université ...

Interrogation récursive du Web sémantique - CoDE - Université ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

4.5 Le Link Traversal, une approche d’interrogation <strong>récursive</strong> 38<br />

Le Link Traversal est une approche totalement basée sur le parcours de liens RDF<br />

et ne nécessite aucunement la connaissance préalable de sources de données <strong>sémantique</strong>s<br />

[23]. Elle est partie <strong>du</strong> concept d’une navigation manuelle des liens RDF, implémentée<br />

par le navigateur Tabulator, un projet de navigateur de données RDF [11, 24]. Le Link<br />

Traversal offre une navigation automatisée de ce concept et permet ainsi l’exécution de<br />

requêtes SPARQL sur le <strong>Web</strong> de données, sans la nécessité de points d’accès SPARQL<br />

pour autant. En effet, cela nécessite seulement que les URI identifiant les ressources<br />

soient déréférençables (i.e. par application des principes de Linked Data [6], le déréfé-<br />

rencement de l’URI d’une ressource par une requête HTTP renvoie des triplets RDF<br />

contenant de l’information sur la ressource en question). Ainsi, chaque ressource ren-<br />

voie une quantité d’informations limitée, mais très pertinente puisque ces informations<br />

concernent la ressource en question.<br />

La méthode d’interrogation <strong>du</strong> Link Traversal est la suivante [14] : lors de l’exécution<br />

d’une requête, l’algorithme alterne en permanence entre la résolution d’un Triple Pattern<br />

(TP) de la requête et le déréférencement de nouvelles URI découvertes <strong>du</strong>rant l’exécution<br />

de la requête. Cela permet d’augmenter en permanence l’ensemble de données récupérées<br />

localement le temps de la requête, en y ajoutant des données ayant une forte probabilité<br />

d’être pertinentes pour l’exécution de cette requête. Le temps d’accès réseau étant un<br />

facteur dominant pour le temps d’exécution de la requête, il ne serait pas de bon ton<br />

de déréférencer toutes les URI découvertes lors de déréférencements précédents, car bon<br />

nombre d’entre elles ne seraient peut-être pas pertinentes pour la requête courante.<br />

Ainsi, l’algorithme ne déréférence que les URI contenues dans les solutions intermédiaires<br />

pro<strong>du</strong>ites au fur et à mesure de l’évaluation de la requête (un exemple illustrant cela est<br />

donné plus bas).<br />

Le Link Traversal a pour avantage de profiter totalement <strong>du</strong> potentiel <strong>du</strong> <strong>Web</strong> sé-<br />

mantique et permet d’obtenir, avec peu de triplets RDF, beaucoup d’informations utiles<br />

pour la résolution de la requête. On peut donc obtenir des résultats pertinents en un<br />

temps raisonnable. Par contre, le temps nécessaire avant d’obtenir le dernier résultat<br />

peut être très long comparé aux autres méthodes. Son exhaustivité est inférieure à 100%<br />

puisque, comme dit précédemment, il serait impensable d’interroger l’entièreté <strong>du</strong> <strong>Web</strong><br />

de données avant d’exécuter la requête.<br />

Exemple d’application <strong>du</strong> Link Traversal<br />

Un exemple d’application <strong>du</strong> Link Traversal est donné plus loin à la section 5.3.1.<br />

Cet exemple montrera concrètement que l’ensemble de données local est continuellement

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!