Interrogation récursive du Web sémantique - CoDE - Université ...
Interrogation récursive du Web sémantique - CoDE - Université ...
Interrogation récursive du Web sémantique - CoDE - Université ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
4.4 La fédération de requêtes avec découverte active (ADQF) 36<br />
renvoient alors les résultats correspondants. Le premier serveur peut alors agréger ces<br />
sous-résultats et renvoyer les résultats finaux à l’utilisateur. C’est donc une exécution<br />
distribuée et non centralisée, comme c’était le cas pour les entrepôts de données et les<br />
moteurs de recherche.<br />
Cette méthode présente l’avantage qu’il n’est plus nécessaire de garder les données<br />
copiées synchronisées, puisque l’on accède directement à la source. De plus, cela ne<br />
nécessite pas d’espace disque supplémentaire redondant. Elle est en revanche beaucoup<br />
plus lente, puisqu’elle nécessite beaucoup d’accès réseau, ce qui ralentit considérablement<br />
le temps de la requête. De plus, l’ensemble de données interrogeables de cette méthode<br />
est limité aux sources de données connues.<br />
L’exhaustivité de la fédération de requêtes est de 100%, sauf dans le cas où l’interface<br />
d’un LDS est inaccessible sur le réseau (panne, etc.). L’interrogation de ces LDS s’exprime<br />
généralement par une requête SPARQL et se fait typiquement via leur point d’accès<br />
SPARQL.<br />
L’exécution d’une telle requête SPARQL implique souvent beaucoup de jointures (une<br />
par Triple Pattern dans le pire des cas), or ces jointures allongent drastiquement le temps<br />
de requête, puisqu’effectuées sur un accès réseau. Au vu de la croissance des données pu-<br />
bliées sur le <strong>Web</strong> de données, et vu la complexité potentielle des requêtes SPARQL,<br />
il est donc nécessaire d’établir des méthodes d’optimisation pour pallier cette lenteur.<br />
Les méthodes d’optimisation traditionnelles de bases de données ne sont pas spéciale-<br />
ment applicables dans le cas <strong>du</strong> <strong>Web</strong> de données, car elles reposent sur la connaissance<br />
préalable de la structure des données contenues dans les sources de données distantes.<br />
Mais alors que les bases de données possèdent des données structurées (les schémas<br />
sont connus d’avance), le <strong>Web</strong> de données présente des données semi-structurées, et il<br />
n’existe donc pas de tel schéma. Il est donc nécessaire d’établir de nouveaux algorithmes<br />
d’optimisation, et des recherches sont actuellement effectuées en ce sens [11, 21, 22].<br />
4.4 La fédération de requêtes avec découverte active (ADQF)<br />
Les trois approches présentées précédemment impliquent la connaissance préalable<br />
des sources de données que l’on va interroger, ce qui restreint la portée des applications<br />
développées, puisque celles-ci sont limitées à l’utilisation de ces sources connues. Afin<br />
d’utiliser tout le potentiel <strong>du</strong> <strong>Web</strong> de données, il est donc nécessaire d’implémenter des<br />
méthodes de découverte active des sources de données, permettant ainsi de découvrir de<br />
nouvelles sources <strong>du</strong>rant l’exécution de la requête elle-même.