13.07.2013 Views

Interrogation récursive du Web sémantique - CoDE - Université ...

Interrogation récursive du Web sémantique - CoDE - Université ...

Interrogation récursive du Web sémantique - CoDE - Université ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

4.4 La fédération de requêtes avec découverte active (ADQF) 36<br />

renvoient alors les résultats correspondants. Le premier serveur peut alors agréger ces<br />

sous-résultats et renvoyer les résultats finaux à l’utilisateur. C’est donc une exécution<br />

distribuée et non centralisée, comme c’était le cas pour les entrepôts de données et les<br />

moteurs de recherche.<br />

Cette méthode présente l’avantage qu’il n’est plus nécessaire de garder les données<br />

copiées synchronisées, puisque l’on accède directement à la source. De plus, cela ne<br />

nécessite pas d’espace disque supplémentaire redondant. Elle est en revanche beaucoup<br />

plus lente, puisqu’elle nécessite beaucoup d’accès réseau, ce qui ralentit considérablement<br />

le temps de la requête. De plus, l’ensemble de données interrogeables de cette méthode<br />

est limité aux sources de données connues.<br />

L’exhaustivité de la fédération de requêtes est de 100%, sauf dans le cas où l’interface<br />

d’un LDS est inaccessible sur le réseau (panne, etc.). L’interrogation de ces LDS s’exprime<br />

généralement par une requête SPARQL et se fait typiquement via leur point d’accès<br />

SPARQL.<br />

L’exécution d’une telle requête SPARQL implique souvent beaucoup de jointures (une<br />

par Triple Pattern dans le pire des cas), or ces jointures allongent drastiquement le temps<br />

de requête, puisqu’effectuées sur un accès réseau. Au vu de la croissance des données pu-<br />

bliées sur le <strong>Web</strong> de données, et vu la complexité potentielle des requêtes SPARQL,<br />

il est donc nécessaire d’établir des méthodes d’optimisation pour pallier cette lenteur.<br />

Les méthodes d’optimisation traditionnelles de bases de données ne sont pas spéciale-<br />

ment applicables dans le cas <strong>du</strong> <strong>Web</strong> de données, car elles reposent sur la connaissance<br />

préalable de la structure des données contenues dans les sources de données distantes.<br />

Mais alors que les bases de données possèdent des données structurées (les schémas<br />

sont connus d’avance), le <strong>Web</strong> de données présente des données semi-structurées, et il<br />

n’existe donc pas de tel schéma. Il est donc nécessaire d’établir de nouveaux algorithmes<br />

d’optimisation, et des recherches sont actuellement effectuées en ce sens [11, 21, 22].<br />

4.4 La fédération de requêtes avec découverte active (ADQF)<br />

Les trois approches présentées précédemment impliquent la connaissance préalable<br />

des sources de données que l’on va interroger, ce qui restreint la portée des applications<br />

développées, puisque celles-ci sont limitées à l’utilisation de ces sources connues. Afin<br />

d’utiliser tout le potentiel <strong>du</strong> <strong>Web</strong> de données, il est donc nécessaire d’implémenter des<br />

méthodes de découverte active des sources de données, permettant ainsi de découvrir de<br />

nouvelles sources <strong>du</strong>rant l’exécution de la requête elle-même.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!