RDF-S3 und eRQL: RDF-Technologien für ... - eWorks
RDF-S3 und eRQL: RDF-Technologien für ... - eWorks
RDF-S3 und eRQL: RDF-Technologien für ... - eWorks
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>RDF</strong>-<strong>S3</strong> <strong>und</strong> <strong>eRQL</strong>:<br />
<strong>RDF</strong>-<strong>Technologien</strong> <strong>für</strong><br />
Informationsportale<br />
Karsten Tolle <strong>und</strong><br />
Fabian Wleklinski
Inhalt<br />
Speicherung:<br />
<strong>RDF</strong> Source related Storage System (<strong>RDF</strong>-<strong>S3</strong>)<br />
Anfrage:<br />
easy <strong>RDF</strong> Query Language (<strong>eRQL</strong>)<br />
Darstellung <strong>und</strong> Ranking der Ergebnisse
Dezentrale Speicherung<br />
Agenten, Peer-Peer,<br />
Alert-Systeme<br />
Ausgangspunkt<br />
Zentrale Speicherung<br />
Datenbanken, ad-hoc Anfragen
Fehlende Quellinformationen<br />
Im <strong>RDF</strong> Modell ist die Speicherung der Herkunft<br />
der Daten nicht vorgesehen. Diese<br />
Quellinformationen sind jedoch nützlich zur:<br />
– Überprüfung der Daten (Aktualität)<br />
– Bezug weiterer Informationen (HTML)<br />
– Glaubwürdigkeit<br />
Jeder kann beliebige Aussagen ins Internet stellen.
Glaubwürdigkeit<br />
Stimmen die Angaben?<br />
P s:offer<br />
s:price<br />
100 $<br />
s:offer<br />
http://www.abc.com vom 23.09.2004<br />
http://www.abc.com vom 23.09.2004<br />
????<br />
s:price<br />
s:by<br />
s:by<br />
http://www.xyz.com<br />
80 $<br />
http://www.abc.com
<strong>RDF</strong>-<strong>S3</strong> Eigenschaften<br />
Speicherung der Quellinformation zu jedem <strong>RDF</strong><br />
Tripel<br />
Möglichkeit zum Löschen <strong>und</strong> Aktualisieren<br />
einzelner Quellen<br />
Optimierung durch Kombination der Generischen-<br />
<strong>und</strong> Schemaspezifischen-Repräsentation der <strong>RDF</strong>-<br />
Daten innerhalb der Datenbank
R D F /X M L f iles<br />
<strong>RDF</strong>-<strong>S3</strong> Aufbau<br />
hohe Datenqualität durch semantische<br />
Überprüfungsfunktionen, die der integrierte<br />
Validating <strong>RDF</strong> Parser (VRP) bietet<br />
I C S -V R P<br />
V alidato r<br />
V R P<br />
I nter nal<br />
R D F M od el<br />
S tream<br />
B ased A P I<br />
R D F - S 3<br />
R D F -S 3<br />
L oader<br />
JD B C - S Q L<br />
R D F -S 3<br />
R epo sito r y<br />
R D F -S 3 A P I
<strong>RDF</strong>-<strong>S3</strong> Demo
Problem – Verständnis<br />
Real-World-Beispiel:<br />
– Zur Erzeugung dieser Präsentation wurde die Länge der<br />
Tower Bridge gesucht<br />
– Suche mit "Tower Bridge" length lieferte eine<br />
Menge Ergebnisseiten, aber:<br />
• Einheiten verschieden (z. B. “Fuß”) oder fehlend<br />
• “Länge” einer Brücke?<br />
– Spannweite? Gesamtlänge? Länge der beweglichen Teile? …?<br />
– Zwei „Kontexte“ nötig: Einheit <strong>und</strong> Längendefinition
Problem – Verständnis<br />
<strong>RDF</strong> Aussagen können oft nur in ihrem<br />
Kontext verstanden werden<br />
– Beispiel: Width of Golden Gate Bridge?<br />
• 90! 90? 90 Meter, 90 Inch, 90 Feet?<br />
rdf:comment<br />
s:name<br />
s:widthofsidewalk<br />
10.5<br />
Golden Gate Bridge<br />
s:width<br />
All units of measurements are in feet.<br />
90
Ziele<br />
<strong>eRQL</strong><br />
1. So einfach wie möglich!<br />
2. Nutzung der Möglichkeiten<br />
durch die Speicherung der<br />
Quellinformation!<br />
3. Darstellung der Ergebnisse<br />
in ihrem Kontext (siehe<br />
Golden Gate Bridge Beispiel)!<br />
Ein-Wort-Abfragen<br />
Dokumenten-Modus<br />
PointOfInterest-Modus
Ein-Wort-Anfrage<br />
SELECT ?s, ?p, ?o<br />
Sehr einfach WHERE <strong>und</strong> ohne ?s =~ Vorwissen „bridge“ einsetzbar!<br />
– Idee: nicht AND komplizierter ?p =~ „bridge“ als Google<br />
Beispiel: Tripel,<br />
AND ?o<br />
die<br />
=~<br />
„bridge“<br />
„bridge“<br />
enthalten<br />
??????<br />
– <strong>eRQL</strong>: bridge<br />
– RQL: select * from {X}@P{Y} where<br />
@P like "*[bB][rR][iI][dD][gG][eE]*"<br />
or X like "*[bB][rR][iI][dD][gG][eE]*"<br />
or Y like "*[bB][rR][iI][dD][gG][eE]*"<br />
– RDQL:ähnlich wie RQL<br />
• Perl ähnliche Notation
0: weglassen<br />
1: einschränken<br />
Dokumenten-Modus<br />
Ermöglicht die Einschränkung auf ausgewählte<br />
Quellen (oder das Weglassen nicht<br />
vertrauenswürdiger Quellen)<br />
Syntax: <br />
– Beispiel: <br />
In RQL nicht vorgesehen!<br />
In RDQL können in der from-Klausel<br />
Einschränkungen definiert werden<br />
– Aber kein gezieltes Weglassen
PointOfInterest-Modus<br />
Gibt den internen Kontext (umgebener <strong>RDF</strong><br />
Graph) der einzelnen Treffer mit an<br />
– Ergebnisse können besser verstanden werden (siehe<br />
Golden Gate Bridge)<br />
Die Größe des zu zeigenden Kontextes wird in der<br />
Anfrage definiert<br />
Beispiel:<br />
[bridge] ohne Kontext<br />
bridge Kontextgröße 1 (default)<br />
~ bridge Kontextgröße 2<br />
~~ bridge Kontextgröße 3 ...
<strong>eRQL</strong> − PointOfInterest<br />
<strong>eRQL</strong> erweitert F<strong>und</strong>stellen zu “POIs”<br />
– benachbarte Aussagen werden hinzugefügt<br />
• z. B. “comment” zu “Golden Gate Bridge”<br />
rdf:comment<br />
s:name<br />
s:widthofsidewalk<br />
10.5<br />
Golden Gate Bridge<br />
s:width<br />
All units of measurements are feet.<br />
90
<strong>eRQL</strong> − PointOfInterest<br />
POIs werden auch <strong>für</strong> Sub-Queries gebildet<br />
– "Golden Gate Bridge" OR "Tower Bridge"<br />
90<br />
s:width<br />
Golden Gate Bridge s:name<br />
s:name<br />
s:length<br />
268<br />
Tower Bridge
<strong>eRQL</strong> − PointOfInterest<br />
POIs werden auch <strong>für</strong> Sub-Queries gebildet<br />
– "Golden Gate Bridge" AND width<br />
90<br />
• POIs <strong>für</strong> “Golden Gate Bridge” <strong>und</strong> “width” werden gebildet<br />
• Vereinigung der POIs, falls diese überlappen, sonst leer<br />
• übereinstimmend mit “Google-Query”<br />
s:width<br />
s:name<br />
Golden Gate Bridge
eRqlEngine<br />
<strong>eRQL</strong>-Prototyp<br />
– kein Datenbank-Backend<br />
• arbeitet mit <strong>RDF</strong>-Dateien<br />
• einfache Installation<br />
Details <strong>und</strong> Download:<br />
– www.dbis.informatik.unifrankfurt.de/~tolle/<strong>RDF</strong>/<strong>eRQL</strong>/<br />
– www.wleklinski.de/rdf/
<strong>eRQL</strong> Demo
Zusammenfassung<br />
<strong>RDF</strong>-<strong>S3</strong> <strong>und</strong> <strong>eRQL</strong> bieten:<br />
Überprüfbare Daten mehr Glaubwürdigkeit<br />
Antworten mit Kontext mehr Verständnis<br />
der Ergebnisse<br />
Anfragen können auf ausgewählte Quellen<br />
eingeschränkt werden bessere Ergebnisse<br />
sehr einfach kann ohne Vorwissen genutzt<br />
werden (wichtig <strong>für</strong> Portale)
Zukünftige Ziele<br />
Steigerung der Performance von <strong>RDF</strong>-<strong>S3</strong><br />
<strong>und</strong> <strong>eRQL</strong><br />
Weitere nützliche Anfragemöglichkeiten<br />
untersuchen<br />
Verbesserung der Ergebnisdarstellung<br />
Versionsunterstützung <strong>für</strong> Quellen unter<br />
<strong>RDF</strong>-<strong>S3</strong><br />
...
Danke <strong>für</strong> die Aufmerksamkeit<br />
Weitere Infos <strong>und</strong> Downloads:<br />
Kontakt:<br />
Fragen?<br />
http://www.dbis.informatik.uni-frankfurt.de/~tolle/rdf/<br />
Karsten Tolle: tolle@dbis.informatik.uni-frankfurt.de<br />
Fabian Wleklinski: wleklinski@eworks.de