27.08.2013 Aufrufe

RDF-S3 und eRQL: RDF-Technologien für ... - eWorks

RDF-S3 und eRQL: RDF-Technologien für ... - eWorks

RDF-S3 und eRQL: RDF-Technologien für ... - eWorks

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>RDF</strong>-<strong>S3</strong> <strong>und</strong> <strong>eRQL</strong>:<br />

<strong>RDF</strong>-<strong>Technologien</strong> <strong>für</strong><br />

Informationsportale<br />

Karsten Tolle <strong>und</strong><br />

Fabian Wleklinski


Inhalt<br />

Speicherung:<br />

<strong>RDF</strong> Source related Storage System (<strong>RDF</strong>-<strong>S3</strong>)<br />

Anfrage:<br />

easy <strong>RDF</strong> Query Language (<strong>eRQL</strong>)<br />

Darstellung <strong>und</strong> Ranking der Ergebnisse


Dezentrale Speicherung<br />

Agenten, Peer-Peer,<br />

Alert-Systeme<br />

Ausgangspunkt<br />

Zentrale Speicherung<br />

Datenbanken, ad-hoc Anfragen


Fehlende Quellinformationen<br />

Im <strong>RDF</strong> Modell ist die Speicherung der Herkunft<br />

der Daten nicht vorgesehen. Diese<br />

Quellinformationen sind jedoch nützlich zur:<br />

– Überprüfung der Daten (Aktualität)<br />

– Bezug weiterer Informationen (HTML)<br />

– Glaubwürdigkeit<br />

Jeder kann beliebige Aussagen ins Internet stellen.


Glaubwürdigkeit<br />

Stimmen die Angaben?<br />

P s:offer<br />

s:price<br />

100 $<br />

s:offer<br />

http://www.abc.com vom 23.09.2004<br />

http://www.abc.com vom 23.09.2004<br />

????<br />

s:price<br />

s:by<br />

s:by<br />

http://www.xyz.com<br />

80 $<br />

http://www.abc.com


<strong>RDF</strong>-<strong>S3</strong> Eigenschaften<br />

Speicherung der Quellinformation zu jedem <strong>RDF</strong><br />

Tripel<br />

Möglichkeit zum Löschen <strong>und</strong> Aktualisieren<br />

einzelner Quellen<br />

Optimierung durch Kombination der Generischen-<br />

<strong>und</strong> Schemaspezifischen-Repräsentation der <strong>RDF</strong>-<br />

Daten innerhalb der Datenbank


R D F /X M L f iles<br />

<strong>RDF</strong>-<strong>S3</strong> Aufbau<br />

hohe Datenqualität durch semantische<br />

Überprüfungsfunktionen, die der integrierte<br />

Validating <strong>RDF</strong> Parser (VRP) bietet<br />

I C S -V R P<br />

V alidato r<br />

V R P<br />

I nter nal<br />

R D F M od el<br />

S tream<br />

B ased A P I<br />

R D F - S 3<br />

R D F -S 3<br />

L oader<br />

JD B C - S Q L<br />

R D F -S 3<br />

R epo sito r y<br />

R D F -S 3 A P I


<strong>RDF</strong>-<strong>S3</strong> Demo


Problem – Verständnis<br />

Real-World-Beispiel:<br />

– Zur Erzeugung dieser Präsentation wurde die Länge der<br />

Tower Bridge gesucht<br />

– Suche mit "Tower Bridge" length lieferte eine<br />

Menge Ergebnisseiten, aber:<br />

• Einheiten verschieden (z. B. “Fuß”) oder fehlend<br />

• “Länge” einer Brücke?<br />

– Spannweite? Gesamtlänge? Länge der beweglichen Teile? …?<br />

– Zwei „Kontexte“ nötig: Einheit <strong>und</strong> Längendefinition


Problem – Verständnis<br />

<strong>RDF</strong> Aussagen können oft nur in ihrem<br />

Kontext verstanden werden<br />

– Beispiel: Width of Golden Gate Bridge?<br />

• 90! 90? 90 Meter, 90 Inch, 90 Feet?<br />

rdf:comment<br />

s:name<br />

s:widthofsidewalk<br />

10.5<br />

Golden Gate Bridge<br />

s:width<br />

All units of measurements are in feet.<br />

90


Ziele<br />

<strong>eRQL</strong><br />

1. So einfach wie möglich!<br />

2. Nutzung der Möglichkeiten<br />

durch die Speicherung der<br />

Quellinformation!<br />

3. Darstellung der Ergebnisse<br />

in ihrem Kontext (siehe<br />

Golden Gate Bridge Beispiel)!<br />

Ein-Wort-Abfragen<br />

Dokumenten-Modus<br />

PointOfInterest-Modus


Ein-Wort-Anfrage<br />

SELECT ?s, ?p, ?o<br />

Sehr einfach WHERE <strong>und</strong> ohne ?s =~ Vorwissen „bridge“ einsetzbar!<br />

– Idee: nicht AND komplizierter ?p =~ „bridge“ als Google<br />

Beispiel: Tripel,<br />

AND ?o<br />

die<br />

=~<br />

„bridge“<br />

„bridge“<br />

enthalten<br />

??????<br />

– <strong>eRQL</strong>: bridge<br />

– RQL: select * from {X}@P{Y} where<br />

@P like "*[bB][rR][iI][dD][gG][eE]*"<br />

or X like "*[bB][rR][iI][dD][gG][eE]*"<br />

or Y like "*[bB][rR][iI][dD][gG][eE]*"<br />

– RDQL:ähnlich wie RQL<br />

• Perl ähnliche Notation


0: weglassen<br />

1: einschränken<br />

Dokumenten-Modus<br />

Ermöglicht die Einschränkung auf ausgewählte<br />

Quellen (oder das Weglassen nicht<br />

vertrauenswürdiger Quellen)<br />

Syntax: <br />

– Beispiel: <br />

In RQL nicht vorgesehen!<br />

In RDQL können in der from-Klausel<br />

Einschränkungen definiert werden<br />

– Aber kein gezieltes Weglassen


PointOfInterest-Modus<br />

Gibt den internen Kontext (umgebener <strong>RDF</strong><br />

Graph) der einzelnen Treffer mit an<br />

– Ergebnisse können besser verstanden werden (siehe<br />

Golden Gate Bridge)<br />

Die Größe des zu zeigenden Kontextes wird in der<br />

Anfrage definiert<br />

Beispiel:<br />

[bridge] ohne Kontext<br />

bridge Kontextgröße 1 (default)<br />

~ bridge Kontextgröße 2<br />

~~ bridge Kontextgröße 3 ...


<strong>eRQL</strong> − PointOfInterest<br />

<strong>eRQL</strong> erweitert F<strong>und</strong>stellen zu “POIs”<br />

– benachbarte Aussagen werden hinzugefügt<br />

• z. B. “comment” zu “Golden Gate Bridge”<br />

rdf:comment<br />

s:name<br />

s:widthofsidewalk<br />

10.5<br />

Golden Gate Bridge<br />

s:width<br />

All units of measurements are feet.<br />

90


<strong>eRQL</strong> − PointOfInterest<br />

POIs werden auch <strong>für</strong> Sub-Queries gebildet<br />

– "Golden Gate Bridge" OR "Tower Bridge"<br />

90<br />

s:width<br />

Golden Gate Bridge s:name<br />

s:name<br />

s:length<br />

268<br />

Tower Bridge


<strong>eRQL</strong> − PointOfInterest<br />

POIs werden auch <strong>für</strong> Sub-Queries gebildet<br />

– "Golden Gate Bridge" AND width<br />

90<br />

• POIs <strong>für</strong> “Golden Gate Bridge” <strong>und</strong> “width” werden gebildet<br />

• Vereinigung der POIs, falls diese überlappen, sonst leer<br />

• übereinstimmend mit “Google-Query”<br />

s:width<br />

s:name<br />

Golden Gate Bridge


eRqlEngine<br />

<strong>eRQL</strong>-Prototyp<br />

– kein Datenbank-Backend<br />

• arbeitet mit <strong>RDF</strong>-Dateien<br />

• einfache Installation<br />

Details <strong>und</strong> Download:<br />

– www.dbis.informatik.unifrankfurt.de/~tolle/<strong>RDF</strong>/<strong>eRQL</strong>/<br />

– www.wleklinski.de/rdf/


<strong>eRQL</strong> Demo


Zusammenfassung<br />

<strong>RDF</strong>-<strong>S3</strong> <strong>und</strong> <strong>eRQL</strong> bieten:<br />

Überprüfbare Daten mehr Glaubwürdigkeit<br />

Antworten mit Kontext mehr Verständnis<br />

der Ergebnisse<br />

Anfragen können auf ausgewählte Quellen<br />

eingeschränkt werden bessere Ergebnisse<br />

sehr einfach kann ohne Vorwissen genutzt<br />

werden (wichtig <strong>für</strong> Portale)


Zukünftige Ziele<br />

Steigerung der Performance von <strong>RDF</strong>-<strong>S3</strong><br />

<strong>und</strong> <strong>eRQL</strong><br />

Weitere nützliche Anfragemöglichkeiten<br />

untersuchen<br />

Verbesserung der Ergebnisdarstellung<br />

Versionsunterstützung <strong>für</strong> Quellen unter<br />

<strong>RDF</strong>-<strong>S3</strong><br />

...


Danke <strong>für</strong> die Aufmerksamkeit<br />

Weitere Infos <strong>und</strong> Downloads:<br />

Kontakt:<br />

Fragen?<br />

http://www.dbis.informatik.uni-frankfurt.de/~tolle/rdf/<br />

Karsten Tolle: tolle@dbis.informatik.uni-frankfurt.de<br />

Fabian Wleklinski: wleklinski@eworks.de

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!