Verteilte Auswertung von RDF-Graphen mit MapReduce und ...
Verteilte Auswertung von RDF-Graphen mit MapReduce und ...
Verteilte Auswertung von RDF-Graphen mit MapReduce und ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Einführung<br />
Datenbanken zeichnen sich durch den Verzicht auf Schemata zur besseren horizontalen<br />
Skalierung aus. Cassandra ist eine weitere NoSQL-Datenbank, <strong>mit</strong> der Firmen<br />
wie beispielsweise Facebook, Digg <strong>und</strong> Twitter gute Erfahrungen gemacht haben.<br />
Ziel dieser Arbeit ist es, die Eigenschaften, die sich aus der Kombination <strong>von</strong> Cassandra<br />
<strong>mit</strong> <strong>MapReduce</strong> ergeben, in Hinblick auf die <strong>Auswertung</strong> <strong>von</strong> SPARQL Basic<br />
Graph Patterns auf großen <strong>RDF</strong>-<strong>Graphen</strong> zu untersuchen. Die Arbeit beschränkt<br />
sich auf das Auswerten einer Folge <strong>von</strong> SPARQL Basic Graph Patterns <strong>mit</strong> maximal<br />
zwei Variablen pro Tripel. Hierfür wurde eine Implementierung entwickelt, die die<br />
Besonderheiten des Datenmodells zum schnellen Zugriff auf die Daten ausnutzt.<br />
Die Arbeit ist wie folgt aufgebaut: In Kapitel 2 werden die Gr<strong>und</strong>lagen des Semantic<br />
Webs <strong>und</strong> der verwendeten Technologien vorgestellt. Darauf aufbauend werden im<br />
folgenden Kapitel die allgemeinen Strategien zur <strong>Auswertung</strong> <strong>und</strong> Speicherung der<br />
<strong>RDF</strong>-Daten vorgestellt. Kapitel 4 erläutert wie diese Strategien in der Implementierung<br />
technisch umgesetzt worden sind. Die Ergebnisse der Evaluation werden in<br />
Kapitel 5 vorgestellt. Es wurden sowohl das Verhalten bei verschiedenen Datengrößen,<br />
als auch der Einfluss verschiedener Parameter untersucht. In Kapitel 6 werden<br />
verwandte Arbeiten vorgestellt <strong>und</strong> die Unterschiede aufgezeigt. Abschließend wird<br />
in Kapitel 7 ein Fazit <strong>und</strong> Ausblick gegeben.<br />
5