02.11.2013 Aufrufe

Verteilte Auswertung von RDF-Graphen mit MapReduce und ...

Verteilte Auswertung von RDF-Graphen mit MapReduce und ...

Verteilte Auswertung von RDF-Graphen mit MapReduce und ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

4.2 Auswerten der Anfragen<br />

4.2 Auswerten der Anfragen<br />

Abb. 4.2 zeigt den Datenfluss der ersten Anwendung. Nach dem Parsen werden aus<br />

den Tripelmustern die <strong>MapReduce</strong> Jobs erzeugt. Anschließend wird die Sequenz<br />

dieser Jobs ausgeführt.<br />

Anfrage<br />

ARQ Parser<br />

●<br />

Parsen der Anfrage<br />

●<br />

Aufteilung in Tripelmuster<br />

Tripelmuster<br />

JobCreator<br />

JoinConfigHelper<br />

●<br />

Erzeugung der <strong>MapReduce</strong>-Jobs<br />

●<br />

Festlegung <strong>von</strong> Spaltenfamilien <strong>und</strong><br />

Prädikaten in der Konfiguration<br />

<strong>MapReduce</strong>-Jobs <strong>mit</strong> Konfigurationen<br />

●<br />

Ausführung der Jobs auf dem<br />

Cluster<br />

●<br />

Zugriff auf Cassandra<br />

●<br />

Verb<strong>und</strong> erfolgt als Map-Side-Join<br />

●<br />

Ausgabe auf HDFS<br />

Ergebnis<br />

Abbildung 4.2: Übersicht des Programmverlaufs<br />

4.2.1 Generieren der Jobs<br />

Die Anfrage wird zuerst an den ARQ-Parser des Jena-Frameworks 3 übergeben <strong>und</strong><br />

wird in Tripelmuster aufgeteilt. Diese werden an die Klasse JobCreator übergeben.<br />

3 http://jena.sourceforge.net/ARQ/<br />

27

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!