02.11.2013 Aufrufe

Verteilte Auswertung von RDF-Graphen mit MapReduce und ...

Verteilte Auswertung von RDF-Graphen mit MapReduce und ...

Verteilte Auswertung von RDF-Graphen mit MapReduce und ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

3.1 Speicherstrategie<br />

Prädikat ein Index gespeichert werden, der alle Keyspace-Namen enthält. Mit dessen<br />

Hilfe würde dann über alle Keyspaces iteriert.<br />

Bei der Implementierung wurde festgestellt, dass die Verteilung der Daten auf die<br />

Knoten im Cluster <strong>mit</strong> Hadoop nicht optimal ist. Die Rechenlast wird nicht ausgeglichen<br />

verteilt, sondern wird nur einem Knoten zugewiesen. Dies liegt an den<br />

ausgewählten Spaltenfamilien, sowie dem frühzeitigen Festlegen des Zeilenschlüssels.<br />

Daher werden für den ersten Verb<strong>und</strong>, bei dem die Daten <strong>von</strong> Hadoop geladen<br />

werden, andere Spaltenfamilien verwendet. Details zur Optimierung werden in<br />

Kap. 4.2.4 erläutert.<br />

21

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!