Verteilte Auswertung von RDF-Graphen mit MapReduce und ...
Verteilte Auswertung von RDF-Graphen mit MapReduce und ...
Verteilte Auswertung von RDF-Graphen mit MapReduce und ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
3.1 Speicherstrategie<br />
Prädikat ein Index gespeichert werden, der alle Keyspace-Namen enthält. Mit dessen<br />
Hilfe würde dann über alle Keyspaces iteriert.<br />
Bei der Implementierung wurde festgestellt, dass die Verteilung der Daten auf die<br />
Knoten im Cluster <strong>mit</strong> Hadoop nicht optimal ist. Die Rechenlast wird nicht ausgeglichen<br />
verteilt, sondern wird nur einem Knoten zugewiesen. Dies liegt an den<br />
ausgewählten Spaltenfamilien, sowie dem frühzeitigen Festlegen des Zeilenschlüssels.<br />
Daher werden für den ersten Verb<strong>und</strong>, bei dem die Daten <strong>von</strong> Hadoop geladen<br />
werden, andere Spaltenfamilien verwendet. Details zur Optimierung werden in<br />
Kap. 4.2.4 erläutert.<br />
21