22.01.2015 Aufrufe

w26M2

w26M2

w26M2

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Abbildung 58 zeigt einen Datenfluss der aus mehreren<br />

mappern, reducern und einem join operator besteht.<br />

Diese Datenflüsse erlauben es, mit Stratosphere auch<br />

komplexe Daten-Integrationsaufgabe auszuführen.<br />

Insgesamt sind seit 2008 mehr als 15 Mann-Jahre<br />

Forschung und Entwicklung in das Stratosphere-Open-<br />

Source-System eingeflossen. Stratosphere wird derzeit<br />

von einer aktiven europäischen Open Source Community<br />

weiterentwickelt und wird bereits in mehreren<br />

Anwendungen eingesetzt, zum einen im Kontext von<br />

Verbundprojekten gefördert durch das BMWi, das BMBF<br />

und die EU, zum anderen in direkten Partnerschaften von<br />

Unternehmen mit Stratosphere.<br />

• 6.5 Big Data und Open Source –<br />

Strategische Weichenstellungen<br />

In drei bis fünf Jahren wird ein Großteil aller neuen Daten<br />

nicht in traditionellen, sondern in neuen Speicherlösungen<br />

wie z. B. Hadoop und Object Storage landen. Open-<br />

Source-Lösungen wie Hadoop spielen somit eine wichtige<br />

Rolle im Big-Data-Ökosystem. Für einige Bausteine einer<br />

Big-Data-Lösung sind neben den reinen Open-Source-<br />

Lösungen auch kommerzielle Lösungen am Markt, die auf<br />

Open-Source aufsetzen (vgl. Tabelle 14).<br />

Baustein<br />

Lösungen<br />

Ferner ist das Stratosphere-System Bestandteil des Smart<br />

Data Innovation Lab (www.sdil.de) sowie die strategische<br />

Flaggschiff-Plattform zur Datenanalyse des Europäischen<br />

Instituts für Technologie (EIT). Das Stratosphere-System<br />

ist unter der Apache 2.0 Lizenz verfügbar. 202<br />

Hadoop<br />

ETL & Analytics<br />

Data Visualization<br />

Hortonworks, Cloudera<br />

Talend, Pentaho, Jaspersoft<br />

ggplot2, OpenDX<br />

Tabelle 14: Kommerzielle Lösungen (Auswahl) auf Open-Source-Basis<br />

Bei einem genaueren Blick auf die Chancen und Risiken<br />

von Hadoop wird ersichtlich, dass sich das konsequente<br />

Vertrauen auf Open Source durchaus lohnen kann. So<br />

lässt sich z. B. ein Vendor Lock-In – die zwingende Bindung<br />

an einen Hersteller – verhindern. Zudem läßt sich<br />

wertvoller Spielraum bei Betriebskosten, strategischen<br />

IT-Investitionen und einem Innovationstempo bewahren,<br />

welches in der Regel wesentlich höher ist als bei proprietären<br />

Lösungen. Als historisches Beispiel sei hier Linux<br />

genannt: Nachdem Linux eine kritische Masse erreicht<br />

hatte, war der Fortschritt hier viel rascher als in den von<br />

einzelnen Anbietern kontrollierten Unix-Silos. Der größte<br />

Teil der Arbeit an und um Linux wird weiterhin von der<br />

Nutzergemeinde erledigt. Wer ins Jahr 2014 springt, wird<br />

viele Parallelen zu Hadoop erkennen.<br />

Der genaue Marktanteil der Hadoop- beziehungsweise<br />

Object-Storage-Lösungen lässt sich schwer voraussagen.<br />

Aber kaum ein Experte zweifelt am generellen Trend, dass<br />

202<br />

Weitere Informationen mit Anwendungsbeispielen, umfangreiche Dokumentation und Technologie-Whitepapers, sowie ein Installations-Image für verschiedene<br />

virtuelle Maschinen, der Source-Code des Systems und Kontaktinformationen finden sich unter http://www.stratosphere.eu<br />

134

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!