w26M2
w26M2
w26M2
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Abbildung 58 zeigt einen Datenfluss der aus mehreren<br />
mappern, reducern und einem join operator besteht.<br />
Diese Datenflüsse erlauben es, mit Stratosphere auch<br />
komplexe Daten-Integrationsaufgabe auszuführen.<br />
Insgesamt sind seit 2008 mehr als 15 Mann-Jahre<br />
Forschung und Entwicklung in das Stratosphere-Open-<br />
Source-System eingeflossen. Stratosphere wird derzeit<br />
von einer aktiven europäischen Open Source Community<br />
weiterentwickelt und wird bereits in mehreren<br />
Anwendungen eingesetzt, zum einen im Kontext von<br />
Verbundprojekten gefördert durch das BMWi, das BMBF<br />
und die EU, zum anderen in direkten Partnerschaften von<br />
Unternehmen mit Stratosphere.<br />
• 6.5 Big Data und Open Source –<br />
Strategische Weichenstellungen<br />
In drei bis fünf Jahren wird ein Großteil aller neuen Daten<br />
nicht in traditionellen, sondern in neuen Speicherlösungen<br />
wie z. B. Hadoop und Object Storage landen. Open-<br />
Source-Lösungen wie Hadoop spielen somit eine wichtige<br />
Rolle im Big-Data-Ökosystem. Für einige Bausteine einer<br />
Big-Data-Lösung sind neben den reinen Open-Source-<br />
Lösungen auch kommerzielle Lösungen am Markt, die auf<br />
Open-Source aufsetzen (vgl. Tabelle 14).<br />
Baustein<br />
Lösungen<br />
Ferner ist das Stratosphere-System Bestandteil des Smart<br />
Data Innovation Lab (www.sdil.de) sowie die strategische<br />
Flaggschiff-Plattform zur Datenanalyse des Europäischen<br />
Instituts für Technologie (EIT). Das Stratosphere-System<br />
ist unter der Apache 2.0 Lizenz verfügbar. 202<br />
Hadoop<br />
ETL & Analytics<br />
Data Visualization<br />
Hortonworks, Cloudera<br />
Talend, Pentaho, Jaspersoft<br />
ggplot2, OpenDX<br />
Tabelle 14: Kommerzielle Lösungen (Auswahl) auf Open-Source-Basis<br />
Bei einem genaueren Blick auf die Chancen und Risiken<br />
von Hadoop wird ersichtlich, dass sich das konsequente<br />
Vertrauen auf Open Source durchaus lohnen kann. So<br />
lässt sich z. B. ein Vendor Lock-In – die zwingende Bindung<br />
an einen Hersteller – verhindern. Zudem läßt sich<br />
wertvoller Spielraum bei Betriebskosten, strategischen<br />
IT-Investitionen und einem Innovationstempo bewahren,<br />
welches in der Regel wesentlich höher ist als bei proprietären<br />
Lösungen. Als historisches Beispiel sei hier Linux<br />
genannt: Nachdem Linux eine kritische Masse erreicht<br />
hatte, war der Fortschritt hier viel rascher als in den von<br />
einzelnen Anbietern kontrollierten Unix-Silos. Der größte<br />
Teil der Arbeit an und um Linux wird weiterhin von der<br />
Nutzergemeinde erledigt. Wer ins Jahr 2014 springt, wird<br />
viele Parallelen zu Hadoop erkennen.<br />
Der genaue Marktanteil der Hadoop- beziehungsweise<br />
Object-Storage-Lösungen lässt sich schwer voraussagen.<br />
Aber kaum ein Experte zweifelt am generellen Trend, dass<br />
202<br />
Weitere Informationen mit Anwendungsbeispielen, umfangreiche Dokumentation und Technologie-Whitepapers, sowie ein Installations-Image für verschiedene<br />
virtuelle Maschinen, der Source-Code des Systems und Kontaktinformationen finden sich unter http://www.stratosphere.eu<br />
134