w26M2
w26M2
w26M2
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Big-Data-Technologien – Wissen für Entscheider<br />
Das Modell in Abbildung 1 stellt eine bewusste Vereinfachung<br />
der Realität dar. Die Anwendungsbereiche der<br />
vier verschiedenen Technologien sind keinesfalls scharf<br />
voneinander getrennt; oftmals bildet eine Kombination<br />
von Technologien die passende Lösung. Außerdem<br />
findet Hadoop zunehmend in allen ver Quadranten<br />
Anwendung. So bringt zum Beispiel die Erweiterung<br />
von Hadoop durch Storm und Spark im Laufe des Jahres<br />
2014 auch Streaming- und In-Memory-Fähigkeiten in die<br />
Hadoop-Plattform.<br />
• 3.2 Taxonomie der Big-Data-<br />
Technologien<br />
Der Zweck jeder Big-Data-Lösung ist es, Daten in entscheidungsrelevante<br />
Informationen umzuwandeln. Die<br />
Vielfalt an Datentypen und Big-Data-Einsatz-Szenarien<br />
erfordert auch vielfältige Werkzeuge auf jeder Schicht<br />
einer Technologie-Landschaft. Der Abschnitt 3.2 setzt den<br />
Startpunkt für die Ausdifferenzierung der im Abschnitt 3.1<br />
vorgestellten Kerntechnologien.<br />
• Die in Abbildung 2 dargestellten Technologien zur<br />
Daten-Haltung werden im Abschnitt 4.1 ausführlich<br />
beschrieben; sie unterscheiden sich zum Beispiel nach<br />
dem Datenformat, dem Zweck der Daten-Haltung,<br />
der Performance sowie den Anforderungen an die<br />
Skalierbarkeit.<br />
• Diese Vielfalt setzt sich auch bei den Technologien<br />
zum Daten-Zugriff fort. Sie sind Gegenstand des<br />
Abschnitts 4.2 und ermöglichen zum Beispiel sowohl<br />
die Stapelverarbeitung als auch Echtzeit-Verfahren<br />
sowie ein iteratives Entdecken der Daten (Unterabschnitt<br />
4.2.3).<br />
• Auch für die analytische Verarbeitung stellt der<br />
Leitfaden die relevanten Werkzeuge vor, welche sich<br />
zum großen Teil direkt am Einsatzszenario sowie am<br />
Datentyp orientieren (vgl. Abschnitt 4.3).<br />
• Ferner müssen die Ergebnisse zielgruppengerecht<br />
präsentiert werden. Das leisten die Visualisierungstechnologien,<br />
die im Abschnitt 4.4 erläutert werden.<br />
4.5 Daten-<br />
Integration<br />
Dashboards<br />
4.4 Visualisierung<br />
Fortgeschrittene<br />
Visualisierung<br />
Real-time<br />
Intelligence<br />
4.6 Daten-<br />
Governance &<br />
-Sicherheit<br />
4.3 Analytische Verarbeitung<br />
Identity & Access<br />
Management<br />
Daten-<br />
Konnektivität<br />
Video<br />
Audio<br />
Geospatial<br />
Web<br />
Text<br />
Semantics<br />
Daten-<br />
Verschlüsselung<br />
Data Ingestion<br />
(ETL, ELT)<br />
Predictive<br />
Data<br />
Mining<br />
Machine<br />
Learning<br />
4.2 Daten-Zugriff<br />
Reporting<br />
Mulimandanten-<br />
Fähigkeit<br />
Batch<br />
Processing<br />
(Hadoop,<br />
MapReduce)<br />
Streaming<br />
& CEP<br />
Search &<br />
Discovery<br />
Query<br />
Governance<br />
4.1 Daten-Haltung<br />
Hadoop<br />
HDFS<br />
NoSQL<br />
Datenbanken<br />
In-Memory<br />
Datenbanken<br />
Analytische<br />
Datenbanken<br />
(DW, etc.)<br />
Transaktionale<br />
Datenbanken<br />
(OLTP)<br />
Abbildung 2: Taxonomie von Big-Data-Technologien<br />
23