w26M2

Empfehlungen

Info

5 Big-Data-Lösungs-Architekturen und -szenarien Herkömmliche Lösungen sind angesichts der mit Big Data assoziierten Herausforderungen (»3 V«) sowohl aus technischer als auch aus betriebswirtschaftlicher Sicht eng limitiert. Hadoop bietet eine Antwort auf diese Herausforderungen und hat sich daher als Kern einer modernen Datenarchitektur und Ergänzung herkömmlicher Lösungen fest etabliert. Aus dem Zusammenspiel von Hadoop und herkömmlichen Lösungen ergeben sich drei typische Rollen für Hadoop in einer Big-Data-Zielarchitektur – Hadoop als: • preiswerter Langzeit-Parkplatz für Daten, • Basis für die Erforschung von Daten, • unternehmensweite Plattform. Das Kapitel 5 zeigt, dass es für jedes Einsatzszenario die passende Architektur gibt. Meist bestimmen der Datentyp sowie die Anforderungen an die Verarbeitung die Auswahl der Bausteine in der Zielarchitektur. Daher orientiert sich die Diskussion der Zielarchitekturen an den Datentypen der verschiedenen Einsatz-Szenarien: Clickstream-Daten, Social-Media-Stimmungsdaten, Server-Logdaten, Sensordaten, Maschine-zu-Maschine-Kommunikation, Standortdaten und Freitext-Daten. Zum Abschluss des Kapitels wird das Zusammenspiel von Big Data und Business Intelligence thematisiert. Ein Beispiel hierfür ist die Entlastung eines traditionellen Data-Warehouses durch Hadoop. • 5.1 Warum eine neu entstehende Datenarchitektur für Big Data Herkömmliche Datenarchitekturen Gegenwärtig nutzen die meisten Unternehmen mindestens eine analytische Anwendung zur Unterstützung von Entscheidungen im täglichen Geschäft. Stark vereinfacht sieht die Architektur dieser Lösungen so aus: werden die Rohdaten meist nach kurzer Zeit gelöscht. Somit finden nur strukturierte und verdichtete Daten Eingang in das Data Warehouse. • Für die Aufgaben der Analytik und Visualisierung wird Standard-Software wie Business Objects, Hyperion, Cognos eingesetzt, die für das Zusammenwirken mit den transaktionalen Anwendungen (in diesem Fall von SAP, Oracle und IBM) optimiert ist. • Daten liegen in strukturierter Form vor und stammen überwiegend aus transaktionalen Unternehmensanwendungen wie ERP, CRM oder SCM. • Die Daten werden in relationalen Datenbanken oder Data Warehouses gehalten. Hierfür werden Rohdaten meist mit dem bekannten Prozess Extract – Transform – Load umgewandelt. Nach dieser Umwandlung Hadoop als Kern einer modernen Datenarchitektur und Ergänzung herkömmlicher Lösungen Im Unterabschnitt 4.1.1 wurde bereits ausgeführt, wie limitiert herkömmliche Lösungen sind – mit dem Ergebnis, dass die Datenmengen die verfügbaren Budgets übersteigen (vgl. S. 37). Ebenfalls in diesem Unterabschnitt 100
Big-Data-Technologien – Wissen für Entscheider wurde Hadoop als Werkzeug beschrieben, die Grenzen zu überwinden: • Hadoop macht Skalierbarkeit bezahlbar. Datenhaltung auf Hadoop ist circa 20x günstiger pro Terabyte als Alternativen wie zum Beispiel traditionelle Speicherlösungen oder Enterprise Data Warehouses. • Mit Hadoop ist es möglich, Daten erst zu speichern und spontan oder später aufschlussreiche Fragen zu stellen. Erst zum Zeitpunkt der Analyse werden die Daten strukturiert. Techniker nennen dies »Schema on Read«. Hadoop ist jedoch heute noch kein Ersatz für die traditionellen Datenspeicher im Unternehmenseinsatz, sondern dient als deren Ergänzung. Aus den Hadoop-basierten Big-Data- Projekten, an denen im Jahre 2014 in zahlreichen deutschen Groß-Unternehmen gearbeitet wurde, kristallisieren sich drei Modelle für Zusammenarbeit zwischen Hadoop und herkömmlichen Lösungen heraus: 1. Hadoop als billiger Langzeit-Parkplatz für Daten. Daten aus unterschiedlichsten Quellen und mit unterschiedlichsten Formaten landen im Hadoop- Cluster, wo sie analog zum ankommenden Rohöl in einer Erdöl-Raffinerie zu Zwischenprodukten verarbeitet werden. Der Prozess Extract – Transform – Load bereitet die dann verdichteten Daten auf ihr Leben in einem Enterprise Data Warehouse vor. Die Rohdaten verbleiben für lange Zeit im kostengünstigen Hadoop- Cluster. Auch alte, schon verdichtete Daten aus dem EDW werden am Ende ihrer Lebenszeit aus Kostengründen wieder Richtung Hadoop ausgelagert. Somit wird Hadoop ein aktives Archiv, die Daten bleiben – anders als bei einer Löschung oder Auslagerung auf Band – weiter im Zugriff. Das Gros der Abfragen und Analysen erfolgt aber weiterhin in herkömmlichen Lösungen. direkt auf Hadoop und durchdringen das Datenmeer auf der Suche nach Mustern und Zusammenhängen, bis sie schließlich in der Fahndung nach dem schwarzen Gold fündig werden. 3. Hadoop als unternehmensweite Plattform. Die zweite Generation von Hadoop ermöglicht es großen Unternehmen, einen firmenweiten Big-Data- Shared-Service anzubieten. Die Komplementarität von Hadoop mit herkömmlichen Lösungen verdeutlicht die Abbildung 40. Hadoop etabliert sich als unternehmensweite Plattform Schon in der ersten Generation hat sich Hadoop rasch zu einer vielversprechenden Plattform entwickelt, um große Datenmengen preiswert zu speichern und skalierbar zu verarbeiten. Mit der zweiten Generation ermöglicht Hadoop es nun großen Unternehmen, einen firmenweiten Big-Data- Shared-Service anzubieten – also einen gemeinsamen Infrastruktur-Pool, auf dem verschiedene interne und externe Kunden mit ihren oder mit gemeinsamen Daten arbeiten können. Viele Unternehmen gehen dazu über, Hadoop als einen unternehmensweiten Shared-Service bereitzustellen – oft als »Daten-See« bezeichnet. Der Wert eines solchen Hadoop-Daten-Sees wächst exponentiell, je mehr Daten in diesem See landen und je mehr Anwendungen auf diesen Daten-See zugreifen. Mehr und mehr Daten werden für Jahrzehnte beibehalten (vgl. Abbildung 41). 2. Erforschung von Daten auf Hadoop. Diese Phase wird sowohl in der Erdölindustrie, als auch in der Business-Intelligence-Gemeinschaft Exploration genannt. Vielfältige Analyse-Werkzeuge laufen 101
Seite 1 und 2:
Big-Data-Technologien - Wissen für
Seite 3 und 4:
Seite 5 und 6:
Seite 7 und 8:
Seite 9 und 10:
Seite 11 und 12:
Seite 13 und 14:
Seite 15 und 16:
Seite 17 und 18:
Seite 19 und 20:
Seite 21 und 22:
Seite 23 und 24:
Seite 25 und 26:
Seite 27 und 28:
Seite 29 und 30:
Seite 31 und 32:
Seite 33 und 34:
Seite 35 und 36:
Seite 37 und 38:
Seite 39 und 40:
Seite 41 und 42:
Seite 43 und 44:
Seite 45 und 46:
Seite 47 und 48:
Seite 49 und 50:
Seite 51 und 52: Big-Data-Technologien - Wissen für
Seite 101: Big-Data-Technologien - Wissen für
Seite 153 und 154:
Seite 155 und 156:
Seite 157 und 158:
Seite 159 und 160:
Seite 161 und 162:
Seite 163 und 164:
Seite 165 und 166:
Seite 167 und 168:
Seite 169 und 170:
Seite 171 und 172:
Seite 173 und 174:
Seite 175 und 176:
Seite 177 und 178:
Seite 179 und 180:
Seite 181 und 182:
Seite 183 und 184:
Seite 185 und 186:
Seite 187 und 188:
Seite 189 und 190:
Seite 191 und 192:
Seite 193 und 194:
Seite 195 und 196:
Seite 197 und 198:
Seite 199 und 200:
Seite 201 und 202:
Seite 203 und 204:
Seite 205 und 206:
Seite 207 und 208:
Alle anzeigen

w26M2

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?