w26M2
w26M2
w26M2
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Big-Data-Technologien – Wissen für Entscheider<br />
Verzeichnis der Abbildungen<br />
Abbildung 1: Big-Data-Anforderungen und Technologieansätze 21<br />
Abbildung 2: Taxonomie von Big-Data-Technologien 23<br />
Abbildung 3: CAP-Dreieck 29<br />
Abbildung 4: Architektur-Komponenten für Big Data 31<br />
Abbildung 5: Kostenvergleich Hadoop versus Alternativen 36<br />
Abbildung 6: Performance-Begrenzung für unterschiedliche Parallelisierungsgrade 37<br />
Abbildung 7: Shared-Nothing-Architektur des MapReduce-Ansatzes 38<br />
Abbildung 8: Hadoop-Gesamtarchitektur 40<br />
Abbildung 9: Klassifikation von Datenbanken nach Einsatzgebieten 43<br />
Abbildung 10: In-Memory-Data-Grid-Architektur am Beispiel Terracotta BigMemory 46<br />
Abbildung 11: Pig-Latin-Illustration – Umsetzung des legendären Hadoop Wordcount-Beispiels 50<br />
Abbildung 12: Illustrationsbeispiel für HiveQL 51<br />
Abbildung 13: Werkzeuge zum Umbau eines vorhandenen ETL-Jobs in einen MapReduce-Job 52<br />
Abbildung 14: RStudio – freie grafische Benutzeroberflächen für R 63<br />
Abbildung 15: Rattle – freie grafische Benutzeroberfläche für Data Mining 63<br />
Abbildung 16: Schritt 1 – Laden des Beispieldatensatzes 64<br />
Abbildung 17: Schritt 2 – Gewinnung des Überblicks über die Daten 64<br />
Abbildung 18: Schritt 3 – erste grafische Analyse von zwei Variablen 64<br />
Abbildung 19: Schritt 4 – grafische Analyse einer weiteren Variablen 64<br />
Abbildung 20: Schritt 5 – Untersuchung der verschiedenen Variablen im Zusammenhang 65<br />
Abbildung 21: Schritt 6 – Generierung eines Entscheidungsbaums 65<br />
Abbildung 22: Schritt 7 – Auslesen der Regeln des Entscheidungsbaums 65<br />
Abbildung 23: Schritt 8 – Überprüfung der Modellgüte 66<br />
Abbildung 24: Machine-Learning-Pipeline 68<br />
Abbildung 25: OLAP-Würfel zur multidimensionalen Datenanalyse 70<br />
Abbildung 26: Klout-Architektur 71<br />
Abbildung 27: Rollen, Ziele und Visualisierungstechnologien im Überblick 73<br />
Abbildung 28: Anscombe’s Quartett 74<br />
Abbildung 29: Struktur des Abschnitts 4.4 75<br />
Abbildung 30: Interaktives Dashboard mit sukzessiven Detailsichten in Tableau Software 77<br />
Abbildung 31: Mitarbeiterbezogener Datenanalyseprozess 79<br />
Abbildung 32: Cross-Industry Standard Process for Data Mining 81<br />
Abbildung 33: Visualisierungspipeline – komplexe Informationsvisualisierung als mehrstufiger Prozess 82<br />
Abbildung 34: Beispiel für multiple koordinierte Ansichten 84<br />
Abbildung 35: Konzeptuelles Modell des Visual Analytics Loop 85<br />
Abbildung 36: Bezug der VA-Methodik zum CRISP-DM 87<br />
Abbildung 37: Etablierte und neue (grün) Datenintegrationskomponenten im Kontext von Big Data 91<br />
Abbildung 38: Grafische Entwicklung von Hadoop-Integrationsszenarien am Beispiel von Talend 92<br />
Abbildung 39: Data Lineage – Wo kommen die Daten her 98<br />
Abbildung 40: Zusammenspiel von Hadoop mit herkömmlichen Lösungen (vereinfacht) 102<br />
Abbildung 41: Hadoop als unternehmensweite Plattform 102<br />
5