22.01.2015 Aufrufe

w26M2

w26M2

w26M2

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Big-Data-Technologien – Wissen für Entscheider<br />

Verzeichnis der Abbildungen<br />

Abbildung 1: Big-Data-Anforderungen und Technologieansätze 21<br />

Abbildung 2: Taxonomie von Big-Data-Technologien 23<br />

Abbildung 3: CAP-Dreieck 29<br />

Abbildung 4: Architektur-Komponenten für Big Data 31<br />

Abbildung 5: Kostenvergleich Hadoop versus Alternativen 36<br />

Abbildung 6: Performance-Begrenzung für unterschiedliche Parallelisierungsgrade 37<br />

Abbildung 7: Shared-Nothing-Architektur des MapReduce-Ansatzes 38<br />

Abbildung 8: Hadoop-Gesamtarchitektur 40<br />

Abbildung 9: Klassifikation von Datenbanken nach Einsatzgebieten 43<br />

Abbildung 10: In-Memory-Data-Grid-Architektur am Beispiel Terracotta BigMemory 46<br />

Abbildung 11: Pig-Latin-Illustration – Umsetzung des legendären Hadoop Wordcount-Beispiels 50<br />

Abbildung 12: Illustrationsbeispiel für HiveQL 51<br />

Abbildung 13: Werkzeuge zum Umbau eines vorhandenen ETL-Jobs in einen MapReduce-Job 52<br />

Abbildung 14: RStudio – freie grafische Benutzeroberflächen für R 63<br />

Abbildung 15: Rattle – freie grafische Benutzeroberfläche für Data Mining 63<br />

Abbildung 16: Schritt 1 – Laden des Beispieldatensatzes 64<br />

Abbildung 17: Schritt 2 – Gewinnung des Überblicks über die Daten 64<br />

Abbildung 18: Schritt 3 – erste grafische Analyse von zwei Variablen 64<br />

Abbildung 19: Schritt 4 – grafische Analyse einer weiteren Variablen 64<br />

Abbildung 20: Schritt 5 – Untersuchung der verschiedenen Variablen im Zusammenhang 65<br />

Abbildung 21: Schritt 6 – Generierung eines Entscheidungsbaums 65<br />

Abbildung 22: Schritt 7 – Auslesen der Regeln des Entscheidungsbaums 65<br />

Abbildung 23: Schritt 8 – Überprüfung der Modellgüte 66<br />

Abbildung 24: Machine-Learning-Pipeline 68<br />

Abbildung 25: OLAP-Würfel zur multidimensionalen Datenanalyse 70<br />

Abbildung 26: Klout-Architektur 71<br />

Abbildung 27: Rollen, Ziele und Visualisierungstechnologien im Überblick 73<br />

Abbildung 28: Anscombe’s Quartett 74<br />

Abbildung 29: Struktur des Abschnitts 4.4 75<br />

Abbildung 30: Interaktives Dashboard mit sukzessiven Detailsichten in Tableau Software 77<br />

Abbildung 31: Mitarbeiterbezogener Datenanalyseprozess 79<br />

Abbildung 32: Cross-Industry Standard Process for Data Mining 81<br />

Abbildung 33: Visualisierungspipeline – komplexe Informationsvisualisierung als mehrstufiger Prozess 82<br />

Abbildung 34: Beispiel für multiple koordinierte Ansichten 84<br />

Abbildung 35: Konzeptuelles Modell des Visual Analytics Loop 85<br />

Abbildung 36: Bezug der VA-Methodik zum CRISP-DM 87<br />

Abbildung 37: Etablierte und neue (grün) Datenintegrationskomponenten im Kontext von Big Data 91<br />

Abbildung 38: Grafische Entwicklung von Hadoop-Integrationsszenarien am Beispiel von Talend 92<br />

Abbildung 39: Data Lineage – Wo kommen die Daten her 98<br />

Abbildung 40: Zusammenspiel von Hadoop mit herkömmlichen Lösungen (vereinfacht) 102<br />

Abbildung 41: Hadoop als unternehmensweite Plattform 102<br />

5

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!