28.12.2013 Aufrufe

Projektgruppe Business Intelligence Applications and Evaluation ...

Projektgruppe Business Intelligence Applications and Evaluation ...

Projektgruppe Business Intelligence Applications and Evaluation ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Projektbericht Cuberunner<br />

Technischer Vergleich<br />

nf-2<br />

nf-3<br />

Support &<br />

Dokumentation<br />

Benutzerfreundlichkeit<br />

3 Die Basisinstallation kommt einher mit einer ausführlichen<br />

Dokumentation sowie einer Online-Dokumentation, welche<br />

von der Community bereitgestellt wird. Weitere Informationen<br />

sind auf der Community-Webseite verfügbar z.B. in Form<br />

von Anleitungen, FAQs oder Forenbeiträgen. Zusätzlich gibt<br />

es zahlreiche Foren, Blogs oder Videos von privaten<br />

Anbietern. Ein direkter technischer Support ist der<br />

kostenpflichtigen EE Version vorbehalten.<br />

2 Die Erstellung der Prozesskette erfolgt über ein Baukastenprinzip,<br />

indem sich jeder Nutzer die vorgefertigten Module<br />

(Funktionen) auf einer grafischen Arbeitsfläche per Drag &<br />

Drop zusammenstellen kann. Die Grundstruktur der Software<br />

ist klar gegliedert und leicht verständlich. Jedoch sind die<br />

Dialoge der einzelnen Module teilweise unterschiedlich und<br />

unübersichtlich aufgebaut, was zu einem sehr hohen<br />

Einarbeitungsaufw<strong>and</strong> führt.<br />

nf-4 Integrierbarkeit 3 Aufgrund von Java lässt sich die Software auf vielen<br />

Plattformen integrieren und kann individuell angepasst<br />

werden. Der Einsatz im Unternehmen unter Voraussetzung<br />

der Hochverfügbarkeit ist jedoch fraglich.<br />

nf-5 Erweiterbarkeit 4 Die Software lässt sich dank Java und des offenen Quellcodes<br />

sehr leicht erweitern.<br />

nf-6 Zuverlässigkeit 3 Pentaho Data Integration wird seit 2004 entwickelt und ist<br />

mittlerweile in der vierten Generation verfügbar. Es stehen<br />

zahlreiche Monitoring und Logging-Funktionalitäten bereit<br />

um Fehler zu identifizieren. Die Stabilität der Anwendung ist<br />

bei großen parallelen Datenmengen stark von den verfügbaren<br />

Ressourcen der Java Virtuell Maschine abhängig. Diese neigt<br />

dazu nicht zu reagieren, sobald zu wenig Arbeitsspeicher<br />

verfügbar ist, der Prozess läuft zwar weiter aber ein Realtime<br />

Monitoring ist nicht mehr möglich.<br />

nf-7 Geschwindigkeit 0 Nicht bewertbar.<br />

etl-1<br />

Datenquellen<br />

& -ziele<br />

4 Es wird eine Fülle von Systemen, Datentypen und Protokollen<br />

als Datenquelle sowie Datenziel unterstützt. Neben<br />

Datenbanken, Flatfile & Excel werden dabei auch<br />

„unkonventionellere“ Quellen wie bspw. RSS, Google<br />

Analytics, etc. unterstützt.<br />

etl-2 Transformation 4 Das Angebot an Transformationen ist sehr umfangreich und<br />

kann leicht individualisiert bzw. erweitert werden, teilweise ist<br />

jedoch eine hohe Einarbeitungszeit von Nöten.<br />

etl-3 Monitoring 3 Es stehen verschiedene Logging-Tiefen zur Verfügung, jeder<br />

Schritt kann sowohl grafisch als auch textuell überwacht<br />

werden. Die Performance lässt sich grafisch auswerten.<br />

etl-4<br />

Prozesskettenmanagement<br />

4 Die ETL-Prozessketten können sowohl sequentiell als auch<br />

parallel gestaltet werden. Eine oder mehrere Prozessketten<br />

lassen sich zu einem Job zusammenfügen und manuell oder<br />

automatisch gestartet werden. Der Job kann beliebig gestaltet<br />

werden und mit Vor- und Nachbedingungen verknüpft<br />

werden.<br />

Tabelle 5.1: Bewertung ETL Pentaho Data Integration CE<br />

655

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!