28.12.2013 Aufrufe

Projektgruppe Business Intelligence Applications and Evaluation ...

Projektgruppe Business Intelligence Applications and Evaluation ...

Projektgruppe Business Intelligence Applications and Evaluation ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Projektbericht Cuberunner<br />

Technischer Vergleich<br />

8.3<br />

Vergleich Data Mining<br />

Nr. Kriterium Gew. R IBM SPSS Modeler<br />

nicht funktional<br />

nf-1 Unabhängigkeit vom Hersteller 4% 4 1<br />

nf-2 Support & Dokumentation 6% 3 4<br />

nf-3 Benutzerfreundlichkeit 6% 2 3<br />

nf-4 Integrierbarkeit 7% 3 2<br />

nf-5 Erweiterbarkeit 7% 4 2<br />

nf-6 Zuverlässigkeit 7% 3 2<br />

nf-7 Geschwindigkeit 3% n. b. n. b.<br />

funktional<br />

dm-1 Datenquellen & -ziele 15% 4 4<br />

dm-2 Unterstützte Methoden 25% 4 3<br />

dm-3 Prozessmanagement, Datenvisualisierung<br />

& Evaluierung<br />

20% 4 4<br />

Bewertung 3,635 3,105<br />

Tabelle 8.3: Vergleich Data Mining<br />

SPSS Modeler und R sind zwei umfassende Tools zur Lösung von Data Mining Anwendungsfällen.<br />

Da Data Mining ein sehr komplexes Thema ist, und tiefgreifendes Vorwissen zur korrekten<br />

Anwendung der Algorithmen notwendig ist, sind auch die Tools dementsprechend komplex. Während<br />

SPSS Modeler von IBM eine lizensierte Software ist, wird R unter den Open Source Richtlinien<br />

bereitgestellt und ist für jedermann zugänglich. Daraus begründen sich auch die Hauptunterschiede der<br />

beiden Produkte. Während R sehr offen konfigurierbar und erweiterbar ist, wird SPSS Modeler als<br />

fertiges Produkt vertrieben, welches nur durch zusätzliche Kosten erweiterbar ist. Um R sinnvoll<br />

einsetzen zu können braucht man mehr Ressourcen und Know-how, das im Unternehmen aufgebaut<br />

werden muss. SPSS Modeler kann relativ zügig installiert werden und erste Ergebnisse sind schneller<br />

erzielt, allerdings nur im Rahmen der vorgegeben Möglichkeiten. Zudem bietet es Garantie- und<br />

Supportleistungen, die bei R nicht gegeben sind. Auf der <strong>and</strong>eren Seite besitzt R eine große Online<br />

Community für die Beantwortung von Fragen und Neuentwicklungen. Zusammenfassend lässt sich<br />

sagen, dass keines der beiden Tools als „besser“ bezeichnet werden kann, da dies vom jeweiligen<br />

Anwendungszweck und Unternehmenseigenheiten abhängig ist. Beide Tools bieten eine sehr große<br />

Auswahl an Data Mining Methoden und sind beide beliebte und sehr ausgereifte Produkte.<br />

670

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!