28.12.2013 Aufrufe

Projektgruppe Business Intelligence Applications and Evaluation ...

Projektgruppe Business Intelligence Applications and Evaluation ...

Projektgruppe Business Intelligence Applications and Evaluation ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Projektbericht Cuberunner<br />

Smart Wind Farm Control – Dokumentation<br />

die Datenanalyse und Anzeige am Bildschirm oder Ausdruck, sowie eine einfache und effektive Programmiersprache,<br />

welche Bedingungen, Schleifen, benutzerdefinierte rekursive Funktionen enthält<br />

(Wirtschaftsuniversität Wien 2012).<br />

Der Funktionsumfang von R kann durch eine Vielzahl von Paketen erweitert und an spezifische statistische<br />

Problemstellungen angepasst werden. Viele Pakete können direkt aus einer über die R-Console<br />

abrufbaren Liste ausgewählt und automatisch installiert werden. Zentrales Archiv für diese Pakete ist<br />

das Comprehensive R Archive Network. Für Data Mining stehen unter <strong>and</strong>erem die folgenden Packagess<br />

für R zur Verfügung (Pyrke 2007):<br />

R<strong>and</strong>omForest<br />

Party<br />

E1071<br />

nnets<br />

BayesTree<br />

gafit & rgenoud<br />

varSelRF<br />

arules<br />

Rweka<br />

Dprep<br />

Bioconductor<br />

Eine Übersicht der speziellen Packages für bestimmte Data Mining Methoden (beispielsweise Frequent<br />

Pattern Mining, Clustering, Klassifikation) kann bei Wikibooks (2012) eingesehen werden.<br />

Zudem bietet das R Package for Data Mining von Zhao (2012) ein Bündel unterschiedlicher Data Mining<br />

Algorithmen von verschiedenen Benutzern. Die bekannteste GUI für das Data Mining mit R<br />

heißt Rattle.<br />

4.4.2 Installation<br />

R wird nicht st<strong>and</strong>ardmäßig mit SAP HANA ausgeliefert, da R Open Source und unter der GPL lizensiert<br />

ist. Zudem bietet SAP keinen Support für R (SAP AG 2012 S. 3). In dem Projekt Smart Wind<br />

Farm Control (SWF) wird R als Inside-Out Variante, d.h. als Stored Procedure direkt innerhalb von<br />

SAP HANA ausgeführt (siehe Datenverarbeitungs (DV)-Konzept, Kapitel 4.3.1). Hierfür wird R sowie<br />

Rserve benötigt. Rserve ist ein TCP/IP Server, der es <strong>and</strong>eren Programmen erlaubt, R zu nutzen,<br />

ohne es zu initialisieren oder ein R Package einzubinden. R und Rserve müssen auf einem separaten<br />

System installiert werden, sie können nicht auf dem gleichen System wie SAP HANA laufen. Daher<br />

wird ein zusätzlicher Suse Linux Server als TCP/IP-Server benötigt (aktuell unterstützt SAP nur dieses<br />

Betriebssystem). Die Installation des Servers und die Anpassungen innerhalb von SAP HANA sollen<br />

im Folgenden beschrieben werden.<br />

546

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!