28.12.2013 Aufrufe

Projektgruppe Business Intelligence Applications and Evaluation ...

Projektgruppe Business Intelligence Applications and Evaluation ...

Projektgruppe Business Intelligence Applications and Evaluation ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Projektgruppe</strong> Cuberunner<br />

Jinengo - Dokumentation<br />

Das gebaute Modell sollte auf jeden Fall mit dem Analyse-Node und dem <strong>Evaluation</strong>-Node überprüft<br />

werden. Die genauen Einstellungen können in der Projektdatei eingesehen werden.<br />

Für die Klassifizierung wird der „exhaustive CHAID“ Algorithmus genutzt. Um die Stabilität des<br />

Modells zu erhöhen ist "Bagging" aktiviert. Nach ausprobieren ergab sich ein Wert von 150 Models<br />

(tab: Build Options Ensembles) als ausreichend um die Aussagekraft des Modells zu maximieren.<br />

Dieser Werte konnte für alle sechs Streams genutzt werden, muss aber evtl. bei sich ändernden Datenvolumen<br />

angepasst werden. Das gebaute Modell sollte auf jeden Fall mit dem Analyse-Node und dem<br />

<strong>Evaluation</strong>-Node überprüft werden. Die genauen Einstellungen können in der Projektdatei eingesehen<br />

werden.<br />

Daten exportieren<br />

Nachdem das Target-Attribut klassifiziert wurde, wird der aktuelle Timestamp als Datum angefügt,<br />

um in Zukunft feststellen zu können, wann die Prediction durchgeführt wurde. Außerdem wird die<br />

Beschriftung des Target-Attributs (in diesem Fall „ownsEbike“) in die Spalte „attribut“ geschrieben.<br />

Dies ist relevant, da alle sechs Streams in dieselbe Tabelle in der Datenbank geschrieben werden. Um<br />

die einzelnen Predictions ausein<strong>and</strong>er zu halten, dient die Spalte „attribut“ als Indikator.<br />

Zum Schluss werden unnötige Felder heraus gefiltert und nur die Einträge ausgewählt, bei denen die<br />

Attribut Ausprägung ursprünglich weder "NULL" noch gleich dem „ValuePredicted“ ist. Zusätzlich<br />

muss die PredictionConfidence größer als ein zu definierender Grenzwert sein. Dieser Grenzwert kann<br />

aus der obigen Analyse der Data Mining Ergebnisse ermittelt werden.<br />

Die Zieltabelle besteht aus folgenden Spalten: „userHistoricID, jinengoUserID, attribut, attributValue,<br />

attributPrediction, predictionConfidence, predictionDate“.<br />

1.5.2 Clustering<br />

Im Rahmen des Clustering werden User zu Gruppen zugeordnet. Mit Hilfe dieser Gruppen können<br />

User gezielter angesprochen werden und dadurch ihre Response Rate auf bspw. Newsletter Kampagnen<br />

erhöht werden. Zur Realisierung wurden zwei Typen von Clustern definiert: zum einen ein<br />

Sustainability Cluster und ein Personen Cluster. Personen Cluster gruppieren User nach ihren persönlichen<br />

Eigenschaften wie Alter, Geschlecht etc. Diese Gruppen sind insbesondere Hilfreich um die<br />

User von Jinengo selbst zu analysieren. Fragen wie „Wer nutzt Jinengo und wie oft“ lassen sich mit<br />

Hilfe dieser Cluster genauer umschreiben. So könnten bestimmte Einkommens und Altersgruppen<br />

identifiziert werden, die Jinengo besonders häufig oder weniger häufig nutzen. Diese Segmente lassen<br />

sich im Anschluss z.B. für zielgruppenspezifische Werbung nutzen.<br />

141

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!