28.12.2013 Aufrufe

Projektgruppe Business Intelligence Applications and Evaluation ...

Projektgruppe Business Intelligence Applications and Evaluation ...

Projektgruppe Business Intelligence Applications and Evaluation ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>Projektgruppe</strong> Cuberunner<br />

Jinengo – DV Konzept<br />

In der Tabelle 3.5 werden die in dem Fachkonzept formulierten Anwendungsfälle und die für die Lösung<br />

verwendeten Methoden mitein<strong>and</strong>er in Beziehung gebracht.<br />

Anwendungsfall aus Fachkonzept verwendete Data-Mining-Methode<br />

Eigenschaften raten<br />

Klassifizierung<br />

Newsletter & Reporting<br />

Clustering<br />

Ökologische Alternativen vorschlagen Assoziation<br />

Warnung vor ungewöhnlichem Verhalten eigene Logik auf Basis der Data-Mining-Ergebnisse<br />

Tabelle 3.5: Zuordnung der Data-Mining-Methoden zu den Anwendungsfällen<br />

3.4.1 Klassifizierung<br />

Ziel der Klassifizierung ist es, Eigenschaften von Endanwendern – z.B. Besitz eines Elektroautos<br />

(ownsPEV) – zu ermitteln, die mit einer gewissen Konfidenz (z.B. >98%) vorliegen, aber bislang vom<br />

Benutzer nicht angegeben wurden (Besitz Elektroauto bislang NULL). Der Schwellenwert für die<br />

Konfidenz-Akzeptanz sollte von Fall zu Fall angepasst werden. Einen Richtwert liefert der im SPSS<br />

Modeler ausgegebene Wert „always correct above“.<br />

Input:<br />

<br />

<br />

<br />

<br />

Anzahl der gefahrenen Strecken pro Verkehrsmittel<br />

Persönliche Attribute (Geschlecht, etc.)<br />

Besitz von Verkehrsmittel (ownsPEV, ownsEbike, etc.)<br />

Endanwenderpräferenzen<br />

Algorithmus:<br />

<br />

<br />

CHAID<br />

Der Algorithmus muss mit sich ändernden Daten überprüft und angepasst werden, da verschiedene<br />

Algorithmen mit fehlenden Datensätzen besser / schlechter umgehen können.<br />

Output:<br />

Die Ergebnisse werden in das Data Warehouse geschrieben (jinengoData-<br />

Warehouse.dbo.ClassificationPrediction).<br />

Spalten der Tabelle: jinengoUserID, userHistoricID, attribute, attributeValue, attributePrediction,<br />

predictionConfidence, predictionDate und predictionAcception.<br />

Die Attribut-Spalte speichert den Namen des Attributs (Bspw.: ownsPEV, ownsEbike, etc), in der<br />

Spalte attributeValue wird der angegebene Wert abgespeichert. Vergleichend dazu wird in der Spalte<br />

attributePrediction der durch DataMining ermittelte Konfidenzwert festgehalten.<br />

69

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!