28.12.2013 Aufrufe

Projektgruppe Business Intelligence Applications and Evaluation ...

Projektgruppe Business Intelligence Applications and Evaluation ...

Projektgruppe Business Intelligence Applications and Evaluation ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Projektgruppe</strong> Cuberunner<br />

Jinengo - Dokumentation<br />

Für diejenigen Attribute, deren Originalwert nicht in der Datenbank vorh<strong>and</strong>en ist, gibt die Klassifizierung<br />

einen Hinweis, welche Ausprägung dem User entsprechend wäre. So bietet die Klassifizierung<br />

eine Möglichkeit fehlende Werte in der Datenbank zu ergänzen.<br />

Ist der klassifizierte Wert <strong>and</strong>ers als angegeben, ist dies ein Hinweis darauf, dass User unter umständen<br />

einen <strong>and</strong>eren Wert präferieren würden. Dies ist insbesondere in Bezug auf Attribute interessant,<br />

die sich auf den Besitz von Produkten beziehen. So könnte es zum Beispiel dabei helfen User zu identifizieren,<br />

die aktuell zwar noch kein E-Bike besitzen, potentiell aber zur Gruppe der Interessenten<br />

gehören.<br />

Da viele Angaben durch den User freiwillig sind, können bestimmte Attribute durch alle Daten hindurch<br />

lückenhaft sein. Sowohl für die Darstellung im Rahmen der BI als auch in der Analyse sind<br />

lückenhafte Datensätze problematisch und es kann daher sinnvoll sein, sie mit den wahrscheinlichsten<br />

Werten aufzufüllen.<br />

Es wurden insgesamt sechs Streams gebaut, die für je ein Attribut die Werte schätzen. Die Streams<br />

sind unterein<strong>and</strong>er fast identisch. Hauptunterscheidung stellt das unterschiedliche „Target Attribut“<br />

dar.<br />

Im Folgenden wird ein Stream beispielhaft für alle dokumentiert:<br />

Daten aufbereiten<br />

Mit den beiden folgenden SQL Statements werden die User und die Routendaten aus der Datenbank<br />

abgefragt:<br />

User:<br />

SELECT<br />

FROM<br />

WHERE<br />

j.ID AS jinengoUserID, u.ID AS userHistoricID,<br />

u.incomeRangeID, u.familyStatusID, u.ownsPEV,<br />

u.ownsGasCar, u.ownsEbike, u.publicTransportMember,<br />

u.railMembershipID, u.carSharingMemberships,<br />

u.maxDistanceToWalk, u.maxDistanceToBike,<br />

u.sustainabilityPreference, u.comfortPreference,<br />

u.costsPreference, j.gender, j.birthdate<br />

dbo.JinengoUser j, dbo.UserHistoric u<br />

u.jinengoUserID = j.ID AND u.ID = ( SELECT MAX(ID) FROM<br />

UserHistoric WHERE jinengoUserID = j.ID)<br />

Routen:<br />

SELECT<br />

userHistoricID,<br />

138

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!