01.11.2013 Aufrufe

Data Mining von Sequenzdaten - Fachgebiet Datenbanken und ...

Data Mining von Sequenzdaten - Fachgebiet Datenbanken und ...

Data Mining von Sequenzdaten - Fachgebiet Datenbanken und ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

1 EINLEITUNG 4<br />

〈32100, 05/08, {〈Brot : 150T Euro〉 , 〈Butter : 70T Euro〉 , 〈Milch : 110T Euro〉 , · · · }〉,<br />

〈32101, 05/08, {〈Brot : 90T Euro〉 , 〈Butter : 55T Euro〉 , 〈Milch : 80T Euro〉 , · · · }〉,<br />

〈32100, 06/08, {〈Brot : 180T Euro〉 , 〈Butter : 100T Euro〉 , 〈Milch : 60T Euro〉 , · · · }〉,<br />

〈32101, 06/08, {〈Brot : 80T Euro〉 , 〈Butter : 60T Euro〉 , 〈Milch : 90T Euro〉 , · · · }〉,<br />

Abbildung 4: Verkaufszahlen einer Filialkette<br />

1.2.2 Beispiele für Anwendungen des <strong>Data</strong> <strong>Mining</strong>s <strong>von</strong> <strong>Sequenzdaten</strong><br />

Suche nach häufigen Teilsequenzen<br />

Der Marketing-Manager eines Kaufhauses möchte eine Werbe-Kampagne mit den<br />

folgenden Aspekten starten. Zum einen soll eine geeignete Menge <strong>von</strong> Waren für die<br />

Werbe-Kampagne ausgesucht werden. Zum anderen soll die Werbe-Kampagne an eine<br />

dafür empfängliche K<strong>und</strong>engruppe adressiert werden. Dadurch soll nicht nur der Verkauf<br />

der ausgewählten Waren stimuliert, sondern auch die K<strong>und</strong>enbindung zum Kaufhaus<br />

weiter ausgebaut werden.<br />

Dafür wurden in der Vergangenheit Transaktionsdaten <strong>von</strong> K<strong>und</strong>en gespeichert. Jede<br />

Transaktion enthält die K<strong>und</strong>en-ID, die gekauften Produkte in der Transaktion <strong>und</strong> einen<br />

Zeitstempel dieser Transaktion. Durch Gruppierung der Transaktionen nach K<strong>und</strong>en <strong>und</strong><br />

Sortierung in aufsteigender Reihenfolge der Zeitstempel erhält der Marketing-Manager<br />

eine Kaufsequenzdatenbank, in der jede Sequenz das Kaufverhalten eines K<strong>und</strong>en widerspiegelt.<br />

Durch die Suche nach häufigen Teilsequenzen, die bei vielen K<strong>und</strong>en vorkommen,<br />

kann der Marketing-Manager interessante Kaufmuster identifizieren. Diese Kaufmuster<br />

als häufige Teilsequenzen sind sehr gut geeignet um das Kaufverhalten <strong>von</strong> K<strong>und</strong>en zu<br />

verstehen. Der Marketing-Manager kann sowohl die geeigneten Produkte für die Werbe-<br />

Kampagen, als auch die zu adressierenden K<strong>und</strong>en aus den gef<strong>und</strong>enen Kaufmustern<br />

ableiten.<br />

Klassifikation <strong>von</strong> Sequenzen<br />

Der Sicherheitschef einer Fluggesellschaft ist für die Bremssysteme <strong>von</strong> Flugzeugen<br />

verantwortlich. Die Zustandsprotokolle für jedes Flugzeug liegen als Sequenzen <strong>von</strong> Einträgen<br />

vor. Eine Wartung der Flugzeuge an einem sogenannten Knoten-Flughafen ist<br />

anstrebenswert, da die Wartungskosten deutlich niedriger sind als die Kosten für die<br />

Wartung an einem Gäste-Flughafen. Auch sollte die Wartung der Flugzeuge nicht zu<br />

häufig geschehen, weil sonst nur unnötige Kosten entstehen würden.<br />

Deshalb ist der Sicherheitschef mit der folgenden Problemstellung konfrontiert: wie<br />

kann man anhand der Sequenz <strong>von</strong> Zustandseinträgen eines Flugzeuges mit hoher Genauigkeit<br />

vorhersagen, ob ein Flugzeug eine Wartung benötigt, bevor es zum nächsten

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!