Data Mining von Sequenzdaten - Fachgebiet Datenbanken und ...
Data Mining von Sequenzdaten - Fachgebiet Datenbanken und ...
Data Mining von Sequenzdaten - Fachgebiet Datenbanken und ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
1 EINLEITUNG 4<br />
〈32100, 05/08, {〈Brot : 150T Euro〉 , 〈Butter : 70T Euro〉 , 〈Milch : 110T Euro〉 , · · · }〉,<br />
〈32101, 05/08, {〈Brot : 90T Euro〉 , 〈Butter : 55T Euro〉 , 〈Milch : 80T Euro〉 , · · · }〉,<br />
〈32100, 06/08, {〈Brot : 180T Euro〉 , 〈Butter : 100T Euro〉 , 〈Milch : 60T Euro〉 , · · · }〉,<br />
〈32101, 06/08, {〈Brot : 80T Euro〉 , 〈Butter : 60T Euro〉 , 〈Milch : 90T Euro〉 , · · · }〉,<br />
Abbildung 4: Verkaufszahlen einer Filialkette<br />
1.2.2 Beispiele für Anwendungen des <strong>Data</strong> <strong>Mining</strong>s <strong>von</strong> <strong>Sequenzdaten</strong><br />
Suche nach häufigen Teilsequenzen<br />
Der Marketing-Manager eines Kaufhauses möchte eine Werbe-Kampagne mit den<br />
folgenden Aspekten starten. Zum einen soll eine geeignete Menge <strong>von</strong> Waren für die<br />
Werbe-Kampagne ausgesucht werden. Zum anderen soll die Werbe-Kampagne an eine<br />
dafür empfängliche K<strong>und</strong>engruppe adressiert werden. Dadurch soll nicht nur der Verkauf<br />
der ausgewählten Waren stimuliert, sondern auch die K<strong>und</strong>enbindung zum Kaufhaus<br />
weiter ausgebaut werden.<br />
Dafür wurden in der Vergangenheit Transaktionsdaten <strong>von</strong> K<strong>und</strong>en gespeichert. Jede<br />
Transaktion enthält die K<strong>und</strong>en-ID, die gekauften Produkte in der Transaktion <strong>und</strong> einen<br />
Zeitstempel dieser Transaktion. Durch Gruppierung der Transaktionen nach K<strong>und</strong>en <strong>und</strong><br />
Sortierung in aufsteigender Reihenfolge der Zeitstempel erhält der Marketing-Manager<br />
eine Kaufsequenzdatenbank, in der jede Sequenz das Kaufverhalten eines K<strong>und</strong>en widerspiegelt.<br />
Durch die Suche nach häufigen Teilsequenzen, die bei vielen K<strong>und</strong>en vorkommen,<br />
kann der Marketing-Manager interessante Kaufmuster identifizieren. Diese Kaufmuster<br />
als häufige Teilsequenzen sind sehr gut geeignet um das Kaufverhalten <strong>von</strong> K<strong>und</strong>en zu<br />
verstehen. Der Marketing-Manager kann sowohl die geeigneten Produkte für die Werbe-<br />
Kampagen, als auch die zu adressierenden K<strong>und</strong>en aus den gef<strong>und</strong>enen Kaufmustern<br />
ableiten.<br />
Klassifikation <strong>von</strong> Sequenzen<br />
Der Sicherheitschef einer Fluggesellschaft ist für die Bremssysteme <strong>von</strong> Flugzeugen<br />
verantwortlich. Die Zustandsprotokolle für jedes Flugzeug liegen als Sequenzen <strong>von</strong> Einträgen<br />
vor. Eine Wartung der Flugzeuge an einem sogenannten Knoten-Flughafen ist<br />
anstrebenswert, da die Wartungskosten deutlich niedriger sind als die Kosten für die<br />
Wartung an einem Gäste-Flughafen. Auch sollte die Wartung der Flugzeuge nicht zu<br />
häufig geschehen, weil sonst nur unnötige Kosten entstehen würden.<br />
Deshalb ist der Sicherheitschef mit der folgenden Problemstellung konfrontiert: wie<br />
kann man anhand der Sequenz <strong>von</strong> Zustandseinträgen eines Flugzeuges mit hoher Genauigkeit<br />
vorhersagen, ob ein Flugzeug eine Wartung benötigt, bevor es zum nächsten