12.07.2015 Aufrufe

Temporale Aspekte des Data Mining - diko-project.de

Temporale Aspekte des Data Mining - diko-project.de

Temporale Aspekte des Data Mining - diko-project.de

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

ist eine Sequenz von Schnappschüssen. Die Stabilität selbst wird dann mitStabilität =Support(X ∩ Y, Ω)Support(X, Ω) × Support(Y, Ω)(15)berechnet [WYM01]. Die Stabilität ist also <strong>de</strong>r Quotient aus <strong>de</strong>n unterstütztenSequenzen Support(X ∩ Y, Ω) und <strong>de</strong>m Kreuzprodukt <strong>de</strong>r Sequenzen, die jeweilsnur einen Zustand <strong>de</strong>r Regel aufweisen.4.2.4 DichteDadurch, dass in diesem Falle numerische Attribute verglichen wer<strong>de</strong>n, ist es möglich,dass Regeln aufgestellt wer<strong>de</strong>n, die numerische Bereiche abzu<strong>de</strong>cken scheinen, in<strong>de</strong>nen es nicht ein tatsächliches Objekt gibt. In Bezug auf das oben gewählteBeispiel könnte man die Notwendigkeit eines Dichte-Parameters so erklären: Eswird von einem Gehalt im Intervall [40.000,55.000] auf Wohnausgaben im Intervall[10.000,15.000] geschlossen. Möglicherweise gibt es nun viele Objekte zu Beginnund En<strong>de</strong> <strong><strong>de</strong>s</strong> jeweiligen Intervalls, die dazu geführt haben, dass diese Regel aufgestelltwur<strong>de</strong>. Doch besagt diese Regel ja auch, dass beliebige Werte-Kombinationeninnerhalb dieses Intervalls möglich sind. Es kann also eine Kombination Gehalt-Wohnausgaben mit Werten von 50.000 bzw. 13.000 geben, obwohl es in <strong>de</strong>n analysiertenDaten nie solch eine Kombination gegeben hat. Es ist gut möglich, dass es sogarKombinationen gibt, die sehr unwahrscheinlich sind. Mit <strong>de</strong>m Dichte-Parameterwird nun bestimmt, wieviele Testdaten in einem Bereich liegen müssen, damit <strong>de</strong>rBereich als Teil eines umfassen<strong>de</strong>n Intervalls bezeichnet wer<strong>de</strong>n kann.4.2.5 Praktische BeispieleMit Hilfe einer temporalen Assoziationsregel lassen sich zum Beispiel folgen<strong>de</strong> Zusammenhängeformulieren: ”Wenn <strong>de</strong>r Preis von Produkt A unter 1 Euro fällt, dannsteigt <strong>de</strong>r monatliche Verkauf von Produkt B um 10.000 - 20.000. “ ”Neue Angestelltezwischen 20 und 30 Jahren starten mit einem Gehalt von 40.000 - 60.000Euro. Die jährliche Erhöhung beträgt min<strong><strong>de</strong>s</strong>tens 2.000 Euro.“4.3 Kalendarische MusterMuster, die in Anlehnung an ein kalendarisches Schema, z.B. einen Jahres-, Monatso<strong>de</strong>rWochenkalen<strong>de</strong>r gesucht wer<strong>de</strong>n, nennt man kalendarische Muster. Ein kalendarischesMuster wird ebenfalls mit temporalen Assoziationsregeln beschrieben. DerUnterschied zu <strong>de</strong>n zuvor vorgestellten Regeln ist, dass es sich hierbei um Regelnhan<strong>de</strong>lt, die zu bestimmten Zeitpunkten o<strong>de</strong>r in bestimmten Zeiträumen gelten. Dertemporale Aspekt einer solchen Regel könnte zum Beispiel je<strong>de</strong>n Dienstag“ o<strong>de</strong>r”je<strong>de</strong>n ersten Mai“ o<strong>de</strong>r ähnlich lauten.”Um eine Regel aufstellen zu können, wird ein relationales Kalen<strong>de</strong>rschemaR = (f n : D n , f n−1 : D n−1 , · · · , f 1 : D 1 ) (16)benötigt [LNWJ01]. Dabei han<strong>de</strong>lt es bei f i um ein Attribut, z.B. um das Jahr, <strong>de</strong>nMonat, <strong>de</strong>n Tag etc. und D als Zeit-Domäne. Die Gültigkeit dieses Schemas wirdmitD n × D n−1 × · · · × D 1 (17)festgelegt. Für je<strong><strong>de</strong>s</strong> Attribut kommen dann bestimmte Integerwerte in Frage, diedurch die obige Gültigkeit eingeschränkt sind. Auf diesem Weg wer<strong>de</strong>n bestimmteWertkombinationen ausgeschlossen. Es gibt dann beispielsweise keinen 32. Januaretc..14

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!