12.07.2015 Aufrufe

Temporale Aspekte des Data Mining - diko-project.de

Temporale Aspekte des Data Mining - diko-project.de

Temporale Aspekte des Data Mining - diko-project.de

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

von <strong>de</strong>r unterschiedlichen Beschreibung ein und <strong><strong>de</strong>s</strong>selben Vorgangs abhängig. Diesesieben zeitlichen Relationen wer<strong>de</strong>n mit Rel bezeichnet. Für das Fin<strong>de</strong>n von temporalenMustern wird zwischen atomaren Mustern, die aus einem einzelnen Ereignisbestehen und zusammengesetzten Mustern, die entsprechend aus min<strong><strong>de</strong>s</strong>tens zweiEreignissen bestehen, unterschie<strong>de</strong>n. Die Größe eines Musters gibt die Anzahl <strong>de</strong>renthaltenen atomaren Muster an.Gibt es ein Ereignis E vom Typ X innerhalb einer Sequenz S, so hat das atomareMuster X ein ”mapping“ in S [KF00].Die Dauer dieses ”mappings“ wird mitM(X, S) = {E} (22)M(X, S).t s = E.t s (23)M(X, S).t e = E.t eangegeben; X ist in S enthalten.Ein vergleichbares Mapping gibt es auch für die zusammengesetzten Muster. Umdie Intervalllänge zu begrenzen und nur Ereignisse zu fin<strong>de</strong>n, die dicht genug beieinan<strong>de</strong>rliegen, gibt es als Parameter die Fenstergröße. Es wer<strong>de</strong>n dann nur Intervallegefun<strong>de</strong>n, die innerhalb <strong><strong>de</strong>s</strong> spezifizierten Fensters liegen.Zu guter Letzt wird auch bei intervall-basieren<strong>de</strong>n Ereignissen die Häufigkeit gemessen.Dies geschieht wie auch bei <strong>de</strong>n an<strong>de</strong>ren Mustern durch das Verhältnis <strong>de</strong>runterstützten Sequenzen zu <strong>de</strong>n Sequenzen in <strong>de</strong>r Datenbank.4.5 TrendsEin Trend bezeichnet die Verän<strong>de</strong>rungen zwischen zwei Objekteigenschaften. DasBeispiel(SS#, =)(Rank, ≠) ↦→ Next (Sal, ≠) (24)sagt aus, dass mit einer Än<strong>de</strong>rung <strong><strong>de</strong>s</strong> Rangs auch eine Än<strong>de</strong>rung <strong><strong>de</strong>s</strong> Gehalts stattfin<strong>de</strong>t[Wij01]. Es han<strong>de</strong>lt sich dabei um eine zeitliche Abhängigkeit (engl. temporal<strong>de</strong>pen<strong>de</strong>ncy), die als Trendabhängigkeit bezeichnet wird. Dabei steht SS#für die Sozialversicherungsnummer, die unverän<strong>de</strong>rt bleibt (=). Rank kennzeichnet<strong>de</strong>n Rang innerhalb eines Unternehmens, <strong>de</strong>r beispielsweise durch eine Beför<strong>de</strong>rungverän<strong>de</strong>rt wird und Sal steht für das Gehalt (engl. salary). Bei bei<strong>de</strong>n fin<strong>de</strong>t eineÄn<strong>de</strong>rung statt (≠). In dieser Form können verschie<strong>de</strong>ne Trends angegeben wer<strong>de</strong>n.Beispiele für Trends sind: Gehälter von Angestellten sinken im Allgemeinen nicht.“”Eine Beför<strong>de</strong>rung schließt eine Gehaltsmin<strong>de</strong>rung aus.“”Weitere Anwendungsmöglichkeiten Das Ermitteln von Trends kann auch fürdie Datenverwaltung selbst von Vorteil sein. Man kann Trends verwen<strong>de</strong>n, um dieDatenintegrität zu verbessern. Unplausible Daten können aufgrund bestehen<strong>de</strong>rTrends ausgeschlossen wer<strong>de</strong>n. So können dann Restriktionen, so genannte Constraints[PAT99] für die Datenbank festgelegt wer<strong>de</strong>n, die aus Trend-Regeln bestehen.Besagt das obige Beispiel, dass eine Beför<strong>de</strong>rung eine Gehaltsmin<strong>de</strong>rung ausschließt,kann verhin<strong>de</strong>rt wer<strong>de</strong>n, dass eine Datenän<strong>de</strong>rung o<strong>de</strong>r ein neuer Datensatz,<strong>de</strong>r diesem Anspruch nicht genügt, auch nicht in die Datenbank aufgenommenwird. Selbstverständlich muss man sich bei dieser Vorgehensweise im Klaren sein,dass Unterstützung und Konfi<strong>de</strong>nz solcher Regel sehr hoch sein müssen, um sie alsRestriktion für Datenbanken verwen<strong>de</strong>n zu können. Eine Regel wie die obige, diebesagt, dass Gehälter im Allgemeinen nicht sinken, wäre hierfür ungeeignet. So istes <strong>de</strong>nkbar, dass ein Mitarbeiter beispielsweise auf Teilzeit umstellt und dadurchein geringeres Gehalt erhält.17

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!