Abbildung 4: Taxonomie zeitlicher Beziehungen[All83]Krankheiten festgehalten. Je<strong>de</strong> Krankheit wird als Intervall festgehalten. Für je<strong><strong>de</strong>s</strong>Intervall gibt es eine Startzeit t s und eine Endzeit t e , wobei gilt, dass t s ≤ t e . ZurVereinfachung wird nun je<strong>de</strong> Krankheit einer Person als Ereignis bezeichnet. Dabeiwird je<strong><strong>de</strong>s</strong> Ereignis einem Ereignistypen E zugeordnet. Ein Ereignis E besteht nunaus (A, t s , t e ) wobei A ∈ E ein Ereignistyp ist. Wird daraufhin eine Sequenz gebil<strong>de</strong>t,sind darin die Ereignisse einer einzelnen Person in chronologischer Reihenfolgemit ihren Start- und Endzeiten notiert. Die Sequenzs j = 〈(A 1 , t s1 , t e1 ), (A 2 , t s2 , t e2 ), · · · , (A n , t sn , t en )〉 (18)ist dann eine Sequenz für die Person j. Die einzelnen Ereignisse wer<strong>de</strong>n nach ihrenEndzeiten geordnet.t ei ≤ t ei+1 (19)Zwischen <strong>de</strong>n einzelnen Ereignissen dieser Sequenz können nun Relationen gemäß<strong>de</strong>r oben besprochenen Abbildung gebil<strong>de</strong>t wer<strong>de</strong>n. Diese Relationen wer<strong>de</strong>n durchdie Relationen zwischen <strong>de</strong>n Endpunkten <strong>de</strong>r Intervalle ausgedrückt, die als ”EndpunktBegrenzung“ bezeichnet wer<strong>de</strong>n. Die Sequenz〈E 1 = (A, 5, 10)〉 (20)zeigt, dass ”A überschnei<strong>de</strong>t B“. Die hierzu erfüllten Bedingungen sind folgen<strong>de</strong>:E 1 .t s < E 2 .t s (21)E 1 .t e > E 2 .t sE 1 .t e < E 2 .t eVon <strong>de</strong>n oben aufgeführten dreizehn Relationen wer<strong>de</strong>n effektiv nur sieben verwen<strong>de</strong>t,da es sich bei <strong>de</strong>n an<strong>de</strong>ren um Relationen mit <strong>de</strong>r gleichen Aussage han<strong>de</strong>lt. Obman nun sagt ”X überschnei<strong>de</strong>t Y“ o<strong>de</strong>r ”Y wird von X überschnitten“ ist lediglich16
von <strong>de</strong>r unterschiedlichen Beschreibung ein und <strong><strong>de</strong>s</strong>selben Vorgangs abhängig. Diesesieben zeitlichen Relationen wer<strong>de</strong>n mit Rel bezeichnet. Für das Fin<strong>de</strong>n von temporalenMustern wird zwischen atomaren Mustern, die aus einem einzelnen Ereignisbestehen und zusammengesetzten Mustern, die entsprechend aus min<strong><strong>de</strong>s</strong>tens zweiEreignissen bestehen, unterschie<strong>de</strong>n. Die Größe eines Musters gibt die Anzahl <strong>de</strong>renthaltenen atomaren Muster an.Gibt es ein Ereignis E vom Typ X innerhalb einer Sequenz S, so hat das atomareMuster X ein ”mapping“ in S [KF00].Die Dauer dieses ”mappings“ wird mitM(X, S) = {E} (22)M(X, S).t s = E.t s (23)M(X, S).t e = E.t eangegeben; X ist in S enthalten.Ein vergleichbares Mapping gibt es auch für die zusammengesetzten Muster. Umdie Intervalllänge zu begrenzen und nur Ereignisse zu fin<strong>de</strong>n, die dicht genug beieinan<strong>de</strong>rliegen, gibt es als Parameter die Fenstergröße. Es wer<strong>de</strong>n dann nur Intervallegefun<strong>de</strong>n, die innerhalb <strong><strong>de</strong>s</strong> spezifizierten Fensters liegen.Zu guter Letzt wird auch bei intervall-basieren<strong>de</strong>n Ereignissen die Häufigkeit gemessen.Dies geschieht wie auch bei <strong>de</strong>n an<strong>de</strong>ren Mustern durch das Verhältnis <strong>de</strong>runterstützten Sequenzen zu <strong>de</strong>n Sequenzen in <strong>de</strong>r Datenbank.4.5 TrendsEin Trend bezeichnet die Verän<strong>de</strong>rungen zwischen zwei Objekteigenschaften. DasBeispiel(SS#, =)(Rank, ≠) ↦→ Next (Sal, ≠) (24)sagt aus, dass mit einer Än<strong>de</strong>rung <strong><strong>de</strong>s</strong> Rangs auch eine Än<strong>de</strong>rung <strong><strong>de</strong>s</strong> Gehalts stattfin<strong>de</strong>t[Wij01]. Es han<strong>de</strong>lt sich dabei um eine zeitliche Abhängigkeit (engl. temporal<strong>de</strong>pen<strong>de</strong>ncy), die als Trendabhängigkeit bezeichnet wird. Dabei steht SS#für die Sozialversicherungsnummer, die unverän<strong>de</strong>rt bleibt (=). Rank kennzeichnet<strong>de</strong>n Rang innerhalb eines Unternehmens, <strong>de</strong>r beispielsweise durch eine Beför<strong>de</strong>rungverän<strong>de</strong>rt wird und Sal steht für das Gehalt (engl. salary). Bei bei<strong>de</strong>n fin<strong>de</strong>t eineÄn<strong>de</strong>rung statt (≠). In dieser Form können verschie<strong>de</strong>ne Trends angegeben wer<strong>de</strong>n.Beispiele für Trends sind: Gehälter von Angestellten sinken im Allgemeinen nicht.“”Eine Beför<strong>de</strong>rung schließt eine Gehaltsmin<strong>de</strong>rung aus.“”Weitere Anwendungsmöglichkeiten Das Ermitteln von Trends kann auch fürdie Datenverwaltung selbst von Vorteil sein. Man kann Trends verwen<strong>de</strong>n, um dieDatenintegrität zu verbessern. Unplausible Daten können aufgrund bestehen<strong>de</strong>rTrends ausgeschlossen wer<strong>de</strong>n. So können dann Restriktionen, so genannte Constraints[PAT99] für die Datenbank festgelegt wer<strong>de</strong>n, die aus Trend-Regeln bestehen.Besagt das obige Beispiel, dass eine Beför<strong>de</strong>rung eine Gehaltsmin<strong>de</strong>rung ausschließt,kann verhin<strong>de</strong>rt wer<strong>de</strong>n, dass eine Datenän<strong>de</strong>rung o<strong>de</strong>r ein neuer Datensatz,<strong>de</strong>r diesem Anspruch nicht genügt, auch nicht in die Datenbank aufgenommenwird. Selbstverständlich muss man sich bei dieser Vorgehensweise im Klaren sein,dass Unterstützung und Konfi<strong>de</strong>nz solcher Regel sehr hoch sein müssen, um sie alsRestriktion für Datenbanken verwen<strong>de</strong>n zu können. Eine Regel wie die obige, diebesagt, dass Gehälter im Allgemeinen nicht sinken, wäre hierfür ungeeignet. So istes <strong>de</strong>nkbar, dass ein Mitarbeiter beispielsweise auf Teilzeit umstellt und dadurchein geringeres Gehalt erhält.17