12.07.2015 Aufrufe

Temporale Aspekte des Data Mining - diko-project.de

Temporale Aspekte des Data Mining - diko-project.de

Temporale Aspekte des Data Mining - diko-project.de

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

vergeben wer<strong>de</strong>n kann.Mit Hilfe <strong>de</strong>r Transaktionszeit wird eine Rollback-Relation geschaffen: es könnteje<strong>de</strong>r Verän<strong>de</strong>rungsschritt rückgängig gemacht bzw. Än<strong>de</strong>rungen je<strong>de</strong>rzeit nachvollzogenwer<strong>de</strong>n. Beliebige Zustän<strong>de</strong> zu unterschiedlichen Zeiten können abgerufenwer<strong>de</strong>n.3.1.2 ZeitstempelungBei einer Zeitstempelung wird ein Tupel o<strong>de</strong>r ein Attribut vom DBMS, teils automatisch,mit einem Zeitwert versehen. Es gibt zwei unterschiedliche Ansätze bei<strong>de</strong>r Zeitstempelung (engl. Timestamp). Zum einen gibt es die Tupel-Zeitstempelungund zum an<strong>de</strong>ren die Attributzeitstempelung.Tupel-ZeitstempelungHierbei han<strong>de</strong>lt es sich um die einfachste und am häufigsten verwen<strong>de</strong>te Metho<strong>de</strong>[JDS98]. Die Zeitstempelung erfolgt hier für je<strong><strong>de</strong>s</strong> Tupel. Die vorhan<strong>de</strong>ne Relationwür<strong>de</strong> um entsprechen<strong>de</strong> Attribute erweitert wer<strong>de</strong>n. Der große Vorteil ist darinzu sehen, dass die konventionellen rationalen DBMS problemlos mit dieser Art <strong>de</strong>rtemporalen Erweiterung umgehen können [KM96]. Die Form <strong>de</strong>r Datenbank bleibterhalten. Je nach verwen<strong>de</strong>ter Zeitdimension wird das Datenbank-Schema auf Tupelebenewie folgt ergänzt. Für die Gültigkeitszeitstempelung wird je ein Attribut für<strong>de</strong>n Anfangs- und für <strong>de</strong>n Endwert <strong><strong>de</strong>s</strong> Gültigkeitszeitraums notiert. Bei <strong>de</strong>r Transaktionzeitstempelungwer<strong>de</strong>n die Werte für Start und En<strong>de</strong> <strong><strong>de</strong>s</strong> Transaktionsintervallsgespeichert, das heißt, von wann bis wann ein Fakt in <strong>de</strong>r Datenbank gültig ist.Speichert man sowohl die Gültigskeitszeiten als auch die Transaktionszeiten, sprichtman von ”bitemporaler Zeitstempelung“ (siehe unten). In diesem Fall wer<strong>de</strong>n insgesamtvier zusätzliche Attribute für die Zeitstempelung vorgehalten. Der Vorteil <strong>de</strong>rTupel-Zeitstemplung liegt darin, dass die Zeitstempelung in vorhan<strong>de</strong>ne konventionelleDatenbanksysteme relativ einfach implementiert wer<strong>de</strong>n kann. Nachteilig ist,dass für alle Attribute eines Tupels nur eine Zeitstempelung erfolgt. In <strong>de</strong>r Regelfin<strong>de</strong>t immer nur die Än<strong>de</strong>rung eines o<strong>de</strong>r mehrerer Attribute statt, die Än<strong>de</strong>rungaller Attributwerte tritt nur selten auf. Da bei temporalen Datenbank Än<strong>de</strong>rungenin einem neuen Tupel mit einem neuen Zeitstempel gespeichert wer<strong>de</strong>n (sieheoben), kommt es auf diesem Weg zwangsläufig zu Redundanzen: mehrere Attributemüssen neu gespeichert wer<strong>de</strong>n, obwohl es für sie keine Verän<strong>de</strong>rung gegeben hat.Attribut-ZeitstempelungIm Gegensatz zur Tupel-Zeitstempelung wer<strong>de</strong>n hier einzelne Attribute mit einemZeitstempel versehen [JDS98]. Dabei gilt es zeitabhängige und zeitunabhängige Attributezu unterschei<strong>de</strong>n. Bei unabhängigen Attributen tritt im Laufe <strong>de</strong>r Zeit keineVerän<strong>de</strong>rung auf. Bei abhängigen Attributen muss davon ausgegangen wer<strong>de</strong>n, dasseine Verän<strong>de</strong>rung <strong><strong>de</strong>s</strong> Attributs potentiell möglich ist. Ist eine Än<strong>de</strong>rung möglich,wird auch eine Gültigkeitszeitstempelung nötig, sonst nicht. Für die Transaktionszeitist die zeitliche Abhängigkeit nicht relevant, sowohl die abhängigen als auch dieunabhängigen erhalten hier einen Zeitstempel.Dadurch, dass die Zeiten bei <strong>de</strong>n einzelnen Attributen stehen, ergibt sich eine komplexemehrwertige Speicherung. Än<strong>de</strong>rungen eines Attributs wer<strong>de</strong>n in <strong>de</strong>r Relationnur beim Attribut selbst gespeichert. Redundanzen wer<strong>de</strong>n hierdurch vermie<strong>de</strong>n. Daalle Versionen in einem einzigen Tupel gespeichert wer<strong>de</strong>n, unterliegt die Relationnicht mehr <strong>de</strong>r ersten Normalform, da <strong>de</strong>ren Bedingung Atomarität lautet [PAT99].Die Einhaltung <strong>de</strong>r ersten Normalform ist wie<strong>de</strong>rum Bedingung für die meistenkommerziell verfügbaren relationalen Datenbanksysteme. Dem gegenüber stehendie Vorteile <strong>de</strong>r flexiblen Mo<strong>de</strong>llierung und Anpassbarkeit sowie die vergleichsweisegeringere Datenmenge. Nachteilig wirkt sich dann allerdings die Komplexitätsstei-7

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!