12.07.2015 Aufrufe

Temporale Aspekte des Data Mining - diko-project.de

Temporale Aspekte des Data Mining - diko-project.de

Temporale Aspekte des Data Mining - diko-project.de

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Abbildung 2: Tabellarische Darstellung <strong><strong>de</strong>s</strong> BCDM-Beispiels [Lan96]Beispiele für temporale Datenbanken In <strong>de</strong>r Praxis wer<strong>de</strong>n in temporalenDatenbanken zum Beispiel Point-Of-Sale-Daten, Inventar-Daten und Call-Center-Daten gespeichert. Bei Inventar-Daten ist es mit diesen temporalen Komponentenmöglich, Inventarverän<strong>de</strong>rungen, d.h. Abgänge und Zugänge zu protokollieren. ImPoint-Of-Sale-Bereich kann es wie<strong>de</strong>rum wichtig sein, fehlerhafte Buchungen und<strong>de</strong>ren Stornierungen nachzvollziehen zu können.3.2 ZeitreihenBei <strong>de</strong>n so genannten Zeitreihen, im Folgen<strong>de</strong>n ”Sequenzen“ genannt, han<strong>de</strong>lt essich um ”eine Folge von Werten, die sich auf aufeinan<strong>de</strong>r folgen<strong>de</strong> Zeitpunkte o<strong>de</strong>rZeiträume bezieht.“ Bei Sequenzen han<strong>de</strong>lt es sich nicht zwangsläufig um Relationen,son<strong>de</strong>rn vielmehr um eine Folge von Kombinationen aus (ggf. mehrdimensionalen)”Wert“ und ”Zeitpunkt“. Unabhängig davon können Sequenzen auch Relationengespeichert wer<strong>de</strong>n. Formal lässt sich eine Sequenz folgen<strong>de</strong>rmaßen darstellen:UnterI = {i 1 , i 2 , ..., i m } (1)versteht man eine Menge verschie<strong>de</strong>ner Attribute, die man Literale o<strong>de</strong>r Items (imFolgen<strong>de</strong>n Items) nennt [Zak97] [Hip01]. Eine nicht leere Menge von ItemsI = {i 1 , i 2 , ..., i k } = α j (2)mit i j als Item wird als Itemset bezeichnet. Eine Sequenz ist dann eine zeitlichgeordnete Liste von Itemsets. Gibt es ein Itemset mit k Items, so wird dieses alsk-Itemset“ bezeichnet und die Länge ist k. Eine Sequenz α wird mit”α = (α 1 ↦→ α 2 ↦→ ... ↦→ α q ) (3)bezeichnet. Bei je<strong>de</strong>m Element α j dieser Sequenz han<strong>de</strong>lt es sich um ein Itemset.Je<strong><strong>de</strong>s</strong> Item kann nur einmal in einem Itemset vorkommen. Unabhängig davon ist esnatürlich möglich, dass ein Item in mehreren Itemsets enthalten ist. Eine Sequenzmit k Itemsets (k = ∑ j |α j|) wird als ”k-Sequenz“ bezeichnet.3.2.1 SubsequenzenEine Sequenzα = (α 1 ↦→ α 2 ↦→ ... ↦→ α n ), N = {1, 2, ..., n} (4)wird als Subsequenz einer weiteren Sequenzβ = (β 1 ↦→ β 2 ↦→ ... ↦→ β m ), M = {1, 2, ..., m} (5)bezeichnet, wenn für alle x ∈ N ein In<strong>de</strong>x j x ∈ M existiert, so dass α x ⊆ β jx .Außer<strong>de</strong>m gilt für alle x, y ∈ N, dass wenn x > y auch j x > j y gilt [Zak97].9

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!