Temporale Aspekte des Data Mining - diko-project.de

Weitere Magazine

Empfehlungen

Info

Eine Subsequenz wird mit α ≼ β notiert.Beispiel: Im Folgenden handelt es sich beium eine Subsequenz vonα = (B ↦→ AC ↦→ D) (6)β = (AB ↦→ E ↦→ ACE ↦→ BE ↦→ DE), (7)also α ≼ β, da α vollständig in β enthalten ist.3.2.2 Beispiele für ZeitreihenB ⊆ AB, AC ⊆ ACE, D ⊆ DE (8)Zeitreihen erfassen in der praktischen Anwendung beispielsweise Web-Visits proStunde, Verkäufe pro Monat, Anrufe pro Tag usw..3.3 Äquivalenz von Zeitreihen und temporalen DatenbankenLiegen die zu analysierenden Daten innerhalb einer temporalen Datenbank vor, istes möglich diese in Sequenzen zu transformieren. Dazu benötigt man Snapshots (sieheKapitel 3.1), also Momentaufnahmen. Die Ausprägungen der einzelnen Objektekönnen dann an Hand ihrer temporalen Attribute, d.h. Transaktions- und Gültigkeitszeit,in Zeitreihen umgewandelt werden. Da eine Sequenz immer aus einemObjekt mit seinen Eigenschaften zu aufeinanderfolgenden Zeitpunkten besteht, isteine Transformation in diese Richtung möglich. Gibt es also in einer temporalenDatenbank ein Objekt ”Warenkorb“ kann anhand der Transaktions- und Gültigkeitszeiteneine Schnappschussfolge gebildet werden. So läßt sich dann der Zustanddes Warenkorbs zum Zeitpunkt 1,2,3,... bilden. In der Sequenz werden dann die jeweiligenWarenkörbe in zeitlicher Reihenfolge abgebildet, die dazugehörigen Zeitengehen allerdings verloren [Zak97]. So ist es also möglich die Methoden zur Analysevon Sequenzen zu verwenden, wenn die Ursprungsdaten in temporalen Datenbankenvorliegen.Theoretisch ist auch ein umgekehrter Weg möglich. Man könnte die in der Sequenzvorhandenen Zustände wieder in eine temporale Datenbank schreiben. Dazuwürden dann die Transaktionszeiten so gesetzt, dass die zweite Ausprägung der Sequenzdort beginnt, wo die erste Ausprägung aufhört. Also ist die TZA der zweitenAusprägung größer oder gleich der TZE der ersten Ausprägung. Nach dem gleichenPrinzip müßte man dann die weiteren Tupel anlegen. Die Gültigkeitswerte in dertemporalen Datenbank würden allerdings alle gleich gesetzt werden: gültig ab sofortbis eine Änderung vorgenommen wird. Man kann also sagen, dass die Daten innerhalbeiner Sequenz nur den Verlauf der Daten innerhalb der temporalen Datenbankwiedergeben.Die Möglichkeit der Umwandlung von temporalen Daten zu Sequenzen ist insofernvon Bedeutung, da die im Verlauf dieser Ausarbeitung vorgestellten Technikenhauptsächlich auf der Verwendung von Sequenzen basieren.4 Temporale MusterAufgrund der Flut an Informationen, die die moderne Technik der Informationsgesellschaftmit sich brachte, wurden immer öfter Entscheidungen nicht auf Grundlageder informationsreichen Datenbanken getroffen, sondern überwiegend nach Intuitiondes Verantwortlichen. Kamber und Han [HK01] bezeichnen solche ungenutzten10
oder falsch genutzten Datenbestände als ”Data Tombs“, zu Deutsch Datengräber.Einen Ausweg aus dieser Misere versprechen Data Mining-Techniken wie sie in denvorangegangenen Ausarbeitungen vorgestellt wurden.Data Mining-Werkzeuge entdecken Muster innerhalb großer Datenmengen, die fürden Benutzer von großem Nutzen sein können. Ähnlich wird auch bei temporalenDaten vorgegangen. Hier bemüht man sich temporale Muster zu entdecken.Im folgenden Abschnitt werden verschiedene Formen von temporalen Mustern vorgestelltund teilweise vertieft beschrieben. Dazu gehören sequentielle Muster, zeitlicheAssoziationsregeln und kalendarische Muster sowie intervall-basierende Ereignisse,Trends und ”unusual Movements“. Der Weg zu diesen Mustern, das heißt dieDatenanalyse wird im nächsten Kapitel dargestellt.4.1 Sequentielle MusterEin sequentielles Muster [Zak97] ist ein Muster, das beim ”mining“ über mehrereSequenzen entdeckt werden kann. Mit Hilfe sequentieller Muster werden Regeln aufgestellt.Diese sind zu vergleichen mit Assoziationsregeln. Assoziationsregeln stellenRelationen und Zusammenhänge zwischen einzelnen Objekten oder deren Attributeher. Sequentielle Muster erfüllen eine ähnliche Aufgabe, doch in einem Punktunterscheiden sie sich von den Assoziationsregeln gänzlich. Assoziationsregeln sindso genannte Intra-Transaktionsmuster, also Muster innerhalb einer Transaktion,beispielsweise innerhalb eines Warenkorbs. Sequentielle Muster dagegen sind Inter-Transaktionsmuster, das heißt, es werden Muster zwischen verschiedenen Transaktionenund nicht zwangsläufig innerhalb dieser untersucht (siehe Abbildung 3).Abbildung 3: Unterschied zwischen Intra- und Inter-TransaktionsmusterSo können beispielsweise Zusammenhänge bei verschiedenen Einkäufen übereinen Zeitraum von mehreren Wochen entdeckt werden. Formal wird ein sequentiellesMuster wie folgt beschrieben:T ist der eindeutige Bezeichner einer Transaktion, die eine Menge von Items I, alsoein so genanntes Itemset enthält.T ⊆ I (9)Mit C wird eine Kundesequenz bezeichnet, der eine Liste von Transaktionen zugeordnetist. Die Transaktionen sind in der Reihenfolge ihrer Transaktionszeit geordnet.C = T 1 ↦→ T 2 ↦→ · · · ↦→ T n (10)Eine Datenbank D enthält wiederum eine Menge solcher Kundensequenzen.11
Seite 1 und 2: Temporale Aspekte des Data MiningOl
Seite 3 und 4: Themas. Zu den Grundlagen gehören
Seite 5 und 6: Zur Darstellung der Zeit gibt es dr
Seite 7 und 8: vergeben werden kann.Mit Hilfe der
Seite 9: Abbildung 2: Tabellarische Darstell
Seite 14 und 15: ist eine Sequenz von Schnappschüss
Seite 16 und 17: Abbildung 4: Taxonomie zeitlicher B
Seite 18 und 19: 4.6 Unusual MovementsBei unusual Mo
Seite 20 und 21: GSP-AlgorithmusF k = {häufige 1er-
Seite 22 und 23: F 4 = {(D ↦→ BF ↦→ A)[2]}Zu
Seite 24 und 25: Die Berechnung der 1er-Sequenzen er
Seite 26 und 27: ergänzt werden. Durch diese, anfan
Seite 28 und 29: Literatur[All83] J .F. Allen. Maint

Temporale Aspekte des Data Mining - diko-project.de

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?