12.07.2015 Aufrufe

Temporale Aspekte des Data Mining - diko-project.de

Temporale Aspekte des Data Mining - diko-project.de

Temporale Aspekte des Data Mining - diko-project.de

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Abbildung 7: SPADE: Erstellung <strong>de</strong>r Subsequenzen [Zak97]o<strong>de</strong>r{(AB), (AD), (AF )}{(A ↦→ A), (A ↦→ B), (A ↦→ D), (A ↦→ F )} (30)Die Auflösung von A ↦→ [ABDF ] ist in (30) zu sehen. In <strong>de</strong>r nächsten Zeile stehennun alle 2er-Sequenzen, die jetzt nach <strong>de</strong>m selben Prinzip wie bei <strong>de</strong>n 1er-Sequenzenwie<strong>de</strong>r neu bezeichnet wer<strong>de</strong>n. Diese Blöcke dienen dann wie<strong>de</strong>rum als Quelle fürdie 3er-Sequenzen. Dieser Vorgang wird so lange wie<strong>de</strong>rholt bis alle Subsequenzenerstellt sind. Es gibt dann ein Gitter mit allen möglichen Subsequenzen.Das horizontale Schema <strong><strong>de</strong>s</strong> GSP benutzt eine Relation mit Kun<strong>de</strong>nbezeichner (cid),Transaktionsbezeichner (tid) und <strong>de</strong>n Items selbst (siehe Abbildung 1). SPADE verwen<strong>de</strong>tim Gegensatz dazu ein vertikales Datenbankschema. Hier wer<strong>de</strong>n je<strong>de</strong>m Item<strong>de</strong>r Kun<strong>de</strong>nbezeichner und <strong>de</strong>r Transaktionsbezeichner zugewiesen. Es han<strong>de</strong>lt sichdabei um die so genante ctid-Liste.Im Folgen<strong>de</strong>n wird nun für je<strong>de</strong> Sequenz solch eine Liste angelegt. Darüber hinausgehört zu je<strong>de</strong>r Sequenz ein Array mit <strong>de</strong>n Items dieser Sequzenz, ihre Unterstützungin Form eines Zählers und ein Integerwert, <strong>de</strong>r ihr Sequenz-Template bestimmt. Miteinem Bit-Wert wer<strong>de</strong>n in diesem Template die Relationen zwischen <strong>de</strong>n einzelnenItems vermerkt, 0 steht für keine Relation, entsprechend 1 für eine Relation. Damitlassen sich binäre Werte wie 111 ermitteln. Letzterer Wert steht für drei aufeinan<strong>de</strong>rfolgen<strong>de</strong> Relationen innerhalb einer Sequenz.23

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!