01.11.2013 Aufrufe

Data Mining von Sequenzdaten - Fachgebiet Datenbanken und ...

Data Mining von Sequenzdaten - Fachgebiet Datenbanken und ...

Data Mining von Sequenzdaten - Fachgebiet Datenbanken und ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

3 ALGORITHMEN 37<br />

Die anderen häufigen, geschlossenen partiellen Ordnungen in der transitiven Reduktion<br />

können, entsprechend der alphabetischen Reihenfolge der restlichen global passenden<br />

Kanten (ac, bc, bd, cb, cd, da <strong>und</strong> dc), in folgende Teilmengen partitioniert werden: (1)<br />

diejenigen mit der Kante ac in der transitiven Reduktion; (2) diejenigen mit der Kante<br />

bc aber keiner Kante ac in der transitiven Reduktion; · · · ; <strong>und</strong> diejenigen mit der Kante<br />

dc aber keiner anderen Kanten in der transitiven Reduktion. Diese Teilmengen können<br />

in Form einer Tiefensuche durchlaufen werden.<br />

sid Sequenz<br />

1 abcde<br />

2 acbde<br />

3 dabce<br />

Tabelle 19: (R 1 ∪ {ac})-projizierte Datenbank S| R1 ∪{ac}<br />

Zum Beispiel wird zuerst die Teilmenge der häufigen, geschlossenen partiellen Ordnungen<br />

mit der Kante ac in der transitiven Reduktion durchsucht. Sie beinhalten alle<br />

R 1 . Um die (R 1 ∪ {ac})-projizierte Datenbank zu generieren, werden alle Sequenzen in<br />

S gesammelt, die Obersequenzen <strong>von</strong> ac sind. In der <strong>Sequenzdaten</strong>bank S sind es die<br />

Sequenzen 1, 2 <strong>und</strong> 3. Nach dem Prunen der nicht häufigen Items in der (R 1 ∪ {ac})-<br />

projizierten Datenbank (siehe Abbildung 19) kann folgende Detektionsmatrix erzeugt<br />

werden:<br />

a b c d e<br />

a 3, ∅ 3, ∅ 2, {b, c} 3, {b, c}<br />

b 0, ∅ 2, ∅ 2, ∅ 3, ∅<br />

c 0, ∅ 1, ∅ 2, ∅ 3, ∅<br />

d 1, ∅ 1, {a} 1, ∅ 3, ∅<br />

e 0, ∅ 0, ∅ 0, ∅ 0, ∅<br />

Tabelle 20: Detektionsmatrix <strong>von</strong> S| R1 ∪{ac}<br />

Die lokal passenden Kanten in S| R1 ∪{ac} mit Support = |S| R1 ∪{ac}| werden als häufige,<br />

geschlossenen partielle Ordnung R 2 = R 1 ∪ {ac} = {ab, ac, be, ce, de} identifiziert.<br />

Alle anderen häufigen, geschlossenen partiellen Ordnungen mit der Kante ac in der transitiven<br />

Reduktion müssen stärker als R 2 sein <strong>und</strong> können entsprechend den restlichen<br />

lokal passenden Kanten in folgende drei Teilmengen partitioniert werden: (1) diejenigen<br />

mit den Kanten ac <strong>und</strong> bc, (2) diejeinigen mit den Kanten ac <strong>und</strong> bd aber nicht die<br />

Kante bc, <strong>und</strong> (3) diejenigen mit den Kanten ac <strong>und</strong> cd aber weder die Kante bc noch<br />

bd in ihrer transitiven Reduktion.<br />

Betrachtet werden soll die Teilmenge (1) <strong>von</strong> R 2 . R 2 hat die Kante ab in der transitiven<br />

Reduktion <strong>und</strong> jede häufige, geschlossene partielle Ordnung mit der Kante ac ist eine<br />

Obermenge <strong>von</strong> R 2 . Es ist erkennbar, dass ab, ac <strong>und</strong> bc nicht innerhalb der selben<br />

transitiven Reduktion vorkommen können, da in diesem Fall die Kante ac transitiv

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!