Data Mining von Sequenzdaten - Fachgebiet Datenbanken und ...
Data Mining von Sequenzdaten - Fachgebiet Datenbanken und ...
Data Mining von Sequenzdaten - Fachgebiet Datenbanken und ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
3 ALGORITHMEN 37<br />
Die anderen häufigen, geschlossenen partiellen Ordnungen in der transitiven Reduktion<br />
können, entsprechend der alphabetischen Reihenfolge der restlichen global passenden<br />
Kanten (ac, bc, bd, cb, cd, da <strong>und</strong> dc), in folgende Teilmengen partitioniert werden: (1)<br />
diejenigen mit der Kante ac in der transitiven Reduktion; (2) diejenigen mit der Kante<br />
bc aber keiner Kante ac in der transitiven Reduktion; · · · ; <strong>und</strong> diejenigen mit der Kante<br />
dc aber keiner anderen Kanten in der transitiven Reduktion. Diese Teilmengen können<br />
in Form einer Tiefensuche durchlaufen werden.<br />
sid Sequenz<br />
1 abcde<br />
2 acbde<br />
3 dabce<br />
Tabelle 19: (R 1 ∪ {ac})-projizierte Datenbank S| R1 ∪{ac}<br />
Zum Beispiel wird zuerst die Teilmenge der häufigen, geschlossenen partiellen Ordnungen<br />
mit der Kante ac in der transitiven Reduktion durchsucht. Sie beinhalten alle<br />
R 1 . Um die (R 1 ∪ {ac})-projizierte Datenbank zu generieren, werden alle Sequenzen in<br />
S gesammelt, die Obersequenzen <strong>von</strong> ac sind. In der <strong>Sequenzdaten</strong>bank S sind es die<br />
Sequenzen 1, 2 <strong>und</strong> 3. Nach dem Prunen der nicht häufigen Items in der (R 1 ∪ {ac})-<br />
projizierten Datenbank (siehe Abbildung 19) kann folgende Detektionsmatrix erzeugt<br />
werden:<br />
a b c d e<br />
a 3, ∅ 3, ∅ 2, {b, c} 3, {b, c}<br />
b 0, ∅ 2, ∅ 2, ∅ 3, ∅<br />
c 0, ∅ 1, ∅ 2, ∅ 3, ∅<br />
d 1, ∅ 1, {a} 1, ∅ 3, ∅<br />
e 0, ∅ 0, ∅ 0, ∅ 0, ∅<br />
Tabelle 20: Detektionsmatrix <strong>von</strong> S| R1 ∪{ac}<br />
Die lokal passenden Kanten in S| R1 ∪{ac} mit Support = |S| R1 ∪{ac}| werden als häufige,<br />
geschlossenen partielle Ordnung R 2 = R 1 ∪ {ac} = {ab, ac, be, ce, de} identifiziert.<br />
Alle anderen häufigen, geschlossenen partiellen Ordnungen mit der Kante ac in der transitiven<br />
Reduktion müssen stärker als R 2 sein <strong>und</strong> können entsprechend den restlichen<br />
lokal passenden Kanten in folgende drei Teilmengen partitioniert werden: (1) diejenigen<br />
mit den Kanten ac <strong>und</strong> bc, (2) diejeinigen mit den Kanten ac <strong>und</strong> bd aber nicht die<br />
Kante bc, <strong>und</strong> (3) diejenigen mit den Kanten ac <strong>und</strong> cd aber weder die Kante bc noch<br />
bd in ihrer transitiven Reduktion.<br />
Betrachtet werden soll die Teilmenge (1) <strong>von</strong> R 2 . R 2 hat die Kante ab in der transitiven<br />
Reduktion <strong>und</strong> jede häufige, geschlossene partielle Ordnung mit der Kante ac ist eine<br />
Obermenge <strong>von</strong> R 2 . Es ist erkennbar, dass ab, ac <strong>und</strong> bc nicht innerhalb der selben<br />
transitiven Reduktion vorkommen können, da in diesem Fall die Kante ac transitiv