2 GRUNDLAGEN 14 Abbildung 5: Darstellung der vier Sequenzen als Graphen Abbildung 6: Gesamtgraph aus den Sequenzen s 1 , s 2 , s 3 <strong>und</strong> s 4
2 GRUNDLAGEN 15 Fügt man nun diese vier Graphen zu einem einheitlichen Graph zusammen, erhält man den Gesamtgraph in der Abbildung 6. Es ist erkennbar, dass zwischen den Knoten a, b, c, d <strong>und</strong> e die Kantendichte besonders hoch ist. Weiterhin ist erkennbar, dass die Kanten a → b, a → e, b → e, c → e <strong>und</strong> d → e bei allen vier Sequenzen auftreten. Anders ausgedrückt: alle vier Sequenzen besitzen die Beziehung a vor b, a vor e, b vor e, c vor e <strong>und</strong> d vor e. In der Abbildung 7 sind diese gemeinsamen Beziehungen als separater Graph dargestellt. Aus dem Kontext heraus kann interpretiert werden, dass zum Beispiel ein Student zuerst das Fach a bestehen muss um das Fach b zu belegen bzw. um Fach e zu belegen muss ein Student die bestandenen Fächer a, b, c, <strong>und</strong> d vorweisen können. Abbildung 7: Gemeinsame Beziehungen der vier Sequenzen s 1 , s 2 , s 3 <strong>und</strong> s 4 Das Beispiel zeigt, dass man die impliziten Beziehungen zwischen den Sequenzen bei Betrachtung der Sequenzen nicht sofort erkennen kann. Weiterhin kann beobachtet werden, dass alle Pfade des Graphen aus Abbildung 7 Teilsequenzen <strong>von</strong> allen Sequenzen in der <strong>Sequenzdaten</strong>bank sind. Der Graph stellt also eine Zusammenfassung der sequentiellen Muster mit Support = 4 dar. Im Folgenden wird u.a. gezeigt, dass der Graph aus Abbildung 7 eine partielle Ordnung darstellt. Gr<strong>und</strong>legende Begriffe Definition 2.11 (Partielle Ordnung). Eine partielle Ordnung R über eine Gr<strong>und</strong>menge M ist eine binäre Beziehung, welche reflexiv, antisymmetrisch <strong>und</strong> transitiv ist. Definition 2.12 (Totale Ordnung). Eine totale Ordnung ist eine partielle Ordnung R für die folgendes gilt: Für je zwei beliebige Elemente x <strong>und</strong> y in M mit x ≠ y ist entweder die Beziehung R(x, y) oder die Beziehung R(y, x) erfüllt. Definition 2.13 (Darstellung als Graph). Eine partielle Ordnung R lässt sich als gerichteter, azyklischer Graph darstellen. Dabei sind die Elemente <strong>von</strong> M die Knoten <strong>und</strong> x → y eine Kante des Graphen, wenn (x, y) ∈ R <strong>und</strong> x ≠ y gilt. Eine Kante x → y wird mit xy abgekürzt.