01.11.2013 Aufrufe

Data Mining von Sequenzdaten - Fachgebiet Datenbanken und ...

Data Mining von Sequenzdaten - Fachgebiet Datenbanken und ...

Data Mining von Sequenzdaten - Fachgebiet Datenbanken und ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

6 ERGEBNISSE 82<br />

Im Folgenden sollen nun die gef<strong>und</strong>enen, häufigen, maximalen partiellen Ordnungen<br />

(HMPO) betrachtet werden. Es ist zu prüfen, inwieweit die gef<strong>und</strong>enden Muster<br />

zusätzliche Informationen bezüglich den häufigen Studienverläufen liefern können. In<br />

Abbildung 46b sind diese Muster als Gesamtgraph dargestellt. Auf den ersten Blick sind<br />

die HMPO’s den sequentiellen Mustern sehr ähnlich. Die Ordnungsbeziehungen aus den<br />

HMPO’s können weitgehend auch aus dem Gesamtgraph der maximalen sequentiellen<br />

Mustern ableitet werden. Was anders ist, sind die HGPO’s mit der Kantenanzahl = 2<br />

bzw. mit drei Items. (siehe Abbildung 47).<br />

Abbildung 47: zwei HMPO’s mit der Kantelänge = 2<br />

Die linke HMPO kennzeichnet den häufigen Studienverlauf, dass zwischen den Prüfungsleistungen<br />

Einführung Betriebssysteme“ <strong>und</strong> Lineare Algebra A“ keine Ordnungsbeziehung<br />

besteht, während beide vor der Prüfungsleistung Analysis A“ ange-<br />

”<br />

” ”<br />

ordnet sind. D.h. es gibt einen häufigen Studienverlauf, bei dem Einführung Betriebssysteme“<br />

<strong>und</strong> Lineare Algebra A“ in beliebigen Semestern bestanden wurden, aber<br />

”<br />

”<br />

Analysis A“ auf jeden Fall in einem späteren Semester bestanden wurde als diese beiden<br />

Prüfungsleistungen. Ferner gibt uns die HMPO die Information, dass diese drei<br />

”<br />

Prüfungsleistungen gemeinsam in einem häufigem Studienverlauf vorkommen.<br />

Demnach konnten zwei zusätzliche Informationen aus dem linken HMPO gewonnen<br />

werden, welche aus der Menge der maximalen sequentiellen Mustern nicht ableitbar sind.<br />

Zwar kommen die Pfade einer HMPO in der Menge der maximalen sequentiellen Mustern<br />

(vgl. Beispiel 2.10) vor, aber trotzdem kann aus den maximalen sequentiellen Mustern<br />

nicht geschlossen werden, dass es sich um ein <strong>und</strong> denselben Studienverlauf handelt.<br />

Zum Beispiel besitzt die linke HMPO die folgenden Pfade: ”<br />

Einführung Betriebssysteme“<br />

→ ”<br />

Analysis A“ <strong>und</strong> ”<br />

Lineare Algebra A“ → ”<br />

Analysis A“. Diese Pfade sind<br />

zugleich zwei maximale sequentielle Muster, welche auch im Gesamtgraph vorkommen<br />

(siehe Abbildung 46a). Allerdings stellen sie innerhalb des Konzepts der sequentiellen<br />

Muster zwei verschiedene häufige Studienverläufe dar. Durch Anwendung des Konzepts<br />

der partiellen Ordnung, konnte die linke HMPO gef<strong>und</strong>en werden, die darüberhinaus<br />

zeigt, dass es sich um ein <strong>und</strong> denselben Studienverlauf handelt. Analog gilt die selbe<br />

Analyse für das rechte HMPO in Abbildung 47.<br />

Bei der Analyse der Gruppe bach0003 konnte tatsächlich gezeigt werden, dass das<br />

Konzept der partiellen Ordnungen die impliziten Ordnungsbeziehunngen durchaus besser<br />

abbilden kann als das Konzept der sequentiellen Muster. Allerdings sind sequentielle<br />

Muster für die Analyse <strong>von</strong> <strong>Sequenzdaten</strong> unverzichtbar, da sie die Gleichzeitigkeit der<br />

Items innerhalb eines Elementes, welche keine Ordnungsbeziehung darstellt, abbilden<br />

können. Daraus folgt, dass die gleichzeitige Anwendung der beiden Konzepte eine sehr

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!