pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...
pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...
pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
nicht verwendet, um die Anzahl der Iterationen, die bis zum Fixpunkt bei den einzelnen<br />
Testdurchläufen benötigt wurden, besser vergleichen zu können.<br />
Für die beiden zu überprüfenden Aspekte – die Auswirkung der Anfangsähnlichkeiten<br />
<strong>und</strong> die Verwendung einer anderen Fixpunktformel – wurden verschiedene Einstellungen<br />
(im Folgenden auch als „Fälle“ bezeichnet) festgelegt. Der Similarity Flooding Algorithmus<br />
wurde für jeden Graphen nacheinander mit diesen Fällen durchgeführt, sodass die<br />
Ergebnisse der einzelnen Fälle vergleichbar für mehrere Graphen sind. Eine genaue Beschreibung<br />
der jeweiligen Fälle ist zu Beginn der jeweiligen Kapitel (Kapitel 7.2.2 <strong>und</strong><br />
Kapitel 7.2.3) zu finden.<br />
Zu den jeweiligen Fällen wurde die Anzahl der Iterationen, bis ein Fixpunkt erreicht<br />
wurde, <strong>und</strong> die Ergebnisse der Ähnlichkeitsberechnungen nach jeder Iteration (einschließlich<br />
der Ähnlichkeitswerte im Fixpunkt nach der letzten Iteration) festgehalten. Dadurch<br />
lässt sich die Entwicklung der (normierten) Werte über die Iterationen hinweg analysieren<br />
<strong>und</strong> vergleichen.<br />
Nach Einstellen des Fixpunktes wurde die Ergebnismenge für jeden Fall außerdem<br />
mit Hilfe eines Stable Marriage Algorithmus (vgl. Kapitel 4.4.2) gefiltert. Dadurch ist<br />
insbesondere bei den größeren Graphen eine bessere Vergleichbarkeit der Ergebnisse<br />
gewährleistet <strong>und</strong> es lässt sich leichter ablesen, ob das Filtern der Ergebnisse sinnvolle<br />
Matching-Kandidaten liefert oder nicht.<br />
Verwendete Graphen<br />
Für die Experimente in diesem Kapitel wurden zunächst eine Reihe von Graphen erzeugt,<br />
auf deren strukturelles Aussehen <strong>und</strong> den Hintergr<strong>und</strong>, aus dem sie in den Tests<br />
verwendet werden, hier kurz eingegangen werden soll. Die Graphen bestehen dabei jeweils<br />
aus zwei Modellen, deren Abbildungen in Anhang A zu finden sind. Dort sind auch<br />
die Pairwise Connectivity Graphs (PCG) zu den Modellen abgebildet.<br />
Die Modelle von Graph 1 entsprechen denen, die im Beispiel in [MGMR01] verwendet<br />
wurden. Der PCG ist entsprechend ebenfalls dort zu finden. Für die hier durchgeführten<br />
Experimente wurde der Graph gewählt, um zum einen die in der Literatur ermittelten<br />
Fixpunkt-Werte nachzuvollziehen, <strong>und</strong> zum anderen, weil aufgr<strong>und</strong> der ähnlichen<br />
Strukturen der Modelle bestimmte Matching-Kandidaten wahrscheinlicher erscheinen<br />
als andere (z.B. erscheint (a, b) aufgr<strong>und</strong> der Anzahl ein- <strong>und</strong> ausgehender Kanten in<br />
den Modellen als Kandidat wahrscheinlicher als (a 1 , b)). Hier ist in den Experimenten<br />
insbesondere interessant zu überprüfen, ob trotzdem Fixpunkte mit unterschiedlichen<br />
Top-Kandidaten für Matchings erreicht werden können oder nicht.<br />
Graph 2 wurde ebenfalls aus [MGMR01] entnommen. Beide Modelle stellen dabei<br />
Bäume dar. Modell B ist dabei aus Modell A entstanden, indem die Knoten neu markiert<br />
wurden, zwei Teilbäume kopiert bzw. verschoben <strong>und</strong> ein neuer Knoten (60) eingefügt<br />
wurde. Der Graph ist für die Experimente interessant, weil bekannt ist, welche Knoten<br />
im Modell A welchen Knoten in Modell B entsprechen, sodass auch hier bestimmte Erwartungen<br />
vorhanden sind, welche Matching-Kandidaten der Algorithmus liefern sollte<br />
(z.B. (4, 55)) <strong>und</strong> welche nicht (z.B. (1, 57)). Die erwarteten Matching-Kandidaten sind<br />
im PCG in Anhang A grau markiert.<br />
46