pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...
pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...
pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Einstellen niedriger Anfangsähnlichkeiten für dieses Paar erreichen, sondern höchstens<br />
durch anschließendes Filtern der Ergebnisse.<br />
Anders verhält es sich mit Fixpunktformel A. Hier ist der Einfluss der Anfangsähnlichkeiten<br />
deutlich größer, der Einfluss der Struktur auf die Ergebnismenge deutlich<br />
geringer. Während man mit der Basis-Fixpunktformel auf eine Vorverarbeitung gänzlich<br />
verzichten kann, ist sie bei Fixpunktformel A notwendiger <strong>und</strong> nützlicher Bestandteil.<br />
Das eröffnet im Anwendungsfall deutlich mehr Möglichkeiten, denn im Gegensatz zur<br />
Basis-Fixpunktformel lassen sich die Fixpunkte durch die Anfangsähnlichkeiten beeinflussen.<br />
Das Similarity Flooding ist mit Fixpunktformel A somit wesentlich flexibler <strong>und</strong> praktikabler<br />
einsetzbar als mit der Basis-Fixpunktformel. Möchte man bestimmte Knotenpaare<br />
im Ergebnis „begünstigen“, kann man das durch Einstellungen an den Anfangsähnlichkeiten<br />
erreichen. Auch wenn man hier strukturell sehr unähnliche Knotenpaare<br />
durch hohe Anfangswerte begünstigt, schafft es der Algorithmus, einen Fixpunkt zu<br />
erreichen, der in Abhängigkeit davon andere Matching-Kandidaten vorschlägt.<br />
Über die Qualität der Fixpunkte, die sich mit der Fixpunktformel A <strong>und</strong> veränderten<br />
Anfangsähnlichkeiten einstellen, kann anhand der in diesem Kapitel verwendeten<br />
Graphen wenig gesagt werden. Auch wenn es – wie etwa bei Graph 6 – Erwartungen gegeben<br />
hat, welche Knotenpaare bezüglich ihrer Struktur mit hohen Ähnlichkeitswerten<br />
im Ergebnis auftreten müssten, reicht das nicht aus, um allgemein von „schlechten“ Ergebnissen<br />
zu sprechen, wenn durch Ändern der Anfangsähnlichkeiten andere Matching-<br />
Kandidaten vorgeschlagen werden. Schließlich möchte man durch diese Änderung das<br />
Ergebnis beeinflussen, sodass es durchaus denkbar ist, dass die Matching-Kandidaten,<br />
die sich daraus ergeben, im konkreten Anwendungsfall bessere Kandidaten sind als die,<br />
die sich rein von der Struktur ergeben hätte.<br />
Um die Qualität besser beurteilen zu können, sind Tests an konkreten Anwendungsfällen<br />
nötig, wie sie im folgenden Abschnitt durchgeführt werden sollen.<br />
7.3. Experimente an Relationalen Datenbankschemata<br />
Nachdem es in Kapitel 7.2 im Wesentlichen darum ging, die Arbeitsweise des Similarity<br />
Flooding <strong>und</strong> die Auswirkungen, die die Wahl der Fixpunktformel <strong>und</strong> die Festlegung<br />
der Anfangsähnlichkeiten auf das Verfahren haben, näher zu beleuchten, soll in diesem<br />
Kapitel die Qualität der Ergebnisse, die das Similarity Flooding liefert, im Vordergr<strong>und</strong><br />
stehen. Wie bereits angedeutet, lassen sich anhand von Graphen nur bedingt Aussagen<br />
über die Qualität des Verfahrens treffen. Aus diesem Gr<strong>und</strong> soll das Similarity Flooding<br />
in den folgenden Abschnitten auf konkrete Relationale Datenbankschemata angewandt<br />
werden, um dazu Aussagen treffen zu können.<br />
7.3.1. Experimentaufbau<br />
Auch wenn die Experimente in diesem Kapitel ähnlich ablaufen wie in Kapitel 7.2, gibt es<br />
einige wesentliche Unterschiede, auf die in den folgenden Abschnitten näher eingegangen<br />
werden soll.<br />
63