30.01.2015 Aufrufe

pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...

pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...

pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Einstellen niedriger Anfangsähnlichkeiten für dieses Paar erreichen, sondern höchstens<br />

durch anschließendes Filtern der Ergebnisse.<br />

Anders verhält es sich mit Fixpunktformel A. Hier ist der Einfluss der Anfangsähnlichkeiten<br />

deutlich größer, der Einfluss der Struktur auf die Ergebnismenge deutlich<br />

geringer. Während man mit der Basis-Fixpunktformel auf eine Vorverarbeitung gänzlich<br />

verzichten kann, ist sie bei Fixpunktformel A notwendiger <strong>und</strong> nützlicher Bestandteil.<br />

Das eröffnet im Anwendungsfall deutlich mehr Möglichkeiten, denn im Gegensatz zur<br />

Basis-Fixpunktformel lassen sich die Fixpunkte durch die Anfangsähnlichkeiten beeinflussen.<br />

Das Similarity Flooding ist mit Fixpunktformel A somit wesentlich flexibler <strong>und</strong> praktikabler<br />

einsetzbar als mit der Basis-Fixpunktformel. Möchte man bestimmte Knotenpaare<br />

im Ergebnis „begünstigen“, kann man das durch Einstellungen an den Anfangsähnlichkeiten<br />

erreichen. Auch wenn man hier strukturell sehr unähnliche Knotenpaare<br />

durch hohe Anfangswerte begünstigt, schafft es der Algorithmus, einen Fixpunkt zu<br />

erreichen, der in Abhängigkeit davon andere Matching-Kandidaten vorschlägt.<br />

Über die Qualität der Fixpunkte, die sich mit der Fixpunktformel A <strong>und</strong> veränderten<br />

Anfangsähnlichkeiten einstellen, kann anhand der in diesem Kapitel verwendeten<br />

Graphen wenig gesagt werden. Auch wenn es – wie etwa bei Graph 6 – Erwartungen gegeben<br />

hat, welche Knotenpaare bezüglich ihrer Struktur mit hohen Ähnlichkeitswerten<br />

im Ergebnis auftreten müssten, reicht das nicht aus, um allgemein von „schlechten“ Ergebnissen<br />

zu sprechen, wenn durch Ändern der Anfangsähnlichkeiten andere Matching-<br />

Kandidaten vorgeschlagen werden. Schließlich möchte man durch diese Änderung das<br />

Ergebnis beeinflussen, sodass es durchaus denkbar ist, dass die Matching-Kandidaten,<br />

die sich daraus ergeben, im konkreten Anwendungsfall bessere Kandidaten sind als die,<br />

die sich rein von der Struktur ergeben hätte.<br />

Um die Qualität besser beurteilen zu können, sind Tests an konkreten Anwendungsfällen<br />

nötig, wie sie im folgenden Abschnitt durchgeführt werden sollen.<br />

7.3. Experimente an Relationalen Datenbankschemata<br />

Nachdem es in Kapitel 7.2 im Wesentlichen darum ging, die Arbeitsweise des Similarity<br />

Flooding <strong>und</strong> die Auswirkungen, die die Wahl der Fixpunktformel <strong>und</strong> die Festlegung<br />

der Anfangsähnlichkeiten auf das Verfahren haben, näher zu beleuchten, soll in diesem<br />

Kapitel die Qualität der Ergebnisse, die das Similarity Flooding liefert, im Vordergr<strong>und</strong><br />

stehen. Wie bereits angedeutet, lassen sich anhand von Graphen nur bedingt Aussagen<br />

über die Qualität des Verfahrens treffen. Aus diesem Gr<strong>und</strong> soll das Similarity Flooding<br />

in den folgenden Abschnitten auf konkrete Relationale Datenbankschemata angewandt<br />

werden, um dazu Aussagen treffen zu können.<br />

7.3.1. Experimentaufbau<br />

Auch wenn die Experimente in diesem Kapitel ähnlich ablaufen wie in Kapitel 7.2, gibt es<br />

einige wesentliche Unterschiede, auf die in den folgenden Abschnitten näher eingegangen<br />

werden soll.<br />

63

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!