pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...
pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...
pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
durch Festlegen von Anfangsähnlichkeiten zu beeinflussen, verloren geht, ist das mit der<br />
Fixpunktformel A möglich.<br />
Um die Qualität der Ergebnisse, die das Similarity Flooding liefert, an realen Beispielen<br />
zu überprüfen, wurden in Kapitel 7.3 Relationale Datenbankschemata als Eingabe für<br />
weitere Experimente verwendet. Hier hat sich gezeigt, dass ohne eine Vorverarbeitungsphase<br />
bei Verwendung der Fixpunktformel A keine guten Ergebnisse geliefert werden<br />
(vgl. Kapitel 7.3.2). Durch eine automatisierte Vorverarbeitung konnten in Kapitel 7.3.3<br />
bessere, wenn auch nach wie vor nicht optimale, Ergebnisse erzielt werden. Manuelle<br />
Anpassungen der vorberechneten Anfangsähnlichkeitswerte, wie sie in Kapitel 7.3.4<br />
vorgenommen wurden, konnten die Ergebnisse meist noch weiter verbessern, erfordern<br />
aber Kenntnisse über die Schemata bzw. die Domäne, in der sie angesiedelt sind, die<br />
nicht in jedem Fall wie in den hier verwendeten Beispielen allein anhand der Namen von<br />
Relationen <strong>und</strong> Attributen erkennbar sind.<br />
Die besten Resultate konnten in Kapitel 7.3.5 dadurch erzielt werden, dass aus den<br />
Ergebnissen des Ablauf des Similarity Flooding bestimmte Matching-Kandidaten gewählt<br />
<strong>und</strong> das Verfahren erneut ausgeführt wurde. Die Auswahl der Kandidaten muss<br />
dabei allerdings wie in Kapitel 7.3.4 manuell passieren, was Kenntnisse über die Domäne<br />
voraussetzt.<br />
73