pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...
pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...
pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
4.4.3. Auswahl von n-zu-m-Mappings<br />
Polygamie<br />
Bei den bisher vorgestellten Metriken handelt es sich nur um solche, die ein Element<br />
der einen Menge auf maximal ein Element der anderen Menge matchen. Das bezeichnet<br />
man als Monogamie. Nun kann es aber sein, dass auch Mappings erwünscht sind, die<br />
mehrere Elemente der einen Menge auf mehrere der anderen matchen können. In diesem<br />
Fall spricht man von Polygamie.<br />
Die polygame Variante des perfekten Matchings stellt das Outer Match dar. Dabei<br />
handelt es sich um ein minimales Matching, bei dem jedes Element von jedem Modell<br />
mindestens einen Partner hat.<br />
Bei Polygamie könnte zum ∑ Beispiel eine Teilmenge M i aus dem Multimapping gesucht<br />
werden, die die Funktion<br />
‖(x,)‖·‖(,y)‖<br />
maximiert, wobei ‖(x, ) <strong>und</strong> ‖(, y)‖ die Anzahl<br />
der Partner von einer Frau x <strong>und</strong> einem Mann y in M i darstellen.<br />
M i<br />
σ(x,y)<br />
Absolute <strong>und</strong> relative Ähnlichkeiten<br />
Absolute Ähnlichkeit liegt dann vor, wenn für ein Map Pair nur genau ein Ähnlichkeitswert<br />
zurückgegeben wird, wie es im Similarity Flooding Algorithmus der Fall ist. Sie ist<br />
symmetrisch, d.h. x ist genauso ähnlich zu y wie y zu x. Im Falle der Hochzeiten heißt<br />
das, dass Partner sich genau gleich mögen.<br />
Betrachtet man die Möglichkeit, dass die Ähnlichkeiten nicht symmetrisch sein müssen,<br />
es also durchaus vorkommen kann, dass in einem Hochzeitspaar der Mann die Frau<br />
lieber mag als umgekehrt, kommt man zu relativen Ähnlichkeiten. Relative Ähnlichkeiten<br />
sind asymmetrisch <strong>und</strong> werden berechnet, indem man das Verhältnis der absoluten<br />
Ähnlichkeitswerte der besten Match-Kandidaten berechnet.<br />
Verwendet man statt der absoluten Ähnlichkeitswerte relative, lässt sich das Multimapping<br />
als ein gerichteter, gewichteter, bipartiter Graph auffassen.<br />
Edit-Operationen<br />
Für einige Probleme bietet es sich an, die Zahl der Edit-Operationen, mit denen ein Teilgraph<br />
in einen anderen überführt werden kann, in die Auswahl-Metrik mit einzubeziehen.<br />
Edit-Operationen sind elementare Einfüge-, Lösch- oder Ersetzungs-Operationen. Durch<br />
Sequenzen solcher Operationen lassen sich zum Beispiel Wörter oder Graphen ineinander<br />
überführen.<br />
Ähnlichkeits-Thresholds<br />
Zur Auswahl geeigneter Wertpaare aus einer Menge von Ergebnispaaren (Multimapping)<br />
können als weiteres Kriterium Ähnlichkeits-Thresholds (Schwellwerte) verwendet<br />
werden. Legt man etwa einen Threshold von t abs = 0.5 fest, würden aus dem Multimapping<br />
nur noch die Map Pairs herausgefiltert werden, deren Ähnlichkeitswert größer bzw.<br />
größer oder gleich 0.5 ist. Ein solcher Threshold kann sowohl für absolute als auch für<br />
relative Ähnlichkeiten verwendet werden.<br />
30