30.01.2015 Aufrufe

pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...

pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...

pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

4.4.3. Auswahl von n-zu-m-Mappings<br />

Polygamie<br />

Bei den bisher vorgestellten Metriken handelt es sich nur um solche, die ein Element<br />

der einen Menge auf maximal ein Element der anderen Menge matchen. Das bezeichnet<br />

man als Monogamie. Nun kann es aber sein, dass auch Mappings erwünscht sind, die<br />

mehrere Elemente der einen Menge auf mehrere der anderen matchen können. In diesem<br />

Fall spricht man von Polygamie.<br />

Die polygame Variante des perfekten Matchings stellt das Outer Match dar. Dabei<br />

handelt es sich um ein minimales Matching, bei dem jedes Element von jedem Modell<br />

mindestens einen Partner hat.<br />

Bei Polygamie könnte zum ∑ Beispiel eine Teilmenge M i aus dem Multimapping gesucht<br />

werden, die die Funktion<br />

‖(x,)‖·‖(,y)‖<br />

maximiert, wobei ‖(x, ) <strong>und</strong> ‖(, y)‖ die Anzahl<br />

der Partner von einer Frau x <strong>und</strong> einem Mann y in M i darstellen.<br />

M i<br />

σ(x,y)<br />

Absolute <strong>und</strong> relative Ähnlichkeiten<br />

Absolute Ähnlichkeit liegt dann vor, wenn für ein Map Pair nur genau ein Ähnlichkeitswert<br />

zurückgegeben wird, wie es im Similarity Flooding Algorithmus der Fall ist. Sie ist<br />

symmetrisch, d.h. x ist genauso ähnlich zu y wie y zu x. Im Falle der Hochzeiten heißt<br />

das, dass Partner sich genau gleich mögen.<br />

Betrachtet man die Möglichkeit, dass die Ähnlichkeiten nicht symmetrisch sein müssen,<br />

es also durchaus vorkommen kann, dass in einem Hochzeitspaar der Mann die Frau<br />

lieber mag als umgekehrt, kommt man zu relativen Ähnlichkeiten. Relative Ähnlichkeiten<br />

sind asymmetrisch <strong>und</strong> werden berechnet, indem man das Verhältnis der absoluten<br />

Ähnlichkeitswerte der besten Match-Kandidaten berechnet.<br />

Verwendet man statt der absoluten Ähnlichkeitswerte relative, lässt sich das Multimapping<br />

als ein gerichteter, gewichteter, bipartiter Graph auffassen.<br />

Edit-Operationen<br />

Für einige Probleme bietet es sich an, die Zahl der Edit-Operationen, mit denen ein Teilgraph<br />

in einen anderen überführt werden kann, in die Auswahl-Metrik mit einzubeziehen.<br />

Edit-Operationen sind elementare Einfüge-, Lösch- oder Ersetzungs-Operationen. Durch<br />

Sequenzen solcher Operationen lassen sich zum Beispiel Wörter oder Graphen ineinander<br />

überführen.<br />

Ähnlichkeits-Thresholds<br />

Zur Auswahl geeigneter Wertpaare aus einer Menge von Ergebnispaaren (Multimapping)<br />

können als weiteres Kriterium Ähnlichkeits-Thresholds (Schwellwerte) verwendet<br />

werden. Legt man etwa einen Threshold von t abs = 0.5 fest, würden aus dem Multimapping<br />

nur noch die Map Pairs herausgefiltert werden, deren Ähnlichkeitswert größer bzw.<br />

größer oder gleich 0.5 ist. Ein solcher Threshold kann sowohl für absolute als auch für<br />

relative Ähnlichkeiten verwendet werden.<br />

30

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!