pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...
pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...
pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
(etwa OLA oder Microsoft BizTalk Mapper) oder Varianten bestehender Verfahren (z.B.<br />
NOM ) entstanden ([SE05]), stellte [Gal06] 2006 fest, dass sich trotz intensiver Forschung<br />
bislang keines der entwickelten Schema-Matching-Verfahren durchgesetzt hat. Stattdessen<br />
würden immer noch ad-hoc-Lösungen eingesetzt, obwohl das Ziel der Matching-<br />
Verfahren eigentlich ja genau die Vermeidung solcher Lösungen sein sollte.<br />
Neben den „klassischen“ Verfahren zum Matching von Schemata wurden vor allem<br />
in den letzten knapp 12 Jahren vermehrt Verfahren zum Matchen von Ontologien verwendet.<br />
[Rah11] nennt hier unter anderem Falcon <strong>und</strong> Rimom aus dem Jahr 2006 <strong>und</strong><br />
Harmony, erstmals vorgestellt 2008.<br />
Trotz vieler Fortschritte, die bei der Entwicklung von Schema-Matching-Verfahren in<br />
den vorangegangenen Jahren gemacht wurden, bescheinigte [Rah11] diesen 2011 immer<br />
noch Schwierigkeiten bei large-scale-Matchings, also Matchings in großem Umfang <strong>und</strong><br />
mit großen Datenmengen. So würden nach wie vor näherungsweise Mappings ermittelt<br />
werden können, Anpassungen durch menschliche Experten wären nach wie vor nötig <strong>und</strong><br />
das Problem, gute Effektivität bei gleichzeitig guter Effizienz zu erreichen, wäre immer<br />
noch nicht gelöst.<br />
3.2. Klassifizierung von Matching-Verfahren<br />
Da die Zahl von Matching-Verfahren stetig wächst, ist es sinnvoll, diese in bestimmte<br />
Kategorien einzuteilen, um den Überblick behalten zu können. In der Literatur wurde<br />
in [RB01] eine solche Klassifizierung vorgenommen, die in [SE05] in Teilen verändert<br />
<strong>und</strong> erweitert wurde. Diese Klassifizierungen sollen in diesem Abschnitt kurz erläutert<br />
werden. Da der Fokus dieser Arbeit auf dem Graph-Matching liegt, soll dabei insbesondere<br />
darauf eingegangen werden, an welcher Stelle sich dieses in den Kontext der<br />
Schema-Matching-Verfahren einordnen lässt.<br />
In [RB01] wird zunächst zwischen individuellen <strong>und</strong> kombinierten Matching-Ansätzen<br />
(auch als Matcher bezeichnet) unterschieden. Individuelle Ansätze verwenden ein einzelnes<br />
Kriterium für das Matching. Sie können entweder ausschließlich schema-basiert<br />
oder instanz-/inhalts-basiert sein. Kombinierte Matcher können entweder mehrere Ansätze<br />
zusammenfassen <strong>und</strong> anhand mehrerer Kriterien ihr Matching durchführen (hybride<br />
Matcher) oder die Ergebnisse mehrerer verschiedener Ansätze zusammenfassen<br />
(Komposition).<br />
Graph-Matching-Verfahren werden dabei den individuellen Matchern <strong>und</strong> dort den<br />
ausschließlich schema-basierten zugeordnet. Im Normalfall werden keinerlei Daten für<br />
das Matching benötigt, sondern lediglich Informationen aus den Schemata. Das Similarity<br />
Flooding, das in dieser Arbeit besonders intensiv betrachtet werden soll, kann<br />
dabei in gewissem Sinne als Ausnahme betrachtet werden, denn dabei wird für das Matching<br />
selbst zwar ausschließlich die Struktur der Schemata herangezogen, in der Vorverarbeitungsphase<br />
sind aber auch weitere Kriterien möglich, die eventuell andere Daten<br />
benötigen (wie zum Beispiel Wörterbücher oder Thesauri).<br />
Auf der nächst-niedrigeren, detaillierteren Ebene unterscheidet man bei den ausschließlich<br />
schema-basierten Matchern zwischen Element-Ebene <strong>und</strong> Struktur-Ebene. Auf<br />
11