30.01.2015 Aufrufe

pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...

pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...

pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

(etwa OLA oder Microsoft BizTalk Mapper) oder Varianten bestehender Verfahren (z.B.<br />

NOM ) entstanden ([SE05]), stellte [Gal06] 2006 fest, dass sich trotz intensiver Forschung<br />

bislang keines der entwickelten Schema-Matching-Verfahren durchgesetzt hat. Stattdessen<br />

würden immer noch ad-hoc-Lösungen eingesetzt, obwohl das Ziel der Matching-<br />

Verfahren eigentlich ja genau die Vermeidung solcher Lösungen sein sollte.<br />

Neben den „klassischen“ Verfahren zum Matching von Schemata wurden vor allem<br />

in den letzten knapp 12 Jahren vermehrt Verfahren zum Matchen von Ontologien verwendet.<br />

[Rah11] nennt hier unter anderem Falcon <strong>und</strong> Rimom aus dem Jahr 2006 <strong>und</strong><br />

Harmony, erstmals vorgestellt 2008.<br />

Trotz vieler Fortschritte, die bei der Entwicklung von Schema-Matching-Verfahren in<br />

den vorangegangenen Jahren gemacht wurden, bescheinigte [Rah11] diesen 2011 immer<br />

noch Schwierigkeiten bei large-scale-Matchings, also Matchings in großem Umfang <strong>und</strong><br />

mit großen Datenmengen. So würden nach wie vor näherungsweise Mappings ermittelt<br />

werden können, Anpassungen durch menschliche Experten wären nach wie vor nötig <strong>und</strong><br />

das Problem, gute Effektivität bei gleichzeitig guter Effizienz zu erreichen, wäre immer<br />

noch nicht gelöst.<br />

3.2. Klassifizierung von Matching-Verfahren<br />

Da die Zahl von Matching-Verfahren stetig wächst, ist es sinnvoll, diese in bestimmte<br />

Kategorien einzuteilen, um den Überblick behalten zu können. In der Literatur wurde<br />

in [RB01] eine solche Klassifizierung vorgenommen, die in [SE05] in Teilen verändert<br />

<strong>und</strong> erweitert wurde. Diese Klassifizierungen sollen in diesem Abschnitt kurz erläutert<br />

werden. Da der Fokus dieser Arbeit auf dem Graph-Matching liegt, soll dabei insbesondere<br />

darauf eingegangen werden, an welcher Stelle sich dieses in den Kontext der<br />

Schema-Matching-Verfahren einordnen lässt.<br />

In [RB01] wird zunächst zwischen individuellen <strong>und</strong> kombinierten Matching-Ansätzen<br />

(auch als Matcher bezeichnet) unterschieden. Individuelle Ansätze verwenden ein einzelnes<br />

Kriterium für das Matching. Sie können entweder ausschließlich schema-basiert<br />

oder instanz-/inhalts-basiert sein. Kombinierte Matcher können entweder mehrere Ansätze<br />

zusammenfassen <strong>und</strong> anhand mehrerer Kriterien ihr Matching durchführen (hybride<br />

Matcher) oder die Ergebnisse mehrerer verschiedener Ansätze zusammenfassen<br />

(Komposition).<br />

Graph-Matching-Verfahren werden dabei den individuellen Matchern <strong>und</strong> dort den<br />

ausschließlich schema-basierten zugeordnet. Im Normalfall werden keinerlei Daten für<br />

das Matching benötigt, sondern lediglich Informationen aus den Schemata. Das Similarity<br />

Flooding, das in dieser Arbeit besonders intensiv betrachtet werden soll, kann<br />

dabei in gewissem Sinne als Ausnahme betrachtet werden, denn dabei wird für das Matching<br />

selbst zwar ausschließlich die Struktur der Schemata herangezogen, in der Vorverarbeitungsphase<br />

sind aber auch weitere Kriterien möglich, die eventuell andere Daten<br />

benötigen (wie zum Beispiel Wörterbücher oder Thesauri).<br />

Auf der nächst-niedrigeren, detaillierteren Ebene unterscheidet man bei den ausschließlich<br />

schema-basierten Matchern zwischen Element-Ebene <strong>und</strong> Struktur-Ebene. Auf<br />

11

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!