pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...
pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...
pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Abbildung 3.1.: Klassifizierung von Matching-Verfahren nach [RB01]<br />
der Element-Ebene sind Verfahren zu finden, deren Matching-Kriterien jeweils einzelne<br />
Elemente der Schemata auf der niedrigsten (atomaren) Ebene betrachten, also zum Beispiel<br />
Attribute. Im Gegensatz dazu werden auf der Struktur-Ebene Zusammenhänge<br />
zwischen einzelnen Elementen berücksichtigt. Graph-Matching-Verfahren fallen somit in<br />
letztere Kategorie.<br />
Abbildung 3.1 zeigt die Klassifizierungen, wie sie in [RB01] gemacht werden. Die<br />
Stelle, an der die Graph-Matching-Verfahren eingeordnet werden, ist dabei hervorgehoben.<br />
Unterhalb der letzten Ebene sind noch weitere Kriterien denkbar, nach denen die<br />
Verfahren eingeteilt werden können, auf die allerdings nicht näher eingegangen werden<br />
soll.<br />
Während [RB01] allgemein Matching-Verfahren klassifiziert, beschränkt sich [SE05]<br />
auf schema-basierte Verfahren, betrachtet also nur einen Teilbaum der Klassifizierung in<br />
Abbildung 3.1. Dafür wird hier eine detailliertere Klassifizierung vorgenommen, welche in<br />
zwei Bereiche eingeteilt ist, die jeweils baumartig strukturiert sind (vgl. Abbildung 3.2).<br />
Der obere Bereich klassifiziert nach der Granularität der Matches <strong>und</strong> anschließend<br />
danach, wie die jeweilige Technik Informationen aus der Eingabe interpretiert. Die Einteilung<br />
nach der Granularität wird dabei wie schon in [RB01] nach Element- <strong>und</strong> Struktur-<br />
Ebene vorgenommen. Unterhalb dieser Ebenen wird zwischen syntaktisch (nur die Struktur<br />
ist für die Interpretation der Eingabe relevant), extern (zusätzliche Hilfsinformationen<br />
werden verwendet) <strong>und</strong> semantisch (formale Semantik als Basis für Interpretation)<br />
unterschieden. Nach dieser Klassifizierung befindet sich das Graph-Matching-Verfahren<br />
– wie in Abbildung 3.2 hervorgehoben – unterhalb der Struktur-Ebene <strong>und</strong> bei den<br />
syntaktischen Verfahren.<br />
Die zweite Klassifizierung im unteren Baum geschieht anhand der Art der Eingabe.<br />
Hier wird zunächst zwischen terminologischen, strukturellen <strong>und</strong> semantischen Eingaben<br />
unterschieden. Bei terminologischen handelt es sich um Zeichenketten, die entweder<br />
String-basiert sind, das heißt die Eingabe als Zeichenkette betrachten, oder die Ter-<br />
12