Institut für Informatik - Dokumentenserver - Universität Leipzig
Institut für Informatik - Dokumentenserver - Universität Leipzig
Institut für Informatik - Dokumentenserver - Universität Leipzig
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
unterschiedliche Datenmodelle und Schemata beschrieben werden wie z.B. SQL,<br />
XML, ER, UML oder Ontologien. Eine neue Generation generischer Repositorien<br />
mit mächtigen APIs wird benötigt, welche eine einfache und schnelle Entwicklung<br />
von Metadaten-Applikationen erlauben sollen. Hierzu wurde der Ansatz des "Model<br />
Management" vorgeschlagen, bei dem unterschiedliche Metadaten-Modelle<br />
und Abbildungen (Mappings) zwischen ihnen einheitlich verwaltet und mit mächtigen,<br />
generischen Operationen bearbeitet werden. Von besonderer Wichtigkeit<br />
hierbei sind die Operationen Match, Merge, und Compose.<br />
Die Anwendbarkeit des Modell-Management-Ansatzes wurde bei der Lösung<br />
konkreter Data Warehouse-Aufgaben überprüft. Mit Hilfe der Modelloperatoren<br />
konnten unterschiedliche Lösungsstrategien <strong>für</strong> typische Mapping-Aufgaben abgeleitet<br />
werden: Integration einer neuen Datenquelle bzw. Hinzufügen eines neuen<br />
Data Marts. Die Lösungen zeigten, dass Mappings effektiv zur Bildung neuer<br />
Mappings wiederverwendet werden können.<br />
Weiterhin wurden bisherige Vorschläge zur Realisierung von Schema Matching<br />
(etwa im Rahmen der Schemaintegration) klassifiziert und auf ihre Tauglichkeit<br />
zur Realisierung einer generischen Match-Operation geprüft. Neben Angaben auf<br />
Schemaebene (Namen, Datentypen, Integritätsbedingungen etc.) sollten auch Informationen<br />
auf Instanzenebene genutzt werden. Weiterhin sollte eine Wiederverwendung<br />
im Rahmen früherer Match-Aufgaben ermittelter Korrespondenzen<br />
angestrebt werden. Für eine generische Match-Implementierung (s. Abbildung)<br />
sollten mehrere Algorithmen ("Matcher") bereitstehen, unter denen anwendungsspezifisch<br />
eine Auswahl getroffen wird.<br />
Tool 1<br />
(Portal schemas)<br />
Global libraries<br />
(dictionaries,<br />
schemas …)<br />
Tool 2<br />
(E-Business schemas)<br />
Schema import/ export<br />
Generic Match<br />
Internal Schema<br />
Representation<br />
Im Data Warehouse-Kontext wurden ferner Ansätze zur Metadaten-Interoperabilität<br />
und -Synchronisation untersucht. Zur Verwaltung von gemeinsam genutzten<br />
Metadaten wurde eine förderierte Architektur vorgeschlagen; zur Replikationskontrolle<br />
<strong>für</strong> Metadaten ein Publish-Subscribe-Ansatz.<br />
62<br />
Tool 3 (Data<br />
Warehousing schemas)<br />
Tool 4<br />
(Database Design)