Dokument 1 - RWTH Aachen University
Dokument 1 - RWTH Aachen University
Dokument 1 - RWTH Aachen University
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
8.2 Ausblick 217<br />
8.2 Ausblick<br />
Die entwickelten Metamodelle für die DW-Architektur und DW-Prozesse erfassen mehr Metadaten<br />
als dies derzeit in Metadatenstandards wie dem CWM der Fall ist. Die in Abschnitt 3.6.4<br />
vorgestellte Einbettung des CWM in das Rahmenwerk könnte in eine wirkliche Integration der<br />
hier vorgestellten Metamodelle und dem CWM-Standard ausgebaut werden. Damit einhergehen<br />
würde eine Erweiterung des Metadatenbanksystems ConceptBase um weitere Schnittstellen<br />
zur automatischen Metadatenerfassung. Dadurch würde man eine vollständige und formale Repräsentation<br />
des CWM-Standards erreichen, die mit den in Abschnitt 3.6.4 genannten Vorteilen<br />
(z.B. Konsistenzprüfung, Analyse der Metadaten durch Anfragen) verbunden ist. Die bereits implementierten<br />
Erweiterungen des ConceptBase-Systems (vgl. Abschnitt 6.5) werden in die in<br />
Kürze erscheinende Version 6.1 von ConceptBase einfließen.<br />
Für das Qualitätsmodell wäre eine vollständige Validierung im Kontext eines integrierten Informationssystems<br />
interessant. Dabei sollte untersucht werden, inwieweit die Qualität des Systems<br />
durch die vorgestellten Qualitätsdimensionen und -faktoren beurteilt werden kann. Des Weiteren<br />
sollte untersucht werden, wie geeignet das Qualitäts- und Vorgehensmodell zum Qualitätsmanagement<br />
in Informationssystemen sind.<br />
Das Verfahren zur qualitätsorientierten Datenintegration sollte für einen konkreten Anwendungsbereich<br />
implementiert werden. Dieses ist für die Datenintegration im Semantic-Web-Bereich geplant<br />
(siehe unten). Dabei ist dann auch zu untersuchen, inwieweit die vereinfachenden Annahmen<br />
die Qualität des Ergebnisses beeinflussen. Eine in Kapitel 6 angesprochene Schwachstelle<br />
des Algorithmus war, dass bei der Suche nach relevanten Datenquellen für ein Konzept nicht<br />
Kombinationen von Konzepten aus mehreren Datenquellen betrachtet werden. Daher wäre eine<br />
Erweiterung des Algorithmus, die auch Kombinationen von Datenquellen auf eine effiziente<br />
Weise berücksichtigt, sinnvoll.<br />
Konkrete Erweiterungen sind in den Bereichen Semantic Web und Model Management geplant.<br />
Wie schon in Abschnitt 7.5 angesprochen wurde, ist die Integration von Daten im Semantic<br />
Web derzeit ein aktuelles Forschungsthema. Durch die Ähnlichkeit der konzeptuellen Modelle<br />
dieser Arbeit mit den Ontologien des Semantic Web, können diese Modelle auch zur Darstellung<br />
von Ontologien benutzt werden. Die logische Perspektive muss jedoch erweitert werden,<br />
da im Semantic Web nicht flache, relationale Strukturen sondern komplex verschachtelte, semistrukturierte<br />
Strukturen betrachtet werden. Daher ist die Übertragung von existierenden Integrationsverfahren<br />
für relationale Daten auf semi-strukturierte Daten ein interessantes Forschungsthema.<br />
Damit eng verknüpft ist auch die Integration von unstrukturierten <strong>Dokument</strong>en mit (semi-)strukturierten<br />
Daten [Halevy et al., 2003b]. Während man in strukturierten Daten nach einzelnen<br />
Datensätzen oder sogar Datenwerten suchen kann, kann man bei unstrukturierten Daten nur nach<br />
ganzen <strong>Dokument</strong>en suchen. Metadaten können zwar den Inhalt eines <strong>Dokument</strong>s beschreiben,<br />
man kann aber nicht direkt auf den Inhalt zugreifen um z.B. eine Teilmenge der Informationen<br />
zu selektieren. Ein Integrationsverfahren für das Semantic Web muss aber Daten sowohl aus<br />
strukturierten als auch aus unstrukturierten Datenquellen integrieren können, da eine Vielzahl<br />
der Daten im Internet als unstrukturierte <strong>Dokument</strong>e verhanden sind.