Dokument 1 - RWTH Aachen University
Dokument 1 - RWTH Aachen University
Dokument 1 - RWTH Aachen University
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Kapitel 5<br />
Datenqualität in<br />
Data-Warehouse-Systemen<br />
Die Datenqualität hat durch die vielfältigen Analysemöglichkeiten, die durch DW-Systeme ermöglicht<br />
werden, an Bedeutung gewonnen. Durch die Integration der Daten in ein DW treten<br />
Probleme auf, die oft auf fehlerhafte Daten zurückzuführen sind. Zum Beispiel ist die Zusammenführung<br />
von Kundendaten problematisch, wenn Schlüsselwerte wie Name oder Geburtsdatum<br />
nicht übereinstimmen. Darüber hinaus werden bei der Analyse der Daten Eingabefehler<br />
erkannt, die im täglichen Betrieb des Unternehmens keine Auswirkung haben. English [1999]<br />
nennt als Beispiel ein Versicherungsunternehmen, in dem die Angestellten bei der Erfassung eines<br />
Versicherungsfalls sehr häufig „gebrochenes Bein“ als Diagnose eingaben, da dieses Datum<br />
in der weiteren Bearbeitung des Versicherungsfalls keine Rolle spielte. Erst bei der Analyse der<br />
Daten zur Anfertigung einer Statistik der Versicherungsfälle fiel dieser Datenfehler auf.<br />
Es ist daher offensichtlich, dass die Datenqualität im DW-System eine wichtige Rolle spielt. Die<br />
in den vorherigen Kapiteln vorgestellten Modelle können die Architektur und Prozesse eines<br />
DW-Systems beschreiben. Um den Betrieb eines DW-Systems aber vollständig zu unterstützen,<br />
müssen auch die Qualitätsaspekte modelliert werden. Für Administratoren ist es wichtig, die<br />
Qualitätsziele der Benutzer des DW-Systems zu kennen und die Qualität des Systems durch<br />
Messungen beurteilen zu können. Die Benutzer müssen in der Lage sein, Qualitätsinformationen<br />
zu Anfrageergebnissen des DW-Systems zu erhalten, und ihre Anforderungen sollten als Qualitätsziele<br />
formal erfasst werden. Zu diesem Zweck wird in diesem Kapitel ein Qualitätsmodell<br />
entworfen, dass auf der einen Seite die Erfassung der Benutzeranforderungen in Form von Qualitätszielen<br />
erlaubt, und auf der anderen Seite die Ergebnisse von Qualitätsmessungen erfasst.<br />
Hierfür wird zunächst der Stand der Forschung und der Praxis untersucht (Abschnitt 5.1). Basierend<br />
auf diesen Arbeiten werden zunächst in Abschnitt 5.2 die Dimensionen der Datenqualität<br />
für DW-Systeme klassifiziert. Anschließend wird das Modell zur Unterstützung des Datenqualitätsmanagements<br />
in DW-Systemen vorgestellt. Grundlage des Modells bildet der Goal-Question-<br />
Metric-Ansatz (Ziel-Frage-Metrik, kurz GQM) von Oivo und Basili [1992], der unter anderem<br />
zum Qualitätsmanagement in der Softwareentwicklung erfolgreich eingesetzt wird [Fuggetta<br />
et al., 1998; van Latum et al., 1998; Barnard und Price, 1994]. Die Grundidee von GQM ist, die<br />
77