18.11.2012 Aufrufe

Dokument 1 - RWTH Aachen University

Dokument 1 - RWTH Aachen University

Dokument 1 - RWTH Aachen University

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Kapitel 5<br />

Datenqualität in<br />

Data-Warehouse-Systemen<br />

Die Datenqualität hat durch die vielfältigen Analysemöglichkeiten, die durch DW-Systeme ermöglicht<br />

werden, an Bedeutung gewonnen. Durch die Integration der Daten in ein DW treten<br />

Probleme auf, die oft auf fehlerhafte Daten zurückzuführen sind. Zum Beispiel ist die Zusammenführung<br />

von Kundendaten problematisch, wenn Schlüsselwerte wie Name oder Geburtsdatum<br />

nicht übereinstimmen. Darüber hinaus werden bei der Analyse der Daten Eingabefehler<br />

erkannt, die im täglichen Betrieb des Unternehmens keine Auswirkung haben. English [1999]<br />

nennt als Beispiel ein Versicherungsunternehmen, in dem die Angestellten bei der Erfassung eines<br />

Versicherungsfalls sehr häufig „gebrochenes Bein“ als Diagnose eingaben, da dieses Datum<br />

in der weiteren Bearbeitung des Versicherungsfalls keine Rolle spielte. Erst bei der Analyse der<br />

Daten zur Anfertigung einer Statistik der Versicherungsfälle fiel dieser Datenfehler auf.<br />

Es ist daher offensichtlich, dass die Datenqualität im DW-System eine wichtige Rolle spielt. Die<br />

in den vorherigen Kapiteln vorgestellten Modelle können die Architektur und Prozesse eines<br />

DW-Systems beschreiben. Um den Betrieb eines DW-Systems aber vollständig zu unterstützen,<br />

müssen auch die Qualitätsaspekte modelliert werden. Für Administratoren ist es wichtig, die<br />

Qualitätsziele der Benutzer des DW-Systems zu kennen und die Qualität des Systems durch<br />

Messungen beurteilen zu können. Die Benutzer müssen in der Lage sein, Qualitätsinformationen<br />

zu Anfrageergebnissen des DW-Systems zu erhalten, und ihre Anforderungen sollten als Qualitätsziele<br />

formal erfasst werden. Zu diesem Zweck wird in diesem Kapitel ein Qualitätsmodell<br />

entworfen, dass auf der einen Seite die Erfassung der Benutzeranforderungen in Form von Qualitätszielen<br />

erlaubt, und auf der anderen Seite die Ergebnisse von Qualitätsmessungen erfasst.<br />

Hierfür wird zunächst der Stand der Forschung und der Praxis untersucht (Abschnitt 5.1). Basierend<br />

auf diesen Arbeiten werden zunächst in Abschnitt 5.2 die Dimensionen der Datenqualität<br />

für DW-Systeme klassifiziert. Anschließend wird das Modell zur Unterstützung des Datenqualitätsmanagements<br />

in DW-Systemen vorgestellt. Grundlage des Modells bildet der Goal-Question-<br />

Metric-Ansatz (Ziel-Frage-Metrik, kurz GQM) von Oivo und Basili [1992], der unter anderem<br />

zum Qualitätsmanagement in der Softwareentwicklung erfolgreich eingesetzt wird [Fuggetta<br />

et al., 1998; van Latum et al., 1998; Barnard und Price, 1994]. Die Grundidee von GQM ist, die<br />

77

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!