18.11.2012 Aufrufe

Dokument 1 - RWTH Aachen University

Dokument 1 - RWTH Aachen University

Dokument 1 - RWTH Aachen University

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

162 6 Ein Verfahren zur qualitätsorientierten Datenintegration in DW-Systemen<br />

aber aus. Bei dem Verbund zwischen Service und BasicCharge muss zusätzlich noch die Repräsentation<br />

des Service-Objekts abgeglichen werden, welches in beiden Datenquellen durch seinen<br />

Code identifiziert wird. Da in der Datenquelle Service der Typ als Integer dargestellt wird,<br />

ist auch eine Konvertierung von den Integer-Werten der Variable T ype4 in die String-Werte der<br />

Ergebnisvariable T ype notwendig.<br />

Customer(ID1, Name1, Street1, City1, Country1), Marketing(Name2, DOB2),<br />

GermanCitizen(Name3, DOB3, City3), Service(ID4, Code4, T ype4),<br />

BasicCharge(ID5, Code5, T ype5, Amount5), LE(DOB2, 1950)<br />

| match([Name2, DOB2], [ID1]), match([ID1], [ID5]), match([ID1], [ID4]),<br />

match([Name3, DOB3], [ID1]), . . . , match([Code4], [Code5]),<br />

assign([ID], [ID4]), assign([Name], [Name1]),<br />

assign([Code], [Code5]), convert([T ype4], [T ype])<br />

Durch den Übergang zur relationalen Darstellung fallen einige der 288 Möglichkeiten zur Integration<br />

weg. Zum Beispiel ist es bei der letzten Möglichkeit für die relationale Darstellung<br />

irrelevant, ob das Teilziel Service(S) in der DW-Relation durch die Datenquelle Service oder BasicCharge<br />

abgedeckt wird. Dennoch bleiben 144 Möglichkeiten übrig. Eine weitere Reduktion<br />

der Möglichkeiten kann sich ergeben, wenn man die match-Operation zwischen Datenquellen als<br />

Gleichheitsbedingung implementiert (z.B. der Verbund zweier Relationen durch Attribut ID). ✷<br />

Die große Anzahl von Möglichkeiten für das relativ kleine Beispiel zeigt, dass eine genauere Betrachtung<br />

der einzelnen Möglichkeiten notwendig ist, um schließlich die beste Möglichkeit oder<br />

die besten Möglichkeiten zu bestimmen. Der Mediator muss nicht aus nur einer konjunktiven<br />

Anfrage bestehen, auch die Vereinigung mehrerer konjunktiver Anfragen ist möglich. Aus diesem<br />

Grund werden im nächsten Abschnitt den Ergebnissen Qualitätswerte zugeordnet, so dass<br />

ein Vergleich der verschiedenen Alternativen möglich ist.<br />

6.4 Qualitätsorientierte Datenintegration<br />

Um eine qualitätsorientierte Datenintegration zu ermöglichen, ist eine Zuordnung von Qualitätsfaktoren<br />

und Qualitätszielen zu den Bestandteilen des Integrationssystems notwendig. Ziel ist es,<br />

die Qualität der integrierten Daten in Abhängigkeit von den verschiedenen Integrationsmöglichkeiten<br />

zu bestimmen. Daraus ergeben sich drei Fragestellungen:<br />

• Wie ordnet man die Qualitätsfaktoren aus Kapitel 5 bzw. Anhang B in das hier entwickelte<br />

Verfahren zur Datenintegration ein?<br />

• Wie werden die Qualitätsziele der Benutzer formalisiert?<br />

• Wie kann man die verschiedenen Lösungsmöglichkeiten miteinander vergleichen?<br />

Diese Fragestellungen werden in den folgenden Abschnitten genauer betrachtet.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!