Dokument 1 - RWTH Aachen University
Dokument 1 - RWTH Aachen University
Dokument 1 - RWTH Aachen University
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
162 6 Ein Verfahren zur qualitätsorientierten Datenintegration in DW-Systemen<br />
aber aus. Bei dem Verbund zwischen Service und BasicCharge muss zusätzlich noch die Repräsentation<br />
des Service-Objekts abgeglichen werden, welches in beiden Datenquellen durch seinen<br />
Code identifiziert wird. Da in der Datenquelle Service der Typ als Integer dargestellt wird,<br />
ist auch eine Konvertierung von den Integer-Werten der Variable T ype4 in die String-Werte der<br />
Ergebnisvariable T ype notwendig.<br />
Customer(ID1, Name1, Street1, City1, Country1), Marketing(Name2, DOB2),<br />
GermanCitizen(Name3, DOB3, City3), Service(ID4, Code4, T ype4),<br />
BasicCharge(ID5, Code5, T ype5, Amount5), LE(DOB2, 1950)<br />
| match([Name2, DOB2], [ID1]), match([ID1], [ID5]), match([ID1], [ID4]),<br />
match([Name3, DOB3], [ID1]), . . . , match([Code4], [Code5]),<br />
assign([ID], [ID4]), assign([Name], [Name1]),<br />
assign([Code], [Code5]), convert([T ype4], [T ype])<br />
Durch den Übergang zur relationalen Darstellung fallen einige der 288 Möglichkeiten zur Integration<br />
weg. Zum Beispiel ist es bei der letzten Möglichkeit für die relationale Darstellung<br />
irrelevant, ob das Teilziel Service(S) in der DW-Relation durch die Datenquelle Service oder BasicCharge<br />
abgedeckt wird. Dennoch bleiben 144 Möglichkeiten übrig. Eine weitere Reduktion<br />
der Möglichkeiten kann sich ergeben, wenn man die match-Operation zwischen Datenquellen als<br />
Gleichheitsbedingung implementiert (z.B. der Verbund zweier Relationen durch Attribut ID). ✷<br />
Die große Anzahl von Möglichkeiten für das relativ kleine Beispiel zeigt, dass eine genauere Betrachtung<br />
der einzelnen Möglichkeiten notwendig ist, um schließlich die beste Möglichkeit oder<br />
die besten Möglichkeiten zu bestimmen. Der Mediator muss nicht aus nur einer konjunktiven<br />
Anfrage bestehen, auch die Vereinigung mehrerer konjunktiver Anfragen ist möglich. Aus diesem<br />
Grund werden im nächsten Abschnitt den Ergebnissen Qualitätswerte zugeordnet, so dass<br />
ein Vergleich der verschiedenen Alternativen möglich ist.<br />
6.4 Qualitätsorientierte Datenintegration<br />
Um eine qualitätsorientierte Datenintegration zu ermöglichen, ist eine Zuordnung von Qualitätsfaktoren<br />
und Qualitätszielen zu den Bestandteilen des Integrationssystems notwendig. Ziel ist es,<br />
die Qualität der integrierten Daten in Abhängigkeit von den verschiedenen Integrationsmöglichkeiten<br />
zu bestimmen. Daraus ergeben sich drei Fragestellungen:<br />
• Wie ordnet man die Qualitätsfaktoren aus Kapitel 5 bzw. Anhang B in das hier entwickelte<br />
Verfahren zur Datenintegration ein?<br />
• Wie werden die Qualitätsziele der Benutzer formalisiert?<br />
• Wie kann man die verschiedenen Lösungsmöglichkeiten miteinander vergleichen?<br />
Diese Fragestellungen werden in den folgenden Abschnitten genauer betrachtet.