Dokument 1 - RWTH Aachen University
Dokument 1 - RWTH Aachen University
Dokument 1 - RWTH Aachen University
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
158 6 Ein Verfahren zur qualitätsorientierten Datenintegration in DW-Systemen<br />
Teilziel Umschreibung 1 Umschreibung 2 Umschreibung 3<br />
PrivateCustomer Marketing (6) Marketing (6) Marketing (6)<br />
ID Customer (1) Customer (1) Service (12)<br />
DOB Marketing (8) GermanCitizen (10) GermanCitizen (10)<br />
Name Customer (2) Customer (2) Customer (2)<br />
located-in Customer (3) GermanCitizen (11) GermanCitizen (11)<br />
Location Customer (4) GermanCitizen (11) GermanCitizen (11)<br />
Country Customer (5) GermanCitizen (11) GermanCitizen (11)<br />
agreement BasicCharge (17) BasicCharge (17) BasicCharge (17)<br />
Service BasicCharge (18) BasicCharge (18) Service (13)<br />
Contract BasicCharge (19) BasicCharge (19) BasicCharge (19)<br />
Code BasicCharge (20) BasicCharge (20) BasicCharge (20)<br />
Type BasicCharge (21) BasicCharge (21) Service (15)<br />
L LE, EQ LE LE<br />
Tabelle 6.2: Drei mögliche Kombinationen von MiniCon-Beschreibungen<br />
Beispiel 6.7 (Fortsetzung von Beispiel 6.5):<br />
In Phase 1 wurden für die Relationen aus Beispiel 6.4 21 MiniCon-Beschreibungen ermittelt. Da<br />
die meisten MiniCon-Beschreibung nur ein Teilziel abdecken, ergeben sich daraus insgesamt 288<br />
Möglichkeiten 2 für eine vollständige und disjunkte Abdeckung der Teilziele der DW-Relation<br />
OldCustomersWithService. Zur Erläuterung beschränke ich die Darstellung hier auf drei repräsentative<br />
Kombinationen. Diese Möglichkeiten sind in Tabelle 6.2 dargestellt.<br />
Die linke Spalte der Tabelle listet die Teilziele der DW-Relation auf, ausgenommen sind die beiden<br />
Vergleichsprädikate. Die anderen drei Spalten stellen jeweils eine mögliche Kombination der<br />
Teilziele dar. Dabei enthalten die einzelnen Zellen den Namen der Datenquellen und in Klammern<br />
die Nummer der zugehörigen MiniCon-Beschreibung (siehe Tabelle 6.1), die das Teilziel<br />
abdeckt. Da die Datenquellen Marketing und BasicCharge „exklusive“ Informationen über Privatkunden<br />
und Verträge beinhalten, tauchen diese Relationen in allen drei Möglichkeiten auf.<br />
Bei Möglichkeit 1 werden die Adressinformationen aus der Datenquelle Customer extrahiert,<br />
und die Geburtsdaten kommen aus der Relation Marketing. Bei Möglichkeit 2 werden diese Informationen<br />
aus der Datenquelle GermanCitizen extrahiert. Die dritte Möglichkeit kombiniert<br />
die Daten aus allen fünf Datenquellen. Die Abbildung eq ist in allen Fällen die identische Abbildung.<br />
Die Abbildung ψ entspricht der Umkehrung der Abbildung ϕ, da in diesem Beispiel für<br />
alle Paare X, Y von Variablen der DW-Relation mit X �= Y gilt: ϕ(X) �= ϕ(Y ). ✷<br />
2 Diese Zahl ergibt sich aus der Anzahl von Möglichkeiten zur Abdeckung eines Teilziels in der DW-Relation:<br />
jeweils drei für ID und Name, jeweils zwei für DOB, Service, Code und Type und zwei Möglichkeiten für die<br />
Gruppe von Teilzielen located-in, Location und Country. Die anderen Teilziele PrivateCustomer, agreement<br />
und Contract werden jeweils nur durch eine Datenquelle abgedeckt.