18.11.2012 Aufrufe

Dokument 1 - RWTH Aachen University

Dokument 1 - RWTH Aachen University

Dokument 1 - RWTH Aachen University

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

158 6 Ein Verfahren zur qualitätsorientierten Datenintegration in DW-Systemen<br />

Teilziel Umschreibung 1 Umschreibung 2 Umschreibung 3<br />

PrivateCustomer Marketing (6) Marketing (6) Marketing (6)<br />

ID Customer (1) Customer (1) Service (12)<br />

DOB Marketing (8) GermanCitizen (10) GermanCitizen (10)<br />

Name Customer (2) Customer (2) Customer (2)<br />

located-in Customer (3) GermanCitizen (11) GermanCitizen (11)<br />

Location Customer (4) GermanCitizen (11) GermanCitizen (11)<br />

Country Customer (5) GermanCitizen (11) GermanCitizen (11)<br />

agreement BasicCharge (17) BasicCharge (17) BasicCharge (17)<br />

Service BasicCharge (18) BasicCharge (18) Service (13)<br />

Contract BasicCharge (19) BasicCharge (19) BasicCharge (19)<br />

Code BasicCharge (20) BasicCharge (20) BasicCharge (20)<br />

Type BasicCharge (21) BasicCharge (21) Service (15)<br />

L LE, EQ LE LE<br />

Tabelle 6.2: Drei mögliche Kombinationen von MiniCon-Beschreibungen<br />

Beispiel 6.7 (Fortsetzung von Beispiel 6.5):<br />

In Phase 1 wurden für die Relationen aus Beispiel 6.4 21 MiniCon-Beschreibungen ermittelt. Da<br />

die meisten MiniCon-Beschreibung nur ein Teilziel abdecken, ergeben sich daraus insgesamt 288<br />

Möglichkeiten 2 für eine vollständige und disjunkte Abdeckung der Teilziele der DW-Relation<br />

OldCustomersWithService. Zur Erläuterung beschränke ich die Darstellung hier auf drei repräsentative<br />

Kombinationen. Diese Möglichkeiten sind in Tabelle 6.2 dargestellt.<br />

Die linke Spalte der Tabelle listet die Teilziele der DW-Relation auf, ausgenommen sind die beiden<br />

Vergleichsprädikate. Die anderen drei Spalten stellen jeweils eine mögliche Kombination der<br />

Teilziele dar. Dabei enthalten die einzelnen Zellen den Namen der Datenquellen und in Klammern<br />

die Nummer der zugehörigen MiniCon-Beschreibung (siehe Tabelle 6.1), die das Teilziel<br />

abdeckt. Da die Datenquellen Marketing und BasicCharge „exklusive“ Informationen über Privatkunden<br />

und Verträge beinhalten, tauchen diese Relationen in allen drei Möglichkeiten auf.<br />

Bei Möglichkeit 1 werden die Adressinformationen aus der Datenquelle Customer extrahiert,<br />

und die Geburtsdaten kommen aus der Relation Marketing. Bei Möglichkeit 2 werden diese Informationen<br />

aus der Datenquelle GermanCitizen extrahiert. Die dritte Möglichkeit kombiniert<br />

die Daten aus allen fünf Datenquellen. Die Abbildung eq ist in allen Fällen die identische Abbildung.<br />

Die Abbildung ψ entspricht der Umkehrung der Abbildung ϕ, da in diesem Beispiel für<br />

alle Paare X, Y von Variablen der DW-Relation mit X �= Y gilt: ϕ(X) �= ϕ(Y ). ✷<br />

2 Diese Zahl ergibt sich aus der Anzahl von Möglichkeiten zur Abdeckung eines Teilziels in der DW-Relation:<br />

jeweils drei für ID und Name, jeweils zwei für DOB, Service, Code und Type und zwei Möglichkeiten für die<br />

Gruppe von Teilzielen located-in, Location und Country. Die anderen Teilziele PrivateCustomer, agreement<br />

und Contract werden jeweils nur durch eine Datenquelle abgedeckt.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!