Dokument 1 - RWTH Aachen University
Dokument 1 - RWTH Aachen University
Dokument 1 - RWTH Aachen University
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
6.4 Qualitätsorientierte Datenintegration 165<br />
Definition 6.10 (Gewichtung der DW-Relation):<br />
Gegeben ist eine Spezifikation einer DW-Relation r gemäß Definition 6.5 der Form<br />
r( −→ X ) ← p1( −→ Z1), . . . , pn( −→ Zn), c1( −−→<br />
Zn+1), . . . , ck( −−→<br />
Zn+k) | Annotation<br />
wobei sich die Prädikate pi auf das konzeptuelle Modell beziehen, und die Prädikate ci Vergleichsprädikate<br />
sind. Eine Gewichtung der Prädikate p1, . . . , pn wird definiert durch einen Vektor<br />
−→ wr = (w1, . . . , wn) mit<br />
• wi ∈ R und 0 ≤ wi ≤ 1, und<br />
• �<br />
wi = 1. ✷<br />
i=1,...,n<br />
Neben der Gewichtung der Prädikate ist aber auch eine Gewichtung der Qualitätsfaktoren notwendig,<br />
um die verschiedenen Lösungsmöglichkeiten miteinander vergleichen zu können. Da<br />
die Gewichtung der Qualitätsfaktoren auch eine subjektive Einschätzung ist und vom Anwendungskontext<br />
abhängt, wird diese Gewichtung auch dem Qualitätsziel zugeordnet.<br />
Definition 6.11 (Gewichtung der Qualitätsfaktoren):<br />
Gegeben sind m Typen von Qualitätsfaktoren. Die Gewichtung der Qualitätsfaktoren wird definiert<br />
durch einen Vektor −→ wq = (w1, . . . , wm) mit<br />
• wi ∈ R und 0 ≤ wi ≤ 1, und<br />
• �<br />
wi = 1. ✷<br />
i=1,...,m<br />
Mit Hilfe der Gewichtungen kann man nun für die Umschreibung einer DW-Relation einen Qualitätswert<br />
bestimmen, um so die verschiedenen Lösungsmöglichkeiten vergleichen zu können.<br />
6.4.3 Bestimmung eines Qualitätswertes<br />
Um nun die Qualität einer Umschreibung der DW-Relation festzustellen, müssen die Qualitätsvektoren<br />
der Datenquellen so zusammengefasst werden, wie es in der Gewichtung vorgegeben<br />
ist. Dabei ist zu beachten, dass jedes Prädikat in der DW-Relation durch genau eine Datenquelle<br />
abgedeckt wird. Dies wird durch die disjunkte und vollständige Kombination der MiniCon-<br />
Beschreibungen in Phase 2 erreicht. Da für jedes Prädikat in der Spezifikation einer Datenquelle<br />
ein Qualitätsvektor definiert wurde, werden genau diese Qualitätsvektoren für die Beurteilung<br />
der Umschreibung genutzt. Wenn also in der DW-Relation die Prädikate q1, . . . , qn und in der<br />
Relation der Datenquelle die Prädikate p1, . . . , pm vorkommen, und die Abbildung ρ der zu-<br />
gehörigen MiniCon-Beschreibung qi auf pj abbildet, dann wird qi der Qualitätsvektor von pj<br />
zugeordnet, der im Folgenden mit −→ vpj<br />
bzw. −−→<br />
vρ(qi) bezeichnet wird.<br />
Dadurch erhält man n Qualitätsvektoren, die nun zu einem Qualitätsvektor zusammengefasst<br />
werden müssen. Dabei sind zwei Besonderheiten zu beachten.