18.11.2012 Aufrufe

Dokument 1 - RWTH Aachen University

Dokument 1 - RWTH Aachen University

Dokument 1 - RWTH Aachen University

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

6.4 Qualitätsorientierte Datenintegration 165<br />

Definition 6.10 (Gewichtung der DW-Relation):<br />

Gegeben ist eine Spezifikation einer DW-Relation r gemäß Definition 6.5 der Form<br />

r( −→ X ) ← p1( −→ Z1), . . . , pn( −→ Zn), c1( −−→<br />

Zn+1), . . . , ck( −−→<br />

Zn+k) | Annotation<br />

wobei sich die Prädikate pi auf das konzeptuelle Modell beziehen, und die Prädikate ci Vergleichsprädikate<br />

sind. Eine Gewichtung der Prädikate p1, . . . , pn wird definiert durch einen Vektor<br />

−→ wr = (w1, . . . , wn) mit<br />

• wi ∈ R und 0 ≤ wi ≤ 1, und<br />

• �<br />

wi = 1. ✷<br />

i=1,...,n<br />

Neben der Gewichtung der Prädikate ist aber auch eine Gewichtung der Qualitätsfaktoren notwendig,<br />

um die verschiedenen Lösungsmöglichkeiten miteinander vergleichen zu können. Da<br />

die Gewichtung der Qualitätsfaktoren auch eine subjektive Einschätzung ist und vom Anwendungskontext<br />

abhängt, wird diese Gewichtung auch dem Qualitätsziel zugeordnet.<br />

Definition 6.11 (Gewichtung der Qualitätsfaktoren):<br />

Gegeben sind m Typen von Qualitätsfaktoren. Die Gewichtung der Qualitätsfaktoren wird definiert<br />

durch einen Vektor −→ wq = (w1, . . . , wm) mit<br />

• wi ∈ R und 0 ≤ wi ≤ 1, und<br />

• �<br />

wi = 1. ✷<br />

i=1,...,m<br />

Mit Hilfe der Gewichtungen kann man nun für die Umschreibung einer DW-Relation einen Qualitätswert<br />

bestimmen, um so die verschiedenen Lösungsmöglichkeiten vergleichen zu können.<br />

6.4.3 Bestimmung eines Qualitätswertes<br />

Um nun die Qualität einer Umschreibung der DW-Relation festzustellen, müssen die Qualitätsvektoren<br />

der Datenquellen so zusammengefasst werden, wie es in der Gewichtung vorgegeben<br />

ist. Dabei ist zu beachten, dass jedes Prädikat in der DW-Relation durch genau eine Datenquelle<br />

abgedeckt wird. Dies wird durch die disjunkte und vollständige Kombination der MiniCon-<br />

Beschreibungen in Phase 2 erreicht. Da für jedes Prädikat in der Spezifikation einer Datenquelle<br />

ein Qualitätsvektor definiert wurde, werden genau diese Qualitätsvektoren für die Beurteilung<br />

der Umschreibung genutzt. Wenn also in der DW-Relation die Prädikate q1, . . . , qn und in der<br />

Relation der Datenquelle die Prädikate p1, . . . , pm vorkommen, und die Abbildung ρ der zu-<br />

gehörigen MiniCon-Beschreibung qi auf pj abbildet, dann wird qi der Qualitätsvektor von pj<br />

zugeordnet, der im Folgenden mit −→ vpj<br />

bzw. −−→<br />

vρ(qi) bezeichnet wird.<br />

Dadurch erhält man n Qualitätsvektoren, die nun zu einem Qualitätsvektor zusammengefasst<br />

werden müssen. Dabei sind zwei Besonderheiten zu beachten.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!