Dokument 1 - RWTH Aachen University

Weitere Magazine

Empfehlungen

Info

130 6 Ein Verfahren zur qualitätsorientierten Datenintegration in DW-Systemen Dabei werde ich die Datalog-Notation für die Darstellung der Anfragen und Sichten verwenden [Ceri et al., 1990]. In Datalog werden konjunktive Anfragen in der Form q( −→ X ) : −r1( −→ X1), . . . , rn( −→ Xn) dargestellt, wobei q und r1, . . . , rn Prädikatennamen sind. q( −→ X ) bildet den Kopf der Anfrage, r1( −→ X1), . . . , rn( −→ Xn) ist der Rumpf der Anfrage, und die einzelnen ri beziehen sich auf Datenbankrelationen (in diesem Kontext auf Elemente des globalen Schemas). −→ X und alle −→ Xi sind Tupeln von Variablen. Im Folgenden wird angenommen, dass Anfragen sicher sind, d.h. alle Variablen des Kopfes tauchen auch im Rumpf auf (formal: −→ X ⊆ −→ X1 ∪ . . . ∪ −→ Xn) Sofern nicht explizit ausgeschlossen, können Anfragen auch arithmetische Vergleichsliterale wie
6.1 Bisherige Algorithmen zur Datenintegration 131 Andererseits ist die Auswertung der umgeschriebenen Regeln aufwendig, da im Prinzip die Relationen des globalen Schemas (im Beispiel r und s) neu berechnet werden. Effizienter ist es direkt die Sichten bei der Auswertung zu benutzen ohne diese Zwischenergebnisse zu produzieren. Dieser Nachteil kann aber durch nachträgliche Optimierungen, wie z.B. das „Auffalten“ der Regeln, abgeschwächt werden. MiniCon-Algorithmus Eine Schwäche des Bucket-Algorithmus von Levy et al. [1996] ist, dass in der zweiten Phase des Algorithmus zu viele Sichten betrachtet werden, obwohl sie offensichtlich für die Beantwortung einer Anfrage nicht relevant sein können. Dies liegt daran, dass der Bucket-Algorithmus nicht die Variablen der Prädikate betrachtet, sondern nur die Prädikatsnamen. Dieses Problem wird am folgenden Beispiel erläutert. Beispiel 6.1: Gegeben sind eine Anfrage q und die Sichten v1, v2 und v3. q(X) : − r(X, Y ), r(Y, X), s(X, Y ) v1(A) : − r(A, B), r(B, A) v2(C, D) : − s(C, D) v3(F, H) : − r(F, G), r(G, H), s(F, G) Der Bucket-Algorithmus würde für das Teilziel r(X, Y ) sowohl v1 als auch v3 als relevant einstufen. v1 kann aber nicht für die Beantwortung von q benutzt werden, da die Variable B nicht von v1 „exportiert“ wird. Diese Variable ist aber für den Verbund mit der Relation s (bzw. einer entsprechenden Sicht) notwendig. ✷ Der Shared-Variable-Bucket- (SVB) und der MiniCon-Algorithmus gehen genau auf diese Schwäche des Algorithmus ein. Die Algorithmen wurden getrennt von Mitra [2001] bzw. Pottinger und Halevy [2001] entwickelt und beziehen beide die Rolle der Variablen mit ein. Der MiniCon-Algorithmus [Pottinger und Levy, 2000; Pottinger und Halevy, 2001] arbeitet ähnlich wie der Bucket-Algorithmus in zwei Phasen. Zunächst werden in der ersten sogenannte MiniCon-Descriptions (MCDs) konstruiert, die im Wesentlichen einem „Bucket“ mit zusätzlichen Informationen entsprechen. Ein MCD für eine Anfrage q über eine Sicht v enthält die folgenden Informationen: • ein Kopf-Homomorphismus h, der (falls notwendig) Variablen aus dem Kopf von v aufeinander abbildet, • den durch h modifizierten Kopf von v, also v( −→ Y ), wobei −→ Y = h( −→ X ), wenn −→ X die Originalvariablen im Kopf von v sind, • eine partielle Abbildung ϕ der Variablen von q auf die Variablen von v, und
Seite 1:
Metadatenverwaltung zur qualitätso
Seite 4 und 5:
Abstract The goal of a data warehou
Seite 7 und 8:
Inhaltsverzeichnis 1 Einleitung 1 1
Seite 9 und 10:
INHALTSVERZEICHNIS ix 5.3.3 Metadat
Seite 11 und 12:
INHALTSVERZEICHNIS xi A Telos-Model
Seite 13 und 14:
Kapitel 1 Einleitung Data-Warehouse
Seite 15 und 16:
1.1 Zielsetzung und Forschungsfrage
Seite 17 und 18:
1.2 Wesentliche Ergebnisse und Aufb
Seite 19 und 20:
Kapitel 2 Umfeld der Arbeit In dies
Seite 21 und 22:
2.1 Data-Warehouse-Systeme 9 Die An
Seite 23 und 24:
2.1 Data-Warehouse-Systeme 11 in sp
Seite 25 und 26:
2.2 Datenintegration 13 Exportschem
Seite 27 und 28:
2.2 Datenintegration 15 Die Schwier
Seite 29 und 30:
2.2 Datenintegration 17 in den Date
Seite 31 und 32:
2.2 Datenintegration 19 und Abbildu
Seite 33 und 34:
2.3 Metadatenverwaltung 21 • Die
Seite 35 und 36:
2.3 Metadatenverwaltung 23 Resource
Seite 37 und 38:
2.3 Metadatenverwaltung 25 Verwaltu
Seite 39 und 40:
2.3 Metadatenverwaltung 27 M2-Ebene
Seite 41 und 42:
2.3 Metadatenverwaltung 29 P(#EType
Seite 43 und 44:
2.3 Metadatenverwaltung 31 Architek
Seite 45 und 46:
Kapitel 3 Ein Metamodell für die A
Seite 47 und 48:
3.1 DW-Architekturen in kommerziell
Seite 49 und 50:
3.1 DW-Architekturen in kommerziell
Seite 51 und 52:
3.2 Metadatenstandards für Data-Wa
Seite 53 und 54:
3.3 Motivation für ein erweitertes
Seite 55 und 56:
3.4 Ein erweitertes Metamodell für
Seite 57 und 58:
3.4 Ein erweitertes Metamodell für
Seite 59 und 60:
3.5 Umsetzung des Rahmenwerks in Te
Seite 61 und 62:
3.5 Umsetzung des Rahmenwerks in Te
Seite 63 und 64:
3.6 Anwendungen und Beispiele 51 3.
Seite 65 und 66:
3.6 Anwendungen und Beispiele 53 di
Seite 67 und 68:
3.6 Anwendungen und Beispiele 55 Ab
Seite 69 und 70:
3.6 Anwendungen und Beispiele 57 Ab
Seite 71 und 72:
3.7 Fazit 59 "SoftwareDeployment_Pr
Seite 73 und 74:
Kapitel 4 Prozesse in Data-Warehous
Seite 75 und 76:
4.1 Prozess- und Workflow-Modellier
Seite 77 und 78:
4.2 Repräsentation von DW-Prozesse
Seite 79 und 80:
4.3 Ein Metamodell für Data-Wareho
Seite 81 und 82:
4.3 Ein Metamodell für Data-Wareho
Seite 83 und 84:
4.4 Evolution des Data-Warehouse-Sy
Seite 85 und 86:
4.4 Evolution des Data-Warehouse-Sy
Seite 87 und 88:
4.6 Fazit 75 end c: $ (~act steps t
Seite 89 und 90:
Kapitel 5 Datenqualität in Data-Wa
Seite 91 und 92: 5.1 Stand der Praxis und Forschung
Seite 107 und 108: 5.2 Qualitätsdimensionen in Data-W
Seite 113 und 114: 5.3 Ein Modell zur Erfassung der Qu
Seite 123 und 124: 5.4 Qualitätsfaktoren für Data-Wa
Seite 125 und 126: 5.5 Vorgehensmodell für das Qualit
Seite 127 und 128: 5.5 Vorgehensmodell für das Qualit
Seite 129 und 130: 5.6 Messung und Verbesserung der Da
Seite 131 und 132: 5.7 Data-Warehouse-Prozesse und Qua
Seite 133 und 134: 5.7 Data-Warehouse-Prozesse und Qua
Seite 135 und 136: 5.8 Fazit 123 Evolutionsoperation B
Seite 137 und 138: Kapitel 6 Ein Verfahren zur qualit
Seite 139 und 140: 6.1 Bisherige Algorithmen zur Daten
Seite 141: 6.1 Bisherige Algorithmen zur Daten
Seite 149 und 150: 6.2 Formalisierung des Rahmenwerks
Seite 159 und 160: 6.3 Anfrageumschreibung zur Datenin
Seite 175 und 176: 6.4 Qualitätsorientierte Dateninte
Seite 183 und 184: 6.5 Systemunterstützung für das Q
Seite 189 und 190: 6.6 Fazit 177 geforderten DW-Relati
Seite 191 und 192: Kapitel 7 Praktische Erfahrungen un
Seite 193 und 194:
7.1 Effizientere Sichtenwartung dur
Seite 195 und 196:
7.1 Effizientere Sichtenwartung dur
Seite 197 und 198:
7.2 Verbesserung der Qualität in d
Seite 199 und 200:
Seite 201 und 202:
Seite 203 und 204:
7.3 Integration von DW-Applikatione
Seite 205 und 206:
7.3 Integration von DW-Applikatione
Seite 207 und 208:
7.4 Elektronische Marktplätze im B
Seite 209 und 210:
Seite 211 und 212:
Seite 213 und 214:
Seite 215 und 216:
Seite 217 und 218:
Seite 219 und 220:
7.5 Semantisch unterstützte Inform
Seite 221 und 222:
Seite 223 und 224:
Seite 225 und 226:
7.6 Fazit 213 genutzt wurde). Das P
Seite 227 und 228:
Kapitel 8 Zusammenfassung und Ausbl
Seite 229 und 230:
8.2 Ausblick 217 8.2 Ausblick Die e
Seite 231 und 232:
Anhang A Telos-Modelle A.1 Architek
Seite 233 und 234:
A.1 Architekturmodell 221 Relations
Seite 235 und 236:
A.1 Architekturmodell 223 A.1.5 Erw
Seite 237 und 238:
A.1 Architekturmodell 225 Class Int
Seite 239 und 240:
A.1 Architekturmodell 227 $ forall
Seite 241 und 242:
A.2 Prozessmodell 229 end Class Com
Seite 243 und 244:
A.3 Qualitätsmodell 231 end subPro
Seite 245 und 246:
A.3 Qualitätsmodell 233 end after
Seite 247 und 248:
Anhang B Qualitätsdimensionen und
Seite 249 und 250:
B.1 Qualitätsdimensionen 237 Quali
Seite 251 und 252:
B.2 Qualitätsfaktoren 239 Qualitä
Seite 253 und 254:
B.2 Qualitätsfaktoren 241 Model Co
Seite 255 und 256:
B.2 Qualitätsfaktoren 243 DW_Compo
Seite 257 und 258:
B.2 Qualitätsfaktoren 245 Benutzun
Seite 259 und 260:
B.2 Qualitätsfaktoren 247 LogcialO
Seite 261 und 262:
Anhang C O-Telos-Axiome Die Axiome
Seite 263 und 264:
Literaturverzeichnis A. E. Abbadi,
Seite 265 und 266:
LITERATURVERZEICHNIS 253 P. A. Bern
Seite 267 und 268:
LITERATURVERZEICHNIS 255 M. J. Care
Seite 269 und 270:
LITERATURVERZEICHNIS 257 D. Fensel,
Seite 271 und 272:
LITERATURVERZEICHNIS 259 A. Y. Hale
Seite 273 und 274:
LITERATURVERZEICHNIS 261 M. Jarke (
Seite 275 und 276:
LITERATURVERZEICHNIS 263 D. Lehmann
Seite 277 und 278:
LITERATURVERZEICHNIS 265 H. W. Niss
Seite 279 und 280:
LITERATURVERZEICHNIS 267 M. Rittber
Seite 281 und 282:
LITERATURVERZEICHNIS 269 M. Staudt
Seite 283 und 284:
LITERATURVERZEICHNIS 271 E. Yu und
Alle anzeigen

Dokument 1 - RWTH Aachen University

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?