pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...

Weitere Magazine

Empfehlungen

Info

• similarityflooding.relationalschema enthält in RelationalSchema die Darstellung eines Relationalen Datenbankschemas, bestehend aus Relationen (RSRelation) und Attributen (RSAttribute). Die Klasse SchemaReader ermöglicht das Einlesen eines Schemas aus einer Textdatei. • similarityflooding.resultfilters implementiert die Stable Marriage zum Filtern der Ergebnisse des Similarity Flooding. SMNode stellt dabei einen Knoten bereit, zu dem in StableMarriage der entsprechende „Partner“ gesucht wird. • similarityflooding.spgraph dient zur Darstellung eines Similarity Propagation Graph (in der Klasse SPGraph), bestehend aus Kanten (SPEdge) und Knoten (SPNode) 6.4. Umgang mit Graphen Da das Similarity Flooding graph-basiert arbeitet, werden intern Graphen für die Darstellung der Daten verwendet. Dabei werden hier zwei verschiedene graphische Strukturen verwendet. Die Klasse ModelGraph dient zur Darstellung eines Modell-Graphen, also einer graphischen Repräsentation eines Modells. Knoten des Modell-Graphen – dargestellt in der Klasse MGNode – haben einen Namen, ansonsten keine weiteren Informationen. Gerichtete Kanten – dargestellt in MGEdge – verbinden jeweils zwei Knoten und haben eine Kantenmarkierung in Form eines Strings. Um zwei Modell-Graphen zusammenzuführen, stellt die Klasse MGtoSPGTranformation die Methode transform bereit. Diese wandelt zwei Objekte der Klasse ModelGraph in ein SPGraph-Objekt um. SPGraph ist die Darstellung eines Similarity Propagation Graph, wie er in Kapitel 4 beschrieben wurde. Jeder Knoten (SPGNode) enthält dabei die zwei Namen der korrespondierenden Knoten der beiden Modelle, den Ähnlichkeitswert und eine einfache Markierung, die für die Wiederholungen des Verfahrens benötigt wird. Gerichtete Kanten (SPGEdge) verbinden jeweils zwei Knoten und speichern die Kantenmarkierung sowie den Propagation-Koeffizienten. In der Methode calculateSimilarity der Klasse SPGraph ist das eigentliche Similarity Flooding implementiert. Über die zwei Parameter number und normalizationFormula wird die Anzahl der Iterationen, nach der das Verfahren spätestens abbricht, und die verwendete Fixpunktformel festgelegt. Das Verfahren an sich wurde wie in Kapitel 4 beschrieben umgesetzt. Um zusätzliche Funktionen – wie etwa das Speichern der Ergebnisse jeder Iteration in einer Textdatei – zu ermöglichen, wurden zwar einige Codezeilen hinzugefügt, die Berechnungen der Ähnlichkeitswerte mit dem Similarity Flooding werden dadurch jedoch nicht beeinflusst. 42
AUTOR(Name (PK), Geburtsdatum); BUCH(ISBN (PK), Autor (FK) -> AUTOR, Titel); AUTOR(Name, Geburtsdatum) BUCH(ISBN, Autor → AUTOR, Titel) Abbildung 6.8.: Beispiel für ein gültiges Schema als Input (oben) und äquivalente Darstellung des Schemas (unten) 6.5. Umgang mit Relationalen Datenbankschemata Relationale Datenbankschemata können mit Hilfe der Klasse SchemaReader aus Textdateien eingelesen werden. Damit aus den Texten gültige Dateien erzeugt werden können, müssen sie folgendermaßen aufgebaut sein: • Jede Relation hat die Form Relationenname(Attribut1, Attribut2, ...); • Primärschlüsselattribute sind durch „Attributname (PK)“ zu kennzeichnen • Fremdschlüssel sind durch „Attributname (FK) -> Relationenname“ zu kennzeichnen • primäre Fremdschlüssel sind durch „Attributname (FPK) -> Relationenname“ zu kennzeichnen • normale Attribute sind durch „Attributname“ zu kennzeichnen • Primärschlüsselattribute (PK) stehen hinter den primären Fremdschlüsselattribute (FPK) Abbildung 6.8 stellt ein einfaches Schema dar, das als gültige Eingabe erkannt und eingelesen werden kann. Darunter ist die gewohnte Darstellung des Schemas abgebildet. Haben sie diese Struktur, erzeugt die Methode read der Klasse SchemaReader daraus ein RelationalSchema-Objekt mit einer Menge von Relationen (RSRelation) und zugehörigen Attributen (RSAttribute). Im Programm geschieht das Umwandeln automatisch nach Auswahl gültiger Textdateien mit Schemata im Schema-Menü und Drücken des umwandeln-Buttons. Die Methode transform der Klasse RelationalSchema wandelt das jeweilige Schema in einen Modell-Graphen um. Dabei sind zwei verschiedene Verfahren (transform_1 und transform_2) implementiert, die zwei unterschiedliche graphische Darstellungen erzeugen und durch Angabe von 1 oder 2 als Parameterwert für method beim Aufruf von transform ausgewählt werden können. transform_2 erzeugt dabei die Darstellung, die für die Experimente in Kapitel 7.3 verwendet und dort näher beschrieben wird. transform_1 diente für frühere Experimente, die im Rahmen der Arbeit nicht weiter beschrieben werden. 43
Seite 1 und 2: Leibniz Universität Hannover Insti
Seite 3 und 4: Inhaltsverzeichnis 1. Einleitung 5
Seite 5 und 6: 1. Einleitung 1.1. Motivation und S
Seite 7 und 8: 2. Grundlagen In diesem Kapitel sol
Seite 9 und 10: Möglichkeiten erläutert, wie Mapp
Seite 11 und 12: (etwa OLA oder Microsoft BizTalk Ma
Seite 13 und 14: Abbildung 3.2.: Klassifizierung von
Seite 15 und 16: 4. Der Similarity Flooding Algorith
Seite 17 und 18: Definition 4.1 Seien A und B zwei M
Seite 19 und 20: Gemäß der Definition wird also zu
Seite 21 und 22: Abbildung 4.3.: Similarity Propagat
Seite 23 und 24: durch die Formel darstellen, wobei
Seite 25 und 26: Tabelle 4.3 dargestellt sind. Währ
Seite 27 und 28: Abbildung 4.4.: Bipartiter Graph (l
Seite 29 und 30: Das Zuordnungsproblem Beim Zuordnun
Seite 31 und 32: 5. Vergleich mit anderen Verfahren
Seite 33 und 34: (vorgeschlagen ist ein Unterschied
Seite 35 und 36: durchgeführt werden müssen, um ei
Seite 37 und 38: 6. Implementierung der Testumgebung
Seite 39 und 40: Abbildung 6.4.: Menü mit den Anfan
Seite 41: Abbildung 6.7.: Filterung der Ergeb
Seite 45 und 46: sich allein mit der Qualität des V
Seite 47 und 48: Die Graphen 3, 4 und 5 sind jeweils
Seite 49 und 50: Graph 1 2 3 4 5 6 7 |Knoten| 6 15 8
Seite 51 und 52: wie sich das allgemein auf das Simi
Seite 53 und 54: Knoten Iteration 1 (a, b) 0 (a 1 ,
Seite 55 und 56: Knoten Iteration 1 2 3 10 20 30 40
Seite 57 und 58: gorithmus arbeiten muss, um zu eine
Seite 59 und 60: Die Beobachtung, dass sich die Kand
Seite 61 und 62: Knoten Iteration 1 2 3 4 5 6 7 8 9
Seite 63 und 64: Einstellen niedriger Anfangsähnlic
Seite 65 und 66: eines Schemas in einen Graphen. Im
Seite 67 und 68: ER_MITARBEITER aus Schema 2 kann zu
Seite 69 und 70: 1 für α in der Vorverarbeitung da
Seite 71 und 72: Musiksammlung Bei den Musiksammlung
Seite 73 und 74: durch Festlegen von Anfangsähnlich
Seite 75 und 76: den Benutzer berücksichtigt wurde,
Seite 77 und 78: Literaturverzeichnis [DMR02] [Dra93
Seite 79 und 80: A. Anhang - Für Experimente verwen
Seite 81 und 82: A.2. Graph 2 Abbildung A.4.: Graph
Seite 83 und 84: A.3. Graph 3 Abbildung A.7.: Graph
Seite 85 und 86: Abbildung A.10.: Graph 4: Pairwise
Seite 93 und 94:
Abbildung B.3.: Graph zu Schema 1 9
Seite 95 und 96:
B.2. Bustouren STADT (Name, Highlig
Seite 97 und 98:
Abbildung B.8.: Graph zu Schema 2 9
Seite 99 und 100:
Abbildung B.11.: Graph zu Schema 1
Seite 101 und 102:
B.4. Filmdatenbank MOVIE (movie, ti
Seite 103 und 104:
Abbildung B.16.: Graph zur Schema 2
Seite 105 und 106:
Schema 1 Schema 2 Ähnlichkeitswert
Seite 107 und 108:
Seite 109 und 110:
Seite 111 und 112:
Seite 113 und 114:
Seite 115 und 116:
Seite 117 und 118:
Seite 119:
Alle anzeigen

pdf (18647 Kb) - Fachgebiet Datenbanken und Informationssysteme ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?