PDF-Download - Deutsche Geodätische Kommission

Weitere Magazine

Empfehlungen

Info

110 KAPITEL 9. DISKUSSION UND AUSBLICK unterscheidet unser Verfahren wesentlich von allgemeinen hierarchischen Clusterverfahren, die typischerweise immer einen einzigen Cluster als Grenzwert liefern und deshalb eine Vorgabe der maximalen Anzahl der Cluster benötigen. • Unser Verfahren liefert Ergebnisse, die sehr gut mit der menschlichen Wahrnehmung vergleichbar sind und benötigt dafür keinerlei Vorgaben von Parametern, noch müssen solche geschätzt werden. Ebenfalls muss keinerlei Abbruchkriterium angegeben werden. Alle relevanten Informationen können aus den Nachbarschaftsgraphen abgeleitet werden. Somit bietet sich unser Verfahren hervorragend für die kartographische Generalisierung und für die explorative Datenanalyse an. • Die Verwendung der Delaunay-Triangulation und die äußere und innere Kantenmenge liefert uns sofort eine geometrische Randbeschreibung der gefundenen Cluster. 9.2 Ausblick Die von uns durchgeführten Untersuchungen deckten natürlich einige Probleme auf und ergaben folgende Fragestellungen für zukünftige Untersuchungen: • Die Ableitung von Gebäudehypothesen aus Katasterdaten bringt die Frage auf, ob es generell möglich ist, durch Erfassung geeigneter, nicht geometrischer Attribute eine dreidimensionale Darstellung zu erzeugen, die beim Betrachter eine hohe Wiedererkennungsrate zur Realität erzeugt, ohne dass explizit die genaue dreidimensionale Form gespeichert wurde. Beispiele für solche Attribute wären z.B. der Fassadentyp, -material und -farbe oder ob die Dachform dem Grundriss folgt oder nicht. Wichtig wären auch Informationen über die Farbe und das Material des Daches. Wir wollen diese Problematik unter dem Begriff Rapid Visualization einordnen und sehen hier erheblichen Forschungsbedarf, da unserer Meinung die digitale Speicherung und Verwaltung der vollständigen dreidimensionalen Baupläne noch bis in die nahe Zukunft unter ökonomischen Gesichtspunkten nicht realisierbar sein wird. Eine Untersuchung zu typischen Gebäudemerkmalen und ihrer Wahrscheinlichkeit sowie der gegenseitigen Abhängigkeit wurde in (Fischer 1997) durchgeführt. Jedoch kann hier kein Anspruch auf Allgemeinheit gestellt werden, da dazu das untersuchte Gebiet zu klein war und auch die Menge der untersuchten Merkmale sehr klein war. Die automatische Ableitung von solchen typischen Merkmalen und ihrer Abhängigkeit untereinander könnte durch eine Clusteranalyse (wie z.B. mit unserem Verfahren) großer Gebäudeinformationssysteme unterschiedlicher Landschaftsregionen automatisiert werden. • In ATKIS werden Straßen als Linien erfasst 1 und in der ALK als Flächen abgelegt; genauer gesagt wird in der ALK das Flurstück, auf dem die Straße verläuft, erfasst. In unserem Verfahren zur Ableitung von ATKIS-Daten aus ALK-Daten sind wir jedoch nicht auf die geeignete ATKIS-Generalisierung der Flurstücksgrenzen eingegangen und haben uns auf die Ableitung neuer Flächen ohne Anpassung der Geometrie beschränkt. Wann diese Generalisierung durchgeführt wird, d.h. vor oder nach der Ableitung neuer Flächenobjekte, ist unerheblich. Es ist jedoch zu untersuchen, wie die Ableitung dieser generalisierten Geometrie geeignet durchgeführt werden kann. Daraus ergeben sich zwei mögliche Lösungsansätze: – Vorgabe eines generalisierten Straßennetzes, womit sich das Problem auf ein geeignetes Matchingverfahren der Flurstücksgrenzen auf das gegebene Straßennetz beschränkt oder – der Ableitung der Straßengeometrie aus den ALK-Daten durch geeignete Skelettierung der Straßenflurstücke und gleichzeitigem oder separatem Matching der gegebenen Flurstücksgrenzen. Generell wäre es interessant zu wissen, wie genau man die ATKIS-Straßengeometrie aus ALK-Daten ableiten kann. • Die Auswertung der manuell erfassten Cluster zeigte, dass der Mensch bei der Gruppierung von punkthaften Objekten nicht nur die homogene Anordnung berücksichtigt, sondern auch die Form des Clusters. Die Erweiterung unseres Verfahrens um Formeigenschaften, wie z.B. linear, kreisförmig oder rechteckig wäre eine interessante Aufgabe, die das Ergebnis unseres Verfahrens sicherlich noch weiter verbessern würde. 1 Ausnahme sind befahrbare Plätze, die als Fläche erfasst werden.
9.2. AUSBLICK 111 • Neben der expliziten Berücksichtigung der Form eines Clusters ist auch die Definition und Verwendung von Rauschmodellen eine offene Frage und bietet ein breites Feld an Forschungsmöglichkeiten. • Auch wenn es unser Ziel war, ein vollständig parameterfreies Verfahren zu definieren, so wäre die Angabe eines Qualitätsmaßes wünschenswert, wie z.B. finde die Gruppen von Objekten, die mit 90% Wahrscheinlichkeit zusammengehören. Eine andere Möglichkeit wäre, dass das Verfahren zu jedem Cluster einen Wahrscheinlichkeitswert oder ein Konfidenzintervall liefert, denn unser Verfahren liefert nur den MAD (Homogenität) der Clusterdichte als Qualitätsmaß eines Clusters. Um eine fundierte qualitative Beurteilung zu ermöglichen, müsste untersucht werden, wie unser Verfahren mit einem verteilungsunabhängigen Testverfahren (parameterfreie Statistik) erweitert werden kann, denn eine Annahme über die Art der Verteilung sollte weiterhin nicht notwendig sein. • Das Fundament unseres beschriebenen Verfahrens ist die Delaunay-Triangulation, da aus ihr in effizienter Weise alle anderen Nachbarschaftsgraphen abgeleitet werden können und sie es uns zusätzlich ermöglicht, mit Hilfe der äußeren und inneren Kantenmengen eine Randbeschreibung der gefundenen Cluster angeben zu können. So schön dieser formale Ansatz auch ist, so hat er in der Praxis jedoch einen wesentlichen Nachteil. Im Falle großer und hochdimensionaler (d >4) Datensätze ist die Delaunay-Triangulation im allgemeinen nicht geeignet, denn die Zeitkomplexität zur Berechnung der Delaunay-Triangulation beträgt für d>2dannO(n ⌈ d 2 ⌉ ), gegenüber O(nlogn) im zweidimensionalen Fall, und die Speicherkomplexität ist dann ebenfalls nicht mehr linear sondern O(n 2 ). Der relative Nachbarschaftsgraph und der Gabriel-Graph weisen zwar bei direkter Berechnung eine etwas günstigere Zeitkomplexität auf, sie besitzen jedoch ebenfalls für d>3 keine lineare Speicherkomplexität mehr. In diesen Fällen erweisen sich die k-Nächsten-Nachbargraphen und der minimal spannende Baum als erheblich günstiger, da sie im allgemeinen für beliebige Dimensionen eine Speicherkomplexität von O(n) besitzen. In (Kleinberg 1997) und (Eppstein 1998) werden effiziente Methoden zur Berechnung von Nächsten-Nachbargraphen für beliebige Dimensionen beschrieben. Es wäre deshalb sehr interessant zu untersuchen, wie sich die Hierarchie der k-Nächsten-Nachbargraphen verhält und ob unser Verfahren mit diesen Graphen ähnliche oder vielleicht sogar bessere Ergebnisse liefert. Welche k-Nächsten-Nachbargraphen wären notwendig (z.B. 1, 2, 3, 4 oder 5)? Verhält sich diese Hierarchie bezüglich der Clusteranzahl in gleicher Weise, wie die von uns verwendete Hierarchie? • Als letztes sei noch unser iterativer Clusteransatz erwähnt. Das von uns definierte Modell wurde eingesetzt, da es eine einzige einheitliche Clusterdefinition und Aggregationsvorschrift für den nicht-iterativen und iterativen Fall ermöglicht und somit nicht zwischen Clustern von Clustern und Clustern von einzelnen Objekten unterschieden werden muss. Bei diesem Modell gehen jedoch alle gewonnenen Informationen über ein Cluster bei jedem Iterationsschritt verloren, was besonders bei regelmäßig angeordneten Strukturen zur Gruppierung benachbarter Cluster unterschiedlicher Dichte führt (siehe Testergebnisse für die künstlichen Testdaten in Abbildung 8.13 auf Seite 97). Es stellt sich somit die Frage, ob, und wenn ja wie, unser Modell erweitert werden kann, um ein einheitliches Modell zu erhalten, das nur die iterative Gruppierung von regelmäßig angeordneten Clustern gleicher Dichte erlaubt und Cluster unterschiedlicher Dichte verbietet.
Seite 1:
DEUTSCHE GEODÄTISCHE KOMMISSION be
Seite 4 und 5:
Adresse der Deutschen Geodätischen
Seite 6 und 7:
5 Ähnlichkeits- und Distanzmaße 3
Seite 9 und 10:
7 Zusammenfassung Die Notwendigkeit
Seite 11 und 12:
9 Kapitel 1 Einleitung 1.1 Motivati
Seite 13 und 14:
1.3. ABGRENZUNG ZU ANDEREN ARBEITEN
Seite 15 und 16:
13 Kapitel 2 Interpretation raumbez
Seite 17 und 18:
2.1. ABLEITUNG VON 3D-GEBÄUDEHYPOT
Seite 19 und 20:
2.2. FORTFÜHRUNG VON ATKIS-DATEN B
Seite 21 und 22:
Seite 23 und 24:
Seite 25 und 26:
Seite 27 und 28:
25 Kapitel 3 Data Mining und Knowle
Seite 29 und 30:
3.2. DATA MINING AUFGABEN UND METHO
Seite 31 und 32:
3.3. RAUMBEZOGENES DATA MINING 29 G
Seite 33 und 34:
31 Kapitel 4 Clusteranalyse Abbildu
Seite 35 und 36:
4.2. HIERARCHISCHES UND NICHT-HIERA
Seite 37 und 38:
4.3. GRAPHBASIERTES CLUSTERING 35
Seite 39 und 40:
37 Kapitel 5 Ähnlichkeits- und Dis
Seite 41 und 42:
5.2. ÄHNLICHKEIT 39 M-Koeffizient
Seite 43 und 44:
5.2. ÄHNLICHKEIT 41 Merkmale Haus
Seite 45 und 46:
5.3. DISTANZ 43 Definition 5.3.2 (M
Seite 47 und 48:
5.4. DISTANZ- UND ÄHNLICHKEITSMASS
Seite 49 und 50:
Seite 51 und 52:
Seite 53 und 54:
5.6. DISKUSSION 51 dies als direkte
Seite 55 und 56:
53 Kapitel 6 Nachbarschaftsgraphen
Seite 57 und 58:
6.1. GRAPHEN 55 Definition 6.1.3 (E
Seite 59 und 60:
6.1. GRAPHEN 57 Brückenkante Endka
Seite 61 und 62: 6.1. GRAPHEN 59 (a) Kette (b) Stern
Seite 63 und 64: 6.2. TYPEN VON NACHBARSCHAFTSGRAPHE
Seite 69 und 70: 6.3. HIERARCHIE DER NACHBARSCHAFTSG
Seite 71 und 72: 6.4. KOMPLEXITÄT 69 6.4 Komplexit
Seite 73 und 74: 71 Kapitel 7 Hierarchisches Nachbar
Seite 75 und 76: 7.2. WAS IST EIN NACHBARSCHAFTSGRAP
Seite 77 und 78: 7.3. SCHÄTZUNG VON CLUSTERMERKMALE
Seite 79 und 80: 7.4. MEDIANBASIERTE ÄHNLICHKEITSRE
Seite 81 und 82: 7.4. MEDIANBASIERTE ÄHNLICHKEITSRE
Seite 83 und 84: 7.5. HPGCL-ALGORITHMUS 81 Diese Ran
Seite 85 und 86: 7.8. VERALLGEMEINERUNG AUF QUALITAT
Seite 87 und 88: 7.9. BERECHNUNG DER RANDBESCHREIBUN
Seite 89 und 90: 87 Kapitel 8 Evaluierung des HPGCL-
Seite 91 und 92: 8.1. TESTDATEN 89 (a) ohne Rauschen
Seite 93 und 94: 8.2. AUSWIRKUNG DER NACHBARSCHAFTSG
Seite 99 und 100: 8.3. ERGEBNISSE FÜR DIE KÜNSTLICH
Seite 101 und 102: 8.4. ERGEBNISSE FÜR DIE REALEN TES
Seite 103 und 104: 8.5. LAUFZEITVERHALTEN 101 (a) Modu
Seite 107 und 108: 8.5. LAUFZEITVERHALTEN 105 (a) NNG:
Seite 111: 109 Kapitel 9 Diskussion und Ausbli
Seite 115 und 116: Literaturverzeichnis Agarwal, P. &
Seite 117 und 118: LITERATURVERZEICHNIS 115 Goodman, J
Seite 119 und 120: LITERATURVERZEICHNIS 117 Rao, S. (1
Seite 121 und 122: 119 Anhang A Manuelle Auswertungen
Seite 123 und 124: 121 (a) Auswertung 5 (b) Auswertung
Seite 125 und 126: 123 (a) Auswertung 3 (b) Auswertung
Seite 127 und 128: 125 Anhang B Testmessungen Die hier
Seite 129 und 130: 127 Tabelle B.1 - Fortsetzung von v
Seite 131 und 132: 129 Anhang C Nachbarschaftsgraphen
Seite 133 und 134: 131 (a) 4-Nächster-Nachbar-Graph (
Seite 135 und 136: 133 Anhang D Auswertung Vaihingen (
Seite 137 und 138: 135 (a) GG (b) NNG-GG (c) DT (d) NN
Seite 139 und 140: 137 Dank Die vorliegende Arbeit ent
Seite 141: 139 Lebenslauf Name Anschrift Gebur
Alle anzeigen

PDF-Download - Deutsche Geodätische Kommission

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?