PDF-Download - Deutsche Geodätische Kommission

96 KAPITEL 8. EVALUIERUNG DES HPGCL-ALGORITHMUS 

8.3 Ergebnisse für die künstlichen Testdaten 

8.3.1 Punktmuster 

Im künstlichen Testdatensatz sollte, nach unserer Meinung, ein optimales Cluster-Verfahren neun Cluster erkennen 

können. Den Kreisring, die Kreisfläche innerhalb des Kreisringes, das Z“, jede der beiden sich berührenden 

” 

Kreisflächen unterhalb des Kreisringes, die quadratische und rechteckige Fläche sowie die beiden ineinander 

verzahnten Flächen. Diese Referenzzerlegung ist jedoch genau betrachtet nicht eindeutig, besonders unter dem 

Aspekt von Punktmengen mit homogenem Abstand als Cluster. Das Z“ besteht genau betrachtet aus vier 

” 

Linien von denen die oberste und unterste den gleichen Punktabstand besitzen – die Assoziation zu einem Z“ ” 

trifft ein menschlicher Operateur aufgrund seines Hintergrundwissens, das unser Verfahren jedoch nicht hat. 

Die sich berührenden Kreisflächen muss man nicht zwangsweise als getrennte Cluster auffassen. Rein unter dem 

Aspekt des homogenen Punktabstandes und da auch nicht konvexe Formen erkannt werden sollen, sind die 

beiden Kreisflächen ein einziger Cluster. Genauso gut kann man die Kreisfläche innerhalb des Kreisringes in elf 

einzelne horizontale Linien zerlegen, da der vertikale Punktabstand größer als der horizontale ist. 

Die Ergebnisse unseres Verfahrens zu diesem Datensatz sind in Abbildung 8.13 dargestellt. Das Ergebnis für 

den Modus 1 (Abb. 8.13a) kommt unserer Vorstellung von einer Referenzzerlegung am nächsten. Es erkennt 

den Kreisring als einen Cluster und innerhalb dieses Clusters einen separaten Cluster. Wie man sieht, trennt 

unser Verfahren sich berührende Cluster gleicher Dichte nicht, was aufgrund unseres Modells auch zu erwarten 

war. Das Z“ wird in fünf Segmente zerlegt und nicht als ein einziges Objekt erfasst. Dieses Ergebnis entspricht 

” 

vollständig unserem Modell, da ja das Z“ aus vier Linien unterschiedlicher Dichte besteht. Dass die diagonale 

” 

Linie in zwei Segmente aufgeteilt wurde, ist nach unserem Modell auch korrekt, da unser Modell nur disjunkte 

Cluster erkennen kann (jeder Punkt kann nur einem Cluster zugeordnet sein) und im Falle von zwei nicht 

disjunkten Clustern immer mindestens einen von beiden Clustern aufteilt. Interessant ist, dass auch beim 

iterativen Clustering das Z“ nie zu einem einzigen Cluster zusammengefasst wird. Das lässt auf eine eindeutige 

” 

dominante Verteilung dieser Cluster schließen. Die Kreisfläche innerhalb des Kreisringes, die aus mehreren 

horizontalen Linien besteht, wird im Gegensatz zum Z“ zu einem Cluster zusammengefasst. Dieses Ergebnis 

” 

stimmt gut mit der menschlichen Wahrnehmung überein. Dieses Ergebnis lässt sich auch mit unserem Modell 

begründen, denn im Gegensatz zum Z“ besitzen alle horizontalen Linien die gleiche Dichte und der Abstand 

” 

zwischen den Linien ist ebenfalls konstant. Wie man an Abbildung 8.15a sieht, werden alle horizontalen Linien als 

separate Cluster erfasst, wenn man nur den NNG in unserem Verfahren verwendet. Die Abbildungen 8.15a und 

b zeigen auch auf, dass im Falle regelmäßig angeordneter Objekte der NNG die wesentliche Cluster-Information 

enthält, da die meisten Cluster, selbst im verrauschten Datensatz schon auf dieser Hierarchiestufe erkannt 

wurden. Wie wir noch zeigen werden, ist dies jedoch im Falle allgemein verteilter Objekte nicht der Fall. 

Wie man an der Anzahl der Cluster erkennt, bewirkt die Vereinigung eines Clusters immer nur mit seinem 

nächsten kompatiblen Cluster (Modus 5, 6, 7 und 8) keinen Unterschied zu der gleichzeitigen Vereinigung 

aller kompatiblen Cluster. Die Ergebnisse in den Modi 2, 4, 6 und 8 zeigen, dass die Grenzzerlegung unseres 

iterativen Clusterings, gegenüber Standardverfahren, nie ein einziger Cluster aller Punkte ist. Diese Ergebnisse 

zeigen jedoch auch, dass im Falle von gleichmäßig verteilten Clustern unser Verfahren ebenfalls zu einem einzigen 

Megacluster führen wird, denn in den Modi 2 und 6 sind die unteren vier Cluster und die untere Linie des ” 

Z“ zu 

einem großen Cluster zusammengefasst worden. Im Modus 4 und 8 wurde dagegen, aufgrund der Maximierung 

des äußeren Abstands, die untere Linie des ” 

Z“ als eigener Cluster klassifiziert. Die Maximierung des äußeren 

Abstands erwirkt somit – wie erwartet – eine strengere Zerlegung. Jedoch führt dies, gegenüber der menschlichen 

Wahrnehmung, wie an den Ergebnissen der Modi 3 und 7 zu sehen, zu unerwarteten Ausreißern, wie der einzelne 

horizontale Linien-Cluster innerhalb des Kreisringes. 

Die Ergebnisse der verrauschten Testdaten (Abb. 8.14) zeigen die Robustheit unseres Verfahrens, da im wesentlichen 

die Cluster der nicht verrauschten Daten wiedererkannt wurden. Die verrauschten Daten bestätigen 

somit das Modell der benachbarten Objekte mit homogenem Abstand. Einzelne Objekte, die durch das Rauschen 

unregelmäßige Abstände, im Gegensatz zu ihren Nachbarn, besitzen, werden nicht zu dem umgebenden 

Cluster hinzugefügt. Es wäre somit möglich, singuläre oder relativ kleine Cluster, die innerhalb großer Cluster 

liegen, als Rauschen zu modellieren. Wie man an Abbildung 8.15b sieht, ist bei regelmäßigen Clustern schon 

allein der NNG sehr robust gegenüber Rauschen. Die Ergebnisse zeigen jedoch auch, dass im Falle einer lokal 

gehäuften Störung die Ergebnisse natürlich verfälscht werden (siehe z.B. Abb. 8.14a und e), da in diesen Fällen 

eigenständige homogene Cluster entstehen, die vom Modell her nicht als Fehler interpretiert werden können. In 

diesen Fällen verbesserte das iterative Clustering, im Sinne der beschriebenen Referenzzerlegung, das Ergebnis,

Vorherige Seite

Nächste Seite

1

3

4

5

6

7

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

99

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

PDF-Download - Deutsche Geodätische Kommission

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?