21.12.2012 Aufrufe

Klassifikation von Mustern

Klassifikation von Mustern

Klassifikation von Mustern

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

4.8. UNÜBERWACHTES LERNEN (VA.1.2.3, 13.04.2004) 429<br />

(4.8.44) zu behalten. Der verbleibende Parameter σ in (4.8.37) ist empirisch zu wählen. Er hängt<br />

<strong>von</strong> der mittleren Distanz der Merkmalsvektoren in der Stichprobe ab.<br />

Hierarchische Zerlegungen<br />

Um einen günstigen Kompromiss zwischen der Zahl der Klassen und der Homogenität der<br />

Muster in einer Klasse zu finden, eignen sich hierarchische Zerlegungen, die ähnlich wie in<br />

Bild 4.6.2b eine Folge zunehmend verfeinerter Zerlegungen liefern. Unter einer Hierarchie H<br />

<strong>von</strong> Zerlegungen wird eine Folge <strong>von</strong> (m + 1) Zerlegungen A 0 , A 1 , . . . , A m der Stichprobe ω<br />

verstanden, wobei<br />

A 0 = {{ 1 c}, { 2 c}, . . . , { N c}} ,<br />

A m = {ω} (4.8.46)<br />

ist. Die Zerlegung A 0 enthält N Klassen mit je einem Muster, die Homogenität jeder Klasse ist<br />

maximal; dagegen enthält A m nur eine Klasse mit N <strong>Mustern</strong>, die Homogenität dieser Klasse<br />

ist minimal. Weiterhin sei A ν−1 eine feinere Zerlegung als A ν , ν = 1, . . . , m, d. h., dass die<br />

Klassen aus A ν immer durch Vereinigung <strong>von</strong> zwei oder mehr Klassen aus A ν−1 entstehen.<br />

Die zu einer Zerlegung A ν gehörigen Klassen seien disjunkt. Die Hierarchie H besteht also<br />

aus Teilmengen ω1, ω2, . . . , ωl <strong>von</strong> ω mit den oben angegebenen Eigenschaften. Ein Maß h zur<br />

Bewertung einer Hierarchie H ist eine für alle Teilmengen ωλ, λ = 1, . . . , l definierte Funktion,<br />

die den Bedingungen<br />

h(ωλ) ≥ 0 ,<br />

ωκ ⊂ ωλ ⇒ h(ωκ) < h(ωλ) (4.8.47)<br />

genügt. Beispiele für solche Funktionen sind<br />

h(ωλ)1 = max<br />

jc, kc∈ωλ<br />

djk ,<br />

h(ωλ)2 = <br />

j,k<br />

djk ,<br />

h(ωλ) = <br />

( j c − µ) 2 , (4.8.48)<br />

j<br />

wobei djk ein Abstandsmaß für zwei Muster j c, k c, z. B. gemäß (4.2.146), S. 355, ist. Damit lässt<br />

sich eine Hierarchie anschaulich als Dendrogramm wie in Bild 4.8.4 darstellen. In einer Stichprobe<br />

werden Muster in irgendeiner Reihenfolge angeordnet sein; das bedeutet, dass i. Allg.<br />

nicht in der Stichprobe benachbarte Muster zusammengefasst werden und sich eine kreuzungsfreie<br />

Darstellung erst nach einer Umordnung ergibt.<br />

Hierarchien lassen sich im Wesentlichen auf zwei Arten konstruieren. Bei den agglomerativen<br />

oder “bottom–up” Verfahren beginnt man mit A 0 , also der feinsten Zerlegung und fasst<br />

schrittweise Klassen zu übergeordneten Klassen zusammen, bis man bei A m endet. Die divisiven<br />

oder “top–down” Verfahren beginnen mit A m und zerlegen solange Klassen in homogenere<br />

Unterklassen, bis A 0 erreicht ist. Da die letzteren Verfahren mehr Rechenaufwand verursachen,<br />

wird hier nur das Prinzip der agglomerativen Konstruktion in Bild 4.8.5 gezeigt.<br />

Damit die gefundene Hierarchie die Struktur der Stichprobe gut wiedergibt, sollte bei der<br />

Bildung neuer Klassen der Zuwachs an Inhomogenität möglichst klein sein. Durch unterschied-

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!