21.12.2012 Aufrufe

Klassifikation von Mustern

Klassifikation von Mustern

Klassifikation von Mustern

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

422 KAPITEL 4. NUMERISCHE KLASSIFIKATION (VK.2.3.3, 07.09.2005)<br />

zuverlässigen Schätzungen, die z. B. mit einer kleinen klassifizierten Stichprobe gemäß (4.2.8),<br />

(4.2.9) berechnet wurden.<br />

4.8.4 Analyse <strong>von</strong> Häufungsgebieten<br />

In diesem Abschnitt werden Methoden zum unüberwachten Lernen vorgestellt, bei denen die<br />

Ermittlung <strong>von</strong> Klassen in einer Stichprobe im Vordergrund steht, aber nicht das Training eines<br />

Klassifikators; dieses ließe sich mit der zerlegten Stichprobe nachträglich überwacht ausführen.<br />

Zu diesem Gebiet der Analyse <strong>von</strong> Häufungsgebieten (“cluster analysis”) gibt es zahlreiche<br />

Ansätze, <strong>von</strong> denen hier einige als Beispiel erläutert werden. Die Grundlage aller Verfahren ist<br />

Postulat 6 <strong>von</strong> Abschnitt 1.3.<br />

Abbildung in die Ebene<br />

Einen ersten (subjektiven) Eindruck <strong>von</strong> der Struktur einer unklassifizierten Stichprobe erhält<br />

man, wenn man die M–dimensionalen Muster f oder die n–dimensionalen Merkmalsvektoren<br />

c in eine Ebene (auf ein Display) abbildet, d. h. auf n ′ = 2–dimensionale Vektoren reduziert.<br />

Ähnliche Muster, die vermutlich in eine Klasse gehören, sind in einer grafischen Darstellung<br />

als benachbarte Punkte erkennbar. Die Klasseneinteilung erfolgt also interaktiv. Die Abbildung<br />

muss die im R n vorhandenen Abstände möglichst gut im R 2 wiedergeben. Die lineare Abbildung<br />

(3.2.2), wobei die Matrix Φ mit Satz 3.8, S. 224, und dem Kern Q (1) in (3.8.8), S. 225,<br />

berechnet wird, ist eine einfache Methode. Bessere Ergebnisse werden in der Regel <strong>von</strong> strukturerhaltenden<br />

nichtlinearen Abbildungen erwartet, jedoch zeigt ein Vergleich an verschiedenen<br />

Beispielen, dass die einfache lineare Abbildung oft ausreicht bzw. zumindest ein guter Startpunkt<br />

ist.<br />

Im Allgemeinen wird eine Stichprobe ω = { ϱ c, ϱ = 1, . . . , N} <strong>von</strong> <strong>Mustern</strong> ϱ c ∈ R n<br />

in eine Stichprobe ω ′ = { ϱ c ′ , ϱ = 1, . . . , N} <strong>von</strong> <strong>Mustern</strong> ϱ c ′ ∈ R n′<br />

, n ′ < n abgebildet.<br />

Die Abbildung soll so sein, dass möglichst alle Abstände <strong>von</strong> <strong>Mustern</strong> aus ω gleich denen <strong>von</strong><br />

<strong>Mustern</strong> aus ω ′ sind. Da dieses für n ′ < n i. Allg. nicht exakt möglich ist, wird iterativ eine<br />

Abbildung bestimmt, die die Unterschiede in den Abständen minimiert. Dazu werden Abstände<br />

djk bzw. d ′ jk für zwei Muster j c, k c ∈ ω bzw. j c ′ , k c ′ ∈ ω ′ sowie ein Fehler ε(ω, ω ′ ) für den<br />

Unterschied der Abstände der Muster definiert. Beispiele sind<br />

djk = ( j c − k c) T ( j c − k c) , d ′ jk = (j c ′ − k c ′ ) T ( j c ′ − k c ′ ) ,<br />

ε(ω, ω ′ ) =<br />

N<br />

j−1 <br />

d<br />

j=2 k=1<br />

p<br />

jk (djk − d ′ jk )2<br />

N j−1 <br />

d<br />

j=2 k=1<br />

p+2<br />

jk<br />

,<br />

(4.8.24)<br />

wobei die einfache Version mit p = 0 bereits sehr gute Ergebnisse bringt. Durch ein Iterationsverfahren<br />

werden die Muster ϱc ′ ∈ Rn′ so verschoben, dass ε(ω, ω ′ ) minimiert ist. Dieses ist<br />

offenbar für beliebige Werte <strong>von</strong> n ′ < n möglich. Für Einzelheiten zu geeigneten Iterationsverfahren<br />

wird auf die Literatur verwiesen.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!