21.12.2012 Aufrufe

Klassifikation von Mustern

Klassifikation von Mustern

Klassifikation von Mustern

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

3.8. ANALYTISCHE METHODEN (VA.1.2.2, 10.01.2004) 223<br />

3.8.2 Problemabhängige Reihenentwicklung<br />

Abstandskriterien<br />

Wie in Abschnitt 3.2.1 beschränken wir uns in diesem Abschnitt auf lineare orthogonale Transformationen,<br />

d. h. das Muster wird nach einem orthonormalen Basisvektorsystem entwickelt.<br />

Im Unterschied zu Abschnitt 3.2.1 soll hier jedoch dasjenige System ϕ ν, ν = 1, . . . , n bestimmt<br />

werden, das ein geeignet gewähltes Kriterium optimiert. Es wird sich zeigen, dass in<br />

diesem Falle die Vektoren ϕ ν <strong>von</strong> den <strong>Mustern</strong> selbst, genauer <strong>von</strong> einer Stichprobe ω <strong>von</strong><br />

<strong>Mustern</strong> abhängen, also je nach Problem verschieden sind. Daher wird eine solche Entwicklung<br />

auch als problemabhängige Reihenentwicklung bezeichnet. Die im Abschnitt 3.2 vorgestellten<br />

Entwicklungen sind dagegen <strong>von</strong> den <strong>Mustern</strong> unabhängig, sie werden daher auch als<br />

problemunabhängige Entwicklungen bezeichnet.<br />

Zunächst sind also geeignete Kriterien anzugeben, um ein „optimales“ Vektorsystem zu berechnen.<br />

Wenn man Muster j f entwickelt, so mag auf den ersten Blick der Erwartungswert des<br />

quadratischen Approximationsfehlers als geeignetes Kriterium erscheinen. Es wurde aber bereits<br />

darauf hingewiesen, dass es weniger auf gute Approximation als auf sichere <strong>Klassifikation</strong><br />

ankommt. Daher wird dieses Kriterium hier nicht weiter betrachtet. Statt dessen werden, wie<br />

schon im vorigen Abschnitt erwähnt, Kriterien verwendet, die auf Postulat 3 <strong>von</strong> Abschnitt 1.3<br />

beruhen. Da man den aus einem Muster extrahierten Merkmalsvektor als Punkt im Merkmalsraum<br />

auffassen kann, ergibt eine Stichprobe <strong>von</strong> <strong>Mustern</strong> eine Punktmenge in diesem Raum.<br />

Postulat 3 besagt, dass die Punkte (Muster) der gleichen Klasse dicht beisammen liegen sollen,<br />

die verschiedener Klassen weit auseinander. Es ist intuitiv einleuchtend, dass die <strong>Klassifikation</strong><br />

dann besonders einfach ist. Wenn man ein Abstandsmaß definiert, so lassen sich verschiedene<br />

Punktmengen quantitativ vergleichen und die beste – im Sinne <strong>von</strong> Postulat 3 – ermitteln.<br />

Als Maß für den Abstand zweier Merkmalsvektoren wird das Quadrat des EUKLID-Abstands<br />

gewählt. Damit werden die folgenden Kriterien zur Beurteilung einer Menge <strong>von</strong> Merkmalen<br />

ω = { j c | j = 1, . . . , N} angegeben:<br />

1. Mittlerer quadratischer Abstand aller Merkmale <strong>von</strong> allen anderen, definiert durch<br />

s1 = 1<br />

N 2<br />

N<br />

i=1<br />

N ic j T <br />

− c<br />

ic j<br />

− c . (3.8.1)<br />

j=1<br />

2. Mittlerer quadratischer Abstand aller Merkmale { j cκ | j = 1, . . . , Nκ} aus einer Klasse<br />

Ωκ <strong>von</strong> den Merkmalen einer anderen Klasse Ωλ (Interklassenabstand), definiert durch<br />

s2 =<br />

2<br />

k(k − 1)<br />

k κ−1<br />

1<br />

Nκ Nλ <br />

<br />

NκNλ<br />

κ=2 λ=1 i=1 j=1<br />

<br />

icκ<br />

− j T <br />

icκ<br />

cλ − j <br />

cλ . (3.8.2)<br />

Mit der ersten Doppelsumme werden alle verschiedenen Paare <strong>von</strong> Klassen erfasst, nämlich<br />

k<br />

= k(k − 1)/2, mit der zweiten alle Abstände zwischen je einem Merkmalsvektor<br />

2<br />

aus je einer Klasse des betreffenden Klassenpaares. Dabei ist k, wie üblich, die Zahl der<br />

Klassen.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!