21.12.2012 Aufrufe

Klassifikation von Mustern

Klassifikation von Mustern

Klassifikation von Mustern

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

4.6. ANDERE KLASSIFIKATORTYPEN (VA.1.1.3, 13.04.2004) 399<br />

4.6.3 Klassifikator für nominale Merkmale<br />

In der Literatur wird vielfach eine Unterscheidung zwischen ordinalen und nominalen Merkmalen<br />

getroffen, die etwa den hier verwendeten Begriffen numerisch und nichtnumerisch entsprechen.<br />

Bei einem nominalen Merkmal – z. B. dem Merkmal Farbe mit den Werten rot, grün,<br />

blau – lässt sich keine sinnvolle Ordnung nach der Größe oder dem Wert der Merkmale angeben,<br />

wie es z. B. bei dem Merkmal Fortmantfrequenz mit Werten f1 = 900 Hz, f2 = 2000 Hz,<br />

f3 = 2700 Hz möglich ist. Daher ist auch bei nominalen Merkmalen die Angabe <strong>von</strong> Metriken<br />

oder Abständen und die Verwendung <strong>von</strong> darauf beruhenden Klassifikatoren nicht ohne<br />

weiteres möglich (s. jedoch (4.6.23)). In Abschnitt 3.1 wurde darauf verwiesen, dass sich in<br />

solchen Fällen die Interpretation der Merkmale als Symbolkette und die Verwendung syntaktischer<br />

Klassifikatoren anbieten. Es gibt jedoch auch andere Ansätze, <strong>von</strong> denen hier beispielhaft<br />

einer vorgestellt wird.<br />

Ein grundsätzlicher Begriff bei der <strong>Klassifikation</strong> <strong>von</strong> <strong>Mustern</strong> mit nominalen Merkmalen<br />

ist das überdeckende Ereignis oder die überdeckende Symbolkette, was an einem einfachen Beispiel<br />

erläutert wird. Es wird angenommen, dass ein Muster nur mit den zwei Merkmalen Form<br />

und Farbe mit Werten Rechteck und Dreieck für die Form und rot, grün und blau für die Farbe<br />

dargestellt wird. Das spezielle Symbol β stehe für einen beliebigen Wert irgendeines Merkmals.<br />

Die Kette (Rechteck, β) überdeckt jede der Symbolketten (Rechteck, rot), (Rechteck, blau) und<br />

(Rechteck, grün). In Bild 4.6.5 wird ein Algorithmus angegeben, mit dem zu einer Stichprobe<br />

<strong>von</strong> <strong>Mustern</strong> mit nominalen Merkmalen eine als Definitionsmenge bezeichnete Menge ωd <strong>von</strong><br />

überdeckenden Ketten konstruiert wird. Die Definitionsmenge ist Grundlage der <strong>Klassifikation</strong>,<br />

die nach der Regel erfolgt<br />

ordne ein Muster der Klasse zu, deren Definitionsmenge eine Kette enthält,<br />

welche die Symbolkette des Musters überdeckt . (4.6.8)<br />

Wenn also k Klassen vorliegen, sind k Definitionsmengen zu konstruieren.<br />

Zur Angabe des Algorithmus bezeichnen wir den Wert des ν-ten Merkmals im j-ten Muster<br />

mit j cν. Das ν-te Merkmal cν nimmt Werte aus einer Menge Sν an, wobei einige oder alle<br />

Mengen Sν, ν = 1, . . . , n gleich sein dürfen. Die Kette (c1, c2, . . . , cn) überdeckt die Symbolkette<br />

( j c1, j c2, . . . , j cn) eines Musters wenn entweder cν = j cν oder cν = β, ν = 1, . . . , n gilt.<br />

Die Stichprobe ω sei wie in Abschnitt 4.6.2 in ω1 und ω0 = ω − ω1 zerlegt. Am Ende enthält<br />

ω1 = ωd eine Definitionsmenge für ω1. Im Algorithmus in Bild 4.6.5 wird die Verschmelzung<br />

<strong>von</strong> Ketten so lange wiederholt, bis keine neuen überdeckenden Ketten mehr gebildet werden;<br />

dann ist ω1 = ωd. Die <strong>Klassifikation</strong> erfolgt gemäß (4.6.8).<br />

4.6.4 Abstandsmessende Klassifikatoren<br />

Vorgehensweisen<br />

Die Verwendung eines geeigneten Abstandsmaßes zwischen einem Prototypen oder Referenzmuster<br />

(oder einer Schablone, “template”) und einem neu beobachteten Muster oder Testmuster<br />

ist ein intuitiv nahe liegender Ansatz bei der <strong>Klassifikation</strong>. Für solche abstandsmessenden<br />

Klassifikatoren gibt es eine Reihe überwiegend heuristisch motivierter Varianten, <strong>von</strong> denen<br />

einige als Beispiele genannt werden:<br />

1. In Abschnitt 4.2.5 ergab sich als Spezialfall des statistischen Klassifikators ein bewichteter<br />

Abstand des Merkmalsvektors eines neuen Musters vom Klassenzentrum µλ.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!