21.12.2012 Aufrufe

Klassifikation von Mustern

Klassifikation von Mustern

Klassifikation von Mustern

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

20 KAPITEL 1. EINFÜHRUNG (VK.1.3.3, 16.03.2003)<br />

Stichprobe enthalten waren oder nicht. Da man dieses vorher nicht sicher weiß, ist es notwendig,<br />

dass die zum Training eines Systems und zum Test des Systems verwendeten Stichproben<br />

disjunkt sind. Einen quantitativen Anhaltspunkt gibt auch die Kapazität eines Klassifikators in<br />

Abschnitt 4.10.<br />

Einige Beispiele für Zusatzinformation yϱ sind<br />

yϱ ∈ {−1, 1} , (1.3.2)<br />

yϱ ∈ {1, . . . , κ, . . . , k} , (1.3.3)<br />

yϱ : {Ωϱ,1, . . . , Ωϱ,kϱ} ∈ ϱ f(x) , (1.3.4)<br />

yϱ = ∅ . (1.3.5)<br />

Die Form in (1.3.2) wird oft zur Charakterisierung des Zweiklassenproblems verwendet; man<br />

kann auch sagen, dass ein Muster entweder zu einer bestimmten Klasse gehört oder nicht. In<br />

(1.3.3) wird je Muster genau eine <strong>von</strong> k Klassen angegeben, zu der es gehört. Ein wesentlich<br />

allgemeineres Problem ist mit (1.3.4) charakterisiert; hier wird zu einem Muster lediglich angegeben,<br />

dass es Objekte aus einigen Klassen enthält, aber nicht, wieviele Objekte aus einer<br />

Klasse sind und in welcher räumlichen (oder zeitlichen) Anordnung. In (1.3.5) schließlich wird<br />

keinerlei Zusatzinformation über das Muster gegeben. Je nach verfügbarer Zusatzinformation<br />

ergeben sich unterschiedliche Probleme, die in Abschnitt 4.8.1 genauer charakterisiert werden.<br />

In den letzten beiden Fällen stellt sich das Problem, mit unvollständiger oder fehlender Information<br />

auf die Eigenschaften <strong>von</strong> Musterklassen zu schließen. Das grundsätzliche Hilfsmittel<br />

dafür ist der in Abschnitt 1.6.4 skizzierte EM-Algorithmus. Der Fall, dass yϱ ∈ R (mit R die<br />

Menge der reellen Zahlen) gegeben ist, bezeichnet das Regressionsproblem, das hier nicht weiter<br />

betrachtet wird.<br />

Allgemein lässt sich sagen, dass der erforderliche Umfang N der Stichprobe ω nur <strong>von</strong> den<br />

statistischen Eigenschaften der Muster und der Art der zu schätzenden Parameter abhängt. Er<br />

ist dagegen völlig unabhängig <strong>von</strong> den Kosten, die die Aufnahme eines Musters verursacht.<br />

Allerdings hat der zum Teil erhebliche Aufwand an Geld und Zeit, den die Sammlung einer<br />

großen Stichprobe verursacht, meistens zur Folge, dass der Stichprobenumfang eher zu klein<br />

als zu groß gewählt wird. Für Systeme zur <strong>Klassifikation</strong> <strong>von</strong> <strong>Mustern</strong> sind außer dem obigen<br />

Postulat noch die beiden folgenden wichtig.<br />

Postulat 2 Ein (einfaches) Muster besitzt Merkmale, die für seine Zugehörigkeit zu einer Klasse<br />

charakteristisch sind.<br />

Postulat 3 Die Merkmale bilden für Muster einer Klasse einen einigermaßen kompakten Bereich<br />

im Merkmalsraum. Die <strong>von</strong> Merkmalen verschiedener Klassen eingenommenen Bereiche<br />

sind einigermaßen getrennt. Dieses ist die wichtige Kompaktheitshypothese für Merkmale.<br />

Das zentrale und allgemein noch ungelöste Problem der <strong>Klassifikation</strong> besteht darin, solche<br />

Merkmale systematisch zu finden, die Postulat 3 genügen. Damit ist hier ein Algorithmus<br />

gemeint, der nach Vorgabe einer Stichprobe und eines Maßes für die Leistungsfähigkeit des<br />

Systems Merkmale erzeugt, die dieses Maß maximieren (oder minimieren). Trotzdem konnte<br />

empirisch nachgewiesen werden, dass es zumindest für bestimmte Problemkreise geeignete<br />

kompakte Merkmale gibt. Bereiche im Merkmalsraum mit unterschiedlicher Kompaktheit sind<br />

in Bild 1.3.1 angedeutet.<br />

Beispiele für die Verteilung <strong>von</strong> Merkmalen zeigt Bild 1.3.2 für drei Typen <strong>von</strong> <strong>Mustern</strong>.<br />

Dargestellt sind jeweils die Beträge der Koeffizienten F0,1, F1,0 der diskreten FOURIER-<br />

Transformation, die in Abschnitt 2.3.3 definiert ist. Alle Beträge sind so normiert, dass der

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!