Methoden zur Klassifikation - OptiV
Methoden zur Klassifikation - OptiV
Methoden zur Klassifikation - OptiV
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Schätzung der<br />
Diskriminanzfunktion<br />
Überprüfung<br />
der Güte der<br />
Diskriminanzfunktion<br />
2.3 <strong>Methoden</strong>beschreibung<br />
Es gibt eine Reihe von Verfahren <strong>zur</strong> Schätzung der Diskriminanzfunktion.<br />
Das bekannteste ist der Ansatz von Fisher, welcher die Koeffizienten bi so<br />
wählt, dass die Funktionswerte der Diskriminanzfunktion für verschiedene Gruppen<br />
möglichst weit auseinanderliegen bzw. das Verhältnis von erklärter Streuung<br />
(zwischen den Gruppen) zu nicht erklärter Streuung (innerhalb der Gruppen)<br />
möglichst groß ist.<br />
max<br />
G<br />
G<br />
g=1<br />
g=1 ng · ( ¯ Dg − ¯ D) 2<br />
ng<br />
i=1 (Dgi − ¯ Dg)<br />
Streuung zwischen den Gruppen<br />
=<br />
2 Streuung innerhalb der Gruppen<br />
Hierbei ist ng die Anzahl der Fälle in einer Klasse g, ¯ D das gesamte Mittel aller<br />
Diskriminanzwerte D, ¯ Dg das Mittel aller Diskriminanzwerte in einer Klasse g<br />
und Dgi der Diskriminanzwert des i-ten Falles in der Klasse g (vgl. Tabachnik/Fidell<br />
1996, S. 514 f.).<br />
Dieses Maximierungsproblem wird über ein Eigenwertproblem gelöst. Weitere<br />
Diskriminanzfunktionen werden so ermittelt, dass diese einen maximalen Anteil<br />
der bis dahin nicht erklärten Streuung erklären können.<br />
Die gebräuchlichsten Kriterien <strong>zur</strong> Überprüfung der Güte der Diskriminanzfunktion<br />
sind der kanonische Korrelationskoeffizient und Wilks Lambda<br />
im Falle zweier Gruppen sowie das multivariate Wilks Lambda bei mehreren<br />
Gruppen. Mit der Anwendung von Wilks Lambda sind Wahrscheinlichkeitsaussagen<br />
über die Unterschiedlichkeit der Gruppen möglich. Hierdurch kann die<br />
statistische Signifikanz ermittelt werden.<br />
Der Kanonische Korrelationskoeffizient misst den Anteil der Streuung zwischen<br />
den Klassen an der gesamten Streuung der Daten. Je größer der Wert des Koeffizienten<br />
ist, desto größer ist die Streuung der Merkmalsausprägungen zwischen<br />
den Gruppen, im Verhältnis <strong>zur</strong> Streuung innerhalb der Gruppen.<br />
Klassifizierung Die Klassifizierung von Objekten mit unbekannter Klassenzugehörigkeit<br />
lässt sich nach verschiedenen <strong>Methoden</strong> durchführen. Zu den bekanntesten gehören<br />
die Distanzmethode, das Wahrscheinlichkeitskonzept und die Klassifizierungsfunktionen<br />
von Fischer.<br />
6