Klassifikation von Mustern

Weitere Magazine

Empfehlungen

Info

246 KAPITEL 3. MERKMALE (VK.2.3.3, 13.04.2004) 3.9 Merkmalsbewertung und –auswahl (VA.1.2.3, 13.04.2004) 3.9.1 Anliegen und Probleme Mit den heuristischen Verfahren von Abschnitt 3.2 – Abschnitt 3.5 ist es relativ leicht möglich, eine große Zahl n ′ von Merkmalen zu erzeugen. Der Aufwand für die Klassifikation steigt mit der Zahl dieser Merkmale an. Das ist intuitiv unmittelbar klar und geht auch aus den speziellen Klassifikationsverfahren von Kapitel 4 hervor. Außerdem verursacht auch die Gewinnung jedes einzelnen Merkmals einen gewissen Aufwand. Aus diesen Gründen wird man stets bestrebt sein, dass die Zahl n < n ′ der tatsächlich verwendeten Merkmale so klein wie möglich ist, um den Gesamtaufwand für die Klassifikation in erträglichen Grenzen zu halten. Damit ergibt sich die Aufgabe, eine Menge mit n ′ vorgegebenen Merkmalen durch eine Merkmalsauswahl auf eine Untermenge mit n „möglichst geeigneten“ Merkmalen zu reduzieren. Definition 3.16 Eine „beste“ Untermenge von Merkmalen hat die Eigenschaft, dass es keine andere mit höchstens genau so vielen Merkmalen gibt, wobei die Merkmale dieser anderen Untermenge eine Klassifikation mit geringerer Fehlerwahrscheinlichkeit erlauben. Aus zwei Gründen, die in den folgenden beiden Absätzen erläutert werden, ist es i. Allg. nicht möglich, diese beste Untermenge zu bestimmen. Daher muss man sich mit suboptimalen Ansätzen begnügen oder mit „möglichst geeigneten“ Merkmalen. Ein einwandfreies Kriterium zur Messung der Güte von Merkmalen ist die in einem bestimmten Klassifikationssystem erreichte Fehlerwahrscheinlichkeit, wie auch in Abschnitt 3.8.1 ausgeführt wurde. Um den Aufwand bei der Merkmalsauswahl zu reduzieren, werden jedoch meistens Kriterien oder Gütemaße verwendet, die unabhängig vom Klassifikator berechnet werden können. Beispiele für solche Gütemaße folgen im nächsten Abschnitt. Damit wird die Bewertung der Merkmale als eigenes Problem, ohne Beachtung der sonstigen Moduln des Klassifikationssystems, durchgeführt. Das vereinfacht das Problem, führt aber i. Allg. dazu, dass die so bestimmten Merkmale nicht die für das Gesamtsystem besten sind. Auch wenn man annimmt, dass geeignete Maße zur Beurteilung der Güte von Merkmalen bekannt sind, ist die Bestimmung einer geeigneten Untermenge ein schwieriges Problem. Wegen der in der Regel vorhandenen statistischen Abhängigkeiten zwischen den Merkmalen müsste man bei einer vollständigen Suchmethode alle Untermengen beurteilen, um die optimale zu finden. Zu einer vorgegebenen Menge mit n ′ Merkmalen gibt es genau n ′ verschiedene n Untermengen mit n < n ′ Merkmalen. Hat man beispielsweise n ′ = 300 Merkmale vorge- geben und will aus Aufwandsgründen nur n = 30 verwenden, so gibt es 300 41 ≈ 1, 7 · 10 30 verschiedene Untermengen mit 30 Merkmalen. Abgesehen von einigen einfachen Spezialfällen mit sehr kleinen Werten für n ′ und n wird es also schwierig sein, die optimale Untermenge zu bestimmen. Daher muss man nach Festlegung eines Gütemaßes für Merkmale auch noch ein Auswahlverfahren festlegen, mit dem man eine möglichst geeignete Untermenge mit erträglichem Aufwand finden kann. Natürlich kann man statistische Abhängigkeiten zwischen Merkmalen zur Vereinfachung vernachlässigen und als beste Untermenge mit n Merkmalen die n am besten bewerteten wählen; tatsächlich wird häufig so verfahren. Man kann aber Beispiele dafür konstruieren, dass selbst bei klassenweise statistisch unabhängigen Merkmalen dieses Verfahren nicht immer optimal ist. Bewertet man jedes der n ′ Merkmale einzeln für sich und wählt die n einzeln am besten bewerteten aus, so ist das nicht notwendig die beste Untermenge mit n Merkmalen.
3.9. MERKMALSBEWERTUNG UND –AUSWAHL (VA.1.2.3, 13.04.2004) 247 Bild 3.9.1: Beispiele für Bereiche, die von Merkmalen verschiedener Klassen eingenommen werden. Der Abstand der Mittelwerte |µ 1 − µ 2| ist allein nicht ausreichend, die Güte der Merkmale zu beurteilen. Aus der obigen Diskussion geht hervor, dass es i. Allg. nicht möglich ist, die beste Untermenge von Merkmalen zu bestimmen. Andererseits liefern erfahrungsgemäß auch einfache Auswahlverfahren bereits wesentlich bessere Ergebnisse als eine Zufallsauswahl. Es wird noch erwähnt, dass oft auch die Verfahren von Abschnitt 3.8 als Merkmalsauswahl bezeichnet werden, da eine Reduzierung der Zahl der Variablen erreicht wird. Der Unterschied ist, dass dort neue Merkmale durch Linearkombination der vorhandenen gebildet werden, während hier die n besonders geeigneten unverändert aus der Menge der vorgegebenen übernommen werden. 3.9.2 Gütemaße für Merkmale Der erste Schritt zur Auswahl einer Untermenge von Merkmalen aus einer Menge vorgegebener Merkmale ist, wie im vorigen Abschnitt erörtert, die Vorgabe eines Maßes zur Bewertung der Güte von Merkmalen. Dieses Gütemaß sollte im Zusammenhang mit der Fehlerwahrscheinlichkeit bei der Klassifikation stehen. Theoretisch besonders befriedigend sind natürlich solche Gütemaße, mit denen sich sehr enge obere und untere Schranken der Fehlerwahrscheinlichkeit angeben lassen. Das Gütemaß sollte aber auch numerisch noch mit vertretbarem Aufwand berechenbar sein, um für Zwecke der Musterklassifikation praktisch interessant zu sein; besonders günstig sind dafür solche Gütemaße, für die sich bei bestimmten Verteilungsdichten der Merkmale geschlossene Formeln angeben lassen. Diese beiden sich widersprechenden Forderungen führen zu der Vermutung, dass eine enge Abschätzung der Fehlerwahrscheinlichkeit (im Extremfall die Fehlerwahrscheinlichkeit selbst) numerisch nicht mehr auswertbar ist und eine auswertbare Abschätzung nur sehr grob ist. Ein sinnvoller Kompromiss wird stets vom jeweiligen Problem und der verfügbaren Rechenkapazität abhängen. Zunächst geht aus Bild 3.9.1 hervor, dass die Güte von Merkmalen sicher mit dem Abstand von Merkmalsvektoren verschiedener Klassen zusammenhängt, dass aber der Abstand der Mittelwerte allein nicht ausreicht, um vernünftige Aussagen zu bekommen. Im Allgemeinen kommt es darauf an, ein geeignetes Maß für den Abstand der Verteilungsdichten der Merkmale aus verschiedenen Klassen zu finden, und dabei spielen alle Parameter eine Rolle. Dieses wird auch in Abschnitt 4.8.4 in (4.8.26), S. 424, und (4.8.44), S. 427, wieder aufgegriffen. Praktisch alle Gütemaße für Merkmale beruhen daher auf geeigneten verallgemeinerten Abstandsmaßen. In Abschnitt 4.1.4 wird gezeigt, dass der Klassifikator, der die Fehlerwahrscheinlichkeit pf minimiert (der sog. BAYES-Klassifikator, Satz 4.3), die a posteriori Wahrscheinlichkeiten p(Ωκ|c ), κ = 1, . . . , k der Klassen berechnet und sich für die Klasse mit maximaler a posteriori Wahrscheinlichkeit entscheidet. Die Fehlerwahrscheinlichkeit dieses Klassifikators ist pB.
Seite 1 und 2:
Vorwort, 1. Auflage Dieses Buch bes
Seite 3:
Dank Der Autor dankt für Hinweise
Seite 6 und 7:
6 INHALTSVERZEICHNIS 2.2.1 Vorbemer
Seite 8 und 9:
8 INHALTSVERZEICHNIS 4.2.5 Klassifi
Seite 10 und 11:
10 KAPITEL 1. EINFÜHRUNG (VK.1.3.3
Seite 12 und 13:
Seite 14 und 15:
Seite 16 und 17:
Seite 18 und 19:
Seite 20 und 21:
Seite 22 und 23:
Seite 24 und 25:
Seite 26 und 27:
Seite 28 und 29:
Seite 30 und 31:
Seite 32 und 33:
Seite 34 und 35:
Seite 36 und 37:
Seite 38 und 39:
Seite 40 und 41:
Seite 42 und 43:
Seite 44 und 45:
Seite 46 und 47:
Seite 48 und 49:
Seite 50 und 51:
Seite 52 und 53:
Seite 54 und 55:
54 LITERATURVERZEICHNIS [Denzler, 2
Seite 56 und 57:
56 LITERATURVERZEICHNIS [Niemann, 1
Seite 58 und 59:
58 LITERATURVERZEICHNIS
Seite 60 und 61:
60 KAPITEL 2. VORVERARBEITUNG (VK.1
Seite 62 und 63:
Seite 64 und 65:
Seite 66 und 67:
Seite 68 und 69:
Seite 70 und 71:
Seite 72 und 73:
Seite 74 und 75:
Seite 76 und 77:
Seite 78 und 79:
Seite 80 und 81:
Seite 82 und 83:
Seite 84 und 85:
Seite 86 und 87:
Seite 88 und 89:
Seite 90 und 91:
Seite 92 und 93:
Seite 94 und 95:
Seite 96 und 97:
Seite 98 und 99:
Seite 100 und 101:
100 KAPITEL 2. VORVERARBEITUNG (VK.
Seite 102 und 103:
Seite 104 und 105:
Seite 106 und 107:
Seite 108 und 109:
Seite 110 und 111:
Seite 112 und 113:
Seite 114 und 115:
Seite 116 und 117:
Seite 118 und 119:
Seite 120 und 121:
Seite 122 und 123:
Seite 124 und 125:
Seite 126 und 127:
Seite 128 und 129:
Seite 130 und 131:
Seite 132 und 133:
Seite 134 und 135:
Seite 136 und 137:
Seite 138 und 139:
Seite 140 und 141:
Seite 142 und 143:
Seite 144 und 145:
Seite 146 und 147:
146 LITERATURVERZEICHNIS [Barrett,
Seite 148 und 149:
148 LITERATURVERZEICHNIS Universit
Seite 150 und 151:
150 LITERATURVERZEICHNIS Lokalisier
Seite 152 und 153:
152 LITERATURVERZEICHNIS [Kwok und
Seite 154 und 155:
154 LITERATURVERZEICHNIS [Niemann,
Seite 156 und 157:
156 LITERATURVERZEICHNIS niques. Co
Seite 158 und 159:
158 LITERATURVERZEICHNIS and Image
Seite 160 und 161:
160 LITERATURVERZEICHNIS
Seite 162 und 163:
162 KAPITEL 3. MERKMALE (VK.2.3.3,
Seite 164 und 165:
Seite 166 und 167:
Seite 168 und 169:
Seite 170 und 171:
Seite 172 und 173:
Seite 174 und 175:
Seite 176 und 177:
Seite 178 und 179:
Seite 180 und 181:
Seite 182 und 183:
Seite 184 und 185:
Seite 186 und 187:
Seite 188 und 189:
Seite 190 und 191:
Seite 192 und 193:
Seite 194 und 195:
Seite 196 und 197: 196 KAPITEL 3. MERKMALE (VK.2.3.3,
Seite 282 und 283: 282 LITERATURVERZEICHNIS [Arcese et
Seite 284 und 285: 284 LITERATURVERZEICHNIS [Caelli un
Seite 286 und 287: 286 LITERATURVERZEICHNIS [de Figuei
Seite 288 und 289: 288 LITERATURVERZEICHNIS [Gubner un
Seite 290 und 291: 290 LITERATURVERZEICHNIS [Kailath,
Seite 292 und 293: 292 LITERATURVERZEICHNIS and enhanc
Seite 294 und 295: 294 LITERATURVERZEICHNIS [Moayer un
Seite 296 und 297:
296 LITERATURVERZEICHNIS [Picone, 1
Seite 298 und 299:
298 LITERATURVERZEICHNIS modeling a
Seite 300 und 301:
300 LITERATURVERZEICHNIS images usi
Seite 302 und 303:
302 LITERATURVERZEICHNIS ments: A n
Seite 304 und 305:
304 KAPITEL 4. NUMERISCHE KLASSIFIK
Seite 306 und 307:
Seite 308 und 309:
Seite 310 und 311:
Seite 312 und 313:
Seite 314 und 315:
Seite 316 und 317:
Seite 318 und 319:
Seite 320 und 321:
Seite 322 und 323:
Seite 324 und 325:
Seite 326 und 327:
Seite 328 und 329:
Seite 330 und 331:
Seite 332 und 333:
Seite 334 und 335:
Seite 336 und 337:
Seite 338 und 339:
Seite 340 und 341:
Seite 342 und 343:
Seite 344 und 345:
Seite 346 und 347:
Seite 348 und 349:
Seite 350 und 351:
Seite 352 und 353:
Seite 354 und 355:
Seite 356 und 357:
Seite 358 und 359:
Seite 360 und 361:
Seite 362 und 363:
Seite 364 und 365:
Seite 366 und 367:
Seite 368 und 369:
Seite 370 und 371:
Seite 372 und 373:
Seite 374 und 375:
Seite 376 und 377:
Seite 378 und 379:
Seite 380 und 381:
Seite 382 und 383:
Seite 384 und 385:
Seite 386 und 387:
Seite 388 und 389:
Seite 390 und 391:
Seite 392 und 393:
Seite 394 und 395:
Seite 396 und 397:
Seite 398 und 399:
Seite 400 und 401:
Seite 402 und 403:
Seite 404 und 405:
Seite 406 und 407:
Seite 408 und 409:
Seite 410 und 411:
Seite 412 und 413:
Seite 414 und 415:
Seite 416 und 417:
Seite 418 und 419:
Seite 420 und 421:
Seite 422 und 423:
Seite 424 und 425:
Seite 426 und 427:
Seite 428 und 429:
Seite 430 und 431:
Seite 432 und 433:
Seite 434 und 435:
Seite 436 und 437:
Seite 438 und 439:
Seite 440 und 441:
Seite 442 und 443:
Seite 444 und 445:
Seite 446 und 447:
Seite 448 und 449:
Seite 450 und 451:
Seite 452 und 453:
Seite 454 und 455:
Seite 456 und 457:
Seite 458 und 459:
458 LITERATURVERZEICHNIS IEEE Trans
Seite 460 und 461:
460 LITERATURVERZEICHNIS decomposit
Seite 462 und 463:
462 LITERATURVERZEICHNIS 1988. [Dev
Seite 464 und 465:
464 LITERATURVERZEICHNIS [Gibbs, 19
Seite 466 und 467:
466 LITERATURVERZEICHNIS [Ichino, 1
Seite 468 und 469:
468 LITERATURVERZEICHNIS trika, 29:
Seite 470 und 471:
470 LITERATURVERZEICHNIS [Martinez
Seite 472 und 473:
472 LITERATURVERZEICHNIS [Och und N
Seite 474 und 475:
474 LITERATURVERZEICHNIS [Rauber et
Seite 476 und 477:
476 LITERATURVERZEICHNIS [Schölkop
Seite 478 und 479:
478 LITERATURVERZEICHNIS fiers by a
Seite 480 und 481:
480 LITERATURVERZEICHNIS gnition, 3
Seite 482 und 483:
Index a posteriori Dichte, 341 Vert
Seite 484 und 485:
484 INDEX Formant, 208, 213 Formele
Seite 486 und 487:
486 INDEX Maßstab, 185 Maximumnorm
Seite 488 und 489:
488 INDEX LASSO, 336 maximum-a-post
Alle anzeigen

Klassifikation von Mustern

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?