Klassifikation von Mustern

Weitere Magazine

Empfehlungen

Info

360 KAPITEL 4. NUMERISCHE KLASSIFIKATION (VK.2.3.3, 07.09.2005) 4.3 Support Vektor Maschinen (VA.1.1.3, 13.04.2004) Klassifikation mit sog. Support Vektor Maschinen (SVM) ist verglichen mit den statistischen Klassifikatoren ein noch relativ neuer Ansatz. Bei diesem wird eine für die Klassifikation wesentliche Teilmenge der Stichprobenelemente in der Trainingsmenge – eben die „Support Vektoren“ – durch konvexe quadratische Optimierung in der Lernphase so bestimmt, dass die Klassentrennung im Merkmalsraum möglichst gut ist. Während insbesondere in Abschnitt 4.1 davon ausgegangen wurde, dass die erforderlichen statistischen Kenngrößen entweder exakt oder zumindest hinreichend genau bekannt sind, d. h. mit einer repräsentativen Stichprobe geschätzt wurden, wird hier ausdrücklich der Einfluss einer endlichen Stichprobe berücksichtigt. Die Basis dafür geht aus dem nächsten Abschnitt hervor. Bei der gesamten Diskussion wird nur ein Zweiklassenproblem betrachtet. Die beiden zu trennenden Klassen werden, wie in der Darstellung der SVM üblich, mit den Indizes +1 bzw. −1 versehen. Für mehr als zwei Klassen gibt es eine Reihe von Vorschlägen. Ein k–Klassenproblem kann auf k Zweiklassenprobleme zurückgeführt werden, indem man k Klassifikatoren trainiert, die jeweils eine Klasse von den k − 1 verbleibenden unterscheiden, die Strategie „eine gegen alle anderen“. Der erste Klassifikator unterscheidet also die Klasse Ω1 von den Klassen {Ω2, . . . , Ωk}, der zweite die Klasse Ω2 von den Klassen {Ω1, Ω3, . . . , Ωk}, usw. Ein weiterer Ansatz zur Rückführung des allgemeinen Klassifikationsproblems auf Zweiklassenprobleme ist charakterisiert durch die Kurzform „eine gegen eine“. Dabei werden alle verschiedenen Paare von Klassen unterschieden, d. h. k(k − 1)/2 Klassifikatoren zur Unterscheidung von ωκ und ωλ, κ = 2, . . . , k, λ = 1, . . . , κ − 1 realisiert. Für jede Klasse gibt es damit mehrere binäre Entscheidungen, sodass sich die Frage nach der endgültigen Entscheidung erhebt. Eine einfache und nach experimentellen Ergebnissen sehr wirksame Strategie besteht darin, bei jeder der durchgeführten Klassifikationen der dabei ausgewählten Klasse einen Punkt zu geben und sich dann endgültig für die Klasse mit maximaler Punktezahl zu entscheiden. Obwohl hier mehr Klassifikatoren trainiert werden müssen als bei der Vorgehensweise „eine gegen alle anderen“, ist der Rechenaufwand für Training und Test bei dieser Strategie wegen der kleineren Stichprobenumfänge geringer, soweit den in den Literaturhinweisen erwähnten Vergleichen zu entnehmen ist. Die Strategie „eine gegen eine“ ist danach für das Mehrklassenproblem zu bevorzugen, zumal sie auch ausgezeichnete Erkennungsraten liefert. Ein dritter Ansatz besteht darin, jeweils eine Klasse von den restlich noch verbleibenden zu unterscheiden, d. h. es werden (k − 1) Klassifikatoren zur Unterscheidung von ω1 und {ω2, ω3, . . . , ωk}, von ω2 und {ω3, ω4, . . . , ωk}, . . . , und von ωk−1 und ωk realisiert. Die Trennbarkeit der Klassen hängt hier i. Allg. von der gewählten Reihenfolge der Klassen ab. Schließlich gibt es Ansätze, das Mehrklassenproblem, ähnlich wie bei den statistischen Klassifikatoren, „in einem Schritt“ zu lösen. Da diese in einem experimentellen Vergleich nicht überzeugend abschnitten, wird dafür auf die Literatur verwiesen. 4.3.1 Die VC–Dimension Von zwei zu trennenden Klassen sei eine klassifizierte Stichprobe von Mustern ϱ f, repräsentiert durch ihre Merkmale ϱ c ∈ R n , gegeben ω = {{ ϱ c, yϱ}, ϱ = 1, 2, . . . , N, yϱ ∈ {−1, 1}} . (4.3.1)
4.3. SUPPORT VEKTOR MASCHINEN (VA.1.1.3, 13.04.2004) 361 Die Merkmalsvektoren haben eine (unbekannte) Verteilungsfunktion P (c, y) und werden statistisch unabhängig aus einer Grundgesamtheit mit dieser Verteilung entnommen. Mit irgendeiner Menge T von Trennfunktionen T = {d ea(c)}, parametrisiert durch einen Parametervektor a, werden die Stichprobenelemente einer der beiden Klassen zugewiesen. Die mittleren Kosten bzw. das Risiko der Klassifikation wird definiert mit V (dea) = 1 2 |dea( ϱ c) − y| dP (c, y) . (4.3.2) Man vergleiche diese Definition mit der in (4.1.10), S. 309. Da die Verteilungsfunktion P (c, y) unbekannt ist, liegt es nahe, das Risiko durch das empirische Risiko Ve(dea) = 1 N N ϱ=1 1 2 |dea( ϱ c) − yϱ| (4.3.3) zu ersetzen. Bei endlichem, und insbesondere kleinem, Stichprobenumfang wird allerdings die Minimierung des empirischen Risikos i. Allg. nicht zu einer guten Klassifikationsleistung an einer neuen, von der Trainingsstichprobe disjunkten, Teststichprobe führen. Auf dieses Problem der Generalisierung wurde bereits in Abschnitt 1.3 hingewiesen. Der Einfluss einer endlichen Stichprobe wird sich dadurch bemerkbar machen, dass das Risiko V größer ist als das empirische Risiko Ve. Der Unterschied ist durch folgende Abschätzung gegeben: Satz 4.12 Für jede Trennfunktion dea und jedes N > h gilt mit der Wahrscheinlichkeit 1 − η V (dea) h φ , log η N N ≤ = h Ve(dea) + φ , log η , N N h (4.3.4) log 2N η + 1 − log h 4 . N (4.3.5) Dabei ist h die sog. VAPNIK–CHERVONENKIS-Dimension (VC–Dimension). Beweis: s. z. B. [Vapnik, 1995] Die obige Abschätzung ist unabhängig von der Verteilung P (c, y). Die linke Seite wird i. Allg. unbekannt bleiben, während die rechte bei bekanntem h für ein d ea berechnet werden kann. Bei entsprechender Wahl von η, h, N kann φ > 1 werden, d. h. die Abschätzung ist dann sicher nicht eng. Die VC–Dimension h ist ein Maß für die Kapazität der Menge {d ea|a ∈ Rea} von Trennfunktionen. Ein Maß für die Kapazität eines Klassifikators gibt (4.10.5), S. 444. Für ein Zweiklassenproblem gibt h die maximale Zahl von Mustern an, die durch diese Funktionen in alle möglichen 2h Partitionen zerlegt werden können. Diese Zerlegung muss nicht für alle Punktmengen vom Umfang h möglich sein, sondern für mindestens eine. Für jede mögliche Zerlegung gibt es also eine Trennfunktion, die diese korrekt durchführt. Eine spezielle Menge von Trennfunktionen ist die der orientierten Hyperebenen dea(c) = c T a0 a + a0 , mit a = , (4.3.6) a mit denen für Punkte c entschieden werden kann, ob sie auf der positiven oder negativen Seite der Ebene liegen oder genau auf dieser Ebene. Die orientierten Ebenen d ea = c T a + a0 und
Seite 1 und 2:
Vorwort, 1. Auflage Dieses Buch bes
Seite 3:
Dank Der Autor dankt für Hinweise
Seite 6 und 7:
6 INHALTSVERZEICHNIS 2.2.1 Vorbemer
Seite 8 und 9:
8 INHALTSVERZEICHNIS 4.2.5 Klassifi
Seite 10 und 11:
10 KAPITEL 1. EINFÜHRUNG (VK.1.3.3
Seite 12 und 13:
Seite 14 und 15:
Seite 16 und 17:
Seite 18 und 19:
Seite 20 und 21:
Seite 22 und 23:
Seite 24 und 25:
Seite 26 und 27:
Seite 28 und 29:
Seite 30 und 31:
Seite 32 und 33:
Seite 34 und 35:
Seite 36 und 37:
Seite 38 und 39:
Seite 40 und 41:
Seite 42 und 43:
Seite 44 und 45:
Seite 46 und 47:
Seite 48 und 49:
Seite 50 und 51:
Seite 52 und 53:
Seite 54 und 55:
54 LITERATURVERZEICHNIS [Denzler, 2
Seite 56 und 57:
56 LITERATURVERZEICHNIS [Niemann, 1
Seite 58 und 59:
58 LITERATURVERZEICHNIS
Seite 60 und 61:
60 KAPITEL 2. VORVERARBEITUNG (VK.1
Seite 62 und 63:
Seite 64 und 65:
Seite 66 und 67:
Seite 68 und 69:
Seite 70 und 71:
Seite 72 und 73:
Seite 74 und 75:
Seite 76 und 77:
Seite 78 und 79:
Seite 80 und 81:
Seite 82 und 83:
Seite 84 und 85:
Seite 86 und 87:
Seite 88 und 89:
Seite 90 und 91:
Seite 92 und 93:
Seite 94 und 95:
Seite 96 und 97:
Seite 98 und 99:
Seite 100 und 101:
100 KAPITEL 2. VORVERARBEITUNG (VK.
Seite 102 und 103:
Seite 104 und 105:
Seite 106 und 107:
Seite 108 und 109:
Seite 110 und 111:
Seite 112 und 113:
Seite 114 und 115:
Seite 116 und 117:
Seite 118 und 119:
Seite 120 und 121:
Seite 122 und 123:
Seite 124 und 125:
Seite 126 und 127:
Seite 128 und 129:
Seite 130 und 131:
Seite 132 und 133:
Seite 134 und 135:
Seite 136 und 137:
Seite 138 und 139:
Seite 140 und 141:
Seite 142 und 143:
Seite 144 und 145:
Seite 146 und 147:
146 LITERATURVERZEICHNIS [Barrett,
Seite 148 und 149:
148 LITERATURVERZEICHNIS Universit
Seite 150 und 151:
150 LITERATURVERZEICHNIS Lokalisier
Seite 152 und 153:
152 LITERATURVERZEICHNIS [Kwok und
Seite 154 und 155:
154 LITERATURVERZEICHNIS [Niemann,
Seite 156 und 157:
156 LITERATURVERZEICHNIS niques. Co
Seite 158 und 159:
158 LITERATURVERZEICHNIS and Image
Seite 160 und 161:
160 LITERATURVERZEICHNIS
Seite 162 und 163:
162 KAPITEL 3. MERKMALE (VK.2.3.3,
Seite 164 und 165:
Seite 166 und 167:
Seite 168 und 169:
Seite 170 und 171:
Seite 172 und 173:
Seite 174 und 175:
Seite 176 und 177:
Seite 178 und 179:
Seite 180 und 181:
Seite 182 und 183:
Seite 184 und 185:
Seite 186 und 187:
Seite 188 und 189:
Seite 190 und 191:
Seite 192 und 193:
Seite 194 und 195:
Seite 196 und 197:
Seite 198 und 199:
Seite 200 und 201:
Seite 202 und 203:
Seite 204 und 205:
Seite 206 und 207:
Seite 208 und 209:
Seite 210 und 211:
Seite 212 und 213:
Seite 214 und 215:
Seite 216 und 217:
Seite 218 und 219:
Seite 220 und 221:
Seite 222 und 223:
Seite 224 und 225:
Seite 226 und 227:
Seite 228 und 229:
Seite 230 und 231:
Seite 232 und 233:
Seite 234 und 235:
Seite 236 und 237:
Seite 238 und 239:
Seite 240 und 241:
Seite 242 und 243:
Seite 244 und 245:
Seite 246 und 247:
Seite 248 und 249:
Seite 250 und 251:
Seite 252 und 253:
Seite 254 und 255:
Seite 256 und 257:
Seite 258 und 259:
Seite 260 und 261:
Seite 262 und 263:
Seite 264 und 265:
Seite 266 und 267:
Seite 268 und 269:
Seite 270 und 271:
Seite 272 und 273:
Seite 274 und 275:
Seite 276 und 277:
Seite 278 und 279:
Seite 280 und 281:
Seite 282 und 283:
282 LITERATURVERZEICHNIS [Arcese et
Seite 284 und 285:
284 LITERATURVERZEICHNIS [Caelli un
Seite 286 und 287:
286 LITERATURVERZEICHNIS [de Figuei
Seite 288 und 289:
288 LITERATURVERZEICHNIS [Gubner un
Seite 290 und 291:
290 LITERATURVERZEICHNIS [Kailath,
Seite 292 und 293:
292 LITERATURVERZEICHNIS and enhanc
Seite 294 und 295:
294 LITERATURVERZEICHNIS [Moayer un
Seite 296 und 297:
296 LITERATURVERZEICHNIS [Picone, 1
Seite 298 und 299:
298 LITERATURVERZEICHNIS modeling a
Seite 300 und 301:
300 LITERATURVERZEICHNIS images usi
Seite 302 und 303:
302 LITERATURVERZEICHNIS ments: A n
Seite 304 und 305:
304 KAPITEL 4. NUMERISCHE KLASSIFIK
Seite 306 und 307:
Seite 308 und 309:
Seite 310 und 311: 310 KAPITEL 4. NUMERISCHE KLASSIFIK
Seite 410 und 411:
Seite 412 und 413:
Seite 414 und 415:
Seite 416 und 417:
Seite 418 und 419:
Seite 420 und 421:
Seite 422 und 423:
Seite 424 und 425:
Seite 426 und 427:
Seite 428 und 429:
Seite 430 und 431:
Seite 432 und 433:
Seite 434 und 435:
Seite 436 und 437:
Seite 438 und 439:
Seite 440 und 441:
Seite 442 und 443:
Seite 444 und 445:
Seite 446 und 447:
Seite 448 und 449:
Seite 450 und 451:
Seite 452 und 453:
Seite 454 und 455:
Seite 456 und 457:
Seite 458 und 459:
458 LITERATURVERZEICHNIS IEEE Trans
Seite 460 und 461:
460 LITERATURVERZEICHNIS decomposit
Seite 462 und 463:
462 LITERATURVERZEICHNIS 1988. [Dev
Seite 464 und 465:
464 LITERATURVERZEICHNIS [Gibbs, 19
Seite 466 und 467:
466 LITERATURVERZEICHNIS [Ichino, 1
Seite 468 und 469:
468 LITERATURVERZEICHNIS trika, 29:
Seite 470 und 471:
470 LITERATURVERZEICHNIS [Martinez
Seite 472 und 473:
472 LITERATURVERZEICHNIS [Och und N
Seite 474 und 475:
474 LITERATURVERZEICHNIS [Rauber et
Seite 476 und 477:
476 LITERATURVERZEICHNIS [Schölkop
Seite 478 und 479:
478 LITERATURVERZEICHNIS fiers by a
Seite 480 und 481:
480 LITERATURVERZEICHNIS gnition, 3
Seite 482 und 483:
Index a posteriori Dichte, 341 Vert
Seite 484 und 485:
484 INDEX Formant, 208, 213 Formele
Seite 486 und 487:
486 INDEX Maßstab, 185 Maximumnorm
Seite 488 und 489:
488 INDEX LASSO, 336 maximum-a-post
Alle anzeigen

Klassifikation von Mustern

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?