Klassifikation von Mustern

Weitere Magazine

Empfehlungen

Info

366 KAPITEL 4. NUMERISCHE KLASSIFIKATION (VK.2.3.3, 07.09.2005) Das Training einer SVM erfordert also die Maximierung von Ld bezüglich ϑ unter den Nebenbedingungen ϑϱ ≥ 0, ϱ ϑϱyϱ = 0. Die Parameter a folgen dann aus (4.3.18). Setzt man (4.3.18) in (4.3.13) ein, so erhält man für die optimale Trennebene H ∗ : d ea = N Tϱ c c + a0 = 0 . (4.3.24) ϱ=1 ϑϱyϱ Das bedeutet, dass man zur Berechnung der Trennebene nur die Skalarprodukte von Merkmalsvektoren braucht. Dieses ist die Basis für den Übergang von Trennebenen auf praktisch beliebige Polynome in den Koeffizienten des Merkmalsvektors in Abschnitt 4.3.5; dabei werden Kernfunktionen wie in (3.8.50) – (3.8.52), S. 234, genutzt, um mit (3.8.53), S. 234, Skalarprodukte hochdimensionaler Vektoren über niedrigdimensionale zu berechnen. Aus den KARUSH–KUHN–TUCKER-Bedingungen (4.3.21), (4.3.22) geht hervor, dass diese entweder durch Punkte (Merkmalsvektoren) genau auf der Hyperebene und LAGRANGE- Multiplikatoren ϑϱ = 0 aber auch ϑϱ > 0 oder durch Punkte nicht auf der Hyperebene und LAGRANGE-Multiplikatoren ϑϱ = 0 erfüllt werden können. Aus (4.3.24) sieht man, dass in die Berechnung der optimalen Hyperebene nur solche Merkmalsvektoren mit aktiven Nebenbedingungen ϑϱ > 0 eingehen; alle anderen Merkmalsvektoren sind unerheblich. Definition 4.12 Die Support Vektoren einer Stichprobe sind die Merkmalsvektoren, die in die Berechnung der optimalen Hyperebene in (4.3.24) eingehen; das sind die Merkmalsvektoren mit aktiven Nebenbedingungen bzw. mit LAGRANGE-Multiplikatoren ϑϱ > 0. 4.3.4 Linear nicht separierbare Stichprobe In konkreten Anwendungen werden Stichproben i. Allg. nicht linear separierbar sein. Trotzdem lässt sich die in Abschnitt 4.3.2 vorgestellte Vorgehensweise mit geeigneten Modifikationen auch hier verfolgen. Das Prinzip besteht darin, die Nebenbedingungen (4.3.7) und (4.3.8) durch zusätzliche Schlupfvariable (“slack variables”) ξϱ ≥ 0 dann abzuschwächen, wenn dieses wegen der Durchdringung der Stichproben notwendig wird. Die Nebenbedingungen (4.3.7) – (4.3.9) werden also ersetzt durch ϱ c T a + a0 ≥ +1 − ξϱ, wenn yϱ = +1 , (4.3.25) ϱ T c a + a0 ≤ −1 + ξϱ, wenn yϱ = −1 , (4.3.26) ≥ 1 − ξϱ , ϱ = 1, . . . , N , (4.3.27) ϱcT yϱ a + a0 ξϱ ≥ 0 , ϱ = 1, . . . , N . (4.3.28) Aufgrund der Diskussion in Abschnitt 4.3.2 kann es auf der Trainingsstichprobe nur dann einen Fehler geben, wenn ξϱ > 1 wird. Eine Abschätzung dieser Fehler ist also ϱ ξϱ. Statt wie in (4.3.14) 1 2 |a|2 zu minimieren, ist es daher sinnvoll 1 2 |a|2 +γ ϱ ξϱ zu minimieren. Mit zusätzlichen LAGRANGE-Multiplikatoren βϱ wird die Nichtnegativität der Schlupfvariablen erreicht. Damit ergibt sich nun die LAGRANGE-Gleichung L(a, ϑ) = 1 2 |a|2 N N + γ ξϱ − ϱc N T ϑϱ yϱ a + a0 − 1 + ξϱ − βϱξϱ . (4.3.29) ϱ=1 ϱ=1 Die KARUSH–KUHN–TUCKER-Bedingungen dafür sind (4.3.18) – (4.3.20) sowie zusätzlich 0 ≤ ϱc T yϱ a + a0 − 1 + ξϱ , (4.3.30) ϱ=1
4.3. SUPPORT VEKTOR MASCHINEN (VA.1.1.3, 13.04.2004) 367 yϱ 0 = ϑϱ ϱc T a + a0 − 1 + ξϱ , (4.3.31) ∂L ∂ξϱ = γ − ϑϱ − βϱ = 0 , (4.3.32) 0 ≤ ξϱ , (4.3.33) 0 ≤ βϱ , (4.3.34) 0 = βϱξϱ , (4.3.35) jeweils für ϱ = 1, . . . , N . Auch hier ist das duale Problem nützlich; es lautet Ld(ϑ) = N ϱ=1 ϑϱ − 1 2 N N ϱ=1 σ=1 ϑϱϑσyϱyσ ϱc Tσ c , (4.3.36) 0 ≤ ϑϱ ≤ γ , (4.3.37) N 0 = ϑϱyϱ . (4.3.38) ϱ=1 Es stimmt also mit (4.3.23) überein, nur die Nebenbedingungen ϑϱ ≤ γ kommen hinzu. Der Gewichtsvektor der Hyperebene ist mit (4.3.18) a = N ϑϱyϱ ϱ c . (4.3.39) ϱ=1 Die Konstante a0 erhält man aus (4.3.31) und (4.3.35). Die optimale Hyperebene hat wie im Falle der linearen Separierbarkeit die Form H ∗ : d ea = N ϱ=1 Tϱ ϑϱyϱ c c + a0 = 0 , (4.3.40) d. h. auch zu ihrer Berechnung sind nur Skalarprodukte der Merkmalsvektoren erforderlich. Natürlich wird man die Summe nur über die Support Vektoren erstrecken. Zur numerischen Berechnung der Support Vektoren wird auf die Anmerkungen in Abschnitt 4.11 verwiesen. Die Klassifikation erfolgt also nicht mit dem Parametervektor a und der Ebenengleichung (4.3.6) sondern mit der Entwicklung (4.3.39) des Parametervektors und (4.3.40). Die Entscheidungsregel ist (4.3.16). 4.3.5 Nichtlineare Trennfunktionen Die bisherige Beschränkung auf Hyperebenen als Trennfunktionen lässt sich auf relativ einfache Weise wesentlich verallgemeinern. Der Schlüssel dafür ist die Beobachtung, dass sowohl beim Training, nämlich in (4.3.36) – (4.3.38), als auch bei der Klassifikation, nämlich in (4.3.40), nur Skalarprodukte der Merkmalsvektoren berechnet werden müssen. Wenn man den Merkmalsvektor c ∈ R n mit einer Abbildung φ in einen höherdimensionalen Raum c ∈ R en , n < n, transformiert, so können alle obigen Rechnungen in (4.3.25) – (4.3.40) statt mit c nun mit c durchgeführt werden; d. h. auch von dem neuen Merkmalsvektor c müssen bei Training und Klassifikation nur Skalarprodukte c T c berechnet werden. Statt einer
Seite 1 und 2:
Vorwort, 1. Auflage Dieses Buch bes
Seite 3:
Dank Der Autor dankt für Hinweise
Seite 6 und 7:
6 INHALTSVERZEICHNIS 2.2.1 Vorbemer
Seite 8 und 9:
8 INHALTSVERZEICHNIS 4.2.5 Klassifi
Seite 10 und 11:
10 KAPITEL 1. EINFÜHRUNG (VK.1.3.3
Seite 12 und 13:
Seite 14 und 15:
Seite 16 und 17:
Seite 18 und 19:
Seite 20 und 21:
Seite 22 und 23:
Seite 24 und 25:
Seite 26 und 27:
Seite 28 und 29:
Seite 30 und 31:
Seite 32 und 33:
Seite 34 und 35:
Seite 36 und 37:
Seite 38 und 39:
Seite 40 und 41:
Seite 42 und 43:
Seite 44 und 45:
Seite 46 und 47:
Seite 48 und 49:
Seite 50 und 51:
Seite 52 und 53:
Seite 54 und 55:
54 LITERATURVERZEICHNIS [Denzler, 2
Seite 56 und 57:
56 LITERATURVERZEICHNIS [Niemann, 1
Seite 58 und 59:
58 LITERATURVERZEICHNIS
Seite 60 und 61:
60 KAPITEL 2. VORVERARBEITUNG (VK.1
Seite 62 und 63:
Seite 64 und 65:
Seite 66 und 67:
Seite 68 und 69:
Seite 70 und 71:
Seite 72 und 73:
Seite 74 und 75:
Seite 76 und 77:
Seite 78 und 79:
Seite 80 und 81:
Seite 82 und 83:
Seite 84 und 85:
Seite 86 und 87:
Seite 88 und 89:
Seite 90 und 91:
Seite 92 und 93:
Seite 94 und 95:
Seite 96 und 97:
Seite 98 und 99:
Seite 100 und 101:
100 KAPITEL 2. VORVERARBEITUNG (VK.
Seite 102 und 103:
Seite 104 und 105:
Seite 106 und 107:
Seite 108 und 109:
Seite 110 und 111:
Seite 112 und 113:
Seite 114 und 115:
Seite 116 und 117:
Seite 118 und 119:
Seite 120 und 121:
Seite 122 und 123:
Seite 124 und 125:
Seite 126 und 127:
Seite 128 und 129:
Seite 130 und 131:
Seite 132 und 133:
Seite 134 und 135:
Seite 136 und 137:
Seite 138 und 139:
Seite 140 und 141:
Seite 142 und 143:
Seite 144 und 145:
Seite 146 und 147:
146 LITERATURVERZEICHNIS [Barrett,
Seite 148 und 149:
148 LITERATURVERZEICHNIS Universit
Seite 150 und 151:
150 LITERATURVERZEICHNIS Lokalisier
Seite 152 und 153:
152 LITERATURVERZEICHNIS [Kwok und
Seite 154 und 155:
154 LITERATURVERZEICHNIS [Niemann,
Seite 156 und 157:
156 LITERATURVERZEICHNIS niques. Co
Seite 158 und 159:
158 LITERATURVERZEICHNIS and Image
Seite 160 und 161:
160 LITERATURVERZEICHNIS
Seite 162 und 163:
162 KAPITEL 3. MERKMALE (VK.2.3.3,
Seite 164 und 165:
Seite 166 und 167:
Seite 168 und 169:
Seite 170 und 171:
Seite 172 und 173:
Seite 174 und 175:
Seite 176 und 177:
Seite 178 und 179:
Seite 180 und 181:
Seite 182 und 183:
Seite 184 und 185:
Seite 186 und 187:
Seite 188 und 189:
Seite 190 und 191:
Seite 192 und 193:
Seite 194 und 195:
Seite 196 und 197:
Seite 198 und 199:
Seite 200 und 201:
Seite 202 und 203:
Seite 204 und 205:
Seite 206 und 207:
Seite 208 und 209:
Seite 210 und 211:
Seite 212 und 213:
Seite 214 und 215:
Seite 216 und 217:
Seite 218 und 219:
Seite 220 und 221:
Seite 222 und 223:
Seite 224 und 225:
Seite 226 und 227:
Seite 228 und 229:
Seite 230 und 231:
Seite 232 und 233:
Seite 234 und 235:
Seite 236 und 237:
Seite 238 und 239:
Seite 240 und 241:
Seite 242 und 243:
Seite 244 und 245:
Seite 246 und 247:
Seite 248 und 249:
Seite 250 und 251:
Seite 252 und 253:
Seite 254 und 255:
Seite 256 und 257:
Seite 258 und 259:
Seite 260 und 261:
Seite 262 und 263:
Seite 264 und 265:
Seite 266 und 267:
Seite 268 und 269:
Seite 270 und 271:
Seite 272 und 273:
Seite 274 und 275:
Seite 276 und 277:
Seite 278 und 279:
Seite 280 und 281:
Seite 282 und 283:
282 LITERATURVERZEICHNIS [Arcese et
Seite 284 und 285:
284 LITERATURVERZEICHNIS [Caelli un
Seite 286 und 287:
286 LITERATURVERZEICHNIS [de Figuei
Seite 288 und 289:
288 LITERATURVERZEICHNIS [Gubner un
Seite 290 und 291:
290 LITERATURVERZEICHNIS [Kailath,
Seite 292 und 293:
292 LITERATURVERZEICHNIS and enhanc
Seite 294 und 295:
294 LITERATURVERZEICHNIS [Moayer un
Seite 296 und 297:
296 LITERATURVERZEICHNIS [Picone, 1
Seite 298 und 299:
298 LITERATURVERZEICHNIS modeling a
Seite 300 und 301:
300 LITERATURVERZEICHNIS images usi
Seite 302 und 303:
302 LITERATURVERZEICHNIS ments: A n
Seite 304 und 305:
304 KAPITEL 4. NUMERISCHE KLASSIFIK
Seite 306 und 307:
Seite 308 und 309:
Seite 310 und 311:
Seite 312 und 313:
Seite 314 und 315:
Seite 316 und 317: 316 KAPITEL 4. NUMERISCHE KLASSIFIK
Seite 416 und 417:
Seite 418 und 419:
Seite 420 und 421:
Seite 422 und 423:
Seite 424 und 425:
Seite 426 und 427:
Seite 428 und 429:
Seite 430 und 431:
Seite 432 und 433:
Seite 434 und 435:
Seite 436 und 437:
Seite 438 und 439:
Seite 440 und 441:
Seite 442 und 443:
Seite 444 und 445:
Seite 446 und 447:
Seite 448 und 449:
Seite 450 und 451:
Seite 452 und 453:
Seite 454 und 455:
Seite 456 und 457:
Seite 458 und 459:
458 LITERATURVERZEICHNIS IEEE Trans
Seite 460 und 461:
460 LITERATURVERZEICHNIS decomposit
Seite 462 und 463:
462 LITERATURVERZEICHNIS 1988. [Dev
Seite 464 und 465:
464 LITERATURVERZEICHNIS [Gibbs, 19
Seite 466 und 467:
466 LITERATURVERZEICHNIS [Ichino, 1
Seite 468 und 469:
468 LITERATURVERZEICHNIS trika, 29:
Seite 470 und 471:
470 LITERATURVERZEICHNIS [Martinez
Seite 472 und 473:
472 LITERATURVERZEICHNIS [Och und N
Seite 474 und 475:
474 LITERATURVERZEICHNIS [Rauber et
Seite 476 und 477:
476 LITERATURVERZEICHNIS [Schölkop
Seite 478 und 479:
478 LITERATURVERZEICHNIS fiers by a
Seite 480 und 481:
480 LITERATURVERZEICHNIS gnition, 3
Seite 482 und 483:
Index a posteriori Dichte, 341 Vert
Seite 484 und 485:
484 INDEX Formant, 208, 213 Formele
Seite 486 und 487:
486 INDEX Maßstab, 185 Maximumnorm
Seite 488 und 489:
488 INDEX LASSO, 336 maximum-a-post
Alle anzeigen

Klassifikation von Mustern

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?