Klassifikation von Mustern

Weitere Magazine

Empfehlungen

Info

388 KAPITEL 4. NUMERISCHE KLASSIFIKATION (VK.2.3.3, 07.09.2005) εCE = − εCFM = M (L) −1 i=0 1 M (L) − 1 δi log[f (L) i ] + (1 − δi) log[1 − f (L) i ] M (L) λ=1 λ=κ a 1 + exp −(b(f (L) κ , (4.5.15) − f (L) . (4.5.16) λ ) + c) Der mittlere quadratische Fehler εMSE ist ein häufiges Fehlermaß, das auch schon in (4.4.9) verwendet wurde. Der MCCLELLAND-Fehler εMcC hat Vorteile bei vielen Klassen, d. h. bei vielen Ausgabeknoten. Die Verwendung der Kreuzentropie εCE soll die Unterschiede zwischen tatsächlicher und idealer Verteilungsdichte der Ausgabewerte minimieren. Das Maß εCFM soll den Unterschied zwischen dem Ausgabewert für die richtige Klasse und den Ausgabewerten der der Wert für den Ausgabeknoten, der die richtige der Wert der anderen, und a, b, c sind Parameter. Alle diese Maße hängen letztlich von der Topologie und den Gewichten des neuronalen Netzes ab. anderen Klassen maximieren. Dabei ist f (L) κ Klasse kodiert, f (L) λ Die Einstellung der Gewichte erfolgt durch einen Gradientenabstieg gemäß w (l) ij ← w(l) ij − β ∂ε ∂w (l) ij = w (l) ij Dabei ist β die Schrittweite und ∂ε/∂w (l) ij + ∆w(l) ij . (4.5.17) die Richtung des Abstiegs. Die Schrittweite wird empirisch festgelegt. Der Gradientenabstieg ist für alle obigen Fehlermaße möglich. Als Beispiel wird für den mittleren quadratischen Fehler εMSE in (4.5.13) und die Sigmoid Funktion in (4.5.1) mit α = 1 die Differentiation in der Ausgabeschicht l = L = 3 durchgeführt. Man erhält mit der Kettenregel der Differentiation ∂εMSE ∂w (L) ij = ∂εMSE ∂f (L) j = ∂ ∂f (3) j ∂ ∂w (3) ij = − ∂f (L) j ∂y (L) j ∂y (L) j ∂w (L) ji 0, 5 (δi − f (3) i δj − f (3) j = −d (3) (2) j f i Damit wird der Korrekturterm ∆w (3) ij i i ) 2 w (3) (2) ij f i − w(3) j 1 − f (3) j ∂ ∂y (3) j f (3) (2) j f i 1 1 + exp(−y (3) j ) (4.5.18) (2) = βd(3) j f i . (4.5.19) Eine entsprechende Rechnung ergibt die Korrekturterme (4.5.22) für die unteren Schichten. Die Gleichungen für das Training sind nachfolgend zusammengefasst.
4.5. NEURONALE NETZE (VA.2.2.3, 13.04.2004) 389 Satz 4.17 (Fehlerrückführungs–Algorithmus) (“error–back–propagation”) Das Training des MLP erfolgt nach den Gleichungen: w (l) ij d (L) j d (l−1) j ← w(l) ij = = + βd(l) j δj − f (L) j M (l) −1 k=0 (l−1) f i l = L, L − 1, . . . , 1 , (4.5.20) 1 − f (L) j f (L) j , (4.5.21) d (l) k w(l) kj 1 − f (l−1) j f (l−1) j l = L, L − 1, . . . , 2 . (4.5.22) Das Training wird iterativ durchgeführt, wobei sukzessive Muster f einer Stichprobe an der Eingabeschicht angeboten werden. Mit (4.5.5) bzw. (4.5.9) wird die Ausgabe des Netzes berechnet. Für die Klassifikation von Mustern wird vorausgesetzt, dass die Trainingsstichprobe klassifiziert ist, d. h. der Wert von δκ(c) in (4.5.11) oder (4.5.12) ist bekannt. Beginnend mit der Ausgabeschicht kann nun (4.5.21) ausgewertet werden und neue Gewichte w (L) ij mit (4.5.20) berechnet werden. Dann werden schrittweise neue Gewichte in den unteren Schichten mit (4.5.22) berechnet. Der Fehler (δj − f (L) j ) wird also von der Ausgabeschicht zur Eingabeschicht „zurückgeführt“, und daher kommt der Name für diesen Trainingsalgorithmus, nämlich Fehlerrückführungs–Algorithmus (bzw. “error–back–propagation algorithm”). Das Training eines neuronalen Netzes kann sehr langwierig sein. Daher wurden verschiedene Ansätze zur Beschleunigung des Trainings vorgeschlagen. Mit der Einführung eines Momententerms wird die Änderung der Gewichte modifiziert zu ∆w (l) ij,N (l−1) = βd(l) j,Nf i,N + γ∆w(l) ij,N−1 , (4.5.23) wobei β und γ Parameter sind, die experimentell festgelegt werden. Weitere Varianten des Trainings sind der zitierten Literatur zu entnehmen. Eigenschaften Da sich mit dem MLP beliebige Funktionen approximieren lassen, eignet es sich sowohl für die Klassifikation von Mustern als auch z. B. für die Vorhersage, Inversion oder Glättung von Funktionen. Einige wichtige Aussagen sind im Folgenden zusammengefasst, wobei für Beweise auf die angegebene Literatur verwiesen wird. Satz 4.18 Das MLP erlaubt 1. die Definition jeder logischen Funktion (zwei Schichten von Gewichten sind hinreichend, Beweis: s. z. B. [Muroga, 1971]); 2. die Approximation jeder nichtlinearen Funktion (zwei Schichten von Gewichten sind hinreichend, Beweis: s. z. B. [Hornik et al., 1989, White, 1990]); 3. die Definition beliebiger Klassengrenzen im R n (zwei Schichten von Gewichten sind hinreichend, Beweis: s. z. B. [Makhoul et al., 1989]). Die Tatsache, dass zwei Schichten für die Approximationen hinreichend sind, schließt nicht aus, dass u. U. drei oder noch mehr Schichten eine schnellere Konvergenz des Trainings erlauben und daher vorzuziehen sind. Insbesondere für die Klassifikation werden oft L = 3 Schichten von Gewichten vorgeschlagen, wobei die Argumentation anschaulich darin besteht, dass
Seite 1 und 2:
Vorwort, 1. Auflage Dieses Buch bes
Seite 3:
Dank Der Autor dankt für Hinweise
Seite 6 und 7:
6 INHALTSVERZEICHNIS 2.2.1 Vorbemer
Seite 8 und 9:
8 INHALTSVERZEICHNIS 4.2.5 Klassifi
Seite 10 und 11:
10 KAPITEL 1. EINFÜHRUNG (VK.1.3.3
Seite 12 und 13:
Seite 14 und 15:
Seite 16 und 17:
Seite 18 und 19:
Seite 20 und 21:
Seite 22 und 23:
Seite 24 und 25:
Seite 26 und 27:
Seite 28 und 29:
Seite 30 und 31:
Seite 32 und 33:
Seite 34 und 35:
Seite 36 und 37:
Seite 38 und 39:
Seite 40 und 41:
Seite 42 und 43:
Seite 44 und 45:
Seite 46 und 47:
Seite 48 und 49:
Seite 50 und 51:
Seite 52 und 53:
Seite 54 und 55:
54 LITERATURVERZEICHNIS [Denzler, 2
Seite 56 und 57:
56 LITERATURVERZEICHNIS [Niemann, 1
Seite 58 und 59:
58 LITERATURVERZEICHNIS
Seite 60 und 61:
60 KAPITEL 2. VORVERARBEITUNG (VK.1
Seite 62 und 63:
Seite 64 und 65:
Seite 66 und 67:
Seite 68 und 69:
Seite 70 und 71:
Seite 72 und 73:
Seite 74 und 75:
Seite 76 und 77:
Seite 78 und 79:
Seite 80 und 81:
Seite 82 und 83:
Seite 84 und 85:
Seite 86 und 87:
Seite 88 und 89:
Seite 90 und 91:
Seite 92 und 93:
Seite 94 und 95:
Seite 96 und 97:
Seite 98 und 99:
Seite 100 und 101:
100 KAPITEL 2. VORVERARBEITUNG (VK.
Seite 102 und 103:
Seite 104 und 105:
Seite 106 und 107:
Seite 108 und 109:
Seite 110 und 111:
Seite 112 und 113:
Seite 114 und 115:
Seite 116 und 117:
Seite 118 und 119:
Seite 120 und 121:
Seite 122 und 123:
Seite 124 und 125:
Seite 126 und 127:
Seite 128 und 129:
Seite 130 und 131:
Seite 132 und 133:
Seite 134 und 135:
Seite 136 und 137:
Seite 138 und 139:
Seite 140 und 141:
Seite 142 und 143:
Seite 144 und 145:
Seite 146 und 147:
146 LITERATURVERZEICHNIS [Barrett,
Seite 148 und 149:
148 LITERATURVERZEICHNIS Universit
Seite 150 und 151:
150 LITERATURVERZEICHNIS Lokalisier
Seite 152 und 153:
152 LITERATURVERZEICHNIS [Kwok und
Seite 154 und 155:
154 LITERATURVERZEICHNIS [Niemann,
Seite 156 und 157:
156 LITERATURVERZEICHNIS niques. Co
Seite 158 und 159:
158 LITERATURVERZEICHNIS and Image
Seite 160 und 161:
160 LITERATURVERZEICHNIS
Seite 162 und 163:
162 KAPITEL 3. MERKMALE (VK.2.3.3,
Seite 164 und 165:
Seite 166 und 167:
Seite 168 und 169:
Seite 170 und 171:
Seite 172 und 173:
Seite 174 und 175:
Seite 176 und 177:
Seite 178 und 179:
Seite 180 und 181:
Seite 182 und 183:
Seite 184 und 185:
Seite 186 und 187:
Seite 188 und 189:
Seite 190 und 191:
Seite 192 und 193:
Seite 194 und 195:
Seite 196 und 197:
Seite 198 und 199:
Seite 200 und 201:
Seite 202 und 203:
Seite 204 und 205:
Seite 206 und 207:
Seite 208 und 209:
Seite 210 und 211:
Seite 212 und 213:
Seite 214 und 215:
Seite 216 und 217:
Seite 218 und 219:
Seite 220 und 221:
Seite 222 und 223:
Seite 224 und 225:
Seite 226 und 227:
Seite 228 und 229:
Seite 230 und 231:
Seite 232 und 233:
Seite 234 und 235:
Seite 236 und 237:
Seite 238 und 239:
Seite 240 und 241:
Seite 242 und 243:
Seite 244 und 245:
Seite 246 und 247:
Seite 248 und 249:
Seite 250 und 251:
Seite 252 und 253:
Seite 254 und 255:
Seite 256 und 257:
Seite 258 und 259:
Seite 260 und 261:
Seite 262 und 263:
Seite 264 und 265:
Seite 266 und 267:
Seite 268 und 269:
Seite 270 und 271:
Seite 272 und 273:
Seite 274 und 275:
Seite 276 und 277:
Seite 278 und 279:
Seite 280 und 281:
Seite 282 und 283:
282 LITERATURVERZEICHNIS [Arcese et
Seite 284 und 285:
284 LITERATURVERZEICHNIS [Caelli un
Seite 286 und 287:
286 LITERATURVERZEICHNIS [de Figuei
Seite 288 und 289:
288 LITERATURVERZEICHNIS [Gubner un
Seite 290 und 291:
290 LITERATURVERZEICHNIS [Kailath,
Seite 292 und 293:
292 LITERATURVERZEICHNIS and enhanc
Seite 294 und 295:
294 LITERATURVERZEICHNIS [Moayer un
Seite 296 und 297:
296 LITERATURVERZEICHNIS [Picone, 1
Seite 298 und 299:
298 LITERATURVERZEICHNIS modeling a
Seite 300 und 301:
300 LITERATURVERZEICHNIS images usi
Seite 302 und 303:
302 LITERATURVERZEICHNIS ments: A n
Seite 304 und 305:
304 KAPITEL 4. NUMERISCHE KLASSIFIK
Seite 306 und 307:
Seite 308 und 309:
Seite 310 und 311:
Seite 312 und 313:
Seite 314 und 315:
Seite 316 und 317:
Seite 318 und 319:
Seite 320 und 321:
Seite 322 und 323:
Seite 324 und 325:
Seite 326 und 327:
Seite 328 und 329:
Seite 330 und 331:
Seite 332 und 333:
Seite 334 und 335:
Seite 336 und 337:
Seite 338 und 339: 338 KAPITEL 4. NUMERISCHE KLASSIFIK
Seite 438 und 439:
Seite 440 und 441:
Seite 442 und 443:
Seite 444 und 445:
Seite 446 und 447:
Seite 448 und 449:
Seite 450 und 451:
Seite 452 und 453:
Seite 454 und 455:
Seite 456 und 457:
Seite 458 und 459:
458 LITERATURVERZEICHNIS IEEE Trans
Seite 460 und 461:
460 LITERATURVERZEICHNIS decomposit
Seite 462 und 463:
462 LITERATURVERZEICHNIS 1988. [Dev
Seite 464 und 465:
464 LITERATURVERZEICHNIS [Gibbs, 19
Seite 466 und 467:
466 LITERATURVERZEICHNIS [Ichino, 1
Seite 468 und 469:
468 LITERATURVERZEICHNIS trika, 29:
Seite 470 und 471:
470 LITERATURVERZEICHNIS [Martinez
Seite 472 und 473:
472 LITERATURVERZEICHNIS [Och und N
Seite 474 und 475:
474 LITERATURVERZEICHNIS [Rauber et
Seite 476 und 477:
476 LITERATURVERZEICHNIS [Schölkop
Seite 478 und 479:
478 LITERATURVERZEICHNIS fiers by a
Seite 480 und 481:
480 LITERATURVERZEICHNIS gnition, 3
Seite 482 und 483:
Index a posteriori Dichte, 341 Vert
Seite 484 und 485:
484 INDEX Formant, 208, 213 Formele
Seite 486 und 487:
486 INDEX Maßstab, 185 Maximumnorm
Seite 488 und 489:
488 INDEX LASSO, 336 maximum-a-post
Alle anzeigen

Klassifikation von Mustern

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?