28.02.2014 Aufrufe

Download (1800Kb) - oops/ - Oldenburger Online-Publikations-Server

Download (1800Kb) - oops/ - Oldenburger Online-Publikations-Server

Download (1800Kb) - oops/ - Oldenburger Online-Publikations-Server

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

mean rmse<br />

23<br />

22.5<br />

22<br />

21.5<br />

21<br />

20.5<br />

20<br />

Gleichbleibende Reihenfolge der Trainingsmuster<br />

η=0.1<br />

η=0.05<br />

η=0.02<br />

η=0.01<br />

mean rmse<br />

23<br />

22.5<br />

22<br />

21.5<br />

21<br />

20.5<br />

20<br />

Wechselnde Reihenfolge der Trainingsmuster<br />

η=0.1<br />

η=0.05<br />

η=0.02<br />

η=0.01<br />

19.5<br />

19.5<br />

19<br />

19<br />

18.5<br />

5000 10000 15000 20000<br />

Anzahl der Trainingsschritte<br />

18.5<br />

1000 2000 3000 4000 5000 6000<br />

Anzahl der Trainingsschritte<br />

Abbildung 3.10: Mittlerer Vorhersagefehler in Abhängigkeit von der Anzahl der Trainingsschritte<br />

für verschiedene Lernschrittweiten am Beispiel von Klasse 3, Vorhersagezeitraum 30 Minuten,<br />

N=60 und vollständiger Verbindung der Schichten. Im linken Bild wurden die Trainingsbeispiele<br />

in gleichbleibender Reihenfolge präsentiert, im rechten Bild wechselte die Reihenfolge bei jedem<br />

Trainingsschritt.<br />

nistisch, es gibt einen Anteil in der Entwicklung der Bewölkungssituation, der nicht berechenbar<br />

ist. Die Ein- und Ausgabepaare sind daher gegenüber der zugrunde liegenden deterministischen<br />

Dynamik verrauscht. Ist die Anzahl der Trainingsbeispiele im Vergleich zu der Anzahl der festzulegenden<br />

Verbindungen zu klein, wird das neuronale Netz durch das Training auch an das Rauschen<br />

angepaßt, was als Übertraining bezeichnet wird. Das neuronale Netz kann dann weniger gut<br />

generalisieren, neue Beispiele können weniger gut vorhergesagt werden.<br />

Zur Vereinfachung der Ausdrucksweise wird im Weiteren eine zur Trainingsmenge disjunkte Testmenge<br />

als unabhängige Testmenge bezeichnet. Ist die Testmenge ein Teil der Trainingsmenge,<br />

wird sie integrierte Testmenge genannt.<br />

Der Einfluß der Länge der Trainingsmenge wurde am Beispiel des Vorhersagezeitraums 30 Minuten<br />

für Netze mit 2 Schichten und vollständiger Verbindung der Schichten untereinander untersucht.<br />

Die Lernschrittweite wurde auf η = 0.2 gesetzt, und es wurden jeweils 500 Trainingsschritte<br />

durchgeführt.<br />

In Abb. 3.11 sind die Vorhersagefehler auf der Testmenge für zwei verschiedene Anzahlen von<br />

Moden zur Repräsentation der Bilder, N = 20 und N = 60, in Abhängigkeit von der Anzahl der<br />

Trainingsbeispiele dargestellt. Dabei wird der Fehler für unabhängige Testmengen zu integrierten<br />

Testmengen in Bezug gesetzt. Wie zu erwarten, sinkt der Fehler für unabhängige Testmengen<br />

mit der Anzahl der Trainingsbeispiele. Der Vergleich der beiden Bilder für N = 20 und N = 60<br />

zeigt, daß bei einer geringeren Anzahl von Moden weniger Trainingsbeispiele notwendig sind, um<br />

Übertraining zu vermeiden. Dies läßt sich darauf zurückführen, daß zum einen bei Verwendung<br />

von weniger Moden der Rauschanteil geringer ist. Zum anderen steigt die Anzahl der Verbindungen<br />

M mit der Anzahl der Moden, die verwendet werden (für ein zweischichtiges Netz: M = 2N 2 )<br />

und verstärkt so die Überanpassung an die Trainingsmenge zusätzlich.<br />

39

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!