Download (1800Kb) - oops/ - Oldenburger Online-Publikations-Server
Download (1800Kb) - oops/ - Oldenburger Online-Publikations-Server
Download (1800Kb) - oops/ - Oldenburger Online-Publikations-Server
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Beispielen erwartet wurde. Die Ursache dafür ist, daß entweder das Minimum der Fehlerfunktion<br />
nicht gefunden wurde oder die Dynamik so komplex ist, daß sie auch mit drei Schichten nicht erfaßt<br />
werden kann. Die Untersuchung für den realistischen Fall mit unabhängiger Testmenge zeigt, daß<br />
für drei Schichten starkes Übertraining auftritt. Dadurch liegen die Fehler deutlich höher als für<br />
zwei Schichten.<br />
Es wurde nicht versucht, das Verfahren mit drei Schichten und vollständiger Verbindung der Schichten<br />
zu verbessern, da der Aufwand hierfür zu groß wäre. Das Training eines neuronalen Netzes mit<br />
drei Schichten für 80 Moden dauert in etwa einen Tag, so daß das Testen verschiedener Trainingsverfahren<br />
zu zeitaufwendig wäre. Hinzu kommt, daß die Trainingsmenge wesentlich vergrößert<br />
werden müßte. Die Anzahl der Beispiele sollte mindestens so groß sein, wie die Anzahl der Verbindungen,<br />
um zu starkes Übertraining zu vermeiden. Für eine Netz mit drei Schichten ist die<br />
Anzahl der Verbindungen proportional zu 2N 3 ,für N = 80 würde das über 1.000.000 Gewichte<br />
bzw. Trainingsbeispiele bedeuten.<br />
Zusammenfassend läßt sich sagen, daß es bei der verwendeten Trainingsmethode und Trainingsmenge<br />
bei vollständiger Verbindung der Schichten günstiger ist, ein Netz mit nur zwei Schichten<br />
zu verwenden.<br />
Verbindung der Schichten<br />
In diesem Abschnitt wird dargestellt, inwieweit Übertraining durch eine Reduktion der Anzahl der<br />
Verbindungen zwischen den Schichten vermindert werden kann. Dazu wurden zunächst wieder<br />
zweischichtige Netze betrachtet. Um herauszufinden, auf welche Verbindungen verzichtet werden<br />
kann, ohne die Vorhersagequalität zu beeinträchtigen, wurden für die Vorhersagezeiträume 30 Minuten<br />
und 2 Stunden die Beträge der einzelnen Gewichte in Abb. 3.14 veranschaulicht. Der Wert<br />
eines Gewichts w i, j ist dabei durch den Grauwert eines Pixels gegeben. Durch die Position eines<br />
Pixels ist festgelegt, um welche Verbindung es sich handelt (x-Richtung: Eingabeneuronen, y-<br />
Richtung: Ausgabeneuronen). Die rechten Quadrate stehen jeweils für die Verbindungen vom Bild<br />
zum Zeitpunkt t (aktuelles Bild) zum vorherzusagenden Bild zum Zeitpunkt t + ∆t, wobei ∆t den<br />
Vorhersagezeitraum bezeichnet. Die linken Quadrate stehen für die Verbindungen vom vergangenen<br />
Bild (t −30min) zum Bild (t +∆t). Wie zu erwarten war, sind die Verbindungen vom aktuellen<br />
Bild zum vorherzusagenden Bild stärker ausgeprägt als die Verbindungen vom vergangenen Bild<br />
zum vorherzusagenden Bild.<br />
Bei der 30 Minuten Vorhersage sind die Verbindungen zwischen sich entsprechenden Moden, repräsentiert<br />
durch die Diagonalen in Abb. 3.14, deutlich stärker als alle anderen Verbindungen. Im<br />
Wesentlichen wirken auf eine vorherzusagende Mode aus dem Bild (t + ∆t) nur die entsprechenden<br />
Moden aus den Eingabebildern. Bei der Vorhersage über einen Bereich von 2 Stunden sind die<br />
Verbindungen zwischen sich entsprechenden Moden zwar ebenfalls am deutlichsten ausgeprägt,<br />
die Verbindungen zu anderen Moden tragen jedoch deutlich bei. Im Besonderen wirken die hohen<br />
Moden aus den Bildern t und (t −30min) auf die niedrigen Moden aus dem folgenden Bild (t +∆t)<br />
(großflächige Strukturen haben Einfluß auf kleinskalige Strukturen zu einem späteren Zeitpunkt).<br />
43