28.02.2014 Aufrufe

Download (1800Kb) - oops/ - Oldenburger Online-Publikations-Server

Download (1800Kb) - oops/ - Oldenburger Online-Publikations-Server

Download (1800Kb) - oops/ - Oldenburger Online-Publikations-Server

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Beispielen erwartet wurde. Die Ursache dafür ist, daß entweder das Minimum der Fehlerfunktion<br />

nicht gefunden wurde oder die Dynamik so komplex ist, daß sie auch mit drei Schichten nicht erfaßt<br />

werden kann. Die Untersuchung für den realistischen Fall mit unabhängiger Testmenge zeigt, daß<br />

für drei Schichten starkes Übertraining auftritt. Dadurch liegen die Fehler deutlich höher als für<br />

zwei Schichten.<br />

Es wurde nicht versucht, das Verfahren mit drei Schichten und vollständiger Verbindung der Schichten<br />

zu verbessern, da der Aufwand hierfür zu groß wäre. Das Training eines neuronalen Netzes mit<br />

drei Schichten für 80 Moden dauert in etwa einen Tag, so daß das Testen verschiedener Trainingsverfahren<br />

zu zeitaufwendig wäre. Hinzu kommt, daß die Trainingsmenge wesentlich vergrößert<br />

werden müßte. Die Anzahl der Beispiele sollte mindestens so groß sein, wie die Anzahl der Verbindungen,<br />

um zu starkes Übertraining zu vermeiden. Für eine Netz mit drei Schichten ist die<br />

Anzahl der Verbindungen proportional zu 2N 3 ,für N = 80 würde das über 1.000.000 Gewichte<br />

bzw. Trainingsbeispiele bedeuten.<br />

Zusammenfassend läßt sich sagen, daß es bei der verwendeten Trainingsmethode und Trainingsmenge<br />

bei vollständiger Verbindung der Schichten günstiger ist, ein Netz mit nur zwei Schichten<br />

zu verwenden.<br />

Verbindung der Schichten<br />

In diesem Abschnitt wird dargestellt, inwieweit Übertraining durch eine Reduktion der Anzahl der<br />

Verbindungen zwischen den Schichten vermindert werden kann. Dazu wurden zunächst wieder<br />

zweischichtige Netze betrachtet. Um herauszufinden, auf welche Verbindungen verzichtet werden<br />

kann, ohne die Vorhersagequalität zu beeinträchtigen, wurden für die Vorhersagezeiträume 30 Minuten<br />

und 2 Stunden die Beträge der einzelnen Gewichte in Abb. 3.14 veranschaulicht. Der Wert<br />

eines Gewichts w i, j ist dabei durch den Grauwert eines Pixels gegeben. Durch die Position eines<br />

Pixels ist festgelegt, um welche Verbindung es sich handelt (x-Richtung: Eingabeneuronen, y-<br />

Richtung: Ausgabeneuronen). Die rechten Quadrate stehen jeweils für die Verbindungen vom Bild<br />

zum Zeitpunkt t (aktuelles Bild) zum vorherzusagenden Bild zum Zeitpunkt t + ∆t, wobei ∆t den<br />

Vorhersagezeitraum bezeichnet. Die linken Quadrate stehen für die Verbindungen vom vergangenen<br />

Bild (t −30min) zum Bild (t +∆t). Wie zu erwarten war, sind die Verbindungen vom aktuellen<br />

Bild zum vorherzusagenden Bild stärker ausgeprägt als die Verbindungen vom vergangenen Bild<br />

zum vorherzusagenden Bild.<br />

Bei der 30 Minuten Vorhersage sind die Verbindungen zwischen sich entsprechenden Moden, repräsentiert<br />

durch die Diagonalen in Abb. 3.14, deutlich stärker als alle anderen Verbindungen. Im<br />

Wesentlichen wirken auf eine vorherzusagende Mode aus dem Bild (t + ∆t) nur die entsprechenden<br />

Moden aus den Eingabebildern. Bei der Vorhersage über einen Bereich von 2 Stunden sind die<br />

Verbindungen zwischen sich entsprechenden Moden zwar ebenfalls am deutlichsten ausgeprägt,<br />

die Verbindungen zu anderen Moden tragen jedoch deutlich bei. Im Besonderen wirken die hohen<br />

Moden aus den Bildern t und (t −30min) auf die niedrigen Moden aus dem folgenden Bild (t +∆t)<br />

(großflächige Strukturen haben Einfluß auf kleinskalige Strukturen zu einem späteren Zeitpunkt).<br />

43

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!