20.01.2015 Aufrufe

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

Optimierte lokale Modelle in der nichtlinearen Zeitreihenanalyse

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Seite 34<br />

2.4. Validierung <strong>lokale</strong>r <strong>Modelle</strong><br />

Aussagekraft; <strong>in</strong>sb. ist <strong>der</strong> Satz an Parametern, <strong>der</strong> den E<strong>in</strong>schritt-Vorhersagefehler<br />

m<strong>in</strong>imiert <strong>in</strong> <strong>der</strong> Regel nicht identisch mit dem Satz, <strong>der</strong> auch bei mehr als e<strong>in</strong>em<br />

Vorhersageschritt die besten Ergebnisse liefert. Robuste Ergebnisse erhält man daher<br />

erst, wenn man die Fehler für mehrere iterierte Vorhersageschritte summiert.<br />

Dies ergibt den p-Schritt Vorhersagefehler<br />

MSE p = 1<br />

p|T ref |<br />

[<br />

∑ (st+1<br />

− f t (x t ) ) p−1<br />

∑<br />

2 (<br />

+ st+i+1 − f t+i (ˆx t+i ) ) ]<br />

2<br />

. (2.12)<br />

t∈T ref i=1<br />

Hierbei stammt nur <strong>der</strong> erste Punkt x t aus dem Datensatz, während alle weiteren<br />

iterierten Vorhersagen auf den geschätzten Punkten ˆx t+i basieren.<br />

Aufgrund des chaotischen Verhaltens <strong>der</strong> betrachteten Systeme kann die Anzahl <strong>der</strong><br />

Schritte p nicht beliebig groß gemacht werden. Verlässt man den Vorhersagehorizont<br />

des Modells, so wird <strong>der</strong> Vorhersagefehler sehr groß und liefert ke<strong>in</strong>e s<strong>in</strong>nvolle<br />

Aussage mehr. Die Anzahl <strong>der</strong> möglichen Vorhersageschritte hängt natürlich vom<br />

jeweiligen System ab; bei kont<strong>in</strong>uierlichen Systemen spielt zudem die gewählte Abtastrate<br />

e<strong>in</strong>e erhebliche Rolle.<br />

Bei eng abgetasteten Zeitreihen gibt es e<strong>in</strong> weiteres Problem: nimmt man für die<br />

LOO-CV e<strong>in</strong>en Testpunkt aus dem Datensatz heraus und sucht <strong>in</strong> <strong>der</strong> verbleibenden<br />

Tra<strong>in</strong><strong>in</strong>gsmenge dessen nächste Nachbarn, wird man mit hoher Wahrsche<strong>in</strong>lichkeit<br />

Punkte direkt vor und direkt h<strong>in</strong>ter dem Testpunkt f<strong>in</strong>den. Dies verfälscht jedoch<br />

das Ergebnis, da dies bei e<strong>in</strong>em “echten” Anfragepunkt, <strong>der</strong> nicht e<strong>in</strong>fach aus dem<br />

Datensatz entnommen wurde, nicht <strong>der</strong> Fall ist. Es ist daher s<strong>in</strong>nvoll, e<strong>in</strong>e bestimmte<br />

Anzahl an Punkten vor und h<strong>in</strong>ter dem Testpunkt von <strong>der</strong> Suche nächster Nachbarn<br />

auszuschließen. Zur Wahl dieses zusätzlichen Parameters bietet sich die mittlere<br />

Wie<strong>der</strong>kehrzeit des Systems an [25]. Sie wird nach folgendem Algorithmus berechnet:<br />

• Wähle zufällig e<strong>in</strong>en Punkt x i aus dem Datensatz.<br />

• Bestimme die Distanz d(x i , x i+p ) mit p = 1, 2, . . . zwischen diesem Punkt und<br />

den nachfolgenden Punkten.<br />

• Bestimmte den additiven Index p, ab dem die Distanz erstmals wie<strong>der</strong> kle<strong>in</strong>er<br />

wird. Dieser ist dann gerade die halbe Wie<strong>der</strong>kehrzeit für den Index i.<br />

• Wie<strong>der</strong>hole diese Schritte für genügend Punkte i des Datensatzes und bestimme<br />

den Mittelwert aller p i . Dieser ist gerade die halbe Wie<strong>der</strong>kehrzeit des<br />

Systems.<br />

Vor <strong>der</strong> Modellierung wird die mittlere Wie<strong>der</strong>kehrzeit des Systems berechnet, die<br />

im Folgenden mit dem Parameter c bezeichnet wird. Der Ausschluss aller Punkte

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!