Kap. Z. Zeitreihen
Kap. Z. Zeitreihen
Kap. Z. Zeitreihen
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Übungen<br />
wie bisher im Klinikum, Raum 301<br />
Mo 10-12 Ronny Feuer<br />
Mo 16-17.30 Andreas Matz<br />
Di 11-13 Daniel Samaga<br />
Mi 8-10 Regina Reiner<br />
Mi 14-16 Sven Mensing<br />
Fr 8-10 Sven-Hendrik Lossin<br />
Fr 13-15 Reservezeit
Übersicht<br />
I. Grundlagen<br />
(Merkmale, Verteilung, Mittelwerte)<br />
II. Zusammenhang von Merkmalen<br />
(bedingte W., Bayes, Korrelation, Regression)<br />
III. Stochastische Modelle<br />
(Binomial, Poisson, Normalverteilung)<br />
hier wird fortgesetzt<br />
Heute ganz anderes Thema:<br />
ZEITREIHEN
Z. <strong>Zeitreihen</strong><br />
Z.1 Begriff der Zeitreihe<br />
Z.2 Struktur einer Zeitreihe<br />
Z.3 Formen des Trends<br />
Z.4 Glätten von <strong>Zeitreihen</strong><br />
Z.5 Saisonkomponente
Beispiele für <strong>Zeitreihen</strong><br />
Die meisten ökonomischen Daten sind in Form<br />
von <strong>Zeitreihen</strong> gegeben<br />
• Bruttoinlandsprodukt<br />
• Gewinne, Handelsvolumen, Steuern<br />
• Zahl der Geburten, Studenten, Azubis<br />
• Aktien- und Devisenkurse<br />
Weitere <strong>Zeitreihen</strong>:<br />
Wetter, Sprache, Medizin (EKG)
Z.1 Begriff der Zeitreihe<br />
Eine Zeitreihe ist eine Folge<br />
x 1 , ..., x T<br />
von zeitlich geordneten Werten eines Merkmals.<br />
Durch die Ordnung der Werte unterscheidet<br />
sich die Zeitreihe von einer Stichprobe.<br />
Im allgemeinen nimmt man konstanten Abstand<br />
zwischen aufeinanderfolgenden Zeitpunkten: ein<br />
Jahr, ein Quartal, Monat oder Tag.<br />
Problem bei Kursen: Wochenende, Feiertage
Wozu <strong>Zeitreihen</strong> ?<br />
Ziele der <strong>Zeitreihen</strong>analyse sind<br />
• Voraussage<br />
• Beschreibung von <strong>Zeitreihen</strong><br />
• Den zugrunde liegenden Prozess verstehen<br />
• Zusammenhang mehrerer <strong>Zeitreihen</strong> finden
Z.2 Struktur einer Zeitreihe<br />
In der Ökonomie zerlegt man eine Zeitreihe in<br />
1. den Trend T, der die langfristige Entwicklung<br />
beschreibt<br />
2. Saisonschwankungen S, die sich z.B. aus<br />
dem Jahresrhythmus ergeben<br />
3. eine zyklische Komponente Z, die z.B. Konjunkturschwankungen<br />
ausdrückt<br />
4. eine zufällige Komponente R, durch die auch<br />
benachbarte Werte sich unterscheiden (Rauschen,<br />
Fehler).
Bemerkungen zur Struktur<br />
Jede einzelne Komponente ist eine Funktion<br />
der Zeit.<br />
Nicht alle Komponenten müssen immer vorhanden<br />
sein.<br />
Die Zusammensetzung der Komponenten kann<br />
additiv als Summe erfolgen<br />
X = T + Z + S + R<br />
oder multiplikativ als Produkt:<br />
X = T ∗ Z ∗ S ∗ R<br />
Der zweite Fall lässt sich durch Logarithmierung<br />
der Werte auf den ersten zurückführen<br />
und wird deshalb nicht extra behandelt.<br />
Sowieso muss klar sein, dass die Zerlegung nicht<br />
exakt die Wirklichkeit ausdrückt, sondern eine<br />
vereinfachte Modellvorstellung ist.
Z.3 Formen des Trends<br />
Mit Trend bezeichnet man eine Funktion f(t),<br />
durch die man die Werte x t der Zeitreihe gut<br />
annähern kann. Folgende Funktionsklassen sind<br />
üblich:<br />
f(t) = a + bt<br />
linearer Trend<br />
f(t) = a ∗ e bt<br />
exponentieller Trend<br />
f(t) = a + bt + t 2<br />
quadratischer Trend<br />
Die Funktionsklasse muss aus der Graphik<br />
bzw. aus der Aufgabenstellung bestimmt werden.<br />
Für verschiedene Teile der Zeitreihe können<br />
unterschiedliche Trendfunktionen zutreffen (lokaler<br />
Trend).<br />
Ist keine Trendfunktion offensichtlich, so wird<br />
statt von Trend und zyklischer Komponente<br />
von der glatten Komponente der Zeitreihe gesprochen.
Bestimmung des Trends<br />
Ein linearer Trend liegt vor, wenn alle Differenzen<br />
x t − x t−1 etwa gleich sind.<br />
Statt benachbarter Werte kann man auch weitere<br />
Differenzen wie x t − x t−5 nehmen, um den<br />
Einfluss von Störungen gering zu halten.<br />
Ein exponentieller Trend liegt vor, wenn die<br />
Quotienten x t /x t−1 etwa konstant sind.<br />
In diesem Fall haben die logarithmierten Werte<br />
einen linearen Trend.<br />
Die Bestimmung der Parameter a, b für die beste<br />
Trendfunktion erfolgt durch lineare, quadratische<br />
oder exponentielle Regression.
Z.4 Begriff des Filters<br />
Wenn man aus aufeinanderfolgenden Werten<br />
x t in jeweils gleicher Weise eine neue Zeitreihe<br />
y t macht, nennt man dies einen Filter. Beispiele:<br />
y t = x t − x t−1<br />
Differenzfilter<br />
y t = 1 2·(x t−1+x t ) gleitender Durchschnitt, Länge 2<br />
y t = 1 m·(x t−m+1+...+x t−1 +x t ) g.D., Länge m<br />
Der Differenzfilter beseitigt einen linearen Trend,<br />
zweimalige Anwendung dieses Filters beseitigt<br />
einen quadratischen Trend (so wie die zweite<br />
Ableitung von x 2 konstant wird).
Z.4 Glättung von <strong>Zeitreihen</strong><br />
Die gleitenden Durchschnitte filtern das Rauschen<br />
heraus (und bei geeigneter Konstruktion<br />
auch die Saisonkomponente, s. unten) und lassen<br />
die glatte Komponente übrig.<br />
Oben waren einfache gleitende Durchschnitte<br />
erwähnt, d.h. mit gleichen Gewichten p k =<br />
1/m, die nachlaufend waren, d.h. mit Werten<br />
x t−k . Man kann auch beliebige Gewichte p k<br />
nehmen:<br />
y t = ∑ k<br />
p k x t−k<br />
Dabei sollte ∑ p k = 1 sein, damit die Werte y t<br />
im Durchschnitt so groß werden wie die x t .<br />
Ebenso können Werte x t+k rechts von x t mit<br />
verwendet werden (zentrierte oder vorlaufende<br />
gleitende Durchschnitte).
Wählt man p k = b k (1 − b) mit b < 1 so spricht<br />
man von exponentieller Glättung. Für b = 1/2<br />
ergeben sich die Gewichte 1/2, 1/4, 1/8 usw.<br />
Für kleinere b wird die geglättete Reihe den<br />
Originaldaten ähnlicher, für b nahe 1 werden<br />
viele vergangene Werte mit beachtet.<br />
Jede Glättung wird Maxima und Minima der<br />
ursprünglichen Reihe abflachen.
Z.5 Saisonkomponente<br />
Aus der Aufgabenstellung ist bekannt, welches<br />
Zeitintervall (Jahr, Quartal, Woche) der Saisonschwankung<br />
entspricht.<br />
Rechnerisch bestimmt man Saisonkomponente<br />
+ Rauschen als<br />
Originalreihe − geglättete Reihe<br />
wobei der Glättungsfilter so konstruiert ist, dass<br />
er die Saisonschwankungen wegnimmt. Er sollte<br />
die Länge der Saison haben. Bei einer Jahressaison<br />
und halbjährlichen Werten (z.B. Studentenzahlen<br />
im Winter und Sommer) nimmt<br />
man einen einfachen Filter der Länge 2. Oder<br />
besser<br />
y t = 1 4 · (x t−1 + 2x t + x t+1 )<br />
weil dies tatsächlich als gemittelter Wert an<br />
der Stelle t (und nicht t − 0.5 oder t + 0.5) interpretiert<br />
werden kann.
Für die Uni Greifswald ergibt sich z.B., dass im<br />
Wintersemester etwa 3 Prozent mehr Studenten<br />
da sind als im Jahresdurchschnitt und im<br />
Sommersemester 3 Prozent weniger.<br />
Bei Quartalswerten und einer jährlichen Saison<br />
nimmt man einen einfachen Durchschnitt der<br />
Länge 4 oder<br />
y t = 1 8 · x t−2 + 1 4 · (x t−1 + x t + x t+1 ) + 1 8 · x t+2