Kapitel 24 Kurvenanpassung
Kapitel 24 Kurvenanpassung
Kapitel 24 Kurvenanpassung
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
<strong>Kapitel</strong> <strong>24</strong><br />
<strong>Kurvenanpassung</strong><br />
Die Prozedur KURVENANPASSUNG schätzt die Parameter einer Regressionsgleichung<br />
mit einer abhängigen (zu erklärenden) Variablen y und einer unabhängigen<br />
(erklärenden) Variablen x. Anders als bei der multiplen linearen Regression (siehe<br />
hierzu <strong>Kapitel</strong> 23, Lineare Regression), bei der die Beziehung zwischen der abhängigen<br />
und der unabhängigen Variablen linear sein muß, können Sie hier unterschiedliche<br />
Kurventypen verwenden. So kann zwischen den beiden Variablen zum<br />
Beispiel ein kubischer, exponentieller oder logarithmischer Zusammenhang bestehen.<br />
Dieser Vorteil gegenüber der multiplen linearen Regression wird allerdings<br />
mit der Beschränkung erkauft, daß bei der Prozedur KURVENANPASSUNG nur eine<br />
erklärende Variable herangezogen werden kann. Multiple Erklärungen sind damit<br />
nicht möglich.<br />
<strong>24</strong>.1 Beispiel 1: Die Phillips-Kurve<br />
Die Aufmerksamkeit von Ökonomen richtet sich immer wieder auf einen möglichen<br />
Zusammenhang zwischen der Höhe des Beschäftigungsniveaus (bzw. dem<br />
Ausmaß der Arbeitslosigkeit) und der Veränderung des Preisniveaus. 1958 hat<br />
Alban W. Phillips den Zusammenhang zwischen der Arbeitslosenquote und dem<br />
Anstieg des Nominallohnes untersucht. 260 Die grafische Darstellung dieses Zusammenhangs<br />
ist als Phillips-Kurve bekannt. Diese deutet an, daß das gesamtwirtschaftliche<br />
Nominallohnniveau um so stärker ansteigt, je geringer die Arbeitslosenquote<br />
ist. Dieser Zusammenhang ist auch recht plausibel, wenn man sich den<br />
Arbeitsmarkt als einen Markt wie andere (zum Beispiel den Markt für Autos oder<br />
für Immobilien) vorstellt: Eine geringe Arbeitslosenquote bedeutet, daß das Angebot<br />
an Arbeit (also die Nachfrage nach Arbeitsplätzen) im Vergleich zur Arbeitsnachfrage<br />
(also zum Angebot an Arbeitsplätzen) relativ gering ist. Wenn aber das<br />
Angebot im Vergleich zur Nachfrage gering ist, liegt es nahe, daß der Preis für<br />
260 Siehe Phillips, A.W. (1958): The Relation Between Unemployment and the Rate of<br />
Change of Money Wage Rates in the United Kingdom, 1861 – 1957, in: Economica, Vol. 25,<br />
S. 283 – 299.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
578 <strong>Kapitel</strong> <strong>24</strong> <strong>Kurvenanpassung</strong><br />
Arbeit (also der Nominallohn) relativ stark ansteigt - dies ist im Prinzip auch auf<br />
anderen Märkten so.<br />
1960 haben Paul A. Samuelson und Robert M. Solow eine modifizierte Form der<br />
Phillips-Kurve vorgelegt 261 , in der die Arbeitslosenquote nicht mehr den Nominallohnänderungen,<br />
sondern den Preisniveauänderungen gegenübergestellt wird.<br />
Auch diese Kurve beschreibt einen negativen Zusammenhang zwischen den beiden<br />
Variablen: Je höher die Inflationsrate, desto niedriger ist die Arbeitslosenquote.<br />
Wenn ein solcher Zusammenhang tatsächlich Gültigkeit besitzt, ergibt sich<br />
daraus unmittelbar ein Dilemma für die Wirtschaftspolitik. Sowohl eine niedrige<br />
Arbeitslosenquote als auch eine geringe Inflationsrate werden im allgemeinen als<br />
erstrebenswerte Ziele angesehen. Gilt jedoch der durch die modifizierte Phillips-<br />
Kurve beschriebene Zusammenhang, lassen sich beide Ziele nicht gleichzeitig erreichen,<br />
sondern die Politik muß gewissermaßen zwischen Skylla und Charybdis<br />
wählen. Allerdings ist die Gültigkeit dieses Zusammenhangs - und insbesondere<br />
seine Stabilität im Zeitablauf - sehr umstritten. Auch seine funktionale Form ist<br />
nicht eindeutig bestimmt. So kann ein negativer Zusammenhang zwischen der Inflationsrate<br />
und der Arbeitslosenquote unter anderem eine lineare, eine quadratische<br />
oder eine logarithmische Form haben. Mit anderen Worten: Die modifizierte<br />
Phillips-Kurve kann grundsätzlich verschiedenen Kurventypen entsprechen.<br />
Auf der Begleit-CD befindet sich die Datei Makrodaten.sav mit verschiedenen<br />
makroökonomischen Zeitreihen für die alten Länder der Bundesrepublik<br />
Deutschland. Unter anderem enthält die Datei die Variablen alq und preise_v, in<br />
denen die Arbeitslosenquoten sowie die Veränderungsraten des Preisindex des<br />
Bruttosozialprodukts für die Jahre 1960 bis 1996 enthalten sind. Um einen ersten<br />
Eindruck von einem möglichen Zusammenhang zwischen den Variablen zu bekommen,<br />
bietet es sich an, die gemeinsame Verteilung in einem Streudiagramm<br />
darzustellen. Um ein solches Diagramm zu erstellen, wählen Sie den Befehl<br />
GRAFIK, STREUDIAGRAMM und anschließend die Option Einfach. Geben Sie in<br />
dem Dialogfeld Einfaches Scatterplot die Variablen preise_v als Y-Variable, alq<br />
als X-Variable und jahr für die Fallbeschriftung an. Mit diesen Einstellungen erhalten<br />
Sie das in Abbildung <strong>24</strong>.1 dargestellte Streudiagramm. Das abgebildete<br />
Diagramm wurde im Grafikeditor leicht verändert, insbesondere wurde mit dem<br />
Befehl FORMAT, INTERPOLATION eine Verbindungslinie zwischen den einzelnen<br />
Datenpunkten eingefügt. Die Linie verbindet die Punkte in ihrer historischen Reihenfolge.<br />
Das Streudiagramm läßt folgendes erkennen: Die Annahme eines negativen Zusammenhangs<br />
zwischen der Inflationsrate und der Arbeitslosenquote scheint mit<br />
der im Streudiagramm dargestellten gemeinsamen Verteilung dieser beiden Größen<br />
vereinbar zu sein. Dies gilt in besonderem Maße für die Beobachtungen ab<br />
1970. Werden nur die Daten seit diesem Zeitpunkt betrachtet, weist die zwischen<br />
den Datenpunkten eingezeichnete Verbindungslinie in der Tendenz eindeutig einen<br />
fallenden Verlauf auf. Dies ist gleichbedeutend mit der Beobachtung, daß re-<br />
261 Vgl. Samuelson, P.A., R.M. Solow (1960): Analytical Aspects of Anti-Inflation Policy, in:<br />
American Economic Review, Vol. 50, S. 177-194.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>24</strong>.1 Beispiel 1: Die Phillips-Kurve 579<br />
lativ hohe (niedrige) Werte der Arbeitslosenquote in diesem Zeitraum oftmals gemeinsam<br />
mit relativ niedrigen (hohen) Inflationsraten aufgetreten sind. In den 60 er<br />
Jahren scheint dieser Zusammenhang nicht gegolten zu haben. Während für die<br />
Inflationsrate in diesem Jahrzehnt sowohl sehr hohe als auch sehr niedrige Werte<br />
beobachtet werden konnten, lag die höchste beobachtete Arbeitslosenquote nur<br />
etwas mehr als ein Prozentpunkt über ihrem niedrigsten Wert. Die Arbeitslosenquote<br />
scheint somit von den Änderungen der Inflationsrate kaum berührt worden<br />
zu sein. Zu einem ähnlichen Ergebnis kann man gelangen, wenn man die Periode<br />
von 1975 bis 1981 isoliert betrachtet. Auch in dieser Zeit waren die Änderungen<br />
in der Arbeitslosenquote eher gering, obwohl sich die Preise in den einzelnen Jahren<br />
mit deutlich unterschiedlichen Raten veränderten. Insbesondere läßt sich auch<br />
hier - bei isolierter Betrachtung dieses Zeitraums - kein negativer Zusammenhang<br />
zwischen Inflationsrate und Arbeitslosenquote erkennen.<br />
Aufgrund dieser Überlegungen soll im folgenden zunächst eine <strong>Kurvenanpassung</strong><br />
für den Zeitraum zwischen 1970 und 1994 - in dem ein negativer Zusammenhang<br />
zwischen Inflationsrate und Arbeitslosenquote zu bestehen scheint - durchgeführt<br />
werden. Es wird also untersucht, durch welchen Kurventyp der Zusammenhang<br />
zwischen den beiden Variablen am geeignetsten abgebildet werden kann. Anschließend<br />
werden die drei Teilperioden 1961-1975, 1975-1981 und 1982-1994<br />
isoliert betrachtet.<br />
8<br />
Veränderungsrate des Preisindex des BSP in %<br />
7<br />
6<br />
5<br />
4<br />
3<br />
2<br />
1<br />
0<br />
1961<br />
1974<br />
2<br />
4<br />
1981<br />
6<br />
8<br />
1994<br />
10<br />
Arbeitslosenquote (Anteil der Erwerbslosen an den Erwerbspersonen)<br />
Abbildung <strong>24</strong>.1: Streudiagramm für die Variablen „alq“ und „preise_v“ aus der Datei<br />
Makrodaten.sav<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
580 <strong>Kapitel</strong> <strong>24</strong> <strong>Kurvenanpassung</strong><br />
1970 bis 1994<br />
Soll eine Kurve an die Wertepaare aus dem Zeitraum von 1970 bis 1994 angepaßt<br />
werden, kommen unter anderem eine lineare und eine quadratische Form in Frage.<br />
262 Um eine entsprechende <strong>Kurvenanpassung</strong> durchzuführen, wählen Sie den<br />
Befehl 263<br />
STATISTIK<br />
REGRESSION<br />
KURVENANPASSUNG...<br />
Geben Sie in dem damit geöffneten Dialogfeld die abhängige Variable preise_v<br />
und die unabhängige Variable alq an, und wählen Sie in der Gruppe Modelle die<br />
Optionen Linear und Quadratisch. Mit diesen Einstellungen wird der in den Abbildungen<br />
<strong>24</strong>.2 und <strong>24</strong>.3 wiedergegebenen Output erzeugt. 264<br />
In der Grafik aus Abbildung <strong>24</strong>.3 stellt die weiße Linie die beobachteten Werte für<br />
den Zeitraum von 1970 bis 1994 dar. An diese Werte wurden eine lineare (gestrichelte<br />
Linie) und eine quadratische (durchgezogene schwarze Linie) Funktion angepaßt.<br />
Vom optischen Eindruck her scheinen beide Linien mehr oder weniger<br />
gleich gut oder schlecht geeignet zu sein, den tatsächlichen Zusammenhang zwischen<br />
der Inflationsrate und der Arbeitslosenquote zu beschreiben. Eine etwas<br />
präzisere Aussage ermöglicht der Textoutput in Abbildung <strong>24</strong>.2. Dort wird an dem<br />
R 2 (Spalte Rsq) deutlich, daß die quadratische Funktion (unterste Zeile; R 2 =<br />
0,795) eine etwas bessere Anpassung liefert als die lineare (R 2 = 0,789). Allerdings<br />
sind beide Schätzungen hochsignifikant, da die Signifikanz des F-Wertes<br />
jeweils mit 0,000 ausgewiesen ist.<br />
In den Spalten b0, b1 und b2 werden die geschätzten Parameter für die lineare und<br />
die quadratische Funktion angegeben. Danach ergeben sich folgende Schätzgleichungen:<br />
Linear:<br />
alq = 10,3 - 1,3 · preise_v<br />
Quadratisch: alq = 11,37 - 1,85 · preise_v + 0,06 · preise_v 2<br />
Würde die lineare Gleichung tatsächlich den gültigen Zusammenhang zwischen<br />
der Inflationsrate und der Arbeitslosenquote beschreiben, dann würde die Arbeitslosenquote<br />
bei einer Inflationsrate von null 10,3% betragen. Mit jedem Anstieg<br />
der Inflationsrate um einen Prozentpunkt könnte die Arbeitslosenquote um<br />
1,3 Prozentpunkte gesenkt werden. Man müßte also lediglich eine Inflationsrate<br />
von 5% in Kauf nehmen, um die Arbeitslosenquote auf unter 4% zu senken.<br />
262 Bei der quadratischen Funktion käme nur ein Ast des typischen Graphen zur Anwendung,<br />
vgl. auch die Übersicht über die zur Verfügung stehenden Kurventypen in Abbildung <strong>24</strong>.8,<br />
S. 588.<br />
263 Zuvor müssen Sie in der Datendatei festlegen, daß nur die Werte ab 1970 berücksichtigt<br />
werden sollen. Hierzu können Sie den Befehl DATEN, FÄLLE AUSWÄHLEN verwenden. Wählen<br />
Sie in dem entsprechenden Dialogfeld die Option Falls Bedingung zutrifft, und geben Sie in dem<br />
Dialogfeld der dazugehörigen Schaltfläche Falls die Bedingung jahr >= 1970 an.<br />
264 Beachten Sie, daß die Achsen in Abbildung <strong>24</strong>.3 gegenüber der Grafik in Abbildung <strong>24</strong>.1<br />
vertauscht sind.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>24</strong>.1 Beispiel 1: Die Phillips-Kurve 581<br />
Hätte dagegen die quadratische Gleichung Gültigkeit, könnte diese folgendermaßen<br />
interpretiert werden: Bei einer Inflationsrate von null würde die Arbeitslosenquote<br />
ungefähr 11,4% betragen. Bei einem Anstieg der Inflationsrate sind zwei<br />
gegenläufige Effekte zu beobachten. Einer dieser Effekte bewirkt, daß die Arbeitslosenquote<br />
jeweils um 1,85 Prozentpunkte sinkt, wenn die Inflationsrate um<br />
einen Prozentpunkt ansteigt. Diesem linearen negativen Effekt wirkt ein quadratischer<br />
positiver Effekt entgegen. Bei geringen Werten der Inflationsrate überwiegt<br />
der negative Einfluß, so daß die Arbeitslosenquote mit zunehmender Inflationsrate<br />
tatsächlich zurückgeht. Bei sehr hoher Inflation kehrt sich das Verhältnis dagegen<br />
um, und die Arbeitslosigkeit nimmt mit ansteigender Inflation ebenfalls zu.<br />
MODEL: MOD_8.<br />
Independent: PREISE_V<br />
Dependent Mth Rsq d.f. F Sigf b0 b1 b2<br />
ALQ LIN ,789 23 86,21 ,000 10,2990 -1,3041<br />
ALQ QUA ,795 22 42,69 ,000 11,3714 -1,8502 ,0588<br />
Abbildung <strong>24</strong>.2: Textoutput der <strong>Kurvenanpassung</strong><br />
10<br />
Arbeitslosenquote<br />
8<br />
6<br />
4<br />
2<br />
0<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
7<br />
8<br />
Veränderungsrate des Preisindex des BSP in %<br />
Abbildung <strong>24</strong>.3: Grafik der Prozedur KURVENANPASSUNG mit einer linearen und einer<br />
quadratischen Anpassung für den Zeitraum von 1970 bis 1994<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
582 <strong>Kapitel</strong> <strong>24</strong> <strong>Kurvenanpassung</strong><br />
Wahl zwischen den Schätzgleichungen<br />
Die Tatsache, daß für die quadratische Gleichung ein höheres R 2 ausgewiesen<br />
wird, läßt einen möglicherweise zunächst dazu tendieren, der quadratischen Funktion<br />
den Vorzug zu geben. Hierbei sollten Sie allerdings berücksichtigen, daß die<br />
Anpassung einer quadratischen Funktion beinahe immer zu besseren, niemals aber<br />
zu schlechteren Ergebnissen (gemessen am R 2 ) führt als die Anpassung einer linearen<br />
Funktion. Dies ist sehr einleuchtend, wenn man bedenkt, daß die lineare<br />
Funktion lediglich einen Sonderfall der quadratischen Funktion darstellt, bei dem<br />
der Parameter b 2 den Wert null hat. Der Preis für des höhere R 2 einer quadratischen<br />
gegenüber einer linearen Funktion besteht in der höheren Anzahl erklärender<br />
Variablen. Während die lineare Funktion mit einer erklärenden Variablen (x<br />
bzw. im vorliegenden Beispiel alq) auskommt, benötigt die quadratische Funktion<br />
zwei erklärende Variablen (x und x 2 bzw. alq und alq 2 ). Eine weitere Verbesserung<br />
des R 2 läßt sich sehr einfach erreichen, indem anstatt des quadratischen ein<br />
kubischer Kurventyp verwendet wird, der wiederum eine zusätzliche erklärende<br />
Variable (x 3 bzw. alq 3 ) einbezieht.<br />
Allgemein sollte die Entscheidung für oder wider einen Kurventyp niemals ausschließlich<br />
anhand des R 2 erfolgen. Von wesentlich größerer Bedeutung als die<br />
Güte der Anpassung ist die Frage, ob ein bestimmter Kurventyp inhaltlich plausibel<br />
erscheint. So läßt sich das R 2 immer weiter verbessern, indem zusätzliche erklärende<br />
Variablen (wie zum Beispiel x 4 , x 5 , x 6 etc.) einbezogen werden. Es ist jedoch<br />
fraglich, ob auf diese Weise der funktionale Zusammenhang zwischen den<br />
beiden betrachteten Variablen sinnvoll abgebildet werden kann.<br />
Betrachtung der Einzelperioden<br />
Abbildung <strong>24</strong>.4 zeigt die Ergebnisse der <strong>Kurvenanpassung</strong> für die drei Teilperioden.<br />
In allen drei Perioden wurden eine lineare und eine quadratische Funktion<br />
verwendet, wobei sich die angegebenen Statistiken unterhalb der Tabelle ausschließlich<br />
auf die lineare Funktion beziehen.<br />
9<br />
Arbeitslosenquote<br />
1961-1975 1975-1981 1982-1994<br />
9<br />
Arbeitslosenquote<br />
9<br />
Arbeitslosenquote<br />
8<br />
8<br />
8<br />
7<br />
7<br />
7<br />
6<br />
6<br />
6<br />
5<br />
5<br />
5<br />
4<br />
4<br />
4<br />
3<br />
3<br />
3<br />
2<br />
2<br />
2<br />
1<br />
1<br />
1<br />
0<br />
0<br />
0<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
7<br />
8<br />
3,5<br />
4,0<br />
4,5<br />
5,0<br />
5,5<br />
6,0<br />
1,5<br />
2,0<br />
2,5<br />
3,0<br />
3,5<br />
4,0<br />
4,5<br />
Veränderungsrate des Preisindex des BSP in %<br />
Veränderungsrate des Preisindex des BSP in %<br />
Veränderungsrate des Preisindex des BSP in %<br />
R 2 = 0,019 d.f. 13 R 2 = 0,008 d.f. 6 R 2 = 0,551 d.f 11<br />
F = 0,25 Sig. = 0,623 F = 0,05 Sig. = 0,831 F = 13,51 Sig. = 0,004<br />
alq = 0,8 + 0,07 preise_v alq = 3,5 + 0,14 preise_v alq = 9,2 - 0,7 preise_v<br />
Abbildung <strong>24</strong>.4: Lineare und quadratische <strong>Kurvenanpassung</strong> für die drei Teilperioden;<br />
Schätzstatistik für lineare Funktion<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>24</strong>.1 Beispiel 1: Die Phillips-Kurve 583<br />
Die Regressionsgerade verläuft in jeder der drei Teilperioden wesentlich flacher<br />
als in der Schätzung für die Gesamtperiode. In den ersten beiden Teilperioden<br />
werden mit den Koeffizienten 0,07 und 0,14 sogar positive Zusammenhänge zwischen<br />
der Arbeitslosenquote und der Inflationsrate ausgewiesen. Für beide Teilperioden<br />
zeigen jedoch die Werte für R 2 sowie die ausgewiesenen Signifikanzen,<br />
daß tatsächlich kein (oder zumindest kein linearer) Zusammenhang zwischen der<br />
Arbeitslosenquote und der Inflationsrate innerhalb dieser Teilperioden zu bestehen<br />
scheint. Für die dritte Teilperiode ist dagegen durchaus der erwartete negative Zusammenhang<br />
zu erkennen. Der entsprechende Koeffizient (b 1 ) wurde mit 0,7 geschätzt,<br />
das R 2 zeigt mit einem Wert von 0,55, daß durchaus ein gewisser Zusammenhang<br />
zwischen den beiden Variablen besteht, und auch der F-Wert ist mit<br />
0,4% hochsignifikant.<br />
Die abgebildeten Diagramme wurden im Grafikeditor so angepaßt, daß die senkrechte<br />
Achse, auf der die Arbeitslosenquote in Prozent abgetragen wird, jeweils<br />
den Wertebereich von 0 bis 9 darstellt. Dadurch läßt sich an den drei nebeneinander<br />
liegenden Grafiken deutlich erkennen, daß sich die dargestellte Kurve im<br />
Zeitablauf nach oben verschoben hat. Da die Kurve zusätzlich innerhalb jeder Periode<br />
relativ flach verläuft (und damit relativ geringe Schwankungen in der Arbeitslosenquote<br />
anzeigt), wäre eine mögliche Interpretation für diese Beobachtung<br />
die folgende: Tatsächlich besteht der erwartete Zusammenhang zwischen der Inflationsrate<br />
und der Arbeitslosenquote nicht oder nur in geringem Ausmaß. Vielmehr<br />
wird die Höhe der Arbeitslosigkeit im wesentlichen durch andere Faktoren<br />
bestimmt und nicht unmittelbar durch die Inflationsrate beeinflußt. Die tatsächlich<br />
relevanten Bestimmungsfaktoren der Arbeitslosenquote haben bewirkt, daß sich<br />
das Niveau der Arbeitslosigkeit im Zeitablauf nach oben verschoben hat, und zwar<br />
zunächst von einem Niveau bei ungefähr 2% in den 60 er Jahren auf ein Niveau um<br />
die 5% in der zweiten Hälfte der 70 er Jahre, bis nunmehr ein Niveau von ungefähr<br />
7-8% in den 80 er und Anfang der 90 er Jahre erreicht wurde.<br />
Es hat sich gezeigt, daß sich die Hypothese eines Zusammenhangs zwischen der<br />
Inflationsrate und der Arbeitslosenquote je nach Betrachtungsweise sowohl untermauern<br />
als auch entkräften läßt. Dies macht deutlich, daß bei der Verwendung<br />
von Instrumenten wie der <strong>Kurvenanpassung</strong> - so wie von statistischen Analyseverfahren<br />
im allgemeinen - eine große Sorgfalt erforderlich ist, um nicht zu schnelle<br />
oder falsche Schlüsse zu ziehen. Insbesondere sollte man jedes Ergebnis, das man<br />
gefunden zu haben glaubt, anschließend noch einmal mit etwas Abstand betrachten<br />
und schlicht fragen, ob dieses „nach gesundem Menschenverstand“ plausibel<br />
ist. Auf diese Weise lassen sich bereits zahlreiche Fehlschlüsse vermeiden, wie<br />
zum Beispiel der Übergang von einer linearen auf eine kubische Funktion, die<br />
- wie unter Wahl zwischen den Schätzgleichungen, S. 582 dargestellt - möglicherweise<br />
einen besseren Fit, dafür aber auch eine geringere inhaltliche Plausibilität<br />
aufweist.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
584 <strong>Kapitel</strong> <strong>24</strong> <strong>Kurvenanpassung</strong><br />
<strong>24</strong>.2 Beispiel 2: Wachstumsrate in der Bundesrepublik<br />
Die Datendatei Makrodaten.sav enthält in der Variablen bip die Werte des Bruttoinlandsprodukts<br />
(BIP) für das alte Gebiet der Bundesrepublik Deutschland. Im<br />
folgenden soll versucht werden, mit Hilfe der Prozedur KURVENANPASSUNG eine<br />
Funktion zu finden, die den Verlauf des BIP möglichst gut beschreibt. Da das<br />
Bruttoinlandsprodukt grundsätzlich einem Wachstumsprozeß folgt, kommt hierfür<br />
der Kurventyp Wachstum in Frage. Dieser paßt eine Kurve mit konstanter<br />
Wachstumsrate an die beobachtete Kurve des BIP an.<br />
Im vorhergehenden Beispiel wurde eine Kurve gesucht, die den Zusammenhang<br />
zwischen der Inflationsrate und der Arbeitslosenquote möglichst gut beschreibt,<br />
wobei die Arbeitslosenquote als abhängige und die Inflationsrate als erklärende<br />
Variable angesehen wurden. In diesem Beispiel bildet nun das BIP die abhängige<br />
Variable. Allerdings soll nicht der Zusammenhang zwischen dem BIP und einer<br />
anderen Größe untersucht, sondern lediglich dessen Entwicklung im Zeitablauf<br />
nachgezeichnet werden. Damit gibt es keine erklärende Variable im eigentlichen<br />
Sinne. Vielmehr stellt die Zeit die unabhängige Größe dar, denn die anzupassende<br />
Kurve soll die Veränderung des BIP bei voranschreitender Zeit abbilden. Für solche<br />
Fälle, in denen eine Kurve an die Entwicklung einer Variablen im Zeitablauf<br />
angepaßt werden soll, ist im Dialogfeld <strong>Kurvenanpassung</strong> in der Gruppe Unabhängige<br />
Variable die Option Zeit vorgesehen. Kreuzen Sie diese Option an, verschieben<br />
Sie die Variable bip in das Feld Abhängige Variablen, und wählen Sie in<br />
der Gruppe Modell den Kurventyp Wachstum, um den in den Abbildungen <strong>24</strong>.5<br />
und <strong>24</strong>.6 dargestellten Output zu erhalten.<br />
In der Grafik aus Abbildung <strong>24</strong>.6 stellt die weiße Kurve den Verlauf der beobachteten<br />
Werte und die schwarze Kurve die daran angepaßte Wachstumsfunktion<br />
dar. In der langfristigen Tendenz scheint die geschätzte Wachstumsfunktion die<br />
tatsächliche Entwicklung des BIP recht gut nachzubilden. In Abbildung <strong>24</strong>.5 wird<br />
für die Anpassungsgüte ein R 2 von 0,971 ausgewiesen. Der F-Wert ist mit 0,000<br />
hochsignifikant.<br />
Die allgemeine Form der geschätzten Wachstumsfunktion lautet:<br />
b0 + b1 · t<br />
y = e<br />
Dabei bezeichnet y die abhängige Variable und t die Zeit. e ist die Eulersche Zahl<br />
(≈ 2,71828). Für den Parameter b 0 wurde der Wert 6,9774 geschätzt, für b 1 der<br />
Wert 0,0278. Damit lautet die geschätzte Wachstumsfunktion:<br />
6,9774 + 0,0278 · t<br />
bip = e<br />
Die Zeitvariable t nimmt dabei Werte zwischen 1 und 35 (und nicht etwa zwischen<br />
1960 und 1994) an. Die Funktion läßt sich auch in der folgenden Form<br />
schreiben, in der sie einfacher interpretiert werden kann:<br />
bip = e 6,9774 · e 0,0278 · t<br />
Im ersten Teil des Ausdrucks auf der rechten Seite (e 6,9774 ) ist die Zeitvariable t<br />
nicht enthalten, so daß dies eine Konstante ist. e 6,9774 ist gleich dem Wert 1072,1.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>24</strong>.2 Beispiel 2: Wachstumsrate in der Bundesrepublik 585<br />
Damit kann die geschätzte Wachstumsfunktion auch folgendermaßen geschrieben<br />
werden:<br />
bip = 1072,1 · e 0,0278 · t<br />
Der Wert 1072,1 kann dabei als Ausgangswert des Wachstumsprozesses in dem<br />
beobachteten Zeitraum angesehen werden. Ausgehend von diesem Wert wächst<br />
das BIP - gemäß der angepaßten Kurve - seit 1960 jährlich mit der Rate von<br />
0,0278 bzw. 2,78%. Die langfristige Entwicklung des Bruttoinlandsprodukts zwischen<br />
1960 und 1994 läßt sich damit in stilisierter Form durch eine Funktion mit<br />
konstanter Wachstumsrate von 2,78% abbilden.<br />
MODEL: MOD_9.<br />
Independent: Time<br />
Dependent Mth Rsq d.f. F Sigf b0 b1<br />
BIP GRO ,971 33 1089,48 ,000 6,9774 ,0278<br />
Abbildung <strong>24</strong>.5: Textoutput der Anpassung einer Wachstumsfunktion an die Entwicklung<br />
des BIP<br />
3000<br />
Bruttoinlandsprodukt - Alte Bundesländer<br />
(in Preisen von 1991; Mrd. DM)<br />
2000<br />
1000<br />
0<br />
0<br />
10<br />
20<br />
30<br />
40<br />
Sequence<br />
Abbildung <strong>24</strong>.6: Entwicklung des BIP in dem früheren Bundesgebiet von 1960 bis 1994<br />
(weiße Kurve) und daran angepaßte Wachstumsfunktion (schwarze Kurve)<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
586 <strong>Kapitel</strong> <strong>24</strong> <strong>Kurvenanpassung</strong><br />
<strong>24</strong>.3 Kurventypen<br />
Sie können in der Prozedur KURVENANPASSUNG zwischen elf verschiedenen Kurventypen<br />
wählen. Nur ein Kurventyp (Linear) beschreibt unmittelbar einen linearen<br />
Zusammenhang zwischen der abhängigen und der erklärenden Variablen. Allerdings<br />
lassen sich auch alle übrigen zehn Kurventypen in eine lineare Funktion<br />
transformieren. Dies kann sehr hilfreich sein, wenn die Beziehung zwischen den<br />
Variablen mit anderen Verfahren, die eine linearen Zusammenhang voraussetzen,<br />
weiter untersucht werden soll.<br />
Mit dem Kurventyp Linear schätzen Sie eine Funktion der allgemeinen Form: 265<br />
y = b 0 + b 1 · x<br />
Diese Funktion ist damit linear in den Variablen y und x. Der Kurventyp Logarithmisch<br />
schätzt dagegen eine Funktion der allgemeinen Form:<br />
y = b 0 + b 1 · ln(x)<br />
Diese Funktion ist zwar nicht linear in den Variablen y und x, wohl aber in y und<br />
ln(x). Wenn also der wahre Zusammenhang zwischen zwei Variablen durch die<br />
nichtlineare Funktion y = b 0 + b 1 · ln(x) abgebildet wird, können Sie die natürlichen<br />
Logarithmen für die Werte der Variablen x berechnen und erhalten auf diese<br />
Weise eine neue Variable, die einen linearen Zusammenhang zur Variablen y aufweist.<br />
Mit dem Kurventyp Kubisch schätzen Sie eine Funktion der allgemeinen Form:<br />
y = b 0 + b 1 · x + b 2 · x 2 + b 3 · x 3<br />
Auch diese Funktion ist natürlich nicht linear in den Variablen y und x, wohl aber<br />
in den Variablen y, x, x 2 und x 3 .<br />
Der Kurventyp Zusammengesetzt schätzt eine Funktion der allgemeinen Form:<br />
y = b 0 ·<br />
Durch Logarithmierung läßt sich diese Funktion in folgende Form überführen:<br />
ln(y) = ln(b 0 ) + ln(b 1 ) · x<br />
Damit ist die Funktion linear in den Variablen ln(y) und x.<br />
Die Übersicht in Abbildung <strong>24</strong>.7 führt alle elf zur Verfügung stehenden Kurventypen<br />
auf und gibt jeweils die durch einen Kurventyp geschätzte Funktion in der<br />
allgemeinen Form an. Zusätzlich wird jeweils dargestellt, in welcher Weise die<br />
Funktion transformiert werden kann, damit sie einen linearen Zusammenhang<br />
zwischen einer abhängigen und einer oder mehreren erklärenden Variablen beschreibt.<br />
x<br />
b 1<br />
265 Zur Bedeutung der Symbole siehe auch die Erläuterungen in Abbildung <strong>24</strong>.7.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>24</strong>.3 Kurventypen 587<br />
Kurventyp Funktion Lineare Form<br />
Linear y = b 0 + b 1 · x y = b 0 + b 1 · x<br />
Logarithmisch y = b 0 + b 1 · ln(x) y = b 0 + b 1 · ln(x)<br />
Invers y = b 0 + x<br />
b 1 y = b0 + x<br />
b 1<br />
Quadratisch y = b 0 + b 1 · x + b 2 · x 2 y = b 0 + b 1 · x + b 2 · x 2<br />
Kubisch y = b 0 + b 1 · x + b 2 · x 2 + b 3 · x 3 y = b 0 + b 1 · x + b 2 · x 2 + b 3 · x 3<br />
Exponent<br />
b1<br />
y = b 0 · x<br />
Zusammengesetzt y = b 0 ·<br />
x<br />
b1<br />
ln(y) = ln(b 0 ) + b 1 · ln(x)<br />
ln(y) = ln(b 0 ) + ln(b 1 ) · x<br />
b1<br />
S<br />
b<br />
y = e + b<br />
0 x<br />
ln(y) = b 0 + 1<br />
x<br />
Logistisch<br />
1<br />
y =<br />
⎛ 1 1<br />
1 x<br />
+ b<br />
o 0 ⋅ b<br />
⎟ ⎞<br />
ln<br />
⎜ + = ln(b 0 ) + ln(b 1 ) · x<br />
1<br />
⎝ y o ⎠<br />
Wachstum<br />
b0+ b1⋅x<br />
y = e<br />
ln(y) = b 0 + b 1 · x<br />
Exponentiell<br />
b x<br />
y = b 0 · e ⋅ 1<br />
ln(y) = ln(b 0 ) + b 1 · x<br />
Hierbei ist y die abhängige und x die erklärende Variable. b 0 , b 1 , b 2 und b 3 bezeichnen die<br />
zu schätzenden Regressionskoeffizienten. e ist die Eulersche Zahl (≈ 2,71828) und ln der<br />
natürliche Logarithmus. Bei der logistischen Funktion bezeichnet o eine Obergrenze des<br />
logistischen Modells, die in dem Dialogfeld <strong>Kurvenanpassung</strong> vorgegeben werden kann.<br />
Abbildung <strong>24</strong>.7: Übersicht über die zur Verfügung stehenden Kurventypen<br />
Abbildung <strong>24</strong>.8 skizziert die typischen Kurvenverläufe, die mit den einzelnen zur<br />
Verfügung stehenden Kurventypen erstellt werden können. Dabei hängt die konkrete<br />
Form einer Kurve sehr stark von den jeweils verwendeten Parametern ab.<br />
Besonders deutlich wird dies unter anderem bei den Kurventypen Exponent und<br />
Zusammengesetzt, für die jeweils drei Kurven (die mit unterschiedlichen Parametern<br />
erzeugt wurden) dargestellt werden.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
588 <strong>Kapitel</strong> <strong>24</strong> <strong>Kurvenanpassung</strong><br />
Linear Logarithmisch Invers<br />
Quadratisch Kubisch Exponent<br />
11 2<br />
1<br />
3 3<br />
Zusammengesetzt S Logistisch<br />
1<br />
2<br />
3<br />
Wachstum<br />
Exponentiell<br />
Abbildung <strong>24</strong>.8: Skizze der typischen Kurvenverläufe der unterschiedlichen Kurventypen<br />
<strong>24</strong>.4 Einstellungen zur <strong>Kurvenanpassung</strong><br />
Um eine oder mehrere <strong>Kurvenanpassung</strong>en durchzuführen, wählen Sie den Befehl<br />
STATISTIK<br />
REGRESSION<br />
KURVENANPASSUNG...<br />
Dieser Befehl öffnet das in Abbildung <strong>24</strong>.9 dargestellte Dialogfeld. Nehmen Sie<br />
dort folgende Einstellungen vor:<br />
¾ Abhängige Variable(n): Fügen Sie in dieses Feld eine oder mehrere abhängige<br />
Variablen ein. Wenn Sie mehrere abhängige Variablen angeben, wird für jede<br />
von ihnen eine eigene <strong>Kurvenanpassung</strong> durchgeführt. Sie erhalten somit die<br />
gleichen Ergebnisse wie bei zweimaligem Ausführen der Prozedur mit jeweils<br />
einer abhängigen Variablen.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
<strong>24</strong>.4 Einstellungen zur <strong>Kurvenanpassung</strong> 589<br />
Abbildung <strong>24</strong>.9: Dialogfeld des Befehl STATISTIK, REGRESSION, KURVENANPASSUNG<br />
¾ Unabhängige Variable: Möchten Sie eine erklärende Variable angeben, wählen<br />
Sie in der Gruppe Unabhängige Variable die Option Variable, und verschieben<br />
Sie die erklärende Variable in das entsprechende Feld. Soll dagegen<br />
eine Kurve an die Entwicklung einer Variablen im Zeitablauf angepaßt werden,<br />
wählen Sie die Option Zeit.<br />
¾ Modelle: Kreuzen Sie in dieser Gruppe die Kurventypen an, die für die <strong>Kurvenanpassung</strong><br />
verwendet werden sollen (siehe im einzelnen Abschnitt<br />
<strong>24</strong>.3, Kurventypen, S. 586). Wenn Sie den Kurventyp Logistisch wählen, können<br />
Sie eine Obergrenze des logistischen Modells angeben (siehe auch die<br />
Gleichung in Abbildung <strong>24</strong>.7). Dies muß eine positive Zahl sein, die größer ist<br />
als der größte in der abhängigen Variablen vorkommende Wert. Als Voreinstellung<br />
ist die Obergrenze auf unendlich eingestellt, so daß der Term 1/o in<br />
der logistischen Gleichung den Wert null annimmt und damit entfällt.<br />
¾ Konstante in Gleichung einschließen: Diese Option ist per Voreinstellung angekreuzt,<br />
so daß in der Regressionsgleichung ein konstanter Term berücksichtigt<br />
und geschätzt wird. Soll kein konstanter Term berücksichtigt werden,<br />
wählen Sie diese Option ab. Damit entfällt in den Gleichungen jeweils der Parameter<br />
b 0 .<br />
¾ Diagramm der Modelle: Mit dieser ebenfalls voreingestellten Option wird ein<br />
Diagramm mit dem Verlauf der beobachteten Werte und den daran angepaßten<br />
Kurven erstellt (siehe zum Beispiel Abbildung <strong>24</strong>.3, S. 581).<br />
¾ ANOVA-Tabelle anzeigen: Kreuzen Sie diese Option an, um für jedes Modell<br />
(also für jede Kombination aus abhängiger Variablen und Kurventyp) eine<br />
Übersicht mit den wichtigsten Kennzahlen einer Varianzanalyse zu erstellen.<br />
¾ Speichern: In dem Dialogfeld dieser Schaltfläche können Sie veranlassen, daß<br />
die Ergebnisse der <strong>Kurvenanpassung</strong> als Variablen gespeichert werden (s.u.).<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing
590 <strong>Kapitel</strong> <strong>24</strong> <strong>Kurvenanpassung</strong><br />
Speichern<br />
Abbildung <strong>24</strong>.10: Dialogfeld der Schaltfläche „Speichern“<br />
Mit der Schaltfläche Speichern öffnen Sie das in Abbildung <strong>24</strong>.10 wiedergegebene<br />
Dialogfeld, das folgende Optionen enthält:<br />
¾ Variablen speichern: Sie können veranlassen, daß die vorhergesagten Werte,<br />
die Residuen und/oder die Vorhersageintervalle als neue Variablen in der geöffneten<br />
Datendatei gespeichert werden. Die Vorhersageintervalle werden in<br />
zwei Variablen gespeichert, von denen eine die Werte der unteren und die andere<br />
die Werte der oberen Intervallgrenze aufnimmt. Die Variable für die untere<br />
Intervallgrenze erhält den Namen lcl_1, die für die obere Grenze den Namen<br />
ucl_1 (bzw. entsprechende Namen mit höheren Endziffern). Für die Breite des<br />
Konfidenzintervalls können Sie in der Dropdown-Liste zwischen einem 90%-,<br />
einem 95%- und einem 99%-Konfidenzniveau wählen.<br />
¾ Fälle vorhersagen: Wenn Sie in dem Hauptdialogfeld für die unabhängige<br />
Variable die Option Zeit gewählt haben, können Sie einen Vorhersagezeitraum<br />
festlegen, der über den Beobachtungszeitraum hinausgeht. Hierzu stehen die<br />
folgenden Optionen zur Verfügung:<br />
y Von der Schätzperiode bis zum letzten Fall vorhersagen: Haben Sie die in<br />
der <strong>Kurvenanpassung</strong> zu berücksichtigenden Fälle mit dem Befehl DATEN,<br />
FÄLLE AUSWÄHLEN und dort mit der Option Nach Zeit- oder Fallbereich<br />
eingeschränkt, werden mit dieser Option Prognosewerte für die gesamte<br />
Schätzperiode und für alle anschließenden Fälle berechnet.<br />
y Vorhersagen bis: Geben Sie in dem Feld Beobachtung an, bis zu welchem<br />
Zeitpunkt (1, 2, 3, ...) Prognosewerte berechnet und gespeichert werden<br />
sollen. Haben Sie in der Datendatei ein Datum definiert 266 , können Sie für<br />
die letzte Vorhersageperiode das Datum angeben. Hierzu stehen dann die<br />
entsprechenden Eingabefelder zur Verfügung.<br />
266 Hierzu steht der Befehl DATEN, DATUM DEFINIEREN zur Verfügung, siehe im einzelnen<br />
Abschnitt 9.8, Datumsvariablen erstellen, S. <strong>24</strong>6.<br />
Felix Brosius, SPSS 8<br />
International Thomson Publishing