24.04.2014 Aufrufe

Kapitel 24 Kurvenanpassung

Kapitel 24 Kurvenanpassung

Kapitel 24 Kurvenanpassung

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>Kapitel</strong> <strong>24</strong><br />

<strong>Kurvenanpassung</strong><br />

Die Prozedur KURVENANPASSUNG schätzt die Parameter einer Regressionsgleichung<br />

mit einer abhängigen (zu erklärenden) Variablen y und einer unabhängigen<br />

(erklärenden) Variablen x. Anders als bei der multiplen linearen Regression (siehe<br />

hierzu <strong>Kapitel</strong> 23, Lineare Regression), bei der die Beziehung zwischen der abhängigen<br />

und der unabhängigen Variablen linear sein muß, können Sie hier unterschiedliche<br />

Kurventypen verwenden. So kann zwischen den beiden Variablen zum<br />

Beispiel ein kubischer, exponentieller oder logarithmischer Zusammenhang bestehen.<br />

Dieser Vorteil gegenüber der multiplen linearen Regression wird allerdings<br />

mit der Beschränkung erkauft, daß bei der Prozedur KURVENANPASSUNG nur eine<br />

erklärende Variable herangezogen werden kann. Multiple Erklärungen sind damit<br />

nicht möglich.<br />

<strong>24</strong>.1 Beispiel 1: Die Phillips-Kurve<br />

Die Aufmerksamkeit von Ökonomen richtet sich immer wieder auf einen möglichen<br />

Zusammenhang zwischen der Höhe des Beschäftigungsniveaus (bzw. dem<br />

Ausmaß der Arbeitslosigkeit) und der Veränderung des Preisniveaus. 1958 hat<br />

Alban W. Phillips den Zusammenhang zwischen der Arbeitslosenquote und dem<br />

Anstieg des Nominallohnes untersucht. 260 Die grafische Darstellung dieses Zusammenhangs<br />

ist als Phillips-Kurve bekannt. Diese deutet an, daß das gesamtwirtschaftliche<br />

Nominallohnniveau um so stärker ansteigt, je geringer die Arbeitslosenquote<br />

ist. Dieser Zusammenhang ist auch recht plausibel, wenn man sich den<br />

Arbeitsmarkt als einen Markt wie andere (zum Beispiel den Markt für Autos oder<br />

für Immobilien) vorstellt: Eine geringe Arbeitslosenquote bedeutet, daß das Angebot<br />

an Arbeit (also die Nachfrage nach Arbeitsplätzen) im Vergleich zur Arbeitsnachfrage<br />

(also zum Angebot an Arbeitsplätzen) relativ gering ist. Wenn aber das<br />

Angebot im Vergleich zur Nachfrage gering ist, liegt es nahe, daß der Preis für<br />

260 Siehe Phillips, A.W. (1958): The Relation Between Unemployment and the Rate of<br />

Change of Money Wage Rates in the United Kingdom, 1861 – 1957, in: Economica, Vol. 25,<br />

S. 283 – 299.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


578 <strong>Kapitel</strong> <strong>24</strong> <strong>Kurvenanpassung</strong><br />

Arbeit (also der Nominallohn) relativ stark ansteigt - dies ist im Prinzip auch auf<br />

anderen Märkten so.<br />

1960 haben Paul A. Samuelson und Robert M. Solow eine modifizierte Form der<br />

Phillips-Kurve vorgelegt 261 , in der die Arbeitslosenquote nicht mehr den Nominallohnänderungen,<br />

sondern den Preisniveauänderungen gegenübergestellt wird.<br />

Auch diese Kurve beschreibt einen negativen Zusammenhang zwischen den beiden<br />

Variablen: Je höher die Inflationsrate, desto niedriger ist die Arbeitslosenquote.<br />

Wenn ein solcher Zusammenhang tatsächlich Gültigkeit besitzt, ergibt sich<br />

daraus unmittelbar ein Dilemma für die Wirtschaftspolitik. Sowohl eine niedrige<br />

Arbeitslosenquote als auch eine geringe Inflationsrate werden im allgemeinen als<br />

erstrebenswerte Ziele angesehen. Gilt jedoch der durch die modifizierte Phillips-<br />

Kurve beschriebene Zusammenhang, lassen sich beide Ziele nicht gleichzeitig erreichen,<br />

sondern die Politik muß gewissermaßen zwischen Skylla und Charybdis<br />

wählen. Allerdings ist die Gültigkeit dieses Zusammenhangs - und insbesondere<br />

seine Stabilität im Zeitablauf - sehr umstritten. Auch seine funktionale Form ist<br />

nicht eindeutig bestimmt. So kann ein negativer Zusammenhang zwischen der Inflationsrate<br />

und der Arbeitslosenquote unter anderem eine lineare, eine quadratische<br />

oder eine logarithmische Form haben. Mit anderen Worten: Die modifizierte<br />

Phillips-Kurve kann grundsätzlich verschiedenen Kurventypen entsprechen.<br />

Auf der Begleit-CD befindet sich die Datei Makrodaten.sav mit verschiedenen<br />

makroökonomischen Zeitreihen für die alten Länder der Bundesrepublik<br />

Deutschland. Unter anderem enthält die Datei die Variablen alq und preise_v, in<br />

denen die Arbeitslosenquoten sowie die Veränderungsraten des Preisindex des<br />

Bruttosozialprodukts für die Jahre 1960 bis 1996 enthalten sind. Um einen ersten<br />

Eindruck von einem möglichen Zusammenhang zwischen den Variablen zu bekommen,<br />

bietet es sich an, die gemeinsame Verteilung in einem Streudiagramm<br />

darzustellen. Um ein solches Diagramm zu erstellen, wählen Sie den Befehl<br />

GRAFIK, STREUDIAGRAMM und anschließend die Option Einfach. Geben Sie in<br />

dem Dialogfeld Einfaches Scatterplot die Variablen preise_v als Y-Variable, alq<br />

als X-Variable und jahr für die Fallbeschriftung an. Mit diesen Einstellungen erhalten<br />

Sie das in Abbildung <strong>24</strong>.1 dargestellte Streudiagramm. Das abgebildete<br />

Diagramm wurde im Grafikeditor leicht verändert, insbesondere wurde mit dem<br />

Befehl FORMAT, INTERPOLATION eine Verbindungslinie zwischen den einzelnen<br />

Datenpunkten eingefügt. Die Linie verbindet die Punkte in ihrer historischen Reihenfolge.<br />

Das Streudiagramm läßt folgendes erkennen: Die Annahme eines negativen Zusammenhangs<br />

zwischen der Inflationsrate und der Arbeitslosenquote scheint mit<br />

der im Streudiagramm dargestellten gemeinsamen Verteilung dieser beiden Größen<br />

vereinbar zu sein. Dies gilt in besonderem Maße für die Beobachtungen ab<br />

1970. Werden nur die Daten seit diesem Zeitpunkt betrachtet, weist die zwischen<br />

den Datenpunkten eingezeichnete Verbindungslinie in der Tendenz eindeutig einen<br />

fallenden Verlauf auf. Dies ist gleichbedeutend mit der Beobachtung, daß re-<br />

261 Vgl. Samuelson, P.A., R.M. Solow (1960): Analytical Aspects of Anti-Inflation Policy, in:<br />

American Economic Review, Vol. 50, S. 177-194.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>24</strong>.1 Beispiel 1: Die Phillips-Kurve 579<br />

lativ hohe (niedrige) Werte der Arbeitslosenquote in diesem Zeitraum oftmals gemeinsam<br />

mit relativ niedrigen (hohen) Inflationsraten aufgetreten sind. In den 60 er<br />

Jahren scheint dieser Zusammenhang nicht gegolten zu haben. Während für die<br />

Inflationsrate in diesem Jahrzehnt sowohl sehr hohe als auch sehr niedrige Werte<br />

beobachtet werden konnten, lag die höchste beobachtete Arbeitslosenquote nur<br />

etwas mehr als ein Prozentpunkt über ihrem niedrigsten Wert. Die Arbeitslosenquote<br />

scheint somit von den Änderungen der Inflationsrate kaum berührt worden<br />

zu sein. Zu einem ähnlichen Ergebnis kann man gelangen, wenn man die Periode<br />

von 1975 bis 1981 isoliert betrachtet. Auch in dieser Zeit waren die Änderungen<br />

in der Arbeitslosenquote eher gering, obwohl sich die Preise in den einzelnen Jahren<br />

mit deutlich unterschiedlichen Raten veränderten. Insbesondere läßt sich auch<br />

hier - bei isolierter Betrachtung dieses Zeitraums - kein negativer Zusammenhang<br />

zwischen Inflationsrate und Arbeitslosenquote erkennen.<br />

Aufgrund dieser Überlegungen soll im folgenden zunächst eine <strong>Kurvenanpassung</strong><br />

für den Zeitraum zwischen 1970 und 1994 - in dem ein negativer Zusammenhang<br />

zwischen Inflationsrate und Arbeitslosenquote zu bestehen scheint - durchgeführt<br />

werden. Es wird also untersucht, durch welchen Kurventyp der Zusammenhang<br />

zwischen den beiden Variablen am geeignetsten abgebildet werden kann. Anschließend<br />

werden die drei Teilperioden 1961-1975, 1975-1981 und 1982-1994<br />

isoliert betrachtet.<br />

8<br />

Veränderungsrate des Preisindex des BSP in %<br />

7<br />

6<br />

5<br />

4<br />

3<br />

2<br />

1<br />

0<br />

1961<br />

1974<br />

2<br />

4<br />

1981<br />

6<br />

8<br />

1994<br />

10<br />

Arbeitslosenquote (Anteil der Erwerbslosen an den Erwerbspersonen)<br />

Abbildung <strong>24</strong>.1: Streudiagramm für die Variablen „alq“ und „preise_v“ aus der Datei<br />

Makrodaten.sav<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


580 <strong>Kapitel</strong> <strong>24</strong> <strong>Kurvenanpassung</strong><br />

1970 bis 1994<br />

Soll eine Kurve an die Wertepaare aus dem Zeitraum von 1970 bis 1994 angepaßt<br />

werden, kommen unter anderem eine lineare und eine quadratische Form in Frage.<br />

262 Um eine entsprechende <strong>Kurvenanpassung</strong> durchzuführen, wählen Sie den<br />

Befehl 263<br />

STATISTIK<br />

REGRESSION<br />

KURVENANPASSUNG...<br />

Geben Sie in dem damit geöffneten Dialogfeld die abhängige Variable preise_v<br />

und die unabhängige Variable alq an, und wählen Sie in der Gruppe Modelle die<br />

Optionen Linear und Quadratisch. Mit diesen Einstellungen wird der in den Abbildungen<br />

<strong>24</strong>.2 und <strong>24</strong>.3 wiedergegebenen Output erzeugt. 264<br />

In der Grafik aus Abbildung <strong>24</strong>.3 stellt die weiße Linie die beobachteten Werte für<br />

den Zeitraum von 1970 bis 1994 dar. An diese Werte wurden eine lineare (gestrichelte<br />

Linie) und eine quadratische (durchgezogene schwarze Linie) Funktion angepaßt.<br />

Vom optischen Eindruck her scheinen beide Linien mehr oder weniger<br />

gleich gut oder schlecht geeignet zu sein, den tatsächlichen Zusammenhang zwischen<br />

der Inflationsrate und der Arbeitslosenquote zu beschreiben. Eine etwas<br />

präzisere Aussage ermöglicht der Textoutput in Abbildung <strong>24</strong>.2. Dort wird an dem<br />

R 2 (Spalte Rsq) deutlich, daß die quadratische Funktion (unterste Zeile; R 2 =<br />

0,795) eine etwas bessere Anpassung liefert als die lineare (R 2 = 0,789). Allerdings<br />

sind beide Schätzungen hochsignifikant, da die Signifikanz des F-Wertes<br />

jeweils mit 0,000 ausgewiesen ist.<br />

In den Spalten b0, b1 und b2 werden die geschätzten Parameter für die lineare und<br />

die quadratische Funktion angegeben. Danach ergeben sich folgende Schätzgleichungen:<br />

Linear:<br />

alq = 10,3 - 1,3 · preise_v<br />

Quadratisch: alq = 11,37 - 1,85 · preise_v + 0,06 · preise_v 2<br />

Würde die lineare Gleichung tatsächlich den gültigen Zusammenhang zwischen<br />

der Inflationsrate und der Arbeitslosenquote beschreiben, dann würde die Arbeitslosenquote<br />

bei einer Inflationsrate von null 10,3% betragen. Mit jedem Anstieg<br />

der Inflationsrate um einen Prozentpunkt könnte die Arbeitslosenquote um<br />

1,3 Prozentpunkte gesenkt werden. Man müßte also lediglich eine Inflationsrate<br />

von 5% in Kauf nehmen, um die Arbeitslosenquote auf unter 4% zu senken.<br />

262 Bei der quadratischen Funktion käme nur ein Ast des typischen Graphen zur Anwendung,<br />

vgl. auch die Übersicht über die zur Verfügung stehenden Kurventypen in Abbildung <strong>24</strong>.8,<br />

S. 588.<br />

263 Zuvor müssen Sie in der Datendatei festlegen, daß nur die Werte ab 1970 berücksichtigt<br />

werden sollen. Hierzu können Sie den Befehl DATEN, FÄLLE AUSWÄHLEN verwenden. Wählen<br />

Sie in dem entsprechenden Dialogfeld die Option Falls Bedingung zutrifft, und geben Sie in dem<br />

Dialogfeld der dazugehörigen Schaltfläche Falls die Bedingung jahr >= 1970 an.<br />

264 Beachten Sie, daß die Achsen in Abbildung <strong>24</strong>.3 gegenüber der Grafik in Abbildung <strong>24</strong>.1<br />

vertauscht sind.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>24</strong>.1 Beispiel 1: Die Phillips-Kurve 581<br />

Hätte dagegen die quadratische Gleichung Gültigkeit, könnte diese folgendermaßen<br />

interpretiert werden: Bei einer Inflationsrate von null würde die Arbeitslosenquote<br />

ungefähr 11,4% betragen. Bei einem Anstieg der Inflationsrate sind zwei<br />

gegenläufige Effekte zu beobachten. Einer dieser Effekte bewirkt, daß die Arbeitslosenquote<br />

jeweils um 1,85 Prozentpunkte sinkt, wenn die Inflationsrate um<br />

einen Prozentpunkt ansteigt. Diesem linearen negativen Effekt wirkt ein quadratischer<br />

positiver Effekt entgegen. Bei geringen Werten der Inflationsrate überwiegt<br />

der negative Einfluß, so daß die Arbeitslosenquote mit zunehmender Inflationsrate<br />

tatsächlich zurückgeht. Bei sehr hoher Inflation kehrt sich das Verhältnis dagegen<br />

um, und die Arbeitslosigkeit nimmt mit ansteigender Inflation ebenfalls zu.<br />

MODEL: MOD_8.<br />

Independent: PREISE_V<br />

Dependent Mth Rsq d.f. F Sigf b0 b1 b2<br />

ALQ LIN ,789 23 86,21 ,000 10,2990 -1,3041<br />

ALQ QUA ,795 22 42,69 ,000 11,3714 -1,8502 ,0588<br />

Abbildung <strong>24</strong>.2: Textoutput der <strong>Kurvenanpassung</strong><br />

10<br />

Arbeitslosenquote<br />

8<br />

6<br />

4<br />

2<br />

0<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

8<br />

Veränderungsrate des Preisindex des BSP in %<br />

Abbildung <strong>24</strong>.3: Grafik der Prozedur KURVENANPASSUNG mit einer linearen und einer<br />

quadratischen Anpassung für den Zeitraum von 1970 bis 1994<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


582 <strong>Kapitel</strong> <strong>24</strong> <strong>Kurvenanpassung</strong><br />

Wahl zwischen den Schätzgleichungen<br />

Die Tatsache, daß für die quadratische Gleichung ein höheres R 2 ausgewiesen<br />

wird, läßt einen möglicherweise zunächst dazu tendieren, der quadratischen Funktion<br />

den Vorzug zu geben. Hierbei sollten Sie allerdings berücksichtigen, daß die<br />

Anpassung einer quadratischen Funktion beinahe immer zu besseren, niemals aber<br />

zu schlechteren Ergebnissen (gemessen am R 2 ) führt als die Anpassung einer linearen<br />

Funktion. Dies ist sehr einleuchtend, wenn man bedenkt, daß die lineare<br />

Funktion lediglich einen Sonderfall der quadratischen Funktion darstellt, bei dem<br />

der Parameter b 2 den Wert null hat. Der Preis für des höhere R 2 einer quadratischen<br />

gegenüber einer linearen Funktion besteht in der höheren Anzahl erklärender<br />

Variablen. Während die lineare Funktion mit einer erklärenden Variablen (x<br />

bzw. im vorliegenden Beispiel alq) auskommt, benötigt die quadratische Funktion<br />

zwei erklärende Variablen (x und x 2 bzw. alq und alq 2 ). Eine weitere Verbesserung<br />

des R 2 läßt sich sehr einfach erreichen, indem anstatt des quadratischen ein<br />

kubischer Kurventyp verwendet wird, der wiederum eine zusätzliche erklärende<br />

Variable (x 3 bzw. alq 3 ) einbezieht.<br />

Allgemein sollte die Entscheidung für oder wider einen Kurventyp niemals ausschließlich<br />

anhand des R 2 erfolgen. Von wesentlich größerer Bedeutung als die<br />

Güte der Anpassung ist die Frage, ob ein bestimmter Kurventyp inhaltlich plausibel<br />

erscheint. So läßt sich das R 2 immer weiter verbessern, indem zusätzliche erklärende<br />

Variablen (wie zum Beispiel x 4 , x 5 , x 6 etc.) einbezogen werden. Es ist jedoch<br />

fraglich, ob auf diese Weise der funktionale Zusammenhang zwischen den<br />

beiden betrachteten Variablen sinnvoll abgebildet werden kann.<br />

Betrachtung der Einzelperioden<br />

Abbildung <strong>24</strong>.4 zeigt die Ergebnisse der <strong>Kurvenanpassung</strong> für die drei Teilperioden.<br />

In allen drei Perioden wurden eine lineare und eine quadratische Funktion<br />

verwendet, wobei sich die angegebenen Statistiken unterhalb der Tabelle ausschließlich<br />

auf die lineare Funktion beziehen.<br />

9<br />

Arbeitslosenquote<br />

1961-1975 1975-1981 1982-1994<br />

9<br />

Arbeitslosenquote<br />

9<br />

Arbeitslosenquote<br />

8<br />

8<br />

8<br />

7<br />

7<br />

7<br />

6<br />

6<br />

6<br />

5<br />

5<br />

5<br />

4<br />

4<br />

4<br />

3<br />

3<br />

3<br />

2<br />

2<br />

2<br />

1<br />

1<br />

1<br />

0<br />

0<br />

0<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

8<br />

3,5<br />

4,0<br />

4,5<br />

5,0<br />

5,5<br />

6,0<br />

1,5<br />

2,0<br />

2,5<br />

3,0<br />

3,5<br />

4,0<br />

4,5<br />

Veränderungsrate des Preisindex des BSP in %<br />

Veränderungsrate des Preisindex des BSP in %<br />

Veränderungsrate des Preisindex des BSP in %<br />

R 2 = 0,019 d.f. 13 R 2 = 0,008 d.f. 6 R 2 = 0,551 d.f 11<br />

F = 0,25 Sig. = 0,623 F = 0,05 Sig. = 0,831 F = 13,51 Sig. = 0,004<br />

alq = 0,8 + 0,07 preise_v alq = 3,5 + 0,14 preise_v alq = 9,2 - 0,7 preise_v<br />

Abbildung <strong>24</strong>.4: Lineare und quadratische <strong>Kurvenanpassung</strong> für die drei Teilperioden;<br />

Schätzstatistik für lineare Funktion<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>24</strong>.1 Beispiel 1: Die Phillips-Kurve 583<br />

Die Regressionsgerade verläuft in jeder der drei Teilperioden wesentlich flacher<br />

als in der Schätzung für die Gesamtperiode. In den ersten beiden Teilperioden<br />

werden mit den Koeffizienten 0,07 und 0,14 sogar positive Zusammenhänge zwischen<br />

der Arbeitslosenquote und der Inflationsrate ausgewiesen. Für beide Teilperioden<br />

zeigen jedoch die Werte für R 2 sowie die ausgewiesenen Signifikanzen,<br />

daß tatsächlich kein (oder zumindest kein linearer) Zusammenhang zwischen der<br />

Arbeitslosenquote und der Inflationsrate innerhalb dieser Teilperioden zu bestehen<br />

scheint. Für die dritte Teilperiode ist dagegen durchaus der erwartete negative Zusammenhang<br />

zu erkennen. Der entsprechende Koeffizient (b 1 ) wurde mit 0,7 geschätzt,<br />

das R 2 zeigt mit einem Wert von 0,55, daß durchaus ein gewisser Zusammenhang<br />

zwischen den beiden Variablen besteht, und auch der F-Wert ist mit<br />

0,4% hochsignifikant.<br />

Die abgebildeten Diagramme wurden im Grafikeditor so angepaßt, daß die senkrechte<br />

Achse, auf der die Arbeitslosenquote in Prozent abgetragen wird, jeweils<br />

den Wertebereich von 0 bis 9 darstellt. Dadurch läßt sich an den drei nebeneinander<br />

liegenden Grafiken deutlich erkennen, daß sich die dargestellte Kurve im<br />

Zeitablauf nach oben verschoben hat. Da die Kurve zusätzlich innerhalb jeder Periode<br />

relativ flach verläuft (und damit relativ geringe Schwankungen in der Arbeitslosenquote<br />

anzeigt), wäre eine mögliche Interpretation für diese Beobachtung<br />

die folgende: Tatsächlich besteht der erwartete Zusammenhang zwischen der Inflationsrate<br />

und der Arbeitslosenquote nicht oder nur in geringem Ausmaß. Vielmehr<br />

wird die Höhe der Arbeitslosigkeit im wesentlichen durch andere Faktoren<br />

bestimmt und nicht unmittelbar durch die Inflationsrate beeinflußt. Die tatsächlich<br />

relevanten Bestimmungsfaktoren der Arbeitslosenquote haben bewirkt, daß sich<br />

das Niveau der Arbeitslosigkeit im Zeitablauf nach oben verschoben hat, und zwar<br />

zunächst von einem Niveau bei ungefähr 2% in den 60 er Jahren auf ein Niveau um<br />

die 5% in der zweiten Hälfte der 70 er Jahre, bis nunmehr ein Niveau von ungefähr<br />

7-8% in den 80 er und Anfang der 90 er Jahre erreicht wurde.<br />

Es hat sich gezeigt, daß sich die Hypothese eines Zusammenhangs zwischen der<br />

Inflationsrate und der Arbeitslosenquote je nach Betrachtungsweise sowohl untermauern<br />

als auch entkräften läßt. Dies macht deutlich, daß bei der Verwendung<br />

von Instrumenten wie der <strong>Kurvenanpassung</strong> - so wie von statistischen Analyseverfahren<br />

im allgemeinen - eine große Sorgfalt erforderlich ist, um nicht zu schnelle<br />

oder falsche Schlüsse zu ziehen. Insbesondere sollte man jedes Ergebnis, das man<br />

gefunden zu haben glaubt, anschließend noch einmal mit etwas Abstand betrachten<br />

und schlicht fragen, ob dieses „nach gesundem Menschenverstand“ plausibel<br />

ist. Auf diese Weise lassen sich bereits zahlreiche Fehlschlüsse vermeiden, wie<br />

zum Beispiel der Übergang von einer linearen auf eine kubische Funktion, die<br />

- wie unter Wahl zwischen den Schätzgleichungen, S. 582 dargestellt - möglicherweise<br />

einen besseren Fit, dafür aber auch eine geringere inhaltliche Plausibilität<br />

aufweist.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


584 <strong>Kapitel</strong> <strong>24</strong> <strong>Kurvenanpassung</strong><br />

<strong>24</strong>.2 Beispiel 2: Wachstumsrate in der Bundesrepublik<br />

Die Datendatei Makrodaten.sav enthält in der Variablen bip die Werte des Bruttoinlandsprodukts<br />

(BIP) für das alte Gebiet der Bundesrepublik Deutschland. Im<br />

folgenden soll versucht werden, mit Hilfe der Prozedur KURVENANPASSUNG eine<br />

Funktion zu finden, die den Verlauf des BIP möglichst gut beschreibt. Da das<br />

Bruttoinlandsprodukt grundsätzlich einem Wachstumsprozeß folgt, kommt hierfür<br />

der Kurventyp Wachstum in Frage. Dieser paßt eine Kurve mit konstanter<br />

Wachstumsrate an die beobachtete Kurve des BIP an.<br />

Im vorhergehenden Beispiel wurde eine Kurve gesucht, die den Zusammenhang<br />

zwischen der Inflationsrate und der Arbeitslosenquote möglichst gut beschreibt,<br />

wobei die Arbeitslosenquote als abhängige und die Inflationsrate als erklärende<br />

Variable angesehen wurden. In diesem Beispiel bildet nun das BIP die abhängige<br />

Variable. Allerdings soll nicht der Zusammenhang zwischen dem BIP und einer<br />

anderen Größe untersucht, sondern lediglich dessen Entwicklung im Zeitablauf<br />

nachgezeichnet werden. Damit gibt es keine erklärende Variable im eigentlichen<br />

Sinne. Vielmehr stellt die Zeit die unabhängige Größe dar, denn die anzupassende<br />

Kurve soll die Veränderung des BIP bei voranschreitender Zeit abbilden. Für solche<br />

Fälle, in denen eine Kurve an die Entwicklung einer Variablen im Zeitablauf<br />

angepaßt werden soll, ist im Dialogfeld <strong>Kurvenanpassung</strong> in der Gruppe Unabhängige<br />

Variable die Option Zeit vorgesehen. Kreuzen Sie diese Option an, verschieben<br />

Sie die Variable bip in das Feld Abhängige Variablen, und wählen Sie in<br />

der Gruppe Modell den Kurventyp Wachstum, um den in den Abbildungen <strong>24</strong>.5<br />

und <strong>24</strong>.6 dargestellten Output zu erhalten.<br />

In der Grafik aus Abbildung <strong>24</strong>.6 stellt die weiße Kurve den Verlauf der beobachteten<br />

Werte und die schwarze Kurve die daran angepaßte Wachstumsfunktion<br />

dar. In der langfristigen Tendenz scheint die geschätzte Wachstumsfunktion die<br />

tatsächliche Entwicklung des BIP recht gut nachzubilden. In Abbildung <strong>24</strong>.5 wird<br />

für die Anpassungsgüte ein R 2 von 0,971 ausgewiesen. Der F-Wert ist mit 0,000<br />

hochsignifikant.<br />

Die allgemeine Form der geschätzten Wachstumsfunktion lautet:<br />

b0 + b1 · t<br />

y = e<br />

Dabei bezeichnet y die abhängige Variable und t die Zeit. e ist die Eulersche Zahl<br />

(≈ 2,71828). Für den Parameter b 0 wurde der Wert 6,9774 geschätzt, für b 1 der<br />

Wert 0,0278. Damit lautet die geschätzte Wachstumsfunktion:<br />

6,9774 + 0,0278 · t<br />

bip = e<br />

Die Zeitvariable t nimmt dabei Werte zwischen 1 und 35 (und nicht etwa zwischen<br />

1960 und 1994) an. Die Funktion läßt sich auch in der folgenden Form<br />

schreiben, in der sie einfacher interpretiert werden kann:<br />

bip = e 6,9774 · e 0,0278 · t<br />

Im ersten Teil des Ausdrucks auf der rechten Seite (e 6,9774 ) ist die Zeitvariable t<br />

nicht enthalten, so daß dies eine Konstante ist. e 6,9774 ist gleich dem Wert 1072,1.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>24</strong>.2 Beispiel 2: Wachstumsrate in der Bundesrepublik 585<br />

Damit kann die geschätzte Wachstumsfunktion auch folgendermaßen geschrieben<br />

werden:<br />

bip = 1072,1 · e 0,0278 · t<br />

Der Wert 1072,1 kann dabei als Ausgangswert des Wachstumsprozesses in dem<br />

beobachteten Zeitraum angesehen werden. Ausgehend von diesem Wert wächst<br />

das BIP - gemäß der angepaßten Kurve - seit 1960 jährlich mit der Rate von<br />

0,0278 bzw. 2,78%. Die langfristige Entwicklung des Bruttoinlandsprodukts zwischen<br />

1960 und 1994 läßt sich damit in stilisierter Form durch eine Funktion mit<br />

konstanter Wachstumsrate von 2,78% abbilden.<br />

MODEL: MOD_9.<br />

Independent: Time<br />

Dependent Mth Rsq d.f. F Sigf b0 b1<br />

BIP GRO ,971 33 1089,48 ,000 6,9774 ,0278<br />

Abbildung <strong>24</strong>.5: Textoutput der Anpassung einer Wachstumsfunktion an die Entwicklung<br />

des BIP<br />

3000<br />

Bruttoinlandsprodukt - Alte Bundesländer<br />

(in Preisen von 1991; Mrd. DM)<br />

2000<br />

1000<br />

0<br />

0<br />

10<br />

20<br />

30<br />

40<br />

Sequence<br />

Abbildung <strong>24</strong>.6: Entwicklung des BIP in dem früheren Bundesgebiet von 1960 bis 1994<br />

(weiße Kurve) und daran angepaßte Wachstumsfunktion (schwarze Kurve)<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


586 <strong>Kapitel</strong> <strong>24</strong> <strong>Kurvenanpassung</strong><br />

<strong>24</strong>.3 Kurventypen<br />

Sie können in der Prozedur KURVENANPASSUNG zwischen elf verschiedenen Kurventypen<br />

wählen. Nur ein Kurventyp (Linear) beschreibt unmittelbar einen linearen<br />

Zusammenhang zwischen der abhängigen und der erklärenden Variablen. Allerdings<br />

lassen sich auch alle übrigen zehn Kurventypen in eine lineare Funktion<br />

transformieren. Dies kann sehr hilfreich sein, wenn die Beziehung zwischen den<br />

Variablen mit anderen Verfahren, die eine linearen Zusammenhang voraussetzen,<br />

weiter untersucht werden soll.<br />

Mit dem Kurventyp Linear schätzen Sie eine Funktion der allgemeinen Form: 265<br />

y = b 0 + b 1 · x<br />

Diese Funktion ist damit linear in den Variablen y und x. Der Kurventyp Logarithmisch<br />

schätzt dagegen eine Funktion der allgemeinen Form:<br />

y = b 0 + b 1 · ln(x)<br />

Diese Funktion ist zwar nicht linear in den Variablen y und x, wohl aber in y und<br />

ln(x). Wenn also der wahre Zusammenhang zwischen zwei Variablen durch die<br />

nichtlineare Funktion y = b 0 + b 1 · ln(x) abgebildet wird, können Sie die natürlichen<br />

Logarithmen für die Werte der Variablen x berechnen und erhalten auf diese<br />

Weise eine neue Variable, die einen linearen Zusammenhang zur Variablen y aufweist.<br />

Mit dem Kurventyp Kubisch schätzen Sie eine Funktion der allgemeinen Form:<br />

y = b 0 + b 1 · x + b 2 · x 2 + b 3 · x 3<br />

Auch diese Funktion ist natürlich nicht linear in den Variablen y und x, wohl aber<br />

in den Variablen y, x, x 2 und x 3 .<br />

Der Kurventyp Zusammengesetzt schätzt eine Funktion der allgemeinen Form:<br />

y = b 0 ·<br />

Durch Logarithmierung läßt sich diese Funktion in folgende Form überführen:<br />

ln(y) = ln(b 0 ) + ln(b 1 ) · x<br />

Damit ist die Funktion linear in den Variablen ln(y) und x.<br />

Die Übersicht in Abbildung <strong>24</strong>.7 führt alle elf zur Verfügung stehenden Kurventypen<br />

auf und gibt jeweils die durch einen Kurventyp geschätzte Funktion in der<br />

allgemeinen Form an. Zusätzlich wird jeweils dargestellt, in welcher Weise die<br />

Funktion transformiert werden kann, damit sie einen linearen Zusammenhang<br />

zwischen einer abhängigen und einer oder mehreren erklärenden Variablen beschreibt.<br />

x<br />

b 1<br />

265 Zur Bedeutung der Symbole siehe auch die Erläuterungen in Abbildung <strong>24</strong>.7.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>24</strong>.3 Kurventypen 587<br />

Kurventyp Funktion Lineare Form<br />

Linear y = b 0 + b 1 · x y = b 0 + b 1 · x<br />

Logarithmisch y = b 0 + b 1 · ln(x) y = b 0 + b 1 · ln(x)<br />

Invers y = b 0 + x<br />

b 1 y = b0 + x<br />

b 1<br />

Quadratisch y = b 0 + b 1 · x + b 2 · x 2 y = b 0 + b 1 · x + b 2 · x 2<br />

Kubisch y = b 0 + b 1 · x + b 2 · x 2 + b 3 · x 3 y = b 0 + b 1 · x + b 2 · x 2 + b 3 · x 3<br />

Exponent<br />

b1<br />

y = b 0 · x<br />

Zusammengesetzt y = b 0 ·<br />

x<br />

b1<br />

ln(y) = ln(b 0 ) + b 1 · ln(x)<br />

ln(y) = ln(b 0 ) + ln(b 1 ) · x<br />

b1<br />

S<br />

b<br />

y = e + b<br />

0 x<br />

ln(y) = b 0 + 1<br />

x<br />

Logistisch<br />

1<br />

y =<br />

⎛ 1 1<br />

1 x<br />

+ b<br />

o 0 ⋅ b<br />

⎟ ⎞<br />

ln<br />

⎜ + = ln(b 0 ) + ln(b 1 ) · x<br />

1<br />

⎝ y o ⎠<br />

Wachstum<br />

b0+ b1⋅x<br />

y = e<br />

ln(y) = b 0 + b 1 · x<br />

Exponentiell<br />

b x<br />

y = b 0 · e ⋅ 1<br />

ln(y) = ln(b 0 ) + b 1 · x<br />

Hierbei ist y die abhängige und x die erklärende Variable. b 0 , b 1 , b 2 und b 3 bezeichnen die<br />

zu schätzenden Regressionskoeffizienten. e ist die Eulersche Zahl (≈ 2,71828) und ln der<br />

natürliche Logarithmus. Bei der logistischen Funktion bezeichnet o eine Obergrenze des<br />

logistischen Modells, die in dem Dialogfeld <strong>Kurvenanpassung</strong> vorgegeben werden kann.<br />

Abbildung <strong>24</strong>.7: Übersicht über die zur Verfügung stehenden Kurventypen<br />

Abbildung <strong>24</strong>.8 skizziert die typischen Kurvenverläufe, die mit den einzelnen zur<br />

Verfügung stehenden Kurventypen erstellt werden können. Dabei hängt die konkrete<br />

Form einer Kurve sehr stark von den jeweils verwendeten Parametern ab.<br />

Besonders deutlich wird dies unter anderem bei den Kurventypen Exponent und<br />

Zusammengesetzt, für die jeweils drei Kurven (die mit unterschiedlichen Parametern<br />

erzeugt wurden) dargestellt werden.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


588 <strong>Kapitel</strong> <strong>24</strong> <strong>Kurvenanpassung</strong><br />

Linear Logarithmisch Invers<br />

Quadratisch Kubisch Exponent<br />

11 2<br />

1<br />

3 3<br />

Zusammengesetzt S Logistisch<br />

1<br />

2<br />

3<br />

Wachstum<br />

Exponentiell<br />

Abbildung <strong>24</strong>.8: Skizze der typischen Kurvenverläufe der unterschiedlichen Kurventypen<br />

<strong>24</strong>.4 Einstellungen zur <strong>Kurvenanpassung</strong><br />

Um eine oder mehrere <strong>Kurvenanpassung</strong>en durchzuführen, wählen Sie den Befehl<br />

STATISTIK<br />

REGRESSION<br />

KURVENANPASSUNG...<br />

Dieser Befehl öffnet das in Abbildung <strong>24</strong>.9 dargestellte Dialogfeld. Nehmen Sie<br />

dort folgende Einstellungen vor:<br />

¾ Abhängige Variable(n): Fügen Sie in dieses Feld eine oder mehrere abhängige<br />

Variablen ein. Wenn Sie mehrere abhängige Variablen angeben, wird für jede<br />

von ihnen eine eigene <strong>Kurvenanpassung</strong> durchgeführt. Sie erhalten somit die<br />

gleichen Ergebnisse wie bei zweimaligem Ausführen der Prozedur mit jeweils<br />

einer abhängigen Variablen.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


<strong>24</strong>.4 Einstellungen zur <strong>Kurvenanpassung</strong> 589<br />

Abbildung <strong>24</strong>.9: Dialogfeld des Befehl STATISTIK, REGRESSION, KURVENANPASSUNG<br />

¾ Unabhängige Variable: Möchten Sie eine erklärende Variable angeben, wählen<br />

Sie in der Gruppe Unabhängige Variable die Option Variable, und verschieben<br />

Sie die erklärende Variable in das entsprechende Feld. Soll dagegen<br />

eine Kurve an die Entwicklung einer Variablen im Zeitablauf angepaßt werden,<br />

wählen Sie die Option Zeit.<br />

¾ Modelle: Kreuzen Sie in dieser Gruppe die Kurventypen an, die für die <strong>Kurvenanpassung</strong><br />

verwendet werden sollen (siehe im einzelnen Abschnitt<br />

<strong>24</strong>.3, Kurventypen, S. 586). Wenn Sie den Kurventyp Logistisch wählen, können<br />

Sie eine Obergrenze des logistischen Modells angeben (siehe auch die<br />

Gleichung in Abbildung <strong>24</strong>.7). Dies muß eine positive Zahl sein, die größer ist<br />

als der größte in der abhängigen Variablen vorkommende Wert. Als Voreinstellung<br />

ist die Obergrenze auf unendlich eingestellt, so daß der Term 1/o in<br />

der logistischen Gleichung den Wert null annimmt und damit entfällt.<br />

¾ Konstante in Gleichung einschließen: Diese Option ist per Voreinstellung angekreuzt,<br />

so daß in der Regressionsgleichung ein konstanter Term berücksichtigt<br />

und geschätzt wird. Soll kein konstanter Term berücksichtigt werden,<br />

wählen Sie diese Option ab. Damit entfällt in den Gleichungen jeweils der Parameter<br />

b 0 .<br />

¾ Diagramm der Modelle: Mit dieser ebenfalls voreingestellten Option wird ein<br />

Diagramm mit dem Verlauf der beobachteten Werte und den daran angepaßten<br />

Kurven erstellt (siehe zum Beispiel Abbildung <strong>24</strong>.3, S. 581).<br />

¾ ANOVA-Tabelle anzeigen: Kreuzen Sie diese Option an, um für jedes Modell<br />

(also für jede Kombination aus abhängiger Variablen und Kurventyp) eine<br />

Übersicht mit den wichtigsten Kennzahlen einer Varianzanalyse zu erstellen.<br />

¾ Speichern: In dem Dialogfeld dieser Schaltfläche können Sie veranlassen, daß<br />

die Ergebnisse der <strong>Kurvenanpassung</strong> als Variablen gespeichert werden (s.u.).<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing


590 <strong>Kapitel</strong> <strong>24</strong> <strong>Kurvenanpassung</strong><br />

Speichern<br />

Abbildung <strong>24</strong>.10: Dialogfeld der Schaltfläche „Speichern“<br />

Mit der Schaltfläche Speichern öffnen Sie das in Abbildung <strong>24</strong>.10 wiedergegebene<br />

Dialogfeld, das folgende Optionen enthält:<br />

¾ Variablen speichern: Sie können veranlassen, daß die vorhergesagten Werte,<br />

die Residuen und/oder die Vorhersageintervalle als neue Variablen in der geöffneten<br />

Datendatei gespeichert werden. Die Vorhersageintervalle werden in<br />

zwei Variablen gespeichert, von denen eine die Werte der unteren und die andere<br />

die Werte der oberen Intervallgrenze aufnimmt. Die Variable für die untere<br />

Intervallgrenze erhält den Namen lcl_1, die für die obere Grenze den Namen<br />

ucl_1 (bzw. entsprechende Namen mit höheren Endziffern). Für die Breite des<br />

Konfidenzintervalls können Sie in der Dropdown-Liste zwischen einem 90%-,<br />

einem 95%- und einem 99%-Konfidenzniveau wählen.<br />

¾ Fälle vorhersagen: Wenn Sie in dem Hauptdialogfeld für die unabhängige<br />

Variable die Option Zeit gewählt haben, können Sie einen Vorhersagezeitraum<br />

festlegen, der über den Beobachtungszeitraum hinausgeht. Hierzu stehen die<br />

folgenden Optionen zur Verfügung:<br />

y Von der Schätzperiode bis zum letzten Fall vorhersagen: Haben Sie die in<br />

der <strong>Kurvenanpassung</strong> zu berücksichtigenden Fälle mit dem Befehl DATEN,<br />

FÄLLE AUSWÄHLEN und dort mit der Option Nach Zeit- oder Fallbereich<br />

eingeschränkt, werden mit dieser Option Prognosewerte für die gesamte<br />

Schätzperiode und für alle anschließenden Fälle berechnet.<br />

y Vorhersagen bis: Geben Sie in dem Feld Beobachtung an, bis zu welchem<br />

Zeitpunkt (1, 2, 3, ...) Prognosewerte berechnet und gespeichert werden<br />

sollen. Haben Sie in der Datendatei ein Datum definiert 266 , können Sie für<br />

die letzte Vorhersageperiode das Datum angeben. Hierzu stehen dann die<br />

entsprechenden Eingabefelder zur Verfügung.<br />

266 Hierzu steht der Befehl DATEN, DATUM DEFINIEREN zur Verfügung, siehe im einzelnen<br />

Abschnitt 9.8, Datumsvariablen erstellen, S. <strong>24</strong>6.<br />

Felix Brosius, SPSS 8<br />

International Thomson Publishing

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!