17.01.2014 Aufrufe

Die Methode der kleinsten absoluten Abweichungen in linearen ...

Die Methode der kleinsten absoluten Abweichungen in linearen ...

Die Methode der kleinsten absoluten Abweichungen in linearen ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

1 E<strong>in</strong>leitung<br />

[6], [18]. Dabei werden ˆβ 0 und ˆβ 1 so gewählt, dass die sogenannte Summe <strong>der</strong> quadratischen<br />

Residuen<br />

n∑<br />

(y i − β 0 − β 1 x i ) 2<br />

i=1<br />

<strong>in</strong> β 0 und β 1 m<strong>in</strong>imiert wird. Den so erhaltenen Schätzer für die Regressionsgerade nennt<br />

man Kle<strong>in</strong>ste-Quadrate-Schätzer (least squares estimator, LSE). <strong>Die</strong>ser Schätzer hat viele<br />

angenehme Eigenschaften (siehe Kapitel 2), was auch <strong>der</strong> Grund für se<strong>in</strong>e Beliebtheit ist.<br />

Allerd<strong>in</strong>gs hat er auch e<strong>in</strong>en entscheidenden Nachteil: Er ist extrem anfällig gegen Punkte,<br />

die nicht <strong>der</strong> Modellgleichung folgen, sogenannte Ausreiÿer. Daher ist für bestimmte<br />

Anwendungen, bei denen das Auftreten solcher Ausreiÿer absehbar ist, e<strong>in</strong> robusterer<br />

Schätzer nötig. E<strong>in</strong> robusterer Schätzer ist <strong>der</strong> Kle<strong>in</strong>ste-Absolute-<strong>Abweichungen</strong>-Schätzer<br />

(least absolute deviations estimator, LAD). Er m<strong>in</strong>imiert<br />

n∑<br />

|y i − β 0 − β 1 x i |<br />

i=1<br />

<strong>in</strong> β 0 und β 1 . Aber auch dieser reicht häug nicht aus, um den E<strong>in</strong>uss <strong>der</strong> Ausreiÿer<br />

genügend zu kontrollieren. Er fängt zwar den E<strong>in</strong>uss e<strong>in</strong>er Fehlannahme <strong>in</strong> <strong>der</strong><br />

Fehlerverteilung gut ab, beson<strong>der</strong>s bei heavy-tail Verteilungen, die viel Wahrsche<strong>in</strong>lichkeitsmasse<br />

weit entfernt vom Mittelwert aufweisen [28]. Das bedeutet e<strong>in</strong>e Robustheit <strong>in</strong><br />

<strong>der</strong> y-Koord<strong>in</strong>ate <strong>der</strong> Messpunkte. Starke <strong>Abweichungen</strong> <strong>in</strong> <strong>der</strong> x-Koord<strong>in</strong>ate, sogenannte<br />

Hebelpunkte (leverage po<strong>in</strong>ts), können jedoch mit dem LAD-Schätzer nicht eektiv<br />

behandelt werden [28]. Um hier e<strong>in</strong>e höhere Robustheit zu erzielen, werden die Daten<br />

getrimmt, das heiÿt, man nimmt an, dass e<strong>in</strong>e gewisse Anzahl n − m mit 0 < m ≤ n <strong>der</strong><br />

Daten Ausreiÿer s<strong>in</strong>d. Welche das genau s<strong>in</strong>d, muss während <strong>der</strong> Schätzung bestimmt<br />

werden. In Komb<strong>in</strong>ation mit dem LAD-Schätzer wird dann die Funktion<br />

m∑<br />

|y (i) − β 0 − β 1 x (i) | (1.3)<br />

i=1<br />

<strong>in</strong> β 0 und β 1 m<strong>in</strong>imiert, wobei die Permutation (·) von β 0 und β 1 abhängt und die Beträge<br />

aufsteigend sortiert. <strong>Die</strong>sen Schätzer nennt man TLAD-Schätzer (trimmed least absolute<br />

deviations). So wird auch e<strong>in</strong>e Robustheit gegen Hebelpunkte erzielt, da sie als Auÿreiÿer<br />

identiziert werden können. Man spricht hier auch von Ausreiÿer-resistenter Statistik,<br />

während <strong>der</strong> Begri <strong>der</strong> Robustheit <strong>in</strong> <strong>der</strong> Literatur ursprünglich für Unempndlichkeit<br />

gegen Fehlerverteilungen mit heavy-tails, also im S<strong>in</strong>ne e<strong>in</strong>er Verteilungs-Robustheit,<br />

verwendet wurde [12, S. 4]. In dieser Arbeit wird <strong>der</strong> E<strong>in</strong>fachheit halber nur <strong>der</strong> Begri<br />

robust ganz allgeme<strong>in</strong> für die Unempndlichkeit gegen <strong>Abweichungen</strong> von den Modellannahmen<br />

verwendet, seien es heavy-tailed Verteilungen o<strong>der</strong> Ausreiÿer. Ohneh<strong>in</strong> s<strong>in</strong>d<br />

viele statistische Verfahren entwe<strong>der</strong> robust und resistent o<strong>der</strong> ke<strong>in</strong>es von beidem [12, S.<br />

4].<br />

6

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!