01.03.2014 Aufrufe

Skriptum

Skriptum

Skriptum

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Beispiel 2.5.<br />

r x,y =<br />

3.14<br />

1.83 · 1.81 = 0.95<br />

Bei der Regression versucht man, eine Funktion f (Modell) zu finden, mit der<br />

ein Merkmal y durch das andere Merkmal x mittels f (x) möglichst gut geschätzt<br />

werden kann (Modellanpassung). Dabei soll die gesamte Abweichung durch die<br />

Wahl der Parameter von f minimiert werden.<br />

Definition 2.6. Die Summe der Fehlerquadrate (sum of squared errors, SSE) ist<br />

S(f , x, y) :=<br />

n∑<br />

(y i − f (x i )) 2 .<br />

i=1<br />

Definition 2.7. Die Regression nach der Methode der kleinsten Quadrate ist<br />

die Minimierung der Summe der Fehlerquadrate durch Variation der Parameter<br />

a 1 , a 2 ,... des Modells f a1 ,a 2 ,....<br />

(â 1 , â 2 ,...) = argmin<br />

a 1 ,a 2 ,...<br />

S(f a1 ,a 2 ,..., x, y) = argmin<br />

a 1 ,a 2 ,...<br />

n∑<br />

(y i − f a1 ,a 2 ,...(x i )) 2<br />

Definition 2.8. Bei der linearen Regression setzt sich f aus einer Linearkombination<br />

f = a 1 f 1 + a 2 f 2 + ... + a m f m zusammen. Die f k können dabei beliebige<br />

Funktionen sein.<br />

Satz 2.9. Die Lösung einer linearen Regression ergibt sich aus der Lösung des linearen<br />

Gleichungssystems C a = b, wobei a der Vektor der m Parameter a 1 , a 2 ,...<br />

ist, C eine m × m Matrix und b ein m-Vektor ist mit<br />

i=1<br />

i=1<br />

n∑<br />

n∑<br />

C k,l = f k (x i )f l (x i ), b k = y i f k (x i ).<br />

Beweis. Das Maximum von S(f , x, y) als Funktion der Parameter a k können wir<br />

durch partielles Ableiten nach den a k und Nullsetzen ermitteln.<br />

0 =<br />

∂S(f , x, y)<br />

= ∂ n∑<br />

(y i − a 1 f 1 (x i ) − a 2 f 2 (x i ) − ... − a m f m (x i )) 2<br />

∂a k ∂a k i=1<br />

n∑<br />

= 2(y i − a 1 f 1 (x i ) − a 2 f 2 (x i ) − ...)f k (x i ).<br />

i=1<br />

Durch Nullsetzen und Hineinziehen und Trennen der Summe bekommen wir<br />

n∑<br />

n∑<br />

n∑<br />

n∑<br />

a 1 f 1 (x i )f k (x i ) + a 2 f 2 (x i )f k (x i ) + ... a m f m (x i )f k (x i ) = y i f k (x i ),<br />

i=1<br />

i=1<br />

was der Zeile k des obigen Gleichungssystems entspricht.<br />

i=1<br />

i=1<br />

i=1<br />

9

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!