Skriptum
Skriptum
Skriptum
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Beispiel 2.5.<br />
r x,y =<br />
3.14<br />
1.83 · 1.81 = 0.95<br />
Bei der Regression versucht man, eine Funktion f (Modell) zu finden, mit der<br />
ein Merkmal y durch das andere Merkmal x mittels f (x) möglichst gut geschätzt<br />
werden kann (Modellanpassung). Dabei soll die gesamte Abweichung durch die<br />
Wahl der Parameter von f minimiert werden.<br />
Definition 2.6. Die Summe der Fehlerquadrate (sum of squared errors, SSE) ist<br />
S(f , x, y) :=<br />
n∑<br />
(y i − f (x i )) 2 .<br />
i=1<br />
Definition 2.7. Die Regression nach der Methode der kleinsten Quadrate ist<br />
die Minimierung der Summe der Fehlerquadrate durch Variation der Parameter<br />
a 1 , a 2 ,... des Modells f a1 ,a 2 ,....<br />
(â 1 , â 2 ,...) = argmin<br />
a 1 ,a 2 ,...<br />
S(f a1 ,a 2 ,..., x, y) = argmin<br />
a 1 ,a 2 ,...<br />
n∑<br />
(y i − f a1 ,a 2 ,...(x i )) 2<br />
Definition 2.8. Bei der linearen Regression setzt sich f aus einer Linearkombination<br />
f = a 1 f 1 + a 2 f 2 + ... + a m f m zusammen. Die f k können dabei beliebige<br />
Funktionen sein.<br />
Satz 2.9. Die Lösung einer linearen Regression ergibt sich aus der Lösung des linearen<br />
Gleichungssystems C a = b, wobei a der Vektor der m Parameter a 1 , a 2 ,...<br />
ist, C eine m × m Matrix und b ein m-Vektor ist mit<br />
i=1<br />
i=1<br />
n∑<br />
n∑<br />
C k,l = f k (x i )f l (x i ), b k = y i f k (x i ).<br />
Beweis. Das Maximum von S(f , x, y) als Funktion der Parameter a k können wir<br />
durch partielles Ableiten nach den a k und Nullsetzen ermitteln.<br />
0 =<br />
∂S(f , x, y)<br />
= ∂ n∑<br />
(y i − a 1 f 1 (x i ) − a 2 f 2 (x i ) − ... − a m f m (x i )) 2<br />
∂a k ∂a k i=1<br />
n∑<br />
= 2(y i − a 1 f 1 (x i ) − a 2 f 2 (x i ) − ...)f k (x i ).<br />
i=1<br />
Durch Nullsetzen und Hineinziehen und Trennen der Summe bekommen wir<br />
n∑<br />
n∑<br />
n∑<br />
n∑<br />
a 1 f 1 (x i )f k (x i ) + a 2 f 2 (x i )f k (x i ) + ... a m f m (x i )f k (x i ) = y i f k (x i ),<br />
i=1<br />
i=1<br />
was der Zeile k des obigen Gleichungssystems entspricht.<br />
i=1<br />
i=1<br />
i=1<br />
9