Vektorer og lineær regression - Forside for harremoes.dk
Vektorer og lineær regression - Forside for harremoes.dk
Vektorer og lineær regression - Forside for harremoes.dk
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Tilbage er blot at udregne det sidste led<br />
n<br />
fi (vi − w) =<br />
i=1<br />
n<br />
fivi −<br />
i=1<br />
= w − w<br />
= 0.<br />
Vi har set, at hvis et helt datasæt skal repræsenteret ved et enkelt punkt,<br />
s˚a er tyngdepunktet det bedste valg. Vi vil nu <strong>for</strong>søge at repræsentere hele<br />
datasættet ved en ret linje af <strong>for</strong>men y = ax + b. Her vil vi opfatte x som<br />
den uafhængige variable <strong>og</strong> y som den afhængige variabel. Vi vil igen bruge<br />
gennemsnitlig kvadratisk afvigelse som m˚al <strong>for</strong> kvaliteten af vores rette linje,<br />
hvor vi ved kvadratisk afvigelse <strong>for</strong>st˚ar størrelsen<br />
n<br />
i=1<br />
n<br />
fi (yi − (axi + b)) 2 .<br />
i=1<br />
Sætning 21 For et datasæt vil bedste rette linje g˚a gennem tyngepunktet <strong>og</strong><br />
hældningen vil være givet ved<br />
n a =<br />
Bevis. Først skriver vi<br />
n<br />
fi (yi − (axi + b)) 2 =<br />
i=1<br />
i=1 fi (xi − ¯x) (yi − ¯y)<br />
n i=1 fi (xi − ¯x) 2 .<br />
fi w<br />
n<br />
fi ((yi − axi) − b) 2<br />
s˚a <strong>for</strong> fastholdt værdi af a skal vi minimere en kvadratafvigelse <strong>og</strong> skal der<strong>for</strong><br />
vælge middelværdien<br />
b =<br />
i=1<br />
n<br />
fi (yi − axi)<br />
i=1<br />
= ¯y − a¯x<br />
men det medfører at ¯y = a¯x + b s˚a linen skal g˚a gennem tyngdepunktet.<br />
For at gøre den sidste del af beviset simplere vil vi antage at tyngdepunktet<br />
11