23.07.2013 Views

Vektorer og lineær regression - Forside for harremoes.dk

Vektorer og lineær regression - Forside for harremoes.dk

Vektorer og lineær regression - Forside for harremoes.dk

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Tilbage er blot at udregne det sidste led<br />

n<br />

fi (vi − w) =<br />

i=1<br />

n<br />

fivi −<br />

i=1<br />

= w − w<br />

= 0.<br />

Vi har set, at hvis et helt datasæt skal repræsenteret ved et enkelt punkt,<br />

s˚a er tyngdepunktet det bedste valg. Vi vil nu <strong>for</strong>søge at repræsentere hele<br />

datasættet ved en ret linje af <strong>for</strong>men y = ax + b. Her vil vi opfatte x som<br />

den uafhængige variable <strong>og</strong> y som den afhængige variabel. Vi vil igen bruge<br />

gennemsnitlig kvadratisk afvigelse som m˚al <strong>for</strong> kvaliteten af vores rette linje,<br />

hvor vi ved kvadratisk afvigelse <strong>for</strong>st˚ar størrelsen<br />

n<br />

i=1<br />

n<br />

fi (yi − (axi + b)) 2 .<br />

i=1<br />

Sætning 21 For et datasæt vil bedste rette linje g˚a gennem tyngepunktet <strong>og</strong><br />

hældningen vil være givet ved<br />

n a =<br />

Bevis. Først skriver vi<br />

n<br />

fi (yi − (axi + b)) 2 =<br />

i=1<br />

i=1 fi (xi − ¯x) (yi − ¯y)<br />

n i=1 fi (xi − ¯x) 2 .<br />

fi w<br />

n<br />

fi ((yi − axi) − b) 2<br />

s˚a <strong>for</strong> fastholdt værdi af a skal vi minimere en kvadratafvigelse <strong>og</strong> skal der<strong>for</strong><br />

vælge middelværdien<br />

b =<br />

i=1<br />

n<br />

fi (yi − axi)<br />

i=1<br />

= ¯y − a¯x<br />

men det medfører at ¯y = a¯x + b s˚a linen skal g˚a gennem tyngdepunktet.<br />

For at gøre den sidste del af beviset simplere vil vi antage at tyngdepunktet<br />

11

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!