02.11.2014 Views

Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...

Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...

Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Poglavlje 10<br />

Korelacija i regresija<br />

U ovom poglavlju bavimo se statističkom analizom povezanosti medu varijablama. Iako<br />

se može izučavati povezanost više varijabli, mi ćemo se ograničiti na bivarijatni slučaj<br />

(X, Y ). Nadalje, ograničit ćemo se samo na linearnu povezanost, dakle, na modele koji<br />

pretpostavljaju da je uvjetno očekivanje od Y za svaku danu vrijednost x od X, linearna<br />

funkcija od x (tj. regresijska funkcija od Y na X = x je linearna funkcija):<br />

E[Y |X = x] = α + βx.<br />

U korelacijskoj analizi dviju varijabli naglasak je na problemu odredivanja mjere jakosti<br />

linearne povezanosti medu njima.<br />

U regresijskoj analizi varijabli X i Y naglasak je na prirodi veze izmedu varijable Y kao<br />

zavisne varijable (odziv) i X kao nezavisne varijable (poticaj). Analiza se sastoji u odabiru<br />

i prilagodbi primjerenog modela u svrhu predvidanja odziva (individualne vrijednosti od Y<br />

ili očekivane vrijednosti od Y ) za zadani poticaj (za zadanu vrijednost x od X). Kao što<br />

smo već spomenuli, ograničit ćemo se samo na linearnu vezu izmedu X i Y .<br />

Pretpostavimo da je mjerenje bivarijatnog vektora (X, Y ) dalo sljedeće podatke:<br />

(x 1 , y 1 ), (x 2 , y 2 ), . . . , (x n , y n ) (10.1)<br />

Prije nego odaberemo i primijenimo metode inferencijalne statistike, analizirajmo podatke<br />

grafički, pomoću dijagrama raspršenja, da bi vidjeli postoji li uopće ikakva veza izmedu<br />

varijabli X i Y , te, ako postoji, koja je priroda povezanosti.<br />

Ako je linearna povezanost od X i Y plauzibilna, analizira se varijabilnost od Y za<br />

fiksnu vrijednost x od X da bi se ocijenila jakost linearne veze izmedu X i Y .<br />

Ako se pokazalo da X i Y nisu povezane ili da veza nije linearna, tada se metode<br />

koje ćemo diskutirati u ovom poglavlju ne mogu primijeniti. S druge strane, može se dogoditi<br />

da dobro odabrana transformacija originalnih podataka pokaže linearnu povezanost<br />

izmedu transformiranih podataka. U tom slučaju se opisane metode mogu primijeniti na<br />

transformirane varijable.<br />

Dijagram raspršenja je prikaz podataka (10.1) kao točaka u Kartezijevom koordinatnom<br />

sustavu.<br />

Primjer 10.1 Uzorak se sastoji od 10 podataka o iznosima zahtjeva za naknadu šteta i<br />

korespodentnih iznosa koje je osiguravajuće društvo stvarno platilo (u jedinicama od po<br />

100 kn):<br />

zahtjev (x) 2.10 2.40 2.50 3.20 3.60 3.80 4.10 4.20 4.50 5.00<br />

isplata (y) 2.18 2.06 2.54 2.61 3.67 3.25 4.02 3.71 4.38 4.45<br />

87

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!