Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...
Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...
Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Poglavlje 10<br />
Korelacija i regresija<br />
U ovom poglavlju bavimo se statističkom analizom povezanosti medu varijablama. Iako<br />
se može izučavati povezanost više varijabli, mi ćemo se ograničiti na bivarijatni slučaj<br />
(X, Y ). Nadalje, ograničit ćemo se samo na linearnu povezanost, dakle, na modele koji<br />
pretpostavljaju da je uvjetno očekivanje od Y za svaku danu vrijednost x od X, linearna<br />
funkcija od x (tj. regresijska funkcija od Y na X = x je linearna funkcija):<br />
E[Y |X = x] = α + βx.<br />
U korelacijskoj analizi dviju varijabli naglasak je na problemu odredivanja mjere jakosti<br />
linearne povezanosti medu njima.<br />
U regresijskoj analizi varijabli X i Y naglasak je na prirodi veze izmedu varijable Y kao<br />
zavisne varijable (odziv) i X kao nezavisne varijable (poticaj). Analiza se sastoji u odabiru<br />
i prilagodbi primjerenog modela u svrhu predvidanja odziva (individualne vrijednosti od Y<br />
ili očekivane vrijednosti od Y ) za zadani poticaj (za zadanu vrijednost x od X). Kao što<br />
smo već spomenuli, ograničit ćemo se samo na linearnu vezu izmedu X i Y .<br />
Pretpostavimo da je mjerenje bivarijatnog vektora (X, Y ) dalo sljedeće podatke:<br />
(x 1 , y 1 ), (x 2 , y 2 ), . . . , (x n , y n ) (10.1)<br />
Prije nego odaberemo i primijenimo metode inferencijalne statistike, analizirajmo podatke<br />
grafički, pomoću dijagrama raspršenja, da bi vidjeli postoji li uopće ikakva veza izmedu<br />
varijabli X i Y , te, ako postoji, koja je priroda povezanosti.<br />
Ako je linearna povezanost od X i Y plauzibilna, analizira se varijabilnost od Y za<br />
fiksnu vrijednost x od X da bi se ocijenila jakost linearne veze izmedu X i Y .<br />
Ako se pokazalo da X i Y nisu povezane ili da veza nije linearna, tada se metode<br />
koje ćemo diskutirati u ovom poglavlju ne mogu primijeniti. S druge strane, može se dogoditi<br />
da dobro odabrana transformacija originalnih podataka pokaže linearnu povezanost<br />
izmedu transformiranih podataka. U tom slučaju se opisane metode mogu primijeniti na<br />
transformirane varijable.<br />
Dijagram raspršenja je prikaz podataka (10.1) kao točaka u Kartezijevom koordinatnom<br />
sustavu.<br />
Primjer 10.1 Uzorak se sastoji od 10 podataka o iznosima zahtjeva za naknadu šteta i<br />
korespodentnih iznosa koje je osiguravajuće društvo stvarno platilo (u jedinicama od po<br />
100 kn):<br />
zahtjev (x) 2.10 2.40 2.50 3.20 3.60 3.80 4.10 4.20 4.50 5.00<br />
isplata (y) 2.18 2.06 2.54 2.61 3.67 3.25 4.02 3.71 4.38 4.45<br />
87