ISPITIVANJE ODNOSA MEĐU POJAVAMA Dijagram rasipanja
ISPITIVANJE ODNOSA MEĐU POJAVAMA Dijagram rasipanja
ISPITIVANJE ODNOSA MEĐU POJAVAMA Dijagram rasipanja
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
yi<br />
Doc. dr. Snježana Pivac<br />
Poslovna statistika<br />
<strong>ISPITIVANJE</strong> <strong>ODNOSA</strong> <strong>MEĐU</strong> <strong>POJAVAMA</strong><br />
<strong>Dijagram</strong> <strong>rasipanja</strong><br />
yi<br />
• Poslovna i makroekonomska statistika često, uz analizu kretanja jedne<br />
ekonomske pojave, imaju potrebu istražiti ovisnosti dviju ili više pojava,<br />
odnosno numeričkih nizova, zajedno.<br />
• Prvi korak:<br />
<strong>Dijagram</strong> <strong>rasipanja</strong> u pravokutno<br />
m koordinatnom sustavu točkama ( i , i ) y x prikazuje parove vrijednosti<br />
dviju promatranih numeričkih varijabli.<br />
xi<br />
(a) pozitivna funckionalna<br />
veza<br />
xi<br />
(a) negativna funckionalna<br />
veza<br />
yi<br />
yi<br />
(b) pozitivna statistička<br />
veza<br />
Veza između promatranih varijabli ne mora uvijek odgovarati jednadžbi<br />
pravca.<br />
xi<br />
(b) negativna statistička<br />
veza<br />
xi<br />
1
Primjer<br />
<strong>Dijagram</strong> <strong>rasipanja</strong> vrijednosti proizvodnje u tekućim cijenama (u 000 kn) i broj<br />
zaposlenih (u tis.) na nekom području za nekoliko vremenskih razdoblja<br />
Vrijednost proizvodnje (u 000 kn) yi<br />
yi<br />
(a) pozitivna funckionalna<br />
krivolinijska veza<br />
320<br />
300<br />
280<br />
260<br />
240<br />
220<br />
200<br />
180<br />
160<br />
140<br />
120<br />
100<br />
100 110 120 130 140 150 160<br />
Izvor: Podaci su simulirani<br />
yi<br />
xi<br />
yi<br />
(a) nema veze među pojavama<br />
Broj zaposlenih (u 000) xi<br />
• Raspored točaka dijagrama <strong>rasipanja</strong> upućuje na pozitivnu statističku vezu između<br />
vrijednosti proizvodnje i broja zaposlenih. Između točaka može se zamisliti linija<br />
pravca, ali sve točke ne leže na toj liniji već postoje pozitivna i/ili negativna<br />
xi<br />
(b) pozitivna statistička<br />
krivolinijska veza<br />
xi<br />
2
odstupanja. Dakle, u ovom slučaju, porast broja zaposlenih na promatranom području<br />
prati porast vrijednosti proizvodnje.<br />
Koeficijent linearne korelacije<br />
Pod pojmom korelacija podrazumijeva se međuzavisnost ili povezanost slučajnih<br />
varijabli.<br />
Po smjeru korelacija može biti:<br />
• pozitivna i<br />
• negativna.<br />
Pozitivna korelacija je prisutna kada rast vrijednosti jedne varijable prati rast<br />
vrijednosti druge promatrane varijable, odnosno kada pad jedne prati pad vrijednosti druge<br />
varijable.<br />
Negativna korelacija prisutna je kada rast jedne varijable prati pad druge varijable i<br />
obratno.<br />
Pearsonov koeficijent linearne korelacije (r) -najpoznatija mjera linearne korelacije<br />
između slučajnih varijabli:<br />
r =<br />
ili<br />
r<br />
n<br />
∑( X − X ) ⋅ ( Y −Y<br />
)<br />
i=<br />
1<br />
i<br />
n<br />
2<br />
n<br />
i<br />
i=<br />
1 i=<br />
1<br />
∑( X − X ) ⋅ ∑( Y −Y<br />
)<br />
n<br />
∑ X iYi<br />
− n ⋅ X ⋅Y<br />
i = =1 ,<br />
n ⋅σ<br />
⋅σ<br />
x<br />
y<br />
i<br />
i<br />
2<br />
,<br />
gdje su σ x i σ y jednostavne standardne devijacije promatranih varijabli:<br />
n<br />
2<br />
∑ xi<br />
i=<br />
1<br />
x =<br />
∑ yi<br />
2<br />
i=<br />
1 2<br />
σ − X i σ y = − Y .<br />
n<br />
n<br />
Kreće se u intervalu:<br />
−1 ≤ r ≤<br />
Ako je:<br />
1<br />
r = −1;<br />
r = 1 ⇒ funkcionalna negativna/pozitivna korelacija,<br />
−1 < r ≤ −0,<br />
8 ; 0 , 8 ≤ r < 1 ⇒ jaka negativna/pozitivna korelacija,<br />
n<br />
2<br />
− 0, 8 < r ≤ −0,<br />
5 ; 0 , 5 ≤ r < 0,<br />
8 ⇒ srednje jaka negativna/pozitivna korelacija,<br />
− 0 , 5 < r < 0 ; 0 < r < 0,<br />
5 ⇒ slaba negativna/pozitivna korelacija,<br />
r = 0 ⇒ nema korelacije.<br />
Primjer<br />
Iz osnovnog skupa od 1744 industrijskih poduzeća u Splitsko-dalmatinskoj županiji<br />
nakon odbacivanja podataka o poduzećima s 0 zaposlenih i negativnim poslovanjem, te<br />
"outliersa" po različitim financijskim pokazateljima, u analizi je ostao uzorak veličine 316<br />
poduzeća.<br />
3
Zadatak je izračunati linearnu korelaciju između odabranih varijabli za poduzeća u<br />
uzorku:<br />
• broja zaposlenih,<br />
• ukupnog prihoda,<br />
• neto dobiti i<br />
• vlastitog kapitala.<br />
Correlations<br />
Broj<br />
zaposlenih<br />
Ukupni<br />
prihodi<br />
Neto dobit<br />
Broj<br />
zaposlenih<br />
Ukupni<br />
prihodi<br />
Neto dobit Vlastiti<br />
kapital<br />
Pear. Corr. 1 .954** .868** .302**<br />
Sig. . .000 .000 .000<br />
N 316 316 316 316<br />
Pear. Corr. .954** 1 .959** .311**<br />
Sig. .000 . .000 .000<br />
N 316 316 316 316<br />
Pear. Corr. .868** .959** 1 .146**<br />
Sig. .000 .000 . .009<br />
N 316 316 316 316<br />
Vlastiti Pear. Corr. .302** .311** .146** 1<br />
kapital<br />
Sig. .000 .000 .009 .<br />
N 316 316 316 316<br />
** Correlation is significant at the 0.01 level (1%).<br />
Korelacija ranga<br />
• Ako se želi istražiti međuovisnost pojava koje su izražene<br />
modalitetima redoslijednog obilježja, odnosno ako su im modaliteti<br />
pridruženi na temelju ordinarne skale računa se korelacija ranga.<br />
• Spearmanov koeficijent korelacjie ranga (rS):<br />
N<br />
2<br />
6⋅<br />
∑ di<br />
i=<br />
1<br />
rS<br />
= 1 − , 3<br />
N − N<br />
gdje je:<br />
N - broj parova vrijednosti varijabli X i Y,<br />
di = r(<br />
xi<br />
) − r(<br />
yi<br />
) - razlika rangova vrijednosti varijabli X i Y.<br />
• Spearmanov koeficijent korelacije ranga može poprimiti vrijednosti u intervalu:<br />
−1 ≤ S ≤ 1 r<br />
• Kada ovaj koeficijent poprimi vrijednosti -1 i 1, riječ je o potpunoj korelaciji ranga<br />
među varijablama.<br />
4
• Vrijednost ovog koeficijenta 0 znači da nema nikakve korelacije ranga među<br />
pojavama.<br />
• Najčešće se vrijednost Spearmanovog koeficijenta kreće u rasponu −1 < r s < 1.<br />
Primjer<br />
Zadani su podaci za 12 studenata fakulteta "E" o bodovima na testu iz predmeta:<br />
Matematika i Statistika.<br />
Zadatak je izračunati Spearmanov koeficijent korelacije ranga uspjeha na<br />
testovima.<br />
Bodovi na testu iz Matematike i Statistike odabranih studenata fakulteta "E"<br />
Studenti<br />
Bodovi na testu<br />
iz Matematike<br />
(xi)<br />
Bodovi na<br />
testu iz<br />
Statistike (yi)<br />
Rang<br />
r(xi)<br />
Rang<br />
r(yi)<br />
Razlika<br />
rangova<br />
di<br />
2<br />
di<br />
A 50* 45* 6,5 5 1,5 2,25<br />
B 64 70 9 11 -2 4<br />
C 43 45* 5 5 0 0<br />
D 80 75 12 12 0 0<br />
E 21 38 2 2 0 0<br />
F 57 60 8 8 0 0<br />
G 50* 45* 6,5 5 1,5 2,25<br />
H 37 50 4 7 -3 9<br />
I 10 25 1 1 0 0<br />
J 75 68 11 10 1 1<br />
K 65 63 10 9 1 1<br />
L 35 40 3 3 0 0<br />
Ukupno: - - - 0 19,5<br />
Izvor: Podaci su simulirani.<br />
r<br />
S<br />
=<br />
N<br />
6 ⋅ ∑d<br />
i<br />
i=<br />
1 6 ⋅19,<br />
5<br />
− = 1−<br />
= 0,<br />
931818<br />
3<br />
N − N 12 −12<br />
1 3<br />
2<br />
Spearmanov koeficijent korelacije ranga je pozitivan i iznosi 0.93. Može se zaključiti da u<br />
ovom primjeru između uspjeha na testu iz Matematike i Statistike postoji visoka korelacija<br />
ranga. Odnosno, ako je student postigao dobar rezultat na testu iz Matematike, može se<br />
očekivati da će postići dobar rezultat i na testu iz Statistike i obrnuto.<br />
5