05.11.2014 Views

Regresija Jednostruka linearna regresija

Regresija Jednostruka linearna regresija

Regresija Jednostruka linearna regresija

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Doc. dr. Snježana Pivac<br />

Poslovna statistika<br />

<strong>Regresija</strong><br />

Zadaća regresijske analize je da pronađe analitičko-matematički oblik veze između jedne<br />

ovisne ili regresand varijable i jedne ili više neovisnih ili regresorskih varijabli.<br />

Osim objašnjavanja prirode ovisnosti promatranih pojava na temelju tog analitičkog oblika može<br />

se vršiti predviđanje vrijednosti ovisne varijable pri određenim vrijednostima neovisne-ih varijabli.<br />

<strong>Jednostruka</strong> <strong>linearna</strong> <strong>regresija</strong><br />

U slučaju postojanja samo jedne ovisne ili regresand i samo jedne neovisne ili regresorske<br />

varijable kaže se da je to jednostavni, jednostruki ili jednodimenzionalni regresijski model, a<br />

regresijska analiza se može postaviti na slijedeći način:<br />

1. Potpuno, precizno i koncizno definiranje predmeta i ciljeva istraživanja, te postavljanje<br />

osnovnih pretpostavki.<br />

2. Crtanje dijagrama rasipanja, izbor modela i definiranje varijabli. Na primjer, aditivni<br />

model 1<br />

Y = f ( X ) + e ,<br />

gdje je: Y- ovisna ili regresand varijabla,<br />

X - neovisna ili regresorska varijabla,<br />

e - slučajna komponenta.<br />

Svaki model ima slučajnu komponentu e , koja upućuje da veze između pojava u praksi nisu<br />

funkcionalne, nego su statističke ili stohastičke, odnosno oko linije konkretnog aditivnog modela<br />

postoje pozitivna i/ili negativna odstupanja originalnih vrijednosti.<br />

U ovom koraku bitno je formirati statističko-dokumentacijsku osnovu iz primarnog (direktno)<br />

i/ili sekundarnog (literatura) izvora vodeći računa da promatrani podaci budu usporedivi i da njihova<br />

usporedba zadovoljava ekonomske kriterije.<br />

3. Odabir konkretnog regresijskog modela, njegova specifikacija i pretpostavke. (Na<br />

primjer, linearni model: Y β + X + e .)<br />

Slika 1.<br />

y<br />

= 0 β1<br />

x<br />

1 Modeli u praksi ne moraju biti aditivni: na primjer, multiplikativni model<br />

Y = f ( X ) ⋅ e ,<br />

gdje je: Y- ovisna ili regresand varijabla, X - neovisna ili regresorska varijabla , e - slučajna komponenta.<br />

1


Na slici 1. prikazan je dijagram rasipanja koji upućuje na postojanje pozitivne statističke veze<br />

između dviju varijabli X i Y. Povlačenjem linije pravca između točaka dijagrama rasipanja<br />

pretpostavlja se aditivna <strong>linearna</strong> veza među varijablama.<br />

4. Statistička analiza modela: ocjena parametara i pokazatelja reprezentativnosti modela.<br />

U ovoj fazi regresijske analize ocjenjuju se parametri konkretnog izabranog regresijskog<br />

modela, te se računaju odgovarajući pokazatelji reprezentativnosti modela, koji ukazuju na to da li<br />

model zadovoljava statističke kriterije.<br />

5. Testiranje hipoteza o modelu i statističko teorijskih pretpostavki.<br />

6a) DA - ako su ispunjene pretpostavke, vrši se sinteza rezultata i donose se sudovi o<br />

predmetu istraživanja.<br />

6b) NE -ako nisu ispunjene pretpostavke: vrši se modifikacija modela i vraća se na korak 2),<br />

tj. na izbor novog modela i definiranje varijabli.<br />

Dakle, regresijskom analizom traže se i ocjenjuju parametri funkcije koja na najbolji mogući način<br />

opisuje vezu između varijabli X i Y. Na temelju uzorka parova vrijednosti varijabli X i Y:<br />

( x 1 , y1<br />

),<br />

( x2,<br />

y2<br />

),...,<br />

( x n , y n ) crta se dijagram rasipanja, koji je prikazan na slici 2..<br />

Slika 2.<br />

y<br />

y i<br />

x i<br />

x<br />

Dijagram rasipanja pokazuje pozitivnu statističku vezu između pojava X i Y.<br />

Slika 3.<br />

y<br />

y i<br />

e i<br />

Yˆ<br />

=β ˆ + ˆ β1 X<br />

0<br />

x i<br />

x<br />

Ako se na dijagramu rasipanja povuče pravac, on je općenito oblika:<br />

Yˆ<br />

= ˆ β + ˆ β1 X<br />

0<br />

Svaka točka dijagrama rasipanja zadovoljava jednadžbu:<br />

Y ˆ β ˆ X + e ,<br />

i = 0 + β1<br />

i<br />

i<br />

odnosno svaka točka Y i odstupa od linije pravca za pozitivnu ili negativnu razliku e i .<br />

2


Regresijska analiza traži parametre ˆ β ˆ<br />

0 i β1<br />

, tako da pravac Yˆ prolazi između stvarnih točaka<br />

promatranih varijabli i da najbolje tumači vezu između njih, odnosno pravac mora biti takav da<br />

odstupanja e i budu najmanja.<br />

Postoji više različitih metoda za ocjenu ovih parametara, a najčešće korištena metoda je<br />

metoda najmanjih kvadrata, koja upravo procjenjuje parametre ˆ β ˆ<br />

0 i β1<br />

tako da odstupanja e i budu<br />

najmanja. 2 Ona daje najbolje linearne nepristrane ocjene (BLUE) i vrlo je često primjenjivana<br />

metoda za ocjenu parametara.<br />

Y = Y ˆ + e<br />

i<br />

i<br />

i<br />

Odstupanja originalnih vrijednosti od ocijenjenih vrijednosti e i mogu biti pozitivna i<br />

negativna. Stoga, da se ne bi međusobno poništile te pozitivne i negativne vrijednosti, ova metoda<br />

minimizira sumu kvadrata od e i .<br />

n<br />

2<br />

i<br />

i=<br />

1<br />

min ∑e<br />

n<br />

= min ∑(<br />

Y − Yˆ<br />

)<br />

i<br />

i=<br />

1<br />

2<br />

i<br />

n<br />

2<br />

[ Yi<br />

− ( ˆ β ˆ<br />

0 β1X<br />

i )]<br />

= min ∑ +<br />

i=<br />

1<br />

Dakle, traži se minimum kvadrata odstupanja empirijskih (stvarnih) u odnosu na regresijske<br />

vrijednosti.<br />

Nakon primjene matematičkog postupka traženja minimuma dobiju se dvije jednadžbe s dvije<br />

nepoznanice, tj. parametri regresijskog modela ˆ β ˆ<br />

0 i β1.<br />

n ⋅ ˆ β + ˆ β ⋅ ∑ X i = ∑Y<br />

0<br />

n<br />

ˆ β ⋅ ∑ X<br />

0<br />

i=<br />

1<br />

n<br />

1<br />

i=<br />

1<br />

i<br />

n<br />

1<br />

i=<br />

1<br />

+ ˆ β ⋅ ∑ X<br />

n<br />

i<br />

i=<br />

1<br />

2<br />

i<br />

n<br />

= ∑ X Y<br />

i=<br />

1<br />

i<br />

i<br />

∑ X iYi<br />

− nXY<br />

Navedeni sustav uvijek ima rješenja i vrijedi da je: ˆ i=<br />

1<br />

β i ˆ Y bˆ<br />

1 =<br />

β X<br />

n<br />

0 = − ,<br />

2 2<br />

∑ X − nX<br />

n<br />

n<br />

∑ X i ∑Yi<br />

i= 1 i=<br />

1<br />

gdje su: X = i Y = , jednostavne aritmetičke sredine varijabli X i Y.<br />

n n<br />

Konačno je ocijenjeni model: ˆ = ˆ β + ˆ β X ,<br />

Y 0 1<br />

gdje je ˆβ 0 konstantni član, tj. očekivana vrijednost zavisne varijable kada je nezavisna varijabla<br />

jednaka nuli: (<br />

ˆ0 β = Yˆ kada je X=0). Ovaj parametar interpretira se i kao odsječak na osi ordinata u<br />

kojoj regresijski pravac siječe tu os, uz pretpostavku da je apscisa te točke X=0.<br />

n<br />

i=<br />

1<br />

i<br />

2 Pri formiranju modela postavljaju se i pretpostavke slučajne greške e i (tzv. Gauss-Markovljevi uvjeti):<br />

I. E( e i ) = 0,<br />

∀i<br />

(očekivanje slučajne greške je nula za svaku opservaciju)<br />

II.<br />

2<br />

E(<br />

ei<br />

, e j ) = σ e < +∞ za i = j<br />

= const.<br />

(homoskedastičnost varijance reziduala, tj. pretpostavlja se da je varijanca<br />

reziduala konačna i čvrsta)<br />

III.<br />

E(<br />

ei<br />

, e j ) = 0, ∀i<br />

≠ j,<br />

tj.<br />

(greška je slučajna i nema korelacije između varijabli s pomakom od e i )<br />

Cov(<br />

ei<br />

, e j ) = 0, ∀i<br />

≠ j<br />

IV. E ( e i , X i ) = 0 (slučajna greška je distribuirana nezavisno od regresorske varijable X)<br />

2<br />

Vrijedi da je slučajna greška e distribuirana normalnom distribucijom: N (0, σ < ∞)<br />

.<br />

3


Regresijski koeficijent ˆβ 1 pokazuje prosječnu promjenu zavisne varijable kada<br />

nezavisna varijabla poraste za jedinicu. Ovaj parametar interpretira se i kao koeficijent smjera,<br />

odnosno nagiba regresijskog pravca koji može imati pozitivni i negativni predznak, ovisno o smjeru<br />

veze između promatranih varijabli.<br />

Može se postaviti i suprotna ovisnost u modelu, na način da je varijabla X sada ovisna ili<br />

regresorska varijabla: X α + Y + e<br />

= 0 α1<br />

i<br />

Ocjena parametara u ovom slučaju vrši se na jednak način kao kod početnog modela Ŷ , samo<br />

što je sada X ovisna varijabla, pa u izrazima za izračunavanje parametara, X i Y mijenjaju<br />

mjesta.<br />

n<br />

∑ X iYi<br />

− nXY<br />

i=<br />

1<br />

ˆ α i ˆ X dY ˆ<br />

1 =<br />

α<br />

n<br />

0 = − ,<br />

2 2<br />

∑Y<br />

− nY<br />

i<br />

i=<br />

1<br />

Nakon ocijene parametara regresijskog modela postavlja se pitanje reprezentativnosti,<br />

odnosno sposobnosti modela da objasni kretanje ovisne varijable Y uz pomoć odabrane neovisne<br />

varijable X.<br />

U tu svrhu koriste se neki apsolutni i relativni pokazatelji. Ovi pokazatelji temelje se na<br />

raspodjeli odstupanja vrijednosti ovisne varijable Y i u regresijskom modelu od njene aritmetičke<br />

sredine Y i njenih očekivanih vrijednosti Ŷ i .<br />

Slika 4.<br />

y<br />

Yˆ<br />

=β ˆ + ˆ β1X<br />

0<br />

y<br />

ST<br />

y i<br />

SR<br />

SP<br />

y<br />

x<br />

Na slici 4. prikazan je dijagram rasipanja varijabli X i Y sa ucrtanim ocijenjenim modelom<br />

pravca Ŷ . Na slici je označena i aritmetička sredina varijable Y . Pri formiranju suma odgovarajućih<br />

odstupanja, zbog već ranije navedenog razloga, da se ne bi međusobno poništile pozitivne i negativne<br />

razlike, računaju se njihovi kvadrati.<br />

n<br />

SP = ∑<br />

i=<br />

1<br />

2 n n<br />

2<br />

( Yˆ<br />

−Y<br />

) = ˆ β ⋅ ∑Y<br />

+ ˆ β ∑ X Y − n ⋅Y<br />

i<br />

0 i<br />

i=<br />

1<br />

1<br />

i=<br />

1<br />

i<br />

i<br />

Dakle, SP je suma kvadrata protumačenog dijela odstupanja vrijednosti varijable Y od<br />

aritmetičke sredine, odnosno suma kvadrata odstupanja ocijenjenih vrijednosti varijable Y od<br />

aritmetičke sredine.<br />

n<br />

SR = ∑<br />

i=<br />

1<br />

2 n<br />

n n<br />

( Y −Yˆ<br />

2<br />

) = ∑Y<br />

− ˆ β ⋅ ∑Y<br />

− ˆ β ∑<br />

i<br />

i<br />

i<br />

i=<br />

1<br />

0 i<br />

i=<br />

1<br />

1<br />

i=<br />

1<br />

X Y<br />

i<br />

i<br />

Dakle, SR je suma kvadrata neprotumačenog dijela odstupanja vrijednosti varijable Y od<br />

aritmetičke sredine, odnosno suma kvadrata odstupanja originalnih ili empirijskih vrijednosti<br />

varijable Y od ocijenjenih vrijednosti. Ova odstupanja su u stvari slučajne greške e i .<br />

n<br />

ST = ∑<br />

2 n<br />

2 2<br />

( Y − Y ) = ∑Y<br />

− n ⋅Y<br />

i<br />

i=<br />

1<br />

i<br />

i=<br />

1<br />

4


Dakle, ST je suma kvadrata ukupnih odstupanja vrijednosti varijable Y od aritmetičke<br />

sredine.<br />

Vrijedi da je: SP + SR = ST ,<br />

što se vidi i na slici 4. Navedeni izraz zove se jednadžba analize varijance i predstavlja temelj<br />

analize reprezentativnosti regresijskog modela.<br />

Standardna greška regresije je apsolutni pokazatelj reprezentativnosti regresijskog<br />

modela, a pokazuje prosječni stupanj varijacije stvarnih vrijednosti ovisne varijable u odnosu<br />

na očekivane regresijske vrijednosti.<br />

SR<br />

ˆ σ ˆ =<br />

Y n − 2<br />

Ovaj pokazatelj izražen je u originalnim jedinicama mjere ovisne varijable Y. Stoga je na<br />

temelju standardne greške regresije teško uspoređivati reprezentativnost modela s različitim mjernim<br />

jedinicama.<br />

Taj problem eliminira relativni pokazatelj koeficijent varijacije regresije, koji predstavlja<br />

postotak standardne greške regresije od aritmetičke sredine varijable Y.<br />

ˆ<br />

ˆ<br />

σ<br />

Yˆ<br />

V ˆ = ⋅100<br />

Y Y<br />

Najmanja vrijednost koeficijenta varijacije je 0%, a najveća nije definirana. Što je koeficijent<br />

varijacije regresijskog modela bliži nuli, to je model reprezentativniji. Često se uzima dogovorena<br />

granica reprezentativnosti od 10%. Dakle ako je koeficijent varijacije manji od 10% kaže se da je<br />

model dobar.<br />

Koeficijent determinacije je pokazatelj reprezentativnosti regresijskog modela, koji se<br />

temelji na analizi varijance. On se definira kao omjer sume kvadrata odstupanja protumačenih<br />

regresijom i sume kvadrata ukupnih odstupanja.<br />

2 SP<br />

r =<br />

ST<br />

Koeficijent determinacije kaže koliko % je sume kvadrata odstupanja vrijednosti<br />

varijable Y od aritmetičke sredine protumačeno regresijskim modelom.<br />

Vrijedi da je:<br />

r<br />

2<br />

= 1−<br />

SR<br />

ST<br />

.<br />

Vrijednost koeficijenta determinacije kreće se u intervalu 0 ≤ r<br />

2 ≤ 1 . Regresijski model je<br />

reprezentativniji ako je ovaj pokazatelj bliži 1. Teorijska granica reprezentativnosti modela je 0,9.<br />

U praksi je ponekad vrlo teško pronaći varijablu koja dobro objašnjava ovisnu pojavu, pa se ta granica<br />

reprezentativnosti spušta i do 0,6.<br />

Korigirani koeficijent determinacije:<br />

2 n −1<br />

2<br />

r = 1−<br />

⋅ (1 − r ) , je asimptotski nepristrana ocjena koeficijenta determinacije.<br />

n − ( k + 1)<br />

2<br />

Za jednostruku linearnu regresiju vrijedi da je koeficijent linearne korelacije: r = ± r ,<br />

gdje predznak od koeficijenta linearne korelacije odgovara predznaku parametara ocijenjenog<br />

jednostrukog linearnog modela: ˆα 1 i ˆ β 1 .<br />

Još vrijedi da je:<br />

r<br />

σ<br />

ˆ<br />

σ<br />

Y<br />

X<br />

= ˆ α1<br />

⋅ i r = β1<br />

⋅ , gdje su X i σ Y<br />

σ X<br />

σ Y<br />

σ standardne devijacije varijabli X i Y.<br />

5


Primjer<br />

Zadana je vrijednost proizvodnje u tekućim cijenama (u 000 kn) i broj zaposlenih (u tis.) na<br />

nekom području za nekoliko vremenskih razdoblja.<br />

a) Zadatak je ocijeniti parametre jednostrukog linearnog regresijskog modela, gdje je<br />

vrijednost proizvodnje ovisna ili regresand varijabla.<br />

Ocijenjeni model pravca potrebno je ucrtati na dijagram rasipanja.<br />

b) Zadatak je za ocijenjeni jednostruki linearni regresijski model, gdje je vrijednost<br />

proizvodnje ovisna ili regresand varijabla izračunati pokazatelje reprezentativnosti: standardnu<br />

grešku regresije, koeficijent varijacije regresije i koeficijent determinacije te komentirati<br />

dobivene rezultate.<br />

Vrijednost proizvodnje u tekućim cijenama (u 000 kn) i broj zaposlenih (u tis.) na nekom<br />

području za nekoliko vremenskih razdoblja<br />

Vrijednost<br />

proizvodnje<br />

y i<br />

n<br />

∑<br />

i=<br />

1<br />

Izvor: Podaci su simulirani<br />

Broj<br />

zaposlenih<br />

x i<br />

x i y<br />

2<br />

i<br />

x i<br />

i<br />

193 119 22967 14161 200,012851 37249<br />

210 125 26250 15625 216,092349 44100<br />

245 129 31605 16641 226,812014 60025<br />

249 136 33864 18496 245,571429 62001<br />

254 142 36068 20164 261,650926 64516<br />

272 146 39712 21316 272,370592 73984<br />

296 155 45880 24025 296,489839 87616<br />

1719<br />

Općenito je model kojeg treba ocijeniti:<br />

Yˆ<br />

= ˆ β + ˆ β1 X .<br />

0<br />

952 236346 130428 1719 429491<br />

Metodom najmanjih kvadrata model jednostavne linearne regresije s ocijenjenim parametrima<br />

metodom najmanjih kvadrata, gdje je "vrijednost proizvodnje" ovisna, a "broj zaposlenih" neovisna<br />

varijabla, je:<br />

Y ˆ = −118,897<br />

+ 2, 68X<br />

• Parametar<br />

ˆ0 β = −118, 897 predstavlja očekivanu vrijednost proizvodnje (Y ˆ)<br />

u slučaju da broj<br />

zaposlenih (X ) iznosi nula. Ovaj parametar nema uvijek ekonomski logično značenje.<br />

• Parametar<br />

ˆ1 β = 2, 68 pokazuje da u slučaju povećanja zaposlenih (X ) za jednu jedinicu (u<br />

ovom slučaju za 1000 zaposlenih) treba očekivati povećanje vrijednosti proizvodnje (Yˆ<br />

) u<br />

prosjeku za 2,68 jedinica, tj. 1000 kuna.<br />

Da bi se na grafikon dijagrama rasipanja ucrtao ocijenjeni model pravca dovoljno je odrediti 2<br />

točke za neke vrijednosti varijable X i kroz njih provući liniju pravca. U ovom primjeru u<br />

posljednjem stupcu tablice izračunate su sve točke pravca Ŷ za svaku pojedinačnu vrijednost varijable<br />

X.<br />

Yˆ<br />

= −118,897<br />

+ 2,679916 ⋅ x<br />

= −118,897<br />

+ 2,679916 ⋅119<br />

1 1<br />

=<br />

…………………<br />

Yˆ<br />

= −118,897<br />

+ 2,679916 ⋅ x<br />

= −118,897<br />

+ 2,679916 ⋅155<br />

7 7<br />

=<br />

Yˆ<br />

200,013 tis. kn<br />

296,490 tis. kn<br />

2<br />

y i<br />

6


Suma ovih očekivanih vrijednosti varijable Ŷ i jednaka je sumi originalnih vrijednosti varijable<br />

Y : ∑Y ˆ = ∑Y<br />

= 1719 tis. kn<br />

i<br />

n<br />

i<br />

i=<br />

1<br />

n<br />

i<br />

i=<br />

1<br />

Ove procijenjene vrijednosti Ŷ leže na regresijskom pravcu, koji je prikazan na slijedećem grafikonu.<br />

Točke dijagrama rasipanja leže oko ocijenjenog modela pravca. Metoda najmanjih kvadrata tražila je<br />

pravac tako da ova odstupanja originalnih vrijednosti Y i od ocijenjenih vrijednosti na pravcu Ŷ i budu<br />

najmanja.<br />

Grafikon<br />

Dijagram rasipanja vrijednosti proizvodnje u tekućim cijenama (u 000 kn) i broja zaposlenih (u<br />

tis.) na nekom području s ucrtanim ocijenjenim regresijskim pravcem<br />

Vrijednost proizvodnje (u 000 kn)<br />

350<br />

300<br />

250<br />

200<br />

150<br />

100<br />

100 120 140 160<br />

Broj zaposlenih (u 000)<br />

Izvor: Podaci su simulirani<br />

Nakon ocijene parametara regresijskog modela postavlja se pitanje reprezentativnosti,<br />

odnosno sposobnosti modela da objasni kretanje ovisne varijable Y uz pomoć odabrane neovisne<br />

varijable X.<br />

Standardna greška regresije je:<br />

SR 487,7687<br />

ˆ σ ˆ = =<br />

= 9,87693 tis. kn,<br />

Y n − 2 7 − 2<br />

gdje je SR suma kvadrata neprotumačenog dijela odstupanja vrijednosti varijable Y od aritmetičke<br />

sredine, a računa se na slijedeći način 3 :<br />

n<br />

i=<br />

1<br />

( Y Yˆ<br />

)<br />

SR = ∑ −<br />

i<br />

i<br />

2<br />

n<br />

2<br />

= ∑Y<br />

− ˆ β ⋅ ∑Y<br />

i<br />

i=<br />

1<br />

0<br />

= 487,7687<br />

n<br />

i<br />

i=<br />

1<br />

− ˆ β ⋅ ∑ X Y<br />

1<br />

n<br />

i=<br />

1<br />

i<br />

i<br />

= 429491 + 118,897 ⋅1719<br />

− 2,679916 ⋅ 236346 =<br />

Standardna greška regresije izražena je u originalnim jedinicama mjere ovisne varijable Y, tj. u tis. kn,<br />

i sama za sebe na govori o reprezentativnosti modela. U ovom slučaju kada su poznate stvarne<br />

vrijednosti varijable vrijednosti proizvodnje Y i , koje se kreću oko 200 jedinica tj. tis. kn, može se<br />

naslutiti da standardna greška regresijskog modela od 9,88 tis. kn nije velika.<br />

Precizniji zaključak o reprezentativnosti modela može se donijeti pomoću relativnog pokazatelja,<br />

odnosno pomoću koeficijenta varijacije regresije:<br />

3 n<br />

Isti rezultat se može dobiti i preko osnovnog oblika izraza: ( ) 2<br />

SR = ∑ Y − ˆ<br />

i Y i<br />

i=<br />

1<br />

7


ˆ<br />

ˆ<br />

σYˆ<br />

9,87693<br />

V ˆ = ⋅100<br />

= ⋅100<br />

= 4,02202%<br />

Y Y 245,5714<br />

n<br />

∑ y<br />

1<br />

1719<br />

gdje je: = = i<br />

i<br />

Y = = 245, 5714 .<br />

n 7<br />

Koeficijent varijacije ovog regresijskog modela je 4,02202%, što je manje od 10%, pa se može<br />

donijeti zaključak da je ovaj model prilično reprezentativan.<br />

Koeficijent determinacije je omjer sume kvadrata protumačenih i ukupnih odstupanja ovisne varijable<br />

od prosjeka u modelu:<br />

2 SP<br />

r = ST<br />

gdje je 4 :<br />

=<br />

6865,946<br />

= 0,93367<br />

7353,714<br />

( Y Y )<br />

n<br />

2 n<br />

n<br />

ˆ ˆ ˆ<br />

2<br />

2<br />

i = β 0 ⋅ ∑Yi<br />

+ β1<br />

⋅ ∑ X iYi<br />

− n ⋅Y<br />

= −118,897<br />

⋅1719<br />

+ 2,679916 ⋅ 236346 − 7 ⋅ 245,5714<br />

i=<br />

1<br />

i=<br />

1<br />

i=<br />

1<br />

SP = ∑ −<br />

n<br />

ST = ∑<br />

i=<br />

1<br />

= 6865,946<br />

2 n<br />

2 2<br />

2<br />

( Y − Y ) = ∑Y<br />

− n ⋅Y<br />

= 429491−<br />

7 ⋅ 245,5714 = 7353, 714<br />

i<br />

i<br />

i=<br />

1<br />

Koeficijent determinacije ovog modela je 0,93367 i veći je od dogovorene granice 0,9, što znači da<br />

je ovaj model reprezentativan. Ovim regresijskim modelom je protumačeno 93,367 % ukupnih<br />

odstupanja ovisne, regresand varijable od aritmetičke sredine.<br />

Dakle, pomoću sva 3 pokazatelja: standardne greške regresije, koeficijenta varijacije regresije i<br />

koeficijenta determinacije, donesen je jedinstven zaključak da je ocijenjeni regresijski model<br />

reprezentativan u objašnjavanju veze između promatranih pojava, tj. vrijednosti proizvodnje i broja<br />

zaposlenih na nekom području.<br />

=<br />

4 n<br />

Isti rezultat se može dobiti i preko osnovnih oblika izraza: ( ˆ ) 2<br />

n<br />

SP = Y i − Y i ( ) 2<br />

= Y i − Y<br />

∑<br />

i=<br />

1<br />

ST ∑ .<br />

i=<br />

1<br />

8

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!