Regresija Jednostruka linearna regresija
Regresija Jednostruka linearna regresija
Regresija Jednostruka linearna regresija
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Doc. dr. Snježana Pivac<br />
Poslovna statistika<br />
<strong>Regresija</strong><br />
Zadaća regresijske analize je da pronađe analitičko-matematički oblik veze između jedne<br />
ovisne ili regresand varijable i jedne ili više neovisnih ili regresorskih varijabli.<br />
Osim objašnjavanja prirode ovisnosti promatranih pojava na temelju tog analitičkog oblika može<br />
se vršiti predviđanje vrijednosti ovisne varijable pri određenim vrijednostima neovisne-ih varijabli.<br />
<strong>Jednostruka</strong> <strong>linearna</strong> <strong>regresija</strong><br />
U slučaju postojanja samo jedne ovisne ili regresand i samo jedne neovisne ili regresorske<br />
varijable kaže se da je to jednostavni, jednostruki ili jednodimenzionalni regresijski model, a<br />
regresijska analiza se može postaviti na slijedeći način:<br />
1. Potpuno, precizno i koncizno definiranje predmeta i ciljeva istraživanja, te postavljanje<br />
osnovnih pretpostavki.<br />
2. Crtanje dijagrama rasipanja, izbor modela i definiranje varijabli. Na primjer, aditivni<br />
model 1<br />
Y = f ( X ) + e ,<br />
gdje je: Y- ovisna ili regresand varijabla,<br />
X - neovisna ili regresorska varijabla,<br />
e - slučajna komponenta.<br />
Svaki model ima slučajnu komponentu e , koja upućuje da veze između pojava u praksi nisu<br />
funkcionalne, nego su statističke ili stohastičke, odnosno oko linije konkretnog aditivnog modela<br />
postoje pozitivna i/ili negativna odstupanja originalnih vrijednosti.<br />
U ovom koraku bitno je formirati statističko-dokumentacijsku osnovu iz primarnog (direktno)<br />
i/ili sekundarnog (literatura) izvora vodeći računa da promatrani podaci budu usporedivi i da njihova<br />
usporedba zadovoljava ekonomske kriterije.<br />
3. Odabir konkretnog regresijskog modela, njegova specifikacija i pretpostavke. (Na<br />
primjer, linearni model: Y β + X + e .)<br />
Slika 1.<br />
y<br />
= 0 β1<br />
x<br />
1 Modeli u praksi ne moraju biti aditivni: na primjer, multiplikativni model<br />
Y = f ( X ) ⋅ e ,<br />
gdje je: Y- ovisna ili regresand varijabla, X - neovisna ili regresorska varijabla , e - slučajna komponenta.<br />
1
Na slici 1. prikazan je dijagram rasipanja koji upućuje na postojanje pozitivne statističke veze<br />
između dviju varijabli X i Y. Povlačenjem linije pravca između točaka dijagrama rasipanja<br />
pretpostavlja se aditivna <strong>linearna</strong> veza među varijablama.<br />
4. Statistička analiza modela: ocjena parametara i pokazatelja reprezentativnosti modela.<br />
U ovoj fazi regresijske analize ocjenjuju se parametri konkretnog izabranog regresijskog<br />
modela, te se računaju odgovarajući pokazatelji reprezentativnosti modela, koji ukazuju na to da li<br />
model zadovoljava statističke kriterije.<br />
5. Testiranje hipoteza o modelu i statističko teorijskih pretpostavki.<br />
6a) DA - ako su ispunjene pretpostavke, vrši se sinteza rezultata i donose se sudovi o<br />
predmetu istraživanja.<br />
6b) NE -ako nisu ispunjene pretpostavke: vrši se modifikacija modela i vraća se na korak 2),<br />
tj. na izbor novog modela i definiranje varijabli.<br />
Dakle, regresijskom analizom traže se i ocjenjuju parametri funkcije koja na najbolji mogući način<br />
opisuje vezu između varijabli X i Y. Na temelju uzorka parova vrijednosti varijabli X i Y:<br />
( x 1 , y1<br />
),<br />
( x2,<br />
y2<br />
),...,<br />
( x n , y n ) crta se dijagram rasipanja, koji je prikazan na slici 2..<br />
Slika 2.<br />
y<br />
y i<br />
x i<br />
x<br />
Dijagram rasipanja pokazuje pozitivnu statističku vezu između pojava X i Y.<br />
Slika 3.<br />
y<br />
y i<br />
e i<br />
Yˆ<br />
=β ˆ + ˆ β1 X<br />
0<br />
x i<br />
x<br />
Ako se na dijagramu rasipanja povuče pravac, on je općenito oblika:<br />
Yˆ<br />
= ˆ β + ˆ β1 X<br />
0<br />
Svaka točka dijagrama rasipanja zadovoljava jednadžbu:<br />
Y ˆ β ˆ X + e ,<br />
i = 0 + β1<br />
i<br />
i<br />
odnosno svaka točka Y i odstupa od linije pravca za pozitivnu ili negativnu razliku e i .<br />
2
Regresijska analiza traži parametre ˆ β ˆ<br />
0 i β1<br />
, tako da pravac Yˆ prolazi između stvarnih točaka<br />
promatranih varijabli i da najbolje tumači vezu između njih, odnosno pravac mora biti takav da<br />
odstupanja e i budu najmanja.<br />
Postoji više različitih metoda za ocjenu ovih parametara, a najčešće korištena metoda je<br />
metoda najmanjih kvadrata, koja upravo procjenjuje parametre ˆ β ˆ<br />
0 i β1<br />
tako da odstupanja e i budu<br />
najmanja. 2 Ona daje najbolje linearne nepristrane ocjene (BLUE) i vrlo je često primjenjivana<br />
metoda za ocjenu parametara.<br />
Y = Y ˆ + e<br />
i<br />
i<br />
i<br />
Odstupanja originalnih vrijednosti od ocijenjenih vrijednosti e i mogu biti pozitivna i<br />
negativna. Stoga, da se ne bi međusobno poništile te pozitivne i negativne vrijednosti, ova metoda<br />
minimizira sumu kvadrata od e i .<br />
n<br />
2<br />
i<br />
i=<br />
1<br />
min ∑e<br />
n<br />
= min ∑(<br />
Y − Yˆ<br />
)<br />
i<br />
i=<br />
1<br />
2<br />
i<br />
n<br />
2<br />
[ Yi<br />
− ( ˆ β ˆ<br />
0 β1X<br />
i )]<br />
= min ∑ +<br />
i=<br />
1<br />
Dakle, traži se minimum kvadrata odstupanja empirijskih (stvarnih) u odnosu na regresijske<br />
vrijednosti.<br />
Nakon primjene matematičkog postupka traženja minimuma dobiju se dvije jednadžbe s dvije<br />
nepoznanice, tj. parametri regresijskog modela ˆ β ˆ<br />
0 i β1.<br />
n ⋅ ˆ β + ˆ β ⋅ ∑ X i = ∑Y<br />
0<br />
n<br />
ˆ β ⋅ ∑ X<br />
0<br />
i=<br />
1<br />
n<br />
1<br />
i=<br />
1<br />
i<br />
n<br />
1<br />
i=<br />
1<br />
+ ˆ β ⋅ ∑ X<br />
n<br />
i<br />
i=<br />
1<br />
2<br />
i<br />
n<br />
= ∑ X Y<br />
i=<br />
1<br />
i<br />
i<br />
∑ X iYi<br />
− nXY<br />
Navedeni sustav uvijek ima rješenja i vrijedi da je: ˆ i=<br />
1<br />
β i ˆ Y bˆ<br />
1 =<br />
β X<br />
n<br />
0 = − ,<br />
2 2<br />
∑ X − nX<br />
n<br />
n<br />
∑ X i ∑Yi<br />
i= 1 i=<br />
1<br />
gdje su: X = i Y = , jednostavne aritmetičke sredine varijabli X i Y.<br />
n n<br />
Konačno je ocijenjeni model: ˆ = ˆ β + ˆ β X ,<br />
Y 0 1<br />
gdje je ˆβ 0 konstantni član, tj. očekivana vrijednost zavisne varijable kada je nezavisna varijabla<br />
jednaka nuli: (<br />
ˆ0 β = Yˆ kada je X=0). Ovaj parametar interpretira se i kao odsječak na osi ordinata u<br />
kojoj regresijski pravac siječe tu os, uz pretpostavku da je apscisa te točke X=0.<br />
n<br />
i=<br />
1<br />
i<br />
2 Pri formiranju modela postavljaju se i pretpostavke slučajne greške e i (tzv. Gauss-Markovljevi uvjeti):<br />
I. E( e i ) = 0,<br />
∀i<br />
(očekivanje slučajne greške je nula za svaku opservaciju)<br />
II.<br />
2<br />
E(<br />
ei<br />
, e j ) = σ e < +∞ za i = j<br />
= const.<br />
(homoskedastičnost varijance reziduala, tj. pretpostavlja se da je varijanca<br />
reziduala konačna i čvrsta)<br />
III.<br />
E(<br />
ei<br />
, e j ) = 0, ∀i<br />
≠ j,<br />
tj.<br />
(greška je slučajna i nema korelacije između varijabli s pomakom od e i )<br />
Cov(<br />
ei<br />
, e j ) = 0, ∀i<br />
≠ j<br />
IV. E ( e i , X i ) = 0 (slučajna greška je distribuirana nezavisno od regresorske varijable X)<br />
2<br />
Vrijedi da je slučajna greška e distribuirana normalnom distribucijom: N (0, σ < ∞)<br />
.<br />
3
Regresijski koeficijent ˆβ 1 pokazuje prosječnu promjenu zavisne varijable kada<br />
nezavisna varijabla poraste za jedinicu. Ovaj parametar interpretira se i kao koeficijent smjera,<br />
odnosno nagiba regresijskog pravca koji može imati pozitivni i negativni predznak, ovisno o smjeru<br />
veze između promatranih varijabli.<br />
Može se postaviti i suprotna ovisnost u modelu, na način da je varijabla X sada ovisna ili<br />
regresorska varijabla: X α + Y + e<br />
= 0 α1<br />
i<br />
Ocjena parametara u ovom slučaju vrši se na jednak način kao kod početnog modela Ŷ , samo<br />
što je sada X ovisna varijabla, pa u izrazima za izračunavanje parametara, X i Y mijenjaju<br />
mjesta.<br />
n<br />
∑ X iYi<br />
− nXY<br />
i=<br />
1<br />
ˆ α i ˆ X dY ˆ<br />
1 =<br />
α<br />
n<br />
0 = − ,<br />
2 2<br />
∑Y<br />
− nY<br />
i<br />
i=<br />
1<br />
Nakon ocijene parametara regresijskog modela postavlja se pitanje reprezentativnosti,<br />
odnosno sposobnosti modela da objasni kretanje ovisne varijable Y uz pomoć odabrane neovisne<br />
varijable X.<br />
U tu svrhu koriste se neki apsolutni i relativni pokazatelji. Ovi pokazatelji temelje se na<br />
raspodjeli odstupanja vrijednosti ovisne varijable Y i u regresijskom modelu od njene aritmetičke<br />
sredine Y i njenih očekivanih vrijednosti Ŷ i .<br />
Slika 4.<br />
y<br />
Yˆ<br />
=β ˆ + ˆ β1X<br />
0<br />
y<br />
ST<br />
y i<br />
SR<br />
SP<br />
y<br />
x<br />
Na slici 4. prikazan je dijagram rasipanja varijabli X i Y sa ucrtanim ocijenjenim modelom<br />
pravca Ŷ . Na slici je označena i aritmetička sredina varijable Y . Pri formiranju suma odgovarajućih<br />
odstupanja, zbog već ranije navedenog razloga, da se ne bi međusobno poništile pozitivne i negativne<br />
razlike, računaju se njihovi kvadrati.<br />
n<br />
SP = ∑<br />
i=<br />
1<br />
2 n n<br />
2<br />
( Yˆ<br />
−Y<br />
) = ˆ β ⋅ ∑Y<br />
+ ˆ β ∑ X Y − n ⋅Y<br />
i<br />
0 i<br />
i=<br />
1<br />
1<br />
i=<br />
1<br />
i<br />
i<br />
Dakle, SP je suma kvadrata protumačenog dijela odstupanja vrijednosti varijable Y od<br />
aritmetičke sredine, odnosno suma kvadrata odstupanja ocijenjenih vrijednosti varijable Y od<br />
aritmetičke sredine.<br />
n<br />
SR = ∑<br />
i=<br />
1<br />
2 n<br />
n n<br />
( Y −Yˆ<br />
2<br />
) = ∑Y<br />
− ˆ β ⋅ ∑Y<br />
− ˆ β ∑<br />
i<br />
i<br />
i<br />
i=<br />
1<br />
0 i<br />
i=<br />
1<br />
1<br />
i=<br />
1<br />
X Y<br />
i<br />
i<br />
Dakle, SR je suma kvadrata neprotumačenog dijela odstupanja vrijednosti varijable Y od<br />
aritmetičke sredine, odnosno suma kvadrata odstupanja originalnih ili empirijskih vrijednosti<br />
varijable Y od ocijenjenih vrijednosti. Ova odstupanja su u stvari slučajne greške e i .<br />
n<br />
ST = ∑<br />
2 n<br />
2 2<br />
( Y − Y ) = ∑Y<br />
− n ⋅Y<br />
i<br />
i=<br />
1<br />
i<br />
i=<br />
1<br />
4
Dakle, ST je suma kvadrata ukupnih odstupanja vrijednosti varijable Y od aritmetičke<br />
sredine.<br />
Vrijedi da je: SP + SR = ST ,<br />
što se vidi i na slici 4. Navedeni izraz zove se jednadžba analize varijance i predstavlja temelj<br />
analize reprezentativnosti regresijskog modela.<br />
Standardna greška regresije je apsolutni pokazatelj reprezentativnosti regresijskog<br />
modela, a pokazuje prosječni stupanj varijacije stvarnih vrijednosti ovisne varijable u odnosu<br />
na očekivane regresijske vrijednosti.<br />
SR<br />
ˆ σ ˆ =<br />
Y n − 2<br />
Ovaj pokazatelj izražen je u originalnim jedinicama mjere ovisne varijable Y. Stoga je na<br />
temelju standardne greške regresije teško uspoređivati reprezentativnost modela s različitim mjernim<br />
jedinicama.<br />
Taj problem eliminira relativni pokazatelj koeficijent varijacije regresije, koji predstavlja<br />
postotak standardne greške regresije od aritmetičke sredine varijable Y.<br />
ˆ<br />
ˆ<br />
σ<br />
Yˆ<br />
V ˆ = ⋅100<br />
Y Y<br />
Najmanja vrijednost koeficijenta varijacije je 0%, a najveća nije definirana. Što je koeficijent<br />
varijacije regresijskog modela bliži nuli, to je model reprezentativniji. Često se uzima dogovorena<br />
granica reprezentativnosti od 10%. Dakle ako je koeficijent varijacije manji od 10% kaže se da je<br />
model dobar.<br />
Koeficijent determinacije je pokazatelj reprezentativnosti regresijskog modela, koji se<br />
temelji na analizi varijance. On se definira kao omjer sume kvadrata odstupanja protumačenih<br />
regresijom i sume kvadrata ukupnih odstupanja.<br />
2 SP<br />
r =<br />
ST<br />
Koeficijent determinacije kaže koliko % je sume kvadrata odstupanja vrijednosti<br />
varijable Y od aritmetičke sredine protumačeno regresijskim modelom.<br />
Vrijedi da je:<br />
r<br />
2<br />
= 1−<br />
SR<br />
ST<br />
.<br />
Vrijednost koeficijenta determinacije kreće se u intervalu 0 ≤ r<br />
2 ≤ 1 . Regresijski model je<br />
reprezentativniji ako je ovaj pokazatelj bliži 1. Teorijska granica reprezentativnosti modela je 0,9.<br />
U praksi je ponekad vrlo teško pronaći varijablu koja dobro objašnjava ovisnu pojavu, pa se ta granica<br />
reprezentativnosti spušta i do 0,6.<br />
Korigirani koeficijent determinacije:<br />
2 n −1<br />
2<br />
r = 1−<br />
⋅ (1 − r ) , je asimptotski nepristrana ocjena koeficijenta determinacije.<br />
n − ( k + 1)<br />
2<br />
Za jednostruku linearnu regresiju vrijedi da je koeficijent linearne korelacije: r = ± r ,<br />
gdje predznak od koeficijenta linearne korelacije odgovara predznaku parametara ocijenjenog<br />
jednostrukog linearnog modela: ˆα 1 i ˆ β 1 .<br />
Još vrijedi da je:<br />
r<br />
σ<br />
ˆ<br />
σ<br />
Y<br />
X<br />
= ˆ α1<br />
⋅ i r = β1<br />
⋅ , gdje su X i σ Y<br />
σ X<br />
σ Y<br />
σ standardne devijacije varijabli X i Y.<br />
5
Primjer<br />
Zadana je vrijednost proizvodnje u tekućim cijenama (u 000 kn) i broj zaposlenih (u tis.) na<br />
nekom području za nekoliko vremenskih razdoblja.<br />
a) Zadatak je ocijeniti parametre jednostrukog linearnog regresijskog modela, gdje je<br />
vrijednost proizvodnje ovisna ili regresand varijabla.<br />
Ocijenjeni model pravca potrebno je ucrtati na dijagram rasipanja.<br />
b) Zadatak je za ocijenjeni jednostruki linearni regresijski model, gdje je vrijednost<br />
proizvodnje ovisna ili regresand varijabla izračunati pokazatelje reprezentativnosti: standardnu<br />
grešku regresije, koeficijent varijacije regresije i koeficijent determinacije te komentirati<br />
dobivene rezultate.<br />
Vrijednost proizvodnje u tekućim cijenama (u 000 kn) i broj zaposlenih (u tis.) na nekom<br />
području za nekoliko vremenskih razdoblja<br />
Vrijednost<br />
proizvodnje<br />
y i<br />
n<br />
∑<br />
i=<br />
1<br />
Izvor: Podaci su simulirani<br />
Broj<br />
zaposlenih<br />
x i<br />
x i y<br />
2<br />
i<br />
x i<br />
i<br />
193 119 22967 14161 200,012851 37249<br />
210 125 26250 15625 216,092349 44100<br />
245 129 31605 16641 226,812014 60025<br />
249 136 33864 18496 245,571429 62001<br />
254 142 36068 20164 261,650926 64516<br />
272 146 39712 21316 272,370592 73984<br />
296 155 45880 24025 296,489839 87616<br />
1719<br />
Općenito je model kojeg treba ocijeniti:<br />
Yˆ<br />
= ˆ β + ˆ β1 X .<br />
0<br />
952 236346 130428 1719 429491<br />
Metodom najmanjih kvadrata model jednostavne linearne regresije s ocijenjenim parametrima<br />
metodom najmanjih kvadrata, gdje je "vrijednost proizvodnje" ovisna, a "broj zaposlenih" neovisna<br />
varijabla, je:<br />
Y ˆ = −118,897<br />
+ 2, 68X<br />
• Parametar<br />
ˆ0 β = −118, 897 predstavlja očekivanu vrijednost proizvodnje (Y ˆ)<br />
u slučaju da broj<br />
zaposlenih (X ) iznosi nula. Ovaj parametar nema uvijek ekonomski logično značenje.<br />
• Parametar<br />
ˆ1 β = 2, 68 pokazuje da u slučaju povećanja zaposlenih (X ) za jednu jedinicu (u<br />
ovom slučaju za 1000 zaposlenih) treba očekivati povećanje vrijednosti proizvodnje (Yˆ<br />
) u<br />
prosjeku za 2,68 jedinica, tj. 1000 kuna.<br />
Da bi se na grafikon dijagrama rasipanja ucrtao ocijenjeni model pravca dovoljno je odrediti 2<br />
točke za neke vrijednosti varijable X i kroz njih provući liniju pravca. U ovom primjeru u<br />
posljednjem stupcu tablice izračunate su sve točke pravca Ŷ za svaku pojedinačnu vrijednost varijable<br />
X.<br />
Yˆ<br />
= −118,897<br />
+ 2,679916 ⋅ x<br />
= −118,897<br />
+ 2,679916 ⋅119<br />
1 1<br />
=<br />
…………………<br />
Yˆ<br />
= −118,897<br />
+ 2,679916 ⋅ x<br />
= −118,897<br />
+ 2,679916 ⋅155<br />
7 7<br />
=<br />
Yˆ<br />
200,013 tis. kn<br />
296,490 tis. kn<br />
2<br />
y i<br />
6
Suma ovih očekivanih vrijednosti varijable Ŷ i jednaka je sumi originalnih vrijednosti varijable<br />
Y : ∑Y ˆ = ∑Y<br />
= 1719 tis. kn<br />
i<br />
n<br />
i<br />
i=<br />
1<br />
n<br />
i<br />
i=<br />
1<br />
Ove procijenjene vrijednosti Ŷ leže na regresijskom pravcu, koji je prikazan na slijedećem grafikonu.<br />
Točke dijagrama rasipanja leže oko ocijenjenog modela pravca. Metoda najmanjih kvadrata tražila je<br />
pravac tako da ova odstupanja originalnih vrijednosti Y i od ocijenjenih vrijednosti na pravcu Ŷ i budu<br />
najmanja.<br />
Grafikon<br />
Dijagram rasipanja vrijednosti proizvodnje u tekućim cijenama (u 000 kn) i broja zaposlenih (u<br />
tis.) na nekom području s ucrtanim ocijenjenim regresijskim pravcem<br />
Vrijednost proizvodnje (u 000 kn)<br />
350<br />
300<br />
250<br />
200<br />
150<br />
100<br />
100 120 140 160<br />
Broj zaposlenih (u 000)<br />
Izvor: Podaci su simulirani<br />
Nakon ocijene parametara regresijskog modela postavlja se pitanje reprezentativnosti,<br />
odnosno sposobnosti modela da objasni kretanje ovisne varijable Y uz pomoć odabrane neovisne<br />
varijable X.<br />
Standardna greška regresije je:<br />
SR 487,7687<br />
ˆ σ ˆ = =<br />
= 9,87693 tis. kn,<br />
Y n − 2 7 − 2<br />
gdje je SR suma kvadrata neprotumačenog dijela odstupanja vrijednosti varijable Y od aritmetičke<br />
sredine, a računa se na slijedeći način 3 :<br />
n<br />
i=<br />
1<br />
( Y Yˆ<br />
)<br />
SR = ∑ −<br />
i<br />
i<br />
2<br />
n<br />
2<br />
= ∑Y<br />
− ˆ β ⋅ ∑Y<br />
i<br />
i=<br />
1<br />
0<br />
= 487,7687<br />
n<br />
i<br />
i=<br />
1<br />
− ˆ β ⋅ ∑ X Y<br />
1<br />
n<br />
i=<br />
1<br />
i<br />
i<br />
= 429491 + 118,897 ⋅1719<br />
− 2,679916 ⋅ 236346 =<br />
Standardna greška regresije izražena je u originalnim jedinicama mjere ovisne varijable Y, tj. u tis. kn,<br />
i sama za sebe na govori o reprezentativnosti modela. U ovom slučaju kada su poznate stvarne<br />
vrijednosti varijable vrijednosti proizvodnje Y i , koje se kreću oko 200 jedinica tj. tis. kn, može se<br />
naslutiti da standardna greška regresijskog modela od 9,88 tis. kn nije velika.<br />
Precizniji zaključak o reprezentativnosti modela može se donijeti pomoću relativnog pokazatelja,<br />
odnosno pomoću koeficijenta varijacije regresije:<br />
3 n<br />
Isti rezultat se može dobiti i preko osnovnog oblika izraza: ( ) 2<br />
SR = ∑ Y − ˆ<br />
i Y i<br />
i=<br />
1<br />
7
ˆ<br />
ˆ<br />
σYˆ<br />
9,87693<br />
V ˆ = ⋅100<br />
= ⋅100<br />
= 4,02202%<br />
Y Y 245,5714<br />
n<br />
∑ y<br />
1<br />
1719<br />
gdje je: = = i<br />
i<br />
Y = = 245, 5714 .<br />
n 7<br />
Koeficijent varijacije ovog regresijskog modela je 4,02202%, što je manje od 10%, pa se može<br />
donijeti zaključak da je ovaj model prilično reprezentativan.<br />
Koeficijent determinacije je omjer sume kvadrata protumačenih i ukupnih odstupanja ovisne varijable<br />
od prosjeka u modelu:<br />
2 SP<br />
r = ST<br />
gdje je 4 :<br />
=<br />
6865,946<br />
= 0,93367<br />
7353,714<br />
( Y Y )<br />
n<br />
2 n<br />
n<br />
ˆ ˆ ˆ<br />
2<br />
2<br />
i = β 0 ⋅ ∑Yi<br />
+ β1<br />
⋅ ∑ X iYi<br />
− n ⋅Y<br />
= −118,897<br />
⋅1719<br />
+ 2,679916 ⋅ 236346 − 7 ⋅ 245,5714<br />
i=<br />
1<br />
i=<br />
1<br />
i=<br />
1<br />
SP = ∑ −<br />
n<br />
ST = ∑<br />
i=<br />
1<br />
= 6865,946<br />
2 n<br />
2 2<br />
2<br />
( Y − Y ) = ∑Y<br />
− n ⋅Y<br />
= 429491−<br />
7 ⋅ 245,5714 = 7353, 714<br />
i<br />
i<br />
i=<br />
1<br />
Koeficijent determinacije ovog modela je 0,93367 i veći je od dogovorene granice 0,9, što znači da<br />
je ovaj model reprezentativan. Ovim regresijskim modelom je protumačeno 93,367 % ukupnih<br />
odstupanja ovisne, regresand varijable od aritmetičke sredine.<br />
Dakle, pomoću sva 3 pokazatelja: standardne greške regresije, koeficijenta varijacije regresije i<br />
koeficijenta determinacije, donesen je jedinstven zaključak da je ocijenjeni regresijski model<br />
reprezentativan u objašnjavanju veze između promatranih pojava, tj. vrijednosti proizvodnje i broja<br />
zaposlenih na nekom području.<br />
=<br />
4 n<br />
Isti rezultat se može dobiti i preko osnovnih oblika izraza: ( ˆ ) 2<br />
n<br />
SP = Y i − Y i ( ) 2<br />
= Y i − Y<br />
∑<br />
i=<br />
1<br />
ST ∑ .<br />
i=<br />
1<br />
8