KORELACIJA I REGRESIJA
KORELACIJA I REGRESIJA
KORELACIJA I REGRESIJA
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>KORELACIJA</strong> <br />
I <strong>REGRESIJA</strong> <br />
PP… 2012
OSNOVNI POJMOVI <br />
<strong>KORELACIJA</strong> <br />
uzajamna povezanost među pojavama (varijablama, <br />
obeležjima, faktorima) (eng. correla,on) <br />
VRSTE <strong>KORELACIJA</strong> <br />
jednostruka, višestruka <br />
linearna, nelinearna <br />
poziOvna, negaOvna <br />
MERENJE JAČINE POVEZANOSTI <br />
koeficijent korelacije r (na uzorku), odn. ρ (na populaciji) <br />
koeficijent determinacije r 2 (odn.) R 2
PRIKAZ RASPROSTIRANJA PODATAKA <br />
grafički prikaz <br />
• između promenljivih x i y <br />
nema povezanosO <br />
• poziOvna povezanost <br />
porast promenljive x → <br />
porast promenljive y <br />
• negaOvna povezanost <br />
porast promenljive x → <br />
smanjenje promenljive y
<strong>REGRESIJA</strong> <br />
izračunavanje matemaOčkog modela povezanosO <br />
(uOcaja) promenljive x (uzroka) i promenljive y <br />
(posledice): y = f(x) <br />
oblici regresije – linearna, nelinearna
VIŠESTRUKA LINEARNA <strong>REGRESIJA</strong> <br />
x 1 , x 2 , ... , x k – nezavisno promenljive (uzroci) <br />
y – zavisno promenljiva (posledica)
UTVRĐIVANJE KORELACIJE <br />
koeficijent korelacije (linearne): <br />
r = s xy<br />
⎧<br />
r = znak + / - → vrsta veze direktna/obrnuta<br />
⎨<br />
⎩ vrednost iz [0,1] → jacina korelacije<br />
€<br />
s xy =<br />
s 2 x =<br />
s 2 y =<br />
n<br />
∑<br />
i=1<br />
n<br />
∑<br />
i=1<br />
n<br />
i=1<br />
n<br />
∑<br />
n<br />
s x s y<br />
x i y i<br />
− x y →<br />
n €<br />
x i<br />
2<br />
y i<br />
2<br />
kovarijansa izmedju x i y<br />
− x 2 → varijansa promenljive x<br />
− y 2 → varijansa promenljive y<br />
n → broj parova podataka (x i ,y i ), i =1,2,...,n
MS Excel =CORREL(raspon podataka X, raspon podataka Y)<br />
x i y i<br />
6 2<br />
10 5<br />
10 7<br />
18 11<br />
20 17<br />
20 12
ZNAČENJE KOEF. KORELACIJE<br />
značenje koeficijenta korelacije uzorka (r) : <br />
r predstavlja nepristrasnu procenu koeficijenta <br />
korelacije osnovnog skupa, tj. populacije (ρ)<br />
ρ =<br />
[kovarijansa (x,y) na populaciji]<br />
[st. dev. x na populaciji]⋅[st. dev. y na populaciji] = σ xy<br />
σ x σ y
KOEFICIJENT DETERMINACIJE <br />
r 2 =<br />
n<br />
∑<br />
i=1<br />
n<br />
∑<br />
i=1<br />
( y ˆ i<br />
− y )<br />
( y i<br />
− y )<br />
suma kvadrata odstupanja<br />
objašnjena regresionom funkcijom<br />
suma kvadrata odstupanja<br />
podataka od aritmetičke sredine<br />
€<br />
r 2 (izmedju 0 i 1) utvrđuje koliko je promene zavisno<br />
promenljive objašnjeno promenom nezavisno promenljive<br />
Primer:<br />
Ako je koeficijent korelacije 0.9, tada je koeficijent determinacije 0.81<br />
što znači da je 81% promene zavisno promenljive objašnjeno<br />
promenom nezavisno promenljive
REGRESIONA JEDNAČINA <br />
Jednačina LINEARNE regresije: <br />
ˆ y = ax + b<br />
KoeficijenO a i b određuju se iz uslova: <br />
a (koeficijent smera pravca) <br />
b (odsečak na y osi) <br />
€<br />
a = s xy<br />
s x<br />
2<br />
b = y − ax
a = 0,84<br />
b = −2,72<br />
x i y i<br />
6 2<br />
10 5<br />
€<br />
ˆ y = ax + b<br />
10 7<br />
18 11<br />
20 17<br />
20 12<br />
€
Nakon unešene formule,<br />
označiti ćelije u kojima je<br />
potrebno smestiti<br />
koeficijente regresije<br />
Zatim pritisnuti taster F2,<br />
a potom istovremeno<br />
kombinaciju tastera<br />
CTRL+SHIFT+ENTER
NELINEARNE REGRESIJE <br />
METODE LINEARIZACIJE <br />
€<br />
€<br />
1. y = b ⋅ x a ⇒ ln y = ln b + a ln x<br />
y ˜ = b ˜ + a ⋅ x ˜<br />
2. y = b ⋅e ax ⇒ ln y = ln b + ax<br />
y ˜ = b ˜ €<br />
+ ax<br />
3. y = b + a x ⇒ y = b + a ⋅ 1 x<br />
y = b + a˜ x<br />
4. y = b + a x ⇒ y = b + a ⋅ ˜ x<br />
5. y =1− e -ax ⇒ ln(y −1) = −ax<br />
-ln(y −1) = ax<br />
ln(y −1) −1 = ax<br />
ln(<br />
˜ y = ax<br />
1<br />
y −1 ) = ax<br />
U Excel‐u: Sca=er diagram + Add Trand Line + <br />
€<br />
Op,ons (R Squared, Show Equa,on on Chart)
VIŠESTRUKA <strong>KORELACIJA</strong> I <strong>REGRESIJA</strong> <br />
Podaci :<br />
⎡ x 1,1 x 1,2 x 1,k<br />
⎤<br />
⎢<br />
⎥<br />
⎢<br />
<br />
€<br />
⎥<br />
X = ⎢ x i,1 x i,2 x i,k<br />
⎥<br />
⎢<br />
⎥<br />
⎢<br />
<br />
⎥<br />
⎣ ⎢ x n,1 x n,2 x n,k ⎦ ⎥<br />
x 1 x 2 x n<br />
n − obim uzorka<br />
Jednacina :<br />
ˆ y = a 1<br />
x 1<br />
+ a 2<br />
x 2<br />
+…+ a k<br />
x k<br />
+ b<br />
y =<br />
k − broj nezavisno promenljivih, tj. faktora<br />
⎡<br />
⎢<br />
⎢<br />
⎢<br />
⎢<br />
⎢<br />
⎣ ⎢<br />
y 1<br />
<br />
y i<br />
<br />
y n<br />
⎤<br />
⎥<br />
⎥<br />
⎥<br />
⎥<br />
⎥<br />
⎦ ⎥<br />
€<br />
Parametri :<br />
⎡ a 1<br />
⎢<br />
α =<br />
⎢<br />
<br />
⎣ ⎢ a k<br />
⎤<br />
⎥<br />
⎥<br />
= ? b = ?<br />
⎦ ⎥<br />
€<br />
α = ( X T X) −1 X T y b = y − a 1 x 1 − a 2 x 2 −…− a k x k<br />
METODA NAJMANJIH <br />
KVADRATA
VIŠESTRUKA <strong>KORELACIJA</strong> I <strong>REGRESIJA</strong> <br />
Korelacione matrice :<br />
⎡ r x1 x 1<br />
r x1 x 2<br />
r x1<br />
⎤<br />
x<br />
⎢<br />
k<br />
⎥<br />
r x2 x<br />
R XX = ⎢ 1<br />
r x2 x 2<br />
r x2 x k ⎥<br />
⎢ ⎥<br />
⎢<br />
⎥<br />
⎣ r xk x 1<br />
r xk x 2<br />
r xk x k ⎦<br />
⎡<br />
⎢<br />
c = ⎢<br />
⎢<br />
⎢<br />
⎣<br />
r x1 y<br />
r x2 y<br />
<br />
r xk y<br />
⎤<br />
⎥<br />
⎥<br />
⎥<br />
⎥<br />
⎦<br />
KOEFICIJENT <br />
DETERMINACIJE <br />
R 2 = c T<br />
( R XX ) −1 c<br />
€<br />
€<br />
U Excel‐u: <br />
Računamo korišćenjem funkcije LINEST
Nakon unešene formule,<br />
označiti ćelije u kojima je<br />
potrebno smestiti<br />
koeficijente regresije<br />
Zatim pritisnuti taster F2,<br />
a potom istovremeno<br />
kombinaciju tastera<br />
CTRL+SHIFT+ENTER