13.11.2014 Views

Korelasi dan Regresi Linier Korelasi Diagram tebar & garis regresi ...

Korelasi dan Regresi Linier Korelasi Diagram tebar & garis regresi ...

Korelasi dan Regresi Linier Korelasi Diagram tebar & garis regresi ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Korelasi</strong> <strong>dan</strong> <strong>Regresi</strong> <strong>Linier</strong><br />

Jurusan BIOSTATISTIKA<br />

Fakultas Kesehatan Masyarakat<br />

Universitas Indonesia<br />

1<br />

<strong>Korelasi</strong><br />

• Menilai hubungan 2 variabel numerik<br />

• Contoh:<br />

1. Apakah ada hubungan antara umur<br />

dengan tekanan darah sistolik<br />

2. Apakah ada hubungan antara income<br />

keluarga dengan IP mhs<br />

3. Apakah ada hubungan antara umur<br />

pasien dengan lama hari rawat<br />

4. Apakah ada hubungan antara tinggi ba<strong>dan</strong><br />

(TB) dengan FEV1<br />

• <strong>Diagram</strong> <strong>tebar</strong> (scatter-plot)<br />

Sumbu X Variabel Independen<br />

Sumbu Y Variabel Dependen<br />

Jur. Biostatistika, FKM UI, 2001 Page 2<br />

<strong>Diagram</strong> <strong>tebar</strong> & <strong>garis</strong> <strong>regresi</strong><br />

Contoh Garis <strong>regresi</strong> FEV1 dengan tinggi ba<strong>dan</strong><br />

<strong>Korelasi</strong><br />

Force expiratoty volume in 1 min (ml)<br />

600<br />

500<br />

400<br />

300<br />

200<br />

100<br />

140<br />

150<br />

160<br />

170<br />

Y i 719, 14 6,<br />

43X<br />

i<br />

180 190 200<br />

• Pola hubungan antara<br />

2 variabel numerik<br />

1. <strong>Linier</strong>:<br />

- Positif<br />

- Negatif<br />

2. Non-<strong>Linier</strong>:<br />

- Parabolik<br />

- Exponensial<br />

height (cm)<br />

Jur. Biostatistika, FKM UI, 2001 Page 3<br />

Jur. Biostatistika, FKM UI, 2001 Page 4<br />

<strong>Korelasi</strong><br />

• Menilai kekuatan hubungan linier 2 var<br />

numerik:<br />

Pearson’s Coefisien Correlation (r)<br />

• Dari nilai r kita dapat menentukan:<br />

a. Kekuatan hubungan(0 s.d 1)<br />

b. Arah hubungan: (+/-)<br />

• Kisaran nilai r antara 0 s.d 1:<br />

0 = Tidak ada hubungan linier<br />

1 = Ada hubungan linier sempurna<br />

• Arah hubungan:<br />

+ = Hubungan direct:semakin besar nilai X<br />

semakin besar nilai Y<br />

• - = Hubungan inverse:semakin besar nilai X<br />

semakin kecil nilai Y<br />

Jur. Biostatistika, FKM UI, 2001 Page 5<br />

ASUMSI<br />

<strong>Korelasi</strong><br />

• Pearson’s Coef. Correlation hanya valid jika asumsi<br />

berikut terpenuhi:<br />

1. Untuk setiap nilai X, Nilai Y terdistribusi<br />

secara normal<br />

2. Untuk setiap nilai Y, Nilai X terdistribusi<br />

secara normal<br />

3. Perkalian antara nilai X <strong>dan</strong> Y terdistribusi<br />

secara normal (bivariate normal distr.)<br />

• Koefisien Determinasi (r 2 ):<br />

Melihat besarnya variasi variabel Y (dalam persen)<br />

yang dapat dijelaskan oleh variabel X.<br />

Misal r=0.8, r 2 =0.64. Artinya sebesar 64% variasi<br />

nilai Y dapat dijelaskan oleh variabel X<br />

Jur. Biostatistika, FKM UI, 2001 Page 6


<strong>Korelasi</strong>: Data Lay-out <strong>dan</strong> perhitungan r<br />

Subjek X X 2 Y Y 2 X.Y<br />

1 X 1 X 1<br />

2<br />

Y 1 Y 1<br />

2<br />

XY 1<br />

. X . X .<br />

2<br />

Y . Y .<br />

2<br />

XY .<br />

. X .<br />

X .<br />

2<br />

Y .<br />

Y .<br />

2<br />

XY .<br />

n X n X<br />

2<br />

n Y n Y<br />

2<br />

n XY n<br />

(X) = … (X 2 ) … (Y)… (Y 2 )… (XY) = …<br />

( X ).( Y)<br />

( XY)<br />

<br />

n<br />

2<br />

2<br />

X Y <br />

2<br />

<br />

2<br />

<br />

( X<br />

) . ( Y<br />

) <br />

n n <br />

r <br />

xy * n x<br />

y<br />

2<br />

2<br />

2<br />

2<br />

<br />

x * n <br />

x<br />

*<br />

<br />

y * n <br />

y<br />

Jur. Biostatistika, FKM UI, 2001 Page 7<br />

<br />

INFERENSI KOEF. KORELASI<br />

• Estimasi Interval Koef. <strong>Korelasi</strong> (r)<br />

Exp[ 2. Zf ] 1<br />

CI ( r)<br />

<br />

Exp[ 2. Zf ] 1<br />

• Uji hipotesis Koef. <strong>Korelasi</strong> (r):<br />

- Ho: = 0<br />

- Ha: 0<br />

n 2<br />

- Uji statistik: t r.<br />

2<br />

1 r<br />

- Critical Region: Ho ditolak jika,<br />

| t (hitung)<br />

| > t (tabel: /2, df=n-2)<br />

<strong>Korelasi</strong><br />

1 1<br />

r Z<br />

Zf Ln<br />

<br />

r <br />

<br />

( / 2)<br />

.<br />

2 1 n 3<br />

Jur. Biostatistika, FKM UI, 2001 Page 8<br />

<strong>Korelasi</strong><br />

INTERPRETASI KOEF. KORELASI<br />

• Kekuatan hubungan: (Subjektif)<br />

r < 0.4<br />

: Lemah<br />

0.4< r 0.8<br />

: Kuat<br />

• <strong>Korelasi</strong> tidak selalu berarti hubungan sebab<br />

akibat (causality)<br />

• <strong>Korelasi</strong> yang lemah tidak selalu berarti tidak<br />

a<strong>dan</strong>ya hubungan<br />

• <strong>Korelasi</strong> yang kuat tidak selalu berarti a<strong>dan</strong>ya<br />

<strong>garis</strong> lurus<br />

Jur. Biostatistika, FKM UI, 2001 Page 9<br />

CONTOH KORELASI:<br />

r <br />

<strong>Korelasi</strong><br />

Subjek (X) Usia (Y) Lama hari rawat X.Y<br />

1 20 5<br />

2 30 6<br />

3 25 5<br />

4 35 7<br />

5 40 8<br />

(X) = 150 (X) = 31 (XY) = 970<br />

(X 2 ) = 4750 (Y 2 ) = 199<br />

( X ).( Y)<br />

( 150).( 31)<br />

( XY)<br />

<br />

( 970)<br />

<br />

n<br />

<br />

5<br />

0.<br />

97<br />

2<br />

2 2 2<br />

X Y <br />

2<br />

<br />

2<br />

<br />

150<br />

31<br />

( X ) . ( Y ) ( 4750) . ( 199)<br />

<br />

n n 5 5 <br />

Jur. Biostatistika, FKM UI, 2001 Page 10<br />

<strong>Korelasi</strong><br />

• Estimasi Interval Koef. <strong>Korelasi</strong> (r)<br />

95% confidence interval r adalah:<br />

1 1<br />

r Z<br />

Zf Ln<br />

Ln<br />

<br />

r <br />

<br />

( / 2)<br />

1 1<br />

0.<br />

97 <br />

. .<br />

2 1 n 3 2 <br />

1<br />

0.<br />

97 <br />

<br />

• Batas bawah r:<br />

Exp[ 2. Zf ] 1 Exp[ ( . )]<br />

CI ( r)<br />

<br />

.<br />

Exp[ . Zf ] 2 0 7064 1<br />

2 1 Exp[ 2( 0. 7064)]<br />

1<br />

0 61<br />

• Batas atas r:<br />

196 .<br />

[ 0. 7064 3. 4782]<br />

5<br />

3<br />

Exp[ 2. Zf ] 1 Exp[ ( . )]<br />

CI ( r)<br />

<br />

.<br />

Exp[ . Zf ] 2 3 4782 1<br />

2 1 Exp[ 2( 34782 . )] 1<br />

0 99<br />

Jur. Biostatistika, FKM UI, 2001 Page 11<br />

<strong>Korelasi</strong><br />

• Uji hipotesis Koef. <strong>Korelasi</strong> (r):<br />

1. Ho: = 0<br />

Ha: 0<br />

2. Uji statistik:<br />

n 2<br />

t r. 0.<br />

97<br />

1 r<br />

5 2<br />

2 2<br />

1 0.<br />

97<br />

6.<br />

91<br />

3. Critical Region: Ho ditolak jika,<br />

| t (hitung) | ≥ t (tabel: /2, df=n-2) atau p-value < <br />

≥ 3.182<br />

p


<strong>Regresi</strong> <strong>Linier</strong><br />

• Memprediksi nilai Y dari X:<br />

1. Berapa tekanan darah sistolik, jika umur = 30 th<br />

2. Berapa IP mhs, jika income keluarga = Rp 2 juta<br />

3. Berapa lama hari rawat, jika pasien berumur 40 th<br />

4. Berapa level FEV1, pada orang dengan TB=170 cm<br />

• Asumsi pada <strong>regresi</strong> linier:<br />

1. Nilai mean dari Y adalah fungsi <strong>garis</strong> lurus<br />

(linierity) dari X Y i = + 1 X i + <br />

2. Nilai Y terdistribusi sec. Normal untuk setiap nilai X<br />

(normality)<br />

3. Varian Y adalah sama untuk setiap nilai X<br />

(homoscedasticity)<br />

4. Nilai X <strong>dan</strong> Y adalah tidak saling berkait<br />

(independency)<br />

Jur. Biostatistika, FKM UI, 2001 Page 13<br />

<strong>Regresi</strong> <strong>Linier</strong><br />

• Mencari <strong>garis</strong> terbaik <strong>regresi</strong> linier:<br />

Metoda Least Square (Persamaan <strong>garis</strong> dibuat<br />

sedemikian rupa sehingga jumlah kuadrat dari selisih<br />

nilai observasi dengan nilai pada <strong>garis</strong> adalah minimum)<br />

• Persamaan <strong>garis</strong> <strong>regresi</strong> linier:<br />

Y i = + 1 X i + <br />

Y i adalah nilai Y yang diprediksi<br />

adalah intercept <strong>dan</strong> 1 adalah slope<br />

adalah posisi dimana <strong>garis</strong> <strong>regresi</strong> memotong sumbu y<br />

1 mengukur kemiringan <strong>garis</strong><br />

Nilai Y meningkat sebesar 1 unit untuk setiap kenaikan<br />

nilai X sebesar 1 unit<br />

adalah error dari model dalam memprediksi rata-rata Y<br />

Jur. Biostatistika, FKM UI, 2001 Page 14<br />

<strong>Regresi</strong> <strong>Linier</strong>: Data Lay-out<br />

Subjek X Y X.Y<br />

1 X 1<br />

X 1<br />

2<br />

Y 1<br />

Y 1<br />

2<br />

XY 1<br />

. X . X .<br />

2<br />

Y . Y .<br />

2<br />

XY .<br />

. X .<br />

X .<br />

2<br />

Y .<br />

Y .<br />

2<br />

XY .<br />

n X n<br />

X<br />

2<br />

n<br />

Y n<br />

Y<br />

2<br />

n<br />

XY n<br />

Varian S 2 x=… S 2 y=…<br />

(X) = … (X 2 ) … (Y)… (Y 2 )… (XY) = …<br />

• Persamaan <strong>garis</strong><br />

<strong>regresi</strong> linier:<br />

• Y i<br />

= + 1<br />

X i<br />

( X<br />

).( Y)<br />

( XY)<br />

<br />

<br />

n<br />

2<br />

<br />

2<br />

X<br />

( X<br />

) <br />

n<br />

Y X<br />

Y<br />

Y mean _ Y <br />

n<br />

X<br />

X mean _ X <br />

n<br />

Jur. Biostatistika, FKM UI, 2001 Page 15<br />

Inferensi Koef. <strong>Regresi</strong><br />

• Estimasi Interva Koef. <strong>Regresi</strong>:<br />

CI Z ( / ) . SE<br />

2 <br />

( n 1) 2 2 2<br />

n<br />

S y S x<br />

<br />

<br />

SE<br />

<br />

( 1 )<br />

. ( . )<br />

<br />

2<br />

( n 1).<br />

S<br />

S<br />

S<br />

2<br />

y<br />

2<br />

x<br />

Varian<br />

VarianX<br />

<br />

Jur. Biostatistika, FKM UI, 2001 Page 16<br />

x<br />

X<br />

X mean _ X <br />

n<br />

<br />

Inferensi Koef. <strong>Regresi</strong><br />

• Uji Hipotesis Koef. <strong>Regresi</strong>:<br />

- Ho: = 0<br />

- Ha: 0<br />

- Uji statistik:<br />

<br />

t <br />

SE<br />

( n 1) 2 2 2<br />

n<br />

S y S x<br />

( 2 )<br />

. ( . )<br />

<br />

SE<br />

<br />

2<br />

( n 1).<br />

S x<br />

- Critical Region: Ho ditolak jika,<br />

<br />

<br />

<br />

CONTOH REGRESI:<br />

<strong>Regresi</strong><br />

Subjek (X) Usia (Y) Lama hari rawat X.Y<br />

1 20 5<br />

2 30 6<br />

3 25 5<br />

4 35 7<br />

5 40 8<br />

S 2 x=62.5<br />

S 2 y=1.7<br />

(X) = 150 (Y) = 31 (XY) = 970<br />

(X 2 ) = 4750 (Y 2 ) = 199<br />

| t (hitung)<br />

| > t (tabel: /2, df=n-2)<br />

Jur. Biostatistika, FKM UI, 2001 Page 17<br />

Jur. Biostatistika, FKM UI, 2001 Page 18


<strong>Regresi</strong> <strong>Linier</strong><br />

• Persamaan <strong>garis</strong> <strong>regresi</strong> linier:<br />

( X<br />

).( Y)<br />

( 150).( 31)<br />

( XY)<br />

<br />

( 970)<br />

<br />

<br />

n<br />

<br />

5<br />

2 2<br />

016 .<br />

<br />

<br />

2<br />

X<br />

150<br />

( X<br />

) <br />

( 4750)<br />

<br />

n<br />

5<br />

Y X 6. 2 016 . .( 30) 14 .<br />

<strong>Regresi</strong> <strong>Linier</strong><br />

• Estimasi Interval Koef. <strong>Regresi</strong> ()<br />

95% confidence interval adalah<br />

2 2 2<br />

S<br />

y S ( 5 1) <br />

2<br />

x . 17 . ( 016 . ) ( 62. 5))<br />

( 5 2) <br />

( n 1) . ( . )<br />

( n 2 ) <br />

<br />

SE<br />

<br />

<br />

2<br />

( n 1).<br />

S x<br />

95% CI Z SE<br />

( / 2).<br />

<br />

<br />

<br />

( 5 1) 62.<br />

5<br />

95% CI 016 . 196 . ( 0. 00863) [ 014 . 017<br />

. ]<br />

<br />

0.<br />

00863<br />

Lama hari rawat (Y) = + 1<br />

X i<br />

Lama hari rawat = 1.4 + 0.16 (Usia)<br />

SE<br />

<br />

<br />

<br />

MS<br />

i<br />

E<br />

<br />

X X<br />

2<br />

Jur. Biostatistika, FKM UI, 2001 Page 19<br />

Jur. Biostatistika, FKM UI, 2001 Page 20<br />

<strong>Regresi</strong> <strong>Linier</strong><br />

• Uji hipotesis Koef. <strong>Regresi</strong> ():<br />

- Ho: = 0<br />

- Ha: 0<br />

- Uji statistik:<br />

016 .<br />

t <br />

SE 0.<br />

00863 1854 .<br />

- Critical Region: Ho ditolak jika,<br />

| t (hitung) | > t (tabel: /2, df=n-2)<br />

> 3.182<br />

<br />

- Keputusan: Ho ditolak<br />

- Kesimpulan: Koef. Beta tidak sama dengan nol<br />

Jur. Biostatistika, FKM UI, 2001 Page 21<br />

• Komputer Out-put:<br />

Model<br />

1<br />

Model<br />

1<br />

Model Summary b<br />

<strong>Regresi</strong> <strong>Linier</strong><br />

Std. Error<br />

Adjusted of the<br />

R R Square R Square Estimate<br />

.970 a .941 .922 .3651<br />

a. Predictors: (Constant), USIA<br />

b. Dependent Variable: LAMA_RWT<br />

Regression<br />

Residual<br />

Total<br />

a. Predictors: (Constant), USIA<br />

b. Dependent Variable: LAMA_RWT<br />

ANOVA b<br />

Sum of<br />

Mean<br />

Squares df Square F Sig.<br />

6.400 1 6.400 48.000 .006 a<br />

.400 3 .133<br />

6.800 4<br />

Jur. Biostatistika, FKM UI, 2001 Page 22<br />

• Komputer Out-put:<br />

<strong>Regresi</strong> <strong>Linier</strong><br />

Model<br />

1<br />

(Constant)<br />

USIA<br />

Unstandardized<br />

Coefficients<br />

a. Dependent Variable: LAMA_RWT<br />

Coefficients a<br />

Standardi<br />

zed<br />

Coefficien<br />

ts<br />

95% Confidence<br />

Interval for B<br />

Lower Upper<br />

B Std. Error Beta t Sig. Bound Bound<br />

1.400 .712 1.967 .144 -.865 3.665<br />

.160 .023 .970 6.928 .006 .087 .233<br />

Jur. Biostatistika, FKM UI, 2001 Page 23

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!