Korelasi dan Regresi Linier Korelasi Diagram tebar & garis regresi ...
Korelasi dan Regresi Linier Korelasi Diagram tebar & garis regresi ...
Korelasi dan Regresi Linier Korelasi Diagram tebar & garis regresi ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>Korelasi</strong> <strong>dan</strong> <strong>Regresi</strong> <strong>Linier</strong><br />
Jurusan BIOSTATISTIKA<br />
Fakultas Kesehatan Masyarakat<br />
Universitas Indonesia<br />
1<br />
<strong>Korelasi</strong><br />
• Menilai hubungan 2 variabel numerik<br />
• Contoh:<br />
1. Apakah ada hubungan antara umur<br />
dengan tekanan darah sistolik<br />
2. Apakah ada hubungan antara income<br />
keluarga dengan IP mhs<br />
3. Apakah ada hubungan antara umur<br />
pasien dengan lama hari rawat<br />
4. Apakah ada hubungan antara tinggi ba<strong>dan</strong><br />
(TB) dengan FEV1<br />
• <strong>Diagram</strong> <strong>tebar</strong> (scatter-plot)<br />
Sumbu X Variabel Independen<br />
Sumbu Y Variabel Dependen<br />
Jur. Biostatistika, FKM UI, 2001 Page 2<br />
<strong>Diagram</strong> <strong>tebar</strong> & <strong>garis</strong> <strong>regresi</strong><br />
Contoh Garis <strong>regresi</strong> FEV1 dengan tinggi ba<strong>dan</strong><br />
<strong>Korelasi</strong><br />
Force expiratoty volume in 1 min (ml)<br />
600<br />
500<br />
400<br />
300<br />
200<br />
100<br />
140<br />
150<br />
160<br />
170<br />
Y i 719, 14 6,<br />
43X<br />
i<br />
180 190 200<br />
• Pola hubungan antara<br />
2 variabel numerik<br />
1. <strong>Linier</strong>:<br />
- Positif<br />
- Negatif<br />
2. Non-<strong>Linier</strong>:<br />
- Parabolik<br />
- Exponensial<br />
height (cm)<br />
Jur. Biostatistika, FKM UI, 2001 Page 3<br />
Jur. Biostatistika, FKM UI, 2001 Page 4<br />
<strong>Korelasi</strong><br />
• Menilai kekuatan hubungan linier 2 var<br />
numerik:<br />
Pearson’s Coefisien Correlation (r)<br />
• Dari nilai r kita dapat menentukan:<br />
a. Kekuatan hubungan(0 s.d 1)<br />
b. Arah hubungan: (+/-)<br />
• Kisaran nilai r antara 0 s.d 1:<br />
0 = Tidak ada hubungan linier<br />
1 = Ada hubungan linier sempurna<br />
• Arah hubungan:<br />
+ = Hubungan direct:semakin besar nilai X<br />
semakin besar nilai Y<br />
• - = Hubungan inverse:semakin besar nilai X<br />
semakin kecil nilai Y<br />
Jur. Biostatistika, FKM UI, 2001 Page 5<br />
ASUMSI<br />
<strong>Korelasi</strong><br />
• Pearson’s Coef. Correlation hanya valid jika asumsi<br />
berikut terpenuhi:<br />
1. Untuk setiap nilai X, Nilai Y terdistribusi<br />
secara normal<br />
2. Untuk setiap nilai Y, Nilai X terdistribusi<br />
secara normal<br />
3. Perkalian antara nilai X <strong>dan</strong> Y terdistribusi<br />
secara normal (bivariate normal distr.)<br />
• Koefisien Determinasi (r 2 ):<br />
Melihat besarnya variasi variabel Y (dalam persen)<br />
yang dapat dijelaskan oleh variabel X.<br />
Misal r=0.8, r 2 =0.64. Artinya sebesar 64% variasi<br />
nilai Y dapat dijelaskan oleh variabel X<br />
Jur. Biostatistika, FKM UI, 2001 Page 6
<strong>Korelasi</strong>: Data Lay-out <strong>dan</strong> perhitungan r<br />
Subjek X X 2 Y Y 2 X.Y<br />
1 X 1 X 1<br />
2<br />
Y 1 Y 1<br />
2<br />
XY 1<br />
. X . X .<br />
2<br />
Y . Y .<br />
2<br />
XY .<br />
. X .<br />
X .<br />
2<br />
Y .<br />
Y .<br />
2<br />
XY .<br />
n X n X<br />
2<br />
n Y n Y<br />
2<br />
n XY n<br />
(X) = … (X 2 ) … (Y)… (Y 2 )… (XY) = …<br />
( X ).( Y)<br />
( XY)<br />
<br />
n<br />
2<br />
2<br />
X Y <br />
2<br />
<br />
2<br />
<br />
( X<br />
) . ( Y<br />
) <br />
n n <br />
r <br />
xy * n x<br />
y<br />
2<br />
2<br />
2<br />
2<br />
<br />
x * n <br />
x<br />
*<br />
<br />
y * n <br />
y<br />
Jur. Biostatistika, FKM UI, 2001 Page 7<br />
<br />
INFERENSI KOEF. KORELASI<br />
• Estimasi Interval Koef. <strong>Korelasi</strong> (r)<br />
Exp[ 2. Zf ] 1<br />
CI ( r)<br />
<br />
Exp[ 2. Zf ] 1<br />
• Uji hipotesis Koef. <strong>Korelasi</strong> (r):<br />
- Ho: = 0<br />
- Ha: 0<br />
n 2<br />
- Uji statistik: t r.<br />
2<br />
1 r<br />
- Critical Region: Ho ditolak jika,<br />
| t (hitung)<br />
| > t (tabel: /2, df=n-2)<br />
<strong>Korelasi</strong><br />
1 1<br />
r Z<br />
Zf Ln<br />
<br />
r <br />
<br />
( / 2)<br />
.<br />
2 1 n 3<br />
Jur. Biostatistika, FKM UI, 2001 Page 8<br />
<strong>Korelasi</strong><br />
INTERPRETASI KOEF. KORELASI<br />
• Kekuatan hubungan: (Subjektif)<br />
r < 0.4<br />
: Lemah<br />
0.4< r 0.8<br />
: Kuat<br />
• <strong>Korelasi</strong> tidak selalu berarti hubungan sebab<br />
akibat (causality)<br />
• <strong>Korelasi</strong> yang lemah tidak selalu berarti tidak<br />
a<strong>dan</strong>ya hubungan<br />
• <strong>Korelasi</strong> yang kuat tidak selalu berarti a<strong>dan</strong>ya<br />
<strong>garis</strong> lurus<br />
Jur. Biostatistika, FKM UI, 2001 Page 9<br />
CONTOH KORELASI:<br />
r <br />
<strong>Korelasi</strong><br />
Subjek (X) Usia (Y) Lama hari rawat X.Y<br />
1 20 5<br />
2 30 6<br />
3 25 5<br />
4 35 7<br />
5 40 8<br />
(X) = 150 (X) = 31 (XY) = 970<br />
(X 2 ) = 4750 (Y 2 ) = 199<br />
( X ).( Y)<br />
( 150).( 31)<br />
( XY)<br />
<br />
( 970)<br />
<br />
n<br />
<br />
5<br />
0.<br />
97<br />
2<br />
2 2 2<br />
X Y <br />
2<br />
<br />
2<br />
<br />
150<br />
31<br />
( X ) . ( Y ) ( 4750) . ( 199)<br />
<br />
n n 5 5 <br />
Jur. Biostatistika, FKM UI, 2001 Page 10<br />
<strong>Korelasi</strong><br />
• Estimasi Interval Koef. <strong>Korelasi</strong> (r)<br />
95% confidence interval r adalah:<br />
1 1<br />
r Z<br />
Zf Ln<br />
Ln<br />
<br />
r <br />
<br />
( / 2)<br />
1 1<br />
0.<br />
97 <br />
. .<br />
2 1 n 3 2 <br />
1<br />
0.<br />
97 <br />
<br />
• Batas bawah r:<br />
Exp[ 2. Zf ] 1 Exp[ ( . )]<br />
CI ( r)<br />
<br />
.<br />
Exp[ . Zf ] 2 0 7064 1<br />
2 1 Exp[ 2( 0. 7064)]<br />
1<br />
0 61<br />
• Batas atas r:<br />
196 .<br />
[ 0. 7064 3. 4782]<br />
5<br />
3<br />
Exp[ 2. Zf ] 1 Exp[ ( . )]<br />
CI ( r)<br />
<br />
.<br />
Exp[ . Zf ] 2 3 4782 1<br />
2 1 Exp[ 2( 34782 . )] 1<br />
0 99<br />
Jur. Biostatistika, FKM UI, 2001 Page 11<br />
<strong>Korelasi</strong><br />
• Uji hipotesis Koef. <strong>Korelasi</strong> (r):<br />
1. Ho: = 0<br />
Ha: 0<br />
2. Uji statistik:<br />
n 2<br />
t r. 0.<br />
97<br />
1 r<br />
5 2<br />
2 2<br />
1 0.<br />
97<br />
6.<br />
91<br />
3. Critical Region: Ho ditolak jika,<br />
| t (hitung) | ≥ t (tabel: /2, df=n-2) atau p-value < <br />
≥ 3.182<br />
p
<strong>Regresi</strong> <strong>Linier</strong><br />
• Memprediksi nilai Y dari X:<br />
1. Berapa tekanan darah sistolik, jika umur = 30 th<br />
2. Berapa IP mhs, jika income keluarga = Rp 2 juta<br />
3. Berapa lama hari rawat, jika pasien berumur 40 th<br />
4. Berapa level FEV1, pada orang dengan TB=170 cm<br />
• Asumsi pada <strong>regresi</strong> linier:<br />
1. Nilai mean dari Y adalah fungsi <strong>garis</strong> lurus<br />
(linierity) dari X Y i = + 1 X i + <br />
2. Nilai Y terdistribusi sec. Normal untuk setiap nilai X<br />
(normality)<br />
3. Varian Y adalah sama untuk setiap nilai X<br />
(homoscedasticity)<br />
4. Nilai X <strong>dan</strong> Y adalah tidak saling berkait<br />
(independency)<br />
Jur. Biostatistika, FKM UI, 2001 Page 13<br />
<strong>Regresi</strong> <strong>Linier</strong><br />
• Mencari <strong>garis</strong> terbaik <strong>regresi</strong> linier:<br />
Metoda Least Square (Persamaan <strong>garis</strong> dibuat<br />
sedemikian rupa sehingga jumlah kuadrat dari selisih<br />
nilai observasi dengan nilai pada <strong>garis</strong> adalah minimum)<br />
• Persamaan <strong>garis</strong> <strong>regresi</strong> linier:<br />
Y i = + 1 X i + <br />
Y i adalah nilai Y yang diprediksi<br />
adalah intercept <strong>dan</strong> 1 adalah slope<br />
adalah posisi dimana <strong>garis</strong> <strong>regresi</strong> memotong sumbu y<br />
1 mengukur kemiringan <strong>garis</strong><br />
Nilai Y meningkat sebesar 1 unit untuk setiap kenaikan<br />
nilai X sebesar 1 unit<br />
adalah error dari model dalam memprediksi rata-rata Y<br />
Jur. Biostatistika, FKM UI, 2001 Page 14<br />
<strong>Regresi</strong> <strong>Linier</strong>: Data Lay-out<br />
Subjek X Y X.Y<br />
1 X 1<br />
X 1<br />
2<br />
Y 1<br />
Y 1<br />
2<br />
XY 1<br />
. X . X .<br />
2<br />
Y . Y .<br />
2<br />
XY .<br />
. X .<br />
X .<br />
2<br />
Y .<br />
Y .<br />
2<br />
XY .<br />
n X n<br />
X<br />
2<br />
n<br />
Y n<br />
Y<br />
2<br />
n<br />
XY n<br />
Varian S 2 x=… S 2 y=…<br />
(X) = … (X 2 ) … (Y)… (Y 2 )… (XY) = …<br />
• Persamaan <strong>garis</strong><br />
<strong>regresi</strong> linier:<br />
• Y i<br />
= + 1<br />
X i<br />
( X<br />
).( Y)<br />
( XY)<br />
<br />
<br />
n<br />
2<br />
<br />
2<br />
X<br />
( X<br />
) <br />
n<br />
Y X<br />
Y<br />
Y mean _ Y <br />
n<br />
X<br />
X mean _ X <br />
n<br />
Jur. Biostatistika, FKM UI, 2001 Page 15<br />
Inferensi Koef. <strong>Regresi</strong><br />
• Estimasi Interva Koef. <strong>Regresi</strong>:<br />
CI Z ( / ) . SE<br />
2 <br />
( n 1) 2 2 2<br />
n<br />
S y S x<br />
<br />
<br />
SE<br />
<br />
( 1 )<br />
. ( . )<br />
<br />
2<br />
( n 1).<br />
S<br />
S<br />
S<br />
2<br />
y<br />
2<br />
x<br />
Varian<br />
VarianX<br />
<br />
Jur. Biostatistika, FKM UI, 2001 Page 16<br />
x<br />
X<br />
X mean _ X <br />
n<br />
<br />
Inferensi Koef. <strong>Regresi</strong><br />
• Uji Hipotesis Koef. <strong>Regresi</strong>:<br />
- Ho: = 0<br />
- Ha: 0<br />
- Uji statistik:<br />
<br />
t <br />
SE<br />
( n 1) 2 2 2<br />
n<br />
S y S x<br />
( 2 )<br />
. ( . )<br />
<br />
SE<br />
<br />
2<br />
( n 1).<br />
S x<br />
- Critical Region: Ho ditolak jika,<br />
<br />
<br />
<br />
CONTOH REGRESI:<br />
<strong>Regresi</strong><br />
Subjek (X) Usia (Y) Lama hari rawat X.Y<br />
1 20 5<br />
2 30 6<br />
3 25 5<br />
4 35 7<br />
5 40 8<br />
S 2 x=62.5<br />
S 2 y=1.7<br />
(X) = 150 (Y) = 31 (XY) = 970<br />
(X 2 ) = 4750 (Y 2 ) = 199<br />
| t (hitung)<br />
| > t (tabel: /2, df=n-2)<br />
Jur. Biostatistika, FKM UI, 2001 Page 17<br />
Jur. Biostatistika, FKM UI, 2001 Page 18
<strong>Regresi</strong> <strong>Linier</strong><br />
• Persamaan <strong>garis</strong> <strong>regresi</strong> linier:<br />
( X<br />
).( Y)<br />
( 150).( 31)<br />
( XY)<br />
<br />
( 970)<br />
<br />
<br />
n<br />
<br />
5<br />
2 2<br />
016 .<br />
<br />
<br />
2<br />
X<br />
150<br />
( X<br />
) <br />
( 4750)<br />
<br />
n<br />
5<br />
Y X 6. 2 016 . .( 30) 14 .<br />
<strong>Regresi</strong> <strong>Linier</strong><br />
• Estimasi Interval Koef. <strong>Regresi</strong> ()<br />
95% confidence interval adalah<br />
2 2 2<br />
S<br />
y S ( 5 1) <br />
2<br />
x . 17 . ( 016 . ) ( 62. 5))<br />
( 5 2) <br />
( n 1) . ( . )<br />
( n 2 ) <br />
<br />
SE<br />
<br />
<br />
2<br />
( n 1).<br />
S x<br />
95% CI Z SE<br />
( / 2).<br />
<br />
<br />
<br />
( 5 1) 62.<br />
5<br />
95% CI 016 . 196 . ( 0. 00863) [ 014 . 017<br />
. ]<br />
<br />
0.<br />
00863<br />
Lama hari rawat (Y) = + 1<br />
X i<br />
Lama hari rawat = 1.4 + 0.16 (Usia)<br />
SE<br />
<br />
<br />
<br />
MS<br />
i<br />
E<br />
<br />
X X<br />
2<br />
Jur. Biostatistika, FKM UI, 2001 Page 19<br />
Jur. Biostatistika, FKM UI, 2001 Page 20<br />
<strong>Regresi</strong> <strong>Linier</strong><br />
• Uji hipotesis Koef. <strong>Regresi</strong> ():<br />
- Ho: = 0<br />
- Ha: 0<br />
- Uji statistik:<br />
016 .<br />
t <br />
SE 0.<br />
00863 1854 .<br />
- Critical Region: Ho ditolak jika,<br />
| t (hitung) | > t (tabel: /2, df=n-2)<br />
> 3.182<br />
<br />
- Keputusan: Ho ditolak<br />
- Kesimpulan: Koef. Beta tidak sama dengan nol<br />
Jur. Biostatistika, FKM UI, 2001 Page 21<br />
• Komputer Out-put:<br />
Model<br />
1<br />
Model<br />
1<br />
Model Summary b<br />
<strong>Regresi</strong> <strong>Linier</strong><br />
Std. Error<br />
Adjusted of the<br />
R R Square R Square Estimate<br />
.970 a .941 .922 .3651<br />
a. Predictors: (Constant), USIA<br />
b. Dependent Variable: LAMA_RWT<br />
Regression<br />
Residual<br />
Total<br />
a. Predictors: (Constant), USIA<br />
b. Dependent Variable: LAMA_RWT<br />
ANOVA b<br />
Sum of<br />
Mean<br />
Squares df Square F Sig.<br />
6.400 1 6.400 48.000 .006 a<br />
.400 3 .133<br />
6.800 4<br />
Jur. Biostatistika, FKM UI, 2001 Page 22<br />
• Komputer Out-put:<br />
<strong>Regresi</strong> <strong>Linier</strong><br />
Model<br />
1<br />
(Constant)<br />
USIA<br />
Unstandardized<br />
Coefficients<br />
a. Dependent Variable: LAMA_RWT<br />
Coefficients a<br />
Standardi<br />
zed<br />
Coefficien<br />
ts<br />
95% Confidence<br />
Interval for B<br />
Lower Upper<br />
B Std. Error Beta t Sig. Bound Bound<br />
1.400 .712 1.967 .144 -.865 3.665<br />
.160 .023 .970 6.928 .006 .087 .233<br />
Jur. Biostatistika, FKM UI, 2001 Page 23