Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
TC
ONDOKUZ MAYIS ÜNİVERSİTESİ
SAĞLIK BİLİMLERİ ENSTİTÜSÜ
BİYOİSTATİSTİK VE İSTATİSTİK
PAKET PROGRAM KULLANIMI
2019.12.24
DANIŞMAN
DOÇ. DR. LEMAN TOMAK
HAZIRLAYAN
MOHEBULLAH FAQİRİ
1
1. Giriş
1.1. Temel kavramlar
Istatistik : istatistiği bir çok tanımı yapılmaktadır. Genel olarak olylar hakkında bilgilerin toplanması,
bulnların araştırmanın amacın yönelik olarak var olan bir problemin ve bunlar ilişkin değişkenlerin
belirlenmesi, analiz yapılmasına dayanan yöntemlerin bilimine istatistik denir.
Biyoistatistik: istatistiğin biyoloji, tıp ve diğer sağlık bilimlerindeki teknolojisidir.
Birim: Sayılabilir veya ölçülebilir özellikleri (değişkenleri) içeren, aralarında bir çok benzerlikler
olmakla beraber farklılıklar da bulunan nesnelere veya olaylara “istatistik birimi” denir. Eğer,
sayılamayan veya ölçülemeyen nesneler veya olaylar söz konusu olduğunda bunlar istatistik birimi
oluşturmazlar. Örneğin; koku, renk, korku, sevinç vb.
Evren: araştırma sonuçlarının geçerli olacağı büyük grup. Evren birimi, evrenin sınırlandırılmış bir
parçasıdır. Sayım, evrenin tüm birimlerine ulaşılarak bilgilerin toplanmasıdır.
İstatistik birimi; canlı, cansız, bir olgu, bir olay veya bir kurum olabilir.
Örneklem: Araştırılmak istenen bir olayla ilgili evrenden, belli kurallara göre seçilmiş, evreni temsil
ettiği varsayılan küçük bir küme örneklem olarak adlandırılır. çekildiği evreni temsil ettiği düşünülen ve
evrenden çekilen küçük bir grubun oluşturduğu topluluktur.
Örnekleme: kitleye ilişkin parametreleri çikarsamak için günlük etkinliklerin hemen her aşamasinda
sürekli olarak yapilmaktadir.satin alinan ya da üretilen ürünlerin tek tek kontrolü çoğu zaman olanaksiz
olduğundan kitlenin özelliklerini taşiyan bir alt grup incelenerek kitle hakkinda karar verme işlemine
örnekleme denir.
örneklemi seçmek için yapılan işlemlerin tümü
Örnekleme türleri
Örnekleme türleri ile ilgili olarak çeşitli sınıflandırmaların olduğu görülebilir. Örnekleme türlerinin
olasılıklı ve olasılıksız olmak üzere iki şekilde ele alınarak sınıflandırmanın yaygın olarak kullanıldığı
söylenebilir. Olasılıklı örnekleme türleri; basit tesadüfi örnekleme, sistematik örnekleme, tabakalı
örnekleme ve küme örnekleme başlıkları altında ele alınacaktır. Olasılıklı olmayan örnekleme türleri ise
gelişigüzel örnekleme, kota örneklemesi, amaçlı örnekleme ve kartopu örneklemesi olarak ele
alınacaktır.
Küme Örneklemesi: Örneklem birimlerinin birden çok kitle biriminden oluştuğu örnekleme yöntemine
verilen addır. Örneğin; Öğrenciler bölümlerine göre gruplanır, grupların her birinden örnekler seçilir.
Sistematik Örnekleme : Örnekleme birimlerinin uygun bir şekilde sıralandığı bir çerçevenin elimizde
olduğu varsayıldığında ilk k (k=N/n)birimden rasgele seçilen herhangi birisinin başlangıç noktası olarak
alındığı ve bundan sonra gelen her k’ncı birimin örnekleme seçildiği yönteme verilen addır. Örneğin,
büyük bir kentte ev seçimi, sokak seçimi, işyeri seçimi otomobil seçimi gibi.
2
Gelişigüzel örnekleme : Bu tür örnekleme, araştırmacının saptanan örneklem büyüklüğüne göre
herhangi bir şekilde evrenin bir parçasını seçmesidir. Herhangi bir fakülteye gidip saptanacak sayıda
rastlanan öğrenciyi örnekleme alma gelişigüzel örneklemedi.
Kota örnekleme : Kota örneklemede sınırlı bir evren, araştırmanın amacına uygun olarak
araştırmacının öngördüğü belirli değişkenlere göre sınıflandırılır. Bu değişkenler yaş, cinsiyet, eğitim
durumu, meslek, hastalık olabileceği gibi, etnik köken, kırsal ve kentsel değişkenler de olabilir.
Basit tesdüfi Örnekleme : Her bir örnekleme biriminde sadece ve sadece tek bir kitle biriminin
bulunduğu ve her bir örnekleme biriminin örneğe seçilme olasılığının eşit olduğu bu yönteme basit
rasgele örnekleme adı verilmektedir.
Uygun örnekleme : Zaman, para ve işgücü açısından var olan sınırlılıklar nedeniyle örneklemin kolay
ulaşılabilir ve uygulama yapılabilir birimlerden seçilmesidir.
Tabakalı Örnekleme: Örnekleme birimleri araştırma konusu herhangi bir değişkene göre büyük
farklılıklar gösteriyor ise (homojen değilse); kitle değişkenliği daha küçük olan alt gruplara ayrılabilir.
Örneğin; Öğrenciler bölümlerine göre gruplanır, grupların her birinden örnekler seçilir.
Amaçlı örnekleme : Bu örneklemenin temeli, araştırmanın amaçları doğrultusunda bir evrenin temsilci
bir örneği yerine, amaçlı olarak bir ya da birkaç alt kesimini örnek olarak almaktır. Başka bir deyişle
amaçlı örnekleme, evrenin soruna en uygun bir kesimini gözlem konusu yapmak demektir. Endüstride
meslek hastalıklarıyla ilgili olarak yapılacak bir araştırmada, araştırmacının, meslek hastalıklarının tüm
evren içinde değil, özellikle belli bir hizmet süresini aşmış ya da belli bir yaş sınırının üstündeki işçiler
arasında daha açık bir biçimde gözlenebileceğini düşünerek, tüm işçiler evrenini değil, orta yaşlı ve yaşlı
işçiler kesimini temsil eden bir seçim yapması buna örnek verilebilir.
Kartopu örnekleme : Kartopu örneklemede öncelikle evrene ait birimlerden birisi ile temas kurulur.
Temas kurulan birimin yardımıyla ikinci birime, ikinci birimin yardımıyla üçüncü birime gidilir. Bu
şekilde, sanki bir kartopunun büyümesi gibi örneklem büyüklüğü genişler. Orta Doğu Teknik
Üniversitesi’nin kuruluş yıllarındaki felsefesini çalışmak isteyen bir araştırmacı için, Orta Doğu Teknik
Üniversitesi’nde emekliliği yaklaşmış veya emekli olmuş birkaç öğretim üyesi çalışmanın ilk
örneklemini oluşturabilir. Araştırma süreci ilerledikçe, ulaşılan kişilerin yardımıyla daha fazla kişi
listeye dahil edilecek ve liste kartopu gibi büyüyecektir.
Parametre: parametre evrenin özelliklerini tanımlamak için kullanılan ölçüler denir. Araştırma kitle
yerine örneklem üzerinde uygulanıyorsa, parametre değerleri tahmin edilir.
Veri: bir olayı aydınlatmak ya da bir gerçeği ortaya çıkarmak için toplanan materyal (ölçüm, bilgi, belge,
madda) olarak tanımlanabilir.
Değişken ve değişken türleri
Bir durumdan diğerine, gözlemden gözleme farklılık gösteren özelliklere değişken adı verdir.
Nicel ve Nitel Değişkenler
Sürekli ve Süreksiz (Kesikli/Kategorik)Değişkenler
Bağımlı ve Bağımsız Değişkenler
3
Nicel Değişkenleri: Eğer bir değişkenin özelliği sayı ve miktar olarak açıklanan biliyorsa buna nicel
değişken denir. Örnek: Başarı puanı, boy, kilo, uzunluk vb.
Nitel Değişkenler: Eğer bir değişkenin özelliği sınıflandırılıyorsa bunan nitel değişken denir. Örnek:
Cinsiyet (kız-erkek), Lise- üniversite vb.), Sosyoekonomik düzey (Alt- orta-üst)
Sürekli Değişkenler : Sürekli değişkenler iki ölçüm arasında sonsuz sayıda değer alabilirler.Örnek:
Boy, test puanı, zeka puanı, ağırlık-Kğ vb
Süreksiz Değişkenler : Ölçülen özellikle ilgili sınırlı sayıda değer alabilen değişkenlere süreksiz
değişken denir.Örnek cinsiyet (kız-erkek), eğitim durumu ( ilkorta- orta-lise- üniversite)
Bağımlı Değişkenler: Bağımlı değişken üzerimde bağımsız değişkenin etkisi incelenen değişkendir.
Örnek Grip hastalığının iyileşme durumu
Bağımsız değişkenler: Bağımsız değişken araştırmacının bağımlı değişken üzerindeki etkisini test
etmek istediği değişkendir. Örnek kullanılan tedavi yöntemi.
2. Merkezi Eğilim Ölçüleri
Veri setini tanımlamak üzere kullanılan ve genellikle tüm elemanları dikkate alarak veri setini
özetlemek için kullanılan ifadelerdir.
merkezi eğilim ölçüleri) ortalamalardan en önemlileri:
Aritmetik Ortalama
Geometrik Ortalama
Kareli Ortalama
Harmonik Ortalama
Mod
Ortanca (Medyan)
Çeyrekler (Quartiles)
2.1. Aritmetik ortalama
Aritmetik ortalama, en çok kullanılan merkezi eğilim ölçüsüdür. Bir seriyi oluşturan gözlem değerlerinin
toplamının, gözlem sayısına oranı olarak tanımlarır.
Formülü: A. O = X̅ = ∑ x i
i=1 dir.
n
n
4
Örnek veri setimiz için vücut ağırlıklarının aritmetik ortalamasını hesaplayalım;
bulunur.
40
X̅ = ∑ x i
n
İ=1
=
75 + 80 + ⋯ + 84 + 82
40
= 3320
40
= 83
2.2. Geometrik ortalama
Geometrik ortalanma gözlem sonuçları bir önceki gözlem sonucuna bağlı olarak değişiyorsa ve bu
değişimin hızı belirlenmek istrniyor kullanılan bir merkezi eğilim ölçüsüdür.
Formülü;
n
G. O = √x 1 . x 2 … x n
n
n
i=1
= √∏ x i
dir.
Gözlem sayısı arttığında, geometrik ortalamayı yukarıdaki formülden hesaplamak güçleşeceği için
logaritma yardımıyla aşağıdaki formül devreye girer;
n
logG = 1 n ∑ log x i
i=1
Örnek veri setimiz için ilk 5 veriye ait Vücut Kitle Endekslerinin geometric ortalamasını aşağıdaki
gibi hesaplarız;
5
G.O = √30. 43 x 31. 25 x 29. 74 x 33. 30x30. 07
= 30. 93
5
2.3. Kareli ortalama
Kareli Ortalama: Seriyi oluşturan gözlem değerlerinin karelerinin toplamının gözlem sayısına oranının
karekökü olarak tanımlanır.
Formülü;
K. O = √ x 1 2 + x 2 2 + ⋯ + x n
2
n
Örnek veri setimizden boy uzunlukları ilişkin kareli ortalamayı hesaplarsak,
157 + 160 + ⋯ + 174 + 180
K. O = √ = √ 1093135 = 165. 312
40
40
2.4. Harmonik Ortalama
Harmonik ortalamanı nüfus artış hızı, büyüme hızı gibi hız gerektiren durumlarda kullanılan bir ortalama
türüdür. Gözlem birim değerlerinin terslerinin aritmetik ortalamasının tersidir.
Formülü;
H. O =
n
1
∑n
i=1 x i
Örnek veri setimizden yine vücut ağırlıklarına ilişkin harmonik ortalamayı şu şekilde hesaplarız;
6
40
H. O =
1
74 + 1
62 + ⋯ + 1 = 40 = 81. 799
0. 489
82
Ortalamalar arasında şu şekilde bir ilişki bulunur,
A. O ≥ G. O. ≥ H. O
2.5. Ortanca (Medyan)
Bir seriyi en küçük değere sahip gözlemden en büyük değere sahip gözleme doğru sıraladığımızda tam
ortada kalan gözlem değerine Medyan denilmektedir. Şayet bir veri setindeki gözlem sayısı çift ise tam
ortaya gelen iki gözlem değerinin ortalaması medyan değeri olarak hesaplanır.Ortanca değer verilerimizi
büyükten küçüğe ya da küçükten büyüğe doğru sıraladığımızda ortadaki değere ortanca denir. Birim
sayısının tek veya çift olmasına göre medyanın bulunması değişir.
Formülü;
n + 1
2
Örnek: 40 hastaların vücut ağırlıkları yukarda verilişitir.ve vücut ağırılıklarını küçükten büyüğe doğru
sıralayalım
n = 40 olduğundan (n+1)/2=(39+1)/2=20
şimidi de denek sayısı çefit olduğu ortanca bu amaç için en son hastanı değerini (110) dışarıda bırakarak denek
sayısını 39 yapalım.
gözlemi bulduğumuzda bu gözlem değeri bize boy uzunlukları için Medyan değerini verecektir. Yani
80kg olacaktır.
2.6. Tepe Değer ( Mod )
Bir veri grubunda en çok tekrarlanan değere tepe değer(mod) denir. Tepe değerin hesaplanmasında
birimlerin büyüklük sırasına konulması şart değilse de, bu işlemin yapılması tepe değerin bulunmasında
kolaylık sağlar.
En çok tekrar eden değer = 80
7
Örnek veri setimizden vücut ağırlığı sütunu dikkate alındığında 80 kg değeri Mod değerini verir çünkü
seride 9 defa ile en çok kullanılan veridir.
3. Değişkenlik Ölçüleri
Bir durumdan diğerine, gözlemden gözlem farklılık gösteren özelliklere değişken adı verdirşer.
3.1. Değişim aralığı (Range)
Bir serideki en büyük değer ile en küçük değer arasındaki fark olarak tanımlanır.
Formülü;
D. A. = x max − x min
Değişi aralığı = En büyük değer – En küçük değer
R= max-min
Örnek veri setimizde vücut ağırlıklarına ait değişim aralığını bulmak istersek;
D.A.= 110-62 = 48 olarak hesaplarız.
Not: Değişim aralığı, farklı sayıda gözlem değeri içeren ve farklı ölçü birimlerine göre oluşturulmuş
serilerin karşılaştırılmalarında kullanılamaz. Bu değişkenlik ölçüsü, uygulamada eşit sayıda küçük
örneklemlerin değerlendirildiği alanlarda, örneğin istatistik kalite kontrolünde sıkça kullanılmaktadır.
3.2. Ortalama Mutlak Sapma
Veri setindeki her bir gözlem değerinin aritmetik ortalamadan farklarının mutlak değerlerinin toplamının
örnek hacmine bölünmesiyle elde edilir.
Formülü;
8
n
O. A. = 1 n ∑|x i − x̅|
i=1
Örnek veri setimiz için vücut ağırlıklarına ait ortalamayı 80 kg bulmuştuk, şimdi de ortalama mutlak
sapmayı hesaplayalım,
O. A. = 1
1
(|75 − 83| + |80 − 83| + ⋯ + |82 − 83|) = x0 = 0
40 40
3.3. Varyans
Varyans, birim değerlerinin ortalamadan sapmalarının kareler toplamının birim sayısına bölünmesi ile
elde edilir. Varyans gözlem sonuçlarının aritmetik ortalamadan ne ölçüde farklı olabileceğini ortaya
koyan bir dağılım ölçüsüdür. Kitle varyansı , örneklem varyansı ile gösterilir.
Veri setindeki her bir gözlem değerinin aritmetik ortalamadan farklarının karelerinin toplamının
örnek hacminin bir eksiğine bölünmesinden elde edilen değişkenlik ölçüsüne örnek varyansı adı verilir.
Formülü;
S 2 = ∑ n i=1 (x i − x̅) 2
n − 1
n
= 1
n − 1 (∑ x i 2 − (∑
i=1
n
i=1
n
x i)
2
)
Örnek veri setimizden vücut ağırlıklarına ait varyansı hesaplarsak,
S 2 =
1
40 − 1 [(75 − 83)2 + (80 − 83) 2 + ⋯ + (82 − 83) 2 ] = 4422 = 113. 38
39
3.4. Standart sapma
Standart sapma gözlem değerlerinin aritmetik ortalamdan farklarının karelerinin aritmetik ortalamasına
varyans ve varyansın pozitif karekökane ise standart spma denir
Formülü,
9
S = √S 2
vücut ağırlıkları için
S = √113. 38 = 10. 648
3.5. Standart Hata
Ortalamaların standart hatası olarak bilinir. Aynı büyüklükte aynı popülasyondan seçilen örneklemlerin
dağılımıdır. Standart Sapma değerinin denek sayısının kareköküne bölünmesi ile elde edilir. Standart
hatanın küçük olması popülasyondan elde edilen parametrelerin tahmini açısından önemlidir.
Standart sapmanın örnek büyüklüğünün kareköküne bölünmesi ile de Standart Hata bulunur. Burada;
Formülü,
S x̅ =
S
√n
=
10. 648
√40
= 1. 683
3.6. Değişim Katsayısı
Standart sapmayı ortalamanın bir yüzdesi olarak ifade eden ve iki veya daha fazla popülâsyondaki
varyasyonu (değişkenliği) karşılaştırmada kullanılan ölçüye Varyasyon (Değişkenlik) Katsayısı denir.
Formülü,
D. K. = S x̅ x100
Örnek veri setimiz için vücut ağırlıkları ait Varyasyon Katsayısını hesaplayalım;
D. K. =
10. 648
x100 = 12. 8289
83
Aşada ki tablo1 de ilk sütun gözlemlediğimiz birimlerin hasta sıra numarasını (Nicel-kesikli), 2.sütun
cinsiyetini (Nitel-adlandırma), 3.sütun eğitim durum (Nitel-adlandırma), 4.sütun kilosunu (Nicelsürekli),
sütun boyunu (Nicel-sürekli), 6.sütun Vücut Kitle Endeksini (Nicel-sürekli) ve son sütunda da medeni
durumunu (Nitel-sıralı) olarak verilmiştir.
Bu tablodaki ana veri setimiz 40 ferde ait cinsiyet, boy uzunluğu ve vücut ağırlığıdır. Bu veriler ışığında
SPSS’ de “Transform” menüsünden “Compute Variable” sekmesinden yararlanarak “Vücut Kitle
Endeksi” sütunu oluşturulmuştur. Burada formül olarak “KİLO/(BOY)**2” kullanılmıştır. Daha sonra
yine “Transform” menüsünden “Recode into Different Variables” sekmesinden vücut kitle endeksleri
zayıf, normal, kilolu ve obez olmak üzere sıralandırılarak “Vücut Durumu” sütunu oluşturulmuştur.
10
Tanimlayici istatistiklerin spss’ de uygulanmasi
Hasta.No Cinsiyet Eğitim Durumu Kilo Boy BMI Medeni.Durum
1 Erkek Önlisans ve lisans 75 157 30.43 Bekar
2 Erkek Yüksek lisans 80 160 31.25 Bekar
3 Erkek Önlisans ve lisans 80 164 29.74 Bekar
4 Erkek İlköretim 80 155 33.3 Evli
5 Erkek İlköretim 90 173 30.07 Evli
6 Kedın Önlisans ve lisans 88 163 33.12 Bekar
7 Kedın İlköretim 66 165 24.24 Bekar
8 Erkek Önlisans ve lisans 78 164 29 Bekar
9 Erkek Yüksek lisans 80 173 26.73 Boş
10 Kedın Önlisans ve lisans 75 175 24.49 Evli
11 Kedın Önlisans ve lisans 88 150 39.11 Evli
12 Kedın Önlisans ve lisans 110 160 42.97 Evli
13 Kedın Doktora 80 165 29.38 Evli
14 Kedın İlköretim 75 162 28.58 Bekar
15 Erkek Doktora 80 156 32.87 Boş
16 Kedın Doktora 110 165 40.4 Evli
17 Erkek Yüksek lisans 94 170 32.53 Bekar
18 Kedın İlköretim 74 153 31.61 Bekar
19 Erkek Önlisans ve lisans 90 165 33.06 Bekar
20 Kedın Önlisans ve lisans 92 167 32.99 Boş
21 Erkek Önlisans ve lisans 96 172 32.45 Evli
22 Kedın Yüksek lisans 80 155 33.3 Evli
23 Kedın Yüksek lisans 70 176 22.6 Evli
24 Kedın Doktora 74 161 28.55 Boş
25 Kedın İlköretim 62 165 22.77 Bekar
26 Erkek Önlisans ve lisans 80 163 30.11 Bekar
27 Erkek Önlisans ve lisans 82 170 28.37 Evli
28 Erkek Yüksek lisans 90 172 30.42 Evli
29 Erkek Doktora 92 170 31.83 Boş
30 Erkek İlköretim 68 150 30.22 Bekar
31 Kedın Doktora 80 168 28.34 Evli
32 Erkek Önlisans ve lisans 75 160 29.3 Evli
33 Kedın Yüksek lisans 90 170 31.14 Evli
34 Erkek Önlisans ve lisans 75 150 33.33 Bekar
35 Erkek Yüksek lisans 80 169 28.01 Evli
36 Erkek Yüksek lisans 105 175 34.29 Evli
37 Kedın Yüksek lisans 80 163 30.11 Evli
38 Erkek Yüksek lisans 90 180 27.78 Evli
39 Erkek Doktora 84 174 27.74 Evli
40 Erkek İlköretim 82 180 25.31 Boş
11
SPSS de tanımlayıcı istatistikler, “Anlyze” menüsünden, “Descriptive Statistics” sekmesinin
altındaki “Descriptives” sekmesi ile yapılmaktadır.
Açılan menüde işlem yapmak istediğimiz veri setini “Variable(s)” kısmına ortadaki ok yardımıyla
tanımlıyoruz. Daha sonra hangi tanımlayıcı istatistikleri yapacağımızı penceredeki Options” seçeneğini
tıklayarak açılan diğer pencere üzerinde belirliyoruz.
12
Daha sonra sırasıyla “Continue” ve “OK” kısımları tıklanarak ilgili gösterge tablolarını oluşturuyoruz.
Şayet grafik oluşturmak da istersek “Anlyze” menüsünden, “Descriptive Statistics”
sekmesinin altındaki “Frequencies” sekmesini de kullanabiliriz. Burada “Chart”
butonundan istediğimiz grafiği seçebiliriz.
13
14
Bu şekilde yukarıdaki gibi tabloları ve grafikleri de elde edebiliriz.
15
B. HIPOTEZ
2.1. Hipotez : Hipotez araştırmanın olası sonucuna dair yapılan tahminlerin ifadesidir. karşılaşılan özel
duruma ilişkin bir önermedir.
2.2. İstatistiksel hipotez
İstatistiksel hipotez herhangi bir anakütle parametresine ilişkin olarak ileri sürülen ve doğruluğu olasılık
kurallarla araştırılabilen önermedir.
2.3. HIPOTEZ TESTLERİ
İstatistiksel hipotez herhangi bir anakütle parametresine ilişkin olarak ileri sürülen ve doğruluğu olasılık
kurallarla araştırılabilen önermedir. Hipotez test hatıranacağı gibi güven sınırlarının hespaplanmasında
anakütleden çekilen birimlerden hareketle anakütle parametreleri hakkında tahminlerde bu
lunulmaktadır. Hipotez testleri bir örneklem ortalaması ile bu örneklemin çekilmiş olduğunu
düşündüğümüz ortalaması etrafındaki farkın anlamlı olup olmadığını (yani önemli bir fark olup
olmadığını) araştırmamızı sağlayan testlerdir.
Hipotez testleri gözlem ya da deneme sonucu elde edilmiş sonuçların, rastlantıya bağlı olup
olmadığının incelenmesinde kullanılan istatistiksel yöntemlere hipotez testleri denir. Hipotez testleri
sayesinde örnekden elde edilen istatistikler aracılığıyla anakütle parametreleri hakkında karar verilir.
Anakütle parametreleri Hakkında karar verirken doğru ya da yanlış olması muhtemel yargılardan hareket
edilir, ve evrenin tümü üzerinde çalışıldığında, çıkan sonuçlar kesindir. Anlamlılık testi uygulanmaz.
2.4. Hipotez testinin aşamaları : Hipotez testlerinin uygulamasını dört aşamada anlatabiliriz;
2.4.1. Hipotezlerin Kurulması
Sıfır Hipotezi ( H
0), Ortalamalar ve dağılımlar arasında bir farkın (veya ilişkinin) olmadığını savunur.
Karşı Hipotez / araştırma hipotezi (Ha ): Ortalamalarda ve dağılımda bir fark olduğunu savunur, ve Red
Bölgesi (Rejection region): Sıfır hipotezi red edip karşı hipotezi kabul edeceğimiz bölge (p değeri)
H 0: Boş hipotez, sıfır hipotezi
H1ya da Ha : Alternatif hipotez
Bu ifadeler araştırırcının konu ile ilgili ön yargısına bağlı olarak değişir. Eğer araştırıcı I. uygulamanın
II. uygulamadan iyi olacağına dair ön yargısı varsa H1: 1> 2 şeklinde kurulur. Hiçbir ön yargısı yoksa,
H1: 1 2 şeklinde kurulur.
16
2.4.2. Test İstatistiğinin Belirlenmesi
İkinci aşamada elimizdeki verinin özelliklerine ve elde edilmek istenen sonuca göre hangi tür test
istatistiğinin uygulanması gerektiğine karar verilir. Bu konu ilerleyen sayfalarda daha ayrıntılı olarak
anlatılacaktır.
2.4.3. Test İstatistiğinin Hesaplanması
Test İstatistiğinin Hesaplanması: İstatistiksel karar, ileri sürülen sıfır hipotezi ile örneklemlerden elde
edilmiş ortalama, oran vs. gibi istatistiklerin kıyaslanması sonucu ve örneklem istatistiği ile sıfır
hipotezinde belirlenmiş olan ana kütle parametresi arasındaki farkı standart hata birimleriyle ifade eden
bir ölçüye ihtiyaç vardır. Kısaca üzerinde test kurulan örneklem istatistiğine “test istatistiği” denir.
2.4.4. Karar Aşaması
Son aşamada ise hesaplanan test istatistiği değeri ile buna ilişkin tablo değeri karşılaştırılır. Kritik tablo
değeri ile
hesaplanan
test istatistiği
karşılaştırılır,hipotez hakkında karar verilir ve sonuç yorumlanır.
Şayet; Oluşturulan hipotez testinin tek veya çift kuyruklu olarak adlandırılması alternatif hipotezin oluşturulma
biçimine bağlıdır.
Hesaplanan değerin mutlak değeri > Tablo değerinin mutlak değeri ise H
0
aleyhine karar verilir. Yani
Ho reddedilir.
Hesaplanan değerin mutlak değeri < Tablo değerinin mutlak değeri ise H
0
Ho lehine karar verilir. Yani
H
0
reddedilemez.
17
Yukarıdakişekillerde ortalama için yapılan hipotez testine ilişkin tek taraflı ve çift taraflı Ret ve
Kabul bölgeleri görülmektedir.
Eğer alternatif hipotezde ana kütle ortalaması k’dan büyük olarak belirtilirse bu sefer sağ tek
kuyruk testi söz konusudur.
Eğer hipotezde red alanı iki eşit alana bölünmüş durumdaysa çift kuyruk test söz konusudur. Çift
kuyruk testinde alternatif hipotezde eşitsizlik söz konusudur.
Tipik değerleri: 0.01, 0.05, 0.10
H 0
Her yapılan istatistiksel hesaplamada çok az da olsa bir hata payı bulunmaktadır. Hipotez
testlerinde bu hata payı α ya da β ile gösterilmektedir. Genel olarak bu hata payları α = 0,05
olarak kabul edilir.
2.5. Hipotez Testlerindeki Hata Tipleri
Hipotez testleri hata tipleri I. Tip ve II. Tip Hatalar dır. Bilmediğimiz örneklem parametresinin
gerçek değeri karşısında ya; doğrudur yada Ha. Çünkü bu iki hipotez, aynı anda her ikisi birden
H 0
doğru olmayacak şekilde teşkil edilmiştir. Örnek değerlerine dayanarak
konusu olacaktır. O halde,
H 0’ın doğruluk veya yanlışlığı bir kriter,
kriter olarak akla gelebilecek 4 durumu şöyle sıralayabiliriz.
H 0
’ın kabulü veya reddi söz
H 0
’ın kabulü veya reddi de ikinci
I. H0 hipotezi kitle parametresinin gerçek değeri karşısında doğrudur ve biz örnekleme sonucu
H0’ı kabul ederiz. Burada bir hata söz konusu değil.
II. H0 hipotezi doğrudur, fakat örnek değerleri karşısında reddedilmiştir, yani aslında doğru olan
bir hipotez yanlışlık yapılarak reddedilmiştir. Buna I. Tip hata adını veriyoruz.
III. Ho hipotezi yanlıştır ve reddedilmiştir. Burada bir hata söz konusu olmaz.
IV. H0 hipotezi yanlıştır fakat örnek sonuçlarına göre kabul edilmiştir. Burada yapılan hataya da II.
tip hata diyoruz.
Hipotez Testlerinin karar
Doğru
Gerçek Durum
H 0
Yanlış
H 0
Kabul 1-α (Kabul Olasılığı) β (II.Tip Hata)
H
0
Ret α (I.Tip Hata) 1-β (Testin Gücü)
H 0
2.5.1. Aritmetik Ortalaması İçin Hipotez test edilmesi (Kitle Varyansı Biliniyor)
2.5.1.1. Hipotez kurulur :
18
2.5.1.2. Test istatistiğinin belirlenmesi:
Burada normal dağıldığı ve kitle standart sapması bilindiği için Z testi uygulanacaktır.
2.5.1.3. Test istatistiği hesaplanır :
2.5.1.4. Karar aşaması
Örnek (Aritmetik Ortalaması İçin Hipotez test edilmesi ) Belirli bir tür hastalığın tedavisi için yeni
bir tür ilaç geliştirilmiştir. Bu ilaçla tedavi edilen hastaların ortalama iyileşme süresinin 10 günden az
olduğu iddia edilmektedir. Rasgele olarak seçilen 7 hasta sözü edilen ilaçla tedavi edilmiş ve kaç günde
iyileştikleri aşağıdaki gibi saptanmıştır.
Çözüm: Öncelikler örnek sorumuzda bize verilen değerleri ifade edelim;
x i : 2, 4, 11, 3, 4, 6, 8
2 4 ve 0. 01 ise kararınız ne olur? % 99 güven düzeyinde kitle ortalaması için güven aralığı
oluşturunuz.
1. Hipotezlerin kurulması:
H 0 = μ = 10
H 1 = μ < 10
2. Test istatistiğinin belirlenmes:
Burada örneğimizin normal dağıldığı ve kitle standart sapması bilindiği için Z testi uygulanacaktır.
19
3. Test istatistiği hesaplanır :
4. Karar aşaması :
Z H = X̅ − μ 5. 43 − 10
∂/
=
2
= −6046
√n √7
Z H = −6. 046 < −2 T < 0. 01 = −2. 33 olduğundan red edilir, yani bu ilaçla tedavi edilen
hastaların ortalama iyileşme süresinin 10 günden az olduğu %99 güvenle söylenebilir.
H 0
Örnek (İki Ortalama Farkının Hipotez Test Edilmesi): A ilacının ortalama etki süresinin B ilacının
ortalama etki süresinden daha büyük olduğu öne sürülmektedir. A ilacı verilen hastaların etki süresine
göre dağılımı normal ve varyansı 30 olarak bilinmektedir.B ilacı verilen hastaların etki süresine göre
dağılımı da normal ve varyansı 36 olarak bilinmektedir. Rasgele seçilen 5 hastaya A ilacı verilmiş ve
ortalama etki süresi 51 olarak bulunmuş ve yine rasgele seçilen 7 hastaya Bilacı verilmiş ve ortalama
etki süresi 39.57 olarak bulunmuştur. Buna göre %95 güven düzeyinde iddiayı test ediniz, A ve B
ilaçlarının ortalama etki süreleri arasındaki fark için %95 lik güven sınırlarını belirleyiniz.
Çözüm: Öncelikler örnek sorumuzda bize verilen değerleri ifade edelim;
X 1 = 51 X 2 = 39. 57 n 1 = 5 n 2 = 7 ∂ 1 2 = 30 ∂ 2
2
= 36
1. Hipotezlerin kurulması:
H 0 = μ 1 = μ 2 ya da μ 1 − μ 2 = 0
H 1 = μ 2 ≠ μ 2 ya da μ 1 − μ 2 ≠ 0
2. Test istatistiğinin belirlenmesi:
Burada örneğimizin normal dağıldığı ve kitle varyansları bilindiği için Z testi uygulanacaktır.
3. Test İstatistiğinin Hesaplanması:
4. Karar aşaması:
α = 0. 05
H 1 = μ 1 > μ 2
Z H > Z T Olduğundan H 0 Red edilir
20
Hipotez testleri için spss uygulamaları
3.1. Tek Örneklem – T testi
Tek örneklem t testinde hipotezler, örneklemden elde edilen ortalama ile evren ortalaması arasında fark
olup olmamasına göre oluşturulur. Örneklem ortalamasının anlamlılığını test etmek üzere kullanılan
parametrik bir tekniktir.
Örnek: Toplumda bireylerin hemoglobin düzeyleri normal dağılım göstermekte ve ortalaması m=14.2
mgr/dl dır. y bölgesinde yaşayan bireylerden rasgele seçilen 10 kişilik bir örnekte hemoglobin düzeyleri
aşağıdaki gibidir. y bölgesinde yaşayan bireylerin hg düzeyleri farklı mıdır?
15 14 15 14 15.80 5.20 14.20 15.80 6 13.70
Örneğimizde n=10 ve toplum varyansı bilinmemektedir.
İlk olarak örneğe ilişkin veriler SPSS’ de oluşturulan Hb_dk sütununa girilir.
Öncelikle verilerin normal dağılıp dağılmadığını test etmek için Analyze > Descriptive Statistics >
Explore seçeneği tıklanır. Açılan pencerede Dependent List kısmına Hb_dk değişkeni taşınır. Display
alanında Plots işaretlenir. Plots seçeneği tıklanır ve görüntülenen ek ekranda Normality plots with tests
seçeneği işaretlenir.
21
Bu bölüme tamamlayıp “OK” e bastığımızda;
Sonuç tablosunu görebiliriz. Burada n<10 olduğundan Shapiro-Wilk testine ait significance değerimize
bakarız ve bu değer 0,01 olarak görülmektedir. Bu değer 0,05 den küçük olduğu için Normal Dağılım
gösterdiği söylenebilmektedir. Bu durumda normal dağılım t testi uygu diğletir.
Hipotezlerin kurulması
H 0 = μ = μ 0 = 10
H 1 ≠ μ ≠ μ 1 = 10
SPSS de tek örneklem t testi için, Anlyze > Compere Means > One-Simple T test seçilir. Görüntülenen
ekranda KPZ_dk değişkeni Test Variable alanına taşınır. “Test Value” alanine 10 değeri girilir.
22
Burada significance değerimiz 0,45 olarak görülmektedir. Bu değer 0,05 den küçük olduğu için
Red edilir.
H 0
N-1= 10-1= 9 sig < 0. 05 Önemli bir fark var
Bu aralığa sıfır eklenirse, ortalama H reddinde% 95'lik bir fark olasılığının sıfıra eşit olduğu ve H0
olduğu varsayılmadığı anlamına gelir.
Sonuç p<0,05 olduğundan ho red
Yorum: y bölgesinden yaşayan bireylerin hemoglobin düzeyleri toplumdan farklılık göstermektedir
ve toplumdan daha yüksektir
Bağımsız İki Örneklem “T testi”
Örnek: Kadiyoloji hastaliklarin 23 erkek ve 17 kadın bireyin kanser belirtilerinin başladığı andaki
sistolik kanbast aşağıdaki gibi belirlenmiştir. Örneklem normal dağıldığına göre erkek ve kadınlarda bu
kadiyoloij hastalik sistolik HTN ortalamaları arasında 0,05 anlamlılık düzeyinde önemli bir fark var
mıdır?
Hipotezlerin kurulması:
SPSS de iki örneklem t testi için, Anlyze > Compere Means > Independent-Simples T test seçeneği
tıklanır. Açılan pencerede” Test Variable(s)” alanına Sistolik HTN , “Groupin Variable” alanına cinsiyet
taşınır. Define Groups seçeneği tıklanır ve görüntülenen ekranda Group1 için 1, Group2 için 2 girilir.
Continue ve OK tıklanır.
23
Bu bölüme tamamlayıp “OK” e bastığımızda
24
Bağımlı İki Örneklem “T testi”
Bağımlı örneklem t-testi, bir değişkenin, iki farklı durumda gözlemlenen değerlerinin ortalamalarını
karşılaştırır. Bu iki durum genellikle uygulanacak bir yöntemin öncesi ve sonrası şeklinde olur. (Örnekte
kullanılan veri setini buradan indirebilirsiniz...)
Örnek: Bu veri setinde yeni bir ilacın kan basıncı üzerindeki etkisi araştırılmaktadır. Hastaların ilacı
kullanmadan önceki kan basınçları (Before_exp_BP) ve ilacı kullandıktan sonraki kan basınçları
(After_exp_BP) ölçülmüştür. Bunlar aynı kişilere ait ve bir uygulamadan önceki ve sonraki değerler
olduğu için bağımlı değişkenlerdir. Dolayısıyla bu iki değişkenin ortalamasını karşılaştırmak için en
uygun test Bağımlı Örneklem t_testi olacaktır. Öncelikle hipotezler kurulmalıdır.
Bağımlı Örneklem t-Testi için hipotezler;
H0: %95 güvenle, deneyden önceki ve sonraki kan basıncı ortalamaları arasında, istatistiksel olarak
anlamlı bir farklılık yoktur. (M1=M2)
H1:%95 güvenle, deneyden önceki ve sonraki kan basıncı ortalamaları arasında, istatistiksel olarak
anlamlı bir farklılık vardır. (M1< >M2)
Daha sonra bağımlı iki örneklem T testi için Anlyze > Compere Means > Paired-Simples T Test
seçenekleri seçilir. Before_exp_BP ve After_exp_BP değişkenleri Paired Variables alanına taşınır. OK
tıklanır
25
Analyze > Compare Means > Paired Sapmle t-test
İlgili bağımlı değişkenler şekildeki gibi seçilir. Daha sonra "Options" bölümünden testin güvenilirlik
yüzdesi belirlenebilir. Ayrıca burada birden fazla veri çifti de analiz edilebilir.
Bu seçimler yapıldıktan sonra sonuçlar aşağıdaki gibi olacaktır.
26
Görüldüğü gibi bu tabloda değişkenlerin ortalamaları birbirinden farklıdır. Ancak sadece bu tabloya
bakılarak bu farklılığın anlamlı yada anlamsız olduğu sonucuna varılamaz. Karar için bir sonraki tablo
dikkate alınmalıdır.
Karar için bu tabloda dikkate alınması gereken değer, "Sig.(2-tailed)" değeridir. 0.000<0.05 olduğu için
H0 hipotezi reddedilir. Yani " %95 güvenle, deneyden önceki ve sonraki kan basıncı ortalamaları
arasında, istatistiksel olarak anlamlı bir farklılık vardır. " diyebiliriz. Birinci tablo incelendiğinde,
deneyden sonraki kan basıncı ortalamasının, deneyden önceki kan basıncı ortalamasından daha küçük
olduğu görülür. Yani kullanılan bu ilaç kan basıncının düşmesinde etkili olmuştur.
P=0.000
P=<0.0001<0.05
Grup Sayısı 2 Olduğunda Değişken Türüne Göre Test Uygulama Şeması
Yaptığımız araştırmalarda elde ettiğimiz verilere hangi analizleri yapmamız gerektiğine karar verme
aşaması çok önemlidir. Zira bu aşamada grup sayımıza ve değişkenlerimizin bağımlı ya da bağımsız
olma durumuna göre izlenecek ayrı yollar söz konusu olacaktır. Öncelikli olarak grup sayımız 2
olduğunda hangi testler uygulanır bunu bir şema ile özetleyelim.
27
Örnek: Zayıf erkek ve obez kadınlarda 24 saatlik enerji tüketimi değerleri yandaki tabloda verilmiştir.
Bu örnekleme dayalı olarak, 24 saatlik enerji tüketimi bakımından erkek ve kadın arasında anlamlı bir
farklılık var mıdır? α=0.05 anlamlılık seviyesinde iki yönlü test kullanınız
Erkrk 5.98 7.45 7.30 6.30 5.80 6.70 8.40 10.15 7.48 9.80
Kadın 11.40 10.98 8.76 9.47 7.89 8.90 12.30 11.40 10.90 9.36
Örneğimizi incelediğimizde kadın ve erkek olmak üzere iki gruptan oluştuğu ve bu grupların birbirinden
bağımsız gruplar olduğu görülmektedir. Bu durumda şemamızdan da görüleceği üzere veri setimizde
öncelikli olarak “Normallik Testi” yapmamız gerekecek. SPSS de normallik testi için Analyze >
Descriptive Statistics > Explore seçeneği tıklanır. Zayıf ve obez, erkek ve kadınlarda 24 saatlik enerji
tüketimi değerleri Factor List” kısmına da grubumuz (Cinsiyet) sütunları taşınır. Plots seçeneği
tıklandığında açılan ekrandaki “Normality plots with tests” kısmındaki kutucuğa tik işareti konulur.
Daha sonra sırasıyla Continue ve OK tıklanır.
p>0,05 H0 reddedilemez
H0: Zayıf erkek ve Obez kadınlarda enerji tüketimi değerlerinin varyansları arasında fark yoktur.H1:
Zayıf kadınlarda ve Obez kadınlarda enerji tüketimi değerlerinin varyansları arasında fark vardır.
28
Bu seçimler yapıldıktan sonra sonuçlar aşağıdaki gibi olacaktır.
H0: Zayıf erkek ve Obez kadınlarda enerji tüketimi değerlerinin varyansları arasında fark yoktur.H1:
Zayıf erkek ve Obez kadınlarda enerji tüketimi değerlerinin varyansları arasında fark vardır.
α değeri, Tip I hata olasılığıdır. Örnek için gerçekte enerji tüketimi bakımından gruplar arasında fark
yokken; farklılık bulma olasılığıdır. Örneğimiz için, α değeri 0.05 olarak belirlenmiştir.
29
Wilcoxon Testi
Bağımlı İki Örnek T Testinin (Paired Samples T-Test) parametrik olmayan karşılığıdır, n birimlik
örnekten elde edilen iki gözlem grubu farkının ortancası sıfır olan toplumdan çekilmiş rasgele örnek olup
olmadığını test eder.
Mann-Whitney U Testi
Mann-Whitney U testini, Bağımsız İki Örnek T Testinin parametrik olmayan karşılığı olarak kabul
etmek mümkündür. Bu test için verinin dağılımı konusunda bir koşul öne sürülmez. Mann-Whitney U
testi ile bağımsız iki grubun aynı dağılıma sahip ana kütlelerden geldiği hipotezi test edilir, "t" testi için
koşulların uygun olmadığı durumlarda bu test uygulanmalıdır. Eğer koşullar uygun ise öncelikle t testi
uygulanmalıdır. Çünkü "t" testi daha güçlüdür.
Kruskal-Wallis Testi,
Birbirinden bağımsız iki ya da daha fazla grubun (örneklemin) bağımlı bir değişkene ilişkin ölçümlerinin
karşılaştırılarak iki dağılım arasında anlamlı bir fark olup olmadığını test etmek amacı ile kullanılır. Bu
testte ve parametrik olmayan diğer testlerde, gruplara ait ölçümlerin karşılaştırılmasında aritmetik
ortalama yerine ortanca (medyan) değer esas alınır.
Grup Sayısı ≥ 3 Bağımsız Değişken İçin Test Uygulama Şeması
30
ANOVA TESTLERİ
ANOVA’da F testini kullandığımız için bu testin sonuçlarının geçerli olabilmesi için diğer parametrik
testlerde olduğu gibi bazı varsayımların yerine gelmesi gerekmektedir. T-testi uygularken iki grubun
ortalamalarının eşit olup olmadığını test ediyorduk. Eğer p değeri alfa (0.05) değerinden büyük çıkarsa
sıfır hipotezi (iki grubun ortalamasının eşit olması) reddedemiyorduk. Eğer p değeri alfa değerinden
düşük çıkarsa sıfır hipotezi reddediyor ve alternatif hipotezi (iki grubun ortalamasının farklı olması)
kabul ediyorduk.
Rastgele tam blok tasarım faktörünün parametrik testi
Latin kare tasarım faktörünün parametrik testi
Çok faktörlü veya çok faktörlü (birden fazla faktör) parametrik faktöryel test
Varyansların homojenliği (homojenlik)
Verilerin bağımsız olması (bağımsızlık)
Bağımlı değişkenin en az eşit aralıklı ölçek olması
Grup içi dağılımların normal olması (within group normality) (normallik)
Bir grup değişkenine (categorical) sahip olunmalıdır.
Verimizde her han
ANOVA bu varsayımların ihlaline dirençli bir yöntemdir. Özellikle grup büyüklükleri eşit
(n1=n2=n3) olduğunda ANOVA normallik ve grup varyans homojenliği varsayımı ihlallerine
dirençlidir.
Test sonuçlarını incelediğimizde tüm gruplar için hesaplanan P değerleri > 0,05 olduğundan normal
dağılım gerçekleşmiştir. Şemamızı incelediğimizde normal dağılım pozitif olduğundan “Tek Yönlü
Varyans” Analizi yapılacaktır. Bu analizi de Analyze > Compare Means > One-Way ANOVA
seçeneğinden yapmaktayız
31
Yukarıda görüldüğü gibi Tek Yönlü Varyans Analizi için açılan pencerede Dependent List kısmına SKB
değerlerinin bulunduğu sütunu, Factor kısmına da H-GRUP sütunumuzu taşıdıktan sonra “Post Hoc”
butonu tıklanır. Açılan pencerede Varyans Homojenliğinin sağlandığıSKB, Tukey, Bonferroni
kısımlarına, Varyans Homojenliğinin Sağlanmadığı Tamhane’ T2, Dunnet’s T3 kısımlarına tik işareti
konulur. Buradaki amaç testimizin Varyans Homojenliği sonucuna göre uygun olan test sonucunu
görerek karar vermektir.
ANOVA Testinden görüldüğü üzere P değerimiz <0,007 olduğu için varyans homojenliği
sağlanamamıştır. Bu durumda Tamhane’ T2 ya da Dunnet’s T3 test sonuçlarına göre karar vermemiz
gerekecek. Şayet P değerimiz > 0,05 olsaydı 0,05 anlamlılık düzeyinde varyans homojenliği sağlanmıştır
diyecektik ve SKB, Tukey ya da Bonferroni testlerine göre karar verecektik
32
Burada grupların varyansları homojen olduğu için "Tukey" testi incelenir(Eğer homojen olmasaydı "Tamhane"
testi incelenirdi). Bu tabloda her grubun ikişerli karşılaştırmaları yapılmış ve bu karşılaştırılan grupların
ortalamaları arasındaki farklar(Mean Difference) sayısal olarak verilmiştir.
33
Kruskal-Wallis testi
Kruskal-Wallis H testi (KWH) parametrik olmayan tek yönlü varyans analizi yöntemidir. K bağımsız
örneğin benzer ortanca değerli toplumların rastgele örnekleri olup olmadığını test eder. KWH testi
uygulanacak verilerin aralıklı ya da oransal ölçekli olması gerekir.
KWH testinde aşağıdaki hipotezler test edilir.
H0: k örnek benzer medyanlı toplumlardan alınmışörneklerdir.
H1: k örnekten an az birinin medyanı diğerlerinden farklıdır
SPSS’te “Kruskal Wallis h” testi parametrik testlerden “One Way Anova” testine karşılık gelmekte olup
bu test medyan değerleri üzerinde çalışmaktadır. Bu test için geliştirilecek hipotez ise şudur.
Katılımcıların medeni durumları ile iş tatmini algılama düzeyleri arasında anlamlı bir farklılık
bulunmamaktadır.Spss’te Kruskal Wallis testinin yapılması için Analyse, Nonparametric Tests, Legacy
Dialogs içinde K Independent Samples Bölümü seçilir.
Karşıya çıkan ekranın üst kısmına iş tatmini ölçeği alt kısmına ise medeni durum atılır.
34
Spss’te Kruskal Wallis h testinde medeni durumun kaç adet cevaplama hakkı varsa bu göz önüne
alınır ve buradaki “Grouping Variable” kısmına minimum değere “1” maksimum değere ise “3” girilir
ve Continue tuşuna basılır. Daha sonra Ok tuşuna basılarak analizin gerçekleşmesi sağlanır.
35
Regresyon-Korelasyon
Regresyon analizi, değişkenler arasındaki neden-sonuç ilişkisini bulmamıza imkan veren bir analiz
yöntemidir. Örneğin “yemek yeme” ile “kilo alma” arasındaki ilişki regresyon analizi ile ölçülebilir.
Korelasyon analizinde ise iki değişkene arasındaki ilişkinin yönü ve şiddeti hesaplanır. Fakat bu ilişki
bir neden-sonuç ilişkisi olmak zorunda değildir. Örneğin, horozların sabah ötmeleriyle, güneşin doğması
arasında kusursuz doğrusal pozitif korelasyon ilişki vardır. Ancak bu ilişki güneşi horozların doğmasını
sağladığını göstermez.
Korelasyon analizi ile iki farklı değişken arasındaki ilişkinin yönü ve şiddeti hakkında bilgi edinebiliriz. Ancak
daha önce de belirttiğimiz gibi korelasyon, nedensonuç ilişkisinin göstergesi değildir. Örneğin; günlük uyku süresi
ile TV izleme süresi arasındaki ilişki korelasyon ile tahmin edilebilir. SPSS te korelasyon analizi için ; NALYZE
CORRELATE » BIVARIATE menüsünden yararlanılmalıdır.
Bağımlı Değişken (y): Bağımlı değişken, regresyon modelinde açıklanan ya da tahmin edilen
değişkendir. Bu değişkenin bağımsız değişken ile ilişkili olduğu varsayılır.
Bağımsız Değişken (x) : Bağımsız değişken, regresyon modelinde açıklayıcı değişken olup; bağımlı
değişkenin değerini tahmin etmek için kullanılır.
Bağımlı değişken ile bağımsız değişken arasındaki doğrusal ilişkiyi açıklayan tek değişkenli regresyon
modeli aşağıdaki gibidir:
y = a + bx
Burada;
y = Bağımlı değişkenin değeri
a = Regresyon doğrusunun kesişim değeri (Sabit değer)
b = Regresyon doğrusunun eğimi
x = Bağımsız değişkenin değerini göstermektedir
Örnek : Kardiyoloji kliniğine başvuran erkek hastalar üzerinde yapılan bir araştırmada, yaş(x) ve
kolesterol(y) değişkeni arasındaki korelasyondan yola çıkılarak kurulan regresyon modeli aşağıdaki gibi
elde edilmiştir: Y = 3.42 + 0.326X
36
Bu modele göre, yaştaki bir birimlik artışın, kolesterol değerinde 0.326 birimlik bir artışa neden olacağı,
yeni doğan bir erkeğin (X=0) kolesterol değerinin ise 3.42 olacağı söylenebilir. Kurulan bu modele göre,
50 yaşında bir erkeğin kolesterol değerinin ne kadar olacağını tahmin edebiliriz X=50 için :
Y = 3.42 + 0.326*(50) =19.52
50 yaşında bir erkeğin kolesterol değerinin 19.52 olacağı söylenebilir.
Sunumun başında öncevaryans ve kovaryans sonra da korelasyon değerlerini hesapladığımız veriyi SPSS ile
korelasyon değeri hesaplamada kullanacağız. Veride katılımcıların izledikleri yaş sayıları ile aldıkları beden ağı
sayıları çeren iki değişken verilmektedir.
Yan taraftaki ekranda aralarında ilişki olup olmadığını merak ettiğimiz iki değişkeni ekraın sağ tarafına
attıktan sonra Pearson kutucuğunu işaretledikten sonra OK tuşuna basabiliriz. Burada iki yönlü hipotez
için iki kuyruklu (twotailed) seçilir.
37
Options menüsünde ortalama ve standart sapma gibi betimleyici istatistiklerin yanında kovaryans
istatistiği de elde edebiliriz. Eğer verimizde kayıp veri var ise nasıl müdahale edilmesi gerektiğini
(pairwise ya da listwise) de seçebiliriz.
Options Menüsünde işaretlememize göre betimleyici istatistik değerleri elde edebiliriz. Bu tablodaki
değerler sunumun başındaki hesaplamalarımız ile aynıdır.
Korelasyon analizi sonucunda elde ettiğimiz yandaki tabloda korelasyon değerinin yanında, bu değerin
anlamlılığı (p-değeri), çapraz çarpımlar, kovaryans ve örneklem büyüklüğü (N) değerleri elde edilir.
Yandaki tabloya göre 40 değere sahip yaş ve 40 değere sahip kilo değişkenleri arasındaki korelasyon
değeri 0.354 olarak hesaplanmıştır. Sıfır hipotezini reddedemeyeceğimizi söyleyen 0.25 p-değerine göre
anlamlı bir ilişki bulunmamaktadır. Ayrıca kovaryans değeri 37.179 olarak bulunmuştur. Bu değerleri
sunumun başında SPSS kullanmadan hesaplamıştık. Burada bir değişkenin kendi ile olan kovaryansı
varyanstır ve daha önce hesapladığımız (97.54 ve 37.17) varyans değerleri ile aynıdır.
Regresyon
Bir veri kullanılarak önce basit regresyon daha sonra da çoklu regresyon uygulaması gösterilecektir.
Verideki değişkenlerden bir sınıftaki öğrencilere ait olup bir sonraki slaytta açıklanmıştır.
Bu sunumda kullanılan verimizde bulunan değişkenler: (no ,isim , cinsiyet , kitap, yaş, vize, vize2,
final , cinsiyetkod, ders saati, devamsizlik)
SPSS’te Regresyon
İlk olarak bu verideki final sınavından alınan puanlar ile devamsızlık arasında basit regresyon analizi
yapılacak. İkinci olarak final sınavı ile ders çalışma saati arasında basit regresyon analizi yapılacaktır.
Son olarak da bu iki bağımsız değişkenin aynı anda modele girdiği ve final sınavını nasıl etkilediklerini
gösteren çoklu regresyon analizi yapılacaktır. Bu analizlere geçmeden önce korelasyon kullanarak bu 3
değişken arası ilişkiye bir göz atalım.
38
Regresyon analizi de diğer analizler gibi SPSS menülerinden Analyze altında yer almaktadır.
Analyze>Regressio n>Linear alt menülerini tıkladığınızda karşınıza çıkan ekran yan taraftaki gibidir.
Regresyon analizi genel olarak bir değişken üzerinde başka bir değişkenin etkisinin olup olmadığını
araştırdığımız durumlarda tercih edilir. Burada bağımlı değişken bir tane iken onu etkileyen değişkenler
(bağımsız değişkenler) birden fazla olabilir. Tek bağımsız içeren regresyon modeline basit doğrusal
regresyon birden fazla bağımsız değişken içeren regresyon modeline de çoklu doğrusal regresyon adı
verilir.
Bağımlı değişken olarak yaş değişkenini girdikten sonra bağımsız değişken olarak cinsiyet değişkenini
girerek ders çalışma saatinin final notu üzerindeki etkisini yordayabiliriz.
39
Basit regresyon çıktısında regresyon katsayılarını içeren 3. Tablonun yanında R, R-kare ve düzeltilmiş
Rkare değerlerinin olduğu 1. Tablo ve regresyon modelinin anlamlı bulunup bulunmadığını gösteren
ANOVA tablosu (2.Tablo) bulunmaktadır.
R değeri cinsiyet ile yaş değişkeni arasındaki korelasyon değerini, R-kare ise bu korelasyon değerinin
karesini göstermektedir. 0.23 değerindeki R-kare bize yaş değişkeni içindeki varyasyonun (çeşitliliğin)
%86’inin cinsiyet değişkenine atfedilebileceğini söylemektedir.
Basit regresyon çıktısındaki ANOVA tablosu bize regresyon modelimizin genel olarak anlamlı bulunup
bulunmadığını gösterir. Burada F-değerine ve p-değerine (p <0.001) bakarak regresyon modelimizin
anlamlı bulunduğunu söyleyebiliriz. Yani cinsiyet değişkeni yaş değişkeninin anlamlı bir tahmin
edicisidir (predictor). ANOVA genel olarak modelin anlamlılığından bahsetse de her bir değişkenin
anlamlılığından bahsetmez. Burada tek bir değişken olduğu için bunu söyleyebilsek de birden fazla
değişkenin olduğu durumlarda her bir değişkenin anlamlı olup olmadığını öğrenmek için bir sonraki
tabloya bakmamız gerekmektedir.
Coefficients adlı tabloda cinsiyet değişkenine ait regresyon yükü (2.977) ve standartlaştırılmış regresyon
yükü (0.151) rapor edilmektedir.