DEV BİOİSTATİTİK

TC

ONDOKUZ MAYIS ÜNİVERSİTESİ

SAĞLIK BİLİMLERİ ENSTİTÜSÜ

BİYOİSTATİSTİK VE İSTATİSTİK

PAKET PROGRAM KULLANIMI

2019.12.24

DANIŞMAN

DOÇ. DR. LEMAN TOMAK

HAZIRLAYAN

MOHEBULLAH FAQİRİ

1

1. Giriş

1.1. Temel kavramlar

Istatistik : istatistiği bir çok tanımı yapılmaktadır. Genel olarak olylar hakkında bilgilerin toplanması,

bulnların araştırmanın amacın yönelik olarak var olan bir problemin ve bunlar ilişkin değişkenlerin

belirlenmesi, analiz yapılmasına dayanan yöntemlerin bilimine istatistik denir.

Biyoistatistik: istatistiğin biyoloji, tıp ve diğer sağlık bilimlerindeki teknolojisidir.

Birim: Sayılabilir veya ölçülebilir özellikleri (değişkenleri) içeren, aralarında bir çok benzerlikler

olmakla beraber farklılıklar da bulunan nesnelere veya olaylara “istatistik birimi” denir. Eğer,

sayılamayan veya ölçülemeyen nesneler veya olaylar söz konusu olduğunda bunlar istatistik birimi

oluşturmazlar. Örneğin; koku, renk, korku, sevinç vb.

Evren: araştırma sonuçlarının geçerli olacağı büyük grup. Evren birimi, evrenin sınırlandırılmış bir

parçasıdır. Sayım, evrenin tüm birimlerine ulaşılarak bilgilerin toplanmasıdır.

İstatistik birimi; canlı, cansız, bir olgu, bir olay veya bir kurum olabilir.

Örneklem: Araştırılmak istenen bir olayla ilgili evrenden, belli kurallara göre seçilmiş, evreni temsil

ettiği varsayılan küçük bir küme örneklem olarak adlandırılır. çekildiği evreni temsil ettiği düşünülen ve

evrenden çekilen küçük bir grubun oluşturduğu topluluktur.

Örnekleme: kitleye ilişkin parametreleri çikarsamak için günlük etkinliklerin hemen her aşamasinda

sürekli olarak yapilmaktadir.satin alinan ya da üretilen ürünlerin tek tek kontrolü çoğu zaman olanaksiz

olduğundan kitlenin özelliklerini taşiyan bir alt grup incelenerek kitle hakkinda karar verme işlemine

örnekleme denir.

örneklemi seçmek için yapılan işlemlerin tümü

Örnekleme türleri

Örnekleme türleri ile ilgili olarak çeşitli sınıflandırmaların olduğu görülebilir. Örnekleme türlerinin

olasılıklı ve olasılıksız olmak üzere iki şekilde ele alınarak sınıflandırmanın yaygın olarak kullanıldığı

söylenebilir. Olasılıklı örnekleme türleri; basit tesadüfi örnekleme, sistematik örnekleme, tabakalı

örnekleme ve küme örnekleme başlıkları altında ele alınacaktır. Olasılıklı olmayan örnekleme türleri ise

gelişigüzel örnekleme, kota örneklemesi, amaçlı örnekleme ve kartopu örneklemesi olarak ele

alınacaktır.

Küme Örneklemesi: Örneklem birimlerinin birden çok kitle biriminden oluştuğu örnekleme yöntemine

verilen addır. Örneğin; Öğrenciler bölümlerine göre gruplanır, grupların her birinden örnekler seçilir.

Sistematik Örnekleme : Örnekleme birimlerinin uygun bir şekilde sıralandığı bir çerçevenin elimizde

olduğu varsayıldığında ilk k (k=N/n)birimden rasgele seçilen herhangi birisinin başlangıç noktası olarak

alındığı ve bundan sonra gelen her k’ncı birimin örnekleme seçildiği yönteme verilen addır. Örneğin,

büyük bir kentte ev seçimi, sokak seçimi, işyeri seçimi otomobil seçimi gibi.

2

Gelişigüzel örnekleme : Bu tür örnekleme, araştırmacının saptanan örneklem büyüklüğüne göre

herhangi bir şekilde evrenin bir parçasını seçmesidir. Herhangi bir fakülteye gidip saptanacak sayıda

rastlanan öğrenciyi örnekleme alma gelişigüzel örneklemedi.

Kota örnekleme : Kota örneklemede sınırlı bir evren, araştırmanın amacına uygun olarak

araştırmacının öngördüğü belirli değişkenlere göre sınıflandırılır. Bu değişkenler yaş, cinsiyet, eğitim

durumu, meslek, hastalık olabileceği gibi, etnik köken, kırsal ve kentsel değişkenler de olabilir.

Basit tesdüfi Örnekleme : Her bir örnekleme biriminde sadece ve sadece tek bir kitle biriminin

bulunduğu ve her bir örnekleme biriminin örneğe seçilme olasılığının eşit olduğu bu yönteme basit

rasgele örnekleme adı verilmektedir.

Uygun örnekleme : Zaman, para ve işgücü açısından var olan sınırlılıklar nedeniyle örneklemin kolay

ulaşılabilir ve uygulama yapılabilir birimlerden seçilmesidir.

Tabakalı Örnekleme: Örnekleme birimleri araştırma konusu herhangi bir değişkene göre büyük

farklılıklar gösteriyor ise (homojen değilse); kitle değişkenliği daha küçük olan alt gruplara ayrılabilir.

Örneğin; Öğrenciler bölümlerine göre gruplanır, grupların her birinden örnekler seçilir.

Amaçlı örnekleme : Bu örneklemenin temeli, araştırmanın amaçları doğrultusunda bir evrenin temsilci

bir örneği yerine, amaçlı olarak bir ya da birkaç alt kesimini örnek olarak almaktır. Başka bir deyişle

amaçlı örnekleme, evrenin soruna en uygun bir kesimini gözlem konusu yapmak demektir. Endüstride

meslek hastalıklarıyla ilgili olarak yapılacak bir araştırmada, araştırmacının, meslek hastalıklarının tüm

evren içinde değil, özellikle belli bir hizmet süresini aşmış ya da belli bir yaş sınırının üstündeki işçiler

arasında daha açık bir biçimde gözlenebileceğini düşünerek, tüm işçiler evrenini değil, orta yaşlı ve yaşlı

işçiler kesimini temsil eden bir seçim yapması buna örnek verilebilir.

Kartopu örnekleme : Kartopu örneklemede öncelikle evrene ait birimlerden birisi ile temas kurulur.

Temas kurulan birimin yardımıyla ikinci birime, ikinci birimin yardımıyla üçüncü birime gidilir. Bu

şekilde, sanki bir kartopunun büyümesi gibi örneklem büyüklüğü genişler. Orta Doğu Teknik

Üniversitesi’nin kuruluş yıllarındaki felsefesini çalışmak isteyen bir araştırmacı için, Orta Doğu Teknik

Üniversitesi’nde emekliliği yaklaşmış veya emekli olmuş birkaç öğretim üyesi çalışmanın ilk

örneklemini oluşturabilir. Araştırma süreci ilerledikçe, ulaşılan kişilerin yardımıyla daha fazla kişi

listeye dahil edilecek ve liste kartopu gibi büyüyecektir.

Parametre: parametre evrenin özelliklerini tanımlamak için kullanılan ölçüler denir. Araştırma kitle

yerine örneklem üzerinde uygulanıyorsa, parametre değerleri tahmin edilir.

Veri: bir olayı aydınlatmak ya da bir gerçeği ortaya çıkarmak için toplanan materyal (ölçüm, bilgi, belge,

madda) olarak tanımlanabilir.

Değişken ve değişken türleri

Bir durumdan diğerine, gözlemden gözleme farklılık gösteren özelliklere değişken adı verdir.

Nicel ve Nitel Değişkenler

Sürekli ve Süreksiz (Kesikli/Kategorik)Değişkenler

Bağımlı ve Bağımsız Değişkenler

3

Nicel Değişkenleri: Eğer bir değişkenin özelliği sayı ve miktar olarak açıklanan biliyorsa buna nicel

değişken denir. Örnek: Başarı puanı, boy, kilo, uzunluk vb.

Nitel Değişkenler: Eğer bir değişkenin özelliği sınıflandırılıyorsa bunan nitel değişken denir. Örnek:

Cinsiyet (kız-erkek), Lise- üniversite vb.), Sosyoekonomik düzey (Alt- orta-üst)

Sürekli Değişkenler : Sürekli değişkenler iki ölçüm arasında sonsuz sayıda değer alabilirler.Örnek:

Boy, test puanı, zeka puanı, ağırlık-Kğ vb

Süreksiz Değişkenler : Ölçülen özellikle ilgili sınırlı sayıda değer alabilen değişkenlere süreksiz

değişken denir.Örnek cinsiyet (kız-erkek), eğitim durumu ( ilkorta- orta-lise- üniversite)

Bağımlı Değişkenler: Bağımlı değişken üzerimde bağımsız değişkenin etkisi incelenen değişkendir.

Örnek Grip hastalığının iyileşme durumu

Bağımsız değişkenler: Bağımsız değişken araştırmacının bağımlı değişken üzerindeki etkisini test

etmek istediği değişkendir. Örnek kullanılan tedavi yöntemi.

2. Merkezi Eğilim Ölçüleri

Veri setini tanımlamak üzere kullanılan ve genellikle tüm elemanları dikkate alarak veri setini

özetlemek için kullanılan ifadelerdir.

merkezi eğilim ölçüleri) ortalamalardan en önemlileri:

Aritmetik Ortalama

Geometrik Ortalama

Kareli Ortalama

Harmonik Ortalama

Mod

Ortanca (Medyan)

Çeyrekler (Quartiles)

2.1. Aritmetik ortalama

Aritmetik ortalama, en çok kullanılan merkezi eğilim ölçüsüdür. Bir seriyi oluşturan gözlem değerlerinin

toplamının, gözlem sayısına oranı olarak tanımlarır.

Formülü: A. O = X̅ = ∑ x i

i=1 dir.

n

n

4

Örnek veri setimiz için vücut ağırlıklarının aritmetik ortalamasını hesaplayalım;

bulunur.

40

X̅ = ∑ x i

n

İ=1

=

75 + 80 + ⋯ + 84 + 82

40

= 3320

40

= 83

2.2. Geometrik ortalama

Geometrik ortalanma gözlem sonuçları bir önceki gözlem sonucuna bağlı olarak değişiyorsa ve bu

değişimin hızı belirlenmek istrniyor kullanılan bir merkezi eğilim ölçüsüdür.

Formülü;

n

G. O = √x 1 . x 2 … x n

n

n

i=1

= √∏ x i

dir.

Gözlem sayısı arttığında, geometrik ortalamayı yukarıdaki formülden hesaplamak güçleşeceği için

logaritma yardımıyla aşağıdaki formül devreye girer;

n

logG = 1 n ∑ log x i

i=1

Örnek veri setimiz için ilk 5 veriye ait Vücut Kitle Endekslerinin geometric ortalamasını aşağıdaki

gibi hesaplarız;

5

G.O = √30. 43 x 31. 25 x 29. 74 x 33. 30x30. 07

= 30. 93

5

2.3. Kareli ortalama

Kareli Ortalama: Seriyi oluşturan gözlem değerlerinin karelerinin toplamının gözlem sayısına oranının

karekökü olarak tanımlanır.

Formülü;

K. O = √ x 1 2 + x 2 2 + ⋯ + x n

2

n

Örnek veri setimizden boy uzunlukları ilişkin kareli ortalamayı hesaplarsak,

157 + 160 + ⋯ + 174 + 180

K. O = √ = √ 1093135 = 165. 312

40

40

2.4. Harmonik Ortalama

Harmonik ortalamanı nüfus artış hızı, büyüme hızı gibi hız gerektiren durumlarda kullanılan bir ortalama

türüdür. Gözlem birim değerlerinin terslerinin aritmetik ortalamasının tersidir.

Formülü;

H. O =

n

1

∑n

i=1 x i

Örnek veri setimizden yine vücut ağırlıklarına ilişkin harmonik ortalamayı şu şekilde hesaplarız;

6

40

H. O =

1

74 + 1

62 + ⋯ + 1 = 40 = 81. 799

0. 489

82

Ortalamalar arasında şu şekilde bir ilişki bulunur,

A. O ≥ G. O. ≥ H. O

2.5. Ortanca (Medyan)

Bir seriyi en küçük değere sahip gözlemden en büyük değere sahip gözleme doğru sıraladığımızda tam

ortada kalan gözlem değerine Medyan denilmektedir. Şayet bir veri setindeki gözlem sayısı çift ise tam

ortaya gelen iki gözlem değerinin ortalaması medyan değeri olarak hesaplanır.Ortanca değer verilerimizi

büyükten küçüğe ya da küçükten büyüğe doğru sıraladığımızda ortadaki değere ortanca denir. Birim

sayısının tek veya çift olmasına göre medyanın bulunması değişir.

Formülü;

n + 1

2

Örnek: 40 hastaların vücut ağırlıkları yukarda verilişitir.ve vücut ağırılıklarını küçükten büyüğe doğru

sıralayalım

n = 40 olduğundan (n+1)/2=(39+1)/2=20

şimidi de denek sayısı çefit olduğu ortanca bu amaç için en son hastanı değerini (110) dışarıda bırakarak denek

sayısını 39 yapalım.

gözlemi bulduğumuzda bu gözlem değeri bize boy uzunlukları için Medyan değerini verecektir. Yani

80kg olacaktır.

2.6. Tepe Değer ( Mod )

Bir veri grubunda en çok tekrarlanan değere tepe değer(mod) denir. Tepe değerin hesaplanmasında

birimlerin büyüklük sırasına konulması şart değilse de, bu işlemin yapılması tepe değerin bulunmasında

kolaylık sağlar.

En çok tekrar eden değer = 80

7

Örnek veri setimizden vücut ağırlığı sütunu dikkate alındığında 80 kg değeri Mod değerini verir çünkü

seride 9 defa ile en çok kullanılan veridir.

3. Değişkenlik Ölçüleri

Bir durumdan diğerine, gözlemden gözlem farklılık gösteren özelliklere değişken adı verdirşer.

3.1. Değişim aralığı (Range)

Bir serideki en büyük değer ile en küçük değer arasındaki fark olarak tanımlanır.

Formülü;

D. A. = x max − x min

Değişi aralığı = En büyük değer – En küçük değer

R= max-min

Örnek veri setimizde vücut ağırlıklarına ait değişim aralığını bulmak istersek;

D.A.= 110-62 = 48 olarak hesaplarız.

Not: Değişim aralığı, farklı sayıda gözlem değeri içeren ve farklı ölçü birimlerine göre oluşturulmuş

serilerin karşılaştırılmalarında kullanılamaz. Bu değişkenlik ölçüsü, uygulamada eşit sayıda küçük

örneklemlerin değerlendirildiği alanlarda, örneğin istatistik kalite kontrolünde sıkça kullanılmaktadır.

3.2. Ortalama Mutlak Sapma

Veri setindeki her bir gözlem değerinin aritmetik ortalamadan farklarının mutlak değerlerinin toplamının

örnek hacmine bölünmesiyle elde edilir.

Formülü;

8

n

O. A. = 1 n ∑|x i − x̅|

i=1

Örnek veri setimiz için vücut ağırlıklarına ait ortalamayı 80 kg bulmuştuk, şimdi de ortalama mutlak

sapmayı hesaplayalım,

O. A. = 1

1

(|75 − 83| + |80 − 83| + ⋯ + |82 − 83|) = x0 = 0

40 40

3.3. Varyans

Varyans, birim değerlerinin ortalamadan sapmalarının kareler toplamının birim sayısına bölünmesi ile

elde edilir. Varyans gözlem sonuçlarının aritmetik ortalamadan ne ölçüde farklı olabileceğini ortaya

koyan bir dağılım ölçüsüdür. Kitle varyansı , örneklem varyansı ile gösterilir.

Veri setindeki her bir gözlem değerinin aritmetik ortalamadan farklarının karelerinin toplamının

örnek hacminin bir eksiğine bölünmesinden elde edilen değişkenlik ölçüsüne örnek varyansı adı verilir.

Formülü;

S 2 = ∑ n i=1 (x i − x̅) 2

n − 1

n

= 1

n − 1 (∑ x i 2 − (∑

i=1

n

i=1

n

x i)

2

)

Örnek veri setimizden vücut ağırlıklarına ait varyansı hesaplarsak,

S 2 =

1

40 − 1 [(75 − 83)2 + (80 − 83) 2 + ⋯ + (82 − 83) 2 ] = 4422 = 113. 38

39

3.4. Standart sapma

Standart sapma gözlem değerlerinin aritmetik ortalamdan farklarının karelerinin aritmetik ortalamasına

varyans ve varyansın pozitif karekökane ise standart spma denir

Formülü,

9

S = √S 2

vücut ağırlıkları için

S = √113. 38 = 10. 648

3.5. Standart Hata

Ortalamaların standart hatası olarak bilinir. Aynı büyüklükte aynı popülasyondan seçilen örneklemlerin

dağılımıdır. Standart Sapma değerinin denek sayısının kareköküne bölünmesi ile elde edilir. Standart

hatanın küçük olması popülasyondan elde edilen parametrelerin tahmini açısından önemlidir.

Standart sapmanın örnek büyüklüğünün kareköküne bölünmesi ile de Standart Hata bulunur. Burada;

Formülü,

S x̅ =

S

√n

=

10. 648

√40

= 1. 683

3.6. Değişim Katsayısı

Standart sapmayı ortalamanın bir yüzdesi olarak ifade eden ve iki veya daha fazla popülâsyondaki

varyasyonu (değişkenliği) karşılaştırmada kullanılan ölçüye Varyasyon (Değişkenlik) Katsayısı denir.

Formülü,

D. K. = S x̅ x100

Örnek veri setimiz için vücut ağırlıkları ait Varyasyon Katsayısını hesaplayalım;

D. K. =

10. 648

x100 = 12. 8289

83

Aşada ki tablo1 de ilk sütun gözlemlediğimiz birimlerin hasta sıra numarasını (Nicel-kesikli), 2.sütun

cinsiyetini (Nitel-adlandırma), 3.sütun eğitim durum (Nitel-adlandırma), 4.sütun kilosunu (Nicelsürekli),

sütun boyunu (Nicel-sürekli), 6.sütun Vücut Kitle Endeksini (Nicel-sürekli) ve son sütunda da medeni

durumunu (Nitel-sıralı) olarak verilmiştir.

Bu tablodaki ana veri setimiz 40 ferde ait cinsiyet, boy uzunluğu ve vücut ağırlığıdır. Bu veriler ışığında

SPSS’ de “Transform” menüsünden “Compute Variable” sekmesinden yararlanarak “Vücut Kitle

Endeksi” sütunu oluşturulmuştur. Burada formül olarak “KİLO/(BOY)**2” kullanılmıştır. Daha sonra

yine “Transform” menüsünden “Recode into Different Variables” sekmesinden vücut kitle endeksleri

zayıf, normal, kilolu ve obez olmak üzere sıralandırılarak “Vücut Durumu” sütunu oluşturulmuştur.

10

Tanimlayici istatistiklerin spss’ de uygulanmasi

Hasta.No Cinsiyet Eğitim Durumu Kilo Boy BMI Medeni.Durum

1 Erkek Önlisans ve lisans 75 157 30.43 Bekar

2 Erkek Yüksek lisans 80 160 31.25 Bekar


4 Erkek İlköretim 80 155 33.3 Evli

5 Erkek İlköretim 90 173 30.07 Evli

6 Kedın Önlisans ve lisans 88 163 33.12 Bekar

7 Kedın İlköretim 66 165 24.24 Bekar

8 Erkek Önlisans ve lisans 78 164 29 Bekar

9 Erkek Yüksek lisans 80 173 26.73 Boş

10 Kedın Önlisans ve lisans 75 175 24.49 Evli



13 Kedın Doktora 80 165 29.38 Evli


15 Erkek Doktora 80 156 32.87 Boş


17 Erkek Yüksek lisans 94 170 32.53 Bekar



20 Kedın Önlisans ve lisans 92 167 32.99 Boş

21 Erkek Önlisans ve lisans 96 172 32.45 Evli

22 Kedın Yüksek lisans 80 155 33.3 Evli


24 Kedın Doktora 74 161 28.55 Boş




28 Erkek Yüksek lisans 90 172 30.42 Evli

29 Erkek Doktora 92 170 31.83 Boş

30 Erkek İlköretim 68 150 30.22 Bekar









39 Erkek Doktora 84 174 27.74 Evli

40 Erkek İlköretim 82 180 25.31 Boş

11

SPSS de tanımlayıcı istatistikler, “Anlyze” menüsünden, “Descriptive Statistics” sekmesinin

altındaki “Descriptives” sekmesi ile yapılmaktadır.

Açılan menüde işlem yapmak istediğimiz veri setini “Variable(s)” kısmına ortadaki ok yardımıyla

tanımlıyoruz. Daha sonra hangi tanımlayıcı istatistikleri yapacağımızı penceredeki Options” seçeneğini

tıklayarak açılan diğer pencere üzerinde belirliyoruz.

12

Daha sonra sırasıyla “Continue” ve “OK” kısımları tıklanarak ilgili gösterge tablolarını oluşturuyoruz.

Şayet grafik oluşturmak da istersek “Anlyze” menüsünden, “Descriptive Statistics”

sekmesinin altındaki “Frequencies” sekmesini de kullanabiliriz. Burada “Chart”

butonundan istediğimiz grafiği seçebiliriz.

13

14

Bu şekilde yukarıdaki gibi tabloları ve grafikleri de elde edebiliriz.

15

B. HIPOTEZ

2.1. Hipotez : Hipotez araştırmanın olası sonucuna dair yapılan tahminlerin ifadesidir. karşılaşılan özel

duruma ilişkin bir önermedir.

2.2. İstatistiksel hipotez

İstatistiksel hipotez herhangi bir anakütle parametresine ilişkin olarak ileri sürülen ve doğruluğu olasılık

kurallarla araştırılabilen önermedir.

2.3. HIPOTEZ TESTLERİ

İstatistiksel hipotez herhangi bir anakütle parametresine ilişkin olarak ileri sürülen ve doğruluğu olasılık

kurallarla araştırılabilen önermedir. Hipotez test hatıranacağı gibi güven sınırlarının hespaplanmasında

anakütleden çekilen birimlerden hareketle anakütle parametreleri hakkında tahminlerde bu

lunulmaktadır. Hipotez testleri bir örneklem ortalaması ile bu örneklemin çekilmiş olduğunu

düşündüğümüz ortalaması etrafındaki farkın anlamlı olup olmadığını (yani önemli bir fark olup

olmadığını) araştırmamızı sağlayan testlerdir.

Hipotez testleri gözlem ya da deneme sonucu elde edilmiş sonuçların, rastlantıya bağlı olup

olmadığının incelenmesinde kullanılan istatistiksel yöntemlere hipotez testleri denir. Hipotez testleri

sayesinde örnekden elde edilen istatistikler aracılığıyla anakütle parametreleri hakkında karar verilir.

Anakütle parametreleri Hakkında karar verirken doğru ya da yanlış olması muhtemel yargılardan hareket

edilir, ve evrenin tümü üzerinde çalışıldığında, çıkan sonuçlar kesindir. Anlamlılık testi uygulanmaz.

2.4. Hipotez testinin aşamaları : Hipotez testlerinin uygulamasını dört aşamada anlatabiliriz;

2.4.1. Hipotezlerin Kurulması

Sıfır Hipotezi ( H

0), Ortalamalar ve dağılımlar arasında bir farkın (veya ilişkinin) olmadığını savunur.

Karşı Hipotez / araştırma hipotezi (Ha ): Ortalamalarda ve dağılımda bir fark olduğunu savunur, ve Red

Bölgesi (Rejection region): Sıfır hipotezi red edip karşı hipotezi kabul edeceğimiz bölge (p değeri)

H 0: Boş hipotez, sıfır hipotezi

H1ya da Ha : Alternatif hipotez

Bu ifadeler araştırırcının konu ile ilgili ön yargısına bağlı olarak değişir. Eğer araştırıcı I. uygulamanın

II. uygulamadan iyi olacağına dair ön yargısı varsa H1: 1> 2 şeklinde kurulur. Hiçbir ön yargısı yoksa,

H1: 1 2 şeklinde kurulur.

16

2.4.2. Test İstatistiğinin Belirlenmesi

İkinci aşamada elimizdeki verinin özelliklerine ve elde edilmek istenen sonuca göre hangi tür test

istatistiğinin uygulanması gerektiğine karar verilir. Bu konu ilerleyen sayfalarda daha ayrıntılı olarak

anlatılacaktır.

2.4.3. Test İstatistiğinin Hesaplanması

Test İstatistiğinin Hesaplanması: İstatistiksel karar, ileri sürülen sıfır hipotezi ile örneklemlerden elde

edilmiş ortalama, oran vs. gibi istatistiklerin kıyaslanması sonucu ve örneklem istatistiği ile sıfır

hipotezinde belirlenmiş olan ana kütle parametresi arasındaki farkı standart hata birimleriyle ifade eden

bir ölçüye ihtiyaç vardır. Kısaca üzerinde test kurulan örneklem istatistiğine “test istatistiği” denir.

2.4.4. Karar Aşaması

Son aşamada ise hesaplanan test istatistiği değeri ile buna ilişkin tablo değeri karşılaştırılır. Kritik tablo

değeri ile

hesaplanan

test istatistiği

karşılaştırılır,hipotez hakkında karar verilir ve sonuç yorumlanır.

Şayet; Oluşturulan hipotez testinin tek veya çift kuyruklu olarak adlandırılması alternatif hipotezin oluşturulma

biçimine bağlıdır.

Hesaplanan değerin mutlak değeri > Tablo değerinin mutlak değeri ise H

0

aleyhine karar verilir. Yani

Ho reddedilir.

Hesaplanan değerin mutlak değeri < Tablo değerinin mutlak değeri ise H

0

Ho lehine karar verilir. Yani

H

0

reddedilemez.

17

Yukarıdakişekillerde ortalama için yapılan hipotez testine ilişkin tek taraflı ve çift taraflı Ret ve

Kabul bölgeleri görülmektedir.

Eğer alternatif hipotezde ana kütle ortalaması k’dan büyük olarak belirtilirse bu sefer sağ tek

kuyruk testi söz konusudur.

Eğer hipotezde red alanı iki eşit alana bölünmüş durumdaysa çift kuyruk test söz konusudur. Çift

kuyruk testinde alternatif hipotezde eşitsizlik söz konusudur.

Tipik değerleri: 0.01, 0.05, 0.10

H 0

Her yapılan istatistiksel hesaplamada çok az da olsa bir hata payı bulunmaktadır. Hipotez

testlerinde bu hata payı α ya da β ile gösterilmektedir. Genel olarak bu hata payları α = 0,05

olarak kabul edilir.

2.5. Hipotez Testlerindeki Hata Tipleri

Hipotez testleri hata tipleri I. Tip ve II. Tip Hatalar dır. Bilmediğimiz örneklem parametresinin

gerçek değeri karşısında ya; doğrudur yada Ha. Çünkü bu iki hipotez, aynı anda her ikisi birden

H 0

doğru olmayacak şekilde teşkil edilmiştir. Örnek değerlerine dayanarak

konusu olacaktır. O halde,

H 0’ın doğruluk veya yanlışlığı bir kriter,

kriter olarak akla gelebilecek 4 durumu şöyle sıralayabiliriz.

H 0

’ın kabulü veya reddi söz

H 0

’ın kabulü veya reddi de ikinci

I. H0 hipotezi kitle parametresinin gerçek değeri karşısında doğrudur ve biz örnekleme sonucu

H0’ı kabul ederiz. Burada bir hata söz konusu değil.

II. H0 hipotezi doğrudur, fakat örnek değerleri karşısında reddedilmiştir, yani aslında doğru olan

bir hipotez yanlışlık yapılarak reddedilmiştir. Buna I. Tip hata adını veriyoruz.

III. Ho hipotezi yanlıştır ve reddedilmiştir. Burada bir hata söz konusu olmaz.

IV. H0 hipotezi yanlıştır fakat örnek sonuçlarına göre kabul edilmiştir. Burada yapılan hataya da II.

tip hata diyoruz.

Hipotez Testlerinin karar

Doğru

Gerçek Durum

H 0

Yanlış

H 0

Kabul 1-α (Kabul Olasılığı) β (II.Tip Hata)

H

0

Ret α (I.Tip Hata) 1-β (Testin Gücü)

H 0

2.5.1. Aritmetik Ortalaması İçin Hipotez test edilmesi (Kitle Varyansı Biliniyor)

2.5.1.1. Hipotez kurulur :

18

2.5.1.2. Test istatistiğinin belirlenmesi:

Burada normal dağıldığı ve kitle standart sapması bilindiği için Z testi uygulanacaktır.

2.5.1.3. Test istatistiği hesaplanır :

2.5.1.4. Karar aşaması

Örnek (Aritmetik Ortalaması İçin Hipotez test edilmesi ) Belirli bir tür hastalığın tedavisi için yeni

bir tür ilaç geliştirilmiştir. Bu ilaçla tedavi edilen hastaların ortalama iyileşme süresinin 10 günden az

olduğu iddia edilmektedir. Rasgele olarak seçilen 7 hasta sözü edilen ilaçla tedavi edilmiş ve kaç günde

iyileştikleri aşağıdaki gibi saptanmıştır.

Çözüm: Öncelikler örnek sorumuzda bize verilen değerleri ifade edelim;

x i : 2, 4, 11, 3, 4, 6, 8

2 4 ve 0. 01 ise kararınız ne olur? % 99 güven düzeyinde kitle ortalaması için güven aralığı

oluşturunuz.

1. Hipotezlerin kurulması:

H 0 = μ = 10

H 1 = μ < 10

2. Test istatistiğinin belirlenmes:

Burada örneğimizin normal dağıldığı ve kitle standart sapması bilindiği için Z testi uygulanacaktır.

19

3. Test istatistiği hesaplanır :

4. Karar aşaması :

Z H = X̅ − μ 5. 43 − 10

∂/

=

2

= −6046

√n √7

Z H = −6. 046 < −2 T < 0. 01 = −2. 33 olduğundan red edilir, yani bu ilaçla tedavi edilen

hastaların ortalama iyileşme süresinin 10 günden az olduğu %99 güvenle söylenebilir.

H 0

Örnek (İki Ortalama Farkının Hipotez Test Edilmesi): A ilacının ortalama etki süresinin B ilacının

ortalama etki süresinden daha büyük olduğu öne sürülmektedir. A ilacı verilen hastaların etki süresine

göre dağılımı normal ve varyansı 30 olarak bilinmektedir.B ilacı verilen hastaların etki süresine göre

dağılımı da normal ve varyansı 36 olarak bilinmektedir. Rasgele seçilen 5 hastaya A ilacı verilmiş ve

ortalama etki süresi 51 olarak bulunmuş ve yine rasgele seçilen 7 hastaya Bilacı verilmiş ve ortalama

etki süresi 39.57 olarak bulunmuştur. Buna göre %95 güven düzeyinde iddiayı test ediniz, A ve B

ilaçlarının ortalama etki süreleri arasındaki fark için %95 lik güven sınırlarını belirleyiniz.

Çözüm: Öncelikler örnek sorumuzda bize verilen değerleri ifade edelim;

X 1 = 51 X 2 = 39. 57 n 1 = 5 n 2 = 7 ∂ 1 2 = 30 ∂ 2

2

= 36

1. Hipotezlerin kurulması:

H 0 = μ 1 = μ 2 ya da μ 1 − μ 2 = 0

H 1 = μ 2 ≠ μ 2 ya da μ 1 − μ 2 ≠ 0

2. Test istatistiğinin belirlenmesi:

Burada örneğimizin normal dağıldığı ve kitle varyansları bilindiği için Z testi uygulanacaktır.

3. Test İstatistiğinin Hesaplanması:

4. Karar aşaması:

α = 0. 05

H 1 = μ 1 > μ 2

Z H > Z T Olduğundan H 0 Red edilir

20

Hipotez testleri için spss uygulamaları

3.1. Tek Örneklem – T testi

Tek örneklem t testinde hipotezler, örneklemden elde edilen ortalama ile evren ortalaması arasında fark

olup olmamasına göre oluşturulur. Örneklem ortalamasının anlamlılığını test etmek üzere kullanılan

parametrik bir tekniktir.

Örnek: Toplumda bireylerin hemoglobin düzeyleri normal dağılım göstermekte ve ortalaması m=14.2

mgr/dl dır. y bölgesinde yaşayan bireylerden rasgele seçilen 10 kişilik bir örnekte hemoglobin düzeyleri

aşağıdaki gibidir. y bölgesinde yaşayan bireylerin hg düzeyleri farklı mıdır?

15 14 15 14 15.80 5.20 14.20 15.80 6 13.70

Örneğimizde n=10 ve toplum varyansı bilinmemektedir.

İlk olarak örneğe ilişkin veriler SPSS’ de oluşturulan Hb_dk sütununa girilir.

Öncelikle verilerin normal dağılıp dağılmadığını test etmek için Analyze > Descriptive Statistics >

Explore seçeneği tıklanır. Açılan pencerede Dependent List kısmına Hb_dk değişkeni taşınır. Display

alanında Plots işaretlenir. Plots seçeneği tıklanır ve görüntülenen ek ekranda Normality plots with tests

seçeneği işaretlenir.

21

Bu bölüme tamamlayıp “OK” e bastığımızda;

Sonuç tablosunu görebiliriz. Burada n<10 olduğundan Shapiro-Wilk testine ait significance değerimize

bakarız ve bu değer 0,01 olarak görülmektedir. Bu değer 0,05 den küçük olduğu için Normal Dağılım

gösterdiği söylenebilmektedir. Bu durumda normal dağılım t testi uygu diğletir.

Hipotezlerin kurulması

H 0 = μ = μ 0 = 10

H 1 ≠ μ ≠ μ 1 = 10

SPSS de tek örneklem t testi için, Anlyze > Compere Means > One-Simple T test seçilir. Görüntülenen

ekranda KPZ_dk değişkeni Test Variable alanına taşınır. “Test Value” alanine 10 değeri girilir.

22

Burada significance değerimiz 0,45 olarak görülmektedir. Bu değer 0,05 den küçük olduğu için

Red edilir.

H 0

N-1= 10-1= 9 sig < 0. 05 Önemli bir fark var

Bu aralığa sıfır eklenirse, ortalama H reddinde% 95'lik bir fark olasılığının sıfıra eşit olduğu ve H0

olduğu varsayılmadığı anlamına gelir.

Sonuç p<0,05 olduğundan ho red

Yorum: y bölgesinden yaşayan bireylerin hemoglobin düzeyleri toplumdan farklılık göstermektedir

ve toplumdan daha yüksektir

Bağımsız İki Örneklem “T testi”

Örnek: Kadiyoloji hastaliklarin 23 erkek ve 17 kadın bireyin kanser belirtilerinin başladığı andaki

sistolik kanbast aşağıdaki gibi belirlenmiştir. Örneklem normal dağıldığına göre erkek ve kadınlarda bu

kadiyoloij hastalik sistolik HTN ortalamaları arasında 0,05 anlamlılık düzeyinde önemli bir fark var

mıdır?

Hipotezlerin kurulması:

SPSS de iki örneklem t testi için, Anlyze > Compere Means > Independent-Simples T test seçeneği

tıklanır. Açılan pencerede” Test Variable(s)” alanına Sistolik HTN , “Groupin Variable” alanına cinsiyet

taşınır. Define Groups seçeneği tıklanır ve görüntülenen ekranda Group1 için 1, Group2 için 2 girilir.

Continue ve OK tıklanır.

23

Bu bölüme tamamlayıp “OK” e bastığımızda

24

Bağımlı İki Örneklem “T testi”

Bağımlı örneklem t-testi, bir değişkenin, iki farklı durumda gözlemlenen değerlerinin ortalamalarını

karşılaştırır. Bu iki durum genellikle uygulanacak bir yöntemin öncesi ve sonrası şeklinde olur. (Örnekte

kullanılan veri setini buradan indirebilirsiniz...)

Örnek: Bu veri setinde yeni bir ilacın kan basıncı üzerindeki etkisi araştırılmaktadır. Hastaların ilacı

kullanmadan önceki kan basınçları (Before_exp_BP) ve ilacı kullandıktan sonraki kan basınçları

(After_exp_BP) ölçülmüştür. Bunlar aynı kişilere ait ve bir uygulamadan önceki ve sonraki değerler

olduğu için bağımlı değişkenlerdir. Dolayısıyla bu iki değişkenin ortalamasını karşılaştırmak için en

uygun test Bağımlı Örneklem t_testi olacaktır. Öncelikle hipotezler kurulmalıdır.

Bağımlı Örneklem t-Testi için hipotezler;

H0: %95 güvenle, deneyden önceki ve sonraki kan basıncı ortalamaları arasında, istatistiksel olarak

anlamlı bir farklılık yoktur. (M1=M2)

H1:%95 güvenle, deneyden önceki ve sonraki kan basıncı ortalamaları arasında, istatistiksel olarak

anlamlı bir farklılık vardır. (M1< >M2)

Daha sonra bağımlı iki örneklem T testi için Anlyze > Compere Means > Paired-Simples T Test

seçenekleri seçilir. Before_exp_BP ve After_exp_BP değişkenleri Paired Variables alanına taşınır. OK

tıklanır

25

Analyze > Compare Means > Paired Sapmle t-test

İlgili bağımlı değişkenler şekildeki gibi seçilir. Daha sonra "Options" bölümünden testin güvenilirlik

yüzdesi belirlenebilir. Ayrıca burada birden fazla veri çifti de analiz edilebilir.

Bu seçimler yapıldıktan sonra sonuçlar aşağıdaki gibi olacaktır.

26

Görüldüğü gibi bu tabloda değişkenlerin ortalamaları birbirinden farklıdır. Ancak sadece bu tabloya

bakılarak bu farklılığın anlamlı yada anlamsız olduğu sonucuna varılamaz. Karar için bir sonraki tablo

dikkate alınmalıdır.

Karar için bu tabloda dikkate alınması gereken değer, "Sig.(2-tailed)" değeridir. 0.000<0.05 olduğu için

H0 hipotezi reddedilir. Yani " %95 güvenle, deneyden önceki ve sonraki kan basıncı ortalamaları

arasında, istatistiksel olarak anlamlı bir farklılık vardır. " diyebiliriz. Birinci tablo incelendiğinde,

deneyden sonraki kan basıncı ortalamasının, deneyden önceki kan basıncı ortalamasından daha küçük

olduğu görülür. Yani kullanılan bu ilaç kan basıncının düşmesinde etkili olmuştur.

P=0.000

P=<0.0001<0.05

Grup Sayısı 2 Olduğunda Değişken Türüne Göre Test Uygulama Şeması

Yaptığımız araştırmalarda elde ettiğimiz verilere hangi analizleri yapmamız gerektiğine karar verme

aşaması çok önemlidir. Zira bu aşamada grup sayımıza ve değişkenlerimizin bağımlı ya da bağımsız

olma durumuna göre izlenecek ayrı yollar söz konusu olacaktır. Öncelikli olarak grup sayımız 2

olduğunda hangi testler uygulanır bunu bir şema ile özetleyelim.

27

Örnek: Zayıf erkek ve obez kadınlarda 24 saatlik enerji tüketimi değerleri yandaki tabloda verilmiştir.

Bu örnekleme dayalı olarak, 24 saatlik enerji tüketimi bakımından erkek ve kadın arasında anlamlı bir

farklılık var mıdır? α=0.05 anlamlılık seviyesinde iki yönlü test kullanınız

Erkrk 5.98 7.45 7.30 6.30 5.80 6.70 8.40 10.15 7.48 9.80

Kadın 11.40 10.98 8.76 9.47 7.89 8.90 12.30 11.40 10.90 9.36

Örneğimizi incelediğimizde kadın ve erkek olmak üzere iki gruptan oluştuğu ve bu grupların birbirinden

bağımsız gruplar olduğu görülmektedir. Bu durumda şemamızdan da görüleceği üzere veri setimizde

öncelikli olarak “Normallik Testi” yapmamız gerekecek. SPSS de normallik testi için Analyze >

Descriptive Statistics > Explore seçeneği tıklanır. Zayıf ve obez, erkek ve kadınlarda 24 saatlik enerji

tüketimi değerleri Factor List” kısmına da grubumuz (Cinsiyet) sütunları taşınır. Plots seçeneği

tıklandığında açılan ekrandaki “Normality plots with tests” kısmındaki kutucuğa tik işareti konulur.

Daha sonra sırasıyla Continue ve OK tıklanır.

p>0,05 H0 reddedilemez

H0: Zayıf erkek ve Obez kadınlarda enerji tüketimi değerlerinin varyansları arasında fark yoktur.H1:

Zayıf kadınlarda ve Obez kadınlarda enerji tüketimi değerlerinin varyansları arasında fark vardır.

28

Bu seçimler yapıldıktan sonra sonuçlar aşağıdaki gibi olacaktır.

H0: Zayıf erkek ve Obez kadınlarda enerji tüketimi değerlerinin varyansları arasında fark yoktur.H1:

Zayıf erkek ve Obez kadınlarda enerji tüketimi değerlerinin varyansları arasında fark vardır.

α değeri, Tip I hata olasılığıdır. Örnek için gerçekte enerji tüketimi bakımından gruplar arasında fark

yokken; farklılık bulma olasılığıdır. Örneğimiz için, α değeri 0.05 olarak belirlenmiştir.

29

Wilcoxon Testi

Bağımlı İki Örnek T Testinin (Paired Samples T-Test) parametrik olmayan karşılığıdır, n birimlik

örnekten elde edilen iki gözlem grubu farkının ortancası sıfır olan toplumdan çekilmiş rasgele örnek olup

olmadığını test eder.

Mann-Whitney U Testi

Mann-Whitney U testini, Bağımsız İki Örnek T Testinin parametrik olmayan karşılığı olarak kabul

etmek mümkündür. Bu test için verinin dağılımı konusunda bir koşul öne sürülmez. Mann-Whitney U

testi ile bağımsız iki grubun aynı dağılıma sahip ana kütlelerden geldiği hipotezi test edilir, "t" testi için

koşulların uygun olmadığı durumlarda bu test uygulanmalıdır. Eğer koşullar uygun ise öncelikle t testi

uygulanmalıdır. Çünkü "t" testi daha güçlüdür.

Kruskal-Wallis Testi,

Birbirinden bağımsız iki ya da daha fazla grubun (örneklemin) bağımlı bir değişkene ilişkin ölçümlerinin

karşılaştırılarak iki dağılım arasında anlamlı bir fark olup olmadığını test etmek amacı ile kullanılır. Bu

testte ve parametrik olmayan diğer testlerde, gruplara ait ölçümlerin karşılaştırılmasında aritmetik

ortalama yerine ortanca (medyan) değer esas alınır.

Grup Sayısı ≥ 3 Bağımsız Değişken İçin Test Uygulama Şeması

30

ANOVA TESTLERİ

ANOVA’da F testini kullandığımız için bu testin sonuçlarının geçerli olabilmesi için diğer parametrik

testlerde olduğu gibi bazı varsayımların yerine gelmesi gerekmektedir. T-testi uygularken iki grubun

ortalamalarının eşit olup olmadığını test ediyorduk. Eğer p değeri alfa (0.05) değerinden büyük çıkarsa

sıfır hipotezi (iki grubun ortalamasının eşit olması) reddedemiyorduk. Eğer p değeri alfa değerinden

düşük çıkarsa sıfır hipotezi reddediyor ve alternatif hipotezi (iki grubun ortalamasının farklı olması)

kabul ediyorduk.

Rastgele tam blok tasarım faktörünün parametrik testi

Latin kare tasarım faktörünün parametrik testi

Çok faktörlü veya çok faktörlü (birden fazla faktör) parametrik faktöryel test

Varyansların homojenliği (homojenlik)

Verilerin bağımsız olması (bağımsızlık)

Bağımlı değişkenin en az eşit aralıklı ölçek olması

Grup içi dağılımların normal olması (within group normality) (normallik)

Bir grup değişkenine (categorical) sahip olunmalıdır.

Verimizde her han

ANOVA bu varsayımların ihlaline dirençli bir yöntemdir. Özellikle grup büyüklükleri eşit

(n1=n2=n3) olduğunda ANOVA normallik ve grup varyans homojenliği varsayımı ihlallerine

dirençlidir.

Test sonuçlarını incelediğimizde tüm gruplar için hesaplanan P değerleri > 0,05 olduğundan normal

dağılım gerçekleşmiştir. Şemamızı incelediğimizde normal dağılım pozitif olduğundan “Tek Yönlü

Varyans” Analizi yapılacaktır. Bu analizi de Analyze > Compare Means > One-Way ANOVA

seçeneğinden yapmaktayız

31

Yukarıda görüldüğü gibi Tek Yönlü Varyans Analizi için açılan pencerede Dependent List kısmına SKB

değerlerinin bulunduğu sütunu, Factor kısmına da H-GRUP sütunumuzu taşıdıktan sonra “Post Hoc”

butonu tıklanır. Açılan pencerede Varyans Homojenliğinin sağlandığıSKB, Tukey, Bonferroni

kısımlarına, Varyans Homojenliğinin Sağlanmadığı Tamhane’ T2, Dunnet’s T3 kısımlarına tik işareti

konulur. Buradaki amaç testimizin Varyans Homojenliği sonucuna göre uygun olan test sonucunu

görerek karar vermektir.

ANOVA Testinden görüldüğü üzere P değerimiz <0,007 olduğu için varyans homojenliği

sağlanamamıştır. Bu durumda Tamhane’ T2 ya da Dunnet’s T3 test sonuçlarına göre karar vermemiz

gerekecek. Şayet P değerimiz > 0,05 olsaydı 0,05 anlamlılık düzeyinde varyans homojenliği sağlanmıştır

diyecektik ve SKB, Tukey ya da Bonferroni testlerine göre karar verecektik

32

Burada grupların varyansları homojen olduğu için "Tukey" testi incelenir(Eğer homojen olmasaydı "Tamhane"

testi incelenirdi). Bu tabloda her grubun ikişerli karşılaştırmaları yapılmış ve bu karşılaştırılan grupların

ortalamaları arasındaki farklar(Mean Difference) sayısal olarak verilmiştir.

33

Kruskal-Wallis testi

Kruskal-Wallis H testi (KWH) parametrik olmayan tek yönlü varyans analizi yöntemidir. K bağımsız

örneğin benzer ortanca değerli toplumların rastgele örnekleri olup olmadığını test eder. KWH testi

uygulanacak verilerin aralıklı ya da oransal ölçekli olması gerekir.

KWH testinde aşağıdaki hipotezler test edilir.

H0: k örnek benzer medyanlı toplumlardan alınmışörneklerdir.

H1: k örnekten an az birinin medyanı diğerlerinden farklıdır

SPSS’te “Kruskal Wallis h” testi parametrik testlerden “One Way Anova” testine karşılık gelmekte olup

bu test medyan değerleri üzerinde çalışmaktadır. Bu test için geliştirilecek hipotez ise şudur.

Katılımcıların medeni durumları ile iş tatmini algılama düzeyleri arasında anlamlı bir farklılık

bulunmamaktadır.Spss’te Kruskal Wallis testinin yapılması için Analyse, Nonparametric Tests, Legacy

Dialogs içinde K Independent Samples Bölümü seçilir.

Karşıya çıkan ekranın üst kısmına iş tatmini ölçeği alt kısmına ise medeni durum atılır.

34

Spss’te Kruskal Wallis h testinde medeni durumun kaç adet cevaplama hakkı varsa bu göz önüne

alınır ve buradaki “Grouping Variable” kısmına minimum değere “1” maksimum değere ise “3” girilir

ve Continue tuşuna basılır. Daha sonra Ok tuşuna basılarak analizin gerçekleşmesi sağlanır.

35

Regresyon-Korelasyon

Regresyon analizi, değişkenler arasındaki neden-sonuç ilişkisini bulmamıza imkan veren bir analiz

yöntemidir. Örneğin “yemek yeme” ile “kilo alma” arasındaki ilişki regresyon analizi ile ölçülebilir.

Korelasyon analizinde ise iki değişkene arasındaki ilişkinin yönü ve şiddeti hesaplanır. Fakat bu ilişki

bir neden-sonuç ilişkisi olmak zorunda değildir. Örneğin, horozların sabah ötmeleriyle, güneşin doğması

arasında kusursuz doğrusal pozitif korelasyon ilişki vardır. Ancak bu ilişki güneşi horozların doğmasını

sağladığını göstermez.

Korelasyon analizi ile iki farklı değişken arasındaki ilişkinin yönü ve şiddeti hakkında bilgi edinebiliriz. Ancak

daha önce de belirttiğimiz gibi korelasyon, nedensonuç ilişkisinin göstergesi değildir. Örneğin; günlük uyku süresi

ile TV izleme süresi arasındaki ilişki korelasyon ile tahmin edilebilir. SPSS te korelasyon analizi için ; NALYZE

CORRELATE » BIVARIATE menüsünden yararlanılmalıdır.

Bağımlı Değişken (y): Bağımlı değişken, regresyon modelinde açıklanan ya da tahmin edilen

değişkendir. Bu değişkenin bağımsız değişken ile ilişkili olduğu varsayılır.

Bağımsız Değişken (x) : Bağımsız değişken, regresyon modelinde açıklayıcı değişken olup; bağımlı

değişkenin değerini tahmin etmek için kullanılır.

Bağımlı değişken ile bağımsız değişken arasındaki doğrusal ilişkiyi açıklayan tek değişkenli regresyon

modeli aşağıdaki gibidir:

y = a + bx

Burada;

y = Bağımlı değişkenin değeri

a = Regresyon doğrusunun kesişim değeri (Sabit değer)

b = Regresyon doğrusunun eğimi

x = Bağımsız değişkenin değerini göstermektedir

Örnek : Kardiyoloji kliniğine başvuran erkek hastalar üzerinde yapılan bir araştırmada, yaş(x) ve

kolesterol(y) değişkeni arasındaki korelasyondan yola çıkılarak kurulan regresyon modeli aşağıdaki gibi

elde edilmiştir: Y = 3.42 + 0.326X

36

Bu modele göre, yaştaki bir birimlik artışın, kolesterol değerinde 0.326 birimlik bir artışa neden olacağı,

yeni doğan bir erkeğin (X=0) kolesterol değerinin ise 3.42 olacağı söylenebilir. Kurulan bu modele göre,

50 yaşında bir erkeğin kolesterol değerinin ne kadar olacağını tahmin edebiliriz X=50 için :

Y = 3.42 + 0.326*(50) =19.52

50 yaşında bir erkeğin kolesterol değerinin 19.52 olacağı söylenebilir.

Sunumun başında öncevaryans ve kovaryans sonra da korelasyon değerlerini hesapladığımız veriyi SPSS ile

korelasyon değeri hesaplamada kullanacağız. Veride katılımcıların izledikleri yaş sayıları ile aldıkları beden ağı

sayıları çeren iki değişken verilmektedir.

Yan taraftaki ekranda aralarında ilişki olup olmadığını merak ettiğimiz iki değişkeni ekraın sağ tarafına

attıktan sonra Pearson kutucuğunu işaretledikten sonra OK tuşuna basabiliriz. Burada iki yönlü hipotez

için iki kuyruklu (twotailed) seçilir.

37

Options menüsünde ortalama ve standart sapma gibi betimleyici istatistiklerin yanında kovaryans

istatistiği de elde edebiliriz. Eğer verimizde kayıp veri var ise nasıl müdahale edilmesi gerektiğini

(pairwise ya da listwise) de seçebiliriz.

Options Menüsünde işaretlememize göre betimleyici istatistik değerleri elde edebiliriz. Bu tablodaki

değerler sunumun başındaki hesaplamalarımız ile aynıdır.

Korelasyon analizi sonucunda elde ettiğimiz yandaki tabloda korelasyon değerinin yanında, bu değerin

anlamlılığı (p-değeri), çapraz çarpımlar, kovaryans ve örneklem büyüklüğü (N) değerleri elde edilir.

Yandaki tabloya göre 40 değere sahip yaş ve 40 değere sahip kilo değişkenleri arasındaki korelasyon

değeri 0.354 olarak hesaplanmıştır. Sıfır hipotezini reddedemeyeceğimizi söyleyen 0.25 p-değerine göre

anlamlı bir ilişki bulunmamaktadır. Ayrıca kovaryans değeri 37.179 olarak bulunmuştur. Bu değerleri

sunumun başında SPSS kullanmadan hesaplamıştık. Burada bir değişkenin kendi ile olan kovaryansı

varyanstır ve daha önce hesapladığımız (97.54 ve 37.17) varyans değerleri ile aynıdır.

Regresyon

Bir veri kullanılarak önce basit regresyon daha sonra da çoklu regresyon uygulaması gösterilecektir.

Verideki değişkenlerden bir sınıftaki öğrencilere ait olup bir sonraki slaytta açıklanmıştır.

Bu sunumda kullanılan verimizde bulunan değişkenler: (no ,isim , cinsiyet , kitap, yaş, vize, vize2,

final , cinsiyetkod, ders saati, devamsizlik)

SPSS’te Regresyon

İlk olarak bu verideki final sınavından alınan puanlar ile devamsızlık arasında basit regresyon analizi

yapılacak. İkinci olarak final sınavı ile ders çalışma saati arasında basit regresyon analizi yapılacaktır.

Son olarak da bu iki bağımsız değişkenin aynı anda modele girdiği ve final sınavını nasıl etkilediklerini

gösteren çoklu regresyon analizi yapılacaktır. Bu analizlere geçmeden önce korelasyon kullanarak bu 3

değişken arası ilişkiye bir göz atalım.

38

Regresyon analizi de diğer analizler gibi SPSS menülerinden Analyze altında yer almaktadır.

Analyze>Regressio n>Linear alt menülerini tıkladığınızda karşınıza çıkan ekran yan taraftaki gibidir.

Regresyon analizi genel olarak bir değişken üzerinde başka bir değişkenin etkisinin olup olmadığını

araştırdığımız durumlarda tercih edilir. Burada bağımlı değişken bir tane iken onu etkileyen değişkenler

(bağımsız değişkenler) birden fazla olabilir. Tek bağımsız içeren regresyon modeline basit doğrusal

regresyon birden fazla bağımsız değişken içeren regresyon modeline de çoklu doğrusal regresyon adı

verilir.

Bağımlı değişken olarak yaş değişkenini girdikten sonra bağımsız değişken olarak cinsiyet değişkenini

girerek ders çalışma saatinin final notu üzerindeki etkisini yordayabiliriz.

39

Basit regresyon çıktısında regresyon katsayılarını içeren 3. Tablonun yanında R, R-kare ve düzeltilmiş

Rkare değerlerinin olduğu 1. Tablo ve regresyon modelinin anlamlı bulunup bulunmadığını gösteren

ANOVA tablosu (2.Tablo) bulunmaktadır.

R değeri cinsiyet ile yaş değişkeni arasındaki korelasyon değerini, R-kare ise bu korelasyon değerinin

karesini göstermektedir. 0.23 değerindeki R-kare bize yaş değişkeni içindeki varyasyonun (çeşitliliğin)

%86’inin cinsiyet değişkenine atfedilebileceğini söylemektedir.

Basit regresyon çıktısındaki ANOVA tablosu bize regresyon modelimizin genel olarak anlamlı bulunup

bulunmadığını gösterir. Burada F-değerine ve p-değerine (p <0.001) bakarak regresyon modelimizin

anlamlı bulunduğunu söyleyebiliriz. Yani cinsiyet değişkeni yaş değişkeninin anlamlı bir tahmin

edicisidir (predictor). ANOVA genel olarak modelin anlamlılığından bahsetse de her bir değişkenin

anlamlılığından bahsetmez. Burada tek bir değişken olduğu için bunu söyleyebilsek de birden fazla

değişkenin olduğu durumlarda her bir değişkenin anlamlı olup olmadığını öğrenmek için bir sonraki

tabloya bakmamız gerekmektedir.

Coefficients adlı tabloda cinsiyet değişkenine ait regresyon yükü (2.977) ve standartlaştırılmış regresyon

yükü (0.151) rapor edilmektedir.

DEV BİOİSTATİTİK

Create successful ePaper yourself

Delete template?

Save as template?