16.07.2015 Views

Slayt 1 - Bartın Üniversitesi

Slayt 1 - Bartın Üniversitesi

Slayt 1 - Bartın Üniversitesi

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

VERİLERİN ANALİZLERE HAZIRLANMASI• Bu bölümde;– Ölçme hataları ve veri hazırlama süreci,– Kodlama, düzeltme ve veri temizleme işlemleri,– Eksik doldurulmuş anketler için çözüm yolları,– Nicel analiz tekniklerinin sınıflandırılması,– Parametrik testler için ön şartlar, çarpıklık vebasıklık,– Uygun analiz tekniğinin seçimi,• Hakkında bilgi verilecektir.


Giriş• Anket, gözlem, mülakat, literatür taraması vb.gibi yollarla toplanan verilere “ham veri”denilir.• Ham verilerin işlenerek, onlara bir anlamyüklenmesine ise “veri analizi” denir.• Bir diğer ifadeyle, veri analizi yardımıylatoplanan verilerin araştırma sorusubağlamında ne ifade ettiği ortaya konmayaçalışılmaktadır.


• Ham veriler, belirli kontrollere tabi tutulmadanve üzerlerinde gerekli düzenlemeleryapılmadan analiz için uygun olmayabilir.• Kontrol ve düzetme yapılmadan işleme tabitutulan verilerden elde edilen sonuçlarınhatalı olma ihtimali çok yüksektir ve telafisimümkün olmayan sonuçlar doğurma ihtimaliyüksektir.


• Ham veri üzerinde yapılacak çeşitli işlemlerle olasıhataların asgariye indirilmesi veya en azından bazıhataların ortadan kaldırılması sağlanmış olacaktır.• Verilerin analize hazırlanması sürecinde ham veriüzerinde kontroller, düzenlemeler ve değişikliklergenellikle, veri saflaştırma, veriye masaj yapma,veri hazırlama veya veri temizleme gibi değişikisimler altında anılmaktadır.


Ölçme hataları• Ölçme, önceden belirlenmiş kurallara görenesnelere ve objelere sayılar atfetme olaraktanımlanabilir.• Sosyal bilimlerde saha çalışması neticesindetoplanan veriler genellikle ölçülmek istenengerçek değerleri yansıtmayabilir.• Bu sebeple istatistiksel analizlerde sahaçalışmasından elde edilen verilerin iki anakısımdan meydana geldiği varsayımıyapılmaktadır.


• Bunlardan birincisi ölçülmek istenen gerçek değer(G), ki araştırmacı bunu bulmaya veya tahminetmeye çalışmaktadır. Diğeri ise hatalar (E) dır.• Ölçme hatalarını ölçülmek istenen gerçekdeğerden sapmalar olarak da kabul etmekmümkündür.• Dolayısıyla analizlerde ölçülen değerlerin gerçekdeğerler yanında hata payını da içerdiği varsayımıyapılarak değerlendirmeler yapılır.• G (Gerçek değer)= X (ölçülen değer) + E (Hatalar)


• Buna göre ölçülmek istenen gerçek değereulaşılmak isteniyorsa, ölçümde yer alacak olanhata teriminin sıfır olması gerekmektedir. Ancakbu pratikte mümkün değildir.• Çünkü, hem bir çok hata kaynağının kontrolaltında tutulması mümkün değildir, hem de çoğuzaman hatanın kaynağını dahi görmek mümkündeğildir.• Bu sebeple, özellikle sosyal bilimlerde hemenhemen her ölçünün belirli derecede hata içerdiğikabul edilmektedir.


• Araştırmacının amacı ve gayretleri olası hataları önlemeyeveya en aza indirmeye çalışmak yönünde olmalıdır.• Araştırmalarda yapılan hataların kaynakları çok çeşitliolabilir, bunlar;– Deneğin karakteri,– Geçici veya kısa süreli kişisel faktörlerde değişme (sağlık,duygu, meşguliyet vb)– Örnekleme ve ölçeklerden kaynaklanan hatalar,– Durumsal faktörler (gürültü, başkalarının varlığı vb)– Mekanik faktörler (silik yazı, anlaşılmayan sorular vb)– Anketin uygulanmasıyla ilgili faktörler (mülakatçıyönlendirmesi) gibi olabilir.


• Bir başka sınıflandırmaya göre saha çalışmasıkaynaklı hataları iki grup altında incelemekmümkündür.1. Örnekleme hataları;• bu tür hatalar saha çalışmasında bilgi kaynağıolan deneklerin veya görüşme yapılan kişilerinaraştırmanın ana kütlesini yeterince iyi temsiledememesinden kaynaklanan hatalardır.(örneğin, ana kütle <strong>Bartın</strong> üniversitesi öğrencileriise, sadece, İİBF işletme bölümü 1. sınıfa anketuygulanması örnekleme hatası olur)


2- Örnekleme dışı hatalar; örnekleme dışındaki tümhata kaynaklarına bağlı hataları kapsamaktadır.Bunlar;• Soru soruş tarzı,• Deneklerin ilgisizlikleri ve isteksizlikleri• Anketörlerin denekleri etkilemesi• Kullanılan ölçeklerin uygun olmaması• Uygun olmayan cevap seçenekleri• Anketin eksik doldurulmuş olması• Verilerin bilgisayara yanlış aktarılması• Kodlama hataları• Yanlış analiz teknikleri vb. gibi hatalardır.


Veri hazırlama süreci• Saha çalışmasında toplanan ham verilerin analizehazır hale getirilmesi amacıyla yapılan işlemlerdizisine veri hazırlama süreci adı verilir. Busüreçte;1. Anketlerin kontrol edilmesi2. Düzenleme /edit etme3. Kodlama4. Verilerin bilgisayar ortamına aktarılması5. Veri temizleme6. İstatistiksel düzenlemeler7. Uygun analiz stratejisinin seçimi


1-Anketlerin kontrol edilmesi• Bu işlem esnasında anketlerin tam olarakdoldurulup doldurulmadığı, cevapların belirli birşekil takip edip etmediği (tüm şıkların aynı şekildeişaretlenmesi gibi), cevaplayıcının anketdoldurmadaki ciddiyeti veya ciddiyetsizliği,soruların anlaşılıp anlaşılmadığı kontrol edilir.• Geri dönen anket sayısının yeterli olup-olmaması(yeterli değilse, yeniden yapılması gibi)


2- Düzenleme (Edit etme)• Düzenleme işlemi geri dönen anketlerin doğrulukve hassasiyetlerini artırmak amacıylayapılmaktadır.• Şıkların doğru kodlanıp- kodlanmadığı,• Açık uçlu soruların bir kodlama sistematiği tabitutulması,• Cevaplandırılmayan sorularla ilgili hususlar;– Doldurulmak üzere geri göndermek– Eksik olan cevabın yerine uygun bir şık işaretlemek– Eksik cevaplı anketlerin iptal edilmesi


3- Kodlama• Verilerin anlamlı bir şekle dönüştürülmesi içinbilgisayar programlarının diline (sayısal hale)dönüştürülmesi işlemidir.• Bilgisayarların anladığı dil sayılardan ibarettir.• Kodlama örnekleri; nominal, aralık,ordinal


4- Verilerin bilgisayar ortamınaaktarılması• Eğer düzeltme işlemi varsa yapıldıktan sonra,kodlar yardımıyla veriler ilgili programagirilmelidir.• Veri girişi esnasında hatalı durumlara karşıuyanık olunmalıdır.


5- Veri temizleme• Bu kademede incelenen konular arasında aşırı uçdeğerlerin tespiti, cevaplar arasındaki mantıkiçelişkilerin saptanması, cevap aralığı dışında kalancevapların bulunması ve temizlenmesi ile eksikcevaplara çözüm bulma yer almaktadır.• Kontrol soruları deneklerin cevap tutarlılıklarınıortaya koymak açısından dikkate alınmalıdır.• Uç değerlere dikkat edilmelidir (Tümü çok iyi veyakötü gibi)


• Eksik değerlerin yeni değerlerle değiştirilmesindekullanılan alternatifler;– Söz konusu değişkenlere ait ortalama değerlerledeğiştirme– Mevcut verilerle oluşturulacak model ile tahminsonucu elde edilen değerlerle değiştirme– Özellikle zaman serisi türü verilerde eksik değişken içineksik gözlemden bir önceki ve sonraki gözlemlerinortalamasını kullanma– Araştırmacı tarafından subjektif olarak tespit edilen birdeğerle değiştirme


6-İstatistiksel düzenlemeler• Verilerin istatistiksel olarak düzenlenmesiişlemi;• değişkenlere ağırlık atama;• değişkenlerin yeniden tanımlanması (kategorisayısının 5’ten 3’e indirilmesi) ve• ölçek transformasyonlarını içermektedir.


7- Uygun analiz stratejisinin seçimi• Yanlış tekniklerin kullanılması hatalı sonuçlarınçıkmasına ve yanlış yorumlara neden olabilir.• Uygun olmayan analiz tekniğinin seçimi sosyalbilimlerde sıklıkla yapılan bir hatadır.


ANALİZ TEKNİKLERİNİNSINIFLANDIRILMASI1. Değişken Sayısına Göre Sınıflandırma2. Veri özelliklerine göre sınıflandırma1. Parametrik analiz teknikleri2. Parametrik olmayan analiz teknikleri3. Amaçlara göre sınıflandırma1. Farklılıkların tespitine yönelik analiz teknikleri2. İlişkilerin analizine yönelik testler


1- DEĞİŞKEN SAYISINA GÖRESINIFLANDIRMA• Bu grupta yer alan analiz tekniklerininsınıflandırmasında kullanılan kriter, analizinkaç değişken üzerinde yapıldığıdır.• Bu grupta yer alan analizler;• Tek değişkenli analizler ve• Çok değişkenli analizler, olmak üzere ikigruba yarılmaktadırlar. (Bazı kaynaklarda,tek, iki ve çok değişkenli analizler şeklindede sınıflandırılmaktadır)


• Tek değişkenli analizlerde, analiz sadece tek birdeğişken üzerinde yapılmaktadır.• Bu analizlerin amacı, genellikle söz konusudeğişkenle ilgili olarak değişik gruplar arasında(denek grupları arasında) istatistiksel anlamdaherhangi bir farkın olup olmadığının veya farklıdenek gruplarına ilişkin cevapların dağılımlarıarasında farkın olup olmadığınınaraştırılmasıdır.


• Örnek; aldıkları maaş açısından, bir işletmedeçalışan bay ve bayan işçiler arasında anlamlıbir fark var mıdır?• Buradaki (tek) değişken, MAAŞ’tır.• Tek değişkenli analiz teknikleri arasında;– T-testi, z-testi, one way ANOVA, Mann Whitney Utesti, ki-kare testi sayılabilir.


• Çok değişkenli testler ise, daha çok iki veyadaha fazla değişken arasındaki ilişkilerinincelendiği tekniklerdir.• Bu tekniklerde belirli değişken(ler)dekideğişim, (bağımlı değişken), diğer değişkenler(bağımsız değişkenler) yardımıyla açıklanmayaçalışılmaktadır.


• Bağımlı değişken; bir veya birden fazladeğişken tarafından açıklanmaya veya tahminedilmeye çalışılan değişkendir.• Bağımsız değişken ise, her hangi bir bağımlıdeğişkenin açıklanmasında veya tahminedilmesinde kullanılan açıklayıcı değişkendir.


• Örneğin; bir tüketicinin alışveriş merkezinegittiğinde yapmış olduğu harcama miktarınıtespit etmek amacıyla cinsiyet ve markettekalış süresi ile harcama miktarı arasındaoluşturulacak olan modelde; harcama miktarıbağımlı değişken ve harcama miktarınıetkileyen cinsiyet ve merkezde kalış süresi isebağımsız değişkenleri temsil etmektedir.


• Çok değişkenli testler arasında;– Korelasyon analizi,– Regresyon analizi,– Ayırma analizi,– Gruplama analizi ve– Faktör analizi sayılabilir.


• Korelasyon Analizi; İki değişken arasındakiilişkinin şiddetini ölçmeye yönelik analiztekniğidir.• Korelasyon analizi, düşük seviyede bir ölçümaracıdır. Daha yüksek seviyelerde ölçüm analizleriise regresyon ve faktör analizleridir.• Regresyon Analizi; bir bağımlı değişken ile birveya birden fazla bağımsız değişken arasındakiilişkiyi incelemektedir. Bir başka deyişle, bağımsızdeğişkenler yardımıyla bağımlı değişkendekideğişimleri açıklamaya çalışan bir analiz tekniğidir.


• Ayırma analizi (diskriminant analizi); regresyonanalizine benzeyen bir analiz tekniği olup,bağımlı değişkenin kategorik (grupları temsileden nominal değerler 0 ve 1 gibi) olduğu vebağımsız değişkenlerin ise en az aralıkölçeğinde olması gereken bir analiz tekniğiolup, amacı gruplar arasındaki ayırımı ortayakoyan değişkenleri tespit etmeyeçalışmaktadır.


• Kümeleme analizi (cluster); denekleri,tüketicileri, insanları veya ankete katılanlarıçeşitli özelliklere göre kümelere ayırmayaçalışan bir analiz tekniğidir.• Faktör analizinde değişkenler arasındakibenzerlikler yardımıyla değişkenlergruplandırılırken, kümeleme analizinde ortaközellikler çerçevesinde bireylerinsınıflandırılması yapılmaktadır.


• Faktör Analizi; birbiri ile ilişkili olduğudüşünülen çok sayıdaki değişken arasındakiilişkinin yapısına ilişkin ipuçları sağlamakamacıyla kullanılan bir analiz türüdür.


2- VERİ ÖZELLİKLERİNE GÖRESINIFLANDIRMA• Bu grup analizlerin sınıflandırılmasındaverilerin özellikleri dikkate alınmaktadır.Buna göre sınıflandırma;1. Parametrik Analiz teknikleri ile2. Parametrik Olmayan Analiz teknikleri,olmak üzere ikiye ayrılarakincelenebilir.


• Parametrik Analiz Teknikleri;• Bazı analiz tekniklerinin uygulanabilmesi için önşart olarak, toplanan verilerin belirli özellikleresahip olmaları veya belirli şartları sağlamalarıbeklenmektedir.• Parametrik analiz tekniklerinin uygulanabilmesiiçin verinin en azından aralık veya rasyoseviyesinde ölçülmüş olması gerekmektedir.• Nominal veya ordinal (sıralama) ölçümseviyesindeki veriler bu test için uygun değildir.


• Parametrik Olmayan Analiz Teknikleri;• İfade edildiği üzere, parametrik analiz tekniklerininveriye uygulanabilmesi için analize tabi tutulacakverilerin belirli şartları taşıması gerekmektedir.• Ancak, şartların birinin veya birkaçının ihlalidurumunda parametrik analiz teknikleri uygulanmaz.• Bu durumda parametrik analiz şartlarını sağlayamayanverilere uygulanabilen ve daha az sayıda şartlar önesüren analiz tekniklerine gerek duyulmaktadır.• Başka bir ifade ile, verinin dağıtımsal özellikleriüzerinde pek fazla durmayan analiz teknikleri gerekliolmaktadır.


• Dağılımdan bağımsız testler olarak da bilinenparametrik olmayan testler, verilerindağılımsal özellikleri ile ilgili olarak, parametriktestlerde olduğu gibi uygulanabilirlik şartıolarak çok katı şartlar ortaya koymamaktadır.


3-AMAÇLARA GÖRE SINIFLANDIRMA• Genel olarak tüm istatistiksel analiz teknikleri iki amacahizmet etmektedirler, bunlardan birincisi farklılıklarıntespiti ve ikincisi ise ilişkilerin incelenmesidir.• Farklılıkların Tespitine Yönelik Analizler;• Bu amaçla kullanılan testler,– T-testi (İki grup arası farklılıklarda)– Ki-kare testi (İki grup arası farklılıklarda)– Z-testi (İki grup arası farklılıklarda)– ANOVA (İkiden fazla grup arası farklılıklarda)– One way ANOVA (İkiden fazla grup arası farklılıklarda)


• İlişkilerin (Bağımlılıkların) TespitineYönelik Analizler ;• Bu anlamda;1. Korelasyon Analizi2. Regresyon Analizi3. Faktör Analizi


UYGUN ANALİZ TEKNİĞİNİN SEÇİMİ• Analizlerin, sağlıklı güvenilir ve faydalıolabilmesi için sadece kullanılan verinin kaliteliolması yeterli olmayıp, uygun analiz tekniğininseçimi de son derece önemlidir.• Tablo 7.1’de farklı veri türleri için uygun analizteknikleri gösterilmektedir.


Test türüParametrikOlmayanParametrikÇeşitli veri türlerine uygun analizÖlçümseviyesiteknikleriFarklılıkların TestleriTek Grupİki grup arasıİki değişkenarası ilişkiNominal •Ki-kare •Ki-kare •Ki-kareOrdinal/Sıralamaİnterval/Aralık veOransal•İşaret testi•Run testi•Z-test•T-testi•MannWhithney Utesti•Wilcoxon•KruskalWallis•Z-test•T-testi•ANOVA (3 vedaha fazlagrup)•Spermanrankkorelasyonu•Regresyon•Korelasyon


HİPOTEZ TESTİ VE TEMEL KAVRAMLAR• Her araştırma bir amaca yönelik olarak yapılır.Bu amaç, bir problemin çözümüne yardımcıolabilecek bilgilerin ortaya çıkarılmasıolabileceği gibi, araştırmacının veyayöneticinin belirli bir konudaki düşüncelerinive önsezilerini test etmek için de olabilir.


Hipotez testi sürecinde takip edilecekaşamalar1. Null ve alternatif hipotezlerin geliştirilmesi2. Uygun testin seçilmesi3. Anlamlılık düzeyinin (alpha) belirlenmesi4. Veri toplanması ve ilgili test istatistiğininhesaplanması5. Test istatistiğine ilişkin değerin belirlenmesi6. Test istatistiği için kritik değerin belirlenmesi7. Null hipotezinin kabul veya reddedilmesi8. Bulguların araştırma problemi açısındanyorumlanması


Null ve alternatif hipotezlerinbelirlenmesi• Bu konu daha önce incelenmiştir. Bu bilgilerışığında uygun null hipotezi geliştirilir.• Yönlü ve yönsüz hipotezler kurulabilir.• Yönlü hipotez: Öğrencilerin %60 nın istemesihalinde ücretsiz İngilizce kursu açılacaktır.• Ho: x≥0.60• H1: x


• Yönsüz hipotez;• Örnek: Öğrencilerin %50 si, <strong>Bartın</strong> ilinin geldiklerişehirlere göre daha pahallı olduğunudüşünmektedirler.• Ho: x=0.50• H1: x≠0.50• Hipotez oluşturulduktan sonra, söz konusuhipotezin test edilmesi gerekmektedir.• Null hipotezi; t-testi, ki-kare testi, z-testi, ANOVA,One Way ANOVA gibi tekniklerle test edilir.


Uygun testin seçilmesi• Tablo 7.1’den den yararlanarak sınanacak testiçin uygun bir analiz tekniği belirlenir.


Anlamlılık düzeyinin belirlenmesi• Ana kütleyi temsil edecek örnek kütleninbelirlenmesi gerekmektedir.• Bu süreçte araştırmacılar iki tür hatayla karşıkarşıyadırlar.• I. Tür hatalar ve II. Tür hatalar.• I. Tür hata; örneklemden elde edilen verilereuygulanan testler ve analizler ışığında gerçektedoğru olan bir null hipotezinin reddedilmesineticesinde ortaya çıkan hatadır.


• II. Tür hata ise, gerçekten de yanlış olan nullhipotezinin analiz neticesinde elde edilenistatistiklere göre doğru kabul edilmesi veyareddedilmemesi ile ortaya çıkan hatadır.


Veri toplama ve test istatistiğininhesaplanması• Bu kademede saha çalışmalarında elde edilenveriler üzerinde daha önce belirlenen uygunistatistiksel analizler uygulanarak, testsonuçları belirlenmektedir.• Bu süreçte örnek boyutu önem arz etmektedir.Çünkü örnek boyutu artıkça sonuçlarıngüvenirlik ve doğruluk derecesi deartmaktadır.


Hesaplanan test istatistiğine ilişkinolasılığın belirlenmesi• Bu kademede yukarıda belirlenen şekildehesaplanan ilgili test istatistiğine tekabül edenolasılık değerinin belirlenmesi gerekmektedir.• Bunun için hazır halde bulunan tablolardanyararlanılabileceği gibi, günümüz modernbilgisayarları bu işlemi araştırmacının talepetmesine gerek kalmaksızın sunmaktadır.• Belirlenen bu değerler, daha sonraki kademedebahsedilecek olan kritik değer ilekarşılaştırılacaktır.


Test istatistiği için uygun kritik değerinbelirlenmesi• Öne sürülen bir null hipotezininreddedilebilmesi için, hesaplanan istatistikdeğerinin belirlenen bir kritik değerin üzerindeolması gerekmektedir.• Örneğin, z-testi için bu değer , %5 (0.05)anlamlılık seviyesi için, 1.96 ve % 1 (0.01)anlamlılık için ise 2.57’dir.• Kritik değer test metoduna göredeğişmektedir.


Null hipotezinin kabul veyareddedilmesi• Bu kademede, daha önce belirlenen değer, birönceki kademede belirlenen değer ilekarşılaştırılarak, null hipotezinin kabul veyareddine karar verilir.• Eğer, belirli bir anlamlılık seviyesinde, (örneğin0.05 anlamlılık seviyesi için hesaplanan değer0.05’den daha yüksek çıkarsa) hesaplanan değerkritik değerden daha büyükse null hipotezireddedilecektir. Aksi halde kabul edilecektir.


Bulguların araştırma problemiaçısından yorumlanması• Hipotez testinin son aşamasında ise, varılansonucun araştırma problemi açısından neanlam ifade ettiği veya etmediği üzerindedurulmaktadır.• Bu kısımda yapılacak en önemli şey, bulgularınve yorumların teknik karmaşıklıktan uzak, sadeve sonuçları kullanacak olan kişilerinanlayabilecekleri seviyede ve açıklıktasunulmasıdır.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!