Bahan Ajar Sampling - Blogs Unpad - Universitas Padjadjaran
Bahan Ajar Sampling - Blogs Unpad - Universitas Padjadjaran
Bahan Ajar Sampling - Blogs Unpad - Universitas Padjadjaran
- No tags were found...
Transform your PDFs into Flipbooks and boost your revenue!
Leverage SEO-optimized Flipbooks, powerful backlinks, and multimedia content to professionally showcase your products and significantly increase your reach.
TINJAUAN MATA KULIAHBAB IPENDAHULUANI. 1 Beberapa DefinisiDalam berbagai media sering dijumpai hasil jejak pendapat dari masyarakattentang isu tertentu, jejak pendapat itu dilakukan untuk mengetahui gambaranpendapat dari masyarakat di daerah dimana jejak pendapat ini dilakukan. Hal serupajuga dijumpai dalam publikasi-publikasi penelitian ilmiah baik yang ditulis dalamrangka penyelesaian studi mahasiswa maupun yang tertera dalam jurnal-jurnalpenelititan. Pada dasarnya semuanya menghendaki gambaran menyeluruh yangdidasarkan pada sebagian objek yang diteliti yang disebut sampel. Gambaran inidihasilkan oleh proses generalisasi atau disebut juga dengan proses induksi .Olehkarena itu, agar diperoleh gambaran yang bisa mengungkapkan keadaan menyeluruhyang sebenarnya, diperlukan dua hal, yaitu proses induksi yang dilakukan dengan carayang tepat, dan sampel yang tergolong “baik”. Dengan proses induksi yang tepatdiartikan sebagai proses yang menggunakan teknik-teknik analisis yang cocok untukpermasalahan yang dikaji serta mengikuti kaidah-kaidah yang mendasarinya. Sampeldikatakan baik apabila dapat menggambarkan semua sifat atau karakteristik darikeseluruhan objek yang diteliti. Untuk dapat memperoleh sampel seperti ini,diperlukan teknik yang disebut teknik sampling.Terdapat beberapa definisi yang diperlukan untuk membahas teknik ini.I.1. 1 Populasi dan SampelPopulasi merupakan keseluruhan (totality) objek, baik itu dari hasilmenghitung maupun mengukur, yang dibatasi oleh kriteria tertentu. Objek populasitersebut terbagi menjadi dua bagian, yaitu objek yang bisa diraba/kongkret (tangiable)dan objek yang tidak bisa diraba/abstrak (untangiable). Banyaknya objek yang adadalam populasi disebut ukuran populasi (population size) yang biasanyadilambangkan dengan N. Ukuran populasi ini besarnya ada yang bisa dihitung(countable) dan juga tidak terhitung (uncountable). Apabila ukuran populasi<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
erapapun besarnya, tapi masih bisa dihitung, maka populasi tersebut dinamakanpopulasi terhingga (finite population). Jika ukuran populasi sudah sedemikianbesarnya sehingga sudah tidak bisa lagi dihitung, maka populasi itu dinamakanpopulasi takhingga (infinite population). Apabila suatu penelitian dilakukan terhadapsemua anggota populasi, maka prosesnya dinamakan SensusDalam suatu penelitian, seringkali peneliti tidak bisa memeriksa seluruhanggota populasi (sensus). Oleh karena itu, hanya diambil sebagian saja dari anggotapopulasi sehingga diperolehlah sampel yang besarnya dilambangkan dengan n.Adapun proses pengambilan sebagian anggota populasi tersebut dinamakan sampling.Gambaran mengenai proses sampling bisa dilihat dari ilustrasi berikut ini :POPULASI ( N )ParameterμσπAlasan -alasanSAMPEL ( n )StatistikxspSensusProses Induksi<strong>Sampling</strong>Gambar I. 1 Proses <strong>Sampling</strong>Terdapat beberapa alasan sehingga peneliti cenderung lebih memilih prosessampling daripada sensus, yaitu :a. Mengurangi biaya, apabila kita melakukan penelitian terhadap sebagian darianggota populasi, maka akan berakibat pada penghematan biaya.b. Masalah tenaga, jelas bahwa semakin banyak objek yang kita teliti, makaakan berakibat pada semakin banyaknya tenaga yang kita butuhkan baik itutenaga pengumpul data / pencacah, pencatat / entri data maupun pengolahdata. Apabila ada keterbatasan untuk ketiga hal tersebut, maka samplingmerupakan alternative terbaik untuk dilakukan.c. Efisiensi waktu, apabila diinginkan kesimpulan yang segera, maka samplingakan lebih tepat untuk digunakan. Hal ini dikarenakan dengan memperkecil<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
anyaknya objek yang akan diteliti maka data akan lebih cepat diperoleh dandianalisis.d. Tingkat ketelitian lebih besar, dalam suatu proses penelitian dari mulaipengumpulan data, pancatatan, dan penganalisisan data harus dilakukandengan benar dan tepat. Apabila kita telah memakai tenaga-tenaga yangberkualitas baik dan diberi latihan intensif, serta pengawasan terhadappekerjaan lapangan diperketat tetapi memberikan volume pekerjaan yangbesar dan cenderung monoton, maka akan menimbulkan kebosanan baik itudari pencacah maupun peneliti. Oleh karena itu, akan diperoleh data yangkurang dapat dipercaya kebenarannya.e. Penelitian bersifat destruktif (penelitian yang sifatnya merusak), sensus tidakmungkin dilakukan untuk objek yang sifatnya merusak. Misalnya dalammenguji golongan darah seseorang, maka tidak mungkin semua darahdikeluarkan untuk diperiksa. Jadi dalam hal ini, sensus tidak mungkin lagiuntuk dilakukan.f. Faktor ekonomis, yang dimaksud dengan ‘faktor ekonomis’ adalahkesepadanan antara biaya, tenaga dan waktu yang dikeluarkan denganinformasi yang akan diperoleh. Apabila nilai dari infomasi tersebut tidaksepadan dengan biaya, tenaga dan waktu, maka sensus menjadi tidak baik lagiuntuk dilakukan.I. 1. 2 Unit ObservasiSuatu objek dimana perlakuan dilakukan disebut unit observasi. Ini merupakanunit dasar dari observasi yang terkadang disebut elemen. Dalam penelitian tentangperilaku masyarakat, maka individu masyarakat adalah unit observasi.I. 1. 3 Populasi TargetPopulasi Target merupakan keseluruhan kumpulan pengamatan/observasisecara lengkap yang akan dipelajari. Menentukan populasi target merupakan langkahawal yang penting pada saat seseorang akan melakukan penelitian. Dalam beberapakeadaan sulit untuk menentukan populasi target. Sebagai contohnya, dalampemungutan suara dalam bidang politik, apakah target populasinya harus semua orang<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
dewasa yang layak memilih? Semua pemilih yang terdaftar? Semua orang yangdipilih pada pemilihan terakhir? Pillihan dari target populasi akan memberikan efekstatistik yang sangat besar terhadap hasilnya. Jadi, dalam setiap penelitian seorangpeneliti pada langkah pertama strateginya harus menentukan secara jelas populasitargetnya yaitu yang nantinya akan menjadi cakupan kesimpulan penelitian. Olehkarena itu, apabila dalam sebuah hasil penelitian dikeluarkan kesimpulan, makamenurut etika penelitian, kesimpulan itu hanya berlaku untuk populasi target yangtelah ditentukan.I. 1. 4 Populasi yang disampelPopulasi yang disampel adalah populasi dimana sampel akan diambil. Padasuatu saat tertentu setelah peneliti menentukan secara tegas populasi targetnya,peneliti tidak bisa memperoleh keterangan mengenai populasi targetnya, sehinggapopulasi yang ditelitinya berbeda (lebih kecil) dari populasi sasarannya.Jadi dalam suatu penelitian survey, idealnya populasi yang disampel adalahjuga populasi target, namun keadaan ideal ini jarang terjadi. Contoh, dalam surveymasyarakat, populasi yang disampel biasanya lebih kecil dari populasi target, sepertitampak dalam gambar berikut :PopulasiKerangkasamplingTidak termasukdalam kerangkasamplingTidak dapatdijangkauMenolakmeresponTidak dapatdijangkauPopulasi yangdisampelTidak layakuntuk disurvaiGambar I. 2 Populasi target dan populasi yang disampel<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Populasi target dan populasi yang disampel dalam survey atau jajak pendapatterhadap suatu kebijakan dari para pemilih melalui suatu telephone, maka yangmenjadi populasi target adalah semua pemilih yang terdaftar. Namun tidak semuapemilih mempunyai telephone, dengan demikian pemilih yang mempunyai telephonedan yang mau menelephone serta berhak merupakan populasi yang disampel.I. 1. 5 Unit samplingUnit sampling merupakan segala sesuatu yang oleh peneliti dijadikan kesatuan(unit) yang nantinya akan menjadi objek pemilihan. Jadi unit sampling itu adalah unityang diambil sebagai sampel. Unit sampling ini bentuknya bisa individu yang berdirisendiri yang disebut satuan elementer (Elementary Unit), dan bisa juga kumpulanindividu yang disebut Cluster. Misalnya, apabila universitas dibagi ke dalam beberapafakultas dan dalam penelitian fakultas ini yang akan dipilih, maka fakultas tersebutmejadi unit sampling. Tetapi apabila universitas dibagi menjadi beberapa jurusan danjurusan ini yang akan dijadikan objek penelitian, maka sekarang yang menjadi unitsamplingnya adalah jurusan.I. 1. 6 Kerangka samplingKerangka sampling (sampling frame) adalah daftar unit sampling yang adadalam sebuah populasi. Dalam survey tentang pendapat masyarakat akan suatukebijakan, maka bila unit samplingnya adalah rumah tangga, daftar yang berisikanrumah tangga, nomor rumah serta alamatnya dan karakteristik lain yang berkaitan,disebut kerangka sampling.Dalam teori sampling, apabila kita harus menyusun sampel, kemudianterhadap data yang dikumpulkan dari sampel ini kita ingin melakukan analisis secarastatistis, maka sampel yang kita susun tadi harus merupakan sampel random. Sampelrandom hanya bisa disusun apabila ada kerangka sampling. Oleh karena itu untuk bisamemperoleh sampel random, kerangka sampling mutlak harus ada.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
I. 1. 7 BiasParameter-parameter populasi hanya bisa diketahui nilainya jika penelitiannya sensus.Dalam penelititan yang bukan sensus, untuk mengetahui nilai parameter tertentu,dilakukan penaksiran melalui sampel.Definisi :Apabila dari sebuah populasi kita akan menaksir sebuah parameter θ dengan penaksirθˆ , maka θˆ disebut estimator untuk θ.Contoh :- Kita ingin menaksir parameter μ dengan X , maka X adalah estimator untukμ- Kita ingin menaksir parameter σ 2 dengan s 2 , maka s 2 adalah estimator untukσ 2- Kita ingin menaksir parameter π dengan p, maka π adalah estimator untuk p.Apabila harga ekspektasi untuk sesuatu penaksir tidak sama dengan parameter yangditaksir maka penaksir itu dikatakan bias.Definisi :Apabila θˆ merupakan penaksir untuk θ yang memenuhi persyaratan bahwa rata-ratauntuk semua θˆ nilainya sama dengan θ, maka dikatakan θˆ adalah penaksir tak biasuntuk θ.Definisi:Apabila parameter yang akan ditaksir adalah θ dan penaksirnya adalah θˆ maka biasdidefinisikan sebagaiB = | θ − E(ˆ) θ |Bias adalah selisih mutlak antara parameter yang ditaksir dengan ekspektasipenaksirnya.a. Bias dalam pemilihan unit sampelSampel yang baik adalah sampel yang bebas dari bias (bias dalam pemilihanunit sampel) terjadi bila beberapa bagian dari populasi target tidak ada dalam populasiyang disampel. Bila suatu survey dirancangkan untuk mempelajari pendapatan rumah<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
tangga yang tinggal menetap (tidak termasuk komuter), maka taksiran rata-ratapendapatan rumah tangga akan mungkin terlalu besar, sehingga memberikan taksiranyang bias.b. Bias dalam pengukuranSampel yang baik adalah juga sampel yang mempunyai sifat bahwa respondenmerespon pertanyaan dengan akurat. Bias dalam pengkuran terjadi bila instrumentyang digunakan untuk mengukur cenderung akan memberikan hasil yang berbeda dariyang sesungguhnya. Jadi instrument tersebut gagal untuk dapat mengukur apa yangsebenarnya harus diukur.Mengukur apa yang seharusnya merupakan hal yangmemang sulit dalam penelitian sosial karena penelitian biasanya berkaitan denganpengukuran karakteristik manusia, yang kadang-kadang tidak bersedia untukmengatakan hal yang sebenarnya. Dla survey penelitian yang dilakukan terhadappetani dalam rangka pemberian bantuan makanan maka mereka akan cenderungmerendahkan hasil pertaniannya dengan harapan memperoleh bantuan pangan.I. 1. 8 Error sampling dan nonsamplingDalam poling pendapat sering dijumpai pernyataan bahwa sampel yangdiambil menggunakan margin error sebesar 5%. Margin error menggambarkanbesarnya sampling error yang ingin diambil oleh peneliti, yaitu error yang dihasilkanakibat penelitian menggunakan sampel (bukan populasi), Idealnya error harus sekecilmungkin, namun bila memperkecil error berakibat bertambah besar sampel. Jikapeneliti mengambil sampel lain yang berbeda, maka jelas akan didapat nilai taksiranyang juga berlainan. Error sampling biasanya dinyatakan dengan terminologyprobabilitas.Jadi error sampling merupakan selisih antara nilai parameter dengan nilaistatistik penaksirnya.Definisi:Apabila θ merupakan sebuah parameter dan θˆ merupakan penaksir bagi θ maka errorsampling didefinisikan sebagai:<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
δ = | θ −θˆ|Error sampling bisa pula berarti semua bentuk error yang ditimbulkan karena prosessampling. Apabila kekeliruan yang terjadi bukan karena proses sampling makakekeliruan itu disebut non-sampling error. Sebagai contoh adalah kekeliruanpengumpulan data sebagai akibat kekeliruan questioner, pemilihan unit sampel danketidakakuratan merespon. Jadi non-sampling error adalah error yang tidak dapatditandai dari variabilitas satu sampel dengan sampel lainnya.I. 1. 9 Presisi dan AkurasiPresisi menunjukkan kekonsistenan atau keseragaman dari nilai penaksir.Makin seragam nilai dari suatu penaksir, maka makin baik presisinya. Dengan katalain bahwa datanya semakin homogen. Dalam ukuran statistik, presisi dinyatakandengan standard error Jadi penaksir yang baik adalah penaksir yang memilikistandard error paling kecil .Sedangkan Akurasi menunjukkan jarak terhadap target. Dalam statistik, yangmenggambarkan akurasi adalah bias yaitu selisih antara penaksir dengan yangditaksir.Gambaran mengenai presisi dan akurasi bisa dilihat dengan menggunakanpemisalan berikut :X X X XX X X X X X XXXX X XX X X XPemanah APemanah BPemanah CGambar I. 3 Ilustrasi presisi dan akurasi dari suatu taksiranGambar di atas dimisalkan sebagai target panahan. Tiga orang pemanahmenembakkan anak panahnya masing-masing pada tiap target tersebut. Dari hasilnyaterlihat bahwa ternyata pemanah A memiliki tingkat presisi dan akurasi yang rendah,<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
dalam arti bahwa hasil dari tembakannya tidak tepat sasaran dengan variasi yang tidakkonsisten. Sedangkan untuk pemanah B menghasilkan suatu tembakan yang konsistensehingga bisa dikatakan bahwa dia memiliki presisi yang tinggi, tetapi masih tidaktepat sasaran atau akurasinya rendah. Untuk pemanah C memberikan kondisi yangterbaik, yaitu memiliki presisi dan akurasi yang tinggi, artinya selain tepat sasaran,juga hasil tembakannya konsisten. Dalam masalah sampling, kondisi seperti pemanahC-lah yang diinginkan.I. 1. 10 Rencana <strong>Sampling</strong> (<strong>Sampling</strong> Plan) dan Rancangan <strong>Sampling</strong> (<strong>Sampling</strong>Design)Ketika kita melakkukan proses sampling, maka secara tegas kita membedakanapa yang dimaksud dengan Rencana <strong>Sampling</strong> dan Rancangan <strong>Sampling</strong>.Rencana <strong>Sampling</strong> merupakan sebuah gambaran garis besar yg menyangkut :1. Penentuan populasi sasaran2. Penentuan bentuk dan ukuran satuan sampling3. Penentuan ukuran sampel ( n )4. Penentuan cara memilih satuan samplingApabila pada rencana sampling di atas kita menambahkan metode penaksiran/metodeanalisis, maka rencana sampling meningkat menjadi Rancangan <strong>Sampling</strong>.Rancangan <strong>Sampling</strong>Rencana <strong>Sampling</strong>Gambar I. 4 Rencana <strong>Sampling</strong> dan Rancangan <strong>Sampling</strong>I. 1. 11 Finite Population Correction (FPC)Apabila kita berhadapan dengan penelitian yang memiliki ukuran populasiterhingga, maka FPC harus dicantumkan pada rumus Standard Error. Jika<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
populasinya tak hingga, maka FPC dianggap sama dengan 1 dan tidak usahdicantumkan dalam rumus Standard Error.N − nBentuk dari FPC itu adalah , tetapi bentuk ini tidak bisa memberikanN − 1keterangan mengenai beberapa hal yang penting. Oleh karena itu dalam pembicaraanita mengenai sampling, bentuk FPC yang akan kita gunakan adalah :Dengan menggunakan rumusyaiotu :N − nN = 1 −nN n FPC = 1 − , maka diperoleh dua buah keterangan N a. Nn , disebut sampling fraction, menyatakan berapa persen sampel yang kita buat(dari populasi). Misalnya jika ada keterangan Nn= 0.15, maka berarti bahwaukuran sampel adalah 15 % dari populasinya.b. Nn menyatakan besarnya peluang setiap satuan sampling untuk termasuk ke dalamsampel berukuran n.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
TINJAUAN MATA KULIAHI. 3 Distribusi <strong>Sampling</strong>Sebagaimana yang telah diuraikan sebelumnya bahwa dengan berbagaialasan, peneliti cenderung melakukan sampling daripada sensus. Dalamkenyataannya, akan terdapat lebih dari sebuah sampel berukuran n yang mungkinyang bisa diambil dari populasi berukuran N. Adanya beberapa kemungkinansampel yang bisa diambil menunjukkan adanya bermacam-macam kombinasi datapopulasi yang bisa terambil Akan tetapi dalam prakteknya hanya akan diambilsebuah sampel untuk digunakan dalam penelitiannya, dengan kata lain bahwahanya akan diambil satu buah kombinasi data. Sampel yang diambil biasanyadipilih secara acak, disebut dengan sampel acak. Selanjutnya dari sampel tersebutdilakukan proses analisis sesuai dengan tujuan penelitiannya. Sebagai contohnyaadalah pada sampel yang bersangkutan akan diperoleh taksiran parameter populasi2θˆ dari θ (θ merupakan lambang parameter populasi [ μ , π , σ ]2merupakan lambang penaksir parameter populasi [ , p,s ], sedangkan θˆx ). Kumpulan nilai-nilaiθˆ pada sampel-sampel yang mungkin disebut sebagaidistribusi sampling dariθˆ .Banyaknya kemungkinan sampel yang bisa diambil tergantung padaproses pengambilan unit-unit populasinya. Berdasarkan proses memilihnya,sampling terbagi ke dalam dua tipe, yaitu sampling dengan pengembalian dansampling tanpa pengembalian. <strong>Sampling</strong> dengan pengembalian merupakan suatuproses pengambilan sampling dimana sampel yang telah terpilih dikembalikanlagi ke dalam populasi sebelum pemilihan selanjutnya dilakukan, sehingga adakemungkinan suatu satuan sampling tertentu akan terpilih lebih dari sekali. Olehkarena itu, jika sampling dilakukan dengan pengembalian, maka akan terdapat N nbuah sampel yang berlainan. Adapun sampling tanpa pengembalian merupakansuatu proses pengambilan sampel dimana satuan sampling yang telah terpillihtidak dikembalikan lagi ke dalam populasi, sehingga setiap satuan sampling hanyamemiliki kesempatan terpilih satu kali. Oleh karena itu, jika sampling dilakukan<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
tanpa pengembalian, maka akan terdapatberlainan. N n=N!buah sampel yangn!( N −n)!I. 3. 1 Distribusi sampling Rata-rataDikatakan distribusi sampling rata-rata karena tujuan dari penelitian iniadalah untuk menaksir rata-rata dari populasi. Oleh karena ada beberapakemungkinan sampel yang akan terbentuk, maka untuk tiap-tiap sampel yangbersangkutan juga akan terdapat beberapa rata-rata sampelnya. Anggap rata-rataini sebagai data baru, maka akan terbentuk suatu kumpulan data yang terdiri darirata-rata dari sampel-sampel. Dari kumpulan rata-rata tersebut dicari rata-rata dansimpangan bakunya, maka akan diperoleh rata-rata dari rata-rata, disimbolkandengan μxdan simpangan baku dari rata-rata, disimbolkan dengan σx.Sebagai contoh, pada tabel berikut terdapat data mengenai nilai intelegensi calonlegislatif yang menggunakan ijasah palsu. Terdapat 5 calon legislatif yangmengunakan ijasah palsu dengan nilai intelegensi masing-masing 50, 60, 70, 80,dan 90. Dari populasi 5 calon legislatif tersebut, diambil 2 sampel secaraberulang-ulang sampai semua kemungkinan sampel terambil.No. Caleg12345Nilai Intelegensi5060708090Dari data di atas diperoleh rata-rata populasi berikut :μ ===Ni=1XN350570i<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
dan simpangan bakunya adalah :σ ====Ni=1( X − μ)N2222( 50 − 70) + ( 60 − 70) + ( 70 − 70) + ( 80 − 70) + ( 90 − 70)1000514,14214i252a. Apabila sampling dilakukan dengan pengembalian, maka diperoleh 5 2 = 25buah kemungkinan sampel, yaitu :Sampel Caleg yang terpilih Nilai IntelegensiRata-rataNilai Intelegensi12345678910111213141516171819201 ; 11 ; 21 ; 31 ; 41 ; 52 ; 12 ; 22 ; 32 ; 42 ; 53 ; 13 ; 23 ; 33 ; 43 ; 54 ; 14 ; 24 ; 34 ; 44 ; 550 ; 5050 ; 6050 ; 7050 ; 8050 ; 9060 ; 5060 ; 6060 ; 7060 ; 8060 ; 9070 ; 5070 ; 6070 ; 7070 ; 8070 ; 9080 ; 5080 ; 6080 ; 7080 ; 8080 ; 905055606570556065707560657075806570758085<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
215 ; 190 ; 5070225 ; 290 ; 6075235 ; 390 ; 7080245 ; 490 ; 8085255 ; 590 ; 9090Tabel di atas merupakan distribusi sampel untuk nilai intelegensi. Terlihat daritabel di atas bahwa terdapat data baru sebanyak 25 rata-rata. Distribusi dari rataratatersebut juga bisa disajikan ke dalam bentuk berikut :Rata-rataNilai IntelegensiFrekuensi P(X)5055606570758085901234543210,040,080,120,160,20,160,120,080,04Selanjutnya dapat ditampilkan dalam bentuk grafik berikut :6Intelegensi5432Frequency1050.055.060.065.070.075.080.085.090.0Std. Dev = 10.21Mean = 70.0N = 25.00Intelegensi<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Dalam kenyataannya, suatu penelitian tidak pernah mengambil sampel secaraberulang-ulang seperti contoh di atas, namun contoh di atas memberi landasandalam melakukan estimasi nilai yang diperoleh dari sampel. Dari kumpulan rataratadi atas, diperoleh jumlah rata-rata = 1750. Maka rata-rata untuk ke – 25 ratarataini adalah :μX===25i= 1Xi2517502570Sedangkan simpangan baku ke – 25 rata-rata tersebut juga dapat dihitung sebagaiberikut :σX==25( Xi− μ )Xi= 25222( 50 − 70) + ( 55 − 70) + ( 60 − 70) + ...( 90 − 70)2500=25= 1025225Ternyata terlihat bahwa rata-rata populasi = 70 dengan rata-rata dari ke-25 ratatersebut sama, tetapi memiliki simpangan baku yang berbeda. Dari populasidiperoleh simpangan bakunya = 14,14214 sedangkan dari ke-25 rata-ratadiperoleh simpangan baku = 10. Selanjutnya dapat dihitung :σσ =Xn14,14214=2= 10Ternyata berlaku :μ = μσXX=σn2<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Persamaan di atas juga dapat berlaku untuk kasus pengambilan sampel tanpapengembalian jika N cukup besar dibandingkan dengan n, dalam hal ini jikanN≤ 5% .b. Apabila sampling dilakukan tanpa pengembalian, maka diperoleh55! = = 10 buah kemungkinan sampel, yaitu :2(5 − 2)! 2!SampelCaleg yangterpilihNilaiIntelegensiRata-rata NilaiIntelegensi11 ; 250 ; 605521 ; 350 ; 706031 ; 450 ; 806541 ; 550 ; 907052 ; 360 ; 706562 ; 460 ; 807072 ; 560 ; 907583 ; 470 ; 807593 ; 570 ; 9080104 ; 580 ; 9085Tabel di atas merupakan distribusi sampel untuk nilai intelegensi jika data yangdiambil tanpa pengembalian. Terlihat dari tabel di atas bahwa terdapat data barusebanyak 10 rata-rata. Distribusi dari rata-rata tersebut juga bisa disajikan kedalam bentuk berikut :Rata-rataNilai Intelegensi5560657075Frekuensi11222P(X)0,10,10,20,20,2<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
8085110,10,1Selanjutnya akan ditampilkan ke dalam bentuk grafik sebagai berikut :2.5Intelegensi2.01.51.0Frequency.50.055.060.065.070.075.080.085.0Std. Dev = 9.13Mean = 70.0N = 10.00IntelegensiDari kumpulan rata-rata di atas, diperoleh jumlah rata-rata = 490. Maka rata-ratauntuk ke – 25 rata-rata ini adalah :μX===10i= 1X107001070iSedangkan simpangan baku ke – 25 rata-rata tersebut juga dapat dihitung sebagaiberikut :σX====10( Xi− μ )Xi= 25222( 55 − 70) + ( 60 − 70) + ( 65 − 70) + ... + ( 85 − 70)750108,6610210Ternyata rata-rata populasi = 70 sama dengan rata-rata dari ke-10 rata-ratatersebut, tetapi memiliki simpangan baku yang berbeda. Dari populasi diperoleh2<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
simpangan bakunya = 14,14214 sedangkan dari ke-7 rata-rata diperolehsimpangan baku = 8,66. Selanjutnya dapat dihitung :σXσ N − n=n N −114,14214 5 − 2=2 5 −1= 8,66Ternyata berlaku :μ = μXσ N − nσ =Xn N −1Selanjutnya simpangan baku dari rata-rata tersebut, baik itu yang diambil denganpengembalian ataupun tanpa pengtembalian, dinamakan simpangan baku ratarataatau galat baku rata-rata. Ukuran ini menunjukkan variasi rata-rata sampelsekitar rata-rata populasi .I. 3. 2 Distribusi samplng ProporsiSebagaimana pada distribusi sampling rata-rata, pemberian nama disrtribusisampling proporsi atau disingkat distribusi proporsi ini dikarenakan tujuan daripenelitiannya adalah untuk menaksir proporsi suatu peristiwa dari populasi.Perhatikan Gambar I. 1, dimisalkan bahwa ukuran dari populasi adalah N danukuran sampel yang diambil adalah n. Apabila dari populasi tersebut terdapat Ybuah peristiwa khusus yang akan diteliti, maka proporsi terjadinya peristiwatersebut adalah :Yπ =NSelanjutnya berdasarkan sampel yang diambil, ternyata peristiwa khusus yangdiperoleh ada sebanyak x buah, maka diperoleh statistik proporsi peristiwa tesebutadalah :xp =n<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Oleh karena ada beberapa kemungkinan sampel yang akan terbentuk, maka untuktiap-tiap sampel yang bersangkutan juga akan terdapat beberapa proporsisampelnya. Apabila proporsi ini diperlakukan sebagai data baru, maka akanterbentuk suatu kumpulan data yang terdiri dari proporsi dari sampel-sampel.Sebagaimana pada distribusi rata-rata, dari kumpulan proporsi tersebut dicari rataratadan simpangan bakunya, maka akan diperoleh rata-rata dari proporsi,disimbolkan denganμpdan simpangan baku dari proporsi, disimbolkan denganσp. Ternyata, jika proses pengambilan sampel dilakukan tanpa pengembalian ataujika kondisi populasi memiliki ukuran yang tidak terlalu besar dibandingkandengan data sampelnya, yaitu (n/N) > 5 %, maka :μ = πσpp=π( 1−π)nN − nN −1selanjutnya jika proses pengambilan sampel dilakukan dengan pengembalian ataukuran populasinya besar dibandingkan dengan ukuran sampel, yaitu (n/N) ≥ 5 %,maka :μ = πσpp=π( 1−π)nI. 3. 3 Distribusi samplng Simpangan BakuSeperti halnya pada pembahahasan sebelumnya, maka dari populasi yangberukuran N yang kemudian diambil sampel beruikuran n, akan menghasilkanbeberapa kemungkinan sampel. Selanjutnya dari semua sampel yang mungkintersebut dicari simpangan bakunya, yaitu s, maka akan terdapat kumpulan darisimpangan baku. Dari kumpulan tersebut, dihitung rata-ratanya, s dan simpanganbakunya, σ s .Jika populasi berdistriobusi normal, atau mendekati normal, maka distribusisimpangan baku untuk n besar, biasanya n ≥ 100, sangat mendekati distribusionormal dengan :<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
μ = σsσσs=2ndengan σ merupakan simpangan baku populasi.Setelah mengetahui sifat dari distribusi sampel, bukan berarti harusmelakukan pengambilan sampel secara berulang-ulang sebagaimana yang telahdijelaskan sebelumnya. Distribusi sampel yang telah dibicarakan tersebutmerupakan dasar penting bagi sebuah dalil yang disebut dalil limit pusat. Dalillimit pusat tersebut menyatakan bahwa jika ada satu populasi dengan rata-rata ,atau proporsi p, dengan simpangan baku (standar deviasi) σ yang besarnyaterhingga, maka distribusi sampel berdasarkan pengambilan sampel n secara acakdan berulang-ulang memiliki beberapa sifat :1. Rata-rata distribusi sampel untuk statistik θˆ akan sama dengan parameterpopulasi, θ .2. Simpangan baku untuk parameter θ sampel akan sama dengan σ/√n . Ukuranini juga dikenal sebagai standard error (SE). SE memegang peranan pentingpada estimasi parameter dan uji statistik.3. Jika distribusi nilai pada populasi normal, maka disribusi sampel juga normal.Tetapi yang lebih penting adalah jika distribusi nilai pada populasi tidaknormal, dengan jumlah sampel yang “cukup” besar, maka distribusi sampelakan mendekati normal, tanpa tergantung dari distribusi nilai parameterpopulasi.Maka dengan asumsi besar sampel yang ”cukup”, distribusi sampel x dapatdigambarkan sebagai berikut :α / 2α / 2θ - Z σ θ θ θ + Z σ θ<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Pada gambar di atas menunjukkan menunjukkan sekian standar error dari rata-ratadistribusi sampel. Nilai α merupakan taraf signifikansi yang menunjukkan derajatkekeliruan yang diberikan.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
TINJAUAN MATA KULIAHBAB IISAMPLING ACAK SEDERHANAII. 1 Pendahuluan<strong>Sampling</strong> acak sederhana merupakan bentuk yang paling dasar dari jenissampling peluang yang memberikan dasar teori untuk proses sampling peluanglainnya yang lebih komplek. <strong>Sampling</strong> Acak Sederhana ini merupakan suatu prosesmemilih satuan sampling dari populasi sedemikian rupa sehingga setiap satuansampling dalam populasi mempunyai peluang yang sama besar untuk terpilih kedalam sampel dan peluang itu diketahui sebelum pemilihan dilakukan.Terdapat duacara dalam pengambilan sampling acak sederhana ini, yaitu dengan pengembalian(with replacement), yang mana dalam proses ini adanya kemungkinan bahwa suatuunit akan terpilih lebih dari satu kali dan tanpa pengembalian (without replacement)yang mana semua unit yang terpilih tidak akan ada yang sama.<strong>Sampling</strong> Acak Sederhana dengan pengembalian yang berukuran n daripopulasi yang berukuran N unit dapat digambarkan sebagai n buah sampelindependen yang berukuran 1. Satu unit dipilih secara acak dari populasi menjadi unitsampel yang pertama, dengan peluang 1/N. Prosedur ini diulang sampai diperolehsampel yang berukuran n unit, yang mana bisa terjadi duplikasi unit sampling.Pada populasi yang terbatas (finite population), suatu sampling yang memilikipenggandaan unit tersebut tidak akan memberikan tambahan informasi. Oleh karenaitu, biasanya sampling tanpa pengembalian lebih disukai karena unit yang terpilihtidak akan terjadi duplikasi. Sebuah sampel acak sederhana tanpa pengembalian yangberukuran n dipilih sedemikian rupa sehingga setiap kemungkinan bagian dari n unitdalam populasi memiliki peluang yang sama untuk terpilih menjadi anggota sampel. N Terdapat kemungkinan sampel yang akan terbentuk. Oleh karena itu, peluangnterpilihnya beberapa individu dalam suatu sampel S dari n unit adalah :P( S)1= Nnn!=( N − n)N !!<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Sebagai konsekuensi dari definisi ini, apabila dilakukan pemilihan dengan <strong>Sampling</strong>Acak Sederhana ke dalam sampel yang berukuran n, maka peluang sesuatu unit akannterpilih ke dalam sampel itu adalah . NProses sampling dengan <strong>Sampling</strong> Acak Sederhana digunakan apabilamemenuhi beberapa kondisi sebagai berikut :1. Variabel yang akan diteliti keadaannya relatif homogen dan tersebarmerata di seluruh populasi.2. Apabila bisa disusun secara lengkap kerangka sampling yangmenyangkut setiap satuan pengamatan yang ada dalam populasi.II. 2 Keuntungan dan Kerugian <strong>Sampling</strong> Acak SederhanaKeuntungan dari digunakannya Simple Random <strong>Sampling</strong> adalah memilikibentuk-bentuk rumus yang sederhana, tidak memerlukan pembobotan, dan semuarmus statistika bisa digunakan.Kerugiannya :1. Ada kemungkinan bahwa sekalipun menggunakan randomisasi, satuansampling yang terpilih tidak tersebar merata atau randomisasi tidakmenjamin 100% bahwa pemilihan keadaannya menyebar merata.2. Apabila ukuran populasi besar dan ukuran sampel besar maka pemilihansecara simple random sampling secara manual menyulitkan.II. 3 Proses Memilih Melalui <strong>Sampling</strong> Acak SederhanaDalam pemilihan unit sampling melalui sampling Acak Sederhana, diperlukanadanya kerangka sampling yang tersusun secara lengkap. Setiap satuan samplingdalam kerangka sampling tersebut diberi nomor urut dan banyaknya angka dalamnomor-nomor tersebut sama untuk setiap satuan sampling.Langkah:1. Tentukan secara tegas Populasi sasaranmisal : Masyarakat di daerah A2. Buat Kerangka sampling<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
No Nama Alamat001 Awal Jl. Merkuri Raya 23002 Arya Jl. Jakarta 24...262 Ending Jl. Cikaso 233. Tentukan ukuran sampel nmisal n=204. Lakukan proses pengambilan sampelApabila suatu target populasi telah ditentukan secara tegas dan dari populasi iniakan disusun sebuah sampel melalui (SRS), maka selanjutnya harus dilakukan prosespemilihan dari anggota sampelnya. Adapun proses memilih dalam Samping AcakSederhana banyak sekali caranya. Dalam buku ini hanya akan dibahas tiga cara yangsering dilakukan, yaitu :1. Simple Randomization (SR) / Pengacakan Secara Sederhana2. Randomization Based on Remainder3. Randomization Based on PermutationII. 3. 1 Simple Randomization (SR) / Pengacakan Secara SederhanaLangkah-langkah yang harus dilakukan dalam pengambilan sampel melalui SimpleRandomization :1. Tentukan populasi penelitian secara tegas study population (populassi sasarandan populasi penelitian), yang sebaiknya sama dengna populasi sasaran2. Tentukan secara tegas ukuran populasi3. Tentukan bentuk satuan sampling dan susun kerangka sampling yang lengkap4. Tentukan ukuran sampel berdasarkan perhitungan tertentu. Ukuran sampeltersebut bisa ditentukan atas dasar statistis (statistical aspects) maupunnonstatistis (nonstatistical aspects)<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
5. Sediakan tabel angka random6. Proses memilih :a. Secara sembarang jatuhkan suatu benda ke atas tabel bilangan randomdan perhatikan angka berapa yang tertuju oleh benda tersebutb. Satuan sampling selanjutnya diperoleh dengan cara membaca tabelangka random ke bawah menurut kolom yang sesuai. Kalau masihbelum cukup, baca ke atas.Catatan:1. Simple Randomization adalah randomisasi yang palling sederhana, tetapibanyak menghamburkan bilangan random.2. Dala praktik, survai yang populasi sasarannya besar, Simpel Randomizationtidak dilakukan secara manual tetapi menggunakan komputer.3. Semua angka random yang lebih besar dari N dilewat, angka randoom yangsudah dipilih tidak dipilih lagi4. Bilangan-bilangan random yang sudah dipakai , baik terpilih maupun tidak,tidak boleh dipilih lagi dalam suatu proses pemilihan. Oleh karena itu sangatdisarankan agar pada saat menggunakan tabel angka random peneliti benarbenarmemperhatikan angka random mana yang sudah dipakai, dan sampaimana peneliti terakhir menggunakan angka random.5. Proses pemilihan seperti ini disebut Simple Random <strong>Sampling</strong> dan secaramatematis proses ini menjamin bahwa setiap satuan pengamatan dalampopulasi mempunyai kesempatan yang sama (peluang yang sama) untukterpilih yaitu peluang terpilih: n/N. Untuk tidak menghamburkan bilanganrandom kita bisa menggunakan Simple Random <strong>Sampling</strong> melalui pendekatanlain.II. 3. 2 Randomization Based on Remainder (Pengacakan berdasarkan pada sisahasil pembagian)Untuk menghemat bilangan random kita melakukan randomisasi atas dasar sisa hasilpmbagianLangkah kerja :1. Tentukan populasi sassaran dan satuan samplingnya<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
2. Susun kerangka sampling3. Tentukan ukuran sampel4. Sediakan tabel angka random, dari tabel ini kita mulai pada baris ke-1 kolomke-1. Sebagai catatan bahwa langkah tersebut dilakukan apabila yakin betulbahwa tidak ada orang lain yang akan menggunakan kerangkan sampling yangsama dengan tabel angka random yang sama pula.5. Sebelum proses pemilihan dimulai, harus ditentukan secara tegas bilanganrandom mana saja yang tidak boleh dipakai. Untuk keperluan ini kita susuninterval-intervalCatatan :1. apabila diperoleh sisi pembagian bernilai nol, maka artinya adalah satuansampling yang terpilih adalah nomor yang terbesar.2. Perhatikan bahwa yang dimaksud dengan sisa pembagian adalah sisapembagian dari bilangan random yang terpilih dengan penyebut N3. Satuan sampling yang sudah terpilih (sisa pembagian yang sudah terpilih)tidak boleh dipakai lagiII. 3. 3 Randomization Based on PermutationsDalam penelitian eksperimental seringkali peneliti harus membagi sekelompoksatuan sampling ke dalam beberapa kelompok secara acak sesuai dengan perlakuan(treatment) yang akan dipakai. Pengacakan yang paling baik dalam hal ini adalahpengacakan dengan menggunakan bilangan yang dipermutasikan (diubah-ubah)secara acak, misalnya; 234, 243, 342, 324, 432, dan 423. Susun bilangan yang telahdipermutasikan tersebut ke dalam sebuah tabel. Pilih secara acak baris ke berapa yangakan dipakai dari tabel tersebut yang kemudian tabel ini harus dibacakan dari kiri kekanan untuk menentukan bilangan acak yang terpilih sebagai nomor untuk satuansampling.II. 4 Bentuk-bentuk EstimasiSebagaimana yang telah diuraikan sebelumnya bahwa dalam prosesinferensial, terdapat dua kegiatan statistik, yaitu penaksiran parameter dan pengujian<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
hipotesis. Adapun pembahasan yang akan diuraikan selanjutnya adalah mengenaipenaksiran parameter.II. 4. 1 Estomator untuk rata-rata populasi (μ ) dan standar errornya ( ( X )xσ )Dalil :Apabila sebuah populasi berukuran N kita embentuk sebuah sampel berukuran nmelalui <strong>Sampling</strong> Acak Sederhana dan dari sampel tersebut diukur variat X yangmempunyai tingkat pengukuran interval/rasio dengan hasil pengukuran x 1 , x 2 , …, x n ,maka :1. Estomatior tak bias untuk rata-rata populasi μx adalah :X 1n= xi2. Estimator untuk standar error σ ( X )ˆ σ( X )adalah( x )22 N − n sn −2 xi= ; s = N nn ( n − 1)i2Apabila dari sebuah sampel berukuran n yang dipilih melalui <strong>Sampling</strong> AcakSederhana, kita bisa menghitung σˆ ( X ), maka Bound of Error untuk rata-rata μdidefinisikan sebagai :BE = δ = t ˆ σα 1−; n−1 2 ( X )secara teori, Bound of Error tersebut menyatakan kekeliruan terbesar yang mungkinterjadi dengan derajat kepercayaan ( 1 - α ) 100%. Secara fisik, Bound of Error adalahsetengah lebar taksiran.II. 4. 3 Estomator untuk proporsi (persentase) dan standar errornyaSecara statistis kalo kita berbicara persentase, sebenarnya kita berbicara proporsi(belum dikalikan 100%). Oleh karena itu dalam statistika, analisis mengenaipersentasse dilakukan atas dasar proporsi.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Dalil :Apabila dari sebuah populasi berukuran nN, kita membentuk sampel berukuran nmelalui sampling Acak sederhana, kemudian dari sampel tersebut kita men variabel Xyang sifatnya (tingkat pengukurannya) nominal dichotomus dengan harga pengukuran:x i = 1 jika satuan sampling bersifat Ax i = 0 jika satuan sampling bukan bersifat Amaka eestimator takbias untuk proporsi A dalam populasi didefinisikan sebagai :1) estomator takbias untuk proporsi1p = xni;x = 1ix = 0ijikajika2) estimator bias untuk standar error dari p adalah :ˆ σ( p)=AB( 1 − p)N − n pN n −1Sebagai catatan bahwa dalam praktik survay yang menyangkut penaksiranparameter,ada sebuah perjanjian tak tertulis yang sifatnya optional, yaitu apabilasampling fraction < 0,05 maka finite population fraction (fpc) dianggap 1. Ini artinyadalam rumus standar Error tidak dimasukkan Fpc. Dalam hal inni diambil suatuketentuan berapa pun sampling fraction, Fpc akan tetap digunakan, sebab sekalipuunn/N < o,o5apabila hasil pengukuran variabel X adalah bilangan-bilangan kecil, Fpcbesar pengaruhnya.II. 5 Menentukan Ukuran SampelSetelah peneliti menentukan tujuan dari penelitiannya, maka selanjutnya perlu diambilkeputusan apakah akan dilakukan sensus atau sampling. Apabila proses yang akandilaksanakannya adalah sampling, maka diperlukan adanya suatu ketegasan berapaukuran sampel minimal yang sebaiknya diambil. Ukuran sampel ini akan memberiisyarat mengenai managability of the research (kelayakan penenlitian). Ada dua dasarpemikiran dalam menentukan ukuran sampel, yaitu ditentukan atas dasar oemikiranstatistis, dan atau ditentukan atas dasar pemikikran nonstatistis.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
II. 5. 1 Menentukan Ukuran Sampel Atas Dasar Pemikiran Non StatistisApabila dipandang dari sudut nonstatisti, ukran sampel ditentukan oleh beberapafaktor, yaitu :a. Ditentukan oleh waktu (time constraint / kendala waktu)b. Ditentukan oleh biayac. Ditentukan oleh ketersediaan satuan sampling, akan lebih terasa di bidangkedokteranII. 5. 2 Menentukan Ukuran Sampel Atas Dasar Pemikiran StatistisDitinjau dari aspek statistis, ukuran sampel ditentukan oleh banyak faktor, yaitu :a. Ukuran sampel ditentukan oleh bentuk parameter yang menjadi tolok ukuranalisis, dalam arti apakah kesimpulan yang akan kita ambil dasarnya rata-rata( μ ), apakah persentase ( π ), atau yang lainnya. Masalah bentuk parameteruini erat kaitannya dengan tingkat pengukuran variabel yang kita hadapi,apakah tingkat penggukurannya nominal, ordinal, interval, atau rasio.b. Ukuran sampel ditentukan oleh tipe sampling yang digunakan, apakahsampling peluang (<strong>Sampling</strong> Acak Sederhana, <strong>Sampling</strong> Sistematis, <strong>Sampling</strong>Acak Stratifikasi, dan <strong>Sampling</strong> Klaster) atau sampling Nonpeluang.c. Ukuran sampel ditentukan pula oleh tujuan penelitian, apakah bertujuanuntuk menaksir parameter atau menguji hipotesis.d. Ukuran sampel ditentukan oleh sifat penelitian, apakah sifatnyanonkomparatif atau komparatif.e. Ukuran sampel ditentukan oleh variabilitas variabel (keseragaman variabel)yang diteliti, makin tidak seragam variabel yang diteliti, makin besar ukuransampel minimal yang harus diambil.f. Apabila tujuan penelitian semata-mata hanya membuat taksiran parameter,maka ukuran sampel ditentukan oleh bound of error penaksiran dan derajatkepercayaan yang dikehendaki ( α ). Sedanghkan apabila tujuan penelitianmenenguji hipotesis, maka ukuran sampel ditentukan oleh berapa selisihterkecil yang harus dinyatakan secara signifikan, tergantung pula pada level ofsignificant ( α ) dan kuasa uji (1-β)<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
II. 5. 2. 1 Menentukan Ukuran Sample Apabila Tujuan PenelitiannyaMenaksir Rata - rataLangkah kerja yang harus dilakukannya adalah sebagai berikut :a. Tentukan dengan tegas bahwa tujuan penelitiannya adalah menaksir rata-ratapopulasi ( μ )b. Tentukan dengan tegas berapa derajat kepercayaan yang akan dipakai (padaumumnya statistik klasik menggunakan derajat kepercayaan 95 % atau 90 %)c. Tentukan bound of error penaksirand. Gunakan persamaan : z / 2 0 = α Sn δ 2n0n =n01 +nKeterangan :S : Simpangan baku untuk variabel yang diteliti dalam populasiδ : Bound of error yang bisa ditolelir / dikehendakiZ ( 1 − α ) : Konstanta bilangan yang diperoleh dari tabel normal baku2Rumus di atas mengandung parameter S yang dalam praktik jarang sekalidiketahui, sebab S hanya diketahui apabila dilakukan sensus. Dalamkenyataannya, S bisa diperoleh melalui cara-cara sebagai berikut :a. Diperoleh dari hasil penelitian orang lain mengenai variabel yang samaatau serupa yang sudah diterima secara akademikb. Pendapat para pakar mengenai variabel yang sedang ditelitic. Lakukan penelitian penjajagan (pilot survey)d. Dengan menggunakan Deming’s Empirical Rule. Menurut Deming, adahubungan antara besarnya simpangan baku dengan besarnya rentang(selisih data terbesar dengan data terkecilnya).Aturan Deming :- Jika variabel X adalah variabel dengan tingkat pengukuran intervalatau rasio mnegikuti distribusi yang bentuk kurvanya miring, baik<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
miring ke kiri maupun miring ke kanan, maka hubungan antarasimpangan baku dengan rentang adalah :S ≈ 0,25 RKurva di atas menunjukkan kurvapositif yang menggambarkan bahwanilai-nilai yang kecil cenderungbanyak, kemudian nilai yang besarcenderung sedikit.Sebagai contohnya adalah aktifitas dipasar. Pada pukul 05.00 – 10.00 yangbelanja cenderung banyak, sedangkansemakin siang semakin sedikit, bahkanyang belanja mulai sepi.Kurva menunjukkan kurva negatif, yangmenggambarkan bahwa nilai-nilai yangkecil cenderunng lebih sedikit daripadanilai-nilai yang besar.Sebagai contohnya adalah pengunjungpada café-café tenda. Pada pagi harinyaris tidak ada pengunjung. Tetapi disore hari, pengunjung mulaiberdatangan. Bahkan pada malam hariterjadi penumpukkan pengunjunghingga terjadi antrian. Kemudianmenjelang pukul 24.00 ke ataspengunjung menjadi sepi lagi- Apabila X mengikuti distribusi yang bentuk kurvanya normal,maka hubungan antara simpangan baku dengan rentang adalah:S ≈ 0,24 R<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
- Jika X mengikuti distribusi yang kurvanya uniform, makahubungan antara simpangan baku dengan rentangnya adalah:S ≈ 0,29 RNilai S yang diperoleh dari hasil penelitian orang lain bukanlahmerupakan simpangan baku populasi, melainkan simpangna bakuyang diperoleh dari sampel yaitu s. Tetapi karena penelitiantersebut sudah diterima orang, maka s dianggap menjadi S. Adakemungkinan bahwa hasil penelitian mengenai vaiabel serupamemberikan s yang berbeda. Dalam keadaan yang seperti inidiambil n yang terbesar.Dalam praktik, ukuran sampel bisa pula dilakukan berdasarkannilai-nilai yang diambil dari ukuran sampel sebesar n. Selanjutnyadigunakan Freund’s Iterative Method, sebagai berikut :1. Tentukan n 0 dengan persamaan berikut :n o2 Z/ 2 = αS δ 2. Substitusikan n o ke dalam persamaan : t/ 2( 1)1 α n −Son = δ 23. Substitusikan n 1 ke dalam persamaan :n2 t/ 2( 1 1) α n −S= δ 24. Substitusikan hasil dari langkah ketiga pada persamaanlangkah ketiga itu sendiri. Langkah dihentikan apabila hasilyang diperoleh sama atau hampir sama dengan langkah yangtelah dilakukan sebelumnya. Diperolehlah nilai minimum dariukuran sampel berdasarkan nilai akhir dari iterasi.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Contoh Soal :Seorang peneliti ingin mengetahui sejauh mana tingkat sadar hukummasyarakat di daerah A. Untuk itu ia perlu mengambil sampel masyarakat.Apabila ia menginginkan derajat keyakinan 95% bahwa kalaupun adaperbedaan rata rata tingkat kesadaran hukum antara hasil sampel dengan ratarata keseluruhan, perbedaan tersebut jangan lebih dari 5. Maka, bila Jumlahpenduduk dewasa masyarakat daerah A =500.000, ukuran sampel yangdiperlukan adalah: z / 2 0 = α Sn δ 21.96(3.84)n0 == 226.586 ≈ 227 52n0n =n01 +n227=2271 +500.000= 226.89 ≈ 227catatan:Skor minimal :40Skor maksimal : 200R =160Diketahui bahwa distribusi skor simetri. MakaS=(0.24)160= 38.4<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
II.5.2.2 Menentukan Ukuran Sample Apabila Tujuan PenelitiannyaMenaksir Persentase (Proporsi)Secara statistis, persentase itu dinyatakan dalam proporsi. Oleh karena itu,menaksir persentase sama dengan menaksir proporsi. Untuk menentukan ukuransampel dengan tujuan penaksiran persentase, dapat dihitung dengan persamaanberikut :a. Jika sebelumnya ada keterangan sekunder mengenai dugaan hargaproporsi , maka rumusnya :n0=z α / 2π 0 (1 −π0 ) δ 2n0n =n0− 11 +Nb. Jika belum ada keterangan sekunder mengenai dugaan π 0 , makadisarankan dipakai π 0 = 0,5 sehingga rumusnya menjadi :n0= z α / 22δn0n =n0− 11 +NRumus ini adalah rumus ukuran sampel minimal yang terbesar , sebabperkalian π 0 (1 - π 0 ) akan merupakan perkalian terbesar nilainya jika danhanya jika π 0 = 0,52Contoh:Seseorang ingin mendapat keterangan berapa persen di suatu daerah yangtergolong pengangguran, bila derajat keyakinan dipilih 99% dengan bound oferror 5%. Diketahui bahwa banyaknya masyarakat di daerah tersebut adalah12.000n22 z0= α≈/ 2 2δ 2.575 = 2 × 0.05 664<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
n =n0 664= = 629.13 ≈ 630n −1664 −1+ 1 +n 12.00010II.5.2.2 Menentukan Ukuran Sample Apabila Tujuan PenelitiannyaMelakukan Pengujian HipotesisAdalahA. Menentukan ukuran sampel bila penelitian bertujuan untuk menguji hipotesismengenai perbedaan rata rata dengan sampel independenGunakan rumus berikutn =( Z + Z )21−α1−β22∂untuk α dan β yang ditentukanS adalah simpangan baku dari variabel yang diteliti, dimana diasumsikanbahwa simpangan baku ini sama untuk kedua populasi.δ menyatakan perbedaan rata rata yang menurut teori /tujuan penelitiandianggap bermaknaS2Contoh:Andaikan dalam suatu penelitian ingin diuji suatu hipotesis yang mengatakan bahwakinerja perusahaan BUMN lebih tinggi dibandingkan dengan non BUMN. Untuk itupenelitian dilakukan. Yang menjadi unit sampling dalam penelitian ini adalahperusahaan bak BUMN maupun non BUMN. Masalahnya berapa perusahaan yangharus dijadikan sampel bila pengujian ingin mengambil resiko α dan β sebesarmasing masing 0.05. Bila menurut teori perbedaan skor rata rata kinerja antaraperusahan BUMN dan Non BUMN sebesar 10dianggap bermakna dan menurut pengalaman skor terendah dari kinerja adalah 30serta tertingi 150, maka kran sampel yang diperlukan adalah:n =( Z + Z )21−α1−β22∂S2= ( .645 + 1.645 )1 2S21022<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
dengan aturan Deming, maka S = 0 .24×R = 0.24 × (150 − 30) = 28. 8SSehingga2( 1.645 + 1.645) 2( 28.8)1022= 179.55 ≈ 180Jadi dperlukan paling sedikit masing 180 perusahaan BUMN dan non BUMN.B. Menentukan ukuran sampel ila penelitian bertujuan untuk menguji hipotesismengenai perbedaan rata rata dengan sampel berpasanganGunakan rumus berikutn =( Z + Z )1−α∂21−β2S2dSdadalah simpangan baku dari perbedaaan skor populasi pertama denganpopulasi ke dua.δ menyatakan perbedaan rata rata yang menurut teori /tujuan penelitiandianggap bermaknaC. Menentukan ukuran sampel bila penelitian bertujuan untuk menguji hipotesistentang kebermaknaan korelasiUntuk menentukan ukuran sampel yang dperlukan digunakan pendekatan berikut:Ukuran sampel ditentukan secara iterasi dengan cara berikut. Tentukan ukuransampel melalui rumusan :Pada iterasi pertama, upditentukan melalui persamaan berikutu p=11+ρ log21−ρ di mana ρ menyatakan perkiraan korelasi yang terjadi antara variabel X dan Y.Untuk iterasi selanjutnya gunakan<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
u p=11+ρ log2 1 + ρ − ρ 2( n −1)demikian seterusnya sampai diperoleh nilai n yang stabil (konvergen).Untuk berbagai nilai α dan β serta nilai ρ, Machin and Campbel telah membuat tabelukuran sampel sehingga memudahkan untuk digunakan. (lihat lampiran 1.)D. Menentukan ukuran sampel bila penelitian bertujuan untuk menguji hipotesistentang kebermaknaan2R dalam analisis regresiBila tujuannya untuk menguji kebermaknaan R 2 dalam analisis regresi,makaukuran sampel ditentukan melalui rumus:Ln = + k +12f22 Rdimana f =21−Rk = banyaknya variabel bebasL diperoleh dari tabel (lampiran 2) untuk α dan β yang ditentukan2R adalah koefisien determinasi terkecil yang besarnyaberdasarkan teori maupun pra survai.diperkirakan baik<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
TINJAUAN MATA KULIAHBAB IIISAMPLING SISTEMATISIII. 1 PendahuluanSebuah sampel yang diperoleh dari penyeleksian satu unsur secara acak dari kunsur yang pertama dalam sebuah kerangka sampling dan setiap unsur ke-k kemudiandisebut satu dalam k sampel sistematik. Jadi, suatu proses memilih dikatakansampling sistematik apabila dalam pemilihan itu dilakukan pemilihan sistematiksetelah terpilih bilangan acak, dengan syarat bahwa peluang terpilihnya<strong>Sampling</strong> sistematik digunakan apabila :1. Bisa disusun kerangka sampling yang lengkap1 N .2. Keadaan variabel yang sedang diteliti relatif homogen dan tersebar meratadi seluruh populasi<strong>Sampling</strong> Sistematik memberikan sebuat alternatif yang berguna dari <strong>Sampling</strong> AcakSederhana untuk alasan sebagai berikut :1. <strong>Sampling</strong> Sistematik lebih mudah untuk dilakukan dan oleh sebab itu lebihsedikit subjek yang melakukan kesalahan wawancara daripada <strong>Sampling</strong> AcakSederhana.2. <strong>Sampling</strong> Sistematik sering memberikan informasi yang lebih banyakmengenai biaya per unit/satuan daripada yang diberikan <strong>Sampling</strong> AcakSederhana.Pada umunya <strong>Sampling</strong> Sistematik merupakan penyeleksian secara acak padasuatu unsur dari k unsur yang pertama dan kemudian penyeleksian pada setiap unsur ksesudahnya. Prosedur ini lebih mudah dibentuk dan biasanya akan meminimalisirkesalahan yang mungkin dilakukan oleh pewawancara daripada dalam proses<strong>Sampling</strong> Acak Sederhana. Sebagai contohnya, akan menjadi lebih sulit apabilamenggunakan <strong>Sampling</strong> Acak Sederhana untuk menyeksi n = 50 orang pembeli padasebuah sudut jalan kota. Pewawancara tidak menentukan pembeli-pembeli mana yangtermasuk dalam sampelnya, karena ia tidak memiliki sampling framenya serta tidak<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
mengetahui ukuran populasi ,N . Sebagai solusinya, ia dapat mengambil sampelsecara sistematik (katakanlah 1 dari 20 pembeli) hingga persyaratan sampelnya bisadidapatkan. Ini akan menjadi sebuah prosedur yang mudah bahkan untukpewawancara yang tidak berpengalaman sekalipun dapat melakukannya.Selain itu, lebih mudah untuk dilakukan dan lebih sedikit terjadinya kesalahandalam wawancara terhadap subjeknya. <strong>Sampling</strong> Sistematik sering memberikaninformasi yang lebih banyak per unit biaya daripada <strong>Sampling</strong> Acak Sederhana.<strong>Sampling</strong> sistematik seringkali menyebar lebih seragam pada seluruh sendi populasisehingga dapat menghasilkan informasi yang lebih banyak mengenai populasinyadaripada data-data yang diperoleh dengan <strong>Sampling</strong> Acak Sederhana.Pertimbangkan contoh berikut : Kita akan memilih salah satu dari 5 sampel secarasistematik dari vouicher perjalanan sekumpulan data sebanyak N = 1000. (yaitu, n =200 voucher) untuk menghitung proporsi dari voucher yang dicatat secara tidakbenar. Satu voucher menggambarkan proses acak dari 5 voucher yang pertama(sebagai contohnya 3 ) dan setiap voucher sesudahnya menjadsi anggota sampel.voucher Voucher yang menjadi sampel123 345678 8910……996997998 9989991000<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Dimisalkan bahwa kebanyakan dari 500 voucher pertama telah diisi dengan benar,tapi berkaitan dengan perubahan yang dialami oleh juru tulis, 500 voucher kedua akanmemiliki kesalahan yang banyak. Apabila proses sampling yang digunakan adalahdengan <strong>Sampling</strong> Acak Sederhana, maka secara kebetulan bisa terpilih kebanyakan(mungkin semua) dari 200 voucher adalah berasal dari salah satunya, baik itu padabagian kelompok pertama maupun yang kedua dan sebab itu taksiran untuk p menjadikurang sesuai Sebaliknya, <strong>Sampling</strong> Sistematik akan memilih jumlah yang sama darivoucher pada kedua kelompok tersebut dan akan memberikan taksiran yang akurat .III. 2 Bagaimana Menggambarkan <strong>Sampling</strong> SistematikWalaupun Sampel Acak Sederhana maupun Sampel Sistematik keduanyamemberikan alternativ yang berguna satu sama lainnya, metode dari pemilihan datasampelnya berbeda. Suatu Sampel Acak Sederhana dari populasi dipilih denganmenggunakan tabel bilangan acak. Akan tetapi metode-metode yang bervariasi dapatdigunakan dalam <strong>Sampling</strong> Sistematik. Peneliti dapat memilih 1 dari 3, 1 dari 5, atausecara umum, 1 dari k sampel sisitematis.Untuk mendapatkan suatu sampel sistematis berukuran n dari sebuah populasiyang berukuran N, harus ditentukan k sistematis yang kurang atau sama dengan n/N.k tidak bisa dipilih secara tepat apabila ukuran populasi tidak diketahui. Meskikpundapat ditentukan ukuran sampel secara pendekatan, namun harus memperkirakan nilaik yang dibutuhkan untuk mencapai ukuran sampel (n). Jika nilai k yang dipilih terlalubesar, ukuran sampel (n) yang diharuskan tidak akan diperoleh dengan menggunakan1-dalam-k sampel sistematis dari populasinya. Hal ini tidak akan menjadi masalahjika peneliti dapat menguanginya dan membuat 1-dalam-k sistematik samplinglainnya hingga ukuran sampel yang telah ditentukan terpenuhi. Namun demikian,dalam beberapa situasi tidak mungkin untuk memulai sampling sistematis yangkedua.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
III. 3 Keuntungan <strong>Sampling</strong> SistematikDibandingkan dengan sampling acak sederhana, sampling sisitematikmempunyai kelebihan, yaitu :1. standard Error yang didasarkan pada sampling sisitematik paling sedikit samapresisinya dengan sampling acak sederhana2. Mudah dilakukan3. Pada keadaan tertentu, sampling sistematik bisa dilakukan sekalipun tidak adakerangka sampling.III. 4 Kerugian <strong>Sampling</strong> Sistematik<strong>Sampling</strong> sistematik bisa sangat merugikan apabila dalam kerangka samplingterdapat periodisitas, teruitama periodisitas yang berhimpit / overlap dengan intervalpemilihan.Sebagai contohnya adalah suatu penelitian yang akan dilakukan mengenaitingkat kepuasan tamu hotel terhadap prosedur pelayanan di hotel tersebut.<strong>Sampling</strong> frame yang digunakanya adalah daftar tamu yang hadir pada saat itu.Berdasarkan tujuan kedatangannya, tamu hotel dibagi menjadi convention, bisnis,weekend, liburan, government dan pelatihan. Celakanya , ternyata berdasarkansampling sistematik ternyata dalam kerangka sampling ada periodisitas yang overlapdengan interval pemilihan, misalnya terus menrus terpilih tamu bisnis. Sehingga padaakhirnya kurang bisa mencerminkan bagaiman tibgkat kepuasan keseluruhan tamuyang ada.III. 5 Menaksir Rata-rata Populasi dan TotalSebagaimana yang telah berulangkali ditekankan bahwa maksud darikebanyakan suatu survey adalah menaksir satu atau lebih parameter dari populasi..Taksiran untuk rata-rata populasi , μ, dari sampel sistematik menggunakan rata-ratasampel, x sebagai berikut :<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Penaksir Rata-rata Populasi, μ :nxii=1μ = xsy=n( 3.1 )Varians taksiran untuk xsy:( x ) N − n s= ( 3 . 2 ) N n2VˆsyBound of Error taksiran tersebut :( x )2N n sZ Vˆ − δ =αsy= Zα ( 3 . 3 )22 N nJika N tidak diketahui maka fpc, ( N – n ) / N pada persamaan (3.2) dan (3.3)dibuang. Ternyata bahwa taksiran varians darixsyyang ada pada persamaan (3.2)identik dengan taksiran varians untuk x yang dperoleh dengan menggunakan<strong>Sampling</strong> acak Sederhana. Hal ini tidak menyiratkan bahwa varians populasi yangbersangkutan sama. Varians dari x diperoleh dari persamaan :Vˆ( x)2 N − n σ= N −1 nDemikian juga varians dari xsydapat dituliskan :V2σ( x ) = 1+( n − 1)syn{ ρ}dimana ρ adalah koefisien korelasi antara observasi dalam sampel sisitematik yangsama. Ketika N besar, kedua varians tersebut sama jika observasi dalam sebuahsampel yang ditetapkan tidak berkorelasi (ρ ≈ 0).Sebuah taksiran yang tak bias dari V ( x sy) tidak dapat diperoleh denganmenggunakan data hanya dari satu sampel sistematik. Hal ini tidak berarti bahwasuatu taksiran dari V ( x sy) tidak pernah bisa diperoleh. Untuk populasi tertentu,ampling sistematik ekivalen dengan sampling acak sederhana, dan kita dapat<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
mengambil V ( x sy) yang hampir sama dengan taksiran varians dari x berdasarkanpada samping acak sederhana.Untuk populasi yang mana hubungan ini terjadi? Untuk menjawab pertanyaantersebut kita harus mempertimbangkan tiga tipe populasi sebagai berikut :1. Populasi Acak (Random Population)2. Populasi Terurut (Ordered Populastion)3. Populasi Berkala (Periodic Population)III. 5. 1 Populasi acakDefinisi : Suatu populasi dikatakan acak apabila elemen-elemen dari populasi tersebutberada dalam urutan yang acak.Elemen-elemen dari sampel sistematik yang diambil dari populasi yang acakdiaharapkan akan heterogen dengan ρ mendekati nol. Dengan demikian, ketika Nbesar, varians dari xsykira-kira sama dengan varians dari x yang berdasarkan padasampling acak sederhana, sampling sistematis dalam kasus ini ekivalen dengansangling acak sederhana. Sebagai contohnya, seorang peneliti ingin menentukan rataratajumlah dari yang ditulis oleh dokter tertentu selama tahun sebelumnya.. Jikaframe (kerangka) mengandung daftar dokter-dokter, cukup beralasan untukmengasumsikan bahwa nama-nama pada daftrar tersebut tidak berhubungan denganbanyaknya resep yang ditulis untuk obat tertentu. Oleh karena itu, kita pertimbangkanbahwa populasinya acak. Suatu sampel sistematik akan ekivelan dengan sampel acaksederhana untuk kasus tersebut.III. 5. 2 Populasi TerurutSuatu populasi dikatakan terurut apabila elemen-elemen dalam populasiterurut dalam dalam jarak sesuai dengan pola tertentuDalam sebuah survey untuk menaksir efektivitas dari instruksi dalam suatukursus yang besar, pelajar diminta untuk mengevaluasi instrukutur merekaberdasarkan skala numerik.. sebuah sampel kemudian diambil dari daftar evaluasiyang disusun dalam urutan numerik yang menaik. Populasi dari pengukuran dimanadata sampel diambil dianggap sebuah populasi yag terurut.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Suatu sampel sistematik yag diambil dari populasi yang terurut pada umumnyabersifat heterogen dengan ρ≤ 0,( x ) V ( x)V sy≤Dengan demikian, sebuah sampel sisitematik dari populasi terurut memberikanindformasi yang lebih banyak per unit biayanya daripada sampel acak sederhana,karena varians dari xsyyang diperoleh lebih kecil daripada varians dari x .Jika tidak diperoleh taksiran V ( x sy) dari data sampel, suatu taksiran konservatifuntuk V ( x sy) dapat digunakan :s N − n ( x ) = 2Vˆsyn N<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
TINJAUAN MATA KULIAHBAB IVSAMPLING ACAK BERSTRATAIV. 1 PendahuluanSalah satu metoda pengambilan sampel lain disamping <strong>Sampling</strong> AcakSederhana adalah <strong>Sampling</strong> Acak Bestrata. <strong>Sampling</strong> ini dilakukan apabila dalamkeadaan tertentu <strong>Sampling</strong> Acak Sederhana kurang baik untuk digunakan karena akanmemberikan presisi suatu taksiran yang rendah. Untuk itu kita perhatikan kasus yangberikut. Misalkan di suatu daerah, pendapatan masyarakat bersifat heterogen, yakniada yang tergolong “tinggi, menengah, atau rendah”, dan melalui <strong>Sampling</strong> AcakSederhana akan diambil sampel dalam usaha menaksir rata-rata pendapatanmasyarakat tersebut, maka ada kemungkinan yang terambil ke dalam sampelwalaupun dilakukan secara acak, kebanyakan atau hanyalah mereka yang tergolongberpenghasilan rendah. Bila rata-rata pendapatan dihitung dari sampel ini, maka rataratatadi akan merupakan taksiran yang rendah (under estimate).Telah diketahui bahwa metoda pengambilan sampel yang dilakukan dalamrangka menaksir parameter populasi adalah metode yang dapat memberikan presisisuatu taksiran yang tinggi. Diketahui pula bahwa presisi suatu taksiran diukur olehgalat baku dari taksiran tersebut. Dari rumus galat baku-galat baku yang sudah kitakenal, dalam <strong>Sampling</strong> Acak Sederhana, Tampak bahwa besar kecilnya galat bakuantara lain bergantung pada ukuran sampel. Makin besar ukuran sampelmenyebabkan makin kecilnya galat baku suatu penaksir, yang juga berarti semakintinggi presisi penaksir tersebut. Selain itu, variasi data, yang diukur oleh S 2 , juga bisamenentukan besarnya galat baku. Dari rumus galat baku rata-rata misalnya, tampakbahwa makin besar harga S 2 (artinya karakteristik populasi heterogen) akan jugamenyebabkan makin besarnya galat baku. Sebaliknya, semakin kecil (karakteristikpopulasi relative homogen) akan menghasilkan galat baku yang kecil. Dengandemikian <strong>Sampling</strong> Acak Sederhana akan memberikan presisi yang tinggi apabilakarakteristk populasi bersifat homogen. Dalam kasus ini, tampak bahwa pendapatanbersifat heterogen yang berarti varians pendapatan, S 2 , juga akan besar. Oleh karenaitu, apabila sampel diambil melalui <strong>Sampling</strong> Acak Sederhana, akan memberikanpresisi yang rendah.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Masuk akal kiranya, agar diperoleh presisi yang tinggi, sampel yang terambilharuslah sampel yang didalamnya berisi misalnya, masyarakat yang dari semuagolongan pendapatan. Sampel seperti ini dapat diperoleh melalui <strong>Sampling</strong> AcakBestrata. Dalam <strong>Sampling</strong> Acak Bestrata populasi N dibagi ke dalam beberapakelompok sedemikian sehingga setiap kelompok mempunyai karakteristik yanghomogen. Kelompok-kelompok semacam ini disebut strata (tunggalnya disebutstratum) dan dalam masing-masing stratum sampel diambil secara acak, yakni dengan<strong>Sampling</strong> Acak Sederhana. Proses pembagian populasi ke dalam beberapa stratadisebut stratifikasi. Dalam kasus sebelumnya, populasi dibagi dalam tiga strata,stratum pertama adalah masyarakat yang tergolong berpenghasilan tinggi, stratumkedua yang berpenghasilan menengah, dan stratum ketiga masyarakat yangberpenghasilan rendah.Dalam bab ini, akan diuraikan <strong>Sampling</strong> Acak Berstrata untuk menaksir ratarata,proporsi serta total populasi. Namun sebelum lebih jauh membahasnya, perludiperhatikan terlebh dahulu beberapa notasi yang digunakan.IV. 2 NotasiTelah dikatakan bahwa populasi dibagi ke dalam kelompok-kelompok yangdisebut strata. Andaikan populasi dibagi dalam L strata, maka banyaknya unit sertabeberapa besaran karakteristik yang diperlukan dalam stratum dinyatakan dalamnotasi-notasi berikut, Indeks k dalam notasi menyatakan stratum ke-k, jadi k bisaberharga 1, 2, …, L.N hn hy hiWf hhbanyaknya unit dalam stratum ke – hbanyaknya unit dalam sampel yang diambil dari stratum ke – hnilai pengamatan atau nilai karakteristik untuk unit ke-i dalamstratum ke-hNh= bobot stratum ke-hNfraksi sampling dalam stratum ke-h yhiYh= nilai rata-rata karakteristik dalam stratum ke-hNh<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
yhiyh= nilai rata-rata karakteristik sampel berukuran nh yang diambil darinh( y − Y )histratum ke-hh2 2Sh= varians karakteristik dalam stratum ke-hNh−1( y − Y )hih2 2sh= varians karakteristik sampel berukuran n h dari stratum ke-hnh−1IV. 3 Prosedur Pengambilan SampelSeperti sudah dijelaskan, bahwa pembentukan strata atau stratifikasidimaksudkan untuk meningkatkan presisi suatu taksiran. Menigkatnya suatu presisiakan bergantung kepada derajat homogenitas yang dicapai dalam strata, atau dapatpula dikatakan bergantung pada seberapa besar variabilitas karakteristik yang akandiukur direfleksikan diantara strata. Hal ini tentu saja pada gilirannya bergantungkepada efektifitas pembentukan strata.Dalam membentuk batas-batas stratum, perlu mengumpulkan semua informasiyang dapat menolong mengklasifikasikan unit-unit menjadi kelompok-kelompokpopulasi yang satu sama lain berbeda. Data masa lalu, intuisi, pertimbangan para ahlidi lapangan, atau kejelian seseorang dalam menerka dengan baik, semuanya bisadigunakan secara efektif dalam membentuk atau membedakan strata satu dengan yanglainnya.Apabila secara cermat strata sudah terbentuk, maka sampel untuk masingmasingstratum dipilih melalui metode <strong>Sampling</strong> Acak Sederhana. Karena dilakukandengan metode <strong>Sampling</strong> Acak Sederhana, maka tentunya harus tersedia kerangkasampling dalam setiap stratum. Apabila sudah tersedia, maka dari N 1 , N 2 , …, N L unitdiambil sampel secara acak, katakan berukuran n 1 , n 2 , …, n L sehingga ukuran sampelyang dibutuhkan, yakni,n = n 1 + n 2 + … + n L (4.1)merupakan golongan ukuran-ukuran sampel setiap stratum.Untuk lebih jelasnya, selanjutnya akan diuraikan langkah kerja dalammembentuk strata untuk sebuah populasi sebaagai berikut :<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
1. Tentukan populasi sasaran dan tentukan populasi secara keseluruhan (N)2. Berdasarkan variabel tertentu (kriteria tertentu) , populasi dibagi-bagi kedalam L buah strata3. Untuk setiap strata lakukan pendaftaran satuan sampling sehingga untuk setiapstrata diperoleh kerangka sampling masing-masing dengan ukuran stratamasing-masing4. Dari populasi tersebut kemudian ditentukan ukuran sampel n yang disebutoverall sample size. Menentukan ukuran sampel n tentu saja harus berdasarkankriteria tertentu.5. Ukuran sampel sebesar n selanjutnya dialokasikan (disebarkan) ke seluruhstrata, yang kemudian disebut alokasi sampel (sample allocation)Stratum I : n 1Stratum I : n 2Ln ii=1Stratum I : n 3 sedemikian rupa sehingga : n = …Stratum I : n L6. Dari setiap stratum kemudian dipilih satuan sampling melalui teknik SampelAcak Sederhana.Oleh karena dari setiap stratum dilakukan secara <strong>Sampling</strong> Acak Sederhana, makakeseluruhan proses disebut <strong>Sampling</strong> Acak Berstrata. Jika proses memilih darisetiap stratum dilakukan secara sistematik, maka proses keseluruhan disebut<strong>Sampling</strong> Acak Sistematis Berstrata.Sebagai contoh, dibawah ini diberikan gambaran pembagian populasi menjaditiga buah stratum yang kemudian dilakukan prose <strong>Sampling</strong> Acak Berstrata :N 1 N 2 . N 3 n 1 n 1 n 1N = N 1 + N 2 + N 3 n = n 1 + n 2 + n 3<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
IV. 4 Taksiran Rata-rata PopulasiIV. 4. 1 Bentuk TaksiranSeperti halnya <strong>Sampling</strong> Acak Sederhana maka akan diuraikan tiga penaksiryang barangkali dilibatkan dalam penelitian. Penaksir ini adalah penaksir rata-rata,proporsi dan total populasi.Rata-rata nilai karakteristik populasi tiada lain adalah jumlah nilaikarakteristik dibagi banyaknya unit dalam populasi.X =atau bisa juga ditulis dengan :LNhh= i i=1Nxhi(4.2)LNhXhh=X = 1 N(4.3)X disebut “rata-rata yang dibobot” dengan bobot yang digunakan adalahukuran-ukuran stratum, yaitu N h . Kalau sampel dari setiap stratum diambil denganmenggunakan <strong>Sampling</strong> Acak Sederhana, maka rata-rata nilai karakteristik darisampel dalam setiap stratum bisa ditentukan yaituxnhxhii=h= 1 (4.4)nhxhini tentu saja merupakan penaksir yang takbias untukmerupakan penaksir yang takbias untukXh, makax h hXh. Karena xhiniN akan merupakan penaksirtotal nilai karakteristik dalam stratum ke-h, sehingga apabila taksiran-taksiran total inikita jumlahkan, yakni Nhxh, maka akan merupakan taksiran total nilai populasi.Oleh karena itu, taksiran rata-rata nilai karakteristik populasi akan sama denganNhxhdibagi oeh N. Taksiran rata-rata nilai karakteristik populasi dalam <strong>Sampling</strong>Acak Berstrata diberi symbol xst. Oleh karenanya<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
xstLxhh== 1 (4.5)NTaksiran ini juga merupakan taksiran yang takbias untuk X .Contoh 4. 1 :Seorang peneliti mengadakan suatu survai untuk mengetahui berapa rata-rata hasilpenjualan lading per bulan milik para petani di suatu daerah. Dikeahui bahwa didaerah tersebut terdapat 250 petani yang 60 diantaranya tergolong kelompok yangmempunyai lading luas, 100 tergolong kelompok yang mempunyai ladang lumayanluas, dan 40 petani tergolong mempunyai ladang kecil. Sampel yang diambil olehpeneliti adalah 50 petani yang masing-masing kelompok diwakili oleh 15, 25, dan 10petani. Dalam tiap kelompok petani-petani ini diambil dengan sampling acaksederhana. Dari petani yang terpilih, rata-rata pendapatannya dihitung, lihat table (IV.1) diperoleh :Tabel IV. 1PENJUALAN HASIL LADANG PER BULANMENURUT STRATA LUAS LADANG(DALAM RATUSAN RIBU RUPIAH)NO123456789101112131415STRATA LUAS LADANG1 2 3123 65 34120 60 30125 63 25160 60 28130 70 27110 64 25140 63 30110 60 35130 59 20100 63 46110 62120 58125 64120 65152 65<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
1617181920212223242560505562606064624046Jumlah 1.875.000 1.500.000 300.000xh125.000 60.000 30.000s h 16.053,48 6.416,13 7.149,20x1 = Rp. 125.000, − x2= Rp.60.000,− x3= Rp.30.000,−maka pukul rata hasil penjualan ladang per bulan di daerah tersebut adalahx st=( 60)( 125.000) + ( 100)( 60.000) + ( 40)( 30.000)= Rp.73.500,−200IV. 4. 2 Galat Baku Rata-rataSeperti telah kita ketahui dalam uraian sebelumnya, selain taksiran untuk suatuparameter populasi, diperlukan juga varians atau galat baku dari taksiran tersebut agarpresisi dari penaksir dapat diukur. Apabila sampel diambil melalui prosedur <strong>Sampling</strong>Acak Berstrata dan dari nilai karakteristik sampel ini akan ditaksir rata-rata populasiX , oleh x st, maka varians dari x st, ditulis V ( xst) dapat ditentukan denganmenggunakan persamaan berikut :yang apabila diuraikan menjadiVN x= h=1 NL h h ( x ) V st(4.6)V( x )stN− nL22 h h h= 1 N2 h(4.7)N h=1 NhnhS<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
atauV( x )dengan w h menyatakan bobot stratum ke-h.st N− n SL22 h h h= Whh=1 N (4.8)hnhV( xst) di atas besarnya besarnya bergantung antara lain pada2Shyaitu varians nilaikarakteristik dalam stratum ke-h. Kenyataan, sering varians ini jarang diketahuibesarnya sehingga sulit bagi kita untuk menghitung V( xst) melalui persamaan (4.8).Oleh karena itu, V( xst) bisa ditaksir. Taksiran untuk V( xst) akan didasarkan padabesarnya varians nilai karakteristik yang dihitung melalui sampel yang diambil darisetiap stratum. Penaksir tersebut adalah :Vˆ( x )st N− n sL22 h h h= Whh=1 N (4.9)hnh2shmenyatakan varians nilai karakteristik stratum ke – h yang dihitung denganmenggunakan persamaan (…). Dengan demikian galat baku dari rata-rata untuksampling berstrata adalahx st( x )s = V (4.10)stDari contoh 4.1, melalui sampel yang diambil dari tiap stratum, besarnya varians atausimpangan baku pendapatan petani dihitung. Dari 15 petani yag mempunyai ladangluas, juga dari 25 petani serta 10 petani yang mempunyai ladang cukup dan kecil,simpangan baku pendapatan dihitung. Hasilnya tampak pada tabel III. 1 berturut-turutadalah :s 1 = Rp. 16.053,48 , -s 2 = Rp. 6.416,13 , -s 3 = Rp. 7.149,20 , -Maka dengan menggunakan persamaan (…) varians rata-rata petani di daerah tersebutbesarnya ditaksir oleh :Vˆ( )x st= 6020040200= 1621797,60322 60 −15 60 40 −10 40 22( 16053,48) 100 100 − 25 ( 6416,13)15( 7149,20)102 + 200 100252+<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
sehingga galat bakunya adalahsx st( x ) =−= V ˆ Rp.1273,498 ,stnilai tersebut untuk mengukur presisi dari xst.Apabila varians suatu taksiran bisa ditentukan, maka interval taksirannya jugabisa dicari. Sejalan dengan pembahasan <strong>Sampling</strong> Acak Sederhana, maka apabilasampel diambil melalui <strong>Sampling</strong> Acak Berstrata, interval taksiran rata-rata denganderajat konfiden α, dapat diperoleh dari :xst− ZZ s (4.11)sx< X < x +1 ststα21α2x stdimanaZ1besarnya didapat dari tabel normal baku.α2Contoh 4.2 :Dalam contoh yang lalu, apabila diinginkan interval taksiran untuk rata-ratapendapatan hasil ladang dengan α = 5 %, maka interval taksiran tersebut adalah :73.500 – (1,96) (1273,498) < X < 73.500 + (1,96) (1273,498)71003,94 < X < 75996,06yang berarti bahwa dengan derajat keyakinan 95 % rata-rata penjualan hasil ladangpara petani di daerah tersebut terletak antara Rp. 71.004 , - dan Rp. 75.996,-.IV. 5 Taksiran Persentase (Proporsi)IV. 5. 1 Bentuk TaksiranSeperti halnya pada taksiran untuk rata-rata, maka taksiran untuk proporsi jugamelibatkan besaran proporsi untuk setiap strata. Oleh karena itu, melalui <strong>Sampling</strong>Acak Berstrata berukuran N, taksiran untuk proporsinya adalah :Pst=Li=1 Ni N pidenganp1=n iix ijn j=1x ij = 1 jika satuan sampling mempunyai karakteristik yang dicarix ij = 0 jika satuan sampling tidak mempunyai karakteristik yang dicari<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
IV. 5. 2 Galat Baku ProporsiApabila sampel diambil melalui prosedur <strong>Sampling</strong> Acak Berstrata dan darinilai karakteristik sampel ini akan ditaksir proporsi populasi π st , oleh P st , maka variansdari P st , ditulis V(P st ) dapat ditentukan dengan menggunakan persamaan berikut :yang apabila diuraikan menjadi( 1−p )L Ni− niNi piiV ( P ) =st (4.12)i= 1 Ni N ni−12( 1−p )L1piiV ( Pst) = ( − )2 NiniNi(4.13)Nn −1h= 1iIV. 6 Alokasi SampelUraian yang lalu memperlihatkan pada kita bagaimana menentukan taksiranrata-rata dan mengukur presisi taksiran rata-rata melalui galat baku taksiran tersebutjika sampel diambil dengan <strong>Sampling</strong> Acak Berstrata. Ini bisa dilakukan apabila kitasudah mengetahui besarnya ukuran sampel, n , dan besarnya ukuran-ukuran sampelyang diambil dari setiap stratum,n h . Dari contoh 4.1 dan 4.2 misalnya, taksiran rataratahasil penjualan, x st, serta variansnya, V( xst), dapat dihitung karena besarnyasampel yaitu 50 petani sudah ditentukan, demikian pula besarnya ukuran sampeluntuk setiap stratum, yaitu; 15, 25, dan 10 petani.Masalah yang timbul tentunya adalah bagaimana menentukan bahwa sampelberukuran 50 petani , dan dalam berapa bagian dari 50 petani ini diberikan untuksetiap stratum. Dengan kata lain, bagaimana menentukan n dan bagaimana pulamengalokasikan n ini ke dalam masing-masing stratum.Dalam bagian ini akan diuraikan terlebih dahulu bagaimana mangalokasikan nke dalam setiap stratum, sehingga untuk n yang diketahui besarnya, n h bisaditentukan. Dalam <strong>Sampling</strong> Acak Berstrata, mengalokasikan n ke dalam setiapstratum bisa ditempuh dalam beberapa cara. Cara yang paling seerhana adalah yangdisebut alokasi proporsional, yang akan diuraikan berikut ini.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
IV. 6. 1 Alokasi ProporsionalSalah satu cara menentukan besarnya n h untuk n yang diketahui adalah alokasiproporsional. Alokasi ini adalah alokasi yang paling sederhana. Ukuran-ukuransampel dari setiap stratum diambil proporsional terhadap ukuran stratumnya, N h .Dengan alokasi ini, maka :sehingga berlaku bahwadari populasi.nNh= ⋅n; h =1, 2,... L (4.14)Nh,n n h = yang menyatakan berapa bagian sampel diambilN NhContoh 4. 3 :Dari contoh 4.1 nampak bahwa ukuran populasinya terdiri dari 200 petani, danmasing-masing stratum berukuran N 1 = 60, N 2 = 100, dan N 3 = 40. Dari ukuran iniakan diambil sampel berukuran 50 petani. Maka dengan alokasi proporsional,banyaknya petani yang harus diambil dari setiap stratum adalah:nnn12360= × 50 = 15 pe tan i200100= × 50 = 25 pe tan i20040= × 50 = 10 pe tan i200dengan demikian, sampel-sampel yang diambil dari setiap stratum dari contoh di atasmerupakan sampel yang proporsional terhadap ukuran stratum.Apabila alokasi sampel dilakukan dengan alokasi proporsional, maka x stdengan variansnya yang masing-masing ditulis dalam persamaan () dan () dapatdisederhanakan menjadi :xhih= i=xst= 1 1 (4.15)nyang merupakan rata-rata nilai karakteristik sampel, danLnh<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
yang taksirannya adalahVN − nN( xst) = Lh=1NNhSn2h(4.16)denganL 2N − n NhshVˆ ( xst) = (4.17)N N nh=12shmenyatakan varians nilai karakteristik yang dihitung dari sampel yangdiambil dari stratum ke-h, dihitung dengan menggunakan rumus (….)Apabila rumus ini kita gunakan untuk contoh yang lalu, makaVˆ( )x st 200 − 50 60 (16053,48)= 200 200 50= 1621797,60322100 (6406,13)+200 50+40200(7149,20)502terlihat bahwa hasilnya sama dengan apabila digunakan persamaan ((())))IV. 6. 2 Alokasi OptimalDalam alokasi proporsional, ukuran-ukuran sampel dari setiap stratumditentukan secara proporsional terhadap ukuran-ukuran stratum N h . Dalam keadaantertentu terdapat suatu kendala dalam menentukan ukuran sampel. Kendala tersebutbiasanya adalah biaya. Dalam sampling, dikenala apa yang disebut biaya samplilng.Dengan biaya sampling diartikan sebagai biaya yang perlu disediakan apabila kitaakan melakukan pengambilan sampel. Oleh karena itu, tercakup di dalamnya biayabiayamerencanakan sampling, membentuk kerangka sampling, melatih pewawancara,mengumpulkan data, menyusun dan mengolah data, keperluan secretariat, dan lainsebagainya. Biaya sampling ini terbagi dalam dua bagian, yaitu biaya tetap, B 0 , danbiaya-biaya tidak tetap, B h . Yang termasuk biaya tetap adalah biaya yang tidaktergantung pada berapa besarnya ukuran sampel yang diambil dari setiap stratum,termasuk di dalamnya adalah biaya-biaya keperluan secretariat, biaya sewa ruangan,honor pegawai, dan sebagainya. Biaya tidak tetap adalah biaya untuk mendapatkandata (melalui wawancara, angket, dan sebagainya) dari satu unut yang ada dalamsetiap stratum. Oleh karena itu, apabila biaya memperoleh data dari satu unit dalamstratum pertama adalah B 1 rupiah, dan dari stratum ini akan diambil sampel berukurann 1 unit. Maka jumlah biaya yang diperlukan untuk mendapatkan data dari stratumpertama adalah n 1 B 1 . Demikian pula untuk stratum ke dua, dengan biaya untuk<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
mendapatkan data dari satu unit sebesar B 2 rupiah, maka diperlukan sebanyak n 2 B 2rupiah.Secara umum, untuk stratum ke-h, diperlukan biaya n h B h rupiah. Oleh karenaitu, biaya yang diperlukan untuk mendapatkan data dari n = nhunit adalahn hBhrupiah. Karena keseluruhan biaya sampling yang diperlukan merupakanjumlah biaya tetap dan tidak tetap, maka seluruh biaya dapat dituliskan sebagaiberikut :B = B0 + n hBh(4.18)Untuk mempermudah perhitungan-perhitungan selanjutnya, hanya akan diperhatikanbiaya tidak tetap saja, yaitu:B′ = B − B0 = n hBh(4.19)Dengan menggunakan fungsi biaya, maka ukuran sampel dapat ditentukan melaluidua cara: Pertama, dengan biaya sampling tertentu, yakni sebesar B, tentukan ukuransampel n, dan alokasikan n ini ke dalam setiap stratum sehingga dicapai presisi yangmaksimal (galat baku taksiran minimal). Ke dua, dengan presisi taksiran yangdikehendaki, tentukan ukuran sampel n, lalu alokasikan n ini pada setiap stratumsehingga biaya yang harus dikeluarkansekecil mungkin. Metode alokasi ukuransampel ini disebut Alokasi Optimal.Dengan terminologi lain, alokasi optimal dapat dinyatakan seperti berikut,tentukan n dan n h sedemikian rupa sehingga untuk B′ tertentutentukan n sehingga untuksxtertentu B′ seminimal mungkin.stsxminimal, ataustKita perhatikan terlebih dahulu bagaimana menentukan n h untuk ukuran ntertentu. Apabila alokasi optimal digunakan, maka ukuran sampel setiap stratumdihitung melalui persamaan:nhNhShBh= ⋅n(4.20) N S BhhhIV. 6. 3 Alokasi NeymanApabila biaya total per satuan sampling dalam setiap stratum (B h ) sama, makapenentuan alokasi sampling ke dalam setiap stratum dari persamaan 4.18 menjadi :<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
nhNhSh= ⋅n(4.21) N ShhAlokasi di atas merupakan bentuk daro alokasi NeymanIV. 6. 4 Alokasi SembarangAlokasi ini dilakukan dengan cara mengalokasikan sampling ke dalam strataseimbang dengan syarat minimal dari sebuah stratum harus ada dua buah satuansampling yang diambil. Dalam praktik, alokasi seperti ini sama sekali tidakdisarankan, sebab alokasi tersebut bisa mengakibatkan standard error menjadimembengkak yang harganya lebih besar daripada standard error <strong>Sampling</strong> AcakSederhana.IV. 6. 5 Alokasi Sama BesarMenurut kriterium ini, alokasi dilakukan atas dasar rumusnn i= (4.22)LPada keadaan tertentu aloksai sma besar bisa menguntungkan, yaitu pada keadaanyang disebut paired allocation.IV. 7 Menentukan Ukuran SampelSebagaimana telah diketahui, banyak sekali faktor yang ikut menentukan ukuransampel, dua diantaranya adalah tergantung kepada parameter yang akan ditaksir dantergantung kepada tipe samplingnya.IV. 7. 1 Menentukan Ukuran Sampel Jika Akan Menaksir Rata-rataApabila parameter yang akan ditaksir adalah rata-rata dan tipe sampling<strong>Sampling</strong> Acak Berstrata, maka ukuran sampel bisa diperoleh melalui persamaanberikut :<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Li=n = δ Z ( − )1 α 2 w i = n i / n ; δ = bound of error12NN2iw2Si+2iLi=1NiS2i(4.23)IV. 7. 2 Menentukan Ukuran Sampel Jika Akan Menaksir ProporsiSelanjutnya jika parameter yang akan ditaksir adalah rata-rata dan tipe sampling<strong>Sampling</strong> Acak Berstrata, maka ukuran sampel bisa diperoleh melalui persamaanberikut :Li=n = δ Z ( 1−α )2 12NN2i2πiw+( 1−π)Lii=1iiN πi( 1−π)i(4.24)<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
TINJAUAN MATA KULIAHBAB VSAMPLING KLASTERV. 1 PendahuluanSalah satu jenis sampling yang juga sering digunakan dalam praktek penelitianadalah sampling klaster. <strong>Sampling</strong> ini dilakukan apabila peneliti ingin menekan biayasampling atau jika kerangka sampling yang memuat elemen/atau unit observasi tidaktersedia. <strong>Sampling</strong> klaster adalah sampling dimana unit samplingnya adalah kumpulanatau kelompok (cluster) elemen (unit observasi). Sebagai contoh, andaikan seorangpeneliti ingin mengetahui rata-rata pendapatan kepala keluarga disebuah kota besar.Apabila <strong>Sampling</strong> acak sederhana atau sampling acak berstrata akan digunakan, makapeneliti harus mempunyai kerangka sampling yang berisikan daftar kepala keluargadikota tersebut. Daftar keseluruhan nama kepala keluarga dikota yang besar seperti inipasti akan sulit diperoleh. kalaupun ada, dan SRS dilakukan maka sampel masyarakatyang terambil bisa tersebar ke semua penjuru kota, dan ini akan melibatkan biayapengambilan sampel yang tinggi. Daftar yang mungkin bisa diperoleh adalah daftarnama nama kelurahan dikota tersebut. Kelurahan adalah kumpulan kepala kepalakeluarga. Oleh karena itu kelurahan dipandang sebagai klaster.Proses pegambilan sampling klaster dilakukan dengan memperhatikankerangka sampling yang berisikan daftar klaster , dalam contoh di atas daftar namakelurahan. Pengambilan sampel kemudian dilakukan dengan mengambil secara acakklaster-klaster. Unit sampling yang berisikan klaster-klaster dinamakan unit samplingutama (primary sampling unit) disingkat USU. Apabila semua unit observasi dalamUSU menjadi anggota sampel maka dikatakan bahwa proses pengambilan sampeldilakukan dengan sampling klaster satu tahap. Namun apabila USU dibagi lagi kedalam unit yang lebih kecil, misalnya kelurahan dibagi lagi ke dalam Rukun-rukunWarga maka rukun warga disebut unit sampling ke dua (secondary sampling unit)disingkat USD. Apabila semua unit obervasi (elemen) dari USD menjadi anggotasampel, maka dikatakan proses pengambilan sampel dilakukan dengan samplingklaster dua tahap, demikian seterusnya.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Perhatikan persamaaan dan perbedaan sampling berstrata dan sampling klaster dalamgambar berikut.<strong>Sampling</strong> Acak StratifikasiMasing-masing elemen di dalam populasitepat berada dalam satu stratumPopulasi dari H strata; stratum h memilikin h elemen<strong>Sampling</strong> KlasterMasing-masing elemen di dalam populasitepat berada dalam satu klaster<strong>Sampling</strong> klaster satu tahap; Populasi dariN klaster.Mengambil secara SRS elemen-elemenuntuk setiap stratumMengambil klaster secara SRS kemudianmengamati semua elemen di dalamklaster yang terambil.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Varians penaksirnya tergantung padakeragaman nilai-nilai di dalam strataKlaster merupakan unit sampling, lebihbanyak klaster yang dijadikan sampelmaka lebih kecil variansnya. Varians daripenaksirnya tergantung pada keragamanantara rata-rata klasterUntuk presisi yang terbaik, elemenelemenindividu di dalam setiap stratumharus memiliki nilai-nilai yang serupa ,tetapi rata-rata sertiap statum satu samalain sedapat mungkin harus berbedaUntuk presisi yang terbaik, elemenelemenindividu di dalam masing-masingklaster harus heterogen, dan rata-rataklaster harus serupa satu sama lainnya.V.2 Notasi notasi yang digunakan untuk <strong>Sampling</strong> Klaster Satu TahapDalam sampling acak sederhana, unit-unit yang diambil sebagai sampel adalahelemen-elemen yang diobservasi. Dalam sampling klaster, unit samplingnya adalahklaster-klaster, dan elemen-elemen yang diobservasi adalah USD di dalam klasterklaster.Himpunan semestanya, U¸ merupakan populasi dari N USU; S menandakansampel dari USU yang dipilih dari populasi USU, dan S i merupakan sampel dari USDyang dipilih dari USU yang ke-i.Berikut ini adalah notasi notasi yang akan digunakan dalam sampling klasterkhususnya bila ingin menaksir rata rata populasi:N = banyaknya klaster dalam populasin = banyaknya klaster yang dipilih sebagai samplemi= banyaknya unit observasi (elemen) dalam klaster ke I, I=1,2, … ,Nm =1n m in i=1rata rata ukuran klaster dalam sampelM = Nm ii=1Banyaknya unit observasi (elemen) dalam populasiMM = rata rata ukuran klaster dalam PopulasiNyi= total semua observasi dalam klaster ke i<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
V.3 Proses Memilih dalam <strong>Sampling</strong> Klaster Satu TahapDalam sampling klaster satu tahap, terjadi suatu kondisi dimana semua atautidak satupun elemen-elemen yang terkandung di dalam klaster (= USU) dijadikansebagai sampel. <strong>Sampling</strong> klaster satu tahap banyak digunakan pada kegiatan survaiyang memiliki biaya sampling untuk USD dapat diabaikan bila dibandingkan denganbiaya sampling untuk USU. Misalnya untuk survai pendidikan, yang bertindaksebagai USU adalah ruangan kelas; semua siswa dalam kelas yang terpilih yangsebenarnya merupakan USD dijadikan sebagai objek analisis jika hanya sedikit biayaekstra yang perlukan daripada meneliti beberapa siswa saja dalam kelas terpilihtersebut.i) Populasi dibagi-bagi ke dalam N buah klaster atau Unit <strong>Sampling</strong> Utama(USU). Keadaan variable Y dalam setiap klaster diusahakan se-heterogenmungkin (dalam praktik tidak pernah bisa tercapai, terutama apabila yangmenjadi klaster adalah daerah atau kumpulan satuan-satuan sampling yangukurannya besar).ii) Secara Simple Random <strong>Sampling</strong> dipilih n buah klaster.iii) Pemilihan hanya dilakukan sekali yaitu memilih klaster ( memilih Unit<strong>Sampling</strong> Utama / USU ). Oleh karena itu, semua unit sampling kedua(USD) yang ada dalam klaster yang terpilih diperiksa.Sebagai catatatan bahwa apabila kita akan menggunakan sampling klaster satu tahapmaka disarankan ukuran klaster relatif kecil. Ukuran klaster yang terlalu kecil bisamerugikan, bisa pula menguntungkan.Merugikan : Apabila yang sedang kita teliti adalah peristiwa-peristiwa yangjarang terjadi (Rare Cases)Contoh : Kematian ibu pada saat melahirkan (mortality)Menguntungkan : Apabila peristiwa itu banyak terjadi (abundant cases).V.4 Taksiran Rata-rata Populasi<strong>Sampling</strong> klaster merupakan sampling acak sederhana dengan setiap unitsamplingnya mengandung sejumlah elemen-elemen. Oleh karena itu, taksiran rata-<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
ata populasi, , dan total, τ, serupa dengan taksiran-taksiran pada sampling acaksederhana. Secara khusus, rata-rata sampel, y , merupakan taksiran yang baik darirata-rata populasi, .Taksiran rata rata populasi μ adalah rata-rata sampel yang bentuknya adalah:yni=1= ni=1ymii(5.1)dan varians dari y adalahn( yi− ymi)N nV ˆ − i=1( y)=2 NnM n −1(5.2)Dalam hal ini M dapat ditaksir dengan m jika M tidak diketahui.Taksiran varians pada persamaan (5.2) merupakan taksiran yang bias dan taksiranvarians tersebut akan baik jika ukuran sampel yang diambil, n, besar, yaitu n 20.Bias akan hilang jika masing-masing klaster, m 1 , m 2 , …, m N , memiliki ukuran yangsama.2Contoh:Suatu survai dirancangkan untuk menaksir rata rata pengeluaran untuk keperluanrumah tangga masyarakat disuatu kota. Karena daftar rumah tangga di daerah tersebuttidak ada, maka dilakukanlah pengambilan sampel dengan cara klaster. Yang menjadiklaster adalah Rukun rukun warga (RW) di daerah tersebut. Dari hasil sampeldiperoleh data berikut.Tabel 5.1RWBanyaknyaRumahTanggaTotal JumlahPengeluaran dariRumah Tangga(dalam ribuanrupiah)RWBanyaknyaRumahTanggaTotal JumlahPengeluaran dariRumah Tangga(dalam ribuanrupiah1 55 2210 11 73 29302 60 2390 12 64 24703 63 2430 13 69 2830<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
4 58 2380 14 58 23705 71 2760 15 63 23906 78 3110 16 75 28707 69 2780 17 78 32108 58 2370 18 51 24309 52 1990 19 67 273010 71 2810 20 70 2880Dari tabel ini maka m = , m = 60, m = 63, , m 70, sehingga = 13031552320=Jadi rata rata pengeluaran dari sampel adalahUntuk menghitung Vˆ ( y)20i=1y2i= y=21+ y22+ ... + y20 yii=120i=1mi=523401303= 40.169n m ii=1diperlukan beberapa perhitungan sebagai berikut:22( 2210) + ( 2390) + ... + ( 2880)= 138873600225220i=1m2i= m=21+ m2 2( 55) + ( 60) + ... + ( 70)= 8617122+ ... + m225220i=1y imi = y1m1+ y 2m2 + ... y 20m20=( 2210)( 55) + ( 2390)( 60) + ... + ( 2880)( 70)= 3456230Kemudian kita uraikan persamaan berikut:<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
2020202 2= y i − 2 y i= 1i=1i=1( y i − ym i)= 138873600 − 2= 248085,668yimi+ y220i=1m2i2( 40,17)( 3456230) + ( 40,17) ( 86171)Karena M tidak diketahui, maka sebagaimana yang telah dijelaskan sebelumnya, Mdapat ditaksir dengan m sebagai berikut :m =20i=1mi1303= = 65,15n 20Apabila dimisalkan bahwa total Rukun Warga yang ada di daerah tersebut adalahsebanyak 100 (N = 100), maka varians dari pengeluarannya adalah:Vˆ (y) =N − nNnM2ni=1100 − 20== 0,123( 100)( 20)( 65,15)( y − ym )in −12i2248085,668 20 −1Dengan demikian, dengan kepercayaan mendekati 95%, taksiran interval untukpengeluaran tersebut adalah :( ) = 40167 , ± 2 0,123 = 40167 , 0 702y ± 2 V ˆ y± ,Jadi taksiran yang paling baik dari rata-rata pengeluaran untuk keperluan rumahtangga masyarakat di kota tersebut adalah 40,167, dan kekeliruan taksiran haruskurang dari 0,702 dengan peluang mendekati 0,95.V.5 Taksiran Total PopulasiPenaksir dari total populasi, τ, adalah sebagai berikut:ny ii=1M y = M(5.3)nmi=1i<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
penaksir varians dariM y adalah:Vˆ( My)= M= M22VN( y)2= MN − nNnM N − n = N nn2N − nNnM ( y i − ym i) ( y i − ym i)i=12ni=1n − 12 ( y i − ym i)n − 12ni=1n − 122(5.4)Contoh :Dari contoh sebelumnya mengenai tingkat pengeluaran untuk keperluan rumahtangga masyarakat di suatu kota, akan ditaksir total pengeluarannya. Dimisalkanbahwa terdapat 5500 penduduk dari kota tersebut, maka nilai taksiran totalpengeluarannya adalah:M y = 5500( 40,167)= 220918,5Sebelumnya telah diketahui nilai dari Vˆ ( y), namun dari sekarang ini nilai M tidakperlu lagi ditaksir dengan m . Dengan memanfaatkan nilai yang telah diperolehtersebut, maka dengan menggunakan kepercayan 95%, taksiran interval untuk τadalah sebagai berikut:M y ± 2Vˆ220918,5 ± 2220918,5 ± 3858,6222( M y) = 220918,5 ± 2 M Vˆ( y)2( 5500) ( 0,123)Seringkali banyaknya elemen dalam populasi tidak diketahui ketika akan digunakan nklaster sampling. Maka penaksirM y tidak dapat digunakan, tetapi dapat digunakanbentuk taksiran yang lain dari total populasi yang tidak bergantung pada M. Nilaidiperoleh dengan persamaan:y τ ,<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
1y τ =(5.5)nn y ii=1adalah rata-rata dari total klaster untuk sampel klaster yang berukuran n. Oleh karebaitu, y τ merupakan penaksir yang tak bias untuk rata dari total N klaster dalampopulasi. Begitu juga N y merupakan penaksir yang tak bias untuk jumlah dari totalklaster atau total populasi, τ.τAdapun penaksir dari total populasi τ, yang tidak bergantung pada M adalah:Taksiran varians untukN y :NN y τ =(5.6)nn y ii=1 ( yi− y)N nV ˆ 22 − i=1( Ny)= N V( y)= N Nn n − 1(5.7)n2Jika ternyata variasi di antara ukuran-ukuran klaster besar dan jika ukuran klastersangat berkorelasi dengan total klaster, maka varians untuk N y (persamaan 5.7)pada umumnya lebih besar dari varians untukM y (persamaan 5.4). Penaksir N ytidak menggunakan informasi yang mengenai ukuran-ukuran klaster m 1 , m 2 , …, m nsehingga bisa mangakibatkan rendahnya presisi yang dimiliki.ττContoh :Dengan menggunakan contoh soal sebelumnya, dimisalkan bahwa untuk menaksirtotal pengeluaran ternyata banyaknya penduduk dari kota tersebut tidak diketahui.Yang diketahui adalah banyak klaster yaitu N=100. Sebagai solusinya, dapatdigunakan persamaan (5.7) sebagai berikut:N yτNn= yni=1100=20( 52340) 261700i =Selanjutnya untuk menentukan varians dari penaksirnya, maka terlebih dahulu dicaripersamaan berikut:<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
n1 n2 2( yi− y)= yi− i= 1i= 1i=1n= 138873600 −= 1899820nyi1202( 52340)2maka interval taksiran untuk total pengeluaran untuk pengeluaran rumah tanggamasyarakat adalah :NyNyττ± 2± 2Vˆ261700±2N( Ny )N − n Nn( 100)261700±12648,5112τ2n ( y i − y)i=1n − 1100− 20 1899820 100( 20) 20 − 12V.6 Menentukan Ukuran Sampel untuk Menaksir Rata-rata dan Total PopulasiBanyaknya informasi dalam suatu sampel klaster dipengaruhi oleh dua faktoryaitu banyaknya klaster dan ukuran relatif dari klaster. Sebagaimana telah kitaketahui, ukuran dari batas-batas kekeliruan (bound of error) dari taksiran tergantungkepada variasi di antara klaster. Dengan demikian harus disahakan untukmemperoleh variasi yang kecil diantara totalnya.diasumsikan bahwa u8kuran klaster(unit sampling) telah dipilih dan dianggap hanya sebagai masalh dari pemililhanjumlah klaster, n.Dari persamaan (5.2), taksiran varians dari y adalahdimanaVˆ (y) =N − n 2NnM 2( s )ks2k=n ( y i − ym i)2i= 1(5.8)n − 1<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Varians sebenarnya dari y sekitar:2( σ )N nV ˆ − ( y)=2 k NnM(5.9)dimana2σ k merupakan varians populasi yang ditaksir dengan2Karena tidak dketahui σ k atau rata-rata dari klaster M , pemilihan ukuran sampel,yaitu banyaknya klaster yang perlu untuk memperoleh informasi khusus mengenaiparameter populasi menjadi sulit. Kesulitan ini dapat diatasi dengan menggunakanmetode yang sama dengan penggunaan pada taksiran rasio. Yaitu, digunakansebuah2s k .taksiran dariσ 2 k dan M , yang diperoleh dari survai pendahuluan, atau dipilihsampel yang berukuran n’ elemen yang telah diambil dari penelitiansebelumnya.Dengan demikian, seperti halnya pada semua permasalahan mengenaipenentuan ukuran sampel, pada standard deviasi penaksir dikalikan dengan duauntuk memperoleh batas-batas kekeliruan dari taksiran (bound of error), δ. Batasanini menunjukkan nilai kekeliruan maksimum yang dirasa memiliki toleransi yangsesuai, yaitu:( )δ = 2 V y (5.10)dengan menggunakan persamaan (5.9), diperoleh pemecahan untuk n.Kita memperoleh hasil yang sama ketika menggunakan M y untuk menaksir totalpopulasi τ, karena V( M y ) = M 2 V( y ).Pendekatan ukuran sampel dengan tujuan untuk menaksir μ dengan batas kekeliruantaksiran δ , adalah:dimana2σ k ditaksir dengan2kN σn = (5.11)N D + σ2s k , dan2δ22kMD = (5.12)4<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Apabila kita mengambil nilai pengali dari simpangan baku taksirannya adalah z α ,2yang merupakan pendekatan dari distribusi normal baku dengan melibatkan resikokekeliruan sebesar α, maka diperoleh :( y)δ= z V (5.13)α2sehingga nilai D berubah menjadi :D =2 2δ M( z ) 2 α2(5.14)Contoh:Misalkan data pada tabel 5.1 merupakan sampel pendahuluan dari pengeluaran untukkeperluan rumah tangga msyarakat di suatu kota. Berapa besar sampel yang harusdiambil untuk keperluan survai yang akan datang yang bertujuan untuk menaksir rataratapengeluaran μ dengan batas kekeliruan dari taksirannya adalah 25 ribu rupiah?Jawab:sn ( y i − ym i )n − 12248085,668=20 − 12 i=1k =,= 13057 14nilai M dapat ditaksir dengan :m =20i=1mi1303= = 65,15n 20Selanjutnya nilai D diperoleh adalah:δD=2M42=2( 25) ( 65,15)42= 663206,64maka ukuran sampel yang sebaiknya diambil adalah<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
2100 ( 13057,14)( 683722,2656)+Nn = σ k== 34 3676 ≈ 352N D + σ 10013057,14,kjadi 35 klaster sebaiknya dijadikan sebagai sampel.V.7 Menentukan ukuran sampel apabila tujuan penelitiannya adalah menaksirtotal populasi, τ, menggunakantaksiran δ :M y, dengan batas kekeliruan dariDengan pola pemikiran yang sama, maka diperoleh persamaan ukuran sampelyang harus diambil sebagai berikut:2kN σn = (5.15)N D + σ2kdimana2σ k ditaksir dengan2s k , dan2D = δ (5.16)24 Natau apabila menggunakan kita mengambil nilai pengali dari simpangan bakutaksirannya adalah z α , yang merupakan pendekatan dari distribusi normal baku2dengan melibatkan resiko kekeliruan sebesar α, maka nilai D berubah menjadi :2δD = (5.17)( z N) 2α2Contoh:Dengan menggunakan data pada tabel 5.1 kembali, anggap sebagai data yangdiperoleh merupakan data survai pendahuluan. Ingin diketahui berapa banyak sampelyang harus diambil untuk menaksir total pengeluaran masyarakat untuk keperluanrumah tangganya, τ, dengan batas kekeliruan 3000 ribu rupiah. Dimisalkan bahwaterdapat 2000 penduduk di kota tersebut.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
JawabDengan menggunakan persamaan (5.15) dan menaksirsn ( y i − ym i )n − 12248085,668=20 − 12 i=1k =,= 13057 142σ k dengandan2δD =4 N2=maka diperoleh2N σkn =N D + σ( 3000)4 ( 100)2k22= 225100=100( 13057,14)( 225)+13057,14= 36, 72 ≈ 37V.8 Taksiran Proporsi PopulasiDimisalkan bahwa seorang peneliti akan menaksir proporsi dari populasi,maka penaksir terbaik dari proporsi populasi, π, adalah proporsi sampel, πˆ atau p.Misal a i merupakan jumlah total dari elemen-elemen dalam klaster ke-i yangmemilkiki karakteristik yang dimaksud. Maka proporsi karakteristik tersebut darielemen-elemen dalam sampel yang berukuran n klaster adalah:pni=1= mi=1aimi(5.18)dimana m i menunjukkan banyaknya elemen di dalam klaster ke-i, i = 1, 2, .., n.Catatan bahwa p memiliki bentuk yang sama dengan y (lihat persmaan ??), kecuali y idiganti dengan a i . Taksiran varians dari p serupa dengan y .Taksiran varians dari p :<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Vˆ( p)( a − p m ) N n − i=1=2N n M n − 1Batas-batas Kekeliruan (Bound of The error) dari taksiran :nii2(5.19)2( ai− p mi) N n i 1Vˆ ( p)Z −= =α α(5.20)δ = Z2 2 2N n M n − 1ndimanaZ α diperoleh dari tabel distribusi normal baku dengan taraf signifikansi α.2Apabila kita mengambil nilai α = 5%, maka diperoleh nilaipersamaan di atas menjadi :Z α mendekati 2 , maka2δ = 2 N n − i2N n M n − 1n2( ai− p mi)= 1(5.21)persamaan varians di atas merupakan penaksir yang baik hanya jika ukuran sampel,n,besar, katakanlah n 20. Jika m 1 = m 2 = … = m N , maka p merupakan penaksir takbias untuk π, dan Vˆ ( p)merupakan penaksir yang tak bias dari varians p yangsebenarnya untuk setiap ukuran sampel.Contoh :Sebagai lanjutan dari contoh sebelumnya, kepada masyarakat ditanyakan pula apakahmasyarakat di kota tersebut menempati rumah sewaan atau rumah milik sendiri.Hasilnya disajikan dalam tabel 5.2 . Gunakan data pada tabel tersebut untuk menaksirproprsi penduduk yang tinggal di rumah sewaan.Tabel 5.2KlasterBanyaknyaBanyaknyaBanyaknyaBanyaknyaRumahRumahPenyewa KlasterPenyewaTanggaTangga( a i )( a i )( m i )( m i )1 55 25 11 73 322 60 36 12 64 223 63 26 13 69 19<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
4 58 21 14 58 155 71 39 15 63 266 78 30 16 75 407 69 20 17 78 358 58 25 18 51 179 52 24 19 67 2210 71 30 20 70 20Dari data di atas diperoleh beberapa besaran sebagai berikut:20i=1202022mi = 1303 mi= 86171 ai= 524 ai= 14728 aimi= 34742i=1i=120i=120i=1Penyelesaian:Taksiran terbaik dari populasi penyewa adalah p, ditunjukkan dalam persmaan 5.18,yaitu :p =ni=1mi=1amii=5241303untuk menaksir varians p. kita harus menghitung:= 0,40ni=1( a − p m )ii2=ni=1a2i= 720,982− 2 p= 14728 − 2aimi+ p2m2( 0,40)( 34742) + ( 0,40) ( 86171)ni=12iKarena M tidak diketahui, maka sebagaimana yang telah dijelaskan sebelumnya, Mdapat ditaksir dengan m sebagai berikut :m =20i=1mi1303= = 65,15n 20Apabila dimisalkan bahwa total Rukun Warga yang ada di daerah tersebut adalahsebanyak 100 (N = 100), maka varians dari proporsi penyewa adalah:<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
N − nVˆ ( y ) = 2 NnM100 − 20== 0,000358( a − p m )n − 1( 100)( 20)( 65,15)ni = 1i2i2720,98220 − 1Dengan demikian, dengan kepercayaan mendekati 95%, taksiran interval untukproporsi penyewa adalah :( p) = 0,40 ± 2 0,000358 = 0,40 0, 0378p ± 2 Vˆ±Jadi taksiran yang paling baik dari proporsi penyewa masyarakat di kota tersebutadalah 0,40 dan kekeliruan taksiran harus kurang dari 0,0378 dengan peluangmendekati 0,95.V.9 Menentukan ukuran sampel untuk menaksir proporsiTaksiran dari proporsi populasi, π, dengan batas δ unit dari kekeliruan taksirandinyatakan dengan2V ( p) = δPersamaan di atas dapat menjadi solusi untuk menentukan besarnya sampel yangharus diambil, n dan prosedur solusinya serupa dengan persamaan 5.15, yaitu:dimana2σ k ditaksir dengan2k2σkN σn = (5.15)N D +2s k ;dans2k=ni=1( a − p m )in −1i2Dδ2 M 2= (5.16)4<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
atau apabila menggunakan kita mengambil nilai pengali dari simpangan bakutaksirannya adalahz α2, yang merupakan pendekatan dari distribusi normal bakudengan melibatkan resiko kekeliruan sebesar α, maka nilai D berubah menjadi :2 2( ) 2 αδ MD = (5.17)z2Contoh:Dimisalkan bahwa data pada tabel 5.2 dianggap sudah kadaluarsa. Selanjutnyadiperlukan suatu penelitian baru yang bertujuan untuk menaksir proporsi pendudukyang menyewa rumah. Berapa banyak sampel yang harus diambil untuk memberikantaksiran tersebut dengan batas 0,03 dari kekeliruan penaksiran?Penyelesaian:Taksiran terbaik dariσ 2 k adalah yang dihitung dengan menggunakan tabel 5.2sebagai berikut:sn2 ( ai− p mi)2k =i=1= =n − 1720,98220 − 137,946Karena M tidak diketahui, maka sebagaimana yang telah dijelaskan sebelumnya, Mdapat ditaksir dengan m sebagai berikut :m =20i=1mi1303= = 65,15n 20selanjutnya dengan mengambil nilai α = 5%, diperoleh nilai z = 1,96 , makadiperoleh nilai D sebagai berikut:22( zα)2( 0,03) ( 6515 , )2( 196 , )δ mD = == 0,994222sehingga diperoleh ukuran sampel minimal yang harus diambil adalah:2( 100)( 37,946)( 100)( 0,994) + ( 37,946)N σ kn = == 27,62 ≈ 282N D + σkα2<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Dengan demikian, klaster yang harus diambil adalah sebanyak 28. Perhatikan bahwanilai 28 menunjukkan banyaknya sampel minimal yang harus di ambil. Oleh karenaitu, pengambilan sampel (klaster) yang lebih dari nilai tersebut tidak menjadi masalahselama tidak ada faktor lain yang menjadi pertimbangan ukuran sampel sepertimasalah biaya, tenaga, waktu, dan lain sebagainya.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
BAB VISAMPLING KLASTER DUA TAHAPVI.1 Pendahuluan<strong>Sampling</strong> klaster dua tahap merupakan perluasan dari konsep klaster sampling.Sebagaimana yang telah dibahas pada bab sebelumnya mengenai sampling klastersecara umum, ternyata klaster pada umumnya merupakan suatu kumpulan darielemen-elemen, seperti blok-blok rumah tangga. Sebuah klaster sering mengandungbegitu banyak elemen. Oleh karena itu, diperlukan suatu pengelompokkan kembalidari elemen-elemen klaster yang telah terbentuk tersebut. Proses pengelompokkankedua dari klaster-klater pertama yang terbentuk itu menghasilkan suatu prosedursampling klaster dua tahap. Sebagai contohnya adalah apabila akan diteliti pendapatmasyarakat di suatu daerah, dalam hal ini kecamatan merupakan bentuk klaster yangpertama. Akan tetapi dikarenakan adanya keterbatasan dana penelitian dan didukungpula poleh suatu kondisi dimana elemen-elemen dalam kecamatan sangat heterogenyang merupakan imbas dari heterogennya tiap desa, maka desa-desa dari tiap klasterdijadikan sebagai klaster-kalster dari klaster pertama (kecamatan). Prosedur pemilihanuntuk klaster tahap dua dilakukan sama halnya seperti prosedur pemilihan padasampling klaster satu tahap. Oleh karena itu, di sini hanya akan terpilih desa-desa dariklaster pertama yang terpilih saja. Sehingga hal akan berakibat pada penghematanbiaya apabila dibandingkan dengan memilih desa langsung sebagai klaster tahappertama. Hal ini dapat dipahami karena jika desa langsung dijadikan sebagai klasterpertama, maka muncul suatu kemungkinan bahwa desa-desa yang terpilih sangatberjauhan yang berakibat pada peningkatan biaya survai atau biaya pengambilan data.Definisi VI.1<strong>Sampling</strong> klaster dua tahap merupakan suatu sampel yang diperoleh dengan diawalipemilihan sampel peluang dari klaster-klaster pertama yang kemudian memilihsampel peluang dari elemen-elemen masing-masing klaster yang telah dijadikansampel pada tahap sebelumnya.Pembahasan dalam buku ini hanya akan terbatas pada pemilihan masing-masing tahapsecara sampling acak sederhana. Sebagai contoh, suatu survai nasional terhadap<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
mahasiswa-mahasiswa di universitas yang ada di Indonesia mengenai opini merekaterhadap pemilihan presiden secara langsung. Klaster-klaster dalam hal ini universitasdapat dipilih secara sampling acak sederhana. Apabila prosedurnya sampling klastersatu tahap, maka seluruh mahasiswa dari universitas yang tepilih dijadikan sebagaiobjek yang diteliti.VI. 2 Cara Pembuatan Sampel Klaster Dua TahapMasalah pertama dalam pemilihan sampel klaster dua tahap adalah pemilihanklaster yang tepat. Terdapat dua kondisi yang diperlukan, yaitu:1. Kedekatan geografis dari elemen-elemen dalam klaster2. Ukuran klaster yang sesuai bagi administer/penelitiPemilihan klaster yang sesuai juga tergantung pada apakah diinginkan untukmembuat sampel sedikit klaster dengan elemen-elemen dalam kalster yang banyakatau sampel banyak klaster dengan elemen-elemen dalam klasternya yang sedikit.Akhirnya, pemilihan tergantung pada biaya yang akan dikeluarkan. Klaster-klasteryang besar cenderung memiliki elemen-elemen yang heterogen, dan karenanya suatusampel yang besar diharuskan untuk tiap-tiap klaster agar diperoleh taksiran yangakurat dari parameter populasi. Sebaliknya, kalster-klaster yang kecil seringmengandung elemen-elemen yang relatif homogen, dalam hal keakuratan informasimengenai karakteristik dari sebuah klaster, dapat diperoleh dengan memilih suatusampel yang kecil dari masing-masing klaster.VI. 3 Taksiran Tak Bias Rata-rata Populasi dan Total PopulasiSebagaimana yang telah dibahas pada bab sebelumnya, diperlukan suatutaksiran untuiik rata-rata populasi, μ, atau total populasi, τ dan menempatkan batasbataskekeliruan (bound of error) dari taksiran, δ. Berikut adalah notasi-notasi yangakan digunakan:N = Banyaknya klaster dalam populasin = Banyaknya klaster yang terpilih secara sampel acak sederhanaM i = Banyaknya elemen dalam klaster ke-im i = Banyaknya elemen yang terpilih dalam secara sampel acak sederhana dari<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
kklaster ke-iM=N M ii=1= Banyaknya elemen dalam populasiMM = = Rata-rata ukuran klaster populasiNy ij =Observasi ke-j dalam sampel dari klaster ke-iyi=1mim ij=1yij= rata-rata sampel untuk klaster ke-iDalam pembentukan suatu taksiran rata-rata populasi, μ, dapat dilakukandengan cara yang serupa dengan bahasan dari bab V mengenai sampling klaster satutahap. Persamaan (5.6) menunjukkan :Nnn y ii=1merupakan suatu penaksir yang tak bias untuk τ. Dengan demikian jika persamaan diatas dibagi dengan M, diperoleh:NMnn y ii=1menjadi suatu peaksir yang tak bias untuk μ. Tetapi penaksir tersebut tidak dapatdievaluasi karena tidak lagi diketahui total klaster, y i . Bagaimanapun juga, y i dapatditaksir denganM i y , dan dalam penggantian ii y itak bias untuk μ, yang dapat dihitung dari data sampel.M untuk y i, dimiliki suatu taksiranPenaksir tak bias untuk rata-rata populasi, μ :nM i yiN iˆ = 1μ = (6.1) M npengambilannya secara sampling acak sederhana untuk setiap tahap.Taksiran varians dari μ :Vˆ( μˆ)= N − n 1 N nM2 s2b+1nNM2 M i − m M i si mn22i M ii= 1i(6.2)dengan<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
n ( M i yi− Mˆ μ)2 i=1sb =(6.3)n −1dansn ( yij− yi)2 ii =2i22= 1i = 1,,...,n (6.4)m −1Batas kekeliruan taksiran:δ =2 Vˆ ( μˆ) (6.5)sebagaimana yang telah dibahas pada bab sebelumnya bahwa nilai pengali 2 diperolehdari pendekatan nilai tabelZ α untuk α = 5 %.2Taksiran μˆ yang ditunjukkan pada persamaan (6.1) tergantung pada M yaitubanyaknya elemen di dalam populasi. Sebuah metoda untuk menaksir μ ketika Mtidak diketahui akan dibahas pada bagian selanjutnya.Sebagai catatan bahwa s i2 merupakan varians sampel untk sampel yangterpilih pada klaster ke-i.Penaksir tak bias dari total populasi dapat diperoleh dengan cara mengalikannilai dari taksiran tak bias rata-rata populasi dengan banyaknya elemen dalampopulasi seperti halnya penggunaan pada sampling acak sederhana. Dengan demikian,M μˆ merupakan penaksir yang tak bias dari τ untuk sampling klaster dua tahap.Taksiran Total Populasi, τ :ˆτ= Mˆ μ = Nni=1Mniyidengan mengasumsikan sampling acak sederhana pada tiap tahap.Taksiran Varians dari τˆ :Vˆ2() ˆτ= M Vˆ () μˆ=2 N − n N N n s2b+Nnni=1M2i M i − m M ii si m2 2dengan s b telah dibahas pada persamaan (6.3) dan s i pada persamaan (6.4)2i<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Batas Kekeliruan Taksiranδ = 2= 2VˆM() ˆτ2Vˆ( μˆ)VI. 4 Penaksir Rasio dari Rata-rata PopulasiPenaksir μˆ yang diberikan pada persamaan (6.1) bergantung pada jumlah total darielemen-elemen dalam populasi, M. Seringkali M tidak diketahui. Jika kondisinyaseperti itu, maka harus ditaksir dari data sampel. Penaksir untuk M diperoleh dengannmengalikan rata-rata ukuran klaster, M i n , dengan jumlah klaster dalam populasi,i=1N. Proses seperti merupakan suatu penaksir rasio, dilambangkan dengan ˆμ r , karenabaik itu pembilang maupun penyebut keduanya merupakan variabel acak.Taksiran Rasio Rata-rata Populasi μ:μˆr=mi=1ni=1MiMyiiTaksiran Varians dari ˆμ r :Vˆ( μˆ)r= N − n 1 N nM2 s2τ+1nNM2ni=1M2i M i − m M ii si m2idengans2τ=dans2i=ni=1mM2i( y − μˆ)in −1i ( yij− yi)i=1mi−12r2i = 1,2,...,n<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Batas Kekeliruan Taksiran:δ = 2( ˆ )Vˆ μrTaksiran ˆμ r adalah bias, tapi bias tersebut dapat diabaikan jika n besar.Taksiran Proporsi PopulasiSuatu permasalaha dalam menaksir suatu proporsi populasi, π, seperti proporsimasyarakat yang menyukai produk tertentu. Suatu penaksir π dapat diperoleh denganmenggunakan μˆ (pada persamaan 6.1), atau ˆμ r sebagaimana yang diberikan padapersamaan (6.9), dan dengan mengambil nilai y ij = 1 atau 0 yang bergantung padakondisi apakah elemen ke-j dalam klaster ke-i termasuk ke dalam kategori yangdimaksud atau tidak.Oleh karena M selalu tidak diketahui, maka dibuat formula untk menaksir π denganmenggunakan suatu taksiran rasio yang sejalan dengan ˆμ r yang diberikan padapersamaan (6.9). Misalkan p merupakan proporsi dari elemen-elemen yang diambilsebagai sampel dari klaster i yang termasuk pada kategori yang dimaksud.Penaksir Proporsi Populasi π :p =ni=1nMi=1iMpˆiiTaksiran varians π :Vˆ n N − n 1 1= M− m( ) + 22 i i i ip s 2 iM2 i N n M nNM i= 1 M i mi−1dengans2rdanq=ni=1= 1−Mi p i2i( p − p)in −12 p qBatas Kekeliruan Taksiran:<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
δ = 2Vˆ ( p)VI. 6 <strong>Sampling</strong> Klaster Berukuran SamaDimisalkan bahwa masing-masing klaster mengandung M elemen, yaitu:M 1 = M 2 = … = M N = MDalam kasus ini, merupakan hal yang wajar apabila sampel yang diambil punmemiliki ukuran yang sama untuk tiap klaster, yaitu :m 1 = m 2 = … = m N = mDi bawah kondisi seperti ini, persamaan (6.1) menjadi:μˆ= N= NM1=nNMni=1i=1yinMMnnii=1nyiyiyang ekivalen dengan rata-rata sampel secara keseluruhanμˆ=1nmn my iji= 1 j=1dimana y ij merupakan ukuran ke – j dalam klaster ke-i. Kondisi seperti ini dapatterjadi dalam sampling produk-produk yang berbentuk paket (sebagai contohnyamasing-masing klaster terdiri atas 1 lusin / 24 kaleng sayuran) atau dalam samplingbarang-barang manufacture.Persamaan (6.2) menjadi:VˆMSBnm( μˆ) = ( − f ) + ( 1−f )dimana1 12f =n1 =N, f 2mM 1 N MSWmMSBdan=mn −1n ( y i − μˆ)i=12<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
MSW==n1n1( m −1)ni=1s2in m( yij− yi)i= 1 j=12MSB (Between-Claster Mean Square) merupakan rata-rata kuadrat antar klaster danMSW (Within-Claster Mean Square) rata-rata kuadrat dalam klaster.Dari persamaan 6.19 di atas, dapat dibuat suatu rangkaian observasi yang pentingpada karakteristikdari sampling klaster dua tahap sebgai beikut:MSWnmdemikian, dapat dihasilkan suatu taksiran yang baik dari varians μˆ sekalipun1. Jika N besar, Vˆ ( μ ˆ ) = dan hanya bergantung pada rata-rata klaster. Dengan2bentuk s i merpakan taksiran yang kurang baik untuk varians dalam klaster.Hal ini bisa terjadi, sebagai contohnya, jika sampling sistematik digunakandalam klaster-klaster.2. Jika m = M (atau f 2 = 1), maka samping klaster dua tahap dikurangi menjadisamping klaster satu tahap, sebagaimana yang telah dibahas pada bab 5.3. Jika n = N, makaVˆ( μˆ) = ( 1− f )2MSWnmyang merupakan taksiran varians yang diperoleh dalam suatu sampel acakstratifikasi dengan n = N strata dan m observasi dari masing-masing strata.Oleh karena itu, terlihat bahwa m mendekati M , sampling klaster dua tahapmemiliki proses yang sama dengan sampling kalster satu tahap. Ketika nmendekati N, sampling klaster dua tahap berkelakuan seperti sampling acakstratifikasi. Jika elemen-elemen di dalam klaster bersifat heterogen, maka harusdijadikan sebagai sampel dalam penelitian.Ketika N besar, taksiran varians( μˆ) = MSB1Vˆ nmakan menaksir varian yang sebenarnya;Vˆ( μˆ)dengan1 = σn 2b2σ w+ m <strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
2σ b = varians di antara rata-rata klasterdan2σ w = varians di antara elemen-elemen dalam klaster-klaster.2 2 2Karena MSB/m menaksir σ b + σ w /m , dan MSW menaksir σ w , maka jika suatupola:1m[ MSB − MSW ]akan menaksir σ b2 . Taksiran secara terpisah dari σ b2 dan σ 2 w diperlukan untukperhitungan ukuran sampel.Sebagaimana dalam kasus sampling acak stratifikasi, selanjutnya akan dicariukuran sampel m dan n yang akan meminimalkan V ( μˆ ) untuk biaya tertentu ataumeminimalkan total biaya sampling untuk V ( μˆ ) tertentu. Dimisalkan bahwa biayadari masing-masing klaster adalah c 1 dan biaya dari masing-masing elemen didalam klaster adalah c 2 . Maka biaya total adalah:c = nc 1 + nmc 2Nilai m yang akan meminimumkan V ( μˆ ) untuk biaya tertentu, atau meminimalkanc untk varians tertentu, diberikan melalui persamaan berikut:m =σσ2w2bcc12Setelah m ditentukan, n diperoleh dari persamaan (6.21) jika V ( μˆ ) tertentu nilainyaatau dari persamaan (6.23) jika c tertentu. Sebagai catatan bahwa m meningkatnilainya jika σ 2 w meningkat dan m akan menurun jika σ b2 meningkat. Dengandemikian, lebih banyak elemen-elemen dalam klaster yang dijadikan sebagaisampel (dan karenanya, akan sedikit klaster yang akan dijadikan sebagai sampel)2 2sebagaimana σ w yang lebih besar bila dibandingkan dengan σ b .VI. 7 <strong>Sampling</strong> Klaster Dua Tahap dengan Peluang Sebanding UkuranOleh karena banyaknya elemen di dalam sebuah klaster berbeda-beda, sebuahteknik yang seringkali menguntungkan untuk digunakan adalah mengambilkklaster-klaster dengan peluang yang sebanding dengan ukurannya. Biasanya,sampling psu digunakan pada tahap pertama dari prosedur sampling klaster dua<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
tahap karena elemen-elemen dalam klaster cenderung memiliki ukuran yang sama.Oleh karena itu, akan diberikan taksiran dari μ dan τ untuk sampling klaser duatahap dimana tahap pertama dari samplingnya mempunyai peluang yangsebanding dengan ukurannya.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
TINJAUAN MATA KULIAHBAB VIIIKlasifiklasi <strong>Sampling</strong>VIII.1 <strong>Sampling</strong> PeluangDitinjau dari sudut kesempatan semua unit sampling untuk terpilih menjadianggota sampel, maka sampling terbagi dalam dua bagian yaitu sampling random dansampling nonrandom, atau disebut juga sampling peluang dan sampling nonpeluang.Suatu proses pengambilan sampel dikatakan random bila semua unit samplingmempunyai peluang untuk bisa terpilih menjadi anggota sampel. Apabila dalamproses memilih satuan sampling dilibatkan unsur peluang sedemikian rupa sehinggabesarnya peluang setiap satuan sampling untuk terpilih diketahui besarnya, makasampling tersebut digolongkan ke dalam sampling peluang.Pada sampling peluang, peluang tiap elemen untuk terpilih sebegai sampelharus diketahui. Untuk tujuan ini, maka daftar elemen untuk memilih sampel(kerangka sampling) harus tersedia. Ke dalam sampling peluang dapat digolongkanbeberapa teknik pengambilan sampel. Selain bagaimana teknik pengambilan sampelyang harus dikerjakan agar setiap unit mempunyai peluang terambil menjadi anggotasampel, dalam sampling peluang juga dibahas berapa banyak unit sampling yangharus diambil.a. Simpel Random <strong>Sampling</strong> (SRS)<strong>Sampling</strong> Acak Sederhana ini merupakan suatu proses memilih satuan samplingdari populasi sedemikian rupa sehingga setiap satuan sampling dalam populasimempunyai peluang yang sama besar untuk terpilih ke dalam sampel dan peluang itudiketahui sebelum pemilihan dilakukan.Terdapat dua cara dalam pengambilansampling acak sederhana ini, yaitu dengan pengembalian (with replacement), yangmana dalam proses ini adanya kemungkinan bahwa suatu unit akan terpilih lebih darisatu kali dan tanpa pengembalian (without replacement) yang mana semua unit yangterpilih tidak akan ada yang sama.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Proses sampling dengan <strong>Sampling</strong> Acak Sederhana digunakan apabilamemenuhi beberapa kondisi sebagai berikut :- Variabel yang akan diteliti keadaannya relatif homogen dan tersebar meratadi seluruh populasi.- Apabila bisa disusun secara lengkap kerangka sampling yang menyangkutsetiap satuan pengamatan yang ada dalam populasi.b. Systematic <strong>Sampling</strong> (SS)Suatu proses memilih dikatakan sampling sistematik apabila dalam pemilihanitu dilakukan pemilihan sistematik setelah terpilih bilangan acak, dengan syaratbahwa peluang terpilihnya1 N .<strong>Sampling</strong> sistematik digunakan apabila :1. Bisa disusun kerangka sampling yang lengkap2. Keadaan variabel yang sedang diteliti relatif homogen dan tersebar meratadi seluruh populasic. Stratified Random <strong>Sampling</strong> (StRS)<strong>Sampling</strong> ini dilakukan apabila dalam keadaan tertentu <strong>Sampling</strong> AcakSederhana kurang baik untuk digunakan karena akan memberikan presisi suatutaksiran yang rendah. <strong>Sampling</strong> Acak Sederhana akan memberikan presisi yangtinggi apabila karakteristk populasi bersifat homogen. Akan tetapi jika keadaanpopulasi relative heterogen, maka kita akan menggunakan StRS. pembentukan strataatau stratifikasi dimaksudkan untuk meningkatkan presisi suatu taksiran. Menigkatnyasuatu presisi akan bergantung kepada derajat homogenitas yang dicapai dalam strata,atau dapat pula dikatakan bergantung pada seberapa besar variabilitas karakteristikyang akan diukur direfleksikan diantara strata. Hal ini tentu saja pada gilirannyabergantung kepada efektifitas pembentukan strata.Dalam membentuk batas-batas stratum, perlu mengumpulkan semua informasiyang dapat menolong mengklasifikasikan unit-unit menjadi kelompok-kelompokpopulasi yang satu sama lain berbeda. Data masa lalu, intuisi, pertimbangan para ahlidi lapangan, atau kejelian seseorang dalam menerka dengan baik, semuanya bisa<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
digunakan secara efektif dalam membentuk atau membedakan strata satu dengan yanglainnya.Apabila secara cermat strata sudah terbentuk, maka sampel untuk masingmasingstratum dipilih melalui metode <strong>Sampling</strong> Acak Sederhana. Karena dilakukandengan metode <strong>Sampling</strong> Acak Sederhana, maka tentunya harus tersedia kerangkasampling dalam setiap stratum.d. Cluster <strong>Sampling</strong> (CS)Cluster sampling dilakukan apabila peneliti ingin menekan biaya samplingatau jika kerangka sampling yang memuat elemen/atau unit observasi tidak tersedia.<strong>Sampling</strong> klaster adalah sampling dimana unit samplingnya adalah kumpulan ataukelompok (cluster) elemen (unit observasi).Proses pegambilan sampling klaster dilakukan dengan memperhatikankerangka sampling yang berisikan daftar klaster. Pengambilan sampel kemudiandilakukan dengan mengambil secara acak klaster-klaster. Unit sampling yangberisikan klaster-klaster dinamakan unit sampling utama (primary sampling unit)disingkat USU. Apabila semua unit observasi dalam USU menjadi anggota sampelmaka dikatakan bahwa proses pengambilan sampel dilakukan dengan samplingklaster satu tahap. Namun apabila USU dibagi lagi ke dalam unit yang lebih kecil,maka terdapat unit sampling ke dua (secondary sampling unit) disingkat USD.Apabila semua unit obervasi (elemen) dari USD menjadi anggota sampel, makadikatakan proses pengambilan sampel dilakukan dengan sampling klaster duatahap, demikian seterusnya.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
TINJAUAN MATA KULIAHBAB VIIRASIO, REGRESI, DAN SELISIH PENAKSIRANVII. 1 PENDAHULUANPenaksiran rata-rata dan total populasi dalam bab-bab sebelumnya didasaridari sebuah sampel respon pengukuran, y 1 , y 2 , y 3 ,...y n , seperti dengan simple randomsampling dan stratified random sampling. Kadang-kadang variabel-variabel lainberkorelasi sangat dekat dengan respon y. Dengan mengukur y dan satu atau lebihvariabel-variabel tambahan, kita bisa mendapatkan informasi tambahan untukmenaksir rata-rata populasi. Anda mungkin mengenal penggunaan variabel-variabeltambahan untuk menaksir rata-rata dari sebuah respon y. Ini merupakan dasar darikonsep korelasi dan rata-rata, untuk pengembangan dari prediksi persamaan relasi ydan x dengan metode kuadrat terkecil. Topik ini umumnya terdapat di bukupengenalan statistika ( Mendenhall, 1987, Bab 10 ).Pada bab-bab sebelumnya diperlihatkan penaksir-penaksir sederhana dariparameter-parameter dengan memanfaatkan respon pengukuran, y 1 , y 2 , y 3 ,...y n ;bagaimana pun, penekanan utamanya didasarkan kepada desain sampel survey (simple dan stratified sampling ). Sebaliknya, pada bab ini akan dijelaskan tiga carabaru dari penaksiran berdasarkan penggunaan variabel tambahan x. Metode-metodetersebut yaitu, rasio, regresi, dan selisih estimasi. Ketiganya membutuhkan duavariabel pengukuran, x dan y , dalam setiap elemen sampel. Macam-macam desainsampling bisa menggunakan ketiga metode di atas, tapi kita akan membicarakansimple random sampling. Penaksiran rasio akan digunakan dalam stratified randomsampling untuk menunjukkan ide dasar bagaimana ketiga metode ini digunakan.VII.2 SURVEY-SURVEY YANG MEMBUTUHKAN PENGGUNAANPENAKSIR RASIOPenaksiran yang efisien dari total populasi kadang-kadang membutuhkanpenggunaan variabel tambahan. Kita ilustrasikan penggunaan dari rasio penaksirdalam suatu situasi berikut ini. Harga yang dibayarkan untuk jeruk dalam pengiriman<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
yang besar berdasarkan dari isi gula dari berat pengiriman. Isi gula yang tepat tidakbisa ditentukan sebelum pembelian dan penyaringan jus buah dari keseluruhan beban;namun, bagaimana pun hal tersebut bisa kita taksir. Satu metode untuk menaksir haldiatas yaitu pertama kali kita tentukan rata-rata isi gula dalam tiap jeruk, μ y ,kemudian mengalikannya dengan jumlah jeruk N dalam muatan. Kemudian kitaambil sampel n jeruk secara acak dari muatan untuk menentukan isi gula y untukmasing-masing jeruk. Rata-rata dari pengukuran , y 1 , y 2 , y 3 ,...y n , akan menaksir μ y; N yakan menaksir total isi gula dalam muatan, y . Sayangnya, metode ini tidakmungkin dilakukan karena terlalu membutuhkan banyak waktu dan biaya dalammenentukan N (yaitu dalam menentukan jumlah jeruk dalam muatan).Kita dapat menghindari untuk menghitung N dengan mencatat beberapa fakta.Pertama, isi gula dalam tiap jeruk , y , berkorelasi cukup dekat dengan berat darijeruk, x; kedua, rasio dari total gula y dengan total berat dari muatan x sama denganrasio dari rata-rata isi gula dalam tiap jeruk μ y dengan rata – rata berat jeruk μ x . Maka:μμyxNμy=Nμxτy=τxuntuk mengetahui total isi gula dari muatan, kita mendapatkanμτy=μy( xxτ )Kita dapat menaksir μ y dan μ x dengan menggunakan y dan x , rata-rata dari isi guladan berat jeruk dari sampel n jeruk. Kita juga dapat mengukur x , yang merupakantotal berat dari jeruk dalam muatan truk. Kemudian penaksiran rasio dari total isi gula y yaitu:∧τ y =y ( τ x)xatau, sama dengan ( mengalikan pembilang dan penyebut dengan n ).∧τ yy= ( τx) =xni=1ni=1yxii( τ )xDalam kasus ini jumlah elemen populasi, N, tidak diketahui, dan karena itukita tidak dapat menggunakan penaksir sederhanaN y untuk menaksir total populasi y . Jadi, penaksir rasio diperlukan untuk menyelesaikan objek penaksiran. Bagaimana<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
pun, jika N diketahui, kita punya pilihan apakah akan menggunakan penaksirN yatau penaksir rasio untuk menaksir y . Jika y dan x kerkorelasi cukup tinggi, berarti xmemberikan kontribusi untuk memprediksi y, penaksir rasio harus lebih baik dariN y , yang semata-mata tergantung pada y .Dalam penjumlahan untuk mendapatkan total populasi y , sering ada parameteparameterlain yang terlibat. Kita mungkin akan menaksir rata-rata populasi μ y ,dengan menggunakan prosedur penaksiran rasio. Sebagai contoh, misalkan kita akanmenaksir rata-rata isi gula dalam tiap jeruk dalam pengiriman yang berskala besar.Kita akan menggunakan rata-rata sampel y untuk menaksir μ y . Bagaimana pun, jika ydan x berkorelasi, penaksir rasio yang menggunakan informasi dari variabel pembantux sering kali memberikan penaksir yang lebih tepat untuk μ y .Rasio populasi merupakan parameter lain yang mungkin terlibat sebagai faktorkoreksi. Sebagai contoh, asumsikan kita akan menaksir rasio dari penjualan mobiluntuk tiga bulan pertama dalam tahun ini dengan total penjualan di periode yang samadi tahun yang lalu. Misalkan x merupakan total penjualan dalam tiga bulan pertamadi tahun yang lalu, sedangkan y total penjualan dalam periode yang sama di tahun ini.Kita perhatikan dalam penaksiran rasio yaitu:τ yR = τxKosep dari penaksiran rasio di gunakan dalam analisis data untuk surveysurveypenting dan secara praktis digunakan oleh pemerintah, dunia bisnis, danpeneliti di akademik. Sebagai contoh, indeks harga konsumen (IHK) sebenarnyamerupakan rasio dari harga-harga pembelian yang tetap dari barang-barang yangkonstan kualitas dan kuantitasnya untuk dua waktu. Sekarang ini, IHK merupakanperbandingan harga hari ini dengan harga tahun 1967. IHK berdasarkan padapengumpulan data tiap bulan atau setiap beberapa bulan dari 24000 penetapan ( tokotoko,rumah sakit-rumah sakit, dan lain-lain) yang dikumpulkan dari 85 kota diseluruh negara. IHK digunakan untuk mengukur tingkat inflasi.The Current Population Survey mendapatkan informasi pengangguran yangmenggambarkan tentang usia, jenis kelamin dan ras pengangguran, menggunakanteknik penaksiran rasio. Sebagai contoh, jumlah rasio pengangguran ras kulit hitamdengan yang sudah bekerja untuk area sampel tertentu bisa dikembangkan untukmenghitung jumlah pengangguran ras kulit hitam di area yang lebih besar dengan cara<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Dengan menggunakan data pada tabel 7.1, taksirlah R, perubahan relatifpada penilaian real estate selama periode 2 tahun yang diberikan. Carijuga rentang kekeliruan penaksiran.PembahasanTaksiran R dengan menggunakan data sampel diperoleh denganr = 20i=120i=1dengan menggunakan tabel 6.1r =164.7154.5yi nilai total sebenarnya dari 20 rumah= nilai total dari 20 rumah 2 tahun yang lalux = 1.07Karena itu, kita menaksir bahwa nilai real estate telah naik kurang lebih 7% selama 2 tahun periode pada daerah yang diteliti.Tabel 7.1 Data dan perhitungan survei nilai real estate ( dalam $ 10,000 )Rumah Nilai perkiraan 2 tahun Nilai sebenarnyayang lalu ( x i )( y i )22x i y i1 6.7 7.1 44.88 50.41 47.572 8.2 8.4 67.24 70.56 83.883 7.9 8.2 62.41 67.24 74.784 6.4 6.9 40.96 47.01 44.165 8.3 8.4 68.89 70.56 69.726 7.2 7.9 51.84 62.41 56.887 6.0 6.5 36.00 42.25 39.008 7.4 7.6 54.76 57.76 56.249 8.1 8.9 65.61 79.21 72.0910 9.3 9.9 86.49 98.01 92.0711 8.2 9.1 67.24 82.81 74.6212 6.8 7.3 46.24 53.29 49.6413 7.4 7.8 54.76 60.84 57.7214 7.5 8.3 56.25 68.89 62.2515 8.3 8.9 68.89 79.21 73.8716 9.1 9.6 82.21 92.16 87.3617 8.6 8.7 73.96 75.69 74.8218 7.9 8.8 62.41 77.44 69.5219 6.3 7.0 39.69 49.00 44.1020 8.9 9.4 79.21 88.36 83.66Jumlah 154.5 164.7 1210.55 1373.71 1288.95x iy i<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Rentang kesalahan penaksiran didapatkan dengan menggunakan persamaan2(7.3). Jalan singkat untuk menghitung (yi− rx i) adalah dengan20i=120i=120i=12i2022( y − rx ) = y + r x − 2rx y(7.4)iii=1Nilai-nilainya didapatkan dari tabel 6.1 :20i=1( y i− rx i)2= 1373.71+(1.07)= 1.3157Dengan menggunakan persamaan (7.3)22i20i=1ii(1210.55) − 2(1.07)(1288.95)2∧V ( r)= 2N − n 1nN x− 2ni=1( yi− rx )n −1i2 1000− 20 1 = 2 20(1000)2(7.725) ni=1(1.3157)192= 0.015Jadi, kita menaksir rasio dari nilai real estate sekarang dengan yang dua tahunyang lalu menjadi r = 1.07 dan kita sungguh yakin bahwa kesalahan penaksirankurang dari 0.02. Karena itulah, rasio sebenarnya R untuk polpulasi seharusnyaberada diantara 1.05 dan 1.09. Dengan catatan bahwa rentang kesalahan daripenaksiran cukup kecil. Karena itu r seharusnya menjadi penaksir yang cocok untukR.Interval konfidensi untuk sampel besar yang didasai oleh teori distribusinormal, seperti yang ditunjukkan dalam bagian 2, mengaplikasikan contoh rasiestimasi dengan baik. Dengan demikian sebagai contoh, penaksiran inteval konfidensi90 % untuk rasio R dalam bentuk∧r ± 1.645V ( r)Taksiran varians r dapat dituliskan dalam berbagai bentuk. Salah satu yanglebih khusus yang berguna untuk menunjukkan koefisien korelasi antara x dan y.Korelasi ini dapat ditaksir olehρ =SSxxySy<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
dimanaS xy =1nn −1i=1( xi−− x)(yi−− y)danS x 2 =1 n −(x i− x)n −1i=12S y 2 =1 n −(y i− y)n −1i=12Koefisien korelasi akan memegang peranan kunci pada diskusi selanjutnya.Sekarang kita menuliskan∧1−f 1 ∧2 2 2V ( r)= (Sy+ r Sx− 2rρ S Sn μx 2 x ydimana f = n/N, fraksi sampling. Bentuk ini sering digunakan dengan perhitunganyang ditampilkan dengan paket-paket perangkat lunak dari statistika stansar. Sebagaicontoh, Minitab membaca data pada sampel 7.1 adalahN Mean Stdevx 20 7.725 0.947y 20 8.235 0.957)Korelasi antara x dan y adalah 0.966Dari rangkuman ini,∧ 20 V ( r)= 1− 1000 = 0.000056712017.7252 .222[( 0.957)+ (1.07) (0.947) − 2(1.07)(0.966)(0.947)(0.957) ] dan 2 V ∧(r)= 0.015, dianggap sama dengan perhitungan yang di awal.Ada analogi antara penaksir rasio dan analisis regresi klasik. Kami akanmemperkenalkan salah satu dari analogi dengan tujuan perhitungan, dan menggalibagian lain dari hubungan tersebut nantinya. Dalam regresi klasik dalam populasiyang tidak terbatas, seandainya kita membuat modelE (y i ) = x iSelanjutnya, jika varian y i proporsional terhadap x i . Kemudian, analisis regresi yangdiboboti seharusnya digunakan, dengan bobot proporsi pada kedua variannya, atau<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
1/x i dalam kasus ini. Kuadrat terkecil biasa dalam analisi regresi yang terbobotdengan bobot 1/x i akan menghasilkan r sebagai penaksir . Standar deviasi darikoefisien regresi akan hampir sama dengan perhitungan 2 V ∧(r)kita yang pertama,kecuali untuk koreksi populasi yang terbatas.Hasil dari MINITAB untuk analisis regresi yang terbobot untuk data padacontoh 7.1 adalahJika taksiran koefisien 1.066 1.07 = r, dan2 V ∧ (r)= 2 0.98(0.00745) = 0. 15adalah seperti hasil perhitungan kita yang diawal. Pendekatan ini tentunya membawakebosanan pada perhitungannya, tapi pengguna teknik ini seharusnya memilikipengetahuan tentang regresi klasik disamping yang ada di buku ini. ( t-rasio dan p-value yang ditunjukkan diatas, jika dalam populasi normal yang tidak terbatas,koefisien regresi akan berbeda secara signifikan terhadap nol).Tehnik rasio untuk menaksir total populasi y diaplikasikan dalam penaksirantoal isi gula dalam muatan truk jeruk. Penaksir sederhana dari N − y tidak dapatdigunakan karena kita tidak mengetahui N, total banyaknya jeruk dalam truk.Prosedur penaksiran rasio berikut dapat diaplikasikan dalam menaksir y apakah Ndiketahui atau tidak.Penaksir rasio dari total populasi τ y :∧∧τ y =ni=1ni=1yxii( τ ) = rτxx(7.5)Varian dari taksiran τ y :∧∧ ∧∧22( τ y ) = ( τx) V ( r)= τxV( − ) − 1 yirxiN n i=1 2 nN μ i n −1n2(7.6)<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
dimana x dan x adalah rata-rata populasi dan total, yang berturut-turut, dari variabelacak x.Rentang kesalahan dari penaksiran :2n2( y − )^ ∧irxi2 N − n 1 i=1V ( τ ) = 2 2yτx(7.7) nN μx n −1Dengan catatan meskipun kita tidak perlu mengetahui N atau x , kita harusmengetahui x untuk menaksir y dengan menggunakan prosedur penaksiran rasio.Contoh 7.2 Dalam sebuah penelitan untuk menaksir total banyaknya gula dalammuatan truk jeruk, sebuah sampel acak dengan n = 10 jeruk dibuatmenjadi jus dan diukur beratnya. Total berat dari semua jeruk, didapatkandengan penimbangan pertama pada truk yang berisi muatan dengankemudian truk yang dikosongkan, didapatkan 1800 pon. Taksirlah y ,total jumlah gula pada jeruk, dan rentang kekeliruan penaksirannyaTabel 7.2 Data untuk contoh 7.2Jeruk Jumlah gula(dalam pon)Berat jeruk(dalam pon)1 0.021 0.402 0.030 0.483 0.025 0.434 0.022 0.425 0.033 0.506 0.027 0.467 0.019 0.398 0.021 0.419 0.023 0.4210 0.025 0.44Total 0.246 4.35Gula yang terkandung dalam jeruk biasanya dicatat dalam derajat brix, yangmerupakan pengukur berapa pon gula padat per 100 pon jeruk. Untuk menghitungnyakita akan menggunakan berapa pon kandungan yang sebenarnya untuk setiap jeruk.Taksiran τˆydapat diperoleh dengan menggunakan persamaan (7.5):<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
τˆy= rτˆ x=10yii= 1( τ10 xi=1xi0.246) = (1800) = 101.79 pon4.35Besarnya kekeliruan taksiran dapat dihitung dengan menggunakan versi modifikasidari persamaan (7.7). Karena N tidak diketahui dalam contoh ini, kita asumsikanfaktor koreksi populasi, (N-n)/N, mendekati nilai yang sama. Asumsi ini cukupberalasan karena kita mengharapkan sedikitnya N = 4000 jeruk di dalam sebuah trukkecil sekalipun. Rata-rata sampel x digunakan untuk menggantikan μ xpadapersamaan (7.7), karena μ x tidak diketahui. Dengan demikian persamaan (7.7) menjadi( yi− rxi)2 1 1 i=12 Vˆ( ˆ τy) = 2 τ x 2 n x n −1Gunakan persamaan (7.4), untuk menghitung :n210i=1( yi− rx )i2=10i=1y2i+ r102i=1x2i− 2r10i=1xiyidimanar =10i=110i=1yxii0.246= = 0.05664.35Dari data,10i = 12y i=(0.021)2+ (0.030)2+ ... + (0.025)2=0.00622410i=110i=1x2iy xi= (0.40)i2+ (0.48)2+ ... + (0.44)2= 1.9035= (0.021)(0.40) + (0.030)(0.48) + ... + (0.025)(0.44) = 0.108394.35x = =100.435Substitusikan ke dalam persamaan (7.4) didapat<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
10i=1( yi− rx )i2=10i=1y2i+ r102i=1x2i− 2r10i=1xiyiMaka kekeliruan penaksirannya adalah= 0.006224 + (0.0566) 2 (1.9035) - 2 (0.0566) (0.10839)= 0.00005228522 1 1 Vˆ( ˆ τ y) = 2 τ x 2 n x 10i=1( yi− rx )n −1i22 1 1 0.000052285 = 2 (1800) = 6. 3210 (0.435)9 Kesimpulannya, rasio penaksiran total gula dalam truk jeruk adalah τˆy= 101.79 pon,dengan kekeliruan penaksiran 7.3. Kita yakin bahwa total kandungan gula τ y beradapada interval101.79 ± 6.3sehingga, intervalnya berada pada 95.49 sampai 108.09 pon.Selain itu, deskriptif statistik, yang diperlihatkan di bawah ini dari outputMinitab, dapat digunakan untuk menghitung V ˆ(r ) , bagian utama dari Vˆ(τ ) .yN Rata-rata Stdevx 10 0.4350 0.0354y 10 0.02460 0.00438Korelasi x dan y = 0.991Analisis regresi yang diboboti dengan garis lurus melalui titik pangkalnyamenghasilkan :Persamaan regresinya adalahy = 0.0566 x<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Konstanta - - - -x 0.056552 0.001719 32.90 0.000Maka didapat,2 Vˆ(τ ) = 2τVˆ(r)yx= 2 (1800) (0.001719) = 6.19yang sangat dekat dengan hasil yang diberikan oleh metode perhitungan yangsebelumnya.Anda akan mengatakan bahwa populasi berukuran N seringkali diketahui.Oleh karena itu, peneliti harus memutuskan dalam kondisi bagaimana menggunakanpenaksir rasioˆ τ = rτxlebih baik dibandingkan dengan menggunakan penaksirykorespondingN y , dimana kedua penaksir didasarkan pada SRS_<strong>Sampling</strong> AcakSederhana (lihat bagian 7.5). Umumnya,daripadarτ x mempunyai varians yang lebih kecilN y apabila terdapat korelasi positif yang kuat antara x dan y, (dimana ρ ,koefisien korelasi antara x dan y, lebih besar dari ½ ). Secara intuisi, pernyataan inimasuk akal karena dalam penaksiran rasio kita menggunakan informasi tambahan daripenambahan variabel x. Jika peneliti lebih tertarik dengan rata-rata populasi daripada total populasi,prosedur penaksiran rasio koresponding ditunjukkan dalam persamaan (7.8), (7.9),dan (7.10).Penaksir rasio rata-rata populasi μy:nyii=1ˆ μy= ( μn x) = rμxxi=1i(7.8)Varians taksiran dariμˆy:2( yi− rxi)ˆ 22 N − n 1 i=1V ( ˆ μ ) = ˆ( ) = yμxVr μx2 nN (7.9) μx n −1n<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Taksiran kekeliruannya :2n2( yi− rxi) N − n i=1Vˆ(ˆ μy) = 2 (7.10) nN n −1Catatan bahwa kita tidak perlu mengetahui τ xatau N untuk menaksir μ yketikamenggunakan prosedur rasio; tetapi μxharus kita ketahui.Sebuah perusahaan ingin menaksir rata-rata jumlah uang μyyang dibayarkan kepadakaryawan untuk biaya pengobatan selama tiga bulan pertama pada kalender tahunan.Laporan rata-rata setiap tiga bulan ini didapat dari laporan keuangan tahunsebelumnya. Sampel acak sebanyak 100 karyawan diambil dari populasi sebanyak1000 karyawan. Hasilnya dinyatakan sebagai berikut. Gunakan data tersebut untukmemprediksi μydan untuk menempatkan kekeliruan penaksiran.n = 100, N = 1000Total tiga bulan terakhir :100 y ii= 1= 1750Total tiga bulan koresponding tahun sebelumnya :100 x ii= 1= 1200Total populasi τxuntuk tiga bulan koresponding tahun sebelumnya :τ x= 12500100i=11002yi= 31,650, x 2 i= 15,620,y ix i= 22,059. 35i= 1100i= 1SolusiTaksiran untuk μyadalahˆ μy= rμ x<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
dimanaMakaμxτx= N12,500= = 12.51000ˆ μ =y100i=1100i=1yxii( μ ) =x1750(12.5)1200= 18.23Taksiran kekeliruan didapat dengan menggunakan persamaan (7.10); tetapi kita harusmenghitung terlebih dahulu100i=1( yi− rx )i2=100i=1y2i+ r1002i=1x2i− 2r100i=1xiyi= 31.650 + (1.4583) 2 (15,620) - (2.9166) (22,059.35)= 441.68Substitusikan ke dalam persamaan (7.10) memberikan taksiran kekeliruan :2Vˆ(ˆμ y)= 2N − nnNni=1( yi− rx )n −1i21000 −100 441.68 = 2 = 0. 42100(1000) 99 Maka taksiran rata-rata jumlah uang yang dibayar kepada karyawan untuk biayapengobatan $18.23. Kita sangat yakin bahwa kekeliruan untuk taksirandari $0.42.μykurangUntuk mengingat rumus taksiran rasio dari rata-rata populasi, total, atau rasio, kitamembuat asosiasi berikut. Rasio sampel r dinyatakan dalam rumus berikutPenaksir R , τy, danrni=1= ni=1yxμyadalahii(7.11)<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
R ˆ =r(7.12)ˆ τy= rτ xˆ μy= rμ xJadi kita hanya perlu mengetahui rumus r dan hubungannya denganμˆ dan τ .yˆ y(7.13)(7.14)MakaTaksiran varians bisa diperoleh dengan mengingat rumus dasar, N − n V ( r)= nN 1ˆ i=12μ xn( yi− rx )n −1i2(7.15)V ˆ ( ˆ τ ) = τ2 V xˆ( r)(7.16)yˆ 2V ( ˆ μ ) = μ V xˆ( r)(7.17)yVII.4 MENENTUKAN UKURAN SAMPELKita menyatakan sebelumnya bahwa jumlah informasi yang dimuat dalamsampel bergantung pada variasi dalam data (yang sering dikontrol dengan disainsampling survey) dan jumlah observasi n yang termasuk dalam sampel. Setelahdisain sampling ditentukan, peneliti harus menentukan jumlah bagian-bagian yangakan digambar. Kita akan menentukan ukuran sampel yang dibutuhkan untukmenaksir parameter populasi R,μy, atau τ ydalam B unit untuk sampling acaksederhana dengan menggunakan penaksir rasio.Catatan bahwa prosedur untuk memilih ukuran sampel n identik dengan yangditunjukkan pada bagian sebelumnya. Jumlah observasi yang dibutuhkan untukmenaksir R, sebuah rasio populasi, dengan taksiran kekeliruan sebesar B diperolehdengan menetapkan dua standar deviasi dari penaksir rasio r sama dengan B dannyatakan untuk n. Sehingga kita harus menyelesaikan2 V ( r)= B(6.18)<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
dengan B adalah bound of error dari penaksiran. Dan V r)sebagai penaksir variansdari r diperoleh melalui persamaan:^(^V ( r)=N − n nN 12μ x^ N − n 1 atau : V ( r)= s2nN μx denganni=12( y − rx )in −1i2(7.19)(7.20)s2=ni−1( yi− rx )n −1i2Varians populasi V(r) yang mendekati dapat diperoleh dari V ( r)dengan mengganti22s oleh σ . Maka jumlah observasi n yang diperlukan untuk menaksir R denganbound of error B dapat diperoleh dengan mencari solusi untuk n dari persamaanberikut ini :^ N − n 1 22 V ( r)= 2 nN 2σ μx = B(7.21)Ukuran sampel yang diperlukan untuk menaksir R dengan bound of error Badalah :2Nσn =ND2+ σ(7.22)dengan2 2B μxD =4Dalam kenyataan di lapangan kita seringkali dihadapkan pada permasalahan dalammenentukan ukuran sampel karena σ 2 tidak diketahui. Jika informasi yangdiperlukan untuk menghitung s 2 sebagai penaksir darimengambil sebuah sampel pendahuluan berukuran'n .2σ tidak tersedia, maka kita<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
n'22( y )^i− rxii−1σ ='n −1kemudian kita substitusikan hasil dari persamaan ini untuk σ 2 pada persamaan(7.22), maka kita akan mendapatkan ukuran sampel yang mendekati. Jika μxjugatidak diketahui, makaμxdapat digantikan oleh rata-rata sampel x − , yang dihitungdari'n yang diperoleh pada penelitian pendahuluan.Contoh7.4: Sebuah perusahaan perakitan berkeinginan untuk menaksir rasioperubahan hilangnya jam kerja karyawan dikarenakan sakit antaratahun lalu dengan tahun ini. Sebuah penelitian pendahuluan dengan'n = 10 orang pekerja telah dilakukan, dan hasilnya disajikan padatabel di bawah. Catatan perusahaan menunjukkan bahwa jumlahtotal jam kerja karyawan yang hilang karena sakit adalah sebesarτ = 16,300. Dengan data yang telah tersedia kita akanxmenentukan ukuran sampel yang diperlukan untuk menaksir R ,dengan besarnya bound of error B = 0.01. Diasumsikan bahwaperusahaan memiliki 1000 orang karyawan (N = 1000).Pekerja12345678910Jam kerja karyawanyang hilang untuk tahunyang lalu, x1224153032261015014178Jam kerja karyawan yanghilang untuk tahun yangsedang dijalani, y.13251532362412162121872Pertama kita menghitung penaksir dari σ dengan menggunakan data yang diperolehdari penelitian pendahuluan<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
^ 2σDengan :10( y i− rx )i= 1= i9210i=1( yi− rx )i2=1010102 2 2yi+ r xi− 2ri= 1i=1i=1Kemudian, dari data yang disajikan pada tabel kita akan menentukan :xiyi10i=12y i= (13)2+ (25)2+ ... + (12)2= 446310i= 12x i= (12)2+ (24)2+ ... + (14)2= 4066 y i i= (12)(13) + (25)(42) + ... + (14)(12) = 4066x05r =10i=110i=1yxii=187178= 1.10i=1( yi− rx )i2=1010102 2 2yi+ r xi− 2ri= 1i=1i=1xiyi2= 4463 + (1.05) (4066) − 2(1.05)(4245) = 31.625dan^ 2σ=10i= 12 2B μxD =4( y i− rx i)922(0.01) (16.3)=431.625= = 16.392= 0.006642 danτx 16.300μx= = = 16.3N 10002 2B μxD =4dengan demikian2(0.01) (16.3)=42= 0.006642<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
^ 2N σn =^ 2ND + σ1000(3.474)== 343.4161000(0.006642) + 3.474Maka untuk menaksir R, tingkat perubahan jam kerja karyawan yang hilang karenasakit, dengan bound of error dari penaksiran sebesar B = 0.01 jam kita memerlukansebanyak 344 orang karyawan untuk diteliti.Dengan cara yang sama, kita dapat menentukan jumlah observasi n yangdiperlukan untuk menaksir rata-rata populasiμ y, dengan bound of error daripenaksiran sebesar B. Ukuran sampel yang diperlukan untuk menaksirdengan mencari solusi untuk n dari persamaan berikut :μydiperoleh2^V ( μy) = B(7.23)Persamaan tersebut juga dapat dinyatakan sebagai berikut :2μV ( r)x=BUkuran sampel yang diperlukan untuk menaksirμ ydengan bound of errorpenaksiran B adalah :dengan2Nσn =ND2+ σD =2B4Sebagai catatan bahwa untuk menentukan n pada persamaan (7.24) kita tidak perlumengetahui nilaiμx; namun demikian kita tetap memerlukan taksiran dari2σ , yangbisa kita peroleh atau kita tentukan dari penelitian yang telah dilakukan sebelumnya.Contoh 7.5: Seorang peneliti berkeinginan untuk menaksir rata-ratajumlah pohon per hektar pada sebuah kebun yang berukuran N= 1000 hektar. Dia berencana mengambil sampel berukuran ndari 1-hektar bidang tanah, kemudian menghitung y, jumlahpohon untuk setiap bidang tanah. Dia juga memiliki pencitraandari kebun tersebut yang bisa digunakan untuk menaksir x,jumlah pohon pada setiap bidang tanah untuk seluruh kebun,<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
sehingga dia juga mengetahuiμx. Tentukanlah ukuran sampelyang diperlukan untuk menaksir μydengan bound of error dariPemecahanpenaksiran sebesar B = 1.0.: Diasumsikan bahwa informasi yang diperlukan untukkepentingan penelitian tidak tersedia, maka kita harusmengadakan sebuah penelitian pendahuluan untuk menaksir2σ . Karena setiap harinya peneliti bisa memeriksa 10 bidangtanah untuk menentukan y, jumlah seluruh pohon per bidangtanah, maka tepat sekali jika kita menggunakantanah pada penelitian pendahuluan.'n = 10 bidangHasil dari penelitian disajikan pada tabel di bawah ini :Bidangtanah12345678910Nilaitaksiran, x2314202512183027831Nilaisebenarnya,y.251522241318353010292082212Taksiran dari σ dapat diperoleh melalui persamaan1022( y )^i− rxi= 1σ = i 9Kemudian gunakanlah persamaan (7.4)10i=1( yi− rx )i2=1010102 2 2yi+ r xi− 2ri= 1i=1i=1xiyiDari penelitian pendahuluan kita peroleh<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
10i=12y i= (25)2+ (15)2+ ... + (29)2= 546910i= 12x i= (23)2+ (14)2+ ... + (31)2= 4872 y i i= (22)(23) + (14)(15) + ... + (31)(29) = 5144x06r =10i=110i=1yxii=221= 1.20810i=1( yi− rx )i2=1010102 2 2yi+ r xi− 2ri= 1i=1i=1xiyi2= 5469 + (1.06) (4872) − 2(1.06)(5144) = 37.8992Dengan menggunakan persamaan (7.24), sekarang kita bisa menentukan n denganD = B2/ 4=14n =2Nσ2ND + σ100(4.21)== 16.561000(0.25) + 4.21Maka untuk menaksirμy, rata-rata jumlah pohon per 1-hektar bidang tanah, denganbound of error sebesar B = 1.0. kita memerlukan sebanyak 17 bidang tanah untukditeliti. Karena pada penelitian pendahuluan kita telah meneliti sebanyak 10 bidangtanah, maka kita tinggal meneliti sisanya yaitu sebanyak 7 bidang tanah.Ukuran sampel yang diperlukan untuk menaksir τ ydengan bound of errorsebesar B bisa didapatkan dengan mencari solusi untuk n dari persamaan berikut :2^V ( τ y) = B(7.25)persamaan di atas juga dapat ditulis sebagai berikut2τ V ( r)B(7.26)x=<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Ukuran sampel yang diperlukan untuk menaksir τ ydengan bound of error Badalah :2Nσn = (7.27)ND2+ σdenganD =2B4N2VII.5 TAKSIRAN REGRESITelah ditunjukan sebelumnya bahwa penaksir rasio lebih layak digunakan jikahubungan antara y dan x adalah linier. Jika kenyataan dari hubungan linier antarapengamatan y’s dan x’s, tetapi tidak harus salah satunya , lalu informasi tambahandisediakan dengan bantuan variabel x yang didapat dari perhitungan taksiran regresidari rata-rataμ y . Harus diketahuiada dalam taksiran rasio dari μ y .μ y sebelum penaksir dapat dipakai, seperti yangYang digarisbawahi memperlihatkan hubungan dasar antara y’s dan x’s yangkadang menunjuk pada garis regresi dari y atas x.Penaksir memberikan asumsi bahwa x’s adalah variabel tetap dan y’s adalahvariabel acaknya. Dapat kita pikirkan nilai x sebagai suatu yang telah diteliti, sepertipendapatan seperempat bulan pertama tahun yang lalu, dan respon y sebagai variabelacak yang belum di teliti, seperti pendapatan empat bulan berikutnya dari suatuperusahaan untuk x yang telah diketahui. Peluang dari penaksir selanjutnyatergantung hanya dari y untuk pasangan x’s.Penaksir Regresi dari rata-rata populasidimanaˆ μ = y + b(μ − x)(7.28)yLb =nii=1ni=1ix( y − y)(xi( x − x)− x)2μ y<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Penaksir varians dariμˆyL nn N − n V ˆ 12 22( ˆ μ yL ) = − − − −(yiy)b (xix)(7.29)Nn n 2 i= 1 i=1 Penaksir batasan kesalahannn N − n 1 2 222 vˆ(μ yL ) = 2 − − − −(yiy)b (xix)(7.30)Nn n 2 i= 1 i=1 Ketika menghitung b dari pasangan penelitian (y 1, x 1 ),…,(y n ,x n ), kita dapatmenggunakan fakta bahwani=1( yi− y)(xi− x)=n2( x − x)i=1ini=1ni=1y x − nxyix2ii− nx2Contoh 7.9Perolehan nilai test matematika telah diberikan kepada 486 siswa yang terlebih dahulumasuk perguruan tinggi tertentu. Dari semua siswa tersebut SRS dari n=10 siswa telahdiseleksi dan kemajuan mereka dalam kalkulus diteliti. Hasil akhir nilai kalkulus telahdilaporkan, seperti telah diberikan pada tabel. Diketahui bahwaμ y =52 untuk 486siswa yang mengambil test perolehan tsb. Taksirμ y untuk populasi ini, dantempatkan taksiran batasan kesalahannya.Siswa Perolehan nilai test(x)Kalkulus akhir(Y)1 39 652 43 783 21 524 64 825 57 926 47 897 28 738 75 989 34 5610 52 75<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
PenyelesaianHasil penghitungany = 76 x = 46b =ni=1ni=1yixi− nxy36,854 −10(46)(76)== 0.76622 2 23,634 −10(46)x − nxinn2(yi− y)= i= 1 i=1y2i− ny2= 2056nn2(xi− x)= i= 1 i=1x2i− nx2= 2474nilai observasi dari μ yL :jugay + b( μ − x)= 76 + (0,766)(52 − 46) = 80xV ˆ ( ˆ μyL nn N − n 1 2 2) = − − −(yiy)b (xNn n 2 i= 1 i=1i− x)[ 2056 − (0,766) (2474)] = 7, 397 486 −101 2= 486(10) 8 dan penaksir batasan kesalahannya adalah2 vˆ(μ yL ) = 5.42Agar diketahui bahwa penaksir regresi dariμ y penurunan nilai y darix menjadi berkurang daripada μ y dan b nya positif.Perhitungan untuk penaksir regresi dari rata-rata sejajar dengan analisis regresiklasik dalam kasus populasi yang tak berhingga.dengan model( y i ) = β 0 + β x iE 1untuk (x i ,y i ) data. Lalu penaksir kuadrat terkecil dari β i adalah b, telah didapat daripersamaan (7.28). juga hasil dari (7.29) menjadi N − n v(μˆyL ) = MSE Nn dimana MSE adalah kesalahan rata-rata kuadrat yang biasa dari analisis regresi.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Untuk ilustrasi, hasil analisis regresi minitab untuk data dalam contoh 7.9sebagai berikut:Persamaan regresiy = 40 .8 + 0. 766xPredictor Coef Stdev t-ratio pConstant 40.784 8.507 4.79 0.000X 0.7656 0.1750 4.38 0.002s=8.704, R-sq=70.5%, R-sq(adj)=66.8%Analisis variansSource DF SS MS F pRegresi 1 1450.0 1450.0 19.14 0.002Error 8 606.0 75.8Total 9 2056.0Perhitungan b diperlihatkan sebagai koefisien dari x dalam persamaan regresi, ataudalam kolom “Coef” berlawanan dengan predictor x dalam tabel. MSE dimasukandibawah “MS” berlawanan dengan “Error” dalam tabel analisis varians. Dengandemikian,dan N − n v(μˆyL ) = MSE Nn =476486(10)2 vˆ(μ yL ) = 5.45(75.8) = 7.42dimana sangat dekat dengan nilai yang terkandung dalam perhitungan yang lalu.Pemeriksaaan yang lebih dekat dari data dalam kandungan gula dan beratjeruk diberikan dalam contoh 7.2 disarankan bahwa penaksir rata-ratanya lebih layakdari pada penaksir rasio.(Plot ari nilainya akan memperlihatkan bahwa garis regresitidak tampak) walau demikian, penaksir regresi dari total adalah bentukNμ yL ,khususnya n harus diketahui. Sejak penaksir rasio juga bekerja dengan baik dalamkasus ini, menetapkan nomor dari jeruk dalam truk tidak akan mendapatkan biaya danwaktu tambahan. Dalam kasus N yang lain akan diketahui atau mudah ditemukan.Dengan demikian, kita harus hati-hati dalam memilih antara penaksir rasio dan<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
penaksir regresi ketika menaksir rata-rata populasi atau total. Akan dibahas lebihlanjut dalam bagian 6.8.VII.6 TAKSIRAN PERBEDAANMetode penaksiran perbedaan rata-rata populasi atau total sama denganmetode regresi yang sesuai dengan nilai y atas dan bawah dengan jumlah yangtergantung perbedaan ( μ x). Akan tetapi, koefisien regresi b tidak dihitung.x −Hasilnya, b dibuat sama.Metode perbedaan lebih mudah untuk dipakai dibandingkan metode regresidan kerap kali bekerja lebih baik. Metode ini biasa digunakan dalam prosedurpemeriksaan, dan akan kita pertimbangkan beberapa contoh dalam bagian ini.Rumus dibawah ini bahwa sampling acak sederhana telah digunakan.Perbedaan penaksir dari populasi μ y :dimanaˆ μ = y + ( μ − x)= μ d(7.31)yD xx +d= y − xPenaksir Varians dari μ yD :n2( d i − d ) N − n i=V ( μ yD ) = 1 Nn n −1(7.32)dimanadi= y − xiiPenaksir batasan kesalahan:2n2( d i − d ) N − n i=1Vˆ(ˆ μ yD ) = 2 (7.33) Nn n −1<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
yContoh 7.10Pemeriksa tertarik dalam membandingkan pemeriksaan nilai dari beberapa barangdengan harga buku. Biasanya, harga buku diketahui untuk setiap barang dalampopulasi, dan pemeriksaan harga diperoleh untuk sebuah sampel dari barang tersebut.Harga buku dapat digunakan untuk memperoleh taksiran yang baik dari total ataurata-rata pemeriksaan nilai untuk populasi.Sebuah populasi berisi 180 daftar barang dengan harga buku $13,320. x i adalah hargabuku dan y i pemeriksaan harga untuk barang yang ke-i. Sampel acak sederhana darin=10 barang diperlihatkan dalam tabel. Plot dari data tersebut, Gambar 6.1,menunjukkan sepanjang garis lurus. Taksir nilai pemeriksaan rata-rata darimetode perbedaan dan taksir varians dari μ yD .Gambar 7.1 Plot y atas x untuk contoh 6.10.μ ydengan200.00150.00100.0050.0050.00 100.00 150.00 200.00xsample nilai audit,y nilai buku,x d1 9 10 -12 14 12 23 7 8 -14 29 26 35 45 47 -26 109 112 -37 40 36 48 238 240 -29 60 59 110 170 167 3<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Diketahui y = 72. 1, x = 71. 7 , dan = 74dan juga,jadiV ( ˆμyD= μ x+ d1 −1μ x= 74 + (72.1−71.7) = 74.4 1 = n −1nn2(di− d ) n i=1i=1 N − n ) = Nn ˆ i=1μ yDn( di− d )n −1d2i58 −10(0.4)=922− nd2= 6.27180−10= (6.27) = 0.59(180)10 VII.7 EFISIENSI RELATIF DARI PENAKSIRKita telah melihat bahwa rata-rata sample, penaksir rasio, penaksir regresi, danpenaksir selisih semuanya bisa digunakan sebagai penaksir rata-rata populasiBagaimana kita mengetahui penaksir yang mana yang terbaik untuk situasi penarikanμ y.sample tertentu? sebenarnya, kita selalu tidak bisa menjawabnya secara pasti, tetapiada beberapa pedoman yang membandingkan sifat-sifat dari penaksir-penaksirtersebut. Salah satu pedomannya bisa diungkapkan dalam hal efisiensi relatif daripenaksir.Andaikan kita mempunyai dua penaksir E 1dan E 2untuk rata-rata μ . Jikakedua E1dan E2adalah penaksir takbias, atau hampir takbias, dari μ , maka secaraumum kita sebaiknya memilih penaksir dengan varians terkecil sebagai penaksirterbaik. Hal ini menghasilkan taksiran selang kepercayaan terpendek bagi μ . Variansbiasanya mengecil ketika ukuran sample membesar, jadi kita harus membandingkanvarians E1dan E2dengan asumsi ukuran sample sama untuk kedua penaksir. Sesuatuhal yang mudah untuk menjelaskan ukuran relatif dari dua varians dengan melihatpada rasionya. Rasio ini disebut dengan efisiensi relatif (relative efficiency),dinotasikan RE, untuk dua penaksir. Kita membentuk rasio efisiensi relatif sehingganilainya yang besar mengutungkan bagi penaksir yang disebutkan pertama kali. Jadi,efisiensi relatif dari E1ke E2(atau E1terhadap E2) diberikan melalui<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Jika ( ) E 1E 2 E1 V ( E2)RE E = 2 V ( E1)RE besar (lebih besar dari 1), maka V E ) akan menjadi lebih besardari V ( E 1) yang menguntungkan bagi E1sebagai penaksir μ . Harus diingat bahwa(2ukuran sampel untuk E1dan E2harus sama dalam kalkulasi ini.REEEAndaikan ( ) 21 2=. Hal ini menyatakan secara tidak langsung bahwaV ( E2 ) = 2V( E1), yang mana merupakan kasus yang menguntungkan bagi E1. Carayang lain untuk membuat perbandingan ini adalah dengan menetapkan bahwa ukuransampel E2harus dua kali dari E 1agar membuat E 1dan E2ekuivalen dalam halvarians. Jadi, RE bisa digagas dalam hal ekuivalensi ukuran sampel (atau usahapenarikan sampel atau biaya penarikan sampel). RE = 1 menyatakan secara tidaklangsung bahwa dua penaksir ekuivalen; tidak menjadi masalah penaksir yang manayang kita gunakan.RE biasanya didefinisikan dalam hal varians teoritis (varians populasi). Akantetapi, kita telah memberikan banyak varians taksiran dalam teks ini. Jadi, kita akanmelanjutkannya dalam semangat ini dan mendefinisikan∧ E1 Vˆ(E2)RE =E 2 Vˆ(E )1∧RE ESekarang kita harus hati-hati dalam menginterpetasi; bahwa ( ) 1E1 2>tidak cukup mengartikan bahwa V E ) > V ( ) , karena kita hanya berurusan dengan(2E1penaksir varians, yang akan mengalami perubahan dari sampel ke sampel. Akantetapi, jika kita mempunyai sampel besar (dan karenanya menjadi penaksir variansyang baik), nilai dari RE( )∧E 1E 2akan sangat lebih besar dari 1 yang tentunya akanbetul-betul menunjukan bahwa E1mungkin menjadi penaksir terbaik.Sekarang kita menghitung taksiran efisiensi relatif untuk pelbagai kombinasidari empat penaksirμyyang telah disebutkan diatas. Pertama, bagaimanapun, kitaharus mempertimbangkan pertanyaan kebiasan, karena tidak tepat untukmembandingkan varians bagi penaksir-penaksir yang bias. Rata-rata y dari sampelacak sederhana selalu penaksir takbias dariμy, jadi tidak ada masalah bias (setidaktidaknyasecara teoritis) dalam berurusan dengan penaksir ini.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Pada sisi lain, penaksir rasioμysecara umum bias, karenar = y x secaraumum penaksir bias dariR = μ μ . Bias menjadi tidak berarti jika hubungan antarayxy dan x jatuh sepanjang garis lurus yang bergerak melalui titik asal. Hampiran untukbias relatif dari r diberikan oleh:E(r)− R≈R2 N − n sx 2 Nn xsy− ρˆysx⋅xdengan ρˆ adalah koefisien korelasi sampel antara x dan y.Mengenai bias dari dua penaksir lainnya, penaksir regresi takbias jikahubungan antara y dan x (regresi y pada x) jatuh sepanjang garis lurus, tidak perlumelalui titik asal. Penaksir selisih selalu takbias dalam penarikan sampel acaksederhana.Dalam membandingkan penaksir rasio dengan rata-rata sampel per elemen y ,kita mempunyai∧ ERE E12 Vˆ(y) = Vˆ(ˆ μ )y=s2y+ r2ss2x2y− 2rρˆsxsy∧RE ˆ μ y > jikasekarang, ( ) 1atauys 2rρˆsxsyataurs 2 > 2ρˆss(dengan asumsi r > 0 )xxyatau1 rsx1ˆ ρ > =2 s 2yssxyxyBesarans xx disebut koefisien variasi. Pada situasi dimana penaksir rasio biasadigunakan, y adalah nilai yang diperbaharui dari x (pendapatan kuartal pertama dalamsatu tahun dibandingkan dengan pendapatan kuartal pertama tahun sebelumnya, nilaiaudit melawan nilai buku, dan lain-lain). Dalam kasus seperti ini, koefisien variasi<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
dari y seharusnya sangat dekat dengan koefisien variasi dari x. Jadi, dalam situasiseperti ini, penaksir rasio lebih efisien daripada rata-rata sampelper elemen penaksir1jika ˆ ρ > .2Secara keseluruhan, penaksir rasio akan lebih efisien daripada y jika variasidiantara x relatif lebih kecil terhadap variasi diantara y dan korelasi antara x dan ybernilai positif yang besar. Jika peneliti mempunyai pilihan seperti bagaimanamemilih nilai-x, ia sebaiknya memilih mereka hampir terus-menerus.Perbandingan sederhana dari penaksir regresi dengan rata-rata per elemeny dan penaksir rasioμˆymembutuhkan beberapa modifikasi taksiran varians. Ingatbahwaˆ μyL= y + b(μ − x)xdengan b adalah penaksir kemiringan (slope) dari garis regresi. Varians taksiran dariμˆyLtelah diberikan (lihat persamaan (7.29) yaituV ˆ ( ˆ μ )yL N − n 1 Nn n − 2 n2 2 ( y − y) − b ( x − x) 2 = i ni= 1 i=1Jika kita membuat sedikit perubahan dengan mengganti (n-2) oleh (n-1) padapenyebutnya, kita akan mempunyaiVˆ(ˆ μdan, karenayLsb = ρˆs) ≈Vˆ(ˆ μ ) menjadiyLVˆ( ˆ μyLyx) ≈N − n Nn N − n sNn 2 2 2[ s − b s ]yx2( 1−ρ )2ˆyHampiran Vˆ(ˆ μ ) ini baik sepanjang n agak besar; (n-2) digunakan pada penyebutyLuntuk mencegah menaksir varians terlalu rendah (underestimation) yang serius dalamsituasi sampel kecil.Dengan menggunakan hampiran varinas yang telah disederhanakan diatas,^ ˆ μRE yyL = s2ys2y=122( 1−ˆ ρ ) 1−ˆ ρi<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
yang akan lebih besar dari satu jika ρˆ tidak samadengan nol. Pada faktanya, REbesarnya bisa menjadi takhingga ketika ρˆ mendekati satu. Jadi,μˆ yLselalu lebihefisien dari y sebagai penaksir dariμ y. (akan tetapi, ingat bahwaμˆ yLakanmempunyai masalah bias yang serius kecuali regresi y pada x benar-benar linear.)Ketika membandingkan taksiran regresi dengan taksiran rasio,Pada kasus ini.atau^ ˆ μyL sRE =ˆ μ y r2y2+ r ss2y2x− 2rˆ ρss2( 1−ˆ ρ )^RE >1 akan menunjukan2 22 2s 2 ˆ ˆx− rρsxsy> −ρsy( ρs ˆ ) 2 y− rs > 0xxykarenaρˆ s = bs , maka ( bs x− rs ) 0yxx2 >yang menunjukan( b − r) 2>0Jadi, penaksir regresi lebih efisien dari penaksir rasio kecuali b=r, dimana kasusmereka ekuivalen.Kasus b=r akan terjadi ketika regresi y pada x linear melalui titikasal dan varians y sebanding dengan x.GAMBAR 7.2Plot dari penerimaan kas (y) dengan banyaknya pembeli (x)<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Situasi yang seperti ditunjukan pada gambar 6.2, dengan kasus penerimaan kasuntuk periode penjualan yang telah ditetapkan yang berhubungan dengan banyaknyapembeli. Catatan bahwa nilai penerimaan melebar ketika x meningkat.Penaksir selisihˆ μyD= y + ( μ − x)xselalu penaksir takbias dari μ pada penarikan sample acak sederhana, dan varianstaksirannya adalahbisa ditulisV ( ˆ N − n ) = Nn ˆ i=1μ yDV ˆ ( ˆ μyD) ==n ( di− d )n −1N − n 1 Nn n −1N − n Nn n2[ ( yi− y) − ( xi− x)]i=12 2[ s + s − 2ρˆ s s ]yxxDalam membandingkan penaksir selisih dengan rata-rata sample per elemen,kita mempunyaiy2^ ˆ μREˆ μyyD = s2y+ s2xyang lebih besar dari satu ketikaatau^ρρs ˆ >22xsysx>sx2sys2y− 2 ˆ ρsxsyJika variasi dalam x’s dan y’s sama, Penaksir difference akan menjadi lebih efisiendibanding y ketika korelasi antara x dan y lebih besar dari 21.punya modelKetika membandingkan penaksir regresi dengan penaksir difference kita^RE^μ^μyLyD=s2y+s2y2s − 2ρx sxs^^ 21 − ρy<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
yang lebih baik lagi jika diuraikans2xataus ^^ 2− 2ρsxs > − ρy2− ^ >x ySejakρsbs x =^0sys2yρ penaksir regresi akan menjadi sama dengan penaksir difference bilab=1. Di lain pihak, penaksir regresi akan menjadi lebih efisien daripada penaksirdifference.Sekarng kita akan melihat beberapa nilai numeric dari efisiensi relative untukdata yang telah kita analisis terlebih dahulu pada bab ini. Data dari table 7.1 dalamreal estate valuation diplotkan dalam gambar 7.3. Melihat point data tersebut yangjatuh sepanjang garis lurus dengan kemiringan dekat dengan persamaan (dalamkenyataan, b=0.977 untuk penaksir regresi) dan y mendekati 0. Untuk kasus iniE r( )− R≈ 0.0053RJadi nilai relative bias untuk penaksir ratio tidak terlalu berpengaruh.Untuk data ini,dan^^ μRE ^ μ^^ μRE ^ μyLyyDy= 1.13= 1.01jadi ketiga penaksir, regresi, ratio, dan difference adalah tentang persamaan yang adadalam penaksir varians. Salah satu dari ketiga penaksir tersebut bekerja dengan baikuntuk masalah menaksir μ yatau τydengan data tersebut. Tapi^^ μREyyL= 14.96<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
jadi y bias menjadi penaksir yang buruk dari μ y, sebagai perbandingan salah satudari 3 penaksir membuat taksiran dari x’s. Di lain pihak, itu membuat 15 kali ataulebih pengamatan untuk mencapai sukses dalam varians yang sama dengan y adalahyang terbagus dengan^yLμ .Data dari table 7.2 tentang kadar gula dengan berat jeruk, hal 159, yang telahdiplot dalam table 7.4. Disini, point data terdapat sepanjang garis lurus tapikemiringannya tidak cukup dekat dengan komunitas (kenyataannya, b=0.123) yintercept signifikan berbeda dari 0. Nilai relative bias dari r = -0.00077 tidak terlaluberpengaruh, tapi^^ μRE^ μyLy= 16.79Hal ini mengimplikasikan akurasi yang lebih baik dalam mencapai sukses dalampenaksiran μ yatau τyyang dikerjakan oleh penaksir regresi lebih baik dari penaksirratio. Penaksir difference tidak dapat digunakan dalam masalah ini.Dari contoh 7.9, kita mempunyai data nilai akhir kalkulus dengan nilai tes psikotes.Kemiringan dalam garis ini tidak cukup dekat dengan komunitas (b=0.766) dan yintercept jauh dari 0. Perhitungannya ditunjukandan^^ μRE^ μ^^ μRE^ μyLyyLyD= 4.84= 1.22Disini penaksir regresi biasanya lebih baik dari penaksir ratio, tapi penaksir differencebias dipakai tetapi kurang efisien.Untuk data dalam contoh 7.10, ketiga metode, ratio, regresi dan differencesebenarnya sama; penaksir difference adalah yang paling mudah dihitung jadi ituadalah pilihan yang masuk akal.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
Dalam kesimpulan, analisis dari data bivariate harus selalu dimulai denganmemplot titiknya. Jika titiknya jatuh sepanjang garis lurus permulaannya maka tepatsekali mengambil penaksir difference, ketiga metode yang melibatkan x’s dan y’sadalah mungkin. Agar penaksir difference bekerja dengan baik, kemiringan dari garisharus cukup dekat dengan salah satu titiknya. Jika titiknya jatuh sepanjang garis lurustidak melalui garis normal, maka penaksir regresi adalah yang terbaik, dalamhubungan dengan varians. Jika titiknya tidak jatuh sepanjang garis lurus, mungkin ysebaiknya digunakan (atau untuk penanganan analisis regresi lebih detail).VII.8 KESIMPULANDengan mengukur variable Y dan variable tambahan X pada masing2 elemendalam sample, kita dapatkan informasi tambahan untuk menaksir parameter populasiyang bersangkutan. Ketika korelasi positif yang kuat ada antara variable X dan Y ,prosedur penaksiran ratio biasanya menyediakan taksiran yang lebih tepat dari μ ydandaripada melakukan prosedur normal yang dihadirkan dalam bab sebelumnya.τyUkuran sample yang dibutuhkan dihadirkan untuk menaksir μ y, τydan Rdengan bound of error yang sama dengan B. pada masing masing kasus seseorang2harus mendapatkan penaksirdari σ dari informasi sebelumnya atau study persiapanuntuk memperkirakan ukuran sample yang dibutuhkan.Penaksiran regresi adalah salah satu teknik untuk menggabungkan informasipada variable tambahan. Metode ini biasanya lebih baik daripada metode penaksiranratio jika hubungan antara Y dan X adalah berupa garis lurus yang tidak melalui asal.Walaupun metode ini bisa diterapkan dengan desain sampling apapun, kitamenitikberatkan pada sampling acak sederhana., ketika menyebutkan stratifiedrandom sampling untuk kasus ratio.Metode penaksiran pembeda dalam prinsipnya sama dengan denganpenaksiran regresi .ini bekerja dengan baik ketika plot Y dengan X menampakkantitik yang uniform pada garis lurus dengan slope unit.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
TINJAUAN MATA KULIAHVIII. 2 <strong>Sampling</strong> PeluangSebuah proses sampling disebut sebagai sampling nonpeluang bila tidaksemua unit mempunyai peluang untuk terpilih atau dalam proses memilih satuansatuansampling tidak dilibatkan peluangnya. Proses pemilihan tanpa melibatkanpeluang merupakan proses yang sederhana tetapi mempunyai kerugian yang sangatbesar, yaitu dalam analisis datanya tidak boleh digunakan test of significance, artinyaanalsis inferensial secara statistis tidak diperkenankan (tidak valid).Ke dalam sampling nonpeluang termasuk diantaranya adalaha. <strong>Sampling</strong> Seadanya (Haphazard/Accidental <strong>Sampling</strong>)Yaitu proses pengambilan sampel sedemikian sehingga unit samplingdiperoleh seadanya. Jadi siapa atau apa saja yang secara kebetulan ada biladipandang cocok sebagai sumber data, maka dapat digunakan sebagai sampel.Contohnya, proses penelitian suatu fosilb. <strong>Sampling</strong> Sukarela (Voluntary <strong>Sampling</strong>)Yaitu sampling dimana unit sampling adalah mereka yang mau secara sukaelamenjadi anggota sampel. Jenis sampling ini banyak digunakan dalampenelitian medis. Orang sebagai unit observasi diminta secara sukarela untukmenjadi objek percobaan.c. Purposive <strong>Sampling</strong> (Judgement <strong>Sampling</strong>)Yaitu proses pengambilan sampling dipilih atas dasar pertimbangan seseorang.Penelitian tentang pendapat masyarakat akan suatu kebijakan yang dillakukanterhadap tokoh-tokoh mayarakat yang ditunjuk merupakan penelitian denganmenggunakan purposive sampling.d. Snowball <strong>Sampling</strong>Dalam jenis sampling ini, unit sampling secara berangkai atas informasi yangdiberikan oleh unit sampling yang terpilih sebelumnya.Contohnya seorang Dokter yang akan melakukan penelitian mengenai pasienyang<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>
e. Quota <strong>Sampling</strong>Merupakan suatu tipe sampling dengan menggunakan beberapa kuota sampaipada kuota yang diinginkan. Tipe sampling ini sangat banyak digunakandalam penelitian pemasaran dan dalam penelitian pengumpulan pendapat(opinion poll)Contoh : Dalam suatu penelitian mengenai tingkat kepuasan konsumenterhadap suatu produk rokok akan diambil sampel dengna beberapa ketentuanberikut :- Quota 1 : Akan diteliti sebanyak 300 konsumen yang telah menggunakanproduk tersebut (angka 300 merupakan hasil pertimbangan sebagai akibat dariketerbatasan dana, tenaga, dan waktu)- Quota 2 : Konsumen yang diambil adalah pria yang berusia 25 - 35 tahun- Quota 3 : Tingkat pendidikan dari konsumen sekurang-kurangnya SMU.f. <strong>Sampling</strong> JenuhApabila sutau populasi memiliki anggota yang sedikit (dalam hal ini kurangdari 30), maka semua elemennya bisa digunakan sebagai sampel. Prosespenarikan sampel seperti ini dinamakan <strong>Sampling</strong> Jenuh. Jadi dengan kata lainbahwa sampling jenuh merupakan sensus.Keuntungan sampling non pleuang adalah dari aspek kemudahan memperoleh unitsampling. Namun, data yang dikumpulkan berdasarkan sampling jenis ini tidak dapatdigeneralisir atau tidak dapat dianalisis lebih jauh melalui alat analisis statistika.<strong>Bahan</strong> <strong>Ajar</strong> <strong>Sampling</strong> - Yudhie AndriyanaJurusan Statistika, FMIPA – <strong>Universitas</strong> <strong>Padjadjaran</strong>