13.07.2015 Views

j - bennike.org

j - bennike.org

j - bennike.org

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Note til StikprøveteoriTeoretisk Statistik, 2. årsprøveErik Bennike og Frederik SilbyeFormeloversigt til stikprøveteoriAlternativ variation Kontinuert variationSimpel tilfældig udvælgelse note 1 Punkt 1 Punkt 2Generel stratificeret udvælgelse Punkt 3 Punkt 4Proportional stratificeret udvælgelse Punkt 5 Punkt 6Optimal stratificeret udvælgelse Punkt 7 Punkt 81. Simpel tilfældig udvælgelse med alternativ variation• Estimat af populationsandelen note 2n1i=i=1µ = θ : θˆ=n⋅∑x• Estimat af populationstotalen N·θ: N ⋅θˆ• Estimat af populationsvariansen τ 2 2 n: s = ⋅θˆ⋅( 1−θˆn)−1antal " mærkede"stikprøvestørrelse• Estimat af variansen af estimatet på populationsandelensâr( θˆ )=2θˆ⋅ 1−θˆn note 3⋅ 1 f1 f , fv ( )( )− = ⋅ ( − ) ≡nn −1N• (Approksimativt) konfidensinterval: θˆu vâr()θˆ1 / 2 ⋅± − αθˆ≤2o Hvis der ønskes et konfidensinterval, hvor var( ) :θn ≥2σ +0( 1−θ)θ ( 1−θ)N(Worst case θ = ½:σ 0n ≥ ) σo Hvis der ønskes et konfidensinterval, hvor bredden af dette ≤ L 0 :θn ≥⎛ L0⎜u⎟⎝ 2⋅1−α/ 2 ⎠( 1−θ)2⎞ θ ( 1−θ)+N(Worst case θ = ½:2014+14Nn ≥⎛ L⎜⎝ 2⋅u1014−α / 2⎞⎟⎠21+4N)2. Simpel tilfældig udvælgelse med kontinuert variation• Estimat af populationsgennemsnittetµ :x =n1n⋅∑x ii=11 Der antages uden tilbagelægning, ergo befinder vi os i en hypergeometrisk fordeling.2 Andelen af enheder i populationen, der besidder en given egenskab.3 f kaldes udvalgsbrøken, da den repræsenterer den brøkdel af den samlede population, der er udvalgt til stikprøven.- 1 -


Note til StikprøveteoriTeoretisk Statistik, 2. årsprøveErik Bennike og Frederik Silbye• Estimat af populationstotalenN⋅ µ :N ⋅ x1n −1• Estimat af populationsvariansen τ 2 2: s = ⋅ ( x i− x)• Estimat af variansen af estimatet på populationsgennemsnittetvâr2s= , f ≡n() x ⋅( 1−f )• (Approksimativt) konfidensinterval: x u vâr()xnN± 1 −α / 2 ⋅2o Hvis der ønskes et konfidensinterval, hvor var() x ≤ σ 0:2τ≥ (Worst case: Sæt τ 2 højt)2 τσ0 +Nn2o Hvis der ønskes et konfidensinterval, hvor bredden af dette ≤ L 0 :n∑i=122τn ≥⎛ L0⎞⎜2 u⎟⎝ ⋅ 1−α/ 2 ⎠22τ+N(Worst case: Sæt τ 2 højt)3. Generel stratificeret udvælgelse med alternativ variationVi ser på m strata hver indeholdende en population på N j , der summer til N. Fra stratum j udtagesen stikprøve på n j enheder. For at anvende stratificeret udvælgelse skal samtlige N j ogN kendes.• Estimat af stratumandelen• Estimat af stratumtotalenµjn1ij=i=1j= θj: θˆj=n⋅ xj∑Nj⋅ θ : N ⋅θˆjjjantal " mærkede"i stikprøve jstratumstikprøvestørrelse• Estimat af populationsandelenµ = θs: θˆs= ∑Wj⋅θˆjmj=1, Wj≡NNjnote 4• Estimat af stratumvariansen τ 2 n2 jj : s = ⋅θˆ⋅( 1−θˆ)jnj−1jj4 W j kaldes for stratumvægtene, altså den vægt hvormed det enkelte stratum indgår i populationen.- 2 -


Note til StikprøveteoriTeoretisk Statistik, 2. årsprøveErik Bennike og Frederik Silbye• Estimat af variansen af estimatet på stratumandelenvâr2sj( θ ˆ ) ⋅( 1−f )jθˆ⋅( 1−θˆj) ( )nj⋅ 1−fjfj≡j−1Njj=j=,njn• (Approksimativt) konfidensinterval for stratumandelen: θˆvâr( ˆ1 / 2 ⋅ )• Estimat af variansen af estimatet på populationsandelenvârmm 2s22 j( θ ˆ ) = W ⋅ vâr( θˆ) = W ⋅ ⋅( 1−f )s∑j=1jj∑=∑jjj= 1 njj=1mW2jθˆj⋅⋅n± − αju θ j( 1−θˆj)⋅ ( 1−f )• (Approksimativt) konfidensinterval for populationsandelen: θˆvâr( ˆ1 / 2 ⋅ )j−1± − αjsu θ s4. Generel stratificeret udvælgelse med kontinuert variationVi ser på m strata hver indeholdende en population på N j , der summer til N. Fra stratum j udtagesen stikprøve på n j enheder. For at anvende stratificeret udvælgelse skal samtlige N j ogN kendes.• Estimat af stratumgennemsnittetµ :jxj=1n j⋅nj∑i=1xij• Estimat af stratumtotalenNj⋅ µ :jNj⋅ xj• Estimat af populationsgennemsnittetµ :xsm= ∑Wj⋅ xjj=1, Wj≡NNjn• Estimat af stratumvariansen τ 2 j2 1j : sj= ⋅∑( xij− xj)nj−1• Estimat af variansen af estimatet på stratumgennemsnittetvârj( x ) ⋅( 1−f )j2s=j, fnjjn≡Njj• (Approksimativt) konfidensinterval for stratumgennemsnittet: x u vâr( )• Estimat af variansen af estimatet på populationsandelenv ârmm22 j( xs) = ∑Wj⋅ vâr( xj) = ∑Wj⋅ ⋅( 1−fj)j=1j=1sn2ji=12± −α:j 1 / 2 ⋅ x j- 3 -


Note til StikprøveteoriTeoretisk Statistik, 2. årsprøveErik Bennike og Frederik Silbye• (Approksimativt) konfidensinterval for populationsgennemsnittet:xuvâr( )s± 1 −α / 2 ⋅ x s5. Proportional stratificeret udvælgelse med alternativ variation• For at finde estimater for stratumandel og populationsandel følges blot formlerne frapunkt 3.• Der hvor den proportionale allokering skal i brug, det er ved bestemmelse af stikprøvestørrelse.Den proportionale allokering udnytter variationen mellem strata til atmindske variansen på estimatoren.• Under proportional allokering er udvalgsbrøkerne f j ens for alle strata:fj=jnj n= , og dermed kan fodtegn på n og f i formlen for variansen på estimato-N Nren fjernes.• Estimat af variansen på populationsandelen bliver ved proportional allokering givetved:vârθm( ˆ 1−fp) = ⋅∑nj=1W ⋅ sj2j• (Approksimativt) konfidensinterval for populationsandelen under proportional allokering:θˆvâr( ˆ1 / 2 ⋅ )± − αpu θ p2• Den mindst mulige stikprøvestørrelse kan, hvis kriteriet er, at var( ) σn ≥m∑j=12 1σ0 + ⋅NW ⋅θjm∑j=1j( 1−θ)W ⋅θjjj( 1−θ)jθˆ≤ findes ved(Worst case θ j = ½ ∀ j giver n som i punkt 1) note 505 2I formlen er der anvendt følgende approksimation: τ = j⋅θ⋅( 1−θ) ≈θ⋅( 1 −θ)jNNj−1- 4 -


Note til StikprøveteoriTeoretisk Statistik, 2. årsprøveErik Bennike og Frederik Silbye• Hvis der ønskes et konfidensinterval, hvor bredden af dette ≤ L 0 note 5 :n ≥⎛ L⎜⎝ 2⋅u01−α/ 2m∑j=12⎞⎟⎠W ⋅θjj1+ ⋅N( 1−θ)m∑j=1jjW ⋅θj( 1−θ)j(Worst case θ j = ½ ∀ j giver n som i punkt 1)• Når n er fundet kan stikprøvestørrelserne i den enkelte strata nemt findes ved:njNj= n ⋅N= n⋅Wj6. Proportional stratificeret udvælgelse med kontinuert variation• For at finde estimater for stratumgennemsnit og populationsgennemsnit følges blotformlerne fra punkt 4.• Der hvor den proportionale allokering skal i brug, det er ved bestemmelse af stikprøvestørrelse.Den proportionale allokering udnytter variationen mellem strata til atmindske variansen på estimatoren.• Under proportional allokering er udvalgsbrøkerne f j ens for alle strata:fj=jnj n= , og dermed kan fodtegn på n og f i formlen for variansen på estimato-N Nren fjernes.• Estimat af variansen på populationsgennemsnittet bliver ved proportional allokeringgivet ved:v ârm1−f( xp) = ⋅∑nj=1W ⋅ sj2j• (Approksimativt) konfidensinterval for populationsgennemsnittet under proportionalallokering: x u vâr( )p± 1 −α / 2 ⋅ x p2• Den mindst mulige stikprøvestørrelse kan, hvis kriteriet er, at () ≤var x σ 0findes vedn ≥m∑j=12 1σ0 + ⋅NW ⋅τjm∑j=12jW ⋅τj2j(Worst case: Høj τ j 2 )- 5 -


Note til StikprøveteoriTeoretisk Statistik, 2. årsprøveErik Bennike og Frederik Silbye• Hvis der ønskes et konfidensinterval, hvor bredden af dette ≤ L 0 :n ≥⎛ L⎜⎝ 2⋅u01−α/ 2m∑j=12⎞⎟⎠W ⋅τj2j1+ ⋅Nm∑j=1W ⋅τj2j(Worst case: Høj τ j 2 )• Når n er fundet kan stikprøvestørrelserne i den enkelte strata nemt findes ved:njNj= n ⋅N= n⋅Wj7. Optimal stratificeret udvælgelse med alternativ variation• For at finde estimater for stratumandel, populationsandel og varianser på disse følgesblot formlerne fra punkt 3.• Der hvor den optimale allokering skal i brug, det er ved bestemmelse af stikprøvestørrelse.Den optimale allokering udnytter for det første ligesom den proportionaleallokering variationen mellem strata, men udnytter også forskelle i varianser indeforde enkelte strata til at mindske variansen på estimatoren.• Estimat af variansen på populationsandelen bliver ved optimal allokering givet ved:vârθ2⎛m⎞m( ˆ 11) = ⋅⎜∑⋅ ⎟oWjsj− ⋅∑⎜⎝⎟⎠n j=1 N j=1W ⋅ sj2j• (Approksimativt) konfidensinterval for populationsandelen under proportional allokering:θˆvâr( ˆ )± 1 − α / 2 ⋅ou θ o2• Den mindst mulige stikprøvestørrelse kan, hvis kriteriet er, at var( θ ) ≤ σfindes ved note 6 :ˆ0⎛m2⎞⎜∑⎟Wj⋅τj⎝ j=1n ≥⎠m2 12σ0 + ⋅∑Wj⋅τjNj=12⎛m⎜∑Wj⋅⎝ j=1=2 1σ0 + ⋅Nm∑j=1θj( 1−θ)W ⋅θjjj⎞⎟⎠2( 1−θ)j(Worst case θ j = ½ ∀ j)- 6 -


Note til StikprøveteoriTeoretisk Statistik, 2. årsprøveErik Bennike og Frederik Silbye• Hvis der ønskes et konfidensinterval, hvor bredden af dette ≤ L 0 note 6 :n ≥⎛ L⎜⎝ 2⋅u01−α/ 2m∑j=12⎞⎟⎠W ⋅θjj1+ ⋅N( 1−θ)m∑j=1jjW ⋅θj( 1−θ)j(Worst case θ j = ½ ∀ j giver n som i punkt 1)• Den optimale stikprøvestørrelse for stratum j kan findes ved note 6nj≥Wm∑k=1jW⋅θkj⋅⋅θ( 1−θ)kj( 1−θ)k⋅ n(Worst case θ j = ½)8. Optimal stratificeret udvælgelse med kontinuert variation• For at finde estimater for stratumgennemsnit og populationsgennemsnit følges blotformlerne fra punkt 4.• Der hvor den optimale allokering skal i brug, det er ved bestemmelse af stikprøvestørrelse.Den optimale allokering udnytter for det første ligesom den proportionaleallokering variationen mellem strata, men udnytter også forskelle i varianser indeforde enkelte strata til at mindske variansen på estimatoren.• Estimat af variansen på populationsgennemsnittet bliver ved optimal allokering givetved:v âr⎛⎜⎝mmm1122 j( x ) ⎜∑⎟o= ⋅ Wj⋅ sj− ⋅∑Wj⋅ sj= ∑Wj⋅ ⋅( 1−fj)nj=1⎞⎟⎠2Nj=1• (Approksimativt) konfidensinterval for populationsandelen under proportional allokering:x u vâr( )o± 1 −α / 2 ⋅ x o2• Den mindst mulige stikprøvestørrelse kan, hvis kriteriet er, at () x ≤findes ved:j=1sn2jvar σ 06 2I formlen er der anvendt følgende approksimation: τ = j⋅θ⋅( 1−θ) ≈θ⋅( 1 −θ)jNNj−1- 7 -


Note til StikprøveteoriTeoretisk Statistik, 2. årsprøveErik Bennike og Frederik Silbye⎛m2⎞⎜∑⎟Wj⋅τj⎝ j=1n ≥⎠m2 12σ0 + ⋅∑Wj⋅τjNj=12⎛m2⎞⎜∑⎟Wj⋅ sj⎝ j=1≈⎠m2 12σ0 + ⋅∑Wj⋅ sjNj=12(Worst case: Høj τ j 2 )• Hvis der ønskes et konfidensinterval, hvor bredden af dette ≤ L 0 note 6 :n ≥⎛⎜⎝⎛⎜⎝m∑j=12mL0⎞ 12 ⎛ L0⎟ + ⋅∑W⋅⎜jτj2⋅u1−α/ 2N j=1 2⋅u1−α/ 2⎠W ⋅τj2jgiver n som i punkt 1)⎞⎟⎠2≈⎝⎛⎜⎝m∑j=1⎞⎟⎠W ⋅ s2j2j1+ ⋅N⎞⎟⎠2m∑j=1W ⋅ sj2j(Worst case θ j = ½ ∀ j• Den optimale stikprøvestørrelse for stratum j kan findes ved note 7nj≥W ⋅ sm∑k=1jW ⋅ skjk⋅ n7 2I formlen er der anvendt følgende approksimation: τ = j⋅θ⋅( 1−θ) ≈θ⋅( 1 −θ)jNNj−1- 8 -

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!