C:\mol\noter\Statistik\Statistiske grundbegreber-v11\s1v11-forside.wpd

Recommendations

Info

5 Stikprøver 5. STIKPRØVER 5.1 UDTAGNING AF STIKPRØVER I langt de fleste i praksis forekomne tilfælde vil det bl.a. af tidsmæssige og omkostningsmæssige grunde være umuligt at foretage en totaltælling af hele populationen. Helt klart er dette ved afprøvningen ødelægger emnet (åbning af konservesdåser) eller populationen i princippet er uendelig ( for at undersøge om en metode giver et større udbytte end et andet, udføres en række kemiske forsøg og her er der teoretisk ingen øvre grænse for antal delforsøg) Som det senere vil fremgå kan selv en forholdsvis lille repræsentativ stikprøve give svar på væsentlige forhold omkring hele populationen. Det er imidlertid klart, at en betingelse herfor er, at stikprøven er repræsentativ, dvs. at stikprøven med hensyn til den egenskab der ønskes er et “mini-billede” af populationen. For at opnå det, foretager man en eller anden form for lodtrækning (kaldes randomisering). Afhængig af problemet kan dette gøres på forskellig måde. Simpel udvælgelse: Den enkleste form for stikprøveudtagning er, at man nummererer populationens elementer, og så randomiserer (ved lodtrækning, evt. ved at benyttet et program der generer tilfældige tal) udtager de N elementer der skal indgå i stikprøven. Eksempel: For at undersøge om en ændring af vitaminindholdet i foderet for svin ændrede deres vægt, udvalgte man ved randomisering de svin, som fik det nye foder. Stratificeret udvælgelse. Under visse omstændigheder er det fordelagtigt (mindre stikprøvestørrelse for at opnå samme sikkerhed) at opdele populationen i mindre grupper (kaldet strada), og så foretage en simpel udvælgelse indenfor hver gruppe. Dette er dog kun en fordel, hvis elementerne indenfor hver gruppe er mere ensartet end mellem grupperne. Eksempel: Ønsker man at spørge vælgerne om deres holdning til et politisk spørgsmål (f.eks. om deres holdning til et skattestop) kunne det måske være en fordel at dele dem op i indkomstgrupper (høj, mellem og lav) . Systematisk udvælgelse: Ved en såkaldt systematisk udvælgelse, vælger man at udtage hver k’te element fra populationen. Eksempel: En detailhandler ønsker at måle tilfredsheden hos sine kunder. Der ønskes udtaget 40 kunder i løbet af en speciel dag. Da man naturligvis ikke på forhånd kender de kunder der kommer i butikken, vælges en systematisk udvælgelse, ved at vælge hver 7'ende kunde der forlader butikken. Man starter dagen med ved lodtrækning at vælge et af tallene fra 1 til 7. Lad det være tallet 5. Man udtager nu kunde nr. 5, 5+ 1⋅ 7 = 12, 5+ 2⋅ 7 = 19,..., 5+ 39⋅ 7 = 278 . Derved har man fået valgt i alt 40 kunder. Problemet er naturligvis, om tallet 7 er det rigtige tal. Hvis man får valgt tallet for stort, eksempelvis sætter det til 30, så vil en stikprøve på 40 kræve, at der er 1175 kunder den dag, og det behøver jo ikke at være tilfældet. Omvendt hvis tallet er for lille, så får man måske udtaget de 40 kunder i løbet af formiddagen, og så er stikprøven nok ikke repræsentativ, da man ikke får eftermiddagskunderne med. 38
5.2 Fordeling og spredning af gennemsnit Klyngeudvælgelse (Cluster sampling) Denne metode kan med fordel benyttes, hvis populationen består af eller kan inddeles i delmængder (klynger) . Metoden består i, at man ved randomisering vælger et mindre antal klynger, som så totaltælles. Eksempel: I et vareparti på 2000 emner fordelt på 200 kasser hver med 10 emner ønsker man en vurdering af fejlprocenten. Man udtager randomiseret 5 kasser, og undersøger alle emnerne i kasserne. 5.2. FORDELING OG SPREDNING AF GENNEMSNIT Udtages en stikprøve fra en population er det jo for, at man ud fra stikprøven kan fortælle noget centralt om hele populationen. I eksempel 1.5 var vi således interesseret i koncentrationen af brintioner (pH) i ledvæsken i knæet hos patienter, der led af denne sygdom. Som led i en nordisk medicinsk undersøgelse udtog man blandt patienter der led af denne sygdom tilfældigt en stikprøve på 75. På basis heraf beregnede man gennemsnittet af pH værdierne til x = 7.2868 og spredningen s = 0.134355 . Man vil nu sige, at et estimat (skøn) for den “sande” middelværdi µ for hele populationen er 7.29 og den “sande” spredning” σ er 0.134. Det er imidlertid klart, at disse tal er behæftet med en vis usikkerhed. Havde vi valgt 75 andre patienter havde vi uden tvivl fået lidt andre tal. Det er derfor ikke nok, at angive at den “sande” middelværdi er x , vi må også angive et “usikkerhedsinterval”. For at kunne beregne et sådant interval er det nødvendigt at kende fordelingen. Her spiller den tidligere nævnte centrale grænseværdisætning en vigtig rolle, idet den jo (løst sagt) siger, at selv om man ikke kender fordelingen af den kontinuerte stokastiske variabel, så vil gennemsnittet af værdierne i en stikprøve på n tal vil være tilnærmelsesvis normalfordelt, hvis blot n er tilstrækkelig stor ( i praksis over 30). Dette er af stor praktisk betydning, idet det så ikke er så vigtigt, om selve populationen er normalfordelt. Ofte er det jo kun af interesseret at kunne forudsige noget om hvor middelværdien af fordelingen er placeret. σ Endvidere fremgik det af sætning 3.1 , at spredningen på x er σ( x) = , hvor σ er n spredningen på den enkelte værdi i stikprøven. Heraf fremgår, at gennemsnittet kan man “stole” mere på end den enkelte måling, da den har en mindre spredning. 39
Page 1: MOGENS ODDERSHEDE LARSEN 18 15 12 9
Page 4 and 5: INDHOLD 1 INTRODUKTION TIL STATISTI
Page 6 and 7: TABEL OVER FRAKTILER I NORMERET NOR
Page 8 and 9: 2 Deskriptiv statistik 2. DESKRIPTI
Page 10 and 11: 2 Deskriptiv statistik Eksempel 2.3
Page 12 and 13: 2 Deskriptiv statistik Dernæst del
Page 14 and 15: 2 Deskriptiv statistik Eksempel 2.6
Page 16 and 17: 2 Deskriptiv statistik Anskuelig fo
Page 18 and 19: 2 Deskriptiv statistik OPGAVER Opga
Page 20 and 21: 2 Deskriptiv statistik Opgave 2.6 D
Page 22 and 23: 3. Kontinuert stokastisk variabel L
Page 24 and 25: 3. Kontinuert stokastisk variabel V
Page 26 and 27: 3. Kontinuert stokastisk variabel F
Page 28 and 29: 3. Kontinuert stokastisk variabel E
Page 30 and 31: 3. Kontinuert stokastisk variabel E
Page 32 and 33: Statistiske grundbegreber OPGAVER O
Page 34 and 35: 4.Normalfordelingen. 4 NORMALFORDEL
Page 36 and 37: 4.Normalfordelingen. For at få et
Page 38 and 39: 4.Normalfordelingen. SÆTNING 4.2.
Page 40 and 41: 4.Normalfordelingen. 3) Da arealet
Page 42 and 43: 4.Normalfordelingen. OPGAVER Opgave
Page 46 and 47: 5 Stikprøver Eksempel 5.1. Fordeli
Page 48 and 49: 5 Stikprøver Lettere er det at ben
Page 50 and 51: 5 Stikprøver Eksempel 5.4. Beregni
Page 52 and 53: 5 Stikprøver Prædistinationsinter
Page 54 and 55: 5 Stikprøver Da overslaget jo er a
Page 56 and 57: 5 Stikprøver 5.5. OVERSIGT over ce
Page 58 and 59: 5 Stikprøver Opgave 5.5 Ved en fab
Page 60 and 61: Hypotesetestning (1 normalfordelt v
Page 76 and 77: 7. Hypotesetest 2 variable 7 . HYPO
Page 78 and 79: 7. Hypotesetest 2 variable 2) 95% K
Page 80 and 81: 7. Hypotesetest 2 variable Parvise
Page 82 and 83: 7. Hypotesetest 2 variable 7.3 OVER
Page 84 and 85: 7. Hypotesetest 2 variable Opgave 7
Page 86 and 87: 8. Regneregler for sandsynlighed, K
Page 94 and 95:
8. Regneregler for sandsynlighed, K
Page 96 and 97:
8. Regneregler for sandsynlighed, K
Page 98 and 99:
9. Vigtige diskrete fordelinger Lad
Page 100 and 101:
9. Vigtige diskrete fordelinger 9.3
Page 102 and 103:
9. Vigtige diskrete fordelinger Eks
Page 104 and 105:
9. Vigtige diskrete fordelinger Eks
Page 106 and 107:
9. Vigtige diskrete fordelinger App
Page 108 and 109:
Vigtige diskrete fordelinger Løsni
Page 110 and 111:
Vigtige diskrete fordelinger 9.6 Po
Page 112 and 113:
Vigtige diskrete fordelinger X er P
Page 114 and 115:
Vigtige diskrete fordelinger Opgave
Page 116 and 117:
Page 118 and 119:
Page 120 and 121:
Eksempel 10.1 Kontinuert variabel.
Page 122 and 123:
Andre kontinuerte fordelinger På n
Page 124 and 125:
Andre kontinuerte fordelinger 10.5
Page 126 and 127:
Bjarne Hellesen: 11 FLERDIMENSIONAL
Page 128 and 129:
Flerdimensional statistisk variabel
Page 130 and 131:
Flerdimensional stokastisk variabel
Page 132 and 133:
Page 134 and 135:
Page 136 and 137:
Page 138 and 139:
Statistiske beregninger på lommere
Page 140 and 141:
Page 142 and 143:
Page 144 and 145:
Page 146 and 147:
Page 148 and 149:
APPENDIX Approksimation af binomial
Page 150 and 151:
Facitliste FACITLISTE KAPITEL 2 2.1
Page 152 and 153:
Facitliste KAPITEL 9 9.1 (1) - )2)
Page 154 and 155:
Stikord STIKORDSREGISTER A acceptom
Page 156:
Stikord S SAK 10 sandsynlighed 16,
show all

C:\mol\noter\Statistik\Statistiske grundbegreber-v11\s1v11-forside.wpd

Create successful ePaper yourself

Delete template?

Save as template?