Opgeloste Oefeningen Hoofdstuk 6: Steekproeven en ... - biomath
Opgeloste Oefeningen Hoofdstuk 6: Steekproeven en ... - biomath
Opgeloste Oefeningen Hoofdstuk 6: Steekproeven en ... - biomath
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Opgeloste</strong> <strong>Oef<strong>en</strong>ing<strong>en</strong></strong> <strong>Hoofdstuk</strong> 6:<br />
<strong>Steekproev<strong>en</strong></strong> <strong>en</strong> empirische distributies<br />
6.1. Uit e<strong>en</strong> normaal verdeeld universum X met gemiddelde waarde µ = 2 <strong>en</strong> standaardafwijking<br />
σ = 1 word<strong>en</strong> 10 onafhankelijke steekproefwaard<strong>en</strong> g<strong>en</strong>om<strong>en</strong>. Zij k het aantal negatieve<br />
steekproefwaard<strong>en</strong> daartuss<strong>en</strong>. Bepaal :<br />
(a) de distributie van k (antw. k d = B(10, 0.023))<br />
(b) de gemiddelde waarde <strong>en</strong> de variantie van k (antw. 0.23 <strong>en</strong> 0.225)<br />
(c) de kans dat k verschill<strong>en</strong>d is van 0. (antw. 0.208)<br />
Oplossing: De waarschijnlijkheid dat e<strong>en</strong> steekproefwaarde negatief is wordt gegev<strong>en</strong> door<br />
p = P(X < 0) = P(U < −2) = Φ(−2) = 0.023.<br />
(a) Het is duidelijk dat k d = B(10, p) = B(10, 0.023).<br />
(b) E[k] = np = 0.23 <strong>en</strong> Var[k] = np(1 − p) = 0.225.<br />
(c) De kans dat k verschill<strong>en</strong>d is van 0 wordt gegev<strong>en</strong> door<br />
P(k = 0) = 1 − P(k = 0) = 1 −<br />
= 1 − (0.977) 10 = 0.208.<br />
<br />
10<br />
p<br />
0<br />
0 (1 − p) 10<br />
6.2. Bepaal het gemiddelde, de mediaan <strong>en</strong> de variantie van volg<strong>en</strong>de rij getall<strong>en</strong>:<br />
(i) 38, 47, 44, 32, 51, 28<br />
(ii) 9, 10, 11, 10, 10, 9, 10, 9, 10, 11<br />
Oplossing:<br />
(i) 28, 32, 38, 44, 47, 51<br />
Mediaan: n = 6: ev<strong>en</strong> dus M := Y n/2+Y n/2+1<br />
2<br />
Gemiddelde: 1<br />
6 (28 + 32 + 38 + 44 + 47 + 51)<br />
= 38+44<br />
2<br />
= 41<br />
Variantie: 1<br />
5 ((−12)2 + (−8) 2 + (−2) 2 + 4 2 + 7 2 + 11 2 = 79, 6<br />
(ii) 9, 10, 11, 10, 10, 9, 10, 9, 10, 11<br />
1
xi ni<br />
9 3<br />
10 5<br />
11 2<br />
10<br />
Mediaan: n = 10: ev<strong>en</strong> dus M := Y n/2+Y n/2+1<br />
2<br />
Gemiddelde: 1<br />
10 (3 × 9 + 5 × 10 + 2 × 11) = 9, 9<br />
= 10<br />
Variantie: 1<br />
9 (3(−0, 9)2 + 5(0, 1) 2 + 2(1, 1) 2 = 0, 544<br />
6.3. Van 1000 getall<strong>en</strong> zijn er 200 gelijk aan 4, 400 gelijk aan 5, 300 gelijk aan 6. De overige<br />
zijn gelijk aan 7. Bepaal de mediaan, het gemiddelde <strong>en</strong> de standaardafwijking.<br />
Oplossing:<br />
xi<br />
ni<br />
4 200<br />
5 400<br />
6 300<br />
7 100<br />
1000<br />
Mediaan: n = 1000: ev<strong>en</strong> dus M := Y 1000/2+Y 1000/2+1<br />
2<br />
= 5<br />
1<br />
Gemiddelde: 1000 (200 × 4 + 400 × 5 + 300 × 6 + 100 × 7) = 5, 3<br />
Variantie:<br />
1<br />
999 (200(−1, 3)2 + 400(0, 3) 2 + 300(0, 7) 2 + 100(1, 7) 2 = 0, 81081<br />
Standaardafwijking= √ 0, 81081 = 0, 9005<br />
6.4. Bij ratt<strong>en</strong> observeerde m<strong>en</strong> 100 verschill<strong>en</strong>de worp<strong>en</strong> van telk<strong>en</strong>s 5 jong<strong>en</strong> <strong>en</strong> m<strong>en</strong> telde<br />
het aantal mannetjes per worp:<br />
4 1 3 3 2 2 2 1 2 3 4 3 0 4 2<br />
5 3 1 3 4 2 2 0 3 2 1 3 2 2 4<br />
3 4 3 2 3 2 2 3 4 5 3 3 3 2 3<br />
2 2 1 1 4 3 4 3 2 2 4 3 3 4 1<br />
2 3 2 3 2 4 3 1 3 3 4 2 3 1 2<br />
2 5 4 3 2 4 3 3 4 2 1 3 2 1 2<br />
3 0 1 1 3 5 2 2 4 3<br />
Maak e<strong>en</strong> frequ<strong>en</strong>tietabel <strong>en</strong> e<strong>en</strong> puntdiagram.<br />
2
Oplossing:<br />
xi ni ni/n (n1 + . . . + ni)/n<br />
0 3 0,03 0,03<br />
1 13 0,13 0,16<br />
2 30 0,3 0,46<br />
3 33 0,33 0,79<br />
4 17 0,17 0,96<br />
5 4 0,04 1<br />
100 1<br />
6.5. Hieronder word<strong>en</strong> de gewicht<strong>en</strong> van 120 vrouw<strong>en</strong> uit de leeftijdscategorie 18-25 jaar (in<br />
kg; afgerond tot op de e<strong>en</strong>heid) gegev<strong>en</strong>.<br />
Gevraagd:<br />
54 45 61 68 45 63 61 59 55 44 57 50<br />
61 44 61 58 44 50 57 59 44 61 48 52<br />
53 43 57 52 59 61 53 59 59 61 53 47<br />
59 61 59 49 61 61 66 48 62 66 66 61<br />
62 46 44 70 54 46 61 70 58 51 49 64<br />
46 56 49 66 55 57 61 59 61 57 45 64<br />
58 48 50 64 58 45 63 48 73 76 54 48<br />
66 64 62 46 61 70 51 47 48 54 50 61<br />
54 44 55 57 51 45 52 55 55 44 54 58<br />
53 56 54 75 54 43 57 50 61 57 54 54<br />
(i) Frequ<strong>en</strong>tietabel met klass<strong>en</strong>indeling<br />
(ii) Histogram <strong>en</strong> frequ<strong>en</strong>tieveelhoek<br />
(iii) Steekproefbereik <strong>en</strong> Mediaan<br />
(iv) Gemiddelde <strong>en</strong> variantie<br />
Oplossing:<br />
(i) Methode om e<strong>en</strong> frequ<strong>en</strong>tietabel voor continue data op te stell<strong>en</strong><br />
1. Zoek de kleinste <strong>en</strong> de grootste waarde in de tabel.<br />
3
2. Houd er rek<strong>en</strong>ing mee dat getabuleerde waard<strong>en</strong> onstaan door afronding!<br />
Bepaal de feitelijke kleinste <strong>en</strong> grootste waarde.<br />
3. Berek<strong>en</strong> het verschil tuss<strong>en</strong> de feitelijke extremale waard<strong>en</strong>.<br />
4. Deel dit verschil door 10 <strong>en</strong> door 20 <strong>en</strong> kies dan e<strong>en</strong> klassebreedte die ligt tuss<strong>en</strong><br />
deze twee uitkomst<strong>en</strong>.<br />
Kleinste waarde: 43 ⇒ Feitelijke kleinste waarde: 42,5<br />
Grootste waarde: 76 ⇒ Feitelijke grootste waarde: 76,5<br />
Verschil tuss<strong>en</strong> extremale waard<strong>en</strong>: 76,5-42,5=34<br />
De klassebreedte moet dus ligg<strong>en</strong> tuss<strong>en</strong><br />
Kies bijvoorbeeld 3 als klassebreedte<br />
(ii) histogram <strong>en</strong> frequ<strong>en</strong>tieveelhoek<br />
34/20 = 1, 7 <strong>en</strong> 34/10 = 3, 4<br />
Klass<strong>en</strong> Midd<strong>en</strong> Turv<strong>en</strong> abs.freq.<br />
[42, 5; 45; 5[ 44 ||||| ||||| |||| 14<br />
[45, 5; 48, 5[ 47 ||||| ||||| || 12<br />
[48, 5; 51, 5[ 50 ||||| ||||| | 11<br />
[51, 5; 54, 5[ 53 ||||| ||||| ||||| || 17<br />
[54, 5; 57, 5[ 56 ||||| ||||| ||||| 15<br />
[57, 5; 60, 5[ 59 ||||| ||||| ||| 13<br />
[60, 5; 63, 5[ 62 ||||| ||||| ||||| ||||| 22<br />
[63, 5; 66, 5[ 65 ||||| |||| 9<br />
[66, 5; 69, 5[ 68 | 1<br />
[69, 5; 72, 5[ 71 ||| 3<br />
[72, 5; 75, 5[ 74 || 2<br />
[75, 5; 78, 5[ 77 | 1<br />
120<br />
(iii) Steekproefbereik: R := Yn − Y1 = 76 − 43 = 33<br />
4
Mediaan:<br />
n = 120: ev<strong>en</strong> dus M := Y 120/2+Y 120/2+1<br />
2<br />
(iv) Gemiddelde: 55,8<br />
Variantie:<br />
= 56+56<br />
2<br />
= 56<br />
1<br />
119 (14(11, 8)2 + 12(8, 8) 2 + 11(5, 8) 2 + 17(2, 8) 2 + 15(0, 2) 2<br />
+12(3, 2) 2 + 23(6, 2) 2 + 9(9, 2) 2 + (12, 2) 2<br />
+3(15, 2) 2 + 2(18, 2) 2 + (21, 2) 2 = 59, 707 (59, 47)<br />
6.6. Ziehier de stystolische bloeddrukk<strong>en</strong> van 100 vrouw<strong>en</strong> uit de leefstijdscategorie 20-30 jaar.<br />
Groep A betreft 50 vrouw<strong>en</strong> die de anticonceptiepil niet gebruik<strong>en</strong> <strong>en</strong> in groep B zijn 50<br />
vrouw<strong>en</strong> die de pil wel gebruik<strong>en</strong>. Vergelijk via box-plot deze twee groep<strong>en</strong>.<br />
Groep A (Niet-gebruikers):<br />
Groep B (Gebruikers):<br />
102 116 106 106 114 105 112 116 98 100<br />
112 120 92 112 121 125 125 134 126 116<br />
118 122 124 119 130 114 96 136 102 126<br />
100 120 104 118 131 146 124 110 108 136<br />
118 122 128 132 115 140 112 132 108 120<br />
112 122 112 106 118 114 108 102 121 110<br />
120 122 126 90 124 120 131 114 125 115<br />
116 126 96 118 130 134 98 131 115 125<br />
128 108 134 128 124 136 138 118 105 141<br />
109 132 116 142 136 120 102 130 132 152<br />
Oplossing: E<strong>en</strong> boxplot is e<strong>en</strong> e<strong>en</strong>voudige grafische sam<strong>en</strong>vatting van <strong>en</strong>kele belangrijke<br />
k<strong>en</strong>getall<strong>en</strong> van e<strong>en</strong> dataset.<br />
In haar e<strong>en</strong>voudigste vorm wordt e<strong>en</strong> boxplot getek<strong>en</strong>t met behulp van volg<strong>en</strong>de 5 getall<strong>en</strong>.<br />
1. De twee extrem<strong>en</strong><br />
2. De mediaan:<br />
M :=<br />
Yn <strong>en</strong> Y1<br />
Yn/2+Yn/2+1 2<br />
Y n+1<br />
2<br />
3. Het eerste <strong>en</strong> het derde kwartielgetal:<br />
Opmerking over de kwartiel<strong>en</strong>:<br />
als n ev<strong>en</strong><br />
als n onev<strong>en</strong><br />
– De zog<strong>en</strong>aamde kwartiel<strong>en</strong> vorm<strong>en</strong> e<strong>en</strong> verdere uitbreiding van het begrip mediaan.<br />
– Van de mediaan kan gezegd word<strong>en</strong> dat ze e<strong>en</strong> geord<strong>en</strong>de rij gegev<strong>en</strong>s in twee<br />
gelijke del<strong>en</strong> verdeelt.<br />
5
– Als we de geord<strong>en</strong>de rij in vier gelijke del<strong>en</strong> will<strong>en</strong> verdel<strong>en</strong>, dan vind<strong>en</strong> we drie<br />
kwartiel<strong>en</strong>.<br />
– Elke observatie uit e<strong>en</strong> geord<strong>en</strong>de rij heeft e<strong>en</strong> rangnummer: de positie die het<br />
in de geord<strong>en</strong>de rij inneemt.<br />
– We definiër<strong>en</strong> nu ook niet-gehele rangnummers door te zegg<strong>en</strong> dat<br />
Yi + p (Yi+1 − Yi)<br />
rangnummer i + p heeft (0 < p < 1).<br />
– Met behulp van het voorgaande definiër<strong>en</strong> we :<br />
∗ het eerste kwartielgetal K1 is het getal met rangnummer n+1<br />
4<br />
∗ het tweede kwartielgetal K2 (of mediaan) is het getal met rangnummer n+1<br />
2<br />
∗ het derde kwartielgetal k3 is het getal met rangnummer 3 n+1<br />
4<br />
Schematisch tek<strong>en</strong><strong>en</strong> we de boxplot als volgt:<br />
1. Teg<strong>en</strong>over e<strong>en</strong> schaal wordt e<strong>en</strong> rechthoekige doos getek<strong>en</strong>t van het eerste tot het<br />
derde kwartiel.<br />
2. De lijn in de doos wijst de mediaan aan.<br />
3. De twee kruisjes duid<strong>en</strong> het grootste <strong>en</strong> het kleinste getal aan.<br />
4. De twee kruisjes word<strong>en</strong> door lijn<strong>en</strong> met de doos verbond<strong>en</strong>.<br />
Om de kwartielgetall<strong>en</strong> te kunn<strong>en</strong> bepal<strong>en</strong> moet<strong>en</strong> we de data eerst ord<strong>en</strong><strong>en</strong>!<br />
Groep A (Niet-gebruikers):<br />
92 96 98<br />
100 100 102 102 104 105 106 106 108 108<br />
110 112 112 112 112 114 114 115 116 116 116 118 118 118 119<br />
120 120 120 121 122 122 124 124 125 126 126 128<br />
130 131 132 132 134 136 136<br />
140 146<br />
Groep B (Gebruikers):<br />
90 96 98<br />
102 102 105 106 108 108 109<br />
110 112 112 114 114 115 115 116 116 118 118 118<br />
120 120 120 121 122 122 124 124 125 125 126 126 128 128<br />
130 130 131 131 132 132 134 134 136 136 138<br />
141 142<br />
152<br />
6
Groep A Groep B<br />
M 118 120+121 = 120, 5<br />
K1 108<br />
2<br />
112<br />
K3 125+0,25(126-125)=125,25 130+0,25(131-130)=130,25<br />
Y50 146 152<br />
Y1 92 90<br />
6.7. Het Effect van e<strong>en</strong> vegetarisch dieet op het serum-cholesterolgehalte.<br />
E<strong>en</strong> steekproef van 24 hospitaalbedi<strong>en</strong>d<strong>en</strong> die e<strong>en</strong> standaard dieet volgd<strong>en</strong> verklaard<strong>en</strong><br />
zich akkoord om gedur<strong>en</strong>de 1 maand over te schakel<strong>en</strong> op e<strong>en</strong> vegetarisch dieet.<br />
Hun serum-cholesterolgehalte werd gemet<strong>en</strong> aan het begin van het vegetarisch dieet <strong>en</strong> 1<br />
maand later.<br />
(i) Berek<strong>en</strong> de gemiddelde verandering in cholesterolgehalte.<br />
(ii) Berek<strong>en</strong> de standaardafwijking van de verandering in cholesterolgehalte.<br />
(iii) Berek<strong>en</strong> de mediaan van de verandering in cholesterol.<br />
(iv) Construeer e<strong>en</strong> box-plot voor de colesterol verandering<strong>en</strong>.<br />
(v) Geef comm<strong>en</strong>taar over de symmetrie van de verdeling van de cholesterol verandering<strong>en</strong>.<br />
(vi) Sommige onderzoekers hebb<strong>en</strong> het gevoel dat het effect van e<strong>en</strong> dieet op cholesterolgehalte<br />
meer uitgesprok<strong>en</strong> is bij person<strong>en</strong> met e<strong>en</strong> hoog cholesterolgehalte. Splits de<br />
data op naargelang het basis cholesterolgehalte bov<strong>en</strong> of onder de mediaan ligt <strong>en</strong><br />
geef comm<strong>en</strong>taar op de bewering.<br />
7
Oplossing:<br />
(i) Gemiddelde :19,542<br />
(ii) Standaardafwijking:<br />
Variantie: <br />
Persoon Voor Na Voor-na<br />
1 195 146 49<br />
2 145 155 -10<br />
3 205 178 27<br />
4 159 146 13<br />
5 244 208 36<br />
6 166 147 19<br />
7 250 202 48<br />
8 236 215 21<br />
9 192 184 8<br />
10 224 208 16<br />
11 238 206 32<br />
12 197 169 28<br />
13 169 182 -13<br />
14 158 127 31<br />
15 151 149 2<br />
16 197 178 19<br />
17 180 161 19<br />
18 222 187 35<br />
19 168 176 -8<br />
20 168 145 23<br />
21 167 154 13<br />
22 161 153 8<br />
23 178 137 41<br />
24 137 125 12<br />
i<br />
x 2 i = 15661<br />
n x 2 = 9165, 042<br />
1<br />
1<br />
(15661 − 9165, 042) = (6496) = 282, 4<br />
n − 1 23<br />
Dus is de standaardafwijking:<br />
16, 8057<br />
(iii) Geord<strong>en</strong>de observaties:<br />
Mediaan: 19<br />
−13 − 10 − 8<br />
2 8 8<br />
12 13 13 16 19 19 19<br />
21 23 27 28<br />
31 32 35 36<br />
8<br />
41 48 49
(iv) Box-plot:<br />
K1 = 8 + 0, 25 × 4 = 9<br />
K2 = 31, 75<br />
Y24 = 49<br />
Y1 = −13<br />
(v) Geef comm<strong>en</strong>taar over de symmetrie van de verdeling van de cholesterol verandering<strong>en</strong>.<br />
Rechts is er e<strong>en</strong> iets grotere spreiding in de box.<br />
Links is de spreiding kleiner.<br />
(vi) Sommige onderzoekers hebb<strong>en</strong> het gevoel dat het effect van e<strong>en</strong> dieet op cholesterolgehalte<br />
meer uitgesprok<strong>en</strong> is bij person<strong>en</strong> met e<strong>en</strong> hoog cholesterolgehalte. Splits de<br />
data op naargelang het basis cholesterolgehalte bov<strong>en</strong> of onder de mediaan ligt <strong>en</strong><br />
geef comm<strong>en</strong>taar op de bewering.<br />
Mediaan van het basischolesterolgehalte: 179<br />
Dus we splits<strong>en</strong> de data op in twee groep<strong>en</strong>:<br />
– Groep 1: alle person<strong>en</strong> met cholesterolgehalte ¡ 179<br />
– Groep 2: alle person<strong>en</strong> met cholesterolgehalte ¿ 179<br />
Voor elk van de twee groep<strong>en</strong> berek<strong>en</strong><strong>en</strong> we de k<strong>en</strong>getall<strong>en</strong> om e<strong>en</strong> boxplot te kunn<strong>en</strong><br />
tek<strong>en</strong><strong>en</strong>:<br />
Let op berek<strong>en</strong> de k<strong>en</strong>getall<strong>en</strong> op basis van de verandering in cholesterolgehalte!<br />
M<br />
K1<br />
K3<br />
Y12<br />
Y1<br />
Groep 1 Groep 2<br />
We zi<strong>en</strong> dan dat het gevoel van de onderzoekers juist is.<br />
9