24.09.2013 Views

Opgeloste Oefeningen Hoofdstuk 6: Steekproeven en ... - biomath

Opgeloste Oefeningen Hoofdstuk 6: Steekproeven en ... - biomath

Opgeloste Oefeningen Hoofdstuk 6: Steekproeven en ... - biomath

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Opgeloste</strong> <strong>Oef<strong>en</strong>ing<strong>en</strong></strong> <strong>Hoofdstuk</strong> 6:<br />

<strong>Steekproev<strong>en</strong></strong> <strong>en</strong> empirische distributies<br />

6.1. Uit e<strong>en</strong> normaal verdeeld universum X met gemiddelde waarde µ = 2 <strong>en</strong> standaardafwijking<br />

σ = 1 word<strong>en</strong> 10 onafhankelijke steekproefwaard<strong>en</strong> g<strong>en</strong>om<strong>en</strong>. Zij k het aantal negatieve<br />

steekproefwaard<strong>en</strong> daartuss<strong>en</strong>. Bepaal :<br />

(a) de distributie van k (antw. k d = B(10, 0.023))<br />

(b) de gemiddelde waarde <strong>en</strong> de variantie van k (antw. 0.23 <strong>en</strong> 0.225)<br />

(c) de kans dat k verschill<strong>en</strong>d is van 0. (antw. 0.208)<br />

Oplossing: De waarschijnlijkheid dat e<strong>en</strong> steekproefwaarde negatief is wordt gegev<strong>en</strong> door<br />

p = P(X < 0) = P(U < −2) = Φ(−2) = 0.023.<br />

(a) Het is duidelijk dat k d = B(10, p) = B(10, 0.023).<br />

(b) E[k] = np = 0.23 <strong>en</strong> Var[k] = np(1 − p) = 0.225.<br />

(c) De kans dat k verschill<strong>en</strong>d is van 0 wordt gegev<strong>en</strong> door<br />

P(k = 0) = 1 − P(k = 0) = 1 −<br />

= 1 − (0.977) 10 = 0.208.<br />

<br />

10<br />

p<br />

0<br />

0 (1 − p) 10<br />

6.2. Bepaal het gemiddelde, de mediaan <strong>en</strong> de variantie van volg<strong>en</strong>de rij getall<strong>en</strong>:<br />

(i) 38, 47, 44, 32, 51, 28<br />

(ii) 9, 10, 11, 10, 10, 9, 10, 9, 10, 11<br />

Oplossing:<br />

(i) 28, 32, 38, 44, 47, 51<br />

Mediaan: n = 6: ev<strong>en</strong> dus M := Y n/2+Y n/2+1<br />

2<br />

Gemiddelde: 1<br />

6 (28 + 32 + 38 + 44 + 47 + 51)<br />

= 38+44<br />

2<br />

= 41<br />

Variantie: 1<br />

5 ((−12)2 + (−8) 2 + (−2) 2 + 4 2 + 7 2 + 11 2 = 79, 6<br />

(ii) 9, 10, 11, 10, 10, 9, 10, 9, 10, 11<br />

1


xi ni<br />

9 3<br />

10 5<br />

11 2<br />

10<br />

Mediaan: n = 10: ev<strong>en</strong> dus M := Y n/2+Y n/2+1<br />

2<br />

Gemiddelde: 1<br />

10 (3 × 9 + 5 × 10 + 2 × 11) = 9, 9<br />

= 10<br />

Variantie: 1<br />

9 (3(−0, 9)2 + 5(0, 1) 2 + 2(1, 1) 2 = 0, 544<br />

6.3. Van 1000 getall<strong>en</strong> zijn er 200 gelijk aan 4, 400 gelijk aan 5, 300 gelijk aan 6. De overige<br />

zijn gelijk aan 7. Bepaal de mediaan, het gemiddelde <strong>en</strong> de standaardafwijking.<br />

Oplossing:<br />

xi<br />

ni<br />

4 200<br />

5 400<br />

6 300<br />

7 100<br />

1000<br />

Mediaan: n = 1000: ev<strong>en</strong> dus M := Y 1000/2+Y 1000/2+1<br />

2<br />

= 5<br />

1<br />

Gemiddelde: 1000 (200 × 4 + 400 × 5 + 300 × 6 + 100 × 7) = 5, 3<br />

Variantie:<br />

1<br />

999 (200(−1, 3)2 + 400(0, 3) 2 + 300(0, 7) 2 + 100(1, 7) 2 = 0, 81081<br />

Standaardafwijking= √ 0, 81081 = 0, 9005<br />

6.4. Bij ratt<strong>en</strong> observeerde m<strong>en</strong> 100 verschill<strong>en</strong>de worp<strong>en</strong> van telk<strong>en</strong>s 5 jong<strong>en</strong> <strong>en</strong> m<strong>en</strong> telde<br />

het aantal mannetjes per worp:<br />

4 1 3 3 2 2 2 1 2 3 4 3 0 4 2<br />

5 3 1 3 4 2 2 0 3 2 1 3 2 2 4<br />

3 4 3 2 3 2 2 3 4 5 3 3 3 2 3<br />

2 2 1 1 4 3 4 3 2 2 4 3 3 4 1<br />

2 3 2 3 2 4 3 1 3 3 4 2 3 1 2<br />

2 5 4 3 2 4 3 3 4 2 1 3 2 1 2<br />

3 0 1 1 3 5 2 2 4 3<br />

Maak e<strong>en</strong> frequ<strong>en</strong>tietabel <strong>en</strong> e<strong>en</strong> puntdiagram.<br />

2


Oplossing:<br />

xi ni ni/n (n1 + . . . + ni)/n<br />

0 3 0,03 0,03<br />

1 13 0,13 0,16<br />

2 30 0,3 0,46<br />

3 33 0,33 0,79<br />

4 17 0,17 0,96<br />

5 4 0,04 1<br />

100 1<br />

6.5. Hieronder word<strong>en</strong> de gewicht<strong>en</strong> van 120 vrouw<strong>en</strong> uit de leeftijdscategorie 18-25 jaar (in<br />

kg; afgerond tot op de e<strong>en</strong>heid) gegev<strong>en</strong>.<br />

Gevraagd:<br />

54 45 61 68 45 63 61 59 55 44 57 50<br />

61 44 61 58 44 50 57 59 44 61 48 52<br />

53 43 57 52 59 61 53 59 59 61 53 47<br />

59 61 59 49 61 61 66 48 62 66 66 61<br />

62 46 44 70 54 46 61 70 58 51 49 64<br />

46 56 49 66 55 57 61 59 61 57 45 64<br />

58 48 50 64 58 45 63 48 73 76 54 48<br />

66 64 62 46 61 70 51 47 48 54 50 61<br />

54 44 55 57 51 45 52 55 55 44 54 58<br />

53 56 54 75 54 43 57 50 61 57 54 54<br />

(i) Frequ<strong>en</strong>tietabel met klass<strong>en</strong>indeling<br />

(ii) Histogram <strong>en</strong> frequ<strong>en</strong>tieveelhoek<br />

(iii) Steekproefbereik <strong>en</strong> Mediaan<br />

(iv) Gemiddelde <strong>en</strong> variantie<br />

Oplossing:<br />

(i) Methode om e<strong>en</strong> frequ<strong>en</strong>tietabel voor continue data op te stell<strong>en</strong><br />

1. Zoek de kleinste <strong>en</strong> de grootste waarde in de tabel.<br />

3


2. Houd er rek<strong>en</strong>ing mee dat getabuleerde waard<strong>en</strong> onstaan door afronding!<br />

Bepaal de feitelijke kleinste <strong>en</strong> grootste waarde.<br />

3. Berek<strong>en</strong> het verschil tuss<strong>en</strong> de feitelijke extremale waard<strong>en</strong>.<br />

4. Deel dit verschil door 10 <strong>en</strong> door 20 <strong>en</strong> kies dan e<strong>en</strong> klassebreedte die ligt tuss<strong>en</strong><br />

deze twee uitkomst<strong>en</strong>.<br />

Kleinste waarde: 43 ⇒ Feitelijke kleinste waarde: 42,5<br />

Grootste waarde: 76 ⇒ Feitelijke grootste waarde: 76,5<br />

Verschil tuss<strong>en</strong> extremale waard<strong>en</strong>: 76,5-42,5=34<br />

De klassebreedte moet dus ligg<strong>en</strong> tuss<strong>en</strong><br />

Kies bijvoorbeeld 3 als klassebreedte<br />

(ii) histogram <strong>en</strong> frequ<strong>en</strong>tieveelhoek<br />

34/20 = 1, 7 <strong>en</strong> 34/10 = 3, 4<br />

Klass<strong>en</strong> Midd<strong>en</strong> Turv<strong>en</strong> abs.freq.<br />

[42, 5; 45; 5[ 44 ||||| ||||| |||| 14<br />

[45, 5; 48, 5[ 47 ||||| ||||| || 12<br />

[48, 5; 51, 5[ 50 ||||| ||||| | 11<br />

[51, 5; 54, 5[ 53 ||||| ||||| ||||| || 17<br />

[54, 5; 57, 5[ 56 ||||| ||||| ||||| 15<br />

[57, 5; 60, 5[ 59 ||||| ||||| ||| 13<br />

[60, 5; 63, 5[ 62 ||||| ||||| ||||| ||||| 22<br />

[63, 5; 66, 5[ 65 ||||| |||| 9<br />

[66, 5; 69, 5[ 68 | 1<br />

[69, 5; 72, 5[ 71 ||| 3<br />

[72, 5; 75, 5[ 74 || 2<br />

[75, 5; 78, 5[ 77 | 1<br />

120<br />

(iii) Steekproefbereik: R := Yn − Y1 = 76 − 43 = 33<br />

4


Mediaan:<br />

n = 120: ev<strong>en</strong> dus M := Y 120/2+Y 120/2+1<br />

2<br />

(iv) Gemiddelde: 55,8<br />

Variantie:<br />

= 56+56<br />

2<br />

= 56<br />

1<br />

119 (14(11, 8)2 + 12(8, 8) 2 + 11(5, 8) 2 + 17(2, 8) 2 + 15(0, 2) 2<br />

+12(3, 2) 2 + 23(6, 2) 2 + 9(9, 2) 2 + (12, 2) 2<br />

+3(15, 2) 2 + 2(18, 2) 2 + (21, 2) 2 = 59, 707 (59, 47)<br />

6.6. Ziehier de stystolische bloeddrukk<strong>en</strong> van 100 vrouw<strong>en</strong> uit de leefstijdscategorie 20-30 jaar.<br />

Groep A betreft 50 vrouw<strong>en</strong> die de anticonceptiepil niet gebruik<strong>en</strong> <strong>en</strong> in groep B zijn 50<br />

vrouw<strong>en</strong> die de pil wel gebruik<strong>en</strong>. Vergelijk via box-plot deze twee groep<strong>en</strong>.<br />

Groep A (Niet-gebruikers):<br />

Groep B (Gebruikers):<br />

102 116 106 106 114 105 112 116 98 100<br />

112 120 92 112 121 125 125 134 126 116<br />

118 122 124 119 130 114 96 136 102 126<br />

100 120 104 118 131 146 124 110 108 136<br />

118 122 128 132 115 140 112 132 108 120<br />

112 122 112 106 118 114 108 102 121 110<br />

120 122 126 90 124 120 131 114 125 115<br />

116 126 96 118 130 134 98 131 115 125<br />

128 108 134 128 124 136 138 118 105 141<br />

109 132 116 142 136 120 102 130 132 152<br />

Oplossing: E<strong>en</strong> boxplot is e<strong>en</strong> e<strong>en</strong>voudige grafische sam<strong>en</strong>vatting van <strong>en</strong>kele belangrijke<br />

k<strong>en</strong>getall<strong>en</strong> van e<strong>en</strong> dataset.<br />

In haar e<strong>en</strong>voudigste vorm wordt e<strong>en</strong> boxplot getek<strong>en</strong>t met behulp van volg<strong>en</strong>de 5 getall<strong>en</strong>.<br />

1. De twee extrem<strong>en</strong><br />

2. De mediaan:<br />

M :=<br />

Yn <strong>en</strong> Y1<br />

Yn/2+Yn/2+1 2<br />

Y n+1<br />

2<br />

3. Het eerste <strong>en</strong> het derde kwartielgetal:<br />

Opmerking over de kwartiel<strong>en</strong>:<br />

als n ev<strong>en</strong><br />

als n onev<strong>en</strong><br />

– De zog<strong>en</strong>aamde kwartiel<strong>en</strong> vorm<strong>en</strong> e<strong>en</strong> verdere uitbreiding van het begrip mediaan.<br />

– Van de mediaan kan gezegd word<strong>en</strong> dat ze e<strong>en</strong> geord<strong>en</strong>de rij gegev<strong>en</strong>s in twee<br />

gelijke del<strong>en</strong> verdeelt.<br />

5


– Als we de geord<strong>en</strong>de rij in vier gelijke del<strong>en</strong> will<strong>en</strong> verdel<strong>en</strong>, dan vind<strong>en</strong> we drie<br />

kwartiel<strong>en</strong>.<br />

– Elke observatie uit e<strong>en</strong> geord<strong>en</strong>de rij heeft e<strong>en</strong> rangnummer: de positie die het<br />

in de geord<strong>en</strong>de rij inneemt.<br />

– We definiër<strong>en</strong> nu ook niet-gehele rangnummers door te zegg<strong>en</strong> dat<br />

Yi + p (Yi+1 − Yi)<br />

rangnummer i + p heeft (0 < p < 1).<br />

– Met behulp van het voorgaande definiër<strong>en</strong> we :<br />

∗ het eerste kwartielgetal K1 is het getal met rangnummer n+1<br />

4<br />

∗ het tweede kwartielgetal K2 (of mediaan) is het getal met rangnummer n+1<br />

2<br />

∗ het derde kwartielgetal k3 is het getal met rangnummer 3 n+1<br />

4<br />

Schematisch tek<strong>en</strong><strong>en</strong> we de boxplot als volgt:<br />

1. Teg<strong>en</strong>over e<strong>en</strong> schaal wordt e<strong>en</strong> rechthoekige doos getek<strong>en</strong>t van het eerste tot het<br />

derde kwartiel.<br />

2. De lijn in de doos wijst de mediaan aan.<br />

3. De twee kruisjes duid<strong>en</strong> het grootste <strong>en</strong> het kleinste getal aan.<br />

4. De twee kruisjes word<strong>en</strong> door lijn<strong>en</strong> met de doos verbond<strong>en</strong>.<br />

Om de kwartielgetall<strong>en</strong> te kunn<strong>en</strong> bepal<strong>en</strong> moet<strong>en</strong> we de data eerst ord<strong>en</strong><strong>en</strong>!<br />

Groep A (Niet-gebruikers):<br />

92 96 98<br />

100 100 102 102 104 105 106 106 108 108<br />

110 112 112 112 112 114 114 115 116 116 116 118 118 118 119<br />

120 120 120 121 122 122 124 124 125 126 126 128<br />

130 131 132 132 134 136 136<br />

140 146<br />

Groep B (Gebruikers):<br />

90 96 98<br />

102 102 105 106 108 108 109<br />

110 112 112 114 114 115 115 116 116 118 118 118<br />

120 120 120 121 122 122 124 124 125 125 126 126 128 128<br />

130 130 131 131 132 132 134 134 136 136 138<br />

141 142<br />

152<br />

6


Groep A Groep B<br />

M 118 120+121 = 120, 5<br />

K1 108<br />

2<br />

112<br />

K3 125+0,25(126-125)=125,25 130+0,25(131-130)=130,25<br />

Y50 146 152<br />

Y1 92 90<br />

6.7. Het Effect van e<strong>en</strong> vegetarisch dieet op het serum-cholesterolgehalte.<br />

E<strong>en</strong> steekproef van 24 hospitaalbedi<strong>en</strong>d<strong>en</strong> die e<strong>en</strong> standaard dieet volgd<strong>en</strong> verklaard<strong>en</strong><br />

zich akkoord om gedur<strong>en</strong>de 1 maand over te schakel<strong>en</strong> op e<strong>en</strong> vegetarisch dieet.<br />

Hun serum-cholesterolgehalte werd gemet<strong>en</strong> aan het begin van het vegetarisch dieet <strong>en</strong> 1<br />

maand later.<br />

(i) Berek<strong>en</strong> de gemiddelde verandering in cholesterolgehalte.<br />

(ii) Berek<strong>en</strong> de standaardafwijking van de verandering in cholesterolgehalte.<br />

(iii) Berek<strong>en</strong> de mediaan van de verandering in cholesterol.<br />

(iv) Construeer e<strong>en</strong> box-plot voor de colesterol verandering<strong>en</strong>.<br />

(v) Geef comm<strong>en</strong>taar over de symmetrie van de verdeling van de cholesterol verandering<strong>en</strong>.<br />

(vi) Sommige onderzoekers hebb<strong>en</strong> het gevoel dat het effect van e<strong>en</strong> dieet op cholesterolgehalte<br />

meer uitgesprok<strong>en</strong> is bij person<strong>en</strong> met e<strong>en</strong> hoog cholesterolgehalte. Splits de<br />

data op naargelang het basis cholesterolgehalte bov<strong>en</strong> of onder de mediaan ligt <strong>en</strong><br />

geef comm<strong>en</strong>taar op de bewering.<br />

7


Oplossing:<br />

(i) Gemiddelde :19,542<br />

(ii) Standaardafwijking:<br />

Variantie: <br />

Persoon Voor Na Voor-na<br />

1 195 146 49<br />

2 145 155 -10<br />

3 205 178 27<br />

4 159 146 13<br />

5 244 208 36<br />

6 166 147 19<br />

7 250 202 48<br />

8 236 215 21<br />

9 192 184 8<br />

10 224 208 16<br />

11 238 206 32<br />

12 197 169 28<br />

13 169 182 -13<br />

14 158 127 31<br />

15 151 149 2<br />

16 197 178 19<br />

17 180 161 19<br />

18 222 187 35<br />

19 168 176 -8<br />

20 168 145 23<br />

21 167 154 13<br />

22 161 153 8<br />

23 178 137 41<br />

24 137 125 12<br />

i<br />

x 2 i = 15661<br />

n x 2 = 9165, 042<br />

1<br />

1<br />

(15661 − 9165, 042) = (6496) = 282, 4<br />

n − 1 23<br />

Dus is de standaardafwijking:<br />

16, 8057<br />

(iii) Geord<strong>en</strong>de observaties:<br />

Mediaan: 19<br />

−13 − 10 − 8<br />

2 8 8<br />

12 13 13 16 19 19 19<br />

21 23 27 28<br />

31 32 35 36<br />

8<br />

41 48 49


(iv) Box-plot:<br />

K1 = 8 + 0, 25 × 4 = 9<br />

K2 = 31, 75<br />

Y24 = 49<br />

Y1 = −13<br />

(v) Geef comm<strong>en</strong>taar over de symmetrie van de verdeling van de cholesterol verandering<strong>en</strong>.<br />

Rechts is er e<strong>en</strong> iets grotere spreiding in de box.<br />

Links is de spreiding kleiner.<br />

(vi) Sommige onderzoekers hebb<strong>en</strong> het gevoel dat het effect van e<strong>en</strong> dieet op cholesterolgehalte<br />

meer uitgesprok<strong>en</strong> is bij person<strong>en</strong> met e<strong>en</strong> hoog cholesterolgehalte. Splits de<br />

data op naargelang het basis cholesterolgehalte bov<strong>en</strong> of onder de mediaan ligt <strong>en</strong><br />

geef comm<strong>en</strong>taar op de bewering.<br />

Mediaan van het basischolesterolgehalte: 179<br />

Dus we splits<strong>en</strong> de data op in twee groep<strong>en</strong>:<br />

– Groep 1: alle person<strong>en</strong> met cholesterolgehalte ¡ 179<br />

– Groep 2: alle person<strong>en</strong> met cholesterolgehalte ¿ 179<br />

Voor elk van de twee groep<strong>en</strong> berek<strong>en</strong><strong>en</strong> we de k<strong>en</strong>getall<strong>en</strong> om e<strong>en</strong> boxplot te kunn<strong>en</strong><br />

tek<strong>en</strong><strong>en</strong>:<br />

Let op berek<strong>en</strong> de k<strong>en</strong>getall<strong>en</strong> op basis van de verandering in cholesterolgehalte!<br />

M<br />

K1<br />

K3<br />

Y12<br />

Y1<br />

Groep 1 Groep 2<br />

We zi<strong>en</strong> dan dat het gevoel van de onderzoekers juist is.<br />

9

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!