(Microsoft PowerPoint - Pr\346sentation1) - Aarhus Universitet
(Microsoft PowerPoint - Pr\346sentation1) - Aarhus Universitet
(Microsoft PowerPoint - Pr\346sentation1) - Aarhus Universitet
Transform your PDFs into Flipbooks and boost your revenue!
Leverage SEO-optimized Flipbooks, powerful backlinks, and multimedia content to professionally showcase your products and significantly increase your reach.
AARHUS<br />
UNIVERSITET<br />
Maja Tarp<br />
AARHUS UNIVERSITET
HVEM ER JEG<br />
Maja Tarp, 24 år<br />
• Folkeskole i Ulsted i Nordjylland<br />
• Student år 2005 fra Dronninglund<br />
Gymnasium<br />
• Efter gymnasiet:<br />
• Militæret<br />
• Australien<br />
• Startede på matematik på <strong>Aarhus</strong><br />
<strong>Universitet</strong> i 2007<br />
• Sommeren 2010:<br />
BSc i matematik<br />
• Nu:<br />
Stud.cand.scient i statistik
STUDIERNES OPBYGNING<br />
Her er jeg
HVORDAN SER EN UGE UD
JOBMULIGHEDER<br />
Private erhvervsliv – et hav af<br />
muligheder:<br />
• Handel<br />
• Banker<br />
• Konsulent- og rådgivningsvirksomhed<br />
• Medicinalindustri<br />
• Sundhed<br />
Forskning:<br />
• <strong>Universitet</strong>er<br />
• Interesseorganisationer<br />
• Private virksomheder<br />
Undervisning:<br />
• Gymnasier<br />
• Handelsskoler<br />
• Seminarer<br />
Ikke Gallup!
Hvorfor statistik<br />
• Kan ”forudsige” fremtiden<br />
• Kan bruges som beslutningsgrundlag:<br />
• Politik<br />
• Aktiekurser<br />
• Medicinske forsøg<br />
• Risikovurdering<br />
• Spilteori
Statistik og virkeligheden<br />
• I perioden 1960-1970 faldt antallet af fødsler samtidig<br />
med at antallet af storkepar i Danmark faldt.<br />
• Drukneulykker og issalg hænger sammen: Når der<br />
sælges mange is, er der mange der drukner!<br />
• Bør der investeres mere i rynkecreme Der er en<br />
overdødelighed blandt folk med rynker!
Normalfordeling
Normalfordeling<br />
• Måske den vigtigste fordeling<br />
overhovedet.<br />
• Har toppunkt i sin middelværdi, og<br />
er symmetrisk fordelt her<br />
omkring.<br />
• Model for hvordan et stort antal<br />
statistiske elementer fordeler sig<br />
omkring deres middelværdi.
Eksempler<br />
• Højde, vægt<br />
• Kvalitetstest<br />
• Blodtryksændring<br />
• IQ
En normalfordelt observation<br />
Vi vil nu betragte en normalfordelt stokastisk variabel:<br />
X<br />
~ N(<br />
µ ; σ )<br />
Hvor µ er middelværdien og σ er standardafvigelsen. Gælder der:<br />
X<br />
~ N(0;1)<br />
siges X at være standardnormalfordelt.
En normalfordelt observation<br />
Vi betragter altså<br />
X<br />
~ N(<br />
µ ; σ )<br />
x<br />
Vi beregner ofte som er det bedste gæt på den sande værdi af .<br />
µ<br />
2<br />
Og som er det bedste gæt man kan komme på den sande værdi af<br />
.<br />
s<br />
σ
Normalfordelingen, grafisk<br />
• Den normerede normalfordeling, dvs.<br />
X<br />
~ N(0;1)<br />
• Grafen viser tæthedsfunktionen.<br />
• Areal = 1
Normalfordelingen, grafisk<br />
• En tilsvarende graf kan laves for enhver<br />
normalfordeling<br />
X<br />
• Samme form som før, blot anden<br />
placering.<br />
• Arealet stadig 1.<br />
~ N(<br />
µ ; σ )
Fordelingsfunktionen<br />
Lad X være en standardnormalfordelt stokastisk variabel.<br />
Fordelingsfunktionen Φ(x) angiver sandsynligheden for, at X er mindre<br />
end et tal x, dvs<br />
Φ(x) = Sandsynlighed for X≤x<br />
Dvs. at Φ(x) er en voksende funktion, med værdier mellem 0 og 1.
Eksempler: Fordelingsfunktionen<br />
Vi betragter<br />
X<br />
~ N(30;4)<br />
altså hvor middelværdien er 30 og spredningen 4.<br />
Bestem fordelingsfunktinen. Dvs.<br />
find sandsynligheden for at ≤ x<br />
To metoder: Antag x=33.<br />
• Bestem sandsynligheden som arealet<br />
under grafen for tæthedsfunktionen fra<br />
- til 33.<br />
∞<br />
• Bestem fordelingsfunktionens værdi i 33.
Eksempel: Fluer og gift<br />
16 fluer udsættes for nervegift, der måles hvor lang tid der går, før<br />
fluerne besvimer.
16<br />
15<br />
14<br />
13<br />
12<br />
11<br />
10<br />
9<br />
8<br />
7<br />
6<br />
5<br />
4<br />
3<br />
2<br />
1<br />
Flue nummer i<br />
1.86<br />
4.9<br />
140<br />
1.32<br />
4.1<br />
58<br />
1.01<br />
3.8<br />
46<br />
0.78<br />
3.8<br />
43<br />
0.58<br />
3.5<br />
34<br />
0.40<br />
3.2<br />
24<br />
0.24<br />
3.2<br />
24<br />
0.08<br />
3.0<br />
20<br />
-0.08<br />
2.5<br />
12<br />
-0.24<br />
2.3<br />
10<br />
-0.40<br />
2.2<br />
9<br />
-0.58<br />
2.2<br />
9<br />
-0.78<br />
1.9<br />
7<br />
-1.01<br />
1.6<br />
5<br />
-1.32<br />
1.6<br />
5<br />
-1.86<br />
1.1<br />
3<br />
Φ^(-1) ((i-0.5)/16)<br />
Ln(tid)<br />
Tid
N(0,1)-fraktil<br />
-2 -1 0 1 2<br />
0 20 40 60 80 100 120 140<br />
tid<br />
Hvis vores målinger er normalfordelte forventer vi at kunne indtegne dem<br />
som en ret linje i fraktilplottet. Dette er ikke tilfældet, men målingerne ser ud<br />
til at de kunne være logaritme fordelt. Derfor tages logaritmen til tiden og vi<br />
indtegner igen.
N(0,1)-fraktil<br />
-2 -1 0 1 2<br />
1 2 3 4 5<br />
Målingerne ligger om en pæn ret linje, hvorfor vi kan antage, at logaritmen til<br />
tiden er normalfordelt. Dvs. vi betragter modellen:<br />
X<br />
lntid<br />
~ N(<br />
µ ; σ )
Vi beregner efterfølgende skøn for standardafvigelsen og middelværdien vha.<br />
formlerne:<br />
S<br />
x<br />
=<br />
=<br />
USS<br />
s<br />
=<br />
n<br />
∑<br />
i=<br />
1<br />
1<br />
S<br />
n<br />
=<br />
x<br />
i<br />
=<br />
n<br />
∑<br />
i=<br />
1<br />
= (1.1 + 1.6 + ... + 4.9) =<br />
1<br />
16<br />
x<br />
2<br />
i<br />
44.9<br />
= 1.1<br />
1<br />
( USS −<br />
n −1<br />
=<br />
2<br />
2.81<br />
+ 1.6<br />
S<br />
n<br />
2<br />
)<br />
=<br />
2<br />
+ ... + 4.9<br />
1<br />
15<br />
44.9<br />
2<br />
(142.6 −<br />
= 142.6<br />
44.9<br />
16<br />
2<br />
)<br />
= 1.05
En lille gåde…<br />
4 mexicanere har stjålet en ged, og er derfor blevet dømt til døden, og<br />
skal skydes. De får dog en chance for at redde deres liv. De er hver<br />
blevet udstyret med en mexicaner hat, og der er 2 hvide og 2 sorte<br />
hatte. De skal nu blot besvare følgende spørgsmål:<br />
Hvilken farve hat har du selv på<br />
Hvilke(n) af de 4 mexicanere kan fortælle<br />
hvilken farve hat han selv har på
Gåden…<br />
Situationer:<br />
1.<br />
2.<br />
3.
Eksempel: Læseevner<br />
Der betragtes to 3. klasser. Den ene klasse modtager ekstra<br />
læsetræning, mens den anden klasse er en kontrolklasse med<br />
almindelig læseundervisning. Efter 8 uger får eleverne en læsetest.<br />
Klasse<br />
Træning<br />
Testresultat<br />
24 43 71 58 43 49 61 44 67 49 53 56 59 52 62 54<br />
57 33 46 43 57<br />
Kontrol<br />
42 43 55 26 62 37 33 41 19 54 20 85 46 10 17 60<br />
53 42 37 42 55 28 48
Fraktilplots viser at målinger i hver klasse kan beskrives med en<br />
normalfordeling, dvs:<br />
X<br />
træning<br />
~<br />
N<br />
( µ<br />
træning<br />
; σ<br />
træning<br />
)<br />
.<br />
X<br />
kontrol<br />
~<br />
N<br />
( µ<br />
kontrol<br />
; σ<br />
kontrol<br />
)<br />
Vi ønsker nu at finde estimater for middelværdi og standardafvigelse i hver<br />
af de to klasser.
Først beregnes:<br />
46123<br />
48<br />
...<br />
43<br />
42<br />
58069<br />
57<br />
...<br />
43<br />
24<br />
955<br />
48)<br />
...<br />
43<br />
(42<br />
1081<br />
57)<br />
...<br />
43<br />
(24<br />
2<br />
2<br />
2<br />
1<br />
2<br />
2<br />
2<br />
2<br />
1<br />
2<br />
1<br />
1<br />
=<br />
+<br />
+<br />
+<br />
=<br />
=<br />
=<br />
+<br />
+<br />
+<br />
=<br />
=<br />
=<br />
+<br />
+<br />
+<br />
=<br />
=<br />
=<br />
+<br />
+<br />
+<br />
=<br />
=<br />
∑<br />
∑<br />
∑<br />
∑<br />
=<br />
=<br />
=<br />
=<br />
n<br />
i<br />
i<br />
kontrol<br />
n<br />
i<br />
i<br />
træning<br />
n<br />
i<br />
i<br />
kontrol<br />
n<br />
i<br />
i<br />
træning<br />
x<br />
USS<br />
x<br />
USS<br />
x<br />
S<br />
x<br />
S
46123<br />
955<br />
23<br />
Kontrol<br />
58069<br />
1081<br />
21<br />
Træning<br />
USS<br />
S<br />
n<br />
Klasse<br />
17.1<br />
)<br />
23<br />
955<br />
(46123<br />
22<br />
1<br />
)<br />
(<br />
1<br />
1<br />
11.0<br />
)<br />
21<br />
1081<br />
(58069<br />
20<br />
1<br />
)<br />
(<br />
1<br />
1<br />
41.5<br />
955<br />
23<br />
1<br />
1<br />
51.5<br />
1081<br />
21<br />
1<br />
1<br />
2<br />
2<br />
2<br />
2<br />
=<br />
−<br />
=<br />
−<br />
−<br />
=<br />
=<br />
−<br />
=<br />
−<br />
−<br />
=<br />
=<br />
=<br />
=<br />
=<br />
=<br />
=<br />
n<br />
S<br />
USS<br />
n<br />
s<br />
n<br />
S<br />
USS<br />
n<br />
s<br />
S<br />
n<br />
x<br />
S<br />
n<br />
x<br />
kontrol<br />
træning<br />
kontrol<br />
træning
Vi ønsker nu at teste hypotesen<br />
H<br />
:σ = σ<br />
træning<br />
kontrol<br />
altså et test for samme standardafvigelse i de to klasser.<br />
Dette gøres ved teststørrelsen:<br />
F<br />
=<br />
s<br />
s<br />
2<br />
træning<br />
2<br />
kontrol<br />
=<br />
11.0<br />
17.1<br />
2<br />
2<br />
=<br />
0.41 ~<br />
F(<br />
f<br />
1<br />
,<br />
f<br />
2<br />
)<br />
=<br />
F(21−1,23−1)<br />
=<br />
F(20,22)<br />
P<br />
obs<br />
( x)<br />
=<br />
2(1 −<br />
F<br />
F ( f<br />
, )(<br />
)) 2(1<br />
(20,22)(0.41))<br />
1 f<br />
F = − F<br />
=<br />
2<br />
F<br />
0.057
Da p-værdien er større end 5 % accepterer vi hypotesen, dvs vi har modellen:<br />
X<br />
X<br />
træning<br />
kontrol<br />
~<br />
~<br />
N(<br />
µ<br />
N(<br />
µ<br />
træning<br />
kontrol<br />
; σ )<br />
; σ )<br />
Den fælles standardafvigelse kan estimeres ved:<br />
s<br />
=<br />
f<br />
træning<br />
s<br />
f<br />
2<br />
træning<br />
træning<br />
+<br />
+<br />
f<br />
f<br />
kontrol<br />
kontrol<br />
s<br />
2<br />
kontrol<br />
=<br />
20<br />
⋅110<br />
2<br />
20<br />
+ 22 ⋅17.1<br />
+ 22<br />
2<br />
=<br />
14.6
Vi ønsker nu at teste hypotesen<br />
H : µ = µ<br />
træning<br />
kontrol<br />
altså et test for samme middelværdi i de to klasser. Dvs. et test for om den<br />
ekstra læsetræning har en effekt.
Dette gøres ved teststørrelsen:<br />
0.027<br />
(2.27))<br />
2(1<br />
) ))<br />
(<br />
(<br />
2(1<br />
)<br />
(<br />
(42)<br />
2)<br />
(<br />
)<br />
(<br />
~<br />
2.27<br />
)<br />
23<br />
1<br />
21<br />
1<br />
(<br />
14.6<br />
41.5<br />
51.5<br />
)<br />
1<br />
1<br />
(<br />
)<br />
(<br />
(42)<br />
)<br />
(<br />
2<br />
2<br />
=<br />
−<br />
=<br />
−<br />
=<br />
=<br />
−<br />
+<br />
=<br />
=<br />
+<br />
−<br />
=<br />
+<br />
−<br />
=<br />
t<br />
f<br />
t<br />
obs<br />
kontrol<br />
træning<br />
kontrol<br />
træning<br />
kontrol<br />
træning<br />
F<br />
x<br />
t<br />
F<br />
x<br />
P<br />
t<br />
n<br />
n<br />
t<br />
f<br />
t<br />
n<br />
n<br />
s<br />
x<br />
x<br />
x<br />
t
Da p-værdien er mindre end 5 % forkaster vi hypotesen om ens<br />
middelværdier. Dvs den ekstra læsetræning har en effekt.<br />
Da vi kun lige nøjagtig fik accept af hypotesen om ens standardafvigelser,<br />
ønsker vi også at teste hypotesen om ens middelværdier i modellen med<br />
forskellige standardafvigelser:<br />
X<br />
X<br />
træning<br />
kontrol<br />
~<br />
~<br />
N(<br />
µ<br />
N(<br />
µ<br />
træning<br />
kontrol<br />
; σ<br />
; σ<br />
træning<br />
kontrol<br />
)<br />
)
37.9<br />
1)<br />
/(23<br />
)<br />
23<br />
17.1<br />
(<br />
1)<br />
/(21<br />
)<br />
21<br />
110<br />
(<br />
)<br />
23<br />
17.1<br />
21<br />
110<br />
(<br />
1)<br />
/(<br />
)<br />
(<br />
1)<br />
/(<br />
)<br />
(<br />
)<br />
(<br />
~<br />
)<br />
~<br />
(<br />
2.31 ~<br />
23<br />
17.1<br />
21<br />
110<br />
41.5<br />
51.5<br />
)<br />
(<br />
:<br />
2<br />
2<br />
2<br />
2<br />
2<br />
2<br />
2<br />
2<br />
2<br />
2<br />
2<br />
2<br />
2<br />
2<br />
2<br />
2<br />
2<br />
2<br />
=<br />
−<br />
+<br />
−<br />
+<br />
=<br />
−<br />
+<br />
−<br />
+<br />
=<br />
=<br />
+<br />
−<br />
=<br />
+<br />
−<br />
=<br />
=<br />
kontrol<br />
kontrol<br />
kontrol<br />
træning<br />
træning<br />
træning<br />
kontrol<br />
kontrol<br />
træning<br />
træning<br />
kontrol<br />
kontrol<br />
træning<br />
træning<br />
kontrol<br />
træning<br />
kontrol<br />
træning<br />
n<br />
n<br />
s<br />
n<br />
n<br />
s<br />
n<br />
s<br />
n<br />
s<br />
f<br />
f<br />
t<br />
n<br />
s<br />
n<br />
s<br />
x<br />
x<br />
x<br />
t<br />
H µ<br />
µ<br />
Dvs. vi tester hypotesen:
P<br />
obs<br />
( x)<br />
= 2(1 − F ~ ( t(<br />
x)<br />
)) = 2(1 − F<br />
(37.9)<br />
(2.31)) =<br />
t ( f )<br />
t<br />
0.026<br />
Dvs. vi også får forkastelse af hypotesen om ens middelværdier i denne<br />
model.<br />
Konklusionen bliver altså i dette tilfælde det samme, men vi bemærker at<br />
idet vi får to forskellige testværdier, kunne vi godt have fået accept i den<br />
ene model frem for den anden.
Eksempel: Allergiske reaktioner<br />
Der betragtes 50 personer med pollenallergi. 23 behandles med en<br />
modgift man vil teste effekten af, mens de resterende 27 får et<br />
medikament, man ved ikke har nogen effekt (placebo). Vi betragter<br />
modellen:<br />
X<br />
mod gift<br />
~ N(<br />
µ<br />
mod gift;<br />
σ<br />
mod gift<br />
)<br />
X<br />
placebo<br />
~<br />
N(<br />
µ<br />
placebo<br />
; σ<br />
placebo<br />
)<br />
Det oplyses at:<br />
Gruppe<br />
n<br />
x<br />
s<br />
Modgift<br />
23<br />
19.5<br />
27.3<br />
Placebo<br />
27<br />
5.4<br />
17.2
Vi vil først teste hypotesen om ens standardafvigelse:<br />
H<br />
: σ<br />
F =<br />
~ F(<br />
P<br />
obs<br />
s<br />
s<br />
1<br />
( x)<br />
= 2(1 −<br />
mod gift<br />
2<br />
mod gift<br />
f<br />
2<br />
placebo<br />
,<br />
f<br />
=<br />
F<br />
2<br />
= σ<br />
=<br />
27.3<br />
17.1<br />
= 2.54<br />
) = F(23<br />
−1,27<br />
−1)<br />
=<br />
2(1 − F<br />
F (22,26)<br />
placebo<br />
2<br />
2<br />
F ( f<br />
1<br />
, f<br />
2<br />
)<br />
( F))<br />
(2.54)) = 0.024<br />
F(22,26)<br />
Dvs vi får forkastelse af hypotesen om ens standardafvigelse.
Havde vi fået accept af hypotesen om ens standardafvigelser ville vi et 95%<br />
konfidensinterval for forskellen mellem middelværdierne være:<br />
2 1 1<br />
2 1 1<br />
x<br />
1<br />
− x2<br />
− s ( + ) t0.975(<br />
f ) ≤ µ<br />
1<br />
− µ<br />
2<br />
≤ x1<br />
− x2<br />
+ s ( + ) t0.<br />
975(<br />
f )<br />
n n<br />
n n<br />
1<br />
2<br />
Når standardafvigelserne ikke er ens bliver konfidensintervallet i stedet:<br />
1<br />
2<br />
x<br />
mod gift<br />
2<br />
2<br />
smod<br />
gift<br />
s<br />
placebo<br />
− x<br />
t (<br />
~<br />
placebo − +<br />
0.975<br />
f ) ≤ µ<br />
mod gift<br />
− µ<br />
n n<br />
mod gift<br />
placebo<br />
placebo<br />
≤<br />
x<br />
mod gift<br />
−<br />
x<br />
placebo<br />
+<br />
s<br />
n<br />
2<br />
mod gift<br />
mod gift<br />
+<br />
s<br />
n<br />
2<br />
placebo<br />
placebo<br />
t<br />
0.975<br />
(<br />
~ f )
35.8<br />
1)<br />
/(27<br />
)<br />
27<br />
17.1<br />
(<br />
1)<br />
/(23<br />
)<br />
23<br />
27.3<br />
(<br />
)<br />
27<br />
17.1<br />
23<br />
27.3<br />
(<br />
1)<br />
/(<br />
)<br />
(<br />
1)<br />
/(<br />
)<br />
(<br />
)<br />
(<br />
~<br />
2<br />
2<br />
2<br />
2<br />
2<br />
2<br />
2<br />
2<br />
2<br />
mod<br />
2<br />
mod<br />
2<br />
mod<br />
2<br />
2<br />
mod<br />
2<br />
mod<br />
=<br />
−<br />
+<br />
−<br />
+<br />
=<br />
−<br />
+<br />
−<br />
+<br />
=<br />
placebo<br />
placebo<br />
placebo<br />
gift<br />
gift<br />
gift<br />
placebo<br />
placebo<br />
gift<br />
gift<br />
n<br />
n<br />
s<br />
n<br />
n<br />
s<br />
n<br />
s<br />
n<br />
s<br />
f<br />
Vi bestemmer først:
Hvormed et 95% konfidensinterval for forskellen mellem middelværdierne<br />
er givet ved:<br />
27.3 −17.1−<br />
27.3<br />
23<br />
2<br />
17.1<br />
+<br />
27<br />
2<br />
2.03 ≤ µ<br />
mod gift<br />
− µ<br />
placebo<br />
≤<br />
27.3−17.1−<br />
27.3<br />
23<br />
2<br />
17.1<br />
+<br />
27<br />
2<br />
2.03<br />
⇒<br />
0.77<br />
≤ µ<br />
mod gift<br />
− µ<br />
placebo<br />
≤ 27.5<br />
Vi bemærker, at 0 ikke ligger i konfidensintervallet.
Vi ønsker til slut at teste om de to middelværdier kan antages at være ens:<br />
H : µ = µ<br />
mod gift<br />
xmod<br />
gift − x<br />
t(<br />
x)<br />
=<br />
2<br />
smod<br />
gift<br />
s<br />
+<br />
nmod<br />
gift<br />
n<br />
~ t(<br />
~ f ) = t(35.8)<br />
P<br />
obs<br />
( x)<br />
= 2(1 − F<br />
placebo<br />
t(<br />
~ f )<br />
placebo<br />
2<br />
placebo<br />
placebo<br />
( t(<br />
x) ))<br />
=<br />
=<br />
19.5 − 5.4<br />
= 2.14<br />
2 2<br />
27.3 17.1<br />
+<br />
23 27<br />
2(1 − F (2.14)) = 0.038<br />
t(35.8)<br />
Det vil sige vi forkaster hypotesen. Det er i overensstemmelse med 0 ikke<br />
er i konfidensintervallet fra før og betyder behandlingen har en effekt.
Hvorfor er det godt<br />
at kunne<br />
sin statistik
TV-quiz<br />
Antag, at du medvirker i et tv-program, og du får givet<br />
muligheden for at vælge mellem tre døre:<br />
Bag en af dørene er der en bil;<br />
bag de to andre en ged.<br />
Du vælger en dør, lad os sige nr. 1, og tv-værten,<br />
som ved, hvad der er bag dørene, åbner en anden dør,<br />
lad os sige nr. 3, bag hvilken der befinder sig en ged.<br />
Han spørger dig nu:<br />
"Vil du hellere vælge dør nr. 2"<br />
Er det nu en fordel af vælge om
Sandsynligheden for at man vælger døren med bilen ved det første valg er<br />
1/3, hvilket også vil være chancen for at vinde bilen, hvis man holder fast<br />
på sit første valg.<br />
På den anden side er sandsynligheden for at vælge en dør, som skjuler en<br />
ged 2/3, og en spiller, som oprindeligt har valgt en ged, vinder bilen ved at<br />
vælge om.
Vi har altså 3 mulige udfald<br />
1.<br />
2.<br />
3.
I to ud af tre tilfælde kan det betale sig at skifte dør, og i et ud af tre<br />
tilfælde kan det ikke betale sig.<br />
Ens chance for at vinde fordobles altså ved at vælge om, når spilstyreren<br />
tilbyder det.<br />
Løsningen ville være anderledes, hvis tv-værten ikke vidste, hvad der var<br />
gemt bag de forskellige døre, eller hvis tv-værten havde muligheden for<br />
ikke at tilbyde spilleren at vælge om.
Er mænd klogere end kvinder
Professor i psykologi ved <strong>Aarhus</strong> <strong>Universitet</strong>, Helmuth Nyborg påstod at<br />
have opdaget mænd gennemsnitligt er 27 % klogere end kvinder.<br />
Senere opdagede han en regnefejl, så forskellen kun var 5 %...<br />
Men kan dette resultat være rigtigt
Problemer med Nyborgs resultat:<br />
- Lille datamateriale (52 personer)<br />
- Hvordan er disse udvalgt<br />
- Hvordan måles intelligensen<br />
- Statistisk metode
Nyborg modellerede hvert køns intelligens ved en normalfordeling.<br />
Han anvendte et test, der ikke gav mulighed for kvinder kunne være<br />
klogere end mænd.<br />
Havde han i stedet anvendt et ganske almindeligt t-test for at<br />
middelværdien var den samme i de to grupper (de to køn), ville han have<br />
fået accept.<br />
Men der er flere problemer…
Nyborg hævdede:<br />
”for hver kvinde med en IQ på over 145 vil der være 122 mænd”<br />
Er Nyborgs 52 testpersoner repræsentative (og ellers giver undersøgelsen<br />
ingen mening!) må de fleste ligge nær middelværdien.<br />
Et så lille datasæt kan derfor ikke sige noget om hvordan fordelingen er i de<br />
mere ekstreme tilfælde.
”Statistiker på prøve”<br />
• Ansat ved Klinisk Epidemiologisk Afdeling (KEA)<br />
• Undersøge patient-populationers prognose<br />
• Adgang til:<br />
• CPR-registret<br />
• Receptdatabase<br />
• Operationsdatabase<br />
• Cancerregister<br />
• Fødsels- og dødsregister
”Statistiker på prøve”<br />
• Immunforsvarets rolle i forbindelse med brystkræft-recidiv<br />
• Herpes Zoster og kræft
•Spørgsmål og kommentarer<br />
•Tak for i dag