08.01.2015 Views

(Microsoft PowerPoint - Pr\346sentation1) - Aarhus Universitet

(Microsoft PowerPoint - Pr\346sentation1) - Aarhus Universitet

(Microsoft PowerPoint - Pr\346sentation1) - Aarhus Universitet

SHOW MORE
SHOW LESS

Transform your PDFs into Flipbooks and boost your revenue!

Leverage SEO-optimized Flipbooks, powerful backlinks, and multimedia content to professionally showcase your products and significantly increase your reach.

AARHUS<br />

UNIVERSITET<br />

Maja Tarp<br />

AARHUS UNIVERSITET


HVEM ER JEG<br />

Maja Tarp, 24 år<br />

• Folkeskole i Ulsted i Nordjylland<br />

• Student år 2005 fra Dronninglund<br />

Gymnasium<br />

• Efter gymnasiet:<br />

• Militæret<br />

• Australien<br />

• Startede på matematik på <strong>Aarhus</strong><br />

<strong>Universitet</strong> i 2007<br />

• Sommeren 2010:<br />

BSc i matematik<br />

• Nu:<br />

Stud.cand.scient i statistik


STUDIERNES OPBYGNING<br />

Her er jeg


HVORDAN SER EN UGE UD


JOBMULIGHEDER<br />

Private erhvervsliv – et hav af<br />

muligheder:<br />

• Handel<br />

• Banker<br />

• Konsulent- og rådgivningsvirksomhed<br />

• Medicinalindustri<br />

• Sundhed<br />

Forskning:<br />

• <strong>Universitet</strong>er<br />

• Interesseorganisationer<br />

• Private virksomheder<br />

Undervisning:<br />

• Gymnasier<br />

• Handelsskoler<br />

• Seminarer<br />

Ikke Gallup!


Hvorfor statistik<br />

• Kan ”forudsige” fremtiden<br />

• Kan bruges som beslutningsgrundlag:<br />

• Politik<br />

• Aktiekurser<br />

• Medicinske forsøg<br />

• Risikovurdering<br />

• Spilteori


Statistik og virkeligheden<br />

• I perioden 1960-1970 faldt antallet af fødsler samtidig<br />

med at antallet af storkepar i Danmark faldt.<br />

• Drukneulykker og issalg hænger sammen: Når der<br />

sælges mange is, er der mange der drukner!<br />

• Bør der investeres mere i rynkecreme Der er en<br />

overdødelighed blandt folk med rynker!


Normalfordeling


Normalfordeling<br />

• Måske den vigtigste fordeling<br />

overhovedet.<br />

• Har toppunkt i sin middelværdi, og<br />

er symmetrisk fordelt her<br />

omkring.<br />

• Model for hvordan et stort antal<br />

statistiske elementer fordeler sig<br />

omkring deres middelværdi.


Eksempler<br />

• Højde, vægt<br />

• Kvalitetstest<br />

• Blodtryksændring<br />

• IQ


En normalfordelt observation<br />

Vi vil nu betragte en normalfordelt stokastisk variabel:<br />

X<br />

~ N(<br />

µ ; σ )<br />

Hvor µ er middelværdien og σ er standardafvigelsen. Gælder der:<br />

X<br />

~ N(0;1)<br />

siges X at være standardnormalfordelt.


En normalfordelt observation<br />

Vi betragter altså<br />

X<br />

~ N(<br />

µ ; σ )<br />

x<br />

Vi beregner ofte som er det bedste gæt på den sande værdi af .<br />

µ<br />

2<br />

Og som er det bedste gæt man kan komme på den sande værdi af<br />

.<br />

s<br />

σ


Normalfordelingen, grafisk<br />

• Den normerede normalfordeling, dvs.<br />

X<br />

~ N(0;1)<br />

• Grafen viser tæthedsfunktionen.<br />

• Areal = 1


Normalfordelingen, grafisk<br />

• En tilsvarende graf kan laves for enhver<br />

normalfordeling<br />

X<br />

• Samme form som før, blot anden<br />

placering.<br />

• Arealet stadig 1.<br />

~ N(<br />

µ ; σ )


Fordelingsfunktionen<br />

Lad X være en standardnormalfordelt stokastisk variabel.<br />

Fordelingsfunktionen Φ(x) angiver sandsynligheden for, at X er mindre<br />

end et tal x, dvs<br />

Φ(x) = Sandsynlighed for X≤x<br />

Dvs. at Φ(x) er en voksende funktion, med værdier mellem 0 og 1.


Eksempler: Fordelingsfunktionen<br />

Vi betragter<br />

X<br />

~ N(30;4)<br />

altså hvor middelværdien er 30 og spredningen 4.<br />

Bestem fordelingsfunktinen. Dvs.<br />

find sandsynligheden for at ≤ x<br />

To metoder: Antag x=33.<br />

• Bestem sandsynligheden som arealet<br />

under grafen for tæthedsfunktionen fra<br />

- til 33.<br />

∞<br />

• Bestem fordelingsfunktionens værdi i 33.


Eksempel: Fluer og gift<br />

16 fluer udsættes for nervegift, der måles hvor lang tid der går, før<br />

fluerne besvimer.


16<br />

15<br />

14<br />

13<br />

12<br />

11<br />

10<br />

9<br />

8<br />

7<br />

6<br />

5<br />

4<br />

3<br />

2<br />

1<br />

Flue nummer i<br />

1.86<br />

4.9<br />

140<br />

1.32<br />

4.1<br />

58<br />

1.01<br />

3.8<br />

46<br />

0.78<br />

3.8<br />

43<br />

0.58<br />

3.5<br />

34<br />

0.40<br />

3.2<br />

24<br />

0.24<br />

3.2<br />

24<br />

0.08<br />

3.0<br />

20<br />

-0.08<br />

2.5<br />

12<br />

-0.24<br />

2.3<br />

10<br />

-0.40<br />

2.2<br />

9<br />

-0.58<br />

2.2<br />

9<br />

-0.78<br />

1.9<br />

7<br />

-1.01<br />

1.6<br />

5<br />

-1.32<br />

1.6<br />

5<br />

-1.86<br />

1.1<br />

3<br />

Φ^(-1) ((i-0.5)/16)<br />

Ln(tid)<br />

Tid


N(0,1)-fraktil<br />

-2 -1 0 1 2<br />

0 20 40 60 80 100 120 140<br />

tid<br />

Hvis vores målinger er normalfordelte forventer vi at kunne indtegne dem<br />

som en ret linje i fraktilplottet. Dette er ikke tilfældet, men målingerne ser ud<br />

til at de kunne være logaritme fordelt. Derfor tages logaritmen til tiden og vi<br />

indtegner igen.


N(0,1)-fraktil<br />

-2 -1 0 1 2<br />

1 2 3 4 5<br />

Målingerne ligger om en pæn ret linje, hvorfor vi kan antage, at logaritmen til<br />

tiden er normalfordelt. Dvs. vi betragter modellen:<br />

X<br />

lntid<br />

~ N(<br />

µ ; σ )


Vi beregner efterfølgende skøn for standardafvigelsen og middelværdien vha.<br />

formlerne:<br />

S<br />

x<br />

=<br />

=<br />

USS<br />

s<br />

=<br />

n<br />

∑<br />

i=<br />

1<br />

1<br />

S<br />

n<br />

=<br />

x<br />

i<br />

=<br />

n<br />

∑<br />

i=<br />

1<br />

= (1.1 + 1.6 + ... + 4.9) =<br />

1<br />

16<br />

x<br />

2<br />

i<br />

44.9<br />

= 1.1<br />

1<br />

( USS −<br />

n −1<br />

=<br />

2<br />

2.81<br />

+ 1.6<br />

S<br />

n<br />

2<br />

)<br />

=<br />

2<br />

+ ... + 4.9<br />

1<br />

15<br />

44.9<br />

2<br />

(142.6 −<br />

= 142.6<br />

44.9<br />

16<br />

2<br />

)<br />

= 1.05


En lille gåde…<br />

4 mexicanere har stjålet en ged, og er derfor blevet dømt til døden, og<br />

skal skydes. De får dog en chance for at redde deres liv. De er hver<br />

blevet udstyret med en mexicaner hat, og der er 2 hvide og 2 sorte<br />

hatte. De skal nu blot besvare følgende spørgsmål:<br />

Hvilken farve hat har du selv på<br />

Hvilke(n) af de 4 mexicanere kan fortælle<br />

hvilken farve hat han selv har på


Gåden…<br />

Situationer:<br />

1.<br />

2.<br />

3.


Eksempel: Læseevner<br />

Der betragtes to 3. klasser. Den ene klasse modtager ekstra<br />

læsetræning, mens den anden klasse er en kontrolklasse med<br />

almindelig læseundervisning. Efter 8 uger får eleverne en læsetest.<br />

Klasse<br />

Træning<br />

Testresultat<br />

24 43 71 58 43 49 61 44 67 49 53 56 59 52 62 54<br />

57 33 46 43 57<br />

Kontrol<br />

42 43 55 26 62 37 33 41 19 54 20 85 46 10 17 60<br />

53 42 37 42 55 28 48


Fraktilplots viser at målinger i hver klasse kan beskrives med en<br />

normalfordeling, dvs:<br />

X<br />

træning<br />

~<br />

N<br />

( µ<br />

træning<br />

; σ<br />

træning<br />

)<br />

.<br />

X<br />

kontrol<br />

~<br />

N<br />

( µ<br />

kontrol<br />

; σ<br />

kontrol<br />

)<br />

Vi ønsker nu at finde estimater for middelværdi og standardafvigelse i hver<br />

af de to klasser.


Først beregnes:<br />

46123<br />

48<br />

...<br />

43<br />

42<br />

58069<br />

57<br />

...<br />

43<br />

24<br />

955<br />

48)<br />

...<br />

43<br />

(42<br />

1081<br />

57)<br />

...<br />

43<br />

(24<br />

2<br />

2<br />

2<br />

1<br />

2<br />

2<br />

2<br />

2<br />

1<br />

2<br />

1<br />

1<br />

=<br />

+<br />

+<br />

+<br />

=<br />

=<br />

=<br />

+<br />

+<br />

+<br />

=<br />

=<br />

=<br />

+<br />

+<br />

+<br />

=<br />

=<br />

=<br />

+<br />

+<br />

+<br />

=<br />

=<br />

∑<br />

∑<br />

∑<br />

∑<br />

=<br />

=<br />

=<br />

=<br />

n<br />

i<br />

i<br />

kontrol<br />

n<br />

i<br />

i<br />

træning<br />

n<br />

i<br />

i<br />

kontrol<br />

n<br />

i<br />

i<br />

træning<br />

x<br />

USS<br />

x<br />

USS<br />

x<br />

S<br />

x<br />

S


46123<br />

955<br />

23<br />

Kontrol<br />

58069<br />

1081<br />

21<br />

Træning<br />

USS<br />

S<br />

n<br />

Klasse<br />

17.1<br />

)<br />

23<br />

955<br />

(46123<br />

22<br />

1<br />

)<br />

(<br />

1<br />

1<br />

11.0<br />

)<br />

21<br />

1081<br />

(58069<br />

20<br />

1<br />

)<br />

(<br />

1<br />

1<br />

41.5<br />

955<br />

23<br />

1<br />

1<br />

51.5<br />

1081<br />

21<br />

1<br />

1<br />

2<br />

2<br />

2<br />

2<br />

=<br />

−<br />

=<br />

−<br />

−<br />

=<br />

=<br />

−<br />

=<br />

−<br />

−<br />

=<br />

=<br />

=<br />

=<br />

=<br />

=<br />

=<br />

n<br />

S<br />

USS<br />

n<br />

s<br />

n<br />

S<br />

USS<br />

n<br />

s<br />

S<br />

n<br />

x<br />

S<br />

n<br />

x<br />

kontrol<br />

træning<br />

kontrol<br />

træning


Vi ønsker nu at teste hypotesen<br />

H<br />

:σ = σ<br />

træning<br />

kontrol<br />

altså et test for samme standardafvigelse i de to klasser.<br />

Dette gøres ved teststørrelsen:<br />

F<br />

=<br />

s<br />

s<br />

2<br />

træning<br />

2<br />

kontrol<br />

=<br />

11.0<br />

17.1<br />

2<br />

2<br />

=<br />

0.41 ~<br />

F(<br />

f<br />

1<br />

,<br />

f<br />

2<br />

)<br />

=<br />

F(21−1,23−1)<br />

=<br />

F(20,22)<br />

P<br />

obs<br />

( x)<br />

=<br />

2(1 −<br />

F<br />

F ( f<br />

, )(<br />

)) 2(1<br />

(20,22)(0.41))<br />

1 f<br />

F = − F<br />

=<br />

2<br />

F<br />

0.057


Da p-værdien er større end 5 % accepterer vi hypotesen, dvs vi har modellen:<br />

X<br />

X<br />

træning<br />

kontrol<br />

~<br />

~<br />

N(<br />

µ<br />

N(<br />

µ<br />

træning<br />

kontrol<br />

; σ )<br />

; σ )<br />

Den fælles standardafvigelse kan estimeres ved:<br />

s<br />

=<br />

f<br />

træning<br />

s<br />

f<br />

2<br />

træning<br />

træning<br />

+<br />

+<br />

f<br />

f<br />

kontrol<br />

kontrol<br />

s<br />

2<br />

kontrol<br />

=<br />

20<br />

⋅110<br />

2<br />

20<br />

+ 22 ⋅17.1<br />

+ 22<br />

2<br />

=<br />

14.6


Vi ønsker nu at teste hypotesen<br />

H : µ = µ<br />

træning<br />

kontrol<br />

altså et test for samme middelværdi i de to klasser. Dvs. et test for om den<br />

ekstra læsetræning har en effekt.


Dette gøres ved teststørrelsen:<br />

0.027<br />

(2.27))<br />

2(1<br />

) ))<br />

(<br />

(<br />

2(1<br />

)<br />

(<br />

(42)<br />

2)<br />

(<br />

)<br />

(<br />

~<br />

2.27<br />

)<br />

23<br />

1<br />

21<br />

1<br />

(<br />

14.6<br />

41.5<br />

51.5<br />

)<br />

1<br />

1<br />

(<br />

)<br />

(<br />

(42)<br />

)<br />

(<br />

2<br />

2<br />

=<br />

−<br />

=<br />

−<br />

=<br />

=<br />

−<br />

+<br />

=<br />

=<br />

+<br />

−<br />

=<br />

+<br />

−<br />

=<br />

t<br />

f<br />

t<br />

obs<br />

kontrol<br />

træning<br />

kontrol<br />

træning<br />

kontrol<br />

træning<br />

F<br />

x<br />

t<br />

F<br />

x<br />

P<br />

t<br />

n<br />

n<br />

t<br />

f<br />

t<br />

n<br />

n<br />

s<br />

x<br />

x<br />

x<br />

t


Da p-værdien er mindre end 5 % forkaster vi hypotesen om ens<br />

middelværdier. Dvs den ekstra læsetræning har en effekt.<br />

Da vi kun lige nøjagtig fik accept af hypotesen om ens standardafvigelser,<br />

ønsker vi også at teste hypotesen om ens middelværdier i modellen med<br />

forskellige standardafvigelser:<br />

X<br />

X<br />

træning<br />

kontrol<br />

~<br />

~<br />

N(<br />

µ<br />

N(<br />

µ<br />

træning<br />

kontrol<br />

; σ<br />

; σ<br />

træning<br />

kontrol<br />

)<br />

)


37.9<br />

1)<br />

/(23<br />

)<br />

23<br />

17.1<br />

(<br />

1)<br />

/(21<br />

)<br />

21<br />

110<br />

(<br />

)<br />

23<br />

17.1<br />

21<br />

110<br />

(<br />

1)<br />

/(<br />

)<br />

(<br />

1)<br />

/(<br />

)<br />

(<br />

)<br />

(<br />

~<br />

)<br />

~<br />

(<br />

2.31 ~<br />

23<br />

17.1<br />

21<br />

110<br />

41.5<br />

51.5<br />

)<br />

(<br />

:<br />

2<br />

2<br />

2<br />

2<br />

2<br />

2<br />

2<br />

2<br />

2<br />

2<br />

2<br />

2<br />

2<br />

2<br />

2<br />

2<br />

2<br />

2<br />

=<br />

−<br />

+<br />

−<br />

+<br />

=<br />

−<br />

+<br />

−<br />

+<br />

=<br />

=<br />

+<br />

−<br />

=<br />

+<br />

−<br />

=<br />

=<br />

kontrol<br />

kontrol<br />

kontrol<br />

træning<br />

træning<br />

træning<br />

kontrol<br />

kontrol<br />

træning<br />

træning<br />

kontrol<br />

kontrol<br />

træning<br />

træning<br />

kontrol<br />

træning<br />

kontrol<br />

træning<br />

n<br />

n<br />

s<br />

n<br />

n<br />

s<br />

n<br />

s<br />

n<br />

s<br />

f<br />

f<br />

t<br />

n<br />

s<br />

n<br />

s<br />

x<br />

x<br />

x<br />

t<br />

H µ<br />

µ<br />

Dvs. vi tester hypotesen:


P<br />

obs<br />

( x)<br />

= 2(1 − F ~ ( t(<br />

x)<br />

)) = 2(1 − F<br />

(37.9)<br />

(2.31)) =<br />

t ( f )<br />

t<br />

0.026<br />

Dvs. vi også får forkastelse af hypotesen om ens middelværdier i denne<br />

model.<br />

Konklusionen bliver altså i dette tilfælde det samme, men vi bemærker at<br />

idet vi får to forskellige testværdier, kunne vi godt have fået accept i den<br />

ene model frem for den anden.


Eksempel: Allergiske reaktioner<br />

Der betragtes 50 personer med pollenallergi. 23 behandles med en<br />

modgift man vil teste effekten af, mens de resterende 27 får et<br />

medikament, man ved ikke har nogen effekt (placebo). Vi betragter<br />

modellen:<br />

X<br />

mod gift<br />

~ N(<br />

µ<br />

mod gift;<br />

σ<br />

mod gift<br />

)<br />

X<br />

placebo<br />

~<br />

N(<br />

µ<br />

placebo<br />

; σ<br />

placebo<br />

)<br />

Det oplyses at:<br />

Gruppe<br />

n<br />

x<br />

s<br />

Modgift<br />

23<br />

19.5<br />

27.3<br />

Placebo<br />

27<br />

5.4<br />

17.2


Vi vil først teste hypotesen om ens standardafvigelse:<br />

H<br />

: σ<br />

F =<br />

~ F(<br />

P<br />

obs<br />

s<br />

s<br />

1<br />

( x)<br />

= 2(1 −<br />

mod gift<br />

2<br />

mod gift<br />

f<br />

2<br />

placebo<br />

,<br />

f<br />

=<br />

F<br />

2<br />

= σ<br />

=<br />

27.3<br />

17.1<br />

= 2.54<br />

) = F(23<br />

−1,27<br />

−1)<br />

=<br />

2(1 − F<br />

F (22,26)<br />

placebo<br />

2<br />

2<br />

F ( f<br />

1<br />

, f<br />

2<br />

)<br />

( F))<br />

(2.54)) = 0.024<br />

F(22,26)<br />

Dvs vi får forkastelse af hypotesen om ens standardafvigelse.


Havde vi fået accept af hypotesen om ens standardafvigelser ville vi et 95%<br />

konfidensinterval for forskellen mellem middelværdierne være:<br />

2 1 1<br />

2 1 1<br />

x<br />

1<br />

− x2<br />

− s ( + ) t0.975(<br />

f ) ≤ µ<br />

1<br />

− µ<br />

2<br />

≤ x1<br />

− x2<br />

+ s ( + ) t0.<br />

975(<br />

f )<br />

n n<br />

n n<br />

1<br />

2<br />

Når standardafvigelserne ikke er ens bliver konfidensintervallet i stedet:<br />

1<br />

2<br />

x<br />

mod gift<br />

2<br />

2<br />

smod<br />

gift<br />

s<br />

placebo<br />

− x<br />

t (<br />

~<br />

placebo − +<br />

0.975<br />

f ) ≤ µ<br />

mod gift<br />

− µ<br />

n n<br />

mod gift<br />

placebo<br />

placebo<br />

≤<br />

x<br />

mod gift<br />

−<br />

x<br />

placebo<br />

+<br />

s<br />

n<br />

2<br />

mod gift<br />

mod gift<br />

+<br />

s<br />

n<br />

2<br />

placebo<br />

placebo<br />

t<br />

0.975<br />

(<br />

~ f )


35.8<br />

1)<br />

/(27<br />

)<br />

27<br />

17.1<br />

(<br />

1)<br />

/(23<br />

)<br />

23<br />

27.3<br />

(<br />

)<br />

27<br />

17.1<br />

23<br />

27.3<br />

(<br />

1)<br />

/(<br />

)<br />

(<br />

1)<br />

/(<br />

)<br />

(<br />

)<br />

(<br />

~<br />

2<br />

2<br />

2<br />

2<br />

2<br />

2<br />

2<br />

2<br />

2<br />

mod<br />

2<br />

mod<br />

2<br />

mod<br />

2<br />

2<br />

mod<br />

2<br />

mod<br />

=<br />

−<br />

+<br />

−<br />

+<br />

=<br />

−<br />

+<br />

−<br />

+<br />

=<br />

placebo<br />

placebo<br />

placebo<br />

gift<br />

gift<br />

gift<br />

placebo<br />

placebo<br />

gift<br />

gift<br />

n<br />

n<br />

s<br />

n<br />

n<br />

s<br />

n<br />

s<br />

n<br />

s<br />

f<br />

Vi bestemmer først:


Hvormed et 95% konfidensinterval for forskellen mellem middelværdierne<br />

er givet ved:<br />

27.3 −17.1−<br />

27.3<br />

23<br />

2<br />

17.1<br />

+<br />

27<br />

2<br />

2.03 ≤ µ<br />

mod gift<br />

− µ<br />

placebo<br />

≤<br />

27.3−17.1−<br />

27.3<br />

23<br />

2<br />

17.1<br />

+<br />

27<br />

2<br />

2.03<br />

⇒<br />

0.77<br />

≤ µ<br />

mod gift<br />

− µ<br />

placebo<br />

≤ 27.5<br />

Vi bemærker, at 0 ikke ligger i konfidensintervallet.


Vi ønsker til slut at teste om de to middelværdier kan antages at være ens:<br />

H : µ = µ<br />

mod gift<br />

xmod<br />

gift − x<br />

t(<br />

x)<br />

=<br />

2<br />

smod<br />

gift<br />

s<br />

+<br />

nmod<br />

gift<br />

n<br />

~ t(<br />

~ f ) = t(35.8)<br />

P<br />

obs<br />

( x)<br />

= 2(1 − F<br />

placebo<br />

t(<br />

~ f )<br />

placebo<br />

2<br />

placebo<br />

placebo<br />

( t(<br />

x) ))<br />

=<br />

=<br />

19.5 − 5.4<br />

= 2.14<br />

2 2<br />

27.3 17.1<br />

+<br />

23 27<br />

2(1 − F (2.14)) = 0.038<br />

t(35.8)<br />

Det vil sige vi forkaster hypotesen. Det er i overensstemmelse med 0 ikke<br />

er i konfidensintervallet fra før og betyder behandlingen har en effekt.


Hvorfor er det godt<br />

at kunne<br />

sin statistik


TV-quiz<br />

Antag, at du medvirker i et tv-program, og du får givet<br />

muligheden for at vælge mellem tre døre:<br />

Bag en af dørene er der en bil;<br />

bag de to andre en ged.<br />

Du vælger en dør, lad os sige nr. 1, og tv-værten,<br />

som ved, hvad der er bag dørene, åbner en anden dør,<br />

lad os sige nr. 3, bag hvilken der befinder sig en ged.<br />

Han spørger dig nu:<br />

"Vil du hellere vælge dør nr. 2"<br />

Er det nu en fordel af vælge om


Sandsynligheden for at man vælger døren med bilen ved det første valg er<br />

1/3, hvilket også vil være chancen for at vinde bilen, hvis man holder fast<br />

på sit første valg.<br />

På den anden side er sandsynligheden for at vælge en dør, som skjuler en<br />

ged 2/3, og en spiller, som oprindeligt har valgt en ged, vinder bilen ved at<br />

vælge om.


Vi har altså 3 mulige udfald<br />

1.<br />

2.<br />

3.


I to ud af tre tilfælde kan det betale sig at skifte dør, og i et ud af tre<br />

tilfælde kan det ikke betale sig.<br />

Ens chance for at vinde fordobles altså ved at vælge om, når spilstyreren<br />

tilbyder det.<br />

Løsningen ville være anderledes, hvis tv-værten ikke vidste, hvad der var<br />

gemt bag de forskellige døre, eller hvis tv-værten havde muligheden for<br />

ikke at tilbyde spilleren at vælge om.


Er mænd klogere end kvinder


Professor i psykologi ved <strong>Aarhus</strong> <strong>Universitet</strong>, Helmuth Nyborg påstod at<br />

have opdaget mænd gennemsnitligt er 27 % klogere end kvinder.<br />

Senere opdagede han en regnefejl, så forskellen kun var 5 %...<br />

Men kan dette resultat være rigtigt


Problemer med Nyborgs resultat:<br />

- Lille datamateriale (52 personer)<br />

- Hvordan er disse udvalgt<br />

- Hvordan måles intelligensen<br />

- Statistisk metode


Nyborg modellerede hvert køns intelligens ved en normalfordeling.<br />

Han anvendte et test, der ikke gav mulighed for kvinder kunne være<br />

klogere end mænd.<br />

Havde han i stedet anvendt et ganske almindeligt t-test for at<br />

middelværdien var den samme i de to grupper (de to køn), ville han have<br />

fået accept.<br />

Men der er flere problemer…


Nyborg hævdede:<br />

”for hver kvinde med en IQ på over 145 vil der være 122 mænd”<br />

Er Nyborgs 52 testpersoner repræsentative (og ellers giver undersøgelsen<br />

ingen mening!) må de fleste ligge nær middelværdien.<br />

Et så lille datasæt kan derfor ikke sige noget om hvordan fordelingen er i de<br />

mere ekstreme tilfælde.


”Statistiker på prøve”<br />

• Ansat ved Klinisk Epidemiologisk Afdeling (KEA)<br />

• Undersøge patient-populationers prognose<br />

• Adgang til:<br />

• CPR-registret<br />

• Receptdatabase<br />

• Operationsdatabase<br />

• Cancerregister<br />

• Fødsels- og dødsregister


”Statistiker på prøve”<br />

• Immunforsvarets rolle i forbindelse med brystkræft-recidiv<br />

• Herpes Zoster og kræft


•Spørgsmål og kommentarer<br />

•Tak for i dag

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!