18.10.2014 Views

Matematisk statistikk - UMB

Matematisk statistikk - UMB

Matematisk statistikk - UMB

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Betingede sannsynligheter<br />

–<br />

Fra spøkefull Monty Hall til<br />

alvorsfull kreftdiagnostikk<br />

Solve Sæbø<br />

IKBM, <strong>UMB</strong>


UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />

Innhold<br />

The Monty Hall game – Vinner du bilen eller geita?<br />

Den statistiske begrunnelsen for riktig strategi i spillet<br />

Betingede sannsynligheter og Bayes regelen.<br />

Sykdomsdiagnostikk – P(brystkreft | mammografi).<br />

Ny blodbasert test lanseres – et viktig supplement til<br />

mammografi?<br />

Statistiske utfordringer i utviklingen av en blodbasert test<br />

for brystkreft.<br />

www.umb.no


The Monty Hall game<br />

www.umb.no<br />

UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP


UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />

The Monty Hall game<br />

Illustrasjon: http://www.math.ucsd.edu/~crypto/Monty/monty.html<br />

Hvilken strategi lønner seg i det lange løp?<br />

- Bytte dør?<br />

- Har ingen betydning?<br />

www.umb.no


Datasimulering i R<br />

www.umb.no<br />

UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP


UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />

Litt sannsynlighetsteori<br />

La A og B betegne ”hendelser” som inntrer med<br />

(totale/ubetingende) sannsynligheter P(A) og P(B).<br />

La A c og B c betegne de komplementære hendelsene (dvs,<br />

ikke-A, ikke-B).<br />

Vi kan illustrere dette med et ”Venn-diagram”:<br />

B c<br />

B<br />

A<br />

A c<br />

www.umb.no


UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />

Den betingede sannsynligheten for A gitt B, P(A|B), kan<br />

uttrykkes ved Bayes regel :<br />

P(A|B) = P(A,B)/P(B) der<br />

P(A,B) er sannsynligheten for både A og B (snittet).<br />

Dette gir at for snittet gjelder:<br />

P(A,B) = P(A|B)*P(B) = P(B|A)*P(A)<br />

Videre er den totale (ubetingede) sanns for A gitt ved<br />

P(A) = P(A,B) + P(A,B c ) = P(A|B)P(B)+P(A|B c )P(B c )<br />

B c<br />

B<br />

A<br />

A c<br />

www.umb.no


UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />

Den statistiske begrunnelsen for riktig strategi<br />

La subskript 1 betegne først valgte dør og subskript 2<br />

betegne tilbudt dør.<br />

La<br />

være sannsynligheten for at det er en bil<br />

bak først valgte dør. Rimelig nok er<br />

Dersom det virkelig er en bil bak den valgte døra vil<br />

og<br />

Dersom det er en geit bak den valgte døra vil<br />

og<br />

siden programverten allerede har åpnet den andre døra<br />

med en geit bak.<br />

www.umb.no


UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />

Så den totale sannsynligheten P(Bil 2 ) for at det er en bil<br />

bak den tilbudte døra er:<br />

Det vil med andre ord lønne seg i lengden å bytte til den<br />

tilbudte døra siden det er 2/3 sjanse for at bilen befinner<br />

seg der (og dermed 1/3 sjanse for bil-gevinst om man<br />

velger ikke å bytte)<br />

www.umb.no


UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />

Mammografi og brystkreft<br />

Anta to hendelser, S og M, definert ved<br />

– S (Syk) = En gitt person har brystkreft.<br />

– M (Mammografi) = En mammografitest viser positivt<br />

resultat, dvs ”syk”.<br />

Begge hendelser vil inntreffe med viss sannsynligheter<br />

P(S) og P(M) dersom en vilkårlig person plukkes ut til en<br />

test.<br />

En god test bør gi positivt utslag med høy sannsynlighet<br />

dersom en pasient er syk, dvs P(M|S) ~ 1<br />

(høy sensitivitet)<br />

Samtidig bør den med høy sannsynlighet vise negativt<br />

resultat dersom personen er frisk, dvs P(M c |S c ) ~ 1<br />

(høy spesifisitet)<br />

www.umb.no


UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />

Men for en pasient er det kanskje mer interessant å vite<br />

hva sannsynligheten er for at man er syk dersom testen<br />

slår ut! Mao hva er P(S|M)?<br />

Bayes regel sier oss at<br />

Og dersom vi bruker uttrykket for total sannsynlighet for<br />

M:<br />

www.umb.no


UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />

Et raskt søk på nettet gir følgende opplysninger om<br />

mammografi:<br />

– Sensitivitet : 0.7-0.9 = P(M|S)<br />

– Spesifisitet : 0.94-0.97 = P(M c |S c )<br />

– Prevalens : ca 0.01 = P(S) (i screening-populasjonen)<br />

Dette gir<br />

Mao, sannynligheten for at en kvinne med positiv<br />

mammografitest i et screeningprogram faktisk har<br />

brystkreft er omlag 0.15.<br />

(Praktisk oppgave i matematikk?)<br />

www.umb.no


UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />

Fra populasjon til utvalg...<br />

Fra utvalg til populasjon...<br />

Tallene i mammografi-eksemplet er basert på estimerte<br />

(anslåtte) sannsynligheter. De er estimert utfra store kliniske<br />

studier der man prøver ut testen på et utvalg av personer med<br />

kjent helsetilstand.<br />

– ”Fra utvalg til populasjon”<br />

I Monty Hall eksemplet kjenner man de populasjonsmessige<br />

sannsynlighetene for å velge dør med bil og geit og kan utfra<br />

det anslå sannsynligheten for ulike utfall<br />

– ”Fra populasjon til utvalg”<br />

Sistnevnte del av <strong>statistikk</strong>en belyses mest i videregående<br />

skole, men er grunnlaget for...<br />

...den del av <strong>statistikk</strong>en som er mest i bruk i praktisk forskning<br />

hvor sannheten (populasjonssannsynlighetene) er ukjent.<br />

www.umb.no


UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />

Aktuell forskning!<br />

Ny test under utvikling<br />

Oppslag i Dagbladet<br />

25.09.2008<br />

www.umb.no


UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />

Et supplement til mammografi<br />

Anta at en ny test i første omgang er ment som et<br />

supplement til mammografi for kvinner med suspekt<br />

mammogram (positiv test).<br />

Mao for denne populasjonen er prevalensen P(S)=0.15<br />

Anta følgende for ny test (D)<br />

– Sensitivitet : P(D|S) = 0.87<br />

– Spesifisitet : P(D C |S C ) = 0.76<br />

Dette gir for en kvinne med suspekt mammogram:<br />

www.umb.no


UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />

Kvinner<br />

40-59 år<br />

To-stegs diagnostikk:<br />

Mammografi<br />

M<br />

M c P(M C )=0.95<br />

P(M) = 0.05<br />

P(S|M) = 0.15<br />

Ny test D c P(D C |M )=0.33<br />

D<br />

P(D|M )=0.67<br />

P(S|D,M)=0.39<br />

www.umb.no

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!