Matematisk statistikk - UMB
Matematisk statistikk - UMB
Matematisk statistikk - UMB
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Betingede sannsynligheter<br />
–<br />
Fra spøkefull Monty Hall til<br />
alvorsfull kreftdiagnostikk<br />
Solve Sæbø<br />
IKBM, <strong>UMB</strong>
UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />
Innhold<br />
The Monty Hall game – Vinner du bilen eller geita?<br />
Den statistiske begrunnelsen for riktig strategi i spillet<br />
Betingede sannsynligheter og Bayes regelen.<br />
Sykdomsdiagnostikk – P(brystkreft | mammografi).<br />
Ny blodbasert test lanseres – et viktig supplement til<br />
mammografi?<br />
Statistiske utfordringer i utviklingen av en blodbasert test<br />
for brystkreft.<br />
www.umb.no
The Monty Hall game<br />
www.umb.no<br />
UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP
UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />
The Monty Hall game<br />
Illustrasjon: http://www.math.ucsd.edu/~crypto/Monty/monty.html<br />
Hvilken strategi lønner seg i det lange løp?<br />
- Bytte dør?<br />
- Har ingen betydning?<br />
www.umb.no
Datasimulering i R<br />
www.umb.no<br />
UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP
UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />
Litt sannsynlighetsteori<br />
La A og B betegne ”hendelser” som inntrer med<br />
(totale/ubetingende) sannsynligheter P(A) og P(B).<br />
La A c og B c betegne de komplementære hendelsene (dvs,<br />
ikke-A, ikke-B).<br />
Vi kan illustrere dette med et ”Venn-diagram”:<br />
B c<br />
B<br />
A<br />
A c<br />
www.umb.no
UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />
Den betingede sannsynligheten for A gitt B, P(A|B), kan<br />
uttrykkes ved Bayes regel :<br />
P(A|B) = P(A,B)/P(B) der<br />
P(A,B) er sannsynligheten for både A og B (snittet).<br />
Dette gir at for snittet gjelder:<br />
P(A,B) = P(A|B)*P(B) = P(B|A)*P(A)<br />
Videre er den totale (ubetingede) sanns for A gitt ved<br />
P(A) = P(A,B) + P(A,B c ) = P(A|B)P(B)+P(A|B c )P(B c )<br />
B c<br />
B<br />
A<br />
A c<br />
www.umb.no
UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />
Den statistiske begrunnelsen for riktig strategi<br />
La subskript 1 betegne først valgte dør og subskript 2<br />
betegne tilbudt dør.<br />
La<br />
være sannsynligheten for at det er en bil<br />
bak først valgte dør. Rimelig nok er<br />
Dersom det virkelig er en bil bak den valgte døra vil<br />
og<br />
Dersom det er en geit bak den valgte døra vil<br />
og<br />
siden programverten allerede har åpnet den andre døra<br />
med en geit bak.<br />
www.umb.no
UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />
Så den totale sannsynligheten P(Bil 2 ) for at det er en bil<br />
bak den tilbudte døra er:<br />
Det vil med andre ord lønne seg i lengden å bytte til den<br />
tilbudte døra siden det er 2/3 sjanse for at bilen befinner<br />
seg der (og dermed 1/3 sjanse for bil-gevinst om man<br />
velger ikke å bytte)<br />
www.umb.no
UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />
Mammografi og brystkreft<br />
Anta to hendelser, S og M, definert ved<br />
– S (Syk) = En gitt person har brystkreft.<br />
– M (Mammografi) = En mammografitest viser positivt<br />
resultat, dvs ”syk”.<br />
Begge hendelser vil inntreffe med viss sannsynligheter<br />
P(S) og P(M) dersom en vilkårlig person plukkes ut til en<br />
test.<br />
En god test bør gi positivt utslag med høy sannsynlighet<br />
dersom en pasient er syk, dvs P(M|S) ~ 1<br />
(høy sensitivitet)<br />
Samtidig bør den med høy sannsynlighet vise negativt<br />
resultat dersom personen er frisk, dvs P(M c |S c ) ~ 1<br />
(høy spesifisitet)<br />
www.umb.no
UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />
Men for en pasient er det kanskje mer interessant å vite<br />
hva sannsynligheten er for at man er syk dersom testen<br />
slår ut! Mao hva er P(S|M)?<br />
Bayes regel sier oss at<br />
Og dersom vi bruker uttrykket for total sannsynlighet for<br />
M:<br />
www.umb.no
UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />
Et raskt søk på nettet gir følgende opplysninger om<br />
mammografi:<br />
– Sensitivitet : 0.7-0.9 = P(M|S)<br />
– Spesifisitet : 0.94-0.97 = P(M c |S c )<br />
– Prevalens : ca 0.01 = P(S) (i screening-populasjonen)<br />
Dette gir<br />
Mao, sannynligheten for at en kvinne med positiv<br />
mammografitest i et screeningprogram faktisk har<br />
brystkreft er omlag 0.15.<br />
(Praktisk oppgave i matematikk?)<br />
www.umb.no
UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />
Fra populasjon til utvalg...<br />
Fra utvalg til populasjon...<br />
Tallene i mammografi-eksemplet er basert på estimerte<br />
(anslåtte) sannsynligheter. De er estimert utfra store kliniske<br />
studier der man prøver ut testen på et utvalg av personer med<br />
kjent helsetilstand.<br />
– ”Fra utvalg til populasjon”<br />
I Monty Hall eksemplet kjenner man de populasjonsmessige<br />
sannsynlighetene for å velge dør med bil og geit og kan utfra<br />
det anslå sannsynligheten for ulike utfall<br />
– ”Fra populasjon til utvalg”<br />
Sistnevnte del av <strong>statistikk</strong>en belyses mest i videregående<br />
skole, men er grunnlaget for...<br />
...den del av <strong>statistikk</strong>en som er mest i bruk i praktisk forskning<br />
hvor sannheten (populasjonssannsynlighetene) er ukjent.<br />
www.umb.no
UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />
Aktuell forskning!<br />
Ny test under utvikling<br />
Oppslag i Dagbladet<br />
25.09.2008<br />
www.umb.no
UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />
Et supplement til mammografi<br />
Anta at en ny test i første omgang er ment som et<br />
supplement til mammografi for kvinner med suspekt<br />
mammogram (positiv test).<br />
Mao for denne populasjonen er prevalensen P(S)=0.15<br />
Anta følgende for ny test (D)<br />
– Sensitivitet : P(D|S) = 0.87<br />
– Spesifisitet : P(D C |S C ) = 0.76<br />
Dette gir for en kvinne med suspekt mammogram:<br />
www.umb.no
UNIVERSITETET FOR MILJØ- OG BIOVITENSKAP<br />
Kvinner<br />
40-59 år<br />
To-stegs diagnostikk:<br />
Mammografi<br />
M<br />
M c P(M C )=0.95<br />
P(M) = 0.05<br />
P(S|M) = 0.15<br />
Ny test D c P(D C |M )=0.33<br />
D<br />
P(D|M )=0.67<br />
P(S|D,M)=0.39<br />
www.umb.no