5. Test per proporzioni: confronto tra campioni e ... - statistica.it
5. Test per proporzioni: confronto tra campioni e ... - statistica.it
5. Test per proporzioni: confronto tra campioni e ... - statistica.it
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
6. TEST PER PROPORZIONI<br />
BIOSTATISTICA<br />
<strong>5.</strong> <strong>Test</strong> <strong>per</strong> <strong>proporzioni</strong>:<br />
<strong>confronto</strong> <strong>tra</strong> <strong>campioni</strong> e<br />
associazione<br />
Marta Blangiardo, Im<strong>per</strong>ial College, London<br />
Department of Epidemiology and Public Health<br />
m.blangiardo@im<strong>per</strong>ial.ac.uk<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.1
6. TEST PER PROPORZIONI<br />
1. Un solo campione: metodo esatto e<br />
approssimazione alla Normale<br />
2. Confronto <strong>tra</strong> due o più <strong>proporzioni</strong><br />
la variabile casuale chi quadro<br />
3. <strong>Test</strong> <strong>per</strong> la bontà di adattamento di una<br />
distribuzione di probabil<strong>it</strong>à ad una<br />
distribuzione empirica: il caso di<br />
probabil<strong>it</strong>à stimata<br />
4. <strong>Test</strong> <strong>per</strong> la bontà di adattamento di una<br />
distribuzione di probabil<strong>it</strong>à ad una<br />
distribuzione empirica: il caso di<br />
probabil<strong>it</strong>à teorica<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.2
6. TEST PER PROPORZIONI<br />
1. Un solo campione: metodo<br />
esatto e approssimazione alla<br />
Normale<br />
• Dalla teoria mendeliana<br />
dell’ered<strong>it</strong>arietà ci si aspetta che<br />
certi incroci di varietà di baccelli<br />
producano baccelli gialli o verdi in<br />
rapporto di 3:1.<br />
• In un particolare es<strong>per</strong>imento si<br />
ottengono 17 baccelli gialli e 5<br />
verdi.<br />
• Possiamo concludere che<br />
l’es<strong>per</strong>imento supporta la teoria?<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.3
6. TEST PER PROPORZIONI<br />
L’es<strong>per</strong>imento produce solo due<br />
possibili risultati: giallo o verde<br />
Es<strong>tra</strong>iamo un campione di n=22<br />
incroci. Siamo interessati a valutare<br />
se la proporzione di baccelli verdi e<br />
gialli riscon<strong>tra</strong>ta nel campione<br />
riflette la teoria mendeliana<br />
H 0 : p verde = ¼ = 0.25<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.4
6. TEST PER PROPORZIONI<br />
Dati campionari:<br />
x (numero baccelli verdi) = 5<br />
n = 22<br />
Che valori può assumere X?<br />
La variabile di interesse (numero di<br />
baccelli verdi) è quant<strong>it</strong>ativa discreta<br />
X = 0,1,2,3,…,n<br />
i = baccello verde SUCCESSO<br />
i =baccello giallo INSUCCESSO<br />
Il nostro interesse è sulla proporzione<br />
di SUCCESSI<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.5
6. TEST PER PROPORZIONI<br />
Variabile casuale binomiale<br />
• X: numero di successi in un dato<br />
numero di prove n indipendenti<br />
• Il risultato di ogni prova è S o I<br />
• La probabil<strong>it</strong>à di S (p) è la stessa in<br />
tutte le prove<br />
• Contiamo il numero di successi in n<br />
prove<br />
35<br />
30<br />
25<br />
20<br />
15<br />
10<br />
X ~ Binom(n,p)<br />
1 2 3 4 5 6 7 8 9 10<br />
successi<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.6
6. TEST PER PROPORZIONI<br />
X ~ Binom(n,p)<br />
P(X=x) = n<br />
μ x = np<br />
σ x 2 = np(1-p)<br />
x px (1-p) n-x<br />
x = 0,1,2,….,n<br />
Media e Varianza<br />
n=12, p=0.3 n=12, p=0.8<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.7
Numeros<strong>it</strong>à<br />
campionaria<br />
6. TEST PER PROPORZIONI<br />
P(X=x) = n<br />
Coefficiente<br />
binomiale<br />
x px (1-p) n-x<br />
Probabil<strong>it</strong>à di<br />
successo<br />
n!<br />
x! (n-x)! =<br />
n*n-1*n-2*…2*1<br />
(x*x-1*…*2*1) [(n-x)*(n-x-1)*…*2*1]<br />
5<br />
Fattoriale<br />
2 =<br />
5!<br />
2! (5-2)! =<br />
Proprietà del fattoriale<br />
n<br />
0<br />
= 1<br />
5*4*3*2*1<br />
(2*1) ((5-2)(5-3)(5-4))<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.8<br />
n<br />
n<br />
= 1
6. TEST PER PROPORZIONI<br />
L’ipotesi è che p verde=0.25<br />
P(X=x) = 22<br />
x<br />
Successo<br />
0.25x (1-0.25) 22-x<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.9
P(X=5) = 22<br />
6. TEST PER PROPORZIONI<br />
Distribuzione esatta:<br />
dal campione ho n=22 e x=5<br />
5 0.255 (1-0.25) 22-5 = 0.193<br />
Quanto è estremo il valore osservato nella<br />
distribuzione<br />
Pvalue=2*0.4956=0.9912<br />
X ~ Binom(22,0.25)<br />
P(X≤5) =<br />
P(X=0)+P(X=1)+P(X=2)+P(X=3)+P(X=4)<br />
+P(X=5)= 0.4956<br />
H 0 : p verde = ¼ = 0.25<br />
Evidenza a<br />
supporto<br />
dell’ipotesi nulla<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.10
6. TEST PER PROPORZIONI<br />
Se nel campione avessi osservato<br />
P(X=20)=<br />
22<br />
x=20<br />
20 0.2520 (1-0.25) 22-20 =1.18e -10<br />
Quanto è estremo il valore osservato nella<br />
distribuzione<br />
X ~ Binom(22,0.25)<br />
P(X≥20) = P(X=21)+P(X=22) =<br />
1.21986e-10<br />
Pvalue=2* 1.21986e-10<br />
=2.43972e-10<br />
RIFIUTO H 0 : p verde = ¼ = 0.25<br />
Non sufficiente<br />
evidenza a supporto<br />
dell’ipotesi nulla<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.11
6. TEST PER PROPORZIONI<br />
Quando n è abbastanza grande (>40)<br />
possiamo approssimare la distribuzione<br />
binomiale a quella normale<br />
X ~ Binom(200,0.2)<br />
In questo caso si possono utilizzare I<br />
valori tabulati <strong>per</strong><br />
1) intervalli di confidenza<br />
2) test d’ipotesi<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.12
6. TEST PER PROPORZIONI<br />
Dal campione ottengo<br />
p =<br />
n.successi<br />
n.prove<br />
Posso calcolare lo standard error<br />
campionario<br />
se( p) =<br />
p(1-p)<br />
n<br />
Non conosco p ma posso stimarla<br />
usando p<br />
se( p) =<br />
p(1-p)<br />
n<br />
E ottenere l’intervallo di confidenza<br />
95%<br />
Pr { p - 1.96 se(p) ≤ p ≤ p + 1.96 se( p) } =<br />
0.95<br />
99%<br />
Pr { p – 2.57 se(p) ≤ p ≤ p + 2.57se( p) } =<br />
0.99<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.13
6. TEST PER PROPORZIONI<br />
• Un gruppo di medici ha studiato l’effetto<br />
dell’utilizzo di cravatte strette sul flusso di<br />
sangue che arriva alla testa. Il loro interesse è<br />
valutare come questo fatto influenzi la capac<strong>it</strong>à<br />
del cervello di rispondere a stimoli visivi. Su<br />
un campione di 250 uomini d’affari si è<br />
ottenuto che in 167 casi la cravatta troppo<br />
stretta influenza l’abil<strong>it</strong>à del cervello.<br />
Dal campione:<br />
n=250<br />
x=167<br />
p=?<br />
p=167/250 = 0.668<br />
se( p) =<br />
Per calcolare<br />
l’intervallo di<br />
confidenza mi<br />
serve l’errore<br />
standard che<br />
stimo:<br />
p(1-p)<br />
n<br />
n>40 approssimo alla Normale<br />
Pr { 0.668 - 1.96 * 0.03 ≤ p ≤ 0.668 + 1.96 * 0.03 } =<br />
0.95<br />
IC = {0.6092-0.7268 }<br />
=0.03<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.14
6. TEST PER PROPORZIONI<br />
Dal campione:<br />
n=250<br />
x=167<br />
p=?<br />
p=167/250 = 0.668<br />
IC = {0.6092-0.7268 }<br />
Possiamo concludere che ripetendo<br />
l’es<strong>per</strong>imento 100 volte in 95 casi il p<br />
della popolazione è compreso<br />
nell’intervallo {0.6092-0.7268 }.<br />
p<br />
In 5 casi su 100 sbaglio stimando p con<br />
p.<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.15
6. TEST PER PROPORZIONI<br />
Dal campione ottengo<br />
p =<br />
se( p) =<br />
z p =<br />
P-value (1 coda) =<br />
Pr ( z >z p sotto H 0 )<br />
P-value (2 code)=<br />
n.successi<br />
n.prove<br />
p(1-p)<br />
n<br />
Ipotesi nulla:<br />
p – p 0<br />
se(p)<br />
2*Pr ( z >z p sotto H 0 )<br />
H 0 : p=p 0<br />
~ N(0,1)<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.16
Dal campione:<br />
n=250<br />
x=167<br />
p=167/250 = 0.668<br />
H 0 : p = 0.5<br />
6. TEST PER PROPORZIONI<br />
Dalla stessa popolazione di uomini d’affari<br />
voglio valutare se l’ipotesi che la proporzione<br />
di uomini con cravatta troppo stretta è 0.5<br />
p – p0 zp = = <strong>5.</strong>6<br />
se(p)<br />
Per standardizzare<br />
p devo stimare<br />
l’errore standard<br />
p(1-p)<br />
se( p) =<br />
n =0.03<br />
Pr ( z >z p sotto H 0 ) = Pr(z><strong>5.</strong>6 sotto H 0 )<br />
Il test è a due code quindi<br />
P-value (2 code)= 2*Pr ( z ><strong>5.</strong>6 sotto H 0 )<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.17
0.0<br />
0.1<br />
0.2<br />
0.3<br />
0.4<br />
0.5<br />
0.6<br />
0.7<br />
0.8<br />
Distribuzione<br />
normale<br />
standardizzata<br />
0<br />
0.5000<br />
0.5398<br />
0.5793<br />
0.6179<br />
0.6554<br />
0.6915<br />
0.7257<br />
0.7580<br />
0.7881<br />
……..<br />
<strong>5.</strong>0<br />
<strong>5.</strong>1<br />
<strong>5.</strong>2<br />
<strong>5.</strong>3<br />
<strong>5.</strong>4<br />
<strong>5.</strong>5<br />
<strong>5.</strong>6<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
1<br />
0.5040<br />
0.5438<br />
0.5832<br />
0.6217<br />
0.6591<br />
0.6950<br />
0.7291<br />
0.7611<br />
0.7910<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
6. TEST PER PROPORZIONI<br />
2<br />
0.5080<br />
0.5478<br />
0.5871<br />
0.6255<br />
0.6628<br />
0.6985<br />
0.7324<br />
0.7642<br />
0.7939<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
Tavole<br />
3<br />
0.5120<br />
0.5517<br />
0.5910<br />
0.6293<br />
0.6664<br />
0.7019<br />
0.7357<br />
0.7673<br />
0.7967<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
4<br />
0.5160<br />
0.5557<br />
0.5948<br />
0.6331<br />
0.6700<br />
0.7054<br />
0.7389<br />
0.7704<br />
0.7995<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
1.0000<br />
Pr(z >zp ) = 1-Pr(z
6. TEST PER PROPORZIONI<br />
2. Confronto <strong>tra</strong> due o più<br />
<strong>proporzioni</strong>: la variabile casuale<br />
chi quadro<br />
In una s<strong>per</strong>imentazione clinica tesa a valutare<br />
l’effetto di un nuovo farmaco nel <strong>tra</strong>ttamento<br />
dell’infarto miocardico acuto, 80 pazienti sono<br />
stati assegnati casualmente al gruppo <strong>tra</strong>ttato<br />
con il farmaco in studio o al placebo<br />
Dopo 28 giorni dall’episodio di infarto (e<br />
dall’inizio dello specifico <strong>tra</strong>ttamento) 10 dei 40<br />
pazienti <strong>tra</strong>ttati con il farmaco sono deceduti,<br />
contro 15 decessi verificatisi nei 40 pazienti<br />
<strong>tra</strong>ttati con placebo<br />
Questa s<strong>per</strong>imentazione offre sufficienti<br />
evidenze che il nuovo farmaco sia<br />
efficace nel <strong>tra</strong>ttamento dell’infarto<br />
acuto?<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.19
6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />
INDIPENDENTI<br />
E1. In una s<strong>per</strong>imentazione clinica tesa a<br />
valutare l’effetto di un nuovo farmaco nel<br />
<strong>tra</strong>ttamento dell’infarto miocardico acuto, 80<br />
pazienti sono stati assegnati casualmente al<br />
gruppo <strong>tra</strong>ttato con il farmaco in studio o al<br />
placebo<br />
Dopo 28 giorni dall’episodio di infarto (e<br />
dall’inizio dello specifico <strong>tra</strong>ttamento) 10 dei 40<br />
pazienti <strong>tra</strong>ttati con il farmaco sono deceduti,<br />
contro 15 decessi verificatisi nei 40 pazienti<br />
<strong>tra</strong>ttati con placebo<br />
deceduti<br />
vivi<br />
totale<br />
Tabella di contingenza 2 X 2<br />
Pazienti <strong>tra</strong>ttati<br />
con il farmaco<br />
p 1 = 10 / 40 =<br />
= 0.250<br />
Pazienti di<br />
controllo<br />
10 15<br />
30 25<br />
40 40<br />
p 2 = 15 / 40 =<br />
= 0.375<br />
totale<br />
25<br />
55<br />
80<br />
Questa s<strong>per</strong>imentazione offre sufficienti evidenze<br />
che il nuovo farmaco sia efficace nel <strong>tra</strong>ttamento<br />
dell’infarto acuto?<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.20
6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />
INDIPENDENTI<br />
Tabella di contingenza 2 X 2<br />
deceduti<br />
vivi<br />
totale<br />
p 1 = 10 / 40 =<br />
= 0.250<br />
Pazienti <strong>tra</strong>ttati<br />
con il farmaco<br />
Pazienti di<br />
controllo<br />
10 15<br />
30 25<br />
40 40<br />
p 2 = 15 / 40 =<br />
= 0.375<br />
totale<br />
25<br />
55<br />
80<br />
p = 25 / 80 =<br />
= 0.3125<br />
Ci si aspetta che la mortal<strong>it</strong>à nei<br />
due gruppi differisca <strong>per</strong> effetto del<br />
caso (errore di campionamento) in<br />
assenza del quale:<br />
p 1 = p 2 = p = 0.3125<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.21
6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />
INDIPENDENTI<br />
Tabella di contingenza 2 X 2<br />
deceduti<br />
vivi<br />
totale<br />
p 1 = 10 / 40 =<br />
= 0.250<br />
Pazienti <strong>tra</strong>ttati<br />
con il farmaco<br />
sotto:<br />
Pazienti di<br />
controllo<br />
10 15<br />
30 25<br />
40 40<br />
p 2 = 15 / 40 =<br />
= 0.375<br />
H 0<br />
totale<br />
25<br />
55<br />
80<br />
p = 25 / 80 =<br />
= 0.3125<br />
π1 = π =<br />
2 π<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.22
6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />
INDIPENDENTI<br />
Tabella di contingenza 2 X 2<br />
deceduti<br />
vivi<br />
totale<br />
p 1 = 10 / 40 =<br />
= 0.250<br />
Pazienti <strong>tra</strong>ttati<br />
con il farmaco<br />
Pazienti di<br />
controllo<br />
10 15<br />
30 25<br />
40 40<br />
p 2 = 15 / 40 =<br />
= 0.375<br />
totale<br />
25<br />
55<br />
80<br />
p = 25 / 80 =<br />
= 0.3125<br />
Quanti pazienti <strong>tra</strong>ttati con il farmaco sarebbero<br />
morti se fossero sottoposti alla stessa mortal<strong>it</strong>à<br />
dell’intero gruppo s<strong>per</strong>imentale?<br />
40 . 0.3125 =<br />
deceduti<br />
vivi<br />
totale<br />
Pazienti <strong>tra</strong>ttati<br />
con il farmaco<br />
12.5<br />
Pazienti di<br />
controllo<br />
40 40<br />
totale<br />
25<br />
55<br />
80<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.23
6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />
INDIPENDENTI<br />
Tabella di contingenza 2 X 2<br />
deceduti<br />
vivi<br />
totale<br />
p 1 = 10 / 40 =<br />
= 0.250<br />
Pazienti <strong>tra</strong>ttati<br />
con il farmaco<br />
Pazienti di<br />
controllo<br />
10 15<br />
30 25<br />
40 40<br />
p 2 = 15 / 40 =<br />
= 0.375<br />
totale<br />
25<br />
55<br />
80<br />
p = 25 / 80 =<br />
= 0.3125<br />
Quanti pazienti <strong>tra</strong>ttati con placebo sarebbero<br />
morti se fossero sottoposti alla stessa mortal<strong>it</strong>à<br />
dell’intero gruppo s<strong>per</strong>imentale?<br />
deceduti<br />
vivi<br />
totale<br />
Pazienti <strong>tra</strong>ttati<br />
con il farmaco<br />
40 . 0.3125 =<br />
Pazienti di<br />
controllo<br />
12.5<br />
40 40<br />
totale<br />
25<br />
55<br />
80<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.24
6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />
INDIPENDENTI<br />
Tabella di contingenza 2 X 2<br />
deceduti<br />
vivi<br />
totale<br />
Pazienti <strong>tra</strong>ttati<br />
con il farmaco<br />
Pazienti di<br />
controllo<br />
10 15<br />
30 25<br />
40 40<br />
Tabella di contingenza 2 X 2<br />
deceduti<br />
vivi<br />
totale<br />
<strong>Test</strong> del<br />
Pazienti <strong>tra</strong>ttati<br />
con il farmaco<br />
12.5<br />
27.5<br />
chi-quadrato<br />
Pazienti di<br />
controllo<br />
12.5<br />
40 40<br />
χ 2<br />
27.5<br />
Σ =<br />
g i<br />
Dati<br />
osservati<br />
totale<br />
25<br />
55<br />
80<br />
Dati<br />
attesi<br />
totale<br />
25<br />
55<br />
80<br />
(O i - E i) 2<br />
E i<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.25
6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />
INDIPENDENTI<br />
+<br />
Dati<br />
osservati<br />
deceduti<br />
Dati<br />
attesi<br />
χ 2<br />
vivi<br />
totale<br />
deceduti<br />
vivi<br />
totale<br />
Σ =<br />
g i<br />
(15-12.5) 2<br />
12.5<br />
Pazienti <strong>tra</strong>ttati<br />
con il farmaco<br />
Pazienti di<br />
controllo<br />
10 15<br />
30 25<br />
40 40<br />
Pazienti <strong>tra</strong>ttati<br />
con il farmaco<br />
12.5<br />
27.5<br />
Pazienti di<br />
controllo<br />
12.5<br />
27.5<br />
40 40<br />
(O i - E i) 2<br />
E i<br />
(30-27.5) 2<br />
(10-12.5) 2<br />
(25-27.5) 2<br />
totale<br />
25<br />
55<br />
80<br />
totale<br />
25<br />
55<br />
80<br />
= +<br />
12.5<br />
+ + = 1.45<br />
27.5 27.5<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.26
Chi<br />
quadro<br />
gdl<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
6. TEST PER PROPORZIONI<br />
Distribuzione chi-quadrato<br />
…<br />
…<br />
…<br />
0.3<br />
1.07<br />
2.41<br />
3.66<br />
4.88<br />
6.06<br />
7.23<br />
0.25<br />
1.32<br />
2.77<br />
4.10<br />
<strong>5.</strong>39<br />
6.62<br />
7.84<br />
…<br />
…<br />
…<br />
0.05<br />
3.84<br />
<strong>5.</strong>99<br />
7.81<br />
9.49<br />
11.07<br />
12.59<br />
0.025<br />
<strong>5.</strong>02<br />
7.38<br />
9.34<br />
11.14<br />
12.83<br />
14.44<br />
0.01<br />
6.63<br />
9.21<br />
11.34<br />
13.28<br />
1<strong>5.</strong>09<br />
16.81<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.27
6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />
INDIPENDENTI<br />
Perché 1 grado di libertà?<br />
Valore empirico: χ 2<br />
P-value =<br />
=<br />
1 1.45<br />
0.2 < Pr(χ 2 2>1.45 sotto H0) < 0.25<br />
> 0.05<br />
Dovremmo accettare l’ipotesi nulla<br />
(p > 0.05): le due <strong>proporzioni</strong> non<br />
differiscono significativamente<br />
Questa s<strong>per</strong>imentazione non offre sufficienti<br />
evidenze che il nuovo farmaco sia efficace nel<br />
<strong>tra</strong>ttamento dell’infarto acuto<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.28
Dati<br />
osservati<br />
deceduti<br />
vivi<br />
totale<br />
6. TEST PER PROPORZIONI<br />
Pazienti <strong>tra</strong>ttati<br />
con il farmaco<br />
Pazienti di<br />
controllo<br />
10 15<br />
30 25<br />
40 40<br />
Se si fissano i totali di riga e di colonna<br />
(marginali) mi basta inserire il valore di<br />
una cella e le altre le trovo <strong>per</strong><br />
differenza<br />
deceduti<br />
vivi<br />
totale<br />
Pazienti <strong>tra</strong>ttati<br />
con il farmaco<br />
10<br />
Pazienti di<br />
controllo<br />
25-10=15<br />
40-10=30 40-15=25<br />
40 40<br />
Quindi ho solo 1 grado di libertà<br />
totale<br />
25<br />
55<br />
80<br />
totale<br />
25<br />
55<br />
80<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.29
6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />
INDIPENDENTI<br />
In una s<strong>per</strong>imentazione clinica tesa a valutare<br />
l’effetto di due nuovi farmaci (A e B) nel<br />
<strong>tra</strong>ttamento dell’infarto miocardico acuto, 90<br />
pazienti furono assegnati casualmente al gruppo<br />
<strong>tra</strong>ttato con il farmaco A, al gruppo <strong>tra</strong>ttato con il<br />
farmaco B o al placebo<br />
Dopo 28 giorni dall’episodio di infarto (e<br />
dall’inizio dello specifico <strong>tra</strong>ttamento) 10 dei 30<br />
pazienti <strong>tra</strong>ttati con il farmaco A, 5 dei 30<br />
pazienti <strong>tra</strong>ttati con il farmaco B e 15 dei 30<br />
pazienti <strong>tra</strong>ttati con placebo sono deceduti<br />
deceduti<br />
vivi<br />
totale<br />
p A = 10 / 30 =<br />
= 0.333<br />
Tabella di contingenza 2 X 3<br />
Farmaco<br />
A<br />
Farmaco<br />
30 30 30<br />
totale<br />
30<br />
60<br />
90<br />
Questa s<strong>per</strong>imentazione offre sufficienti evidenze<br />
che i diversi <strong>tra</strong>ttamenti determinino diversi<br />
effetti sulla sopravvivenza?<br />
B<br />
Placebo<br />
10 5 15<br />
20 25 15<br />
p B = 5 / 30 =<br />
= 0.167<br />
p P = 15 / 30 =<br />
= 0.5<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.30
6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />
INDIPENDENTI<br />
deceduti<br />
vivi<br />
totale<br />
p A = 10 / 30 =<br />
= 0.333<br />
π A<br />
Tabella di contingenza 2 X 3<br />
sotto:<br />
=<br />
Farmaco<br />
A<br />
Farmaco<br />
B<br />
Placebo<br />
10 5 15<br />
20 25 15<br />
30 30 30<br />
π B<br />
p B = 5 / 30 =<br />
= 0.167<br />
H 0<br />
= π p<br />
totale<br />
30<br />
60<br />
90<br />
p P = 15 / 30 =<br />
= 0.500<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.31<br />
=<br />
π<br />
30/90=0.333
6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />
INDIPENDENTI<br />
Dati<br />
osservati<br />
deceduti<br />
vivi<br />
totale<br />
p A = 10 / 30<br />
= 0.333<br />
0.333 . 30 =<br />
deceduti<br />
vivi<br />
totale<br />
Farmaco<br />
A<br />
Farmaco<br />
B<br />
Placebo<br />
10 5 15<br />
20 25 15<br />
30 30 30<br />
p B = 5 / 30<br />
= 0.167<br />
p P = 15 / 30<br />
= 0.500<br />
Dati attesi sotto H 0<br />
0.333 . 30 =<br />
Farmaco<br />
A<br />
10<br />
20<br />
Farmaco<br />
B<br />
10<br />
20<br />
10<br />
30 30 30<br />
totale<br />
30<br />
60<br />
90<br />
p = 30 / 90<br />
= 0.333<br />
0.333 . 30 =<br />
Placebo<br />
20<br />
totale<br />
30<br />
60<br />
90<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.32
6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />
INDIPENDENTI<br />
Dati<br />
osservati<br />
deceduti<br />
vivi<br />
totale<br />
Dati<br />
attesi<br />
deceduti<br />
vivi<br />
totale<br />
χ g<br />
2<br />
Σ =<br />
i<br />
Farmaco<br />
A<br />
Farmaco<br />
B<br />
Placebo<br />
10 5 15<br />
20 25 15<br />
30 30 30<br />
Farmaco<br />
2<br />
A<br />
10 10 10<br />
20<br />
30 30 30<br />
(O i - E i) 2<br />
E i<br />
Farmaco<br />
B<br />
20<br />
Placebo<br />
= 6.11<br />
20<br />
totale<br />
30<br />
60<br />
90<br />
totale<br />
30<br />
60<br />
90<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.33
6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />
INDIPENDENTI<br />
Perché 2 gradi di libertà?<br />
Valore empirico: χ 2<br />
P-value =<br />
=<br />
2 6.11<br />
0.025< Pr(χ 2 2>6.11 sotto H 0) < 0.05<br />
< 0.05<br />
Dovremmo rigettare l’ipotesi nulla<br />
(p < 0.05): le tre <strong>proporzioni</strong><br />
differiscono significativamente<br />
Questa s<strong>per</strong>imentazione offre sufficienti evidenze<br />
che il diverso <strong>tra</strong>ttamento determina diverse<br />
mortal<strong>it</strong>à nei pazienti con infarto acuto<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.34
Dati<br />
osservati<br />
deceduti<br />
vivi<br />
totale<br />
6. TEST PER PROPORZIONI<br />
Farmaco<br />
A<br />
Farmaco<br />
B<br />
Placebo<br />
10 5 15<br />
20 25 15<br />
30 30 30<br />
totale<br />
In questo caso una cella non è sufficiente <strong>per</strong><br />
ottenere tutte le altre <strong>per</strong> differenza. Ne<br />
servono 2<br />
Dati<br />
osservati<br />
deceduti<br />
vivi<br />
totale<br />
Farmaco<br />
A<br />
Farmaco<br />
B<br />
Placebo<br />
10 5 30-10-5=15<br />
30-10=20 30-5=25 30-15=15<br />
30 30 30<br />
Quindi ho 2 gradi di libertà<br />
In generale i gdl si ottengono come<br />
(n.righe-1)*(n.colonne-1)<br />
30<br />
60<br />
90<br />
totale<br />
30<br />
60<br />
90<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.35
6. TEST PER PROPORZIONI<br />
ESERCIZIO di RIEPILOGO 1<br />
In una popolazione di bambini in età<br />
prescolare si vuole verificare se la<br />
<strong>per</strong>centuale di bambini affetti da dislessia<br />
è pari al 10%. Per questo motivo si es<strong>tra</strong>e<br />
un campione di 200 bambini e si ottiene<br />
che quelli dislessici sono 40. Saggiare<br />
l’ipotesi nulla<br />
ESERCIZIO di RIEPILOGO 2<br />
Si vuole verificare se l’effetto di tre diete è<br />
equivalente nel ridurre il peso in una<br />
popolazione di bambini. A tal fine si<br />
es<strong>tra</strong>ggono 3 <strong>campioni</strong> di 20, 30 e 40<br />
bambini e si assegna loro rispettivamente<br />
la dieta A, B e C. Definiamo che la dieta<br />
ha effetto se riduce il peso di almeno 5<br />
Kg. Il numero di riduzioni di peso nei tre<br />
<strong>campioni</strong> è rispettivamente 10, 12 e 18<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.36
6. TEST PER PROPORZIONI<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.37
6. TEST PER PROPORZIONI<br />
ESERCIZIO di RIEPILOGO 2<br />
Si vuole verificare se l’effetto di tre diete è<br />
equivalente nel ridurre il peso in una<br />
popolazione di bambini. A tal fine si<br />
es<strong>tra</strong>ggono 3 <strong>campioni</strong> di 20, 30 e 40<br />
bambini e si assegna loro rispettivamente<br />
la dieta A, B e C. Definiamo che la dieta<br />
ha effetto se riduce il peso di almeno 5<br />
Kg. Il numero di riduzioni di peso nei tre<br />
<strong>campioni</strong> è rispettivamente 10, 12 e 18<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.38
6. TEST PER PROPORZIONI<br />
3. <strong>Test</strong> <strong>per</strong> la bontà di adattamento di una<br />
distribuzione di probabil<strong>it</strong>à ad una<br />
distribuzione empirica: il caso di<br />
probabil<strong>it</strong>à teorica<br />
Dalla teoria mendeliana:<br />
Baccelli verdi e lisci<br />
Rugosi e<br />
verdi (RV)<br />
1/16<br />
Baccelli gialli<br />
e rugosi<br />
Lisci e<br />
verdi (LV)<br />
3/16<br />
Rugosi e<br />
gialli (RG)<br />
3/16<br />
Lisci e<br />
gialli (LG)<br />
9/16<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.39
Rugosi e<br />
verdi (RV)<br />
1/16<br />
6. TEST PER PROPORZIONI<br />
Distribuzione teorica<br />
Lisci e<br />
verdi (LV)<br />
3/16<br />
Rugosi e<br />
gialli (RG)<br />
3/16<br />
Lisci e<br />
gialli (LG)<br />
9/16<br />
Da un campione di 160 incroci si ottengono<br />
i seguenti risultati:<br />
Rugosi e<br />
verdi (RV)<br />
8<br />
Lisci e<br />
verdi (LV)<br />
32<br />
N=160<br />
Rugosi e<br />
gialli (RG)<br />
27<br />
Lisci e<br />
gialli (LG)<br />
I dati supportano la teoria mendeliana?<br />
93<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.40
6. TEST PER PROPORZIONI<br />
Vogliamo testare la seguente ipotesi<br />
H 0 : p 1 =1/16, p 2 =3/16, p 3 =3/16, p 4 =9/16<br />
RV<br />
Se H 0 è vera:<br />
10<br />
LV<br />
30<br />
160 . 1<br />
16 =10 3<br />
160 .<br />
16<br />
=30<br />
RG<br />
30<br />
3<br />
160 .<br />
16<br />
=30<br />
Utilizziamo nuovamentre la <strong>statistica</strong> chi<br />
quadrato<br />
<strong>Test</strong> del<br />
chi-quadrato<br />
χ 2<br />
Σ =<br />
g i<br />
LG<br />
90<br />
(O i - E i) 2<br />
9<br />
160 .<br />
16 =90<br />
E i<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.41
+<br />
Rugosi e<br />
verdi (RV)<br />
(32-30) 2<br />
30<br />
8<br />
RV<br />
10<br />
6. TEST PER PROPORZIONI<br />
Valori osservati<br />
Lisci e<br />
verdi (LV)<br />
32<br />
(27-30) 2<br />
Rugosi e<br />
gialli (RG)<br />
27<br />
Valori attesi sotto H0<br />
LV<br />
30<br />
χ 3 2<br />
RG<br />
30<br />
(8-10) 2<br />
= +<br />
10<br />
(93-90) 2<br />
Lisci e<br />
gialli (LG)<br />
93<br />
LG<br />
90<br />
+ + = 0.93<br />
30<br />
90<br />
I gradi di libertà sono ncat-1<br />
(nel nostro caso 4-1=3)<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.42
gdl<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
6. TEST PER PROPORZIONI<br />
Distribuzione chi-quadrato<br />
0.9<br />
0.0158<br />
0.2107<br />
0.5844<br />
1.0636<br />
1.6103<br />
2.2041<br />
0.8<br />
0.0642<br />
0.4463<br />
1.0052<br />
1.6488<br />
2.3425<br />
3.0701<br />
0.7<br />
0.1485<br />
0.7133<br />
1.4237<br />
2.1947<br />
2.9999<br />
3.8276<br />
0.6<br />
0.2750<br />
1.0217<br />
1.8692<br />
2.7528<br />
3.6555<br />
4.5702<br />
Il Pvalue è compreso <strong>tra</strong> questi due<br />
valori<br />
P-value = Pr(χ 2 3>0.93 sotto H 0) ≈ 0.85<br />
> 0.05<br />
Non abbiamo abbastanza evidenza <strong>per</strong><br />
rifiutare H0 MARTA BLANGIARDO – TEST PER PROPORZION - 6.43
6. TEST PER PROPORZIONI<br />
4. <strong>Test</strong> <strong>per</strong> la bontà di adattamento di una<br />
distribuzione di probabil<strong>it</strong>à ad una<br />
distribuzione empirica: il caso di<br />
probabil<strong>it</strong>à stimata<br />
Stima dei parametri della popolazione<br />
partendo dai dati campionari<br />
Assunzioni sulla forma della<br />
distribuzione dei parametri<br />
E’ utile verificare tali assunzioni valutando<br />
quanto i valori osservati si discostano dalla<br />
distribuzione teorica<br />
Confronto <strong>tra</strong>m<strong>it</strong>e chi quadrato delle<br />
frequenze osservate e attese sotto la<br />
distribuzione teorica<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.44
6. TEST PER PROPORZIONI<br />
S<strong>tra</strong>tegia:<br />
1) Scelta della distribuzione di probabil<strong>it</strong>à<br />
adatta a descrivere il fenomeno in studio<br />
2) Calcolo delle probabil<strong>it</strong>à associate ai<br />
valori che la variabile in studio assume nel<br />
campione<br />
3) Calcolo delle frequenze attese π i . O<br />
4) Valutazione <strong>tra</strong>m<strong>it</strong>e chi quadrato delle<br />
discrepanze <strong>tra</strong> frequenze osservate (O i )<br />
ed attese π i .O<br />
χ 2<br />
= Σ (O i – π i O) 2<br />
g<br />
π i O<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.45
6. TEST PER PROPORZIONI<br />
Verifica dell’adattamento ad una<br />
distribuzione Binomiale<br />
Sono stati raccolti i dati relativi al numero<br />
di figlie femmine in 103 famiglie di 4 figli. Il<br />
rapporto <strong>tra</strong> maschi e femmine è atteso di<br />
½:½.<br />
1) Scelta della distribuzione di probabil<strong>it</strong>à<br />
adatta a descrivere il fenomeno in studio<br />
Variabile casuale<br />
dicotomica<br />
Successo:<br />
figlia femmina<br />
Variabile casuale teorica:<br />
Binomiale<br />
X~Binom(n,p) X~Binom(4,0.5)<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.46
50<br />
45<br />
40<br />
35<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
Osservati<br />
6. TEST PER PROPORZIONI<br />
2) Sappiamo che π i =0.5 sotto H 0<br />
Valori osservati nel campione<br />
X<br />
0<br />
1<br />
2<br />
3<br />
4<br />
Oi 5<br />
24<br />
44<br />
19<br />
11<br />
1 2 3 4 5<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.47
6. TEST PER PROPORZIONI<br />
3) Calcolo delle probabil<strong>it</strong>à associate ai<br />
valori che la variabile in studio assume<br />
nel campione<br />
P(X=x) =<br />
X<br />
0<br />
1<br />
2<br />
3<br />
4<br />
O i<br />
5<br />
24<br />
44<br />
19<br />
11<br />
4<br />
x<br />
0.5x (1-0.5) 4-x<br />
π i<br />
(1/2) 4 =0.0625<br />
4 . (1/2) 1. (1/2) 3 = 0.25<br />
6 . (1/2) 2. (1/2) 2 = 0.375<br />
4 . (1/2) 3. (1/2) 1 = 0.25<br />
(1/2) 4. (1/2) 0 = 0.0625<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.48
50<br />
45<br />
40<br />
35<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
X<br />
0<br />
1<br />
2<br />
3<br />
4<br />
Osservati<br />
Attesi<br />
6. TEST PER PROPORZIONI<br />
4) Calcolo delle frequenze attese π i . O<br />
O i<br />
5<br />
24<br />
44<br />
19<br />
11<br />
π i<br />
(1/2) 4 =0.0625<br />
4 . (1/2) 1. (1/2) 3 = 0.25<br />
6 . (1/2) 2. (1/2) 2 = 0.375<br />
4 . (1/2) 3. (1/2) 1 = 0.25<br />
(1/2) 4. (1/2) 0 = 0.0625<br />
π i .O<br />
0.0625 . 103=6.44<br />
0. 25 . 103=2<strong>5.</strong>75<br />
0.375 . 103=38.62<br />
0.25 . 103=2<strong>5.</strong>75<br />
0.0625 . 103=6.44<br />
1 2 3 4 5<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.49
+<br />
=<br />
6. TEST PER PROPORZIONI<br />
5) Valutazione <strong>tra</strong>m<strong>it</strong>e chi quadrato delle<br />
discrepanze <strong>tra</strong> frequenze osservate (O i )<br />
ed attese π i .O<br />
(5-6.44) 2<br />
6.44<br />
χ 2<br />
(19-2<strong>5.</strong>75) 2<br />
2<strong>5.</strong>75<br />
= Σ (O i – π i O) 2<br />
+<br />
g<br />
(24-2<strong>5.</strong>75) 2<br />
2<strong>5.</strong>75<br />
(11-6.44) 2<br />
π i O<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.50<br />
+<br />
(44-38.62) 2<br />
38.62<br />
+ = 6.191<br />
6.44<br />
P-value = Pr(χ 2 4>6.191 sotto H 0) ≈ 0.18<br />
> 0.05<br />
Il numero di gdl è ncat-1 = 5 - 1 = 4<br />
Da excel:<br />
=DISTRIB.CHI(6.191,4)
6. TEST PER PROPORZIONI<br />
Possiamo concludere che la<br />
differenza <strong>tra</strong> la distribuzione<br />
osservata e quella teorica<br />
(Binomiale di parametro 0.5 in 4<br />
prove) non è significativa<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.51
6. TEST PER PROPORZIONI<br />
Verifica dell’adattamento ad una<br />
distribuzione Poisson<br />
Si desidera conoscere la distribuzione di<br />
una variante rara di una certa pianta in una<br />
determinata regione. Per fare cio’ la<br />
regione viene suddivisa in aree di uguale<br />
grandezza e si conta il numero di elementi<br />
della variante in studio.<br />
1) Scelta della distribuzione di probabil<strong>it</strong>à<br />
adatta a descrivere il fenomeno in studio<br />
Variabile casuale<br />
discreta, ma<br />
NON<br />
dicotomica<br />
Evento<br />
RARO<br />
Variabile casuale teorica:<br />
Poisson<br />
X~Poisson(λ)<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.52
6. TEST PER PROPORZIONI<br />
Distribuzione Poisson<br />
Caratterizzata da<br />
un parametro<br />
X~Poisson(5)<br />
E(X)=5<br />
Var(X)=5<br />
X~Poisson(λ)<br />
E(X) = λ<br />
Var(X) = λ<br />
Distribuzone usata<br />
<strong>per</strong> gli eventi rari<br />
X~Poisson(3)<br />
E(X)=3<br />
Var(X)=3<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.53
45<br />
40<br />
35<br />
30<br />
25<br />
20<br />
15<br />
10<br />
6. TEST PER PROPORZIONI<br />
2) Non conosciamo i valori di π i nella<br />
popolazione: dobbiamo stimarli<br />
5<br />
0<br />
Valori osservati nel campione<br />
X<br />
0<br />
1<br />
2<br />
3<br />
>3<br />
Oi 39<br />
34<br />
13<br />
0 1 2 3<br />
Osservati<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.54<br />
1<br />
0
6. TEST PER PROPORZIONI<br />
2) Non conosciamo i valori di π i nella<br />
popolazione: dobbiamo stimarli<br />
Una stima di λ è<br />
x (media campionaria):<br />
x =<br />
Σx iO i<br />
ΣO i<br />
x = 39 . 0 + 34 . 1 + 13 . 2 + 1 . 3 = 0.7241<br />
87<br />
X~Poisson(0.7241)<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.55
X<br />
0<br />
1<br />
2<br />
3<br />
>3<br />
O i<br />
39<br />
34<br />
13<br />
1<br />
0<br />
6. TEST PER PROPORZIONI<br />
3) Calcolo delle probabil<strong>it</strong>à associate ai<br />
valori che la variabile in studio assume<br />
nel campione<br />
X~Poisson(0.7241)<br />
P(X=x) = λx e -λ<br />
π i<br />
e -0.7241 =0.4847<br />
x!<br />
e -0.7241. (0.7241) 1 = 0.3510<br />
e -0.7241. (0.7241) 2 /2=0.1271<br />
e -0.7241. (0.7241) 3 /6=0.0306<br />
1-0.4847- 0.3510-0.1271-<br />
0.0306 = 0.0065<br />
0.7241 0 e -0.7241<br />
0!<br />
=1<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.56
X<br />
0<br />
1<br />
2<br />
3<br />
>3<br />
45<br />
40<br />
35<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
6. TEST PER PROPORZIONI<br />
4) Calcolo delle frequenze attese π i . O<br />
O i<br />
39<br />
34<br />
13<br />
1<br />
0<br />
Osservati<br />
Attesi<br />
π i<br />
e -0.7241 =0.4847<br />
e -0.7241. (0.7241) 1 =<br />
0.3510<br />
e -0.7241.<br />
(0.7241) 2 /2=0.1271<br />
e -0.7241.<br />
(0.7241) 3 /6=0.0306<br />
1-0.4847- 0.3510-0.1271-<br />
0.0306 = 0.0065<br />
π i .O<br />
0.4847 . 87=42.17<br />
0.3510 . 87=30.54<br />
0.1271 . 87=11.06<br />
0.0306 . 87=2.66<br />
0.0625 . 87=0.54<br />
0 1 2 3 >3<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.57
+<br />
=<br />
6. TEST PER PROPORZIONI<br />
5) Valutazione <strong>tra</strong>m<strong>it</strong>e chi quadrato delle<br />
discrepanze <strong>tra</strong> frequenze osservate (O i )<br />
ed attese π i .n (o p i .n se i parametri sono<br />
ignoti nella popolazione)<br />
(39-42.17) 2<br />
42.17<br />
(1-2.66) 2<br />
2.66<br />
χ 2<br />
= Σ (O i – π i O) 2<br />
+<br />
g<br />
(34-30.54) 2<br />
30.54<br />
(0-0.54) 2<br />
π i O<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.58<br />
+<br />
(13-11.06) 2<br />
11.06<br />
+ = 2.5095<br />
0.54<br />
P-value = Pr(χ 2 3>2.5094 sotto H 0) ≈ 0.47<br />
> 0.05<br />
Il numero di gdl è n.cat-2 = 5 - 2 = 3<br />
Da excel:<br />
=DISTRIB.CHI(2.5094,3)
6. TEST PER PROPORZIONI<br />
Possiamo concludere che la<br />
differenza <strong>tra</strong> la distribuzione<br />
osservata e quella teorica<br />
(Poisson di parametro 0.7241)<br />
non è significativa<br />
PROBLEMA: come mai abiamo usato<br />
un chi quadro con 3 gradi di libertà?<br />
Il numero di gdl è n.cat-2 = 5 - 2 = 3<br />
???<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.59
6. TEST PER PROPORZIONI<br />
Abbiamo visto precedentemente che i<br />
gradi di libertà erano calcolati come<br />
•N.obs-1 (nel caso della T di Student)<br />
•N.cat-1<br />
•(n.righe-1)(n.col-1)<br />
Nel caso del chi<br />
quadro<br />
In questo caso abbiamo un ulteriore vincolo<br />
dato dal fatto che DOBBIAMO stimare λ<br />
<strong>tra</strong>m<strong>it</strong>e i dati campionari (y). Quindi:<br />
1. ΣO i=O<br />
2. Σx iO i= y<br />
ΣO i<br />
gdl = n.cat - 2<br />
Una regola universale: il numero di gradi di libertà è<br />
sempre uguale al numero di osservazioni MENO il<br />
numero di relazioni <strong>tra</strong> le osservazioni che abbiamo la<br />
necess<strong>it</strong>à di ottenere<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.60
6. TEST PER PROPORZIONI<br />
Verifica dell’adattamento ad una<br />
distribuzione Normale<br />
In un campione di piante da fiore viene<br />
misurata la lunghezza della corolla (in mm);<br />
si desidera conoscere la sua distribuzione.<br />
1) Scelta della distribuzione di probabil<strong>it</strong>à<br />
adatta a descrivere il fenomeno in studio<br />
Variabile casuale<br />
continua<br />
X~N(μ,σ 2 )<br />
Ci si aspetta<br />
simmetria<br />
nella<br />
distribuzione<br />
Variabile casuale teorica:<br />
Normale<br />
f<br />
( x)<br />
=<br />
2πσ<br />
( x−μ<br />
)<br />
−<br />
2<br />
2σ<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.61<br />
1<br />
2<br />
⋅e<br />
2
X~N(μ,σ 2 )<br />
Z~N(0,1)<br />
6. TEST PER PROPORZIONI<br />
f ( x)<br />
=<br />
Standardizzazione<br />
f<br />
( z)<br />
2πσ<br />
( x−μ)<br />
−<br />
2<br />
2σ<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.62<br />
1<br />
1<br />
2<br />
2π<br />
⋅e<br />
⋅e<br />
Per standardizzare devo stimare μ e σ 2 dal<br />
campione:<br />
μ<br />
σ 2<br />
x =<br />
s 2 =<br />
Σx iO i<br />
ΣO i<br />
Σ(x i-x) 2 O i<br />
(ΣO i)-1<br />
=<br />
= 67.45<br />
= 8.6136<br />
z<br />
−<br />
2<br />
2<br />
2
6. TEST PER PROPORZIONI<br />
Verifica dell’adattamento ad una<br />
Distribuzione normale standardizzata<br />
distribuzione Normale<br />
1<br />
0<br />
1. Suddividere l’intero campo di variazione<br />
in intervalli. E’ conveniente che il valore<br />
cen<strong>tra</strong>le sia un numero intero.<br />
2. Calcolare la frequenza osservata in ogni<br />
classe<br />
xa -| xb 59.5-|62.5<br />
62.5-|6<strong>5.</strong>5<br />
6<strong>5.</strong>5-|68.5<br />
68.5-|71.5<br />
71.5-|74.5<br />
(x a +x b )/2<br />
61<br />
64<br />
67<br />
70<br />
73<br />
Oi 5<br />
18<br />
42<br />
27<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.63<br />
8<br />
z
6. TEST PER PROPORZIONI<br />
3. Standardizzare usando l’estremo<br />
su<strong>per</strong>iore di ogni classe<br />
xa -| xb 59.5-|62.5<br />
62.5-|6<strong>5.</strong>5<br />
6<strong>5.</strong>5-|68.5<br />
68.5-|71.5<br />
71.5-|74.5<br />
f<br />
( z)<br />
(x a +x b )/2<br />
61<br />
64<br />
67<br />
70<br />
73<br />
=<br />
62.5-67.45<br />
2.93<br />
O i<br />
5<br />
18<br />
42<br />
27<br />
8<br />
1<br />
2π<br />
⋅e<br />
z<br />
−<br />
2<br />
-1.69<br />
-0.66<br />
0.36<br />
1.38<br />
oo<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.64<br />
2<br />
z
6. TEST PER PROPORZIONI<br />
4. Determinare la funzione cumulata I<br />
corrispondenza dei lim<strong>it</strong>i su<strong>per</strong>iori di ogni<br />
classe (<strong>per</strong> l’ultima classe porre=1)<br />
xa -| xb 59.5-|62.5<br />
62.5-|6<strong>5.</strong>5<br />
6<strong>5.</strong>5-|68.5<br />
68.5-|71.5<br />
71.5-|74.5<br />
(x a +x b )/2<br />
61<br />
64<br />
67<br />
70<br />
73<br />
Oi 5<br />
18<br />
42<br />
27<br />
8<br />
z<br />
-1.69<br />
-0.66<br />
0.36<br />
1.38<br />
oo<br />
Fi 0.0455<br />
0.2546<br />
0.6406<br />
0.9126<br />
1.0000<br />
Usando le tavole<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.65
6. TEST PER PROPORZIONI<br />
<strong>5.</strong> Per differenze determinare le frequenze<br />
attese relative π i<br />
x a -| x b<br />
59.5-|62.5<br />
62.5-|6<strong>5.</strong>5<br />
6<strong>5.</strong>5-|68.5<br />
68.5-|71.5<br />
71.5-|74.5<br />
(x a +x b )/2<br />
61<br />
64<br />
67<br />
70<br />
73<br />
F i – F i-1<br />
O i<br />
5<br />
18<br />
42<br />
27<br />
8<br />
z<br />
-1.69<br />
-0.66<br />
0.36<br />
1.38<br />
oo<br />
0.0455<br />
0.2546<br />
0.6406<br />
0.9126<br />
1.0000<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.66<br />
F i<br />
π i<br />
0.0455<br />
0.2091<br />
0.3860<br />
0.2756<br />
0.0838
6. TEST PER PROPORZIONI<br />
6. Calcolare le frequenze attese π i O<br />
x a -| x b20<br />
59.5-|62.5<br />
62.5-|6<strong>5.</strong>5<br />
6<strong>5.</strong>5-|68.5<br />
68.5-|71.5<br />
71.5-|74.5<br />
(x a +x b )/2<br />
61<br />
64<br />
67<br />
70<br />
73<br />
O i<br />
5<br />
18<br />
42<br />
27<br />
8<br />
z<br />
-1.69<br />
-0.66<br />
0.36<br />
1.38<br />
oo<br />
0.0455<br />
0.2546<br />
0.6406<br />
0.9126<br />
1.0000<br />
0.0455<br />
0.2091<br />
0.3860<br />
0.2756<br />
0.0838<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.67<br />
F i<br />
π i<br />
π i O<br />
4.55<br />
20.91<br />
38.60<br />
27.56<br />
8.38
6. TEST PER PROPORZIONI<br />
6. Confrontare le frequenze osservate e<br />
attese <strong>tra</strong>m<strong>it</strong>e il chi quadro<br />
+<br />
=<br />
(5-4.55) 2<br />
4.55<br />
χ 2<br />
(27-27.56) 2<br />
27.56<br />
= Σ (O i – π i O) 2<br />
+<br />
g<br />
(18-20.91) 2<br />
20.91<br />
(8-8.38) 2<br />
π i O<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.68<br />
+<br />
(42-38.60) 2<br />
38.60<br />
+ = 0.777<br />
8.38<br />
Il numero di gdl è n.cat-3 = 5 - 3 = 2<br />
Da excel:<br />
=DISTRIB.CHI(2.5094,2)<br />
P-value = Pr(χ 2 2>0.777 sotto H 0) ≈ 0.67<br />
> 0.05
6. TEST PER PROPORZIONI<br />
Possiamo concludere che la<br />
differenza <strong>tra</strong> la distribuzione<br />
osservata e quella teorica<br />
(Normale di parametri μ=67.45 e<br />
σ=2.93) non è significativa<br />
MARTA BLANGIARDO – TEST PER PROPORZION - 6.69