16.04.2013 Views

5. Test per proporzioni: confronto tra campioni e ... - statistica.it

5. Test per proporzioni: confronto tra campioni e ... - statistica.it

5. Test per proporzioni: confronto tra campioni e ... - statistica.it

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

6. TEST PER PROPORZIONI<br />

BIOSTATISTICA<br />

<strong>5.</strong> <strong>Test</strong> <strong>per</strong> <strong>proporzioni</strong>:<br />

<strong>confronto</strong> <strong>tra</strong> <strong>campioni</strong> e<br />

associazione<br />

Marta Blangiardo, Im<strong>per</strong>ial College, London<br />

Department of Epidemiology and Public Health<br />

m.blangiardo@im<strong>per</strong>ial.ac.uk<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.1


6. TEST PER PROPORZIONI<br />

1. Un solo campione: metodo esatto e<br />

approssimazione alla Normale<br />

2. Confronto <strong>tra</strong> due o più <strong>proporzioni</strong><br />

la variabile casuale chi quadro<br />

3. <strong>Test</strong> <strong>per</strong> la bontà di adattamento di una<br />

distribuzione di probabil<strong>it</strong>à ad una<br />

distribuzione empirica: il caso di<br />

probabil<strong>it</strong>à stimata<br />

4. <strong>Test</strong> <strong>per</strong> la bontà di adattamento di una<br />

distribuzione di probabil<strong>it</strong>à ad una<br />

distribuzione empirica: il caso di<br />

probabil<strong>it</strong>à teorica<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.2


6. TEST PER PROPORZIONI<br />

1. Un solo campione: metodo<br />

esatto e approssimazione alla<br />

Normale<br />

• Dalla teoria mendeliana<br />

dell’ered<strong>it</strong>arietà ci si aspetta che<br />

certi incroci di varietà di baccelli<br />

producano baccelli gialli o verdi in<br />

rapporto di 3:1.<br />

• In un particolare es<strong>per</strong>imento si<br />

ottengono 17 baccelli gialli e 5<br />

verdi.<br />

• Possiamo concludere che<br />

l’es<strong>per</strong>imento supporta la teoria?<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.3


6. TEST PER PROPORZIONI<br />

L’es<strong>per</strong>imento produce solo due<br />

possibili risultati: giallo o verde<br />

Es<strong>tra</strong>iamo un campione di n=22<br />

incroci. Siamo interessati a valutare<br />

se la proporzione di baccelli verdi e<br />

gialli riscon<strong>tra</strong>ta nel campione<br />

riflette la teoria mendeliana<br />

H 0 : p verde = ¼ = 0.25<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.4


6. TEST PER PROPORZIONI<br />

Dati campionari:<br />

x (numero baccelli verdi) = 5<br />

n = 22<br />

Che valori può assumere X?<br />

La variabile di interesse (numero di<br />

baccelli verdi) è quant<strong>it</strong>ativa discreta<br />

X = 0,1,2,3,…,n<br />

i = baccello verde SUCCESSO<br />

i =baccello giallo INSUCCESSO<br />

Il nostro interesse è sulla proporzione<br />

di SUCCESSI<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.5


6. TEST PER PROPORZIONI<br />

Variabile casuale binomiale<br />

• X: numero di successi in un dato<br />

numero di prove n indipendenti<br />

• Il risultato di ogni prova è S o I<br />

• La probabil<strong>it</strong>à di S (p) è la stessa in<br />

tutte le prove<br />

• Contiamo il numero di successi in n<br />

prove<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

X ~ Binom(n,p)<br />

1 2 3 4 5 6 7 8 9 10<br />

successi<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.6


6. TEST PER PROPORZIONI<br />

X ~ Binom(n,p)<br />

P(X=x) = n<br />

μ x = np<br />

σ x 2 = np(1-p)<br />

x px (1-p) n-x<br />

x = 0,1,2,….,n<br />

Media e Varianza<br />

n=12, p=0.3 n=12, p=0.8<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.7


Numeros<strong>it</strong>à<br />

campionaria<br />

6. TEST PER PROPORZIONI<br />

P(X=x) = n<br />

Coefficiente<br />

binomiale<br />

x px (1-p) n-x<br />

Probabil<strong>it</strong>à di<br />

successo<br />

n!<br />

x! (n-x)! =<br />

n*n-1*n-2*…2*1<br />

(x*x-1*…*2*1) [(n-x)*(n-x-1)*…*2*1]<br />

5<br />

Fattoriale<br />

2 =<br />

5!<br />

2! (5-2)! =<br />

Proprietà del fattoriale<br />

n<br />

0<br />

= 1<br />

5*4*3*2*1<br />

(2*1) ((5-2)(5-3)(5-4))<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.8<br />

n<br />

n<br />

= 1


6. TEST PER PROPORZIONI<br />

L’ipotesi è che p verde=0.25<br />

P(X=x) = 22<br />

x<br />

Successo<br />

0.25x (1-0.25) 22-x<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.9


P(X=5) = 22<br />

6. TEST PER PROPORZIONI<br />

Distribuzione esatta:<br />

dal campione ho n=22 e x=5<br />

5 0.255 (1-0.25) 22-5 = 0.193<br />

Quanto è estremo il valore osservato nella<br />

distribuzione<br />

Pvalue=2*0.4956=0.9912<br />

X ~ Binom(22,0.25)<br />

P(X≤5) =<br />

P(X=0)+P(X=1)+P(X=2)+P(X=3)+P(X=4)<br />

+P(X=5)= 0.4956<br />

H 0 : p verde = ¼ = 0.25<br />

Evidenza a<br />

supporto<br />

dell’ipotesi nulla<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.10


6. TEST PER PROPORZIONI<br />

Se nel campione avessi osservato<br />

P(X=20)=<br />

22<br />

x=20<br />

20 0.2520 (1-0.25) 22-20 =1.18e -10<br />

Quanto è estremo il valore osservato nella<br />

distribuzione<br />

X ~ Binom(22,0.25)<br />

P(X≥20) = P(X=21)+P(X=22) =<br />

1.21986e-10<br />

Pvalue=2* 1.21986e-10<br />

=2.43972e-10<br />

RIFIUTO H 0 : p verde = ¼ = 0.25<br />

Non sufficiente<br />

evidenza a supporto<br />

dell’ipotesi nulla<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.11


6. TEST PER PROPORZIONI<br />

Quando n è abbastanza grande (>40)<br />

possiamo approssimare la distribuzione<br />

binomiale a quella normale<br />

X ~ Binom(200,0.2)<br />

In questo caso si possono utilizzare I<br />

valori tabulati <strong>per</strong><br />

1) intervalli di confidenza<br />

2) test d’ipotesi<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.12


6. TEST PER PROPORZIONI<br />

Dal campione ottengo<br />

p =<br />

n.successi<br />

n.prove<br />

Posso calcolare lo standard error<br />

campionario<br />

se( p) =<br />

p(1-p)<br />

n<br />

Non conosco p ma posso stimarla<br />

usando p<br />

se( p) =<br />

p(1-p)<br />

n<br />

E ottenere l’intervallo di confidenza<br />

95%<br />

Pr { p - 1.96 se(p) ≤ p ≤ p + 1.96 se( p) } =<br />

0.95<br />

99%<br />

Pr { p – 2.57 se(p) ≤ p ≤ p + 2.57se( p) } =<br />

0.99<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.13


6. TEST PER PROPORZIONI<br />

• Un gruppo di medici ha studiato l’effetto<br />

dell’utilizzo di cravatte strette sul flusso di<br />

sangue che arriva alla testa. Il loro interesse è<br />

valutare come questo fatto influenzi la capac<strong>it</strong>à<br />

del cervello di rispondere a stimoli visivi. Su<br />

un campione di 250 uomini d’affari si è<br />

ottenuto che in 167 casi la cravatta troppo<br />

stretta influenza l’abil<strong>it</strong>à del cervello.<br />

Dal campione:<br />

n=250<br />

x=167<br />

p=?<br />

p=167/250 = 0.668<br />

se( p) =<br />

Per calcolare<br />

l’intervallo di<br />

confidenza mi<br />

serve l’errore<br />

standard che<br />

stimo:<br />

p(1-p)<br />

n<br />

n>40 approssimo alla Normale<br />

Pr { 0.668 - 1.96 * 0.03 ≤ p ≤ 0.668 + 1.96 * 0.03 } =<br />

0.95<br />

IC = {0.6092-0.7268 }<br />

=0.03<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.14


6. TEST PER PROPORZIONI<br />

Dal campione:<br />

n=250<br />

x=167<br />

p=?<br />

p=167/250 = 0.668<br />

IC = {0.6092-0.7268 }<br />

Possiamo concludere che ripetendo<br />

l’es<strong>per</strong>imento 100 volte in 95 casi il p<br />

della popolazione è compreso<br />

nell’intervallo {0.6092-0.7268 }.<br />

p<br />

In 5 casi su 100 sbaglio stimando p con<br />

p.<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.15


6. TEST PER PROPORZIONI<br />

Dal campione ottengo<br />

p =<br />

se( p) =<br />

z p =<br />

P-value (1 coda) =<br />

Pr ( z >z p sotto H 0 )<br />

P-value (2 code)=<br />

n.successi<br />

n.prove<br />

p(1-p)<br />

n<br />

Ipotesi nulla:<br />

p – p 0<br />

se(p)<br />

2*Pr ( z >z p sotto H 0 )<br />

H 0 : p=p 0<br />

~ N(0,1)<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.16


Dal campione:<br />

n=250<br />

x=167<br />

p=167/250 = 0.668<br />

H 0 : p = 0.5<br />

6. TEST PER PROPORZIONI<br />

Dalla stessa popolazione di uomini d’affari<br />

voglio valutare se l’ipotesi che la proporzione<br />

di uomini con cravatta troppo stretta è 0.5<br />

p – p0 zp = = <strong>5.</strong>6<br />

se(p)<br />

Per standardizzare<br />

p devo stimare<br />

l’errore standard<br />

p(1-p)<br />

se( p) =<br />

n =0.03<br />

Pr ( z >z p sotto H 0 ) = Pr(z><strong>5.</strong>6 sotto H 0 )<br />

Il test è a due code quindi<br />

P-value (2 code)= 2*Pr ( z ><strong>5.</strong>6 sotto H 0 )<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.17


0.0<br />

0.1<br />

0.2<br />

0.3<br />

0.4<br />

0.5<br />

0.6<br />

0.7<br />

0.8<br />

Distribuzione<br />

normale<br />

standardizzata<br />

0<br />

0.5000<br />

0.5398<br />

0.5793<br />

0.6179<br />

0.6554<br />

0.6915<br />

0.7257<br />

0.7580<br />

0.7881<br />

……..<br />

<strong>5.</strong>0<br />

<strong>5.</strong>1<br />

<strong>5.</strong>2<br />

<strong>5.</strong>3<br />

<strong>5.</strong>4<br />

<strong>5.</strong>5<br />

<strong>5.</strong>6<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1<br />

0.5040<br />

0.5438<br />

0.5832<br />

0.6217<br />

0.6591<br />

0.6950<br />

0.7291<br />

0.7611<br />

0.7910<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

6. TEST PER PROPORZIONI<br />

2<br />

0.5080<br />

0.5478<br />

0.5871<br />

0.6255<br />

0.6628<br />

0.6985<br />

0.7324<br />

0.7642<br />

0.7939<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

Tavole<br />

3<br />

0.5120<br />

0.5517<br />

0.5910<br />

0.6293<br />

0.6664<br />

0.7019<br />

0.7357<br />

0.7673<br />

0.7967<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

4<br />

0.5160<br />

0.5557<br />

0.5948<br />

0.6331<br />

0.6700<br />

0.7054<br />

0.7389<br />

0.7704<br />

0.7995<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

Pr(z >zp ) = 1-Pr(z


6. TEST PER PROPORZIONI<br />

2. Confronto <strong>tra</strong> due o più<br />

<strong>proporzioni</strong>: la variabile casuale<br />

chi quadro<br />

In una s<strong>per</strong>imentazione clinica tesa a valutare<br />

l’effetto di un nuovo farmaco nel <strong>tra</strong>ttamento<br />

dell’infarto miocardico acuto, 80 pazienti sono<br />

stati assegnati casualmente al gruppo <strong>tra</strong>ttato<br />

con il farmaco in studio o al placebo<br />

Dopo 28 giorni dall’episodio di infarto (e<br />

dall’inizio dello specifico <strong>tra</strong>ttamento) 10 dei 40<br />

pazienti <strong>tra</strong>ttati con il farmaco sono deceduti,<br />

contro 15 decessi verificatisi nei 40 pazienti<br />

<strong>tra</strong>ttati con placebo<br />

Questa s<strong>per</strong>imentazione offre sufficienti<br />

evidenze che il nuovo farmaco sia<br />

efficace nel <strong>tra</strong>ttamento dell’infarto<br />

acuto?<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.19


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

E1. In una s<strong>per</strong>imentazione clinica tesa a<br />

valutare l’effetto di un nuovo farmaco nel<br />

<strong>tra</strong>ttamento dell’infarto miocardico acuto, 80<br />

pazienti sono stati assegnati casualmente al<br />

gruppo <strong>tra</strong>ttato con il farmaco in studio o al<br />

placebo<br />

Dopo 28 giorni dall’episodio di infarto (e<br />

dall’inizio dello specifico <strong>tra</strong>ttamento) 10 dei 40<br />

pazienti <strong>tra</strong>ttati con il farmaco sono deceduti,<br />

contro 15 decessi verificatisi nei 40 pazienti<br />

<strong>tra</strong>ttati con placebo<br />

deceduti<br />

vivi<br />

totale<br />

Tabella di contingenza 2 X 2<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

p 1 = 10 / 40 =<br />

= 0.250<br />

Pazienti di<br />

controllo<br />

10 15<br />

30 25<br />

40 40<br />

p 2 = 15 / 40 =<br />

= 0.375<br />

totale<br />

25<br />

55<br />

80<br />

Questa s<strong>per</strong>imentazione offre sufficienti evidenze<br />

che il nuovo farmaco sia efficace nel <strong>tra</strong>ttamento<br />

dell’infarto acuto?<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.20


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

Tabella di contingenza 2 X 2<br />

deceduti<br />

vivi<br />

totale<br />

p 1 = 10 / 40 =<br />

= 0.250<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

Pazienti di<br />

controllo<br />

10 15<br />

30 25<br />

40 40<br />

p 2 = 15 / 40 =<br />

= 0.375<br />

totale<br />

25<br />

55<br />

80<br />

p = 25 / 80 =<br />

= 0.3125<br />

Ci si aspetta che la mortal<strong>it</strong>à nei<br />

due gruppi differisca <strong>per</strong> effetto del<br />

caso (errore di campionamento) in<br />

assenza del quale:<br />

p 1 = p 2 = p = 0.3125<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.21


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

Tabella di contingenza 2 X 2<br />

deceduti<br />

vivi<br />

totale<br />

p 1 = 10 / 40 =<br />

= 0.250<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

sotto:<br />

Pazienti di<br />

controllo<br />

10 15<br />

30 25<br />

40 40<br />

p 2 = 15 / 40 =<br />

= 0.375<br />

H 0<br />

totale<br />

25<br />

55<br />

80<br />

p = 25 / 80 =<br />

= 0.3125<br />

π1 = π =<br />

2 π<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.22


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

Tabella di contingenza 2 X 2<br />

deceduti<br />

vivi<br />

totale<br />

p 1 = 10 / 40 =<br />

= 0.250<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

Pazienti di<br />

controllo<br />

10 15<br />

30 25<br />

40 40<br />

p 2 = 15 / 40 =<br />

= 0.375<br />

totale<br />

25<br />

55<br />

80<br />

p = 25 / 80 =<br />

= 0.3125<br />

Quanti pazienti <strong>tra</strong>ttati con il farmaco sarebbero<br />

morti se fossero sottoposti alla stessa mortal<strong>it</strong>à<br />

dell’intero gruppo s<strong>per</strong>imentale?<br />

40 . 0.3125 =<br />

deceduti<br />

vivi<br />

totale<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

12.5<br />

Pazienti di<br />

controllo<br />

40 40<br />

totale<br />

25<br />

55<br />

80<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.23


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

Tabella di contingenza 2 X 2<br />

deceduti<br />

vivi<br />

totale<br />

p 1 = 10 / 40 =<br />

= 0.250<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

Pazienti di<br />

controllo<br />

10 15<br />

30 25<br />

40 40<br />

p 2 = 15 / 40 =<br />

= 0.375<br />

totale<br />

25<br />

55<br />

80<br />

p = 25 / 80 =<br />

= 0.3125<br />

Quanti pazienti <strong>tra</strong>ttati con placebo sarebbero<br />

morti se fossero sottoposti alla stessa mortal<strong>it</strong>à<br />

dell’intero gruppo s<strong>per</strong>imentale?<br />

deceduti<br />

vivi<br />

totale<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

40 . 0.3125 =<br />

Pazienti di<br />

controllo<br />

12.5<br />

40 40<br />

totale<br />

25<br />

55<br />

80<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.24


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

Tabella di contingenza 2 X 2<br />

deceduti<br />

vivi<br />

totale<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

Pazienti di<br />

controllo<br />

10 15<br />

30 25<br />

40 40<br />

Tabella di contingenza 2 X 2<br />

deceduti<br />

vivi<br />

totale<br />

<strong>Test</strong> del<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

12.5<br />

27.5<br />

chi-quadrato<br />

Pazienti di<br />

controllo<br />

12.5<br />

40 40<br />

χ 2<br />

27.5<br />

Σ =<br />

g i<br />

Dati<br />

osservati<br />

totale<br />

25<br />

55<br />

80<br />

Dati<br />

attesi<br />

totale<br />

25<br />

55<br />

80<br />

(O i - E i) 2<br />

E i<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.25


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

+<br />

Dati<br />

osservati<br />

deceduti<br />

Dati<br />

attesi<br />

χ 2<br />

vivi<br />

totale<br />

deceduti<br />

vivi<br />

totale<br />

Σ =<br />

g i<br />

(15-12.5) 2<br />

12.5<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

Pazienti di<br />

controllo<br />

10 15<br />

30 25<br />

40 40<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

12.5<br />

27.5<br />

Pazienti di<br />

controllo<br />

12.5<br />

27.5<br />

40 40<br />

(O i - E i) 2<br />

E i<br />

(30-27.5) 2<br />

(10-12.5) 2<br />

(25-27.5) 2<br />

totale<br />

25<br />

55<br />

80<br />

totale<br />

25<br />

55<br />

80<br />

= +<br />

12.5<br />

+ + = 1.45<br />

27.5 27.5<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.26


Chi<br />

quadro<br />

gdl<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

6. TEST PER PROPORZIONI<br />

Distribuzione chi-quadrato<br />

…<br />

…<br />

…<br />

0.3<br />

1.07<br />

2.41<br />

3.66<br />

4.88<br />

6.06<br />

7.23<br />

0.25<br />

1.32<br />

2.77<br />

4.10<br />

<strong>5.</strong>39<br />

6.62<br />

7.84<br />

…<br />

…<br />

…<br />

0.05<br />

3.84<br />

<strong>5.</strong>99<br />

7.81<br />

9.49<br />

11.07<br />

12.59<br />

0.025<br />

<strong>5.</strong>02<br />

7.38<br />

9.34<br />

11.14<br />

12.83<br />

14.44<br />

0.01<br />

6.63<br />

9.21<br />

11.34<br />

13.28<br />

1<strong>5.</strong>09<br />

16.81<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.27


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

Perché 1 grado di libertà?<br />

Valore empirico: χ 2<br />

P-value =<br />

=<br />

1 1.45<br />

0.2 < Pr(χ 2 2>1.45 sotto H0) < 0.25<br />

> 0.05<br />

Dovremmo accettare l’ipotesi nulla<br />

(p > 0.05): le due <strong>proporzioni</strong> non<br />

differiscono significativamente<br />

Questa s<strong>per</strong>imentazione non offre sufficienti<br />

evidenze che il nuovo farmaco sia efficace nel<br />

<strong>tra</strong>ttamento dell’infarto acuto<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.28


Dati<br />

osservati<br />

deceduti<br />

vivi<br />

totale<br />

6. TEST PER PROPORZIONI<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

Pazienti di<br />

controllo<br />

10 15<br />

30 25<br />

40 40<br />

Se si fissano i totali di riga e di colonna<br />

(marginali) mi basta inserire il valore di<br />

una cella e le altre le trovo <strong>per</strong><br />

differenza<br />

deceduti<br />

vivi<br />

totale<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

10<br />

Pazienti di<br />

controllo<br />

25-10=15<br />

40-10=30 40-15=25<br />

40 40<br />

Quindi ho solo 1 grado di libertà<br />

totale<br />

25<br />

55<br />

80<br />

totale<br />

25<br />

55<br />

80<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.29


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

In una s<strong>per</strong>imentazione clinica tesa a valutare<br />

l’effetto di due nuovi farmaci (A e B) nel<br />

<strong>tra</strong>ttamento dell’infarto miocardico acuto, 90<br />

pazienti furono assegnati casualmente al gruppo<br />

<strong>tra</strong>ttato con il farmaco A, al gruppo <strong>tra</strong>ttato con il<br />

farmaco B o al placebo<br />

Dopo 28 giorni dall’episodio di infarto (e<br />

dall’inizio dello specifico <strong>tra</strong>ttamento) 10 dei 30<br />

pazienti <strong>tra</strong>ttati con il farmaco A, 5 dei 30<br />

pazienti <strong>tra</strong>ttati con il farmaco B e 15 dei 30<br />

pazienti <strong>tra</strong>ttati con placebo sono deceduti<br />

deceduti<br />

vivi<br />

totale<br />

p A = 10 / 30 =<br />

= 0.333<br />

Tabella di contingenza 2 X 3<br />

Farmaco<br />

A<br />

Farmaco<br />

30 30 30<br />

totale<br />

30<br />

60<br />

90<br />

Questa s<strong>per</strong>imentazione offre sufficienti evidenze<br />

che i diversi <strong>tra</strong>ttamenti determinino diversi<br />

effetti sulla sopravvivenza?<br />

B<br />

Placebo<br />

10 5 15<br />

20 25 15<br />

p B = 5 / 30 =<br />

= 0.167<br />

p P = 15 / 30 =<br />

= 0.5<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.30


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

deceduti<br />

vivi<br />

totale<br />

p A = 10 / 30 =<br />

= 0.333<br />

π A<br />

Tabella di contingenza 2 X 3<br />

sotto:<br />

=<br />

Farmaco<br />

A<br />

Farmaco<br />

B<br />

Placebo<br />

10 5 15<br />

20 25 15<br />

30 30 30<br />

π B<br />

p B = 5 / 30 =<br />

= 0.167<br />

H 0<br />

= π p<br />

totale<br />

30<br />

60<br />

90<br />

p P = 15 / 30 =<br />

= 0.500<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.31<br />

=<br />

π<br />

30/90=0.333


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

Dati<br />

osservati<br />

deceduti<br />

vivi<br />

totale<br />

p A = 10 / 30<br />

= 0.333<br />

0.333 . 30 =<br />

deceduti<br />

vivi<br />

totale<br />

Farmaco<br />

A<br />

Farmaco<br />

B<br />

Placebo<br />

10 5 15<br />

20 25 15<br />

30 30 30<br />

p B = 5 / 30<br />

= 0.167<br />

p P = 15 / 30<br />

= 0.500<br />

Dati attesi sotto H 0<br />

0.333 . 30 =<br />

Farmaco<br />

A<br />

10<br />

20<br />

Farmaco<br />

B<br />

10<br />

20<br />

10<br />

30 30 30<br />

totale<br />

30<br />

60<br />

90<br />

p = 30 / 90<br />

= 0.333<br />

0.333 . 30 =<br />

Placebo<br />

20<br />

totale<br />

30<br />

60<br />

90<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.32


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

Dati<br />

osservati<br />

deceduti<br />

vivi<br />

totale<br />

Dati<br />

attesi<br />

deceduti<br />

vivi<br />

totale<br />

χ g<br />

2<br />

Σ =<br />

i<br />

Farmaco<br />

A<br />

Farmaco<br />

B<br />

Placebo<br />

10 5 15<br />

20 25 15<br />

30 30 30<br />

Farmaco<br />

2<br />

A<br />

10 10 10<br />

20<br />

30 30 30<br />

(O i - E i) 2<br />

E i<br />

Farmaco<br />

B<br />

20<br />

Placebo<br />

= 6.11<br />

20<br />

totale<br />

30<br />

60<br />

90<br />

totale<br />

30<br />

60<br />

90<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.33


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

Perché 2 gradi di libertà?<br />

Valore empirico: χ 2<br />

P-value =<br />

=<br />

2 6.11<br />

0.025< Pr(χ 2 2>6.11 sotto H 0) < 0.05<br />

< 0.05<br />

Dovremmo rigettare l’ipotesi nulla<br />

(p < 0.05): le tre <strong>proporzioni</strong><br />

differiscono significativamente<br />

Questa s<strong>per</strong>imentazione offre sufficienti evidenze<br />

che il diverso <strong>tra</strong>ttamento determina diverse<br />

mortal<strong>it</strong>à nei pazienti con infarto acuto<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.34


Dati<br />

osservati<br />

deceduti<br />

vivi<br />

totale<br />

6. TEST PER PROPORZIONI<br />

Farmaco<br />

A<br />

Farmaco<br />

B<br />

Placebo<br />

10 5 15<br />

20 25 15<br />

30 30 30<br />

totale<br />

In questo caso una cella non è sufficiente <strong>per</strong><br />

ottenere tutte le altre <strong>per</strong> differenza. Ne<br />

servono 2<br />

Dati<br />

osservati<br />

deceduti<br />

vivi<br />

totale<br />

Farmaco<br />

A<br />

Farmaco<br />

B<br />

Placebo<br />

10 5 30-10-5=15<br />

30-10=20 30-5=25 30-15=15<br />

30 30 30<br />

Quindi ho 2 gradi di libertà<br />

In generale i gdl si ottengono come<br />

(n.righe-1)*(n.colonne-1)<br />

30<br />

60<br />

90<br />

totale<br />

30<br />

60<br />

90<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.35


6. TEST PER PROPORZIONI<br />

ESERCIZIO di RIEPILOGO 1<br />

In una popolazione di bambini in età<br />

prescolare si vuole verificare se la<br />

<strong>per</strong>centuale di bambini affetti da dislessia<br />

è pari al 10%. Per questo motivo si es<strong>tra</strong>e<br />

un campione di 200 bambini e si ottiene<br />

che quelli dislessici sono 40. Saggiare<br />

l’ipotesi nulla<br />

ESERCIZIO di RIEPILOGO 2<br />

Si vuole verificare se l’effetto di tre diete è<br />

equivalente nel ridurre il peso in una<br />

popolazione di bambini. A tal fine si<br />

es<strong>tra</strong>ggono 3 <strong>campioni</strong> di 20, 30 e 40<br />

bambini e si assegna loro rispettivamente<br />

la dieta A, B e C. Definiamo che la dieta<br />

ha effetto se riduce il peso di almeno 5<br />

Kg. Il numero di riduzioni di peso nei tre<br />

<strong>campioni</strong> è rispettivamente 10, 12 e 18<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.36


6. TEST PER PROPORZIONI<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.37


6. TEST PER PROPORZIONI<br />

ESERCIZIO di RIEPILOGO 2<br />

Si vuole verificare se l’effetto di tre diete è<br />

equivalente nel ridurre il peso in una<br />

popolazione di bambini. A tal fine si<br />

es<strong>tra</strong>ggono 3 <strong>campioni</strong> di 20, 30 e 40<br />

bambini e si assegna loro rispettivamente<br />

la dieta A, B e C. Definiamo che la dieta<br />

ha effetto se riduce il peso di almeno 5<br />

Kg. Il numero di riduzioni di peso nei tre<br />

<strong>campioni</strong> è rispettivamente 10, 12 e 18<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.38


6. TEST PER PROPORZIONI<br />

3. <strong>Test</strong> <strong>per</strong> la bontà di adattamento di una<br />

distribuzione di probabil<strong>it</strong>à ad una<br />

distribuzione empirica: il caso di<br />

probabil<strong>it</strong>à teorica<br />

Dalla teoria mendeliana:<br />

Baccelli verdi e lisci<br />

Rugosi e<br />

verdi (RV)<br />

1/16<br />

Baccelli gialli<br />

e rugosi<br />

Lisci e<br />

verdi (LV)<br />

3/16<br />

Rugosi e<br />

gialli (RG)<br />

3/16<br />

Lisci e<br />

gialli (LG)<br />

9/16<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.39


Rugosi e<br />

verdi (RV)<br />

1/16<br />

6. TEST PER PROPORZIONI<br />

Distribuzione teorica<br />

Lisci e<br />

verdi (LV)<br />

3/16<br />

Rugosi e<br />

gialli (RG)<br />

3/16<br />

Lisci e<br />

gialli (LG)<br />

9/16<br />

Da un campione di 160 incroci si ottengono<br />

i seguenti risultati:<br />

Rugosi e<br />

verdi (RV)<br />

8<br />

Lisci e<br />

verdi (LV)<br />

32<br />

N=160<br />

Rugosi e<br />

gialli (RG)<br />

27<br />

Lisci e<br />

gialli (LG)<br />

I dati supportano la teoria mendeliana?<br />

93<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.40


6. TEST PER PROPORZIONI<br />

Vogliamo testare la seguente ipotesi<br />

H 0 : p 1 =1/16, p 2 =3/16, p 3 =3/16, p 4 =9/16<br />

RV<br />

Se H 0 è vera:<br />

10<br />

LV<br />

30<br />

160 . 1<br />

16 =10 3<br />

160 .<br />

16<br />

=30<br />

RG<br />

30<br />

3<br />

160 .<br />

16<br />

=30<br />

Utilizziamo nuovamentre la <strong>statistica</strong> chi<br />

quadrato<br />

<strong>Test</strong> del<br />

chi-quadrato<br />

χ 2<br />

Σ =<br />

g i<br />

LG<br />

90<br />

(O i - E i) 2<br />

9<br />

160 .<br />

16 =90<br />

E i<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.41


+<br />

Rugosi e<br />

verdi (RV)<br />

(32-30) 2<br />

30<br />

8<br />

RV<br />

10<br />

6. TEST PER PROPORZIONI<br />

Valori osservati<br />

Lisci e<br />

verdi (LV)<br />

32<br />

(27-30) 2<br />

Rugosi e<br />

gialli (RG)<br />

27<br />

Valori attesi sotto H0<br />

LV<br />

30<br />

χ 3 2<br />

RG<br />

30<br />

(8-10) 2<br />

= +<br />

10<br />

(93-90) 2<br />

Lisci e<br />

gialli (LG)<br />

93<br />

LG<br />

90<br />

+ + = 0.93<br />

30<br />

90<br />

I gradi di libertà sono ncat-1<br />

(nel nostro caso 4-1=3)<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.42


gdl<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

6. TEST PER PROPORZIONI<br />

Distribuzione chi-quadrato<br />

0.9<br />

0.0158<br />

0.2107<br />

0.5844<br />

1.0636<br />

1.6103<br />

2.2041<br />

0.8<br />

0.0642<br />

0.4463<br />

1.0052<br />

1.6488<br />

2.3425<br />

3.0701<br />

0.7<br />

0.1485<br />

0.7133<br />

1.4237<br />

2.1947<br />

2.9999<br />

3.8276<br />

0.6<br />

0.2750<br />

1.0217<br />

1.8692<br />

2.7528<br />

3.6555<br />

4.5702<br />

Il Pvalue è compreso <strong>tra</strong> questi due<br />

valori<br />

P-value = Pr(χ 2 3>0.93 sotto H 0) ≈ 0.85<br />

> 0.05<br />

Non abbiamo abbastanza evidenza <strong>per</strong><br />

rifiutare H0 MARTA BLANGIARDO – TEST PER PROPORZION - 6.43


6. TEST PER PROPORZIONI<br />

4. <strong>Test</strong> <strong>per</strong> la bontà di adattamento di una<br />

distribuzione di probabil<strong>it</strong>à ad una<br />

distribuzione empirica: il caso di<br />

probabil<strong>it</strong>à stimata<br />

Stima dei parametri della popolazione<br />

partendo dai dati campionari<br />

Assunzioni sulla forma della<br />

distribuzione dei parametri<br />

E’ utile verificare tali assunzioni valutando<br />

quanto i valori osservati si discostano dalla<br />

distribuzione teorica<br />

Confronto <strong>tra</strong>m<strong>it</strong>e chi quadrato delle<br />

frequenze osservate e attese sotto la<br />

distribuzione teorica<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.44


6. TEST PER PROPORZIONI<br />

S<strong>tra</strong>tegia:<br />

1) Scelta della distribuzione di probabil<strong>it</strong>à<br />

adatta a descrivere il fenomeno in studio<br />

2) Calcolo delle probabil<strong>it</strong>à associate ai<br />

valori che la variabile in studio assume nel<br />

campione<br />

3) Calcolo delle frequenze attese π i . O<br />

4) Valutazione <strong>tra</strong>m<strong>it</strong>e chi quadrato delle<br />

discrepanze <strong>tra</strong> frequenze osservate (O i )<br />

ed attese π i .O<br />

χ 2<br />

= Σ (O i – π i O) 2<br />

g<br />

π i O<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.45


6. TEST PER PROPORZIONI<br />

Verifica dell’adattamento ad una<br />

distribuzione Binomiale<br />

Sono stati raccolti i dati relativi al numero<br />

di figlie femmine in 103 famiglie di 4 figli. Il<br />

rapporto <strong>tra</strong> maschi e femmine è atteso di<br />

½:½.<br />

1) Scelta della distribuzione di probabil<strong>it</strong>à<br />

adatta a descrivere il fenomeno in studio<br />

Variabile casuale<br />

dicotomica<br />

Successo:<br />

figlia femmina<br />

Variabile casuale teorica:<br />

Binomiale<br />

X~Binom(n,p) X~Binom(4,0.5)<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.46


50<br />

45<br />

40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

Osservati<br />

6. TEST PER PROPORZIONI<br />

2) Sappiamo che π i =0.5 sotto H 0<br />

Valori osservati nel campione<br />

X<br />

0<br />

1<br />

2<br />

3<br />

4<br />

Oi 5<br />

24<br />

44<br />

19<br />

11<br />

1 2 3 4 5<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.47


6. TEST PER PROPORZIONI<br />

3) Calcolo delle probabil<strong>it</strong>à associate ai<br />

valori che la variabile in studio assume<br />

nel campione<br />

P(X=x) =<br />

X<br />

0<br />

1<br />

2<br />

3<br />

4<br />

O i<br />

5<br />

24<br />

44<br />

19<br />

11<br />

4<br />

x<br />

0.5x (1-0.5) 4-x<br />

π i<br />

(1/2) 4 =0.0625<br />

4 . (1/2) 1. (1/2) 3 = 0.25<br />

6 . (1/2) 2. (1/2) 2 = 0.375<br />

4 . (1/2) 3. (1/2) 1 = 0.25<br />

(1/2) 4. (1/2) 0 = 0.0625<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.48


50<br />

45<br />

40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

X<br />

0<br />

1<br />

2<br />

3<br />

4<br />

Osservati<br />

Attesi<br />

6. TEST PER PROPORZIONI<br />

4) Calcolo delle frequenze attese π i . O<br />

O i<br />

5<br />

24<br />

44<br />

19<br />

11<br />

π i<br />

(1/2) 4 =0.0625<br />

4 . (1/2) 1. (1/2) 3 = 0.25<br />

6 . (1/2) 2. (1/2) 2 = 0.375<br />

4 . (1/2) 3. (1/2) 1 = 0.25<br />

(1/2) 4. (1/2) 0 = 0.0625<br />

π i .O<br />

0.0625 . 103=6.44<br />

0. 25 . 103=2<strong>5.</strong>75<br />

0.375 . 103=38.62<br />

0.25 . 103=2<strong>5.</strong>75<br />

0.0625 . 103=6.44<br />

1 2 3 4 5<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.49


+<br />

=<br />

6. TEST PER PROPORZIONI<br />

5) Valutazione <strong>tra</strong>m<strong>it</strong>e chi quadrato delle<br />

discrepanze <strong>tra</strong> frequenze osservate (O i )<br />

ed attese π i .O<br />

(5-6.44) 2<br />

6.44<br />

χ 2<br />

(19-2<strong>5.</strong>75) 2<br />

2<strong>5.</strong>75<br />

= Σ (O i – π i O) 2<br />

+<br />

g<br />

(24-2<strong>5.</strong>75) 2<br />

2<strong>5.</strong>75<br />

(11-6.44) 2<br />

π i O<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.50<br />

+<br />

(44-38.62) 2<br />

38.62<br />

+ = 6.191<br />

6.44<br />

P-value = Pr(χ 2 4>6.191 sotto H 0) ≈ 0.18<br />

> 0.05<br />

Il numero di gdl è ncat-1 = 5 - 1 = 4<br />

Da excel:<br />

=DISTRIB.CHI(6.191,4)


6. TEST PER PROPORZIONI<br />

Possiamo concludere che la<br />

differenza <strong>tra</strong> la distribuzione<br />

osservata e quella teorica<br />

(Binomiale di parametro 0.5 in 4<br />

prove) non è significativa<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.51


6. TEST PER PROPORZIONI<br />

Verifica dell’adattamento ad una<br />

distribuzione Poisson<br />

Si desidera conoscere la distribuzione di<br />

una variante rara di una certa pianta in una<br />

determinata regione. Per fare cio’ la<br />

regione viene suddivisa in aree di uguale<br />

grandezza e si conta il numero di elementi<br />

della variante in studio.<br />

1) Scelta della distribuzione di probabil<strong>it</strong>à<br />

adatta a descrivere il fenomeno in studio<br />

Variabile casuale<br />

discreta, ma<br />

NON<br />

dicotomica<br />

Evento<br />

RARO<br />

Variabile casuale teorica:<br />

Poisson<br />

X~Poisson(λ)<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.52


6. TEST PER PROPORZIONI<br />

Distribuzione Poisson<br />

Caratterizzata da<br />

un parametro<br />

X~Poisson(5)<br />

E(X)=5<br />

Var(X)=5<br />

X~Poisson(λ)<br />

E(X) = λ<br />

Var(X) = λ<br />

Distribuzone usata<br />

<strong>per</strong> gli eventi rari<br />

X~Poisson(3)<br />

E(X)=3<br />

Var(X)=3<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.53


45<br />

40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

6. TEST PER PROPORZIONI<br />

2) Non conosciamo i valori di π i nella<br />

popolazione: dobbiamo stimarli<br />

5<br />

0<br />

Valori osservati nel campione<br />

X<br />

0<br />

1<br />

2<br />

3<br />

>3<br />

Oi 39<br />

34<br />

13<br />

0 1 2 3<br />

Osservati<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.54<br />

1<br />

0


6. TEST PER PROPORZIONI<br />

2) Non conosciamo i valori di π i nella<br />

popolazione: dobbiamo stimarli<br />

Una stima di λ è<br />

x (media campionaria):<br />

x =<br />

Σx iO i<br />

ΣO i<br />

x = 39 . 0 + 34 . 1 + 13 . 2 + 1 . 3 = 0.7241<br />

87<br />

X~Poisson(0.7241)<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.55


X<br />

0<br />

1<br />

2<br />

3<br />

>3<br />

O i<br />

39<br />

34<br />

13<br />

1<br />

0<br />

6. TEST PER PROPORZIONI<br />

3) Calcolo delle probabil<strong>it</strong>à associate ai<br />

valori che la variabile in studio assume<br />

nel campione<br />

X~Poisson(0.7241)<br />

P(X=x) = λx e -λ<br />

π i<br />

e -0.7241 =0.4847<br />

x!<br />

e -0.7241. (0.7241) 1 = 0.3510<br />

e -0.7241. (0.7241) 2 /2=0.1271<br />

e -0.7241. (0.7241) 3 /6=0.0306<br />

1-0.4847- 0.3510-0.1271-<br />

0.0306 = 0.0065<br />

0.7241 0 e -0.7241<br />

0!<br />

=1<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.56


X<br />

0<br />

1<br />

2<br />

3<br />

>3<br />

45<br />

40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

6. TEST PER PROPORZIONI<br />

4) Calcolo delle frequenze attese π i . O<br />

O i<br />

39<br />

34<br />

13<br />

1<br />

0<br />

Osservati<br />

Attesi<br />

π i<br />

e -0.7241 =0.4847<br />

e -0.7241. (0.7241) 1 =<br />

0.3510<br />

e -0.7241.<br />

(0.7241) 2 /2=0.1271<br />

e -0.7241.<br />

(0.7241) 3 /6=0.0306<br />

1-0.4847- 0.3510-0.1271-<br />

0.0306 = 0.0065<br />

π i .O<br />

0.4847 . 87=42.17<br />

0.3510 . 87=30.54<br />

0.1271 . 87=11.06<br />

0.0306 . 87=2.66<br />

0.0625 . 87=0.54<br />

0 1 2 3 >3<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.57


+<br />

=<br />

6. TEST PER PROPORZIONI<br />

5) Valutazione <strong>tra</strong>m<strong>it</strong>e chi quadrato delle<br />

discrepanze <strong>tra</strong> frequenze osservate (O i )<br />

ed attese π i .n (o p i .n se i parametri sono<br />

ignoti nella popolazione)<br />

(39-42.17) 2<br />

42.17<br />

(1-2.66) 2<br />

2.66<br />

χ 2<br />

= Σ (O i – π i O) 2<br />

+<br />

g<br />

(34-30.54) 2<br />

30.54<br />

(0-0.54) 2<br />

π i O<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.58<br />

+<br />

(13-11.06) 2<br />

11.06<br />

+ = 2.5095<br />

0.54<br />

P-value = Pr(χ 2 3>2.5094 sotto H 0) ≈ 0.47<br />

> 0.05<br />

Il numero di gdl è n.cat-2 = 5 - 2 = 3<br />

Da excel:<br />

=DISTRIB.CHI(2.5094,3)


6. TEST PER PROPORZIONI<br />

Possiamo concludere che la<br />

differenza <strong>tra</strong> la distribuzione<br />

osservata e quella teorica<br />

(Poisson di parametro 0.7241)<br />

non è significativa<br />

PROBLEMA: come mai abiamo usato<br />

un chi quadro con 3 gradi di libertà?<br />

Il numero di gdl è n.cat-2 = 5 - 2 = 3<br />

???<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.59


6. TEST PER PROPORZIONI<br />

Abbiamo visto precedentemente che i<br />

gradi di libertà erano calcolati come<br />

•N.obs-1 (nel caso della T di Student)<br />

•N.cat-1<br />

•(n.righe-1)(n.col-1)<br />

Nel caso del chi<br />

quadro<br />

In questo caso abbiamo un ulteriore vincolo<br />

dato dal fatto che DOBBIAMO stimare λ<br />

<strong>tra</strong>m<strong>it</strong>e i dati campionari (y). Quindi:<br />

1. ΣO i=O<br />

2. Σx iO i= y<br />

ΣO i<br />

gdl = n.cat - 2<br />

Una regola universale: il numero di gradi di libertà è<br />

sempre uguale al numero di osservazioni MENO il<br />

numero di relazioni <strong>tra</strong> le osservazioni che abbiamo la<br />

necess<strong>it</strong>à di ottenere<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.60


6. TEST PER PROPORZIONI<br />

Verifica dell’adattamento ad una<br />

distribuzione Normale<br />

In un campione di piante da fiore viene<br />

misurata la lunghezza della corolla (in mm);<br />

si desidera conoscere la sua distribuzione.<br />

1) Scelta della distribuzione di probabil<strong>it</strong>à<br />

adatta a descrivere il fenomeno in studio<br />

Variabile casuale<br />

continua<br />

X~N(μ,σ 2 )<br />

Ci si aspetta<br />

simmetria<br />

nella<br />

distribuzione<br />

Variabile casuale teorica:<br />

Normale<br />

f<br />

( x)<br />

=<br />

2πσ<br />

( x−μ<br />

)<br />

−<br />

2<br />

2σ<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.61<br />

1<br />

2<br />

⋅e<br />

2


X~N(μ,σ 2 )<br />

Z~N(0,1)<br />

6. TEST PER PROPORZIONI<br />

f ( x)<br />

=<br />

Standardizzazione<br />

f<br />

( z)<br />

2πσ<br />

( x−μ)<br />

−<br />

2<br />

2σ<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.62<br />

1<br />

1<br />

2<br />

2π<br />

⋅e<br />

⋅e<br />

Per standardizzare devo stimare μ e σ 2 dal<br />

campione:<br />

μ<br />

σ 2<br />

x =<br />

s 2 =<br />

Σx iO i<br />

ΣO i<br />

Σ(x i-x) 2 O i<br />

(ΣO i)-1<br />

=<br />

= 67.45<br />

= 8.6136<br />

z<br />

−<br />

2<br />

2<br />

2


6. TEST PER PROPORZIONI<br />

Verifica dell’adattamento ad una<br />

Distribuzione normale standardizzata<br />

distribuzione Normale<br />

1<br />

0<br />

1. Suddividere l’intero campo di variazione<br />

in intervalli. E’ conveniente che il valore<br />

cen<strong>tra</strong>le sia un numero intero.<br />

2. Calcolare la frequenza osservata in ogni<br />

classe<br />

xa -| xb 59.5-|62.5<br />

62.5-|6<strong>5.</strong>5<br />

6<strong>5.</strong>5-|68.5<br />

68.5-|71.5<br />

71.5-|74.5<br />

(x a +x b )/2<br />

61<br />

64<br />

67<br />

70<br />

73<br />

Oi 5<br />

18<br />

42<br />

27<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.63<br />

8<br />

z


6. TEST PER PROPORZIONI<br />

3. Standardizzare usando l’estremo<br />

su<strong>per</strong>iore di ogni classe<br />

xa -| xb 59.5-|62.5<br />

62.5-|6<strong>5.</strong>5<br />

6<strong>5.</strong>5-|68.5<br />

68.5-|71.5<br />

71.5-|74.5<br />

f<br />

( z)<br />

(x a +x b )/2<br />

61<br />

64<br />

67<br />

70<br />

73<br />

=<br />

62.5-67.45<br />

2.93<br />

O i<br />

5<br />

18<br />

42<br />

27<br />

8<br />

1<br />

2π<br />

⋅e<br />

z<br />

−<br />

2<br />

-1.69<br />

-0.66<br />

0.36<br />

1.38<br />

oo<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.64<br />

2<br />

z


6. TEST PER PROPORZIONI<br />

4. Determinare la funzione cumulata I<br />

corrispondenza dei lim<strong>it</strong>i su<strong>per</strong>iori di ogni<br />

classe (<strong>per</strong> l’ultima classe porre=1)<br />

xa -| xb 59.5-|62.5<br />

62.5-|6<strong>5.</strong>5<br />

6<strong>5.</strong>5-|68.5<br />

68.5-|71.5<br />

71.5-|74.5<br />

(x a +x b )/2<br />

61<br />

64<br />

67<br />

70<br />

73<br />

Oi 5<br />

18<br />

42<br />

27<br />

8<br />

z<br />

-1.69<br />

-0.66<br />

0.36<br />

1.38<br />

oo<br />

Fi 0.0455<br />

0.2546<br />

0.6406<br />

0.9126<br />

1.0000<br />

Usando le tavole<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.65


6. TEST PER PROPORZIONI<br />

<strong>5.</strong> Per differenze determinare le frequenze<br />

attese relative π i<br />

x a -| x b<br />

59.5-|62.5<br />

62.5-|6<strong>5.</strong>5<br />

6<strong>5.</strong>5-|68.5<br />

68.5-|71.5<br />

71.5-|74.5<br />

(x a +x b )/2<br />

61<br />

64<br />

67<br />

70<br />

73<br />

F i – F i-1<br />

O i<br />

5<br />

18<br />

42<br />

27<br />

8<br />

z<br />

-1.69<br />

-0.66<br />

0.36<br />

1.38<br />

oo<br />

0.0455<br />

0.2546<br />

0.6406<br />

0.9126<br />

1.0000<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.66<br />

F i<br />

π i<br />

0.0455<br />

0.2091<br />

0.3860<br />

0.2756<br />

0.0838


6. TEST PER PROPORZIONI<br />

6. Calcolare le frequenze attese π i O<br />

x a -| x b20<br />

59.5-|62.5<br />

62.5-|6<strong>5.</strong>5<br />

6<strong>5.</strong>5-|68.5<br />

68.5-|71.5<br />

71.5-|74.5<br />

(x a +x b )/2<br />

61<br />

64<br />

67<br />

70<br />

73<br />

O i<br />

5<br />

18<br />

42<br />

27<br />

8<br />

z<br />

-1.69<br />

-0.66<br />

0.36<br />

1.38<br />

oo<br />

0.0455<br />

0.2546<br />

0.6406<br />

0.9126<br />

1.0000<br />

0.0455<br />

0.2091<br />

0.3860<br />

0.2756<br />

0.0838<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.67<br />

F i<br />

π i<br />

π i O<br />

4.55<br />

20.91<br />

38.60<br />

27.56<br />

8.38


6. TEST PER PROPORZIONI<br />

6. Confrontare le frequenze osservate e<br />

attese <strong>tra</strong>m<strong>it</strong>e il chi quadro<br />

+<br />

=<br />

(5-4.55) 2<br />

4.55<br />

χ 2<br />

(27-27.56) 2<br />

27.56<br />

= Σ (O i – π i O) 2<br />

+<br />

g<br />

(18-20.91) 2<br />

20.91<br />

(8-8.38) 2<br />

π i O<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.68<br />

+<br />

(42-38.60) 2<br />

38.60<br />

+ = 0.777<br />

8.38<br />

Il numero di gdl è n.cat-3 = 5 - 3 = 2<br />

Da excel:<br />

=DISTRIB.CHI(2.5094,2)<br />

P-value = Pr(χ 2 2>0.777 sotto H 0) ≈ 0.67<br />

> 0.05


6. TEST PER PROPORZIONI<br />

Possiamo concludere che la<br />

differenza <strong>tra</strong> la distribuzione<br />

osservata e quella teorica<br />

(Normale di parametri μ=67.45 e<br />

σ=2.93) non è significativa<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.69

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!