16.04.2013 Views

5. Test per proporzioni: confronto tra campioni e ... - statistica.it

5. Test per proporzioni: confronto tra campioni e ... - statistica.it

5. Test per proporzioni: confronto tra campioni e ... - statistica.it

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

6. TEST PER PROPORZIONI<br />

BIOSTATISTICA<br />

<strong>5.</strong> <strong>Test</strong> <strong>per</strong> <strong>proporzioni</strong>:<br />

<strong>confronto</strong> <strong>tra</strong> <strong>campioni</strong> e<br />

associazione<br />

Marta Blangiardo, Im<strong>per</strong>ial College, London<br />

Department of Epidemiology and Public Health<br />

m.blangiardo@im<strong>per</strong>ial.ac.uk<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.1


6. TEST PER PROPORZIONI<br />

1. Un solo campione: metodo esatto e<br />

approssimazione alla Normale<br />

2. Confronto <strong>tra</strong> due o più <strong>proporzioni</strong><br />

la variabile casuale chi quadro<br />

3. <strong>Test</strong> <strong>per</strong> la bontà di adattamento di una<br />

distribuzione di probabil<strong>it</strong>à ad una<br />

distribuzione empirica: il caso di<br />

probabil<strong>it</strong>à stimata<br />

4. <strong>Test</strong> <strong>per</strong> la bontà di adattamento di una<br />

distribuzione di probabil<strong>it</strong>à ad una<br />

distribuzione empirica: il caso di<br />

probabil<strong>it</strong>à teorica<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.2


6. TEST PER PROPORZIONI<br />

1. Un solo campione: metodo<br />

esatto e approssimazione alla<br />

Normale<br />

• Dalla teoria mendeliana<br />

dell’ered<strong>it</strong>arietà ci si aspetta che<br />

certi incroci di varietà di baccelli<br />

producano baccelli gialli o verdi in<br />

rapporto di 3:1.<br />

• In un particolare es<strong>per</strong>imento si<br />

ottengono 17 baccelli gialli e 5<br />

verdi.<br />

• Possiamo concludere che<br />

l’es<strong>per</strong>imento supporta la teoria?<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.3


6. TEST PER PROPORZIONI<br />

L’es<strong>per</strong>imento produce solo due<br />

possibili risultati: giallo o verde<br />

Es<strong>tra</strong>iamo un campione di n=22<br />

incroci. Siamo interessati a valutare<br />

se la proporzione di baccelli verdi e<br />

gialli riscon<strong>tra</strong>ta nel campione<br />

riflette la teoria mendeliana<br />

H 0 : p verde = ¼ = 0.25<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.4


6. TEST PER PROPORZIONI<br />

Dati campionari:<br />

x (numero baccelli verdi) = 5<br />

n = 22<br />

Che valori può assumere X?<br />

La variabile di interesse (numero di<br />

baccelli verdi) è quant<strong>it</strong>ativa discreta<br />

X = 0,1,2,3,…,n<br />

i = baccello verde SUCCESSO<br />

i =baccello giallo INSUCCESSO<br />

Il nostro interesse è sulla proporzione<br />

di SUCCESSI<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.5


6. TEST PER PROPORZIONI<br />

Variabile casuale binomiale<br />

• X: numero di successi in un dato<br />

numero di prove n indipendenti<br />

• Il risultato di ogni prova è S o I<br />

• La probabil<strong>it</strong>à di S (p) è la stessa in<br />

tutte le prove<br />

• Contiamo il numero di successi in n<br />

prove<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

X ~ Binom(n,p)<br />

1 2 3 4 5 6 7 8 9 10<br />

successi<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.6


6. TEST PER PROPORZIONI<br />

X ~ Binom(n,p)<br />

P(X=x) = n<br />

μ x = np<br />

σ x 2 = np(1-p)<br />

x px (1-p) n-x<br />

x = 0,1,2,….,n<br />

Media e Varianza<br />

n=12, p=0.3 n=12, p=0.8<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.7


Numeros<strong>it</strong>à<br />

campionaria<br />

6. TEST PER PROPORZIONI<br />

P(X=x) = n<br />

Coefficiente<br />

binomiale<br />

x px (1-p) n-x<br />

Probabil<strong>it</strong>à di<br />

successo<br />

n!<br />

x! (n-x)! =<br />

n*n-1*n-2*…2*1<br />

(x*x-1*…*2*1) [(n-x)*(n-x-1)*…*2*1]<br />

5<br />

Fattoriale<br />

2 =<br />

5!<br />

2! (5-2)! =<br />

Proprietà del fattoriale<br />

n<br />

0<br />

= 1<br />

5*4*3*2*1<br />

(2*1) ((5-2)(5-3)(5-4))<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.8<br />

n<br />

n<br />

= 1


6. TEST PER PROPORZIONI<br />

L’ipotesi è che p verde=0.25<br />

P(X=x) = 22<br />

x<br />

Successo<br />

0.25x (1-0.25) 22-x<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.9


P(X=5) = 22<br />

6. TEST PER PROPORZIONI<br />

Distribuzione esatta:<br />

dal campione ho n=22 e x=5<br />

5 0.255 (1-0.25) 22-5 = 0.193<br />

Quanto è estremo il valore osservato nella<br />

distribuzione<br />

Pvalue=2*0.4956=0.9912<br />

X ~ Binom(22,0.25)<br />

P(X≤5) =<br />

P(X=0)+P(X=1)+P(X=2)+P(X=3)+P(X=4)<br />

+P(X=5)= 0.4956<br />

H 0 : p verde = ¼ = 0.25<br />

Evidenza a<br />

supporto<br />

dell’ipotesi nulla<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.10


6. TEST PER PROPORZIONI<br />

Se nel campione avessi osservato<br />

P(X=20)=<br />

22<br />

x=20<br />

20 0.2520 (1-0.25) 22-20 =1.18e -10<br />

Quanto è estremo il valore osservato nella<br />

distribuzione<br />

X ~ Binom(22,0.25)<br />

P(X≥20) = P(X=21)+P(X=22) =<br />

1.21986e-10<br />

Pvalue=2* 1.21986e-10<br />

=2.43972e-10<br />

RIFIUTO H 0 : p verde = ¼ = 0.25<br />

Non sufficiente<br />

evidenza a supporto<br />

dell’ipotesi nulla<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.11


6. TEST PER PROPORZIONI<br />

Quando n è abbastanza grande (>40)<br />

possiamo approssimare la distribuzione<br />

binomiale a quella normale<br />

X ~ Binom(200,0.2)<br />

In questo caso si possono utilizzare I<br />

valori tabulati <strong>per</strong><br />

1) intervalli di confidenza<br />

2) test d’ipotesi<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.12


6. TEST PER PROPORZIONI<br />

Dal campione ottengo<br />

p =<br />

n.successi<br />

n.prove<br />

Posso calcolare lo standard error<br />

campionario<br />

se( p) =<br />

p(1-p)<br />

n<br />

Non conosco p ma posso stimarla<br />

usando p<br />

se( p) =<br />

p(1-p)<br />

n<br />

E ottenere l’intervallo di confidenza<br />

95%<br />

Pr { p - 1.96 se(p) ≤ p ≤ p + 1.96 se( p) } =<br />

0.95<br />

99%<br />

Pr { p – 2.57 se(p) ≤ p ≤ p + 2.57se( p) } =<br />

0.99<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.13


6. TEST PER PROPORZIONI<br />

• Un gruppo di medici ha studiato l’effetto<br />

dell’utilizzo di cravatte strette sul flusso di<br />

sangue che arriva alla testa. Il loro interesse è<br />

valutare come questo fatto influenzi la capac<strong>it</strong>à<br />

del cervello di rispondere a stimoli visivi. Su<br />

un campione di 250 uomini d’affari si è<br />

ottenuto che in 167 casi la cravatta troppo<br />

stretta influenza l’abil<strong>it</strong>à del cervello.<br />

Dal campione:<br />

n=250<br />

x=167<br />

p=?<br />

p=167/250 = 0.668<br />

se( p) =<br />

Per calcolare<br />

l’intervallo di<br />

confidenza mi<br />

serve l’errore<br />

standard che<br />

stimo:<br />

p(1-p)<br />

n<br />

n>40 approssimo alla Normale<br />

Pr { 0.668 - 1.96 * 0.03 ≤ p ≤ 0.668 + 1.96 * 0.03 } =<br />

0.95<br />

IC = {0.6092-0.7268 }<br />

=0.03<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.14


6. TEST PER PROPORZIONI<br />

Dal campione:<br />

n=250<br />

x=167<br />

p=?<br />

p=167/250 = 0.668<br />

IC = {0.6092-0.7268 }<br />

Possiamo concludere che ripetendo<br />

l’es<strong>per</strong>imento 100 volte in 95 casi il p<br />

della popolazione è compreso<br />

nell’intervallo {0.6092-0.7268 }.<br />

p<br />

In 5 casi su 100 sbaglio stimando p con<br />

p.<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.15


6. TEST PER PROPORZIONI<br />

Dal campione ottengo<br />

p =<br />

se( p) =<br />

z p =<br />

P-value (1 coda) =<br />

Pr ( z >z p sotto H 0 )<br />

P-value (2 code)=<br />

n.successi<br />

n.prove<br />

p(1-p)<br />

n<br />

Ipotesi nulla:<br />

p – p 0<br />

se(p)<br />

2*Pr ( z >z p sotto H 0 )<br />

H 0 : p=p 0<br />

~ N(0,1)<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.16


Dal campione:<br />

n=250<br />

x=167<br />

p=167/250 = 0.668<br />

H 0 : p = 0.5<br />

6. TEST PER PROPORZIONI<br />

Dalla stessa popolazione di uomini d’affari<br />

voglio valutare se l’ipotesi che la proporzione<br />

di uomini con cravatta troppo stretta è 0.5<br />

p – p0 zp = = <strong>5.</strong>6<br />

se(p)<br />

Per standardizzare<br />

p devo stimare<br />

l’errore standard<br />

p(1-p)<br />

se( p) =<br />

n =0.03<br />

Pr ( z >z p sotto H 0 ) = Pr(z><strong>5.</strong>6 sotto H 0 )<br />

Il test è a due code quindi<br />

P-value (2 code)= 2*Pr ( z ><strong>5.</strong>6 sotto H 0 )<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.17


0.0<br />

0.1<br />

0.2<br />

0.3<br />

0.4<br />

0.5<br />

0.6<br />

0.7<br />

0.8<br />

Distribuzione<br />

normale<br />

standardizzata<br />

0<br />

0.5000<br />

0.5398<br />

0.5793<br />

0.6179<br />

0.6554<br />

0.6915<br />

0.7257<br />

0.7580<br />

0.7881<br />

……..<br />

<strong>5.</strong>0<br />

<strong>5.</strong>1<br />

<strong>5.</strong>2<br />

<strong>5.</strong>3<br />

<strong>5.</strong>4<br />

<strong>5.</strong>5<br />

<strong>5.</strong>6<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1<br />

0.5040<br />

0.5438<br />

0.5832<br />

0.6217<br />

0.6591<br />

0.6950<br />

0.7291<br />

0.7611<br />

0.7910<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

6. TEST PER PROPORZIONI<br />

2<br />

0.5080<br />

0.5478<br />

0.5871<br />

0.6255<br />

0.6628<br />

0.6985<br />

0.7324<br />

0.7642<br />

0.7939<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

Tavole<br />

3<br />

0.5120<br />

0.5517<br />

0.5910<br />

0.6293<br />

0.6664<br />

0.7019<br />

0.7357<br />

0.7673<br />

0.7967<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

4<br />

0.5160<br />

0.5557<br />

0.5948<br />

0.6331<br />

0.6700<br />

0.7054<br />

0.7389<br />

0.7704<br />

0.7995<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

1.0000<br />

Pr(z >zp ) = 1-Pr(z


6. TEST PER PROPORZIONI<br />

2. Confronto <strong>tra</strong> due o più<br />

<strong>proporzioni</strong>: la variabile casuale<br />

chi quadro<br />

In una s<strong>per</strong>imentazione clinica tesa a valutare<br />

l’effetto di un nuovo farmaco nel <strong>tra</strong>ttamento<br />

dell’infarto miocardico acuto, 80 pazienti sono<br />

stati assegnati casualmente al gruppo <strong>tra</strong>ttato<br />

con il farmaco in studio o al placebo<br />

Dopo 28 giorni dall’episodio di infarto (e<br />

dall’inizio dello specifico <strong>tra</strong>ttamento) 10 dei 40<br />

pazienti <strong>tra</strong>ttati con il farmaco sono deceduti,<br />

contro 15 decessi verificatisi nei 40 pazienti<br />

<strong>tra</strong>ttati con placebo<br />

Questa s<strong>per</strong>imentazione offre sufficienti<br />

evidenze che il nuovo farmaco sia<br />

efficace nel <strong>tra</strong>ttamento dell’infarto<br />

acuto?<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.19


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

E1. In una s<strong>per</strong>imentazione clinica tesa a<br />

valutare l’effetto di un nuovo farmaco nel<br />

<strong>tra</strong>ttamento dell’infarto miocardico acuto, 80<br />

pazienti sono stati assegnati casualmente al<br />

gruppo <strong>tra</strong>ttato con il farmaco in studio o al<br />

placebo<br />

Dopo 28 giorni dall’episodio di infarto (e<br />

dall’inizio dello specifico <strong>tra</strong>ttamento) 10 dei 40<br />

pazienti <strong>tra</strong>ttati con il farmaco sono deceduti,<br />

contro 15 decessi verificatisi nei 40 pazienti<br />

<strong>tra</strong>ttati con placebo<br />

deceduti<br />

vivi<br />

totale<br />

Tabella di contingenza 2 X 2<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

p 1 = 10 / 40 =<br />

= 0.250<br />

Pazienti di<br />

controllo<br />

10 15<br />

30 25<br />

40 40<br />

p 2 = 15 / 40 =<br />

= 0.375<br />

totale<br />

25<br />

55<br />

80<br />

Questa s<strong>per</strong>imentazione offre sufficienti evidenze<br />

che il nuovo farmaco sia efficace nel <strong>tra</strong>ttamento<br />

dell’infarto acuto?<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.20


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

Tabella di contingenza 2 X 2<br />

deceduti<br />

vivi<br />

totale<br />

p 1 = 10 / 40 =<br />

= 0.250<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

Pazienti di<br />

controllo<br />

10 15<br />

30 25<br />

40 40<br />

p 2 = 15 / 40 =<br />

= 0.375<br />

totale<br />

25<br />

55<br />

80<br />

p = 25 / 80 =<br />

= 0.3125<br />

Ci si aspetta che la mortal<strong>it</strong>à nei<br />

due gruppi differisca <strong>per</strong> effetto del<br />

caso (errore di campionamento) in<br />

assenza del quale:<br />

p 1 = p 2 = p = 0.3125<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.21


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

Tabella di contingenza 2 X 2<br />

deceduti<br />

vivi<br />

totale<br />

p 1 = 10 / 40 =<br />

= 0.250<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

sotto:<br />

Pazienti di<br />

controllo<br />

10 15<br />

30 25<br />

40 40<br />

p 2 = 15 / 40 =<br />

= 0.375<br />

H 0<br />

totale<br />

25<br />

55<br />

80<br />

p = 25 / 80 =<br />

= 0.3125<br />

π1 = π =<br />

2 π<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.22


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

Tabella di contingenza 2 X 2<br />

deceduti<br />

vivi<br />

totale<br />

p 1 = 10 / 40 =<br />

= 0.250<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

Pazienti di<br />

controllo<br />

10 15<br />

30 25<br />

40 40<br />

p 2 = 15 / 40 =<br />

= 0.375<br />

totale<br />

25<br />

55<br />

80<br />

p = 25 / 80 =<br />

= 0.3125<br />

Quanti pazienti <strong>tra</strong>ttati con il farmaco sarebbero<br />

morti se fossero sottoposti alla stessa mortal<strong>it</strong>à<br />

dell’intero gruppo s<strong>per</strong>imentale?<br />

40 . 0.3125 =<br />

deceduti<br />

vivi<br />

totale<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

12.5<br />

Pazienti di<br />

controllo<br />

40 40<br />

totale<br />

25<br />

55<br />

80<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.23


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

Tabella di contingenza 2 X 2<br />

deceduti<br />

vivi<br />

totale<br />

p 1 = 10 / 40 =<br />

= 0.250<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

Pazienti di<br />

controllo<br />

10 15<br />

30 25<br />

40 40<br />

p 2 = 15 / 40 =<br />

= 0.375<br />

totale<br />

25<br />

55<br />

80<br />

p = 25 / 80 =<br />

= 0.3125<br />

Quanti pazienti <strong>tra</strong>ttati con placebo sarebbero<br />

morti se fossero sottoposti alla stessa mortal<strong>it</strong>à<br />

dell’intero gruppo s<strong>per</strong>imentale?<br />

deceduti<br />

vivi<br />

totale<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

40 . 0.3125 =<br />

Pazienti di<br />

controllo<br />

12.5<br />

40 40<br />

totale<br />

25<br />

55<br />

80<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.24


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

Tabella di contingenza 2 X 2<br />

deceduti<br />

vivi<br />

totale<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

Pazienti di<br />

controllo<br />

10 15<br />

30 25<br />

40 40<br />

Tabella di contingenza 2 X 2<br />

deceduti<br />

vivi<br />

totale<br />

<strong>Test</strong> del<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

12.5<br />

27.5<br />

chi-quadrato<br />

Pazienti di<br />

controllo<br />

12.5<br />

40 40<br />

χ 2<br />

27.5<br />

Σ =<br />

g i<br />

Dati<br />

osservati<br />

totale<br />

25<br />

55<br />

80<br />

Dati<br />

attesi<br />

totale<br />

25<br />

55<br />

80<br />

(O i - E i) 2<br />

E i<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.25


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

+<br />

Dati<br />

osservati<br />

deceduti<br />

Dati<br />

attesi<br />

χ 2<br />

vivi<br />

totale<br />

deceduti<br />

vivi<br />

totale<br />

Σ =<br />

g i<br />

(15-12.5) 2<br />

12.5<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

Pazienti di<br />

controllo<br />

10 15<br />

30 25<br />

40 40<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

12.5<br />

27.5<br />

Pazienti di<br />

controllo<br />

12.5<br />

27.5<br />

40 40<br />

(O i - E i) 2<br />

E i<br />

(30-27.5) 2<br />

(10-12.5) 2<br />

(25-27.5) 2<br />

totale<br />

25<br />

55<br />

80<br />

totale<br />

25<br />

55<br />

80<br />

= +<br />

12.5<br />

+ + = 1.45<br />

27.5 27.5<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.26


Chi<br />

quadro<br />

gdl<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

6. TEST PER PROPORZIONI<br />

Distribuzione chi-quadrato<br />

…<br />

…<br />

…<br />

0.3<br />

1.07<br />

2.41<br />

3.66<br />

4.88<br />

6.06<br />

7.23<br />

0.25<br />

1.32<br />

2.77<br />

4.10<br />

<strong>5.</strong>39<br />

6.62<br />

7.84<br />

…<br />

…<br />

…<br />

0.05<br />

3.84<br />

<strong>5.</strong>99<br />

7.81<br />

9.49<br />

11.07<br />

12.59<br />

0.025<br />

<strong>5.</strong>02<br />

7.38<br />

9.34<br />

11.14<br />

12.83<br />

14.44<br />

0.01<br />

6.63<br />

9.21<br />

11.34<br />

13.28<br />

1<strong>5.</strong>09<br />

16.81<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.27


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

Perché 1 grado di libertà?<br />

Valore empirico: χ 2<br />

P-value =<br />

=<br />

1 1.45<br />

0.2 < Pr(χ 2 2>1.45 sotto H0) < 0.25<br />

> 0.05<br />

Dovremmo accettare l’ipotesi nulla<br />

(p > 0.05): le due <strong>proporzioni</strong> non<br />

differiscono significativamente<br />

Questa s<strong>per</strong>imentazione non offre sufficienti<br />

evidenze che il nuovo farmaco sia efficace nel<br />

<strong>tra</strong>ttamento dell’infarto acuto<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.28


Dati<br />

osservati<br />

deceduti<br />

vivi<br />

totale<br />

6. TEST PER PROPORZIONI<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

Pazienti di<br />

controllo<br />

10 15<br />

30 25<br />

40 40<br />

Se si fissano i totali di riga e di colonna<br />

(marginali) mi basta inserire il valore di<br />

una cella e le altre le trovo <strong>per</strong><br />

differenza<br />

deceduti<br />

vivi<br />

totale<br />

Pazienti <strong>tra</strong>ttati<br />

con il farmaco<br />

10<br />

Pazienti di<br />

controllo<br />

25-10=15<br />

40-10=30 40-15=25<br />

40 40<br />

Quindi ho solo 1 grado di libertà<br />

totale<br />

25<br />

55<br />

80<br />

totale<br />

25<br />

55<br />

80<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.29


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

In una s<strong>per</strong>imentazione clinica tesa a valutare<br />

l’effetto di due nuovi farmaci (A e B) nel<br />

<strong>tra</strong>ttamento dell’infarto miocardico acuto, 90<br />

pazienti furono assegnati casualmente al gruppo<br />

<strong>tra</strong>ttato con il farmaco A, al gruppo <strong>tra</strong>ttato con il<br />

farmaco B o al placebo<br />

Dopo 28 giorni dall’episodio di infarto (e<br />

dall’inizio dello specifico <strong>tra</strong>ttamento) 10 dei 30<br />

pazienti <strong>tra</strong>ttati con il farmaco A, 5 dei 30<br />

pazienti <strong>tra</strong>ttati con il farmaco B e 15 dei 30<br />

pazienti <strong>tra</strong>ttati con placebo sono deceduti<br />

deceduti<br />

vivi<br />

totale<br />

p A = 10 / 30 =<br />

= 0.333<br />

Tabella di contingenza 2 X 3<br />

Farmaco<br />

A<br />

Farmaco<br />

30 30 30<br />

totale<br />

30<br />

60<br />

90<br />

Questa s<strong>per</strong>imentazione offre sufficienti evidenze<br />

che i diversi <strong>tra</strong>ttamenti determinino diversi<br />

effetti sulla sopravvivenza?<br />

B<br />

Placebo<br />

10 5 15<br />

20 25 15<br />

p B = 5 / 30 =<br />

= 0.167<br />

p P = 15 / 30 =<br />

= 0.5<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.30


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

deceduti<br />

vivi<br />

totale<br />

p A = 10 / 30 =<br />

= 0.333<br />

π A<br />

Tabella di contingenza 2 X 3<br />

sotto:<br />

=<br />

Farmaco<br />

A<br />

Farmaco<br />

B<br />

Placebo<br />

10 5 15<br />

20 25 15<br />

30 30 30<br />

π B<br />

p B = 5 / 30 =<br />

= 0.167<br />

H 0<br />

= π p<br />

totale<br />

30<br />

60<br />

90<br />

p P = 15 / 30 =<br />

= 0.500<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.31<br />

=<br />

π<br />

30/90=0.333


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

Dati<br />

osservati<br />

deceduti<br />

vivi<br />

totale<br />

p A = 10 / 30<br />

= 0.333<br />

0.333 . 30 =<br />

deceduti<br />

vivi<br />

totale<br />

Farmaco<br />

A<br />

Farmaco<br />

B<br />

Placebo<br />

10 5 15<br />

20 25 15<br />

30 30 30<br />

p B = 5 / 30<br />

= 0.167<br />

p P = 15 / 30<br />

= 0.500<br />

Dati attesi sotto H 0<br />

0.333 . 30 =<br />

Farmaco<br />

A<br />

10<br />

20<br />

Farmaco<br />

B<br />

10<br />

20<br />

10<br />

30 30 30<br />

totale<br />

30<br />

60<br />

90<br />

p = 30 / 90<br />

= 0.333<br />

0.333 . 30 =<br />

Placebo<br />

20<br />

totale<br />

30<br />

60<br />

90<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.32


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

Dati<br />

osservati<br />

deceduti<br />

vivi<br />

totale<br />

Dati<br />

attesi<br />

deceduti<br />

vivi<br />

totale<br />

χ g<br />

2<br />

Σ =<br />

i<br />

Farmaco<br />

A<br />

Farmaco<br />

B<br />

Placebo<br />

10 5 15<br />

20 25 15<br />

30 30 30<br />

Farmaco<br />

2<br />

A<br />

10 10 10<br />

20<br />

30 30 30<br />

(O i - E i) 2<br />

E i<br />

Farmaco<br />

B<br />

20<br />

Placebo<br />

= 6.11<br />

20<br />

totale<br />

30<br />

60<br />

90<br />

totale<br />

30<br />

60<br />

90<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.33


6. CONFRONTO TRA 6. TEST PROPORZIONI PER PROPORZIONI DI DUE O PIÙ CAMPIONI<br />

INDIPENDENTI<br />

Perché 2 gradi di libertà?<br />

Valore empirico: χ 2<br />

P-value =<br />

=<br />

2 6.11<br />

0.025< Pr(χ 2 2>6.11 sotto H 0) < 0.05<br />

< 0.05<br />

Dovremmo rigettare l’ipotesi nulla<br />

(p < 0.05): le tre <strong>proporzioni</strong><br />

differiscono significativamente<br />

Questa s<strong>per</strong>imentazione offre sufficienti evidenze<br />

che il diverso <strong>tra</strong>ttamento determina diverse<br />

mortal<strong>it</strong>à nei pazienti con infarto acuto<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.34


Dati<br />

osservati<br />

deceduti<br />

vivi<br />

totale<br />

6. TEST PER PROPORZIONI<br />

Farmaco<br />

A<br />

Farmaco<br />

B<br />

Placebo<br />

10 5 15<br />

20 25 15<br />

30 30 30<br />

totale<br />

In questo caso una cella non è sufficiente <strong>per</strong><br />

ottenere tutte le altre <strong>per</strong> differenza. Ne<br />

servono 2<br />

Dati<br />

osservati<br />

deceduti<br />

vivi<br />

totale<br />

Farmaco<br />

A<br />

Farmaco<br />

B<br />

Placebo<br />

10 5 30-10-5=15<br />

30-10=20 30-5=25 30-15=15<br />

30 30 30<br />

Quindi ho 2 gradi di libertà<br />

In generale i gdl si ottengono come<br />

(n.righe-1)*(n.colonne-1)<br />

30<br />

60<br />

90<br />

totale<br />

30<br />

60<br />

90<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.35


6. TEST PER PROPORZIONI<br />

ESERCIZIO di RIEPILOGO 1<br />

In una popolazione di bambini in età<br />

prescolare si vuole verificare se la<br />

<strong>per</strong>centuale di bambini affetti da dislessia<br />

è pari al 10%. Per questo motivo si es<strong>tra</strong>e<br />

un campione di 200 bambini e si ottiene<br />

che quelli dislessici sono 40. Saggiare<br />

l’ipotesi nulla<br />

ESERCIZIO di RIEPILOGO 2<br />

Si vuole verificare se l’effetto di tre diete è<br />

equivalente nel ridurre il peso in una<br />

popolazione di bambini. A tal fine si<br />

es<strong>tra</strong>ggono 3 <strong>campioni</strong> di 20, 30 e 40<br />

bambini e si assegna loro rispettivamente<br />

la dieta A, B e C. Definiamo che la dieta<br />

ha effetto se riduce il peso di almeno 5<br />

Kg. Il numero di riduzioni di peso nei tre<br />

<strong>campioni</strong> è rispettivamente 10, 12 e 18<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.36


6. TEST PER PROPORZIONI<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.37


6. TEST PER PROPORZIONI<br />

ESERCIZIO di RIEPILOGO 2<br />

Si vuole verificare se l’effetto di tre diete è<br />

equivalente nel ridurre il peso in una<br />

popolazione di bambini. A tal fine si<br />

es<strong>tra</strong>ggono 3 <strong>campioni</strong> di 20, 30 e 40<br />

bambini e si assegna loro rispettivamente<br />

la dieta A, B e C. Definiamo che la dieta<br />

ha effetto se riduce il peso di almeno 5<br />

Kg. Il numero di riduzioni di peso nei tre<br />

<strong>campioni</strong> è rispettivamente 10, 12 e 18<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.38


6. TEST PER PROPORZIONI<br />

3. <strong>Test</strong> <strong>per</strong> la bontà di adattamento di una<br />

distribuzione di probabil<strong>it</strong>à ad una<br />

distribuzione empirica: il caso di<br />

probabil<strong>it</strong>à teorica<br />

Dalla teoria mendeliana:<br />

Baccelli verdi e lisci<br />

Rugosi e<br />

verdi (RV)<br />

1/16<br />

Baccelli gialli<br />

e rugosi<br />

Lisci e<br />

verdi (LV)<br />

3/16<br />

Rugosi e<br />

gialli (RG)<br />

3/16<br />

Lisci e<br />

gialli (LG)<br />

9/16<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.39


Rugosi e<br />

verdi (RV)<br />

1/16<br />

6. TEST PER PROPORZIONI<br />

Distribuzione teorica<br />

Lisci e<br />

verdi (LV)<br />

3/16<br />

Rugosi e<br />

gialli (RG)<br />

3/16<br />

Lisci e<br />

gialli (LG)<br />

9/16<br />

Da un campione di 160 incroci si ottengono<br />

i seguenti risultati:<br />

Rugosi e<br />

verdi (RV)<br />

8<br />

Lisci e<br />

verdi (LV)<br />

32<br />

N=160<br />

Rugosi e<br />

gialli (RG)<br />

27<br />

Lisci e<br />

gialli (LG)<br />

I dati supportano la teoria mendeliana?<br />

93<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.40


6. TEST PER PROPORZIONI<br />

Vogliamo testare la seguente ipotesi<br />

H 0 : p 1 =1/16, p 2 =3/16, p 3 =3/16, p 4 =9/16<br />

RV<br />

Se H 0 è vera:<br />

10<br />

LV<br />

30<br />

160 . 1<br />

16 =10 3<br />

160 .<br />

16<br />

=30<br />

RG<br />

30<br />

3<br />

160 .<br />

16<br />

=30<br />

Utilizziamo nuovamentre la <strong>statistica</strong> chi<br />

quadrato<br />

<strong>Test</strong> del<br />

chi-quadrato<br />

χ 2<br />

Σ =<br />

g i<br />

LG<br />

90<br />

(O i - E i) 2<br />

9<br />

160 .<br />

16 =90<br />

E i<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.41


+<br />

Rugosi e<br />

verdi (RV)<br />

(32-30) 2<br />

30<br />

8<br />

RV<br />

10<br />

6. TEST PER PROPORZIONI<br />

Valori osservati<br />

Lisci e<br />

verdi (LV)<br />

32<br />

(27-30) 2<br />

Rugosi e<br />

gialli (RG)<br />

27<br />

Valori attesi sotto H0<br />

LV<br />

30<br />

χ 3 2<br />

RG<br />

30<br />

(8-10) 2<br />

= +<br />

10<br />

(93-90) 2<br />

Lisci e<br />

gialli (LG)<br />

93<br />

LG<br />

90<br />

+ + = 0.93<br />

30<br />

90<br />

I gradi di libertà sono ncat-1<br />

(nel nostro caso 4-1=3)<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.42


gdl<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

6. TEST PER PROPORZIONI<br />

Distribuzione chi-quadrato<br />

0.9<br />

0.0158<br />

0.2107<br />

0.5844<br />

1.0636<br />

1.6103<br />

2.2041<br />

0.8<br />

0.0642<br />

0.4463<br />

1.0052<br />

1.6488<br />

2.3425<br />

3.0701<br />

0.7<br />

0.1485<br />

0.7133<br />

1.4237<br />

2.1947<br />

2.9999<br />

3.8276<br />

0.6<br />

0.2750<br />

1.0217<br />

1.8692<br />

2.7528<br />

3.6555<br />

4.5702<br />

Il Pvalue è compreso <strong>tra</strong> questi due<br />

valori<br />

P-value = Pr(χ 2 3>0.93 sotto H 0) ≈ 0.85<br />

> 0.05<br />

Non abbiamo abbastanza evidenza <strong>per</strong><br />

rifiutare H0 MARTA BLANGIARDO – TEST PER PROPORZION - 6.43


6. TEST PER PROPORZIONI<br />

4. <strong>Test</strong> <strong>per</strong> la bontà di adattamento di una<br />

distribuzione di probabil<strong>it</strong>à ad una<br />

distribuzione empirica: il caso di<br />

probabil<strong>it</strong>à stimata<br />

Stima dei parametri della popolazione<br />

partendo dai dati campionari<br />

Assunzioni sulla forma della<br />

distribuzione dei parametri<br />

E’ utile verificare tali assunzioni valutando<br />

quanto i valori osservati si discostano dalla<br />

distribuzione teorica<br />

Confronto <strong>tra</strong>m<strong>it</strong>e chi quadrato delle<br />

frequenze osservate e attese sotto la<br />

distribuzione teorica<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.44


6. TEST PER PROPORZIONI<br />

S<strong>tra</strong>tegia:<br />

1) Scelta della distribuzione di probabil<strong>it</strong>à<br />

adatta a descrivere il fenomeno in studio<br />

2) Calcolo delle probabil<strong>it</strong>à associate ai<br />

valori che la variabile in studio assume nel<br />

campione<br />

3) Calcolo delle frequenze attese π i . O<br />

4) Valutazione <strong>tra</strong>m<strong>it</strong>e chi quadrato delle<br />

discrepanze <strong>tra</strong> frequenze osservate (O i )<br />

ed attese π i .O<br />

χ 2<br />

= Σ (O i – π i O) 2<br />

g<br />

π i O<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.45


6. TEST PER PROPORZIONI<br />

Verifica dell’adattamento ad una<br />

distribuzione Binomiale<br />

Sono stati raccolti i dati relativi al numero<br />

di figlie femmine in 103 famiglie di 4 figli. Il<br />

rapporto <strong>tra</strong> maschi e femmine è atteso di<br />

½:½.<br />

1) Scelta della distribuzione di probabil<strong>it</strong>à<br />

adatta a descrivere il fenomeno in studio<br />

Variabile casuale<br />

dicotomica<br />

Successo:<br />

figlia femmina<br />

Variabile casuale teorica:<br />

Binomiale<br />

X~Binom(n,p) X~Binom(4,0.5)<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.46


50<br />

45<br />

40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

Osservati<br />

6. TEST PER PROPORZIONI<br />

2) Sappiamo che π i =0.5 sotto H 0<br />

Valori osservati nel campione<br />

X<br />

0<br />

1<br />

2<br />

3<br />

4<br />

Oi 5<br />

24<br />

44<br />

19<br />

11<br />

1 2 3 4 5<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.47


6. TEST PER PROPORZIONI<br />

3) Calcolo delle probabil<strong>it</strong>à associate ai<br />

valori che la variabile in studio assume<br />

nel campione<br />

P(X=x) =<br />

X<br />

0<br />

1<br />

2<br />

3<br />

4<br />

O i<br />

5<br />

24<br />

44<br />

19<br />

11<br />

4<br />

x<br />

0.5x (1-0.5) 4-x<br />

π i<br />

(1/2) 4 =0.0625<br />

4 . (1/2) 1. (1/2) 3 = 0.25<br />

6 . (1/2) 2. (1/2) 2 = 0.375<br />

4 . (1/2) 3. (1/2) 1 = 0.25<br />

(1/2) 4. (1/2) 0 = 0.0625<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.48


50<br />

45<br />

40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

X<br />

0<br />

1<br />

2<br />

3<br />

4<br />

Osservati<br />

Attesi<br />

6. TEST PER PROPORZIONI<br />

4) Calcolo delle frequenze attese π i . O<br />

O i<br />

5<br />

24<br />

44<br />

19<br />

11<br />

π i<br />

(1/2) 4 =0.0625<br />

4 . (1/2) 1. (1/2) 3 = 0.25<br />

6 . (1/2) 2. (1/2) 2 = 0.375<br />

4 . (1/2) 3. (1/2) 1 = 0.25<br />

(1/2) 4. (1/2) 0 = 0.0625<br />

π i .O<br />

0.0625 . 103=6.44<br />

0. 25 . 103=2<strong>5.</strong>75<br />

0.375 . 103=38.62<br />

0.25 . 103=2<strong>5.</strong>75<br />

0.0625 . 103=6.44<br />

1 2 3 4 5<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.49


+<br />

=<br />

6. TEST PER PROPORZIONI<br />

5) Valutazione <strong>tra</strong>m<strong>it</strong>e chi quadrato delle<br />

discrepanze <strong>tra</strong> frequenze osservate (O i )<br />

ed attese π i .O<br />

(5-6.44) 2<br />

6.44<br />

χ 2<br />

(19-2<strong>5.</strong>75) 2<br />

2<strong>5.</strong>75<br />

= Σ (O i – π i O) 2<br />

+<br />

g<br />

(24-2<strong>5.</strong>75) 2<br />

2<strong>5.</strong>75<br />

(11-6.44) 2<br />

π i O<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.50<br />

+<br />

(44-38.62) 2<br />

38.62<br />

+ = 6.191<br />

6.44<br />

P-value = Pr(χ 2 4>6.191 sotto H 0) ≈ 0.18<br />

> 0.05<br />

Il numero di gdl è ncat-1 = 5 - 1 = 4<br />

Da excel:<br />

=DISTRIB.CHI(6.191,4)


6. TEST PER PROPORZIONI<br />

Possiamo concludere che la<br />

differenza <strong>tra</strong> la distribuzione<br />

osservata e quella teorica<br />

(Binomiale di parametro 0.5 in 4<br />

prove) non è significativa<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.51


6. TEST PER PROPORZIONI<br />

Verifica dell’adattamento ad una<br />

distribuzione Poisson<br />

Si desidera conoscere la distribuzione di<br />

una variante rara di una certa pianta in una<br />

determinata regione. Per fare cio’ la<br />

regione viene suddivisa in aree di uguale<br />

grandezza e si conta il numero di elementi<br />

della variante in studio.<br />

1) Scelta della distribuzione di probabil<strong>it</strong>à<br />

adatta a descrivere il fenomeno in studio<br />

Variabile casuale<br />

discreta, ma<br />

NON<br />

dicotomica<br />

Evento<br />

RARO<br />

Variabile casuale teorica:<br />

Poisson<br />

X~Poisson(λ)<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.52


6. TEST PER PROPORZIONI<br />

Distribuzione Poisson<br />

Caratterizzata da<br />

un parametro<br />

X~Poisson(5)<br />

E(X)=5<br />

Var(X)=5<br />

X~Poisson(λ)<br />

E(X) = λ<br />

Var(X) = λ<br />

Distribuzone usata<br />

<strong>per</strong> gli eventi rari<br />

X~Poisson(3)<br />

E(X)=3<br />

Var(X)=3<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.53


45<br />

40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

6. TEST PER PROPORZIONI<br />

2) Non conosciamo i valori di π i nella<br />

popolazione: dobbiamo stimarli<br />

5<br />

0<br />

Valori osservati nel campione<br />

X<br />

0<br />

1<br />

2<br />

3<br />

>3<br />

Oi 39<br />

34<br />

13<br />

0 1 2 3<br />

Osservati<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.54<br />

1<br />

0


6. TEST PER PROPORZIONI<br />

2) Non conosciamo i valori di π i nella<br />

popolazione: dobbiamo stimarli<br />

Una stima di λ è<br />

x (media campionaria):<br />

x =<br />

Σx iO i<br />

ΣO i<br />

x = 39 . 0 + 34 . 1 + 13 . 2 + 1 . 3 = 0.7241<br />

87<br />

X~Poisson(0.7241)<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.55


X<br />

0<br />

1<br />

2<br />

3<br />

>3<br />

O i<br />

39<br />

34<br />

13<br />

1<br />

0<br />

6. TEST PER PROPORZIONI<br />

3) Calcolo delle probabil<strong>it</strong>à associate ai<br />

valori che la variabile in studio assume<br />

nel campione<br />

X~Poisson(0.7241)<br />

P(X=x) = λx e -λ<br />

π i<br />

e -0.7241 =0.4847<br />

x!<br />

e -0.7241. (0.7241) 1 = 0.3510<br />

e -0.7241. (0.7241) 2 /2=0.1271<br />

e -0.7241. (0.7241) 3 /6=0.0306<br />

1-0.4847- 0.3510-0.1271-<br />

0.0306 = 0.0065<br />

0.7241 0 e -0.7241<br />

0!<br />

=1<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.56


X<br />

0<br />

1<br />

2<br />

3<br />

>3<br />

45<br />

40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

6. TEST PER PROPORZIONI<br />

4) Calcolo delle frequenze attese π i . O<br />

O i<br />

39<br />

34<br />

13<br />

1<br />

0<br />

Osservati<br />

Attesi<br />

π i<br />

e -0.7241 =0.4847<br />

e -0.7241. (0.7241) 1 =<br />

0.3510<br />

e -0.7241.<br />

(0.7241) 2 /2=0.1271<br />

e -0.7241.<br />

(0.7241) 3 /6=0.0306<br />

1-0.4847- 0.3510-0.1271-<br />

0.0306 = 0.0065<br />

π i .O<br />

0.4847 . 87=42.17<br />

0.3510 . 87=30.54<br />

0.1271 . 87=11.06<br />

0.0306 . 87=2.66<br />

0.0625 . 87=0.54<br />

0 1 2 3 >3<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.57


+<br />

=<br />

6. TEST PER PROPORZIONI<br />

5) Valutazione <strong>tra</strong>m<strong>it</strong>e chi quadrato delle<br />

discrepanze <strong>tra</strong> frequenze osservate (O i )<br />

ed attese π i .n (o p i .n se i parametri sono<br />

ignoti nella popolazione)<br />

(39-42.17) 2<br />

42.17<br />

(1-2.66) 2<br />

2.66<br />

χ 2<br />

= Σ (O i – π i O) 2<br />

+<br />

g<br />

(34-30.54) 2<br />

30.54<br />

(0-0.54) 2<br />

π i O<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.58<br />

+<br />

(13-11.06) 2<br />

11.06<br />

+ = 2.5095<br />

0.54<br />

P-value = Pr(χ 2 3>2.5094 sotto H 0) ≈ 0.47<br />

> 0.05<br />

Il numero di gdl è n.cat-2 = 5 - 2 = 3<br />

Da excel:<br />

=DISTRIB.CHI(2.5094,3)


6. TEST PER PROPORZIONI<br />

Possiamo concludere che la<br />

differenza <strong>tra</strong> la distribuzione<br />

osservata e quella teorica<br />

(Poisson di parametro 0.7241)<br />

non è significativa<br />

PROBLEMA: come mai abiamo usato<br />

un chi quadro con 3 gradi di libertà?<br />

Il numero di gdl è n.cat-2 = 5 - 2 = 3<br />

???<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.59


6. TEST PER PROPORZIONI<br />

Abbiamo visto precedentemente che i<br />

gradi di libertà erano calcolati come<br />

•N.obs-1 (nel caso della T di Student)<br />

•N.cat-1<br />

•(n.righe-1)(n.col-1)<br />

Nel caso del chi<br />

quadro<br />

In questo caso abbiamo un ulteriore vincolo<br />

dato dal fatto che DOBBIAMO stimare λ<br />

<strong>tra</strong>m<strong>it</strong>e i dati campionari (y). Quindi:<br />

1. ΣO i=O<br />

2. Σx iO i= y<br />

ΣO i<br />

gdl = n.cat - 2<br />

Una regola universale: il numero di gradi di libertà è<br />

sempre uguale al numero di osservazioni MENO il<br />

numero di relazioni <strong>tra</strong> le osservazioni che abbiamo la<br />

necess<strong>it</strong>à di ottenere<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.60


6. TEST PER PROPORZIONI<br />

Verifica dell’adattamento ad una<br />

distribuzione Normale<br />

In un campione di piante da fiore viene<br />

misurata la lunghezza della corolla (in mm);<br />

si desidera conoscere la sua distribuzione.<br />

1) Scelta della distribuzione di probabil<strong>it</strong>à<br />

adatta a descrivere il fenomeno in studio<br />

Variabile casuale<br />

continua<br />

X~N(μ,σ 2 )<br />

Ci si aspetta<br />

simmetria<br />

nella<br />

distribuzione<br />

Variabile casuale teorica:<br />

Normale<br />

f<br />

( x)<br />

=<br />

2πσ<br />

( x−μ<br />

)<br />

−<br />

2<br />

2σ<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.61<br />

1<br />

2<br />

⋅e<br />

2


X~N(μ,σ 2 )<br />

Z~N(0,1)<br />

6. TEST PER PROPORZIONI<br />

f ( x)<br />

=<br />

Standardizzazione<br />

f<br />

( z)<br />

2πσ<br />

( x−μ)<br />

−<br />

2<br />

2σ<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.62<br />

1<br />

1<br />

2<br />

2π<br />

⋅e<br />

⋅e<br />

Per standardizzare devo stimare μ e σ 2 dal<br />

campione:<br />

μ<br />

σ 2<br />

x =<br />

s 2 =<br />

Σx iO i<br />

ΣO i<br />

Σ(x i-x) 2 O i<br />

(ΣO i)-1<br />

=<br />

= 67.45<br />

= 8.6136<br />

z<br />

−<br />

2<br />

2<br />

2


6. TEST PER PROPORZIONI<br />

Verifica dell’adattamento ad una<br />

Distribuzione normale standardizzata<br />

distribuzione Normale<br />

1<br />

0<br />

1. Suddividere l’intero campo di variazione<br />

in intervalli. E’ conveniente che il valore<br />

cen<strong>tra</strong>le sia un numero intero.<br />

2. Calcolare la frequenza osservata in ogni<br />

classe<br />

xa -| xb 59.5-|62.5<br />

62.5-|6<strong>5.</strong>5<br />

6<strong>5.</strong>5-|68.5<br />

68.5-|71.5<br />

71.5-|74.5<br />

(x a +x b )/2<br />

61<br />

64<br />

67<br />

70<br />

73<br />

Oi 5<br />

18<br />

42<br />

27<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.63<br />

8<br />

z


6. TEST PER PROPORZIONI<br />

3. Standardizzare usando l’estremo<br />

su<strong>per</strong>iore di ogni classe<br />

xa -| xb 59.5-|62.5<br />

62.5-|6<strong>5.</strong>5<br />

6<strong>5.</strong>5-|68.5<br />

68.5-|71.5<br />

71.5-|74.5<br />

f<br />

( z)<br />

(x a +x b )/2<br />

61<br />

64<br />

67<br />

70<br />

73<br />

=<br />

62.5-67.45<br />

2.93<br />

O i<br />

5<br />

18<br />

42<br />

27<br />

8<br />

1<br />

2π<br />

⋅e<br />

z<br />

−<br />

2<br />

-1.69<br />

-0.66<br />

0.36<br />

1.38<br />

oo<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.64<br />

2<br />

z


6. TEST PER PROPORZIONI<br />

4. Determinare la funzione cumulata I<br />

corrispondenza dei lim<strong>it</strong>i su<strong>per</strong>iori di ogni<br />

classe (<strong>per</strong> l’ultima classe porre=1)<br />

xa -| xb 59.5-|62.5<br />

62.5-|6<strong>5.</strong>5<br />

6<strong>5.</strong>5-|68.5<br />

68.5-|71.5<br />

71.5-|74.5<br />

(x a +x b )/2<br />

61<br />

64<br />

67<br />

70<br />

73<br />

Oi 5<br />

18<br />

42<br />

27<br />

8<br />

z<br />

-1.69<br />

-0.66<br />

0.36<br />

1.38<br />

oo<br />

Fi 0.0455<br />

0.2546<br />

0.6406<br />

0.9126<br />

1.0000<br />

Usando le tavole<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.65


6. TEST PER PROPORZIONI<br />

<strong>5.</strong> Per differenze determinare le frequenze<br />

attese relative π i<br />

x a -| x b<br />

59.5-|62.5<br />

62.5-|6<strong>5.</strong>5<br />

6<strong>5.</strong>5-|68.5<br />

68.5-|71.5<br />

71.5-|74.5<br />

(x a +x b )/2<br />

61<br />

64<br />

67<br />

70<br />

73<br />

F i – F i-1<br />

O i<br />

5<br />

18<br />

42<br />

27<br />

8<br />

z<br />

-1.69<br />

-0.66<br />

0.36<br />

1.38<br />

oo<br />

0.0455<br />

0.2546<br />

0.6406<br />

0.9126<br />

1.0000<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.66<br />

F i<br />

π i<br />

0.0455<br />

0.2091<br />

0.3860<br />

0.2756<br />

0.0838


6. TEST PER PROPORZIONI<br />

6. Calcolare le frequenze attese π i O<br />

x a -| x b20<br />

59.5-|62.5<br />

62.5-|6<strong>5.</strong>5<br />

6<strong>5.</strong>5-|68.5<br />

68.5-|71.5<br />

71.5-|74.5<br />

(x a +x b )/2<br />

61<br />

64<br />

67<br />

70<br />

73<br />

O i<br />

5<br />

18<br />

42<br />

27<br />

8<br />

z<br />

-1.69<br />

-0.66<br />

0.36<br />

1.38<br />

oo<br />

0.0455<br />

0.2546<br />

0.6406<br />

0.9126<br />

1.0000<br />

0.0455<br />

0.2091<br />

0.3860<br />

0.2756<br />

0.0838<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.67<br />

F i<br />

π i<br />

π i O<br />

4.55<br />

20.91<br />

38.60<br />

27.56<br />

8.38


6. TEST PER PROPORZIONI<br />

6. Confrontare le frequenze osservate e<br />

attese <strong>tra</strong>m<strong>it</strong>e il chi quadro<br />

+<br />

=<br />

(5-4.55) 2<br />

4.55<br />

χ 2<br />

(27-27.56) 2<br />

27.56<br />

= Σ (O i – π i O) 2<br />

+<br />

g<br />

(18-20.91) 2<br />

20.91<br />

(8-8.38) 2<br />

π i O<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.68<br />

+<br />

(42-38.60) 2<br />

38.60<br />

+ = 0.777<br />

8.38<br />

Il numero di gdl è n.cat-3 = 5 - 3 = 2<br />

Da excel:<br />

=DISTRIB.CHI(2.5094,2)<br />

P-value = Pr(χ 2 2>0.777 sotto H 0) ≈ 0.67<br />

> 0.05


6. TEST PER PROPORZIONI<br />

Possiamo concludere che la<br />

differenza <strong>tra</strong> la distribuzione<br />

osservata e quella teorica<br />

(Normale di parametri μ=67.45 e<br />

σ=2.93) non è significativa<br />

MARTA BLANGIARDO – TEST PER PROPORZION - 6.69

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!