Analisi della varianza - Marco Vicentini

Facoltà di Psicologia 

Università di Padova 

Anno Accademico 2010-‐2011 

Corso di Psicometria - Modulo B 

Dott. Marco Vicentini 

marco.vicentini@unipd.it 

Rev. 19/01/2011

¡� Confronto tra medie di due campioni 

indipendenti 

¡� Analisi della Varianza 

§� Il calcolo della devianza 

§� Le fonti di variabilità e/o errore 

§� La distribuzione F e la sua significatività 

§� Confronti a coppie 

¡� Analisi della varianza con più livelli e fattori

Un esempio numerico 

3

¡� Poniamo di aver raccolto dei 

dati da un campione A e un 

campione B indipendenti. 

¡� Vogliamo verificare se i due 

campioni appartengono ad 

una popolazione con la 

medesima media. 

A 

1 

5 

4 

3 

2 

B 

6 

5 

4 

7 

8 

4

¡� Prepariamo le informazioni necessarie al 

calcolo della varianza di A e B: 

A 

1 

5 

4 

3 

2 

A 2 

1 

25 

16 

9 

4 

B 

6 

5 

4 

7 

8 

B 2 

36 

25 

16 

49 

81 

Σ 15 55 30 190 

n = 5 

A = 3 

B = 6 

5

¡� Come primo passo è sempre necessario 

verificare l’omogeneità delle varianze, 

tramite il test F, con d a =4 e d b =4. 

2 

! ˆ1 

= 

( ) 2 

X 2 

! " ! X 

n "1 

2 190 " 30 

! ˆ 2 = 

2 

! 1 

2 

! 2 

Fc = ˆ 

ˆ 

( ) 2 

5"1 

5 

= 2.5 

2.5 =1.00 

n 

= 2.5 

= 55" 15 

( ) 2 

5"1 

5 

= 2.5 

6

¡� Per individuare il valore critico di F per df a = 4 

e df b = 4 si procede: 

1 

2 

.. 

.. 

4 

.. 

df - numeratore 

2 3 4 5 

6.39 

15.98 

Valore critico con 

significatività 0.05 



7

¡� Il valore critico per α=.05 con d a =4 e d b =4 per 

la statistica F è 6.39. 

¡� Non possiamo rigettare l’ipotesi H 0 in quanto 

il valore calcolato F cal = 1.00 è minore del 

valore critico F c = 6.39. 

¡� Possiamo concludere che le varianze dei due 

campioni sono omogenee. 

8

¡� Procediamo con il calcolo della statistica t per il 

confronto tra medie, calcolando la stima della 

deviazione standard della distribuzione 

campionaria della differenza tra le medie: 

ˆ 

! x1!x 2 = 

ˆ 

! x1!x 2 = 

2 

! ˆ1 

n1 !1 

( ) + ˆ 

n 1 + n 2 ! 2 

2.5" 4 + 2.5" 4 

5+ 5! 2 

2 

! 2 

n2 !1 

( ) 

1 

5 

+ 1 

5 

" 

1 

n 1 

= 5 

2 

+ 1 

n 2 

= 

2 

5 =1 

9

¡� La statistica t per il confronto tra medie con 

gradi di libertà d= 5+5-‐2 = 8 assume il valore: 

t c = X 1 ! X 2 

ˆ 

! x1!x 2 

= 3! 6 

1.00 

= !3 

1.00 

= !3.00 

¡� Per α=0.05 e d=8 il valore t crit =2.31. 

¡� Essendo t crit

¡� Vedremo di seguito come il test-‐t applicato al 

confronto tra medie non rappresenta che un 

caso particolare dell’Analisi della Varianza. 

11

Modello teorico 

12

¡� L'analisi sta*s*ca più diffusa per i disegni sperimentali 

un cui viene manipolata una variabile indipendente VI 

somministrata a sogge7 diversi, assegna* 

casualmente a diversi gruppi di tra9amento, 

§� I gruppi possono essere chiama* anche livelli del fa2ore. 

¡� Consente di definire un indice empirico dell'effe9o 

della VI, e di paragonare questo indice alla 

distribuzione di Fischer che si riscontrano quando 

l'ipotesi nulla è vera 

§� Ovvero vi è l’assenza di effe7 del tra9amento. 

13

¡� Il calcolo dell'indice o rapporto F di Fisher si 

effe9ua mediante l'Analisi della Varianza 

(ANOVA) che consente di verificare le ipotesi 

paragonando gli indici di variabilità e 

precisamente le varianze. 

14

¡� Ciascun soggetto contribuisce a determinare 

tre devianze: 

§� uno scarto dalla media generale 

▪ Variabilità totale dei dati osservati (SS T ) 

§� uno scarto dalla media del suo gruppo 

▪ Variabilità non spiegata dall’appartenenza al gruppo (SS err ) 

§� uno scarto fra la media del suo gruppo e la media 

generale 

▪ Variabilità spiegata dalla suddivisione in gruppi o dal 

fattore a più livelli (SS F ) 

15

A! B = 4.5 

A = 3 B = 6 

1 2 3 4 5 6 7 8 

Fattore F, 

Livelli A e B 

A 

1 

5 

4 

3 

2 

A! B 

B 

6 

5 

4 

7 

8 

16

Variabilità tra i gruppi 

A! B = 4.5 

A = 3 B = 6 

1 2 3 4 5 6 7 8 

Variabilità entro i gruppi 

Fattore F, 

Livelli A e B 

A 

1 

5 

4 

3 

2 

A! B 

B 

6 

5 

4 

7 

8 

17

Variabilità tra i gruppi 

A! B = 4.5 

A = 3 B = 6 

1 2 3 4 5 6 7 8 

! 

Variabilità entro i gruppi 

d( a;AB) 

= d( a;A) 

+ d( A;AB) 

Lo scarto di ogni dato dalla media 

generale (Y i -‐ Y T ) può essere 

scomposto in due par*: 

1. La deviazione rispe9o alla 

media del suo gruppo (Y i -‐ Y A ) 

2. la deviazione tra la media del 

suo gruppo e la media generale 

(Y A – Y T ) 

18

¡� Dato un insieme AUB, è 

possibile individuare: 

A 

1 

5 

4 

3 

2 

A = 3 

B = 6 

A! B = 4.5 

A i -‐A 

-‐2 

2 

1 

0 

-‐1 

B 

6 

5 

4 

7 

8 

B i -‐B 

0 

-‐1 

-‐2 

1 

2 

AB 

1 

5 

4 

3 

2 

6 

5 

4 

7 

8 

AB i -‐AB 

-‐3.5 

0.5 

-‐0.5 

-‐1.5 

-‐2.5 

1.5 

0.5 

-‐0.5 

2-‐5 

3.5 

19

¡� Da cui si calcolano le sommatorie dei quadrati degli 

scarti rispetto alla media: 

A 

1 

5 

4 

3 

2 

A i -‐A Δ 2 

-‐2 4 

2 4 

1 1 

0 0 

-‐1 1 

B 

6 

5 

4 

7 

8 

B i -‐B Δ 2 

0 0 

-‐1 1 

-‐2 4 

1 1 

2 4 

Σ 10 10 

AB 

1 

5 

4 

3 

2 

6 

5 

4 

7 

8 

AB i -‐AB Δ 2 

-‐3.5 12.25 

0.5 0.25 

-‐0.5 0.25 

-‐1.5 2.25 

-‐2.5 6.25 

1.5 2.25 

0.5 0.25 

-‐0.5 0.25 

2-‐5 6.25 

3.5 12.25 

42.5 

20

¡� Dato un insieme AUB, è quindi possibile 

individuare: 

( Ai ! A) 

2 

" = A 2 " ! A 

( Bi ! B) 

2 

" = B 2 " ! B 

" n = 10 

" n = 10 

( ABi ! AB) 

2 

" = AB 2 " ! AB 

" n = 42.5 

¡� Si veda anche il metodo di calcolo riportato in: 

anova-‐ss.docx 

21

¡� Chiameremo: 

A 

1 

5 

4 

3 

2 

A i -‐A Δ 2 

-‐2 4 

2 4 

1 1 

0 0 

-‐1 1 

SSerr = 10 + 10 

SS tot = 42.5 

B 

6 

5 

4 

7 

8 

B i -‐B Δ 2 

0 0 

-‐1 1 

-‐2 4 

1 1 

2 4 

10 10 

SSF = 42.5 - ( 10 + 10 

= 

22.5 

) 

AB 

1 

5 

4 

3 

2 

6 

5 

4 

7 

8 


-‐3.5 12.25 

0.5 0.25 

-‐0.5 0.25 

-‐1.5 2.25 

-‐2.5 6.25 

1.5 2.25 

0.5 0.25 

-‐0.5 0.25 

2-‐5 6.25 

3.5 12.25 

42.5 

AB 

3 

3 

3 

3 

3 

6 

6 

6 

6 

6 


-‐1.5 2.25 

-‐1.5 2.25 

-‐1.5 2.25 

-‐1.5 2.25 

-‐1.5 2.25 

1.5 2.25 

1.5 2.25 

1.5 2.25 

1.5 2.25 

1.5 2.25 

22.5 

22

¡� SS err : la somma delle variabilità entro i gruppi 

▪ chiamata anche variabilità non spiegata, o errore. 

SSerr = ( Ai ! A) 

2 

" + ( Bi ! B) 

2 

" 

¡� SS tot : la variabilità totale 

SStot = ( ABi ! AB) 

2 

" 

= 42.5 

=10 +10 = 20 

¡� SS F : la variabilità tra i gruppi 

▪ variabilità dovuta al fattore, ottenuta anche come differenza 

tra la variabilità totale e la variabilità non spiegata. 

( ) 2 

" + " Bi ! AB 

SS F = A i ! AB 

( ) 2 

= SS tot ! SS err = 42.5! 20 = 22.5 

= n a #A 2 + n b #B 2 = 

23

¡� Medesimi risultati possono essere ottenuti 

attraverso la formula semplificata: ( X i " X ) 2 

A 

1 

5 

4 

3 

2 

A 2 

1 

25 

16 

9 

4 

B 

6 

5 

4 

7 

8 

B 2 

36 

25 

16 

49 

81 

AB 

1 

5 

4 

3 

2 

6 

5 

4 

7 

8 

AB 2 

1 

25 

16 

9 

4 

36 

25 

16 

49 

15 55 30 190 45 245 

81 

! 

Σ 

# = X 2 

# " # X 

SS A = 55!15 2 5 =10 

( ) 2 

SS B =190 ! 30 2 5 =10 

SS err = SS A + SS B = 20 

SS T = 245! 45 2 10 = 42.5 

SS F = SS T ! SS err = 22.5 

24 

n

Si definisce devianza la sommatoria dei quadra* degli scar* di un 

elemento x i dalla media del gruppo di appartenenza. 

La grandezze delle devianze dipende dal numero degli scar* 

considera*. 

2 medie (due gruppi) Devianze tra i gruppi 

5 soggetti Devianze entro i gruppi 

10 soggetti Devianze totale 

Devianza media 

Varianza 

= 

Media della sommatoria degli scarti quadratici (MS) 

25

¡� La “varianza” è definita dal rapporto tra la 

sommatoria dei quadrati degli scarti (SS) e i 

gradi di libertà (d): 

MS = SS 

d 

26

Il numero degli elemen* di un insieme che sono in grado 

di variare liberamente senza essere sogge7 a restrizioni 

d = 

essendo n il numero delle osservazioni indipenden* in 

un campione, e perdendosi un grado di libertà nella 

s*ma della media della popolazione, nel calcolo della 

varianza si avrà: 

d = n !1 

numero delle 

osservazioni 

nel campione 

- numero delle 

s*me dei 

parametri 

27

¡� SS F : basandosi sulla somma degli scar* 

delle medie dei gruppi dalla media 

generale, le osservazioni che possono 

variare sono le medie dei gruppi. 

¡� Quando si s*ma la media generale dalle 

medie dei gruppi queste perdono un 

grado di libertà. 

df F = k !1 

dove k è il numero dei gruppi sperimentali. 

Nel nostro esempio k=2, df F =1 

SS F = 22.5 

28

¡� SS err : si basa sulla somma degli scar* 

fra i singoli da* e la media del 

proprio gruppo, entro ciascun 

gruppo, definendo la media si perde 

un grado di libertà. 

¡� Poiché la devianza entro i gruppi si 

calcola sommando le devianze entro 

i gruppi, si sommano anche i rela*vi 

gradi di libertà: 

dferr = " ni !1 = ntot ! k 

SSerr = 10 + 10 

29

¡� Avremo così la possibilità di calcolare la 

statistica F associata al rapporto tra la 

variabilità tra gruppi e la variabilità non 

spiegata: 

F = SS F df F 

SS err df err 

= MS F 

MS err 

30

¡� Si avrà quindi: 

F 1,8 = 

SS F df F 

SS err df err 

MS F 

MS err 

= 22.5 1 

= 22.5 

2.5 

20.0 8 = 

Tramite un programma statistico è possibile 

calcolare la probabilità associata: 

p( F1,8 = 9.0) 

= 0.017 

= 9.0 

O, per un’altra strada … 31

¡� Si individua il valore critico di F per df F = 1 e 

df err = 8 : 

1 

2 

.. 

.. 

8 

.. 

df - numeratore 

1 2 3 4 5 

5.32 

11.26 





32

¡� Il valore cri*co di F CRIT dipende dai gradi di 

libertà associa* al numeratore e al 

denominatore, e dal livello di significa*vità 

scelto (α). 

¡� Se la F cal è uguale o superiore al valore cri*co 

di F, l'ipotesi nulla H 0 sarà rifiutata. 

33

¡� Il valore di F cal(1,8) =9.0 è superiore al valore 

critico F crit =5.32 

¡� Si può accettare l’ipotesi H 1 che i due gruppi 

appartengano a popolazioni differenti, 

¡� ovvero che il fattore sia significativo 

§� nel porre una differenza tra le medie dei due livelli 

o gruppi. 

34

Fon$ di variabilità Devianza 

(SS) 

tra i gruppi (SS F ) 

anche nota come SS A 

entro i gruppi 

(SS err ) 

anche nota come SS S/A 

Gradi di libertà 

(df) 

Varianza 

(MS) 

22.5 1 22.5 

20 8 2.5 

Totale (T) 42.5 9 

F p 

9 0.017 * 

35

Fon$ di variabilità Devianza (SS) Gradi di libertà (df) Varianza (MS) F 

tra i gruppi (SS F ) 

anche nota come SS A 

entro i gruppi (SS err ) 

anche nota come SS S/A 

SS F k-‐1 SS F /df F 

SS err n-‐k SS err /df err 

Totale (T) SS T n-‐1 

MS F 

MS err 

36

¡� Le devianze sono addi7ve 

I df sono addi7vi 

SS T = SS F + SS err 22.5 + 20 42.5 

df T = df F + df err 1+8 9 

Questa cara9eris*ca perme9e di controllare l'esa9ezza dei calcoli 

37

¡� È possibile calcolare la percentuale di 

varianza spiegata dal modello, altresì 

chiamata potenza dell’effetto, tramite: 

! 2 = SS F 

SS T 

= 22.5 

42.5 

= 0.53 

¡� Il 53% della varianza dei dati è spiegata dal 

fattore “gruppo di appartenenza”. 

38

¡� Per analizzare i da* di un esperimento mono-‐ 

fa9oriale randomizzato, si definiscono le due fon* di 

variabilità: 

§� l'effe=o del fa=ore sperimentale, ossia dalla somma degli 

scar* quadra*ci delle medie dei gruppi rispe9o alla media 

generale. 

§� l'errore sperimentale, misurato dalla devianza entro i 

gruppi, ossia dalla somma degli scar* dei punteggi dei 

sogge7 di un gruppo rispe9o alla media di quel gruppo. 

§� Le devianze non sono dire9amente rapportabili poiché si 

basano su un numero di osservazioni diverse. Per tale 

mo*vo viene usata la devianza media. 

39

¡� Le varianze sono ottenute calcolando le 

medie delle somme degli scarti quadratici 

diviso i gradi di libertà. 

¡� Il rapporto tra varianza tra gruppi e quella 

entro i gruppi fornisce l'indice F, ossia una 

stima della grandezza della manipolazione 

rispetto all'errore sperimentale 

40

Gli assun* su cui si fonda l'uso della distribuzione campionaria 

delle F riguardano delle cara9eris*che che devono avere 

delle popolazioni di un tra9amento: 

1) I punteggi si devono distribuire normalmente (assunto della 

normalità dei da*) 

2) I punteggi delle popolazioni devono avere varianze 

omogenee (assunto della omoschedas*cità) 

3) I punteggi entro la stessa popolazione e fra popolazioni 

diverse devono essere indipenden* l'uno dell'altro (assunto 

dell'indipendenza dei punteggi) 

42

¡� È interessante osservare 

come il risultato di una 

ANOVA con un fattore a 

due livelli coincida con il 

risultato del test t per 

campioni indipendenti: 

F 1,8 = 9, p(F) = 0.017 

t 8 = !3, p(t) = 0.017 

dab 

0.05 0.10 0.15 0.20 0.25 

A U B 

1 2 3 4 5 6 7 8 

xab 

A U B 

A 

B 

43

¡� Ponendo nelle coordinate x={0,1} i corrispettivi valori 

di A e B, possiamo calcolare l’eq. di regressione: 

X 

0 

0 

0 

0 

0 

1 

1 

1 

1 

1 

Y 

1 

5 

4 

3 

2 

6 

5 

4 

7 

8 

A 

B 

X 2 

0 

0 

0 

0 

0 

1 

1 

1 

1 

1 

Y 2 

1 

25 

16 

9 

4 

36 

25 

16 

49 

64 

XY 

0 

0 

0 

0 

0 

6 

5 

4 

7 

8 

44 

! X = 5 

! Y = 45 

X 2 

! = 5 

Y 2 

! = 245 

! XY = 30 

b = 

30 " 5# 45 10 

5" 5 2 10 

= 7.5 

2.5 

a = 45 10 " 3# 5 10 = 3 

y $ = 3+ 3x 

= 3

¡� Ponendo nelle coordinate x={0,1} i 

corrispettivi valori di A e B, 

possiamo calcolare la seguente 

equazione di regressione: 

X 

0 

0 

0 

0 

0 

1 

1 

1 

1 

1 

Y 

1 

5 

4 

3 

2 

6 

5 

4 

7 

8 

A 

B 

y 

1 2 3 4 5 6 7 8 

y ! = 3+ 3x 

A B 

Gruppi

¡� Se calcoliamo la significatività del parametro 

b otteniamo: 

ES b = 

t n"2 = b 

ES b 

! 2 

! ( n " 2) 

( x " x) 

2 

! 

= 3.0 

1.0 

=1.0 

= 3.0, p(t) = 0.017 

46

¡� Tutti i programmi statistici riportano i dati in maniera 

equivalente a quanto calcolato: 

> y=c(1,5,4,3,2,6,5,4,7,8)! 

> x=c(0,0,0,0,0,1,1,1,1,1)! 

> summary(lm(y~x))! 

! 

Coefficients:! 

Estimate Std. Error t value Pr(>|t|) ! 

(Intercept) 3.0000 0.7071 4.243 0.00283 **! 

x 3.0000 1.0000 3.000 0.01707 * ! 

! 

R-squared: 0.5294! 

F-statistic: 9 on 1 and 8 DF, p-value: 0.01707 ! 

47

¡� Tutti i programmi statistici riportano i dati in maniera 

equivalente a quanto calcolato: 

> y=c(1,5,4,3,2,6,5,4,7,8)! 

> g=gl(2,5)! 

> summary(aov(y~x))! 

Analysis of Variance Table! 

! 

Df Sum Sq Mean Sq F value Pr(>F) ! 

x 1 22.5 22.5 9 0.01707 *! 

Residuals 8 20.0 2.5 ! 

48

Trattamento 

Gruppo A X 1 

Gruppo B X 2 

Le differenze tra le medie sono dovute all’effe9o del 

tra9amento o al caso? 

Differenza tra medie delle diverse condizioni sperimentali 

X A 

X B 

Effetto della manipolazione della VI 

Effetto di fattori casuali 

Errore sperimentale 

Effetto del trattamento 

Variabilità tra i gruppi Effe9o del tra9amento + errore 

50

Gruppo A 

Sog01 

Sog02 

Sog03 

Sog04 

Trattamento X 1 

X 1 

X 1 

X 1 

X 1 

Gruppo B 

Sog11 

Sog12 

Sog13 

Sog14 

Stesso trattamento Stesso trattamento 

Trattamento X 2 

Variabilità entro i gruppi differenze dei punteggi individuali 

all'interno dello stesso gruppo 

X 2 

X 2 

X 2 

X 2 

Fornisce una stima dell'errore sperimentale 

51

Effetto del trattamento = 


variabilità tra i gruppi 

variabilità entro i gruppi 

trattamento + errore sperimentale 

errore sperimentale 

Un trattamento inefficace dovrebbe avere lo stesso effetto su entrambi i 

gruppi quindi: 


trattamento + errore sperimentale 

errore sperimentale 

= 1 

52

¡� Si è interessa* a sapere quali effe7 hanno alcuni 

addi*vi chimici alimentari sui livelli di a7vità dei 

bambini ipera7vi. 

¡� Sono assegna* casualmente 9 bambini ipera7vi 

alla cui dieta è stato aggiunto l'addi*vo chimico 

al gruppo A 1 , altre9an* bambini ipera7vi sono 

assegna* alla stessa dieta ma senza l’addi*vo 

chimico (gruppo A 2 ). 

¡� Ci si chiede se l’addi*vo chimico porta in essere 

differen* livelli di a7vità nei bambini. 

54

I da* riporta* forniscono in indice complessivo 

di a7vità psicomotoria: 

sogg 

Senza additivi 

(A1) 

Con additivi 

sogg 

(A2) 

Y1,1 31 Y2,1 30 

Y1,2 33 Y2,2 28 

Y1,3 25 Y2,3 36 

Y1,4 28 Y2,4 41 

Y1,5 24 Y2,5 29 

Y1,6 30 Y2,6 32 

Y1,7 31 Y2,7 27 

Y1,8 26 Y2,8 35 

Y1,9 30 Y2,9 36 

55

¡� Come procedere? 

1. Grafico delle distribuzioni 

2. Calcolo delle sommatorie dei quadrati 

3. Verifica della omogeneità della varianza 

4. Calcolo della statistica F 

5. Decisione e discussione 

56

y 

25 30 35 40 

¡� Si può costruire un grafico a dispersione 

ovvero un boxplot: 

A_1 A_2 

25 30 35 40 

A_1 A_2 

57

¡� Calcolo delle sommatorie dei quadrati 

A1 

A2 

31 30 

33 28 

25 36 

28 41 

24 29 

30 32 

31 27 

26 35 

30 36 

A1 2 A2 2 

961 900 

1089 784 

625 1296 

784 1681 

576 841 

900 1024 

961 729 

676 1225 

900 1296 

n a = n b = 9 

! A1 = 258 

! A2 = 294 

! 

2 

A1 = 7472 

! 

2 

A2 = 9776 

58

¡� Si verifica l’omogeneità delle varianze, tramite il test 

F, con d a =8 e d b =8 (F crit =3.44). 

2 

s1 = 

( ) 2 

X 2 

! " ! X 

n "1 

2 9776 " 294 

s2 = 

9 "1 

Fc = s 2 

max 

2 

smin ( ) 2 

21.5 

= 

9.5 

9 

n 

= 2.26 

= 7472 " 258 

= 21.5 

( ) 2 

9 "1 

¡� Si tratta di due campioni con varianza omogenea. 

9 

= 9.5 

59

¡� Si calcolano le sommatorie dei quadrati tra ed 

entro i gruppi: 

! 

! 

( ) " 

2 2 

SST = A1 + A2 

SS F = n 1 

# 

% 

% 

$ 

! n1 

A 1 

SS err = SS T " SS F 

# 

" % 

$ 

! 

A 1 + 

! A1 + ! A2 ( ) 2 

! 

n 1 + n 2 

n 1 + n 2 

A 2 

&& 

( ( 

( ( 

'' 

2 

# 

+ n % 

2 % 

$ 

! n2 

A 2 

# 

" % 

$ 

! 

A 1 + 

! 

n 1 + n 2 

A 2 

&& 

( ( 

( ( 

'' 

2 

60

¡� Si calcolano le sommatorie dei quadrati tra ed 

entro i gruppi: 

2 2 ( ! A1 + ! A2 ) SST = ( ! A1 + ! A2 ) " 

2 

= 

SS F 

SS err 

= 7472 + 9776 " 

# 

= n % 

1% 

$ 

! n1 

A 1 

# 

" % 

$ 

! 

n 1 + n 2 

( 258+ 294) 

2 

18 

A 1 + 

! 

n 1 + n 2 

= 9 258 # # 258+ 294 && 

% " % ( ( 

$ 9 $ 18 '' 

A 2 

2 

&& 

( ( 

( ( 

'' 

= SS T " SS F = 320 " 72 = 248 

2 

= 320 

# 

+ n % 

2 % 

$ 

! n2 

A 2 

# 

" % 

$ 

! 

A 1 + 

+ 9 294 # # 258+ 294 && 

% " % ( ( 

$ 9 $ 18 '' 

! 

n 1 + n 2 

2 

A 2 

= 72 

&& 

( ( 

( ( 

'' 

2 

= 

61

¡� Calcolo della statistica F: 

F1,18 = SSF SSerr ( k !1) 

n ! k 

( ) 

= 72.0 1 

248.0 16 

¡� Il valore critico F 1,16 =4.49. 

= 4.65 

¡� Poiché F cal >F crit possiamo accettare H1, ovvero 

l’ipotesi che l’additivo chimico ha prodotto un 

cambiamento nei livelli di attività dei bambini. 

62

Regola per distribuzioni di F 

H 0 viene mantenuta 

F=4.49 (valore cri*co di F) 

H 0 viene rifiutata 

1 2 3 4 5 

6 

Se la F calcolata è uguale o superiore al valore cri*co di F= 4.49 l'ipotesi nulla sarà 

rifiutata. 

5% 

63

¡� Nel riportare i risulta* in una tesi è molto u*le 

riportare la tabella riassun*va dell'analisi della 

varianza. 

¡� Nei resocon* di ricerca queste sono 

generalmente omesse, a meno che il disegno 

sperimentale non sia par*colarmente 

complesso. 

¡� Non dimen*care di riportare le medie dei 

gruppi o delle condizioni, poiché senza le medie 

i risulta* sono incomple* o poco informa*vi. 

64

¡� Assumiamo di avere i seguenti dati, 

provenienti da un disegno monofattoriale a 3 

livelli: 

A1 A2 A3 

31 30 36 

33 28 35 

25 26 33 

28 41 28 

24 29 29 

30 32 40 

31 27 45 

26 35 39 

30 36 35 1 2 3 

25 30 35 40 45 

67

A1 A2 A3 

31 30 36 

33 28 35 

25 36 33 

28 41 28 

24 29 29 

30 32 40 

31 27 45 

26 35 39 

30 36 35 

A 2 1 A 2 2 A 2 3 

961 900 1296 

1089 784 1225 

625 676 1089 

784 1681 784 

576 841 841 

900 1024 1600 

961 729 2025 

676 1225 1521 

900 1296 1225 

! A1 = 258 

! 

2 

A1 = 7472 

! A2 = 284 

! 

2 

A2 = 9156 

! A3 = 320 

! 

2 

A3 =11606 

SS A1 = 76 

SS A2 =194.22 

SS A3 = 228.22 

SS err = 498.44 

SS tot = 713.85 

SS F = 215.41 

68

¡� Il risultato dell’ANOVA ci dirà se in generale i 

gruppi sono differenti dalla media generale; 

SS df MS F p 

tra i gruppi 215.41 2 107.70 

entro i 

gruppi 

498.44 24 20.77 

5.19 0.013 * 

¡� Ma non ci darà alcuna informazione relativa 

alle differente dei gruppi tra di loro. 

69

¡� Se l’effetto principale è significativo, è possibile 

valutare la significatività dei confronti a coppie 

§� Un metodo per verificare la significatività delle 

differenze è noto come pairwise comparison. 

§� Si paragonano due sole condizioni sperimentali, 

considerando il rapporto tra: 

▪ La varianza calcolata sulla base della differenza tra le medie. 

▪ La varianza entro i gruppi o varianza d’errore complessiva. 

¡� Se l’effetto principale non è significativo, non è 

lecito effettuare alcun tipo di test. 

70

¡� È possibile calcolare il rapporto tra la varianza 

tra gruppi considerati e la varianza d’errore: 

F cfr = SS F cfr 

¡� Dove: 

SS err 

( kcfr !1) 

n ! k 

( ) 

SS = n ( Fcfr A X " X ) A1 A2 

2 

2 

71

¡� Consideriamo ad esempio il confronto tra le 

medie di A 1 (X=28.67) e A 3 (X=35.55): 

SS cfrA1 "A 3 

F cfrA1"A3 

= n ( A X " X ) A1 A2 

2 

= SScfr ( 2 "1) 

A1"A3 

( n " k) 

SS err 

2 = 9 ( "6.89) 

2 

= 213.62 

20.77 =10.28 

2 = 213.62 

¡� Si identifica il valore critico F crit (1;24)=4.26. 

¡� Si conclude che la differenza tra A 1 e A 3 è 

statisticamente significativa. 

72

¡� Se l’effetto principale è significativo, è anche 

possibile effettuare una serie di test-‐t per 

ciascuna coppia, avendo attenzione a 

correggere il valore critico di α per il numero 

di confronti a coppie (metodo di Bonferroni). 

¡� Se l’effetto principale non è significativo, non 

è lecito effettuare alcun tipo di test post-‐hoc. 

73

¡� È una statistica molto più potente del t-‐test e si applica a 

disegni molto più complessi (confronto tra medie di più 

gruppi e più condizioni). 

¡� Si può testare l'effetto di un fattore tenendo sotto 

controllo gli altri e si accede alla verifica delle interazioni 

tra fattori. 

¡� Se si stanno confrontando solo due medie tuttavia ANOVA 

fornirà gli stessi (identici) risultati del test t. 

§� Per quanto concerne gli aspetti tecnici e di implementazione si 

approfondisca l'argomento con la dispensa allegata preparata 

dalla dr.ssa Silvia Poli, Uso del programma STATISTICA 6.1, pag. 

25-‐36. 

§� Oppure http://www.statsoft.com/textbook/stathome.html

¡� Il termine “analisi della varianza” deriva dal fatto che, pur 

basandosi su una analisi delle medie, la tecnica statistica utilizzata 

si basa sulla “scomposizione” della variabilità totale dei dati 

osservati in due parti: 

§� variabilità sperimentale (varianza sperimentale o spiegata o tra 

gruppi (between groups) detta anche Mean Square Effect, Media del 

Quadrato degli Effetti, o MSeffetto) che e dovuta alle variabili 

introdotte e studiate dal disegno di ricerca e cioè alla manipolazione 

della variabile indipendente. 

§� variabilità residua o accidentale (varianza non spiegata, o di errore, o 

entro i gruppi (within groups) detta anche Mean Square Error, Media 

del Quadrato dell'Errore o MSerrore) che e dovuta a tutte le condizioni 

o variabili non controllabili o non controllate dal disegno stesso.

¡� Ipotesi sperimentali 

¡� H 0 : non vi sono differenza tra le medie dei gruppi nella 

popolazione 

§� ci si può aspettare che la varianza stimata sulla base della variabilità 

tra i gruppi (dovuta alla manipolazione della VI) è all'incirca pari a 

quella dovuta alla variabilità entro gruppi (variabilità accidentale). 

¡� Queste due dimensioni di varianza possono essere confrontate 

tramite il test F. 

§� F = varianza tra i gruppi / varianza entro i gruppi 

¡� Il valore di F è tanto più grande quanto più è grande la varianza tra 

i gruppi e piccola quella entro i gruppi. 

¡� Per valutare se esso è abbastanza grande per rigettare l'ipotesi 

nulla si confronta la probabilità associata (p-‐value) con il livello di 

significatività fissato (solitamente 0.05).

¡� H 0 

§� Se non possiamo rigettare l'ipotesi nulla 

§� possiamo concludere che i campioni provengano dalla stessa 

popolazione e quindi la varianza tra-‐i-‐gruppi e la varianza entro-‐ 

i-‐gruppi sono due stime indipendenti della stessa varianza della 

popolazione. 

¡� H 1 

§� se la varianza tra-‐i-‐gruppi è significativamente più grande di 

quella entro-‐i-‐gruppi, 

§� possiamo concludere che la variabilità osservata nella variabile 

dipendente è riconducibile alla manipolazione della variabile 

indipendente. 

§� Esiste una differenza tra le medie dei gruppi riconducibile alla 

variabile indipendente.

¡� Riassumendo 

§� Se il risultato del test F non è significativo è inutile procedere 

all'esame delle differenze tra medie particolari, perche vi è il rischio 

reale che un certo numero di confronti sia dato come significativo 

mentre la maggior parte di essi è dovuto solo alla variabilità casuale. 

§� Se invece il risultato del test F è statisticamente significativo vuol dire 

che almeno una media risulta essere diversa dalle altre. 

¡� Per individuare quale gruppo o quali gruppi differiscono si può 

procedere invece in due modi: 

§� confronti a priori o contrasti pianificati prima della raccolta dati, in 

quanto aventi “a priori” un particolare interesse. 

§� confronti a posteriori o post-‐hoc (definiti dopo aver raccolto i dati ed 

esaminato le medie, tipicamente tutti i confronti a coppie possibili)

Nota bene: 

¡� L'attendibilita del test F nell'analisi della varianza 

si basa sulla soddisfazione dei seguenti assunti: 

§� normalita della distribuzione della variabile 

dipendente. 

▪ Questa si verifica con i test di normalità di Kolmogorov-‐ 

Smirnof o di Shapiro-‐Wilk; 

§� estrazione casuale dei campioni della popolazione; 

§� omogeneita delle varianze dei gruppi. 

▪ Si verifica con il test di Levene.

¡� A seconda del numero di Variabili Indipendenti avremo: 

§� analisi della varianza univariata a una via se si ha una sola VI 

§� analisi della varianza fattoriale se si hanno più variabili 

indipendenti 

¡� A seconda del numero delle Variabili Dipendenti oggetto 

di analisi potremmo avere: 

§� analisi della varianza univariata (ANOVA) se è indagata una sola 

VD 

§� disegni a misure ripetute se la VD è misurata più volte 

§� analisi della varianza multivariata (MANOVA) se sono indagate 

diverse VD

Analisi della varianza - Marco Vicentini

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?