Lezione 8

Lezione 8 

Misure per 

Produzione ed Automazione 

Industriale 

Seconda Università di Napoli 

Ing. Daniele Gallo 

Analisi dei risultati di misura 

• Inferenza statistica 

– Come dedurre dai parametri di un campione 

informazioni su sui parametri dell’intera 

distribuzione 

• Decisioni su basi statistiche 

– Come prendere decisioni oggettive su processi 

influenzati da eventi aleatori ottimizzando il livello di 

confidenza e l’onere computazionale 

• Collaudo Campionario 

– Come determinare la numerosità del campione e i 

criteri di accettazione/rifiuto per il collaudo di 

prodotti e processi 

1

Analisi dei risultati di misura 

• Analisi della media (ANOM) 

– Come attenuare gli effetti delle cause di variabilità 

aleatoria del processo di misura volto a 

determinare sperimentalmente gli effetti di uno o 

più parametri su una caratteristica del sistema 

• Analisi della varianza (ANOVA) 

–Per discriminare gli effetti di più variabili su una 

caratteristica, cercare le eventuali correlazioni, 

discriminare le cause speciali rispetto alla 

variabilità naturale 

Considerazioni preliminari 

• I processi di misurazione, sono finalizzati a 

prendere delle decisioni 

• Problema: ogni decisione è sempre affetta 

da un grado di imponderabilità! 

• La complessità dei processi industriali è 

elevata, per cui i modelli deterministici delle 

regolazioni causa-effetto sono inadeguati. 

• si assumono decisioni su basi statistiche 

2

Considerazioni preliminari 

• Aumentare il numero di prove eseguite 

aumenta la significatività dei risultati 

– Si riduce l’impatto del “rumore” sovrapposto 

ai dati di misura, ovvero delle variazioni 

aleatorie 

• Aumentare il numero di prove implica 

l’aumento dei costi di esecuzione 

– Ottimizzazione del numero di prove 

mediante un opportuno “collaudo 

campionario” 

Inferenza statistica 

L’analisi dell’intera 

popolazione di prova è 

normalmente troppo 

onerosa in termini 

di costo o di tempi. 

μ σ 

CAMPIONE 

x S 

L’unica alternativa è quella di analizzare un limitato 

sottinsieme e dall’analisi dei parametri del campione 

(es. la media x e la varianza, S2 ) dedurre i parametri 

dell’intera popolazione (la media μ e la varianza, σ2 POPOLAZIONE 

) 

3


È chiaro che quanto più 

numeroso risulta il 

campione tanto più 

precise saranno le 

informazioni che si 

otterranno rispetto 

all’intera popolazione 

→ μ 

x S → σ 

CAMPIONE 1 

POPOLAZIONE 

Se il campione si estende fino a coprire l’intera 

popolazione i parametri calcolati (la media e la 

varianza) sarebbero quelli corretti. 


CAMPIONE n 

CAMPIONE 2 

• Secondo il Teorema del Limite Centrale, la media 

campionaria, x, è variabile aleatoria distribuita 

secondo una gaussiana con media μ e varianza 

σ 2 /n con μ e σ 2 media e varianza dell’intera 

popolazione 

• per il calcolo delle probabilità relative a x a possiamo 

far riferimento alla standardizzazione: 

z 

= 

μ 

n 

• Per n molto grande, z è gaussiana anche usando la 

varianza campionaria, altrimenti è una T Student. 

x 

σ / 

− 

4

Intervallo di Confidenza 

x − μ 

La probabilità che z = 

σ / n 

cada tra –z(α/2) e +z(α/2) è uguale a (1- α) dove 

z(α/2) indica il valore della variabile normale 

standardizzata il cui integrale vale α/2: 

⎡ ⎛ α ⎞ x − μ ⎛ α ⎞⎤ 

P⎢− 

z⎜ 

⎟〈 

〈 z⎜ 

⎟⎥ 

= 1− 

α 

⎢⎣ 

⎝ 2 ⎠ σ / n ⎝ 2 ⎠⎥⎦ 

⎡ ⎛ α ⎞ σ ⎛ α ⎞ σ ⎤ 

P⎢x 

− z⎜ 

⎟ 〈 μ〈 

x + z⎜ 

⎟ ⎥ = 1− 

α 

⎣ ⎝ 2 ⎠ n ⎝ 2 ⎠ n ⎦ 

Si ha quindi 


⎡ ⎛ α ⎞ σ ⎛ α ⎞ σ ⎤ 

P⎢x 

− z⎜ 

⎟ 〈 μ〈 

x + z⎜ 

⎟ ⎥ = 1− 

α 

⎣ ⎝ 2 ⎠ n ⎝ 2 ⎠ n ⎦ 

α/2 

( α 2 ) 

− z 

z 

b α 

( 2 ) 

α/2 

5


⎡ ⎛ α ⎞ σ 

⎢x 

− z⎜ 

⎟ 

⎣ ⎝ 2 ⎠ n 

⎛ α ⎞ σ ⎤ 

x + z⎜ 

⎟ ⎥ 

⎝ 2 ⎠ n ⎦ 

Questo intervallo è detto intervallo di 

confidenza al [100•(1-α)]% 

Probabilità dell’intervallo di contenere 

la media della popolazione è (1-α). 

; 

In pratica α rappresenta la percentuale di 

risultati esterni all’intervallo di confidenza. 


Questa probabilità è chiamata Livello Di Confidenza e 

generalmente è scelto tra 0,95 e 0,99. 

Livello di Limiti di α z(α/2) 

confidenza confidenza 

68.27 % x ± σ/ n 0.317 1.000 

90.00 % x ± 1.645 σ/ n 0.100 1.645 

95.00 % x ± 1.96 σ/ n 0.050 1.960 

95.45 % x ± 2 σ/ n 0.045 2.000 

99.00 % x ± 2.58 σ/ n 0.010 2.580 

99.73 % x ± 3 σ/ n 0.003 3.000 

6

Esempio 

Per analizzare una produzione di pelati sono stati 

estratti e pesati 1000 barattoli e si sono ottenuti 

x = 380g 

Applicando 

2 

S = 

100g 

⎡ ⎛ α ⎞ σ ⎛ α ⎞ σ ⎤ 

P ⎢x 

− z⎜ 

⎟ 〈 μ 〈 x + z⎜ 

⎟ ⎥ = 1 − α 

⎣ ⎝ 2 ⎠ n ⎝ 2 ⎠ n ⎦ 

Se ne può dedurre per la media μ di prodotto: 

⎛ α ⎞ 10 

⎛ α ⎞ 10 

P[ 

380 − z⎜ 

⎟ 〈 μ〈 

380 + z⎜ 

⎟ ] = 1− 

α 

⎝ 2 ⎠ 1000 ⎝ 2 ⎠ 1000 

Esempio 

2 = ⎟ 

⎛ α ⎞ 

z⎜ 

⎝ ⎠ 

2 

1. 

96 

n > 100 ⇒ S 

Scegliendo l’intervallo di confidenza al 95% 

(1-α=0.95) 

Allora 

1. 

96 1. 

96 

P[ 

380 − 〈 μ〈 

380 + ] = 

10 10 

0. 

95 

Ovvero la media di produzione con una 

probabilità del 95% è compresa nell’intervallo 

[ 

379. 

38 

; 

380. 

62] 

≈ σ 

7

Varianza campionaria 

Considerando la distribuzione della varianza campionaria, 

è possibile provare teoricamente che la variabile 

2 ( n − 1) 

s 

2 

J = → χ 

2 

n 

σ 

segue una distribuzione del chi-quadrato con (n-1) 

gradi di liberà quando la variabile analizzata segue a 

sua volta una distribuzione normale e le osservazioni 

sono indipendenti. 

Questo fatto ci permette di determinare per esempio gli 

intervalli di confidenza di una varianza, oppure di 

testare se la varianza della popolazione dalla quale ho 

estratto il campione è uguale o diversa ad una certa 

varianza data 

Varianza campionaria 

In altre parole, se per esempio, 

• estraessi da una popolazione 1000 campioni di n = 10 

individui ciascuno 

• misurassi in ciascun individuo una variabile continua che 

possiede una distribuzione gaussiana 

• calcolassi la varianza campionaria s 2 in ciascuno di questi 

campioni 

• moltiplicassi ognuna delle 1000 varianze per 9 e dividessi 

tale prodotto per la varianza della popolazione che 

assumo essere nota e pari a σ 2 , ottenendo così 1000 

valori della variabile J 

La distribuzione di frequenza di questi 1000 valori finali della 

variabile J tenderebbe a seguire (seguirebbe, se invece di 

1000 campioni analizzassi infiniti campioni) una distribuzione 

del chi-quadrato con (n-1) gradi di libertà 

−1 

8

Test di Fisher 

Serve a confrontare le varianze, s1 2 es 2 2 , di due 

popolazioni gradi di libertà n 1 e n 2. 

Se le due varianze che consideriamo sono 

calcolate su due campioni che provengono dalla 

stessa popolazione, queste stanno stimando la 

stessa varianza σ 2 (solitamente ignota) e il 

rapporto delle due varianze campionarie è dato da 

F 

= 

s 

s 

2 

1 

2 

2 

= 

χ 

σ 

( n − ) 

Test di Fisher 

2 

( n2 

−1) 

χn 

1 ( 2 1) 

1− 

n − 

= 

2 2 2 

σ χ ( n −1) 

2 

n1 

−1 

2 

1 1 χn2 

−1 

n2 

−1 

1 

La figura di merito, F, si confronta con la 

distribuzione di Fisher con n 1 e n 2 gradi di libertà 

con livello di significatività α trovato in tabella 

2 

s 

F = 

≤ Fα 

s 

1 

2 

2 

, n1, 

n2 

Un valore inferiore al livello critico conferma 

l’ipotesi di provenienza dalla stessa popolazione 

9

Decisioni su basi statistiche 

Prendere decisioni oggettive su processi influenzati da 

eventi aleatori tenendo in conto la probabilità di sbagliare. 

Test delle ipotesi 

– Si impostano le ipotesi a confronto 

– Si determina il rischio di sbagliare 

– Si definisce il criterio di decisione 

– Si gestisce la probabilità di accettare una 

decisione sbagliata 

– Si calcola la numerosità del campione 

– Si eseguono le prove e si decide 

Esempi di test delle ipotesi 

• Test di Significatività 

• Test del χ 2 

• Test di Fisher 

• … 

10

Impostazione delle ipotesi 

• Impostare le ipotesi vuol dire definire le 

popolazioni da mettere a confronto per 

determinare se esiste una differenza 

significativa fra di esse 

• tipicamente si cercano differenze dei parametri 

(media o varianza) di due campioni 

– Ipotesi nulla (H0 ): non c’è differenza fra i parametri 

dei due campioni (tipicamente è l’ipotesi che si 

vuole verificare) 

– Ipotesi alternativa (H1 ): qualsiasi ipotesi diversa 

da quella nulla (c’è differenza fra i parametri) 

Impostazione delle ipotesi 

•Esempio: 

– Si vuole determinare se esiste una 

variazione di un processo produttivo 

(es., la quantità di rifiuti prodotti) tra 

due mesi diversi: 

• Ipotesi nulla: la diversità non esiste 

• Ipotesi alternativa: la diversità esiste 

11

Ipotesi bilaterali 

– H 0 : Le medie e le varianze delle popolazioni 

sono le stesse 

– H 1 : Le medie e le varianze delle popolazioni 

NON sono le stesse 

non interessa conoscere se una media/varianza è 

più grande dell’altra, ma solo se sono diverse. I 

test di questo tipo si chiamano a due code (o 

bilaterali, o non direzionali) 

Ipotesi unilaterali 

–H 0 : Le medie delle popolazioni sono le 

stesse 

–H 1 : La media della popolazione 1 è 

maggiore/minore della media della 

popolazione 2 

Se interessa dare un peso maggiore ad una 

”direzione” del test. 

12

Esempio: confronto con valore 

storico 

–H 0 : La media μ 0 è uguale a R 0 

–H 1 : La media μ 0 è maggiore/minore di R 0 

Se l’interesse è di determinare la 

variazione rispetto ad un valore target 

specificato, ad esempio un valore medio 

ottenuto da analisi storiche. 

Il rischio di sbagliare 

A causa della natura aleatoria di ogni processo, 

ogni decisione ha una probabilità di essere 

sbagliata: 

– è possibile rifiutare l’ipotesi H 0 quando essa 

è vera, con una probabilità di errore pari a α 

– è possibile non rifiutare l’ipotesi H 0, quando 

essa è falsa con probabilità di errore pari a β 

13


Decisione 

statistica 

ACCETTO H 0 

RIFIUTO 

H 0 

H 0 VERA 

Decisione 

corretta al (1-α)% 

errore 

I TIPO 

α 

Situazione reale 


H 0 FALSA 

Errore 

II TIPO 

β 

Decisione 

corretta al 

(1- β)% 

• Il rischio α è fissato a priori e determina il 

criterio di confronto rispetto a cui prendere la 

decisione. (1-α è il livello di significatività del 

test) 

• Il rischio β è poi determinato a valle del criterio di 

decisione. (1-β èdetta potenza del test) 

• I due errori NON si possono commettere 

contemporaneamente, perché si riferiscono a 

ipotesi mutuamente esclusive 

14


• Più è alto 1- α, maggiore è la probabilità 

che, se è vera l’ipotesi nulla, la decisione 

sia corretta, ovvero è minore la 

probabilità che essa venga rigettata 

• α deve essere sufficientemente piccolo 

in modo che, se rigetto l’ipotesi nulla, ciò 

sia dovuto al fatto che nella realtà è 

molto probabile l’ipotesi alternativa. 


• β, invece, indica la probabilità che la scelta 

dell’ipotesi nulla dipenda da un evento 

favorevole che però appartiene ad una 

situazione diversa da quella descritta 

dall’ipotesi nulla. 

• Quanto più è piccolo β tanto più il test ci tutela 

da tali occorrenze 

• Es. le distribuzioni da cui prelevo i due 

campioni sono diverse ma i risultati della 

misurazione sono tali da far ritenere che 

invece esse siano identiche 

15

Il criterio di decisione 

Definite le ipotesi e il rischio associato si 

deve definire il criterio di decisione, ovvero 

una procedura che mi permetta di giungere 

ad una decisione: 

1. Definire una figura di merito 

2. Scegliere la statistica corrispondente 

3. Confrontare il valore sperimentale della 

figura di merito con la statistica teorica 

Il criterio di decisione 

• In altre parole, la natura statistica della 

nostra decisione deriva dal fatto che ciò che 

posso osservare è solo un campione 

limitato di n elementi prelevati da una 

distribuzione, sul quale basare la decisione. 

• Esempio: la media campionaria è variabile 

aleatoria distribuita secondo una gaussiana 

con media μ e varianza σ 2 /n 

16

Fissato il rischio α (di sbagliare nel rifiutare H 0 ) 

α/2 

Definizione del Criterio Formale di 

Decisione 

a b 

α/2 

Per la distribuzione normale: 

⎧F0 

( a) 

= α / 2 

⎨ 

⎩1 

− F0 

( b) 

= α / 2 

per cui a – b “Regione di accettazione”: A ≡ { [ a, 

b] 

} 

{ ] − ∞, 

a [ U] 

, b, 

+∞[ 

} = B “Regione di rifiuto” 

In questo caso il test è bilaterale 

Definizione del Criterio Formale di 

Decisione 

Test è unilaterale: 

α corrisponde ad un’unica regione di rifiuto, ad 

una delle due estremità dell’intervallo possibile; 

α 

− 

z ( α ) 

17

Esempio 

• Supponiamo che la media storica della 

produzione di rifiuti sia μ 0 e la deviazione 

standard σ 0 . 

• Vogliamo verificare se la modifica di una 

parte del processo produttivo riduce la 

produzione di rifiuti giornaliera. Posso a 

tal fine misurare la produzione per n 

giorni e farne la media, μ 

– Figura di merito: media della produzione 

di n giorni 

Esempio 

• Utilizzando la variabile standardizzata 

z 

= 

μ − 

σ 

0 

• Fissato il rischio di sbagliare (es α=5%) calcolo 

la regione di accettazione 

⎡ ⎛ α ⎞ σ 0 ⎛ α ⎞ σ 0 ⎤ 

⎢μ0 

− z⎜ 

⎟ ; μ0 

+ z⎜ 

⎟ ⎥ 

⎣ ⎝ 2 ⎠ n ⎝ 2 ⎠ n ⎦ 

• Se μ appartiene alla regione, la media di 

produzione non è cambiata con un livello di 

confidenza del (1-α)% 

/ 

μ 

0 

n 

18

Esempio 

• La verifica si può effettuare anche confrontando 

il valore di soglia percentile e cioè se 

μ − μ 0 

σ / n 

0 

≤ 

z 

⎛ 

⎜ 

⎝ 

α 

2 

la media di produzione non è cambiata con un 

livello di confidenza del (1-α)% 

Esempio 

• Volendo effettuare un test unilaterale 

(es. la produzione è aumentata) deve essere 

considerato il nuovo valore di soglia e il nuovo criterio 

d’accettazione diventa 

Ovvero 

⎡ 

μ 

∈ ⎢μ0 

− z 

⎣ 

μ − 

σ / 

0 

μ 

0 

n 

≥ 

− z 

la media di produzione è aumentata con un livello di 

confidenza del (1-α)% 

σ 

⎞ 

⎟ 

⎠ 

0 ( α ) ; + ∞⎢ 

n ⎣ 

( α ) 

⎡ 

19

GESTIONE DELLA PROBABILITA’ DI ACCETTARE 

UNA DECISIONE FALSA 

• Se la figura di merito cade nella regione 

d’accettazione, non possiamo escludere che 

ciò sia dovuto ad un’occorrenza favorevole 

proveniente da una situazione sfavorevole: 

– Esempio: la produzione di rifiuti è effettivamente 

cambiata (distanza δ), ma non me ne accorgo 

perché μ è affetta da variabilità aleatoria che la 

porta all’interno della regione di accettazione 



a b 

Se la media si è spostata da μ 0 a μ 1 

(a parità di σ) esiste una aliquota di valori 

che ha probabilità β di finire 

nella regione di accettazione. 

20



• La probabilità che ciò succeda è data 

dalla probabilità che la distribuzione 

con media μ 1 ≠μ 0 esibisca dei valori 

nell’intervallo di accettazione [a ; b] 

(per l’ipotesi bilaterale) 

β = F 1 (a) - F 1 (b) 

• β dipende dalla distanza tra μ 1 e μ 0 , e 

dalla numerosità del campione 



L’errore di secondo tipo non è semplice da determinare. 

Infatti, essendo un errore che si compie quando è vera 

l’ipotesi alternativa, bisogna specificare un’ipotesi 

alternativa per determinarlo. 

Può essere conveniente capire quale probabilità 

abbiamo di accettare erroneamente l’ipotesi nulla se 

fosse vera una specifica ipotesi alternativa, µ’ 

La scelta del valore di µ’ dovrebbe identificare un valore 

particolarmente anomalo, che se fosse veramente la 

media della popolazione dalla quale abbiamo estratto il 

campione che stiamo analizzando vorremo che venisse 

evidenziata 

21



β 

N. 

B. 

Per 

Per 

(1-α) 

β(μ 1 ): caratteristica 

operativa del test 

μ → ∞ 

1 

μ → μ 

1 

0 

β → 0 

β → ( 1−α 

) 

1−β(μ 1 ): funzione 

potenza del test 

Numerosità del campione 

Scegliendo un livello di confidenza 1- α in un 

test bilaterale (α 1 = α 2 = α/2) l’intervallo di 

accettazione è: 

0 

0 

[ a; 

b] 

= ⎢μ0 

− z⎜ 

⎟ ; μ0 

+ z⎜ 

⎟ ⎥ 

⎝ 2 ⎠ n ⎝ 2 ⎠ n ⎦ 

⎣ 

• Al crescere di n 

⎡ 

⎛ α ⎞ σ 

⎛ α ⎞ σ 

– i due estremi dell’intervallo di 

accettazione si avvicinano a μ0 – l’area sottesa dalla curva relativa alla 

media μ1 tra i due estremi è minore 

⎤ 

22


• Per il calcolo di β, consideriamo la variabile μ, 

gaussiana con media μ 1 e varianza σ 0 2 , il 

calcolo della probabilità che cada in [a; b] si 

ottiene con riferimento alla standardizzazione 

• Gli estremi saranno 

z a 

= 

σ 

a 

0 

− 

/ 

μ 

1 

n 

z 

= 

σ 

μ − 


0 

• Sostituendo i valori di a e b, l’area risulta 

⎡ μ 

⎤ ⎡ 

⎤ 

0 − μ 1 ⎛ α ⎞ μ 0 − μ 1 ⎛ α ⎞ 

β = F 

⎢ + z ⎜ ⎟ ⎥ − F ⎢ − z ⎜ ⎟ ⎥ 

⎢⎣ 

σ / ⎝ 2 ⎠ ⎥⎦ 

⎢⎣ 

/ ⎝ 2 

0 n 

σ 0 n ⎠ ⎥⎦ 

Al crescere di n, 

cresce la 

potenza del test 

(1-β) 

/ 

μ 

z b 

1 

n 

= 

a b 

σ 

b 

0 

− 

/ 

μ 

1 

n 

23


• Nella pratica la numerosità del test può 

essere scelta proprio in modo da fissare 

la probabilità di essere ingannati 

– Si fissa la minima variabilità significativa, 

δ=μ0-μ1 , e la potenza desiderata, (1-β) 

– si calcolala numerosità minima che sia 

compatibile con questi valori 

Esempio: 

Dati iniziali μ 0 = 72 mm σ 0 = 2 mm 

Dopo la regolazione si modifica la dimensione 

media? 

Ipotesi nulla 

H 0 : μ = μ 0 

Sperimentalmente, 

su un campione 

N=10 risulta X=75. 

Ipotesi alternativa 

H a :μ ≠μ 0 

⎧ σ 2 

⎪ 

= = 0, 

632 

N 10 

Calcoli: ⎨ 

⎪ 75 − 72 

z0 

= = 4, 

74 

⎪⎩ 

0, 

632 

24

Esempio: 

Criterio di 

accettazione 

o rifiuto. 

0,025 0,025 

-1,96 

Probabilità di 

errore del I o 

tipo (α) 

(rifiutare 

l’ipotesi vera) è 

rappresentata 

dall’area 

tratteggiata. 

Rifiuto accettazione rifiuto 

In genere si assume di accettare l’ipotesi al 95%; questo significa: 

Respingere H0 quando ΙZ0Ι≥1,96 Accettazione H0 quando ΙZ0Ι < 1,96 

che significa che la probabilità di respingere H0 quando è vera è 5% 

Esempio: 

1,96 

Z 0 = 4,74 ≥ 1,96 → H 0 RIFIUTATA 

72 75 X 

0 4,74 z 

La probabilità che NON si sia modifica la media 

è esigua! 

z 

25

Possibili classificazioni : 

1) 

2) 

• Accettazione 

• Selezione 

•Tipo 

PROVE DI COLLAUDO 

• Collaudo al 100% 

• Collaudo campionario 

Saltuario 

Percentuale 

Statistico 

BASI DEL COLLAUDO STATISTICO 

Il valor medio μ della caratteristica appartiene ad 

una distribuzione normale, con varianza fissa. 

Il prodotto è di buona qualità se μ ≤ μ1 

Test delle ipotesi: 

H 

H 

0 

a 

: μ = μ 

1 

: μ ≠ μ = μ 

1 

2 

26

BASI DEL COLLAUDO STATISTICO 

β 

μ 1 

μ a 

α → R. 

F. 

rischio del fornitore 

β → R. 

C. 

rischio del committente 

α 

μ 2 

ANOM (Analisis of Mean) 

Si utilizza per valutare gli effetti di p parametri 

c 1 …c i …c p su una caratteristica di qualità η, a 

partire dall’analisi di N misurazioni. 

Si considerano pertanto anche j livelli per 

ognuno dei parametri, c i1 …c iq …c ij 

Es. per l’evaporazione di un gas si considerano 

temperatura e pressione con differenti livelli 

T [°k] 

P [bar] 

300 

10 

350 

20 

400 

30 

450 

40 

x 

27


1. Si calcola la media μ della caratteristica a partire 

da tutti i dati sperimentali: 

μ = 

1 N 

∑ ηk 

N k = 1 

2. Si calcolano le medie condizionate ad ogni 

livello q di ogni parametro c i (si utilizzano solo gli n iq 

esperimenti eseguiti con il parametro c i al livello q): 

m 

iq 

= 

1 

n 

niq 

∑ 

iq k = 1 

3. Si valutano gli effetti dei parametri dalla 

differenza tra media generale e medie locali: 

η 


αiq = miq 

− μ 

αiq è una stima della capacità di spostare il valor 

medio del parametro c i al livello q 

In esperimenti con “target” prefissati si 

individua il parametro, ed il livello di parametro 

che forniscono il minor scostamento dal target. 

k 

28

ANOVA (Analisi della Varianza ) 

E’ una procedura che serve ad analizzare la 

variabilità dei risultati di una misura 

attribuendone la causa a variazioni 

deterministiche di uno o più parametri o aleatorie 

La forma più semplici di ANOVA può essere 

considerata come l’estensione del test delle 

ipotesi: invece di confrontare le medie di due 

popolazioni, confrontiamo le medie di un 

numero maggiore di popolazioni, 

simultaneamente in una singola analisi. 


Supponiamo di avere 4 popolazioni da confrontare. In 

questo caso potrei quindi ingenuamente pensare di 

fare 6 confronti con 6 test delle ipotesi, ognuno per 

ogni possibile coppia di popolazioni. 

il problema in questi 6 confronti è quello dell’errore 

complessivo di primo tipo, detto anche 

Experimentwise Error). 

Se la probabilità di compiere un errore di primo tipo 

era stata prefissata al valore α in ciascuno dei test, è 

chiaro che più test faccio, più aumenta la probabilità di 

compiere errori di primo tipo. 

29


In generale se ripetiamo n test delle ipotesi la 

probabilità di non fare nessun errore di primo tipo è 

( ) n 

− 

P = 1− 

1 α 

Per esempio, se α = 0.05, come di solito, la probabilità 

di fare almeno un errore di primo tipo in 6 test è 0.26. 

Se facessi 20 test la probabilità sarebbe pari a 0.65. 

Con una probabilità molto alta (65%), quindi, almeno 

un test darebbe erroneamente un risultato significativo 

anche se fosse vera l’ipotesi nulla. 


TERMINOLOGIA 

l’ANOVA serve per confrontare le medie di diverse 

(più di due) popolazioni. 

Le medie di una variabile quantitativa, come altezza, 

peso, concentrazione, etc. misurata sulle singole 

osservazioni. 

Il fattore, nell’ANOVA, é invece l’elemento che 

distingue le diverse popolazioni, e al quale siamo 

interessati. Il fattore viene anche detto via, oppure 

criterio di classificazione. 

Il fattore può essere presente in più livelli 

L’anova può essere fatta con più fattori 

30


Esempio 

Supponiamo aver campionato 20 individui in 4 popolazioni 

di una certa specie di coleottero prelevati a differenti livelli di 

quota. Peso ciascuno degli 80 individui e mi chiedo 

se esente una differenza tra i pesi medi 

nelle 4 diverse quote di provenienza. 

l’ipotesi nulla è di uguaglianza tra le medie nelle 4 

popolazioni da cui provengono i campioni: 

H0: m1 = m 2 = m 3 = m 4 

L’ipotesi alternativa è invece quella che prevede che 

ALMENO una media sia diversa. 

H1: m1 = m 2 = m 3 = m 4 


Esempio 

variabile: peso degli individui 

fattore: quota dell’habitat 

livelli del fattore: diversi livelli di quota 

31


Può essere 

ANOVA univariata unifattoriale (One-way 

Anova): considera gli effetti di un parametro 

controllato sul prodotto (processo) 

ANOVA multifattoriale si cerca di capire come 

diversi fattori agiscono sulla variabile 

considerata e interagiscono tra di loro 

Two-way Anova: vi sono due parametri 

controllati 

Three-way Anova: ………c.s. 

ONE WAY ANOVA 

Se tutti i campioni provengono da popolazioni con la stessa 

media (ossia, se é vera l’ipotesi nulla), esistono due modi 

per stimare la varianza della variabile: 

Il primo modo é quello di utilizzare le varianze calcolate 

nei singoli campioni e calcolarne la media pesata per i 

diversi gradi di libertà. 

Questa varianza misura la dispersione delle singole 

osservazioni rispetto alla media del gruppo dal quale le 

osservazioni provengono (e quindi non dipende 

dall’eventuale differenza tra le popolazioni). Tale 

stima viene si chiama varianza entro gruppi, o varianza 

residua, o varianza dell’errore. Noi la chiameremo MSE 

(Mean Square Error). La stima MSE, è corretta nel caso 

sia vera l’ipotesi nulla, e anche nel caso sia vera 

l’ipotesi alternativa 

32

ONE WAY ANOVA 

Il secondo modo i basa sulla dispersione delle medie 

osservate nei diversi campioni. 

Abbiamo infatti visto che le medie campionarie estratte da 

una popolazione con varianza σ 2 si distribuiscono con una 

varianza pari a σ 2 /n (n e’ il numero di osservazioni nel 

singolo campione). 

Abbiamo a disposizione un numero k di medie campionarie 

dalle quali possiamo calcolare direttamente una stima della 

varianza delle medie (casa che non potevo fare con un 

campione solo), σ 2 (y-barra). Se appunto é vera l’ipotesi 

nulla, questa varianza delle medie stimata dalle medie nei 

diversi campioni é una stima di σ 2 /n chiamata varianza 

tra gruppi, o MSB 

ONE WAY ANOVA 

Se é vera l’ipotesi nulla, MSE e MSB stimano la stessa cosa 

(σ 2 ), e quindi i rapporto MSB/MSE tende ad essere 1 e ad 

essere distribuito come la distribuzione teorica Fisher (che é 

appunto il rapporto tra due varianze). 

Se invece é vera l’ipotesi alternativa, (almeno una media é 

diversa dalle altre), MSE stima ancora σ 2 , ma questo non é 

più vero per MSB. Infatti MSE é sempre una varianza entro 

gruppi, anche se le medie dei gruppi sono diverse. MSB 

invece utilizza la varianza delle medie campionarie calcolata 

dai dati che, se non é vera l’ipotesi nulla, tende ad essere 

maggiore di σ 2 /n. Quindi, se é vera H1, MSB/MSE tende 

ad essere maggiore di 1, e posso testare la significatività 

di questo rapporto con il test di Fisher. 

33

ONE WAY ANOVA 

ONE WAY ANOVA 

Esempio coleotteri 

Peso 

n i 

y i =Σ j x ij 

µ i 

σ i 

1 

12.3 

12.6 

13.1 

12.5 

12.8 

5 

63.3 

12.660 

LIVELLI DI QUOTA 

11.9 

11.8 

11.4 

3 

35.1 

11.700 

12.2 

12.6 

12.5 

12.4 

4 

49.7 

12.425 

MSB= MSE= 

2 

3 

4 

12.1 

12.5 

12.4 

11.7 

4 

48.7 

12.175 

totale 

16 

196.8 

12.30 

34

ONE WAY ANOVA 

Vediamo ora un modo assolutamente equivalente 

per arrivare a MSE e MSB, ma a partire dalla 

scomposizione degli scarti. La variazione totale può 

essere decomposta in : 

• variazione della media di tutte le osservazioni 

rispetto a zero; 

• variazione della media delle osservazioni 

relative ad ogni livello del parametro rispetto 

alla media di tutte le osservazioni. 

• variazione delle singole osservazioni rispetto 

alla media delle osservazioni di ogni livello del 

parametro. 

ONE WAY ANOVA 

SSTO 

SSTO 

SSTO 

= 

= 

= 

2 

∑( 

yij 

− yˆ 

) = ∑( 

( yij 

− yˆ 

i ) − ( yˆ 

i − yˆ 

) ) 

j, 

j 

2 

∑( 

yij 

− yˆ 

i ) −∑ 

ni 

( yˆ 

i − yˆ 

) 

j, 

j 

SS 

e 

+ SS 

M 

j, 

j 

Devianza totale = Devianza entro gruppi + Devianza tra gruppi 

La somma del quadrato dei dati è pari alla somma 

del quadrato dei valori medi somma del quadrato 

degli errori 

j 

2 

2 

35

SS 

SS 

SS 

ESEMPIO DI UTILIZZO DI ONE WAY ANOVA 

Pompa N. 

Velocità di 

afflusso 

(dl/s) 

T 

M 

e 

= 5 

2 

+ 6 

T 

N 

2 

2 

1 

5 

+ 8 

2 

6 

3 

8 

4 

2 

Risulta N=8 

T=40 dl/s 

Ť =5.0 dl/s 

ESEMPIO DI UTILIZZO DI NO-WAY ANOVA 

⎛ 

= N⎜ 

⎝ 

⎞ 

⎟ 

⎠ 

= 

= 222 − 200 = 22 ( dl / s) 

2 

+ 2 

T 

N 

2 

2 

+ 5 

2 

40 

= 

8 

2 

+ 4 

2 

2 

5 

5 

+ 4 

La varianza dell'errore 

vale: 

2 

6 

4 

+ 6 

2 

= 200 ( dl / s) 

( ν è il numero di gradi di libertà 

e 

SSe 

ν 

e 

= 

2 

7 

4 

8 

6 

= 222 ( dl / s) 

22 

7 

= 

3, 

14 

per l'errore) 

2 

36

TWO WAY ANOVA 

TWO WAY ANOVA 

37

Progettazione degli esperimenti 

38

Lezione 8

Create successful ePaper yourself

Delete template?

Save as template?