You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
N<br />
∑(<br />
x − x)<br />
i<br />
i<br />
s = = 1 N<br />
cioè la media degli scarti, ho una variabile identicamente nulla. Infatti si ha:<br />
1<br />
= ∑ N<br />
xi<br />
Nx<br />
i= s − = x − x = 0<br />
N N<br />
per definizione. In effetti ciò significa che la media aritmetica é proprio quel valore di x rispetto al<br />
quale é nulla la media degli scarti. Una definizione più appropriata di dispersione si ottiene<br />
considerando la media degli scarti al quadrato<br />
s<br />
N<br />
∑(<br />
x<br />
− x)<br />
2<br />
2<br />
i<br />
i=<br />
= 1<br />
N<br />
e poi prendendone la radice quadrata (per avere anche una grandezza omogenea dimensionalmente<br />
a x):<br />
s<br />
i=<br />
1<br />
=<br />
N<br />
∑(<br />
x<br />
i<br />
− x)<br />
N<br />
2<br />
Si tratta di una grandezza sempre positiva che prende il nome di deviazione standard campionaria o<br />
anche semplicemente deviazione standard. Il suo quadrato é detto varianza campionaria o<br />
semplicemente varianza. Il suo significato é chiaramente intuitivo (quanto scarto in media dalla<br />
media). Rispetto alla stima dell’intervallo massimo, ha il vantaggio di usare tutti i dati e di essere<br />
meno sensibile ad eventuali fluttuazioni anomale. Nel seguito del corso vedremo più<br />
approfonditamente il suo significato. Per ora essa é una stima della “dispersione delle misure”.<br />
Si noti che in base alla definizione appena fatta, c’è un secondo modo di calcolare la deviazione<br />
standard campionaria. Infatti essa può essere espressa come (consideriamo prima la varianza<br />
campionaria):<br />
s<br />
2<br />
N<br />
∑(<br />
xi<br />
i=<br />
1<br />
=<br />
2<br />
− 2x<br />
x + x<br />
N<br />
i<br />
2<br />
)<br />
N<br />
∑ xi<br />
i=<br />
1<br />
=<br />
N<br />
2<br />
N<br />
x∑<br />
xi<br />
i=<br />
1<br />
− 2<br />
N<br />
+ x<br />
2<br />
=<br />
x<br />
2<br />
− x<br />
cioè come la differenza tra la media dei quadrati e il quadrato della media. Si noti che tale<br />
differenza non é 0 in generale ma é per definizione una quantità positiva. Cosi’ definita, la<br />
deviazione standard può essere valutata senza aver prima valutato la media aritmetica. Dal punto di<br />
visto del calcolo, significa che anziché fare 2 “loops” sulle misure, é sufficiente farne 1.<br />
Se definisco un intervallo centrato nella media e di semilarghezza pari alla deviazione standard,<br />
questo intervallo non é un intervallo massimo. Rappresenta solo una parte della larghezza. Non<br />
sono certo che la misura cada là dentro. Tuttavia é una misura proporzionale alla larghezza. Fig.1.7<br />
mostra per alcuni istogrammi, l’intervallo centrato sulla media delle misure e avente la deviazione<br />
standard come semilarghezza. Si può osservare (si tratta di una osservazione su base puramente<br />
empirica per la quale troveremo una giustificazione nel seguito del corso) che costruendo intervalli<br />
di semilarghezza pari a 3 volte la deviazione standard, si ottengono intervalli all’interno dei quali<br />
praticamente tutti i valori sono contenuti. Nel seguito chiameremo tali intervalli, intervalli di quasicertezza.<br />
Nel seguito vedremo anche che la deviazione standard come l’abbiamo definita deve essere corretta<br />
per tenere conto del fatto che nel considerare gli scarti tra ciascuna misura e la media aritmetica, in<br />
realtà sto usando 2 volte ciascuna misura: infatti ciascuna misura compare sia nella media, che<br />
come singola misura. Questo fatto si traduce nella seguente definizione:<br />
2<br />
23