Richiami di probabilità e statistica (I)
Richiami di probabilità e statistica (I)
Richiami di probabilità e statistica (I)
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
€<br />
€<br />
<strong>Richiami</strong> <strong>di</strong> <strong>probabilità</strong> e <strong>statistica</strong> (I)<br />
E’ equivalente determinare la <strong>di</strong>stribuzione <strong>di</strong> densità <strong>di</strong> <strong>probabilità</strong> p(x) o la <strong>di</strong>stribuzione<br />
<strong>di</strong> <strong>probabilità</strong> cumulata P(x), detta anche funzione <strong>di</strong> ripartizione o <strong>probabilità</strong> <strong>di</strong> non<br />
superamento, infatti:<br />
P(x)= Pr ob[X ≤ x] = p(z)dz<br />
p(x)= dP<br />
dx<br />
Relazione fra tempo <strong>di</strong> ritorno T e <strong>probabilità</strong> <strong>di</strong> non superamento P:<br />
€<br />
1<br />
T =<br />
1−P(x)<br />
P(x)=1− 1<br />
T<br />
Fissato il tempo <strong>di</strong> ritorno T si ricava la <strong>probabilità</strong> <strong>di</strong> non superamento P e quin<strong>di</strong> la portata<br />
o pioggia x con tempo <strong>di</strong> ritorno T.<br />
La <strong>probabilità</strong> <strong>di</strong> superamento Ps(x) sarà invece:<br />
€<br />
∫<br />
x<br />
−∞<br />
P s = 1<br />
T<br />
= (1− P)<br />
1
<strong>Richiami</strong> <strong>di</strong> <strong>probabilità</strong> e <strong>statistica</strong> (II)<br />
La <strong>di</strong>stribuzione <strong>di</strong> <strong>probabilità</strong> cumulata P(x), o in modo equivalente la <strong>di</strong>stribuzione <strong>di</strong><br />
densità <strong>di</strong> <strong>probabilità</strong> p(x), viene determinata utilizzando il campione osservato:<br />
x = (x1 , x2 , . . . , xn), rior<strong>di</strong>nato in or<strong>di</strong>ne crescente.<br />
Distribuzione <strong>di</strong> frequenza relativa:<br />
Distribuzione <strong>di</strong> frequenza cumulata:<br />
Il campo delle osservazioni (<strong>di</strong> portata o pioggia) deve essere stato sud<strong>di</strong>viso in classi o<br />
intervalli <strong>di</strong> ampiezza Δx. €<br />
nk è il numero <strong>di</strong> osservazioni che ricadono nell’intervallo k-esimo [xk - Δx , xk].<br />
€<br />
fk = nk n<br />
F(xj )= ∑<br />
j<br />
f<br />
k =1<br />
k<br />
Più spesso in idrologia la <strong>di</strong>stribuzione <strong>di</strong> frequenza cumulata è definita attraverso una<br />
regola <strong>di</strong> plotting position, ad esempio:<br />
F j =F(x j)=<br />
j<br />
n +1<br />
oppure : F j =F(x j )=<br />
j − 0.5<br />
n<br />
2
<strong>Richiami</strong> <strong>di</strong> <strong>probabilità</strong> e <strong>statistica</strong> (III)<br />
Proprietà statistiche delle serie temporali<br />
Principali in<strong>di</strong>ci statistici delle serie temporali:<br />
N : in<strong>di</strong>ca la numerosità della serie temporale (y1 , y2 , . . . yt)<br />
Me<strong>di</strong>a:<br />
Varianza: s<br />
€<br />
Scarto quadratico (o deviazione standard): s<br />
2 1<br />
= (yt − y)<br />
N −1<br />
2<br />
N<br />
∑<br />
t =1<br />
Coefficiente <strong>di</strong> variazione:<br />
€<br />
Coefficiente <strong>di</strong> asimmetria:<br />
Coefficiente <strong>di</strong> autocorrelazione:<br />
€<br />
essendo:<br />
y = 1<br />
N ⎛⎛ ⎞⎞<br />
⎜⎜ ⎟⎟ ∑ yt ⎝⎝ N ⎠⎠<br />
t =1<br />
L'andamento <strong>di</strong> rk al variare <strong>di</strong> k fornisce il correlogramma.<br />
g =<br />
N<br />
∑<br />
N ( y t − y ) 3<br />
t =1<br />
( N −1)( N − 2) s 3<br />
3
€<br />
Analisi <strong>statistica</strong> dei massimi annui <strong>di</strong> portata al colmo<br />
Rior<strong>di</strong>no i massimi annui <strong>di</strong> portata al colmo Qi e assegno a ciascuno una frequenza cumulata<br />
F(Qi) utilizzando una regola <strong>di</strong> ”plotting position”:<br />
Q : Q1 ≤ Q2 ≤ . . . ≤ Qi ≤ . . . ≤ QN<br />
F(Q): 1/(N+1) ; 2/(N+1) ; . . . ; i/(N+1) ; . . . ; N/(N+1)<br />
Dove:<br />
Qi<br />
= massimo annuo i-‐esimo (posizione rior<strong>di</strong>nata) <strong>di</strong> portata al colmo<br />
F(Qi) = frequenza cumulata corrispondente alla portata Qi .<br />
Ricor<strong>di</strong>amo che:<br />
Il tempo <strong>di</strong> ritorno T associato ad una portata QT<br />
è il tempo (espresso in anni) che me<strong>di</strong>amente<br />
intercorre fra due osservazioni <strong>di</strong> portata massima<br />
annua ¸ ≥ QT . La relazione con la <strong>probabilità</strong> P <strong>di</strong> non<br />
superamento (CDF) `e:<br />
1<br />
T =<br />
1− P(QT )<br />
P(Q T )=1− 1<br />
T<br />
1. Scelta <strong>di</strong>stribuzione; 2. Stima parametri; 3. Test <strong>di</strong> adattamento<br />
P(Q)<br />
F(Q)<br />
1<br />
P(Q )<br />
T<br />
1/T<br />
11/T<br />
Q 1<br />
Q 3 Q 4<br />
Q 2<br />
Q T<br />
Q N<br />
Q<br />
4
€<br />
€<br />
€<br />
Alcune <strong>di</strong>stribuzioni <strong>di</strong> <strong>probabilità</strong> utilizzate in idrologia<br />
• Lognormale<br />
Si trasforma l’osservazione x <strong>di</strong> portata o pioggia in y = log x e si utilizza la Normale:<br />
P(x)=P(y)=<br />
∫<br />
y<br />
−∞<br />
1<br />
exp −<br />
σ 2π<br />
1 ⎧⎧<br />
2<br />
⎡⎡ y − µ ⎤⎤ ⎫⎫<br />
⎨⎨<br />
2⎣⎣<br />
⎢⎢<br />
σ ⎦⎦<br />
⎥⎥ ⎬⎬ dy<br />
⎩⎩ ⎭⎭<br />
dove µ = µ(y) e σ = σ(y) sono la me<strong>di</strong>a e scarto attesi (teorici) della <strong>di</strong>stribuzione <strong>di</strong> y.<br />
• Gumbel (<strong>di</strong>stribuzione asintotica del massimo valore tipo 1, detta anche EV1)<br />
{ [ ] }<br />
P(x)=exp −exp −α(x − u)<br />
dove α = 1.283/σ(x) ; u = µ(x) – 0.45 σ(x),<br />
µ(x) e σ(x) sono la me<strong>di</strong>a e lo scarto attesi della <strong>di</strong>stribuzione <strong>di</strong> x.<br />
• TCEV (<strong>di</strong>stribuzione asintotica del massimo valore a due componenti)<br />
P(x)=exp(−λ 1e −x /θ 1 −λ2 e −x /θ 2 )<br />
<strong>di</strong>stribuzione a 4 parametri il cui utilizzo è in<strong>di</strong>rizzato alle analisi regionali.<br />
5
Stima dei parametri <strong>di</strong> una <strong>di</strong>stribuzione probabilistica<br />
• Metodo dei momenti: Si eguagliano i momenti teorici della <strong>di</strong>stribuzione <strong>di</strong> <strong>probabilità</strong><br />
ai momenti campionari.<br />
Occorre eguagliare tanti momenti quanti sono i parametri da stimare.<br />
Me<strong>di</strong>a campionaria:<br />
Varianza campionaria:<br />
€<br />
m= 1<br />
n<br />
n<br />
x<br />
i =1<br />
i<br />
L’incertezza <strong>di</strong> stima dei momenti cresce con l’or<strong>di</strong>ne del momento.<br />
In pratica, si sostituiscono ai momenti teorici (ad esempio a µ e σ della lognormale o<br />
Gumbel) i momenti calcolati<br />
€<br />
sul campione: µ ≅ m ; σ ≅ s<br />
• Metodo della massima verosimiglianza: Si rimanda al corso <strong>di</strong> <strong>statistica</strong>.<br />
∑<br />
s 2 = 1 n<br />
∑ (xi − m)<br />
i =1 n −1<br />
2<br />
6
Verifica delle ipotesi (test statistici: esempio del χ 2)<br />
• Ipotesi nulla (H0): Il campione x = (x1 , x2 , . . . , xn) è una realizzazione estratta dalla<br />
<strong>di</strong>stribuzione <strong>di</strong> <strong>probabilità</strong> P(x);<br />
• Statistica test S: <strong>statistica</strong> utilizzata per il test (ad esempio il test del χ2 );<br />
• Livello <strong>di</strong> significatività del test (α): <strong>probabilità</strong> <strong>di</strong> rifiuto <strong>di</strong> ipotesi nulla vera (es: α =<br />
0:05; 0:01; 0:001); definisce la zona <strong>di</strong> rifiuto (R);<br />
• Regione <strong>di</strong> accettazione (W): è complementare alla zona <strong>di</strong> rifiuto;<br />
2 (n j − np j )<br />
χ c =<br />
2<br />
K<br />
Test Statistico del χ 2 (K. Pearson):<br />
• K = numero <strong>di</strong> classi in cui si sud<strong>di</strong>vide il campo della variabile casuale X<br />
• pj = P[xj ≤ X < xj+1] = P(xj+1) - P(xj) = <strong>probabilità</strong> che la variabile casuale X ricada nella<br />
classe j-‐esima, nel caso in cui H0 sia vera.<br />
• nj = numero <strong>di</strong> osservazioni€ che ricadono nella classe j-‐esima<br />
• n = numero totale <strong>di</strong> osservazioni<br />
• npj = numero <strong>di</strong> osservazioni atteso per la classe j-‐esima<br />
Zona <strong>di</strong> rifiuto: R = {χc 2≥ χ2 (α , ν)} ; Zona <strong>di</strong> accettazione: W={χc 2 < χ2 (α , ν)}<br />
ν = (K - 1 – s) = gra<strong>di</strong> <strong>di</strong> libertà;<br />
s = numero <strong>di</strong> parametri della <strong>di</strong>stribuzione P(x) stimati con il campione x ;<br />
Regola <strong>di</strong> equi-<strong>probabilità</strong> <strong>di</strong> Gumbel: p1 = p2 = . . . = pj = . . . = pK<br />
Regola empirica per il calcolo del n. <strong>di</strong> classi K: npj ≥ 5 ⇒ K ≤ n/5<br />
∑<br />
j=1<br />
np j<br />
7
€<br />
Inversione delle <strong>di</strong>stribuzioni Gumbel e Lognormale<br />
Distribuzione Gumbel<br />
• I parametri α e u sono già stati calcolati.<br />
• Fisso T (tempo <strong>di</strong> ritorno), calcolo la <strong>probabilità</strong> <strong>di</strong> non superamento P = 1 – 1/T<br />
• La portata o pioggia con tempo <strong>di</strong> ritorno T è:<br />
x = u − ln(−ln(P))<br />
α<br />
Distribuzione Lognormale<br />
(<strong>di</strong>stribuzione normale della variabile trasformata y = ln x, ovvero y = log10 x)<br />
• I parametri µy e σy sono già stati calcolati.<br />
• Fisso T, calcolo la <strong>probabilità</strong> <strong>di</strong> non superamento P = 1 – 1/T<br />
• Ricavo il frattile zP della <strong>di</strong>stribuzione N(0,1) dalle tavole.<br />
• Ricavo la variabile trasformata: y = µy +σy zP<br />
• La portata o pioggia con tempo <strong>di</strong> ritorno T è:<br />
x = exp(y) ovvero: x = 10 y<br />
8