20.05.2013 Views

Richiami di probabilità e statistica (I)

Richiami di probabilità e statistica (I)

Richiami di probabilità e statistica (I)

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

€<br />

€<br />

<strong>Richiami</strong> <strong>di</strong> <strong>probabilità</strong> e <strong>statistica</strong> (I)<br />

E’ equivalente determinare la <strong>di</strong>stribuzione <strong>di</strong> densità <strong>di</strong> <strong>probabilità</strong> p(x) o la <strong>di</strong>stribuzione<br />

<strong>di</strong> <strong>probabilità</strong> cumulata P(x), detta anche funzione <strong>di</strong> ripartizione o <strong>probabilità</strong> <strong>di</strong> non<br />

superamento, infatti:<br />

P(x)= Pr ob[X ≤ x] = p(z)dz<br />

p(x)= dP<br />

dx<br />

Relazione fra tempo <strong>di</strong> ritorno T e <strong>probabilità</strong> <strong>di</strong> non superamento P:<br />

€<br />

1<br />

T =<br />

1−P(x)<br />

P(x)=1− 1<br />

T<br />

Fissato il tempo <strong>di</strong> ritorno T si ricava la <strong>probabilità</strong> <strong>di</strong> non superamento P e quin<strong>di</strong> la portata<br />

o pioggia x con tempo <strong>di</strong> ritorno T.<br />

La <strong>probabilità</strong> <strong>di</strong> superamento Ps(x) sarà invece:<br />

€<br />

∫<br />

x<br />

−∞<br />

P s = 1<br />

T<br />

= (1− P)<br />

1


<strong>Richiami</strong> <strong>di</strong> <strong>probabilità</strong> e <strong>statistica</strong> (II)<br />

La <strong>di</strong>stribuzione <strong>di</strong> <strong>probabilità</strong> cumulata P(x), o in modo equivalente la <strong>di</strong>stribuzione <strong>di</strong><br />

densità <strong>di</strong> <strong>probabilità</strong> p(x), viene determinata utilizzando il campione osservato:<br />

x = (x1 , x2 , . . . , xn), rior<strong>di</strong>nato in or<strong>di</strong>ne crescente.<br />

Distribuzione <strong>di</strong> frequenza relativa:<br />

Distribuzione <strong>di</strong> frequenza cumulata:<br />

Il campo delle osservazioni (<strong>di</strong> portata o pioggia) deve essere stato sud<strong>di</strong>viso in classi o<br />

intervalli <strong>di</strong> ampiezza Δx. €<br />

nk è il numero <strong>di</strong> osservazioni che ricadono nell’intervallo k-esimo [xk - Δx , xk].<br />

€<br />

fk = nk n<br />

F(xj )= ∑<br />

j<br />

f<br />

k =1<br />

k<br />

Più spesso in idrologia la <strong>di</strong>stribuzione <strong>di</strong> frequenza cumulata è definita attraverso una<br />

regola <strong>di</strong> plotting position, ad esempio:<br />

F j =F(x j)=<br />

j<br />

n +1<br />

oppure : F j =F(x j )=<br />

j − 0.5<br />

n<br />

2


<strong>Richiami</strong> <strong>di</strong> <strong>probabilità</strong> e <strong>statistica</strong> (III)<br />

Proprietà statistiche delle serie temporali<br />

Principali in<strong>di</strong>ci statistici delle serie temporali:<br />

N : in<strong>di</strong>ca la numerosità della serie temporale (y1 , y2 , . . . yt)<br />

Me<strong>di</strong>a:<br />

Varianza: s<br />

€<br />

Scarto quadratico (o deviazione standard): s<br />

2 1<br />

= (yt − y)<br />

N −1<br />

2<br />

N<br />

∑<br />

t =1<br />

Coefficiente <strong>di</strong> variazione:<br />

€<br />

Coefficiente <strong>di</strong> asimmetria:<br />

Coefficiente <strong>di</strong> autocorrelazione:<br />

€<br />

essendo:<br />

y = 1<br />

N ⎛⎛ ⎞⎞<br />

⎜⎜ ⎟⎟ ∑ yt ⎝⎝ N ⎠⎠<br />

t =1<br />

L'andamento <strong>di</strong> rk al variare <strong>di</strong> k fornisce il correlogramma.<br />

g =<br />

N<br />

∑<br />

N ( y t − y ) 3<br />

t =1<br />

( N −1)( N − 2) s 3<br />

3


€<br />

Analisi <strong>statistica</strong> dei massimi annui <strong>di</strong> portata al colmo<br />

Rior<strong>di</strong>no i massimi annui <strong>di</strong> portata al colmo Qi e assegno a ciascuno una frequenza cumulata<br />

F(Qi) utilizzando una regola <strong>di</strong> ”plotting position”:<br />

Q : Q1 ≤ Q2 ≤ . . . ≤ Qi ≤ . . . ≤ QN<br />

F(Q): 1/(N+1) ; 2/(N+1) ; . . . ; i/(N+1) ; . . . ; N/(N+1)<br />

Dove:<br />

Qi<br />

= massimo annuo i-­‐esimo (posizione rior<strong>di</strong>nata) <strong>di</strong> portata al colmo<br />

F(Qi) = frequenza cumulata corrispondente alla portata Qi .<br />

Ricor<strong>di</strong>amo che:<br />

Il tempo <strong>di</strong> ritorno T associato ad una portata QT<br />

è il tempo (espresso in anni) che me<strong>di</strong>amente<br />

intercorre fra due osservazioni <strong>di</strong> portata massima<br />

annua ¸ ≥ QT . La relazione con la <strong>probabilità</strong> P <strong>di</strong> non<br />

superamento (CDF) `e:<br />

1<br />

T =<br />

1− P(QT )<br />

P(Q T )=1− 1<br />

T<br />

1. Scelta <strong>di</strong>stribuzione; 2. Stima parametri; 3. Test <strong>di</strong> adattamento<br />

P(Q)<br />

F(Q)<br />

1<br />

P(Q )<br />

T<br />

1/T<br />

11/T<br />

Q 1<br />

Q 3 Q 4<br />

Q 2<br />

Q T<br />

Q N<br />

Q<br />

4


€<br />

€<br />

€<br />

Alcune <strong>di</strong>stribuzioni <strong>di</strong> <strong>probabilità</strong> utilizzate in idrologia<br />

• Lognormale<br />

Si trasforma l’osservazione x <strong>di</strong> portata o pioggia in y = log x e si utilizza la Normale:<br />

P(x)=P(y)=<br />

∫<br />

y<br />

−∞<br />

1<br />

exp −<br />

σ 2π<br />

1 ⎧⎧<br />

2<br />

⎡⎡ y − µ ⎤⎤ ⎫⎫<br />

⎨⎨<br />

2⎣⎣<br />

⎢⎢<br />

σ ⎦⎦<br />

⎥⎥ ⎬⎬ dy<br />

⎩⎩ ⎭⎭<br />

dove µ = µ(y) e σ = σ(y) sono la me<strong>di</strong>a e scarto attesi (teorici) della <strong>di</strong>stribuzione <strong>di</strong> y.<br />

• Gumbel (<strong>di</strong>stribuzione asintotica del massimo valore tipo 1, detta anche EV1)<br />

{ [ ] }<br />

P(x)=exp −exp −α(x − u)<br />

dove α = 1.283/σ(x) ; u = µ(x) – 0.45 σ(x),<br />

µ(x) e σ(x) sono la me<strong>di</strong>a e lo scarto attesi della <strong>di</strong>stribuzione <strong>di</strong> x.<br />

• TCEV (<strong>di</strong>stribuzione asintotica del massimo valore a due componenti)<br />

P(x)=exp(−λ 1e −x /θ 1 −λ2 e −x /θ 2 )<br />

<strong>di</strong>stribuzione a 4 parametri il cui utilizzo è in<strong>di</strong>rizzato alle analisi regionali.<br />

5


Stima dei parametri <strong>di</strong> una <strong>di</strong>stribuzione probabilistica<br />

• Metodo dei momenti: Si eguagliano i momenti teorici della <strong>di</strong>stribuzione <strong>di</strong> <strong>probabilità</strong><br />

ai momenti campionari.<br />

Occorre eguagliare tanti momenti quanti sono i parametri da stimare.<br />

Me<strong>di</strong>a campionaria:<br />

Varianza campionaria:<br />

€<br />

m= 1<br />

n<br />

n<br />

x<br />

i =1<br />

i<br />

L’incertezza <strong>di</strong> stima dei momenti cresce con l’or<strong>di</strong>ne del momento.<br />

In pratica, si sostituiscono ai momenti teorici (ad esempio a µ e σ della lognormale o<br />

Gumbel) i momenti calcolati<br />

€<br />

sul campione: µ ≅ m ; σ ≅ s<br />

• Metodo della massima verosimiglianza: Si rimanda al corso <strong>di</strong> <strong>statistica</strong>.<br />

∑<br />

s 2 = 1 n<br />

∑ (xi − m)<br />

i =1 n −1<br />

2<br />

6


Verifica delle ipotesi (test statistici: esempio del χ 2)<br />

• Ipotesi nulla (H0): Il campione x = (x1 , x2 , . . . , xn) è una realizzazione estratta dalla<br />

<strong>di</strong>stribuzione <strong>di</strong> <strong>probabilità</strong> P(x);<br />

• Statistica test S: <strong>statistica</strong> utilizzata per il test (ad esempio il test del χ2 );<br />

• Livello <strong>di</strong> significatività del test (α): <strong>probabilità</strong> <strong>di</strong> rifiuto <strong>di</strong> ipotesi nulla vera (es: α =<br />

0:05; 0:01; 0:001); definisce la zona <strong>di</strong> rifiuto (R);<br />

• Regione <strong>di</strong> accettazione (W): è complementare alla zona <strong>di</strong> rifiuto;<br />

2 (n j − np j )<br />

χ c =<br />

2<br />

K<br />

Test Statistico del χ 2 (K. Pearson):<br />

• K = numero <strong>di</strong> classi in cui si sud<strong>di</strong>vide il campo della variabile casuale X<br />

• pj = P[xj ≤ X < xj+1] = P(xj+1) - P(xj) = <strong>probabilità</strong> che la variabile casuale X ricada nella<br />

classe j-­‐esima, nel caso in cui H0 sia vera.<br />

• nj = numero <strong>di</strong> osservazioni€ che ricadono nella classe j-­‐esima<br />

• n = numero totale <strong>di</strong> osservazioni<br />

• npj = numero <strong>di</strong> osservazioni atteso per la classe j-­‐esima<br />

Zona <strong>di</strong> rifiuto: R = {χc 2≥ χ2 (α , ν)} ; Zona <strong>di</strong> accettazione: W={χc 2 < χ2 (α , ν)}<br />

ν = (K - 1 – s) = gra<strong>di</strong> <strong>di</strong> libertà;<br />

s = numero <strong>di</strong> parametri della <strong>di</strong>stribuzione P(x) stimati con il campione x ;<br />

Regola <strong>di</strong> equi-<strong>probabilità</strong> <strong>di</strong> Gumbel: p1 = p2 = . . . = pj = . . . = pK<br />

Regola empirica per il calcolo del n. <strong>di</strong> classi K: npj ≥ 5 ⇒ K ≤ n/5<br />

∑<br />

j=1<br />

np j<br />

7


€<br />

Inversione delle <strong>di</strong>stribuzioni Gumbel e Lognormale<br />

Distribuzione Gumbel<br />

• I parametri α e u sono già stati calcolati.<br />

• Fisso T (tempo <strong>di</strong> ritorno), calcolo la <strong>probabilità</strong> <strong>di</strong> non superamento P = 1 – 1/T<br />

• La portata o pioggia con tempo <strong>di</strong> ritorno T è:<br />

x = u − ln(−ln(P))<br />

α<br />

Distribuzione Lognormale<br />

(<strong>di</strong>stribuzione normale della variabile trasformata y = ln x, ovvero y = log10 x)<br />

• I parametri µy e σy sono già stati calcolati.<br />

• Fisso T, calcolo la <strong>probabilità</strong> <strong>di</strong> non superamento P = 1 – 1/T<br />

• Ricavo il frattile zP della <strong>di</strong>stribuzione N(0,1) dalle tavole.<br />

• Ricavo la variabile trasformata: y = µy +σy zP<br />

• La portata o pioggia con tempo <strong>di</strong> ritorno T è:<br />

x = exp(y) ovvero: x = 10 y<br />

8

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!