20.06.2013 Views

Scarica la relazione finale - DiMaPla

Scarica la relazione finale - DiMaPla

Scarica la relazione finale - DiMaPla

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

S =<br />

MS residual<br />

PRESS è <strong>la</strong> somma dei quadrati dell’errore di predizione del modello, ossia rappresenta<br />

l’abilità di predizione del modello ; esso è calco<strong>la</strong>to attraverso <strong>la</strong><br />

∑ ⎟ n ⎛ ei<br />

⎞<br />

PRESS =<br />

⎜<br />

1 ⎝1<br />

− hi<br />

⎠<br />

con ei = valore residuo ed hi = leverage value. Questi sono ottenuti come elementi del<strong>la</strong> diagonale<br />

−1<br />

principale del<strong>la</strong> matrice H = X ⋅ ( X ′ X ) ⋅ X ′ dove X rappresenta <strong>la</strong> matrice delle osservazioni<br />

R 2 è un coefficiente che illustra come una variazione del<strong>la</strong> risposta sia spiegata dal modello; più<br />

alto risulta questo termine e meglio il modello fitta i dati osservati<br />

2 SS residual<br />

R = 1−<br />

=<br />

SS total<br />

R 2 (adj) tiene conto del numero di fattori del modello<br />

R<br />

2<br />

2<br />

SS regression<br />

SS total<br />

MS residual<br />

( adj)<br />

= 1−<br />

SS total / DF total<br />

R 2 (pred) indica quanto bene il modello predirebbe nuove osservazioni, quando invece R 2 mostra<br />

quanto bene il modello fitta i dati acquisiti; risulta molto utile per confrontare tra loro diversi modelli<br />

in quanto è calco<strong>la</strong>to con le osservazioni che non sono incluse nel modello. La formu<strong>la</strong> per il<br />

calcolo di questo parametro è<br />

2<br />

R ( pred)<br />

= 1−<br />

PRESS<br />

SS total<br />

Oltre a questi indici ce ne sono altri di fondamentale importanza al fine di comprendere al meglio<br />

tutta <strong>la</strong> tabel<strong>la</strong> dell’analisi del<strong>la</strong> varianza.<br />

I gradi di libertà (DF) indicano il numero di variabili indipendenti, derivanti dai dati osservati, che<br />

sono necessari per il calcolo delle somme dei quadrati. I gradi di libertà di ciascun componente<br />

sono:<br />

DF regression p-1<br />

DF residual error N-p<br />

DF pure error N-n<br />

DF <strong>la</strong>ck of fit n-p<br />

DF total N-1<br />

dove N è il numero di osservazioni totali, n il numero delle osservazioni non replicate e p è il<br />

numero dei termini che compongono il modello.<br />

134

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!