una tecnica per la regressione locale - Department of Mathematics ...
una tecnica per la regressione locale - Department of Mathematics ...
una tecnica per la regressione locale - Department of Mathematics ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
A questo punto è possibile calco<strong>la</strong>re <strong>una</strong> statistica F considerando l’approssimazionefatta con <strong>la</strong> <strong>regressione</strong> lineare e quel<strong>la</strong> con un modello alternativo,e valutandone <strong>la</strong> differenza. Sotto l’ipotesi nul<strong>la</strong> i valori stimati siano dati daMY , dove M è <strong>la</strong> matrice hat <strong>per</strong> un’approssimazione nel senso dei minimiquadrati. Sotto l’ipotesi alternativa i valori stimati siano invece HY , dove Hè <strong>la</strong> matrice hat <strong>per</strong> <strong>una</strong> <strong>regressione</strong> basata su tecniche derivate dai KernelSmoothers. F allora si può scrivere comeF = ||HY − MY ||2 /νˆσ 2dove ν = tr((H − M) ′ (H − M)). Questa statistica non ha <strong>una</strong> distribuzioneF esatta; nonostante questo, approssimando <strong>la</strong> distribuzione che ci interessacon <strong>una</strong> F , supposto che H 0 sia vera, otteniamo dei risultati ragionevoli. Labontà di questi risultati è influenzata dalle quantità usate <strong>per</strong> stimare i gradidi libertà del<strong>la</strong> F . Una possibile scelta è ν <strong>per</strong> il numeratore e n − 2ν 1 + ν 2<strong>per</strong> il denominatore. L’approssimazione può <strong>per</strong>ò essere migliorata o<strong>per</strong>andodelle trasformazioni su queste quantità: sia Λ = (H − M) ′ (H − M), i gradidi libertà del numeratore diventano tr(Λ) 2 /tr(Λ 2 ), similmente si ottengono igradi di libertà del denominatore.Una volta descritta <strong>la</strong> distribuzione approssimata del<strong>la</strong> statistica F il test diipotesi si conduce considerando il p-value che si calco<strong>la</strong> a partire da F . Essosarà certamente valido in quanto valori grandi del<strong>la</strong> statistica che stiamoutilizzando sono prove contro l’ipotesi nul<strong>la</strong>, quindi a partire dal p-valuepossiamo costruire <strong>la</strong> regione di rifiuto del test.50