13.07.2015 Views

una tecnica per la regressione locale - Department of Mathematics ...

una tecnica per la regressione locale - Department of Mathematics ...

una tecnica per la regressione locale - Department of Mathematics ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

La funzione smooth.spline di R <strong>of</strong>fre tre diversi modi di specificare il valoredi α voluto.In Figura 2.4 si è utilizzato il parametro spar con valori 0.1, 0.8 e 1.5. Percome è stata costruita smooth.spline, α è <strong>una</strong> funzione monotona crescentedi spar quindi il risultato ottenuto è <strong>per</strong>fettamente in accordo con <strong>la</strong> teoria.Si vede infatti che al crescere di spar, e quindi di α, <strong>la</strong> stima di g parte come<strong>una</strong> curva irrego<strong>la</strong>re ma molto fedele ai dati e diventa, <strong>per</strong> spar = 1.5, <strong>una</strong>retta di <strong>regressione</strong>. É evidente che in questo caso l’ultima stima è del tuttoinadeguata.Il secondo modo di scegliere α è <strong>una</strong> <strong>tecnica</strong> indiretta che, analogamente aquanto abbiamo visto <strong>per</strong> il Loess, passa attraverso <strong>la</strong> richiesta del numerodi gradi di libertà desiderato <strong>per</strong> <strong>la</strong> stima. L’argomento del<strong>la</strong> funzione implementatada R preposto a questa scelta è df. I risultati ottenuti sono visibiliin Figura 2.5.Se nel<strong>la</strong> funzione non si inserisce un valore nè <strong>per</strong> spar, nè <strong>per</strong> df, α vienedeterminato tramite <strong>una</strong> <strong>tecnica</strong> automatica chiamata Cross-Validation, ilcui meccanismo verrà descritto più avanti. La curva presente in Figura 2.6 èstata ottenuta in questo modo.2.2 Proprietà statisticheIn vista dello studio delle tecniche <strong>per</strong> <strong>la</strong> selezione del parametro di lisciamentoe di altre procedure inferenziali, è necessario descrivere alcune proprietàche sono comuni a tutti gli stimatori lineari. Consideriamo <strong>una</strong> misuradel<strong>la</strong> bontà del<strong>la</strong> stima di g(x), in partico<strong>la</strong>re l’errore quadratico medio,MSE(x) = E((ĝ(x) − g(x)) 2 ) = var(ĝ(x)) + bias(ĝ(x)) 2dove <strong>la</strong> distorsione è data da bias(ĝ) = E(ĝ(x)) − g(x).Intuitivamente, <strong>per</strong> quanto riguarda i Kernel Smoothers ed anche il Loess, alcrescere del parametro di lisciamento α vengono usati più dati <strong>per</strong> costruire <strong>la</strong>39

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!