14.01.2013 Views

ESERCITAZIONI DI STATISTICA BIOMEDICA

ESERCITAZIONI DI STATISTICA BIOMEDICA

ESERCITAZIONI DI STATISTICA BIOMEDICA

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

3.3 Trasformazione dei dati 33<br />

rstandard(mod)<br />

−1.5 −1.0 −0.5 0.0 0.5 1.0 1.5 2.0<br />

0 20 40 60 80 100<br />

mod$fitted<br />

−2 −1 0 1<br />

2 4 6 8 10<br />

Figura3.5: Analisideiresiduiperl’Esempio3.3.1. Asinistrailgraficodei residuistandardizzaticontro<br />

i valori fittati dal modello lineare evidenzia forti problemi di non linearità. A destra il corrispondente<br />

graficoperilmodellotrasformatomostracheilproblemaèstatorisoltodallatrasformazionet(y) = √ y.<br />

Esempio<br />

Un nuovo centro commerciale inizia una campagna pubblicitaria per incrementare il numero dei suoi<br />

clienti. Il numero medio di visitatori per unità di tempo viene monitorato per 20 settimane dopo<br />

l’inizio della promozione. I dati sono quelli inseriti nei due vettori tempo e visitatori.<br />

> tempo visitatori mod plot(mod$fitted, rstandard(mod))<br />

Dall’analisi del grafico risulta evidente che vi è un forte problema di non linearità. Tramite il metodo<br />

di Box-Cox si può tentare di stimare la miglior correzione da apportare ai dati. La chiamata:<br />

> library(MASS) # caricamento della libreria MASS<br />

> boxcox(visitatori ~ tempo, lambda=seq(0.3, 0.6, by=0.01))<br />

produce il grafico a sinistra in Fig. 3.6. Sull’asse delle ascisse, il cui range e densità di campionamento<br />

possono essere impostati mediante l’opzione lambda, si leggono i valori del parametro λ. La miglior<br />

trasformazione possibile corrisponde al valore per cui la curva ha il suo massimo. La libreria MASS,<br />

che mette a disposizione la funzione boxcox, fa parte della distribuzione standard di R.<br />

Dal graficosi può leggerela stima della migliortrasformazioneda applicarealla variabiley. Questa<br />

stima viene fatta tramite il metodo di maximum likelihood, assumendo normalità degli errori. Per<br />

ulteriori dettagli sul procedimento si rimanda a [26, 59]. Il risultato migliore è λ ∼ 0.45, ma per<br />

ragioni di semplicità di interpretazione è più opportuno scegliere il valore λ = 0.5 (trasformazione<br />

radice quadrata), valore che cade sul margine destro dell’intervallo di confidenza.<br />

Si fitta quindi il modello trasformato e si analizzano i residui (a destra in Fig. 3.5):<br />

> mod1 plot(mod1$fitted, rstandard(mod1))<br />

Si nota che i problemi del modello precedente vengono risolti dalla trasformazione scelta. A destra in<br />

Fig. 3.6 sono riportati i punti sperimentali e i due fit. �<br />

rstandard(mod1)<br />

mod1$fitted

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!