20.06.2013 Views

Dispensa di modelli lineari in R - Dipartimento di Statistica

Dispensa di modelli lineari in R - Dipartimento di Statistica

Dispensa di modelli lineari in R - Dipartimento di Statistica

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Capitolo 5<br />

Costruzione del modello e analisi<br />

dei residui<br />

5.1 Analisi dei dati CEMENT.DAT<br />

I dati nel file cement.dat si riferiscono ad uno stu<strong>di</strong>o sulla resistenza del cemento alla<br />

tensione. La resistenza <strong>di</strong>pende, tra le altre cose, dal tempo <strong>di</strong> essiccazione. Nello<br />

stu<strong>di</strong>o è stata misurata la resistenza alla tensione (<strong>in</strong> kg/cm 2 ) <strong>di</strong> lotti <strong>di</strong> cemento<br />

sottoposti a <strong>di</strong>versi tempi <strong>di</strong> essiccazione (<strong>in</strong> giorni). Si vuole stu<strong>di</strong>are la relazione<br />

tra la resistenza alla tensione e il tempo <strong>di</strong> essiccazione. In questo caso il tempo,<br />

t = (t1, . . . , tn), è la variabile esplicativa e la resistenza, y = (y1, . . . , yn), è la variabile<br />

risposta.<br />

> rm(list = ls())<br />

> Cem attach(Cem)<br />

È utile <strong>in</strong>iziare con un’analisi esplorativa dei dati, per esempio osservando il <strong>di</strong>agramma<br />

<strong>di</strong> <strong>di</strong>spersione tra la variabile risposta e la variabile esplicativa.<br />

> plot(resist ~ tempo)<br />

La Figura 5.1 <strong>in</strong><strong>di</strong>ca chiaramente una relazione non l<strong>in</strong>eare. Qu<strong>in</strong><strong>di</strong>, un modello<br />

che ipotizza che yi, i = 1, . . . , n, siano realizzazioni <strong>di</strong> variabili casuali <strong>in</strong><strong>di</strong>pendenti<br />

Yi ∼ N(β1 + β2ti, σ 2 ) non sembra appropriato. Conviene allora cercare qualche<br />

trasformazione delle variabili che <strong>l<strong>in</strong>eari</strong>zzi la relazione.<br />

Generalmente, si preferisce trasformare le variabili esplicative. Si possono provare<br />

<strong>di</strong>verse trasformazioni della variabile t. La Figura 5.2 mostra l’effetto <strong>di</strong> 4<br />

trasformazioni sul <strong>di</strong>agramma <strong>di</strong> <strong>di</strong>spersione.<br />

> par(mfrow = c(2, 2))<br />

> plot(log(tempo), resist)<br />

> plot(1/(tempo), resist)<br />

> plot(1/sqrt(tempo), resist)<br />

> plot(sqrt(tempo), resist)<br />

> par(mfrow = c(1, 1))<br />

42

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!