Dispensa di modelli lineari in R - Dipartimento di Statistica
Dispensa di modelli lineari in R - Dipartimento di Statistica
Dispensa di modelli lineari in R - Dipartimento di Statistica
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Capitolo 5<br />
Costruzione del modello e analisi<br />
dei residui<br />
5.1 Analisi dei dati CEMENT.DAT<br />
I dati nel file cement.dat si riferiscono ad uno stu<strong>di</strong>o sulla resistenza del cemento alla<br />
tensione. La resistenza <strong>di</strong>pende, tra le altre cose, dal tempo <strong>di</strong> essiccazione. Nello<br />
stu<strong>di</strong>o è stata misurata la resistenza alla tensione (<strong>in</strong> kg/cm 2 ) <strong>di</strong> lotti <strong>di</strong> cemento<br />
sottoposti a <strong>di</strong>versi tempi <strong>di</strong> essiccazione (<strong>in</strong> giorni). Si vuole stu<strong>di</strong>are la relazione<br />
tra la resistenza alla tensione e il tempo <strong>di</strong> essiccazione. In questo caso il tempo,<br />
t = (t1, . . . , tn), è la variabile esplicativa e la resistenza, y = (y1, . . . , yn), è la variabile<br />
risposta.<br />
> rm(list = ls())<br />
> Cem attach(Cem)<br />
È utile <strong>in</strong>iziare con un’analisi esplorativa dei dati, per esempio osservando il <strong>di</strong>agramma<br />
<strong>di</strong> <strong>di</strong>spersione tra la variabile risposta e la variabile esplicativa.<br />
> plot(resist ~ tempo)<br />
La Figura 5.1 <strong>in</strong><strong>di</strong>ca chiaramente una relazione non l<strong>in</strong>eare. Qu<strong>in</strong><strong>di</strong>, un modello<br />
che ipotizza che yi, i = 1, . . . , n, siano realizzazioni <strong>di</strong> variabili casuali <strong>in</strong><strong>di</strong>pendenti<br />
Yi ∼ N(β1 + β2ti, σ 2 ) non sembra appropriato. Conviene allora cercare qualche<br />
trasformazione delle variabili che <strong>l<strong>in</strong>eari</strong>zzi la relazione.<br />
Generalmente, si preferisce trasformare le variabili esplicative. Si possono provare<br />
<strong>di</strong>verse trasformazioni della variabile t. La Figura 5.2 mostra l’effetto <strong>di</strong> 4<br />
trasformazioni sul <strong>di</strong>agramma <strong>di</strong> <strong>di</strong>spersione.<br />
> par(mfrow = c(2, 2))<br />
> plot(log(tempo), resist)<br />
> plot(1/(tempo), resist)<br />
> plot(1/sqrt(tempo), resist)<br />
> plot(sqrt(tempo), resist)<br />
> par(mfrow = c(1, 1))<br />
42