14.01.2013 Views

ESERCITAZIONI DI STATISTICA BIOMEDICA

ESERCITAZIONI DI STATISTICA BIOMEDICA

ESERCITAZIONI DI STATISTICA BIOMEDICA

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

1.2 Visualizzazioni grafiche dei dati 7<br />

Density<br />

0.0 0.1 0.2 0.3 0.4<br />

Histogram of A<br />

−2 −1 0 1 2<br />

A<br />

Density<br />

Histogram of A<br />

−2 −1 0 1 2<br />

Figura 1.3: Istogramma ottenuto dalla generazione 120 numeri casuali ∼ N(0,1) con sovrapposta la<br />

kernel density (a destra).<br />

La chiamata alla funzione lines sovrappone il grafico di kernel density all’istogramma realizzato in<br />

precedenza. Se non si specifica altrimenti, usando l’opzione bw, la funzione density utilizza un algoritmo<br />

di ottimizzazione per determinare la larghezza di banda migliore (per ulteriori dettagli si veda<br />

la pagina di manuale relativa alla funzione density). Per rappresentare solamente la kernel density si<br />

usa il comando plot al posto di lines. I risultati sono presentati in Fig. 1.3.<br />

Esempio<br />

I metodi presentati possono essere applicati ai dati del geyser “Old Faithful”. Come in precedenza si<br />

divide la finestra grafica in due parti:<br />

> par(mfrow=c(1,2))<br />

quindi si generano l’istogramma per i tempi d’attesa fra due eruzioni e la sua kernel density:<br />

> hist(geyser$waiting, prob=TRUE, xlab="waiting")<br />

> lines(density(geyser$waiting), col="red")<br />

a cui si affianca l’equivalente grafico per la durata delle eruzioni:<br />

> hist(geyser$duration, prob=TRUE, xlab="duration")<br />

> lines(density(geyser$duration), col="red")<br />

L’output, in Fig. 1.4, evidenzia che le distribuzioni di entrambe le variabili sono bimodali, risultato<br />

che non si poteva evincere dall’osservazione di Fig. 1.2.<br />

1.2.2 Rappresentazioni bidimensionali<br />

La generalizzazione al caso di stime kernel density in due dimensioni può essere ottenuta con la<br />

funzione kde2d della libreria MASS come nell’esempio seguente.<br />

Nel caso delle eruzioni del geyser “Old Faithful” la stima kernel density congiunta delle variabili<br />

durata e attesa si ottiene con la chiamata:<br />

> f1

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!