22.10.2014 Views

Enrico Feoli, Paola Ganis - Università degli Studi di Trieste

Enrico Feoli, Paola Ganis - Università degli Studi di Trieste

Enrico Feoli, Paola Ganis - Università degli Studi di Trieste

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

hi<br />

= λ b<br />

(8.14)<br />

i<br />

hi<br />

In questo caso trovare le correlazioni tra le variabili originali e le componenti principali<br />

equivale a normalizzare gli autovettori della matrice <strong>di</strong> correlazione a √λ. Ne consegue che i valori<br />

b hi <strong>degli</strong> autovettori cosi’ normalizzati, tutti rientranti nell’intervallo [-1,1], sono interpretabili<br />

<strong>di</strong>rettamente come coefficienti <strong>di</strong> correlazione tra la variabile h-esima e la componente principale i-<br />

esima.<br />

8.2.1.1 Rappresentazione grafica delle variabili, <strong>degli</strong> oggetti, del biplot e relativa interpretazione<br />

L'algoritmo R ha il grande vantaggio <strong>di</strong> ricavare gli assi <strong>di</strong> or<strong>di</strong>namento <strong>degli</strong> oggetti, cioe' le<br />

componenti principali, utilizzando gli assi delle variabili. Tramite esso e’ quin<strong>di</strong> possibile<br />

rappresentare in uno spazio ridotto sia i punti–variabile che i punti-oggetto. Essi possono essere<br />

rappresentati sia in <strong>di</strong>agrammi separati che nello stesso <strong>di</strong>agramma realizzando quell’or<strong>di</strong>namento<br />

che prende il nome <strong>di</strong> biplot il cui prefisso bi- in<strong>di</strong>ca proprio le due <strong>di</strong>mensioni della tabella dei dati<br />

(non dello spazio) i cui elementi sono righe e colonne, variabili e oggetti, specie e rilievi.<br />

Diagramma delle variabili. Il <strong>di</strong>agramma a due <strong>di</strong>mensioni x,y per le variabili viene costruito<br />

assumendo come asse x il primo autovettore (B 1 ) e come asse y il secondo autovettore (B 2 ). Gli<br />

assi sono centrati e quin<strong>di</strong> si incrociano all’origine, cioe’ nel punto <strong>di</strong> coor<strong>di</strong>nate [0,0] che<br />

corrisponde al centroide dei dati originali.<br />

Le m variabili trovano collocazione nel piano determinato dagli assi in rapporto al valore<br />

assunto in ciascuno <strong>di</strong> essi. Solitamente esse sono rappresentate con i vettori che congiungono<br />

l’origine del sistema <strong>di</strong> coor<strong>di</strong>nate con i punti-variabile.<br />

La rappresentazione puo’ cambiare a seconda della trasformazione dei dati adottata e della<br />

funzione utilizzata per il calcolo della matrice simmetrica tra le variabili; inoltre essa cambia anche<br />

in rapporto alla scelta fatta per normalizzare gli autovettori soprattutto quando gli autovalori<br />

corrispondenti agli assi scelti per la rappresentazione sono molto <strong>di</strong>fferenti tra loro.<br />

Normalizzando all’unita’ gli autovettori, sia gli autovettori che i vettori-variabile risultano,<br />

nello spazio multi<strong>di</strong>mensionale, tutti ortogonali tra loro e <strong>di</strong> lunghezza unitaria; normalizzando<br />

invece gli autovettori a √λ, le lunghezze dei vettori-variabile <strong>di</strong>ventano proporzionali alle deviazioni<br />

standard delle variabili e il loro prodotto, che <strong>di</strong>pende dall’angolo che li separa nello spazio<br />

multi<strong>di</strong>mensionale, e’ proporzionale alla loro covarianza e approssima il coefficiente <strong>di</strong> correlazione.<br />

Pertanto scalare gli autovettori a √λ e’ utile per interpretare meglio le relazioni tra le variabili: i<br />

vettori delle variabili che puntano nella stessa <strong>di</strong>rezione in<strong>di</strong>cano che le variabili sono correlate<br />

positivamente tra loro, quelli che puntano in <strong>di</strong>rezione opposta in<strong>di</strong>cano correlazioni negative e<br />

8-110

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!