Enrico Feoli, Paola Ganis - Università degli Studi di Trieste
Enrico Feoli, Paola Ganis - Università degli Studi di Trieste
Enrico Feoli, Paola Ganis - Università degli Studi di Trieste
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
hi<br />
= λ b<br />
(8.14)<br />
i<br />
hi<br />
In questo caso trovare le correlazioni tra le variabili originali e le componenti principali<br />
equivale a normalizzare gli autovettori della matrice <strong>di</strong> correlazione a √λ. Ne consegue che i valori<br />
b hi <strong>degli</strong> autovettori cosi’ normalizzati, tutti rientranti nell’intervallo [-1,1], sono interpretabili<br />
<strong>di</strong>rettamente come coefficienti <strong>di</strong> correlazione tra la variabile h-esima e la componente principale i-<br />
esima.<br />
8.2.1.1 Rappresentazione grafica delle variabili, <strong>degli</strong> oggetti, del biplot e relativa interpretazione<br />
L'algoritmo R ha il grande vantaggio <strong>di</strong> ricavare gli assi <strong>di</strong> or<strong>di</strong>namento <strong>degli</strong> oggetti, cioe' le<br />
componenti principali, utilizzando gli assi delle variabili. Tramite esso e’ quin<strong>di</strong> possibile<br />
rappresentare in uno spazio ridotto sia i punti–variabile che i punti-oggetto. Essi possono essere<br />
rappresentati sia in <strong>di</strong>agrammi separati che nello stesso <strong>di</strong>agramma realizzando quell’or<strong>di</strong>namento<br />
che prende il nome <strong>di</strong> biplot il cui prefisso bi- in<strong>di</strong>ca proprio le due <strong>di</strong>mensioni della tabella dei dati<br />
(non dello spazio) i cui elementi sono righe e colonne, variabili e oggetti, specie e rilievi.<br />
Diagramma delle variabili. Il <strong>di</strong>agramma a due <strong>di</strong>mensioni x,y per le variabili viene costruito<br />
assumendo come asse x il primo autovettore (B 1 ) e come asse y il secondo autovettore (B 2 ). Gli<br />
assi sono centrati e quin<strong>di</strong> si incrociano all’origine, cioe’ nel punto <strong>di</strong> coor<strong>di</strong>nate [0,0] che<br />
corrisponde al centroide dei dati originali.<br />
Le m variabili trovano collocazione nel piano determinato dagli assi in rapporto al valore<br />
assunto in ciascuno <strong>di</strong> essi. Solitamente esse sono rappresentate con i vettori che congiungono<br />
l’origine del sistema <strong>di</strong> coor<strong>di</strong>nate con i punti-variabile.<br />
La rappresentazione puo’ cambiare a seconda della trasformazione dei dati adottata e della<br />
funzione utilizzata per il calcolo della matrice simmetrica tra le variabili; inoltre essa cambia anche<br />
in rapporto alla scelta fatta per normalizzare gli autovettori soprattutto quando gli autovalori<br />
corrispondenti agli assi scelti per la rappresentazione sono molto <strong>di</strong>fferenti tra loro.<br />
Normalizzando all’unita’ gli autovettori, sia gli autovettori che i vettori-variabile risultano,<br />
nello spazio multi<strong>di</strong>mensionale, tutti ortogonali tra loro e <strong>di</strong> lunghezza unitaria; normalizzando<br />
invece gli autovettori a √λ, le lunghezze dei vettori-variabile <strong>di</strong>ventano proporzionali alle deviazioni<br />
standard delle variabili e il loro prodotto, che <strong>di</strong>pende dall’angolo che li separa nello spazio<br />
multi<strong>di</strong>mensionale, e’ proporzionale alla loro covarianza e approssima il coefficiente <strong>di</strong> correlazione.<br />
Pertanto scalare gli autovettori a √λ e’ utile per interpretare meglio le relazioni tra le variabili: i<br />
vettori delle variabili che puntano nella stessa <strong>di</strong>rezione in<strong>di</strong>cano che le variabili sono correlate<br />
positivamente tra loro, quelli che puntano in <strong>di</strong>rezione opposta in<strong>di</strong>cano correlazioni negative e<br />
8-110