25.12.2012 Views

Dispense

Dispense

Dispense

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

6.2. IL METODO DELLE COMPONENTI PRINCIPALI 329<br />

esempio, osserviamo la …gura con davanti i dati visualizzati col comando pca$loadings. E<br />

ragionevole associare Comp:1 alle tre variabili SC, SA.SC e TD, in quanto ha componenti<br />

maggiori in tali direzioni (circa 0.5, in valore assoluto, contro i circa 0.3 nelle altre direzioni).<br />

Allo stesso modo, ha senso associare Comp:2 a PLIC e TMI (0.4 e 0.8 contro 0.2 e 0.3). Una<br />

possibile interpretazione delle prime due componenti principali, cioè delle nuove variabili<br />

aleatorie, potrebbe quindi essere quella dove la prima descrive il benessere di topo economico<br />

e la seconda quello relativo alla salute.<br />

Per quanti…care le osservazioni fatte sulla correlazione (positiva o negativa) o meno tra<br />

gli indicatori di partenza, è importante osservare direttamente la matrice di correlazione delle<br />

variabili di partenza, tramite il comando:<br />

cor(A)<br />

Nell’esempio sugli indicatori di benessere, possiamo così veri…care quantoavevamo già<br />

stabilito: la forte correlazione (con il giusto segno) tra SC, SA.SC e TD, l’assenza di legame<br />

tra PLIC e SC e TD, la correlazione negativa ma non troppo marcata tra PLIC e TMI, e via<br />

dicendo. Notiamo, rispetto a quanto gi a detto basandoci sulla …gura, la correlazione (anche<br />

se non forte) di TMI non solo con PLIC, ma quasi allo stesso modo anche con le tre variabili<br />

economiche, negativa o positiva nel modo che ci aspettiamo. Una rappresentazione gra…ca si<br />

ottiene col comando<br />

plot(A)<br />

che mostra, per ciascuna coppia di variabili, il gra…co di dispersione dei dati, altro strumento<br />

da cui si puà intuire la presenza di legame o meno tra le variabili aleatorie. Ad<br />

esempio, tornando agli indicatori di benessere, se si esegue questo comando si nota la visualizzazione<br />

gra…ca del legame tra TD e SA.SC da un lato, e dell’assenza di legame tra PLIC e<br />

SC dall’altro.<br />

Con il comando:<br />

pca$loadings<br />

compare una tabella in cui è possibile vedere le coordinate di ogni vettore della nuova base<br />

rispetto alla vecchia base (leggendo la tabella colonna per colonna) e le coordinate dei vettori<br />

della vecchia base rispetto alla nuova base (leggendo la tabella riga per riga). Questi numeri,<br />

i loadings, contengono potenzialmente molto signi…cato, su cui torneremo più di¤usamente<br />

nell’ambito dell’Analisi Fattoriale. Se sono grandi, indicano che una variabile pesa molto<br />

sull’altra e questo può contribuire all’interpretazione delle componenti principali. Tuttavia,<br />

la …gura ottenuta con biplot(pca) già fornisce questo tipo di informazioni in modo più<br />

immediato. Per questo i loadings sono più essenziali nel caso dell’Analisi Fattoriale, in cui<br />

non ci sono ra¢ gurazioni così espressive.<br />

È inoltre possibile vedere le deviazioni standard delle nuove variabili aleatorie, cioè le<br />

radici quadrate degli autovalori di A, semplicemente digitando<br />

pca<br />

6.2.3 Classi…che tramite PCA<br />

Dato un punto sperimentale, ad esempio la regione Toscana, espresso nelle coordinate X, la<br />

sua proiezione su e1 rappresenta la sua prima coordinata nella nuova base, e così per le altre

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!