22.10.2014 Views

Enrico Feoli, Paola Ganis - Università degli Studi di Trieste

Enrico Feoli, Paola Ganis - Università degli Studi di Trieste

Enrico Feoli, Paola Ganis - Università degli Studi di Trieste

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

appunto componenti principali, tali che spieghino quanta piu' parte possibile della varianza delle<br />

variabili originali e siano tra loro ortogonali. Esse sod<strong>di</strong>sfano il seguente modello lineare:<br />

Y<br />

i<br />

'<br />

= B X<br />

i<br />

per i=1,m (8.7)<br />

in cui ogni singolo elemento y ij della nuova variabile Y i relativo all’oggetto j e’ esplicitato<br />

nella formula seguente:<br />

ij<br />

m<br />

y = ∑ b x = b x + b x + ... + b<br />

x<br />

hi hj 1i<br />

1 j 2i<br />

2 j<br />

mi mj<br />

(8.8)<br />

h=<br />

1<br />

Da questo modello si puo’ vedere come ogni valore osservato x hj subisce una trasformazione<br />

lineare in y ij . In esso i valori da b 1i a b mi sono i coefficienti che mettono in relazione le variabili<br />

originali con le componenti; essi possono essere pensati come i pesi relativi a ciascuna variabile<br />

originale da x 1j a x mj sulla componente i-esima.<br />

Le componenti principali si determinano dopo l'in<strong>di</strong>viduazione dei vettori B i dei coefficienti<br />

che permettono la trasformazione (8.7). Per eseguire una PCA, Orloci (1978) <strong>di</strong>stingue 3 algoritmi<br />

secondo le modalita’ R, Q e D, le cui procedure <strong>di</strong> calcolo, descritte <strong>di</strong> seguito, sono illustrate in Fig.<br />

8.5. In realta’, <strong>di</strong> questi, solo l’algoritmo R calcola le coor<strong>di</strong>nate delle variabili (autovettori) e,<br />

tramite queste, quelle <strong>degli</strong> oggetti (componenti principali), mentre gli altri due algoritmi si<br />

limitano a trovare <strong>di</strong>rettamente le componenti principali evitando il calcolo delle coor<strong>di</strong>nate delle<br />

variabili. La scelta dell'algoritmo da utilizzare in una PCA per ottenere le coor<strong>di</strong>nate dei rilievi<br />

<strong>di</strong>pende dalle <strong>di</strong>mensioni della matrice dei dati. Infatti, l'algoritmo R, poiche' calcola le coor<strong>di</strong>nate<br />

<strong>degli</strong> oggetti dalla matrice <strong>di</strong> correlazione o <strong>di</strong> varianza-covarianza tra le specie, e' solitamente<br />

utilizzato quando gli oggetti sono piu' numerosi delle variabili per risparmiare tempo e memoria<br />

nell'elaborazione. Viceversa, se le variabili sono in numero <strong>di</strong> molto superiore agli oggetti, risultano<br />

essere piu' convenienti gli algoritmi Q e D.<br />

Ci preme ancora aggiungere che e’ un errore applicare l’algoritmo R scambiando gli oggetti<br />

con le variabili, cioe’ calcolare la matrice <strong>di</strong> correlazione o <strong>di</strong> varianza-covarianza sugli oggetti e<br />

derivare dai suoi autovettori le coor<strong>di</strong>nate delle variabili. Con questa procedura i risultati non<br />

coincidono con quelli della procedura corretta descritta dettagliatamente nel paragrafo successivo.<br />

Infatti, il primo asse estratto non corrisponde all’asse <strong>di</strong> massima variazione e cio’ comporta una<br />

per<strong>di</strong>ta <strong>di</strong> efficienza nell’or<strong>di</strong>namento. Pertanto, per evitare errori, prima <strong>di</strong> elaborare i dati con un<br />

software statistico e’ importante capire come il software organizza i dati, cioe’ la giusta<br />

collocazione delle variabili e <strong>degli</strong> oggetti nelle righe o nelle colonne della matrice <strong>di</strong> input.<br />

8-106

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!