Enrico Feoli, Paola Ganis - Università degli Studi di Trieste
Enrico Feoli, Paola Ganis - Università degli Studi di Trieste
Enrico Feoli, Paola Ganis - Università degli Studi di Trieste
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
appunto componenti principali, tali che spieghino quanta piu' parte possibile della varianza delle<br />
variabili originali e siano tra loro ortogonali. Esse sod<strong>di</strong>sfano il seguente modello lineare:<br />
Y<br />
i<br />
'<br />
= B X<br />
i<br />
per i=1,m (8.7)<br />
in cui ogni singolo elemento y ij della nuova variabile Y i relativo all’oggetto j e’ esplicitato<br />
nella formula seguente:<br />
ij<br />
m<br />
y = ∑ b x = b x + b x + ... + b<br />
x<br />
hi hj 1i<br />
1 j 2i<br />
2 j<br />
mi mj<br />
(8.8)<br />
h=<br />
1<br />
Da questo modello si puo’ vedere come ogni valore osservato x hj subisce una trasformazione<br />
lineare in y ij . In esso i valori da b 1i a b mi sono i coefficienti che mettono in relazione le variabili<br />
originali con le componenti; essi possono essere pensati come i pesi relativi a ciascuna variabile<br />
originale da x 1j a x mj sulla componente i-esima.<br />
Le componenti principali si determinano dopo l'in<strong>di</strong>viduazione dei vettori B i dei coefficienti<br />
che permettono la trasformazione (8.7). Per eseguire una PCA, Orloci (1978) <strong>di</strong>stingue 3 algoritmi<br />
secondo le modalita’ R, Q e D, le cui procedure <strong>di</strong> calcolo, descritte <strong>di</strong> seguito, sono illustrate in Fig.<br />
8.5. In realta’, <strong>di</strong> questi, solo l’algoritmo R calcola le coor<strong>di</strong>nate delle variabili (autovettori) e,<br />
tramite queste, quelle <strong>degli</strong> oggetti (componenti principali), mentre gli altri due algoritmi si<br />
limitano a trovare <strong>di</strong>rettamente le componenti principali evitando il calcolo delle coor<strong>di</strong>nate delle<br />
variabili. La scelta dell'algoritmo da utilizzare in una PCA per ottenere le coor<strong>di</strong>nate dei rilievi<br />
<strong>di</strong>pende dalle <strong>di</strong>mensioni della matrice dei dati. Infatti, l'algoritmo R, poiche' calcola le coor<strong>di</strong>nate<br />
<strong>degli</strong> oggetti dalla matrice <strong>di</strong> correlazione o <strong>di</strong> varianza-covarianza tra le specie, e' solitamente<br />
utilizzato quando gli oggetti sono piu' numerosi delle variabili per risparmiare tempo e memoria<br />
nell'elaborazione. Viceversa, se le variabili sono in numero <strong>di</strong> molto superiore agli oggetti, risultano<br />
essere piu' convenienti gli algoritmi Q e D.<br />
Ci preme ancora aggiungere che e’ un errore applicare l’algoritmo R scambiando gli oggetti<br />
con le variabili, cioe’ calcolare la matrice <strong>di</strong> correlazione o <strong>di</strong> varianza-covarianza sugli oggetti e<br />
derivare dai suoi autovettori le coor<strong>di</strong>nate delle variabili. Con questa procedura i risultati non<br />
coincidono con quelli della procedura corretta descritta dettagliatamente nel paragrafo successivo.<br />
Infatti, il primo asse estratto non corrisponde all’asse <strong>di</strong> massima variazione e cio’ comporta una<br />
per<strong>di</strong>ta <strong>di</strong> efficienza nell’or<strong>di</strong>namento. Pertanto, per evitare errori, prima <strong>di</strong> elaborare i dati con un<br />
software statistico e’ importante capire come il software organizza i dati, cioe’ la giusta<br />
collocazione delle variabili e <strong>degli</strong> oggetti nelle righe o nelle colonne della matrice <strong>di</strong> input.<br />
8-106