Enrico Feoli, Paola Ganis - Università degli Studi di Trieste
Enrico Feoli, Paola Ganis - Università degli Studi di Trieste
Enrico Feoli, Paola Ganis - Università degli Studi di Trieste
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Centratura relativa<br />
x − x<br />
x t<br />
= (5.3)<br />
n −1<br />
Standar<strong>di</strong>zzazione<br />
con la deviazione<br />
standard (variabile z)<br />
z = x =<br />
t<br />
x − x<br />
∑( x − x)<br />
n<br />
2<br />
(5.4)<br />
Rapporto con il valore<br />
massimo<br />
x<br />
t<br />
=<br />
x<br />
x<br />
max<br />
(5.5)<br />
Rapporto con<br />
l’intervallo <strong>di</strong> valori<br />
x t<br />
x − x<br />
x − x<br />
min<br />
= (5.6)<br />
max<br />
min<br />
Normalizzazione<br />
x<br />
t<br />
=<br />
x<br />
∑<br />
x<br />
2<br />
i<br />
(5.7)<br />
Normalizzazione della<br />
variabile centrata<br />
x − x<br />
x t<br />
=<br />
∑ −<br />
2<br />
(5.8)<br />
( x x)<br />
Le trasformazioni (5.5), (5.6) e (5.7) producono valori compresi tra 0 e 1. Di queste, la prima<br />
rapporta i valori originali al valore massimo della variabile, e la seconda rapporta i valori originali,<br />
sottratti del valore minimo, all’intervallo della variabile. Le trasformazioni (5.2), (5.3), (5.4) e (5.8)<br />
generano valori negativi e positivi perche' traslano l'origine dell’asse della variabile nel punto con<br />
coor<strong>di</strong>nate uguali alla me<strong>di</strong>a. La trasformazione (5.4) crea la variabile standar<strong>di</strong>zzata z i cui valori<br />
al 99,73% sono compresi tra –3 e +3 (ve<strong>di</strong> Fig. 4.6); la trasformazione (5.7) normalizza i dati<br />
perché ogni valore è rapportato alla norma o lunghezza del vettore della variabile (corrispondente<br />
al denominatore della formula); la variabile normalizzata assume lunghezza unitaria. La<br />
trasformazione (5.8) normalizza i dati dopo che sono stati centrati e produce quin<strong>di</strong> valori compresi<br />
tra –1 e +1. Sebbene i termini standar<strong>di</strong>zzazione e normalizzazione siano spesso utilizzati in senso<br />
ampio per in<strong>di</strong>care un qualsiasi processo <strong>di</strong> trasformazione che uniformi i dati, in senso stretto essi<br />
fanno riferimento solo alle trasformazioni rispettivamente (5.4) e (5.7), (5.8).<br />
Nell’analizzare le matrici dei dati con le tecniche multivariate si deve tenere presente che<br />
pochi sono i coefficienti a<strong>di</strong>mensionali, quelli cioe’ che sono in<strong>di</strong>pendenti dalla scala e dall'unita' <strong>di</strong><br />
misura delle variabili e che, pertanto, possono essere applicati anche senza la trasformazione<br />
preliminare delle variabili. Tra questi citiamo il coefficiente <strong>di</strong> correlazione [eq. (7.17)], l'in<strong>di</strong>ce <strong>di</strong><br />
somiglianza <strong>di</strong> Gower [eq. (7.21)] per dati misti e gli in<strong>di</strong>ci probabilistici che non sono trattati in<br />
questa <strong>di</strong>spensa.<br />
Quando nei dati coesistono variabili qualitative a due o piu’ stati, variabili or<strong>di</strong>nali, variabili<br />
5-62