Variabili categoriali ordinate
Variabili categoriali ordinate
Variabili categoriali ordinate
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Lucido 106<br />
Le variabili<br />
• Una variabile è una proprietà di cui è stata data una definizione<br />
operativa<br />
concetto<br />
proprietà<br />
stato a<br />
stato b<br />
...<br />
d.o.<br />
variabile<br />
categoria 1<br />
categoria 2<br />
...<br />
Esempio 1<br />
concetto: livello di istruzione<br />
unità: individuo<br />
proprietà: titolo di studio<br />
stati: elementare, media<br />
inferiore, media superiore,<br />
laurea<br />
variabile: titolo di studio<br />
categorie: 1 elementare<br />
2 media inferiore<br />
3 media superiore<br />
4 laurea
Lucido 107<br />
Esempio 2<br />
concetto: benessere materiale<br />
unità: famiglia<br />
proprietà: reddito familiare<br />
stati: infiniti<br />
variabile: reddito familiare<br />
categorie: infinite<br />
Esempio 3<br />
concetto: confessione religiosa<br />
unità: individuo<br />
proprietà: religione<br />
stati: cattolica, protestante,<br />
musulmana, ebrea,<br />
buddista, induista, altre<br />
variabile: religione<br />
categorie: 1 cattolica<br />
2 protestante<br />
3 musulmana<br />
4 ebrea<br />
5 buddista<br />
6 induista<br />
7 altre
Lucido 108<br />
Tipi di variabile<br />
• Le variabili non sono tutte uguali: vi sono differenze tra loro, che<br />
possono essere analizzate secondo cinque criteri:<br />
1. il tipo di unità cui si riferiscono<br />
2. la loro manipolabilità da parte del ricercatore<br />
3. la posizione nella relazione causa-effetto<br />
4. l’osservabilità<br />
5. le operazioni logico-matematiche consentite sui loro valori<br />
1. <strong>Variabili</strong> individuali-collettive<br />
variabili individuali:<br />
si riferiscono a proprietà<br />
attinenti l’individuo<br />
variabili aggregate:<br />
consumi medi per famiglia,<br />
tasso di disoccupazione per<br />
provincia, tasso di suicidi<br />
per nazione, etc.<br />
variabili collettive:<br />
riguardano proprietà di<br />
soggetti collettivi<br />
(famiglia, regione,<br />
distretto scolastico, etc.)
Lucido 109<br />
2. Manipolabilità<br />
variabili<br />
non manipolabili:<br />
tutte le proprietà delle unità<br />
d’analisi che non possono<br />
essere modificate dal<br />
ricercatore<br />
genere, età, etnia, istruzione,<br />
consumi culturali, ...<br />
variabili manipolabili:<br />
tutte le proprietà delle unità<br />
d’analisi che possono essere<br />
controllate e modificate<br />
dal ricercatore<br />
tutto ciò che può essere<br />
modificato sperimentalmente:<br />
pregiudizio razziale,<br />
orientamento politico, ...
Lucido 110<br />
3. <strong>Variabili</strong> dipendenti-indipendenti<br />
• E’ una distinzione che fa riferimento al ruolo svolto dalle variabili<br />
nei modelli teorici e nell’analisi dei dati<br />
variabile indipendente:<br />
è la variabile che<br />
rappresenta la causa<br />
Esempio<br />
genere<br />
età<br />
titolo di studio<br />
indipendenti<br />
variabile dipendente:<br />
è la variabile che<br />
rappresenta l’effetto<br />
pratica religiosa<br />
dipendente
Lucido 111<br />
Il modello di acquisizione sociale di Blau e Duncan<br />
(1967)<br />
Anni di istruzione Anni di istruzione<br />
del padre dell’intervistato<br />
Status Status<br />
del padre dell’intervistato<br />
(prima occ.)<br />
• Alcune variabili sono sia causa, sia effetto:<br />
Status dell’intervistato<br />
gli anni di istruzione dell’intervistato sono causa del suo status, ma a<br />
loro volta sono effetto degli anni di istruzione paterni;<br />
lo status dell’intervistato alla prima occupazione è sia causa di quello<br />
attuale, sia effetto di altre due variabili: lo status del padre e gli anni<br />
di istruzione dell’intervistato<br />
Solo lo status dell’intervistato è solo effetto di altre variabili, senza<br />
essere causa di alcuna<br />
<strong>Variabili</strong> indipendenti = quelle da cui originano le frecce<br />
<strong>Variabili</strong> dipendenti = quelle cui arrivano le frecce
Lucido 112<br />
4. Osservabilità<br />
• E’ una distinzione basata sulla possibilità di rilevare empiricamente una<br />
proprietà: alcune proprietà infatti non possono essere rilevate direttamente,<br />
perché fanno riferimento a concetti troppo generali o compositi. Ad<br />
esempio: intelligenza, status socio-economico, coesione sociale, anomia,<br />
etc.<br />
• Abbiamo quindi:<br />
variabili osservabili:<br />
fanno riferimento a tutte le proprietà<br />
che posso rilevare direttamente<br />
(genere, età, occupazione, stato<br />
civile, orientamento di voto, pratica<br />
religiosa, etc.)<br />
Esempio<br />
titolo di studio<br />
della madre<br />
titolo di studio<br />
del padre<br />
variabili<br />
osservabili<br />
variabili non osservabili<br />
(latenti):<br />
fanno riferimento a quelle<br />
proprietà che non possono essere<br />
rilevate direttamente<br />
livello culturale<br />
della famiglia<br />
variabile<br />
non osservabile
Lucido 113<br />
5. Tipi di scale (o livelli di misurazione)<br />
• L’ultima tipologia di variabili è di fondamentale importanza nella<br />
ricerca empirica, poiché grazie ad essa è possibile stabilire quali<br />
operazioni logico-matematiche è possibile applicare a quali variabili,<br />
e dunque quali tipi di analisi dei dati è possibile effettuare.<br />
• Ciò ha ripercussioni sul tipo di ipotesi di ricerca che possono essere<br />
sottoposte a controllo: accade che alcune ipotesi non possono essere<br />
controllate empiricamente perché il tipo di dati (cioè di variabili) di<br />
cui si dispone non lo consente<br />
Esempio: analisi di regressione con titolo di studio come<br />
variabile dipendente, e genere dell’intervistata/o come variabile<br />
indipendente
Lucido 114<br />
Codici o numeri?<br />
• I codici numerici di cui si compone la matrice dei dati a volte sono<br />
numeri, ma a volte sono semplici codici<br />
Esempio<br />
Quali di questi codici sono numeri e quali no?<br />
Genere: 1=donna, 2=uomo<br />
Titolo di studio: 1=elementare, 2=media inferiore, 3=media<br />
superiore, 4=laurea<br />
Età: 25/30/35/... anni<br />
GENERE ETA TITOLO<br />
1 56 3<br />
2 58 2<br />
1 56 1<br />
... ... ...<br />
Ha senso sommare<br />
1 + 2?<br />
Ha senso dividere<br />
3 ÷ 2?<br />
Ha senso calcolare<br />
(56 + 58)/2?
Lucido 115<br />
• Le differenze tra variabili riguardo al trattamento dei loro valori<br />
dipendono dalle differenze che percepiamo tra le proprietà<br />
Esempio<br />
La proprietà genere presenta due stati non ordinabili tra<br />
loro (maschio, femmina)<br />
La proprietà titolo di studio presenta stati ordinabili tra<br />
loro (elementare, media inf., media sup., laurea)<br />
Le proprietà età e numero di figli presentano numerosi<br />
stati, tutti ordinabili tra loro<br />
• Per sapere con quale tipo di proprietà abbiamo a che fare è<br />
necessario considerare due criteri principali:<br />
1) la presenza di un ordine tra gli stati;<br />
2) la possibilità di determinare la distanza esatta tra gli stati
Lucido 116<br />
Tipologia proprietà-variabili<br />
ordine?<br />
sì<br />
sì<br />
no<br />
unità di<br />
misura<br />
naturale<br />
unità di<br />
misura<br />
convenzionale<br />
distanza esatta?<br />
sì no<br />
proprietà a stati<br />
enumerabili<br />
variabili<br />
cardinali discrete<br />
proprietà continue<br />
variabili<br />
cardinali continue<br />
proprietà <strong>categoriali</strong><br />
<strong>ordinate</strong><br />
conteggio ordinamento<br />
misurazione<br />
⎯<br />
variabili<br />
<strong>categoriali</strong> <strong>ordinate</strong><br />
proprietà <strong>categoriali</strong><br />
non <strong>ordinate</strong><br />
classificazione<br />
variabili<br />
<strong>categoriali</strong><br />
non <strong>ordinate</strong>
Lucido 117<br />
<strong>Variabili</strong> <strong>categoriali</strong> non <strong>ordinate</strong><br />
• Queste proprietà vengono dette <strong>categoriali</strong> non <strong>ordinate</strong>, perché i loro<br />
stati individuano gruppi o categorie che non possono essere ordinati tra<br />
loro, e dei quali possiamo dire solo che sono uguali o diversi.<br />
• La definizione operativa di una proprietà categoriale non ordinata<br />
descrive la procedura di classificazione che darà origine alla variabile<br />
corrispondente (Marradi 1980), la quale sarà detta anch’essa<br />
categoriale non ordinata.<br />
Esempio<br />
Della proprietà “confessione religiosa” abbiamo individuato i seguenti<br />
stati significativamente distinti tra loro:<br />
1) cattolica<br />
2) protestante<br />
3) ortodossa<br />
4) buddista<br />
5) musulmana<br />
6) ebraica<br />
7) altre<br />
8) nessuna<br />
La definizione operativa della proprietà è quindi:<br />
1. chiedere all’intervistato/a (ad esempio la signora Bianchi) a quale<br />
confessione religiosa appartiene (cioè in quale gruppo ricade);<br />
2. registrare lo stato con il codice corrispondente (ad esempio,<br />
“cattolica”, codice 1). Ciò equivale a classificare la signora Bianchi<br />
come appartenente al gruppo dei cattolici.
Lucido 118<br />
<strong>Variabili</strong> <strong>categoriali</strong> <strong>ordinate</strong><br />
• Sono proprietà i cui stati si presentano in maniera ordinata, per le quali<br />
cioè esiste una gerarchia che consente di ordinare i diversi stati<br />
• Di questi possiamo dire non solo che sono uguali o diversi tra loro, ma<br />
anche che uno è maggiore o minore dell’altro (“elementare” non solo è<br />
diverso da “licenza media”, ma è anche inferiore)<br />
• Nella definizione operativa di questo tipo di proprietà si deve fare in<br />
modo che l’ordine dei codici assegnati a ciascuna modalità non<br />
contraddica l’ordine degli stati della proprietà:<br />
1. elementare 1. laurea 1. media inf.<br />
2. media inf. oppure 2. media sup. ma non 2. elementare<br />
3. media sup. 3. media inf. 3. laurea<br />
4. laurea 4. elementare 4. media sup.<br />
• La definizione operativa di una proprietà categoriale ordinata deve<br />
comprendere le istruzioni per attuare la procedura di ordinamento<br />
attraverso cui si dà origine alla variabile corrispondente, detta anch’essa<br />
categoriale ordinata.<br />
L’ordinamento è l’operazione con cui ripartiamo gli intervistati tra i<br />
diversi gruppi ordinati (gli stati della proprietà), assegnando a<br />
ciascuno di essi il codice numerico corrispondente al gruppo cui<br />
appartiene e creando così la variabile<br />
• Questa parte della definizione operativa sarà:<br />
1) chiedere all’intervistato di quale titolo di studio è in possesso;<br />
2) assegnare l’intervistato a uno dei gruppi ordinati (cioè ordinare gli<br />
intervistati);<br />
3) registrare il codice numerico corrispondente.
Lucido 119<br />
• Il principale problema relativo alle variabili <strong>categoriali</strong> <strong>ordinate</strong> è che<br />
non conosciamo la distanza tra le varie modalità: non sappiamo cioè se<br />
la distanza che separa “licenza elementare” da “licenza media” è la<br />
stessa che c’è tra “diploma” e “laurea”.<br />
• Attribuendo ai vari stati della proprietà titolo di studio i codici numerici<br />
da 1 a 4, abbiamo ipotizzato che gli stati fossero equidistanti.<br />
Avere la licenza media anziché il diploma fa però una certa differenza,<br />
e la distanza tra licenza media e diploma potrebbe essere più grande di<br />
quella che separa, ad esempio, la licenza elementare dalla licenza media<br />
• Tuttavia non sappiamo qual è la distanza tra gli stati (altrimenti<br />
avremmo una variabile cardinale, anziché categoriale ordinata), e<br />
quindi generalmente si sceglie di considerare eguali tali distanze,<br />
assegnando codici numerici che danno luogo a modalità equidistanti<br />
(ad esempio 1, 2, 3, ..., oppure 10, 20, 30,..., o ancora 5, 10, 15, ...)
Lucido 120<br />
<strong>Variabili</strong> cardinali discrete<br />
• Conosciamo sia l’ordine, sia la distanza tra gli stati della proprietà, che<br />
sono dette a stati enumerabili<br />
Esempi<br />
numero di figli o di automobili per famiglia<br />
numero di abitanti di un comune<br />
numero di giornali settimanali letti per settimana<br />
numero di libri letti in un anno<br />
....<br />
• Esiste un’unità di misura cosiddetta naturale, costituita dai numeri interi<br />
(detti appunto naturali) e dai loro multipli;<br />
• Gli stati di questo tipo di proprietà si definiscono contando, cioè tramite<br />
un’operazione di conteggio.<br />
• La definizione operativa è semplice:<br />
1) contare il numero di oggetti relativi al caso in esame (ad esempio, i<br />
figli della famiglia Rossi, le automobili della famiglia Verdi, le volte<br />
in cui l’intervistato è andato al cinema nell’ultimo mese, e così via);<br />
2) registrare il numero ottenuto. Quest’ultimo è un numero vero e<br />
proprio, e non più un codice numerico: possiamo cioè applicare ad<br />
esso tutte le operazioni matematiche che si applicano ai numeri<br />
cardinali.<br />
• Questo tipo di variabili viene detto appunto cardinale discreta: l’unità<br />
di misura non ammette decimali (non è possibile avere 1.7 automobili, a<br />
meno che non si tratti di una media) e la corrispondente proprietà varia<br />
appunto per stati discreti.<br />
• È anche possibile individuare uno zero assoluto, che corrisponde<br />
all’assenza della proprietà: zero figli, zero automobili, zero abitanti, etc.
Lucido 121<br />
<strong>Variabili</strong> cardinali continue<br />
• Provengono da proprietà per le quali è possibile concepire “infiniti stati<br />
intermedi fra due stati comunque scelti” (Marradi 1993, 13)<br />
Esempi<br />
età<br />
reddito<br />
spesa mensile per abbigliamento<br />
...<br />
• In tutti questi casi possiamo immaginare che tra uno stato e l’altro ve ne<br />
siano infiniti: tra lo stato “20 anni” e lo stato “21 anni” possiamo<br />
individuare gli stati “20 anni e 6 mesi”, “20 anni e 9 mesi”, “20 anni, 9<br />
mesi e 10 giorni”, e molti altri ancora.<br />
• Come per le proprietà a stati enumerabili, conosciamo sia l’ordine sia la<br />
distanza tra gli stati, ma l’unità di misura è convenzionale, e non esiste<br />
uno zero assoluto<br />
Esempi<br />
Diverse unità di misura lineari: metri, miglia, yarde, etc.<br />
Diversi sistemi per calcolare lo scorrere del tempo: il calendario<br />
lunare, oltre a quello solare<br />
Diverse unità di misura del peso: chilogrammi, libbre, etc.<br />
Diverse scale di misurazione della temperatura: Celsius,<br />
Fahrenheit
Lucido 122<br />
• La definizione operativa di queste proprietà deve specificare la<br />
procedura di misurazione che dà luogo a variabili cardinali continue,<br />
comprendendo le regole necessarie agli arrotondamenti<br />
Esempio<br />
Non è possibile né utile, in una ricerca empirica, registrare con<br />
esattezza assoluta uno stato qualsiasi, ad esempio che il signor<br />
Bianchi ha 50 anni, 6 mesi, 10 giorni, 20 ore, 30 minuti, 10<br />
secondi, 40 decimi di secondo, e così via, fino a porzioni<br />
infinitesimali di tempo<br />
• In sintesi, l’operazione di misurazione, che va specificata nella<br />
definizione operativa, consiste dei seguenti passi (Marradi 1980):<br />
1) si stabilisce un’unità di misura (anni o mesi; centimetri o metri; ...);<br />
2) si decide quante cifre registrare e come arrotondare (ad esempio, due<br />
cifre dopo la virgola, arrotondando per difetto);<br />
3) si confronta l’unità di misura con l’ammontare della proprietà nel<br />
singolo caso (si stabilisce ad esempio che il signor Bianchi ha 51<br />
anni);<br />
4) si trasforma l’esito della fase precedente nel numero registrabile<br />
corrispondente (cioè si registra “51”).
Lucido 123<br />
In sintesi:<br />
variabili <strong>categoriali</strong><br />
non <strong>ordinate</strong> (o nominali):<br />
le categorie non possono essere<br />
<strong>ordinate</strong><br />
non è possibile stabilire la distanza tra<br />
due categorie adiacenti<br />
Esempio: il genere<br />
cardinali continue<br />
la proprietà corrispondente varia per<br />
incrementi infinitesimali (assume<br />
infiniti stati intermedi tra due stati<br />
consecutivi qualsiasi)<br />
l’unità di misura non esiste in natura e<br />
dev’essere definita convenzionalmente<br />
(es. metri, feet, miglia, etc.)<br />
Esempio: l’età, il reddito, la<br />
temperatura<br />
variabili <strong>categoriali</strong> <strong>ordinate</strong><br />
le categorie sono ordinabili<br />
non è possibile stabilire la distanza<br />
tra due categorie adiacenti, ma solo<br />
che una precede l’altra<br />
Esempio: il titolo di studio<br />
variabili cardinali<br />
presentano un numero elevato e<br />
potenzialmente infinito di categorie<br />
possono essere continue o discrete<br />
cardinali discrete<br />
la proprietà corrispondente consiste nel<br />
“possesso” di un certo numero di<br />
oggetti (auto, figli, abitanti, etc.)<br />
l’unità di misura esiste in natura, e<br />
consiste nei numeri naturali (1, 2, 3, ...)<br />
Esempio: il numero dei figli, il numero<br />
di abitanti, il numero di periodici letti,<br />
etc.
Lucido 124<br />
Requisiti di una classificazione<br />
1) Esaustività<br />
Ogni caso deve poter essere assegnato<br />
ad una categoria<br />
Esempio: se il caso i-esimo non è<br />
stato assegnato né alla categoria<br />
maschio né alla categoria femmina, la<br />
classificazione non è esaustiva<br />
3) Disgiunzione<br />
Ogni caso appartiene solo ad una delle categorie<br />
Esempio: se la categoria elementare è<br />
parzialmente sovrapposta alla categoria<br />
media inferiore (cioè contiene casi che<br />
appartengono contemporaneamente ad<br />
entrambe), le categorie non sono disgiunte<br />
2) Mutua esclusività<br />
Un caso appartiene o non appartiene<br />
ad una categoria<br />
Esempio: se il caso i-esimo<br />
appartiene per il 60% alla categoria<br />
elementare e per il 40% alla categoria<br />
media inferiore, non abbiamo più una<br />
classificazione di tipo mutuamente<br />
esclusivo, ma di tipo fuzzy (non<br />
standard)
Lucido 125<br />
La misurazione<br />
• Il concetto di misurazione è collegato a quello di unità di misura:<br />
quando misuriamo, confrontiamo un’unità di misura con<br />
l’ammontare della relativa proprietà posseduto da un caso concreto<br />
(Marradi)<br />
• L’operazione della misurazione si compone di quattro fasi (Marradi):<br />
1) si stabilisce un’unità di misura<br />
2) si decide quante cifre registrare e come arrotondare<br />
3) si confronta l’unità di misura con l’ammontare della proprietà nel<br />
singolo caso<br />
4) si trasforma l’esito della fase precedente nel numero registrabile<br />
corrispondente<br />
Esempio: misurare l’età<br />
1) l’unità di misura è l’anno solare<br />
2) si registrano due cifre senza decimali. Se l’intervistato<br />
compie gli anni nei primi sei mesi, l’età viene arrotondata<br />
all’anno x; se l’intervistato compie gli anni nel secondo<br />
semestre, l’età viene arrotondata all’anno x +1<br />
3) chiedo all’intervistato quanti anni ha<br />
4) registro il numero sul questionario
Lucido 126<br />
• È corretto parlare di misurazione solo quando ci riferiamo a<br />
proprietà che danno origine a variabili cardinali<br />
Esempio<br />
La seguente affermazione:<br />
Vogliamo misurare la proprietà “titolo di studio”<br />
non è corretta, perché il titolo di studio è una proprietà (che<br />
percepiamo come) ordinale, e la corrispondente variabile<br />
viene generata tramite la procedura di ordinamento, non di<br />
misurazione. L’affermazione corretta sostituisce “misurare”<br />
con “rilevare”: vogliamo rilevare la proprietà “titolo di<br />
studio”<br />
Allo stesso modo, non è corretto affermare di “misurare” il<br />
genere degli intervistati, o il numero dei loro figli (che<br />
vengono contati, non misurati)
Lucido 127<br />
Quali operazioni su quali variabili?<br />
• Abbiamo detto che il tipo di proprietà determina il tipo di variabile:<br />
se percepiamo un ordine tra gli stati, avremo una variabile<br />
categoriale ordinata; se non lo percepiamo avremo una variabile<br />
categoriale non ordinata; se infine percepiamo numerosi stati<br />
(misurabili o conteggiabili), avremo una variabile cardinale<br />
• Tuttavia nella matrice dei dati tutte le variabili si presentano in forma<br />
numerica<br />
Questi codici numerici sono numeri<br />
veri e propri? posso usarli per le<br />
normali operazioni algebriche?<br />
NO:<br />
solo le variabili cardinali possono essere sottoposte<br />
alle operazioni algebriche, perché<br />
solo questo tipo di variabile presenta numeri veri e propri;<br />
negli altri due casi (variabili <strong>categoriali</strong> <strong>ordinate</strong> e non)<br />
si tratta di codici
Lucido 128<br />
Riassumendo:<br />
Stati della<br />
proprietà<br />
Procedura di<br />
operativizzazione<br />
Tipo di<br />
variabile<br />
non ordinati classificazione categoriale<br />
non ordinata<br />
(nominale)<br />
ordinati ordinamento categoriale<br />
ordinata<br />
continui<br />
discreti<br />
(Corbetta 1999)<br />
misurazione<br />
conteggio<br />
Caratteristiche<br />
dei valori<br />
nomi tradotti in<br />
codici numerici<br />
numeri con le<br />
sole proprietà<br />
ordinali<br />
cardinale numeri con<br />
proprietà<br />
cardinali<br />
Operazioni<br />
effettuabili<br />
sui valori<br />
Statistiche<br />
ammissibili<br />
= ≠ moda<br />
= ≠<br />
> <<br />
= ≠<br />
> <<br />
+ – × ÷<br />
• Delle categorie di una variabile categoriale non ordinata possiamo<br />
solo dire che sono uguali o diverse tra loro<br />
mediana,<br />
percentili<br />
media,<br />
varianza,<br />
deviazione<br />
standard<br />
Esempio: cattolico è diverso da musulmano, buddista è diverso da ebraico, ...<br />
• Delle categorie di una variabile categoriale ordinata possiamo dire<br />
non solo che sono uguali o diverse tra loro, ma anche che l’una è ad<br />
un livello superiore o inferiore all’altra<br />
Esempio: non solo titolo elementare è diverso da diploma, ma quest’ultimo è<br />
ad un livello superiore del primo<br />
• Sui valori di una variabile cardinale possiamo compiere tutte le<br />
operazioni algebriche, e quindi anche dire che un valore è maggiore,<br />
minore, uguale o diverso da un altro<br />
Esempio: 65 anni è diverso e maggiore di 55; posso sommare i due valori e<br />
dividerli per 2, ottenendo così la media