04.06.2013 Views

Variabili categoriali ordinate

Variabili categoriali ordinate

Variabili categoriali ordinate

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Lucido 106<br />

Le variabili<br />

• Una variabile è una proprietà di cui è stata data una definizione<br />

operativa<br />

concetto<br />

proprietà<br />

stato a<br />

stato b<br />

...<br />

d.o.<br />

variabile<br />

categoria 1<br />

categoria 2<br />

...<br />

Esempio 1<br />

concetto: livello di istruzione<br />

unità: individuo<br />

proprietà: titolo di studio<br />

stati: elementare, media<br />

inferiore, media superiore,<br />

laurea<br />

variabile: titolo di studio<br />

categorie: 1 elementare<br />

2 media inferiore<br />

3 media superiore<br />

4 laurea


Lucido 107<br />

Esempio 2<br />

concetto: benessere materiale<br />

unità: famiglia<br />

proprietà: reddito familiare<br />

stati: infiniti<br />

variabile: reddito familiare<br />

categorie: infinite<br />

Esempio 3<br />

concetto: confessione religiosa<br />

unità: individuo<br />

proprietà: religione<br />

stati: cattolica, protestante,<br />

musulmana, ebrea,<br />

buddista, induista, altre<br />

variabile: religione<br />

categorie: 1 cattolica<br />

2 protestante<br />

3 musulmana<br />

4 ebrea<br />

5 buddista<br />

6 induista<br />

7 altre


Lucido 108<br />

Tipi di variabile<br />

• Le variabili non sono tutte uguali: vi sono differenze tra loro, che<br />

possono essere analizzate secondo cinque criteri:<br />

1. il tipo di unità cui si riferiscono<br />

2. la loro manipolabilità da parte del ricercatore<br />

3. la posizione nella relazione causa-effetto<br />

4. l’osservabilità<br />

5. le operazioni logico-matematiche consentite sui loro valori<br />

1. <strong>Variabili</strong> individuali-collettive<br />

variabili individuali:<br />

si riferiscono a proprietà<br />

attinenti l’individuo<br />

variabili aggregate:<br />

consumi medi per famiglia,<br />

tasso di disoccupazione per<br />

provincia, tasso di suicidi<br />

per nazione, etc.<br />

variabili collettive:<br />

riguardano proprietà di<br />

soggetti collettivi<br />

(famiglia, regione,<br />

distretto scolastico, etc.)


Lucido 109<br />

2. Manipolabilità<br />

variabili<br />

non manipolabili:<br />

tutte le proprietà delle unità<br />

d’analisi che non possono<br />

essere modificate dal<br />

ricercatore<br />

genere, età, etnia, istruzione,<br />

consumi culturali, ...<br />

variabili manipolabili:<br />

tutte le proprietà delle unità<br />

d’analisi che possono essere<br />

controllate e modificate<br />

dal ricercatore<br />

tutto ciò che può essere<br />

modificato sperimentalmente:<br />

pregiudizio razziale,<br />

orientamento politico, ...


Lucido 110<br />

3. <strong>Variabili</strong> dipendenti-indipendenti<br />

• E’ una distinzione che fa riferimento al ruolo svolto dalle variabili<br />

nei modelli teorici e nell’analisi dei dati<br />

variabile indipendente:<br />

è la variabile che<br />

rappresenta la causa<br />

Esempio<br />

genere<br />

età<br />

titolo di studio<br />

indipendenti<br />

variabile dipendente:<br />

è la variabile che<br />

rappresenta l’effetto<br />

pratica religiosa<br />

dipendente


Lucido 111<br />

Il modello di acquisizione sociale di Blau e Duncan<br />

(1967)<br />

Anni di istruzione Anni di istruzione<br />

del padre dell’intervistato<br />

Status Status<br />

del padre dell’intervistato<br />

(prima occ.)<br />

• Alcune variabili sono sia causa, sia effetto:<br />

Status dell’intervistato<br />

gli anni di istruzione dell’intervistato sono causa del suo status, ma a<br />

loro volta sono effetto degli anni di istruzione paterni;<br />

lo status dell’intervistato alla prima occupazione è sia causa di quello<br />

attuale, sia effetto di altre due variabili: lo status del padre e gli anni<br />

di istruzione dell’intervistato<br />

Solo lo status dell’intervistato è solo effetto di altre variabili, senza<br />

essere causa di alcuna<br />

<strong>Variabili</strong> indipendenti = quelle da cui originano le frecce<br />

<strong>Variabili</strong> dipendenti = quelle cui arrivano le frecce


Lucido 112<br />

4. Osservabilità<br />

• E’ una distinzione basata sulla possibilità di rilevare empiricamente una<br />

proprietà: alcune proprietà infatti non possono essere rilevate direttamente,<br />

perché fanno riferimento a concetti troppo generali o compositi. Ad<br />

esempio: intelligenza, status socio-economico, coesione sociale, anomia,<br />

etc.<br />

• Abbiamo quindi:<br />

variabili osservabili:<br />

fanno riferimento a tutte le proprietà<br />

che posso rilevare direttamente<br />

(genere, età, occupazione, stato<br />

civile, orientamento di voto, pratica<br />

religiosa, etc.)<br />

Esempio<br />

titolo di studio<br />

della madre<br />

titolo di studio<br />

del padre<br />

variabili<br />

osservabili<br />

variabili non osservabili<br />

(latenti):<br />

fanno riferimento a quelle<br />

proprietà che non possono essere<br />

rilevate direttamente<br />

livello culturale<br />

della famiglia<br />

variabile<br />

non osservabile


Lucido 113<br />

5. Tipi di scale (o livelli di misurazione)<br />

• L’ultima tipologia di variabili è di fondamentale importanza nella<br />

ricerca empirica, poiché grazie ad essa è possibile stabilire quali<br />

operazioni logico-matematiche è possibile applicare a quali variabili,<br />

e dunque quali tipi di analisi dei dati è possibile effettuare.<br />

• Ciò ha ripercussioni sul tipo di ipotesi di ricerca che possono essere<br />

sottoposte a controllo: accade che alcune ipotesi non possono essere<br />

controllate empiricamente perché il tipo di dati (cioè di variabili) di<br />

cui si dispone non lo consente<br />

Esempio: analisi di regressione con titolo di studio come<br />

variabile dipendente, e genere dell’intervistata/o come variabile<br />

indipendente


Lucido 114<br />

Codici o numeri?<br />

• I codici numerici di cui si compone la matrice dei dati a volte sono<br />

numeri, ma a volte sono semplici codici<br />

Esempio<br />

Quali di questi codici sono numeri e quali no?<br />

Genere: 1=donna, 2=uomo<br />

Titolo di studio: 1=elementare, 2=media inferiore, 3=media<br />

superiore, 4=laurea<br />

Età: 25/30/35/... anni<br />

GENERE ETA TITOLO<br />

1 56 3<br />

2 58 2<br />

1 56 1<br />

... ... ...<br />

Ha senso sommare<br />

1 + 2?<br />

Ha senso dividere<br />

3 ÷ 2?<br />

Ha senso calcolare<br />

(56 + 58)/2?


Lucido 115<br />

• Le differenze tra variabili riguardo al trattamento dei loro valori<br />

dipendono dalle differenze che percepiamo tra le proprietà<br />

Esempio<br />

La proprietà genere presenta due stati non ordinabili tra<br />

loro (maschio, femmina)<br />

La proprietà titolo di studio presenta stati ordinabili tra<br />

loro (elementare, media inf., media sup., laurea)<br />

Le proprietà età e numero di figli presentano numerosi<br />

stati, tutti ordinabili tra loro<br />

• Per sapere con quale tipo di proprietà abbiamo a che fare è<br />

necessario considerare due criteri principali:<br />

1) la presenza di un ordine tra gli stati;<br />

2) la possibilità di determinare la distanza esatta tra gli stati


Lucido 116<br />

Tipologia proprietà-variabili<br />

ordine?<br />

sì<br />

sì<br />

no<br />

unità di<br />

misura<br />

naturale<br />

unità di<br />

misura<br />

convenzionale<br />

distanza esatta?<br />

sì no<br />

proprietà a stati<br />

enumerabili<br />

variabili<br />

cardinali discrete<br />

proprietà continue<br />

variabili<br />

cardinali continue<br />

proprietà <strong>categoriali</strong><br />

<strong>ordinate</strong><br />

conteggio ordinamento<br />

misurazione<br />

⎯<br />

variabili<br />

<strong>categoriali</strong> <strong>ordinate</strong><br />

proprietà <strong>categoriali</strong><br />

non <strong>ordinate</strong><br />

classificazione<br />

variabili<br />

<strong>categoriali</strong><br />

non <strong>ordinate</strong>


Lucido 117<br />

<strong>Variabili</strong> <strong>categoriali</strong> non <strong>ordinate</strong><br />

• Queste proprietà vengono dette <strong>categoriali</strong> non <strong>ordinate</strong>, perché i loro<br />

stati individuano gruppi o categorie che non possono essere ordinati tra<br />

loro, e dei quali possiamo dire solo che sono uguali o diversi.<br />

• La definizione operativa di una proprietà categoriale non ordinata<br />

descrive la procedura di classificazione che darà origine alla variabile<br />

corrispondente (Marradi 1980), la quale sarà detta anch’essa<br />

categoriale non ordinata.<br />

Esempio<br />

Della proprietà “confessione religiosa” abbiamo individuato i seguenti<br />

stati significativamente distinti tra loro:<br />

1) cattolica<br />

2) protestante<br />

3) ortodossa<br />

4) buddista<br />

5) musulmana<br />

6) ebraica<br />

7) altre<br />

8) nessuna<br />

La definizione operativa della proprietà è quindi:<br />

1. chiedere all’intervistato/a (ad esempio la signora Bianchi) a quale<br />

confessione religiosa appartiene (cioè in quale gruppo ricade);<br />

2. registrare lo stato con il codice corrispondente (ad esempio,<br />

“cattolica”, codice 1). Ciò equivale a classificare la signora Bianchi<br />

come appartenente al gruppo dei cattolici.


Lucido 118<br />

<strong>Variabili</strong> <strong>categoriali</strong> <strong>ordinate</strong><br />

• Sono proprietà i cui stati si presentano in maniera ordinata, per le quali<br />

cioè esiste una gerarchia che consente di ordinare i diversi stati<br />

• Di questi possiamo dire non solo che sono uguali o diversi tra loro, ma<br />

anche che uno è maggiore o minore dell’altro (“elementare” non solo è<br />

diverso da “licenza media”, ma è anche inferiore)<br />

• Nella definizione operativa di questo tipo di proprietà si deve fare in<br />

modo che l’ordine dei codici assegnati a ciascuna modalità non<br />

contraddica l’ordine degli stati della proprietà:<br />

1. elementare 1. laurea 1. media inf.<br />

2. media inf. oppure 2. media sup. ma non 2. elementare<br />

3. media sup. 3. media inf. 3. laurea<br />

4. laurea 4. elementare 4. media sup.<br />

• La definizione operativa di una proprietà categoriale ordinata deve<br />

comprendere le istruzioni per attuare la procedura di ordinamento<br />

attraverso cui si dà origine alla variabile corrispondente, detta anch’essa<br />

categoriale ordinata.<br />

L’ordinamento è l’operazione con cui ripartiamo gli intervistati tra i<br />

diversi gruppi ordinati (gli stati della proprietà), assegnando a<br />

ciascuno di essi il codice numerico corrispondente al gruppo cui<br />

appartiene e creando così la variabile<br />

• Questa parte della definizione operativa sarà:<br />

1) chiedere all’intervistato di quale titolo di studio è in possesso;<br />

2) assegnare l’intervistato a uno dei gruppi ordinati (cioè ordinare gli<br />

intervistati);<br />

3) registrare il codice numerico corrispondente.


Lucido 119<br />

• Il principale problema relativo alle variabili <strong>categoriali</strong> <strong>ordinate</strong> è che<br />

non conosciamo la distanza tra le varie modalità: non sappiamo cioè se<br />

la distanza che separa “licenza elementare” da “licenza media” è la<br />

stessa che c’è tra “diploma” e “laurea”.<br />

• Attribuendo ai vari stati della proprietà titolo di studio i codici numerici<br />

da 1 a 4, abbiamo ipotizzato che gli stati fossero equidistanti.<br />

Avere la licenza media anziché il diploma fa però una certa differenza,<br />

e la distanza tra licenza media e diploma potrebbe essere più grande di<br />

quella che separa, ad esempio, la licenza elementare dalla licenza media<br />

• Tuttavia non sappiamo qual è la distanza tra gli stati (altrimenti<br />

avremmo una variabile cardinale, anziché categoriale ordinata), e<br />

quindi generalmente si sceglie di considerare eguali tali distanze,<br />

assegnando codici numerici che danno luogo a modalità equidistanti<br />

(ad esempio 1, 2, 3, ..., oppure 10, 20, 30,..., o ancora 5, 10, 15, ...)


Lucido 120<br />

<strong>Variabili</strong> cardinali discrete<br />

• Conosciamo sia l’ordine, sia la distanza tra gli stati della proprietà, che<br />

sono dette a stati enumerabili<br />

Esempi<br />

numero di figli o di automobili per famiglia<br />

numero di abitanti di un comune<br />

numero di giornali settimanali letti per settimana<br />

numero di libri letti in un anno<br />

....<br />

• Esiste un’unità di misura cosiddetta naturale, costituita dai numeri interi<br />

(detti appunto naturali) e dai loro multipli;<br />

• Gli stati di questo tipo di proprietà si definiscono contando, cioè tramite<br />

un’operazione di conteggio.<br />

• La definizione operativa è semplice:<br />

1) contare il numero di oggetti relativi al caso in esame (ad esempio, i<br />

figli della famiglia Rossi, le automobili della famiglia Verdi, le volte<br />

in cui l’intervistato è andato al cinema nell’ultimo mese, e così via);<br />

2) registrare il numero ottenuto. Quest’ultimo è un numero vero e<br />

proprio, e non più un codice numerico: possiamo cioè applicare ad<br />

esso tutte le operazioni matematiche che si applicano ai numeri<br />

cardinali.<br />

• Questo tipo di variabili viene detto appunto cardinale discreta: l’unità<br />

di misura non ammette decimali (non è possibile avere 1.7 automobili, a<br />

meno che non si tratti di una media) e la corrispondente proprietà varia<br />

appunto per stati discreti.<br />

• È anche possibile individuare uno zero assoluto, che corrisponde<br />

all’assenza della proprietà: zero figli, zero automobili, zero abitanti, etc.


Lucido 121<br />

<strong>Variabili</strong> cardinali continue<br />

• Provengono da proprietà per le quali è possibile concepire “infiniti stati<br />

intermedi fra due stati comunque scelti” (Marradi 1993, 13)<br />

Esempi<br />

età<br />

reddito<br />

spesa mensile per abbigliamento<br />

...<br />

• In tutti questi casi possiamo immaginare che tra uno stato e l’altro ve ne<br />

siano infiniti: tra lo stato “20 anni” e lo stato “21 anni” possiamo<br />

individuare gli stati “20 anni e 6 mesi”, “20 anni e 9 mesi”, “20 anni, 9<br />

mesi e 10 giorni”, e molti altri ancora.<br />

• Come per le proprietà a stati enumerabili, conosciamo sia l’ordine sia la<br />

distanza tra gli stati, ma l’unità di misura è convenzionale, e non esiste<br />

uno zero assoluto<br />

Esempi<br />

Diverse unità di misura lineari: metri, miglia, yarde, etc.<br />

Diversi sistemi per calcolare lo scorrere del tempo: il calendario<br />

lunare, oltre a quello solare<br />

Diverse unità di misura del peso: chilogrammi, libbre, etc.<br />

Diverse scale di misurazione della temperatura: Celsius,<br />

Fahrenheit


Lucido 122<br />

• La definizione operativa di queste proprietà deve specificare la<br />

procedura di misurazione che dà luogo a variabili cardinali continue,<br />

comprendendo le regole necessarie agli arrotondamenti<br />

Esempio<br />

Non è possibile né utile, in una ricerca empirica, registrare con<br />

esattezza assoluta uno stato qualsiasi, ad esempio che il signor<br />

Bianchi ha 50 anni, 6 mesi, 10 giorni, 20 ore, 30 minuti, 10<br />

secondi, 40 decimi di secondo, e così via, fino a porzioni<br />

infinitesimali di tempo<br />

• In sintesi, l’operazione di misurazione, che va specificata nella<br />

definizione operativa, consiste dei seguenti passi (Marradi 1980):<br />

1) si stabilisce un’unità di misura (anni o mesi; centimetri o metri; ...);<br />

2) si decide quante cifre registrare e come arrotondare (ad esempio, due<br />

cifre dopo la virgola, arrotondando per difetto);<br />

3) si confronta l’unità di misura con l’ammontare della proprietà nel<br />

singolo caso (si stabilisce ad esempio che il signor Bianchi ha 51<br />

anni);<br />

4) si trasforma l’esito della fase precedente nel numero registrabile<br />

corrispondente (cioè si registra “51”).


Lucido 123<br />

In sintesi:<br />

variabili <strong>categoriali</strong><br />

non <strong>ordinate</strong> (o nominali):<br />

le categorie non possono essere<br />

<strong>ordinate</strong><br />

non è possibile stabilire la distanza tra<br />

due categorie adiacenti<br />

Esempio: il genere<br />

cardinali continue<br />

la proprietà corrispondente varia per<br />

incrementi infinitesimali (assume<br />

infiniti stati intermedi tra due stati<br />

consecutivi qualsiasi)<br />

l’unità di misura non esiste in natura e<br />

dev’essere definita convenzionalmente<br />

(es. metri, feet, miglia, etc.)<br />

Esempio: l’età, il reddito, la<br />

temperatura<br />

variabili <strong>categoriali</strong> <strong>ordinate</strong><br />

le categorie sono ordinabili<br />

non è possibile stabilire la distanza<br />

tra due categorie adiacenti, ma solo<br />

che una precede l’altra<br />

Esempio: il titolo di studio<br />

variabili cardinali<br />

presentano un numero elevato e<br />

potenzialmente infinito di categorie<br />

possono essere continue o discrete<br />

cardinali discrete<br />

la proprietà corrispondente consiste nel<br />

“possesso” di un certo numero di<br />

oggetti (auto, figli, abitanti, etc.)<br />

l’unità di misura esiste in natura, e<br />

consiste nei numeri naturali (1, 2, 3, ...)<br />

Esempio: il numero dei figli, il numero<br />

di abitanti, il numero di periodici letti,<br />

etc.


Lucido 124<br />

Requisiti di una classificazione<br />

1) Esaustività<br />

Ogni caso deve poter essere assegnato<br />

ad una categoria<br />

Esempio: se il caso i-esimo non è<br />

stato assegnato né alla categoria<br />

maschio né alla categoria femmina, la<br />

classificazione non è esaustiva<br />

3) Disgiunzione<br />

Ogni caso appartiene solo ad una delle categorie<br />

Esempio: se la categoria elementare è<br />

parzialmente sovrapposta alla categoria<br />

media inferiore (cioè contiene casi che<br />

appartengono contemporaneamente ad<br />

entrambe), le categorie non sono disgiunte<br />

2) Mutua esclusività<br />

Un caso appartiene o non appartiene<br />

ad una categoria<br />

Esempio: se il caso i-esimo<br />

appartiene per il 60% alla categoria<br />

elementare e per il 40% alla categoria<br />

media inferiore, non abbiamo più una<br />

classificazione di tipo mutuamente<br />

esclusivo, ma di tipo fuzzy (non<br />

standard)


Lucido 125<br />

La misurazione<br />

• Il concetto di misurazione è collegato a quello di unità di misura:<br />

quando misuriamo, confrontiamo un’unità di misura con<br />

l’ammontare della relativa proprietà posseduto da un caso concreto<br />

(Marradi)<br />

• L’operazione della misurazione si compone di quattro fasi (Marradi):<br />

1) si stabilisce un’unità di misura<br />

2) si decide quante cifre registrare e come arrotondare<br />

3) si confronta l’unità di misura con l’ammontare della proprietà nel<br />

singolo caso<br />

4) si trasforma l’esito della fase precedente nel numero registrabile<br />

corrispondente<br />

Esempio: misurare l’età<br />

1) l’unità di misura è l’anno solare<br />

2) si registrano due cifre senza decimali. Se l’intervistato<br />

compie gli anni nei primi sei mesi, l’età viene arrotondata<br />

all’anno x; se l’intervistato compie gli anni nel secondo<br />

semestre, l’età viene arrotondata all’anno x +1<br />

3) chiedo all’intervistato quanti anni ha<br />

4) registro il numero sul questionario


Lucido 126<br />

• È corretto parlare di misurazione solo quando ci riferiamo a<br />

proprietà che danno origine a variabili cardinali<br />

Esempio<br />

La seguente affermazione:<br />

Vogliamo misurare la proprietà “titolo di studio”<br />

non è corretta, perché il titolo di studio è una proprietà (che<br />

percepiamo come) ordinale, e la corrispondente variabile<br />

viene generata tramite la procedura di ordinamento, non di<br />

misurazione. L’affermazione corretta sostituisce “misurare”<br />

con “rilevare”: vogliamo rilevare la proprietà “titolo di<br />

studio”<br />

Allo stesso modo, non è corretto affermare di “misurare” il<br />

genere degli intervistati, o il numero dei loro figli (che<br />

vengono contati, non misurati)


Lucido 127<br />

Quali operazioni su quali variabili?<br />

• Abbiamo detto che il tipo di proprietà determina il tipo di variabile:<br />

se percepiamo un ordine tra gli stati, avremo una variabile<br />

categoriale ordinata; se non lo percepiamo avremo una variabile<br />

categoriale non ordinata; se infine percepiamo numerosi stati<br />

(misurabili o conteggiabili), avremo una variabile cardinale<br />

• Tuttavia nella matrice dei dati tutte le variabili si presentano in forma<br />

numerica<br />

Questi codici numerici sono numeri<br />

veri e propri? posso usarli per le<br />

normali operazioni algebriche?<br />

NO:<br />

solo le variabili cardinali possono essere sottoposte<br />

alle operazioni algebriche, perché<br />

solo questo tipo di variabile presenta numeri veri e propri;<br />

negli altri due casi (variabili <strong>categoriali</strong> <strong>ordinate</strong> e non)<br />

si tratta di codici


Lucido 128<br />

Riassumendo:<br />

Stati della<br />

proprietà<br />

Procedura di<br />

operativizzazione<br />

Tipo di<br />

variabile<br />

non ordinati classificazione categoriale<br />

non ordinata<br />

(nominale)<br />

ordinati ordinamento categoriale<br />

ordinata<br />

continui<br />

discreti<br />

(Corbetta 1999)<br />

misurazione<br />

conteggio<br />

Caratteristiche<br />

dei valori<br />

nomi tradotti in<br />

codici numerici<br />

numeri con le<br />

sole proprietà<br />

ordinali<br />

cardinale numeri con<br />

proprietà<br />

cardinali<br />

Operazioni<br />

effettuabili<br />

sui valori<br />

Statistiche<br />

ammissibili<br />

= ≠ moda<br />

= ≠<br />

> <<br />

= ≠<br />

> <<br />

+ – × ÷<br />

• Delle categorie di una variabile categoriale non ordinata possiamo<br />

solo dire che sono uguali o diverse tra loro<br />

mediana,<br />

percentili<br />

media,<br />

varianza,<br />

deviazione<br />

standard<br />

Esempio: cattolico è diverso da musulmano, buddista è diverso da ebraico, ...<br />

• Delle categorie di una variabile categoriale ordinata possiamo dire<br />

non solo che sono uguali o diverse tra loro, ma anche che l’una è ad<br />

un livello superiore o inferiore all’altra<br />

Esempio: non solo titolo elementare è diverso da diploma, ma quest’ultimo è<br />

ad un livello superiore del primo<br />

• Sui valori di una variabile cardinale possiamo compiere tutte le<br />

operazioni algebriche, e quindi anche dire che un valore è maggiore,<br />

minore, uguale o diverso da un altro<br />

Esempio: 65 anni è diverso e maggiore di 55; posso sommare i due valori e<br />

dividerli per 2, ottenendo così la media

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!