30.12.2014 Views

Décrire les données - Pearson

Décrire les données - Pearson

Décrire les données - Pearson

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Analyse de données avec SPSS®<br />

fluence d’une variable sur une autre, il devra mettre en œuvre le test approprié (voir la<br />

section 3 du chapitre).<br />

2.2. Tests et mesures d’association de deux variab<strong>les</strong> qualitatives<br />

Les tris croisés ne permettent pas de démontrer l’existence d’une association de deux<br />

variab<strong>les</strong> du point de vue statistique. Pour mesurer véritablement la relation entre <strong>les</strong><br />

variab<strong>les</strong>, il est nécessaire de mettre en place des tests de signification statistique de l’association.<br />

La théorie des tests statistiques sera détaillée dans la section 3 de ce chapitre,<br />

mais le test très simple du khi-deux pour vérifier l’association de deux variab<strong>les</strong> qualitatives<br />

constitue une bonne introduction.<br />

Existence d’une association significative d’indépendance : le test du khi-deux<br />

Le test du khi-deux (χ 2 ) est couramment utilisé. Il cherche à tester si deux variab<strong>les</strong><br />

qualitatives (nomina<strong>les</strong> ou ordina<strong>les</strong>) sont significativement associées. En réalité, c’est<br />

l’indépendance des variab<strong>les</strong> qualitatives, présentées dans un tableau croisé, qui est testée.<br />

On cherche à vérifier si l’association des deux variab<strong>les</strong> est suffisamment forte pour<br />

que l’hypothèse de leur indépendance puisse être rejetée.<br />

Le principe est de comparer la distribution observée (O ij<br />

), c’est-à-dire <strong>les</strong> effectifs que<br />

l’on peut lire dans le tableau croisé, à une distribution théorique (T ij<br />

) qui correspond à<br />

l’hypothèse selon laquelle <strong>les</strong> deux variab<strong>les</strong> sont indépendantes. Normalement, si <strong>les</strong><br />

variab<strong>les</strong> étaient indépendantes, l’effectif observé ne devrait dépendre que des effectifs<br />

marginaux, c’est-à-dire de l’effectif total de chaque modalité. Imaginons que l’on cherche<br />

à savoir si la possession d’une carte de fidélité et le sexe sont associés. L’effectif théorique<br />

des possesseurs d’une carte de fidélité femme est égal au nombre de possesseurs d’une<br />

carte de fidélité multiplié par le nombre de femmes divisé par l’effectif total de<br />

l’échantillon.<br />

Le χ 2 observé sur l’échantillon se calcule de la manière suivante :<br />

χ 2 =<br />

l<br />

c<br />

∑∑<br />

i=1<br />

j=1<br />

(O ij<br />

−T ij<br />

) 2<br />

T ij<br />

40<br />

où :<br />

i = numéro de la ligne ;<br />

j = numéro de la colonne ;<br />

l = nombre de lignes, c’est-à-dire le nombre de modalités de la variable présentée en<br />

lignes ;<br />

c = nombre de colonnes, c’est-à-dire le nombre de modalités de la variable présentée en<br />

colonnes.<br />

La loi du khi-deux suit une distribution asymétrique dont la forme dépend du nombre<br />

de degrés de liberté n. Le nombre de degrés de liberté varie en fonction du nombre de<br />

modalités des variab<strong>les</strong> et se calcule de la manière suivante : (l – 1) × (c – 1). On rejettera<br />

l’hypothèse nulle d’indépendance entre <strong>les</strong> variab<strong>les</strong> si le χ 2 calculé est supérieur à la<br />

valeur de référence du χ 2 se trouvant dans la table de khi-deux pour n degrés de liberté<br />

(en lignes dans la table) et pour un α (niveau de risque de se tromper en rejetant l’hypo-<br />

© 2010 <strong>Pearson</strong> France – Analyse de données avec SPSS®, 2e éd. – Manu Carricano, Fanny Poujol, Laurent Bertrandias

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!