12.07.2015 Views

initiation ä excel pour dåpouillement d'enquçte - Claude RAVELET

initiation ä excel pour dåpouillement d'enquçte - Claude RAVELET

initiation ä excel pour dåpouillement d'enquçte - Claude RAVELET

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

INITIATION Ä EXCELPOUR DÅPOUILLEMENT D'ENQUÇTEC. <strong>RAVELET</strong>Janvier 2009


Excel est un tableur, cÄest-Å-dire une grille :PRÄSENTATION DÅEXCELDans la grille, chaque rectangle est une "cellule" dÇfinie par un nÉ de ligne et un nÉ decolonne. Par exemple ici la cellule A1. On peut entrer dans les cellules des lettres, des chiffres,des images ou des opÇrations. On peut faire des calculs dans une cellule par rapport Åune autre, on appelle cela les rÇfÇrences relatives.Exemple : dans la cellule A1, il y a la valeur 12. On veut que dans B1, il y ait 5 de plus quedans A1 : on entre donc dans B1 "=A1+5" (le signe = signifie quÄon va entrer une opÇration etnon pas une lettre ou un chiffre), ce qui donne le rÇsultat 17 :


Exercice : (fichier "notes")Soit une classe de 30 ÇlÑves qui ont obtenu une note au 1 er semestre (Note A) et une noteau 2 Ñme semestre (Note B). On veut mettre 3 point de plus Å tous les ÇlÑves <strong>pour</strong> la note B :Ci-dessus la grille des notes ; puis on entre dans la cellule D2 :"=C2+3" ; le rÇsultat est 14.- 2 -


Pour faire la mÖme opÇration <strong>pour</strong> les 30 ÇlÑves, sÇlectionnez la colonne D en "inversionvidÇo" puis cliquez sur "Edition"/"Remplissage"/"En bas", le rÇsultat est immÇdiat.Nous voulons maintenant calculer la moyenne annuelle des 30 ÇlÑves sur les 2 notes A et B.En D2, la syntaxe est "=MOYENNE(B2:C2)", cÄest-Å-dire "calculer la moyenne de la zonecomprise entre B2 et C2"- 3 -


Exercice :Calculer la moyenne de la classe aux notes A et B :On se place en B32 et on entre "=MOYENNE(B2:B31)", puis <strong>pour</strong> la note B on clique"Edition/Remplissage/Å droite".Pour arrondir Å 2 chiffres derriÑre la virgule, on clique "Format/cellule/Nombre/2", ce quidonne le rÇsultat ci-dessus.- 4 -


Calcul de lÄÜcart-type. Si on ne connaát pas la syntaxe, on cherche dans lÄicàne â :Choisissez "Autres fonctions" puis "Statistiques" et dans la liste trouvez "ECARTYPE" ;Dans Nombre1 entrez la zone B2:B31, faites OK. La syntaxe est :"=ECARTYPE(B2:B31)". Recopiez Å droite <strong>pour</strong> les notes B, arrondissez Å 2 chiffresderriÑre la virgule :- 5 -


Exercice :Calculez le coefficient de corrÇlation entre les notes A et B.MÖme procÇdure : â puis COEFFICIENT CORRELATION puis les 2 zones (puisquÄonÇvalue une corrÇlation entre 2 sÇries) B2:B31 et C2:C31. Arrondi, le rÇsultat est le suivant :- 6 -


Travaillons maintenant sur une grille de donnÇes dÇmographiques (fichier"EXERCICE_dÇmo") :En A sont indiquÇes les annÇes, en B la population totale en milliers, en C le nombre demariages, en D le nombre de naissances de garäons, en E celui de filles, en F le total des naissances(D+E).Calculons le taux de natalitÇ en ã : Nb de naissances X 1000/Total de la population : indiquonsen G2 "=F2*1000/B2" mais attention la population est en milliers, il faut donc diviserpar 1000, la formule devient donc "=F2/B2"- 7 -


On recopie vers le bas, puis on va rÇaliser un graphique : cliquer sur lÄicàne reprÇsentantun histogramme et choisir "Courbes".En maintenant la souris sur "Maintenir appuyÇ <strong>pour</strong> visionner" on peut voir ce que sera legraphique. Choisir "Suivant", le graphique apparaát, encore "Suivant", puis entrer le titre dugraphique et le mettre dans la mÖme page.Le graphique apparaát dans la page, le dÇplacer en maintenant la souris appuyÇe <strong>pour</strong> quÄilne cache pas la grille. Il ne reste plus quÄÅ amÇliorer lÄaspect du graphique en mettant de lacouleur avec lÄicàne "bec verseur" en haut Å droite.- 8 -


Exercice : Calculer le taux de nuptialitÇ et faire un graphique.Il nÄy a pas de donnÇes concernant les mariages entre 1923 et 1945, donc la courbesÄÇcroule entre ces 2 dates.Voici le rÇsultat.- 9 -


UTILISATION DÄEXCEL POUR LE DÅPOUILLEMENT DES ENQUÇTESOuvrir le fichier "EXERCICE_grille". Cette grille reproduit les rÄsultats dÅune enquÇte parquestionnaires faite en Normandie il y a quelques annÄes. Les colonnes correspondent auxquestions et les lignes aux numÄros de questionnaires (attention cÅest la colonne A qui indiqueles numÄros des questionnaires) :IntÄressons-nous É la colonne B (variable SEXE). On veut faire le tri É plat de cette question: quelle est la rÄpartition entre les hommes (code M) et les femmes (code F).SÄlectionner la colonne B puis DonnÄes/Rapport de tableau croisÄ dynamique.


Cette premiÑre fenÇtre apparaÖt, cliquez sur Suivant, cette 2 Ñme fenÇtre apparaÖt, faites aussiSuivant, il nÅy a rien É modifier.InsÄrez le tri sur une nouvelle feuille afin de ne pas cacher la grille, la fenÇtre ci-dessusapparaÖt. Maintenez la souris appuyÄe sur SEXE et dÄplacez lÅicÜne dans la colonne de gauche.En reláchant la souris, les diffÄrentes valeurs apparaissent (ici F et M), ensuite faites glisserÉ nouveau lÅicÜne SEXE mais dans la partie centrale du tableau cette fois (oà il est indiquÄ"DÄposer DonnÄes Ici"), le tri des F et des M se fait automatiquement. En cliquant sur la flÑchedu tableau, vous Äliminez les cellules vides. Faites maintenant un <strong>pour</strong>centage en entrantdans C5 "=B5*100/502".- 11 -


Exercice : de la mÇme maniÑre, faites le tri É plat de la variable "Cadre de vie" (rural/urbain,colonne D).Voici le rÄsultat.Nous voulons maintenant faire le tri É plat de la CSP. En procÄdant de la mÇme maniÑre,on obtient le rÄsultat suivant :On voit quÅil y a trop de valeurs (tableau de droite), le tri est trop Ätendu et le tri croisÄfutur ne permettra pas de test de signification, un âä nÅÄtant pas permis avec des valeurs tropfaibles. Il faut donc rÄduire les valeurs des CSP aux 8 catÄgories principales en ne prenant quele chiffre de gauche du code INSEE de la CSP.- 13 -


Commencez par insÄrer une nouvelle colonne en sÄlectionnant la colonne suivante J et enfaisant la commande Insertion/Colonnes :Donnez un nouveau titre É la nouvelle colonne (indispensable) : CSP_bis. Dans la celluleJ2 entrez la formule "=GAUCHE(I2;1)", cÅest-É-dire "prendre un chiffre de gauche de la celluleI2". Excel indique donc 3 (É gauche de 31). Recopiez vers le bas. Les cellules vides resterontvides, les Non RÄponses "NR" deviendront "N". Faites maintenant un tri É plat deCSP_bis comme prÄcÄdemment.On obtient le rÄsultat ci-dessus aprÑs <strong>pour</strong>centages et lÅhistogramme arrangÄ (<strong>pour</strong> obtenirles valeurs en abscisses : sÄlectionnez A5:B13 avant de lancer le graphique).- 14 -


Nous allons maintenant faire le tri É plat de lÅáge. Nous allons rencontrer les mÇmesproblÑmes que <strong>pour</strong> la CSP : il y a trop de valeurs, il faut rÄduire. Donc insÄrez une nouvellecolonne :En D insÄrez une nouvelle colonne et appelez-la "AGE_bis". Nous allons classer lespersonnes en 2 catÄgories : les "jeunes" (moins de 21 ans) et les "agÄs" (les autres). Pour celanous allons employer la syntaxe "SI" (conditionnelle). Entrons en D2 :"=SI(C2


Classons maintenant les enquÇtÄs en 4 classes dÅáge : "A" les moins de 21 ans, "B" ceuxentre 21 et 40 ans, "C" ceux entre 41 et 60 ans et "D" les plus de 60 ans. La syntaxe est :ã SI(C2


ã SI(F2="M";"en couple";SI(F2="U";"en couple";"seul")) å, cÅest-É-dire ã si on trouve dansF2 "M" ou "U", la personne vit en couple, sinon elle vit seule. Voyons ce que cela donne :On voit que cela ne marche pas puisque les Non rÄponses (NR) ne sont considÄrÄs nicomme M ni comme U, donc vivant seuls. Il en est de mÇme <strong>pour</strong> les A. Il faut donc revoir laformule et Äliminer dÅemblÄe les NR et les A (par exemple considÄrer les A comme des NR).Entrons donc avant la formule prÄcÄdente :ã SI(F2="";"";SI(F2="NR";"NR";SI(F2="A";"NR" å afin dÅÄliminer les vides, les NR et lesA. On voit que cela marche : les NR et les A seront comptabilisÄs comme NR. NotonsquÅavec SI il doit y avoir autant de parenthÑses ouvertes que fermÄes. Il reste É faire le tri Éplat et le graphique.Ci-dessus le tri É plat. SÄlectionnez A5:B6. En cliquant sur lÅicÜne Histogramme on obtientcela. Cliquez avec la droite de la souris sur le bouton du bas "SITUATION" et choisissez"Masquer les boutons". Le graphique est dÄbarrassÄ de tout bouton ou cadre superflu.- 17 -


Ensuite cliquez É nouveau sur lÅicÜne Histogramme <strong>pour</strong> choisir plutÜt un secteur, plusadÄquat lorsquÅil nÅy a que 2 valeurs, et donnez-lui un titre.Placez le graphique dans la mÇme feuille que le tri É plat et donnez-lui de la couleur.- 18 -


TRIS CROISÄSReprenons la grille en son Ätat. Nous allons croiser le sexe et le cadre de vie (colonnes B etE) selon lÅhypothÇse que les femmes rechignent É habiter la campagne. Situons le curseur ÉlÅintÄrieur de la grille et cliquons sur DonnÄes/Rapport de tableau croisÄ dynamique :Le processus est le mÑme que <strong>pour</strong> le tri É plat jusquÅÉ ce tableau. Avec le bouton gauchede la souris restÄ appuyÄ dÄplacer le bouton SEXE dans la colonne de gauche et relÖcher. Lebouton CADRE doit Ñtre placÄ dans la ligne du haut puis SEXE ou CADRE placÄ dans lapartie centrale "DÄposer DonnÄes Ici". Le croisement est effectuÄ.SÄlectionnez la partie centrale du tableau (en jaune) et faites Edition/Copier puis ouvrez lefichier "KHI2", sÅil nÅest pas dÄjÉ copiÄ dans une feuille de la grille, et dans la premiÇre cellule(B7) de cette grille de Üá faites Edition/Coller. Le Üá est immÄdiatement calculÄ ainsi quele seuil de probabilitÄ dÅerreur.On remarque que le Üá est de 0,026 et le risque dÅerreur estde 0,87 soit 87%, ce qui est trÇs fort. Cela signifie que si onaffirme quÅil y a un lien entre les 2 variables, on a un risque dese tromper de 87%, autant dire quÅil nÅy a pas de lien entre lesexe et le cadre de vie rural/urbain. LÅhypothÇse Ätait doncfausse.- 19 -


Exercice : Croisez Sexe et Niveau dÅÄtudes (colonnes B et J). Les femmes sont-elles plusdiplàmÄes que les hommes ?On procÇde de la mÑme maniÇre <strong>pour</strong> obtenir le tableau ci-dessus. Le Üá est de 6,54 avec unrisque dÅerreur de 0,16 (16%). Il nÅy a pas de lien entre les 2 variables. Pour quÅil y ait un lien,il faut que le seuil dÅerreur soit infÄrieur É 10%.Croisons maintenant Age et Revenus. MÑme cheminement :Attention, il faut utiliser ici la grille KHI2_yates car il y a des 4 et des 5 dans le tableau. LeÜá est de 156,53 avec un risque dÅerreur de 3,89E-29 cÅest-É-dire 29 zÄros avant la virgule, soiten <strong>pour</strong>centage 0,00000000000000000000000000389%, autant dire nul. On peut donc direavec certitude quÅil y a un lien entre lÅÖge et le revenu. Quand il y a un lien, on doit se rÄfÄrerÉ la table des signes (sinon on lÅignore) <strong>pour</strong> voir le sens du lien. On repÇre les + dans la table:les jeunes ont moins de revenus et cÅest dans la catÄgorie 41-60 ans quÅon gagne le plus.- 20 -


Croisons <strong>pour</strong> terminer la CSP avec le revenu <strong>pour</strong> vÄrifier lÅhypothÇse Ävidente quÅongagne diffÄremment selon les mÄtiers. On effectue donc un tableau croisÄ entre CSP_bis etREVENU :On voit quÅil y a des cellules vides (donc = 0). Or il nÅest pas possible de calculer un Üáavec des cellules vides (en effet diviser par 0 donne lÅinfini, donc on aurai Üá=Ä, ce qui nÅaaucun sens). Il faut donc rÄduire le tableau en regroupant les CSP. DÄsignons par"agro,artisan,patron" les catÄgories 1, 2 & 3 ; "prof. inter." la 4 ; "employÄ,ouvrier" les 5 & 6 ;"retraitÄ" la 7 et "inactif" la 8. InsÄrons une nouvelle colonne CSP_ter oâ nous ferons unregroupement en ces 5 catÄgories (en effet la grille KHI2 ne comporte que 5 lignes et 5 colonnes).Nous entrons la formule :=SI(L2="";"";SI(L2="NR";"NR";SI(L2


LÉ, cela fonctionne. Reste É faire le tri croisÄ (ci-dessus). Un nouveau problÇme se pose : ily a des 1 et 2 dans le tableau, ce qui interdit un Üá. Il faut donc regrouper aussi les revenus. Ici,ci-dessus, un regroupement manuel, mais on aurait aussi pu insÄrer une nouvelle colonneREVENU_bis et classer en 2 catÄgories : "moins de 1500 ä" (1 + 2) et "plus de 1500 ä" (3 +4). Ici le regroupement manuel est plus rapide.Reste É Copier/Coller dans la grille KHI2. La probabilitÄ dÅerreur est de 8,44E-16 soit :0,0000000000000844% quasi nulle. Il y a donc un lien trÇs fort entre la profession et le revenu.La table des signes nous indique que les catÄgories 1, 2, 3, 4, 5 & 6 gagnent en comparaisonmieux que les 7 & 8.- 22 -

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!