cours et TD - Enseeiht

More documents

Recommendations

Info

60 CHAPITRE 4.THÉORIE DE L’ÉCHANTILLONNAGEou non 4 . Soit P cette population, nous pouvons alors définir la variable aléatoire X suivante :X : P −→ {0, 1}b ↦−→ 0 si le bulletin b est nonb ↦−→ 1 si le bulletin b est oui.X est encore une variable aléatoire de loi de Bernoulli de paramètre p. Ce paramètre représente ici le pourcentagedes électeurs qui ont voté oui dans la population des électeurs qui ont voté oui ou non. Le problème est alors deconnaître la valeur de ce paramètre et plus précisemment de savoir si cette valeur est supérieure ou inférieure à1/2.Remarque 1.2.3. Dans l’exemple précédent, nous avons considéré le cas d’un référendum et non celui d’unsondage d’opinion. Dans le cas du référendum, les estimations qui seront données le soir du 29 mai seront obtenuesà partir de bulletins dépouillés, donc de données exactes. Le cas des sondages est lui beaucoup plus délicat. En effet,on n’est pas sûr dans un sondage que les personnes interrogées répondent vraiment ce qu’elles pensent et on nesait pas si les personnes qui refusent de répondre ont le même comportement que celles qui répondent ; bref, nousn’avons pas les données exactes. La fiabilité des données est bien évidemment une question très importante enpratique qu’il faut toujours garder à l’esprit. Nous n’aborderons pas cette question dans ce cours, question qui esttotalement dépendante du domaine d’application. La collecte des données pour un référendum ou celle pour l’étudede la pollution d’une nappe phréatique sont bien évidemment très différentes. Elle doit donc être effectuée par unspécialiste du domaine. Nous supposerons donc toujours ici que les données sont fiables.Exemple 1.2.4. Considérons maintenant un cas d’école qui nous sera très utile pédagogiquement. La populationU étudiée est une urne remplie de boules blanches et noires. On définit alors la variable aléatoire suivanteX : U −→ {0, 1}b ↦−→ 0 si b est noireb ↦−→ 1 si b est blanche.X est toujours une variable aléatoire de loi de Bernoulli de paramètre p. Ici ce paramètre est le pourcentage deboules blanches dans l’urne.On voit donc ici qu’estimer un taux de germination, un pourcentage de réponses par oui à un référendum ouun pourcentage de boules blanches dans une urne contenant des boules blanches et noires, sont des problèmesidentiques.Exemple 1.2.5. On s’interesse ici à un caractére qualitatif (la couleur des yeux) dans une population déterminéeP, par exemple la population française. On définit alors la variable aléatoireX : P −→ {marron,noir, bleu,vert,autre}1 individu ↦−→ la couleur de ses yeux.Ce qu’on désire connaître c’est la proportion des individus qui ont la couleur des yeux marron, noir, bleu, vert etautre, c’est-à-dire la loi de la variable aléatoire X : P (X = marron), P (X = noir), P (X = bleu), P (X = vert), etP (X = autre).Exemple 1.2.6. On s’intéresse au rendement exprimé en quintaux à l’hectare d’une variété fixée de tournesol T .Définissons la variable aléatoire suivante :X : P −→ Rune culture ↦−→ le rendement de cette culture.Il faut là encore bien définir la population P. On doit en autre préciser :– la variété T ;– le type de terrain ;4 En France les bulletins blancs sont considérés comme des bulletins nuls et ne sont donc pas des suffrages exprimés. Ceci n’est pasle cas dans tous les pays.
1.MODÉLISATION DES VARIABLES 61– la taille des parcelles, leurs expositions, ... ;– les conditions de cultures ;– ...Le rendement est alors définie comme l’espérance mathématique de cette variable : µ = E(X). Estimer un rendement,c’est donc encore trouver une ”valeur approchée” de l’espérance mathématique d’une variable aléatoire.Nous supposerons en pratique pour cela que la loi de cette variable aléatoire (qui est une loi de probabilité sur R)est normale de paramètre µ et σ. On écrira que X suit une loi N (µ, σ 2 ) (attention nous mettons la variance σ 2 etnon l’écart type dans N (µ, σ 2 )). Ceci n’est bien sûr qu’un modèle. En effet, un rendement est toujours positif etdonc on sait que P (X < 0) = 0. Or, si X suit une loi normale, cette quantité est ègale à∫ 0−∞1√2πσe −(x−µ)2 /(2σ 2) dx,qui est strictement positif. Cependant, cette dernière quantité sera en pratique extrêment faible (voir l’exercice6.1.2). Elle ne remettra donc pas en cause le modèle choisi.Remarque 1.2.7. Le choix d’une loi de probabilité d’une variable aléatoire comme le rendement n’est pas toujours évident. Il se fait enpratique à partir de la connaissance que l’on peut avoir a priori. La justification théorique de l’emploi de la loi normale vient du théorèmelimite central. On peut en effet penser que le rendement obtenu est le résultat moyen d’un grand nombre de variable indépendantes (devariances majorées). Le théorème limite central nous dit alors que la loi de probabilité qui en résulte est très proche d’une loi normale.Nous mettons cependant en garde le lecteur sur l’utilisation parfois abusive de cette loi normale.Exemple 1.2.8. On désire étudier simultanément sur la population P des étudiants français de l’année 2005 lesvariables suivantes : le sexe, la taille, la couleur des yeux, et leurs ressources annuelles. On définit en fait ici levecteur aléatoire de dimension 5 suivant :X : P −→ {M, F } × R × R × {marron,noir,bleu, vert,autre} × Run étudiant ↦−→ (son sexe,sa taille, son poids, la couleur de ses yeux, ses ressources annuelles).Les applications composantes de X définissent cinq variables aléatoires X 1 , X 2 , X 3 , X 4 , X 5 qui sont définies sur lemême espace de départ que X : P et qui représentent respectivement les variables sexe, taille, poids, couleur desyeux et ressources. La variable couleur des yeux s’écrit par exempleX 4 : P −→ {marron,noir,bleu, vert,autre}un étudiant ↦−→ la couleur de ses yeux.On peut donc parler ici de l’indépendance ou non de ces variables aléatoires (X 1 , X 2 , X 3 , X 4 , X 5 ).Ces exemples montrent clairement que l’on formalise toujours les variables étudiées par des variables aléatoires. Ilfaudra toujours en pratique bien préciser ces variables aléatoires, c’est-à-dire la population de départ et l’applicationelle même. En effet les données seront en pratique les valeurs obtenues des variables aléatoires sur un échantillonde la population. Les statistiques ne pourront donner de réponses que sur la population à partir de laquelle ona extrait l’échantillon et uniquement celle-ci. Précisons aussi que les termes de population et d’individu sont àprendre dans leur sens statistique. Ainsi, dans l’exemple 1.2.6 un individu est en fait une culture sur une parcelle.On parle aussi parfois d’unité expérimentale au lieu d’individu. On emploie aussi le terme de caractère au lieu devariable.En conclusion une variable sera en fait une variable aléatoireX : P −→ Cω ↦−→ X(ω),où– la population P est en terme de probabilité un espace fondamental ;– un individu ω est un élément de la population P ;– C est l’ensemble des valeurs que peut prendre la variable aléaloire.Ce que l’on souhaite connaître en pratique c’est la loi de cette variable aléatoire, ou la valeur de certain de sesparamètres. Nous souhaitons ici souligner que la terminologie de variable aléatoire est très mauvaise. En effet, une variable aléatoire X deP à valeurs dans C est en fait une fonction parfaitement déterninée qui permet de transposer une probabilité d’un espace probabilisé dans unautre. Une variable aléatoire n’est donc pas une variable dans le sens mathématique du terme puisque c’est une fonction ; et cette fonction estparfaitement connue. On peut donc dire, comme cela est mentionné dans [2] qu’une variable aléatoire, c’est comme le Saint Empire RomainGermanique : il n’était pas saint, ce n’était pas un empire et il n’était pas romain ! ! !
Page 3 and 4:
iiTABLE DES MATIÈRES3.1 Probabilit
Page 5 and 6:
Chapitre 1Introduction1 Image de la
Page 7 and 8:
6. DIFFICULTÉ DE CET ENSEIGNEMENT
Page 9 and 10:
Chapitre 2Statistique descriptive1
Page 11 and 12:
3. STATISTIQUE DESCRIPTIVE À UNE D
Page 13 and 14: 3. STATISTIQUE DESCRIPTIVE À UNE D
Page 21 and 22: 4. STATISTIQUE DESCRIPTIVE À 2 DIM
Page 23 and 24: y4. STATISTIQUE DESCRIPTIVE À 2 DI
Page 31 and 32: 5.COMPLÉMENTS 27- son âge t en an
Page 33 and 34: 6. EXERCICES 296 Exercices6.1 Exerc
Page 35 and 36: 6. EXERCICES 31400350300250Values20
Page 37 and 38: 6. EXERCICES 33avec :{x 1 , x 2 , .
Page 39 and 40: Chapitre 3Probabilités1 Introducti
Page 41 and 42: 2.DÉFINITION DES PROBABILITÉS 37f
Page 43 and 44: 3.PROBABILITÉS CONDITIONNELLES ET
Page 45 and 46: 4. VARIABLES ALÉATOIRES 414.2 Déf
Page 47 and 48: 4. VARIABLES ALÉATOIRES 43(i) X es
Page 49 and 50: 4. VARIABLES ALÉATOIRES 45F (x)✻
Page 51 and 52: 4. VARIABLES ALÉATOIRES 474.5 Vari
Page 53 and 54: 4. VARIABLES ALÉATOIRES 49Ici les
Page 55 and 56: 5.ESPÉRANCE MATHÉMATIQUE 51Remarq
Page 57 and 58: 5.ESPÉRANCE MATHÉMATIQUE 53Théor
Page 59 and 60: 6.THÉORÈMES LIMITES 55est donc po
Page 61 and 62: 6.THÉORÈMES LIMITES 570.10.10.050
Page 63: Chapitre 4Théorie de l’échantil
Page 67 and 68: 2. INTRODUCTION À LA THÉORIE DE L
Page 69 and 70: 2. INTRODUCTION À LA THÉORIE DE L
Page 71 and 72: 3. ÉCHANTILLONNAGE 67Remarque 2.3.
Page 73 and 74: 4. DISTRIBUTION D’ÉCHANTILLONNAG
Page 75 and 76: 4. DISTRIBUTION D’ÉCHANTILLONNAG
Page 77 and 78: 5. PRINCIPALES LOIS DE PROBABILITÉ
Page 83 and 84: 6. EXERCICES 790.40.3f(x)0.20.1A 1
Page 85 and 86: 6. EXERCICES 81(b) Donner la loi de
Page 87 and 88: 6. EXERCICES 83✷V ar(Ȳ ) = ( 12)
Page 89 and 90: 6. EXERCICES 85(i) On définit la s
Page 91 and 92: Chapitre 5Tests statistiques : prin
Page 93 and 94: 2. EXEMPLE 8920001900durée de vie1
Page 95 and 96: 3. PRINCIPES GÉNÉRAUX 91µ 1380 1
Page 97 and 98: 3. PRINCIPES GÉNÉRAUX 93(ii) Desc
Page 99 and 100: 4. TEST BILATÉRAL 95µ 5.25 5.50 5
Page 101 and 102: 5. CONCLUSION 974.3 Tests multiples
Page 103 and 104: 6. EXERCICES 996 Exercices6.1 Exerc
Page 105 and 106: 6. EXERCICES 101observation du n-é
Page 107 and 108: 6. EXERCICES 1036.2 Exercices avec
Page 109 and 110: 6. EXERCICES 105Cette expérience s
Page 111 and 112: 6. EXERCICES 107(d) Application num
Page 113 and 114: Chapitre 6Estimation1 Introduction1
Page 115 and 116:
2. PRINCIPES GÉNÉRAUX 111C’est
Page 117 and 118:
2. PRINCIPES GÉNÉRAUX 113Par suit
Page 119 and 120:
3. ESTIMATIONS DES PRINCIPAUX PARAM
Page 121 and 122:
Page 123 and 124:
Page 125 and 126:
4.COMPLÉMENTS 121Nous avons ainsi
Page 127 and 128:
5. EXERCICES 123L’estimation ponc
Page 129 and 130:
5. EXERCICES 125(b) u 0.995 = 2.576
Page 131 and 132:
5. EXERCICES 127(i) calculer(ii) Ca
Page 133 and 134:
5. EXERCICES 129(ii) Si n désigne
Page 135:
Bibliographie[1] Gildas Brossier an
show all

cours et TD - Enseeiht

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?