11.07.2015 Views

cours et TD - Enseeiht

cours et TD - Enseeiht

cours et TD - Enseeiht

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

60 CHAPITRE 4.THÉORIE DE L’ÉCHANTILLONNAGEou non 4 . Soit P c<strong>et</strong>te population, nous pouvons alors définir la variable aléatoire X suivante :X : P −→ {0, 1}b ↦−→ 0 si le bull<strong>et</strong>in b est nonb ↦−→ 1 si le bull<strong>et</strong>in b est oui.X est encore une variable aléatoire de loi de Bernoulli de paramètre p. Ce paramètre représente ici le pourcentagedes électeurs qui ont voté oui dans la population des électeurs qui ont voté oui ou non. Le problème est alors deconnaître la valeur de ce paramètre <strong>et</strong> plus précisemment de savoir si c<strong>et</strong>te valeur est supérieure ou inférieure à1/2.Remarque 1.2.3. Dans l’exemple précédent, nous avons considéré le cas d’un référendum <strong>et</strong> non celui d’unsondage d’opinion. Dans le cas du référendum, les estimations qui seront données le soir du 29 mai seront obtenuesà partir de bull<strong>et</strong>ins dépouillés, donc de données exactes. Le cas des sondages est lui beaucoup plus délicat. En eff<strong>et</strong>,on n’est pas sûr dans un sondage que les personnes interrogées répondent vraiment ce qu’elles pensent <strong>et</strong> on nesait pas si les personnes qui refusent de répondre ont le même comportement que celles qui répondent ; bref, nousn’avons pas les données exactes. La fiabilité des données est bien évidemment une question très importante enpratique qu’il faut toujours garder à l’esprit. Nous n’aborderons pas c<strong>et</strong>te question dans ce <strong>cours</strong>, question qui esttotalement dépendante du domaine d’application. La collecte des données pour un référendum ou celle pour l’étudede la pollution d’une nappe phréatique sont bien évidemment très différentes. Elle doit donc être effectuée par unspécialiste du domaine. Nous supposerons donc toujours ici que les données sont fiables.Exemple 1.2.4. Considérons maintenant un cas d’école qui nous sera très utile pédagogiquement. La populationU étudiée est une urne remplie de boules blanches <strong>et</strong> noires. On définit alors la variable aléatoire suivanteX : U −→ {0, 1}b ↦−→ 0 si b est noireb ↦−→ 1 si b est blanche.X est toujours une variable aléatoire de loi de Bernoulli de paramètre p. Ici ce paramètre est le pourcentage deboules blanches dans l’urne.On voit donc ici qu’estimer un taux de germination, un pourcentage de réponses par oui à un référendum ouun pourcentage de boules blanches dans une urne contenant des boules blanches <strong>et</strong> noires, sont des problèmesidentiques.Exemple 1.2.5. On s’interesse ici à un caractére qualitatif (la couleur des yeux) dans une population déterminéeP, par exemple la population française. On définit alors la variable aléatoireX : P −→ {marron,noir, bleu,vert,autre}1 individu ↦−→ la couleur de ses yeux.Ce qu’on désire connaître c’est la proportion des individus qui ont la couleur des yeux marron, noir, bleu, vert <strong>et</strong>autre, c’est-à-dire la loi de la variable aléatoire X : P (X = marron), P (X = noir), P (X = bleu), P (X = vert), <strong>et</strong>P (X = autre).Exemple 1.2.6. On s’intéresse au rendement exprimé en quintaux à l’hectare d’une variété fixée de tournesol T .Définissons la variable aléatoire suivante :X : P −→ Rune culture ↦−→ le rendement de c<strong>et</strong>te culture.Il faut là encore bien définir la population P. On doit en autre préciser :– la variété T ;– le type de terrain ;4 En France les bull<strong>et</strong>ins blancs sont considérés comme des bull<strong>et</strong>ins nuls <strong>et</strong> ne sont donc pas des suffrages exprimés. Ceci n’est pasle cas dans tous les pays.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!