11.07.2015 Views

cours et TD - Enseeiht

cours et TD - Enseeiht

cours et TD - Enseeiht

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

1.MODÉLISATION DES VARIABLES 61– la taille des parcelles, leurs expositions, ... ;– les conditions de cultures ;– ...Le rendement est alors définie comme l’espérance mathématique de c<strong>et</strong>te variable : µ = E(X). Estimer un rendement,c’est donc encore trouver une ”valeur approchée” de l’espérance mathématique d’une variable aléatoire.Nous supposerons en pratique pour cela que la loi de c<strong>et</strong>te variable aléatoire (qui est une loi de probabilité sur R)est normale de paramètre µ <strong>et</strong> σ. On écrira que X suit une loi N (µ, σ 2 ) (attention nous m<strong>et</strong>tons la variance σ 2 <strong>et</strong>non l’écart type dans N (µ, σ 2 )). Ceci n’est bien sûr qu’un modèle. En eff<strong>et</strong>, un rendement est toujours positif <strong>et</strong>donc on sait que P (X < 0) = 0. Or, si X suit une loi normale, c<strong>et</strong>te quantité est ègale à∫ 0−∞1√2πσe −(x−µ)2 /(2σ 2) dx,qui est strictement positif. Cependant, c<strong>et</strong>te dernière quantité sera en pratique extrêment faible (voir l’exercice6.1.2). Elle ne rem<strong>et</strong>tra donc pas en cause le modèle choisi.Remarque 1.2.7. Le choix d’une loi de probabilité d’une variable aléatoire comme le rendement n’est pas toujours évident. Il se fait enpratique à partir de la connaissance que l’on peut avoir a priori. La justification théorique de l’emploi de la loi normale vient du théorèmelimite central. On peut en eff<strong>et</strong> penser que le rendement obtenu est le résultat moyen d’un grand nombre de variable indépendantes (devariances majorées). Le théorème limite central nous dit alors que la loi de probabilité qui en résulte est très proche d’une loi normale.Nous m<strong>et</strong>tons cependant en garde le lecteur sur l’utilisation parfois abusive de c<strong>et</strong>te loi normale.Exemple 1.2.8. On désire étudier simultanément sur la population P des étudiants français de l’année 2005 lesvariables suivantes : le sexe, la taille, la couleur des yeux, <strong>et</strong> leurs ressources annuelles. On définit en fait ici levecteur aléatoire de dimension 5 suivant :X : P −→ {M, F } × R × R × {marron,noir,bleu, vert,autre} × Run étudiant ↦−→ (son sexe,sa taille, son poids, la couleur de ses yeux, ses ressources annuelles).Les applications composantes de X définissent cinq variables aléatoires X 1 , X 2 , X 3 , X 4 , X 5 qui sont définies sur lemême espace de départ que X : P <strong>et</strong> qui représentent respectivement les variables sexe, taille, poids, couleur desyeux <strong>et</strong> ressources. La variable couleur des yeux s’écrit par exempleX 4 : P −→ {marron,noir,bleu, vert,autre}un étudiant ↦−→ la couleur de ses yeux.On peut donc parler ici de l’indépendance ou non de ces variables aléatoires (X 1 , X 2 , X 3 , X 4 , X 5 ).Ces exemples montrent clairement que l’on formalise toujours les variables étudiées par des variables aléatoires. Ilfaudra toujours en pratique bien préciser ces variables aléatoires, c’est-à-dire la population de départ <strong>et</strong> l’applicationelle même. En eff<strong>et</strong> les données seront en pratique les valeurs obtenues des variables aléatoires sur un échantillonde la population. Les statistiques ne pourront donner de réponses que sur la population à partir de laquelle ona extrait l’échantillon <strong>et</strong> uniquement celle-ci. Précisons aussi que les termes de population <strong>et</strong> d’individu sont àprendre dans leur sens statistique. Ainsi, dans l’exemple 1.2.6 un individu est en fait une culture sur une parcelle.On parle aussi parfois d’unité expérimentale au lieu d’individu. On emploie aussi le terme de caractère au lieu devariable.En conclusion une variable sera en fait une variable aléatoireX : P −→ Cω ↦−→ X(ω),où– la population P est en terme de probabilité un espace fondamental ;– un individu ω est un élément de la population P ;– C est l’ensemble des valeurs que peut prendre la variable aléaloire.Ce que l’on souhaite connaître en pratique c’est la loi de c<strong>et</strong>te variable aléatoire, ou la valeur de certain de sesparamètres. Nous souhaitons ici souligner que la terminologie de variable aléatoire est très mauvaise. En eff<strong>et</strong>, une variable aléatoire X deP à valeurs dans C est en fait une fonction parfaitement déterninée qui perm<strong>et</strong> de transposer une probabilité d’un espace probabilisé dans unautre. Une variable aléatoire n’est donc pas une variable dans le sens mathématique du terme puisque c’est une fonction ; <strong>et</strong> c<strong>et</strong>te fonction estparfaitement connue. On peut donc dire, comme cela est mentionné dans [2] qu’une variable aléatoire, c’est comme le Saint Empire RomainGermanique : il n’était pas saint, ce n’était pas un empire <strong>et</strong> il n’était pas romain ! ! !

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!