22.06.2013 Views

Université de Provence — Centre de télé-enseignement L3 BGSTU ...

Université de Provence — Centre de télé-enseignement L3 BGSTU ...

Université de Provence — Centre de télé-enseignement L3 BGSTU ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Université</strong> <strong>de</strong> <strong>Provence</strong><br />

<strong>—</strong><br />

<strong>Centre</strong> <strong>de</strong> <strong>télé</strong>-<strong>enseignement</strong><br />

<strong>L3</strong> <strong>BGSTU</strong> Statistique<br />

Nicolas Pech<br />

<strong>Université</strong> <strong>de</strong> <strong>Provence</strong><br />

EA EGEE case 36<br />

3, place Victor Hugo<br />

13331 Maxseille ce<strong>de</strong>x 3<br />

2004-2005


Ce cours fait suite à celui dispensé dans le cadre du L2 <strong>BGSTU</strong>. J’ai essayé <strong>de</strong> faire en sorte<br />

qu’il puisse être lu <strong>de</strong> manière indépendante. Pour cela j’ai été amené à faire <strong>de</strong>s rappels aux<br />

endroits où ils étaient nécessaires. Ces rappels seront signalés, et je vous invite à les lire. Je<br />

vous conseille les ouvrages suivants :<br />

J. Bouyer. Métho<strong>de</strong>s statistiques. Mé<strong>de</strong>cine-Biologie. Estem<br />

J-J. Daudin, S. Robin & C. Vuillet. Statistique inférentielle. Idées, démarches, exemples.<br />

Presses universitaires <strong>de</strong> Rennes.<br />

G. Saporta. Probabilités, analyse <strong>de</strong>s données et statistique. Technip<br />

B. Scherrer. Biostatistique. Gaëtan Morin.<br />

D. Schwartz. Métho<strong>de</strong>s statistiques à l’usage <strong>de</strong>s mé<strong>de</strong>cins et <strong>de</strong>s biologistes. 4ème édition.<br />

Flammarion


Table <strong>de</strong>s matières<br />

1 Notions <strong>de</strong> probabilité [rappels <strong>de</strong> L2] 4<br />

1.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4<br />

1.2 Définition d’une probabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />

1.2.1 Espace probabilisable . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />

1.2.2 Probabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />

1.3 Indépendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8<br />

1.3.1 Indépendance <strong>de</strong> <strong>de</strong>ux événements . . . . . . . . . . . . . . . . . . . . . 8<br />

1.3.2 Indépendance <strong>de</strong> <strong>de</strong>ux variables aléatoires . . . . . . . . . . . . . . . . . 9<br />

1.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10<br />

2 Loi géométrique et loi exponentielle 11<br />

2.1 La loi géométrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />

2.1.1 La loi <strong>de</strong> Bernoulli [rappel <strong>de</strong> L2] . . . . . . . . . . . . . . . . . . . . . . 11<br />

2.1.2 La loi géométrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12<br />

2.1.3 Moyenne théorique ou espérance d’une variable aléatoire discrète . . . . 13<br />

2.1.4 Variance théorique ou espérance d’une variable aléatoire discrète . . . . 14<br />

2.2 La loi exponentielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />

2.2.1 Loi <strong>de</strong> probabilité d’une v.a. continue . . . . . . . . . . . . . . . . . . . 15<br />

2.2.2 La loi exponentielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15<br />

2.2.3 Moyenne théorique ou espérance d’une v.a. continue . . . . . . . . . . . 18<br />

2.2.4 Variance théorique d’une v.a. continue . . . . . . . . . . . . . . . . . . . 18<br />

2.3 Loi <strong>de</strong> Laplace-Gauss ou loi normale [Rappel <strong>de</strong> L2] . . . . . . . . . . . . . . . 19<br />

2.3.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19<br />

2.3.2 Table <strong>de</strong> la loi N(0,1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22<br />

2.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23<br />

3 Comparaison <strong>de</strong> <strong>de</strong>ux moyennes 24<br />

3.1 Position du problème . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />

3.2 Les effectifs <strong>de</strong>s échantillons sont suffisamment importants . . . . . . . . . . . . 24<br />

3.2.1 Distribution d’une moyenne [Rappel <strong>de</strong> L2] . . . . . . . . . . . . . . . . 25<br />

3.2.2 Construction du test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26<br />

3.2.3 Calcul <strong>de</strong> l’erreur <strong>de</strong> secon<strong>de</strong> espèce β . . . . . . . . . . . . . . . . . . . 27<br />

3.3 Les petits échantillons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29<br />

3.3.1 Les observations individuelles sont distribuées selon une loi normale :<br />

test <strong>de</strong> stu<strong>de</strong>nt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29<br />

2


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

3.3.2 Les observations individuelles ne sont pas distribuées selon une loi normale<br />

: test <strong>de</strong> Mann-Whitney . . . . . . . . . . . . . . . . . . . . . . . . 32<br />

3.4 Test paramétrique et test libre . . . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />

3.5 Table <strong>de</strong> la loi <strong>de</strong> Stu<strong>de</strong>nt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35<br />

3.6 Table la loi <strong>de</strong> Mann et Whitney . . . . . . . . . . . . . . . . . . . . . . . . . . 36<br />

3.7 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37<br />

4 Test du chi-<strong>de</strong>ux (χ 2 ) d’adéquation 40<br />

4.1 Position du problème . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40<br />

4.2 Construction du test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41<br />

4.2.1 Cas où la distribution théorique ne dépend pas <strong>de</strong> paramètre inconnu . . 41<br />

4.2.2 Cas où la distribution théorique dépend <strong>de</strong> paramètre(s) inconnu(s) . . . 44<br />

4.3 Fonction <strong>de</strong> répartition <strong>de</strong> la loi du χ 2 . . . . . . . . . . . . . . . . . . . . . . . 46<br />

4.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47<br />

5 Liaison entre <strong>de</strong>ux variables aléatoires discrètes 49<br />

5.1 Loi <strong>de</strong> probabilité d’un couple <strong>de</strong> variables aléatoires discrètes . . . . . . . . . . 49<br />

5.1.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49<br />

5.1.2 Lois marginales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50<br />

5.1.3 Lois conditionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50<br />

5.2 Test du χ 2 d’indépendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50<br />

5.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53<br />

6 Liaison entre <strong>de</strong>ux variables aléatoires continues 55<br />

6.1 Loi <strong>de</strong> probabilité d’un couple <strong>de</strong> variables aléatoires continues . . . . . . . . . 55<br />

6.1.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55<br />

6.1.2 Lois marginales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56<br />

6.1.3 Lois conditionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56<br />

6.2 Covariance et coefficient <strong>de</strong> corrélation linéaire . . . . . . . . . . . . . . . . . . 57<br />

6.2.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57<br />

6.2.2 Estimation du cooefficient <strong>de</strong> corrélation linéaire . . . . . . . . . . . . . 58<br />

6.2.3 Test <strong>de</strong> l’hypothèse <strong>de</strong> nullité du coefficient <strong>de</strong> corrélation linéaire . . . . 60<br />

6.3 exercice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60<br />

7 Régression linéaire simple 62<br />

7.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62<br />

7.2 Le modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62<br />

7.3 Estimation <strong>de</strong>s coefficients du modèle par la métho<strong>de</strong> <strong>de</strong>s moindres carrés . . . 65<br />

7.4 Test <strong>de</strong> la pente <strong>de</strong> la droite <strong>de</strong> régression . . . . . . . . . . . . . . . . . . . . . 67<br />

7.4.1 Construction du test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67<br />

7.4.2 Interprétation du test <strong>de</strong> la pente . . . . . . . . . . . . . . . . . . . . . . 68<br />

7.5 Précision <strong>de</strong> la droite <strong>de</strong> régression . . . . . . . . . . . . . . . . . . . . . . . . . 69<br />

7.5.1 Intervalle <strong>de</strong> confiance <strong>de</strong> la pente <strong>de</strong> la droite <strong>de</strong> régression . . . . . . . 69<br />

7.5.2 Prédiction <strong>de</strong> Y connaissant x . . . . . . . . . . . . . . . . . . . . . . . . 69<br />

7.6 Part <strong>de</strong> variance expliquée par la régression . . . . . . . . . . . . . . . . . . . . 70<br />

7.7 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72<br />

3


Chapitre 1<br />

Notions <strong>de</strong> probabilité [rappels <strong>de</strong> L2]<br />

L’objet <strong>de</strong> toute étu<strong>de</strong> statistique est <strong>de</strong> formuler <strong>de</strong>s lois valables pour un ensemble d’êtres<br />

ou d’éléments auquel on donne le nom <strong>de</strong> population.<br />

1.1 Généralités<br />

Définition 1.1 On appelle population (notée Ω) un ensemble d’éléments ou individus (notés<br />

ω), possédant au moins une caractéristique commune et exclusive, permettant <strong>de</strong> l’i<strong>de</strong>ntifier<br />

et <strong>de</strong> le distinguer sans ambiguïté <strong>de</strong> tout autre.<br />

Exemples :<br />

1. Ω1 =“Ensemble <strong>de</strong>s étudiants inscrits en <strong>L3</strong><strong>BGSTU</strong>” ;<br />

2. Ω2 = “Ensemble <strong>de</strong>s poissons d’un lac” ;<br />

3. Ω3 = “Ensemble <strong>de</strong>s familles d’un pays” ;<br />

4. Ω4 = “Ensemble <strong>de</strong> cellules”.<br />

Ω1 constitue bien une population car l’élément constitutif <strong>de</strong> la population est bien i<strong>de</strong>ntifié<br />

(une personne), et ses caractéristiques communes et exclusives : il est étudiant ET inscrit en<br />

<strong>L3</strong><strong>BGSTU</strong>.<br />

Remarque : Un individu n’est pas forcément un individu au sens usuel. Pour Ω1, l’individu<br />

ω est une personne. Pour Ω3, l’individu (ω) est une famille.<br />

Définition 1.2 On appelle variable aléatoire (notée T; X; Y ... Z) une application qui à<br />

un individu ω associe une valeur numérique appelée réalisation <strong>de</strong> la variable aléatoire (notée<br />

T(ω)=t; X(ω)=x;Y(ω)=y ...Z(ω)=z).<br />

Exemples : L’observation <strong>de</strong>s cellules permet <strong>de</strong> définir la variable aléatoire “état <strong>de</strong> la<br />

cellule” :<br />

4


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

C : Ω4 −→ {0,1}<br />

ωi ↦−→ C(ωi) = 1 si la cellule i est cancéreuse;<br />

= 0 sinon.<br />

Un jet <strong>de</strong> dés permet <strong>de</strong> définir la variable aléatoire “numéro <strong>de</strong> la face tirée” :<br />

X : Ω1 −→ {1,2,3,4,5,6}<br />

ωi ↦−→ X(ωi) = xi = numéro <strong>de</strong> la face tirée<br />

L’observation du groupe sanguin d’un individu dans la population humaine permet <strong>de</strong> définir<br />

la variable aléatoire “groupe sanguin” :<br />

X : Ω2 −→ {1,2,3,4}<br />

ωi ↦−→ X(ωi) = 1 si le groupe est <strong>de</strong> type A<br />

= 2 si le groupe sanguin est <strong>de</strong> type B<br />

= 3 si le groupe sanguin est <strong>de</strong> type AB<br />

= 4 si le groupe sanguin est <strong>de</strong> type O<br />

L’observation <strong>de</strong> la taille d’un poisson permet <strong>de</strong> définir la variable aléatoire “taille” :<br />

T : Ω3 −→ {R + }<br />

ωi ↦−→ T(ωi) = xi = taille du poisson<br />

Définition 1.3 On appelle espace fondamental l’ensemble E constitué <strong>de</strong> tous les résultats<br />

possibles <strong>de</strong> la variable aléatoire.<br />

Exemple : Pour la variable aléatoire “jet <strong>de</strong> dés”, E = {1, 2, 3, 4, 5, 6}; pour la variable<br />

aléatoire “groupe sanguin”, E = {1, 2, 3, 4}; pour la variable aléatoire “taille du poisson”,<br />

E = R + .<br />

Définition 1.4 On appelle événement -noté A, B, ...- une proposition concernant les résultats<br />

<strong>de</strong> la variable aléatoire, ce qui est équivalent à un sous ensemble <strong>de</strong> l’espace fondamental E.<br />

On notera E l’ensemble <strong>de</strong>s événements associé à E.<br />

Exemple 1 L’événement “obtenir un résultat pair” pour la variable aléatoire “jet <strong>de</strong> dés” est<br />

A1 = {2, 4, 6}; l’événement “obtenir un résultat impair” pour la variable aléatoire “jet <strong>de</strong><br />

dés” est A2 = {1, 3, 5}; l’événement “avoir un 1” pour la variable aléatoire “jet <strong>de</strong> dés” est<br />

A3 = {1}, l’événement “obtenir un 7” pour la variable aléatoire “jet <strong>de</strong> dés” est ∅. Ces quatre<br />

ensembles font partie <strong>de</strong> E = {A1, A2, A3, ∅, ..., E}.<br />

Exemple 2 L’événement “ne pas être du groupe sanguin A” pour la variable aléatoire “groupe<br />

sanguin” est A1 = {2, 3, 4}; L’événement “être donneur universel” pour la variable aléatoire<br />

“groupe sanguin” est A1 = {3}.<br />

5


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Exemple 3 L’événement “être compris entre 10 et 12 cm” pour la variable aléatoire “taille<br />

du poisson” est A1 = [10, 12]; l’événement “être strictement supérieur à 12” pour la variable<br />

aléatoire “taille du poisson” est A2 =]12, +∞[.<br />

La première caractéristique d’une variable aléatoire, c’est qu’on ne connaît pas avant sa réalisation,<br />

la valeur qu’elle prend. Puisqu’on ne peut connaître la valeur prise par la variable<br />

aléatoire considérée, on va s’intéresser aux chances ou probabilités <strong>de</strong> tout événement. “Connaître”<br />

la variable aléatoire ce n’est pas connaître à l’avance les résultats, c’est connaître quelle<br />

est la chance ou probabilité <strong>de</strong> réalisation <strong>de</strong> tout événement.<br />

1.2 Définition d’une probabilité<br />

1.2.1 Espace probabilisable<br />

Définition 1.5 Soit Ω un ensemble, on appelle espace probabilisable la donnée d’un couple<br />

(Ω, A) où A (dite tribu associée à Ω) est une collection <strong>de</strong> sous ensembles <strong>de</strong> Ω vérifiant :<br />

1. Ω ∈ A<br />

2. Si A ∈ A alors A c ∈ A<br />

3. Pour toute suite (An)n∈N d’éléments <strong>de</strong> A, ∪n∈NAn ∈ A<br />

Exemple : Soit E = {1,2,3,4,5,6} <strong>de</strong> l’exemple “jet <strong>de</strong> dé”. Si on définit E = P(E) =ensemble<br />

<strong>de</strong>s parties <strong>de</strong> E, alors (E, E) constitue un espace probabilisable. E correspond alors à l’ensemble<br />

<strong>de</strong>s événements qu’il est possible d’associer à la variable aléatoire “jet <strong>de</strong> dé”.<br />

1.2.2 Probabilité<br />

Définition<br />

Définition 1.6 Soit (Ω, A) un espace probabilisable. On appelle probabilité P associée à (Ω, A)<br />

l’application :<br />

P : A −→ [0, 1]<br />

A ↦−→ P(A) telle que :<br />

• P(Ω) = 1;<br />

• Pour toute suite (Ai)i d’événements <strong>de</strong>ux à <strong>de</strong>ux disjoints (ie Ai ∩ Aj, ∀i = j) alors<br />

P(∪iAi) = <br />

i P(Ai)<br />

Définition 1.7 Le triplet (Ω, A,P) est dit espace probabilisé.<br />

Propriété 1.1 Soient A et B <strong>de</strong>ux événements quelconques, alors on a toujours :<br />

P(∅) = 0<br />

P(A c ) = 1 − P(A)<br />

P(A ∪ B) = P(A) + P(B) − P(A ∩ B)<br />

A ⊆ B ⇒ P(A) ≤ P(B).<br />

6


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Propriété 1.2 Quand l’espace fondamental est fini et si ses éléments sont équiprobables alors<br />

la probabilité d’obtenir un événement A est notée P(A), avec P(A) = CardA<br />

. Le cardinal <strong>de</strong><br />

CardE<br />

A désigne le nombre d’éléments <strong>de</strong> A.<br />

Exemples :<br />

1. Soit un dé, quelle est la probabilité d’obtenir un nombre pair?<br />

E = {1, 2, 3, 4, 5, 6} et A = { 2, 4, 6}. Donc CardE= 6 et CardA= 3. La probabilité<br />

= 1/2.<br />

d’obtenir un nombre pair est donc P(A)= CardA<br />

CardE<br />

2. Soit un dé, quelle est la probabilité d’obtenir un nombre supérieur ou égal à 3?<br />

E = {1, 2, 3, 4, 5, 6} et B = { 3, 4, 5, 6}. Donc CardE= 6 et CardB= 4. La<br />

= 2/3.<br />

probabilité d’obtenir un nombre supérieur ou égal à 3 est donc P(B)= CardB<br />

CardE<br />

3. Soit un dé, quelle est la probabilité d’obtenir un nombre pair et supérieur ou égal à 3?<br />

Pour cela nous calculons la probabilité <strong>de</strong> l’intersection <strong>de</strong>s événements A et B :<br />

CardA ∩ B<br />

A ∩ B = { 4, 6} d’où P(A ∩ B) = = 1/3.<br />

CardE<br />

Loi <strong>de</strong> probabilité d’une variable aléatoire<br />

Définition 1.8 Soit X une variable aléatoire réelle, E son espace fondamental muni <strong>de</strong> E.<br />

On <strong>de</strong>finit PX la probabilité associée à X par : PX(A) = P {ω / X(ω) ∈ A} = P(X ∈ A). PX<br />

est dite distribution théorique ou encore loi <strong>de</strong> probabilité <strong>de</strong> X.<br />

Exemple : Soit Ω=“Ensemble <strong>de</strong>s étudiants <strong>de</strong> <strong>L3</strong><strong>BGSTU</strong>” et A= “Ensemble <strong>de</strong> tous les<br />

groupes d’étudiants <strong>de</strong> <strong>L3</strong><strong>BGSTU</strong> qu’il est possible <strong>de</strong> constituer”. On définit alors sur (Ω, A)<br />

la probabilité :<br />

Soit X la variable “groupe sanguin” :<br />

X : Ω −→<br />

P : (Ω, A) −→ [0,1]<br />

A ↦−→ P(A) = cardA<br />

cardΩ<br />

<br />

{1,2,3,4}, E<br />

<br />

ω ↦−→ X(ω) = 1 si le groupe sanguin est <strong>de</strong> type A<br />

= 2 si le groupe sanguin est <strong>de</strong> type B<br />

= 3 si le groupe sanguin est <strong>de</strong> type AB<br />

= 4 si le groupe sanguin est <strong>de</strong> type O<br />

Soit l’événement “être donneur universel”= A = {4}. Alors on a :<br />

PX(A) = PX{4} = P {ω / X(ω) = 4} =<br />

card{ω / X(ω) = 4}<br />

cardΩ<br />

7


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Probabilité conditionnelle<br />

Définition 1.9 Si A et B sont <strong>de</strong>ux événements (avec P(A) = 0), on appelle probabilité<br />

conditionnelle <strong>de</strong> B quand A est réalisé, le nombre réel défini par P(B/A) . P(A ∩ B)<br />

= .<br />

P(A)<br />

Exemple : Jet <strong>de</strong> dé (Ω, A,P) −→ (E = {1,2,3,4,5,6}, E, PX)<br />

ω ↦−→ X(ω)<br />

Considérons les <strong>de</strong>ux événements : A=“Obtenir un résultat pair” et B=“Obtenir un résultat<br />

supérieur ou égal à 4”.<br />

PX(B/A) . = PX(A ∩ B)<br />

PX(A) = PX{4, 6}<br />

1/3<br />

. Nous obtenons donc = 2/3.<br />

PX{2, 4, 6} 1/2<br />

1.3 Indépendance<br />

1.3.1 Indépendance <strong>de</strong> <strong>de</strong>ux événements<br />

Définition 1.10 Deux événements A et B sont dits indépendants si et seulement si :<br />

P(A ∩ B) = P(A) × P(B).<br />

Remarques :<br />

1. Si A et B sont indépendants alors P(B/A) = P(B);<br />

2. “indépendance” signifie que la réalisation <strong>de</strong> l’événement A ne modifie pas les chances<br />

ou la probabilité <strong>de</strong> réalisation <strong>de</strong> l’événement B ;<br />

3. Pour montrer la dépendance <strong>de</strong> <strong>de</strong>ux événements A et B, il suffit <strong>de</strong> vérifier que P(A ∩<br />

B) = P(A) × P(B).<br />

Exemple :<br />

1. Considérons l’exemple précé<strong>de</strong>nt (obtenir un résultat pair et supérieur ou égal à 4). La<br />

probabilité <strong>de</strong> l’intersection <strong>de</strong>s événements A et B (A ∩ B = { 4, 6}) est égale à :<br />

CardA ∩ B<br />

P(A ∩ B) = = 1/3.<br />

CardE<br />

Si nous calculons P(A) × P(B), nous obtenons P(A) × P(B) = 1/2 × 1/2 = 1/4 donc<br />

P(A ∩ B) = P(A) × P(B). Les événements A et B ne sont pas indépendants.<br />

2. Reprenons l’exemple précé<strong>de</strong>nt en considérant B1 l’événement “obtenir un résultat supérieur<br />

ou égal à 3". La probabilité <strong>de</strong> l’intersection <strong>de</strong>s événements A et B1 (A ∩ B1 =<br />

CardA ∩ B1<br />

{ 4, 6}) est égale à : P(A ∩ B1) = = 1/3.<br />

CardE<br />

Si nous calculons P(A) × P(B1), nous obtenons P(A) × P(B1) = 1/2 × 2/3 = 1/3 donc<br />

P(A ∩ B1) = P(A) × P(B1). Les événements A et B1 sont donc indépendants.<br />

8


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

1.3.2 Indépendance <strong>de</strong> <strong>de</strong>ux variables aléatoires<br />

Définition 1.11 Soient X et Y <strong>de</strong>ux variables aléatoires réelles définies sur la même population.<br />

X et Y sont dites variables aléatoires indépendantes si et seulement si :<br />

∀(a1, a2, b1, b2) / a1 < b1 ∧ a2 < b2,<br />

P {ω/a1 < X(ω) < b1 ∧ a2 < Y (ω) < b2} = PX[a1, b1] × PY [a2, b2].<br />

Interprétation : Intuitivement, <strong>de</strong>ux variables aléatoires sont indépendantes si la distribution<br />

<strong>de</strong> l’une ne dépend pas <strong>de</strong>s valeurs <strong>de</strong> l’autre. Par exemple, le poids et la tension arterielle<br />

seraient indépendantes si la distribution <strong>de</strong> la tension artérielle était la même quelque soit le<br />

poids. Pratiquement, cela signifie que si l’on regroupait les sujets d’une population en sous<br />

populations <strong>de</strong> sujets <strong>de</strong> même poids, la distribution <strong>de</strong> la tension artérielle serait la même<br />

dans toutes ces populations.<br />

9


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

1.4 Exercices<br />

Exercice 1.1 On considère un dé à 6 faces non pipé. On définit les 3 événements :<br />

A=“Obtenir un chiffre pair”, B=“Obtenir un chiffre impair”, C=“Obtenir un résultat ≥ à 4”.<br />

1. Les événements A et B sont-ils indépendants ?<br />

2. Montrer que les événements A et C ne sont pas indépendants.<br />

3. Proposer un événement D qui soit indépendant <strong>de</strong> l’événement A.<br />

Exercice 1.2 On a mélangé par inadvertance <strong>de</strong>s graines <strong>de</strong> <strong>de</strong>ux provenances différentes :<br />

A et B. On a ainsi un ensemble <strong>de</strong> graines dont 1/3 provient <strong>de</strong> A et 2/3 <strong>de</strong> B. La moitié <strong>de</strong>s<br />

graines <strong>de</strong> A et les trois quarts <strong>de</strong>s graines <strong>de</strong> B sont noires. On choisit une graine au hasard :<br />

elle est noire. Quelle est la probabilité pour qu’elle provienne <strong>de</strong> A?<br />

Exercice 1.3 On vous présente un homme. Dans la brève conversation qui suit, vous apprenez<br />

que cet homme a <strong>de</strong>ux enfants dont au moins une fille. Quelle est la probabilité pour qu’il<br />

ait <strong>de</strong>ux filles ?<br />

Exercice 1.4 Une population est composée <strong>de</strong> 40% d’hommes et <strong>de</strong> 60% <strong>de</strong> femmes. 50%<br />

<strong>de</strong>s hommes et 30% <strong>de</strong>s femmes fument. Quelle est la probabilité pour qu’un fumeur, choisi<br />

au hasard, soit une femme?<br />

Exercice 1.5 Une partie du jeu du lièvre et <strong>de</strong> la tortue se déroule ainsi : On lance un dé.<br />

Si le dé tombe sur 1, 2, 3, 4 ou 5 la tortue avance d’une case. Elle a 5 cases à franchir avant<br />

d’atteindre l’arrivée. La partie est alors terminée, la tortue a gagné. Si le dé tombe sur 6 le<br />

lièvre atteint directement l’arrivée. La partie est alors terminée, le lièvre a gagné.<br />

La partie continue jusqu’à ce qu’il y ait un gagnant. Quelle est la situation la plus enviable :<br />

celle du lièvre ou celle <strong>de</strong> la tortue?<br />

10


Chapitre 2<br />

Loi géométrique et loi exponentielle<br />

2.1 La loi géométrique<br />

2.1.1 La loi <strong>de</strong> Bernoulli [rappel <strong>de</strong> L2]<br />

Nous allons considérer l’exemple suivant : on considère un mala<strong>de</strong> qui doit recevoir une greffe.<br />

Pour que la greffe puisse se faire, il faut que le donneur soit compatible avec le mala<strong>de</strong>. Si on<br />

définit par Ω l’ensemble <strong>de</strong>s donneurs potentiels (e.g. adultes entre 25 et 45 ans) on peut à<br />

chaque individu associer une valeur numérique égale à :<br />

• 1 si le donneur est compatible;<br />

• 0 si le donneur n’est pas compatible.<br />

... et définir l’application suivante :<br />

X1 : Ω −→ {0,1}<br />

ω ↦−→ X1(ω) = 1 si compatible;<br />

= 0 si non compatible.<br />

Ω représente la population (ie les donneurs respectant le critère d’inclusion, et ω est le donneur<br />

qui se présente. On considère ici que le donneur est choisi aléatoirement dans la population.<br />

Ainsi, le résultat (ie compatibilité ou non compatibilité) est aléatoire...on ne peut pas savoir<br />

à l’avance si le donneur est compatible!<br />

Définition 2.1 On appelle variable aléatoire (v.a.) réelle une application X qui à un individu<br />

ω associe une valeur numérique appelée réalisation <strong>de</strong> la variable aléatoire (notée X(ω) = x).<br />

On note :<br />

X : Ω −→ E<br />

ω ↦−→ X(ω) = x<br />

Pour notre exemple, la v.a. est à valeurs dans un ensemble dénombrable (et même fini) : E =<br />

{0,1}. On parlealors <strong>de</strong> v.a. discrète. E = {0,1} est le plus simple possible. Les événements<br />

possibles sont : ∅, {0}, {1}, {0,1} ...et pour connaître leurs probabilités il suffit <strong>de</strong> connaître<br />

les probabilités associées à {0} et à {1}. On notera : p = P(X1 = 1) et 1−p = q = P(X1 = 0).<br />

11


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Définition 2.2 La “collection” <strong>de</strong>s probabilités associées aux événements unitaires est dite loi<br />

<strong>de</strong> probabilité <strong>de</strong> la variable aléatoire X.<br />

La définition précé<strong>de</strong>nte est valable dans le cas discret, nous verrons ensuite ce qu’elle <strong>de</strong>vient<br />

dans le cas continu, c’est à dire dans le cas où la v.a. est à valeurs dans un ensemble non<br />

dénombrable.<br />

Exemple (suite) Imaginons que dans la population <strong>de</strong>s donneurs 30% <strong>de</strong>s individus soient<br />

compatibles. Alors, nous en déduisons que P(X = 1) = 0,3 et P(X = 0) = 0,7. La loi <strong>de</strong><br />

probabilité <strong>de</strong> X1 est donc : (p = 0,3;q = 0,7).<br />

Définition 2.3 La loi <strong>de</strong> probabilité d’une v.a. à <strong>de</strong>ux états (en général codés par 0 et par 1)<br />

est dite loi <strong>de</strong> Bernoulli. On note X1 B(p).<br />

2.1.2 La loi géométrique<br />

Exemple (suite) : Imaginons nous à la place du mala<strong>de</strong>. Il peut se <strong>de</strong>man<strong>de</strong>r :<br />

(a) Si le prochain donneur sera compatible ...ou plutôt quelle est la probabilité que le<br />

prochain donneur soit compatible? C’est ce que nous venons <strong>de</strong> voir au paragraphe<br />

précé<strong>de</strong>nt.<br />

(b) Qu’elle est la probabilité qu’il lui faille attendre 2 (ou 3, 4, ...k) donneurs avant d’être<br />

greffé? ...autrement dit il s’interesse à la v.a. “nombre <strong>de</strong> donneurs avant la greffe”.<br />

Dans la cas (b), définissons la v.a.Y associée. Un individu est ici un mala<strong>de</strong>, donc Ω ′<br />

=ensemble<br />

<strong>de</strong>s mala<strong>de</strong>s. Combien y-a-t-il <strong>de</strong> valeurs possibles ? k = 1,2,3, · · · + ∞ = N ⋆ = E. Nous<br />

pouvons donc définir :<br />

X : Ω ′<br />

ω ′<br />

−→ N⋆ ↦−→ X(ω ′<br />

) = Nombre <strong>de</strong> donneurs nécessaires pour la greffe<br />

Calculons maintenant les probabilités associées aux événements unitaires :<br />

P(Y = 1) = P(X1 = 1) = p = 0,300<br />

P(Y = 2) = P(X1 = 0 ∩ X2 = 1)<br />

= P(X1 = 0) × P(X2 = 1) si on suppose les v.a. Xi indépendantes.<br />

= (1 − p) × p = 0,3 × 0,7 = 0,210.<br />

P(Y = 3) = P(X1 = 0 ∩ X2 = 0 ∩ X3 = 1)<br />

= P(X1 = 0) × P(X2 = 0) × P(X1 = 1)si on suppose les v.a. Xi indépendantes.<br />

= (1 − p) 2 × p = 0,7 2 × 0,3 = 0,147.<br />

...et plus généralement P(Y = k) = (1 − p) k−1 × p<br />

Définition 2.4 Une v.a. Y à valeurs dans N ⋆ suit une loi géométrique <strong>de</strong> paramètre p (0 ≤<br />

p ≤ 1) si et seulement si : P(Y = k) = (1 − p) k−1 × p<br />

La loi géométrique est la loi du nombre d’essai(s) nécessaire(s) pour faire apparaître un événement<br />

<strong>de</strong> probabilité p.<br />

12


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

(c) Autre question : quelle est la probabilité <strong>de</strong> n’avoir toujours pas été greffé au bout <strong>de</strong> 5<br />

donneurs ?<br />

Répondre à cette question, c’est calculer la valeur <strong>de</strong> :<br />

P(Y > 5) = 1 − P(Y ≤ 5)<br />

<br />

<br />

= 1 − P(Y = 1) + P(Y = 2) + P(Y = 3) + P(Y = 4) + P(Y = 5)<br />

<br />

= 1 − p + (1 − p) × p + (1 − p) 2 × p + (1 − p) 3 × p + (1 − p) 4 <br />

× p<br />

<br />

<br />

= 1 − 0,300 + 0,210 + 0,147 + 0,103 + 0,072<br />

= 1 − 0,832<br />

= 0,168<br />

2.1.3 Moyenne théorique ou espérance d’une variable aléatoire discrète<br />

(d) Nouvelle question que peut se poser le mala<strong>de</strong> : si on considère l’ensemble <strong>de</strong>s mala<strong>de</strong>s<br />

(qui constituent Ω ′<br />

), quel est le nombre moyen µ(Y ) <strong>de</strong> donneurs nécessaires pour être<br />

greffé?<br />

Définition 2.5 Nous appelons moyenne théorique ou espérance d’une v.a. discrète le nombre<br />

-s’il existe et a un sens- :<br />

µ(Y ) = <br />

j<br />

pj × cj<br />

où les cj sont les valeurs possibles. dans notre exemple cj = 1,2,3,... , et les pj sont les<br />

probabilités qui leur sont associées.<br />

Dans le cadre <strong>de</strong> notre exemple, où Y suit une loi géométrique nous obtenons :<br />

Or<br />

µ(Y ) =<br />

+∞<br />

k=0<br />

=<br />

=<br />

=<br />

=<br />

+∞<br />

i=1<br />

+∞<br />

k=0<br />

+∞<br />

k=0<br />

+∞<br />

k=0<br />

+∞<br />

q k 1<br />

1 − q ⇒<br />

k=0<br />

+∞<br />

j × p × (1 − p) j−1<br />

(k + 1) × p × (1 − p) k<br />

(k + 1) × (1 − q) × (q) k<br />

(k + 1)q k −<br />

kq k +<br />

k=0<br />

+∞<br />

(k + 1)q k+1<br />

k=0<br />

+∞<br />

q k + q 2<br />

+∞<br />

k=0<br />

kq k−1 =<br />

k=0<br />

1<br />

(1 − q) 2<br />

D’où µ(Y ) = (q − q2 1 1<br />

) +<br />

(1 − q) 2 1 − q<br />

en posant k = j − 1<br />

car q = 1 − p<br />

kq k−1 − q<br />

+∞<br />

k=0<br />

q k<br />

1<br />

1<br />

× (1 − q) = × (q + 1 − q) =<br />

1 − q 1 − q<br />

13<br />

= 1<br />

p .


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Propriété 2.1 Si Y suit une loi géométrique <strong>de</strong> paramètre p, alors µ(Y ) = 1<br />

p<br />

Exemple : Nous avons p = 0,3 ⇒ µ(Y ) = 1<br />

3,33. Donc en moyenne la greffe peut être<br />

0,3<br />

effectuée au bout <strong>de</strong> trois donneurs.<br />

La moyenne théorique ou espérance µ(Y ) est un paramètre qui donne la valeur centrale <strong>de</strong><br />

la distribution. µ est une constante connue si et seulement si on connait les pj . Si on ne<br />

connait pas les pj (dans notre exemple, si on ne connait pas la probabilité p <strong>de</strong> compatibilité<br />

d’un donneur), alors µ existe mais est inconnue ...on peut alors chercher à en obtenir une<br />

estimation ou à faire un test quant à sa valeur possible.<br />

Propriété 2.2 1) Soient X et Y définies sur la même population Ω,<br />

alors µ(X + Y ) = µ(X) + µ(Y )<br />

2) Soit a une constante. Alors µ(aX) = a × µ(X)<br />

2.1.4 Variance théorique ou espérance d’une variable aléatoire discrète<br />

(e) Autre (encore!) question : en moyenne la greffe sera possible au bout <strong>de</strong> µ(Y ) = 3,33<br />

donneurs. Mais pour un mala<strong>de</strong> donné, le nombre <strong>de</strong> donneurs nécessaires pour le greffe<br />

ne sera pas (et forcément!) égal à 3,33 et va fluctuer <strong>de</strong> part et d’autre <strong>de</strong> cette valeur.<br />

Nous allons quantifier cette fluctuation à l’ai<strong>de</strong> d’un indice qui s’appelle la variance.<br />

Définition 2.6 Nous appelons variance théorique d’une v.a. discrète Y , le nombre -lorsqu’il<br />

existe et a un sens- défini par :<br />

σ 2 (Y ) = µ(Y − µ(Y )) 2 = <br />

pj × (cj − µ(Y )) 2 .<br />

Propriété 2.3 Si Y suit une loi géométrique <strong>de</strong> paramètre p, alors σ 2 (Y ) = q<br />

p 2.<br />

Exemple : p = 0,3, q = 0,7 ⇒ σ2 (Y ) = 0,7<br />

= 7,77 ⇐⇒ σ(Y ) = 2,78.<br />

0,32 Exercice : Soit la v.a X1 définie au début du paragraphe, qui suit une loi <strong>de</strong> Bernoulli B(p).<br />

Montrer que µ(X1) = p et σ2 (X1) = pq.<br />

Il existe <strong>de</strong>ux autres lois <strong>de</strong> probabilités discrètes usuelles que vous avez vu en L2. Il s’agit <strong>de</strong><br />

la loi binomiale et <strong>de</strong> la loi <strong>de</strong> Poisson.<br />

2.2 La loi exponentielle<br />

(f) Le mala<strong>de</strong> se pose maintenant la question suivante : “Combien <strong>de</strong> temps vais-je attendre<br />

avant d’être greffé?” ou encore “Quelle est la probabilité que j’atten<strong>de</strong> plus qu’un temps<br />

T avant d’être greffé?”<br />

14<br />

j


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Fonction <strong>de</strong> <strong>de</strong>nsite<br />

0.0 0.01 0.02 0.03 0.04<br />

a b<br />

Fig. 2.1 – Densité <strong>de</strong> probabilité d’une variable aléatoire continue.<br />

2.2.1 Loi <strong>de</strong> probabilité d’une v.a. continue<br />

Définissons la variable aléatoire associée à notre question. C’est celle qui à chaque mala<strong>de</strong> va<br />

associer le temps d’attente avant la greffe :<br />

Z : Ω ′<br />

ω ′<br />

−→ R +<br />

↦−→ Z(ω ′<br />

) = Temps nécessaire pour la greffe<br />

Cette v.a. est à valeurs dans un ensemble indénombrable, on parle <strong>de</strong> v.a. continue.<br />

Définition 2.7 On appelle événement d’une v.a. continue tout intervalle, ou réunion d’intervalles.<br />

En conséquence, la loi <strong>de</strong> probabilité d’une v.a. continue est connue dès que l’on connait, pour<br />

tout intervalle [a, ,b] la probabilité pour que Z soit comprise entre a et b. : P(a < Z ≤ b) =<br />

PZ(]a,b]).<br />

Définition 2.8 Soit Z une v.a. à valeurs dans R. S’il existe une fonction fZ continue positive<br />

telle que : P(a < Z ≤ b) =<br />

b<br />

a<br />

fZ(t)dt, alors fZ est dite <strong>de</strong>nsité <strong>de</strong> probabilité <strong>de</strong> Z.<br />

En conséquence, pour une v.a. continue, la probabilité d’un intervalle se présente comme une<br />

aire sous la courbe <strong>de</strong> fZ, pour l’intervalle correspondant. L’aire totale est égale à 1. fZ est<br />

l’analogue <strong>de</strong>s (pj)j qui ont été définis dans le cas discret;<br />

Nous allons maintenant présenter une <strong>de</strong> ces fonctions <strong>de</strong> <strong>de</strong>nsité, qui sous certaines suppositions<br />

que nous énoncerons, permet <strong>de</strong> répondre à la question posée.<br />

2.2.2 La loi exponentielle<br />

C’est l’analogue, en version continue, <strong>de</strong> la loi géométrique que nous avons vue préce<strong>de</strong>mment.<br />

Notons A l’événement “un donneur compatible est trouvé”, et faisons les suppositions<br />

suivantes :<br />

(S1) La probabilité que A se produise dans un intervalle <strong>de</strong> temps ]t, t + ∆t] ne dépend que<br />

<strong>de</strong> ∆t : on dit que le processus est homogène et sans mémoire.<br />

15


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Z<br />

A1 A2 AN AN+1<br />

0 1 2<br />

k-1 k<br />

t1 t2 tN tN+1<br />

X1<br />

(S2) Soit P(∆t) cette probabilité. On suppose que P(∆t) λ × ∆t quand ∆t tend vers 0, où<br />

λ > 0 : A est un événement rare.<br />

(S3) Si t1, t2, t3, t4 sont quatre instants successifs, alors les événements “A se produit entre<br />

t1 et t2” et “A se produit entre t3 et t4” sont indépendants.<br />

Modélisation du temps d’attente (cas discret)<br />

On déci<strong>de</strong> <strong>de</strong> faire une observation par heure, pour voir si A s’est produit. Notons 1,2,3,... ,k−<br />

1,k,... les instants d’observation séparés par un intervalle <strong>de</strong> temps ∆t = 1h.<br />

Soit [0, T] l’intervalle d’étu<strong>de</strong> du phénomène pendant lequel on a observé un nombre (aléatoire)<br />

N <strong>de</strong> manifestations <strong>de</strong> A. On note t1,... ,tN,... les instants où A se produit et Xk = tk−tk−1<br />

les variables d’attente successives.<br />

Soit Ak=“l’événement se produit pendant la k ième heure”, et Āk l’événement contraire. Les<br />

événements Ak et Āl (k = l) sont indépendants (d’après (S3)). Pour tout k, la probabilité<br />

que A se produise pendant la k ième heure ne dépend pas <strong>de</strong> k (d’après (S1)). Posons donc<br />

P(Ak) = P(∆t) = λ. Nous avons donc P( Āk) = 1 − λ.<br />

Soit Z ′<br />

le temps d’attente discrétisé <strong>de</strong> A : Z ′<br />

est une v.a. discrète exprimant le temps d’attente<br />

en nombre d’heures. Alors Z ′<br />

suit une loi géométrique <strong>de</strong> paramètre p :<br />

X2<br />

P(Z ′<br />

= k) = λ × (1 − λ) k−1<br />

Du discret au continu : <strong>de</strong> la loi géométrique à la loi exponentielle<br />

Si on considère <strong>de</strong>s intervalles <strong>de</strong> temps plus courts ...par exemple multiples <strong>de</strong> 1<br />

heure (par<br />

n<br />

exemple toutes les minutes,...), la probabilité que A se produise durant un intervalle donné<br />

16<br />

T


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

<strong>de</strong> durée ∆t = 1<br />

n<br />

0<br />

1/n<br />

2/n<br />

t<br />

3/n<br />

4/n<br />

1<br />

est P(1 ) =<br />

n n × λ (car d’après (S2), P(∆t) λ × ∆t).<br />

Soit Z la c.a. continue du temps d’attente <strong>de</strong> l’événement A. Soit Yn le nombre <strong>de</strong> frac-<br />

tions <strong>de</strong> ∆t = 1<br />

n<br />

minutes à attendre avant que l’événement A se produise. D’après le para-<br />

graphe précé<strong>de</strong>nt, Yn suit une loi géométrique <strong>de</strong> paramètre p = P( 1<br />

n<br />

P(Yn = kn) = λ λ<br />

× (1 −<br />

n n )kn−1 ).<br />

λ<br />

) = . Nous avons donc<br />

n<br />

Supposons que l’événement A se produit en l’instant t compris entre (kn−1)×∆t = (kn−1)× 1<br />

n<br />

et kn × ∆t = kn × 1<br />

n .<br />

Remarquons que kn<br />

n → t quand n → +∞. Si Yn = kn, alors nous avons kn − 1<br />

n<br />

Or, P(Yn = k) P( kn − 1<br />

n<br />

kn<br />

n ≤ τn < kn − 1<br />

n .<br />

< Z ≤ kn kn<br />

) = P(Z ≤<br />

n<br />

D’après le théorème <strong>de</strong>s accroissements finis, nous avons donc :<br />

P(Y = kn) 1<br />

n f(τn)<br />

n ) − P(Z ≤ kn − 1<br />

n<br />

kn<br />

< Z ≤<br />

n .<br />

1<br />

) <br />

n f(τn) avec<br />

⇐⇒ λ λ<br />

× (1 −<br />

n n )kn−1 ) = 1<br />

n f(τn)<br />

⇐⇒ λ × (1 − λ<br />

n )kn−1 ) = f(τn)<br />

En prenant la limite lorsque n tend vers +∞ <strong>de</strong>s <strong>de</strong>ux membres <strong>de</strong> l’égalité, nous obtenons :<br />

17


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

lim<br />

n→+∞ f(τn) = f(t)<br />

Or<br />

λ<br />

lim λ × (1 −<br />

n→+∞ n )kn−1 =<br />

λ kn−1<br />

lim λ × (1 − )n× n<br />

n→+∞ n<br />

kn−1 λ<br />

×ln(1−<br />

en× n n )<br />

= λ × lim<br />

n→+∞<br />

kn−1<br />

= λ × lim e n<br />

n→+∞ ×−λ<br />

car ln(1 − λ<br />

n<br />

) −λ , sin >> λ<br />

n<br />

= λ × e−λ×t kn − 1<br />

car lim = t<br />

n→+∞ n<br />

Nous avons donc f(t) = λ × e −λ×t . Cette <strong>de</strong>nsité est dite <strong>de</strong>nsité <strong>de</strong> la loi exponentielle.<br />

Définition 2.9 Une variable aléatoire réelle positive Z suit une loi exponentielle <strong>de</strong> paramètre<br />

λ, notée exp(λ) ssi elle admet comme <strong>de</strong>nsité <strong>de</strong> probabilité : f(t) = λ × e −λ×t .<br />

2.2.3 Moyenne théorique ou espérance d’une v.a. continue<br />

Définition 2.10 Définition 2.11 On appelle moyenne théorique ou espérance, notée µ(X)<br />

d’une variable aléatoire continue X, le nombre lorsqu’il existe :<br />

µ = µ(X) =<br />

+∞<br />

−∞<br />

t × fX(t)dt.<br />

Remarque : C’est l’analogue du cas discret µ(X) = <br />

ci × pi.<br />

Propriété 2.4 Soit Z suivant une loi exponentielle exp(λ). Alors µ(Z) = 1<br />

λ<br />

2.2.4 Variance théorique d’une v.a. continue<br />

Définition 2.12 On appelle variance théorique σ2 d’une variable aléatoire continue X, le<br />

nombre lorsqu’il existe :<br />

σ 2 = σ 2 +∞<br />

(X) =<br />

−∞<br />

i≥0<br />

(t − µ(X)) 2 × fX(t)dt<br />

Remarque : C’est l’analogue du cas discret σ2 (X) = <br />

(ci − µ(X)) 2 × pi.<br />

Propriété 2.5 Soit Z suivant une loi exponentielle exp(λ). Alors var(Z) = 1<br />

λ 2.<br />

Il existe d’autres lois <strong>de</strong> probabilités continues que vous avez vu en L2. : loi normale ou <strong>de</strong><br />

Laplace-Gauss, loi Uniforme, <strong>de</strong> Stu<strong>de</strong>nt, du χ 2 ... Nous rappelons dans le paragraphe suivant<br />

la loi normale.<br />

18<br />

i≥0


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

2.3 Loi <strong>de</strong> Laplace-Gauss ou loi normale [Rappel <strong>de</strong> L2]<br />

2.3.1 Définition<br />

Pour les variables aléatoires continues, c’est la loi la plus utilisée en statistique.<br />

Définition 2.13 Une variable aléatoire continue X suit une loi normale <strong>de</strong> paramètres µ et<br />

σ 2 ≥ 0 si elle admet comme <strong>de</strong>nsité <strong>de</strong> probabilité :<br />

On note X ↩→ N(µ,σ 2 ).<br />

fX(t) = 1<br />

σ √ 2π e−1<br />

<br />

t − µ<br />

2 σ<br />

Remarque : La notation N(µ,σ) existe également. Aussi, pour enlever toute ambiguïté, on<br />

précisera laquelle <strong>de</strong>s <strong>de</strong>ux notations est employée. Par exemple, X ↩→ N(µ,σ 2 = 9). ou<br />

X ↩→ N(µ,σ = 3).<br />

Fonction <strong>de</strong> <strong>de</strong>nsite<br />

0.0 0.02 0.04 0.06 0.08 0.10 0.12<br />

2<br />

-9 -6 -3 0 3 6 9 12 15<br />

Fig. 2.2 – Densité <strong>de</strong> probabilité pour une loi N(µ = 3,σ 2 = 9).<br />

Propriété 2.6 Si X ↩→ N(µ,σ 2 ), alors : µ(X) = µ et σ 2 (X) = σ 2 .<br />

Propriété 2.7 Si X ↩→ N(µ,σ 2 ), alors Y = aX + b suit une loi normale<br />

<strong>de</strong> moyenne µ(Y ) = µ(aX + b) = aµ(X) + b;<br />

et <strong>de</strong> variance σ 2 (Y ) = σ 2 (aX + b) = a 2 σ 2 (X).<br />

Propriété 2.8 Si X1 ↩→ N(µ1,σ 2 1 ) et X2 ↩→ N(µ2,σ 2 2 ) sont indépendantes, alors Y =<br />

X1 + X2 suit une loi normale :<br />

• <strong>de</strong> moyenne µ(Y ) = µ(X1 + X2) = µ(X1) + µ(X2);<br />

• et <strong>de</strong> variance σ 2 (Y ) = σ 2 (X1 + X2) = σ 2 (X1) + σ 2 (X2).<br />

Remarques :<br />

19


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

1. fX(x)est est une fonction symétrique par rapport à la moyenne µ et admet <strong>de</strong>ux points<br />

d’inflexion d’abcisse µ − σ et µ + σ.<br />

2. La loi normale dépend <strong>de</strong> <strong>de</strong>ux paramètres µ et σ 2 . Il existe donc une infinité <strong>de</strong> lois<br />

normales :<br />

Fonction <strong>de</strong> <strong>de</strong>nsite<br />

0.0 0.1 0.2 0.3 0.4 0.5<br />

N(-5;0.7)<br />

N(0;1)<br />

N(3;3)<br />

-10 -5 0 5 10 15<br />

Fig. 2.3 – Fonction <strong>de</strong> <strong>de</strong>nsité pour trois lois normales.<br />

Cependant, à partir d’une loi normale quelconque, X ↩→ N(µ,σ 2 ), on peut se ramener<br />

X − µ<br />

à Z ↩→ N(0,1). En effet Z = suit alors d’après la propriété (2.8) une loi normale<br />

σ<br />

<strong>de</strong> moyenne µ(Z) = µ µ<br />

var(X) σ2<br />

− = 0 et <strong>de</strong> variance var(Z) = = = 1.<br />

σ σ σ2 σ2 3. Le calcul <strong>de</strong>s probabilités associées à la loi normale n’est pratiquement pas possible avec<br />

<strong>de</strong>s moyens simples. En effet, la primitive <strong>de</strong> :<br />

1<br />

σ √ 2π e−1<br />

<br />

t − µ(X)<br />

2 σ<br />

n’existe pas. On se sert alors <strong>de</strong> tables construite pour la loi N(0,1).<br />

4. Lorsque l’on doit calculer une probabilité relative à une loi normale quelconque N(µ,σ 2 )<br />

on utilise le changement <strong>de</strong> variable indiqué en 2 :<br />

<br />

a − µ<br />

PX([a,b]) = P(a < X < b) = P<br />

σ<br />

< X − µ<br />

σ<br />

2<br />

< b − µ<br />

<br />

σ<br />

<br />

a − µ<br />

= P<br />

σ<br />

< Z <<br />

b − µ<br />

<br />

. Ainsi la table <strong>de</strong> la loi normale N(0,1) suffit à calculer les probabilités relatives<br />

σ<br />

à n’importe quelle loi normale.<br />

5. Vocabulaire : La loi N(0,1) est dite loi normale standard ou encore loi normale centrée<br />

réduite.<br />

6. Importance <strong>de</strong> la loi normale<br />

• La loi normale est certainement la loi <strong>de</strong> probabilité la plus utilisée. Comme on le<br />

verra par la suite, elle intervient souvent comme loi limite vers laquelle convergent<br />

20


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

certains modèles : par exemple la moyenne <strong>de</strong> n mesures indépendantes et <strong>de</strong> même<br />

loi a une distribution qui se rapproche <strong>de</strong> plus en plus d’une distribution normale<br />

lorsque n augmente.<br />

• Introduite comme “Loi normale <strong>de</strong>s erreurs”, d’où son nom, la loi normale semble<br />

décrire assez bien la distribution <strong>de</strong> certains caractères biométriques, par exemple la<br />

taille d’un individu choisi au hasard dans une population donnée.<br />

• Elle est à l’origine du développement <strong>de</strong> modèles probabilistes : les modèles gaussiens<br />

(Loi du Chi-Deux, loi <strong>de</strong> Stu<strong>de</strong>nt, loi <strong>de</strong> Fisher-Sne<strong>de</strong>cor).<br />

• Enfin, elle peut être utilisée comme approximation <strong>de</strong>s lois discrètes binomiale et <strong>de</strong><br />

Poisson.<br />

21


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

2.3.2 Table <strong>de</strong> la loi N(0,1)<br />

Si Z sui la loi normale N(0,1), la table donne la valeur <strong>de</strong> P(Z < x). Cette valeur s’obtient<br />

par addition <strong>de</strong>s nombres inscrits en marge.<br />

-3 -2 -1 0 1 2 3<br />

0.50<br />

0.51<br />

0.52<br />

0.53<br />

0.54<br />

0.55<br />

0.56<br />

0.57<br />

0.58<br />

0.59<br />

0.60<br />

0.61<br />

0.62<br />

0.63<br />

0.64<br />

0.65<br />

0.66<br />

0.67<br />

0.68<br />

0.69<br />

0.70<br />

0.71<br />

0.72<br />

0.73<br />

0.74<br />

0.75<br />

0.76<br />

0.77<br />

0.78<br />

0.79<br />

0.80<br />

0.81<br />

0.82<br />

0.83<br />

0.84<br />

0.85<br />

0.86<br />

0.87<br />

0.88<br />

0.89<br />

0.90<br />

0.91<br />

0.92<br />

0.93<br />

0.94<br />

0.95<br />

0.96<br />

0.97<br />

0.98<br />

0.99<br />

0.000<br />

0.0000<br />

0.0251<br />

0.0502<br />

0.0753<br />

0.1004<br />

0.1257<br />

0.1510<br />

0.1764<br />

0.2019<br />

0.2275<br />

0.2533<br />

0.2793<br />

0.3055<br />

0.3319<br />

0.3585<br />

0.3853<br />

0.4125<br />

0.4399<br />

0.4677<br />

0.4959<br />

0.5244<br />

0.5534<br />

0.5828<br />

0.6128<br />

0.6433<br />

0.6745<br />

0.7063<br />

0.7388<br />

0.7722<br />

0.8064<br />

0.8416<br />

0.8779<br />

0.9154<br />

0.9542<br />

0.9945<br />

1.0364<br />

1.0803<br />

1.1264<br />

1.1750<br />

1.2265<br />

1.2816<br />

1.3408<br />

1.4051<br />

1.4758<br />

1.5548<br />

1.6449<br />

1.7507<br />

1.8808<br />

2.0537<br />

2.3263<br />

0.001<br />

0.0025<br />

0.0276<br />

0.0527<br />

0.0778<br />

0.1030<br />

0.1282<br />

0.1535<br />

0.1789<br />

0.2045<br />

0.2301<br />

0.2559<br />

0.2819<br />

0.3081<br />

0.3345<br />

0.3611<br />

0.3880<br />

0.4152<br />

0.4427<br />

0.4705<br />

0.4987<br />

0.5273<br />

0.5563<br />

0.5858<br />

0.6158<br />

0.6464<br />

0.6776<br />

0.7095<br />

0.7421<br />

0.7756<br />

0.8099<br />

0.8452<br />

0.8816<br />

0.9192<br />

0.9581<br />

0.9986<br />

1.0407<br />

1.0848<br />

1.1311<br />

1.1800<br />

1.2319<br />

1.2873<br />

1.3469<br />

1.4118<br />

1.4833<br />

1.5632<br />

1.6546<br />

1.7624<br />

1.8957<br />

2.0749<br />

2.3656<br />

0.002<br />

0.0050<br />

0.0301<br />

0.0552<br />

0.0803<br />

0.1055<br />

0.1307<br />

0.1560<br />

0.1815<br />

0.2070<br />

0.2327<br />

0.2585<br />

0.2845<br />

0.3107<br />

0.3372<br />

0.3638<br />

0.3907<br />

0.4179<br />

0.4454<br />

0.4733<br />

0.5015<br />

0.5302<br />

0.5592<br />

0.5888<br />

0.6189<br />

0.6495<br />

0.6808<br />

0.7128<br />

0.7454<br />

0.7790<br />

0.8134<br />

0.8488<br />

0.8853<br />

0.9230<br />

0.9621<br />

1.0027<br />

1.0450<br />

1.0893<br />

1.1359<br />

1.1850<br />

1.2372<br />

1.2930<br />

1.3532<br />

1.4187<br />

1.4909<br />

1.5718<br />

1.6646<br />

1.7744<br />

1.9110<br />

2.0969<br />

2.4089<br />

0.003<br />

0.0075<br />

0.0326<br />

0.0577<br />

0.0828<br />

0.1080<br />

0.1332<br />

0.1586<br />

0.1840<br />

0.2096<br />

0.2353<br />

0.2611<br />

0.2871<br />

0.3134<br />

0.3398<br />

0.3665<br />

0.3934<br />

0.4207<br />

0.4482<br />

0.4761<br />

0.5044<br />

0.5330<br />

0.5622<br />

0.5918<br />

0.6219<br />

0.6526<br />

0.6840<br />

0.7160<br />

0.7488<br />

0.7824<br />

0.8169<br />

0.8524<br />

0.8890<br />

0.9269<br />

0.9661<br />

1.0069<br />

1.0494<br />

1.0939<br />

1.1407<br />

1.1901<br />

1.2426<br />

1.2988<br />

1.3595<br />

1.4255<br />

1.4985<br />

1.5805<br />

1.6747<br />

1.7866<br />

1.9268<br />

2.1201<br />

2.4573<br />

0.004<br />

0.0100<br />

0.0351<br />

0.0602<br />

0.0853<br />

0.1105<br />

0.1358<br />

0.1611<br />

0.1866<br />

0.2121<br />

0.2378<br />

0.2637<br />

0.2898<br />

0.3160<br />

0.3425<br />

0.3692<br />

0.3961<br />

0.4234<br />

0.4510<br />

0.4789<br />

0.5072<br />

0.5359<br />

0.5651<br />

0.5948<br />

0.6250<br />

0.6557<br />

0.6871<br />

0.7192<br />

0.7521<br />

0.7858<br />

0.8204<br />

0.8560<br />

0.8927<br />

0.9307<br />

0.9701<br />

1.0110<br />

1.0537<br />

1.0985<br />

1.1455<br />

1.1952<br />

1.2481<br />

1.3047<br />

1.3658<br />

1.4325<br />

1.5063<br />

1.5893<br />

1.6849<br />

1.7991<br />

1.9431<br />

2.1444<br />

2.5121<br />

0.005<br />

0.0125<br />

0.0376<br />

0.0627<br />

0.0878<br />

0.1130<br />

0.1383<br />

0.1637<br />

0.1891<br />

0.2147<br />

0.2404<br />

0.2663<br />

0.2924<br />

0.3186<br />

0.3451<br />

0.3719<br />

0.3989<br />

0.4261<br />

0.4538<br />

0.4817<br />

0.5101<br />

0.5388<br />

0.5681<br />

0.5978<br />

0.6280<br />

0.6588<br />

0.6903<br />

0.7225<br />

0.7554<br />

0.7892<br />

0.8239<br />

0.8596<br />

0.8965<br />

0.9346<br />

0.9741<br />

1.0152<br />

1.0581<br />

1.1031<br />

1.1503<br />

1.2004<br />

1.2536<br />

1.3106<br />

1.3722<br />

1.4395<br />

1.5141<br />

1.5982<br />

1.6954<br />

1.8119<br />

1.9600<br />

2.1701<br />

2.5758<br />

0.006<br />

0.0150<br />

0.0401<br />

0.0652<br />

0.0904<br />

0.1156<br />

0.1408<br />

0.1662<br />

0.1917<br />

0.2173<br />

0.2430<br />

0.2689<br />

0.2950<br />

0.3213<br />

0.3478<br />

0.3745<br />

0.4016<br />

0.4289<br />

0.4565<br />

0.4845<br />

0.5129<br />

0.5417<br />

0.5710<br />

0.6008<br />

0.6311<br />

0.6620<br />

0.6935<br />

0.7257<br />

0.7588<br />

0.7926<br />

0.8274<br />

0.8633<br />

0.9002<br />

0.9385<br />

0.9782<br />

1.0194<br />

1.0625<br />

1.1077<br />

1.1552<br />

1.2055<br />

1.2591<br />

1.3165<br />

1.3787<br />

1.4466<br />

1.5220<br />

1.6072<br />

1.7060<br />

1.8250<br />

1.9774<br />

2.1973<br />

2.6521<br />

0.007<br />

0.0175<br />

0.0426<br />

0.0677<br />

0.0929<br />

0.1181<br />

0.1434<br />

0.1687<br />

0.1942<br />

0.2198<br />

0.2456<br />

0.2715<br />

0.2976<br />

0.3239<br />

0.3505<br />

0.3772<br />

0.4043<br />

0.4316<br />

0.4593<br />

0.4874<br />

0.5158<br />

0.5446<br />

0.5740<br />

0.6038<br />

0.6341<br />

0.6651<br />

0.6967<br />

0.7290<br />

0.7621<br />

0.7961<br />

0.8310<br />

0.8669<br />

0.9040<br />

0.9424<br />

0.9822<br />

1.0237<br />

1.0669<br />

1.1123<br />

1.1601<br />

1.2107<br />

1.2646<br />

1.3225<br />

1.3852<br />

1.4538<br />

1.5301<br />

1.6164<br />

1.7169<br />

1.8384<br />

1.9954<br />

2.2262<br />

2.7478<br />

0.008<br />

0.0201<br />

0.0451<br />

0.0702<br />

0.0954<br />

0.1206<br />

0.1459<br />

0.1713<br />

0.1968<br />

0.2224<br />

0.2482<br />

0.2741<br />

0.3002<br />

0.3266<br />

0.3531<br />

0.3799<br />

0.4070<br />

0.4344<br />

0.4621<br />

0.4902<br />

0.5187<br />

0.5476<br />

0.5769<br />

0.6068<br />

0.6372<br />

0.6682<br />

0.6999<br />

0.7323<br />

0.7655<br />

0.7995<br />

0.8345<br />

0.8705<br />

0.9078<br />

0.9463<br />

0.9863<br />

1.0279<br />

1.0714<br />

1.1170<br />

1.1650<br />

1.2160<br />

1.2702<br />

1.3285<br />

1.3917<br />

1.4611<br />

1.5382<br />

1.6258<br />

1.7279<br />

1.8522<br />

2.0141<br />

2.2571<br />

2.8782<br />

0.009<br />

0.0226<br />

0.0476<br />

0.0728<br />

0.0979<br />

0.1231<br />

0.1484<br />

0.1738<br />

0.1993<br />

0.2250<br />

0.2508<br />

0.2767<br />

0.3029<br />

0.3292<br />

0.3558<br />

0.3826<br />

0.4097<br />

0.4372<br />

0.4649<br />

0.4930<br />

0.5215<br />

0.5505<br />

0.5799<br />

0.6098<br />

0.6403<br />

0.6713<br />

0.7031<br />

0.7356<br />

0.7688<br />

0.8030<br />

0.8381<br />

0.8742<br />

0.9116<br />

0.9502<br />

0.9904<br />

1.0322<br />

1.0758<br />

1.1217<br />

1.1700<br />

1.2212<br />

1.2759<br />

1.3346<br />

1.3984<br />

1.4684<br />

1.5464<br />

1.6352<br />

1.7392<br />

1.8663<br />

2.0335<br />

2.2904<br />

3.0902<br />

22


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

2.4 Exercices<br />

Exercice 2.1 L’instituteur <strong>de</strong> Paul donne chaque semaine une récitation à apprendre à ses<br />

25 élèves. Chaque jour <strong>de</strong> la semaine il interroge un élève au hasard.<br />

1. Soit la variable aléatoire X=“être interrogé un jour donné”. Quelle est sa distribution ?<br />

2. Sur les 38 semaines <strong>de</strong> l’année scolaire, quelle est la distribution <strong>de</strong> la variable aléatoire<br />

“nombre <strong>de</strong> jours où Paul sera interrogé” ?<br />

3. Paul s’interroge maintenant sur le nombre moyen <strong>de</strong> séances qu’il passera avant d’être<br />

interrogé.<br />

(a) Quelle est la probabilité qu’il soit interrogé dès la première séance? Que 5 séances<br />

se passent avant que Paul ne soit interrogé?<br />

(b) Définir la variable aléatoire “nombre <strong>de</strong> séances jusqu’à l’interrogation”. Quelle est<br />

sa distribution <strong>de</strong> probabilité? (on considèrera le nombre <strong>de</strong> jours d’interrogations<br />

comme suffisamment grand pour être assimilable à l’infini)<br />

(c) Quel est le nombre moyen <strong>de</strong> séances qui auront lieu avant que Paul ne soit interrogé?<br />

Exercice 2.2 Dans une population, la taille <strong>de</strong>s femmes adultes a une distribution normale<br />

<strong>de</strong> moyenne µ = 1,65 m et <strong>de</strong> variance σ 2 = 0.0025 m 2 .<br />

1. Quelle est la proportion <strong>de</strong> femmes mesurant plus <strong>de</strong> 1,70 m?<br />

2. (a) Quelle est la taille qui n’est dépassée que par 5 % <strong>de</strong>s femmes ?<br />

(b) Quelle est la valeur <strong>de</strong> taille telle que la taille <strong>de</strong> 5% <strong>de</strong>s femmes lui soit inférieure?<br />

(c) En déduire un intervalle où se trouve la taille <strong>de</strong> 90 % <strong>de</strong>s femmes <strong>de</strong> la population?<br />

Y-a-t-il une seule solution?<br />

Exercice 2.3 La taille <strong>de</strong>s tortues est distribuée selon une loi normale N(113cm;12cm) pour<br />

les mâles et selon une loi normale N(136cm; 21cm) pour les femelles.<br />

1. Donner un intervalle <strong>de</strong> taille contenant 95% <strong>de</strong>s individus femelles, puis 90% <strong>de</strong>s individus<br />

femelles ;<br />

2. Donner un intervalle <strong>de</strong> taille contenant 95% <strong>de</strong>s individus mâles, puis 90% <strong>de</strong>s individus<br />

mâles ;<br />

3. Quelle est la probabilité qu’une tortue donnée mesure :<br />

(a) exactement 113 cm;<br />

(b) moins <strong>de</strong> 130 cm;<br />

(c) plus <strong>de</strong> 100 cm;<br />

(d) entre 100 et 130 cm.<br />

23


Chapitre 3<br />

Comparaison <strong>de</strong> <strong>de</strong>ux moyennes<br />

3.1 Position du problème<br />

On considère <strong>de</strong>ux lacs, lac A et lac B peuplés chacun <strong>de</strong> truites. On s’interesse à la variable<br />

poids. Si ΩA (resp. ΩB) désigne la population constituée <strong>de</strong>s poissons du lac A (resp. B). Alors<br />

nous pouvons définir :<br />

et<br />

XA ΩA −→ R +<br />

ω ↦−→ XA(ω) =poids du poisson ω<br />

XB ΩB −→ R +<br />

ω ↦−→ XB(ω) =poids du poisson ω<br />

Nous posons µA = µ(XA) et σ 2 (XA) = σ 2 A et µB = µ(XB) et σ 2 (XB) = σ 2 B .<br />

On souhaite déci<strong>de</strong>r entre les <strong>de</strong>ux hypothèses suivantes :<br />

(H0) µA = µB<br />

(H1) µA = µB<br />

Pour répondre à la question, on va prélever un échantillon <strong>de</strong> nA poissons dans le lac A et <strong>de</strong><br />

nB poissons dans le lac B.<br />

Nous allons maintenant présenter le test statistique <strong>de</strong> (H0) contre (H1) en considérant plusieurs<br />

situations liées à la taille <strong>de</strong>s échantillons que l’on va prélever et à la nature <strong>de</strong>s distributions<br />

<strong>de</strong> XA et XB.<br />

3.2 Les effectifs <strong>de</strong>s échantillons sont suffisamment importants<br />

Dans le cas d’une variable continue (comme l’est la variable poids), on entendra par là nA ≥ 30<br />

et nB ≥ 30.<br />

Exemple : On a collecté 2 échantillons, les résultats obtenus sont les suivants :<br />

24


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Lac A ¯xA = 123g s 2 A (x) = 2530g2 nA = 60<br />

Lac B ¯xB = 132g s 2 A (x) = 2310g2 nB = 73<br />

Pour chacun <strong>de</strong>s <strong>de</strong>ux échantillons, nous pouvons calculer ¯xA(resp.¯xB). Cette valeur est une<br />

réalisation <strong>de</strong> la variable aléatoire :<br />

¯XA ΩA × ΩA ...ΩA −→ R +<br />

ω ′<br />

= (ω1,...,ωn) ↦−→ ¯ XA(ω ′<br />

) = 1<br />

De même ¯xB est une réalisation <strong>de</strong> la v.a. :<br />

¯XB ΩB × ΩB ...ΩB −→ R +<br />

ω ′<br />

= (ω1,...,ωn) ↦−→ ¯ XB(ω ′<br />

) = 1<br />

nA<br />

i=1<br />

nB<br />

nA<br />

Xi(ωi)<br />

nB<br />

Xi(ωi)<br />

3.2.1 Distribution d’une moyenne [Rappel <strong>de</strong> L2]<br />

Propriété 3.1 Soit X1,...Xn, n variables aléatoires indépendantes <strong>de</strong> même distribution et<br />

possédant une moyenne µ et une variance σ2 . Alors la variable aléatoire X = 1<br />

n<br />

Xi suit<br />

n<br />

i=1<br />

asymptotiquement une distribution normale <strong>de</strong> moyenne µ ′ = µ et <strong>de</strong> variance σ ′2 = σ2<br />

n<br />

La démonstration <strong>de</strong> la propriété précé<strong>de</strong>nte est basée sur le théorème central limite :<br />

Théorème 3.1 Soit (Xi)i≥1 une suite <strong>de</strong> variables aléatoires réelles indépendantes <strong>de</strong> même<br />

loi possédant une moyenne µ et une variance σ 2 . Alors quelle que soit la loi <strong>de</strong>s Xi,<br />

(3.1) lim<br />

n→+∞ L<br />

n i=1 Xi − nµ<br />

σ √ n<br />

i=1<br />

<br />

= N(0,1).<br />

L’égalité (3.1) signifie qu’en tout point t <strong>de</strong> l’intervalle <strong>de</strong> variation où F est continue,<br />

lim<br />

n→+∞ Fn(t) = F(t), où on note Fn la fonction <strong>de</strong> répartion <strong>de</strong> la variable aléatoire<br />

et F la fonction <strong>de</strong> répartition <strong>de</strong> la loi N(0,1).<br />

La propriété en découle comme suit : si n est assez “grand”, alors à n fixé :<br />

<br />

L<br />

n i=1 Xi − nµ<br />

σ √ <br />

N(0,1)<br />

n<br />

<br />

X − µ<br />

⇐⇒ L<br />

σ/ √ <br />

N(0,1)<br />

n<br />

⇐⇒ L(X − µ) N(0,σ/ √ n)<br />

⇐⇒ L(X) N(µ,σ/ √ n)<br />

25<br />

n<br />

i=1 Xi − nµ<br />

σ √ n


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

3.2.2 Construction du test<br />

Ainsi, lorsque nA ≥ 30 et nB ≥ 30, et en supposant ¯ XA et ¯ XB indépendantes : D = ¯ XA − ¯ XB<br />

qui suit une distribution N<br />

vons peut avoir <strong>de</strong>ux origines possibles :<br />

<br />

µD = µA − µB,σ 2 D = σ2 A<br />

• Les fluctuations d’échantillonnage? :<br />

• Une réelle différtence entre µA et µB ?<br />

nA<br />

+ σ2 B<br />

nB<br />

<br />

. Ainsi ¯xA − ¯xB que nous obser-<br />

Les <strong>de</strong>ux cas sont possibles! Il est donc impossible <strong>de</strong> répondre avec certitu<strong>de</strong> à la question<br />

posée.<br />

Le but est <strong>de</strong> choisir entre (H0) et (H1), à notre choix étant associé un risque d’erreur (nous<br />

pouvons nous tromper!). On définit ainsi :<br />

α=erreur consistant à déci<strong>de</strong>r (H1) alors que (H0) est vraie = P(H1/H0)<br />

β=erreur consistant à déci<strong>de</strong>r (H0) alors que (H1) est vraie.<br />

Construire un test <strong>de</strong> l’hypothèse nulle (H0) contre l’hypothèse alternative (H1), c’est établir<br />

une règle <strong>de</strong> décision entre (H0) et (H1).<br />

Règle <strong>de</strong> décision du test<br />

On peut présenter son principe en faisant l’analogie avec un procès. H0 (être innocent) est<br />

l’hypothèse que l’on conserve si le résultat n’est pas clair. Tous suspect est présumé innocent,<br />

et c’est à l’accusation d’apporter la preuve <strong>de</strong> sa culpabilité (hypothèse H1). Le jury va prendre<br />

une décision en ayant <strong>de</strong>ux types <strong>de</strong> risque :<br />

• Condamner à tort un innocent (risque α);<br />

• Innocenter à tort un coupable (risque β).<br />

Dans le cas d’un test statistique, nous allons calculer, sous l’hypothèse (H0) la probabilité<br />

ou p-valeur d’observer un écart au moins aussi important que celui observé entre (¯xA − ¯xB<br />

et µD. Nous établissons alors la règle <strong>de</strong> décision du test :<br />

• Si cette valeur est suffisamment faible i.e. inférieure au risque α fixé a priori : on rejette<br />

(H0) au risque α ;<br />

• Si cette p-valeur n’est pas suffisamment faible : i.e. supérieure au risque α fixé a priori :<br />

on ne rejette pas (H0) au risque β.<br />

Exemple : Choisissons α = 0,05. Etant donné que les effectifs <strong>de</strong>s <strong>de</strong>ux échantillons sont<br />

supérieurs à 30, nous avons alors sous (H0) D = ¯ XA − ¯ <br />

XB qui suit une distribution N µD =<br />

0,σ2 D = σ2 A +<br />

nA<br />

σ2 <br />

B N 0,<br />

nB<br />

s2 A +<br />

nA<br />

s2 <br />

B .<br />

nB <br />

73,81<br />

Or, ¯xA − ¯xB=123-132=-9g. Nous en déduisons :<br />

26


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

1/2 p-valeur<br />

p-valeur = P(D < −9 ∩ D > 9<br />

1/2 p-valeur<br />

-20 -10 0 10 20<br />

= P(D < −9) + P(D > 9)<br />

= 2P(D > 9)<br />

= 2 × P( D<br />

√ 73,81 ><br />

= 2 × P(Z > 1.04)<br />

= 2 × (1 − P(Z < 1.04))<br />

= 2 × (1 − 0,85)<br />

9<br />

√ 73,81 )<br />

= 0,3.<br />

Il y a donc 30% <strong>de</strong> chances d’observer sous (H0) une différence au moins aussi importante que<br />

celle observée. Dans notre exemple, la p-valeur est donc supérieure à 0,05. D’après la règle <strong>de</strong><br />

décision <strong>de</strong> notre test, nous en déduisons que l’on ne rejette pas (H0) au risque β <strong>de</strong> se tromper.<br />

Pour notre exemple, la conclusion du test correspond au nfait que l’écart observé (-9 g) ne<br />

peut pas -sauf à prendre un risque α > 0,05 (et il faudrait qu’il soit au moins supérieur à<br />

la p-valeur qui vaut 0,3!)- être attribué à autre chose qu’aux fluctuations d’échantillonnage.<br />

Ceci ne veut pas dire qu’il n’existe pas <strong>de</strong> différence! C’est la raison pour laquelle on dit “on<br />

ne rejette pas (H0)” plutôt que “on accepte (H0)”.<br />

3.2.3 Calcul <strong>de</strong> l’erreur <strong>de</strong> secon<strong>de</strong> espèce β<br />

Rappelons que nous avons défini β comme la probabilité <strong>de</strong> ne pas rejeter (H0) lorsque (H1)<br />

est vraie. Remarquons qu’étant donné que (H1) µD = 0 il y a autant <strong>de</strong> valeurs <strong>de</strong> β que<br />

d’alternatives à (H0). Nous nous proposons <strong>de</strong> calculer sa valeur dans le cas où µD = 15 g : si<br />

la différence entre les moyennes théoriques <strong>de</strong>s <strong>de</strong>ux lacs est <strong>de</strong> 15 g, quelle est la probabilité<br />

β <strong>de</strong> ne pas la découvrir?<br />

27


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Beta<br />

Alpha/2<br />

-40 -20 0 20<br />

Intervalle <strong>de</strong> fluctuation<br />

Alpha/2<br />

Fig. 3.1 – Erreurs <strong>de</strong> première espèce (α) et <strong>de</strong> secon<strong>de</strong> espèce (β) dans le cas d’un test <strong>de</strong><br />

comparaison <strong>de</strong> <strong>de</strong>ux moyennes bilatéral<br />

Zones <strong>de</strong> rejet et <strong>de</strong> non rejet du test<br />

Définition 3.1 On appelle one <strong>de</strong> non-rejet du test, l’ensemble <strong>de</strong>s valeurs u telles que la pvaleur<br />

qui leur est associé ne conduise pas à un rejet <strong>de</strong> l’hypothèse (H0) :<br />

<br />

<br />

<br />

u / p − valeur ><br />

α = u / P(|D| > u) > α) = u / P(−u < D < u) < 1 − α)<br />

Cet ensemble est un intervalle (centré sur 0 dans le cas du test <strong>de</strong> comparaison <strong>de</strong> <strong>de</strong>ux<br />

moyennes) dont les bornes vérifient :<br />

<br />

⇐⇒ P <br />

σ2 A<br />

−a<br />

<<br />

<br />

σ 2 A<br />

D<br />

P(−a < D < a) = 1 − α<br />

a<br />

< <br />

σ2 <br />

= 1 − α<br />

A<br />

+<br />

nA<br />

σ2 B<br />

nB<br />

+<br />

nA<br />

σ2 B<br />

nB<br />

+<br />

nA<br />

σ2 B<br />

nB<br />

⇐⇒ P(−zα/2 < Z < zα/2) = 1 − α<br />

La valeur zα/2 est lue dans la table <strong>de</strong> la loi normale, et vaut 1,96 lorsque α = 0,05. Nous<br />

<br />

<br />

σ<br />

avons donc : [−a, a] = − zα/2 ×<br />

2 <br />

A<br />

σ2 <br />

A . Cet intervalle est dit<br />

nA<br />

+ σ2 B , zα/2 ×<br />

nB<br />

nA<br />

+ σ2 B<br />

nB<br />

intervalle <strong>de</strong> fluctuation (IF) : c’est l’intervalle auquel D = ¯ XA − ¯ XB a une probabilité 1 − α<br />

d’appartenir si (H0) est vraie.<br />

On pourrait (et c’est absolument équivalent à ce que nous avons fait préce<strong>de</strong>mment) définir<br />

la règle <strong>de</strong> décision du test ainsi :<br />

28


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

−→ Si ¯xA − ¯xB appartient à l’intervalle <strong>de</strong> fluctuation, on déci<strong>de</strong> alors <strong>de</strong> ne pas rejeter<br />

(H0) au risque β <strong>de</strong> se tromper.<br />

−→ Si ¯xA − ¯xB n’appartient pas à l’intervalle <strong>de</strong> fluctuation, on déci<strong>de</strong> <strong>de</strong> rejeter (H0)<br />

au risque α <strong>de</strong> se tromper.<br />

Calcul <strong>de</strong> β<br />

Dans notre cas, IF =<br />

β = PH1 (D ∈ IF)<br />

= PH1 (−a < D < a)<br />

<br />

σ2 A<br />

= PH1<br />

= P<br />

<br />

− z α/2 ×<br />

<br />

− z α/2 −<br />

<br />

− 1,96 × √ 73,81, +1,96 × √ <br />

73,81 . Nous en déduisons :<br />

<br />

σ 2 A<br />

nA<br />

nA<br />

15<br />

+ σ2 B<br />

nB<br />

+ σ2 B<br />

nB<br />

< D < z α/2 ×<br />

< Z < +z α/2 −<br />

<br />

= P − zα/2 − 15<br />

√ ,+zα/2 −<br />

73,81 15<br />

√<br />

73,81<br />

= P(−3,7 < Z < 0,21)<br />

= P(Z < 0,21) − P(Z < −3,7)<br />

<br />

0<br />

= 0,58<br />

<br />

<br />

σ 2 A<br />

+<br />

nA<br />

σ2 B<br />

nB<br />

<br />

σ 2 A<br />

nA<br />

15<br />

+ σ2 B<br />

nB<br />

Donc, si (H1) est vraie avec un écart <strong>de</strong> 15 g entre les moyennes théoriques <strong>de</strong>s <strong>de</strong>ux lacs, il<br />

y a une probabilité égale à 0,58 <strong>de</strong> na pas le mettre en évi<strong>de</strong>nce...<br />

3.3 Les petits échantillons<br />

Nous avons alors <strong>de</strong>ux situations : celle où on peut supposer que les variables XA et XB sont<br />

distribuées selon une loi normale, et celle où cette supposition ne peut être faite.<br />

3.3.1 Les observations individuelles sont distribuées selon une loi normale :<br />

test <strong>de</strong> stu<strong>de</strong>nt<br />

Considérons l’exemple suivant : nous souhaitons comparer les poids moyens <strong>de</strong> <strong>de</strong>ux lacs à<br />

partir <strong>de</strong>s observations suivantes :<br />

Lac A ¯xA = 111g s 2 A (x) = 2432g2 nA = 11<br />

Lac B ¯xB = 193g s 2 A (x) = 2728g2 nB = 18<br />

Les tailles <strong>de</strong>s échantillons (inférieures à 30) ne nous autorisent pas à employer le test précé<strong>de</strong>nt.<br />

Nous allons alors faire la supposition suivante : les v.a. XA et XB sont distribuées<br />

selon une loi normale. Comment peut-on justifier cette distribution? En invoquant le théorème<br />

central-limite (TCL). En effet le poids d’un animal est la résultante <strong>de</strong> nombreux facteurs<br />

29


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

(environnementaux, génétique, ...) qui s’ajoutent et -peut-on penser- ceci <strong>de</strong> manière indépendante.<br />

Donc, le poids d’un individu peut-être vu comme l’addition <strong>de</strong> facteurs indépendants<br />

...donc comme une somme <strong>de</strong> v.a. indépendantes. D’après le TCL, cela nous permet <strong>de</strong> supposer<br />

la normalité <strong>de</strong>s poids individuels. Bien entendu ceci ne reste qu’une supposition, qu’il<br />

faudrait en toute rigueur vali<strong>de</strong>r par une analyse <strong>de</strong> la distribution <strong>de</strong>s poids individuels.<br />

Donc, si on suppose XA distribué selon une loi N(µA, σ2 A ) et XB distribué selon une loi<br />

N(µB, σ2 B ). Alors ¯ XA = 1<br />

nA<br />

Xi suit -en supposant les Xi indépendantes une distribution<br />

nA<br />

i=1<br />

N(µA, σ2 A).<br />

(d’après un résultat vu en L2, et rappelé dans le paragraphe <strong>de</strong> la loi nor-<br />

nA<br />

male, quant à l’addition <strong>de</strong> lois normales et à la multiplication d’une v.a. par une constante).<br />

De même ¯ XB = 1<br />

nB<br />

nB<br />

i=1<br />

Xi est distribué selon une loi N(µB, σ2 B ). Nous en déduisons que<br />

nB<br />

D = ¯ XA − ¯ XB suit une distribution N(µA − µB, σ2 A<br />

nA<br />

+ σ2 B )<br />

nB<br />

Dans la section précé<strong>de</strong>nte(cas <strong>de</strong>s “grands” échantillons) , nous avions alors approximé la<br />

distribution <strong>de</strong> D par N(µA − µB, s2 A<br />

nA<br />

+ s2 B ) (∗), c’est à dire en remplaçant les valeurs<br />

nB<br />

théoriques <strong>de</strong>s variances (σ 2 A et σ2 B ) par leurs estimations i.e. les variances empiriques (s2 A et<br />

s 2 B ). Rappelons que s2 (x) = 1<br />

n − 1<br />

n<br />

(xi − ¯x) 2 .<br />

i=1<br />

Dans le cas <strong>de</strong> petits échantillons (qui est celui qui nous concerne maintenant), l’approximation<br />

(∗) n’est plus valable, les estimations s2 A (<strong>de</strong> σ2 A ) et s2 B (<strong>de</strong> σ2 B ) pouvant beaucoup sécarter<br />

<strong>de</strong>s vraies valeurs.<br />

Le problème ne peut être abordé simplement que si l’on suppose σ2 A = σ2 B c’est à dire que les<br />

échantillons proviennent <strong>de</strong> populations pouvant différer par leurs moyennes (c’est l’hypothèse<br />

qu’on souhaite tester!) mais pas par leur variance (i.e. on supposera σ2 A = σ2 B = σ2<br />

Propriété 3.2 Soit X1,... ,Xn nA variables aléatoires <strong>de</strong> distributions N(µA,σ 2 ), Y1,... ,Yn<br />

nB variables aléatoires <strong>de</strong> distributions N(µB,σ 2 ¯X −<br />

), alors<br />

¯ Y<br />

<br />

1<br />

s × +<br />

nA<br />

1<br />

Tn−2 où n =<br />

nB<br />

nA + nB où s 2 = (nA) × s 2 A + (nB) × s 2 B<br />

nA + nB − 2<br />

Tn−2 est appelée distribution <strong>de</strong> Stu<strong>de</strong>nt à n −2 <strong>de</strong>grés <strong>de</strong> libertés (ddl). La loi <strong>de</strong> Stu<strong>de</strong>nt est<br />

très similaire à la loi N(0,1) : courbe en cloche symétrique par rapport à l’axe <strong>de</strong>s ordonnées.<br />

Sa distribution est seulement plus large aux extrémités. De plus, lorsque n → +∞, on montre<br />

que Tn → N(0,1).<br />

30


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

-4 -2 0 2 4<br />

Fig. 3.2 – Fonctions <strong>de</strong> <strong>de</strong>nsité <strong>de</strong> la loi <strong>de</strong> T <strong>de</strong> Stu<strong>de</strong>nt (pointillés) à 5 <strong>de</strong>grés <strong>de</strong> liberté et<br />

<strong>de</strong> la loi normale N(0,1)<br />

Construction du test<br />

¯X −<br />

Ainsi sous (H0), T =<br />

¯ Y<br />

<br />

1<br />

s × +<br />

nA<br />

1<br />

Tn−2. Si on se fixe un risque α (α = 0,05<br />

nB<br />

¯xA − ¯xB<br />

par exemple) on peut calculer la p-valeur associée à <br />

1<br />

s × +<br />

nA<br />

1<br />

, c’est à dire la pro-<br />

nB<br />

babilité d’observer sous H0 un écart à 0 au moins aussi important que celui observé. Ici,<br />

s2 (11 − 1) × 2432 + (18 − 1) × 2728<br />

= = 2618,37 ←→ s = 51,2.<br />

11 + 18 − 2<br />

Donc ¯xA − ¯xB 111 − 193<br />

= =<br />

s<br />

1 1<br />

51,2 × +<br />

11 18<br />

−82<br />

= −3,44. De plus n = 11 + 18 = 29, donc<br />

51,2<br />

ddl=39 − 2 = 27.<br />

La règle <strong>de</strong> décision du test sera donc :<br />

• Si la p-valeur est inférieure au risque α fixé a priori : on rejette (H0) au risque α;<br />

• Si la p-valeur est supérieure au risque α fixé a priori : on ne rejette pas (H0) au risque<br />

β.<br />

Calculons la p-valeur. p-valeur= P(T27 < −3,44ouT27 > 3,44) = ×P(|T27| > 3,44). Or, à<br />

partir <strong>de</strong> la table <strong>de</strong> la loi <strong>de</strong> Stu<strong>de</strong>nt, nous avons P(|T | > 2.05) = 0.05. Nous en déduisons<br />

donc que : p-valeur=P(|T27| > 3,44) < P(|T | > 2.05) = 0.05.<br />

D’après la règle <strong>de</strong> décision du test, nous décidons <strong>de</strong> rejeter (H0) au risque α <strong>de</strong> se tromper.<br />

31


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

3.3.2 Les observations individuelles ne sont pas distribuées selon une loi<br />

normale : test <strong>de</strong> Mann-Whitney<br />

Revenons à l’exemple <strong>de</strong>s greffes ( cf chapitre 2). Nous souhaitons comparer le nombre moyen<br />

<strong>de</strong> donneurs nécessaires avant d’être greffé pour <strong>de</strong>ux hôpitaux. Nous avons observé les résultats<br />

suivants :<br />

Hôpital A 22 7 3 19 24 12 8<br />

Hôpital B 7 2 18 11 15<br />

On souhaite tester (H0) µA = µB<br />

contre (H1) µA = µB<br />

Ici, la taille <strong>de</strong>s échantillons n’est pas assez importante pour pouvoir mettre en oeuvre le<br />

test présenté en 1. D’autre part, nous pouvons difficilement supposer le nombre <strong>de</strong> donneurs<br />

distribué selon une loi normale (cf chapitre 2) où nous avons, sous certaines conditions ,<br />

proposé la loi géométrique) et donc employer le test précé<strong>de</strong>nt. Nous présentons donc le test<br />

<strong>de</strong> Mann-Withney, qui revient exactement à tester<br />

(H0) meA = meB<br />

contre (H1) meA = meB<br />

où me désigne la médiane.<br />

Soient, dans le cas général, (x1,x2,... ,xnA ) et (y1,y2,... ,ynB les <strong>de</strong>ux échantillons. Ce test<br />

repose sur l’idée que si l’on mélange les <strong>de</strong>ux séries <strong>de</strong> valeurs et qu’on ordonne le tout par<br />

valeurs croissantes on doit obtenir un mélange homogène. Pour cela, les <strong>de</strong>ux suites étant<br />

réordonnées, on compte le nombre total <strong>de</strong> couples (xi,yi) où xi a un rang plus grand que yi<br />

(ou bien tels que xi > yi si X et Y sont quantitatives).<br />

Soit Ux ce nombre. Il varie <strong>de</strong> 0 à nA × nB.<br />

– Si Ux = 0, nous avons : x1,... ,xnA ,y1,...,ynB<br />

– Si Ux = nA × nB, nous avons : y1,... ,ynB ,x1,... ,xnA<br />

D’autre part, si les <strong>de</strong>ux distributions sont issues <strong>de</strong> la même population on montre que :<br />

L(Ux) = L(Uy) et :<br />

E(Ux) = nA × nB<br />

, V (Ux) =<br />

2<br />

(nAnB) × (nA + nB + 1)<br />

12<br />

De plus, la distribution <strong>de</strong> Ux est connue exactement (et tabulée), et est asymptotiquement<br />

normale (approximation considérée comme correcte dès que nA et nB sont ≥ 8).<br />

Soit alors u = min(ux,uy) et si on se fixe un risque <strong>de</strong> première espèce α (par exemple<br />

α = 0,05) alors la p-valeur=P(U > u).<br />

Mais revenons à notre exemple. Si nous classons les observations par ordre croissant nous<br />

obtenons :<br />

observation 2 3 7 8 11 12 15 18 19 22 24<br />

rang 1 2 3.5 5 6 7 8 9 10 11 12<br />

région B A A,B A B A B B A A A<br />

32


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Nous en déduisons que UA = 4 + 3.5 + 3 + 2 = 12.5 et UB = 7 + 5.5 + 4 + 3 + 3 = 22.5, d’où<br />

u = min(12.5,22.5) = 8.5. Or, P(U < 12,5) > P(U < 5) = 0.05. D’après la règle <strong>de</strong> décision<br />

du test, nous décidons <strong>de</strong> ne pas rejeter l’hypothèse (H0) au risque β <strong>de</strong> nous tromper.<br />

3.4 Test paramétrique et test libre<br />

Considérons l’exemple du test <strong>de</strong> la comparaison <strong>de</strong> <strong>de</strong>ux moyennes observées i.e. <strong>de</strong> l’hypothèse<br />

:<br />

(H0) µA = µB<br />

contre (H1) µA = µB<br />

Nous avons préce<strong>de</strong>mment présenté trois façons <strong>de</strong> construire le test, fonction <strong>de</strong> diverses<br />

suppositions que l’on peut émettre :<br />

Cas Supposition Statistique <strong>de</strong> test<br />

¯XA −<br />

(1)nA et nB > 30 Aucune<br />

¯ XB<br />

↩→ N(0, 1) sous (H0)<br />

(2)nA et/ou nB < 30 Normalité <strong>de</strong>s observations individuelles<br />

s 2 A<br />

nA<br />

+ s2 B<br />

nB<br />

¯XA − ¯ XB<br />

s<br />

↩→ Tn−2 sous (H0)<br />

Homogénéité <strong>de</strong>s variances par groupe où s 2 = (nA − 1) × s 2 A + (nB − 1) × s 2 B<br />

nA + nB − 2<br />

(3)nA et/ou nB < 30 Aucune U = min(Ux, Uy)<br />

Définition 3.2 Un test est dit paramétrique si son objet est <strong>de</strong> tester certaine hypothèse<br />

relative à un ou plusieurs paramètres d’une v.a. <strong>de</strong> loi spécifiée ou non.<br />

Au sens <strong>de</strong> la définition précé<strong>de</strong>nte, le test que nous considérons dans ce chapitre est paramétrique.<br />

Nous verrons un exemple <strong>de</strong> test non-paramétrique - le test du χ 2 - dans un chapitre<br />

ultérieur où nous testerons par exemple :<br />

(H0) La v.a. considérée suit une loi Normale<br />

contre (H1) La v.a. considérée ne suit pas une loi Normale<br />

Définition 3.3 Un test est dit libre (distribution free en anglais) si sa mise en œuvre ne<br />

repose pas sur une supposition concernant le distribution <strong>de</strong> la variable aléatoire considérée.<br />

Au sens <strong>de</strong> la définition précé<strong>de</strong>nte, les tests (1) et (3) sont libres (et paramétriques) tandis<br />

que le test (2) n’est pas libre car faisant une supposition <strong>de</strong> normalité <strong>de</strong>s observations individuelles.<br />

Le test (1), bien que libre, nécessite d’avoir <strong>de</strong>s effectifs suffisamment importants<br />

pour être mis en œuvre, ce qui n’est pas le cas du test (3).<br />

33


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

le test <strong>de</strong> Mann-Withney. est souvent qualifié (abusivement au sens <strong>de</strong>s définitions précé<strong>de</strong>ntes)<br />

<strong>de</strong> test non paramétrique, Même si les conditions d’application <strong>de</strong> ce test sont moins<br />

restrictives, il faut cependant noter que les échantillons doivent être aléatoires et indépendants<br />

entre eux.<br />

34


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

3.5 Table <strong>de</strong> la loi <strong>de</strong> Stu<strong>de</strong>nt<br />

Si T suit la loi <strong>de</strong> Stu<strong>de</strong>nt Tn à n <strong>de</strong>grés <strong>de</strong> liberté (ddl), la table donne la valeur <strong>de</strong> P(Tn < x).<br />

-3 -2 -1 0 1 2 3<br />

1<br />

ddl<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

8<br />

9<br />

10<br />

11<br />

12<br />

13<br />

14<br />

15<br />

16<br />

17<br />

18<br />

19<br />

20<br />

21<br />

22<br />

23<br />

24<br />

25<br />

26<br />

27<br />

28<br />

29<br />

30<br />

31<br />

32<br />

33<br />

34<br />

35<br />

36<br />

37<br />

38<br />

39<br />

40<br />

41<br />

42<br />

43<br />

44<br />

45<br />

46<br />

47<br />

48<br />

49<br />

50<br />

0.60<br />

0.325<br />

0.289<br />

0.277<br />

0.271<br />

0.267<br />

0.265<br />

0.263<br />

0.262<br />

0.261<br />

0.260<br />

0.260<br />

0.259<br />

0.259<br />

0.258<br />

0.258<br />

0.258<br />

0.257<br />

0.257<br />

0.257<br />

0.257<br />

0.257<br />

0.256<br />

0.256<br />

0.256<br />

0.256<br />

0.256<br />

0.256<br />

0.256<br />

0.256<br />

0.256<br />

0.256<br />

0.255<br />

0.255<br />

0.255<br />

0.255<br />

0.255<br />

0.255<br />

0.255<br />

0.255<br />

0.255<br />

0.255<br />

0.255<br />

0.255<br />

0.255<br />

0.255<br />

0.255<br />

0.255<br />

0.255<br />

0.255<br />

0.255<br />

0.70<br />

0.727<br />

0.617<br />

0.584<br />

0.569<br />

0.559<br />

0.553<br />

0.549<br />

0.546<br />

0.543<br />

0.542<br />

0.540<br />

0.539<br />

0.538<br />

0.537<br />

0.536<br />

0.535<br />

0.534<br />

0.534<br />

0.533<br />

0.533<br />

0.532<br />

0.532<br />

0.532<br />

0.531<br />

0.531<br />

0.531<br />

0.531<br />

0.530<br />

0.530<br />

0.530<br />

0.530<br />

0.530<br />

0.530<br />

0.529<br />

0.529<br />

0.529<br />

0.529<br />

0.529<br />

0.529<br />

0.529<br />

0.529<br />

0.528<br />

0.528<br />

0.528<br />

0.528<br />

0.528<br />

0.528<br />

0.528<br />

0.528<br />

0.528<br />

0.80<br />

1.376<br />

1.061<br />

0.978<br />

0.941<br />

0.920<br />

0.906<br />

0.896<br />

0.889<br />

0.883<br />

0.879<br />

0.876<br />

0.873<br />

0.870<br />

0.868<br />

0.866<br />

0.865<br />

0.863<br />

0.862<br />

0.861<br />

0.860<br />

0.859<br />

0.858<br />

0.858<br />

0.857<br />

0.856<br />

0.856<br />

0.855<br />

0.855<br />

0.854<br />

0.854<br />

0.853<br />

0.853<br />

0.853<br />

0.852<br />

0.852<br />

0.852<br />

0.851<br />

0.851<br />

0.851<br />

0.851<br />

0.850<br />

0.850<br />

0.850<br />

0.850<br />

0.850<br />

0.850<br />

0.849<br />

0.849<br />

0.849<br />

0.849<br />

0.90<br />

3.078<br />

1.886<br />

1.638<br />

1.533<br />

1.476<br />

1.440<br />

1.415<br />

1.397<br />

1.383<br />

1.372<br />

1.363<br />

1.356<br />

1.350<br />

1.345<br />

1.341<br />

1.337<br />

1.333<br />

1.330<br />

1.328<br />

1.325<br />

1.323<br />

1.321<br />

1.319<br />

1.318<br />

1.316<br />

1.315<br />

1.314<br />

1.313<br />

1.311<br />

1.310<br />

1.309<br />

1.309<br />

1.308<br />

1.307<br />

1.306<br />

1.306<br />

1.305<br />

1.304<br />

1.304<br />

1.303<br />

1.303<br />

1.302<br />

1.302<br />

1.301<br />

1.301<br />

1.300<br />

1.300<br />

1.299<br />

1.299<br />

1.299<br />

0.95<br />

6.314<br />

2.920<br />

2.353<br />

2.132<br />

2.015<br />

1.943<br />

1.895<br />

1.860<br />

1.833<br />

1.812<br />

1.796<br />

1.782<br />

1.771<br />

1.761<br />

1.753<br />

1.746<br />

1.740<br />

1.734<br />

1.729<br />

1.725<br />

1.721<br />

1.717<br />

1.714<br />

1.711<br />

1.708<br />

1.706<br />

1.703<br />

1.701<br />

1.699<br />

1.697<br />

1.696<br />

1.694<br />

1.692<br />

1.691<br />

1.690<br />

1.688<br />

1.687<br />

1.686<br />

1.685<br />

1.684<br />

1.683<br />

1.682<br />

1.681<br />

1.680<br />

1.679<br />

1.679<br />

1.678<br />

1.677<br />

1.677<br />

1.676<br />

0.9750<br />

12.706<br />

4.303<br />

3.182<br />

2.776<br />

2.571<br />

2.447<br />

2.365<br />

2.306<br />

2.262<br />

2.228<br />

2.201<br />

2.179<br />

2.160<br />

2.145<br />

2.131<br />

2.120<br />

2.110<br />

2.101<br />

2.093<br />

2.086<br />

2.080<br />

2.074<br />

2.069<br />

2.064<br />

2.060<br />

2.056<br />

2.052<br />

2.048<br />

2.045<br />

2.042<br />

2.040<br />

2.037<br />

2.035<br />

2.032<br />

2.030<br />

2.028<br />

2.026<br />

2.024<br />

2.023<br />

2.021<br />

2.020<br />

2.018<br />

2.017<br />

2.015<br />

2.014<br />

2.013<br />

2.012<br />

2.011<br />

2.010<br />

2.009<br />

0.9900<br />

31.821<br />

6.965<br />

4.541<br />

3.747<br />

3.365<br />

3.143<br />

2.998<br />

2.896<br />

2.821<br />

2.764<br />

2.718<br />

2.681<br />

2.650<br />

2.624<br />

2.602<br />

2.583<br />

2.567<br />

2.552<br />

2.539<br />

2.528<br />

2.518<br />

2.508<br />

2.500<br />

2.492<br />

2.485<br />

2.479<br />

2.473<br />

2.467<br />

2.462<br />

2.457<br />

2.453<br />

2.449<br />

2.445<br />

2.441<br />

2.438<br />

2.434<br />

2.431<br />

2.429<br />

2.426<br />

2.423<br />

2.421<br />

2.418<br />

2.416<br />

2.414<br />

2.412<br />

2.410<br />

2.408<br />

2.407<br />

2.405<br />

2.403<br />

0.9950<br />

63.657<br />

9.925<br />

5.841<br />

4.604<br />

4.032<br />

3.707<br />

3.499<br />

3.355<br />

3.250<br />

3.169<br />

3.106<br />

3.055<br />

3.012<br />

2.977<br />

2.947<br />

2.921<br />

2.898<br />

2.878<br />

2.861<br />

2.845<br />

2.831<br />

2.819<br />

2.807<br />

2.797<br />

2.787<br />

2.779<br />

2.771<br />

2.763<br />

2.756<br />

2.750<br />

2.744<br />

2.738<br />

2.733<br />

2.728<br />

2.724<br />

2.719<br />

2.715<br />

2.712<br />

2.708<br />

2.704<br />

2.701<br />

2.698<br />

2.695<br />

2.692<br />

2.690<br />

2.687<br />

2.685<br />

2.682<br />

2.680<br />

2.678<br />

0.9990<br />

318.309<br />

22.327<br />

10.215<br />

7.173<br />

5.893<br />

5.208<br />

4.785<br />

4.501<br />

4.297<br />

4.144<br />

4.025<br />

3.930<br />

3.852<br />

3.787<br />

3.733<br />

3.686<br />

3.646<br />

3.610<br />

3.579<br />

3.552<br />

3.527<br />

3.505<br />

3.485<br />

3.467<br />

3.450<br />

3.435<br />

3.421<br />

3.408<br />

3.396<br />

3.385<br />

3.375<br />

3.365<br />

3.356<br />

3.348<br />

3.340<br />

3.333<br />

3.326<br />

3.319<br />

3.313<br />

3.307<br />

3.301<br />

3.296<br />

3.291<br />

3.286<br />

3.281<br />

3.277<br />

3.273<br />

3.269<br />

3.265<br />

3.261<br />

0.9995<br />

636.619<br />

31.599<br />

12.924<br />

8.610<br />

6.869<br />

5.959<br />

5.408<br />

5.041<br />

4.781<br />

4.587<br />

4.437<br />

4.318<br />

4.221<br />

4.140<br />

4.073<br />

4.015<br />

3.965<br />

3.922<br />

3.883<br />

3.850<br />

3.819<br />

3.792<br />

3.768<br />

3.745<br />

3.725<br />

3.707<br />

3.690<br />

3.674<br />

3.659<br />

3.646<br />

3.633<br />

3.622<br />

3.611<br />

3.601<br />

3.591<br />

3.582<br />

3.574<br />

3.566<br />

3.558<br />

3.551<br />

3.544<br />

3.538<br />

3.532<br />

3.526<br />

3.520<br />

3.515<br />

3.510<br />

3.505<br />

3.500<br />

3.496<br />

35


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

3.6 Table la loi <strong>de</strong> Mann et Whitney<br />

La table donne la valeur mα telle que P(U ≤ mα) = α = 0.05 pour <strong>de</strong>ux échantillons d’effectifs<br />

n1 et n2 avec n1 ≤ n2.<br />

n2 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20<br />

n1<br />

2 - - - - 0 0 0 0 1 1 1 1 1 2 2 2 2<br />

3 - 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8<br />

4 0 1 2 3 4 4 5 6 7 8 9 10 11 11 12 13 14<br />

5 2 3 5 6 7 8 9 11 12 13 14 15 17 18 19 20<br />

6 5 6 8 10 11 13 14 16 17 19 21 22 24 25 27<br />

7 8 10 12 14 16 18 20 22 24 26 28 30 32 34<br />

8 13 15 17 19 22 24 26 29 31 34 36 38 41<br />

9 17 20 23 26 28 31 34 37 39 42 45 48<br />

10 23 26 29 33 36 39 42 45 48 52 55<br />

11 30 33 37 40 44 47 51 55 58 62<br />

12 37 41 45 49 53 57 61 65 69<br />

13 45 50 54 59 63 67 72 76<br />

14 55 59 64 69 74 78 83<br />

15 64 70 75 80 85 90<br />

16 75 81 86 92 98<br />

17 87 93 99 105<br />

18 99 106 112<br />

19 113 119<br />

20 127<br />

36


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

3.7 Exercices<br />

Exercice 3.1 On a déterminé sur quelques individus mâles et femelles d’une espèce d’échino<strong>de</strong>rme<br />

le rapport gonadosomatique (RGS=100× poids gonadique/poids individuel).<br />

Mâles 6,3 2,4 3,0 4,6 8,3<br />

Femelles 5,6 4,8 9,2 7,9 8,6<br />

Malgré la très faible taille <strong>de</strong>s échantillons, peut-on déterminer si les RGS diffèrent significativement?<br />

Exercice 3.2 Dans le cadre d’une étu<strong>de</strong> sur le traitement <strong>de</strong>s eaux usées, on souhaite comparer<br />

l’efficacité <strong>de</strong> <strong>de</strong>ux filtres : l’un en fibre <strong>de</strong> verre et l’autre en papier filtre. Pour cela<br />

on déci<strong>de</strong> d’effectuer <strong>de</strong>s prélèvements <strong>de</strong> 200 millilitres d’eau, et <strong>de</strong> mesurer pour chacun<br />

d’entre eux la quantité <strong>de</strong> soli<strong>de</strong>s en suspension -exprimée en mg/l- retenus lorsqu’on filtre.<br />

34 prélèvements seront filtrés en utilisant le filtre en fibre <strong>de</strong> verre et 34 autres en utilisant le<br />

filtre en papier filtre.<br />

1. Proposer un test permettant <strong>de</strong> déci<strong>de</strong>r si les <strong>de</strong>ux types <strong>de</strong> filtres ont <strong>de</strong>s efficacités<br />

différentes.<br />

2. Les résultats <strong>de</strong> ces analyses, c’est à dire les quantités mesurées <strong>de</strong> soli<strong>de</strong>s en suspension<br />

sont présentés dans le tableau suivant :<br />

Filtre en fibre <strong>de</strong> verre Papier filtre Filtre en fibre <strong>de</strong> verre Papier filtre<br />

65 62 62 99<br />

88 87 99 85<br />

66 90 101 68<br />

76 60 81 90<br />

60 81 87 81<br />

55 85 98 72<br />

108 74 96 86<br />

106 87 63 89<br />

101 61 120 91<br />

79 87 75 133<br />

100 100 71 58<br />

83 114 74 71<br />

75 84 81 100<br />

81 112 58 92<br />

79 106 77 104<br />

84 63 64 101<br />

95 70 82 102<br />

¯x 82,06 86,62<br />

s(x) 16,05 17,34<br />

Qu’en concluez vous ?<br />

3. Calculer l’erreur <strong>de</strong> secon<strong>de</strong> espèce β associée au test précé<strong>de</strong>nt si la différence <strong>de</strong>s<br />

moyennes théoriques entre les filtres en fibre <strong>de</strong> verre et les filtres papier était égale à 4<br />

mg/l.<br />

4. On déci<strong>de</strong> maintenant <strong>de</strong> continuer les prélévements. Toujours dans le cas où la différence<br />

<strong>de</strong>s moyennes théoriques serait égale à 4 mg/l, combien faut-il effectuer <strong>de</strong> prélèvements<br />

supplémentaires pour que β soit inférieure à 0,3?<br />

37


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Exercice 3.3 On a mesuré (en mm) la longueur <strong>de</strong>s œufs <strong>de</strong> coucou trouvés dans les nids<br />

<strong>de</strong> <strong>de</strong>ux espèces d’oiseaux : roitelet et fauvette. Les résultats sont présentés dans le tableau<br />

suivant :<br />

Roit. 23.78 21.80 20.69 22.44 21.03 21.88 20.24 18.83 20.08 20.90 20.99 20.63 24.74 22.87<br />

Fauv. 24.86 22.75 22.52 22.83 20.75 23.03 23.16 22.96 22.30 22.85 21.29 22.16 22.06 22.37<br />

1. Si nous ne faisons pas <strong>de</strong> test, pourquoi l’affirmation : “ ¯x1 est différent <strong>de</strong> ¯x2 , donc la<br />

taille moyenne <strong>de</strong>s œufs <strong>de</strong> coucous installés dans <strong>de</strong>s nids <strong>de</strong> roitelets est différente <strong>de</strong><br />

celle <strong>de</strong>s œufs <strong>de</strong> coucous installés dans <strong>de</strong>s nids <strong>de</strong> fauvettes” n’est-elle pas fondée?<br />

2. Proposez un test permettant <strong>de</strong> déci<strong>de</strong>r entre les <strong>de</strong>ux hypothèses :<br />

(H0) : “La taille moyenne <strong>de</strong>s œufs <strong>de</strong> coucous installés dans <strong>de</strong>s nids <strong>de</strong> roitelets est<br />

égale à celle <strong>de</strong>s œufs <strong>de</strong> coucous installés dans <strong>de</strong>s nids <strong>de</strong> fauvettes”<br />

(H1) : “La taille moyenne <strong>de</strong>s œufs <strong>de</strong> coucous installés dans <strong>de</strong>s nids <strong>de</strong> roitelets est<br />

différente <strong>de</strong> celle <strong>de</strong>s œufs <strong>de</strong> coucous installés dans <strong>de</strong>s nids <strong>de</strong> fauvettes”<br />

3. Qu’en concluez-vous ?<br />

Exercice 3.4 Deux groupes <strong>de</strong> 10 étudiants, formés à <strong>de</strong>s métho<strong>de</strong>s pédagogiques différentes,<br />

ont subi le même examen. A l’issue <strong>de</strong> cet examen, le classement <strong>de</strong>s étudiants était le suivant :<br />

groupe A 1 3 4 5 7 8 8 ex 12 15 17<br />

groupe B 2 6 10 11 13 14 15 ex 18 19 20<br />

On désire savoir si les <strong>de</strong>ux métho<strong>de</strong>s pédagogiques conduisent à <strong>de</strong>s résultats statistiquement<br />

différents. Proposer un test permettant <strong>de</strong> répondre à cette question.<br />

Exercice 3.5 On considère un lac peuplé <strong>de</strong> truites et ouvert à la pêche. Les gestionnaires<br />

du lac ont décidé d’adopter comme critère d’évaluation <strong>de</strong> l’état <strong>de</strong> cette population son poids<br />

moyen théorique µ. Les actions envisagées sont les suivantes : si µ = 150 g on laisse les choses<br />

en l’état, si µ < 150 g on prend une mesure <strong>de</strong> gestion. Pour évaluer l’état <strong>de</strong> la population,<br />

on déci<strong>de</strong> <strong>de</strong> prélever un échantillon <strong>de</strong> n poissons. On notera ¯x le poids moyen et s 2 (x) la<br />

variance associés à l’échantillon.<br />

1. Les gestionnaires déci<strong>de</strong>nt <strong>de</strong> prélever eux-même les n poissons en posant <strong>de</strong>s filets en<br />

divers points du lac. Pourquoi ne prélèvent-ils pas leur échantillon parmi les prises <strong>de</strong>s<br />

pêcheurs ?<br />

2. Proposer les hypothèses (H0) et (H1) associées au test. Construire le test.<br />

3. L’échantillon prélevé est constitué <strong>de</strong> n = 43 individus dont le poids moyen est ¯x = 146<br />

g et s(x) = 25 g. Quelle conclusion en déduisez-vous ?<br />

4. Quel est le risque d’erreur associé à votre décision? Quelle est sa valeur numérique (si<br />

besoin est, on considèrera µH1 = 140 g)?<br />

38


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Exercice 3.6 Les mesures <strong>de</strong>s tailles <strong>de</strong> <strong>de</strong>ux échantillons <strong>de</strong> rotifères ont conduit aux résultats<br />

suivants :<br />

Echantillon <strong>de</strong>s mâles : effectif : 51, moyenne : 10,67 mm, variance : 1.48 mm 2 .<br />

Echantillon <strong>de</strong>s femelles : effectif : 47, moyenne : 11,07 mm, variance : 1.29 mm 2 .<br />

1. Peut-on dire que la différence observée entre les moyennes <strong>de</strong> la taille <strong>de</strong>s mâles et celle<br />

<strong>de</strong>s femelles est due au hasard?<br />

2. Calculer la valeur <strong>de</strong> l’erreur <strong>de</strong> secon<strong>de</strong> espèce β associée au test précé<strong>de</strong>nt si la différence<br />

<strong>de</strong>s moyennes entre les populations mâles et femelles était égale à 0,4 mm?<br />

3. Si on avait observé les résultats sur <strong>de</strong>s échantillons d’effectifs égaux à 130, que concluraiton?<br />

39


Chapitre 4<br />

Test du chi-<strong>de</strong>ux (χ 2 ) d’adéquation<br />

4.1 Position du problème<br />

Nous avons étudié au premier chapitre la variable aléatoire Y =“Nombre <strong>de</strong> donneurs nécessaires<br />

à une greffe” :<br />

où Ω ′<br />

Y Ω ′<br />

ω ′<br />

−→ N⋆ ↦−→ Y (ω ′<br />

) = Nombre <strong>de</strong> donneurs nécessaires pour effectuer la greffe<br />

désigne l’ensemble <strong>de</strong>s mala<strong>de</strong>s.<br />

Nous avons vu que si les donneurs sont prélevés aléatoirement parmi l’ensemble <strong>de</strong>s donneurs,<br />

alors Y suit une loi géométrique et P(Y = k) = (1 − p) k−1 × p, où p est la probabilité qu’un<br />

donneur soit compatible.<br />

L’hôpital, où ont lieu les greffes, souhaite diminuer la durée d’attente pour les mala<strong>de</strong>s et donc<br />

envisage une autre procédure que la sélection aléatoire <strong>de</strong>s donneurs. Pour cela, les donneurs<br />

compatibles étant le plus souvent du groupe sanguin A, l’hôpital déci<strong>de</strong> <strong>de</strong> mener une campagne<br />

d’information incitant les personnes du groupe sanguin A à venir préférentiellement à<br />

l’hôpital.<br />

Sur 100 mala<strong>de</strong>s greffés après la campagne <strong>de</strong> l’hôpital, voici les délais d’attente observés :<br />

Nbre <strong>de</strong> donneurs nécessaires 1 2 3 4 5 et +<br />

pour la greffe<br />

Nombre <strong>de</strong> mala<strong>de</strong>s Oi 40 29 8 10 13<br />

Nous souhaitons tester l’effeicacité <strong>de</strong> la campagne d’information menée par l’hôpital. Nous<br />

avons alors <strong>de</strong>ux situations ou hypothèses :<br />

(H0) La campagne n’a eu aucun effet ⇐⇒ Les donneurs sont toujours prélevés aléatoirement;<br />

(H1) La campagne a eu un effet ⇐⇒ Les donneurs ne sont plus prélevés aléatoirement.<br />

40


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Remarquons que si (H0) est vraie, alors la distribution <strong>de</strong> la v.a. Y : “nombre <strong>de</strong> donneurs”<br />

est une loi géométrique. Dans ce cas, les effectifs observés (cf tableau précé<strong>de</strong>nt) <strong>de</strong>vraient<br />

être en adéquation avec la loi géométrique. Si tel n’est pas le cas, on penchera plutôt pour<br />

l’hypothèse (H1). Ainsi, les <strong>de</strong>ux hypothèses (H0) et (H1) entre lesquelles nous souhaitons<br />

déci<strong>de</strong>r peuvent être réécrites ainsi :<br />

(H0) Y suit une loi géométrique;<br />

(H1) Y ne suit pas une loi géométrique.<br />

Il s’agit donc <strong>de</strong> tester si la répartition <strong>de</strong> la v.a. Y est conforme ou pas à une loi géométrique.<br />

4.2 Construction du test<br />

4.2.1 Cas où la distribution théorique ne dépend pas <strong>de</strong> paramètre inconnu<br />

Nous nous plaçons dans la situation où p = 0,3, i.e. 30 % <strong>de</strong>s personnes entre 25 et 45 ans<br />

sont compatibles. Alors nous pouvons préciser l’hypothèse (H0) :<br />

(H0) : Y suit une loi géométrique <strong>de</strong> paramètrep = 0,3<br />

Remarque : Nous nous plaçons ainsi dans la situation où les paramètres <strong>de</strong> la distribution<br />

sous (H0) sont connus. Dans le cas où ils sont inconnus, nous verrons en fin <strong>de</strong> ce chapitre<br />

comment le test doit être adapté.<br />

Définition 4.1 Soit une urne contenant k catégories <strong>de</strong> boules différentes en proportion p1,p2...pk.<br />

k<br />

Comme pi=1, la composition <strong>de</strong> l’urne est parfaitement définie par (k − 1) <strong>de</strong> ces propor-<br />

i=1<br />

tions. k−1 est dit nombre <strong>de</strong> <strong>de</strong>grés <strong>de</strong> libertés (ddl). C’est le nombre <strong>de</strong> proportions permettant<br />

<strong>de</strong> déterminer parfaitement la composition <strong>de</strong> l’urne.<br />

Dans notre exemple, k = 5 donc le nombre <strong>de</strong> <strong>de</strong>grés<strong>de</strong> liberté (ddl) est égal à 5 − 1 = 4.<br />

Si (H0) était vraie, alors les probabilités <strong>de</strong>s occurences <strong>de</strong> Y seraient :<br />

P(Y = 1) = p = 0,3; P(Y = 2) = p × (1 − p) = 0,21;<br />

P(Y = 3) = p × (1 − p) 2 = 0,147; P(Y = 4) = p × (1 − p) 3 = 0,103; P(Y ≥ 5) = 0,24<br />

Si la répartition <strong>de</strong> l’échantillon était la même que la répartition théorique on observerait :<br />

C1 = n × p1 = 100 × 0,3 = 30<br />

C2 = n × p2 = 100 × 0,21 = 21<br />

C3 = n × p3 = 100 × 0,147 = 14,7<br />

C4 = n × p4 = 100 × 0,103 = 10,3<br />

C5 = n × p5 = 100 × 0,24 = 24<br />

Nous en déduisons le tableau récapitulatif suivant :<br />

41


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Y 1 2 3 4 ≥ 5<br />

pi 0,300 0,210 0,147 0,103 0,240<br />

Ci 30 21 14,7 10,3 24<br />

Oi 40 29 8 10 13<br />

Il existe donc un “écart” entre la composition <strong>de</strong> l’échantillon et la composition théorique. Il<br />

est d’abord nécessaire <strong>de</strong> caratériser cet écart i.e. <strong>de</strong> choisir un indice exprimant “l’écart” entre<br />

la composition théorique et observée.<br />

Indice?<br />

– Somme <strong>de</strong>s écarts ? Non, car elle est nulle.<br />

– Somme <strong>de</strong>s valeurs absolues ? Non, car ne se prête pas facilement au calcul <strong>de</strong>s probabilités.<br />

– Somme <strong>de</strong>s carrés <strong>de</strong>s écarts ? Il donne le même poids à tous les écarts, qu’ils se rapportent<br />

à <strong>de</strong> petits ou à <strong>de</strong>s grands effectifs calculés.<br />

On choisit donc comme indice :<br />

KH = (O1 − C1) 2<br />

+ (O2 − C2) 2<br />

+ ... + (Ok − Ck) 2<br />

=<br />

C1<br />

C2<br />

Ck<br />

k (Oi − Ci) 2<br />

Avantage : Si l’échantillon provient effectivement <strong>de</strong> l’urne théorique, alors on connaît la distribution<br />

<strong>de</strong> KH donc ses fluctuations d’échantillonnage.<br />

Propriété 4.1 Si l’échantillon provient <strong>de</strong> la distribution théorique (p1.. pk), alors KH =<br />

k (Oi − Ci) 2<br />

suit approximativement une loi <strong>de</strong> χ2 (chi-<strong>de</strong>ux) à k−1 ddl. On note L(KH) =<br />

i=1<br />

χ 2 k−1 .<br />

Ci<br />

Remarques :<br />

1. L’avantage principal <strong>de</strong> la variable KH est que sa distribution ne dépend pas <strong>de</strong> la<br />

composition <strong>de</strong> l’urne, mais ne dépend que du nombre <strong>de</strong> catégories ou modalités.<br />

2. Condition <strong>de</strong> validité <strong>de</strong> la propriété. La propriété précé<strong>de</strong>nte est vali<strong>de</strong> lorsque n tend<br />

vers +∞ et ni tend vers +∞ quelque soit i. Concrètement on considère l’approximation<br />

comme correcte dès que les effectifs calculés Ci = npi ≥ 5.<br />

Construction du test<br />

Si l’hypothèse (H0) est vérifiée, alors d’aprés la propriété précé<strong>de</strong>nte KH =<br />

i=1<br />

Ci<br />

5 (Oi − Ci) 2<br />

suit approximativement une distribution du χ 2 à 5−1 = 4 ddl. Les conditions d’approximation<br />

<strong>de</strong> la distribution sont ici vérifiées (tous les Ci ≥ 5).<br />

Calculons maintenant la valeur observée <strong>de</strong> la statistique du test :<br />

42<br />

i=1<br />

Ci


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

0 5 10 15 20<br />

14,47<br />

p-valeur<br />

Fig. 4.1 – p-valeur (partie hachurée) du test du χ 2 (voir texte)<br />

(40 − 30)2<br />

KHobs = +<br />

30<br />

(21 − 29)2<br />

+<br />

21<br />

(14,7 − 8)2<br />

+<br />

14,7<br />

(10,3 − 10)2<br />

= 3,33 + 3,05 + 3,05 + 810−3 + 5,04<br />

10<br />

+ (24 − 13)2<br />

24<br />

14,47<br />

Nous allons maintenant calculer la probabilité d’observer un “écart” au moins aussi important<br />

sous (H0). On appelle p-valeur cette probabilité.<br />

Fixons nous alors un risque α. Par exemple, choisissons α=0,05. Alors, nous définissons la<br />

règle <strong>de</strong> décision suivante :<br />

• Si p-valeur < α, alors nous décidons <strong>de</strong> rejeter (H0) au risque α (car on considère que<br />

la p-valeur est trop faible, la limite étant fixée par α, pour pouvoir l’attribuer au hasard);<br />

• Si la p-valeur > α, alors nous décidons <strong>de</strong> ne pas rejeter (H0) au risque β (car on considère<br />

que la p-valeur est trop élevée, la limite étant fixée par α, pour pouvoir l’attribuer<br />

à autre chose qu’au hasard).<br />

Dans le cas <strong>de</strong> notre exemple, ddl = 5 − 1 = 4 et P(KH > KHobs = 14,47) < 0,01 (lu dans<br />

la table du χ 2 ). D’après notre règle <strong>de</strong> décision, nous concluons alors au rejet <strong>de</strong> l’hypothèse<br />

(H0) au risque α = 0,05 <strong>de</strong> se tromper : on peut dire que la campagne <strong>de</strong> l’hôpital a eu un<br />

effet. Mais cet effet est-il positif ou négatif ?<br />

La réponse à la question nous est donnée en comparant les effectifs théoriques et observées<br />

pour les composantes <strong>de</strong> KHobs les plus élevées, ie celles qui concourrent au rejet <strong>de</strong> (H0).<br />

Nous constatons alors qu’il y a plus <strong>de</strong> mala<strong>de</strong>s ayant attendu 1 ou 2 donneurs que sous le<br />

hasard ... et moins ayant attendu plus <strong>de</strong> 3 donneurs. Donc la campagne a eu un effet positif !<br />

43


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

4.2.2 Cas où la distribution théorique dépend <strong>de</strong> paramètre(s) inconnu(s)<br />

On a mesuré la taille <strong>de</strong> 217 oiseaux en mm. Les observations sont regroupées en classes dans<br />

le tableau suivant :<br />

Classes 745 Total<br />

Effectifs observés Oi 3 31 74 67 42 217<br />

Effectifs théoriques Ci = npi 5.22 26.18 64.84 73.2 47.55 217<br />

(Oi − Ci) 2<br />

Ci<br />

0.94 0.89 1.29 0.53 0.65 4.29<br />

La moyenne <strong>de</strong>s tailles <strong>de</strong> l’échantillon <strong>de</strong>s 217 oiseaux est la moyenne ¯x = 728.1 et l’écart<br />

type s(x) = 21.8. Ces valeurs ont été calculées avant <strong>de</strong> mettre en classe les observations.<br />

Peut-on dire que la distribution <strong>de</strong>s tailles est conforme à une loi normale? Répondre à cette<br />

question, c’est trancher entre les <strong>de</strong>ux hypothèses suivantes :<br />

(H0) : la distribution <strong>de</strong>s tailles est une loi normale<br />

(H1) : la distribution <strong>de</strong>s tailles n’est pas une loi normale<br />

La différence avec le cas précé<strong>de</strong>nt c’est que (H0) correspond à une loi (normale, dans notre<br />

exemple) dont les paramètres µ et σ sont inconnus.<br />

Pour pouvoir utiliser la statistique du χ 2 on doit calculer, sous l’hypothèse (H0), les nombres<br />

pi correspondants aux probabilités <strong>de</strong>s différentes classes considérées :<br />

p1 = P(T < 685) = PT − µ<br />

σ<br />

p2 = P(685 < T < 705) = P685 − µ<br />

σ<br />

p3 = P(705 < T < 725) = P705 − µ<br />

σ<br />

p4 = P(725 < T < 745) = P725 − µ<br />

σ<br />

685 − µ 685 − µ<br />

< < < −1.977) = 0.024<br />

σ=PZ<br />

σ=P(Z<br />

< Z <<br />

< Z <<br />

< Z <<br />

705 − µ<br />

σ=P(−1.977 < Z < −1.06) = 0.121<br />

725 − µ<br />

σ=P(−1.06 < Z < −0.14) = 0.299<br />

745 − µ<br />

σ=P(−0.14 < Z < 0.775) = 0.337<br />

745 − µ<br />

p5 = P(T > 745) = 1 − PZ < = 1 − 0.781 = 0.219<br />

σ)<br />

On choisit la loi normale la plus proche <strong>de</strong> nos observations i.e. N(µ = 728.1;σ = 21.8). On<br />

peut alors compléter le tableau précé<strong>de</strong>nt.<br />

Propriété 4.2 Si on estime p paramètres, alors si (H0) est vraie, KH =<br />

approximativement une distribution dite <strong>de</strong> χ 2 à k − 1 − p <strong>de</strong>grés <strong>de</strong> libertés.<br />

44<br />

k (Oi − Ci) 2<br />

suit<br />

i=1<br />

Ci


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Conditions d’approximation : n tend +∞ et ni tend +∞ quelque soit i. Concrètement, on<br />

conidère les conditions d’approximation remplis dès que Ci = npi > 5<br />

On peut alors d’après la propriété précé<strong>de</strong>nte dire que si (H0) est vérifié alors la statistique<br />

k (Oi − Ci)<br />

KH =<br />

2<br />

suit approximativement une loi <strong>de</strong> χ2 à 5 −1−2 = 2 <strong>de</strong>grés <strong>de</strong> libertés.<br />

i=1<br />

Ci<br />

Les conditions d’approximations sont vérifiées (tous les Ci ≥ 5). On peut alors construire<br />

la règle <strong>de</strong> décision du test. On se fixe pour cela un risque d’erreur <strong>de</strong> première espèce<br />

α = P(H1/H0) = 0.05 et on définit la p-valeur suivant p − valeur = P(KH > KHobs).<br />

Alors, nous définissons la règle <strong>de</strong> décision suivante :<br />

• Si p-valeur < α, alors nous décidons <strong>de</strong> rejeter (H0) au risque α (car on considère que<br />

la p-valeur est trop faible, la limite étant fixée par α, pour pouvoir l’attribuer au hasard);<br />

• Si la p-valeur > α, alors nous décidons <strong>de</strong> ne pas rejeter (H0) au risque β (car on considère<br />

que la p-valeur est trop élevée, la limite étant fixée par α, pour pouvoir l’attribuer<br />

à autre chose qu’au hasard).<br />

Dans notre cas le KHobs = 4.296, ddl = 4. D’après la table du χ 2 nous lisons que P(KH ><br />

4.296) > P(KH = 7,78) = 0,1. Nous concluons donc au non rejet <strong>de</strong> l’hypothèse (H0) au<br />

risque β <strong>de</strong> se tromper.<br />

45


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

4.3 Fonction <strong>de</strong> répartition <strong>de</strong> la loi du χ 2<br />

Si KH sui la loi normale χ 2 p , la table donne la valeur <strong>de</strong> F(x) = P(KH < x). En ligne les<br />

<strong>de</strong>grés <strong>de</strong> liberté (ddl), en colonnes les valeurs <strong>de</strong> la fonction <strong>de</strong> répartition, à l’intersection<br />

<strong>de</strong>s <strong>de</strong>ux la valeur <strong>de</strong> x<br />

0 5 10 15 20<br />

x<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

8<br />

9<br />

10<br />

11<br />

12<br />

13<br />

14<br />

15<br />

16<br />

17<br />

18<br />

19<br />

20<br />

21<br />

22<br />

23<br />

24<br />

25<br />

26<br />

27<br />

28<br />

29<br />

30<br />

31<br />

32<br />

33<br />

34<br />

35<br />

36<br />

37<br />

38<br />

39<br />

40<br />

41<br />

42<br />

43<br />

44<br />

45<br />

46<br />

47<br />

48<br />

49<br />

50<br />

0.001<br />

0.000<br />

0.002<br />

0.024<br />

0.091<br />

0.210<br />

0.381<br />

0.598<br />

0.857<br />

1.152<br />

1.479<br />

1.834<br />

2.214<br />

2.617<br />

3.041<br />

3.483<br />

3.942<br />

4.416<br />

4.905<br />

5.407<br />

5.921<br />

6.447<br />

6.983<br />

7.529<br />

8.085<br />

8.649<br />

9.222<br />

9.803<br />

10.391<br />

10.986<br />

11.588<br />

12.196<br />

12.811<br />

13.431<br />

14.057<br />

14.688<br />

15.324<br />

15.965<br />

16.611<br />

17.262<br />

17.916<br />

18.575<br />

19.239<br />

19.906<br />

20.576<br />

21.251<br />

21.929<br />

22.610<br />

23.295<br />

23.983<br />

24.674<br />

0.005<br />

0.000<br />

0.010<br />

0.072<br />

0.207<br />

0.412<br />

0.676<br />

0.989<br />

1.344<br />

1.735<br />

2.156<br />

2.603<br />

3.074<br />

3.565<br />

4.075<br />

4.601<br />

5.142<br />

5.697<br />

6.265<br />

6.844<br />

7.434<br />

8.034<br />

8.643<br />

9.260<br />

9.886<br />

10.520<br />

11.160<br />

11.808<br />

12.461<br />

13.121<br />

13.787<br />

14.458<br />

15.134<br />

15.815<br />

16.501<br />

17.192<br />

17.887<br />

18.586<br />

19.289<br />

19.996<br />

20.707<br />

21.421<br />

22.138<br />

22.859<br />

23.584<br />

24.311<br />

25.041<br />

25.775<br />

26.511<br />

27.249<br />

27.991<br />

0.010<br />

0.000<br />

0.020<br />

0.115<br />

0.297<br />

0.554<br />

0.872<br />

1.239<br />

1.646<br />

2.088<br />

2.558<br />

3.053<br />

3.571<br />

4.107<br />

4.660<br />

5.229<br />

5.812<br />

6.408<br />

7.015<br />

7.633<br />

8.260<br />

8.897<br />

9.542<br />

10.196<br />

10.856<br />

11.524<br />

12.198<br />

12.879<br />

13.565<br />

14.256<br />

14.953<br />

15.655<br />

16.362<br />

17.074<br />

17.789<br />

18.509<br />

19.233<br />

19.960<br />

20.691<br />

21.426<br />

22.164<br />

22.906<br />

23.650<br />

24.398<br />

25.148<br />

25.901<br />

26.657<br />

27.416<br />

28.177<br />

28.941<br />

29.707<br />

0.025<br />

0.001<br />

0.051<br />

0.216<br />

0.484<br />

0.831<br />

1.237<br />

1.690<br />

2.180<br />

2.700<br />

3.247<br />

3.816<br />

4.404<br />

5.009<br />

5.629<br />

6.262<br />

6.908<br />

7.564<br />

8.231<br />

8.907<br />

9.591<br />

10.283<br />

10.982<br />

11.689<br />

12.401<br />

13.120<br />

13.844<br />

14.573<br />

15.308<br />

16.047<br />

16.791<br />

17.539<br />

18.291<br />

19.047<br />

19.806<br />

20.569<br />

21.336<br />

22.106<br />

22.878<br />

23.654<br />

24.433<br />

25.215<br />

25.999<br />

26.785<br />

27.575<br />

28.366<br />

29.160<br />

29.956<br />

30.755<br />

31.555<br />

32.357<br />

0.05<br />

0.004<br />

0.103<br />

0.352<br />

0.711<br />

1.145<br />

1.635<br />

2.167<br />

2.733<br />

3.325<br />

3.940<br />

4.575<br />

5.226<br />

5.892<br />

6.571<br />

7.261<br />

7.962<br />

8.672<br />

9.390<br />

10.117<br />

10.851<br />

11.591<br />

12.338<br />

13.091<br />

13.848<br />

14.611<br />

15.379<br />

16.151<br />

16.928<br />

17.708<br />

18.493<br />

19.281<br />

20.072<br />

20.867<br />

21.664<br />

22.465<br />

23.269<br />

24.075<br />

24.884<br />

25.695<br />

26.509<br />

27.326<br />

28.144<br />

28.965<br />

29.787<br />

30.612<br />

31.439<br />

32.268<br />

33.098<br />

33.930<br />

34.764<br />

0.1000<br />

0.016<br />

0.211<br />

0.584<br />

1.064<br />

1.610<br />

2.204<br />

2.833<br />

3.490<br />

4.168<br />

4.865<br />

5.578<br />

6.304<br />

7.042<br />

7.790<br />

8.547<br />

9.312<br />

10.085<br />

10.865<br />

11.651<br />

12.443<br />

13.240<br />

14.041<br />

14.848<br />

15.659<br />

16.473<br />

17.292<br />

18.114<br />

18.939<br />

19.768<br />

20.599<br />

21.434<br />

22.271<br />

23.110<br />

23.952<br />

24.797<br />

25.643<br />

26.492<br />

27.343<br />

28.196<br />

29.051<br />

29.907<br />

30.765<br />

31.625<br />

32.487<br />

33.350<br />

34.215<br />

35.081<br />

35.949<br />

36.818<br />

37.689<br />

0.5000<br />

0.455<br />

1.386<br />

2.366<br />

3.357<br />

4.351<br />

5.348<br />

6.346<br />

7.344<br />

8.343<br />

9.342<br />

10.341<br />

11.340<br />

12.340<br />

13.339<br />

14.339<br />

15.338<br />

16.338<br />

17.338<br />

18.338<br />

19.337<br />

20.337<br />

21.337<br />

22.337<br />

23.337<br />

24.337<br />

25.336<br />

26.336<br />

27.336<br />

28.336<br />

29.336<br />

30.336<br />

31.336<br />

32.336<br />

33.336<br />

34.336<br />

35.336<br />

36.336<br />

37.335<br />

38.335<br />

39.335<br />

40.335<br />

41.335<br />

42.335<br />

43.335<br />

44.335<br />

45.335<br />

46.335<br />

47.335<br />

48.335<br />

49.335<br />

0.9000<br />

2.706<br />

4.605<br />

6.251<br />

7.779<br />

9.236<br />

10.645<br />

12.017<br />

13.362<br />

14.684<br />

15.987<br />

17.275<br />

18.549<br />

19.812<br />

21.064<br />

22.307<br />

23.542<br />

24.769<br />

25.989<br />

27.204<br />

28.412<br />

29.615<br />

30.813<br />

32.007<br />

33.196<br />

34.382<br />

35.563<br />

36.741<br />

37.916<br />

39.087<br />

40.256<br />

41.422<br />

42.585<br />

43.745<br />

44.903<br />

46.059<br />

47.212<br />

48.363<br />

49.513<br />

50.660<br />

51.805<br />

52.949<br />

54.090<br />

55.230<br />

56.369<br />

57.505<br />

58.641<br />

59.774<br />

60.907<br />

62.038<br />

63.167<br />

0.9500<br />

3.841<br />

5.991<br />

7.815<br />

9.488<br />

11.070<br />

12.592<br />

14.067<br />

15.507<br />

16.919<br />

18.307<br />

19.675<br />

21.026<br />

22.362<br />

23.685<br />

24.996<br />

26.296<br />

27.587<br />

28.869<br />

30.144<br />

31.410<br />

32.671<br />

33.924<br />

35.172<br />

36.415<br />

37.652<br />

38.885<br />

40.113<br />

41.337<br />

42.557<br />

43.773<br />

44.985<br />

46.194<br />

47.400<br />

48.602<br />

49.802<br />

50.998<br />

52.192<br />

53.384<br />

54.572<br />

55.758<br />

56.942<br />

58.124<br />

59.304<br />

60.481<br />

61.656<br />

62.830<br />

64.001<br />

65.171<br />

66.339<br />

67.505<br />

0.9750<br />

5.024<br />

7.378<br />

9.348<br />

11.143<br />

12.833<br />

14.449<br />

16.013<br />

17.535<br />

19.023<br />

20.483<br />

21.920<br />

23.337<br />

24.736<br />

26.119<br />

27.488<br />

28.845<br />

30.191<br />

31.526<br />

32.852<br />

34.170<br />

35.479<br />

36.781<br />

38.076<br />

39.364<br />

40.646<br />

41.923<br />

43.195<br />

44.461<br />

45.722<br />

46.979<br />

48.232<br />

49.480<br />

50.725<br />

51.966<br />

53.203<br />

54.437<br />

55.668<br />

56.896<br />

58.120<br />

59.342<br />

60.561<br />

61.777<br />

62.990<br />

64.201<br />

65.410<br />

66.617<br />

67.821<br />

69.023<br />

70.222<br />

71.420<br />

0.9900<br />

6.635<br />

9.210<br />

11.345<br />

13.277<br />

15.086<br />

16.812<br />

18.475<br />

20.090<br />

21.666<br />

23.209<br />

24.725<br />

26.217<br />

27.688<br />

29.141<br />

30.578<br />

32.000<br />

33.409<br />

34.805<br />

36.191<br />

37.566<br />

38.932<br />

40.289<br />

41.638<br />

42.980<br />

44.314<br />

45.642<br />

46.963<br />

48.278<br />

49.588<br />

50.892<br />

52.191<br />

53.486<br />

54.776<br />

56.061<br />

57.342<br />

58.619<br />

59.893<br />

61.162<br />

62.428<br />

63.691<br />

64.950<br />

66.206<br />

67.459<br />

68.710<br />

69.957<br />

71.201<br />

72.443<br />

73.683<br />

74.919<br />

76.154<br />

0.9950<br />

7.879<br />

10.597<br />

12.838<br />

14.860<br />

16.750<br />

18.548<br />

20.278<br />

21.955<br />

23.589<br />

25.188<br />

26.757<br />

28.300<br />

29.819<br />

31.319<br />

32.801<br />

34.267<br />

35.718<br />

37.156<br />

38.582<br />

39.997<br />

41.401<br />

42.796<br />

44.181<br />

45.559<br />

46.928<br />

48.290<br />

49.645<br />

50.993<br />

52.336<br />

53.672<br />

55.003<br />

56.328<br />

57.648<br />

58.964<br />

60.275<br />

61.581<br />

62.883<br />

64.181<br />

65.476<br />

66.766<br />

68.053<br />

69.336<br />

70.616<br />

71.893<br />

73.166<br />

74.437<br />

75.704<br />

76.969<br />

78.231<br />

79.490<br />

0.9990<br />

10.828<br />

13.816<br />

16.266<br />

18.467<br />

20.515<br />

22.458<br />

24.322<br />

26.124<br />

27.877<br />

29.588<br />

31.264<br />

32.909<br />

34.528<br />

36.123<br />

37.697<br />

39.252<br />

40.790<br />

42.312<br />

43.820<br />

45.315<br />

46.797<br />

48.268<br />

49.728<br />

51.179<br />

52.620<br />

54.052<br />

55.476<br />

56.892<br />

58.301<br />

59.703<br />

61.098<br />

62.487<br />

63.870<br />

65.247<br />

66.619<br />

67.985<br />

69.346<br />

70.703<br />

72.055<br />

73.402<br />

74.745<br />

76.084<br />

77.419<br />

78.750<br />

80.077<br />

81.400<br />

82.720<br />

84.037<br />

85.351<br />

86.661<br />

46


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

4.4 Exercices<br />

Exercice 4.1 Pour étudier le comportement alimentaire d’une espèce <strong>de</strong> fourmi, Lasius flavus,<br />

on a conçu le dispositif expérimental suivant : 6 chambres sont disposées en rayon autour<br />

d’un promenoir central circulaire. Un gramme d’aliment à tester est placé au centre <strong>de</strong> chaque<br />

chambre et le même aliment se retrouve dans <strong>de</strong>ux chambres diamétralement opposées. Trois<br />

sucres ont été testés : le glucose, le galactose et le lévulose. Le premier jour <strong>de</strong> l’expérience, à<br />

8 heures du matin, 20 ouvrières sont introduites dans le promenoir central et pendant 5 jours<br />

consécutifs on note <strong>de</strong> 8 heures à 16 heures le nombre et l’emplacement <strong>de</strong>s fourmis dans les<br />

diverses chambres.<br />

La répartition <strong>de</strong> Lasius flavus a été la suivante : Glucose : 255 observations <strong>de</strong> fourmis ; Galactose<br />

: 458 observations <strong>de</strong> fourmis ; Lévulose : 67 observations <strong>de</strong> fourmis.<br />

On veut tester l’hypothèse H0 selon laquelle la répartition <strong>de</strong>s fourmis dans les chambres ne<br />

dépend pas du type <strong>de</strong> nourriture qui s’y trouve.<br />

1. Quelle est l’hypothèse H1 complémentaire <strong>de</strong> H0 ?<br />

2. Traduire H0 et H1 en terme <strong>de</strong> probabilité <strong>de</strong> fréquentation <strong>de</strong>s trois types <strong>de</strong> nourriture.<br />

3. Proposer une procédure <strong>de</strong> test <strong>de</strong> H0 contre H1. Vous préciserez notamment la distribution<br />

utilisée pour la statistique du test sous H0, puis la règle <strong>de</strong> décision avant <strong>de</strong><br />

conclure.<br />

(255 − 260)2<br />

On donne +<br />

260<br />

(458 − 260)2<br />

+<br />

260<br />

(67 − 260)2<br />

= 294, 15.<br />

260<br />

4. Proposer une interprétation biologique du résultat obtenu.<br />

Exercice 4.2 Dans une région du Canada, vivent sur le même territoire <strong>de</strong>ux types d’oies.<br />

Des oies blanches et <strong>de</strong>s oies <strong>de</strong> couleur “gris-bleuté” dénommées “oies bleues”. On observe sur<br />

le territoire trois types <strong>de</strong> couples :<br />

• Type 1 : blanc × blanc<br />

• Type 2 : blanc × bleu ou bleu × blanc<br />

• Type 3 : bleu × bleu<br />

1. Désignons par p la probabilité pour qu’une oie soit blanche dans la population et par<br />

q = 1 − p la probabilité qu’elle soit bleue. Dans l’hypothèse où la formation <strong>de</strong>s couples<br />

se ferait au hasard, définir la distribution <strong>de</strong> la variable aléatoire X=“Nombre d’oies<br />

blanches par couple”.<br />

2. On observe dans la nature 520 couples. Quels <strong>de</strong>vraient être les effectifs (théoriques) <strong>de</strong><br />

chacun <strong>de</strong>s types <strong>de</strong> couples s’ils se formaient au hasard?<br />

3. En réalité, les effectifs observés sont <strong>de</strong> 373 pour le type 1 et 83 pour le type 2. Estimer<br />

à partir <strong>de</strong> ces observations les paramètres p et q. Tester l’hypothèse selon laquelle la<br />

formation <strong>de</strong>s couples s’effectue au hasard. Que peut-on en conclure?<br />

47


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Exercice 4.3 Le lycée <strong>de</strong> la ville <strong>de</strong> P. accueille 948 élèves dont 593 filles. Le service <strong>de</strong>s<br />

sports du lycée organise une course d’orientation, chaque équipe étant formée <strong>de</strong> 4 élèves. Les<br />

élèves déci<strong>de</strong>nt librement <strong>de</strong> la formation <strong>de</strong>s équipes.<br />

1. Définir la variable aléatoire X=“Nombre <strong>de</strong> filles par équipe”.<br />

2. Dans l’hypothèse où les équipes se forment indépendamment du sexe <strong>de</strong>s élèves, quelle<br />

est la distribution <strong>de</strong> la variable aléatoire X ?<br />

3. Le jour <strong>de</strong> la course, la répartition <strong>de</strong>s équipes suivant le nombre <strong>de</strong> filles qu’elles<br />

contiennent est la suivante :<br />

Nombre <strong>de</strong> filles par équipe 0 1 2 3 4<br />

Effectifs Observés 14 31 68 70 54<br />

Quels <strong>de</strong>vraient être les effectifs théoriques du nombre <strong>de</strong> filles par équipe si les équipes<br />

se formaient indépendamment du sexe?<br />

4. Tester l’hypothèse selon laquelle les équipes se forment indépendamment du sexe.<br />

5. Interpréter le résultat obtenu.<br />

Exercice 4.4 Vous avez conçu un programme informatique générateur <strong>de</strong> nombres choisis<br />

au hasard dans l’ensemble <strong>de</strong>s dix premiers entiers. Les mille premiers résultats sont répartis<br />

comme suit :<br />

Chiffre 0 1 2 3 4 5 6 7 8 9<br />

Nombre d’observations 105 92 115 103 91 109 92 112 94 87<br />

1. Pourquoi l’affirmation “Les effectifs observés pour les différents chiffres sont différents,<br />

donc le programme est à revoir” n’est-elle pas fondée?<br />

2. Proposer un test permettant <strong>de</strong> tester l’hypothèse d’équiprobabilité <strong>de</strong> chacun <strong>de</strong>s chiffres.<br />

Vous préciserez notamment les hypothèses H0 et H1, la distribution utilisée pour la statistique<br />

du test sous l’hypothèse H0 ainsi que la règle <strong>de</strong> décision.<br />

3. Qu’en concluez-vous ?<br />

48


Chapitre 5<br />

Liaison entre <strong>de</strong>ux variables aléatoires<br />

discrètes<br />

5.1 Loi <strong>de</strong> probabilité d’un couple <strong>de</strong> variables aléatoires discrètes<br />

5.1.1 Définition<br />

Dans un lac, vivent <strong>de</strong>ux espèces <strong>de</strong> poissons (espèce A et espèce B). Ces <strong>de</strong>ux espèces peuvent<br />

s’hybri<strong>de</strong>r, donnant lieu à un troisième groupe (C). Nous pouvons ainsi définir la variable aléatoire<br />

discrète “espèce” :<br />

X : Ω −→ {1,2,3}<br />

ω ↦−→ X(ω) = 1 si A<br />

2 si B<br />

3 si C<br />

Ces animaux présentent <strong>de</strong>ux formes pour leur bouche qui peut être “infère” (ie dirigée vers<br />

le bas lorsque l’animal se nourrit préférentiellement au fond) ou “supère” (ie dirigée vers le<br />

haut). Nous pouvons ainsi définir la variable aléatoire discrète “forme” :<br />

Y : Ω −→ {1,2}<br />

ω ↦−→ Y (ω) = 1 si infère<br />

2 si supère<br />

L’étu<strong>de</strong> <strong>de</strong> la liaison entre <strong>de</strong>ux variables -ici discrètes- est un problème fondamental en statistique.<br />

Dans l’exemple que nous venons <strong>de</strong> présenter, nous observons en fait sur chaque individu<br />

<strong>de</strong>ux caractères ou variables aléatoires. Nous pouvons alors définir la variable aléatoire “couple”<br />

ou (X,Y ) ainsi :<br />

(X, Y ) : Ω −→<br />

<br />

{1,2,3} × {1,2}<br />

<br />

ω ↦−→ X(ω) , Y (ω)<br />

Définition 5.1 On appelle loi <strong>de</strong> probabilité jointe ou loi du couple (X,Y ) la loi <strong>de</strong> probabilité<br />

P (X,Y ) définie ainsi : P (X,Y )(xi,yj) = P(X = xi ∩ Y = yj).<br />

49


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Dans le cas discret, cette loi <strong>de</strong> probabilité peut se mettre sous la forme d’une table :<br />

x1<br />

.<br />

y1 ... yj ... yq<br />

.<br />

.<br />

xi ... ... pij ... ... pi.<br />

On note pij = P(X = xi ∩ Y = yj), et bien entendu :<br />

5.1.2 Lois marginales<br />

.<br />

xp<br />

.<br />

p.j<br />

p<br />

q<br />

i=1 j=1<br />

Définition 5.2 On appelle lois marginales, les lois <strong>de</strong> probabilité <strong>de</strong> X et Y prises séparément<br />

:<br />

q<br />

P(X = xi) =<br />

P(Y = yj) =<br />

j=1<br />

p<br />

i=1<br />

pij = pi.<br />

pij = p.j<br />

5.1.3 Lois conditionnelles<br />

Lorsque les événements {X = xi} et {Y = yj} sont <strong>de</strong> probabilités non nulles, on peut définir<br />

<strong>de</strong>ux types <strong>de</strong> lois conditionnelles selon que l’on connaît la valeur <strong>de</strong> X ou <strong>de</strong> Y .<br />

Définition 5.3 On appelle loi conditionnelle <strong>de</strong> X si Y = yj :<br />

pij<br />

P(X = xi/Y = yj) = P(X = xi ∩ Y = yj)<br />

P(Y = yj)<br />

On appelle loi conditionnelle <strong>de</strong> Y si X = xi :<br />

P(Y = yj/X = xi) = P(X = xi ∩ Y = yj)<br />

P(X = xi)<br />

= pij<br />

p.j<br />

= pij<br />

pi.<br />

Propriété 5.1 Si X et Y sont <strong>de</strong>ux variables aléatoires indépendantes, alors :<br />

pij = P(X = xi ∩ Y = yj) = P(X = xi) × P(Y = yj) = pi. × p.j ∀(i,j)<br />

5.2 Test du χ 2 d’indépendance<br />

Reprenons l’exemple précé<strong>de</strong>nt. Nous souhaitons tester l’hypothèse :<br />

(H0) X et Y sont indépendantes<br />

contre (H1) X et Y ne sont pas indépendantes<br />

50


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

D’après la propriété précé<strong>de</strong>nte, (H0) et (H1) peuvent être réécrites en :<br />

(H0) ∀(i,j) pij = pi × pj<br />

contre (H1) ∃(i,j) / pij = pi × pj<br />

Pour répondre à la question posée, on déci<strong>de</strong> <strong>de</strong> collecter un échantillon <strong>de</strong> n = 148 poissons.<br />

Les résultats observés sont les suivants :<br />

A B C<br />

I 12 (14) 22 (29,135) 22 (12,865) n1. = 56<br />

S 25 (23) 55 (47,865) 12 (21,135) n2. = 92<br />

n.1 = 37 n.2 = 77 n.3 = 34 n.. = 148<br />

Le tableau précé<strong>de</strong>nt est dit tableau <strong>de</strong> contingence <strong>de</strong>s <strong>de</strong>ux variables aléatoires X et Y . On<br />

note nij l’effectif observé pour la modalité i <strong>de</strong> X et j <strong>de</strong> Y . Calculons maintenant les effectifs<br />

théoriques (et le tableau <strong>de</strong> contingence théorique qui en découle) sous l’hypothèse (H0). Sous<br />

(H0) :<br />

Cij = n × pi × pj n × ni.<br />

n<br />

× n.j<br />

n<br />

où on remplace la valeur théorique pi par son estimation ˆpi = ni.<br />

n , et <strong>de</strong> même pj par son<br />

estimation ˆpj = nj.<br />

n . Nous en déduisons alors le tableau <strong>de</strong>s effectifs théoriques (termes entre<br />

parenthèses dans le tableau précé<strong>de</strong>nt).<br />

Remarquons que le test que nous présentons est un test d’adéquation d’une distribution observée<br />

à une distribution théorique où :<br />

1. La distribution théorique est celle du couple (X,Y ) sous l’hypothèse d’indépendance;<br />

2. On se sert <strong>de</strong> l’échantillon pour estimer <strong>de</strong>s paramètres <strong>de</strong> la distribution théorique : les<br />

(pi)i et les (pj)j.<br />

Rappelons ici la propriété vue dans le chapitre précé<strong>de</strong>nt :<br />

Propriété 5.2 Si on estime p paramètres, alors si (H0) est vraie, KH =<br />

approximativement une distribution dite <strong>de</strong> χ 2 à k − 1 − p <strong>de</strong>grés <strong>de</strong> libertés.<br />

Dans notre cas, nous avons KH =<br />

p<br />

q<br />

i=1 j=1<br />

(Oij − Cij) 2<br />

Cij<br />

Calculons alors le nombre <strong>de</strong> paramètres estimés :<br />

• Les pi ? Il y en a p dont p − 1 sont indépendants ;<br />

• Les pj ? Il y en a p dont p − 1 sont indépendants.<br />

51<br />

=<br />

p<br />

i=1 j=1<br />

k (Oi − Ci) 2<br />

suit<br />

i=1<br />

Ci<br />

q (nij − ni. × n.j<br />

)<br />

n<br />

2<br />

ni. × n.j<br />

n


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Nous en déduisons que le <strong>de</strong>gré <strong>de</strong> liberté est égal à :<br />

pq − 1 − (p − 1) − (q − 1)<br />

= pq − p − q + 1<br />

= p × (q − 1) − q + 1<br />

= p × (q − 1) − (q − 1)<br />

= (p − 1) × (q − 1).<br />

Pour notre exemple, nous avons donc KH qui suit approximativement sous l’hypothèse (H0)<br />

une distribution χ 2 (3−1)×(2−1) = χ2 2 . Remarquons que les conditions d’approximation : Cij ≥ 5<br />

sont bien vérifiées ici.<br />

Calculons KHobs =<br />

+ (25 − 23)2<br />

23<br />

+ (55 − 47, 865)2<br />

(12 − 14)2<br />

14<br />

47, 865<br />

+ (22 − 29, 135)2<br />

+ (12 − 21, 135)2<br />

29, 135<br />

21, 135<br />

+ (22 − 12, 865)2<br />

12, 865<br />

= 13, 71.<br />

Fixons nous maintenant un risque α = 0, 05 et calculons la pvaleur = PH0(KH > 13, 71). Nous<br />

emploierons ensuite la règle <strong>de</strong> décision suivante du test :<br />

• Si pvaleur > α alors nous ne rejetons pas (H0) au risque β <strong>de</strong> se tromper<br />

• Si pvaleur < α alors nous rejetons (H0) au risque α <strong>de</strong> se tromper<br />

En lisant la table du χ 2 pour ddl=2, nous en concluons que :<br />

p − valeur = PH0(KH > 13, 71) < PH0(KH > 9, 21) = 0, 01 < 0, 05. D’après la règle <strong>de</strong> décision,<br />

nous concluons au rejet <strong>de</strong> (H0), au risque α <strong>de</strong> se tromper.<br />

Interprétation <strong>de</strong>s résultats<br />

Une fois l’hypothèse (H0) rejetée, nous pouvons regar<strong>de</strong>r quels sont les termes qui contribuent le plus<br />

au rejet :<br />

KH = 13,71 = 0,28 + 1,73 + 6,48<br />

+ 0,17 + 1,06 + 3,94<br />

Dans notre cas, ce sont les <strong>de</strong>ux termes correspondant à la catégorie C qui sont les plus importants.<br />

Ce sont donc ces termes dont nous interpréterons l’écart entre effectifs observés et théoriques. En<br />

l’occurence, pour la catégorie C :<br />

• On a plus d’individus à bouche infère que théoriquement sous (H0);<br />

• On a moins d’individus à bouche supère que sous (H0).<br />

52


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

5.3 Exercices<br />

Exercice 5.1 Dans la Durance vivent -entre autres- <strong>de</strong>ux espèces <strong>de</strong> poissons Chondrostoma nasus et<br />

Chondrostoma toxostoma qui peuvent s’hybri<strong>de</strong>r, donnant lieu à un troisième groupe “hybri<strong>de</strong>s”. On a<br />

échantillonné 626 poissons sur quatre stations : Laragne, Manosque, Pertuis, Cavaillon. Le tableau <strong>de</strong><br />

contingence croisant la variable station à la variable groupe est le suivant :<br />

Cavaillon Pertuis Manosque Laragne Total<br />

“Hybri<strong>de</strong>s” 39 9 26 3 77<br />

Chondrostoma toxostoma 84 136 141 15 376<br />

Chondrostoma nasus 105 13 13 42 173<br />

Total 228 158 180 60 626<br />

1. Proposez un test permettant <strong>de</strong> déci<strong>de</strong>r si la répartition <strong>de</strong>s individus suivant les groupes est<br />

indépendante <strong>de</strong> la station. Vous préciserez notamment les hypothèses H0 et H1, la distribution<br />

utilisée pour la statistique du test sous l’hypothèse H0 ainsi que la règle <strong>de</strong> décision.<br />

2. Les résultat du test fournis par un logiciel sont les suivants :<br />

Cavaillon Pertuis Manosque Laragne Total<br />

Hyb 39 9 26 3 77<br />

? ? 22.14 7.38 77<br />

C. toxostoma 84 136 141 15 376<br />

? ? 108.12 36.03 376<br />

C. nasus 105 13 13 42 173<br />

63.01 43.66 49.74 16.58 173<br />

Total 228 158 180 60 626<br />

Kh = 4.28+5.60+0.67+?+20.47+17.80+?+12.28+27.98+21.53+27.14+38.97=189.32<br />

DL = ?<br />

Remplacer chacun <strong>de</strong>s 7 points d’interrogation par sa valeur, en expliquant ce qu’il représente<br />

et en justifiant votre calcul.<br />

3. Conclure quant au résultat du test, puis interpréter les résultats obtenus. Les stations sont placées<br />

le long du cours d’eau <strong>de</strong> l’amont vers l’aval comme suit : Laragne, Manosque, Pertuis,<br />

Cavaillon. Peut-on parler le gradient amont-aval dans la répartion <strong>de</strong>s 3 groupes ?<br />

Exercice 5.2 Des larves d’une certaine espèce d’insecte ont été récoltées dans <strong>de</strong>s prélévements <strong>de</strong><br />

milieu d’un même site, à trois dates <strong>de</strong> l’année différentes. Les divers sta<strong>de</strong>s <strong>de</strong> développement sont<br />

dénombrés. Les résultats obtenus sont les suivants :<br />

Date Sta<strong>de</strong> 1 Sta<strong>de</strong> 2 Sta<strong>de</strong> 3 Sta<strong>de</strong> 4<br />

T1 36 42 30 18<br />

T2 22 31 22 13<br />

T3 14 17 20 17<br />

Peut-on considérer qu’il y a eu évolution <strong>de</strong> la population larvaire sur le site entre ces trois dates ?<br />

Exercice 5.3 Un mé<strong>de</strong>cin étudie la question suivante : “Les risques <strong>de</strong> complication sont-ils différents<br />

lorsqu’on accouche à l’hôpital ou à domicile ?” Pour y répondre, il a entrepris une enquête réunissant<br />

1000 cas d’accouchement, moitié ayant eu lieu sans accoucheur (à domicile) et moitié avec accoucheur<br />

(à l’hôpital). Les résultats sont les suivants :<br />

53


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Hôpital Domicile<br />

Pas <strong>de</strong> complication 440 480<br />

Avec complication 60 20<br />

1. Définir les variables “Lieu d’accouchement” et “Type <strong>de</strong> complication”, puis proposer un test<br />

permettant <strong>de</strong> déci<strong>de</strong>r s’il existe ou non une dépendance entre ces <strong>de</strong>ux variables.<br />

2. Donner le résultat du test. Le mé<strong>de</strong>cin interprète ce résultat en disant qu’accoucher à l’hôpital<br />

augmente le risque <strong>de</strong> complication . . . mais saisi d’un doute il présente ses résultats à <strong>de</strong>ux<br />

collègues.<br />

- Le premier lui fait remarquer qu’il est possible que l’on fasse plus appel à l’accoucheur<br />

lorsque la situation se présente mal. Le mé<strong>de</strong>cin interroge alors les 60 personnes ayant eu<br />

<strong>de</strong>s complications à l’hôpital et se rend compte que 38 d’entre elles sont allées à l’hôpital<br />

sachant qu’elles avaient un fort risque <strong>de</strong> complication.<br />

- Le second lui <strong>de</strong>man<strong>de</strong> d’augmenter la taille <strong>de</strong> son échantillon. L’enquête complétée<br />

conduit aux résultats suivants :<br />

Hôpital Domicile<br />

Pas <strong>de</strong> complication 861 947<br />

Avec complication 139 53<br />

3. Lequel <strong>de</strong>s <strong>de</strong>ux conseils vous semble-t-il justifié ? Effectuez alors le test complémentaire correspondant<br />

au conseil qui vous semble justifié.<br />

4. Pour quelle raison l’interprétation par le mé<strong>de</strong>cin <strong>de</strong>s résultats du premier test n’était-elle pas<br />

correcte ?<br />

54


Chapitre 6<br />

Liaison entre <strong>de</strong>ux variables aléatoires<br />

continues<br />

6.1 Loi <strong>de</strong> probabilité d’un couple <strong>de</strong> variables aléatoires continues<br />

6.1.1 Définition<br />

On s’intéresse sur <strong>de</strong>s poissons aux <strong>de</strong>ux caractères quantitatifs suivants :<br />

• Longueur à la fourche (X)<br />

• Diamètre <strong>de</strong> l’œil (Y)<br />

Si Ω désigne la population, alors nous pouvons définir :<br />

X : Ω −→ R +<br />

ω ↦−→ X(ω) = longueur à la fourche du poisson ω<br />

Y : Ω −→ R +<br />

ω ↦−→ Y (ω) = Diamètre <strong>de</strong> l’œil du poisson ω<br />

Dans cet exemple, nous observons en fait sur chaque individu <strong>de</strong>ux caractères ou variables aléatoires.<br />

Nous pouvons alors définir le couple (X, Y ) ainsi :<br />

(X, Y ) : Ω −→ R + × R +<br />

ω ↦−→<br />

<br />

X(ω) , Y (ω)<br />

Nous nous interessons ici à la définition <strong>de</strong> la distribution du couple.<br />

Définition 6.1 On appelle loi du couple ou loi <strong>de</strong> probabilité jointe <strong>de</strong> (X, Y ) la probabilité définie<br />

ainsi : ∀ [ax, bx], [ay, by]<br />

<br />

<br />

<br />

[ax, bx], [ay, by] = P ax < X < bx ∩ ay < Y < by<br />

P (X,Y )<br />

<br />

bx by<br />

Propriété 6.1 S’il existe une fonction f(x, y) telle que : P (X,Y ) [ax, bx], [ay, by] = f(x, y)dx dy,<br />

alors f(., .) est dite <strong>de</strong>nsité <strong>de</strong> probabilité du couple.<br />

55<br />

ax<br />

ay


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

6.1.2 Lois marginales<br />

Fig. 6.1 – Densité d’un couple <strong>de</strong> variables réelles (X,Y)<br />

Définition 6.2 On appelle loi marginale <strong>de</strong> X la loi <strong>de</strong> probabilité <strong>de</strong> X prise séparément :<br />

<br />

bx<br />

PX([ax, bx]) = P (X,Y ) [ax, bx], (−∞, +∞) = f(x, y)dy dx,<br />

ax R<br />

<br />

fX(x)<br />

<br />

De la même manière, on définit la loi marginale <strong>de</strong> Y par :<br />

<br />

by <br />

PY ([ay, by]) = P (X,Y ) (−∞, +∞), [ay, by] = f(x, y)dx dy,<br />

ay R<br />

<br />

fY (y)<br />

<br />

6.1.3 Lois conditionnelles<br />

Comme nous l’avons vu au paragraphe précé<strong>de</strong>nt, on peut toujours déduire <strong>de</strong> la loi du couple <strong>de</strong> <strong>de</strong>ux<br />

variables aléatoires la loi <strong>de</strong> chacune <strong>de</strong>s <strong>de</strong>ux variables. Nous allons maintenant nous intéresser à la<br />

liaison entre ces <strong>de</strong>ux variables, c’est à dire à la manière dont les couples (xi, yi) observables sont appariés<br />

dans la loi du couple. Une loi conditionnelle donne, pour une valeur fixée <strong>de</strong> l’une <strong>de</strong>s variables,<br />

la loi <strong>de</strong> probabilité <strong>de</strong> l’autre. Dans notre exemple, cela revient à s’intéresser à la distribution <strong>de</strong> la<br />

longueur Y <strong>de</strong>s poissons conditionnellement à une valeur fixée x du diamètre <strong>de</strong> l’œil.<br />

Nous rappelons les notations :<br />

f (X,Y ) est la <strong>de</strong>nsité <strong>de</strong> probabilité du couple (X, Y )<br />

56


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

fX est la <strong>de</strong>nsité <strong>de</strong> probabilité <strong>de</strong> X<br />

fY est la <strong>de</strong>nsité <strong>de</strong> probabilité <strong>de</strong> Y<br />

<br />

<br />

P x ≤ X < x + dx ∩ y < Y < y + dy<br />

<br />

<br />

<br />

= P y < Y < y + dy / x ≤ X < x + dx<br />

<br />

<br />

× P x ≤ X < x + dx<br />

↓dx → 0, dy → 0 <br />

<br />

↓ dx → 0<br />

f (X,Y )(x, y)dx dy = P y < Y < y + dy / x ≤ X < x + dx × fX(x)dx<br />

<br />

<br />

Nous en déduisons : P y < Y < y + dy / x ≤ X < x + dx f (X,Y )(x, y)<br />

dy.<br />

fX(x)<br />

Définition 6.3 Ainsi, pour tout réel x tel que fX(x) = 0, nous pouvons définir une fonction : fY/X=x :<br />

f(x, y)<br />

y ↦−→ fY/X=x(y) = . Cette fonction s’appelle la <strong>de</strong>nsité conditionnelle <strong>de</strong> Y sachant que X = x.<br />

f(x)<br />

Remarques :<br />

1) On définit <strong>de</strong> même pout tout réel y tel que fY (y) = 0 la <strong>de</strong>nsité conditionnelle <strong>de</strong> X sachant que<br />

f(x, y)<br />

Y = y : fX/Y =y(x) =<br />

fY (y) .<br />

2) Remarquons que f X/Y =y (et <strong>de</strong> même f Y/X=x) ont bien les propriétés d’une <strong>de</strong>nsité <strong>de</strong> probabilité<br />

puisque :<br />

• f X/Y =y(x) =<br />

•<br />

+∞<br />

−infty<br />

f(x, y)<br />

fY (y)<br />

≥ 0.<br />

f X/Y =ydx = 1<br />

fY (y)<br />

+∞<br />

−infty<br />

f(x, y)dx = fY (y)<br />

= 1<br />

fY (y)<br />

6.2 Covariance et coefficient <strong>de</strong> corrélation linéaire<br />

6.2.1 Définitions<br />

Soit (X, Y ) un couple <strong>de</strong> variables aléatoires réelles. On suppose que chacune <strong>de</strong> ces <strong>de</strong>ux variables<br />

possè<strong>de</strong> une espérance et une variance. On note µX, µY leurs espérances, σ2 X et σ2 Y leurs variances.<br />

Définition 6.4 On appelle covariance <strong>de</strong>s variables X et Y et on note cov(X, Y ), σXY le nombre,<br />

s’il existe, défini par :<br />

<br />

<br />

µ (X − µX)(Y − µY ) = <br />

(xi − µX)(yj − µY )pij<br />

si les variables sont discrètes<br />

<br />

<br />

µv (X − µX)(Y − µY )<br />

=<br />

<br />

i<br />

R<br />

<br />

j<br />

R<br />

(x − µX)(y − µY )f (X,Y )(x, y)dxdy où f (X,Y )(x, y)<br />

désigne la <strong>de</strong>nsité <strong>de</strong> probabilité du couple(X, Y )<br />

La covariance possè<strong>de</strong> la propriété d’être nulle lorsque les variables sont indépendantes. Réciproquement,<br />

une covariance nulle n’implique pas l’indépendance entre les variables (sauf dans le cas gaussien).<br />

Cependant la covariance donne <strong>de</strong>s indications sur la liaison entre les <strong>de</strong>ux variables :<br />

• Lorsque cov(X, Y ) < 0, les écarts (X − µX) et (Y − µY ) ont tendance à être <strong>de</strong> signe contraire<br />

et X et Y ont tendance à évoluer en sens contraire ;<br />

• Lorsque cov(X, Y ) > 0, les écarts (X − µX) et (Y − µY ) ont tendance à être <strong>de</strong> même signe et<br />

X et Y ont tendance à évoluer dans le même sens.<br />

57


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Définition 6.5 On appelle coefficient <strong>de</strong> corrélation <strong>de</strong>s variables X et Y le nombre, s’il existe, défini<br />

par :<br />

cov(X, Y )<br />

ρXY = <br />

var(X)var(Y )<br />

Le coefficient <strong>de</strong> corrélation est utilisé pour mesurer le <strong>de</strong>gré <strong>de</strong> liaison entre <strong>de</strong>ux variables. Il vérifie<br />

les propriétés suivantes :<br />

1. −1 < ρXY < 1 et ρXY est inchangé si on change d’unité et/ou d’origine pour X et Y . Cela<br />

signifie que si l’on remplace X par X ′ = aX + b où a ≥ 0 et b ≥ 0, le coefficient <strong>de</strong> corrélation<br />

linéaire entre X ′ et Y est le même que celui entre X et Y .<br />

2. |ρXY | = 1 ⇐⇒ Y = aX + b (cf chapitre sur la régression linéaire. De plus, ρ = 1 → a > 0 et<br />

ρ = 1 → a < 0.<br />

Ces propriétés signifient que le coefficient <strong>de</strong> corrélation linéaire mesure l’association entre X et<br />

Y indépendamment <strong>de</strong>s unités choisies pour ces variables, ce qui facilite gran<strong>de</strong>ment l’interprétation<br />

<strong>de</strong> sa valeur. On peut par exemple dire que la corrélation ρ entre les variables X et<br />

Y est plus forte que celle <strong>de</strong> ρ ′<br />

entre les variables X ′<br />

et Y ′<br />

lorsque ρ est supérieur (en valeur<br />

absolue) à ρ ′<br />

alors qu’une telle conclusion n’aurait aucun sens à propos <strong>de</strong>s covariances (ou <strong>de</strong>s<br />

pentes <strong>de</strong>s droites <strong>de</strong> régression, cf chapitre sur la régression linéaire).<br />

3. L’indépendance <strong>de</strong> X et Y implique ρXY = 0. C’est la liaison la plus faible. Attention, la réciproque<br />

n’est pas vraie sauf pour <strong>de</strong>s cas particuliers comme celui où X et Y sont distribuées<br />

selon une loi normale.<br />

4. ρXY > 0 ←→ X et Y ont tendance à évoluer dans le même sens, ρXY < 0 ←→ X et Y ont<br />

tendance à évoluer en sens contraire.<br />

Propriété 6.2 Soient X et Y <strong>de</strong>ux variables aléatoires quelconques. Alors :<br />

σ 2 (X + Y ) = σ 2 (X) + σ 2 (Y ) + 2cov(X, Y ).<br />

En effet σ2 <br />

2 (X + Y ) = µ X + Y − µ(X) − µ(Y )<br />

<br />

2 = µ (X − µ(X)) + (Y − µ(Y ))<br />

<br />

= µ<br />

(X − µ(X)) 2 + (Y − µ(Y )) 2 + 2 × (X − µ(X)) × (Y − µ(Y ))<br />

= σ 2 (X) + σ 2 (Y ) + 2 cov(X, Y )<br />

En particulier si X et Y sont indépendantes, alors : var(X + Y ) = var(X) + var(Y ).<br />

6.2.2 Estimation du cooefficient <strong>de</strong> corrélation linéaire<br />

On a mesuré sur n = 29 poissons les <strong>de</strong>ux variables aléatoires X=“longueur à la fourche” et Y =“diamètre<br />

<strong>de</strong> l’œil”. Les données observées sont les suivantes :<br />

58


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

1 2 3 4 5 6 7 8 9 10<br />

x 13.91 19.94 14.93 12.94 12.06 16.73 15.75 22.91 23.49 26.45<br />

y 0.70 0.71 0.74 0.68 0.66 0.80 0.81 1.07 1.00 1.11<br />

11 12 13 14 15 16 17 18 19 20<br />

x 27.56 20.61 23.20 25.19 19.23 13.41 14.43 13.97 12.40 13.21<br />

y 1.19 0.94 1.01 1.15 0.86 0.78 0.80 0.77 0.72 0.77<br />

21 22 23 24 25 26 27 28 29<br />

x 13.97 17.25 8.58 18.59 16.75 20.03 12.02 14.43 13.75<br />

y 0.73 0.84 0.54 0.96 0.77 0.98 0.68 0.76 0.78<br />

L’estimateur <strong>de</strong> µX est ¯ X = 1<br />

n<br />

L’estimateur <strong>de</strong> µY est ¯ Y = 1<br />

n<br />

L’estimateur <strong>de</strong> σ 2 X est<br />

L’estimateur <strong>de</strong> σ 2 Y est<br />

1<br />

n − 1<br />

1<br />

n − 1<br />

n<br />

i=1<br />

n<br />

i=1<br />

n<br />

i=1<br />

n<br />

i=1<br />

Xi, son estimation est ¯x = 1<br />

n<br />

Yi, son estimation est ¯y = 1<br />

n<br />

n<br />

xi = 16.95<br />

i=1<br />

n<br />

yi = 0.838<br />

i=1<br />

(Xi − ¯ X) 2 , son estimation est s 2 (x) = 1<br />

n − 1<br />

(Yi − ¯ Y ) 2 , son estimation est s 2 (y) = 1<br />

L’estimateur <strong>de</strong> la covariance cov(X, Y ) est cov(X, Y ) = 1<br />

n − 1<br />

est<br />

1<br />

n − 1<br />

n<br />

(xi − ¯ (x)) × (yi − ¯y).<br />

i=1<br />

n<br />

(xi − ¯x) 2 = 23.76<br />

i=1<br />

n<br />

(yi − ¯y)<br />

n − 1<br />

i=1<br />

2 = 0.026<br />

n<br />

(Xi−¯ (X))×(Yi− ¯ Y ), son estimation<br />

Après simplification par n − 1, nous en déduisons l’estimateur R du coefficient <strong>de</strong> corrélation ρ :<br />

i=1<br />

n<br />

(Xi − ¯ X) × (Yi − ¯ Y )<br />

i=1<br />

R = <br />

<br />

<br />

n<br />

(Xi − ¯ X) 2 ×<br />

i=1<br />

L’estimation r <strong>de</strong> R à partir <strong>de</strong>s données est alors<br />

n<br />

(Yi − ¯ Y ) 2<br />

i=1<br />

n<br />

(xi − ¯x) × (yi − ¯y)<br />

i=1<br />

r = <br />

<br />

<br />

n<br />

(xi − ¯x) 2 ×<br />

i=1<br />

n<br />

(yi − ¯y) 2<br />

L’expression préce<strong>de</strong>nte <strong>de</strong> r peut encore s’écrire sous les formes :<br />

59<br />

i=1


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

r = <br />

<br />

<br />

n i=1<br />

n<br />

i=1<br />

xi × yi − 1<br />

n (<br />

x 2 i − 1<br />

n (<br />

n<br />

i=1<br />

n n<br />

xi) × ( yi)<br />

i=1<br />

xi) 2<br />

×<br />

n <br />

i=1<br />

i=1<br />

n<br />

y 2 i − 1<br />

n (<br />

i=1<br />

=<br />

yi)<br />

2<br />

n<br />

(xi × yi) − n × ¯x × ¯y<br />

i=1<br />

(n − 1) × s2 (x) × s2 (y)<br />

En pratique, on utilise celle <strong>de</strong>s trois formules qui est la plus commo<strong>de</strong> avec les données dont on dis-<br />

n<br />

pose. Dans notre exemple, xi × yi = 433.341. Nous en déduisons alors l’estimation <strong>de</strong> ρ :<br />

r =<br />

i=1<br />

433.81 − 29 × 16.95 × 0.84<br />

(29 − 1) × √ 23.76 × 0.026<br />

= 0.972.<br />

6.2.3 Test <strong>de</strong> l’hypothèse <strong>de</strong> nullité du coefficient <strong>de</strong> corrélation linéaire<br />

L’estimation précé<strong>de</strong>mment observée r est le résultat d’une variable aléatoire. Nous ne pouvons pas,<br />

au vu <strong>de</strong> la seule valeur <strong>de</strong> r conclure à l’existence d’une corrélation entre X et Y ... encore faut-il que<br />

r soit une valeur qu’on a très peu <strong>de</strong> chances d’observer si ρ = 0. Nous présentons maintenant le test<br />

<strong>de</strong> :<br />

(H0) ρ = 0<br />

contre (H1) ρ = 0<br />

Comme pour tous les autres tests que nous avons vus, la construction d’un test du coefficient <strong>de</strong><br />

corrélation linéaire nécessite <strong>de</strong> connaître les fluctuations d’échantillonnage <strong>de</strong> R sous l’hypothèse<br />

(H0). On montre ainsi que sous (H0), et si l’une <strong>de</strong>s <strong>de</strong>ux distributions conditionnelles est normale et<br />

<strong>de</strong> variance constante alors : T = R × √ n − 2<br />

√ suit une distribution <strong>de</strong> Stu<strong>de</strong>nt à n−2 <strong>de</strong>grés <strong>de</strong> liberté.<br />

1 − R2 Le test consiste donc à calculer t0 = r × √ n − 2<br />

√ 1 − r 2 = 21.507 et à en déduire la p-valeur associée à t0 :<br />

P(|T | > t0).<br />

Si on se fixe un risque α (par exemple α = 0.05), nous en déduisons la règle <strong>de</strong> décision du test :<br />

• Si la p-valeur < α, alors nous rejetons (H0) au risque α <strong>de</strong> se tromper ;<br />

• Si la p-valeur > α, alors nous ne rejetons pas (H0) au risque β <strong>de</strong> se tromper.<br />

A l’ai<strong>de</strong> <strong>de</strong> la table <strong>de</strong> Stu<strong>de</strong>nt, nous lisons que : P(|T27| > t0) < P(|T27| > 3.69) = 0.001 < 0.05<br />

Nous concluons donc au rejet <strong>de</strong> (H0) au risque α = 0.05 <strong>de</strong> se tromper : il existe donc bien une<br />

corrélation linéaire (positive) entre les variables aléatoires X=“longueur à la fourche” et Y =“diamètre<br />

<strong>de</strong> l’œil”.<br />

6.3 exercice<br />

Exercice 6.1 Dans une étu<strong>de</strong> sur la dynamique <strong>de</strong>s populations naturelles <strong>de</strong> la tenthrè<strong>de</strong> du pin<br />

(Diprion frutetarum) on a mesuré la longueur y <strong>de</strong> 14 cocons et observé sa capacité <strong>de</strong> reproduction<br />

en comptant le nombre x d’ovocytes matures.<br />

x 9,31 8,31 9,57 10,64 7,54 8,29 8,28 9,57 8,91 7,59 7,39 9,27 6,15 8,08<br />

y 37,94 35,05 32,39 38,90 24,88 40,55 43,78 37,77 36,88 30,44 27,80 42,46 22,74 30,92<br />

60


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

1. Tracer le graphe <strong>de</strong>s observations (yi − ¯y) en fonction <strong>de</strong>s (xi − ¯x), que constatez vous ?<br />

2. Rappeler la définition du coefficient <strong>de</strong> corrélation linéaire ρ(X, Y ) entre <strong>de</strong>ux variables aléatoires<br />

X et Y . Quelles sont ses propriétés ?<br />

3. Donner l’expression <strong>de</strong> l’estimateur r(x, y) <strong>de</strong> ρ(X, Y ) calculé à partir d’un échantillon. Calculer<br />

l’estimation du coefficient <strong>de</strong> corrélation linéaire dans notre cas.<br />

4. On supposera désormais que la distribution <strong>de</strong> Y à X = x fixé est normale. On désire tester<br />

l’hypothèse (H0) : ρ(X, Y ) = 0 contre (H1) : ρ(X, Y ) = 0. Construire le test et conclure.<br />

61


Chapitre 7<br />

Régression linéaire simple<br />

7.1 Introduction<br />

L’étu<strong>de</strong> <strong>de</strong> l’association entre <strong>de</strong>ux variables quantitatives X et Y est un problème où :<br />

(a) Les <strong>de</strong>ux variables peuvent jouer un rôle symétrique : on souhaite savoir si les variables évoluent<br />

conjointement. C’est le cas que nous avons vu au chapitre précé<strong>de</strong>nt avec X=“longueur à la fourche”<br />

et Y =“diamètre <strong>de</strong> l’œil”.<br />

(b) Les <strong>de</strong>ux variables ne jouent pas un rôle symétrique. Par exemple, si Y =“poids <strong>de</strong> naissance du<br />

nourrisson” et X=“poids <strong>de</strong> naissance <strong>de</strong> la mère”, on peut se poser la question suivante : le poids <strong>de</strong><br />

la mère est-il la “cause” du poids <strong>de</strong> naissance <strong>de</strong> l’enfant? Ou, même si ce n’est pas le cas, peut-on<br />

-au vu du poids maternel- prédire celui du nourrisson ?<br />

On parle alors pour Y <strong>de</strong> “variables réponse”, “variable à expliquer”, “variable à prédire”, “variable<br />

endogène”, “variable endogène” ou <strong>de</strong> “variable dépendante‘” ;<br />

On parle pour X <strong>de</strong> “facteur”, “variable explicative”, “variable prédictrice”, “variable exogène”, ou “variable<br />

indépendante”.<br />

Pour décrire les liens entre les variables aléatoires X et Y , la régression consiste à décrire au mieux la<br />

façon dont Y varie en fonction <strong>de</strong> X. Cela revient à décrire la distribution <strong>de</strong> Y pour chaque valeur x<br />

<strong>de</strong> X. L’existence d’un lien entre X et Y correspond à une situation où la distribution <strong>de</strong> Y varie selon<br />

les valeurs <strong>de</strong> X. Inversement, l’absence <strong>de</strong> lien correspond au cas où la distribution <strong>de</strong> Y est inchangée<br />

quelle que soit la valeur <strong>de</strong> X. Ainsi, (b) n’est pas une restriction du cas (a), mais correspond à une<br />

situation qui se pose souvent en pratique.<br />

7.2 Le modèle<br />

Nous allons étudier l’exemple suivant 1 : On a mesuré pour 12 stations situées aux environs <strong>de</strong> Banyuls<br />

<strong>de</strong>ux variables :<br />

• La distance à la côte X (en m)<br />

• Le taux <strong>de</strong> salinité Y (en ln(g/m 2 ))<br />

1 Données <strong>de</strong> Lebreton et al : Principal component analysis analyses with respect to instrumental variables :<br />

an overview of their role in studies of structure -activity and species - environment relationships. In : Applied<br />

multivariate analysis in SAR and environmental studies. 1991<br />

62


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Les données sont représentées par n couples (xi, yi) d’observations données dans le tableau suivant :<br />

Relevé Salinité Distance à la côte<br />

1 7,3 23<br />

2 6,60 29<br />

3 5,70 35<br />

4 6,80 57<br />

5 6,20 57<br />

6 6,30 60<br />

7 5,90 62<br />

8 5,60 66<br />

9 5,40 80<br />

10 4,60 85<br />

11 4,99 100<br />

12 4,13 123<br />

Le modèle que nous allons étudier et que nous appellerons modèle <strong>de</strong> regression linéaire s’applique<br />

aux conditions expérimentales suivantes : les valeurs xi prises par X sont supposées connues<br />

sans erreur dans tout le domaine <strong>de</strong>s valeurs possibles. Elles peuvent être :<br />

• Choisies a priori (exemple : doses d’un engrais fourni à <strong>de</strong>s unités expérimentales);<br />

• Mesurées après avoir déterminé sur quelles unités expérimentales se feraient les mesures (exemple :<br />

tirage au sort dans une population plus vaste).<br />

Dans notre exemple, on supposera la distance à la côte connues exactement, les places ou stations<br />

choisies a priori.<br />

Si nous pensons que la relation entre Y et X est linéaire, si nous pensons que l’une (X) peut expliquer<br />

l’autre (Y ), nous écrivons leur relation sous la forme :<br />

Yi = a + b × xi + Ei i = 1, . . .,n<br />

Cela signifie que, la valeur <strong>de</strong> X étant fixée à x, le résultat (aléatoire) <strong>de</strong> Y se décompose en :<br />

• une composante fixe (a + b × x) : c’est la salinité moyenne théorique <strong>de</strong>s parcelles situées à<br />

une distance x <strong>de</strong> la côte. Cette moyenne théorique est ainsi supposée varier <strong>de</strong> manière linéaire<br />

avec la distance à la côte.<br />

a est un paramètre constant et représente l’ordonnée à l’origine<br />

b est un paramètre constant, appelé coefficient <strong>de</strong> régression ou pente : il représente l’augmentation<br />

moyenne du ln(sal) lorsque la distance augmente d’une unité. Soulignons qu’il s’agit d’une<br />

augmentation moyenne : la différence <strong>de</strong> salinité entre <strong>de</strong>ux stations éloignées d’un mètre est en<br />

moyenne égale à b.<br />

• Une composante aléatoire Ei qui représente l’écart <strong>de</strong> l’individu i à la moyenne théorique. Il<br />

est appelé résidu. Nous supposerons les (Ei) indépendants et <strong>de</strong> même variance (supposition1),<br />

<strong>de</strong> même moyenne théorique 0 et variance théorique σ 2 (supposition 2), et distribuées selon une<br />

loi normale (supposition 3). σ 2 est dite variance résiduelle. C’est également la variance <strong>de</strong> Y<br />

lorsque X = x est fixé. On a donc σ 2 Y > σ2 .<br />

La relation (1), complétée par les suppostions (1) à (3) sur les résidus constitue le modèle <strong>de</strong> régression<br />

linéaire. Nous employons le terme <strong>de</strong> supposition (traduction <strong>de</strong> l’anglais assumption) <strong>de</strong> préférence à<br />

63


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

celui d’hypothèse. En effet, le sens donné à “hypothèse” en statistique est très précis : on teste une<br />

hypothèse alors qu’on vérifie -ou pas- une supposition.<br />

On parle pour (1) <strong>de</strong> modèle <strong>de</strong> régression linéaire simple :<br />

• linéaire car les <strong>de</strong>ux paramètres (a et b) interviennent <strong>de</strong> façon linéaire dans (1) . On exprime<br />

E(Y/X = x), la moyenne théorique <strong>de</strong> Y à x fixé, comme une fonction linéaire <strong>de</strong> x. Si la<br />

relation est autre que linéaire, on parle <strong>de</strong> régression non linéaire.<br />

• simple car il n’y a qu’une seule variable explicative X. Lorsqu’il y en a plusieurs, on parle <strong>de</strong><br />

régression multiple.<br />

• régression pour <strong>de</strong>s raisons historiques. Le terme <strong>de</strong> régression a une origine curieuse. Il remonte<br />

à l’étu<strong>de</strong> par Sir Francis Galton (cousin <strong>de</strong> Darwin et fondateur <strong>de</strong> l’eugénisme) <strong>de</strong> la<br />

relation entre la taille <strong>de</strong>s parents et celle <strong>de</strong>s enfants. Il observa que les enfants <strong>de</strong> parents <strong>de</strong><br />

petite taille avaient tendance à être <strong>de</strong> petite taille mais pas autant que leurs parents. Ils avaient<br />

plutôt une taille les rapprochant <strong>de</strong> parents moyens. Il en était <strong>de</strong> même pour les enfants <strong>de</strong><br />

parents ayant une gran<strong>de</strong> taille : leurs enfants semblaient “régresser” vers la moyenne (dans le<br />

sens <strong>de</strong> retourner vers un état antérieur). Galton appela “rapport <strong>de</strong> régression filiale” la pente<br />

(< 1) <strong>de</strong> la relation linéaire entre la taille <strong>de</strong>s parents et celle <strong>de</strong>s enfants.<br />

Une fois choisi le modèle linéaire (1) et faisant les suppositions (1) à (3), <strong>de</strong>ux questions se posent :<br />

• Quelles sont les valeurs <strong>de</strong> a et b ?<br />

• La pente <strong>de</strong> la droite a + b × x est-elle différente <strong>de</strong> 0 ?<br />

Cette secon<strong>de</strong> question est intéressante car elle permet <strong>de</strong> tester l’existence d’un lien entre X et Y . En<br />

effet, si b = 0, E(Y/X = x) = a : la moyenne conditionnelle <strong>de</strong> Y ne dépend pas <strong>de</strong> X ou encore qu’il<br />

n’existe pas <strong>de</strong> lien en moyenne entre X et Y .<br />

Enfin, notons bien qu’un absence <strong>de</strong> relation est plus exactement ici une absence <strong>de</strong> relation linéaire<br />

. . . mais un autre type <strong>de</strong> relation (non linéaire) peut très bien exister entre X et Y .<br />

Y<br />

X<br />

Fig. 7.1 – Deux type <strong>de</strong> relations pouvant lier Y à X : (a) linéaire; (b) non linéaire.<br />

64<br />

Y<br />

X


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

7.3 Estimation <strong>de</strong>s coefficients du modèle par la métho<strong>de</strong> <strong>de</strong>s<br />

moindres carrés<br />

Chaque individu i est caractérisé par un couple (xi, yi). On peut le représenter par un point sur le<br />

graphique suivant.<br />

log(sal)<br />

4.5 5.0 5.5 6.0 6.5 7.0<br />

(xi, yi)<br />

20 40 60 80 100 120<br />

dist<br />

(xi, yi=a + b xi)<br />

Fig. 7.2 – Graphe <strong>de</strong>s observations (xi,yi) et <strong>de</strong> la droite <strong>de</strong>s moindres carrés.<br />

Principe : nous allons, pour notre jeu <strong>de</strong> données, estimer la droite <strong>de</strong> régression a + b × x par la<br />

droite â + ˆ b × x qui minimise le critère suivant :<br />

SCE =<br />

n<br />

(yi − a − b × xi) 2<br />

â et ˆ b seront dits estimations par la métho<strong>de</strong> <strong>de</strong>s moindres carrés <strong>de</strong>s paramètres a et b.<br />

Propriété 7.1 Les estimations <strong>de</strong>s paramètres a et b par les moindres carrés sont :<br />

ˆ b =<br />

n<br />

i=1<br />

â = 1<br />

n<br />

xi × yi − 1<br />

n (<br />

n<br />

i=1<br />

x 2 i<br />

i=1<br />

− 1<br />

n (<br />

n<br />

yi − ˆb × ¯x.<br />

i=1<br />

i=1<br />

n n<br />

xi) × ( yi)<br />

n<br />

xi) 2<br />

i=1<br />

i=1<br />

Exemple : nous avons ¯x = 5, 8, ¯y = 64, 75, s 2 x<br />

=<br />

n<br />

xi × yi − n × ¯x × ¯y<br />

i=1<br />

= 848, 75 et<br />

65<br />

(n − 1) × s 2 x<br />

; =<br />

cov(x, y)<br />

s 2 x<br />

n<br />

xi × yi = 4250, 26. Nous en déduisons :<br />

i=1


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

ˆb =<br />

4250, 26 − 12 × 5, 8 × 64, 75<br />

11 × 848, 75<br />

= −0, 0278<br />

â = 64, 75 − (−0, 0278) × 5, 8 = 7, 6<br />

Démonstration <strong>de</strong> la propriété :<br />

La droite <strong>de</strong>s moindres carrés correspond aux valeurs <strong>de</strong> a et b pour les quelles SCE est minimum. Pour<br />

estimer a et b, on utilise un résultat mathématique classique : le point où la dérivée d’une fonction est<br />

nulle correspond à un minimum ou à un maximum <strong>de</strong> cette fonction. On obtient ainsi les coefficients<br />

â et ˆ b <strong>de</strong> la droite <strong>de</strong> régression en annulant les dérivées <strong>de</strong> SCE par rapport à a et à b. On montre<br />

qu’il s’agit bien d’un minimum. Les <strong>de</strong>ux équations obtenues en dérivant SCE par rapport à a, puis<br />

par rapport à b, sont les suivantes :<br />

⎧<br />

⎪⎨<br />

⎪⎩<br />

∂SCE<br />

∂a<br />

∂SCE<br />

∂b<br />

=<br />

=<br />

n<br />

−2 × (yi − a − b × xi) = −2 ×<br />

i=1<br />

n<br />

yi + 2 × n × a + 2 × b ×<br />

i=1<br />

n<br />

−2 × xi × (yi − a − b × xi) = −2 ×<br />

i=1<br />

La première équation donne : â = ¯y − ˆ b × ¯x.<br />

La secon<strong>de</strong> équation donne en remplaçant â par ¯y − ˆ b × ¯x :<br />

−<br />

n<br />

xi × yi + ¯y ×<br />

i=1<br />

⇐⇒ ˆ n b ×<br />

⇐⇒ ˆ b =<br />

i=1<br />

x 2 i<br />

− n × ¯x2<br />

n<br />

xi + ˆb ×<br />

i=1<br />

=<br />

n<br />

i=1<br />

x 2 i = 0<br />

n<br />

xi × yi + 2 × a ×<br />

i=1<br />

n<br />

xi × yi − n × ¯y × ¯x<br />

i=1<br />

⇐⇒ ˆ n b × x<br />

i=1<br />

2 i − 1<br />

n<br />

× ( xi)<br />

n<br />

i=1<br />

2<br />

=<br />

n<br />

xi × yi − n × ¯y × ¯x<br />

i=1<br />

n<br />

i=1<br />

x 2 i<br />

− 1<br />

n<br />

× (<br />

n<br />

xi) 2<br />

i=1<br />

=<br />

n<br />

xi × yi − n × ¯y × ¯x<br />

i=1<br />

n<br />

xi × yi − n × ¯y × ¯x<br />

i=1<br />

(n − 1) × s 2 x<br />

n<br />

xi = 0<br />

i=1<br />

n<br />

xi + 2 × b ×<br />

Remarque : â et ˆ b présentés dans la propriété précé<strong>de</strong>nte sont <strong>de</strong>s réalisations <strong>de</strong>s variables aléatoires :<br />

B =<br />

n<br />

xi × Yi − 1<br />

n<br />

× ( xi) ×<br />

n<br />

i=1<br />

n<br />

x<br />

i=1<br />

2 n 1<br />

i − × ( xi)<br />

n<br />

i=1<br />

2<br />

n<br />

n<br />

i=1<br />

i=1<br />

Yi<br />

i=1<br />

xi<br />

n<br />

i=1<br />

Yi<br />

A = − B ×<br />

n n<br />

A et B sont dits estimateurs <strong>de</strong> a et b. Les valeurs numériques qu’ils prennent sur un échantillon (â<br />

et ˆb) sont appelées estimations.<br />

Propriété 7.2 Sous le modèle linéaire Yi = a + b × xi + Ei et en supposant les Ei indépendants<br />

<strong>de</strong> moyenne théorique nulle et <strong>de</strong> variance σ 2 constante, alors A et B sont <strong>de</strong>s estimateurs sans biais<br />

<strong>de</strong> a et b (ie µ(A) = a et µ(B) = b) qui ont une variance minimale parmi les estimateurs qui sont <strong>de</strong>s<br />

fo nctions linéaires <strong>de</strong>s Yi.<br />

66<br />

i=1<br />

n<br />

i=1<br />

x 2 i<br />

= 0


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Propriété 7.3 Un estimateur <strong>de</strong> σ2 est donné par S = 1<br />

n<br />

(Yi − A − B ×xi)<br />

n − 2<br />

i=1<br />

2 . Son estimation<br />

est donc égale à s2 = 1<br />

n<br />

(yi − â −<br />

n − 2<br />

ˆb × xi) 2 . On note aussi s2 = ˆ σ2 i=1<br />

Remarque : L’expression s 2 est aussi égale à s 2 =<br />

avons s 2 y = 0.85. Nous en déduisons s 2 =<br />

n − 1<br />

n − 2 × (s2y − b2 × s 2 x ). Pour notre exemple, nous<br />

12 − 1<br />

12 − 2 × (0.85 − (0.0278)2 × 848.75) = 0.213.<br />

7.4 Test <strong>de</strong> la pente <strong>de</strong> la droite <strong>de</strong> régression<br />

7.4.1 Construction du test<br />

Dans le modèle Yi = a + b × xi + Ei, le terme a + b × xi est l’équation d’une droite dont b est la<br />

pente. Nous souhaitons tester :<br />

(H0) b = 0<br />

contre (H1) b = 0<br />

Il est bien entendu possible <strong>de</strong> présenter un test concernant a, mais sauf dans <strong>de</strong>s cas très particuliers<br />

il n’a pas d’intérêt.<br />

Comme nous l’avons déjà fait, par exemple dans le cas du test <strong>de</strong> comparaison <strong>de</strong> <strong>de</strong>ux moyennes<br />

(chapitre 3), il faut pour construire le test déterminer les fluctuations d’échantillonnage ou loi <strong>de</strong> probabilité<br />

<strong>de</strong> B lorsque (H0) est vraie.<br />

Propriété 7.4 Soit le modèle linéaire Yi = a + b × xi + Ei, et les suppositions : (1) Les Ei sont<br />

indépendants, <strong>de</strong> moyenne théorique nulle, et <strong>de</strong> même variance σ 2 , (2) Les Ei sont distribués selon<br />

une loi normale.<br />

Alors, T =<br />

B − b<br />

s 2 B<br />

suit une loi <strong>de</strong> Stu<strong>de</strong>nt à n − 2 <strong>de</strong>grés <strong>de</strong> libertés, où σ2 sy<br />

(<br />

B =<br />

n − 2<br />

En particulier si (H0) est vraie, nous avons T = B<br />

s 2 B<br />

libertés.<br />

s 2 B sera estimée par s 2 B<br />

Construction du test<br />

= ( sy<br />

sx )2 − b 2<br />

n − 2<br />

Calculons la valeur observée <strong>de</strong> la statistique du test : Tobs = ˆ b<br />

s 2 B<br />

= ( sy<br />

sx )2 − b 2<br />

= ( 0.85<br />

848.75 )2 − (−0.0278) 2<br />

car s2 B = 0.000023.<br />

n − 2 12 − 2<br />

Calculons maintenant la p − valeur = P(|T | > 5.81).<br />

67<br />

sx )2 − B 2<br />

qui suit une loi <strong>de</strong> Stu<strong>de</strong>nt à n − 2 <strong>de</strong>grés <strong>de</strong><br />

= −0.0278<br />

√ 0.000023 = −5.81<br />

.


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Si on se fixe un risque α (par exemple α = 0.05), nous en déduisons la règle <strong>de</strong> décision du test :<br />

• Si la p-valeur < α, alors nous rejetons (H0) au risque α <strong>de</strong> se tromper ;<br />

• Si la p-valeur > α, alors nous ne rejetons pas (H0) au risque β <strong>de</strong> se tromper.<br />

Ici, pour α = 0.05, nous lisons dans la table <strong>de</strong> Stu<strong>de</strong>nt que : P(|T | > 2.228) = 0.05. Or, 5.81 ><br />

2.228 ⇒ P(|T | > 5.81) < P(|T | > 2.228) = 0.05. D’après la règle <strong>de</strong> décision, nous en concluons au<br />

rejet <strong>de</strong> (H0) au risque α = 0.05 <strong>de</strong> se tromper.<br />

7.4.2 Interprétation du test <strong>de</strong> la pente<br />

Il faut bien avoir conscience que l’hypothèse testée est celle d’une relation linéaire entre les variables<br />

X et Y . Ainsi, un non rejet <strong>de</strong> l’hypothèse (H0), en admettant que la décision ne soit pas fausse, peut<br />

correspondre aux cas suivants : (a) Il n’existe pas <strong>de</strong> relation (linéaire ou pas) entre X et Y ; (b) Il<br />

existe un autre type <strong>de</strong> relation que linéaire entre X et Y .<br />

De même, un rejet <strong>de</strong> l’hypothèse (H0) signifie qu’il existe -au moins- une composante linéaire dans la<br />

relation entre X et Y .<br />

Y<br />

Y<br />

(a)<br />

(c)<br />

X<br />

X<br />

Fig. 7.3 – Régression linéaire <strong>de</strong> Y en X : (a) Il n’existe pas <strong>de</strong> relation (linéaire ou pas) entre<br />

X et Y ; (b) Il existe un autre type <strong>de</strong> relation que linéaire entre X et Y ; (c) Il n’existe qu’une<br />

relation linéaire entre X et Y ; (b) Il existe un autre type <strong>de</strong> relation, en plus d’une relation<br />

linéaire, entre X et Y .<br />

Pour cette raison il est important, une fois le modèle linéaire effectué, <strong>de</strong> vérifier la validité <strong>de</strong>s suppositions<br />

du modèle. Par exemple, les résidus (estimés) associés aux modèles (b) et ((d) <strong>de</strong>vraient<br />

68<br />

Y<br />

Y<br />

(b)<br />

(d)<br />

X<br />

X


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

apparaître comme corrélés et <strong>de</strong> ce fait <strong>de</strong>vraient nous amener à remettre en cause le modèle linéaire<br />

pour représenter la liaison entre X et Y .<br />

7.5 Précision <strong>de</strong> la droite <strong>de</strong> régression<br />

Les coefficients a et b <strong>de</strong> la droite <strong>de</strong> régression sont estimés par â et ˆ b à partir <strong>de</strong>s couples <strong>de</strong> valeurs<br />

(xi, yi) observés sur notre échantillon. Comme toute estimation, â et ˆ b sont soumis aux fluctuations<br />

d’échantillonnage.<br />

7.5.1 Intervalle <strong>de</strong> confiance <strong>de</strong> la pente <strong>de</strong> la droite <strong>de</strong> régression<br />

Nous avons précé<strong>de</strong>mment vu que sous les suppositions du modèle linéaire alors : T =<br />

loi <strong>de</strong> Stu<strong>de</strong>nt à n − 2 <strong>de</strong>grés <strong>de</strong> libertés, où σ 2 B<br />

un risque α, alors :<br />

⇐⇒ P(−t α/2 <<br />

= ( sy<br />

sx )2 − B 2<br />

n − 2<br />

P(−t α/2 < T < t α/2) = α<br />

B − b<br />

s 2 B<br />

⇐⇒ P(−t α/2 × s 2 B < B − b < t α/2) × s 2 B<br />

⇐⇒ P(B − t α/2 × s 2 B < b < B + t α/2) × s 2 B<br />

ˆb − tα/2 × s 2 B , ˆ b + t α/2 × s 2 B<br />

Donc, l’intervalle<br />

<strong>de</strong> la pente <strong>de</strong> la droite <strong>de</strong> régression.<br />

< t α/2) = α<br />

= α<br />

= α<br />

B − b<br />

s 2 B<br />

suit une<br />

. Nous en déduisons que, si on se fixe<br />

<br />

constitue un intervalle <strong>de</strong> confiance <strong>de</strong> niveau α<br />

Application : ˆ b = −0.0278, s 2 B = 0.000023. Si on choisit α = 0.05, alors t α/2 = 2.228 pour un <strong>de</strong>gré <strong>de</strong><br />

liberté égal à 12−2 = 10. L’intervalle <strong>de</strong> confiance à 1−α = 0.95 <strong>de</strong> la pente est donc [−0.038, −0.017].<br />

7.5.2 Prédiction <strong>de</strong> Y connaissant x<br />

Une <strong>de</strong>s utilisations importantes <strong>de</strong> la régression linéaire est <strong>de</strong> prédire la valeur <strong>de</strong> y connaissant<br />

x. Cette question a <strong>de</strong>ux aspects selon que l’on s’interesse à la prédiction ˆy <strong>de</strong> la valeur moyenne<br />

E(Y/X = x) ou à la valeur individuelle y lorsque x est fixé.<br />

Intervalle <strong>de</strong> confiance <strong>de</strong> ˆy<br />

La droite <strong>de</strong> régression estimée ˆy = â + ˆ b × x permet <strong>de</strong> calculer la valeur moyenne ˆy pour une valeur<br />

donnée x. Par supposition du modèle, la distribution <strong>de</strong> Y à x fixé est N(a+b×x, σ 2 ). La distribution<br />

<strong>de</strong> la valeur moyenne prédite ˆy est donc aussi normale, et on montre que sa variance est :<br />

n − 1<br />

var(ˆy) =<br />

n − 2 × (s2y − b 2 × s 2 x)<br />

<br />

s2 <br />

1<br />

×<br />

n<br />

Nous en déduisons un intervalle <strong>de</strong> confiance <strong>de</strong> E(Y/X = x) :<br />

<br />

¯y − t n−2, α/2 × s 2 ×[ 1<br />

n<br />

(x − ¯x)2<br />

+<br />

(n − 1)s2 <br />

x<br />

(x − ¯x)2<br />

+<br />

(n − 1)s2 ], ¯y + tn−2, α/2 ×<br />

x<br />

s2 ×[ 1<br />

n<br />

69<br />

(x − ¯x)2<br />

+<br />

(n − 1)s2 <br />

]<br />

x


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Où s 2 constitue une estimation <strong>de</strong> σ 2 .<br />

Remarquons que var(ˆy) dépend <strong>de</strong> x. Elle est minimum pour x = ¯x. En effet, les fluctuations d’échantillonnage<br />

sont moins importantes au voisinage <strong>de</strong> ¯x.<br />

Exemple : ˆy = 7.6−0.0278×x et s2 = 0.213. Nous en déduisons : <br />

<br />

1 (x −<br />

<br />

5.8)2<br />

var(ˆy) = 0.213× + .<br />

12 11 × 848.75<br />

L’expression <strong>de</strong> l’intervalle <strong>de</strong> confiance, au niveau <strong>de</strong> confiance 1 − α = 0.95 est donc :<br />

<br />

1 (x −<br />

<br />

5.8)2<br />

7.6 − 0.0278 + / − 2.228 × 0.213 × + .<br />

12 11 × 848.75<br />

Fluctuation d’échantillonnage <strong>de</strong> la valeur individuelle y prédite connaissant x<br />

Le paragraphe précé<strong>de</strong>nt donnait l’intervalle <strong>de</strong> confiance <strong>de</strong> la moyenne théorique ˆy = E(Y/X = x).<br />

On peut aussi s’intéresser à l’intervalle où se situe la valeur y d’un sujet pour lequel x est fixé. Il<br />

s’agit ici d’un intervalle <strong>de</strong> fluctuation. La prédiction individuelle y à x fixé a pour moyenne théorique<br />

ˆy = a + b × x et pour variance var(ˆy) + σ 2 .<br />

L’intervalle <strong>de</strong> fluctuation <strong>de</strong> la valeur prédite s’écrit donc :<br />

<br />

a + b × x − tn−2,α/2 × var(ˆy) + σ2 , a + b × x + tn−2,α/2 × var(ˆy) + σ2 <br />

Lorsqu’on fait le calcul numérique, il faut remplacer les valeurs théoriques inconnues (a, b, var(ˆy) et<br />

σ 2 ) par leurs estimations. On obtient alors :<br />

<br />

â+ ˆ <br />

b ×x−t n−2,α/2 × s2 × (1 + 1 (x − ¯x)2<br />

+<br />

n (n − 1)s2 ), â+<br />

x<br />

ˆ <br />

b ×x+t n−2,α/2 × s2 × (1 + 1 (x − ¯x)2<br />

+<br />

n (n − 1)s2 <br />

)<br />

x<br />

7.6 Part <strong>de</strong> variance expliquée par la régression<br />

Trois valeurs sont associées à chaque individu : xi, yi et ˆyi = â + ˆb × xi (valeur prédite par le modèle).<br />

n<br />

Nous pouvons alors considérer la décomposition suivante <strong>de</strong> SCET = (yi − ¯y) 2 , variabilité <strong>de</strong>s yi<br />

par rapport à leur moyenne :<br />

n<br />

SCET = (yi − ¯y) 2 =<br />

SCET =<br />

i=1<br />

=<br />

n<br />

(yi − ˆy + ˆy − ¯y) 2<br />

i=1<br />

i=1<br />

i=1<br />

i=1<br />

n<br />

(yi − ˆyi) 2<br />

n<br />

+ (ˆyi − ¯y) 2<br />

n<br />

+ 2 ×(yi − ˆyi) × (ˆyi − ¯y)<br />

<br />

SCER SCEM<br />

=0<br />

n<br />

(yi − ¯y) 2 représente la variabilité totale <strong>de</strong>s yi par rapport à leur moyenne, c’est la<br />

i=1<br />

somme <strong>de</strong>s carrés <strong>de</strong>s écarts totale ;<br />

n<br />

SCER = (yi − ˆyi) 2 représente la variabilité <strong>de</strong>s valeurs observées par rapport aux valeurs<br />

i=1<br />

prédites par le modèle , c’est la somme <strong>de</strong>s carrés <strong>de</strong>s écarts résiduels ;<br />

n<br />

SCEM = (ˆyi − ¯y) 2 représente la variabilité <strong>de</strong>s valeurs prédites par le modèle par rapport à<br />

i=1<br />

la moyenne, c’est la somme <strong>de</strong>s carrés <strong>de</strong>s écarts dus au modèle.<br />

Définition 7.1 On appelle coefficient <strong>de</strong> détermination - ou pourcentage <strong>de</strong> variance expliquée- le<br />

70<br />

i=1


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

rapport : R 2 = SCEM<br />

SCET<br />

= SCET − SCER<br />

SCET<br />

=<br />

n<br />

(ˆyi − ¯y) 2<br />

i=1<br />

n<br />

(yi − ¯y) 2<br />

Exemple SCET = 9, 40, SCEM = 7, 14, SCER = 2, 26. Nous en déduisons que<br />

R 2 = SCEM<br />

SCET<br />

= 7.14<br />

= 0, 76<br />

9.40<br />

On montre que R 2 = B 2 × s2 x<br />

s 2 y<br />

i=1<br />

Propriété 7.5 (test <strong>de</strong> significativité <strong>de</strong> la régression)<br />

SCEM/1<br />

On montre que sous l’hypothèse (H0) b = 0, alors F =<br />

suit une loi <strong>de</strong> Fisher-Sne<strong>de</strong>cor<br />

SCER/(n − 2)<br />

à 1 et (n − 2) <strong>de</strong>grés <strong>de</strong> liberté.<br />

On montre que ce test est équivalent à celui <strong>de</strong> (H0) b = 0 contre (H1) b = 1 et à celui <strong>de</strong> (H0) R = 0<br />

contre (H1) R = 0.<br />

On présente souvent les résultats sous la forme d’un tableau récapitulatif dit tableau <strong>de</strong> décomposition<br />

<strong>de</strong> la variance : ddl SC CM = SC/ddl Fobs p-valeur<br />

distance 1 7.14 7.14 31.57 0.00022<br />

résidus 10 2.26 0.2262<br />

71


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

7.7 Exercices<br />

Exercice 7.1 (A faire en partie sous Excel, jeu <strong>de</strong> données data.exercice7.1.xls)<br />

Les isotopes sont <strong>de</strong>s éléments chimiques possédant un même nombre d’électrons et <strong>de</strong> protons mais<br />

un nombre différent <strong>de</strong> neutrons, ce qui entraîne un nombre <strong>de</strong> masse particulier à chaque isotope. La<br />

plupart <strong>de</strong>s éléments ont plusieurs isotopes stables, par exemple 12C et 13C pour le carbone. On définit<br />

le rapport isotopique d’un organisme<br />

<br />

R −<br />

<br />

Rref<br />

"isotope le moins abondant"<br />

par δ =<br />

× 100 où R =<br />

Rref<br />

"isotope le plus abondant" =<br />

12C pour le carbone et Rref est le<br />

13C rapport d’une référence.<br />

Dans la nature, la composition isotopique varie suivant les organismes. Elle peut varier suivant le<br />

producteur primaire (par exemple les plantes terrestres qui effectuent leur photosynthèse à partir du<br />

CO2 atmosphérique et les algues qui utilisent le carbone inorganique dissous dans l’eau n’auront pas<br />

le même rapport isotopique en carbone), et suivant le niveau trophique (en général, le consommateur<br />

est très légérement enrichi en isotope lourd par rapport à sa nourriture).<br />

La composition <strong>de</strong>s isotopes du carbone est connue comme étant assez stable suivant le niveau trophique<br />

(on admettra par la suite qu’elle est indépendante du niveau trophique), beaucoup plus variable suivant<br />

l’origine du producteur primaire.<br />

On a échantillonné sur la Durance 71 poissons <strong>de</strong> l’espèce Chondrostoma nasus. Pour chaque individu<br />

i on a calcule le rapport isotopique du carbone : yi, et mesuré sa taille xi.<br />

1. Pour quelle raison a-t-on pu effectuer ces mesures ?<br />

2. Représenter graphiquement les valeurs observées yi en fonction <strong>de</strong>s tailles xi. Commenter le graphique.<br />

3. Nous cherchons maintenant à modéliser le rapport isotopique du carbone en fonction <strong>de</strong> la taille<br />

selon le modèle linéaire :<br />

yi = a + b × xi + ɛi,<br />

Dans l’équation précé<strong>de</strong>nte quels sont les termes qui sont aléatoires et ceux qui sont fixes ? Préciser<br />

les suppositions associées au modèle.<br />

4. On se propose maintenant d’estimer les paramètres du modèle par la métho<strong>de</strong> <strong>de</strong>s moindres carrés.<br />

Calculer les estimations <strong>de</strong>s paramètres du modèle par la métho<strong>de</strong> <strong>de</strong>s moindres carrés.<br />

5. Ajouter au graphe précé<strong>de</strong>nt la droite <strong>de</strong> régression. Représenter pour une observation yi la contribution<br />

due au modèle, et celle due au terme résiduel.<br />

6. Donner les expressions <strong>de</strong> la somme <strong>de</strong>s carrés <strong>de</strong>s écarts totale (SCEt), la somme <strong>de</strong>s carrés <strong>de</strong>s<br />

écarts dus à la régression (SCEr) et la somme <strong>de</strong>s carrés <strong>de</strong>s écarts résiduels (SCEr). Calculer sous<br />

Excel les valeurs numériques correspondantes.<br />

7. Quel est le pourcentage <strong>de</strong> la variance totale qui est expliqué par notre modèle ?<br />

8. On se propose <strong>de</strong> tester :<br />

(H0) b = 0<br />

contre (H1) b = 0<br />

72


Télé-<strong>enseignement</strong> <strong>Université</strong> <strong>de</strong> <strong>Provence</strong> <strong>L3</strong><strong>BGSTU</strong> Statistique, N. Pech<br />

Donner sous (H0) la distribution <strong>de</strong> B, l’estimateur <strong>de</strong> b. En déduire la statistique <strong>de</strong> test. Quelle est<br />

la conclusion du test?<br />

9. Proposer une interprétation biologique <strong>de</strong> ce résultat.<br />

10. On définit ˆyi = â × xi + ˆ b et êri = (yi − ˆyi)/s. Tracer les graphiques suivants :<br />

• êri en fonction <strong>de</strong> ˆyi ;<br />

• Un histogramme <strong>de</strong>s êri<br />

Quel est le but <strong>de</strong> chacun <strong>de</strong>s graphes ? Commenter les résultats obtenus.<br />

11. Sous Excel, vérifier que dans le menu Outil l’option Utilitaire d’analyse est bien affichée. Si<br />

ce n’est pas le cas, cliquez sur macro complémentaire, cocher Utilitaire d’analyse et vali<strong>de</strong>r.<br />

Effectuer la régression linéaire <strong>de</strong> y sur x. Interpréter les sorties du logiciel.<br />

Exercice 7.2 Les données ci-<strong>de</strong>ssous donnent, pour 14 années, le nombre <strong>de</strong> <strong>télé</strong>viseurs pour 1000<br />

habitants (variable X) et le nombre <strong>de</strong> mala<strong>de</strong>s mentaux pour 1000 habitants (variable Y).<br />

Année Nbre <strong>de</strong> <strong>télé</strong>viseurs Nbre <strong>de</strong> mala<strong>de</strong>s mentaux<br />

pour 1000 habitants pour 1000 habitants<br />

1970 13 8<br />

1971 20 8<br />

1972 23 9<br />

1973 25 10<br />

1974 27 11<br />

1975 31 11<br />

1976 36 12<br />

1977 46 16<br />

1978 55 18<br />

1979 63 19<br />

1980 70 20<br />

1981 76 21<br />

1982 81 22<br />

1983 85 23<br />

Tracer le graphe y en fonction <strong>de</strong> x. Proposer un modèle <strong>de</strong> régression linéaire expliquant y par x.<br />

A-t-on le droit d’en conclure que le nombre <strong>de</strong> postes <strong>de</strong> <strong>télé</strong>vision a une influence sur le nombre <strong>de</strong><br />

mala<strong>de</strong>s mentaux ?<br />

On donne :<br />

n<br />

xi × yi = 1147,<br />

i=1<br />

n<br />

xi = 651,<br />

i=1<br />

n<br />

yi = 208,<br />

i=1<br />

73<br />

n<br />

i=1<br />

x 2 i = 3490,<br />

n<br />

i=1<br />

y 2 i = 38281.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!