11.07.2015 Views

cours et TD - Enseeiht

cours et TD - Enseeiht

cours et TD - Enseeiht

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

12 CHAPITRE 2. STATISTIQUE DESCRIPTIVE– si le nombre d’observations est impair la médiane est ˜x = x n/2+1 .(ii) Pour les données groupées la classe médiane est celle qui contient la médiane. En adm<strong>et</strong>tant que les observationsappartenant à c<strong>et</strong>te classe sont réparties uniformément, la médiane aura pour expression :oùi est l’indice de la classe médiane.x ′ i est la limite inférieure de c<strong>et</strong>te classe.∆x i est l’intervalle de la classe i.F i est la fréquence cumulée relative de la classe i.˜x = x ′ i + ∆x i1/2 − F in iExemple 3.3.7. Pour les données de l’exemple (3.3.1), nous avons :˜x = 66Définition 3.3.8 (Quartiles). On définit de façon similaire les quartiles i.e les 3 quantités qui séparent les donnéesen 4 groupes contenant le même nombre de données. On notera Q 1 , Q 2 <strong>et</strong> Q 3 les trois quartiles.Exemple 3.3.9. Considérons les 24 données suivantes :8 13 27 32 25 16 32 27 8 28 79 25 35 25 38 29 80 50 38 30 20 20 49 9Ces données mises en ordre croissant sont :8 8 9 13 16 20 20 25 25 25 27 27 28 29 30 32 32 35 38 38 49 50 79 80Les quartiles sont alors : Q 1 = 20, Q 2 = ˜x = 27, 5 <strong>et</strong> Q 3 = 36, 5.Remarque 3.3.10. Le deuxième quartile est égale à la médiane.Définition 3.3.11 (Mode). On appelle mode d’une distribution non groupée toute valeur rendant maximale lafréquence. On appelle classe modale d’une distribution groupée toute classe rendant maximale le rapport :FréquenceIntervalle de classeExemple 3.3.12. Pour les données de l’exemple (3.3.1), il y a 3 modes : 63,66,70.Remarque 3.3.13.non cumulées.(i) Le mode est une valeur qui rend maximum la représentation graphique des fréquences(ii) Dans le cas d’une distribution théorique d’une variable aléatoire continue le mode est toute valeur qui maximisela fonction de densité. C’est la valeur “la plus probable”.Les paramètres de position sont très insuffisants pour caractériser des données ; aussi nous avons besoin de savoirsi les observations sont concentrées ou non autour d’un paramètre de position. C’est ce critère que l’on qualifie àl’aide des paramètres de dispersion. Le paramètre le plus connu <strong>et</strong> le plus utilisé est la variance d’un échantillon.Définition 3.3.14 (Variance d’un échantillon). On appelle variance de l’échantillon la quantité :– Si les données sont sous la forme d’une série statistiques 2 = 1 nn∑(x i − ¯x) 2– Si les données sont sous la forme d’une distribution de fréquences absoluess 2 = 1 ni=1p∑n i (x i − ¯x) 2i=1Remarque 3.3.15. (i) On note souvent SCE = ∑ ni=1 (x i − ¯x) 2 . SCE est la Somme des Carrés des Écarts,sous entendu à la moyenne.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!