04.07.2013 Views

Exercices et solutions.pdf - IUMSP

Exercices et solutions.pdf - IUMSP

Exercices et solutions.pdf - IUMSP

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Solutions des exercices du Chapitre 2<br />

2.1 Soit X le vecteur à m = 20 composantes contenant les mesures àfaibleniveauprotéique<br />

<strong>et</strong> Y le vecteur à n = 17 composantes contenant les mesures àniveauprotéique élevé.<br />

(a) On pose α =0.25 <strong>et</strong> β =0.75 <strong>et</strong> on obtient:<br />

m(X) =0.453, med(X) =0.750, s(X) =2.805,<br />

[⌊mα⌋] =5,[⌊mβ⌋] = 15, qα(X) =−0.375, qβ(X) =1.385, Iq(X) =1.76;<br />

m(Y )=0.273, med(Y )=0.750, s(Y )=2.007,<br />

[⌊nα⌋] =4,[⌊nβ⌋] = 12, qα(Y )=0.00, qβ(Y )=1.25, Iq(X) =1.25.<br />

Le logiciel R utilise une version lissée de la function de distribution cumulative empirique<br />

dans le calcul des quantiles. Il donne les résultats suivants:<br />

qα(X) =−0.3125, qβ(X) =1.3275, Iq(X) =1.64,<br />

qα(Y )=−0.2500, qβ(X) =1.2500, Iq(X) =1.00.<br />

(b) m(X) >m(Y ), mais les médianes sont identiques. On ne peut pas conclure que ces<br />

résultats soutiennent l’hypotèse.<br />

(c) Après suppression de la donnée 9.00 dans X, onobtient:<br />

m(X) =0.00, med(X) =0.750, s(X) =2.058,<br />

[⌊mα⌋] =4,[⌊mβ⌋] = 14, qα(X) =−1.5, qβ(X) =1.25, Iq(X) =2.75.<br />

Avec R, on obtient Iq =1.635. On remarque que m(X) <strong>et</strong>s(X) changent de façon<br />

importante, tandis que med(X) <strong>et</strong>Iq(X) (version lissée de R) sont presque insensibles<br />

à la suppression de la mesure extrême.<br />

2.2 Soit N le nombre d’étamines. Après élimination de la plus p<strong>et</strong>ite valeur dans les deux<br />

ensembles de données on obtient:<br />

(a) m(N) = 659.32, med(N) = 422, m(log(N)) = 6.056, med(log(N)) = 6.045.<br />

(b) La médiane représente le milieu de la distribution; la moyenne est infuencée par les<br />

valeurs extrêmes (en particulier par les valeurs élevées de N). La moyenne <strong>et</strong> la<br />

médiane de N sont très différentes car la distribution de N est très asymétrique. La<br />

médiane <strong>et</strong> la moyenne de log(N) sonttrès proches, car la distribution de log(N) est<br />

presque symétrique.<br />

(c) On observe que log(med(N)) = 6.045 = med(log(N)).<br />

Ceci s’explique de la façon suivante. Soient n [1] ≤ ...≤ n [99] les valeurs ordonnées de<br />

N. Donc med(N) =n [50] <strong>et</strong> log(med(N)) = log(n [50]). En outre, comme log est une<br />

fonction monotone croissante, les valeurs ordonnées de log(N) sont log(n [1]) ≤ ... ≤<br />

log(n [99]). Donc med(log(N)) = log(n [50]) = log(med(N)).<br />

(g) Avec toutes les données (100), on obtient med(log(N)) = 6.030581 ≈ 6.030685 =<br />

log(med(N)). Il n’y a pas une parfaite égalité car<br />

med(log(N)) = [log(n [50])+log(n [51])]/2 = log[(n [50] + n [51])/2].<br />

(d) Évidemment, la propriété delamédiane que l’on vient d’établir s’étend à tout quantile<br />

(de façon approximative ou exacte selon la définition).<br />

(e) On peut étendre les propriétés susmentionnées à d’autres transformations, pourvu<br />

qu’elle soient monotones croissantes. (Que se passe-t-il pour des transformations<br />

décroissantes ?) La proprété ne vaut pas pour des transformations non monotones:<br />

par exemple, med(sin(N)) = −0.18472 = 0.85554 = sin(med(N)).<br />

(f) On a m(log(N)) = 6.056395 < 6.419214 = log(m(N). La propriété ne vaut pas pour<br />

la moyenne.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!