22.06.2013 Views

3-ponctuation-et-syntaxe-dans-la-langue-francaise - Tunisie ...

3-ponctuation-et-syntaxe-dans-la-langue-francaise - Tunisie ...

3-ponctuation-et-syntaxe-dans-la-langue-francaise - Tunisie ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

0.05 0.10 0.15 0.20<br />

Proportion de marquage<br />

FIG. 4.3 – Boîte à moustache des R2 par phrase, par charte<br />

aperçu plus n<strong>et</strong> de <strong>la</strong> popu<strong>la</strong>tion sous-jacente. 5 La courbe est d’ailleurs n<strong>et</strong>tement plus<br />

douce que ne l’était l’histogramme.<br />

La distribution dessine une cloche dont <strong>la</strong> queue de gauche est approximativement<br />

égale à <strong>la</strong> queue de droite. 6 La distribution est dite gaussienne ou normale (Howell<br />

1998, ch. 3). Une distribution de ce type est adéquatement résumée par sa moyenne (x)<br />

<strong>et</strong> son écart-type (s). Ce dernier correspond à <strong>la</strong> racine carrée positive de <strong>la</strong> variance<br />

(s 2 ). 7 En l’occurrence, x=0.13 <strong>et</strong> s=0.035. Ces paramètres suffisent à dessiner <strong>la</strong><br />

forme de <strong>la</strong> distribution.<br />

4.1.2.4 Boîte à moustaches<br />

Une autre manière utile de représenter les données est le graphique dit de <strong>la</strong> «boîte à<br />

moustaches» (figure 4.3). 8 Celui-ci prend <strong>la</strong> forme d’une boîte grisée pourvue d’une<br />

ou de deux «moustaches» (ligne discontinue, ici horizontale, s’achevant par un trait<br />

perpendicu<strong>la</strong>ire). 9 La boîte montre comment l’essentiel des données se concentre autour<br />

de <strong>la</strong> médiane. 10 (trait noir). Les moustaches représentent <strong>la</strong> dispersion des données<br />

Quant aux points extérieurs, il s’agit de valeurs adjacentes, qu’il faut considérer<br />

comme atypiques. L’orientation de <strong>la</strong> boîte n’a aucune signification particulière.<br />

5<br />

Par exemple, un histogramme comportant 50 c<strong>la</strong>sses, n’aurait pas présenté une forme particulière.<br />

6<br />

Ceci anticipe sur <strong>la</strong> suite de l’exposé (→4.1.3), mais il est possible de se servir de tests<br />

spécifiques <strong>et</strong> de techniques de représentations pour appréhender <strong>la</strong> normalité des données.<br />

Nous ne nous étendrons pas sur le suj<strong>et</strong>. Nous indiquons au lecteur intéressé que le test<br />

de Shapiro-Wilks (Upton/Cook 2006, 388–389) sur l’échantillon ne perm<strong>et</strong> pas de rej<strong>et</strong>er<br />

H0 (→4.1.3.1) <strong>et</strong> d’affirmer l’anormalité de <strong>la</strong> popu<strong>la</strong>tion. L’examen de <strong>la</strong> droite de Henry<br />

montre qu’on peut raisonnablement accepter <strong>la</strong> normalité. Voir annexe 4.1.2.3.shapiro.txt.<br />

7<br />

Voir Howell 1998, 50–51. La variance est calculée en faisant <strong>la</strong> somme des écarts au carré<br />

de chaque valeur (où x représente chaque valeur <strong>et</strong> n <strong>la</strong> taille de l’échantillon):<br />

s 2 <br />

(x− x) 2<br />

=<br />

n−1<br />

8 Voir Howell 1998, §2.10.<br />

9 Voir Howell 1998, 60–63.<br />

10 Valeur de <strong>la</strong> distribution qui compte autant de valeurs qui lui sont inférieures que de valeurs<br />

qui lui sont supérieures; voir Howell 1998, 39.<br />

155<br />

(4.1)

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!