22.06.2013 Views

3-ponctuation-et-syntaxe-dans-la-langue-francaise - Tunisie ...

3-ponctuation-et-syntaxe-dans-la-langue-francaise - Tunisie ...

3-ponctuation-et-syntaxe-dans-la-langue-francaise - Tunisie ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

→4.2, p. 158. Nous nous limiterons à présenter les concepts fondamentaux; 2 d’autres<br />

techniques plus particulières seront expliquées au moment où nous en ferons usage. 3<br />

4.1.1 Individus <strong>et</strong> variables<br />

Toute étude statistique se doit, après avoir posé c<strong>la</strong>irement <strong>la</strong> question qui <strong>la</strong> motive, de<br />

définir avec précision <strong>la</strong> popu<strong>la</strong>tion qui constituera son champ d’investigation. D’un<br />

point de vue général, elle correspond tout simplement à<br />

«l’ensemble des événements (scores des étudiants, revenus des personnes, vitesses de course<br />

de rats, <strong>et</strong>c.) qui [. . .] intéressent [le chercheur].» (Howell 1998, 2).<br />

Une popu<strong>la</strong>tion est donc un ensemble d’unités distinctes, appelées individus <strong>dans</strong> <strong>la</strong><br />

terminologie statistique.<br />

Comme il n’est pas toujours possible d’observer l’ensemble d’une popu<strong>la</strong>tion, il<br />

faut parfois en extraire un échantillon, c’est-à-dire un certain nombre d’individus, dont<br />

l’effectif est noté n. La sélection de c<strong>et</strong> échantillon peut se révéler délicate, surtout si<br />

elle n’est pas faite aléatoirement (Howell 1998, 2–3). Par exemple, l’ensemble des<br />

chartes originales écrites à Liège avant 1292 constitue un ensemble fini de documents<br />

dont nous ne connaissons pas l’effectif. C<strong>et</strong> ensemble peut être considéré comme <strong>la</strong><br />

popu<strong>la</strong>tion que nous voulons étudier, chaque charte constituant un individu distinct<br />

de c<strong>et</strong>te popu<strong>la</strong>tion. Les chartes r<strong>et</strong>enues pour notre étude ne sont dès lors qu’un<br />

échantillon d’effectif n=148 de <strong>la</strong> popu<strong>la</strong>tion à décrire. Le choix de ces documents<br />

a été contraint par des restrictions pratiques <strong>et</strong> n’est donc pas complètement aléatoire.<br />

Comme nous l’avons précisé lorsque nous avons parlé de <strong>la</strong> constitution du corpus<br />

(→0.2), <strong>la</strong> manière dont s’est é<strong>la</strong>borée <strong>la</strong> collection a d’inévitables conséquences sur<br />

l’homogénéité des données (→4.2).<br />

Un individu se caractérise par un ensemble de variables, auxquelles sont assignées<br />

des valeurs:<br />

«Une fois abordées <strong>la</strong> sélection des suj<strong>et</strong>s <strong>et</strong> leur répartition <strong>dans</strong> des groupes de traitement,<br />

il est temps de considérer les données qui en résulteront. [. . .] Une variable est une propriété<br />

d’un obj<strong>et</strong> ou événement qui peut prendre différentes valeurs. Ainsi, <strong>la</strong> couleur des cheveux<br />

est une variable parce qu’il s’agit de <strong>la</strong> propriété d’un obj<strong>et</strong> (les cheveux) <strong>et</strong> qu’elle peut<br />

prendre différentes valeurs (cheveux bruns, blonds, roux, gris, <strong>et</strong>c.). [. . .] [C]haque élément<br />

de <strong>la</strong> popu<strong>la</strong>tion prend une valeur pour chaque variable. Nous pouvons encore distinguer<br />

les variables discrètes, comme le sexe ou <strong>la</strong> c<strong>la</strong>sse de lycée, qui ne prennent qu’un nombre<br />

limité de valeurs, <strong>et</strong> les variables continues, comme l’âge [. . .], qui peuvent prendre, au moins<br />

en théorie, n’importe quelle valeur entre les points inférieur <strong>et</strong> [4] supérieur de l’échelle.»<br />

(Howell 1998, 3–4).<br />

2<br />

Les détails de ces concepts pourront être lus <strong>dans</strong> le manuel de David Howell (1998): Méthodes<br />

statistiques en sciences humaines nous y ferons souvent référence, en mentionnant<br />

les pages précises où le lecteur pourra trouver les développements qui servent de base à<br />

notre exposé. Le c<strong>la</strong>ssique Initiation aux méthodes de <strong>la</strong> statistique linguistique de Charles<br />

Muller (1973) est toujours très utile. Le premier chapitre du livre de Michael Oakes (1998)<br />

est également riche.<br />

3<br />

Par exemple, le test dit duχ 2 (p. 177s.).<br />

152

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!