22.06.2013 Views

3-ponctuation-et-syntaxe-dans-la-langue-francaise - Tunisie ...

3-ponctuation-et-syntaxe-dans-la-langue-francaise - Tunisie ...

3-ponctuation-et-syntaxe-dans-la-langue-francaise - Tunisie ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Densité<br />

10<br />

8<br />

6<br />

4<br />

2<br />

0<br />

0.00 0.05 0.10 0.15 0.20 0.25<br />

4.1.3 Test d’hypothèse<br />

FIG. 4.4 – Probabilité que R25%<br />

Les propriétés des distributions servent, entre autres, à tester des hypothèses, c’est-àdire<br />

à inférer des informations à partir de <strong>la</strong> structure des données. Ces inférences sont<br />

fondées sur le concept fondamental d’hypothèse nulle (→4.1.3.1). Néanmoins, l’emploi<br />

de méthodes mathématiques pour étudier les données n’affranchit pas totalement<br />

le chercheur du recours à son propre jugement (→4.1.3.2).<br />

4.1.3.1 Concept d’hypothèse nulle<br />

Expliquons les principes du test d’hypothèse à partir de <strong>la</strong> distribution normale présentée<br />

ci-dessus 11 (x=0.13, s=0.035). Imaginons <strong>la</strong> situation suivante: nous découvrons<br />

un nouveau document où <strong>la</strong>proportion de R2 constituants immédiats de <strong>la</strong> phrase est<br />

de 5%, ce qui est très faible. Nous voudrions savoir quelle est <strong>la</strong> probabilité pour ce<br />

nouveau document d’être tiré de <strong>la</strong> même popu<strong>la</strong>tion que l’échantillon déjà décrit.<br />

Il y a deux possibilités: soit le score est anormalement bas, <strong>et</strong> le document, de toute<br />

évidence, ne provient pas de <strong>la</strong> même popu<strong>la</strong>tion; soit le score n’est pas anormalement<br />

bas, <strong>et</strong> il n’y a pas de raison de considérer que le document vient d’une autre popu<strong>la</strong>tion.<br />

Dans c<strong>et</strong>te dernière situation, <strong>la</strong> variation qui existe entre les deux échantillons<br />

ou popu<strong>la</strong>tions comparés (dont, en l’occurrence, un échantillon d’un seul individu)<br />

est due au hasard. L’hypothèse selon <strong>la</strong>quelle <strong>la</strong> variation serait effectivement due au<br />

hasard est appelée situation d’indépendance. L’hypothèse nulle consiste à considérer<br />

c<strong>et</strong>te indépendance comme correspondant à <strong>la</strong> réalité; on <strong>la</strong> note H0. L’hypothèse opposée,<br />

qui consiste à dire qu’il existe une différence suffisamment importante pour<br />

qu’elle ne soit pas liée exclusivement à des causes aléatoires se nomme hypothèse alternative<br />

(notée H1). En règle générale, les tests donnent <strong>la</strong> probabilité que les écarts<br />

par rapport à H0 (appelés écarts à l’indépendance) soient en nombre significativement<br />

élevé.<br />

Nous avons vu que <strong>la</strong> courbe d’une distribution dessinait avec l’axe des abscisses<br />

une surface correspondant à une probabilité de 100%. N’importe quelle valeur située<br />

entre les valeurs extrêmes peut se trouver sous <strong>la</strong> courbe. La probabilité qu’une charte<br />

dont 5% des constituants immédiats de <strong>la</strong> phrase soient des R2 correspond à <strong>la</strong> surface<br />

de <strong>la</strong> courbe dont les valeurs de x sont comprises <strong>dans</strong> l’intervalle [0;0.05] (figure 4.4).<br />

Le calcul de <strong>la</strong> probabilité est ici fait par ordinateur <strong>et</strong> est d’autant plus simple que <strong>la</strong><br />

distribution en présence est normale <strong>et</strong> qu’on en connaît <strong>la</strong> moyenne <strong>et</strong> l’écart-type.<br />

11 Nous n’aurons plus recours à ce test <strong>dans</strong> les pages qui suivent, mais il s’avère qu’il est le<br />

plus simple à comprendre parmi les tests d’hypothèse <strong>et</strong> qu’il m<strong>et</strong> facilement en évidence les<br />

principes du calcul des probabilités.<br />

156

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!