22.06.2013 Views

3-ponctuation-et-syntaxe-dans-la-langue-francaise - Tunisie ...

3-ponctuation-et-syntaxe-dans-la-langue-francaise - Tunisie ...

3-ponctuation-et-syntaxe-dans-la-langue-francaise - Tunisie ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

5 Tendances générales<br />

La première étape de <strong>la</strong> description consistera à rechercher les grandes tendances qui<br />

gouvernent l’apparition de <strong>la</strong> <strong>ponctuation</strong> au sens restreint. Conformément à ce que<br />

nous avons exposé supra (→4.1.1), nous commencerons par définir l’étendue de notre<br />

échantillon <strong>et</strong> les individus qui le composent, en précisant les variables <strong>et</strong> modalités<br />

r<strong>et</strong>enues: celles qui décrivent les propriétés morphosyntaxiques <strong>et</strong> positionnelles des<br />

constituants d’une part, <strong>et</strong> celles qui en décrivent <strong>la</strong> <strong>ponctuation</strong> d’autre part (→5.0).<br />

Un aperçu général de chacune des variables prise isolément sera donné (→5.1), avant<br />

d’envisager <strong>la</strong> manière dont elles entrent en re<strong>la</strong>tion. Les «tris croisés» qui servent à<br />

évaluer les liens entre deux variables seront alors détaillés (→5.2). Nous verrons en<br />

quoi c<strong>et</strong>te démarche, pour instructive qu’elle soit, reste insuffisante si l’on se borne à<br />

séparer les caractères morphosyntaxiques des constituants <strong>et</strong> nous présenterons comment<br />

nous avons contourné ce problème (→5.3).<br />

Que ce soit au point de vue des calculs impliqués ou des variables choisies pour<br />

décrire les données, ce chapitre sera re<strong>la</strong>tivement abstrait, <strong>la</strong> recherche de tendances<br />

générales s’accompagnant d’une réduction inévitable. Néanmoins, <strong>dans</strong> <strong>la</strong> mesure où<br />

les individus seront définis à partir des données empiriques, <strong>et</strong> comme ces dernières<br />

seront réintroduites par <strong>la</strong> suite (chapitres→6 <strong>et</strong>→7), nous pensons que ce caractère<br />

abstrait n’est pas préjudiciable.<br />

5.0 Définition des données<br />

La définition des données est une partie importante de <strong>la</strong> conversion de notre question<br />

<strong>dans</strong> un «<strong>la</strong>ngage statistique» (→4.1). Il s’agira de délimiter l’échantillon étudié, en<br />

choisissant les individus <strong>et</strong> leurs variables définitoires.<br />

5.0.1 Choix des individus <strong>et</strong> taille de l’échantillon<br />

Il semble que pour aborder le problème qui nous intéresse, deux alternatives de définition<br />

des individus s’offrent à nous: ces derniers sont soit les constituants, soit les<br />

ponctogrammes. Pour c<strong>et</strong>te première étape, nous avons considéré que les individus<br />

étaient les constituants.<br />

L’effectif total de l’échantillon (n) est de 90752 individus. C<strong>et</strong> effectif correspond<br />

àl’ensemble des mots (64252 individus 1 ) <strong>et</strong> de tous les constituants construits à partir<br />

de ces mots (récursivement jusqu’au niveau directement inférieur à celui des énoncés,<br />

1 Certains mots à double fonction, comme nel (ne <strong>et</strong> le contractés) sont comptabilisés deux<br />

fois <strong>dans</strong> l’échantillon total des constituants, mais pas <strong>dans</strong> le compte des mots.<br />

167

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!