22.06.2013 Views

3-ponctuation-et-syntaxe-dans-la-langue-francaise - Tunisie ...

3-ponctuation-et-syntaxe-dans-la-langue-francaise - Tunisie ...

3-ponctuation-et-syntaxe-dans-la-langue-francaise - Tunisie ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

0.4 Ressources techniques<br />

Avant de les enfouir <strong>dans</strong> les annexes, disons quelques mots des logiciels <strong>et</strong> techniques<br />

informatiques employés pour encoder les données. Aucun logiciel répondant<br />

exactement à nos besoins n’étant disponible, nous avons été contraint de développer<br />

nous-même l’ensemble des programmes employés. De manière très concrète, voici ce<br />

qui a dû être fait.<br />

Les chartes ont été transcrites <strong>et</strong> encodées à l’aide d’une norme <strong>la</strong>rgement répandue<br />

pour stocker les données complexes de nature textuelle: l’eXtensible Markup<br />

Language (XML), qui perm<strong>et</strong> à l’ordinateur de r<strong>et</strong>rouver les mots <strong>et</strong> les signes de<br />

<strong>ponctuation</strong> originaux au moyen de programmes adéquats. Ces derniers sont fournis<br />

en annexe. 9 Les outils de traitement des données prennent <strong>la</strong> forme de scripts 10 écrits<br />

<strong>dans</strong> un <strong>la</strong>ngage nommé Perl. 11 On pourra également consulter les transcriptions diplomatiques<br />

abouties en se reportant aux annexes. 12<br />

Les analyses morphosyntaxiques, conformes à l’exposé du modèle du chapitre 3,<br />

ont été encodées <strong>dans</strong> le même fichier informatique que celui qui contenait l’édition<br />

de chaque charte. Les analyses exhaustives, représentées par des boîtes imbriquées<br />

suivant un ordre déductif al<strong>la</strong>nt des textes aux mots, sont fournies en annexe. 13<br />

Enfin, les chapitres→4 à→7 nécessitaient que les données soient extraites <strong>et</strong><br />

soumises à un nombre important de calculs. La sélection des données (rassemblées<br />

également à l’aide d’un programme Perl) <strong>et</strong> leur traitement numérique prend <strong>la</strong> forme<br />

de scripts écrits <strong>dans</strong> un <strong>la</strong>ngage nommé R, 14 particulièrement adapté aux traitements<br />

statistiques.<br />

Quels que soient les programmes <strong>et</strong> les <strong>la</strong>ngages utilisés, il importe de souligner<br />

deux choses: <strong>la</strong> liberté des codes sources <strong>et</strong> l’absence de garantie.<br />

Les programmes d’extraction des données ne sont pas forcément infaillibles <strong>et</strong><br />

contiennent probablement des erreurs. Dans une perspective scientifique, il est impératif<br />

que le code source des applications soit ouvert <strong>et</strong> documenté. Si les codes sont<br />

reportés en annexe, il reste un important effort de documentation à faire. Qu’on nous<br />

<strong>la</strong>isse poser ici un jugement sévère <strong>et</strong> catégorique sur les logiciels dont les sources,<br />

pour des raisons commerciales ou autres, ne sont pas accessibles aux utilisateurs: pareilles<br />

pratiques nuisent à <strong>la</strong> science. C’est ainsi que les programmes <strong>et</strong> standards que<br />

nous avons choisi d’employer sont libres <strong>et</strong> ouverts. 15<br />

9<br />

Voir <strong>la</strong> section Ressources des annexes.<br />

10<br />

C’est-à-dire de programmes non compilés, «lisibles» <strong>dans</strong> n’importe quel éditeur de texte.<br />

La compi<strong>la</strong>tion des programmes écrits <strong>dans</strong> un <strong>la</strong>ngage de scripts est généralement effectuée<br />

à l’exécution.<br />

11<br />

Version 5.8.7, voir <strong>la</strong> «bible» du <strong>la</strong>ngage, par son créateur: Wall <strong>et</strong> al. 2000.<br />

12<br />

Voir <strong>la</strong> section Transcriptions des annexes.<br />

13<br />

Voir <strong>la</strong> section Analyses syntaxiques.<br />

14<br />

Version 2.4.0, voir R Development Core Team 2005.<br />

15<br />

Les licences d’utilisation de Perl <strong>et</strong> R sont fournies <strong>dans</strong> les paqu<strong>et</strong>s binaires d’instal<strong>la</strong>tion<br />

de ces logiciels; voir <strong>la</strong> section Ressources des annexes.<br />

10

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!