Etude de marqueurs linguistiques pour une interprétation ... - Accueil
Etude de marqueurs linguistiques pour une interprétation ... - Accueil
Etude de marqueurs linguistiques pour une interprétation ... - Accueil
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Mémoire <strong>de</strong> Maîtrise Industrie <strong>de</strong> la Langue Laetitia Maraninchi<br />
Figure 4 : Programme du Parti Québécois au format PDF<br />
Le parcours du fichier se fait <strong>de</strong> page en page, comme sous le logiciel <strong>de</strong> traitement <strong>de</strong><br />
texte Word. Cependant, Acrobat Rea<strong>de</strong>r ne permet que la consultation <strong>de</strong>s fichiers, l’édition<br />
n’est pas possible (c’est-à-dire enlever <strong>de</strong>s zones <strong>de</strong> texte ou les déplacer par exemple).<br />
Pour modifier, et par là même manipuler le document ouvert, il faut le copier, mais on<br />
ne peut copier qu’<strong>une</strong> page à la fois, ce qui peut être très long si notre document fait 59 pages,<br />
comme c’est le cas ici.<br />
C’est <strong>pour</strong> cette raison que nous <strong>de</strong>vions convertir ce document au format pdf en un<br />
document au format texte, beaucoup plus modulable. D’autre part on constate la présence<br />
d’images dans ce document pdf, qui peuvent être gênantes lors du traitement <strong>de</strong>s données.<br />
Pour effectuer cette conversion, nous avons utilisé un programme <strong>de</strong> transcodage d’un<br />
fichier pdf en fichier texte. Nous avons téléchargé ce programme <strong>de</strong>puis l’adresse suivante :<br />
http://www.halcyon.com/pub/users/horn/<br />
Les accents et les lettres majuscules ont été supprimés dans la nouvelle version au<br />
format texte du fichier <strong>de</strong> départ.<br />
- 18 -