23.06.2013 Views

Etude de marqueurs linguistiques pour une interprétation ... - Accueil

Etude de marqueurs linguistiques pour une interprétation ... - Accueil

Etude de marqueurs linguistiques pour une interprétation ... - Accueil

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Mémoire <strong>de</strong> Maîtrise Industrie <strong>de</strong> la Langue Laetitia Maraninchi<br />

Figure 4 : Programme du Parti Québécois au format PDF<br />

Le parcours du fichier se fait <strong>de</strong> page en page, comme sous le logiciel <strong>de</strong> traitement <strong>de</strong><br />

texte Word. Cependant, Acrobat Rea<strong>de</strong>r ne permet que la consultation <strong>de</strong>s fichiers, l’édition<br />

n’est pas possible (c’est-à-dire enlever <strong>de</strong>s zones <strong>de</strong> texte ou les déplacer par exemple).<br />

Pour modifier, et par là même manipuler le document ouvert, il faut le copier, mais on<br />

ne peut copier qu’<strong>une</strong> page à la fois, ce qui peut être très long si notre document fait 59 pages,<br />

comme c’est le cas ici.<br />

C’est <strong>pour</strong> cette raison que nous <strong>de</strong>vions convertir ce document au format pdf en un<br />

document au format texte, beaucoup plus modulable. D’autre part on constate la présence<br />

d’images dans ce document pdf, qui peuvent être gênantes lors du traitement <strong>de</strong>s données.<br />

Pour effectuer cette conversion, nous avons utilisé un programme <strong>de</strong> transcodage d’un<br />

fichier pdf en fichier texte. Nous avons téléchargé ce programme <strong>de</strong>puis l’adresse suivante :<br />

http://www.halcyon.com/pub/users/horn/<br />

Les accents et les lettres majuscules ont été supprimés dans la nouvelle version au<br />

format texte du fichier <strong>de</strong> départ.<br />

- 18 -

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!