05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 3 : L’annotation discursive à partir d’EXCOM<br />

récupérés sur le Web, à partir <strong>de</strong> l’in<strong>de</strong>xation <strong>de</strong>s valeurs sémantiques associées aux<br />

segments annotés, ce qui est à l’opposé d’une in<strong>de</strong>xation classique sur les termes (voir<br />

[Djioua et Desclés 2007]).<br />

3. L’annotation discursive <strong>automatique</strong> <strong>de</strong> <strong>textes</strong><br />

3.1. Structuration discursive <strong>de</strong>s <strong>textes</strong><br />

<strong>Le</strong> texte, tel qu’il est conçu dans une linguistique qui va au-<strong>de</strong>là <strong>de</strong> la proposition<br />

et <strong>de</strong> la phrase, doit être vu comme une unité <strong>de</strong> sens à part entière avec <strong>de</strong>s structures et<br />

<strong>de</strong>s organisations internes élaborées qui ne se superposent pas toujours les une aux<br />

autres, et non pas comme un assemblage formel ou informel d’énoncés simplement<br />

juxtaposés.<br />

La structure physique d’un texte est l’organisation la plus apparente, son rôle est<br />

<strong>de</strong> découper physiquement le contenu du texte à l’ai<strong>de</strong> <strong>de</strong> différents moyens. Elle fait<br />

apparaître différents éléments matériellement distinguables comme les titres, les<br />

paragraphes, les phrases, les notes, la bibliographie… <strong>Le</strong>s délimitations qui séparent ces<br />

éléments dans la structuration physique prennent l’apparence d’espacements vi<strong>de</strong>s, <strong>de</strong><br />

retour à la ligne simple ou multiple, <strong>de</strong> ponctuations, etc. Toutes ces traces qui révèlent<br />

la structuration physique d’un texte sont d’une gran<strong>de</strong> importance dans la construction<br />

du sens d’un texte, au même titre que les unités linguistiques lexicales et grammaticales.<br />

Si nous prenons en exemple le découpage en paragraphes d’un texte, celui-ci peut<br />

correspondre à un découpage par thèmes <strong>de</strong> l’auteur, comme on le constate souvent.<br />

Ainsi dans ces cas là, chaque paragraphe traite d’un thème différent <strong>de</strong> ceux du même<br />

niveau. Cependant, la structuration physique (en prenant en compte tous les éléments<br />

qui la composent) ne se confond pas toujours avec d’autres types <strong>de</strong> structuration, telle<br />

que la structuration sémantique sous-jacente au texte.<br />

Ceci nous amène alors à traiter d’une autre structure présente au sein du texte, la<br />

structure discursive, qui n’est pas toujours liée à la structuration physique. Prenons<br />

l’exemple suivant qui fait apparaître les traces saillantes d’une telle structuration (nous<br />

avons délibérément ajouté <strong>de</strong>s encadrement pour expliciter celle-ci dans ce passage) :<br />

124

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!