05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 4 : Processus et stratégies <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong><br />

L’intérêt du <strong>résumé</strong> indicatif est alors d’autant plus utile dans le cas d’une gran<strong>de</strong> base<br />

<strong>de</strong> <strong>textes</strong> à consulter.<br />

Nous avons détaillé dans le chapitre 3 un ensemble <strong>de</strong> catégories discursives et<br />

nous avons précisé que certaines répon<strong>de</strong>nt mieux à certains types <strong>de</strong> <strong>résumé</strong>s. D’après<br />

notre principe <strong>de</strong> composition <strong>de</strong>s <strong>résumé</strong>s par extraction, nous <strong>de</strong>vons ajouter toutes les<br />

phrases qui, d’après leur catégorie discursive, sont les meilleures pour jouer ensemble la<br />

fonction communicative correspondant à ce type <strong>de</strong> <strong>résumé</strong>. Effectivement, il est<br />

évi<strong>de</strong>nt dans le cas du <strong>résumé</strong> indicatif que certaines catégories discursives sont plus<br />

pertinentes que d’autres, en raison <strong>de</strong> leur rôle et <strong>de</strong> leur effet sur le lecteur. Nous ne<br />

rappelerons pas la définition <strong>de</strong> chacune, mais il est clair que les catégories <strong>de</strong><br />

présentations thématiques, <strong>de</strong> problématiques et d’objectifs <strong>de</strong> l’auteur sont<br />

extrêmement pertinentes dans le cas <strong>de</strong>s <strong>résumé</strong>es indicatifs, tout particulièrement<br />

quand elles sont en début <strong>de</strong> document ou quand elles contiennent un ou plusieurs<br />

termes thématiques. <strong>Le</strong>s phrases appartenant à ces catégories fournissent au lecteur plus<br />

que d’autres les éléments les plus importants pour indiquer sur quoi porte le texte ainsi<br />

que son but. Ensuite peuvent venir les conclusions, les récapitulations finales puis les<br />

hypothèses générales en début <strong>de</strong> document. Nous procédons alors à un positionnement<br />

<strong>de</strong> chaque catégorie discursive au sein d’une hiérarchie propre au <strong>résumé</strong> indicatif (où<br />

en haut sont présentes les catégories les plus pertinentes), en tenant aussi compte <strong>de</strong> la<br />

position textuelle et <strong>de</strong> la présence <strong>de</strong> termes thématiques. Nous présentons dans la<br />

figure ci-<strong>de</strong>ssous (figure 22) l’ordonnancement général <strong>de</strong>s catégories discursives<br />

d’après nos choix et en fonction <strong>de</strong> leur importance pour le <strong>résumé</strong> indicatif 57 . La<br />

stratégie consiste alors à sélectionner prioritairement les phrases appartenant à la<br />

catégorie discursive la plus haute pour ensuite <strong>de</strong>scendre cette hiérarchie<br />

progressivement jusqu’à ce que le nombre <strong>de</strong> phrases soit suffisant pour construire le<br />

<strong>résumé</strong>. Pour certaines catégories (présentation thématique, objectif, hypothèse, etc.),<br />

tous les segments extraits doivent être rattachés à l’auteur et/ou être en rapport avec le<br />

document en cours (on choisit pour cela les annotations correspondantes dans chaque<br />

cas, voir chapitre 3).<br />

57 Nous précisons que la composition du <strong>résumé</strong> qui résulte d’une telle stratégie est entièrement cohérente<br />

avec (par exemple) les observations <strong>de</strong> [Liddy 1991] sur les catégories d’informations contenues dans les<br />

<strong>résumé</strong>s d’articles scientifiques, voir également chapitre 1 partie 2.1.<br />

269

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!