05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 4 : Processus et stratégies <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong><br />

termes thématiques dans la phrase ne sont que <strong>de</strong>s indices supplémentaires (et pas<br />

suffisants à eux seuls) pour évaluer la pertinence <strong>de</strong> celle-ci. On obtient alors à la fin <strong>de</strong><br />

cette étape un ensemble <strong>de</strong> phrases pertinentes sélectionnées (le nombre variant suivant<br />

la taille du <strong>résumé</strong>), puis ordonnées suivant l’ordre <strong>de</strong> leur apparition dans le texte<br />

d’origine : cet ensemble forme le <strong>résumé</strong> par extraction.<br />

5 ème étape : Phase <strong>de</strong> nettoyage du <strong>résumé</strong> final. On procè<strong>de</strong> en <strong>de</strong>rnier lieu à un<br />

nettoyage du <strong>résumé</strong> afin d’améliorer sa lisibilité. On retire ou on ajoute quelques<br />

éléments au <strong>résumé</strong> pour que celui-ci soit plus agréable à consulter. On traite par<br />

exemple la présence <strong>de</strong>s énumérations (premièrement, <strong>de</strong>uxièmement…) en les retirant<br />

du <strong>résumé</strong>, car les séries énumératives qui les contiennent peuvent ne pas être complètes<br />

puisque seulement une partie restreinte <strong>de</strong>s phrases du texte source sont extraites pour le<br />

<strong>résumé</strong>.<br />

Sortie : Visualisation par l’utilisateur. L’utilisateur peut visualiser le <strong>résumé</strong><br />

obtenu dans une interface où l’on peut faire apparaître distinctement les différentes<br />

catégories discursives contenues dans le <strong>résumé</strong>. Il peut par ailleurs visionner dans un<br />

mo<strong>de</strong> avancé, s’il le souhaite, <strong>de</strong>s informations complémentaires associées à chaque<br />

phrase : <strong>de</strong>scription <strong>de</strong> la catégorie discursive, position dans la structure textuelle,<br />

termes thématiques…<br />

1.2. Application <strong>de</strong> la stratégie résumante<br />

1.2.1. Critères <strong>de</strong> pertinences adoptés<br />

Donnons maintenant une <strong>de</strong>scription plus complète <strong>de</strong>s trois critères que nous<br />

avons choisis dans l’évaluation <strong>de</strong> la pertinence <strong>de</strong>s phrases pour le <strong>résumé</strong><br />

<strong>automatique</strong>. Ces trois critères correspon<strong>de</strong>nt pour une phrase à :<br />

1. sa catégorie discursive (à travers l’annotation qui la désigne),<br />

2. sa position dans la structure textuelle,<br />

3. la présence <strong>de</strong> termes thématiques dans celle-ci.<br />

Par rapport à ce que nous avons dit dans le chapitre 1 sur la pertinence <strong>de</strong>s<br />

informations dans un texte (partie 1.3), l’évaluation <strong>de</strong> la pertinence à partir <strong>de</strong> ces trois<br />

critères est donc liée uniquement à la nature même du texte source, et non à <strong>de</strong>s<br />

préférences quelconques du résumeur ou à la situation <strong>de</strong> production du <strong>résumé</strong>. Ainsi,<br />

261

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!