05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 4 : Processus et stratégies <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong><br />

2.5. Nettoyage final du <strong>résumé</strong><br />

A la suite <strong>de</strong> la construction d’un <strong>résumé</strong> par extraction <strong>de</strong>s phrases jugées comme<br />

étant les plus pertinentes (étape 4), il convient en <strong>de</strong>rnier lieu <strong>de</strong> pouvoir améliorer sa<br />

lisibilité (étape 5). Effectivement, l’approche par extraction engendre dans les <strong>résumé</strong>s<br />

produits <strong>de</strong> nombreux problèmes liés à la cohésion, tels que <strong>de</strong>s ruptures <strong>de</strong> liens<br />

anaphoriques, ou à la cohérence, qui peuvent nuire à la bonne interprétation <strong>de</strong> ces<br />

<strong>résumé</strong>s lors <strong>de</strong> leur lecture. Cependant, la gestion entière <strong>de</strong> tels problèmes reste très<br />

difficile et très lour<strong>de</strong>, c’est pourquoi nous proposons comme solution d’effectuer<br />

quelques traitements élémentaires <strong>de</strong> surface consistant en <strong>de</strong>s ajouts ou <strong>de</strong>s retraits<br />

d’éléments textuels dans l’objectif <strong>de</strong> retoucher les <strong>résumé</strong>s afin <strong>de</strong> rendre meilleure<br />

leur lecture.<br />

Cette phase <strong>de</strong> nettoyage final traite un <strong>résumé</strong> en recherchant dans chacune <strong>de</strong><br />

ses phrases celles qui sont composées d’éléments textuels potentiellement nuisibles<br />

(pour la lisibilité) et que l’on souhaite retirer ou modifier. Pour effectuer ce traitement,<br />

nous procédons à l’utilisation <strong>de</strong> différentes règles sous forme d’expressions régulières<br />

qui exécutent <strong>de</strong>s actions d’effacement ou <strong>de</strong> reformulation à partir <strong>de</strong>s formes qu’elles<br />

repèrent. Donnons ainsi <strong>de</strong>ux exemples simples <strong>de</strong> règles :<br />

• Si l’on rencontre une seule expression renvoyant à une énumération dans une<br />

phrase telle que premièrement, <strong>de</strong>uxièmement, d’abord… alors on l’efface. En<br />

effet, l’absence possible <strong>de</strong>s autres phrases rattachées à l’énumération risque <strong>de</strong><br />

nuire sur la lisibilité.<br />

Exemple au sein d’un <strong>résumé</strong> :<br />

Avant : « […] Nous soulignons premièrement l’importance du phénomène<br />

X. Pour terminer, nous dirons que […] »<br />

Après : « […] Nous soulignons l’importance du phénomène X. Pour<br />

terminer, nous dirons que […] »<br />

• Si l’on rencontre un connecteur tel que et, ou... ou un adverbe tel que ensuite…<br />

en début phrase (premier ou <strong>de</strong>uxième terme) alors on l’efface. En effet, un tel<br />

terme marque un lien par rapport à une ou plusieurs phrases qui précè<strong>de</strong>nt. Une<br />

289

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!