05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 2 : <strong>Le</strong> <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> <strong>textes</strong><br />

document. Il semble qu’AutoSummarize emploie essentiellement <strong>de</strong>s métho<strong>de</strong>s<br />

statistiques pour évaluer la pertinence <strong>de</strong>s phrases à extraire ou à surligner. La présence<br />

<strong>de</strong> termes fréquents dans une phrase paraît être le critère principal d’estimation <strong>de</strong> sa<br />

pertinence. AutoSummarize fournit à l’utilisateur une application simple d’emploi et<br />

intégrée dans un logiciel très utilisé. Cependant la qualité <strong>de</strong> ses résultats est<br />

globalement pas très bonne, comme le montrera notre évaluation dans le chapitre 5, ce<br />

qui rend cette fonctionnalité par conséquent peu utile pour les utilisateurs. Enfin,<br />

AutoSummarize s’exécute sur un très grand nombre <strong>de</strong> langues (toutes celles que Word<br />

semble pouvoir traiter).<br />

D’un point <strong>de</strong> vue technique, la <strong>de</strong>rnière version d’AutoSummarize (2007)<br />

correspond à une métho<strong>de</strong> <strong>de</strong> la classe document (dont le document courant est un<br />

objet) qui est rattachée au Framework .NET 3.5. (la précé<strong>de</strong>nte 2005 était rattachée au<br />

Framework .NET 2.0). Toutefois il ne semble pas y avoir eu <strong>de</strong> modifications<br />

essentielles mais seulement une intégration au nouveau Framework. Nous donnons la<br />

syntaxe décrivant cette métho<strong>de</strong> dans le langage C# (extrait <strong>de</strong><br />

http://msdn2.microsoft.com):<br />

public Range AutoSummarize(<br />

ref Object <strong>Le</strong>ngth,<br />

ref Object Mo<strong>de</strong>,<br />

ref Object UpdateProperties<br />

)<br />

<strong>Le</strong> paramètre <strong>Le</strong>ngth correspond au taux <strong>de</strong> compression en pourcentage. <strong>Le</strong><br />

paramètre Mo<strong>de</strong> décrit le mo<strong>de</strong> d’affichage du <strong>résumé</strong> (document externe, surlignement,<br />

etc.). Enfin le paramètre UpdateProperties, s’il est mis à la valeur true, met à jour les<br />

zones Mot-clé et Commentaires décrivant le contenu du texte dans la boîte <strong>de</strong> dialogue<br />

Properties. Illustrons cela en donnant un exemple pratique <strong>de</strong> co<strong>de</strong> C# employant cette<br />

métho<strong>de</strong> (extrait <strong>de</strong> http://msdn2.microsoft.com) :<br />

74

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!