05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 5 : Evaluation et bilan <strong>de</strong> la tâche <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong><br />

correctement à leur fonction communicative, mais cette métho<strong>de</strong> ne permet toutefois<br />

pas <strong>de</strong> vali<strong>de</strong>r l’apport informatif et la pertinence <strong>de</strong> leur contenu. Un <strong>résumé</strong> peut ainsi<br />

être très bon du point <strong>de</strong> vue <strong>de</strong> sa lisibilité, sans problèmes <strong>de</strong> cohésion ni <strong>de</strong><br />

cohérence, mais totalement insuffisant pour ce qui est <strong>de</strong> l’apport informatif <strong>de</strong> son<br />

contenu. Par ailleurs, une autre catégorie <strong>de</strong> métho<strong>de</strong>s intrinsèques consiste à comparer<br />

les <strong>résumé</strong>s machines à <strong>de</strong>s données attendues en sortie, telles qu’un ou plusieurs<br />

<strong>résumé</strong>s <strong>de</strong> référence, ou encore <strong>de</strong>s phrases pertinentes choisies par <strong>de</strong>s sujets humains<br />

<strong>de</strong>vant être contenues dans le <strong>résumé</strong>. On utilise pour cela un ensemble d’outils<br />

d’estimation, comme les taux <strong>de</strong> précision ou <strong>de</strong> rappel, qui permettent d’analyser <strong>de</strong><br />

manière quantitative les <strong>résumé</strong>s machines aux données <strong>de</strong> références. <strong>Le</strong> calcul <strong>de</strong> ces<br />

valeurs quantitatives, effectué sur la base <strong>de</strong> comparaison entre le <strong>résumé</strong> machine et les<br />

données <strong>de</strong> référence, peut être automatisé. Cette automatisation permet alors un gain <strong>de</strong><br />

temps considérable dans la phase d’évaluation d’un système. Enfin, une autre gran<strong>de</strong><br />

catégorie <strong>de</strong> métho<strong>de</strong>s intrinsèques évalue les <strong>résumé</strong>s machines en prenant en compte<br />

les <strong>textes</strong> qui sont à la source du traitement. La pertinence et l’apport informatif d’un<br />

<strong>résumé</strong> sont alors évalués en rapport avec le texte source et non pas sur <strong>de</strong>s éléments <strong>de</strong><br />

référence choisis arbitrairement, comme dans les métho<strong>de</strong>s précé<strong>de</strong>ntes.<br />

1.1.3. <strong>Le</strong>s métho<strong>de</strong>s extrinsèques<br />

<strong>Le</strong>s métho<strong>de</strong>s extrinsèques cherchent à évaluer un <strong>résumé</strong> en fonction <strong>de</strong> l’utilité<br />

et <strong>de</strong> la capacité qu’il apporte à effectuer certaines tâches. A la suite <strong>de</strong> la lecture d’un<br />

<strong>résumé</strong> par un sujet, on <strong>de</strong>man<strong>de</strong> à ce <strong>de</strong>rnier d’exécuter certaines tâches à partir <strong>de</strong><br />

celui-ci dans l’objectif <strong>de</strong> voir comment seront affectées ces exécutions suivant la<br />

qualité du <strong>résumé</strong>. Il faut ainsi dans ce type d’évaluation proposer <strong>de</strong>s tâches dont la<br />

bonne réalisation dépend <strong>de</strong> la bonne construction du <strong>résumé</strong>, aussi bien dans sa forme<br />

que dans son contenu. Bien souvent, un type <strong>de</strong> tâche que l’on <strong>de</strong>man<strong>de</strong> au lecteur du<br />

<strong>résumé</strong> est <strong>de</strong> répondre à certaines questions en rapport avec le texte source. Un <strong>résumé</strong><br />

est alors considéré comme efficace s’il permet à son lecteur <strong>de</strong> répondre aussi bien au<br />

questionnaire que d’autres lecteurs qui ont lu le texte source, ou que s’il avait le texte<br />

source en libre consultation. Par exemple, si un <strong>résumé</strong> indicatif ou informatif construit<br />

à un taux <strong>de</strong> 10% permet <strong>de</strong> répondre à un ensemble <strong>de</strong> questions qui couvrent 80% du<br />

sujet traité dans le texte, la qualité <strong>de</strong> celui-ci est très bonne puisqu’il satisfait <strong>de</strong><br />

299

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!