05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 5 : Evaluation et bilan <strong>de</strong> la tâche <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong><br />

1. Evaluation du <strong>résumé</strong> <strong>automatique</strong> à partir d’EXCOM<br />

1.1. L’évaluation <strong>de</strong> <strong>résumé</strong>s produits <strong>automatique</strong>ment<br />

1.1.1. Présentation<br />

L’évaluation est une phase essentielle dans le développement d’applications<br />

informatiques pour le traitement <strong>de</strong>s langues naturelles, car elle permet d’estimer à la<br />

fin <strong>de</strong> la phase <strong>de</strong> développement la capacité d’une application, ainsi que son efficacité<br />

à effectuer <strong>de</strong>s tâches qu’on lui soumet. Au sein <strong>de</strong> la recherche dans le milieu du TAL<br />

et <strong>de</strong> la recherche d’informations, l’évaluation est ainsi <strong>de</strong>venue une condition<br />

nécessaire à la validité et au sérieux <strong>de</strong>s travaux. Nous ne présenterons pas ici les<br />

avantages bien connus <strong>de</strong> l’évaluation dans le domaine <strong>de</strong>s applications logiciels, nous<br />

renvoyons pour cela à la littérature portant sur ce sujet. Toutefois, nous ferons une<br />

remarque. En effet, si les conséquences positives <strong>de</strong> l’évaluation ne sont pas à<br />

démontrer dans la construction d’outils informatiques performants, un « excès<br />

d’évaluation » amène, ou plutôt oriente <strong>de</strong>s projets dans le but unique d’optimiser leurs<br />

évaluations dans un sens favorable (ce qui peut sembler normal). Ainsi, certains travaux<br />

ten<strong>de</strong>nt à proposer <strong>de</strong>s applications telles <strong>de</strong>s boites noires, où l’on ne gère pas et ne<br />

comprend pas en détail les traitements internes, et cela uniquement dans le but d’avoir<br />

les meilleurs résultats espérés. Une gran<strong>de</strong> partie <strong>de</strong>s métho<strong>de</strong>s utilisant l’apprentissage<br />

peuvent être classées parmi ces travaux, puisque qu’elles effectuent leur apprentissage<br />

en fonction uniquement <strong>de</strong>s sorties attendues, peu importe alors la nature <strong>de</strong>s<br />

traitements internes tant que ceux-ci sont effectués comme on l’attend (on utilise pour<br />

cela <strong>de</strong> nombreuses métho<strong>de</strong>s numériques comme les réseaux <strong>de</strong> neurones, <strong>de</strong>s<br />

métho<strong>de</strong>s issues <strong>de</strong> l’analyse <strong>de</strong> données… mais aussi <strong>de</strong>s métho<strong>de</strong>s symboliques<br />

comme l’apprentissage sur <strong>de</strong>s grammaires par exemple).<br />

Dans le cadre du <strong>résumé</strong> <strong>automatique</strong>, l’évaluation <strong>de</strong>s <strong>résumé</strong>s produits est<br />

particulièrement difficile en raison <strong>de</strong>s sources auxquelles on doit les comparer. En<br />

effet, les éléments <strong>de</strong> référence avec lesquels on apprécie les <strong>résumé</strong>s obtenus sont <strong>de</strong><br />

nature très variables : <strong>résumé</strong>s générés par <strong>de</strong>s sujets humains, ensembles <strong>de</strong> phrases<br />

297

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!