05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 5 : Evaluation et bilan <strong>de</strong> la tâche <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong><br />

sélectionnées également par <strong>de</strong>s humains, conditions liées à la bonne application d’une<br />

tâche impliquée par le <strong>résumé</strong> (questions-réponses…), etc. Il <strong>de</strong>vient alors très difficile<br />

<strong>de</strong> juger qu’un élément <strong>de</strong> référence est meilleur qu’un autre. <strong>Le</strong>s éléments <strong>de</strong> référence<br />

sont conditionnés par la subjectivité dépendante <strong>de</strong> nombreux paramètres <strong>de</strong>s sujets<br />

humains qui servent généralement <strong>de</strong> producteurs <strong>de</strong> ces éléments <strong>de</strong> référence. Si l’on<br />

prend le cas <strong>de</strong>s <strong>résumé</strong>s humains comme référence pour une évaluation, qu’ils soient<br />

construits par abstraction ou par extraction, ils peuvent être très variables dans les <strong>de</strong>ux<br />

cas, et cela est d’autant plus remarquable que, dans le cas <strong>de</strong>s <strong>résumé</strong>s par extraction<br />

produits par <strong>de</strong>s humains, le taux <strong>de</strong> recouvrement est relativement faible, surtout si l’on<br />

augmente le nombre <strong>de</strong> sujets. Par exemple, [IBM 1962] ont montré dans une<br />

expérience qu’ils ont menée que six sujets humains ont en moyenne 1,6 phrases en<br />

commun sur <strong>de</strong>s <strong>résumé</strong>s par extractions <strong>de</strong> 20 phrases qu’ils construisent à partir <strong>de</strong><br />

<strong>textes</strong>. Il en est <strong>de</strong> même lorsque l’on <strong>de</strong>man<strong>de</strong> à <strong>de</strong>s sujets <strong>de</strong> choisir les segments<br />

(phrases ou paragraphes) les plus pertinents d’un texte en les ordonnant, puisque la<br />

pertinence peut dépendre <strong>de</strong> l’intérêt que peut porter le sujet sur tel thème, dépendre <strong>de</strong>s<br />

conditions initiales qui sont <strong>de</strong>mandées aux sujets, etc. Toutefois, les étu<strong>de</strong>s sur<br />

l’évaluation <strong>de</strong> <strong>résumé</strong>s produits <strong>automatique</strong>ment sont très actives, et elles tentent <strong>de</strong><br />

parvenir par différentes façons à une évaluation juste <strong>de</strong>s systèmes <strong>de</strong> <strong>résumé</strong><br />

<strong>automatique</strong>. On dégage ainsi <strong>de</strong>ux grands courants d’évaluation, qui regroupent pour le<br />

premier les métho<strong>de</strong>s intrinsèques et pour le second les métho<strong>de</strong>s extrinsèques. Nous<br />

allons les décrire brièvement pour en donner un aperçu préalable, avant d’exposer notre<br />

propre évaluation. Nous renvoyons le lecteur à différents articles pour un<br />

approfondissement <strong>de</strong> ce domaine qu’est l’évaluation <strong>de</strong> <strong>résumé</strong>s ([Mani 1998], par<br />

exemple).<br />

1.1.2. <strong>Le</strong>s métho<strong>de</strong>s intrinsèques<br />

<strong>Le</strong>s métho<strong>de</strong>s intrinsèques ont pour objectif d’évaluer les <strong>résumé</strong>s machines<br />

d’après leurs propriétés et leur contenu. On peut ainsi évaluer les <strong>résumé</strong>s produits par<br />

abstraction comme par extraction à travers leur lisibilité, notamment à partir <strong>de</strong><br />

l’énumération du nombre <strong>de</strong> relations anaphoriques « brisées », ou à partir d’autres<br />

problèmes <strong>de</strong> cohésion. Ce premier type <strong>de</strong> métho<strong>de</strong> est particulièrement utile pour<br />

vérifier la bonne lisibilité <strong>de</strong>s <strong>résumé</strong>s, cette lisibilité étant nécessaire pour répondre<br />

298

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!