05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 5 : Evaluation et bilan <strong>de</strong> la tâche <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong><br />

2. Bilan et remarques<br />

2.1. Bilan global <strong>de</strong>s <strong>de</strong>ux évaluations<br />

Nous allons essayer ici <strong>de</strong> tirer certaines conclusions qui peuvent découler <strong>de</strong><br />

l’analyse commune <strong>de</strong>s <strong>de</strong>ux évaluations.<br />

La première évaluation nous a permis <strong>de</strong> comparer les contenus <strong>de</strong> chaque<br />

<strong>résumé</strong>, alors que dans la secon<strong>de</strong>, les étudiants ont analysé principalement la cohérence<br />

et la cohésion <strong>de</strong> chaque <strong>résumé</strong>, et moins la pertinence <strong>de</strong>s informations qui pouvaient<br />

être à l’intérieur. Effectivement, si on reprend les valeurs <strong>de</strong> précision et les <strong>de</strong>ux<br />

valeurs <strong>de</strong> rappel (sur l’union et l’intersection) obtenues lors <strong>de</strong> la première évaluation<br />

comparativement à <strong>de</strong>s <strong>résumé</strong>s humains (voir les tableaux 9, 10 et 11 ci-<strong>de</strong>ssous), la<br />

variation <strong>de</strong> ces valeurs entre les <strong>résumé</strong>s logiciels est considérable, pour la précision<br />

comme pour le rappel. Notre application a produit <strong>de</strong>s <strong>résumé</strong>s qui ont une précision et<br />

un rappel bien supérieurs dans certains cas à Copernic Summarizer, et surtout à<br />

AutoSummarize, or ces fortes variations ne sont pas apparues distinctement dans la<br />

<strong>de</strong>uxième évaluation. Encore une fois, les étudiants se sont beaucoup plus attachés dans<br />

la <strong>de</strong>uxième évaluation à estimer la cohérence et la cohésion <strong>de</strong>s <strong>résumé</strong>s à partir d’une<br />

lecture normale, sans faire gar<strong>de</strong> aux informations pertinentes qui auraient pu s’y<br />

trouver et qui auraient pu mieux distinguer les <strong>résumé</strong>s. Il semble ainsi qu’il n’ait pas<br />

été facile pour les étudiants <strong>de</strong> bien noter et différencier les <strong>résumé</strong>s ce que révèlent les<br />

écarts <strong>de</strong> résultats en moyenne peu importants. De plus dans la majorité <strong>de</strong>s cas, les<br />

étudiants n’ont pas été unanimement d’accord pour noter <strong>de</strong> la même façon un <strong>résumé</strong>.<br />

Tout cela montre bien que les étudiants se sont attachés à <strong>de</strong>s aspects difficiles à évaluer<br />

(cohérence, cohésion, etc.) pour <strong>de</strong> tels <strong>résumé</strong>s. Effectivement, tous les <strong>résumé</strong>s étant<br />

ici produits par extraction (logiciels et humain), ils font apparaître naturellement <strong>de</strong><br />

nombreux problèmes <strong>de</strong> cohérence et <strong>de</strong> cohésion qui masquent au lecteur dans<br />

l’évaluation une partie <strong>de</strong> l’apport informatif du contenu <strong>de</strong>s <strong>résumé</strong>s. Cette constatation<br />

montre l’importance que peut avoir pour un lecteur la texture <strong>de</strong>s <strong>résumé</strong>s produits<br />

<strong>automatique</strong>ment. La bonne composition <strong>de</strong>s <strong>résumé</strong>s en informations pertinentes<br />

(d’après la première évaluation) n’assure pas forcément toujours <strong>de</strong> bons résultats dans<br />

311

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!