05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 2 : <strong>Le</strong> <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> <strong>textes</strong><br />

1.2. La fonction du <strong>résumé</strong> <strong>automatique</strong><br />

1.2.1. <strong>Le</strong>s besoins et les <strong>textes</strong> traités<br />

Dans le domaine du <strong>résumé</strong> <strong>automatique</strong>, <strong>de</strong>ux principaux types <strong>de</strong> <strong>textes</strong> sont<br />

plus particulièrement traités : les <strong>textes</strong> scientifiques et techniques, et les <strong>textes</strong> narratifs<br />

qui sont essentiellement <strong>de</strong>s articles <strong>de</strong> presse décrivant <strong>de</strong>s événements économiques,<br />

financiers, politiques, sportifs, etc. <strong>Le</strong> choix <strong>de</strong> prendre en compte ces <strong>de</strong>ux types <strong>de</strong><br />

<strong>textes</strong> n’est pas né du fait d’une quelconque facilité à traiter ceux-ci plus que d’autres,<br />

notamment du fait <strong>de</strong> leur structuration, mais plutôt d’un intérêt économique et<br />

pratique 19 . En effet, dès les années 1970 avec les projets TRW, ADAM…, la quantité <strong>de</strong><br />

<strong>textes</strong> scientifiques et techniques, mais aussi d’articles <strong>de</strong> presse, <strong>de</strong>venaient tellement<br />

importante qu’il était nécessaire <strong>de</strong> réaliser <strong>de</strong>s outils permettant <strong>de</strong> les résumer, afin<br />

que les utilisateurs puissent continuer à chercher <strong>de</strong>s informations parmi cette masse <strong>de</strong><br />

données nouvelles que tout cela représentait et qui commençaient à être<br />

progressivement numérisée. <strong>Le</strong> <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> <strong>textes</strong> scientifiques et<br />

techniques était vu comme un outil potentiellement efficace permettant une<br />

amélioration <strong>de</strong> la productivité <strong>de</strong>s chercheurs grâce au gain <strong>de</strong> temps assuré par la<br />

lecture <strong>de</strong>s <strong>résumé</strong>s. Il en était <strong>de</strong> même pour les <strong>textes</strong> narratifs dont l’intérêt était plus<br />

large et dont l’accessibilité était proposée à un plus grand nombre <strong>de</strong> personnes (pas<br />

uniquement les chercheurs). De nos jours, les besoins n’ont pas vraiment changé, les<br />

<strong>textes</strong> scientifiques/techniques et les <strong>textes</strong> narratifs restent toujours les plus traités en<br />

vue du <strong>résumé</strong>. Toutefois, c’est désormais la quantité <strong>de</strong> ces documents qui a<br />

énormément augmenté, et aussi la prise en compte <strong>de</strong> leurs composants non textuels<br />

(graphiques, tableaux, etc.) dans le traitement qui a changé. Par ailleurs, le public<br />

intéressé est <strong>de</strong>venu aussi plus large : mé<strong>de</strong>cins, analystes financier, etc.<br />

19 Effectivement, on pourrait croire que les premiers travaux ont choisi <strong>de</strong>s <strong>textes</strong> simples pour<br />

commencer, avant d’entreprendre <strong>de</strong>s <strong>textes</strong> plus « difficiles », or ceci n’a pas été le cas. La nature <strong>de</strong>s<br />

type <strong>de</strong> <strong>textes</strong> (structuration, marqueurs linguistiques employés, etc.) ne semble pas avoir été vraiment<br />

prise en considération. La prise <strong>de</strong> conscience <strong>de</strong> la difficulté à traiter certains types <strong>de</strong> <strong>textes</strong> est apparue<br />

plus tard, parallèlement à <strong>de</strong>s travaux linguistiques et psycholinguistiques sur ceux-ci.<br />

49

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!