05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 2 : <strong>Le</strong> <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> <strong>textes</strong><br />

l’ai<strong>de</strong> directe <strong>de</strong>s formes <strong>de</strong> surface mais plutôt grâce à la structure <strong>de</strong>s scripts que le<br />

système remplissait 14 . D’autres travaux importants ont continué à apparaître à cette<br />

époque tels que SUSY, TOPIC, SCISOR et PAULINE 15 .<br />

Globalement, les systèmes <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong> par compréhension <strong>de</strong> cette<br />

époque étaient fortement influencés par tous les travaux se faisant sur la compréhension<br />

<strong>de</strong> <strong>textes</strong> et sur la représentation <strong>de</strong>s connaissances en psychologie cognitive et en<br />

intelligence artificielle. La <strong>de</strong>man<strong>de</strong> en <strong>résumé</strong> <strong>automatique</strong> n’était pas réellement forte,<br />

et cela ne fournissait aucune contrainte sur le choix <strong>de</strong>s métho<strong>de</strong>s dans ce domaine.<br />

Ainsi, les chercheurs pouvaient tenter, comme ils le souhaitaient, <strong>de</strong> copier l’activité<br />

résumante humaine pour leur système même si cela était difficile et concrètement peu<br />

applicable. En effet, tous ces systèmes étaient bien souvent dépendants <strong>de</strong>s domaines<br />

sur lesquels portaient les <strong>textes</strong>. Certains travaux, comme SUSY [Fum et al. 1982],<br />

étaient même très ambitieux, ils envisageaient <strong>de</strong> nombreux traitements (syntaxiques,<br />

sémantiques, etc.) qui, même encore aujourd’hui, n’ont jamais pu être entièrement<br />

faits comme, par exemple, la réalisation <strong>de</strong> la représentation propositionnelle d’un texte.<br />

On envisageait donc <strong>de</strong>s systèmes théoriquement intéressants et reposant sur <strong>de</strong>s<br />

fon<strong>de</strong>ments cognitifs soli<strong>de</strong>s 16 , mais en réalité on avait <strong>de</strong>s systèmes lourds, limités<br />

techniquement, et restreints à <strong>de</strong>s domaines bien précis.<br />

<strong>Le</strong>s années 1990 ont vu arriver l’insertion massive <strong>de</strong> l’informatique dans le<br />

travail et dans les entreprises en raison <strong>de</strong> l’amélioration <strong>de</strong> la productivité qu’elle<br />

permettait. <strong>Le</strong>s entreprises commençaient ainsi à <strong>de</strong>voir gérer une masse grandissante<br />

<strong>de</strong> documents <strong>de</strong> travail sous format électronique. La recherche d’informations<br />

commençait alors à ce développer considérablement, surtout à la fin <strong>de</strong>s années 90 avec<br />

l’apparition d’Internet et <strong>de</strong>s moteurs <strong>de</strong> recherche. La quantité d’informations à traiter<br />

est <strong>de</strong>venue tellement importante et hétérogène que les besoins en recherche<br />

d’informations ont explosé, notamment pour le <strong>résumé</strong> <strong>automatique</strong>. <strong>Le</strong>s besoins se sont<br />

alors orientés vers <strong>de</strong>s métho<strong>de</strong>s rapi<strong>de</strong>s et s’appliquant <strong>de</strong> façon large, c’est-à-dire<br />

indépendante <strong>de</strong>s domaines. A partir <strong>de</strong> cela, le <strong>résumé</strong> <strong>automatique</strong> est revenu en<br />

14 Pour un script décrivant un meurtre par exemple, on sait que l’information correspondant dans celui-ci<br />

à l’auteur du meurtre est plus pertinente que d’autres.<br />

15 On renvoie à [Endres-Niggemeyer 1998] et [Mani 2000] pour les détails relatifs à ces systèmes.<br />

16 En tout cas, plus que les systèmes par extraction <strong>de</strong>s débuts (années 1950-70).<br />

45

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!