05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 2 : <strong>Le</strong> <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> <strong>textes</strong><br />

pertinence <strong>de</strong>s phrases à extraire. Il préfigurait alors <strong>de</strong> nombreux systèmes à venir qui<br />

reprendraient par la suite le même principe général. De plus, les étu<strong>de</strong>s autour <strong>de</strong> ce<br />

projet se sont également intéressées à l’évaluation <strong>de</strong> <strong>résumé</strong>s et aux aspects relevant<br />

<strong>de</strong>s compétences humaines pour résumer <strong>de</strong>s <strong>textes</strong>. Ce projet était remarquable en cela<br />

puisqu’il engageait certaines réflexions sur les capacités résumantes alors qu’à la même<br />

époque aucun modèle psychologique n’était encore proposé pour expliquer les<br />

différents processus qui intervenaient dans l’activité résumante. Enfin, tout ces travaux<br />

ont fait se dégager les idées les plus fondamentales autour du <strong>résumé</strong> <strong>automatique</strong>,<br />

comme les problèmes causés par l’extraction pour construire les <strong>résumé</strong>s (problèmes <strong>de</strong><br />

redondance, d’incomplétu<strong>de</strong>, <strong>de</strong> rupture, etc.), l’insuffisance théorique <strong>de</strong> l’emploi <strong>de</strong>s<br />

statistiques, ou encore les difficultés pour comprendre un texte (à partir d’analyse<br />

sémantique) afin <strong>de</strong> le résumer.<br />

D’autres projets ont suivi alors le même cadre technique pour construire le<br />

<strong>résumé</strong>, c’est-à-dire celui <strong>de</strong> l’extraction <strong>de</strong> phrases à partir <strong>de</strong> l’évaluation <strong>de</strong> la<br />

pertinence <strong>de</strong> chacune <strong>de</strong> ces phrases. Toutefois, la prise en considération <strong>de</strong><br />

l’évaluation d’une phrase en la mettant également en rapport avec le reste du texte s’est<br />

développée progressivement, et si on l’extrayait on vérifiait son lien aux phrases<br />

précé<strong>de</strong>ntes avec par exemple la présence <strong>de</strong> connecteurs en début <strong>de</strong> phrases.<br />

A partir <strong>de</strong>s années 1980 sont apparues <strong>de</strong>s théories qui décrivaient les différents<br />

traitements intervenant dans le système cognitif humain dans les activités <strong>de</strong> lecture et<br />

<strong>de</strong> la compréhension <strong>de</strong> <strong>textes</strong>, en particulier le modèle <strong>de</strong> Kintsch et Van Dijk qui<br />

expliquait en plus la construction d’un <strong>résumé</strong> 13 . Ces théories ont alors<br />

considérablement inspiré l’architecture <strong>de</strong>s systèmes <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong><br />

l’époque. L’influence <strong>de</strong> théories psychologiques a constitué une rupture par rapport<br />

aux techniques précé<strong>de</strong>ntes qui analysaient seulement la surface <strong>de</strong>s <strong>textes</strong>, puisque<br />

désormais on cherchait à « comprendre » le texte, notamment avec l’utilisation <strong>de</strong><br />

connaissances issues <strong>de</strong> structures cognitives plus profon<strong>de</strong>s comme les scritps, les<br />

schema, les frames… L’un <strong>de</strong> ces premiers travaux s’inspirant <strong>de</strong>s recherches en<br />

psychologie a été celui <strong>de</strong> G. DeJong avec le système FRUMP (voir [DeJong 1982]). Il<br />

était réellement nouveau dans le domaine car il proposait un principe calqué sur<br />

l’activité résumante humaine, et <strong>de</strong> plus, il déterminait les informations pertinentes sans<br />

13 Cf. chapitre précé<strong>de</strong>nt.<br />

44

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!