05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 2 : <strong>Le</strong> <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> <strong>textes</strong><br />

qui commença en 1991 par étudier les différentes techniques <strong>de</strong> recherche<br />

d’informations (algorithmes, architecture <strong>de</strong>s logiciels, etc.). Dans sa troisième et<br />

<strong>de</strong>rnière phase, <strong>de</strong> 1996 à 1998, le programme TIPSTER s’est intéressé au <strong>résumé</strong><br />

<strong>automatique</strong> et a permis une évaluation « officielle » <strong>de</strong>s solutions proposées à l’époque<br />

dans le domaine. En 1998, la première gran<strong>de</strong> évaluation SUMMAC (TIPSTER Text<br />

Summarization Evaluation) a été faite sur différents systèmes en définissant <strong>de</strong>ux cadres<br />

d’évaluations. <strong>Le</strong> premier cadre consistait en l’évaluation classique <strong>de</strong> <strong>résumé</strong>s<br />

indicatifs produits <strong>automatique</strong>ment tandis que le <strong>de</strong>uxième consistait en l’évaluation <strong>de</strong><br />

<strong>résumé</strong>s qui, à la suite <strong>de</strong> leur lecture, doivent permettre au lecteur <strong>de</strong> bien pouvoir<br />

catégoriser le document d’origine. <strong>Le</strong>s résultats ont alors montré que la lecture <strong>de</strong><br />

<strong>résumé</strong>s avec un ratio assez bas (10 et 17% dans ce cas) était globalement aussi efficace<br />

que la lecture <strong>de</strong>s <strong>textes</strong> originaux pour rechercher <strong>de</strong>s indications portant sur le<br />

contenu, et que, <strong>de</strong> plus, ces <strong>résumé</strong>s offraient un gain <strong>de</strong> temps considérable (>40%)<br />

dans les prises <strong>de</strong> décision telle que la catégorisation d’un document par un humain.<br />

Enfin, <strong>de</strong>puis les années 2003 et 2004, il semble y avoir un net ralentissement<br />

dans le domaine du <strong>résumé</strong> <strong>automatique</strong> 18 aussi bien dans le milieu universitaire où les<br />

travaux sont plus rares que dans les entreprises qui n’innovent plus dans ce domaine<br />

(voir stoppent le développement <strong>de</strong> leur produit). Ce fait s’observe également dans la<br />

diminution <strong>de</strong>s colloques ou <strong>de</strong>s conférences portant sur ce domaine. Depuis 2001, à la<br />

suite <strong>de</strong> l’ouvrage <strong>de</strong> In<strong>de</strong>rjeet Mani [Mani 2001a], aucun ouvrage <strong>de</strong> référence sur le<br />

<strong>résumé</strong> <strong>automatique</strong> n’a vu le jour en langue anglaise. En 2004, un numéro <strong>de</strong> la revue<br />

française TAL [Minel 2004] est paru sur le <strong>résumé</strong> <strong>automatique</strong> mais l’ouvrage ne fait<br />

que rassembler quelques articles portant sur certains travaux bien particuliers, et n’offre<br />

pas en français un panorama suffisant du domaine. Ainsi, il n’existe encore à l’heure<br />

actuelle aucun livre <strong>de</strong> référence en langue française sur le sujet. En ce qui concerne les<br />

entreprises, seul quelques logiciels sont disponibles pour le français parmi lesquels<br />

Pertinence Mining, Copernic Summarizer, et Subject Search Summarizer. De manière<br />

générale, ce phénomène <strong>de</strong> ralentissement du <strong>résumé</strong> <strong>automatique</strong> s’accompagne<br />

parallèlement <strong>de</strong> nouvelles approches en recherche d’informations, en fouille textuelle<br />

18 Ce constat que nous faisons porte sur le mon<strong>de</strong> anglo-saxon (qui reste prédominant) et la France mais<br />

non sur le mon<strong>de</strong> germanique, scandinave ou japonais dont il est plus difficile pour nous <strong>de</strong> connaître<br />

l’état actuel. On note par ailleurs l’apparition progressive et récente <strong>de</strong> travaux en provenance<br />

d’universités indiennes et chinoises, toutefois pas encore réellement novateurs.<br />

47

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!