05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Introduction<br />

Désormais, le domaine se dirige <strong>de</strong> plus en plus vers la production <strong>de</strong> <strong>résumé</strong>s<br />

flexibles correspondant aux attentes <strong>de</strong> l’utilisateur. Quelles que soient les métho<strong>de</strong>s<br />

utilisées, on propose différentes sortes <strong>de</strong> <strong>résumé</strong>s, comme les <strong>résumé</strong>s indicatifs,<br />

<strong>de</strong>scriptifs, techniques, etc. l’objectif étant <strong>de</strong> répondre à un type <strong>de</strong> recherche<br />

d’informations.<br />

De plus, l’extension du <strong>résumé</strong> <strong>automatique</strong> à <strong>de</strong> nouvelles applications conduit<br />

maintenant à vouloir résumer plusieurs documents dans un même processus <strong>de</strong><br />

traitement : c’est le <strong>résumé</strong> multidocuments. <strong>Le</strong>s procédés <strong>de</strong> construction restent<br />

généralement les mêmes mais <strong>de</strong> nouvelles difficultés apparaissent, comme la gestion<br />

<strong>de</strong> la redondance d’informations pouvant exister entre les différents documents et qui ne<br />

doit pas apparaître dans le <strong>résumé</strong> final.<br />

2. Contexte <strong>de</strong> travail et objectifs<br />

Depuis le milieu <strong>de</strong>s années 1990, différents travaux portant sur le <strong>résumé</strong><br />

<strong>automatique</strong> <strong>de</strong> <strong>textes</strong> ont été effectués au laboratoire <strong>LaLIC</strong> <strong>de</strong> l’université <strong>Paris</strong>-<br />

<strong>Sorbonne</strong>, notamment en collaboration avec <strong>de</strong>s entreprises comme EDF ou France<br />

Télécom. La réalisation successive <strong>de</strong> plusieurs projets, SERAPHIN 1 [Berri 1995],<br />

SAFIR [Berri 1996], ContextO [Crispino 2004] et maintenant EXCOM 2 [Djioua et al.<br />

2006], a permis <strong>de</strong> développer une recherche sur ce sujet sur la base <strong>de</strong> techniques<br />

propres au laboratoire.<br />

Depuis l’origine, l’approche employée dans tous ces projets consiste en l’emploi<br />

quasi-exclusif <strong>de</strong> techniques linguistiques, particulièrement à travers <strong>de</strong>s annotations<br />

discursives <strong>automatique</strong>s <strong>de</strong>s <strong>textes</strong>. En effet, ces <strong>de</strong>rnières, au centre <strong>de</strong> la construction<br />

<strong>de</strong> <strong>résumé</strong>s, sont effectuées par la métho<strong>de</strong> d’exploration contextuelle ([Desclés 2006],<br />

[Desclés et Minel 2005], [Desclés et al. 1997] et [Desclés 1997]) qui opère à partir <strong>de</strong><br />

l’i<strong>de</strong>ntification <strong>de</strong> marqueurs discursifs dans les <strong>textes</strong> pour pouvoir annoter <strong>de</strong>s<br />

segments textuels. L’idée centrale pour le <strong>résumé</strong> <strong>automatique</strong> est alors d’extraire les<br />

1 Système Expert <strong>de</strong> Repérage Automatique <strong>de</strong>s Phrases Importantes d’un texte et <strong>de</strong> leur Normalisation<br />

2 EXploration COntextuelle Multilingue.<br />

12

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!