05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 2 : <strong>Le</strong> <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> <strong>textes</strong><br />

5. Historique <strong>de</strong>s recherches au laboratoire <strong>LaLIC</strong><br />

5.1. Travaux précé<strong>de</strong>nts : SERAPHIN, SAPHIR et CONTEXTO<br />

5.1.1. <strong>Le</strong> système SERAPHIN (1994)<br />

<strong>Le</strong> laboratoire <strong>LaLIC</strong> <strong>de</strong> l’université <strong>Paris</strong>IV-<strong>Sorbonne</strong> a acquis <strong>de</strong>puis plus d’une<br />

dizaine d’années une expérience dans le domaine du <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> <strong>textes</strong>. La<br />

réalisation <strong>de</strong> plusieurs projets, tels que SERAPHIN, SAFIR et ContextO, a participé en<br />

France et dans le mon<strong>de</strong> francophone 36 à la réflexion et à la mise en place d’applications<br />

concrètes dans ce domaine <strong>de</strong>puis les années 90. Par ailleurs, ces projets se sont<br />

également développés à la suite d’une <strong>de</strong>man<strong>de</strong> provenant <strong>de</strong> l’entreprise EDF qui fut<br />

par conséquent partenaire <strong>de</strong> ceux-ci.<br />

<strong>Le</strong> système SERAPHIN (Système Expert <strong>de</strong> Repérage Automatique <strong>de</strong>s Phrases<br />

Importantes d’un texte et <strong>de</strong> leur Normalisation) [<strong>Le</strong>roux 1994] [Berri, 1995] était la<br />

première application <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong> du laboratoire, et il s’insérait dans le cadre<br />

<strong>de</strong> l’approche par extraction avec analyse <strong>de</strong> surface. SERAPHIN consistait en<br />

l’extraction <strong>de</strong>s phrases les plus importantes à partir <strong>de</strong> la métho<strong>de</strong> d’exploration<br />

contextuelle ([Desclés 2006], [Desclés et Minel 2005], [Desclés et al. 1997] et [Desclés<br />

1997]). Il a été élaboré pour répon<strong>de</strong> à un besoin <strong>de</strong> la compagnie énergétique française<br />

EDF dans le cadre du traitement <strong>de</strong> documents textuels. SERAPHIN permettait <strong>de</strong><br />

fournir au département GRETS 37 d’EDF, composé entre autres <strong>de</strong> sociologues, <strong>de</strong>s<br />

<strong>résumé</strong>s produits <strong>automatique</strong>ment afin <strong>de</strong> donner un aperçu du contenu <strong>de</strong>s <strong>textes</strong> que<br />

ces personnes du département <strong>de</strong>vaient consulter dans le cadre <strong>de</strong> la veille<br />

technologique. Dès SERAPHIN, les principaux points qui caractérisent l’approche<br />

adoptée par le laboratoire <strong>LaLIC</strong> en terme <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong> étaient retenus dans<br />

le système :<br />

36 Conjointement à d’autres travaux comme ceux <strong>de</strong> [<strong>Le</strong>hmann 1995] au LORIA <strong>de</strong> Nancy avec le projet<br />

RAFI, <strong>de</strong> [Masson 1998] au LIMSI <strong>de</strong> l’université d’Orsay ou <strong>de</strong> [Saggion 2000] au Canada à l’université<br />

<strong>de</strong> Montréal.<br />

37 Département d’enquêtes d’opinions sur <strong>de</strong>s domaines d’intérêts <strong>de</strong> l’entreprise (nucléaires,<br />

environnement, etc.).<br />

87

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!