05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 2 : <strong>Le</strong> <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> <strong>textes</strong><br />

représentation du texte, qui éventuellement peut être modifiée par la suite, afin <strong>de</strong><br />

pouvoir générer <strong>automatique</strong>ment un <strong>résumé</strong> textuel à partir <strong>de</strong> celle-ci.<br />

Cependant, ce procédé <strong>de</strong> production reste ardu. Il n’existe pas encore à l’heure<br />

actuelle d’outils conceptuels et techniques pour pouvoir automatiser la compréhension<br />

d’un texte avec la construction parallèle <strong>de</strong> sa représentation. Il en est exactement <strong>de</strong><br />

même avec la génération <strong>de</strong> <strong>textes</strong> qui reste également très imparfaite et sommaire. De<br />

plus, cette approche est généralement dépendante <strong>de</strong>s domaines traités dans les <strong>textes</strong>,<br />

notamment du fait <strong>de</strong> l’emploi <strong>de</strong> connaissances et <strong>de</strong> structures qui doivent être<br />

définies ou connues préalablement et qui dépen<strong>de</strong>nt bien souvent <strong>de</strong> ces domaines.<br />

Toutefois <strong>de</strong> nombreux systèmes utilisant cette approche par compréhension, partielle<br />

dans l’essentielle, ont vu le jour.<br />

Il existe certaines métho<strong>de</strong>s qui cherchent à instancier <strong>de</strong>s structures schématiques<br />

préalablement définies afin <strong>de</strong> générer un <strong>résumé</strong> à partir <strong>de</strong> celles-ci. La plate-forme<br />

FRUMP proposée par G. DeJong [DeJong 1982] avait pour objectif <strong>de</strong> résumer <strong>de</strong>s<br />

articles <strong>de</strong> presse d’une façon similaire à ce que l’homme pouvait faire, c’est-à-dire en<br />

discernant les principaux événements et acteurs décrits dans le texte pour choisir les<br />

plus pertinents. <strong>Le</strong> système utilisait pour cela <strong>de</strong>s scripts vi<strong>de</strong>s qui correspondaient à <strong>de</strong>s<br />

événements couramment décrits dans les articles <strong>de</strong> presse et que l’on remplissait par<br />

les informations dégagées du texte. <strong>Le</strong>s scripts correspon<strong>de</strong>nt à un certain type <strong>de</strong><br />

représentation qu’a proposé R.C. Schank [Schank et Abelson 1977] et qui permettent<br />

d’organiser et <strong>de</strong> structurer les informations acquises dans la mémoire. FRUMP a été<br />

ainsi l’un <strong>de</strong>s premiers systèmes qui a proposé une telle démarche par l’utilisation <strong>de</strong><br />

représentations dans le domaine du <strong>résumé</strong> <strong>automatique</strong>.<br />

<strong>Le</strong> système SUSY [Fum et al. 1982] est particulièrement intéressant et<br />

représentatif <strong>de</strong>s ambitions <strong>de</strong> l’approche par compréhension. Il reposait sur les travaux<br />

<strong>de</strong> l’époque <strong>de</strong> W. Kintsch et T.A. Van Dijk à propos <strong>de</strong> la compréhension <strong>de</strong> <strong>textes</strong> 25 .<br />

SUSY proposait une chaîne <strong>de</strong> traitements qui passait par la construction <strong>de</strong> différentes<br />

représentations jusqu’à la génération finale du <strong>résumé</strong>. Dans un premier temps,<br />

l’analyse du texte en entrée permettait <strong>de</strong> construire la représentation propositionnelle<br />

du texte. Ensuite, l’objectif était <strong>de</strong> construire une représentation qui permettait <strong>de</strong><br />

refléter la structure rhétorique se dégageant du texte. A la suite, on ordonnait les<br />

25 Cf. chapitre 1.<br />

56

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!