05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 2 : <strong>Le</strong> <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> <strong>textes</strong><br />

les scripts préalablement vi<strong>de</strong>s qui décrivent les événements présents dans le texte. La<br />

connaissance <strong>de</strong> ces scripts permet ensuite au système <strong>de</strong> dégager les informations<br />

pertinentes et <strong>de</strong> pouvoir construire le <strong>résumé</strong>.<br />

<strong>Le</strong> système SUSY [Fum et al. 1982] (voir également la partie 2.2 plus haut) qui<br />

résume <strong>de</strong>s <strong>textes</strong> scientifiques utilise quant à lui un système <strong>de</strong> représentation<br />

propositionnelle du texte. Effectivement, il s’inspire du modèle <strong>de</strong> W. Kintsch et T.A.<br />

Van Djik qui lui-même emploie ce type <strong>de</strong> représentation. Une première représentation<br />

propositionnelle du texte est travaillée pour produire ensuite un réseau propositionnel<br />

hiérarchique qui représente le résultat <strong>de</strong> la compréhension et qui permet donc <strong>de</strong><br />

produire le <strong>résumé</strong> (à partir <strong>de</strong>s éléments les plus haut <strong>de</strong> la hiérarchie) [Endres-<br />

Niggemeyer 1998].<br />

Parmi les systèmes employant un système <strong>de</strong> représentation conceptuelle, on note<br />

SCISOR [Jacob et Rau 1990] qui permet <strong>de</strong> résumer <strong>de</strong>s <strong>textes</strong> narratifs mais aussi<br />

d’effectuer <strong>de</strong> la recherche d’informations à partir <strong>de</strong> questions. Ils utilisent une base <strong>de</strong><br />

connaissances qui correspond à un ensemble <strong>de</strong> différents concepts renvoyant à <strong>de</strong>s<br />

événements. SCISOR construit lors du traitement une organisation <strong>de</strong>s différents<br />

concepts présents dans le texte. Il produit ensuite le <strong>résumé</strong> en regroupant certains<br />

concepts (par exemple par généralisation) et en éliminant d’autres moins pertinents.<br />

Nous avons dit plus haut 29 que la construction d’une représentation du texte ou <strong>de</strong><br />

représentations <strong>de</strong> certaines informations du texte pour construire le <strong>résumé</strong> est <strong>de</strong>venu<br />

plus rare au profit <strong>de</strong>s systèmes employant l’extraction par analyse <strong>de</strong> surface.<br />

Cependant, pour certains types <strong>de</strong> <strong>textes</strong>, comme les <strong>textes</strong> narratifs, le passage par une<br />

représentation nous semble réellement nécessaire. Si une analyse <strong>de</strong> surface peut<br />

trouver <strong>de</strong>s informations importantes dans <strong>de</strong>s articles scientifiques comme <strong>de</strong>s<br />

hypothèses, <strong>de</strong>s objectifs… il n’en est pas tout à fait <strong>de</strong> même dans ce type <strong>de</strong> <strong>textes</strong><br />

puisque souvent les informations les plus pertinentes doivent être inférées ou mises en<br />

relation avec d’autres <strong>de</strong> manière sous-jacente. Par exemple, pour désigner un<br />

événement important dans une narration, il faut souvent prendre en compte la dimension<br />

aspecto-temporelle du texte, ainsi que sa dimension causale. C’est à cause <strong>de</strong> ces<br />

contraintes que les représentations du texte ou les représentations <strong>de</strong> certaines<br />

29 Cf. partie 1.1 et 2.2 <strong>de</strong> ce chapitre<br />

63

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!