05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 2 : <strong>Le</strong> <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> <strong>textes</strong><br />

• indépendance par rapport aux domaines ;<br />

• indépendance par rapport aux genres et aux styles ;<br />

• pas d’utilisation <strong>de</strong> terminologies (entités nommées, dictionnaires, etc.) ;<br />

• estimation <strong>de</strong> la pertinence <strong>de</strong>s phrases sur le principal critère <strong>de</strong> présence <strong>de</strong><br />

certains marqueurs linguistiques que l’on décompose en indicateurs et en indices<br />

(selon la métho<strong>de</strong> d’exploration contextuelle) ;<br />

• utilisation <strong>de</strong> certaines catégories pour désigner les phrases contenant les<br />

marqueurs (thématique, soulignement, récapitulation, argumentation,<br />

questionnement, hypothèse, objectif, etc.) ;<br />

• prise en compte également dans l’estimation <strong>de</strong> la pertinence <strong>de</strong> la structure<br />

textuelle, que l’on fait apparaître dans SERAPHIN à l’ai<strong>de</strong> <strong>de</strong> balises<br />

SGML sous la forme d’une représentation objet du texte ;<br />

• prise en compte aussi dans l’estimation <strong>de</strong> la pertinence <strong>de</strong> la présence d’unités<br />

lexicales (termes candidats) contenues dans les titres et que l’on extrait ;<br />

• hiérarchisation <strong>de</strong>s phrases suivant la catégorie à laquelle elles sont rattachées<br />

(les énoncés thématiques sont prioritaires par rapport aux hypothèses) ;<br />

• sélection <strong>de</strong>s phrases pour le <strong>résumé</strong> à partir du haut <strong>de</strong> la hiérarchie ;<br />

• restructuration finale du <strong>résumé</strong> en réalignant les phrases extraites et en gardant<br />

les phrases qui sont liées par <strong>de</strong>s liens transphrastiques à <strong>de</strong>s phrases<br />

sélectionnées.<br />

Pour récapituler tout cela, nous donnons dans la figure ci-<strong>de</strong>ssous la chaîne <strong>de</strong><br />

traitement effectuée par SERAPHIN sur un texte.<br />

88

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!