05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 2 : <strong>Le</strong> <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> <strong>textes</strong><br />

1. Sélection d’un texte pour SERAPHIN<br />

2. Extraction <strong>de</strong>s candidats-termes <strong>de</strong>s titres<br />

3. Tokénisation, segmentation et recherche <strong>de</strong>s marqueurs<br />

4. Construction <strong>de</strong> la représentation objet<br />

5. Attribution <strong>de</strong>s annotations sur les phrases du texte<br />

6. Sélection <strong>de</strong>s phrases importantes du texte<br />

7. Construction du <strong>résumé</strong><br />

Figure 5 : Chaîne <strong>de</strong> traitements principale dans SERAPHIN<br />

<strong>Le</strong> système SERAPHIN s’inscrivait dans un emploi exclusif <strong>de</strong> techniques<br />

linguistiques avec analyse <strong>de</strong> surface, sans utilisation <strong>de</strong> statistiques, ou encore<br />

d’apprentissages sur corpus. Toutefois, il ne proposait qu’un seul type <strong>de</strong> stratégie et ne<br />

pouvait donc offrir qu’un seul type <strong>de</strong> <strong>résumé</strong> par texte, en permettant une version<br />

longue (40% du texte initial) ou courte (20% du texte initial).<br />

5.1.2. <strong>Le</strong> système SAPHIR (1996)<br />

A la suite <strong>de</strong> SERAPHIN, un nouveau système a été proposé : SAPHIR [Berri et<br />

al. 1996] [Berri et Cartier 1996]. Celui-ci était principalement dédié au filtrage<br />

sémantique <strong>de</strong> <strong>textes</strong> et il était également réalisé en collaboration avec l’entreprise EDF.<br />

<strong>Le</strong> <strong>résumé</strong> <strong>automatique</strong> était l’une <strong>de</strong>s fonctionnalités proposées par le système mais il<br />

n’était pas principalement dédié à celle-ci. De manière générale, le système SAPHIR<br />

reprenait tous les points que nous avons exposés plus haut et qui caractérisent<br />

l’approche adoptée dans SERAPHIN. L’annotation par application <strong>de</strong> la métho<strong>de</strong><br />

d’exploration contextuelle sur le texte reste toujours au cœur du traitement. Cependant,<br />

la dénomination <strong>de</strong>s annotations se précise un peu mieux en proposant les principales<br />

89

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!