05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 4 : Processus et stratégies <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong><br />

Etape 1<br />

Extraction<br />

<strong>de</strong> termes<br />

Etape 4<br />

Stratégie<br />

résumante<br />

Carte sémantique<br />

Sortie<br />

Texte<br />

segmenté<br />

Annotation<br />

EXCOM<br />

Texte<br />

annoté<br />

Sélection /<br />

Extraction<br />

Texte<br />

<strong>résumé</strong><br />

Entrée<br />

Etape 2<br />

Etape 3<br />

Nettoyage<br />

segments<br />

peu fiables<br />

Nettoyage<br />

lisibilité<br />

Etape 5<br />

Figure 26 : <strong>Le</strong>s différents traitements dans la construction <strong>de</strong> <strong>résumé</strong>s<br />

Entrée (prétraitement initial)<br />

Entrée : fichier textuel.<br />

Sortie : fichier textuel segmenté sous format XML.<br />

Action : segmentation du texte en phrases, paragraphes, sections et titres.<br />

Technique : programme SEGATEX (en PERL).<br />

Etape 1<br />

Entrée : fichier textuel segmenté sous format XML.<br />

Sortie : liste <strong>de</strong> termes thématiques.<br />

Action : extraction dans les titres et sous-titres <strong>de</strong>s noms présents.<br />

Technique : programme PERL avec appel à TREETAGGER.<br />

Etape 2<br />

Entrée : fichier textuel segmenté sous format XML.<br />

291

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!