05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 3 : L’annotation discursive à partir d’EXCOM<br />

Image 6 : Texte segmenté par SEGATEX<br />

<strong>Le</strong> format XML renvoyé en sortie est compatible avec la DTD DocBook<br />

(www.docbook.org), ce qui le rend plus facilement récupérable pour d’autres<br />

applications éventuelles. <strong>Le</strong> module SEGATEX intégré dans le système EXCOM<br />

(figure 13) peut tout à fait être utilisé malgré tout en <strong>de</strong>hors <strong>de</strong> celui-ci, par exemple<br />

pour une tâche nécessitant une segmentation physique du texte.<br />

Figure 13 : Chaîne <strong>de</strong> traitement du module SegaTex<br />

Dans notre travail, la phrase a été choisie comme unité d’annotation et<br />

d’extraction, et ce sont donc celles-ci qui seront évaluées sur le plan <strong>de</strong> la pertinence<br />

dans le cadre du <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> texte. Certains travaux ont préféré le<br />

114

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!