05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 2 : <strong>Le</strong> <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> <strong>textes</strong><br />

certains défauts, ce qui a amené par la suite au développement du système d’annotation<br />

actuel EXCOM. Malgré tout, il faut noter que <strong>de</strong> nouvelles réflexions ont été ajoutées et<br />

prises en compte dans le système CONTEXTO comparativement aux <strong>de</strong>ux précé<strong>de</strong>nts.<br />

Enumérons ainsi les principaux changements qui ont été effectués dans CONTEXTO :<br />

• une meilleure prise en compte <strong>de</strong> l’importance <strong>de</strong> l’interface (problème<br />

ergonomique) dans l’affichage <strong>de</strong>s résultats et plus particulièrement dans la<br />

navigation entre le <strong>résumé</strong> et le texte source ;<br />

• une possibilité d’intervention accrue <strong>de</strong> l’utilisateur sur le traitement effectué par<br />

le système ;<br />

• la possibilité d’exploiter d’autres types <strong>de</strong> traitements que ceux utilisant la<br />

linguistique tels que les traitements statistiques ;<br />

• la possibilité pour les linguistes d’écrire leurs règles d’annotation par<br />

exploration contextuelle dans un langage formel LangText (figure 6) fortement<br />

déclaratif et que le système pourrait interpréter par la suite <strong>automatique</strong>ment 38 ;<br />

• l’utilisation d’une base <strong>de</strong> données stockant les marqueurs linguistiques et leur<br />

propriétés (type <strong>de</strong> marqueurs : indicateur ou indice ; classe sémantique ; tâche) ;<br />

• l’implémentation d’un segmenteur SEGATEX permettant <strong>de</strong> décomposer<br />

<strong>automatique</strong>ment à partir <strong>de</strong> règles heuristiques le texte en phrases, paragraphes<br />

et titres, d’après les travaux <strong>de</strong> G. Mourad [Mourad 1999] [Mourad 2001].<br />

38 Toutefois l’interprétation <strong>automatique</strong> du langage LangText n’a jamais été implémentée dans<br />

CONTEXTO.<br />

91

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!