05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 3 : L’annotation discursive à partir d’EXCOM<br />

sont VER:pres être<br />

très ADV très<br />

belles ADJ beau<br />

. SENT .<br />

En observant la sortie <strong>de</strong> TreeTagger sur cet exemple, on voit qu’il est tout à fait<br />

possible d’exploiter dans le cadre d’une autre application les annotations attribuées à<br />

chaque mot. Par exemple, si l’on souhaite extraire certaines catégories <strong>de</strong> termes dans<br />

un texte, comme les noms ou les verbes, on observe bien l’utilité <strong>de</strong> ce type<br />

d’information qui nous permet <strong>de</strong> les sélectionner par la suite <strong>automatique</strong>ment.<br />

La plate-forme GATE (General Architecture for Text Engineering,<br />

http://gate.ac.uk/) qui s’insère dans l’environnement <strong>de</strong> développement objet Java,<br />

propose un ensemble <strong>de</strong> modules utiles dans le domaine du traitement linguistique <strong>de</strong><br />

<strong>textes</strong> et <strong>de</strong> données multimédias [Dowman et al. 2005]. ANNIE est un composant <strong>de</strong><br />

GATE [Cunningham et al. 2002 ; http://gate.ac.uk/ie/annie.html] qui fournit une<br />

annotation <strong>de</strong>s données textuelles sous-différent points <strong>de</strong> vue. Voici dans la figure 8 ci<strong>de</strong>ssous<br />

la chaîne <strong>de</strong> traitements effectuée par <strong>de</strong>s modules <strong>de</strong> GATE et où intervient<br />

ANNIE.<br />

100

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!