05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 2 : <strong>Le</strong> <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> <strong>textes</strong><br />

5.2. La phase actuelle : EXCOM (2005)<br />

Actuellement, les travaux portant sur le <strong>résumé</strong> <strong>automatique</strong> sont associés à la<br />

nouvelle plate-forme basée sur le système EXCOM (EXploration COntextuelle<br />

Multilingue [Djioua et al., 2006]) qui a pour objectif principal l’annotation sémantique<br />

<strong>automatique</strong> <strong>de</strong> <strong>textes</strong>, notamment dans plusieurs langues (nous présenterons EXCOM<br />

plus en détails dans le prochain chapitre, aussi n’en parlerons-nous ici que très<br />

brièvement afin <strong>de</strong> montrer la continuité du système). Comme pour les systèmes<br />

précé<strong>de</strong>nts, EXCOM repose toujours sur la métho<strong>de</strong> d’exploration contextuelle dans le<br />

cadre <strong>de</strong> l’annotation sémantique <strong>automatique</strong>. Cependant, certains points nouveaux ont<br />

été abordés comme :<br />

• la possibilité d’écrire les règles directement dans le système d’une manière plus<br />

déclarative, sous format XML, ce qui en facilite l’accès aux linguistes dans<br />

l’écriture <strong>de</strong> celles-ci ;<br />

• <strong>de</strong>s possibilités nouvelles dans la syntaxe <strong>de</strong>s règles avec entre autres <strong>de</strong><br />

nouvelles fonctionnalités ;<br />

• une utilisation massive <strong>de</strong>s technologies XML, XSLT et XPATH tout au long <strong>de</strong><br />

la chaîne <strong>de</strong> traitements dans l’annotation sémantique ;<br />

• une prise en charge <strong>de</strong> tous les formats <strong>de</strong> caractères pour pouvoir traiter <strong>de</strong>s<br />

langues à écritures différentes (par exemple actuellement le coréen, le chinois et<br />

l’arabe) ;<br />

• une importance accrue <strong>de</strong> la notion <strong>de</strong> carte sémantique, qui organise les<br />

concepts et les relations présentes dans les <strong>textes</strong>, conçue maintenant comme<br />

une ontologie linguistique dont les segments annotés en sont <strong>de</strong>s objets 39 ;<br />

• une prise en charge <strong>de</strong>s éléments non textuels contenus dans les documents<br />

(images, diagrammes, etc.), notamment en tentant <strong>de</strong> les relier aux éléments<br />

textuels les environnant [<strong>Le</strong> Priol 2008] ;<br />

• un renforcement <strong>de</strong>s applications en sortie qui exploitent la catégorisation <strong>de</strong>s<br />

informations textuelles effectuées à travers l’annotation sémantique, comme les<br />

fiches <strong>de</strong> synthèse 40 ;<br />

39 Pour une définition <strong>de</strong> la notion <strong>de</strong> carte sémantique voir le chapitre 3 partie 3.4.<br />

93

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!