05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 5 : Evaluation et bilan <strong>de</strong> la tâche <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong><br />

Pourtant ce qui différencie cette métho<strong>de</strong> <strong>de</strong>s autres, comme certaines statistiques, qui<br />

fonctionnent aussi sur <strong>de</strong>s formes <strong>de</strong> surface sans analyse en profon<strong>de</strong>ur, c’est qu’elle<br />

exploite <strong>de</strong>s ressources linguistiques et qu’elle utilise <strong>de</strong>s hypothèses et <strong>de</strong>s heuristiques<br />

<strong>de</strong> nature également linguistique ([Desclés 2006], [Desclés et Minel 2005], [Desclés et<br />

al. 1997] et [Desclés 1997]). <strong>Le</strong> fait <strong>de</strong> ne pas exécuter <strong>de</strong>s analyses en profon<strong>de</strong>ur<br />

permet premièrement un gain <strong>de</strong> temps en diminuant les traitements, et, <strong>de</strong>uxièmement,<br />

d’éviter <strong>de</strong> dépendre <strong>de</strong> traitements sous-jacents à l’annotation. Ce <strong>de</strong>rnier point est<br />

particulièrement important puisque l’exécution <strong>de</strong> tels traitements reste toujours une<br />

tâche coûteuse en temps, difficile et pas encore totalement fiable. <strong>Le</strong>s analyses<br />

<strong>automatique</strong>s syntaxiques et sémantiques sont encore loin d’être crédibles et les<br />

analyses <strong>automatique</strong>s morpho-syntaxiques, plus abouties, restent gourman<strong>de</strong>s en<br />

ressources et ne sont pas totalement fiables. La qualité <strong>de</strong>s applications est fortement<br />

dépendante <strong>de</strong>s erreurs que <strong>de</strong> telles analyses peuvent engendrer. Cela justifie donc une<br />

annotation sémantique <strong>automatique</strong> du texte avec la métho<strong>de</strong> d’exploration contextuelle<br />

puisque cette <strong>de</strong>rnière offre la possibilité d’effectuer une telle tâche à l’ai<strong>de</strong> d’une<br />

analyse <strong>de</strong> surface sans aucune analyse morpho-syntaxique ou syntaxique, et sans<br />

aucune sorte d’interprétations sémantiques <strong>de</strong>s formes sur lesquelles elle travaille.<br />

D’un point <strong>de</strong> vue « computationnel », la métho<strong>de</strong> d’exploration contextuelle se<br />

distingue tout à fait <strong>de</strong> l’emploi <strong>de</strong>s expressions régulières couramment utilisées pour<br />

reconnaître <strong>de</strong>s motifs, <strong>de</strong>s cue phrases, etc. dans les différentes applications du TAL ou<br />

<strong>de</strong> la recherche d’informations (comme la plate-forme d’annotation GATE-ANNIE 66 ).<br />

Si, dans certains cas simples, une expression régulière peut se substituer à l’exploration<br />

contextuelle pour i<strong>de</strong>ntifier un schéma <strong>de</strong> type indicateur+indices dans un contexte<br />

défini (phrase, paragraphe, etc), la reconnaissance d’autres formes par <strong>de</strong>s critères plus<br />

élaborés n’est toutefois pas possible en se restreignant à cet outil. Enumérons les<br />

principales différences entre l’exploration contextuelle et les expressions régulières :<br />

• Lors du repérage d’un indicateur, l’exploration contextuelle procè<strong>de</strong> par<br />

une recherche d’indice(s) dans le contexte gauche ou droit <strong>de</strong> l’indicateur,<br />

et cela en partant toujours <strong>de</strong> ce <strong>de</strong>rnier. Pour ce qui est <strong>de</strong>s expressions<br />

régulières, elles fonctionnent uniquement <strong>de</strong> façon linéaire <strong>de</strong> gauche vers<br />

la droite, et n’offrent ainsi pas la possibilité <strong>de</strong> hiérarchiser les différents<br />

66 Cf. chapitre 3, partie 1.2.<br />

314

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!