05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 3 : L’annotation discursive à partir d’EXCOM<br />

possible <strong>de</strong> faire certaines requêtes précises sur le texte, comme extraire toutes les<br />

conclusions ou les hypothèses présentes dans le cas d’un article scientifique.<br />

Il est important <strong>de</strong> noter aussi un <strong>de</strong>uxième inconvénient <strong>de</strong>s métho<strong>de</strong>s <strong>de</strong> TAL<br />

actuelles, qui est la conséquence <strong>de</strong>s analyses employées pour arriver à l’exécution<br />

d’une tâche. Effectivement, les traitements qui sont exécutés passent souvent par<br />

différentes étapes séparées chacune par <strong>de</strong>s analyses <strong>de</strong> nature différente<br />

(morphologique, syntaxique, etc.). Or chaque analyse nécessite <strong>de</strong>s connaissances<br />

propres et font dépendre les autres <strong>de</strong> son bon fonctionnement. Ce déroulement <strong>de</strong>s<br />

traitements par étapes d’analyses successives complexifie considérablement les<br />

applications, et font aussi dépendre l’exécution <strong>de</strong> certaines tâches <strong>de</strong> traitements sousjacents<br />

pas toujours fiables et consommateurs en temps <strong>de</strong> calcul. Afin <strong>de</strong> remédier à ce<br />

problème, une solution consistera, avec la métho<strong>de</strong> que nous allons présenter, en<br />

l’exploration du contexte textuel avec la recherche <strong>de</strong> formes <strong>de</strong> surface, qui dans le cas<br />

<strong>de</strong> l’annotation sémantique, nous permettra <strong>de</strong> nous passer d’analyses morphologiques<br />

ou syntaxiques dans les traitements dédiés à cet objectif.<br />

Nous allons ainsi exposer une métho<strong>de</strong>, la métho<strong>de</strong> d’exploration contextuelle, qui<br />

permet <strong>de</strong> franchir ces contraintes que nous venons d’évoquer. C’est à partir <strong>de</strong> cette<br />

métho<strong>de</strong> que nous allons pouvoir catégoriser une partie <strong>de</strong>s informations contenues dans<br />

le texte, sans analyses en profon<strong>de</strong>ur, afin <strong>de</strong> pouvoir par la suite les extraire plus<br />

facilement, et <strong>de</strong> répondre à certaines tâches, comme la fouille textuelle, le <strong>résumé</strong><br />

<strong>automatique</strong> (chapitre 4), ou la construction <strong>de</strong> fiches <strong>de</strong> synthèse (chapitre 6). La<br />

métho<strong>de</strong> d’exploration contextuelle ([Desclés et Minel 2005], [Desclés et al. 1997] et<br />

[Desclés 1997]) procè<strong>de</strong> par une analyse <strong>de</strong> surface du texte avec la reconnaissance <strong>de</strong><br />

formes linguistiques (marqueurs linguistiques) indiquant l’éventuelle présence d’une<br />

certaine information d’ordre sémantique.<br />

La métho<strong>de</strong> d’exploration contextuelle se veut avant tout comme une métho<strong>de</strong><br />

linguistico-computationnelle adaptée particulièrement au traitement <strong>automatique</strong> <strong>de</strong> la<br />

langue dans le cadre d’analyses d’ordre sémantique. Elle repose pour cela sur un<br />

ensemble d’hypothèses cognitives et linguistiques que nous énumérons ([Desclés<br />

2006] [Blais et Desclés 2008]) :<br />

– Hypothèse cognitive 1 : Dans une recherche d’informations au sein d’un<br />

texte, le lecteur se focalise sur certains segments textuels et sur <strong>de</strong>s<br />

108

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!