05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 3 : L’annotation discursive à partir d’EXCOM<br />

Deuxièmement, aucun type d’apprentissage <strong>automatique</strong> n’intervient, notamment<br />

pour la construction <strong>de</strong>s bases <strong>de</strong> marqueurs ou pour l’annotation. Ceci ne nous soumet<br />

pas alors à la dépendance d’un type <strong>de</strong> corpus sur lequel l’apprentissage aurait été fait.<br />

Troisièmement, enfin il n’y a pas d’utilisation d’ontologies <strong>de</strong> domaines, puis<br />

éventuellement, <strong>de</strong> reconnaissance <strong>de</strong>s entités nommées dans le texte. L’annotation que<br />

nous défendons s’appuie essentiellement sur le repérage <strong>de</strong> relations sémantiques dans<br />

le texte qui sont indépendantes <strong>de</strong>s domaines à la différence <strong>de</strong>s entités nominales 45 .<br />

Nous noterons toutefois qu’EXCOM n’est pas en opposition avec l’utilisation<br />

d’analyses morpho-syntaxique / syntaxique, ou d’ontologies avec un repérage d’entités<br />

nommées. Ces éléments n’ont pas été intégrés initialement car ils ne sont pas<br />

indispensables dans le processus d’annotation par exploration contextuelle. Mais dans le<br />

cadre d’applications plus larges, le repérage d’entités nommées associées à une<br />

ontologie, par exemple, peut <strong>de</strong>venir très utile pour pouvoir reconnaître les arguments<br />

d’une relation que l’on aurait déjà annotée (comme une relation <strong>de</strong> rencontre qui serait<br />

annotée et où dont on chercherait les arguments : qui a rencontré qui).<br />

L’objectif d’EXCOM n’est pas <strong>de</strong> constituer une alternative aux techniques<br />

actuelles <strong>de</strong> TAL dans l’annotation <strong>automatique</strong> <strong>de</strong> <strong>textes</strong>, mais plutôt <strong>de</strong> proposer une<br />

approche complémentaire, peut-être plus appropriée pour répondre à certaines tâches<br />

spécifiques comme la recherche par points <strong>de</strong> vue. Cette démarche nécessite un travail<br />

linguistique d’investigation dans les <strong>textes</strong> pour dégager les marqueurs, ainsi qu’une<br />

expertisation <strong>de</strong>s ressources. Cependant, la constitution <strong>de</strong> ressources (marqueurs<br />

linguistiques et règles d’exploration contextuelle) par <strong>de</strong>s linguistes sur un point <strong>de</strong> vue<br />

<strong>de</strong> fouille précis (comme les hypothèses) ne nécessite pas dans le temps <strong>de</strong> lour<strong>de</strong>s ou<br />

continuelles modifications, mais seulement <strong>de</strong>s ajustements. Ceci est dû à la nature<br />

discursive <strong>de</strong>s marques qui restent stables, indépendantes <strong>de</strong>s domaines (nous le<br />

justifierons aussi dans la partie suivante).<br />

L’intérêt d’une telle métho<strong>de</strong> d’annotation est <strong>de</strong> fournir à un utilisateur la<br />

possibilité <strong>de</strong> pouvoir sélectionner <strong>de</strong>s points <strong>de</strong> vue <strong>de</strong> fouille dans son parcours <strong>de</strong><br />

recherche d’informations. Il peut concevoir ainsi <strong>de</strong>s requêtes plus avancées : citations<br />

<strong>de</strong> X, définition du terme Y… <strong>Le</strong> projet actuel MOXCE s’inscrit dans cette<br />

perspective : il consiste en la recherche d’informations dans une base <strong>de</strong> documents<br />

45 Cela sera justifié dans la suite <strong>de</strong> ce chapitre<br />

123

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!