05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 3 : L’annotation discursive à partir d’EXCOM<br />

pronominale contenue dans l’indicateur, et non pas à la polysémie <strong>de</strong> l’indicateur, mais<br />

cela expose le problème du contexte particulier où il est posé dans un cas difficilement<br />

gérable <strong>automatique</strong>ment. Nous prenons conscience <strong>de</strong> ce fait puisqu’il intervient dans<br />

le bruit, même <strong>de</strong> manière faible, mais nous considérons prioritairement l’utilisation <strong>de</strong><br />

nos marques au sein du texte dans les con<strong>textes</strong> les plus fréquents et les plus généraux<br />

(dans la mesure où cela n’introduit qu’un bruit très faible).<br />

Une secon<strong>de</strong> source <strong>de</strong> bruit prend son origine dans la taille <strong>de</strong> l’espace <strong>de</strong><br />

recherche <strong>de</strong>s indices autour <strong>de</strong> l’indicateur, cela <strong>de</strong> la même manière que le rappel. En<br />

effet, certaines règles s’exécutent dans un espace <strong>de</strong> recherche non approprié (trop<br />

large) pour déterminer correctement la valeur discursive du segment. La recherche d’un<br />

ou plusieurs indices au <strong>de</strong>là <strong>de</strong> la proposition pour certains indicateurs, introduit un<br />

bruit considérable. La levée <strong>de</strong> l’indétermination pour <strong>de</strong> nombreux marqueurs <strong>de</strong>vrait<br />

pouvoir se faire dans le contexte <strong>de</strong> la proposition pour que l’annotation soit correcte.<br />

Pour remédier à ce problème, qui provoque aussi bien du bruit que du silence dans notre<br />

approche <strong>de</strong> l’annotation discursive <strong>de</strong> segments, <strong>de</strong>s travaux sont actuellement en cours<br />

au laboratoire <strong>LaLIC</strong> ayant pour but la construction d’un segmenteur <strong>de</strong> <strong>textes</strong> en<br />

propositions. Ceci permettra d’effectuer ensuite <strong>de</strong>s recherches d’indices dans <strong>de</strong>s<br />

con<strong>textes</strong> propositionnels afin d’obtenir <strong>de</strong>s résultats plus fiables et plus complets.<br />

Pour terminer l’analyse <strong>de</strong> cette évaluation, nous ferons quelques remarques. L’un<br />

<strong>de</strong>s avantages <strong>de</strong>s systèmes basés sur <strong>de</strong>s ressources linguistiques construites par<br />

l’homme et non pas <strong>automatique</strong>ment, tel que le nôtre, est qu’ils peuvent être améliorés<br />

par <strong>de</strong> nouvelles modifications <strong>de</strong>s ressources (ajouts, retraits…) qui sont totalement<br />

sous le contrôle d’un humain compétent (ici un linguiste). <strong>Le</strong>s modifications effectuées<br />

en sont ainsi quasiment toujours contrôlées et positives. Dans le cadre <strong>de</strong> systèmes<br />

reposant sur <strong>de</strong>s connaissances construites par apprentissage et sur lesquelles on<br />

n’intervient pas ou très peu directement, les variations peuvent tendre généralement vers<br />

l’amélioration mais cela n’exclut pas l’insertion d’éléments bruiteurs (notamment<br />

parcequ’il n’y a pas <strong>de</strong> différence dans les <strong>textes</strong> entre les cas particuliers ou généraux<br />

d’utilisation <strong>de</strong>s marqueurs). Lors <strong>de</strong> cette évaluation, il nous a été possible <strong>de</strong><br />

comprendre les causes <strong>de</strong> chaque annotation attribuée puisque l’on maîtrise entièrement<br />

les ressources et les règles d’annotation, ce qui n’est souvent pas le cas dans les<br />

systèmes par apprentissage. L’amélioration <strong>de</strong> notre système pour la suite s’avère plus<br />

aisée et maîtrisable. Après cette évaluation, nous avons vu qu’il est donc possible<br />

253

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!