05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 3 : L’annotation discursive à partir d’EXCOM<br />

un indice comme dans cet article pouvant lever l’indétermination sémantique portant<br />

sur un tel indicateur est bien souvent absent et implicite).<br />

Nous allons maintenant traiter <strong>de</strong>s phénomènes <strong>de</strong> silence et <strong>de</strong> bruit qui<br />

interviennent dans notre évaluation.<br />

La principale source <strong>de</strong> silence dans notre évaluation provient du choix <strong>de</strong> ne pas<br />

reconnaître les segments comportant <strong>de</strong>s marques linguistiques trop polysémiques, car<br />

leur i<strong>de</strong>ntification nécessite en effet la construction <strong>de</strong> règles d’exploration contextuelle<br />

dédiées pour traiter correctement ces cas particuliers. Nous avons construit nos règles<br />

d’annotation en fonction d’ensemble <strong>de</strong> marqueurs proches sémantiquement, voir<br />

syntaxiquement, et dont la levée <strong>de</strong> l’indétermination peut se résoudre <strong>de</strong> manière<br />

commune. Or, pour <strong>de</strong> telles marques, <strong>de</strong>s règles propres doivent être faites. Dans le<br />

cadre actuel, nous avons choisi <strong>de</strong> retirer ces marques trop polysémiques, parce qu’elles<br />

engendraient du bruit, et <strong>de</strong> reporter ultérieurement la construction <strong>de</strong> règles spécifiques<br />

à la suite d’une analyse linguistique plus détaillée <strong>de</strong> ces marques.<br />

Une autre source <strong>de</strong> silence correspond à l’impossibilité d’exécuter certaines<br />

règles dans un espace <strong>de</strong> recherche <strong>de</strong>s indices bien précis, nécessaire pour une<br />

application juste <strong>de</strong> la règle. Dans certains cas, une recherche d’indices au sein <strong>de</strong> la<br />

proposition s’avère nécessaire, tandis qu’au niveau <strong>de</strong> la phrase une exploration risque<br />

d’engendrer une erreur d’analyse en trouvant une marque (faisant office d’indice) qui ne<br />

serait pas rattachée à l’indicateur et ne lèverait donc pas l’indétermination qui porterait<br />

sur ce <strong>de</strong>rnier. Voici <strong>de</strong>ux exemples pour illustrer ce problème d’espace <strong>de</strong> recherche<br />

trop large et qui intervient aussi d’une autre façon dans le bruit, comme nous le verrons<br />

plus loin (les indicateurs sont en gras et les indices sont soulignés) :<br />

(a) « Notre concept d'épreuve stipule simplement ceci : dès lors qu'un sujet se met<br />

dans la situation propre à la réalisation d'un genre, il est conduit à mettre en<br />

oeuvre quelques gestes fondamentaux, correspondant à la structure <strong>de</strong><br />

l'épreuve, et contribuant à la régularité <strong>de</strong>s formes génériques. » Economie<br />

cinétique et formes <strong>de</strong> mimesis : le cas <strong>de</strong>s histoires <strong>de</strong> vie, Jean-Michel<br />

Baudoin & Juan Pita, CALS2006.<br />

(b) « <strong>Le</strong> but <strong>de</strong> cette annotation sera indiqué dans l'élément « Purpose » par le<br />

terme standard « discipline » puisque l'annotation indique dans ce cas à quelle<br />

251

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!