05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 3 : L’annotation discursive à partir d’EXCOM<br />

- un segment textuel discontinu composé <strong>de</strong> plusieurs mots pouvant être<br />

distants et non continus dans le texte, tel que l’indicateur il est …<br />

important…que pour la recherche <strong>de</strong> soulignement.<br />

- un ou plusieurs signes <strong>de</strong> ponctuation, tels que le : « qui est un indicateur<br />

pour repérer <strong>de</strong>s discours rapportés directes (pour le cas <strong>de</strong>s citations) dans<br />

les <strong>textes</strong> [Alaharabi 2006].<br />

- une expression symbolique ayant un rôle particulier comme les renvois<br />

bibliographiques sous la forme (XXX 07) ou encore [YYY, 2006], notamment<br />

dans les travaux sur l’étu<strong>de</strong> <strong>de</strong>s citations et <strong>de</strong>s renvoies bibliographiques<br />

dans les <strong>textes</strong> scientifiques [Bertin et al. 2006].<br />

Toutefois, nous l’avons remarqué dans les hypothèses plus hautes, la présence seule<br />

d’un indicateur ne permet pas toujours d’annoter un segment textuel, car la valeur<br />

sémantique <strong>de</strong> l’indicateur peut varier en fonction du contexte. Il faut pour cela dans un<br />

second temps lever l’indétermination sémantique pouvant porter sur l’indicateur, afin <strong>de</strong><br />

s’assurer qu’il renvoie bien à la catégorie sémantique recherchée. Cette levée <strong>de</strong><br />

l’indétermination pour les différents indicateurs s’effectue alors par l’application <strong>de</strong><br />

règles d’exploration contextuelle. Ces règles consistent à rechercher dans le contexte<br />

textuel <strong>de</strong> l’indicateur (voir également la figure 12), un ou plusieurs indices<br />

linguistiques particuliers permettant <strong>de</strong> lever l’indétermination sémantique et <strong>de</strong> pouvoir<br />

ensuite annoter le segment textuel (ce <strong>de</strong>rnier pouvant correspondre à l’indicateur seul<br />

ou bien plus largement à la proposition, à la phrase, etc.). La recherche d’un indice dans<br />

un certain contexte se fait toujours en partant <strong>de</strong> l’indicateur jusqu’à ce qu’une<br />

occurrence soit trouvée. Il est aussi possible d’exécuter une recherche sur <strong>de</strong>s indices<br />

négatifs. Ce sont <strong>de</strong>s indices, qui à l’opposé <strong>de</strong>s autres, doivent être absents du contexte<br />

alentour. L’intérêt <strong>de</strong> ceux-ci est <strong>de</strong> s’assurer que certaines marques linguistiques dans<br />

le contexte <strong>de</strong> l’indicateur ne vont pas infirmer la valeur sémantique qui est indiquée par<br />

l’indicateur. Dans le cas où l’on chercherait à annoter une déclaration, il ne faudrait pas<br />

la présence d’un si (ou d’un autre équivalent) dans le contexte gauche d’un indicateur<br />

pointant une telle catégorie sémantique (par exemple avec l’indicateur je déclare).<br />

Aussi, l’exploration contextuelle permet <strong>de</strong> rechercher <strong>de</strong>s indices dans <strong>de</strong>s con<strong>textes</strong><br />

particuliers comme les titres, la première phrase du premier paragraphe, etc. Dans<br />

certains cas, l’indicateur seul peut être suffisamment fiable pour pouvoir annoter un<br />

segment, et la recherche d’indices n’est alors plus nécessaire pour lever<br />

110

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!