05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 4 : Processus et stratégies <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong><br />

simples, sinon nous gardons la forme d’origine si elle est au pluriel dans le segment<br />

textuel, voir figure 25).<br />

La domination <strong>de</strong>s Anglais sur les mers <br />

Extraction TREETAGGER<br />

domination : NOM<br />

Anglais : NAM<br />

mers : NOM<br />

Génération formes dérivées<br />

Liste termes<br />

thématiques<br />

Domination(s) ?<br />

domination(s) ?<br />

Anglais<br />

Mer(s) ?<br />

mer(s) ?<br />

Figure 25 : Construction d’une liste <strong>de</strong> termes thématiques<br />

2.3. Repérage <strong>de</strong>s phrases peu fiables<br />

2.3.1. Présentation<br />

En complément <strong>de</strong> l’estimation <strong>de</strong> l’information pertinente dans les <strong>textes</strong> à l’ai<strong>de</strong><br />

<strong>de</strong>s critères précé<strong>de</strong>mment exposés (étape 3, voir partie 1.1.2), nous vérifions également<br />

pour chaque phrase la présence d’éléments linguistiques permettant d’établir, du fait <strong>de</strong><br />

leur rôle, que celles-ci ne sont pas fiables pour le <strong>résumé</strong>, même si ces phrases<br />

appartiennent à <strong>de</strong>s catégories discursives pertinentes (étape 4). Notre démarche qui<br />

consiste à reconnaître et à catégoriser les phrases pertinentes pour le <strong>résumé</strong>, peut elle<br />

aussi s’appliquer à l’inverse pour i<strong>de</strong>ntifier les phrases estimées comme n’étant pas<br />

fiables. L’idée principale est d’exclure certaines phrases estimées comme pouvant être<br />

279

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!