05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 3 : L’annotation discursive à partir d’EXCOM<br />

d’annotation participe à l’apparition d’erreurs d’annotation ou au silence qui peut<br />

exister ?<br />

Au terme <strong>de</strong> cette évaluation, nous pourrons donc juger nos ressources<br />

linguistiques et l’importance <strong>de</strong>s contraintes linguistiques et informatiques sur notre<br />

approche et sur notre système.<br />

Corpus d’étu<strong>de</strong><br />

Dans le cadre <strong>de</strong> notre évaluation, nous décidons <strong>de</strong> constituer notre corpus <strong>de</strong><br />

<strong>textes</strong> du même type que ceux sur lesquels nous avons travaillé auparavant dans<br />

l’élaboration <strong>de</strong> nos ressources. Ainsi, nous choisissons vingt <strong>textes</strong> <strong>de</strong> type article<br />

scientifique dans six corpus différents et plus ou moins relativement liés dans les<br />

domaines qu’ils abor<strong>de</strong>nt. <strong>Le</strong>s six corpus dont sont extraits les <strong>textes</strong> sont celui <strong>de</strong><br />

l’AFIA, <strong>de</strong>s colloques RECITAL 2001, CALS 2006, TALN 2001, et EUROSEM 2000<br />

et <strong>de</strong> la revue ALSIC 49 . Ils portent sur les domaines <strong>de</strong> l’intelligence artificielle, <strong>de</strong>s<br />

sciences du langage, du traitement <strong>automatique</strong> <strong>de</strong>s langues, et <strong>de</strong>s sciences <strong>de</strong><br />

l’éducation (voir le tableau 3 ci-<strong>de</strong>ssous pour la répartition <strong>de</strong>s <strong>textes</strong> suivant le corpus).<br />

Corpus<br />

Nombre<br />

articles<br />

AFIA 7<br />

TALN2001 6<br />

RECITAL2001 1<br />

CALS2006 2<br />

ALSIC 3<br />

EUROSEM2000 1<br />

Total 20<br />

Tableau 3 : Corpus d’évaluation<br />

Dans la construction <strong>de</strong> nos ressources, nous avons travaillé en partie sur <strong>de</strong>s<br />

<strong>textes</strong> provenant <strong>de</strong> ces différents corpus. Toutefois, nous avons également travaillé sur<br />

d’autres ensembles <strong>de</strong> <strong>textes</strong>, tels que <strong>de</strong>s <strong>textes</strong> provenant <strong>de</strong> la revue <strong>de</strong> sciences<br />

cognitives INTELLECTICA ou <strong>de</strong>s <strong>textes</strong> en sciences humaines (sociologie, politique,<br />

49 Nous renvoyons l’auteur à l’annexe 2 partie 1 pour un détail plus complet <strong>de</strong>s articles et <strong>de</strong>s corpus.<br />

246

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!