05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 3 : L’annotation discursive à partir d’EXCOM<br />

psychologie, etc.) issus <strong>de</strong> la base d’articles en ligne <strong>de</strong> l’Institut Jean Nicod. Nous<br />

faisons ces remarques tout simplement pour informer le lecteur que les ressources qui<br />

vont être exploitées ici ne se sont pas élaborées uniquement dans le cadre restreint <strong>de</strong>s<br />

corpus que nous retenons ici pour l’évaluation. <strong>Le</strong>s ressources ont été généralisées le<br />

plus possible pour ne pas les faire dépendre d’un corpus, la validation va nous permettre<br />

<strong>de</strong> vérifier si ce choix convient bien.<br />

Protocole<br />

Notre protocole consiste en un calcul sur chaque texte <strong>de</strong>s valeurs <strong>de</strong> précision et<br />

<strong>de</strong> rappel pour chaque catégorie discursive intervenant dans l’annotation ainsi que pour<br />

l’ensemble <strong>de</strong> toutes les catégories intervenantes. Rappelons comment sont calculés les<br />

taux <strong>de</strong> précision et <strong>de</strong> rappel mis dans le cadre <strong>de</strong> notre évaluation :<br />

a : Nombre d’annotations correctes attribuées <strong>automatique</strong>ment.<br />

b : Nombre d’annotations attribuées <strong>automatique</strong>ment<br />

c : Nombre d’annotations correctes attribuées manuellement<br />

Précision (%) = (a / b) * 100<br />

Rappel (%) = (a / c) * 100<br />

<strong>Le</strong> calcul du rappel nécessite donc d’avoir annoté manuellement les vingt <strong>textes</strong><br />

avec les mêmes catégories discursives qui ont été lancées <strong>automatique</strong>ment sur les<br />

<strong>textes</strong>.<br />

Nous ferons remarquer un point important <strong>de</strong> l’évaluation qui porte sur<br />

l’annotation manuelle <strong>de</strong>s vingt <strong>textes</strong>. Nous avons annoté uniquement les segments<br />

comportant <strong>de</strong>s marques linguistiques explicites pouvant justifier la valeur discursive<br />

qu’on leur affecte. Nous considérons que cette approche est assez objective et peu<br />

soumise au jugement <strong>de</strong> celui qui annote, en raison <strong>de</strong> la présence d’indices matériels<br />

communément admis comme étant associés à <strong>de</strong>s fonctions textuelles précises<br />

(représentatives <strong>de</strong> catégories discursives). Une annotation sans référence à <strong>de</strong>s marques<br />

247

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!