05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 4 : Processus et stratégies <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong><br />

pertinentes. Une phrase exprimant l’objectif principal <strong>de</strong> l’auteur est effectivement bien<br />

plus importante qu’une phrase relatant un exemple ou une citation. Pour ce type <strong>de</strong><br />

texte, la connaissance <strong>de</strong> ces catégories discursives au travers <strong>de</strong>s annotations est<br />

précieuse car celles-ci nous indiquent <strong>de</strong> manière fiable la pertinence ou non <strong>de</strong>s phrases<br />

sans aucune évaluation numérique et quantitative. Ainsi, la catégorie discursive<br />

attribuée à une phrase par l’annotation permet d’estimer la pertinence <strong>de</strong> cette <strong>de</strong>rnière<br />

<strong>de</strong> manière qualitative puisqu’elle se fon<strong>de</strong> sur une connaissance linguistique du rôle <strong>de</strong><br />

cette catégorie, qui nous confirme l’importance <strong>de</strong> sa place dans le texte. Nous<br />

renvoyons au chapitre 3 pour une <strong>de</strong>scription plus détaillée <strong>de</strong> l’annotation discursive.<br />

1.2.1.2. La position textuelle<br />

<strong>Le</strong> premier critère <strong>de</strong> pertinence, basé sur l’annotation discursive, repose<br />

essentiellement sur la présence dans les segments textuels <strong>de</strong> marqueurs linguistiques<br />

(indicateur + indices) permettant <strong>de</strong> déterminer le rôle discursif joué par ces <strong>de</strong>rniers (et<br />

donc leur pertinence au sein du texte), or certains marqueurs peuvent souvent être<br />

absents <strong>de</strong>s segments, plus particulièrement les indices dans le contexte <strong>de</strong> l’indicateur.<br />

La prise en compte <strong>de</strong> la structure matérielle du texte <strong>de</strong>vient donc utile pour nous ai<strong>de</strong>r<br />

à mieux définir le rôle discursif du segment et pour évaluer sa pertinence dans le cas du<br />

<strong>résumé</strong> <strong>automatique</strong>. En effet, la structure matérielle du texte correspond à<br />

l’organisation textuelle physique <strong>de</strong>s différents objets textuels qui composent le texte, et<br />

celle-ci participe pleinement au sens du texte (autant que les marques lexicales ou<br />

syntaxiques par exemple).<br />

Nous nous intéressons ainsi dans notre travail à l’exploitation <strong>de</strong> la structure<br />

matérielle du texte pour l’évaluation <strong>de</strong> la pertinence <strong>de</strong> segments textuels dans le cadre<br />

du <strong>résumé</strong> <strong>automatique</strong> et d’autres applications comme la fouille textuelle sémantique<br />

avec les fiches <strong>de</strong> synthèse (chapitre 5). La prise en compte <strong>de</strong> la position d’une phrase<br />

au sein <strong>de</strong> la structure physique est souvent importante dans l’évaluation <strong>de</strong> sa<br />

pertinence puisque la position peut être liée au rôle et à l’intérêt qu’elle joue dans le<br />

texte. Ce critère d’évaluation <strong>de</strong> la pertinence par le positionnement textuel a été<br />

souvent utilisé dans <strong>de</strong>s métho<strong>de</strong>s <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong> employant <strong>de</strong>s techniques<br />

numériques multicritères (chapitre 2). Edmundson [Edmundson 1969] fut le premier à<br />

l’intégrer parmi une liste d’autres critères, et plus récemment Teufel [Teufel 1997] et<br />

Kupiec [Kupiec et al. 1995] l’ont également utilisé dans leurs travaux. En outre ces<br />

264

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!