05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 1 : L’activité résumante <strong>de</strong> <strong>textes</strong><br />

très fréquemment en début et fin <strong>de</strong> document. La localisation précise <strong>de</strong>s ces éléments<br />

pertinents dans la structure textuelle correspond à leur emplacement dans la disposition<br />

argumentative sous-jacente à l’article scientifique qui se reflète ainsi (l’objectif <strong>de</strong><br />

l’auteur et la présentation du thème général sont en début d’argumentation, tandis que la<br />

conclusion la parachève). Nous soulignons, et ceci aura une importance dans<br />

l’explication et la justification <strong>de</strong> notre travail, que l’étu<strong>de</strong> <strong>de</strong> <strong>résumé</strong>s issus <strong>de</strong> corpus<br />

d’articles scientifiques et produits par <strong>de</strong>s résumeurs professionnels a montré que ce<br />

sont généralement les mêmes éléments discursifs <strong>de</strong>s articles qui ten<strong>de</strong>nt à constituer les<br />

<strong>résumé</strong>s. Liddy [Liddy 1991] a observé que les <strong>résumé</strong>s d’un corpus d’articles<br />

comprennent la présence principale <strong>de</strong>s composants suivants : objectifs, hypothèses,<br />

métho<strong>de</strong>s, sujets, résultats, conclusions, et références. Dans la reconnaissance d’un<br />

segment textuel comme étant un objectif ou une conclusion, le résumeur s’ai<strong>de</strong> <strong>de</strong><br />

différents indices comme les titres et sous-titres qui sont présents dans le contexte du<br />

segment textuel, et aussi d’autres indices comme la présence <strong>de</strong> marques linguistiques<br />

(mots ou expressions), notamment celles appartenant au métadiscours. <strong>Le</strong> repérage <strong>de</strong><br />

ces marques linguistiques permet d’extraire rapi<strong>de</strong>ment les éléments pertinents que le<br />

résumeur cherche en priorité, et ce repérage se fait généralement à la suite <strong>de</strong> la<br />

sélection initiale d’une zone <strong>de</strong> lecture par le résumeur. On observe que ces marques ne<br />

sont souvent pas liées à un domaine particulier, et se retrouvent dans tous les articles<br />

scientifiques <strong>de</strong> différents domaines 11 . Aussi ces marques sont-elles relativement<br />

indépendantes du style qu’adoptent les auteurs d’articles.<br />

Ces différents observations linguistiques et psycholinguistiques que nous venons<br />

<strong>de</strong> présenter brièvement montrent que, pour localiser l’information pertinente d’un texte<br />

(étape fondamentale dans l’activité résumante), les résumeurs professionnels utilisent<br />

pour l’essentiel <strong>de</strong>s connaissances linguistiques et <strong>de</strong>s métho<strong>de</strong>s heuristiques sans faire<br />

appel à <strong>de</strong>s connaissances <strong>de</strong> domaines, et ils sont donc capables <strong>de</strong> résumer rapi<strong>de</strong>ment<br />

un texte avec une compréhension tout à fait partielle, et sans en lire la totalité du<br />

contenu.<br />

11 Nous montrerons dans le chapitre 3 en quoi ces marques, à partir <strong>de</strong>squelles nous travaillerons dans<br />

notre approche, sont indépendantes <strong>de</strong>s domaines présents au sein <strong>de</strong>s articles scientifiques.<br />

39

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!