05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 2 : <strong>Le</strong> <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> <strong>textes</strong><br />

pour les entreprises et d’un progrès pratique pour les employés qui pourront utiliser le<br />

temps gagné à d’autres tâches mieux rapportées à leurs compétences.<br />

1.2.2. Résumé <strong>automatique</strong> et in<strong>de</strong>xation<br />

En raison <strong>de</strong> la difficulté à construire <strong>de</strong>s <strong>résumé</strong>s <strong>de</strong> manière <strong>automatique</strong>,<br />

comme nous l’avons vu, l’in<strong>de</strong>xation a maintenant pris une place prépondérante dans<br />

les outils <strong>de</strong> consultation <strong>de</strong> bases <strong>de</strong> documents. Effectivement, il est beaucoup plus<br />

facile <strong>de</strong> fournir à un utilisateur une <strong>de</strong>scription d’un document à l’ai<strong>de</strong> d’une liste <strong>de</strong><br />

mots-clés représentatifs <strong>de</strong> son contenu qu’à l’ai<strong>de</strong> <strong>de</strong> son <strong>résumé</strong> élaboré<br />

<strong>automatique</strong>ment. Malgré tout, leur exploitation n’est pas du tout comparable, car une<br />

liste <strong>de</strong> mots-clés ne fournit pas <strong>de</strong> détails sur la structure d’un document et qu’elle<br />

contient bien moins d’informations qu’un <strong>résumé</strong> indicatif ou informatif. Un <strong>résumé</strong><br />

peut être considéré comme la <strong>de</strong>scription structurée d’une liste <strong>de</strong> mots-clés résultant<br />

d’une in<strong>de</strong>xation, et le fait d’être un texte (contrairement à une liste) lui permet une bien<br />

meilleure lisibilité. Mais pour <strong>de</strong>s raisons essentiellement <strong>de</strong> simplicité et <strong>de</strong> rapidité,<br />

l’in<strong>de</strong>xation reste très largement préférée au <strong>résumé</strong> <strong>automatique</strong> dans les bases <strong>de</strong><br />

documents.<br />

Comme le précise K. Sparck-Jones [Sparck-Jones 1993], le rapport entre une liste<br />

<strong>de</strong> mots-clés et le texte qu’elle représente est beaucoup plus simple à évaluer que celui<br />

d’un <strong>résumé</strong> avec son texte source. En effet, l’évaluation <strong>de</strong> <strong>résumé</strong>s est une tâche<br />

difficile à cause <strong>de</strong> la gran<strong>de</strong> variabilité <strong>de</strong> ceux-ci dans leur forme comme dans leur<br />

contenu et à cause <strong>de</strong>s différentes façons dont ils peuvent renvoyer différemment aux<br />

<strong>textes</strong> sources 21 .<br />

1.2.3. <strong>Le</strong>s apports scientifiques<br />

En <strong>de</strong>hors du point <strong>de</strong> vue technologique, le domaine du <strong>résumé</strong> <strong>automatique</strong> a<br />

également contribué à certains apports scientifiques avec la recherche <strong>de</strong> connaissances<br />

liées à la construction <strong>de</strong>s <strong>résumé</strong>s. Effectivement, le <strong>résumé</strong> <strong>automatique</strong> a fait avancer<br />

certaines étu<strong>de</strong>s sur <strong>de</strong>s champs particuliers <strong>de</strong> l’activité résumante. La psychologie<br />

21 Cf. chapitre 4, partie 3.1. pour une présentation <strong>de</strong> l’évaluation dans le <strong>résumé</strong> <strong>automatique</strong>.<br />

52

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!