05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 4 : Processus et stratégies <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong><br />

texte particulièrement en fonction <strong>de</strong>s catégories discursives auxquelles elles<br />

appartiennent.<br />

2. Sélection et extraction <strong>de</strong> l’information qui sera intégrée dans le <strong>résumé</strong> à<br />

travers <strong>de</strong>s segments pertinents qui sont annotés sémantiquement. La stratégie <strong>de</strong><br />

sélection s’effectue à partir <strong>de</strong> connaissances sur les catégories les plus<br />

pertinentes (à travers un ordonnancement que nous verrons dans la suite).<br />

3. Mise en présentation du <strong>résumé</strong>. On insère par concaténation les segments<br />

retenus et on effectue <strong>de</strong>s nettoyages sur le <strong>résumé</strong> afin qu’il puisse être<br />

« présentable », c’est-à-dire pouvoir offrir une lisibilité satisfaisante au lecteur<br />

du <strong>résumé</strong>.<br />

Si notre approche <strong>automatique</strong> ne consiste pas en une analyse en profon<strong>de</strong>ur du<br />

texte avec compréhension comme dans les modèles humains classiques (celui <strong>de</strong><br />

Kintsch et Van Dijk pas exemple), le processus résumant se décompose bien <strong>de</strong> la<br />

même façon que ceux-ci en trois phases séparées par <strong>de</strong>s traitements pour <strong>de</strong>s tâches<br />

différentes : analyser, sélectionner et extraire, présenter. Ce qui change<br />

fondamentalement, ce sont les moyens qui interviennent dans ces phases pour exécuter<br />

chaque tâche. Par exemple dans la première phase, l’analyse <strong>de</strong> l’information source<br />

consiste pour nous à obtenir un texte sémantiquement annoté (les annotations se référant<br />

aux catégories discursives) tandis que dans les modèles humains (ou encore certains<br />

modèles informatiques par compréhension, voir chapitre 2) l’objectif est <strong>de</strong> produire<br />

une représentation sémantique du texte 52 . Cependant, si les résultats <strong>de</strong>s traitements<br />

internes à une phase sont différents, l’action générale exercée dans la phase reste la<br />

même. Dans notre cas l’action exercée reste bien en fin <strong>de</strong> compte l’analyse <strong>de</strong><br />

l’information source, la sélection et l’extraction <strong>de</strong> l’information pertinente, et la mise<br />

en présentation du <strong>résumé</strong>, comme pour les modèles humains.<br />

52 L’annotation sémantique consiste en l’enrichissement du texte par <strong>de</strong> nouvelles données sémantiques<br />

qui s’y superposent tandis que l’élaboration par la compréhension d’une représentation sémantique du<br />

texte correspond à la création d’un autre objet distinct du texte.<br />

258

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!