05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 2 : <strong>Le</strong> <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> <strong>textes</strong><br />

connaissance <strong>de</strong> la structure rhétorique du texte peut fournir directement l’ordre<br />

d’importance <strong>de</strong>s phrases du texte.<br />

Pour les travaux employant principalement <strong>de</strong>s techniques linguistiques dans le<br />

traitement principal, l’objectif est <strong>de</strong> repérer les segments les plus importants à partir <strong>de</strong><br />

connaissances linguistiques sur les <strong>textes</strong> (marques linguistiques, structures discursives,<br />

etc.) sans essayer <strong>de</strong> faire appel à une quelconque forme d’évaluation quantitative <strong>de</strong> la<br />

pertinence, où l’on mélange <strong>de</strong>s critères <strong>de</strong> nature(s) diverse(s). Ce type <strong>de</strong> métho<strong>de</strong> qui<br />

repose donc essentiellement sur <strong>de</strong>s techniques linguistiques admettent souvent<br />

l’hypothèse que certaines marques <strong>de</strong> surface (marqueurs) dans un contexte textuel bien<br />

précis permettent d’affecter une valeur au segment (sémantique, rhétorique, etc.) qui les<br />

contient (la phrase ou la proposition en général), et ainsi <strong>de</strong> connaître sa pertinence dans<br />

le texte afin <strong>de</strong> l’extraire pour construire le <strong>résumé</strong>. Ces métho<strong>de</strong>s sont généralement<br />

bien moins utilisées que les autres, surtout celles avec un emploi exclusif <strong>de</strong> techniques<br />

linguistiques et non quantitatives. L’inconvénient majeur pour les informaticiens est la<br />

difficulté <strong>de</strong> réaliser un traitement <strong>automatique</strong> du texte à partir <strong>de</strong>s concepts<br />

linguistiques qui doivent être employés, ainsi que la contrainte <strong>de</strong> <strong>de</strong>voir constituer <strong>de</strong>s<br />

connaissances et ressources linguistiques qui seront utilisées par le système.<br />

L’avenir <strong>de</strong>s techniques positionnant leurs principaux traitements au niveau<br />

discursif semble prometteur pour faire avancer qualitativement les systèmes, que ceuxci<br />

soient par extraction ou par compréhension. Effectivement, les opérations <strong>de</strong> mise en<br />

texte dirigées par une stratégie discursive laissent <strong>de</strong>s traces particulières dans les <strong>textes</strong><br />

qui peuvent être exploitées <strong>automatique</strong>ment. Ces traces sont <strong>de</strong>s marques qui indiquent<br />

aux lecteurs le rôle textuel joué par certains segments textuels, et <strong>de</strong> plus elles ai<strong>de</strong>nt<br />

aussi celui-ci à reconstruire convenablement la représentation discursive, action<br />

fondamentale dans la compréhension. Par les informations discursives qu’elles<br />

fournissent à propos <strong>de</strong> certains segments ou structures qui les contiennent, ces marques<br />

sont ainsi <strong>de</strong> très bons indicateurs pour déterminer la pertinence <strong>de</strong> ceux-ci. Ces<br />

marques sont relativement fiables malgré <strong>de</strong>s phénomènes <strong>de</strong> polysémie qu’il faut<br />

parfois traiter localement, mais surtout elles peuvent apparaître, pour certaines, comme<br />

étant indépendantes <strong>de</strong>s domaines traitées dans les <strong>textes</strong>, ce qui est un atout<br />

considérable par rapport à d’autres métho<strong>de</strong>s (comme celles employant <strong>de</strong>s ontologies,<br />

ou <strong>de</strong>s scripts tous rattachés à <strong>de</strong>s domaines particuliers). Pour ce qui est <strong>de</strong>s approches<br />

par compréhension, elles sont d’une ai<strong>de</strong> considérable pour la construction <strong>de</strong> la<br />

71

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!