05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 2 : <strong>Le</strong> <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> <strong>textes</strong><br />

particulier une dimension temporelle entre eux (ils utilisent l’algèbre d’Allen qui<br />

travaille sur les relations entre intervalles temporelles, [Allen 1983]). A chaque objet<br />

multimédia du document est affectée une valeur correspondant à son <strong>de</strong>gré <strong>de</strong><br />

pertinence dans le document, ce qui permet ensuite <strong>de</strong> désigner à partir d’un algorithme<br />

les meilleurs objets pour la construction du <strong>résumé</strong>.<br />

4.4. La compression <strong>de</strong> <strong>textes</strong><br />

<strong>Le</strong> domaine <strong>de</strong> recherche portant sur la compression <strong>de</strong> <strong>textes</strong> consiste en<br />

l’élagage dans les phrases <strong>de</strong> certaines parties auxiliaires qui, par leur effacement,<br />

n’enlèvent pas l’information première véhiculée par la phrase et n’altèrent pas la<br />

cohérence grammaticale. Appliqué sur un texte, ce traitement effectue bien une<br />

compression, en réduisant la taille <strong>de</strong> celui-ci. Toutefois, ceci ne s’apparente pas tout à<br />

fait au <strong>résumé</strong> <strong>automatique</strong> puisque la compression ne retient que les éléments qui sont<br />

pertinents au sein <strong>de</strong> la phrase et non au sein du texte. La pertinence <strong>de</strong>s éléments dans<br />

une phrase s’évalue alors suivant <strong>de</strong> nombreux critères comme la fonction syntaxique<br />

qu’ils effectuent, le rôle rhétorique qu’ils jouent selon la RST (nucleï ou satellites), etc.<br />

Parmi ces différents critères <strong>de</strong> pertinence, il n’y a pas réellement <strong>de</strong> prise en compte du<br />

texte lui-même : on cherche une pertinence locale et non pas globale comme dans le<br />

<strong>résumé</strong> <strong>automatique</strong>. Toutefois, l’intérêt <strong>de</strong> la compression <strong>de</strong> <strong>textes</strong> est apparu comme<br />

un post-traitement à la suite <strong>de</strong> la construction <strong>automatique</strong> <strong>de</strong> <strong>résumé</strong>s. Effectivement,<br />

il peut <strong>de</strong>venir intéressant <strong>de</strong> vouloir encore réduire la taille d’un <strong>résumé</strong> obtenu,<br />

d’autant plus que la compression n’altèrera pas par son traitement les informations<br />

pertinentes qui ont été retenues par le processus résumant. Ceci peut paraître encore<br />

plus profitable dans le cadre <strong>de</strong>s <strong>résumé</strong>s produits par extraction, puisque ceux-ci<br />

peuvent contenir <strong>de</strong>s phrases qui ne sont pertinentes que sur l’une <strong>de</strong> leur partie. La<br />

compression ajoute une analyse <strong>de</strong> la pertinence interne à la phrase que l’extraction<br />

n’effectuait pas. Dans le cas <strong>de</strong>s <strong>résumé</strong>s qui sont produits par génération, ceux-ci sont<br />

moins affectés par ce type <strong>de</strong> traitement intra-phrastique. Ainsi, dans ce rôle <strong>de</strong> posttraitement<br />

à la suite du processus résumant mais aussi d’autres traitements, la<br />

compression <strong>de</strong> <strong>textes</strong> offre <strong>de</strong>s perspectives utiles. La compression <strong>de</strong> <strong>textes</strong> a<br />

également l’avantage d’être relativement autonome du <strong>résumé</strong> <strong>automatique</strong> du point <strong>de</strong><br />

vue <strong>de</strong>s techniques employées, car elles sont plutôt ancrées dans l’analyse<br />

85

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!