05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 2 : <strong>Le</strong> <strong>résumé</strong> <strong>automatique</strong> <strong>de</strong> <strong>textes</strong><br />

PDA, téléphones portables, etc.) implique l’étu<strong>de</strong> et la conception <strong>de</strong> nouveaux<br />

systèmes <strong>de</strong> <strong>résumé</strong> pouvant traiter cette variété d’informations hétérogènes, et surtout<br />

pouvant présenter <strong>de</strong> manière adéquate celles-ci en sortie. L’interactivité <strong>de</strong>s systèmes<br />

est également <strong>de</strong> plus en plus étudiée entre l’interface et l’utilisateur. Effectivement, les<br />

moyens mo<strong>de</strong>rnes <strong>de</strong> l’informatique permettent <strong>de</strong> traiter plus aisément les données<br />

multimédia <strong>de</strong>s documents, et aussi <strong>de</strong> plus se concentrer sur les aspects ergonomiques<br />

pour présenter les résultats, ce qui était moins le cas autrefois, où seules <strong>de</strong>s données<br />

textuelles étaient traitées et présentées.<br />

On trouve en conséquence <strong>de</strong>s applications <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong> qui<br />

s’appliquent maintenant à d’autres médias tels que les vidéos ou le son. Evi<strong>de</strong>mment,<br />

les traitements sont très différents mais l’objectif reste le même : fournir <strong>de</strong>s<br />

informations suffisantes à propos d’une vidéo ou d’une musique pour savoir si l’on doit<br />

consulter ou non l’original. Dans le cas d’une vidéo, l’idée est <strong>de</strong> ne retenir que les<br />

scènes les plus importantes, ceci pouvant être déterminé par rapport à <strong>de</strong>s besoins<br />

préalables. Oh et Hua [Oh et Hua 2000] proposent un telle métho<strong>de</strong> pour le <strong>résumé</strong> <strong>de</strong><br />

vidéos à partir <strong>de</strong> l’analyse du contenu visuel <strong>de</strong> celles-ci, voir également [Gong et Liu<br />

2003], [Bin Yu et al. 2003] et [He et al. 1999]. Pour le <strong>résumé</strong> <strong>de</strong> ban<strong>de</strong>s sonores non<br />

verbales, les techniques <strong>de</strong> <strong>résumé</strong> <strong>automatique</strong> s’inspirent essentiellement <strong>de</strong> celles<br />

issues du traitement du signal. L’idée est <strong>de</strong> trouver un ou <strong>de</strong>s moments qui reflètent le<br />

mieux la structure générale <strong>de</strong> la ban<strong>de</strong> sonore (ce peut être un opéra, un morceau <strong>de</strong><br />

musique classique, etc.), voir [Peeters et al. 2002] et [Logan et Chu 2000]. Un autre<br />

champ d’application nouveau porte sur le <strong>résumé</strong> <strong>de</strong> contenu audio du type dialogue.<br />

Effectivement, il existe maintenant <strong>de</strong>s bases qui contiennent <strong>de</strong> très gran<strong>de</strong>s quantités<br />

<strong>de</strong> contenus audio provenant <strong>de</strong>s radios, <strong>de</strong> discours politiques enregistrés, etc. <strong>Le</strong><br />

principe est ici <strong>de</strong> réduire le temps d’écoute <strong>de</strong> ces dialogues en ne retenant que<br />

l’essentiel, voir pour un exemple <strong>de</strong> travaux sur ce sujet [Fabre et al. 2006]. Enfin, on<br />

trouve également <strong>de</strong>s systèmes qui permettent <strong>de</strong> résumer dans un processus commun<br />

<strong>de</strong>s documents contenant plusieurs formats d’informations (<strong>textes</strong>, vidéos, sons, etc.).<br />

Globalement, le principe n’est pas <strong>de</strong> résumer séparément chaque format d’informations<br />

avec les métho<strong>de</strong>s qui conviennent mais plutôt <strong>de</strong> prendre en compte tous les formats<br />

dans un même traitement. Ce sont donc <strong>de</strong>s traitements plus génériques qui ne rentrent<br />

pas réellement dans le contenu informatif décrit par chaque format. Dans [Laborie et al.<br />

2007], le principe est <strong>de</strong> construire un graphe qui mette en relation tous les objets<br />

multimédias contenus dans le document (vidéos, <strong>textes</strong> et images), en considérant en<br />

84

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!