05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 7 : Quelques aspects multilingues<br />

Pour récapituler tout cela, nous rappelons alors les principaux éléments <strong>de</strong> notre<br />

approche qui sont indépendants <strong>de</strong>s langues (dans le sens où ils traversent toutes ces<br />

langues) :<br />

• les annotations discursives et les catégories auxquelles elles renvoient ;<br />

• la carte sémantique qui regroupe sous forme <strong>de</strong> réseau <strong>de</strong> relations les catégories<br />

discursives ;<br />

• le processus résumant au moins dans l’idée que l’annotation et l’extraction sur le<br />

critère <strong>de</strong>s catégories discursives constituent l’essentiel <strong>de</strong> celui-ci ;<br />

• les stratégies résumantes qui composent les <strong>résumé</strong>s en sélectionnant les<br />

catégories discursives adéquates pour un type <strong>de</strong> <strong>résumé</strong>.<br />

Sinon les éléments variables dans chaque langue sont :<br />

• les ressources linguistiques qui composent et détectent les catégories discursives<br />

dans les <strong>textes</strong>, c’est-à-dire les marqueurs linguistiques et les règles<br />

d’exploration contextuelle ;<br />

• certains traitements spécialisés comme la segmentation du texte en phrases,<br />

paragraphes, propositions, etc.<br />

2. Travaux multilingues au laboratoire <strong>LaLIC</strong><br />

Nous rassemblons dans le tableau 12 les différents travaux du laboratoire <strong>LaLIC</strong><br />

dans d’autres langues que le français à propos <strong>de</strong> l’annotation discursive et ses<br />

applications, notamment dans le <strong>résumé</strong> <strong>automatique</strong>. Nous précisons encore une fois<br />

que tous ces travaux se font en concertation les uns aux autres dans l’objectif <strong>de</strong> fournir<br />

une plate-forme d’ingénierie multilingue commune (reposant sur le système<br />

d’annotation <strong>automatique</strong> EXCOM) dans laquelle chaque tâche d’annotation puisera<br />

dans les ressources nécessaires pour le traitement <strong>de</strong> chacune <strong>de</strong>s langues. Nous ne<br />

présenterons brièvement dans la suite que certains travaux qui portent sur l’annotation<br />

354

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!