05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 7 : Quelques aspects multilingues<br />

2.4. COREEN : <strong>résumé</strong> et repérage <strong>de</strong>s citations<br />

La langue coréenne appartient au groupe ouralo-altaïque et elle possè<strong>de</strong> <strong>de</strong>s<br />

propriétés nettement différentes du français qui ont une influence importante sur son<br />

traitement <strong>automatique</strong>. <strong>Le</strong> coréen est une langue entièrement agglutinante qui possè<strong>de</strong><br />

un système complexe d’affixes. De plus, avec le phénomène <strong>de</strong> l’ordre libre partiel dans<br />

les phrases coréennes 83 , l’analyse morpho-syntaxique <strong>de</strong> cette langue reste difficile. En<br />

travaillant uniquement sur les formes <strong>de</strong> surfaces, sans aucune analyse morphologique<br />

ou morpho-syntaxique, la métho<strong>de</strong> d’exploration contextuelle fournit ainsi un outil<br />

particulièrement adéquat dans le cadre <strong>de</strong> l’annotation sémantique <strong>de</strong> <strong>textes</strong> coréens<br />

[Chai 2007].<br />

<strong>Le</strong>s recherches au laboratoire <strong>LaLIC</strong> sur l’annotation sémantique <strong>de</strong>s <strong>textes</strong><br />

coréens se décomposent en trois thématiques :<br />

1. Une première étu<strong>de</strong> sur la faisabilité du <strong>résumé</strong> <strong>automatique</strong> en coréen à<br />

partir <strong>de</strong> l’approche adoptée au laboratoire <strong>LaLIC</strong> a été faite en 2004 à la<br />

suite d’un mémoire <strong>de</strong> Maîtrise [Kang 2004]. Ensuite sur la base <strong>de</strong>s<br />

travaux en français portant sur le <strong>résumé</strong> <strong>automatique</strong>, <strong>de</strong>s premiers<br />

travaux ont consisté à traduire une partie <strong>de</strong>s ressources linguistiques du<br />

français en coréen, dans l’objectif principalement <strong>de</strong> montrer une<br />

première réalisation <strong>de</strong> ce projet. Ces travaux se sont faits en partenariat<br />

avec le département <strong>de</strong> français <strong>de</strong> l’université Hankuk <strong>de</strong>s Etu<strong>de</strong>s<br />

Etrangères <strong>de</strong> Séoul 84 qui a participé à la constitution <strong>de</strong>s ressources<br />

linguistiques pour la langue coréenne. Enfin, une thèse en cours sous la<br />

direction <strong>de</strong> Jean-Pierre Desclés porte sur le <strong>résumé</strong> <strong>automatique</strong> en<br />

coréen à partir du système EXCOM.<br />

2. D’autres travaux se sont particulièrement intéressés sur l’annotation <strong>de</strong>s<br />

citations, principalement dans les <strong>textes</strong> journalistiques coréens. <strong>Le</strong><br />

marquage <strong>de</strong>s citations (directes et indirectes) en coréen est nettement<br />

83 Seul le verbe reste toujours en fin <strong>de</strong> phrase. A la différence, la langue turque possè<strong>de</strong> un ordre libre<br />

total.<br />

84 Hankuk University of Foreign Studies, Seoul.<br />

363

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!