05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 7 : Quelques aspects multilingues<br />

Figure 35 : carte sémantique discours rapporté [Alrahabi et Desclés 2007]<br />

2.3. BULGARE : annotation et <strong>résumé</strong> <strong>de</strong> <strong>textes</strong> scientifiques<br />

La langue bulgare est une langue indo-européenne qui possè<strong>de</strong> certaines<br />

particularités qui influent sur son traitement <strong>automatique</strong> [Atanassova 2006].<br />

Enumérons les principales particularités qui affectent l’approche choisie au laboratoire :<br />

– la morphologie du verbe bulgare est assez lour<strong>de</strong> ce qui complique la<br />

constitution <strong>de</strong>s ressources (marqueurs linguistiques), avec ou sans<br />

l’utilisation d’un conjugueur ;<br />

– le phénomène <strong>de</strong> l’ordre libre dans les phrases bulgares oblige les règles<br />

d’exploration contextuelle à ne considérer qu’un seul espace <strong>de</strong> recherche<br />

(gauche + droit) ;<br />

– la ponctuation est complétement grammaticalisée, ce qui permet d’utiliser<br />

certains signes <strong>de</strong> ponctuation comme indices.<br />

<strong>Le</strong>s principaux travaux du laboratoire sur la langue bulgare dans le cadre <strong>de</strong><br />

l’annotation ont porté sur le traitement <strong>de</strong> <strong>textes</strong> scientifiques, notamment pour la<br />

construction <strong>de</strong> <strong>résumé</strong>s et <strong>de</strong> fiches <strong>de</strong> synthèse. Dans [Atanassova 2006], cinq<br />

360

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!