05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 3 : L’annotation discursive à partir d’EXCOM<br />

linguistique <strong>automatique</strong> peut s’effectuer à n’importe quel niveau <strong>de</strong> la langue tant que<br />

les annotations et les règles associées peuvent exécuter correctement cette tâche. Dans<br />

le cadre <strong>de</strong> l’annotation sémantique, les <strong>de</strong>ux plates-formes que nous avons présentées<br />

s’orientent plus précisément sur certains aspects <strong>de</strong>scriptifs et sur certains types d’unités<br />

linguistiques, comme avec l’annotation d’entités nommées (nom <strong>de</strong> lieux, valeurs<br />

monétaire, noms d’organisation, etc.). Toutefois, certains aspects comme l’annotation<br />

<strong>de</strong>s relations discursives contenues dans le texte (notamment à travers <strong>de</strong>s verbes) sont<br />

relativement rares, notamment parce que le lien à une ontologie existante se fait par<br />

l’instanciation d’objets à <strong>de</strong>s classes préexistantes, et non par l’introduction <strong>de</strong> relation<br />

entre objets <strong>de</strong> l’ontologie. Pourtant ce type d’annotations semble très important. Si<br />

nous prenons l’exemple suivant :<br />

Nicolas Sarkozy a rencontré Vladimir Poutine à Moscou le 14/11/07.<br />

Quatre entités seront dégagées facilement par <strong>de</strong>s plates-formes d’annotation (à<br />

l’ai<strong>de</strong> <strong>de</strong> grammaires JAPE par exemple) à cause <strong>de</strong> certaines régularités dans leur<br />

forme : les noms <strong>de</strong> personne Nicolas Sarkozy et Vladimir Poutine, le nom <strong>de</strong> lieu<br />

Moscou et la date 14/11/07. Cependant la relation qui est présente entre ces <strong>de</strong>ux<br />

personnes, marquée par a rencontré, ne sera pas prise en compte, et pourtant elle relie<br />

<strong>de</strong> manière essentielle les entités nommées qui sont ici. Il existe ainsi entre les <strong>de</strong>ux<br />

entités Nicolas Sarkozy et Vladimir Poutine une relation sémantique qui indique une<br />

notion <strong>de</strong> rencontre entre les <strong>de</strong>ux. En se restreignant aux entités nommées, il n’est alors<br />

pas possible <strong>de</strong> pouvoir rechercher les rencontres <strong>de</strong> Nicolas Sarkozy à Moscou, ou <strong>de</strong><br />

savoir qui il a rencontré en 2007. La relation n’étant pas annotée, on ne peut filtrer<br />

sémantiquement le contenu textuel d’un article à partir <strong>de</strong> celle-ci. Il existe beaucoup<br />

d’autres relations importantes qui structurent l’informations <strong>de</strong>s <strong>textes</strong>, comme celles<br />

<strong>de</strong>s définitions (X se définit par Y) ou <strong>de</strong>s citations (X dit que : «… »). C’est entre autres<br />

sur cet aspect <strong>de</strong> l’annotation <strong>de</strong>s relations dans les <strong>textes</strong> que s’est orientée la plateforme<br />

EXCOM, et plus particulièrement dans l’annotation discursive, ce que nous<br />

allons exposer plus loin dans ce chapitre.<br />

104

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!