05.07.2014 Views

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

Le résumé automatique de textes - LaLIC - Université Paris-Sorbonne

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Conclusion et perspectives<br />

a. Ils consistent à montrer explicitement au lecteur <strong>de</strong>s changements<br />

dans la structuration discursive, et aussi à donner <strong>de</strong>s indications<br />

sur <strong>de</strong>s relations entre les différents éléments du texte.<br />

b. <strong>Le</strong>s marqueurs discursifs appartiennent à un autre découpage <strong>de</strong>s<br />

unités <strong>de</strong> la langue. Au-<strong>de</strong>là <strong>de</strong>s unités lexicales et grammaticales<br />

qui composent toutes les langues, on ajoute les unités discursives<br />

qui sont constituées <strong>de</strong> celles-ci mais dont la fonction porte sur un<br />

autre niveau, celui du discours.<br />

c. Contrairement aux unités lexicales et, dans une moindre mesure,<br />

aux unités grammaticales, les unités discursives sont totalement<br />

indépendantes par rapport aux domaines <strong>de</strong> connaissances présents<br />

dans les <strong>textes</strong>. Dans notre travail, cela présente l’avantage <strong>de</strong> ne<br />

pas faire dépendre <strong>de</strong>s domaines les ressources linguistiques,<br />

composées <strong>de</strong> marqueurs discursifs, et <strong>de</strong> pouvoir ainsi appliquer<br />

l’annotation à un vaste choix <strong>de</strong> <strong>textes</strong> (scientifiques pour notre<br />

cas).<br />

3. L’idée <strong>de</strong> catégoriser sémantiquement les informations textuelles est<br />

essentielle dans notre approche. Ce principe, peu adopté dans la majorité<br />

<strong>de</strong>s travaux en recherche d’informations et en fouille textuelle, ouvre le<br />

champ à <strong>de</strong> nombreuses applications. Dans le cadre <strong>de</strong>s applications qui en<br />

résultent, la catégorisation sémantique <strong>de</strong>s informations textuelles à partir<br />

<strong>de</strong> critères linguistiques procure, selon nous, une fiabilité et une qualité<br />

<strong>de</strong>s résultats supérieures aux techniques actuelles (bien souvent<br />

statistiques). Voici les principaux points importants liés à la<br />

catégorisation :<br />

a. On peut associer à chaque catégorie discursive, comme celles<br />

retenues dans notre travail, un ensemble <strong>de</strong> marqueurs<br />

linguistiques qui renvoient à celle-ci lorsqu’ils apparaissent à la<br />

surface <strong>de</strong>s <strong>textes</strong>. Ces marqueurs 90 comportent pour cela une<br />

partie <strong>de</strong> la signification <strong>de</strong> ces catégories discursives.<br />

90 Correspondant aux indicateurs dans la métho<strong>de</strong> d’exploration contextuelle.<br />

369

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!