23.06.2013 Views

Un analyseur syntaxique opérationnel : SYNTEX - ERSS

Un analyseur syntaxique opérationnel : SYNTEX - ERSS

Un analyseur syntaxique opérationnel : SYNTEX - ERSS

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

nominaux complexes dans des corpus de grande taille, (2) l’analyse <strong>syntaxique</strong> des<br />

phrases est rarement décisive pour identifier les frontières de syntagmes nominaux, (3) le<br />

fait d’adopter une méthode robuste autorise une démarche expérimentale par tests<br />

nombreux sur corpus de grande taille et une mise au point fine des règles d’extraction.<br />

J’argumente ainsi que la méthode de LEXTER est plus précise qu’une méthode par simple<br />

repérage de patrons de termes, et plus efficace et robuste qu’une méthode par analyse<br />

<strong>syntaxique</strong> globale 7 . J’affirme même : « La synergie entre repérage de termes et analyse<br />

<strong>syntaxique</strong> doit s’effectuer dans le sens inverse. D’un point de vue théorique, toute<br />

approche structurale de l’analyse de la langue qui fonde sur la compositionnalité une<br />

organisation des traitements en niveaux (<strong>syntaxique</strong>, sémantique) se doit de considérer<br />

les termes comme des unités sur le plan <strong>syntaxique</strong>, puisque ce sont des unités sur le<br />

plan interprétatif. D’un point de vue pratique, il est nécessaire de fournir à un <strong>analyseur</strong><br />

<strong>syntaxique</strong> la liste des termes (et des noms composés) qu’il est susceptible de rencontrer<br />

dans les textes, pour limiter le nombre de cas d’ambiguïtés auxquels il sera confronté. »<br />

(Bourigault, 1994b, p. 70). J’évoque à ce propos un « principe d’incertitude », qui<br />

interdirait d’obtenir, avec une égale précision et en exploitant les mêmes informations, à<br />

la fois la structure <strong>syntaxique</strong> d’une phrase et le repérage d’unités complexes qui la<br />

constitueraient. Je n’approfondirai jamais cette idée. A rebours, je réalise quelques<br />

années plus tard un <strong>analyseur</strong> <strong>syntaxique</strong> de phrase dont une des applications en aval est<br />

l’extraction de termes (section 1.7).<br />

1.3. La fonction initiale de LEXTER : extraire des étiquettes<br />

de concepts<br />

LEXTER est développé initialement pour répondre au problème de la constitution et de<br />

l’enrichissement de thesaurus. Je le conçois comme un outil dont la fonction est<br />

d’extraire automatiquement d’un corpus de textes des séquences de mots aptes à intégrer<br />

directement la nomenclature d’un thesaurus, sans retouche de forme. Par exemple, le<br />

logiciel doit extraire la séquence nominale paroi d’enceinte, mais doit écarter la<br />

séquence paroi de cette enceinte, parce que la présence du déterminant démonstratif<br />

vient la disqualifier pour le titre d’étiquette de concept. Ce parti pris relève de la<br />

conception naïve de la terminologie qui est la mienne tout au long de mon travail de<br />

thèse : le terme est une étiquette de concept, il est figé à la fois dans sa fonction<br />

7 Cette polémique peut paraître quelque peu datée, au regard de la popularité gagnée ces dix dernières années<br />

par les travaux en analyse <strong>syntaxique</strong> robuste par bribes. A l’époque, la nécessité de mettre au point un tel<br />

argumentaire m’est apparue, quelques mois après le début de ma thèse, à l’occasion d’un colloque sur le<br />

repérage de l’information textuelle organisé à l’<strong>Un</strong>iversité du Québec à Montréal. Je présentais pour la<br />

première fois le principe du découpage par marqueurs de frontière, et celui, qui suit logiquement, de<br />

décomposition des syntagmes nominaux maximaux (Bourigault, 1991). <strong>Un</strong> membre de l’équipe de l’UQAM,<br />

qui travaillait alors sur le progiciel Termino, m’a demandé comment je pouvais extraire des syntagmes<br />

nominaux sans analyse <strong>syntaxique</strong> de la phrase. Ce point, dont je constate retrospectivement avoir surestimé<br />

l’importance, m’a conduit à l’époque à mobiliser une partie de mon énergie à justifier le non recours à<br />

l’analyse <strong>syntaxique</strong> de phrase.<br />

12

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!