Un analyseur syntaxique opérationnel : SYNTEX - ERSS
Un analyseur syntaxique opérationnel : SYNTEX - ERSS
Un analyseur syntaxique opérationnel : SYNTEX - ERSS
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
1.1. Recherches en ingénierie linguistique<br />
J’ai effectué ma thèse dans un contexte industriel, à la Direction des Etudes et<br />
Recherches (DER) d’EDF, au sein du service Informatique et Mathématiques<br />
Appliquées (septembre 1990-juin 1994) 1 . Le sujet de recherche avait été déterminé suite<br />
à la question précise et concrète adressée par les responsables du Service Information,<br />
Prospective et Normalisation de la DER à leur collègues du service Informatique et<br />
Mathématiques Appliquées : comment enrichir et maintenir à jour le thesaurus<br />
électronique utilisé par le système d’indexation automatique de la DER. J’ai été<br />
d’emblée plongé dans le contexte d’une recherche guidée par un problème à résoudre.<br />
Ingénieur de formation, et après trois années d’études en linguistique théorique et<br />
formelle à l’<strong>Un</strong>iversité Paris VII, je n’ai pas été rebuté par ces conditions de travail, que<br />
j’ai toujours considérées comme stimulantes 2 . Au long de mon parcours de chercheur, de<br />
la DER d’EDF au CNRS, cette « obligation de résultats », contrainte subie et acceptée au<br />
départ de ma recherche, est devenue une dimension constitutive assumée de ma<br />
conception du travail de chercheur en Traitement Automatique des Langues (TAL).<br />
Dans le paysage de la recherche en TAL, marqué par « la cohabitation paradoxale et<br />
nécessaire des recherches théoriques et des applications à visée industrielle » (Cori &<br />
Léon, 2002), je revendique une démarche ingénierique, où la définition du programme<br />
de recherche est, pour partie, liée à l’identification d’applications cibles ou de problèmes<br />
concrets, et où la validation des résultats passe par la confrontation des outils réalisés<br />
avec des contextes d’usages aussi réels que possible.<br />
Ce parti pris d’une recherche située en ingénierie linguistique est clairement assumé et<br />
affiché dans ma thèse soutenue en juin 1994. Il est révélé par l’architecture même du<br />
mémoire, et en particulier par les choix concernant la traditionnelle partie « état de<br />
l’art ». Le premier chapitre est consacré à la présentation des principes de base du<br />
logiciel. Il commence par l’énoncé du problème à résoudre, à savoir la constitution et<br />
l’enrichissement de thesaurus, et par la présentation de la solution visée : la réalisation<br />
d’un logiciel d’extraction de terminologie, prenant en entrée un corpus étiqueté portant<br />
sur un domaine spécialisé, et effectuant une analyse <strong>syntaxique</strong> pour extraire des<br />
syntagmes nominaux susceptibles de représenter les concepts du domaine. Pour la mise<br />
en contexte de la recherche, plutôt que d’inscrire mon travail dans un champ particulier<br />
de la linguistique ou du Traitement Automatique des Langues, je choisis de le situer en<br />
évoquant la « demande », c’est-à-dire les domaines d’application de la terminologie<br />
(traduction automatique, informatique documentaire, gestion de la connaissance). En<br />
restant dans la même veine « génie logiciel », je définis ensuite un cahier des charges<br />
minimal pour la réalisation du logiciel en imposant deux contraintes : généralité – le<br />
1 Je dois beaucoup à Gérard Hatabian, alors chef du groupe Statistiques, Optimisation, Aide à la Décision, qui<br />
m’a fait confiance à ce moment crucial de mon parcours professionnel.<br />
2 Il faut bien reconnaître qu’à cette époque la Direction des Etudes et Recherches d’EDF constituait un lieu<br />
extrêmement favorable et confortable pour des recherches à visée applicatives certes, mais avec une pression<br />
quant aux résultats beaucoup moindre que dans les entreprises industrielles du secteur privé.<br />
8