23.06.2013 Views

Un analyseur syntaxique opérationnel : SYNTEX - ERSS

Un analyseur syntaxique opérationnel : SYNTEX - ERSS

Un analyseur syntaxique opérationnel : SYNTEX - ERSS

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

1.1. Recherches en ingénierie linguistique<br />

J’ai effectué ma thèse dans un contexte industriel, à la Direction des Etudes et<br />

Recherches (DER) d’EDF, au sein du service Informatique et Mathématiques<br />

Appliquées (septembre 1990-juin 1994) 1 . Le sujet de recherche avait été déterminé suite<br />

à la question précise et concrète adressée par les responsables du Service Information,<br />

Prospective et Normalisation de la DER à leur collègues du service Informatique et<br />

Mathématiques Appliquées : comment enrichir et maintenir à jour le thesaurus<br />

électronique utilisé par le système d’indexation automatique de la DER. J’ai été<br />

d’emblée plongé dans le contexte d’une recherche guidée par un problème à résoudre.<br />

Ingénieur de formation, et après trois années d’études en linguistique théorique et<br />

formelle à l’<strong>Un</strong>iversité Paris VII, je n’ai pas été rebuté par ces conditions de travail, que<br />

j’ai toujours considérées comme stimulantes 2 . Au long de mon parcours de chercheur, de<br />

la DER d’EDF au CNRS, cette « obligation de résultats », contrainte subie et acceptée au<br />

départ de ma recherche, est devenue une dimension constitutive assumée de ma<br />

conception du travail de chercheur en Traitement Automatique des Langues (TAL).<br />

Dans le paysage de la recherche en TAL, marqué par « la cohabitation paradoxale et<br />

nécessaire des recherches théoriques et des applications à visée industrielle » (Cori &<br />

Léon, 2002), je revendique une démarche ingénierique, où la définition du programme<br />

de recherche est, pour partie, liée à l’identification d’applications cibles ou de problèmes<br />

concrets, et où la validation des résultats passe par la confrontation des outils réalisés<br />

avec des contextes d’usages aussi réels que possible.<br />

Ce parti pris d’une recherche située en ingénierie linguistique est clairement assumé et<br />

affiché dans ma thèse soutenue en juin 1994. Il est révélé par l’architecture même du<br />

mémoire, et en particulier par les choix concernant la traditionnelle partie « état de<br />

l’art ». Le premier chapitre est consacré à la présentation des principes de base du<br />

logiciel. Il commence par l’énoncé du problème à résoudre, à savoir la constitution et<br />

l’enrichissement de thesaurus, et par la présentation de la solution visée : la réalisation<br />

d’un logiciel d’extraction de terminologie, prenant en entrée un corpus étiqueté portant<br />

sur un domaine spécialisé, et effectuant une analyse <strong>syntaxique</strong> pour extraire des<br />

syntagmes nominaux susceptibles de représenter les concepts du domaine. Pour la mise<br />

en contexte de la recherche, plutôt que d’inscrire mon travail dans un champ particulier<br />

de la linguistique ou du Traitement Automatique des Langues, je choisis de le situer en<br />

évoquant la « demande », c’est-à-dire les domaines d’application de la terminologie<br />

(traduction automatique, informatique documentaire, gestion de la connaissance). En<br />

restant dans la même veine « génie logiciel », je définis ensuite un cahier des charges<br />

minimal pour la réalisation du logiciel en imposant deux contraintes : généralité – le<br />

1 Je dois beaucoup à Gérard Hatabian, alors chef du groupe Statistiques, Optimisation, Aide à la Décision, qui<br />

m’a fait confiance à ce moment crucial de mon parcours professionnel.<br />

2 Il faut bien reconnaître qu’à cette époque la Direction des Etudes et Recherches d’EDF constituait un lieu<br />

extrêmement favorable et confortable pour des recherches à visée applicatives certes, mais avec une pression<br />

quant aux résultats beaucoup moindre que dans les entreprises industrielles du secteur privé.<br />

8

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!