Un analyseur syntaxique opérationnel : SYNTEX - ERSS
Un analyseur syntaxique opérationnel : SYNTEX - ERSS
Un analyseur syntaxique opérationnel : SYNTEX - ERSS
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
(Hutchins, 1986, section 3.10)<br />
Pour illustrer les recherches menées dans les années 1950 et 1960, j’ai choisi deux<br />
équipes de chercheurs parmi les pionniers de cette grande époque, représentant chacune<br />
un des deux courants (Hutchins, 1986, sections 4.2 et 4.3). Comme représentants du<br />
courant pragmatique, je présente les chercheurs de l’université de Georgetown, parce<br />
qu’ils ont été les tenants les plus actifs de cette approche et parce que leurs recherches,<br />
entamées dès 1952, ont conduit au système SYSTRAN, très largement utilisé de nos<br />
jours 19 . Comme représentant du courant perfectionniste, je présente l’équipe de<br />
recherche sur la TA au Massachusetts Institute of Technology, parce qu’elle a placé<br />
d’emblée le transfert <strong>syntaxique</strong> au centre de son modèle de traduction automatique, et<br />
parce qu’elle a développé très tôt l’idée de la déclarativité.<br />
A l’université de Georgetown, les recherches sur la TA ont été lancées par Leon Dostert<br />
en juin 1952 et développées en collaboration avec IBM. En janvier 1954, une première<br />
démonstration d’une maquette expérimentale donne des résultats suffisamment<br />
impressionnants à l’époque pour que la National Science Fundation décide de<br />
subventionner de façon massive les recherches sur la TA à Georgetown. <strong>Un</strong>e vingtaine<br />
de chercheurs sont recrutés sur le projet. <strong>Un</strong>e équipe menée par Michael Zarenach<br />
développe une méthode dite « General Analysis Technique », rebaptisée ensuite<br />
« Georgetown Automatic Translation » (GAT). Cette méthode est implémentée dans un<br />
système de traduction Russe-Anglais (SERNA system) par Peter Toma en 1959, système<br />
qui est installé à EURATOM à Ispra en Italie en 1963, et au Laboratoire National d’Oak<br />
Ridge en 1964. Pour des raisons mal connues (on évoque des conflits entre linguistes et<br />
programmeurs), les subventions s’arrêtent et les recherches sur la TA à Georgetown<br />
s’interrompent. Ces deux systèmes seront utilisés, à la satisfaction des utilisateurs selon<br />
plusieurs enquêtes réalisées sur le terrain, jusqu’à leur remplacement par SYSTRAN, à<br />
Ispra en 1970 et à Oak Ridge en 1980.<br />
Le système GAT était présenté par les auteurs comme constitué de plusieurs « niveaux »,<br />
ou de plusieurs « passes » : (1) consultation du dictionnaire, analyse morphémique et<br />
résolution des homographes, (2) analyse syntagmatique pour le repérage de<br />
combinaisons de mots basée sur les relations d’accord, de gouvernance et d’apposition,<br />
(3) analyse <strong>syntaxique</strong> pour le repérage des relations sujet/prédicat. Dans les faits,<br />
l’analyse effectivement réalisée était très rudimentaire (Hutchins, 1986, section 4.2). Elle<br />
était chargée de lever les ambiguïtés morphologiques par l’examen des catégories des<br />
mots précédent et suivant. La méthode de développement adoptée par les concepteurs du<br />
système était entièrement « guidée par les textes », selon un mode par essai/erreur. Les<br />
programmes étaient testés sur un corpus particulier, étendus ou corrigés en fonction des<br />
résultats, puis testés sur un autre corpus, et ainsi de suite. Selon (Kay, 1973), cité par<br />
(Hutchins, 1986), le résultat fut une grammaire « monolithique » de taille et de<br />
complexité monstrueuse, développée sans conception claire de ce que devait être une<br />
règle grammaticale et une structure <strong>syntaxique</strong>, dans laquelle les phases d’analyse de la<br />
phrase source et de transfert vers la langue cible étaient intriquées, rendant les évolutions<br />
19 www.systran.fr<br />
30