23.06.2013 Views

Un analyseur syntaxique opérationnel : SYNTEX - ERSS

Un analyseur syntaxique opérationnel : SYNTEX - ERSS

Un analyseur syntaxique opérationnel : SYNTEX - ERSS

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

(Hutchins, 1986, section 3.10)<br />

Pour illustrer les recherches menées dans les années 1950 et 1960, j’ai choisi deux<br />

équipes de chercheurs parmi les pionniers de cette grande époque, représentant chacune<br />

un des deux courants (Hutchins, 1986, sections 4.2 et 4.3). Comme représentants du<br />

courant pragmatique, je présente les chercheurs de l’université de Georgetown, parce<br />

qu’ils ont été les tenants les plus actifs de cette approche et parce que leurs recherches,<br />

entamées dès 1952, ont conduit au système SYSTRAN, très largement utilisé de nos<br />

jours 19 . Comme représentant du courant perfectionniste, je présente l’équipe de<br />

recherche sur la TA au Massachusetts Institute of Technology, parce qu’elle a placé<br />

d’emblée le transfert <strong>syntaxique</strong> au centre de son modèle de traduction automatique, et<br />

parce qu’elle a développé très tôt l’idée de la déclarativité.<br />

A l’université de Georgetown, les recherches sur la TA ont été lancées par Leon Dostert<br />

en juin 1952 et développées en collaboration avec IBM. En janvier 1954, une première<br />

démonstration d’une maquette expérimentale donne des résultats suffisamment<br />

impressionnants à l’époque pour que la National Science Fundation décide de<br />

subventionner de façon massive les recherches sur la TA à Georgetown. <strong>Un</strong>e vingtaine<br />

de chercheurs sont recrutés sur le projet. <strong>Un</strong>e équipe menée par Michael Zarenach<br />

développe une méthode dite « General Analysis Technique », rebaptisée ensuite<br />

« Georgetown Automatic Translation » (GAT). Cette méthode est implémentée dans un<br />

système de traduction Russe-Anglais (SERNA system) par Peter Toma en 1959, système<br />

qui est installé à EURATOM à Ispra en Italie en 1963, et au Laboratoire National d’Oak<br />

Ridge en 1964. Pour des raisons mal connues (on évoque des conflits entre linguistes et<br />

programmeurs), les subventions s’arrêtent et les recherches sur la TA à Georgetown<br />

s’interrompent. Ces deux systèmes seront utilisés, à la satisfaction des utilisateurs selon<br />

plusieurs enquêtes réalisées sur le terrain, jusqu’à leur remplacement par SYSTRAN, à<br />

Ispra en 1970 et à Oak Ridge en 1980.<br />

Le système GAT était présenté par les auteurs comme constitué de plusieurs « niveaux »,<br />

ou de plusieurs « passes » : (1) consultation du dictionnaire, analyse morphémique et<br />

résolution des homographes, (2) analyse syntagmatique pour le repérage de<br />

combinaisons de mots basée sur les relations d’accord, de gouvernance et d’apposition,<br />

(3) analyse <strong>syntaxique</strong> pour le repérage des relations sujet/prédicat. Dans les faits,<br />

l’analyse effectivement réalisée était très rudimentaire (Hutchins, 1986, section 4.2). Elle<br />

était chargée de lever les ambiguïtés morphologiques par l’examen des catégories des<br />

mots précédent et suivant. La méthode de développement adoptée par les concepteurs du<br />

système était entièrement « guidée par les textes », selon un mode par essai/erreur. Les<br />

programmes étaient testés sur un corpus particulier, étendus ou corrigés en fonction des<br />

résultats, puis testés sur un autre corpus, et ainsi de suite. Selon (Kay, 1973), cité par<br />

(Hutchins, 1986), le résultat fut une grammaire « monolithique » de taille et de<br />

complexité monstrueuse, développée sans conception claire de ce que devait être une<br />

règle grammaticale et une structure <strong>syntaxique</strong>, dans laquelle les phases d’analyse de la<br />

phrase source et de transfert vers la langue cible étaient intriquées, rendant les évolutions<br />

19 www.systran.fr<br />

30

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!