PDF (484Ko) - Observatoire de linguistique Sens-Texte (OLST)
PDF (484Ko) - Observatoire de linguistique Sens-Texte (OLST)
PDF (484Ko) - Observatoire de linguistique Sens-Texte (OLST)
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
au domaine <strong>de</strong>s changements climatiques, et d'extraction automatique <strong>de</strong>s candidats termes<br />
(CT) a été effectué par Mme Annaïch Le Serrec, corédactrice du DiCoEnviro. Cette tâche ne<br />
faisait donc pas partie <strong>de</strong> mon stage, mais une formation à ce sujet était nécessaire à la<br />
bonne compréhension du processus dans son ensemble. J'ai ainsi appris que :<br />
<br />
les paires <strong>de</strong> textes, sélectionnés d'après <strong>de</strong>s critères reconnus, ont été alignés à l'ai<strong>de</strong><br />
<strong>de</strong> l'aligneur Alinea (Kraif 2004) pour former un corpus parallèle ;<br />
<br />
le logiciel d’acquisition automatique <strong>de</strong> termes Termostat (Drouin 2003) a ensuite<br />
été utilisé pour extraire une liste <strong>de</strong> CT dans chaque langue selon une approche<br />
contrastive 2 ;<br />
<br />
Les CT extraits sont <strong>de</strong>s termes simples, appartenant aux parties du discours du nom,<br />
du verbe, <strong>de</strong> l'adjectif et <strong>de</strong> l'adverbe.<br />
Pour la durée du stage, nous avons utilisé presque exclusivement la liste d'extraction <strong>de</strong> CT<br />
français, sauf à la toute fin, pour la recherche d'équivalents.<br />
2.1.2 Choix <strong>de</strong>s termes à décrire<br />
Pour le stage, j'avais la responsabilité <strong>de</strong> la <strong>de</strong>scription <strong>de</strong>s lexies 3 appartenant à la partie du<br />
discours du nom et <strong>de</strong> l'adjectif. J'ai d'abord dû sélectionner les termes à traiter selon la liste<br />
<strong>de</strong> CT extraits automatiquement, mais aussi selon certains critères :<br />
<br />
conceptuels (Ex. : Quels termes appartiennent véritablement au domaine du<br />
changement climatique? Lesquels décrivent <strong>de</strong>s entités ou <strong>de</strong>s phénomènes centraux<br />
dans ce domaine, <strong>de</strong> sorte qu'on <strong>de</strong>vrait les décrire en priorité?)<br />
2 C'est-à-dire par comparaison avec un corpus <strong>de</strong> référence <strong>de</strong> la langue générale.<br />
3 On nomme « lexie » chaque acception d'un vocable.<br />
5