05.07.2014 Views

Acquisition du tchèque par les francophones : analyse ... - LaLIC

Acquisition du tchèque par les francophones : analyse ... - LaLIC

Acquisition du tchèque par les francophones : analyse ... - LaLIC

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

ANNOTATION MORPHOLOGIQUE<br />

• la forme requise, valeur de l’attribut requis : domu<br />

• le lemme de la forme requise, valeur de l’attribut lemme : dům<br />

• la tra<strong>du</strong>ction française de la forme requise, valeur de l’attribut trad_fr : maison<br />

• la consigne grammaticale, valeur de l’attribut consigne : sg.<br />

• le contexte droit, valeur de l’attribut cntx_droit : je hezká zahrada<br />

L’annotation morphologique de la forme requise 31 , saisie à la main ou générée automatiquement<br />

<strong>par</strong> la procé<strong>du</strong>re Annote, devrait être inscrite dans la base de données avec <strong>les</strong><br />

informations suivantes :<br />

• catégorie lexicale, valeur de l’attribut tagLex : subst<br />

• type morphologique, valeur de l’attribut tagMorph : N<br />

• type <strong>par</strong>adigmatique, valeur de l’attribut pdgm : hd<br />

• cas, valeur de l’attribut cas : gen<br />

• nombre, valeur de l’attribut num : sg<br />

• genre, valeur de l’attribut gen : i<br />

• alternance, valeur de l’attribut alt : ů > o<br />

La procé<strong>du</strong>re Annote lit <strong>les</strong> données structurel<strong>les</strong>, saisies à la main <strong>par</strong> l’auteur, et calcule<br />

toutes <strong>les</strong> valeurs possib<strong>les</strong> des attributs de l’annotation. Pour faire ceci, elle utilise la définition<br />

des types <strong>par</strong>adigmatiques dans le fichier pdgm.xml et la procé<strong>du</strong>re AlterneRadical, qui<br />

se sert de la spécification des alternances dans le fichier alt.xml.<br />

Les données à l’ENTRÉE de la procé<strong>du</strong>re sont : le lemme <strong>du</strong> mot à décliner, la forme<br />

requise, la consigne grammaticale.<br />

Les données à la SORTIE de la procé<strong>du</strong>re sont toutes <strong>les</strong> valeurs possib<strong>les</strong> des attributs<br />

tagLex, tagMorph, pdgm, cas, num, gen, alt.<br />

Le principe de cette procé<strong>du</strong>re est de trouver une correspondance entre la forme requise<br />

et des formes qui sont le résultat de la concaténation <strong>du</strong> radical (extrait à <strong>par</strong>tir <strong>du</strong> lemme,<br />

et modifié éventuellement <strong>par</strong> la procé<strong>du</strong>re AlterneRadical) et d’une désinence, lue dans <strong>les</strong><br />

listes spécifiant <strong>les</strong> types <strong>par</strong>adigmatiques dans le fichier pdgm.xml. Si une correspondance<br />

est trouvée, <strong>les</strong> informations grammatica<strong>les</strong> liées à la désinence (<strong>les</strong> valeurs des attributs<br />

tagLex, tagMorph, pdgm, cas, num, gen, alt) sont considérées comme une annotation possible<br />

de la forme requise.<br />

Le calcul de l’annotation peut se dérouler de deux manières différentes. Si le lemme<br />

figure <strong>par</strong>mi <strong>les</strong> exemp<strong>les</strong> spécifiant <strong>les</strong> différents sous-types <strong>par</strong>adigmatiques dans le fichier<br />

pdgm.xml, le lemme est traité comme connu ; dans le cas contraire, il est traité comme<br />

31 Voir la section 6.2.6, p. 211.<br />

112

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!