22.06.2013 Views

Analyse syntaxique à l'aide des tables du Lexique ... - Accueil

Analyse syntaxique à l'aide des tables du Lexique ... - Accueil

Analyse syntaxique à l'aide des tables du Lexique ... - Accueil

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

4.1 Le lexique <strong>syntaxique</strong> Lefff et le format Alexina<br />

impersonnelles (Sagot et Danlos, 2007), constructions pronominales (Danlos et<br />

Sagot, 2008), les adverbes en -ment (Sagot et Fort, 2007), plusieurs classes<br />

d’expressions figées verbales (Laurence et al., 2006), les verbes en -iser et -fier<br />

(Sagot et Fort, 2009) ;<br />

– enfin, un certain nombre <strong>des</strong> noms et adjectifs viennent initialement <strong>du</strong> lexique<br />

morphologique Multext pour le français (Veronis, 1998).<br />

Au niveau extensionnel, la version actuelle <strong>du</strong> Lefff (3.0.1) (Sagot, 2010) contient<br />

536 375 entrées correspondant <strong>à</strong> 110 477 lemmes distincts couvrant toutes les<br />

catégories. Les chiffres détaillés figurent dans la Tab. 4.1 4 .<br />

Catégorie Entrées intensionnelles Lemmes distincts Entrées extensionnelles<br />

Verbes 7 107 6 825 361 817<br />

Verbes figés 1 868 1 850 3 295<br />

Noms 37 755 37 530 78 338<br />

Adjectifs 10 504 10 483 34 096<br />

Adverbes 4 019 3 584 4 062<br />

Prépositions 226 225 655<br />

Noms propres 52 482 52 185 52 552<br />

Autres 833 632 1 342<br />

Table 4.1: Données quantitatives <strong>du</strong> Lefff<br />

4.1.2 Du Lefff intensionnel au Lefff extensionnel<br />

Le Lefff est basé sur deux niveaux de représentation :<br />

– Un niveau intensionnel qui factorise l’information lexicale, de sorte qu’<strong>à</strong><br />

chaque lemme soit associé une classe morphologique 5 et une information <strong>syntaxique</strong><br />

détaillée permettant une gestion rapide et simple. L’information lexicale<br />

sous forme intensionnelle est organisée dans différents fichiers .ilex en fonction<br />

de la catégorie lexicale de leurs lemmes.<br />

– Un niveau extensionnel, généré automatiquement en compilant le lexique intensionnel<br />

(tous les fichiers .ilex), dans lequel on associe chaque forme fléchie 6<br />

avec toute son information morphologique et <strong>syntaxique</strong> : étiquette morphologique,<br />

ou cadre de sous-catégorisation de sa redistribution correspondante,<br />

etc. Par ce processus on obtient les fichiers sous la forme extensionnelle .lex,<br />

correspondant <strong>à</strong> chacun <strong>des</strong> fichiers .ilex compilés.<br />

Lorsque le lexique intensionnel est compilé en un lexique extensionnel, tous les<br />

mots appartenant <strong>à</strong> la famille de chaque lemme sont construits <strong>à</strong> l’aide de leur<br />

4. La catégorie ≪Autres≫ comprend les différentes sortes de conjonctions, les déterminants, les<br />

interjections, les signes de ponctuation, les pronoms, les préfixes et suffixes, ainsi que <strong>des</strong> entrées<br />

spéciales pour les entités nommées et les mots inconnus.<br />

5. Une classe morphologique permet de construire toute les formes associées au lemme.<br />

6. Par forme fléchie, on entend chaque mot résultant de l’application de règles de dérivations<br />

sur la racine d’un certain lemme. Dit d’une autre manière, la forme fléchie est le mot tel qu’il<br />

apparaît.<br />

47

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!