03.07.2013 Views

La nouvelle de langue française, aux frontières des ... - L'esprit Livre

La nouvelle de langue française, aux frontières des ... - L'esprit Livre

La nouvelle de langue française, aux frontières des ... - L'esprit Livre

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

434 LA STATISTIQUE LEXICALE AU SECOURS D’UNE DÉFINITION DE LA NOUVELLE<br />

Nous abor<strong>de</strong>rons trois points : l’analyse <strong>de</strong> la spécificité <strong>de</strong>s textes du corpus ;<br />

la distribution <strong>de</strong>s classes <strong>de</strong> grammèmes ; enfin, la richesse lexicale <strong>de</strong>s textes du<br />

corpus.<br />

SPÉCIFICITÉ DES TEXTES DU CORPUS<br />

Le corpus sur lequel nous avons travaillé était composé <strong>de</strong> <strong>de</strong>ux romans (Une<br />

vie d’oiseau, ci-<strong>de</strong>ssous ‘OISE’, et <strong>La</strong> rue qui monte, ci-<strong>de</strong>ssous ‘MONT’) et <strong>de</strong> 23<br />

<strong>nouvelle</strong>s rassemblées en <strong>de</strong>ux recueils (De très petites fêlures, ci-<strong>de</strong>ssous ‘FELU’, et<br />

Les préférés, ci-<strong>de</strong>ssous ‘PREF’). Le logiciel Hyperbase permet <strong>de</strong> mettre en évi<strong>de</strong>nce<br />

le vocabulaire spécifique <strong>de</strong>s textes. Pour chaque forme (sauf pour celles<br />

qui ont une fréquence trop basse), le logiciel calcule la fréquence moyenne d’apparition<br />

dans le corpus (c’est cette valeur qui est prise comme norme <strong>de</strong> comparaison)<br />

et place, autour <strong>de</strong> cette moyenne, les fréquences <strong>de</strong> la forme dans les<br />

différents textes. Si ces points sont caractérisés par un écart réduit supérieur à 2<br />

en valeur absolue, c’est-à-dire supérieur à 2 ou inférieur à -2, ils sont retenus par<br />

le logiciel. Ceux qui sont inférieurs à -2 viennent gonfler le stock <strong>de</strong>s formes<br />

déficitaires, ceux qui sont supérieurs à 2, celui <strong>de</strong>s formes excé<strong>de</strong>ntaires. Le vocabulaire<br />

spécifique d’un texte compris dans un corpus est l’ensemble <strong>de</strong>s mots par<br />

lesquels il se distingue <strong>de</strong>s autres, soit parce qu’il possè<strong>de</strong> ces mots en très grand<br />

nombre, soit parce que ces mots sont particulièrement rares à l’intérieur <strong>de</strong> ses<br />

limites.<br />

Puisque nous nous intéressions <strong>aux</strong> mots <strong>de</strong> relation et, plus précisément, <strong>aux</strong><br />

mots grammatic<strong>aux</strong>, qui sont plus indépendants du thème, notre première tâche<br />

fut donc <strong>de</strong> trier manuellement les listes <strong>de</strong> mots spécifiques produites par le<br />

logiciel en fonction <strong>de</strong> cet objectif. <strong>La</strong> sous-liste constituée fut ensuite traduite<br />

sous forme graphique grâce <strong>aux</strong> métho<strong>de</strong>s multidimentionnelles <strong>de</strong> l’analyse factorielle<br />

6 . On ne saurait trop insister sur le fait que ces représentations graphiques<br />

doivent être abordées avec la plus gran<strong>de</strong> pru<strong>de</strong>nce et en gardant à l’esprit que la<br />

machinerie mathématique qui a produit la représentation n’a fourni qu’une <strong>de</strong>s<br />

projections possibles.<br />

Dans le graphique présenté ci-<strong>de</strong>ssous, quatre points-textes 7 qui représentent<br />

les quatre ouvrages comparés : les <strong>de</strong>ux recueils <strong>de</strong> <strong>nouvelle</strong>s (FELU et PREF) et les<br />

<strong>de</strong>ux romans (OISE et MONT). Les autres points qui apparaissent sur le graphique<br />

représentent les éléments <strong>de</strong> la sous-liste.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!