22.06.2013 Views

3-ponctuation-et-syntaxe-dans-la-langue-francaise - Tunisie ...

3-ponctuation-et-syntaxe-dans-la-langue-francaise - Tunisie ...

3-ponctuation-et-syntaxe-dans-la-langue-francaise - Tunisie ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

«[L]a méta-information, <strong>dans</strong> les cas de données textuelles, est particulièrement abondante.<br />

Chaque mot utilisé, même si c’est un mot grammatical [. . .] a droit à plusieurs lignes, ou<br />

plusieurs pages <strong>dans</strong> un dictionnaire encyclopédique. 16 Les règles de grammaire constituent<br />

évidemment une méta-information fondamentale.<br />

[. . .]<br />

Le problème principal concerne <strong>la</strong> pertinence de ces différents niveaux de méta-information<br />

vis-à-vis du problème que l’on étudie.» (Lebart/Salem 1994, 21).<br />

À c<strong>et</strong> égard, <strong>la</strong> définition des individus en vue d’un traitement statistique est une procédure<br />

assez proche de celle qui consistait, à un niveau plus abstrait, à discerner les<br />

caractères parmi les propriétés des obj<strong>et</strong>s, de manière à définir les concepts (chapitre<br />

→1).<br />

Chaque occurrence de construction est en rapport avec de nombreuses données<br />

d’ordres différents. Il serait effectivement possible d’intégrer d’innombrables variables<br />

au traitement, mais à l’exigence de pertinence s’ajoute celle de simplicité.<br />

Lorsqu’il est question de traiter des données syntaxiques, qui sont structurées suivant<br />

un modèle hiérarchique (chapitre→3), <strong>la</strong> récursivité multiplie virtuellement à l’infini<br />

les informations qu’il est possible d’intégrer à <strong>la</strong> description de chaque individu.<br />

S’agissant de décrire une proposition dont le prédicat est à l’infinitif, par exemple le<br />

constituant souligné <strong>dans</strong>:<br />

· en tıeſmong de ceſte [8] choſe · aj ıo faıt ceſ l<strong>et</strong>reſ ſaíeler de mon˘ ˘<br />

ſaıel · <strong>la</strong>n del jncarnatıon<br />

jhesu crıst · mıl · <strong>et</strong> · cc · <strong>et</strong> · xxx · vj · [9] el moıs · de jvle (Document 1236–07, 7)<br />

il pourrait se révéler pertinent de créer une variable enregistrant si ce prédicat est<br />

également complémenté par un R2 qui lui est propre (ce qui est le cas ici). Si ce R2<br />

est de nature propositionnelle, on pourrait continuer à relever les variables <strong>et</strong> ainsi de<br />

suite. Une telle pratique mènerait immanquablement à un relevé disproportionné <strong>et</strong> un<br />

grand nombre de modalités (les modalités «simples») seraient surreprésentées.<br />

Il faut donc sacrifier une partie de l’information <strong>et</strong> une partie de l’intérêt du corpus<br />

s’en trouve dès lors négligée. On pourrait juger sévèrement toute réduction des<br />

matériaux, arguant que l’élimination d’informations précieuses affaiblit les conclusions<br />

qu’on en tire. Le procédé est cependant obligatoire: sans lui, chaque individu<br />

serait défini par un très grand nombre de variables aux modalités extrêmement variées.<br />

La seule conclusion à <strong>la</strong>quelle l’analyse aboutirait alors est que chaque individu est<br />

l’unique représentant d’une c<strong>la</strong>sse particulière, dont on ne peut rien dire, faute d’effectif.<br />

. . Les statistiques n’étant réellement utilisables que si les effectifs sont suffisants,<br />

il faut se résoudre à limiter le nombre de variables <strong>et</strong> le nombre de modalités de chacune<br />

d’elles. Paradoxalement, le fait de négliger une partie de l’information perm<strong>et</strong><br />

de décrire plus efficacement les données. On évite de se perdre <strong>dans</strong> une myriade de<br />

variables complexes en sélectionnant d’emblée un p<strong>et</strong>it nombre de variables simples.<br />

4.2.4 Finesse de <strong>la</strong> description<br />

La formalisation des données <strong>et</strong> <strong>la</strong> sélection des questions jugées pertinentes sont autant<br />

de facteurs qui diminuent <strong>la</strong> finesse de <strong>la</strong> description.<br />

16 Sic.<br />

160

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!