Base de données
Base de données
Base de données
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Tri <strong>de</strong>s occurrences par spécificité<br />
Sonal - Mo<strong>de</strong> d’emploi<br />
Les barres bleues représentent la spécificité positive, la barre rouge la spécificité<br />
négative. Les barres représentent l’improbabilité que les mots apparaissent comme<br />
ils le font. En clair, plus la barre est large, moins l’apparition du mot dans les<br />
conditions observées est probable. Le contenu <strong>de</strong>s cases dans le prolongement <strong>de</strong>s<br />
barres renseigne à l’inverse la probabilité en %. Plus elle est basse, moins la forme<br />
apparaît <strong>de</strong> manière prévisible.<br />
- Régler le seuil <strong>de</strong> spécificité<br />
La largeur <strong>de</strong>s barres est fonction du seuil choisi. A droite du bouton d’option<br />
permettant <strong>de</strong> trier les mots par spécificité, se trouve une zone <strong>de</strong> texte mentionnant<br />
le seuil au-<strong>de</strong>là duquel la probabilité ne doit plus être représentée. Par défaut, le<br />
seuil <strong>de</strong> 10% implique que ne sont représentés que les 10 <strong>de</strong>rniers % d’improbabilité.<br />
Cela revient à ne voir apparaître <strong>de</strong> barre bleue ou rouge uniquement pour les<br />
probabilités inférieures à 10%. Mettre par exemple un seuil <strong>de</strong> 5% ne filtrera pas les<br />
résultats, mais reviendra à « zoomer » sur les <strong>de</strong>rniers 5%, accroissant ainsi les écarts<br />
entre <strong>de</strong>s probabilités proches.<br />
- Afficher (ou non) les spécificités négatives<br />
Par défaut, Sonal n’affiche que les spécificités positives (barres bleues). Cela permet<br />
d’éviter un phénomène logique mais problématique qui est que lorsque l’on isole une<br />
sous-partie du corpus largement majoritaire, elle ne se caractérise que par les formes<br />
absentes, celles-là même qui caractérisent la sous-partie désactivée.<br />
131