13.07.2013 Views

Base de données

Base de données

Base de données

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

22 Débuguer un corpus<br />

Sonal - Mo<strong>de</strong> d’emploi<br />

Malgré tous les efforts faits pour stabiliser l’application et pour limiter les risques <strong>de</strong><br />

perte <strong>de</strong> <strong>données</strong>, il est toujours possible qu’à un moment donné, vous ayez à<br />

débuguer votre corpus. Votre chance en l’occurrence est que le fonctionnement <strong>de</strong><br />

Sonal est particulièrement simple. Tout repose sur <strong>de</strong>s fichiers texte avec un système<br />

<strong>de</strong> balisage rudimentaire. Il est donc toujours possible <strong>de</strong> corriger manuellement ce<br />

qui dysfonctionne. Mais, pour ce faire, la première chose à faire est <strong>de</strong> se pencher un<br />

peu sur le fonctionnement du logiciel pour en comprendre l’organisation d’ensemble.<br />

22.1 Diagnostiquer l’origine du problème<br />

Pour faire simple, vous pouvez avoir <strong>de</strong>ux types <strong>de</strong> problème : soit votre corpus<br />

contient une erreur et ne veut plus s’ouvrir (assez rare), soit il y a à l’intérieur <strong>de</strong><br />

votre corpus un entretien qui dysfonctionne, c'est-à-dire un entretien où par exemple<br />

il y a <strong>de</strong>s informations incohérentes etc. Les messages que Sonal vous envoient vous<br />

permettent généralement <strong>de</strong> faire la différence.<br />

- Vérifier le fichier corpus<br />

Si Sonal ne vous mentionne pas un entretien en particulier et qu’il se plante au<br />

démarrage d’un corpus, la première chose à faire est <strong>de</strong> vérifier l’intégrité du fichier<br />

corpus. Pour ce faire, il suffit <strong>de</strong> l’ouvrir avec le bloc note (clic droit -> ouvrir avec -><br />

bloc note) et <strong>de</strong> vérifier qu’il est correctement structuré.<br />

Y’a-t-il toutes les balises d’ouverture et <strong>de</strong> fermeture ? N’y-a-t-il aucun saut <strong>de</strong> ligne<br />

superflu ?<br />

Il arrive par exemple que les lignes <strong>de</strong>s thématiques contiennent <strong>de</strong>s sauts <strong>de</strong> ligne<br />

intempestifs ou <strong>de</strong>s lignes vi<strong>de</strong>s:<br />

|THEM|<br />

En pareil cas, Sonal ne retrouve pas ce qu’il cherche sur chaque ligne (co<strong>de</strong>, couleur,<br />

nom) et peut planter au moment du chargement <strong>de</strong>s thématiques.<br />

Au besoin, n’hésitez pas à faire <strong>de</strong>s copies du fichier corpus (que vous placerez dans<br />

le même dossier que l’original) et à tenter <strong>de</strong>s modifications.<br />

Une bonne métho<strong>de</strong> pour s’assurer que le problème ne provient pas du corpus est <strong>de</strong><br />

faire une copie du fichier crp, et d’y retirer tous les entretiens, c'est-à-dire <strong>de</strong><br />

supprimer les lignes entre les balises |ENTR|.<br />

153

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!