Extraits Norme Z 47-100 - ChloroFil
Extraits Norme Z 47-100 - ChloroFil
Extraits Norme Z 47-100 - ChloroFil
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Extrait de la norme Afnor Z <strong>47</strong>-<strong>100</strong> de décembre 2001<br />
Règles d’établissement des thésaurus monolingues<br />
2 ROLE DU THÉSAURUS DANS LA FONCTION DOCUMENTAIRE<br />
3 CHOIX DES TERMES DESCRIPTEURS<br />
3.1 CRITERES DE CHOIX DE DESCRIPTEURS<br />
3.1.1 Trois principes doivent être respectés pour le choix des termes à inclure dans un thésaurus :<br />
3.1.2.1.1 Limiter le nombre de descripteurs dans un thésaurus ou limiter le nombre de descripteurs<br />
assignés à un document<br />
3.1.3 Identificateurs<br />
4 LES RELATIONS ENTRE DESCRIPTEURS<br />
5 CONSTRUCTION D’UN THESAURUS<br />
5.2 COLLECTE DES TERMES SIGNIFICATIFS DU LANGAGE NATUREL, CANDIDATS<br />
DESCRIPTEURS<br />
5.2.1 La méthode analytique<br />
5.2.2 La méthode synthétique ou globale<br />
5.2.3 Combinaison des deux méthodes<br />
5.4 VERIFICATION<br />
5.5 CHOIX<br />
7 ESSAI ET MISE A JOUR DU THESAURUS<br />
7.2 MISE A JOUR<br />
7.2.1 Choix de nouveaux descripteurs<br />
7.2.2 Elimination des descripteurs<br />
7.2.3 Conclusion<br />
AVANT-PROPOS<br />
La présente norme est en concordance technique avec la norme internationale ISO 2788 « Principes<br />
directeurs pour l’établissement et le développement de thésaurus monolingues » élaborée par le<br />
comité technique « Documentation » de l’Organisation internationale de normalisation (ISO), avec<br />
quelques modifications de rédaction et la présentation de méthodes pratiques rendant plus explicites<br />
les règles internationales pour l’élaboration des thésaurus en langue française.<br />
2 ROLE DU THÉSAURUS DANS LA FONCTION DOCUMENTAIRE<br />
Le thésaurus permet de traduire en termes d’indexation ou en termes de recherche tout concept<br />
devant entrer ou sortir d’un système documentaire donné.<br />
Le thésaurus ne doit être confondu ni avec un lexique, ni avec un index, ni avec un dictionnaire.<br />
Le thésaurus est constitué par un ensemble de termes (descripteurs ou non-descripteurs) et de<br />
relations qui précisent leur environnement sémantique.<br />
Le vocabulaire constituant le thésaurus doit être :<br />
- non ambigu pour que les mêmes termes de ce vocabulaire identifient systématiquement les<br />
mêmes concepts<br />
Commission Langages Documentaires <strong>Extraits</strong> <strong>Norme</strong> Z <strong>47</strong>-<strong>100</strong>.doc Août 2005<br />
Réseau Renadoc
- structuré pour assurer une meilleure définition de chaque terme et pour permettre des<br />
recherches à différents degrés de généralité ou de spécificité.<br />
3 CHOIX DES TERMES DESCRIPTEURS<br />
3.1 CRITERES DE CHOIX DE DESCRIPTEURS<br />
3.1.1 Trois principes doivent être respectés pour le choix des termes à inclure dans un thésaurus :<br />
a) Un descripteur doit en règle générale représenter une seule notion. La structure du thésaurus,<br />
notamment les relations hiérarchiques précisent souvent implicitement le concept exprimé par<br />
un terme. Au cas où la description du concept ne serait pas suffisamment explicite, il y a lieu<br />
de mieux définir le sens par une note d’application.<br />
b) Lorsqu’un concept peut être exprimé par plusieurs synonymes, un seul terme doit être choisi<br />
comme descripteur et utilisé pour l’indexation. Avant d’accepter un terme, il faut donc<br />
rechercher si d’autres synonymes n’ont pas été introduits avant dans le thésaurus.<br />
c) Un descripteur peut comprendre un ou plusieurs mots. En règle générale, le descripteur doit<br />
refléter la terminologie du sujet, sans tenir compte du nombre de mots nécessaires pour<br />
représenter la notion. Mais dans la mesure du possible, un descripteur doit comprendre le<br />
minimum de mot, et de préférence, un seul.<br />
3.1.2.1.1 Limiter le nombre de descripteurs dans un thésaurus ou limiter le nombre de descripteurs<br />
assignés à un document<br />
Pour réduire le volume d‘un thésaurus, il faut utiliser au maximum des descripteurs simples, en<br />
pensant qu’il faudra assigner un plus grand nombre de descripteurs à un document. Le nombre de<br />
descripteurs spécifiques sera par là même réduit. On restreint également la possibilité de<br />
hiérarchisation entre les descripteurs. On diminue alors le risque de silence lors de la recherche tout en<br />
augmentant le risque de bruit.<br />
3.1.3 Identificateurs<br />
Il existe un type de termes particuliers pouvant être utilisés comme termes d’indexation sans être<br />
intégrés dans le thésaurus ; ils figurent dans des listes annexes ouvertes ; ce sont généralement des<br />
noms propres : collectivités, marque de fabrique, lieux géographiques, abréviations. La forme des<br />
identificateurs doit être normalisée et contrôlée comme celle des descripteurs.<br />
4 LES RELATIONS ENTRE DESCRIPTEURS<br />
Une des fonctions primordiales d’un thésaurus est de représenter les relations entre concepts par<br />
l’indication des rapports entre les termes utilisés pour les décrire.<br />
Le réseau des relations d’un descripteur avec les autres termes (« descripteurs » ou « non<br />
descripteurs ») fournit ainsi une sorte de définition et concourt à réduire les risques d’ambiguïté en<br />
situant le descripteur dans un contexte qui en précise le sens.<br />
Ces relations ne doivent ni être choisies au hasard ni selon des associations d’idées purement<br />
personnelles mais selon un plan d’ensemble qui replace tous les éléments les uns par rapport aux<br />
autres avec comme principal souci d’augmenter la précision de chaque concept et de supprimer au<br />
maximum les causes possibles de silence ou de bruit soit à l’indexation, soit à l’interrogation.<br />
La valeur d’un thésaurus en tant qu’outil documentaire réside autant dans le choix des termes que<br />
dans le choix des relations conceptuelles qui en définissent les modalités d’application.<br />
Commission Langages Documentaires <strong>Extraits</strong> <strong>Norme</strong> Z <strong>47</strong>-<strong>100</strong>.doc Août 2005<br />
Réseau Renadoc<br />
2
5 CONSTRUCTION D’UN THESAURUS<br />
5.2 COLLECTE DES TERMES SIGNIFICATIFS DU LANGAGE NATUREL, CANDIDATS<br />
DESCRIPTEURS<br />
Il n’existe aucune méthode systématique de collecte de termes qui soit fondée sur une analyse<br />
linguistique rigoureuse, mais empiriquement on peut distinguer deux méthodes fondamentalement<br />
différentes.<br />
5.2.1 La méthode analytique<br />
Cette méthode consiste à regrouper les mots significatifs du langage naturel dans le domaine<br />
considéré à partir des sources suivantes :<br />
- documents de littérature courante ;<br />
- questions des utilisateurs, spécialistes du domaine<br />
- descriptions ou indexations expérimentales de documents (effectuées sans thésaurus).<br />
Il est essentiel de choisir des textes et questions représentatifs des catégories de documents à exploiter<br />
ainsi que du domaine couvert et des catégories de besoins.<br />
Il est tout aussi naturel de limiter la durée de la période de collecte pour constituer rapidement un<br />
noyau de termes spécifiques d’apparition de termes nouveaux, et la méthode analytique n’a plus<br />
autant d’intérêt lorsque cette fréquence devient trop faible.<br />
5.2.2 La méthode synthétique ou globale<br />
Cette méthode consiste à rechercher les termes significatifs du domaine ; non dans des textes mais a<br />
priori dans des sources de référence qui sont déjà sous forme de listes lexicales :<br />
- les fichiers existants ;<br />
- les dictionnaires ;<br />
- les index d’ouvrages<br />
- les listes de classifications et les traités terminologiques (normes, etc.) ;<br />
- les tables de matières ;<br />
- les manuels d’ouvrages d’enseignement ;<br />
- les nomenclatures ;<br />
- les thésaurus existants<br />
Il est essentiel de choisir ces listes de manière qu’elles couvrent le domaine et répondent aux objectifs<br />
qui ont été définis.<br />
( …)<br />
En revanche, rien ne peut assurer l’exhaustivité de la liste constituée, il est fort possible que des termes<br />
importants, parfois fondamentaux, n’apparaissent par parce que leur secteur n’a pas été pris en<br />
compte.<br />
5.2.3 Combinaison des deux méthodes<br />
Les deux méthodes de collecte de termes sont pragmatiques, et ni l’un ni l’autre n’est à utiliser seule,<br />
on s’accorde généralement à considérer qu’une combinaison des deux assure de bons résultats.<br />
Une première combinaison peut s’effectuer de la manière suivante :<br />
Au moyen d’une indexation expérimentale d’une petite série de documents couvrant le domaine, on<br />
établit une première liste de termes (application de la méthode analytique) qui constitue un cadre de<br />
mots fondamentaux généralement bien répartis dans le domaine.<br />
Cette liste est ensuite complétée au moyen de la méthode synthétique ; on la subdivise pour cela en<br />
autant de secteurs qu’il est nécessaire et on enrichit le vocabulaire de chaque secteur au moyen des<br />
listes lexicales dont on peut disposer.<br />
Cette solution offre l’avantage d’assurer, pour tous les secteurs du thésaurus, un niveau de spécificité<br />
constant.<br />
Commission Langages Documentaires <strong>Extraits</strong> <strong>Norme</strong> Z <strong>47</strong>-<strong>100</strong>.doc Août 2005<br />
Réseau Renadoc<br />
3
5.4 VERIFICATION<br />
Quelle que soit la méthode de collecte retenue, il faut vérifier la valeur scientifique des descripteurs<br />
choisi, en consultant des dictionnaires ; d’autres vocabulaires d’indexation ou vocabulaires<br />
normalisés, des index des périodiques techniques primaires et secondaires, des ouvrages de référence<br />
de la spécialité, en se référant à l’usage, et surtout en demandant leur avis à des spécialistes du sujet. Il<br />
faut écarter les termes qui ne sont pas usités, ou, si on les retient, que ce soit pour signaler qu’ils sont<br />
proscrits.<br />
5.5 CHOIX<br />
Pour établir l’utilité des descripteurs possibles, il faut rechercher pour chacun d’eux :<br />
- s’il apparaît fréquemment dans la littérature ou dans les informations existantes.<br />
- quelle est son incidence probable sir les demandes formulées.<br />
- s’il exprime bien ou commodément le ou les sens de la notion en question.<br />
- quelle est sa relation avec les descripteurs déjà acceptés<br />
- s’il occupe une position charnière dans la structure hiérarchique<br />
- s’il est identique dans sa forme et dans son sens aux descripteurs utilisés dans les thésaurus<br />
avec lesquels on recherche une compatibilité.<br />
Aucun de ces facteurs d’appréciation ne doit être envisagé isolément, et il faut prêter une attention<br />
toute particulière aux domaines périphériques, pour lesquels on ne demande pas au descripteur d’être<br />
aussi parfaitement exhaustif et spécifique qu’en ce qui concerne le domaine principal.<br />
7 ESSAI ET MISE A JOUR DU THESAURUS<br />
7.2 MISE A JOUR<br />
Toute évolution d’un pôle d’intérêt rend nécessaire une mise à jour. L’évolution du vocabulaire<br />
scientifique qui en découle conduit à une remise en cause permanente du contenu de chaque<br />
thésaurus. (..)<br />
Il faut contrôler la fréquence d’usage des descripteurs. Chaque fois qu’une recherche ne permet pas de<br />
récupérer toute l’information que l’on croyait pouvoir recueillir, il faut procéder à une évaluation<br />
critique des descripteurs qui ont été employés ou qui auraient dû l’être.<br />
7.2.1 Choix de nouveaux descripteurs<br />
Si pendant l’indexation ou la recherche documentaire, on constate que des notions ou des relations<br />
entre les notions n’ont pas été suffisamment précisées dans le thésaurus, il faut trouver un nouveau<br />
descripteur ou de nouvelles relations.<br />
De plus, les indexeurs et les utilisateurs doivent constamment vérifier s’il n’apparaît pas de termes<br />
susceptibles de constituer des descripteurs nouveaux, représentant soit des notions nouvelles, soit des<br />
points de vue différents relatifs à des notions anciennes ou qui sont assimilés à des synonymes de<br />
termes existants. Avant de les admettre définitivement, l’utilité des termes nouveaux et des relations<br />
doit être évaluée.<br />
7.2.2 Elimination des descripteurs<br />
Lorsque l’on constate que la fréquence d’utilisation est très faible, il faut s’assurer que ce n’est pas dû<br />
exclusivement à la pénurie de documents employant cette notion particulière. Théoriquement, on ne<br />
devrait supprimer un descripteur particulier que s’il n’a jamais été utilisé, ni pour l’indexation, ni<br />
pour la recherche documentaire. Il est plus commode d’indiquer par une référence préférentielle<br />
(référence EMPLOYER), où se situe, le cas échéant, le terme de remplacement.<br />
Commission Langages Documentaires <strong>Extraits</strong> <strong>Norme</strong> Z <strong>47</strong>-<strong>100</strong>.doc Août 2005<br />
Réseau Renadoc<br />
4
Un descripteur qui a été éliminé, peut être conservé comme synonyme et être utilisé pour la recherche,<br />
afin d’éviter la nécessité de réindexer les documents qui utilisaient ce descripteur. A chaque fois, il<br />
faut examiner et réadapter les relations du descripteur éliminé ou modifié.<br />
7.2.3 Conclusion<br />
D’une façon pratique, la modification, l’adjonction ou la suppression d’un certain nombre de termes<br />
du thésaurus entraînent un nombre important de corrections et la mise à jour de l’ouvrage se réalise<br />
plus aisément par une réédition complète que par l’adjonction de rectificatifs.<br />
Le thésaurus est avant tout un outil évolutif et les mises à jour doivent être périodiquement réalisées<br />
pour adapter l’outil à sa fonction documentaire.<br />
Le processus d’essai et de mise à jour constitue une méthode d’approximations successives nécessaire<br />
à l’obtention d’un thésaurus opérationnel. Il ne faut pas oublier que le temps seul décide de la taille et<br />
de la forme du thésaurus : l’ouvrage n’est jamais terminé.<br />
Commission Langages Documentaires <strong>Extraits</strong> <strong>Norme</strong> Z <strong>47</strong>-<strong>100</strong>.doc Août 2005<br />
Réseau Renadoc<br />
5