14.11.2014 Views

Extraits Norme Z 47-100 - ChloroFil

Extraits Norme Z 47-100 - ChloroFil

Extraits Norme Z 47-100 - ChloroFil

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Extrait de la norme Afnor Z <strong>47</strong>-<strong>100</strong> de décembre 2001<br />

Règles d’établissement des thésaurus monolingues<br />

2 ROLE DU THÉSAURUS DANS LA FONCTION DOCUMENTAIRE<br />

3 CHOIX DES TERMES DESCRIPTEURS<br />

3.1 CRITERES DE CHOIX DE DESCRIPTEURS<br />

3.1.1 Trois principes doivent être respectés pour le choix des termes à inclure dans un thésaurus :<br />

3.1.2.1.1 Limiter le nombre de descripteurs dans un thésaurus ou limiter le nombre de descripteurs<br />

assignés à un document<br />

3.1.3 Identificateurs<br />

4 LES RELATIONS ENTRE DESCRIPTEURS<br />

5 CONSTRUCTION D’UN THESAURUS<br />

5.2 COLLECTE DES TERMES SIGNIFICATIFS DU LANGAGE NATUREL, CANDIDATS<br />

DESCRIPTEURS<br />

5.2.1 La méthode analytique<br />

5.2.2 La méthode synthétique ou globale<br />

5.2.3 Combinaison des deux méthodes<br />

5.4 VERIFICATION<br />

5.5 CHOIX<br />

7 ESSAI ET MISE A JOUR DU THESAURUS<br />

7.2 MISE A JOUR<br />

7.2.1 Choix de nouveaux descripteurs<br />

7.2.2 Elimination des descripteurs<br />

7.2.3 Conclusion<br />

AVANT-PROPOS<br />

La présente norme est en concordance technique avec la norme internationale ISO 2788 « Principes<br />

directeurs pour l’établissement et le développement de thésaurus monolingues » élaborée par le<br />

comité technique « Documentation » de l’Organisation internationale de normalisation (ISO), avec<br />

quelques modifications de rédaction et la présentation de méthodes pratiques rendant plus explicites<br />

les règles internationales pour l’élaboration des thésaurus en langue française.<br />

2 ROLE DU THÉSAURUS DANS LA FONCTION DOCUMENTAIRE<br />

Le thésaurus permet de traduire en termes d’indexation ou en termes de recherche tout concept<br />

devant entrer ou sortir d’un système documentaire donné.<br />

Le thésaurus ne doit être confondu ni avec un lexique, ni avec un index, ni avec un dictionnaire.<br />

Le thésaurus est constitué par un ensemble de termes (descripteurs ou non-descripteurs) et de<br />

relations qui précisent leur environnement sémantique.<br />

Le vocabulaire constituant le thésaurus doit être :<br />

- non ambigu pour que les mêmes termes de ce vocabulaire identifient systématiquement les<br />

mêmes concepts<br />

Commission Langages Documentaires <strong>Extraits</strong> <strong>Norme</strong> Z <strong>47</strong>-<strong>100</strong>.doc Août 2005<br />

Réseau Renadoc


- structuré pour assurer une meilleure définition de chaque terme et pour permettre des<br />

recherches à différents degrés de généralité ou de spécificité.<br />

3 CHOIX DES TERMES DESCRIPTEURS<br />

3.1 CRITERES DE CHOIX DE DESCRIPTEURS<br />

3.1.1 Trois principes doivent être respectés pour le choix des termes à inclure dans un thésaurus :<br />

a) Un descripteur doit en règle générale représenter une seule notion. La structure du thésaurus,<br />

notamment les relations hiérarchiques précisent souvent implicitement le concept exprimé par<br />

un terme. Au cas où la description du concept ne serait pas suffisamment explicite, il y a lieu<br />

de mieux définir le sens par une note d’application.<br />

b) Lorsqu’un concept peut être exprimé par plusieurs synonymes, un seul terme doit être choisi<br />

comme descripteur et utilisé pour l’indexation. Avant d’accepter un terme, il faut donc<br />

rechercher si d’autres synonymes n’ont pas été introduits avant dans le thésaurus.<br />

c) Un descripteur peut comprendre un ou plusieurs mots. En règle générale, le descripteur doit<br />

refléter la terminologie du sujet, sans tenir compte du nombre de mots nécessaires pour<br />

représenter la notion. Mais dans la mesure du possible, un descripteur doit comprendre le<br />

minimum de mot, et de préférence, un seul.<br />

3.1.2.1.1 Limiter le nombre de descripteurs dans un thésaurus ou limiter le nombre de descripteurs<br />

assignés à un document<br />

Pour réduire le volume d‘un thésaurus, il faut utiliser au maximum des descripteurs simples, en<br />

pensant qu’il faudra assigner un plus grand nombre de descripteurs à un document. Le nombre de<br />

descripteurs spécifiques sera par là même réduit. On restreint également la possibilité de<br />

hiérarchisation entre les descripteurs. On diminue alors le risque de silence lors de la recherche tout en<br />

augmentant le risque de bruit.<br />

3.1.3 Identificateurs<br />

Il existe un type de termes particuliers pouvant être utilisés comme termes d’indexation sans être<br />

intégrés dans le thésaurus ; ils figurent dans des listes annexes ouvertes ; ce sont généralement des<br />

noms propres : collectivités, marque de fabrique, lieux géographiques, abréviations. La forme des<br />

identificateurs doit être normalisée et contrôlée comme celle des descripteurs.<br />

4 LES RELATIONS ENTRE DESCRIPTEURS<br />

Une des fonctions primordiales d’un thésaurus est de représenter les relations entre concepts par<br />

l’indication des rapports entre les termes utilisés pour les décrire.<br />

Le réseau des relations d’un descripteur avec les autres termes (« descripteurs » ou « non<br />

descripteurs ») fournit ainsi une sorte de définition et concourt à réduire les risques d’ambiguïté en<br />

situant le descripteur dans un contexte qui en précise le sens.<br />

Ces relations ne doivent ni être choisies au hasard ni selon des associations d’idées purement<br />

personnelles mais selon un plan d’ensemble qui replace tous les éléments les uns par rapport aux<br />

autres avec comme principal souci d’augmenter la précision de chaque concept et de supprimer au<br />

maximum les causes possibles de silence ou de bruit soit à l’indexation, soit à l’interrogation.<br />

La valeur d’un thésaurus en tant qu’outil documentaire réside autant dans le choix des termes que<br />

dans le choix des relations conceptuelles qui en définissent les modalités d’application.<br />

Commission Langages Documentaires <strong>Extraits</strong> <strong>Norme</strong> Z <strong>47</strong>-<strong>100</strong>.doc Août 2005<br />

Réseau Renadoc<br />

2


5 CONSTRUCTION D’UN THESAURUS<br />

5.2 COLLECTE DES TERMES SIGNIFICATIFS DU LANGAGE NATUREL, CANDIDATS<br />

DESCRIPTEURS<br />

Il n’existe aucune méthode systématique de collecte de termes qui soit fondée sur une analyse<br />

linguistique rigoureuse, mais empiriquement on peut distinguer deux méthodes fondamentalement<br />

différentes.<br />

5.2.1 La méthode analytique<br />

Cette méthode consiste à regrouper les mots significatifs du langage naturel dans le domaine<br />

considéré à partir des sources suivantes :<br />

- documents de littérature courante ;<br />

- questions des utilisateurs, spécialistes du domaine<br />

- descriptions ou indexations expérimentales de documents (effectuées sans thésaurus).<br />

Il est essentiel de choisir des textes et questions représentatifs des catégories de documents à exploiter<br />

ainsi que du domaine couvert et des catégories de besoins.<br />

Il est tout aussi naturel de limiter la durée de la période de collecte pour constituer rapidement un<br />

noyau de termes spécifiques d’apparition de termes nouveaux, et la méthode analytique n’a plus<br />

autant d’intérêt lorsque cette fréquence devient trop faible.<br />

5.2.2 La méthode synthétique ou globale<br />

Cette méthode consiste à rechercher les termes significatifs du domaine ; non dans des textes mais a<br />

priori dans des sources de référence qui sont déjà sous forme de listes lexicales :<br />

- les fichiers existants ;<br />

- les dictionnaires ;<br />

- les index d’ouvrages<br />

- les listes de classifications et les traités terminologiques (normes, etc.) ;<br />

- les tables de matières ;<br />

- les manuels d’ouvrages d’enseignement ;<br />

- les nomenclatures ;<br />

- les thésaurus existants<br />

Il est essentiel de choisir ces listes de manière qu’elles couvrent le domaine et répondent aux objectifs<br />

qui ont été définis.<br />

( …)<br />

En revanche, rien ne peut assurer l’exhaustivité de la liste constituée, il est fort possible que des termes<br />

importants, parfois fondamentaux, n’apparaissent par parce que leur secteur n’a pas été pris en<br />

compte.<br />

5.2.3 Combinaison des deux méthodes<br />

Les deux méthodes de collecte de termes sont pragmatiques, et ni l’un ni l’autre n’est à utiliser seule,<br />

on s’accorde généralement à considérer qu’une combinaison des deux assure de bons résultats.<br />

Une première combinaison peut s’effectuer de la manière suivante :<br />

Au moyen d’une indexation expérimentale d’une petite série de documents couvrant le domaine, on<br />

établit une première liste de termes (application de la méthode analytique) qui constitue un cadre de<br />

mots fondamentaux généralement bien répartis dans le domaine.<br />

Cette liste est ensuite complétée au moyen de la méthode synthétique ; on la subdivise pour cela en<br />

autant de secteurs qu’il est nécessaire et on enrichit le vocabulaire de chaque secteur au moyen des<br />

listes lexicales dont on peut disposer.<br />

Cette solution offre l’avantage d’assurer, pour tous les secteurs du thésaurus, un niveau de spécificité<br />

constant.<br />

Commission Langages Documentaires <strong>Extraits</strong> <strong>Norme</strong> Z <strong>47</strong>-<strong>100</strong>.doc Août 2005<br />

Réseau Renadoc<br />

3


5.4 VERIFICATION<br />

Quelle que soit la méthode de collecte retenue, il faut vérifier la valeur scientifique des descripteurs<br />

choisi, en consultant des dictionnaires ; d’autres vocabulaires d’indexation ou vocabulaires<br />

normalisés, des index des périodiques techniques primaires et secondaires, des ouvrages de référence<br />

de la spécialité, en se référant à l’usage, et surtout en demandant leur avis à des spécialistes du sujet. Il<br />

faut écarter les termes qui ne sont pas usités, ou, si on les retient, que ce soit pour signaler qu’ils sont<br />

proscrits.<br />

5.5 CHOIX<br />

Pour établir l’utilité des descripteurs possibles, il faut rechercher pour chacun d’eux :<br />

- s’il apparaît fréquemment dans la littérature ou dans les informations existantes.<br />

- quelle est son incidence probable sir les demandes formulées.<br />

- s’il exprime bien ou commodément le ou les sens de la notion en question.<br />

- quelle est sa relation avec les descripteurs déjà acceptés<br />

- s’il occupe une position charnière dans la structure hiérarchique<br />

- s’il est identique dans sa forme et dans son sens aux descripteurs utilisés dans les thésaurus<br />

avec lesquels on recherche une compatibilité.<br />

Aucun de ces facteurs d’appréciation ne doit être envisagé isolément, et il faut prêter une attention<br />

toute particulière aux domaines périphériques, pour lesquels on ne demande pas au descripteur d’être<br />

aussi parfaitement exhaustif et spécifique qu’en ce qui concerne le domaine principal.<br />

7 ESSAI ET MISE A JOUR DU THESAURUS<br />

7.2 MISE A JOUR<br />

Toute évolution d’un pôle d’intérêt rend nécessaire une mise à jour. L’évolution du vocabulaire<br />

scientifique qui en découle conduit à une remise en cause permanente du contenu de chaque<br />

thésaurus. (..)<br />

Il faut contrôler la fréquence d’usage des descripteurs. Chaque fois qu’une recherche ne permet pas de<br />

récupérer toute l’information que l’on croyait pouvoir recueillir, il faut procéder à une évaluation<br />

critique des descripteurs qui ont été employés ou qui auraient dû l’être.<br />

7.2.1 Choix de nouveaux descripteurs<br />

Si pendant l’indexation ou la recherche documentaire, on constate que des notions ou des relations<br />

entre les notions n’ont pas été suffisamment précisées dans le thésaurus, il faut trouver un nouveau<br />

descripteur ou de nouvelles relations.<br />

De plus, les indexeurs et les utilisateurs doivent constamment vérifier s’il n’apparaît pas de termes<br />

susceptibles de constituer des descripteurs nouveaux, représentant soit des notions nouvelles, soit des<br />

points de vue différents relatifs à des notions anciennes ou qui sont assimilés à des synonymes de<br />

termes existants. Avant de les admettre définitivement, l’utilité des termes nouveaux et des relations<br />

doit être évaluée.<br />

7.2.2 Elimination des descripteurs<br />

Lorsque l’on constate que la fréquence d’utilisation est très faible, il faut s’assurer que ce n’est pas dû<br />

exclusivement à la pénurie de documents employant cette notion particulière. Théoriquement, on ne<br />

devrait supprimer un descripteur particulier que s’il n’a jamais été utilisé, ni pour l’indexation, ni<br />

pour la recherche documentaire. Il est plus commode d’indiquer par une référence préférentielle<br />

(référence EMPLOYER), où se situe, le cas échéant, le terme de remplacement.<br />

Commission Langages Documentaires <strong>Extraits</strong> <strong>Norme</strong> Z <strong>47</strong>-<strong>100</strong>.doc Août 2005<br />

Réseau Renadoc<br />

4


Un descripteur qui a été éliminé, peut être conservé comme synonyme et être utilisé pour la recherche,<br />

afin d’éviter la nécessité de réindexer les documents qui utilisaient ce descripteur. A chaque fois, il<br />

faut examiner et réadapter les relations du descripteur éliminé ou modifié.<br />

7.2.3 Conclusion<br />

D’une façon pratique, la modification, l’adjonction ou la suppression d’un certain nombre de termes<br />

du thésaurus entraînent un nombre important de corrections et la mise à jour de l’ouvrage se réalise<br />

plus aisément par une réédition complète que par l’adjonction de rectificatifs.<br />

Le thésaurus est avant tout un outil évolutif et les mises à jour doivent être périodiquement réalisées<br />

pour adapter l’outil à sa fonction documentaire.<br />

Le processus d’essai et de mise à jour constitue une méthode d’approximations successives nécessaire<br />

à l’obtention d’un thésaurus opérationnel. Il ne faut pas oublier que le temps seul décide de la taille et<br />

de la forme du thésaurus : l’ouvrage n’est jamais terminé.<br />

Commission Langages Documentaires <strong>Extraits</strong> <strong>Norme</strong> Z <strong>47</strong>-<strong>100</strong>.doc Août 2005<br />

Réseau Renadoc<br />

5

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!