Texte Complet - CRRM Ã
Texte Complet - CRRM Ã
Texte Complet - CRRM Ã
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
UNE APPROCHE POUR LA MODELISATION DE LA SEMANTIQUE<br />
DANS LES SYSTEMES D’INFORMATION ELABOREE<br />
Philippe Aniorté<br />
Institut Universitaire de Technologie de Bayonne - Département Informatique<br />
Place Paul Bert - 64100 Bayonne - France<br />
Tél : +33 5 59 46 32 15 - Fax : +33 5 59 46 32 29<br />
Philippe.Aniorte@iutbay.univ-pau.fr<br />
Mots clés :<br />
Arbre de domaine, Base de données, Graphe conceptuel, Lien sémantique, Terminologie<br />
1 Introduction<br />
De plus en plus les Systèmes d’Information intègrent des informations « élaborées » et<br />
sémantiquement riches. Les applications comme celles se situant dans le champ de la bibliométrie<br />
qui analysent et traitent ces informations relèvent moins de l’Informatique que des Sciences de<br />
l’Information. Elles se situent au carrefour de disciplines très différentes, entre autres<br />
l’Informatique et la Linguistique.<br />
Nos travaux s’intéressent à l’intégration de ces deux disciplines et plus précisément aux<br />
bases de données terminologiques. La nécessité de telles bases a été clairement mise en évidence<br />
dans tous les domaines mettant en oeuvre une analyse linguistique, par exemple ceux utilisant le<br />
langage naturel. L’objectif et l’originalité de nos travaux consistent à s’intéresser spécifiquement<br />
à la conception de telles bases devant modéliser le système conceptuel du domaine.<br />
En effet, en matière de bases de données terminologiques, la majorité des propositions<br />
(au demeurant peu nombreuses) repose sur une approche « base de données » ou une approche<br />
« terminologique », ces deux approches n’étant malheureusement pas intégrées. Nous en avons<br />
nous-même fait l’expérience en privilégiant l’aspect « base de données » et l’approche que cela<br />
induit habituellement, pour aboutir à des résultats modérément satisfaisants [ARNA94],
[FRAN94], [DEME95]. A l’inverse on trouve des approches axées sur les aspects<br />
« sémantiques », plus d’ailleurs que sur les aspects purement terminologiques, qui ne s’appuient<br />
pas sur les bases de données. Il est vrai que la plupart du temps, le problème considéré n’est pas<br />
essentiel dans le sens où il ne constitue pas l’objectif principal des recherches.<br />
L’approche que nous proposons repose sur l’utilisation d’une méthode que nous avons<br />
définie. Cette méthode est basée sur la théorie des graphes conceptuels développée par J.F.<br />
SOWA [SOWA84] qui propose un modèle sémantique pour la représentation des connaissances.<br />
Cette théorie est utilisée dans de nombreux domaines de recherche basés sur le traitement du<br />
langage naturel [AZEM93] [KABB93] [CHEV92] [ARRO91] [NOGI91] ... Elle a également été<br />
adaptée pour la Recherche d’Information en langage naturel dans le cadre de l’approche dite<br />
linguistique [PUGE94].<br />
L’article est organisé comme suit. Dans un premier temps nous présentons<br />
succinctement la terminologie en insistant sur la démarche du terminologue. Puis nous présentons<br />
les éléments essentiels de la théorie des graphes conceptuels. Enfin nous exposons notre méthode<br />
en montrant qu’elle s’inscrit naturellement dans la démarche du terminologue et permet de<br />
modéliser le système conceptuel du domaine.<br />
2 La terminologie<br />
2.1 Introduction<br />
La terminologie est une discipline théorique et pratique. Elle consiste à inventorier les<br />
termes d’un domaine. Ces termes forment un ensemble cohérent reflétant le système conceptuel<br />
de ce domaine. Il constitue le vocabulaire employé par les spécialistes. En ce sens, il représente<br />
une langue de spécialité, par opposition à la langue générale.<br />
Chaque terme est défini, décrit : des informations sur le sens, l’usage et le<br />
fonctionnement du terme sont récoltées. Ses relations avec d’autres termes du domaine sont<br />
établies afin de constituer un arbre de domaine [DEBE91].<br />
Cette rapide introduction à l’activité terminologique repose sur des notions qu’il
convient de préciser.<br />
Le terme<br />
Le terme se définit comme une unité signifiante constitué d’un mot (terme simple ou<br />
uniterme) ou de plusieurs mots (terme complexe ou polyterme). Il désigne un concept déterminé<br />
de façon univoque à l’intérieur d’un domaine.<br />
Le mot est une unité de langue pourvue de sens et constituée par un certain nombre de<br />
lettres [ARNA94].<br />
Le concept<br />
Le concept a été présenté dans [LYON78] comme toute idée, toute pensée ou toute<br />
construction mentale au moyen de laquelle l’esprit appréhende les choses ou parvient à les<br />
reconnaître. On peut aussi le définir comme une unité de pensée constituée d’un ensemble de<br />
caractères attribués à un objet ou à une classe d’objets. C’est une représentation d’un aspect de la<br />
réalité isolé par l’esprit qui peut s’exprimer par des termes dans plusieurs langues.<br />
Notons que le concept est une entité controversée qui peut également se concevoir hors<br />
langages et qui est dans ce cas purement mentale.<br />
Le domaine<br />
Le domaine peut être une activité, une problématique, une discipline dans laquelle une<br />
langue dite de spécialité, par opposition à la langue générale, existe et est utilisée par les experts<br />
du domaine [BONJ94].<br />
Les liens entre termes, concepts et domaine peuvent s’exprimer comme suit : un terme<br />
désigne un concept, il est défini par une définition dans le domaine étudié (ou champ<br />
d’application).<br />
Le rôle de la définition est très important en terminologie. Une définition de concept<br />
doit permettre de le distinguer de tout autre. Les définitions sont classificatoires, hiérarchisantes,<br />
structurantes... Ce sont des textes en langue naturelle.<br />
2.2 La fiche terminologique
Le principal outil de travail du terminologue est la fiche terminologique appelée aussi<br />
parfois dossier terminologique. Elle contient l’ensemble des informations relatives à une entité<br />
terminologique c’est-à-dire au terme et au concept que celui-ci désigne [FRAN94]. Des<br />
informations propres aux conditions de rédaction de la fiche (mention des sources, degré de<br />
fiabilité, etc...) peuvent également y être consignées [BONJ94]. Nous n’en tiendrons pas compte<br />
par la suite.<br />
L’utilisation de l’informatique a donné naissance au néologisme « terminotique »<br />
(contraction de terminologie et informatique) qui désigne l’ensemble des situations dans<br />
lesquelles l’informatique intervient comme support à des activités terminologiques. De ce fait<br />
l’usage de fiches « papier » est devenu quelque peu désuet. Néanmoins, la notion de fiche est<br />
restée.<br />
Outre le terme (dans ce contexte on parle également de forme graphique) et sa<br />
définition, une fiche terminologique consigne des informations de type terminologique,<br />
linguistique... On peut citer, sans que cette liste soit exhaustive :<br />
- l’origine du terme (nom latin ...),<br />
- la racine, groupe de lettres rappelant le mot ayant donné naissance au terme,<br />
- l’acronyme ou sigle,<br />
- la phonétique,<br />
- la flexion, fonction grammaticale du terme (verbe...),<br />
- la connotation, usage du terme (familier...),<br />
- les homonymes,<br />
- les homophones, termes se prononçant de la même façon mais ayant un sens<br />
différent,<br />
- une note, remarques particulières concernant le terme...<br />
Notons que la fiche terminologique d’un terme peut ne pas contenir toutes les<br />
informations énumérées ci-dessus, par exemple absence de l’acronyme...<br />
2.3 L’arbre de domaine<br />
L’arbre de domaine matérialise les liens de type générique (hyperonyme) / spécifique<br />
(hyponyme) existant entre concepts. Il est établi au fur et à mesure de la découverte de nouveaux
concepts et/ou à la lecture de leurs définitions. Il sert également à délimiter un domaine en<br />
énumérant l’ensemble de ses concepts.<br />
Chaque concept a une position dans la hiérarchie des concepts matérialisée par l’arbre<br />
de domaine. Chaque concept est associé à un concept plus général ou concept générique de<br />
manière à former un arbre conceptuel du domaine.<br />
L’hyperonymie<br />
Tout concept, à l’exception de celui se trouvant au sommet de l’arborescence, possède<br />
un hyperonyme ou générique. La succession des hyperonymes construit le parcours ascendant de<br />
l’arborescence des concepts. L’hyperonyme ou le générique définit le cadre dans lequel entre le<br />
concept considéré.<br />
L’hyperonymie peut se traduire comme suit : un terme Y est hyperonyme d’un terme X,<br />
si l’on peut dire « un X est un Y » en formulant une relation d’inclusion entre les classes<br />
désignées par ces termes.<br />
L’hyponymie<br />
Tout concept, à l’exception de celui situé au point le plus bas de l’arborescence,<br />
possède un hyponyme ou spécifique. La succession des hyponymes construit le parcours<br />
descendant de l’arborescence des concepts.<br />
L’hyponymie peut se traduire comme suit : un terme X est hyponyme d’un terme Y, si<br />
l’on peut dire « un X est un Y » en formulant une relation d’inclusion entre les classes désignées<br />
par ces termes.<br />
2.4 Liens sémantiques entre concepts<br />
Mis à part les liens de type générique/spécifique (cf. 2.3) un concept peut être<br />
sémantiquement lié à d’autres concepts par des relations de synonymie, d’antonymie ou par des<br />
liaisons associatives.<br />
La synonymie<br />
Sont dits synonymes deux termes dont les valeurs sont rigoureusement identiques. Ils<br />
sont en tous points substituables.
Les synonymes sont habituellement définis comme des copies de formes différentes<br />
mais de même sens. En fait, on ne rencontre jamais de synonymes parfaits même si les sens sont<br />
quasiment identiques.<br />
Notons que dans le domaine de la recherche documentaire, la notion de synonymie<br />
donne lieu à plusieurs nuances :<br />
- synonymie « réelle »,<br />
- équivalence entre variantes orthographiques,<br />
- équivalence entre abréviation et forme développée,<br />
- équivalence entre sigle et forme développée,<br />
- quasi-synonymie ou synonymie contextuelle,<br />
- équivalence inter-linguistique.<br />
L’antonymie<br />
Tout terme a, en principe, sa face inverse ou antonyme. Deux termes sont antonymes si<br />
l’un est la négation de l’autre, c’est à dire s’il possède les mêmes traits, mais avec un signe<br />
inverse. On parle aussi de contraires. C’est une opposition au terme de synonymie car il permet<br />
de coupler des termes différents.<br />
On peut distinguer :<br />
- les antonymes polaires (mari/femme),<br />
- les antonymes scalaires (grand/petit),<br />
- les antonymes contradictoires (célibataire/marié),<br />
- les antonymes contraires (monter/descendre),<br />
- les antonymes réciproques (acheter/vendre).<br />
Les liaisons associatives<br />
Un terme X est lié à un terme Y par une liaison de ce type si par exemple pour<br />
compléter la définition de X, on peut se référer au terme Y. On peut, comme pour les relations<br />
sémantiques précédentes, imaginer dans ce cadre plusieurs variantes.<br />
2.5 Exemple<br />
Extrait de l’arbre de domaine
Component of a computer system<br />
ALU CU main store peripheral<br />
input peripheral output peripheral storage device<br />
keypad touchpad cursor control drawing magnetic tape disk videodisk<br />
device<br />
device<br />
mouse tracker ball joystick light graphics single-sided double-sided<br />
pen tablet disk disk<br />
printer VDU screen plotter<br />
impact printer<br />
non impact printer<br />
daisy wheel printer<br />
ink-jet printer thermal printer laser printer<br />
Les synonymes ne sont pas représentés pour ne pas alourdir l’arbre.<br />
Le domaine choisi pour illustrer les résultats produits par le terminologue est celui des<br />
éléments d’un système informatique. La langue utilisée est l’anglais. Plus qu’un simple exemple,<br />
ce cadre fait partie du champ d’expérimentation de nos travaux.<br />
La présentation n’est pas complète. Nous l’avons limitée aux seuls aspects nécessaires<br />
pour expliquer notre contribution : extrait de l’arbre de domaine (page précédente) et liens de<br />
synonymie (ci-dessous).<br />
Liens de synonymie entre concepts<br />
. synonymes de main store<br />
- main memory
- primary store<br />
- internal memory<br />
- immediate access storage<br />
. synonymes de peripheral<br />
- peripheral device<br />
- peripheral unit<br />
. synonymes de storage device<br />
- secondary store<br />
-external memory<br />
-auxiliary storage<br />
. synonymes de cursor control device<br />
- point and shoot device<br />
3 La théorie des graphes conceptuels<br />
La théorie des graphes conceptuels, développée par J.F. SOWA [SOWA84], trouve ses<br />
fondements en linguistique, en psychologie et en philosophie. Son intérêt réside dans sa capacité à<br />
modéliser la sémantique du domaine d’application. J.F. SOWA propose même que sa théorie soit<br />
considérée comme un langage universel de représentation des connaissances pour tout système<br />
intelligent [SOWA92]. La théorie est bâtie autour de la notion de concept que nous avons<br />
détaillée dans le chapitre précédent.<br />
3.1 Les concepts<br />
Un concept, dans un graphe conceptuel, a un label de type, ou plus simplement un type,<br />
et un référent. Les concepts obéissent à la notation suivante :<br />
[ : ]<br />
La hiérarchie des types de concept
La hiérarchie des types de concept permet de généraliser, ou au contraire de spécialiser.<br />
Les types de concept sont ordonnés selon leur « degré de généralité » par une relation notée<br />
«
« boîtes ».<br />
Les noeuds relations conceptuelles sont représentés par des ellipses ou entre<br />
parenthèses, avec un et un seul arc entrant, et un et un seul arc sortant. Un arc entrant relie un<br />
concept à une relation conceptuelle, et un arc sortant relie une relation conceptuelle à un concept:<br />
[CONCEPT] -> (RELATION CONCEPTUELLE) -> [CONCEPT]<br />
Une relation conceptuelle se lit toujours dans le sens des flèches.<br />
Un graphe conceptuel est orienté, fini, connexe et biparti. Formellement il se définit<br />
comme suit :<br />
GC = (N,A)<br />
un graphe conceptuel est constitué de noeuds et d’arcs<br />
N = (C,R)<br />
les noeuds sont partitionnés en deux ensembles : C et R<br />
C={c1...cn} ensemble des noeuds concepts<br />
R={r1...rm} ensemble des noeuds relations conceptuelles<br />
A = (AE,AS) les arcs sont partitionnés en deux ensembles : AE et AS<br />
AE={e1...em} où ei = avec 1
L’opération de simplification d’un graphe conceptuel consiste, si deux relations<br />
conceptuelles sont dupliquées, c’est-à-dire si deux relations conceptuelles identiques relient deux<br />
mêmes concepts (suite par exemple à une opération de jointure), à supprimer l’une d’elles ainsi<br />
que les arcs reliés à celle-ci.<br />
J.F. SOWA a également défini d’autres opérations telles que la projection et l’opération<br />
de jointure maximale qui ne sont pas décrites ici.<br />
Le lecteur intéressé par les définitions formelles de toutes ces opérations pourra se<br />
référer à la bibliographie, notre objectif n’étant pas de présenter le modèle de J.F. SOWA mais<br />
simplement de le « situer » dans le cadre de nos travaux.<br />
4 La modélisation du système conceptuel du domaine<br />
La construction d’une base de données terminologique, ou d’une base de concepts<br />
(terme employé dans [BONJ94]), nécessite la réunion de compétences multiples :<br />
- en base de données et modèles de données,<br />
- en terminologie,<br />
mais cela suppose également<br />
- une connaissance approfondie du domaine (au sens terminologique).<br />
C’est donc une démarche multi-disciplinaire qui, pour aboutir, doit également être interdisciplinaire.<br />
Les différentes expériences que nous avons menées parallèlement [ARNA94],<br />
[FRAN94] et successivement [DEME95] se sont avérées modérément satisfaisantes. Mettant en<br />
oeuvre, lors de la modélisation, des démarches « bases de données » classiques reposant sur les<br />
modèles Entité/Association, Entité/Association Etendu ou Objet, elles ne sont pas parvenues à<br />
intégrer de façon satisfaisante les usages des différentes disciplines.<br />
Dans ce contexte, notre contribution consiste à proposer une approche basée sur<br />
l’utilisation des graphes conceptuels. Trouvant une partie de ses fondements dans la linguistique,
la théorie des graphes conceptuels s’inscrit naturellement dans la démarche du terminologue et<br />
facilite la modélisation du système conceptuel du domaine.<br />
4.1 Principe<br />
Le travail du terminologue (cf. 2) consiste à :<br />
- établir pour chaque terme une fiche terminologique (rappelons que chaque terme<br />
désigne un concept),<br />
- établir l’arbre de domaine qui matérialise les liens de type générique/spécifique<br />
existant entre concepts,<br />
- établir des liens sémantiques entre concepts (synonymie, antonymie, liaisons<br />
associatives).<br />
L’établissement des fiches terminologiques est une opération « classique » qui consiste<br />
à regrouper pour chaque terme l’ensemble des informations qui lui sont associées. Le modèle des<br />
graphes conceptuels n’intervient pas à ce niveau. Notons simplement que la définition du terme<br />
est un texte et que l’on peut avoir comme information des listes (d’homonymes par exemple).<br />
Ceci aura nécessairement un impact sur le stockage de l’information...<br />
Le modèle des graphes conceptuels intervient par contre lors de l’établissement de<br />
l’arbre de domaine et lors de l’établissement des liens sémantiques entre concepts.<br />
Etablissement de l’arbre de domaine<br />
L’arbre de domaine du terminologue est identique, à quelques détails près, à la<br />
hiérarchie des types de concept du modèle de J.F. SOWA.<br />
Concernant les noeuds, cette affirmation repose sur le constat que les notions de<br />
concept (en terminologie) et de type de concept (dans la théorie des graphes conceptuels) sont<br />
identiques.<br />
Quant aux arcs, les liens de type générique/spécifique (en terminologie) sont les mêmes<br />
que ceux de type général/spécialisé (dans la théorie des graphes conceptuels).<br />
Il est nécessaire néanmoins de transformer l’arbre de domaine produit par le<br />
terminologue en treillis de types de concept pour se ramener à la théorie des graphes conceptuels.<br />
Pour ce faire il convient :<br />
- d’ajouter les types de concept UNIV et ABSURD.
- d’ajouter les liens unissant ces deux concepts aux autres.<br />
Notre première contribution consiste à proposer une opération permettant de réaliser<br />
automatiquement cette transformation. Cette opération peut se formaliser ainsi :<br />
Soit un arbre de domaine AD<br />
AD = (C,A)<br />
C={c1...cn}<br />
A={a1...am}<br />
un arbre de domaine est constitué de sommets (concepts) et d’arcs<br />
ensemble des concepts du domaine<br />
où ai= avec 1
- des arcs entrants,<br />
- des arcs sortants.<br />
D’autre part, à un concept est associé un type (qui apparaît dans le treillis des types de<br />
concepts), et un référent qui peut être une astérisque (concept générique) ou un marqueur<br />
individuel (concept individuel).<br />
Notons que pour le terminologue, concept est à prendre systématiquement au sens<br />
générique. De ce fait nous assimilons la notion de concept et de type de concept, comme le fait<br />
d’ailleurs la notation dans la théorie des graphes conceptuels (cf. 3.1).<br />
Par conséquent, le contexte que nous mettons à la disposition du terminologue pour<br />
modéliser les liens sémantiques entre concepts est défini comme suit :<br />
- le treillis des types de concept TC obtenu précédemment à partir de l’arbre de<br />
domaine<br />
- un ensemble de relations conceptuelles R sur lequel nous reviendrons.<br />
Ce contexte se caractérise donc par l’absence de marqueur individuel et de relation de<br />
conformité associant types de concept et marqueurs individuels.<br />
Le principe de modélisation des liens sémantiques entre concepts peut dès lors<br />
s’énoncer comme suit :<br />
Deux concepts C1 et C2 appartenant au treillis TC et liés sémantiquement sont associés<br />
par une relation conceptuelle RC de l’ensemble R via des arcs entrant et sortant de la manière<br />
suivante :<br />
[C1] -> (RC) -> [C2]<br />
L’application de ce principe par le terminologue engendre la création de graphes<br />
conceptuels.<br />
Concernant l’ensemble R des relations conceptuelles, nous proposons naturellement d’y<br />
mettre, dans un premier temps, les relations sémantiques « classiques » utilisées en terminologie<br />
(synonymie, antonymie, liaison associative).<br />
4.2 Exemple<br />
Etablissement de l’arbre de domaine
Le treillis de types de concept obtenu automatiquement à partir de l’arbre de domaine<br />
produit par le terminologue en 2.5 est le suivant :<br />
UNIV<br />
Component of a computer system<br />
ALU* CU* main store* peripheral<br />
input peripheral output peripheral storage device<br />
keypad* touchpad* cursor control drawing magnetic tape* disk videodisk*<br />
device<br />
device<br />
mouse* tracker ball* joystick* light graphics single-sided double-sided<br />
pen* tablet* disk* disk<br />
printer VDU screen* plotter
impact printer non impact printer<br />
daisy wheel printer<br />
ink-jet printer thermal printer laser printer<br />
ABSURD<br />
* tous les types de concept marqués par une étoile sont reliés au type de concept ABSURD mais<br />
ces liens n’ont pas été représentés pour ne pas alourdir le schéma. Les synonymes ne sont pas non<br />
plus représentés.<br />
La construction de l’arbre de domaine est incrémentale, elle s’effectue au fur et à<br />
mesure de la découverte de nouveaux concepts et/ou à la lecture de leurs définitions (cf. 2.3).<br />
Pour ce faire, nous mettons à disposition du terminologue un éditeur de graphe doté<br />
des fonctionnalités classiques (chargement, sauvegarde, édition ...) et de l’opération de<br />
transformation en treillis de types de concept à mettre en oeuvre lorsque la construction de l’arbre<br />
de domaine est achevée.<br />
Etablissement des liens sémantiques entre concepts<br />
Le treillis des types de concept obtenu précédemment et l’ensemble des relations<br />
conceptuelles R défini en 4.1 constituent le contexte dans lequel le terminologue va modéliser les<br />
liens sémantiques entre concepts.<br />
La création des graphes conceptuels se fait à l’aide de l’éditeur de graphe. Le<br />
terminologue peut à tout moment consulter :<br />
- le treillis des types de concept<br />
- l’ensemble des relations conceptuelles.<br />
En permanence, des contrôles sont effectués, par exemple pour vérifier l’existence des<br />
concepts (dans le treillis) ou des relations conceptuelles utilisés pour construire les graphes.<br />
Dans ce contexte le terminologue peut être amené à construire successivement, à des<br />
périodes plus ou moins éloignées dans le temps, les graphes conceptuels suivants :
GC1 : main memory synonyme primary store<br />
GC2 : primary store synonyme internal memory<br />
GC3 : main memory synonyme primary synonyme immediate<br />
store<br />
access storage<br />
Il peut s’avérer intéressant pour le terminologue de « relier » ces différents graphes.<br />
Pour ce faire, nous proposons d’utiliser les opérations définies sur les graphes conceptuels (cf.<br />
3.2) et de les rendre utilisables à partir de l’éditeur de graphe. Nous illustrons cela à l’aide des<br />
exemples qui suivent :<br />
La jointure de GC1 et GC2 sur le concept primary store permet d’obtenir GC12 :<br />
main memory synonyme primary store synonyme internal store<br />
La jointure de GC12 et GC3 sur les concepts main memory et primary store permet<br />
d’obtenir GC123 :<br />
synonyme synonyme internal store<br />
main memory<br />
primary store<br />
synonyme synonyme immediate access storage<br />
La simplification de GC123 permet d’obtenir GC123S :<br />
main memory synonyme primary store<br />
synonyme<br />
synonyme<br />
internal store<br />
immediate access<br />
storage<br />
Le dispositif présenté et illustré par la relation de synonymie permet d’établir les liens<br />
sémantiques entre concepts. Ajoutés à l’arbre de domaine ils contribuent à la modélisation du
système conceptuel du domaine.<br />
5 Conclusion<br />
Les axes de recherche pouvant bénéficier de l’utilisation de bases de données<br />
terminologiques sont dès à présent relativement nombreux. L’intérêt de telles bases a déjà été mis<br />
en évidence dans les Systèmes Intelligents de Recherche d’Information [PUGE94],<br />
particulièrement lors de l’analyse des requêtes de l’utilisateur. Il en est de même pour la<br />
Conception des Systèmes d’Information [BONJ94], plus précisément dans le cadre de<br />
l’intégration de schémas « hétérogènes »...<br />
Alors que, dans la plupart des cas, le sujet n’a été qu’ébauché, on entrevoit déjà<br />
d’autres champs d’application dans le domaine des interfaces, de l’apprentissage... Enfin, en<br />
terminologie, on envisage la constitution de dictionnaires électroniques notionnellement<br />
structurés.<br />
Nos travaux sont originaux dans le sens où ils s’intéressent spécifiquement aux bases de<br />
données terminologiques. Effectués au sein d’une équipe réunissant des compétences en bases de<br />
données et en terminologie, ils ont pour objectif d’apporter une contribution dans les domaines<br />
informatiques de plus en plus nombreux s’appuyant sur la terminologie.<br />
Dans cet article nous proposons une approche pour la conception de bases de données<br />
terminologiques. Elle se démarque des deux catégories d’approches « traditionnelles » qui ne<br />
permettent pas toujours d’obtenir des résultats satisfaisants. Basée sur la théorie des graphes<br />
conceptuels qui propose un modèle sémantique pour la représentation des connaissances éprouvé<br />
dans d’autres domaines de recherche, la méthode que nous avons définie s’inscrit naturellement<br />
dans la démarche du terminologue et permet de modéliser le système conceptuel du domaine.<br />
La première étape de la méthode concerne l’établissement de l’arbre de domaine qui<br />
matérialise les liens de type générique/spécifique existant entre concepts. Nous proposons au<br />
terminologue un environnement graphique permettant la construction incrémentale de l’arbre de<br />
domaine. D’autre part nous avons défini et formalisé l’opération de transformation de cet arbre en<br />
treillis de types de concept. Cette opération disponible dans l’environnement graphique est mise
en oeuvre lorsque la construction de l’arbre de domaine est achevée.<br />
La deuxième étape consiste à établir les liens sémantiques entre concepts. Nous avons<br />
défini un contexte adapté au problème considéré. Grâce à ce contexte, à l’environnement<br />
graphique et aux opérations définies sur les graphes conceptuels, il est possible de construire des<br />
graphes modélisant les liens sémantiques entre concepts.<br />
Pour le moment, l’ensemble des relations conceptuelles que nous mettons à la<br />
disposition du terminologue est limité aux relations de synonymie, d’antonymie, et aux liaisons<br />
associatives. Dans un futur proche, nous projetons d’étudier ces dernières de manière à mettre en<br />
évidence différentes catégories, en liaison avec la définition du concept qui est consignée dans la<br />
fiche terminologique.<br />
Cela suppose de considérer la définition non plus comme un simple texte, mais d’avoir<br />
éventuellement recours à des précurseurs de définition, d’utiliser des caractères définitoires, ou<br />
d’envisager d’autres solutions...<br />
D’un point de vue pratique on peut dans cette optique offrir au terminologue la<br />
possibilité de visualiser la définition d’un concept, voire même sa fiche terminologique, dans<br />
l’environnement graphique multi-fenêtres mis à sa disposition.<br />
L’intérêt de ces futurs travaux réside bien sûr dans l’enrichissement sémantique du<br />
système conceptuel du domaine.<br />
6 Bibliographie<br />
[ARNA94] Arnauné K., Carton C., Rompteaux A.<br />
Base de données terminologique<br />
Rapport interne, 1994<br />
[ARRO91] Arronategui U., Huguet T., Macchion J.P., Mieulet F.<br />
Modélisation cognitive de la compréhension<br />
2èmes journées nationales du GRECO-PRC Communication Homme-Machine<br />
Toulouse, Janvier 1991
[AZEM93] Azemard F., Huguet T., Macchion J.P., Mieulet F.<br />
Intégration multimodale et interprétation conceptuelle pour une interface intelligente<br />
Colloque international en informatique cognitive des organisations<br />
Montreal, Mai 1993<br />
[BONJ94] Bonjour M., Falquet G., Leonard M.<br />
Bases de concepts et intégration de bases de données<br />
INFORSID, 1994<br />
[CHEV92] Chevallet J.P.<br />
Un modèle logique de recherche d’information appliqué au formalisme des graphes<br />
conceptuels : le prototype ELEN et son expérimentation sur un corpus de<br />
composants logiciels<br />
Thèse de Doctorat, Grenoble I, 1992<br />
[DEBE91] De Besse B.<br />
Stage de terminologie<br />
Ecole de Traduction et d’Interprétation, Genève, 1991<br />
[DEME95] Deme C.S., Dieng B.D., Masante S., Ndoye D.<br />
Gestion de la terminologie<br />
Rapport interne, 1995<br />
[FRAN94] Franchistéguy I., Mailles F., Mendiboure D., Rodrigo F.<br />
Dictionnaire terminotique<br />
Rapport interne, 1994<br />
[KABB93] Kabbaj A.<br />
Architecture d’un système de gestion des connaissances<br />
Colloque international en informatique cognitive des organisations<br />
Montréal, Mai 1993
[LYON78] Lyons J.<br />
Sémantique linguistique<br />
Larrousse, Paris, 1978<br />
[NOGI91] Nogier J.F.<br />
Génération automatique de langage et graphes conceptuels<br />
Edition Hermès, 1991<br />
[PUGE94] Puget D.<br />
Aspects sémantiques dans les systèmes de recherche d’information<br />
Thèse de Doctorat, Toulouse III, 1994<br />
[SOWA84] Sowa J.F.<br />
Conceptual structures : Information processing in mind and machine<br />
Addison-Wesley publishing company, 1984<br />
[SOWA92] Sowa J.F.<br />
Conceptual graphs as a universal knowledge representation<br />
E.Y. Rodin, 1992