30.11.2014 Views

Texte Complet - CRRM à

Texte Complet - CRRM à

Texte Complet - CRRM à

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

UNE APPROCHE POUR LA MODELISATION DE LA SEMANTIQUE<br />

DANS LES SYSTEMES D’INFORMATION ELABOREE<br />

Philippe Aniorté<br />

Institut Universitaire de Technologie de Bayonne - Département Informatique<br />

Place Paul Bert - 64100 Bayonne - France<br />

Tél : +33 5 59 46 32 15 - Fax : +33 5 59 46 32 29<br />

Philippe.Aniorte@iutbay.univ-pau.fr<br />

Mots clés :<br />

Arbre de domaine, Base de données, Graphe conceptuel, Lien sémantique, Terminologie<br />

1 Introduction<br />

De plus en plus les Systèmes d’Information intègrent des informations « élaborées » et<br />

sémantiquement riches. Les applications comme celles se situant dans le champ de la bibliométrie<br />

qui analysent et traitent ces informations relèvent moins de l’Informatique que des Sciences de<br />

l’Information. Elles se situent au carrefour de disciplines très différentes, entre autres<br />

l’Informatique et la Linguistique.<br />

Nos travaux s’intéressent à l’intégration de ces deux disciplines et plus précisément aux<br />

bases de données terminologiques. La nécessité de telles bases a été clairement mise en évidence<br />

dans tous les domaines mettant en oeuvre une analyse linguistique, par exemple ceux utilisant le<br />

langage naturel. L’objectif et l’originalité de nos travaux consistent à s’intéresser spécifiquement<br />

à la conception de telles bases devant modéliser le système conceptuel du domaine.<br />

En effet, en matière de bases de données terminologiques, la majorité des propositions<br />

(au demeurant peu nombreuses) repose sur une approche « base de données » ou une approche<br />

« terminologique », ces deux approches n’étant malheureusement pas intégrées. Nous en avons<br />

nous-même fait l’expérience en privilégiant l’aspect « base de données » et l’approche que cela<br />

induit habituellement, pour aboutir à des résultats modérément satisfaisants [ARNA94],


[FRAN94], [DEME95]. A l’inverse on trouve des approches axées sur les aspects<br />

« sémantiques », plus d’ailleurs que sur les aspects purement terminologiques, qui ne s’appuient<br />

pas sur les bases de données. Il est vrai que la plupart du temps, le problème considéré n’est pas<br />

essentiel dans le sens où il ne constitue pas l’objectif principal des recherches.<br />

L’approche que nous proposons repose sur l’utilisation d’une méthode que nous avons<br />

définie. Cette méthode est basée sur la théorie des graphes conceptuels développée par J.F.<br />

SOWA [SOWA84] qui propose un modèle sémantique pour la représentation des connaissances.<br />

Cette théorie est utilisée dans de nombreux domaines de recherche basés sur le traitement du<br />

langage naturel [AZEM93] [KABB93] [CHEV92] [ARRO91] [NOGI91] ... Elle a également été<br />

adaptée pour la Recherche d’Information en langage naturel dans le cadre de l’approche dite<br />

linguistique [PUGE94].<br />

L’article est organisé comme suit. Dans un premier temps nous présentons<br />

succinctement la terminologie en insistant sur la démarche du terminologue. Puis nous présentons<br />

les éléments essentiels de la théorie des graphes conceptuels. Enfin nous exposons notre méthode<br />

en montrant qu’elle s’inscrit naturellement dans la démarche du terminologue et permet de<br />

modéliser le système conceptuel du domaine.<br />

2 La terminologie<br />

2.1 Introduction<br />

La terminologie est une discipline théorique et pratique. Elle consiste à inventorier les<br />

termes d’un domaine. Ces termes forment un ensemble cohérent reflétant le système conceptuel<br />

de ce domaine. Il constitue le vocabulaire employé par les spécialistes. En ce sens, il représente<br />

une langue de spécialité, par opposition à la langue générale.<br />

Chaque terme est défini, décrit : des informations sur le sens, l’usage et le<br />

fonctionnement du terme sont récoltées. Ses relations avec d’autres termes du domaine sont<br />

établies afin de constituer un arbre de domaine [DEBE91].<br />

Cette rapide introduction à l’activité terminologique repose sur des notions qu’il


convient de préciser.<br />

Le terme<br />

Le terme se définit comme une unité signifiante constitué d’un mot (terme simple ou<br />

uniterme) ou de plusieurs mots (terme complexe ou polyterme). Il désigne un concept déterminé<br />

de façon univoque à l’intérieur d’un domaine.<br />

Le mot est une unité de langue pourvue de sens et constituée par un certain nombre de<br />

lettres [ARNA94].<br />

Le concept<br />

Le concept a été présenté dans [LYON78] comme toute idée, toute pensée ou toute<br />

construction mentale au moyen de laquelle l’esprit appréhende les choses ou parvient à les<br />

reconnaître. On peut aussi le définir comme une unité de pensée constituée d’un ensemble de<br />

caractères attribués à un objet ou à une classe d’objets. C’est une représentation d’un aspect de la<br />

réalité isolé par l’esprit qui peut s’exprimer par des termes dans plusieurs langues.<br />

Notons que le concept est une entité controversée qui peut également se concevoir hors<br />

langages et qui est dans ce cas purement mentale.<br />

Le domaine<br />

Le domaine peut être une activité, une problématique, une discipline dans laquelle une<br />

langue dite de spécialité, par opposition à la langue générale, existe et est utilisée par les experts<br />

du domaine [BONJ94].<br />

Les liens entre termes, concepts et domaine peuvent s’exprimer comme suit : un terme<br />

désigne un concept, il est défini par une définition dans le domaine étudié (ou champ<br />

d’application).<br />

Le rôle de la définition est très important en terminologie. Une définition de concept<br />

doit permettre de le distinguer de tout autre. Les définitions sont classificatoires, hiérarchisantes,<br />

structurantes... Ce sont des textes en langue naturelle.<br />

2.2 La fiche terminologique


Le principal outil de travail du terminologue est la fiche terminologique appelée aussi<br />

parfois dossier terminologique. Elle contient l’ensemble des informations relatives à une entité<br />

terminologique c’est-à-dire au terme et au concept que celui-ci désigne [FRAN94]. Des<br />

informations propres aux conditions de rédaction de la fiche (mention des sources, degré de<br />

fiabilité, etc...) peuvent également y être consignées [BONJ94]. Nous n’en tiendrons pas compte<br />

par la suite.<br />

L’utilisation de l’informatique a donné naissance au néologisme « terminotique »<br />

(contraction de terminologie et informatique) qui désigne l’ensemble des situations dans<br />

lesquelles l’informatique intervient comme support à des activités terminologiques. De ce fait<br />

l’usage de fiches « papier » est devenu quelque peu désuet. Néanmoins, la notion de fiche est<br />

restée.<br />

Outre le terme (dans ce contexte on parle également de forme graphique) et sa<br />

définition, une fiche terminologique consigne des informations de type terminologique,<br />

linguistique... On peut citer, sans que cette liste soit exhaustive :<br />

- l’origine du terme (nom latin ...),<br />

- la racine, groupe de lettres rappelant le mot ayant donné naissance au terme,<br />

- l’acronyme ou sigle,<br />

- la phonétique,<br />

- la flexion, fonction grammaticale du terme (verbe...),<br />

- la connotation, usage du terme (familier...),<br />

- les homonymes,<br />

- les homophones, termes se prononçant de la même façon mais ayant un sens<br />

différent,<br />

- une note, remarques particulières concernant le terme...<br />

Notons que la fiche terminologique d’un terme peut ne pas contenir toutes les<br />

informations énumérées ci-dessus, par exemple absence de l’acronyme...<br />

2.3 L’arbre de domaine<br />

L’arbre de domaine matérialise les liens de type générique (hyperonyme) / spécifique<br />

(hyponyme) existant entre concepts. Il est établi au fur et à mesure de la découverte de nouveaux


concepts et/ou à la lecture de leurs définitions. Il sert également à délimiter un domaine en<br />

énumérant l’ensemble de ses concepts.<br />

Chaque concept a une position dans la hiérarchie des concepts matérialisée par l’arbre<br />

de domaine. Chaque concept est associé à un concept plus général ou concept générique de<br />

manière à former un arbre conceptuel du domaine.<br />

L’hyperonymie<br />

Tout concept, à l’exception de celui se trouvant au sommet de l’arborescence, possède<br />

un hyperonyme ou générique. La succession des hyperonymes construit le parcours ascendant de<br />

l’arborescence des concepts. L’hyperonyme ou le générique définit le cadre dans lequel entre le<br />

concept considéré.<br />

L’hyperonymie peut se traduire comme suit : un terme Y est hyperonyme d’un terme X,<br />

si l’on peut dire « un X est un Y » en formulant une relation d’inclusion entre les classes<br />

désignées par ces termes.<br />

L’hyponymie<br />

Tout concept, à l’exception de celui situé au point le plus bas de l’arborescence,<br />

possède un hyponyme ou spécifique. La succession des hyponymes construit le parcours<br />

descendant de l’arborescence des concepts.<br />

L’hyponymie peut se traduire comme suit : un terme X est hyponyme d’un terme Y, si<br />

l’on peut dire « un X est un Y » en formulant une relation d’inclusion entre les classes désignées<br />

par ces termes.<br />

2.4 Liens sémantiques entre concepts<br />

Mis à part les liens de type générique/spécifique (cf. 2.3) un concept peut être<br />

sémantiquement lié à d’autres concepts par des relations de synonymie, d’antonymie ou par des<br />

liaisons associatives.<br />

La synonymie<br />

Sont dits synonymes deux termes dont les valeurs sont rigoureusement identiques. Ils<br />

sont en tous points substituables.


Les synonymes sont habituellement définis comme des copies de formes différentes<br />

mais de même sens. En fait, on ne rencontre jamais de synonymes parfaits même si les sens sont<br />

quasiment identiques.<br />

Notons que dans le domaine de la recherche documentaire, la notion de synonymie<br />

donne lieu à plusieurs nuances :<br />

- synonymie « réelle »,<br />

- équivalence entre variantes orthographiques,<br />

- équivalence entre abréviation et forme développée,<br />

- équivalence entre sigle et forme développée,<br />

- quasi-synonymie ou synonymie contextuelle,<br />

- équivalence inter-linguistique.<br />

L’antonymie<br />

Tout terme a, en principe, sa face inverse ou antonyme. Deux termes sont antonymes si<br />

l’un est la négation de l’autre, c’est à dire s’il possède les mêmes traits, mais avec un signe<br />

inverse. On parle aussi de contraires. C’est une opposition au terme de synonymie car il permet<br />

de coupler des termes différents.<br />

On peut distinguer :<br />

- les antonymes polaires (mari/femme),<br />

- les antonymes scalaires (grand/petit),<br />

- les antonymes contradictoires (célibataire/marié),<br />

- les antonymes contraires (monter/descendre),<br />

- les antonymes réciproques (acheter/vendre).<br />

Les liaisons associatives<br />

Un terme X est lié à un terme Y par une liaison de ce type si par exemple pour<br />

compléter la définition de X, on peut se référer au terme Y. On peut, comme pour les relations<br />

sémantiques précédentes, imaginer dans ce cadre plusieurs variantes.<br />

2.5 Exemple<br />

Extrait de l’arbre de domaine


Component of a computer system<br />

ALU CU main store peripheral<br />

input peripheral output peripheral storage device<br />

keypad touchpad cursor control drawing magnetic tape disk videodisk<br />

device<br />

device<br />

mouse tracker ball joystick light graphics single-sided double-sided<br />

pen tablet disk disk<br />

printer VDU screen plotter<br />

impact printer<br />

non impact printer<br />

daisy wheel printer<br />

ink-jet printer thermal printer laser printer<br />

Les synonymes ne sont pas représentés pour ne pas alourdir l’arbre.<br />

Le domaine choisi pour illustrer les résultats produits par le terminologue est celui des<br />

éléments d’un système informatique. La langue utilisée est l’anglais. Plus qu’un simple exemple,<br />

ce cadre fait partie du champ d’expérimentation de nos travaux.<br />

La présentation n’est pas complète. Nous l’avons limitée aux seuls aspects nécessaires<br />

pour expliquer notre contribution : extrait de l’arbre de domaine (page précédente) et liens de<br />

synonymie (ci-dessous).<br />

Liens de synonymie entre concepts<br />

. synonymes de main store<br />

- main memory


- primary store<br />

- internal memory<br />

- immediate access storage<br />

. synonymes de peripheral<br />

- peripheral device<br />

- peripheral unit<br />

. synonymes de storage device<br />

- secondary store<br />

-external memory<br />

-auxiliary storage<br />

. synonymes de cursor control device<br />

- point and shoot device<br />

3 La théorie des graphes conceptuels<br />

La théorie des graphes conceptuels, développée par J.F. SOWA [SOWA84], trouve ses<br />

fondements en linguistique, en psychologie et en philosophie. Son intérêt réside dans sa capacité à<br />

modéliser la sémantique du domaine d’application. J.F. SOWA propose même que sa théorie soit<br />

considérée comme un langage universel de représentation des connaissances pour tout système<br />

intelligent [SOWA92]. La théorie est bâtie autour de la notion de concept que nous avons<br />

détaillée dans le chapitre précédent.<br />

3.1 Les concepts<br />

Un concept, dans un graphe conceptuel, a un label de type, ou plus simplement un type,<br />

et un référent. Les concepts obéissent à la notation suivante :<br />

[ : ]<br />

La hiérarchie des types de concept


La hiérarchie des types de concept permet de généraliser, ou au contraire de spécialiser.<br />

Les types de concept sont ordonnés selon leur « degré de généralité » par une relation notée<br />

«


« boîtes ».<br />

Les noeuds relations conceptuelles sont représentés par des ellipses ou entre<br />

parenthèses, avec un et un seul arc entrant, et un et un seul arc sortant. Un arc entrant relie un<br />

concept à une relation conceptuelle, et un arc sortant relie une relation conceptuelle à un concept:<br />

[CONCEPT] -> (RELATION CONCEPTUELLE) -> [CONCEPT]<br />

Une relation conceptuelle se lit toujours dans le sens des flèches.<br />

Un graphe conceptuel est orienté, fini, connexe et biparti. Formellement il se définit<br />

comme suit :<br />

GC = (N,A)<br />

un graphe conceptuel est constitué de noeuds et d’arcs<br />

N = (C,R)<br />

les noeuds sont partitionnés en deux ensembles : C et R<br />

C={c1...cn} ensemble des noeuds concepts<br />

R={r1...rm} ensemble des noeuds relations conceptuelles<br />

A = (AE,AS) les arcs sont partitionnés en deux ensembles : AE et AS<br />

AE={e1...em} où ei = avec 1


L’opération de simplification d’un graphe conceptuel consiste, si deux relations<br />

conceptuelles sont dupliquées, c’est-à-dire si deux relations conceptuelles identiques relient deux<br />

mêmes concepts (suite par exemple à une opération de jointure), à supprimer l’une d’elles ainsi<br />

que les arcs reliés à celle-ci.<br />

J.F. SOWA a également défini d’autres opérations telles que la projection et l’opération<br />

de jointure maximale qui ne sont pas décrites ici.<br />

Le lecteur intéressé par les définitions formelles de toutes ces opérations pourra se<br />

référer à la bibliographie, notre objectif n’étant pas de présenter le modèle de J.F. SOWA mais<br />

simplement de le « situer » dans le cadre de nos travaux.<br />

4 La modélisation du système conceptuel du domaine<br />

La construction d’une base de données terminologique, ou d’une base de concepts<br />

(terme employé dans [BONJ94]), nécessite la réunion de compétences multiples :<br />

- en base de données et modèles de données,<br />

- en terminologie,<br />

mais cela suppose également<br />

- une connaissance approfondie du domaine (au sens terminologique).<br />

C’est donc une démarche multi-disciplinaire qui, pour aboutir, doit également être interdisciplinaire.<br />

Les différentes expériences que nous avons menées parallèlement [ARNA94],<br />

[FRAN94] et successivement [DEME95] se sont avérées modérément satisfaisantes. Mettant en<br />

oeuvre, lors de la modélisation, des démarches « bases de données » classiques reposant sur les<br />

modèles Entité/Association, Entité/Association Etendu ou Objet, elles ne sont pas parvenues à<br />

intégrer de façon satisfaisante les usages des différentes disciplines.<br />

Dans ce contexte, notre contribution consiste à proposer une approche basée sur<br />

l’utilisation des graphes conceptuels. Trouvant une partie de ses fondements dans la linguistique,


la théorie des graphes conceptuels s’inscrit naturellement dans la démarche du terminologue et<br />

facilite la modélisation du système conceptuel du domaine.<br />

4.1 Principe<br />

Le travail du terminologue (cf. 2) consiste à :<br />

- établir pour chaque terme une fiche terminologique (rappelons que chaque terme<br />

désigne un concept),<br />

- établir l’arbre de domaine qui matérialise les liens de type générique/spécifique<br />

existant entre concepts,<br />

- établir des liens sémantiques entre concepts (synonymie, antonymie, liaisons<br />

associatives).<br />

L’établissement des fiches terminologiques est une opération « classique » qui consiste<br />

à regrouper pour chaque terme l’ensemble des informations qui lui sont associées. Le modèle des<br />

graphes conceptuels n’intervient pas à ce niveau. Notons simplement que la définition du terme<br />

est un texte et que l’on peut avoir comme information des listes (d’homonymes par exemple).<br />

Ceci aura nécessairement un impact sur le stockage de l’information...<br />

Le modèle des graphes conceptuels intervient par contre lors de l’établissement de<br />

l’arbre de domaine et lors de l’établissement des liens sémantiques entre concepts.<br />

Etablissement de l’arbre de domaine<br />

L’arbre de domaine du terminologue est identique, à quelques détails près, à la<br />

hiérarchie des types de concept du modèle de J.F. SOWA.<br />

Concernant les noeuds, cette affirmation repose sur le constat que les notions de<br />

concept (en terminologie) et de type de concept (dans la théorie des graphes conceptuels) sont<br />

identiques.<br />

Quant aux arcs, les liens de type générique/spécifique (en terminologie) sont les mêmes<br />

que ceux de type général/spécialisé (dans la théorie des graphes conceptuels).<br />

Il est nécessaire néanmoins de transformer l’arbre de domaine produit par le<br />

terminologue en treillis de types de concept pour se ramener à la théorie des graphes conceptuels.<br />

Pour ce faire il convient :<br />

- d’ajouter les types de concept UNIV et ABSURD.


- d’ajouter les liens unissant ces deux concepts aux autres.<br />

Notre première contribution consiste à proposer une opération permettant de réaliser<br />

automatiquement cette transformation. Cette opération peut se formaliser ainsi :<br />

Soit un arbre de domaine AD<br />

AD = (C,A)<br />

C={c1...cn}<br />

A={a1...am}<br />

un arbre de domaine est constitué de sommets (concepts) et d’arcs<br />

ensemble des concepts du domaine<br />

où ai= avec 1


- des arcs entrants,<br />

- des arcs sortants.<br />

D’autre part, à un concept est associé un type (qui apparaît dans le treillis des types de<br />

concepts), et un référent qui peut être une astérisque (concept générique) ou un marqueur<br />

individuel (concept individuel).<br />

Notons que pour le terminologue, concept est à prendre systématiquement au sens<br />

générique. De ce fait nous assimilons la notion de concept et de type de concept, comme le fait<br />

d’ailleurs la notation dans la théorie des graphes conceptuels (cf. 3.1).<br />

Par conséquent, le contexte que nous mettons à la disposition du terminologue pour<br />

modéliser les liens sémantiques entre concepts est défini comme suit :<br />

- le treillis des types de concept TC obtenu précédemment à partir de l’arbre de<br />

domaine<br />

- un ensemble de relations conceptuelles R sur lequel nous reviendrons.<br />

Ce contexte se caractérise donc par l’absence de marqueur individuel et de relation de<br />

conformité associant types de concept et marqueurs individuels.<br />

Le principe de modélisation des liens sémantiques entre concepts peut dès lors<br />

s’énoncer comme suit :<br />

Deux concepts C1 et C2 appartenant au treillis TC et liés sémantiquement sont associés<br />

par une relation conceptuelle RC de l’ensemble R via des arcs entrant et sortant de la manière<br />

suivante :<br />

[C1] -> (RC) -> [C2]<br />

L’application de ce principe par le terminologue engendre la création de graphes<br />

conceptuels.<br />

Concernant l’ensemble R des relations conceptuelles, nous proposons naturellement d’y<br />

mettre, dans un premier temps, les relations sémantiques « classiques » utilisées en terminologie<br />

(synonymie, antonymie, liaison associative).<br />

4.2 Exemple<br />

Etablissement de l’arbre de domaine


Le treillis de types de concept obtenu automatiquement à partir de l’arbre de domaine<br />

produit par le terminologue en 2.5 est le suivant :<br />

UNIV<br />

Component of a computer system<br />

ALU* CU* main store* peripheral<br />

input peripheral output peripheral storage device<br />

keypad* touchpad* cursor control drawing magnetic tape* disk videodisk*<br />

device<br />

device<br />

mouse* tracker ball* joystick* light graphics single-sided double-sided<br />

pen* tablet* disk* disk<br />

printer VDU screen* plotter


impact printer non impact printer<br />

daisy wheel printer<br />

ink-jet printer thermal printer laser printer<br />

ABSURD<br />

* tous les types de concept marqués par une étoile sont reliés au type de concept ABSURD mais<br />

ces liens n’ont pas été représentés pour ne pas alourdir le schéma. Les synonymes ne sont pas non<br />

plus représentés.<br />

La construction de l’arbre de domaine est incrémentale, elle s’effectue au fur et à<br />

mesure de la découverte de nouveaux concepts et/ou à la lecture de leurs définitions (cf. 2.3).<br />

Pour ce faire, nous mettons à disposition du terminologue un éditeur de graphe doté<br />

des fonctionnalités classiques (chargement, sauvegarde, édition ...) et de l’opération de<br />

transformation en treillis de types de concept à mettre en oeuvre lorsque la construction de l’arbre<br />

de domaine est achevée.<br />

Etablissement des liens sémantiques entre concepts<br />

Le treillis des types de concept obtenu précédemment et l’ensemble des relations<br />

conceptuelles R défini en 4.1 constituent le contexte dans lequel le terminologue va modéliser les<br />

liens sémantiques entre concepts.<br />

La création des graphes conceptuels se fait à l’aide de l’éditeur de graphe. Le<br />

terminologue peut à tout moment consulter :<br />

- le treillis des types de concept<br />

- l’ensemble des relations conceptuelles.<br />

En permanence, des contrôles sont effectués, par exemple pour vérifier l’existence des<br />

concepts (dans le treillis) ou des relations conceptuelles utilisés pour construire les graphes.<br />

Dans ce contexte le terminologue peut être amené à construire successivement, à des<br />

périodes plus ou moins éloignées dans le temps, les graphes conceptuels suivants :


GC1 : main memory synonyme primary store<br />

GC2 : primary store synonyme internal memory<br />

GC3 : main memory synonyme primary synonyme immediate<br />

store<br />

access storage<br />

Il peut s’avérer intéressant pour le terminologue de « relier » ces différents graphes.<br />

Pour ce faire, nous proposons d’utiliser les opérations définies sur les graphes conceptuels (cf.<br />

3.2) et de les rendre utilisables à partir de l’éditeur de graphe. Nous illustrons cela à l’aide des<br />

exemples qui suivent :<br />

La jointure de GC1 et GC2 sur le concept primary store permet d’obtenir GC12 :<br />

main memory synonyme primary store synonyme internal store<br />

La jointure de GC12 et GC3 sur les concepts main memory et primary store permet<br />

d’obtenir GC123 :<br />

synonyme synonyme internal store<br />

main memory<br />

primary store<br />

synonyme synonyme immediate access storage<br />

La simplification de GC123 permet d’obtenir GC123S :<br />

main memory synonyme primary store<br />

synonyme<br />

synonyme<br />

internal store<br />

immediate access<br />

storage<br />

Le dispositif présenté et illustré par la relation de synonymie permet d’établir les liens<br />

sémantiques entre concepts. Ajoutés à l’arbre de domaine ils contribuent à la modélisation du


système conceptuel du domaine.<br />

5 Conclusion<br />

Les axes de recherche pouvant bénéficier de l’utilisation de bases de données<br />

terminologiques sont dès à présent relativement nombreux. L’intérêt de telles bases a déjà été mis<br />

en évidence dans les Systèmes Intelligents de Recherche d’Information [PUGE94],<br />

particulièrement lors de l’analyse des requêtes de l’utilisateur. Il en est de même pour la<br />

Conception des Systèmes d’Information [BONJ94], plus précisément dans le cadre de<br />

l’intégration de schémas « hétérogènes »...<br />

Alors que, dans la plupart des cas, le sujet n’a été qu’ébauché, on entrevoit déjà<br />

d’autres champs d’application dans le domaine des interfaces, de l’apprentissage... Enfin, en<br />

terminologie, on envisage la constitution de dictionnaires électroniques notionnellement<br />

structurés.<br />

Nos travaux sont originaux dans le sens où ils s’intéressent spécifiquement aux bases de<br />

données terminologiques. Effectués au sein d’une équipe réunissant des compétences en bases de<br />

données et en terminologie, ils ont pour objectif d’apporter une contribution dans les domaines<br />

informatiques de plus en plus nombreux s’appuyant sur la terminologie.<br />

Dans cet article nous proposons une approche pour la conception de bases de données<br />

terminologiques. Elle se démarque des deux catégories d’approches « traditionnelles » qui ne<br />

permettent pas toujours d’obtenir des résultats satisfaisants. Basée sur la théorie des graphes<br />

conceptuels qui propose un modèle sémantique pour la représentation des connaissances éprouvé<br />

dans d’autres domaines de recherche, la méthode que nous avons définie s’inscrit naturellement<br />

dans la démarche du terminologue et permet de modéliser le système conceptuel du domaine.<br />

La première étape de la méthode concerne l’établissement de l’arbre de domaine qui<br />

matérialise les liens de type générique/spécifique existant entre concepts. Nous proposons au<br />

terminologue un environnement graphique permettant la construction incrémentale de l’arbre de<br />

domaine. D’autre part nous avons défini et formalisé l’opération de transformation de cet arbre en<br />

treillis de types de concept. Cette opération disponible dans l’environnement graphique est mise


en oeuvre lorsque la construction de l’arbre de domaine est achevée.<br />

La deuxième étape consiste à établir les liens sémantiques entre concepts. Nous avons<br />

défini un contexte adapté au problème considéré. Grâce à ce contexte, à l’environnement<br />

graphique et aux opérations définies sur les graphes conceptuels, il est possible de construire des<br />

graphes modélisant les liens sémantiques entre concepts.<br />

Pour le moment, l’ensemble des relations conceptuelles que nous mettons à la<br />

disposition du terminologue est limité aux relations de synonymie, d’antonymie, et aux liaisons<br />

associatives. Dans un futur proche, nous projetons d’étudier ces dernières de manière à mettre en<br />

évidence différentes catégories, en liaison avec la définition du concept qui est consignée dans la<br />

fiche terminologique.<br />

Cela suppose de considérer la définition non plus comme un simple texte, mais d’avoir<br />

éventuellement recours à des précurseurs de définition, d’utiliser des caractères définitoires, ou<br />

d’envisager d’autres solutions...<br />

D’un point de vue pratique on peut dans cette optique offrir au terminologue la<br />

possibilité de visualiser la définition d’un concept, voire même sa fiche terminologique, dans<br />

l’environnement graphique multi-fenêtres mis à sa disposition.<br />

L’intérêt de ces futurs travaux réside bien sûr dans l’enrichissement sémantique du<br />

système conceptuel du domaine.<br />

6 Bibliographie<br />

[ARNA94] Arnauné K., Carton C., Rompteaux A.<br />

Base de données terminologique<br />

Rapport interne, 1994<br />

[ARRO91] Arronategui U., Huguet T., Macchion J.P., Mieulet F.<br />

Modélisation cognitive de la compréhension<br />

2èmes journées nationales du GRECO-PRC Communication Homme-Machine<br />

Toulouse, Janvier 1991


[AZEM93] Azemard F., Huguet T., Macchion J.P., Mieulet F.<br />

Intégration multimodale et interprétation conceptuelle pour une interface intelligente<br />

Colloque international en informatique cognitive des organisations<br />

Montreal, Mai 1993<br />

[BONJ94] Bonjour M., Falquet G., Leonard M.<br />

Bases de concepts et intégration de bases de données<br />

INFORSID, 1994<br />

[CHEV92] Chevallet J.P.<br />

Un modèle logique de recherche d’information appliqué au formalisme des graphes<br />

conceptuels : le prototype ELEN et son expérimentation sur un corpus de<br />

composants logiciels<br />

Thèse de Doctorat, Grenoble I, 1992<br />

[DEBE91] De Besse B.<br />

Stage de terminologie<br />

Ecole de Traduction et d’Interprétation, Genève, 1991<br />

[DEME95] Deme C.S., Dieng B.D., Masante S., Ndoye D.<br />

Gestion de la terminologie<br />

Rapport interne, 1995<br />

[FRAN94] Franchistéguy I., Mailles F., Mendiboure D., Rodrigo F.<br />

Dictionnaire terminotique<br />

Rapport interne, 1994<br />

[KABB93] Kabbaj A.<br />

Architecture d’un système de gestion des connaissances<br />

Colloque international en informatique cognitive des organisations<br />

Montréal, Mai 1993


[LYON78] Lyons J.<br />

Sémantique linguistique<br />

Larrousse, Paris, 1978<br />

[NOGI91] Nogier J.F.<br />

Génération automatique de langage et graphes conceptuels<br />

Edition Hermès, 1991<br />

[PUGE94] Puget D.<br />

Aspects sémantiques dans les systèmes de recherche d’information<br />

Thèse de Doctorat, Toulouse III, 1994<br />

[SOWA84] Sowa J.F.<br />

Conceptual structures : Information processing in mind and machine<br />

Addison-Wesley publishing company, 1984<br />

[SOWA92] Sowa J.F.<br />

Conceptual graphs as a universal knowledge representation<br />

E.Y. Rodin, 1992

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!