Indlæg - CBS

NoRdteRM 16 

Ontologier og taksonomier 

RedaktøReR: Bodil NistRup MadseN & HaNNe eRdMaN tHoMseN 

NoRdteRM 2009 

københavn 9.-12. juni 2009

NORDTERM 16 

Ontologier og taksonomier 

Indlæg fra NORDTERM 2009 

København, Danmark 

9.‐12. juni 2009 

Redaktører: 

Bodil Nistrup Madsen 

& Hanne Erdman Thomsen 

Arrangører: 

Institut for Internationale Sprogstudier og Vidensteknologi 

& DANTERMcentret, Handelshøjskolen i København (CBS) 

Institut for Fagsprog, Kommunikation og Informationsvidenskab, 

Syddansk Universitet (SDU) 

Værter: 

Institut for Internationale Sprogstudier og Vidensteknologi 

& DANTERMcentret 

CBS 

Sponsorer: 

Nordplus, FUHU, Hedorfs Fond 

NORDTERM 2009, København 9.-12. juni 2009 1

FORORD 

NORDTERM 2009 fandt sted ved Institut for Internationale Sprogstudier og Vidensteknologi, CBS, 

Handelshøjskolen i København, den 9.-12. juni 2009 (www.cbs.dk/nordterm2009). Arrangementet 

bestod af et kursus, en konference, en workshop, NORDTERM-forsamlingen og styregruppemøder. 

Kurset varede én dag og blev afholdt tirsdag de n 9. juni, m ens konferencen fandt sted fra onsdag 

den 10. til torsdag 11. juni. Den 12. juni blev de r afholdt workshop, styre- og arbejdsgruppemøder 

samt NORDTERM-forsamling. 

Tema 

Hovedtemaet for NORDTERM 2009 var udarbejdelse og anvendelse af ontologier og taksonom ier, 

især hos organisationer og offentlige myndigheder i de nordiske lande. P.t. er der et stort b ehov for 

terminologer hos det offentlige, hvor bl.a. term inologiske ontologier (begrebssystemer) bliver brugt 

til optimering af it-arkitektur, i d igitale forvaltningssystemer, til af klaring af organisationernes 

terminologi og til meget mere. 

Kurset og de inviterede indlæg på konferencen vedrørte principper for term inologiske ontologier, 

andre typer ontologier, værktøje r og for mater for ontologier sa mt deres anvendelse hos det 

offentlige. 

Til konferencen var der inviteret to foredragsholdere, som holdt følgende indlæg: 

David Markwell (Principal Consultant, CIC Ltd): Making sense of health - the challenge for 

clinical terminology 

Kristian Hjort-Madsen (Finansministeriet, Den Digitale Taskforce): 

Forretningsreferencemodellen FORM 

Herudover blev der indkaldt i ndlæg fra forskere og udøvende te rminologer til konferencen. Som 

sædvanlig var der – ud over hovedtemaet - mulighed for 

indlæg om terminologiarbejde i Norden 

teoretisk orienterede indlæg fra forsknings- og uddannelsesinstitutioner 

praktisk orienterede indlæg fra virksomheder og organisationer. 

Kurset gav en introduk tion til principper for den kendte sundhedsontologi, SNOMED CT (ved 

David Markwell: http://www 1.clininfo.co.uk/snomed) og tilpasni ngen af SNOMED CT til dansk 

(ved Birthe Toft, SDU). Herudover om fattede kurset en introduktion til te rminologiske ontologier 

samt deres anvendels e hos det offentlig e bl.a. som grundlag for klass ifikationer og datamodeller 

(ved Bodil Nistrup Madsen, Hanne Erdman Thomsen og Anna Odgaard, CBS). 

Målgruppe 

Arrangementet samlede terminologer og terminologiinteresserede fra såvel forskningsinstitutioner 

som erhvervsliv og offentlige institutioner i hele Norden. 

Proceedings 

Vi har valgt at opdele proceedings fra NORDTERM 2009 i hhv. trykte og elektroniske proceedings. 

De trykte p roceedings omfatter alle m odtagne abstracts fra konferencen sam t informationer om 

kurset, workshoppen, styregruppemøderne og NORDTERM-forsamlingen. 


Bagest i de trykte proceedings findes en CD med alle modtagne indlæg og præsentationer fra 

konferencen og workshoppen. De elektroniske proceed ings omfatter især de akadem iske indlæg, 

idet ikke alle virksomheder og offentlige myndigheder har benyttet sig af tilbuddet om at publicere 

deres indlæg. Dog findes de fles te af konferencens PowerPoint-p ræsentationer i de elektroniske 

proceedings på den vedlagte CD, som endvidere indeholder abstracts og rapporter fra de trykte 

proceedings. Endelig findes link til både tryk te og elek troniske proceedings på konferencens 

hjemmeside http://www.cbs.dk/forskning/konferencer/nordterm_2009 samt på NORDTERMs 

hjemmeside http://www.nordterm.net/info/public-en.html. 

Arrangementskomité 

Planlægningen blev udført af en arrangementskomité bestående af Bodil Nistrup Madsen og Hanne 

Erdman Thomsen (begge Institut for Internationale Sprogstudier og Vi densteknologi, CBS, Lotte 

Weilgaard og Annelise Grinsted (Institut for Fagsprog, Kommunikation og Infor mationsvidenskab, 

Syddansk Universitet (SDU), Annne mette Wenzel / Lone Bo Sisseck, daglig leder ved 

DANTERMcentret samt Anna Odgaard, projektleder, ved DANTERMcentret, CBS. 

En særlig tak til Mere te Borch fra Institutadm inistrationen i Dalgas Have, IADH, CBS, som har 

bistået med planlægning, afvikling og udarbejdelse af proceedings. 

Sponsorer 

Arrangementet har modtaget støtte fra NordPlus Sprog, Hedord Fonden, FUHU og CBS. 

Bodil Nistrup Madsen og Hanne Erdman Thomsen 


Proceedings 

ONTOLOGIARBEJDE I SUNDHEDSSEKTOREN 

Stefano Testi: Terminologi, Klassifikation, Begreppsmodellering 

Troels Thomsen: Sikring af Datakvalitet ved Hjælp af Ontologier 

Anne-Mette Skou: ’Specialer’ i sundhedsvæsnet i Danmark 

ONTOLOGIER INDEN FOR OMRÅDET BIOMEDICIN OG BIOKEMI 

Damhus, Olesen Larsen, Nistrup Madsen & Zambach: Begrebsafklaring inden for området 

enzymkemi 

Zambach & Nistrup Madsen: Terminologiske ontologier og beskrivelseslogik: Et eksperiment inden 

for domænet enzymkemi 

Nistrup Madsen, Erdman Thomsen, Lassen & Zambach: Insulinontologi til Søgeprojekt 

ONTOLOGIER OG BEGREBSRELATIONER 

Camilla Wiberg Danielsen: Working Towards a Common Danish Upper Ontology 

Cecilia Lind: TNCs arbete med en basordlista – en ontologi med definitioner? 

Anita Nuopponen: Begreppsrelationer som verktyg för begreppsanalysen 

ONTOLOGIER OG DATAMODELLER 

Nistrup Madsen & Odgaard: From concept models to conceptual data models 

SEMANTIK OG SAMMENHÆNG I DIGITAL FORVALTNING 

Lars Johnsen: Interoperabilitet 2.0: Sømløse emnekort i digital forvaltning 

DEN SVENSKE RIKSTERMBANKEN 

Anna-Lena Bucher: Terminologisamordning inom svenska myndigheter. Ny språklag på väg. 

Dobrina & Nilsson: Koll på innehåll igen: Vad har kommit med i Rikstermbanken? 

Peter Svanberg: Från Termdok på cd-rom till Rikstermbanken 

TEORI OG PRAKSIS I TERMINOLOGIARBEJDE 

Birthe Toft: Domænemodellering som grundlag for terminologier og ontologier: 

afgrænsningsproblemet 

Jørgen Burchardt: Personaliseret information 

Henrik Nilsson: Ordningen i redan – om uppräkningar i begreppsbeskrivningar 


TERMINOLOGI OG UDDANNELSE 

Nilsson & Nissilä: TERMDIST: nordisk terminologiutbildning i ljuset av europeiskt utbildningsoch 

certifieringsarbete inom terminologi 

Nissilä & Pilke: Begreppsstrukturer i språkbadselevers ämnesspecifika skriftliga produktion 

Päivi Pasanen: Compiling a Glossary for a Special Language Learning Tool 

TERMINOLOGISK INFRASTRUKTUR OG TERMBASER 

Andersen & Kristiansen: Terminor og Termportalen – nye initiativer for norsk terminologisk 

infrastruktur 

Eija Puttonen: En termbank växer fram: Från kostnadsnyttoanalys via terminologisk analys till 

praktisk tillämpning 

Igor Kudashev: Documentation of Sources in Terminology Management Systems, with Particular 

Emphasis on Collaborative Platforms 

TERMINOLOGI I PRAKSIS 

Jeanette Ørsted: CLS Terminology Adapting to the Needs of the Market 

Grinsted & Erdman Thomsen: Cost-benefit begrebsafklaring 

INFORMATIONSEKSTRAKTION OG INFORMATIONSSØGNING 

Merkel, Foo, Andersson, Edholm, Gidlund & Åsberg: Automatic Extraction and Manual Validation 

of Hierarchical Swedish Patent Terminology 

Seppälä, Hyvönen, Tuominen & Viljanen: ONKI-ontologibiblioteket: tjänster för upprätthållare, 

indexerare och informationssökare 

TERMINOLOGIPROJEKTER 

Susanne Lervad: Etablering af termbase over dragt- og tekstilbegreber 

Torbjørg Breivik: Arbeid med nordiske termer i språkteknologi 

Olesen Larsen & Nistrup Madsen: Forskningsbegreber og terminologi 

KONTRASTIVE ANALYSER 

Mourier & Vesterli: KNowaboUT - A Work-In-Progress Study On How To Fruitfully Combine The 

Theories Of Terminology And Lexicography 

Fumiko Kano: Ontology-based Triangulated Terminology Management 

WORKSHOP: STANDARDISERING AV SPRÅKTEKNOLOGISKE TERMER I NORDEN 


Torbjørg Breivik: Oppsummering – arbeidsseminar om språkteknologiske termer på de nordiske 

språkene 

Karlsson &Nilsson: Språkteknologisk (meta)terminologi – situationen i Sverige 


Terminologi, Klassifikation, 

Begreppsmodellering 

Stefano Testi 

Socialstyrelsen, Sverige 

Abstract. Inom fackområdet vård och omsorg, som innefattar både hälso- och sjukvård och 

socialtjänst, bedrivs i Sverige projekt med sikte på en gemensam nationell informationsstruktur 

och ett nationellt fackspråk. Socialstyrelsen har regeringens uppdrag att driva dessa projekt. För 

att uppnå dessa mål krävs olika metoder. Terminologiarbete används för att reda ut begreppen 

inom fackområdet i fråga. Begreppsmodellering används för att visa hur begreppen i en viss 

verksamhet eller process relaterar till varandra och kan resultera i underlag till en 

informationsmodell. För statistiska ändamål och för att underlätta sökandet och användandet av 

information behövs klassifikationer. Denna artikel vill visa på att många blandar ihop de tre 

metoderna, men att de bör hållas isär och användas för sina respektive syften. 

INLEDNING 

Inom fackområdet vård och omsorg, som innefattar både hälso- och sjukvård och 

socialtjänst, bedrivs i S verige projekt med sikte på en gemensam nationell 

informationsstruktur och ett nationellt fackspråk. Socialstyrelsen har regeringens 

uppdrag att driva dessa projekt. För att uppnå dessa mål krävs olika metoder. 

Terminologiarbete används för att reda ut begreppen inom fackområdet i fråga. 

Begreppsmodellering används för att visa hur begreppen i en viss verksamhet eller 

process relaterar till varandra och kan resultera i underlag till en informationsmodell. 

För statistiska ändamål och för att underlätta sökandet och användandet av information 

behövs klassifikationer. Det är viktigt att hålla isär metoderna och använda dem för 

sina respektive syften. 

Denna artikel vill visa på att många blandar ihop metoderna, vad de har för syften 

och vad de ska användas till. Artikeln är skriven utifrån en terminologs perspektiv och 

kommer inte att beskriva terminologiläran utan visa exempel på sammanblandning. 

Eftersom problemen kan skilja sig mellan de nordiska länderna är det svenska 

förhållanden som beskrivs, dessutom begränsat till fackområdet vård och omsorg. 

När det gäller terminologiarbete gentemot klassifikation är det inte helt ovanligt att 

personer som söker i Socialstyrelsens termbank undrar varför de inte hittar samma 

information som i t.ex. ICF (Klassifikation av funktionstillstånd, funktionshinder och 

hälsa). Det händer också att klassifikationer används som om de vore uppslagsverk 

eller termlistor. 


TERMINOLOGIARBETE OCH KLASSIFIKATION 

Skillnaden mellan terminologiarbete och klassifikation kan kortfattat uttryckas på 

följande sätt: Terminologiarbete syftar till att undvika tolkningstvister och 

missförstånd genom att reda ut och definiera begreppen inom ett fackområde samt ge 

lämpliga termer till b egreppen. Klassifikation syftar till a tt underlätta sökandet och 

användandet av information genom att gruppera, indela eller inordna objekt eller 

individer i olika klasser, för statistiskt ändamål. 

Terminologiska definitioner finns oftast inte i k lassifikationer. Vissa 

klassifikationer, som ICF och ICD-10 (på svenska Klassifikation av sjukdomar och 

hälsoproblem, KSH97) har någon form av beskrivningar, som i klassifikationen i fråga 

ibland kallas för definitioner. Dessa beskrivningar ska ses inom ramen för 

klassifikationen eller klassifikationens delområden. När det gäller kriterier, alltså det 

som avgör att något ska klassificeras som just det, hänvisas man nästan alltid till 

medicinsk sakkunskap (böcker, artiklar, forskningsfynd). 

I den svenska versionen av ICD-10 står följande under rubriken ”Klassifikation och 

inte nomenklatur”: Genom klassifikationens breda användning inom sjukvården blir 

dess språk och terminologi av betydelse för det medicinska fackspråket. Det förtjänar 

dock understrykas att det här primärt är fråga om en statistisk klassifikation och inte 

en nomenklatur, dvs. en förteckning över riktiga eller rekommenderade beteckningar 

eller termer. Klassifikationens språk är sålunda inte bindande för formuleringen av de 

diagnoser som anges i patientjournaler eller annan medicinsk dokumentation. 

Klassifikationer har följaktligen ett annat syfte än att definiera begrepp inom ett 

fackområde. Klassifikationen ICF används till exempel för att kunna klassificera 

funktionstillstånd och olika typer av funktionsnedsättningar, bland annat utifrån vad en 

person kan eller inte kan göra. ICF består av fyra huvudavsnitt, kroppsfunktioner, 

kroppsstrukturer, aktivitet och delaktighet samt omgivningsfaktorer. Varje avsnitt är 

indelat i kapitel, som i sin tur kan vara ytterligare underindelade. 

Terminologiskt skulle man kanske definiera begreppet ”äta” ungefär så här: inta 

fast eller flytande föda via munnen med hjälp av något verktyg. I ICF hittar man ”att 

äta” i kapitel 5 Personlig vård i avsnittet Aktiviteter och delaktighet, se figur 1 nedan. 

FIGUR 1. Exempel från ICF (avkortat). 


ICF är uppbyggd efter en hierarkisk struktur men det handlar snarare om klasser 

eller kategorier än om begrepp. Att klä sig och att äta tillhör båda kategorin personlig 

vård (som kan ses som en rubrik i sammanhanget), men man skulle knappast 

terminologiskt definiera ”att äta” och ”att klä sig” utifrån det överordnade begreppet 

”personlig vård”. Beskrivningen i ICF till ”att äta” lyder Att genomföra samordnade 

uppgifter och handlingar för att äta mat som serveras, att föra maten till munnen och 

konsumera den på ett kulturellt acceptabelt sätt, skära eller bryta maten i bitar, öppna 

flaskor och burkar, använda matbestick, äta sina måltider till fest och vardags. Denna 

beskrivning innehåller kännetecken som inte har med begreppet äta att göra, till 

exempel skära eller bryta maten i bitar, öppna flaskor och burkar, äta sina måltider 

till fest och vardags. Här handlar det om en beskrivning i sitt sammanhang, man får 

tänka sig ett scenario där man ska kunna bedöma vad en person kan. Kan personen 

öppna en burk eller skära maten? I avsnittet Kroppsfunktioner finns ”funktioner vid 

intagande av föda” i kapitel 5 Matsmältnings- och ämnesomsättningsfunktioner och 

endokrina funktioner, se figur 2 nedan. 

FIGUR 2. Exempel från ICF (avkortat). 

Beskrivningen till ”funktioner vid intagande av föda” lyder Funktioner som hänger 

samman med att inta och hantera fasta eller flytande ämnen till kroppen genom 

munnen. En kombination av vissa av kännetecknen från att äta och funktioner vid 

intagande av föda skulle kunna ge en definition av begreppet ”äta”, men syftet med 

ICF är inte att definiera begrepp utan att kunna klassificera funktionstillstånd. 

ISO-standard 

Inom ISO (International Organization for Standardization) finns en teknisk kommitté 

för hälsoinformatik, ISO/TC 215 Health informatics. En av de standarder som denna 

kommitté har utarbetat heter ISO 17115 1 

Health informatics – Vocabulary for 

terminological systems. Som terminolog blir man nyfiken på vad ett terminologiskt 

system är, eftersom det inte brukar användas som term inom terminologiläran, och en 

ordlista för sådana system låter intressant. I avsnittet Main purposes står det följande: 

1 Jag har utgått från version 17115:2007. 


The principles established by ISO/TC 37 are extended here into a formal system suited 

to health informatics. Eftersom ISO/TC 37 är den tekniska kommitté som arbetar med 

terminologi och andra språkliga resurser så blir man än mer intresserad. I standarden 

finns dessutom en bilaga med utvalda definitioner från ISO 1087-1:2000 

(Terminology work – Vocabulary – Part 1: Theory and application). I bilagan till ISO 

17115 föregås varje termpostnummer av ”A”, som hänvisning till ISO 1087-1. 

Vad är då ett terminologiskt system enligt denna standard? Det finns ingen 

definition av det begreppet, men däremot ett avsnitt med definitioner av olika typer av 

sådana system, nämligen classification, coding scheme, coding system, reference 

terminology och clinical terminology. Definitionen av classification lyder 

exhaustive set of mutually exclusive categories (2.1.4) to aggregate data at a preprescribed 

level of specialization (2.1.3) for a specific purpose 

Som exempel på en klassifikation ges ICD-10. Men som tidigare nämnts står det i 

inledningen till ICD-10 att det här primärt är fråga om en statistisk klassifikation och 

inte en nomenklatur. På vilka grunder är det då ett terminologisystem? 

Reference terminology har definitionen 

set of atomic level designations structured to support representations of both simple 

and compositional concepts independent of human language (within machine) 

med en anmärkning: Reference terminology is designed to uniquely represent 

concepts (A.2.3.1). Om nu terminologi är en uppsättning benämningar som hör till ett 

fackspråk, och ett fackspråk är en språkform som används för kommunikation inom ett 

fackområde, kan man då säga att en referensterminologi är något som är oberoende av 

mänskligt språk? Och vad är egentligen ett sammansatt (compositional) begrepp? 

För att återgå till d efinitionen av classification, den innehåller termen category. 

Figur 3 visar hur termposten för detta begrepp ser ut. 

FIGUR 3. Termposten category i ISO 17115:2007. 

I figur 3 framgår att category är synonym till generic concept. Termen generic 

concept och definitionen av begreppet är i sin tur hämtade från ISO 1087, som på 

svenska inte har någon direkt motsvarighet men som avser ett överordnat begrepp i en 

generisk relation. Det innebär att classification enligt ISO 17115 ä r en uttömmande 

uppsättning av ömsesidigt uteslutande överordnade begrepp i generiska relationer. 

För mig känns det inte riktigt att säga att klass eller kategori skulle vara synonymt med 

överordnat begrepp i en generisk relation. I klassifikationssammanhang väljer man att 


kategorisera efter någon viss egenskap (att klä sig och att äta har man valt att lägga 

under samma kategori i ICF), men begreppsmässigt så ärver ett underbegrepp alla 

kännetecken från överbegreppet. Observera att ISO 1087 inte har med category som 

synonym till generic concept! 

Det finns flera exempel på när ISO 17115 krockar med terminologins terminologi, 

trots att man utgår från denna, till exempel begreppet concept name. Detta begrepp har 

definitionen 

term (A.3.4.3) which uniquely designates a concept (A.3.2.1) within a concept 

system (A.3.2.11) 

Allt som inleds med ett ”A” kommer alltså från ISO 1087. Men en terminolog är 

noga med att skilja mellan term och (egen)namn (där term är benämning för ett 

allmänbegrepp som tillhör ett fackområde medan egennamn är benämning på ett 

individualbegrepp). Att säga att ett begreppsnamn är en term blir ganska förvirrande 

och missvisande. I ISO 1087 oc h i bilagan till ISO 17115 f inns begreppet 

”appellation” med, med synonymen ”name” och definitionen verbal designation of an 

individual concept. 

Terminologiarbete och begreppsmodellering 

Syftena med terminologiarbete respektive begreppsmodellering kan förenklat 

beskrivas som i figur 4 nedan. 

FIGUR 4. Syftet med metoderna. 

Det väsentliga här är vad som är skillnaden mellan ett fackområde och en verksamhet. 

Man skulle kunna se det som att ett fackområde, som till exempel vård och omsorg, 

kan innefatta en mängd olika verksamheter (ambulanssjukvårdens verksamhet i ett 

område kan se annorlunda ut jämfört med ambulanssjukvårdens verksamhet i ett annat 

område, men de tillhör samma fackområde). Ofta är begreppsmodeller ett stöd för att 

utveckla informationsmodeller för en verksamhet. 

I Sverige görs mycket arbete med modellering av olika slag inom vård och omsorg. 

I arbetet med att ta fram en nationell informationsstruktur för vård och omsorg 

utarbetar man process-, begrepps- och informationsmodeller. Själva projektet 

förkortas NI (nationell informationsstruktur) och ett utkast 2 

med bilagor finns 

2 Reviderad begreppsmodell samt informationsmodell för vård och omsorg − Utgångspunkt för fortsatt utveckling av den 

nationella informationsstrukturen. Utkast 3 från projektet Nationell Informationsstruktur (2009-05-18). 


tillgängligt för synpunkter på adress http://www.socialstyrelsen.se/NI. I bilaga 1 till 

detta utkast beskrivs bland annat begreppsmodellering. Där sägs följande: 

Beroende på om målet är att beskriva ett fackspråk eller att göra en 

begreppsmodell för en verksamhet så används olika metoder för begreppsanalys. 

Begreppsanalys i begreppsmodellering syftar till att identifiera begrepp inom en 

verksamhet genom att åskådliggöra dem och deras relationer till varandra. 

Terminologisk begreppsanalys syftar till att identifiera begrepps unika kännetecken 

för att kunna formulera textuella definitioner till begreppen inom ett fackområde. 

I projektet NI är verksamheten vård och omsorg. Men om verksamheten är lika med 

fackområdet borde det inte behövas olika metoder för begreppsanalys utan innehållet i 

begreppsmodell och terminologiskt begreppsdiagram borde överensstämma med 

varandra. Såsom begreppsanalys är beskrivet i bilaga 1 tycks det snarare handla om en 

verksamhetsanalys med fokus på begreppsanvändning och inte en analys av begreppet 

självt. 

Man måste kunna beskriva hur en verksamhet fungerar och vilken information som 

man behöver hålla i verksamheten, men det är inte detsamma som att identifiera och 

definiera begrepp (men för att kunna hålla information om begrepp måste begreppen 

vara utredda). 

Ett annat citat från bilaga 1 lyder 

Ett begrepp förklaras av sina samband till andra begrepp. Ju fler samband ett 

begrepp beskrivs med desto tydligare blir det. 

Ett begrepp blir knappast tydligare ju fler samband det beskrivs med, om inte dessa 

samband är särskiljande gentemot relaterade begrepp. För att definiera ett begrepp 

behöver man identifiera de särskiljande kännetecknen gentemot relaterade begrepp. 

I bilaga 1 finns följande text som förklaring till figur 5 nedan: 

Ett begrepp har flera samband som tillsammans förklarar vad som menas med 

begreppet. Ordet ”person” kan till exempel betyda många saker. Om vi däremot säger 

att ”person äger en bil” så har vi begränsat person till bilägande personer. Om vi 

lägger till ett samband till ”person har konto”, så har vi begränsat person ytterligare 

till ”bilägande personer med konto”. Om man lägger på ett samband till begreppet 

”konto” (till exempel ”konto knutet till oljebolag”) så begränsas inte bara ”konto” 

utan också ”person”. Förklaringen eller beskrivningen (”definitionen”) i detta 

sammanhang blir alltså ”bilägande personer med konto knutet till oljebolag”. 


FIGUR 5. Exempel på begreppsmodell från bilaga 1 till NI:s Utkast 3. 

Det är svårt att förstå syftet med modellen i figur 5 (även om det bara är just ett 

exempel). För det första, kan ”person” verkligen betyda många saker? För det andra, 

vad är det egentligen som ”definieras” i exemplet? Man får inte veta något om 

begreppet person, inte heller om begreppen bil, konto eller oljebolag. Man får veta att 

det kan finnas personer som äger bil(ar) och har konto knutet till oljebolag. Men att 

säga att detta skulle vara en definition är inte lätt att förstå. En definition av vad? I 

vilket sammanhang? På vilka grunder är det en begreppsmodell? Ovanstående 

påminner snarare om en informationsmodell (men utan tillhörande attribut), för att 

hålla information om att någon kan äga bil och ha konto i oljebolag. 

Ytterligare ett citat från bilaga 1: 

Man kan också säga att en subklass är en delmängd av superklassen. Till exempel; 

mängden av alla Kunder är en delmängd av alla Personer eller med andra ord, en 

Kund är också en Person. 

Här känns det som man blandar ihop två saker. Det är referenterna till det 

underordnade begreppet som utgör en delmängd av referenterna till det överordnade 

begreppet. Mängden av alla barrträd är en delmängd av alla träd (på referentnivå), men 

begreppet barrträd är en typ av träd. 

På motsvarande sätt är det en viss person som kan ha olika roller i olika 

sammanhang, inte begreppet person. Terminologiskt skulle man inte säga att till 

exempel hälso- och sjukvårdspersonal och patient är olika typer av begreppet 

personroll, utan av begreppet person. 

Kanske är det denna sammanblandning som gör att exemplet i figur 6 kallas för 

begreppsmodell, trots att individuella roller och personbegrepp inte hålls isär 

(närstående är en typ av person som är en typ av personroll som innehas av fysisk 

person etc.). 


FIGUR 6. Exempel från bilaga 3 till NI:s Utkast 3. 

Detta var en beskrivning av begreppsmodellering. I Sverige tycks inte finnas någon 

klar samsyn om vad begreppsmodellering är och hur en begreppsmodell ska vara 

uppbyggd. 

SLUTSATSER 

Det behöver tydliggöras att en klassifikation och en termbank inte innehåller 

samma typ av information utan har olika syften. 

Det är inte helt lätt att utifrån bilaga 1 till NI:s utkast 3 förstå vilket syfte 

begreppsmodellen har till skillnad från ett terminologiskt begreppsdiagram när 

verksamheten sammanfaller med fackområdet. Här behövs tydligare gränsdragning 

och syftesbeskrivning. 

När det gäller standarder behöver de kvalitetssäkras. Inom området hälsoinformatik 

finns en arbetsgrupp för terminologi, men principerna från ISO/TC 37 tillämpas inte i 

tillräcklig grad. Terminologiska begreppsdefinitioner blandas med beskrivningar av 

informationsmängder (klasser, kategorier). Dessutom är återanvändningen dålig, det 

vill säga varje standard definierar ofta begreppen utifrån själva standardens 

avgränsning i stället för utifrån fackområdet i fråga, vilket gör att det förekommer 

olika definitioner av samma begrepp i olika standarder. 


REFERENSER 

ISO 17115:2007, Health informatics – Vocabulary for terminological systems 

ISO 1087-1:2000, Terminology work – Vocabulary – Part 1: Theory and application 

Klassifikation av funktionstillstånd, funktionshinder och hälsa (2003) (svensk version av International 

Classification of Functioning, Disability and Health, ICF) 

Klassifikation av sjukdomar och hälsoproblem 1997 (KSH97) (version 2009) (svensk version av 

ICD-10) 


Sikring af Datakvalitet ved Hjælp af Ontologier 

Troels Thomsen 

Region Hovedstadens it-stab, Koncern IT 

København (Hillerød) 

Postadr.: Kongens Vænge 2, 3400 Hillerød 

Besøgsadr.: Borgervænget 7, 2100 København Ø 

Mail: tth@regionh.dk 

Abstract. Forudsætningen for genudnyttelse af elektroniske data er strukturerede data. Men 

det er ikke nogen triviel sag at tilvejebringe sådanne data. Det kræver, at grundlaget er begrebsafklaret 

og at data indtastes og lagres i en struktur, der kan behandles maskinelt. Først da kan data 

importeres i eller implementeres i det informationssystem, som de ønskede data skal anvendes 

i. Med eksempler belyses, hvad der skal forstås ved strukturerede data og hvorledes anvendelsen 

af ontologier kan kvalitetssikre en konsistent begrebsstruktur for data som grundlag for fx modellering 

af databaser. 

INDLEDNING 

Deling, udveksling og genudnyttelse af elektroniske data hører man nu efterhånden 

hver dag som den store åbenbaring i sundhedsvæsnet, og ordene har nærmest fået karakter 

af et mantra. 

Men elektroniske data kan ikke nødvendigvis udveksles vilkårligt efter ønske. Der er 

nogle forudsætninger, der skal være opfyldt. Forudsætningerne er ofte noget, der bliver 

glemt i euforien over det perspektiv, som rådighed over og adgang til elektroniske 

data åbner. Men datakvaliteten er afgørende for, hvad data overhovedet kan bruges til, 

og uddata bliver aldrig bedre end inddata!! Derfor er det vigtigt at sikre datakvaliteten. 

Mit fremmeste mål med dette indlæg er at gøre opmærksom på nogle strukturelle 

forudsætninger for at dele eller udveksle data. 

Jeg vil med eksempler fra det virkelige liv i henholdsvis ordbogsverdenen, nemlig 

Retskrivningsordbogen, og i Region Hovedstaden fortælle om, hvordan vi bruger begrebsafklaring 

og efterfølgende opstilling af mini-ontologier til at sikre datakvaliteten 

under udviklingen af nye, kliniske dokumentationssystemer. 

Udgangspunktet for udvikling af dokumentationssystemerne er et klinisk materiale, 

som dækker 34 medicinske specialer, og som er indsamlet i perioden 2004-2007. Materialet 

benævnes Sundhedsfagligt Indhold (SFI) og rummer flere tusinde Word-sider 

opsat i skemaer, se et eksempel i FIGUR 4. SFI rummer i princippet de 10 hyppigst 

forekommende kliniske interventioner inden for hvert speciale, og der er en vis overlapning. 

Sundhedsfagligt indhold handler hovedsageligt om klinisk viden og praksis 

som indhold i informationssystemer. 


Men der hersker ikke nogen ensartet struktur af materialet, og dokumentationsarbejdet 

er sket på et uensartet grundlag. Derfor kræver materialet ikke blot en opdatering, 

det kræver også en begrebsafklaring og sidst, men ikke mindst, en dialog med de 

klinikere, der skal bruge indholdet i et informationssystem, altså slutbrugerne. 

Begrebsafklaring og dennes rolle i processen som middel til kvalitetssikring af data 

beskrives med udgangspunkt i konkret SFI-materiale. Selve arbejdsprocessen og metoden 

belyses med eksempler fra et par medicinske specialer, og der gives tillige et par 

eksempler på forvandlingen fra de oprindelige word-skemaer til mere strukturerede 

data. 

DATAKVALITET 

Når jeg taler om datakvalitet og især sikring af datakvalitet, så er kvalitet her forstået 

som en parameter, man skal definere. Datakvalitet rummer i sig selv ikke noget specielt 

positivt eller negativt, men er neutralt. Så i denne sammenhæng handler det om, at 

data har den kvalitet, man ønsker. Datakvaliteten handler fx om, hvorvidt data er 

strukturerede eller ej. Strukturen fremkommer fx ved, at data lagres i en database, hvor 

der er en beskrevet plads til hver informationstype, man indtaster, så man sidenhen 

kan søge på disse informationstyper. Det kan være navn, adresse, postnummer eller 

systolisk og diastolisk blodtryk. 

Derfor vil brugergrænsefladen, grafic user interface (GUI), ofte rumme begrænsninger 

på, hvilken slags data, der kan indtastes i hvilket felt. 

I det markerede felt kan man således kun indtaste en talværdi: 

FIGUR 1: Udkast til brugergrænseflade til dokumentation af observationer af en patients bevidsthedstilstand, 

Region Hovedstadens SFI. 


Et minimumskrav til såvel inddata som uddata er, at brugerne af data har mulighed 

for at fortolke data ens, så de forstår det samme ved dem. Det kræver så dels, at data er 

definerede og at definitionerne er tilgængelige eller formidlet. Det sidste er en organisatorisk 

opgave, så den vil jeg ikke komme nærmere ind på her. 

Skal man kunne genudnytte data og søge på bestemte datatyper, så kræver det, at 

netop disse datatyper kan genfindes i en genkendelig og reproducerbar struktur. Det 

betyder omvendt, at data skal bringes ind i systemet på en måde, der sikrer genkendelse 

og ønsket struktur, og at de indtastede data er konsistente. 

Man må således ikke skifte mellem at måle blodtryk i hPa og mmHg i samme system. 

Tilsvarende skal man til ordbogsbrug anvende samme ordklassesystem hele vejen 

igennem og ikke skifte mellem et system med otte ordklasser og et system med 10 

ordklasser. 

STRUKTURERET VS. FRI TEKST 

Sammenlign fx en romantekst med en ordbogsartikel. 

Romanteksten er en lang kæde af tekststrenge. Tekst er det eneste, man kan søge, 

og man kan typisk ikke søge på fx ordklasser. Så selv om man har romanen elektronisk, 

kan man ikke søge på fx ordklassen konjunktioner, da de ’elektroniske håndtag’ 

til at identificere ordklasse og konjunktion mangler. Teksten er ikke blevet tagget med 

disse klasser. 

Ideelt set er ordbogsartikler af samme type struktureret ens: 

• cykel sb., cyk(e)len, cykler. 

• cykelanhænger sb., -en, -e, bf. pl. cykelanhængerne. 

• cykelbud sb., -det, -e. 

• cykelbukser sb. pl. 

• cykelhandler sb., -en, -e, bf. pl. cykelhandlerne. 

Strukturen er styret af metadata, som det kan ses af FIGUR 2: (metadata er ikke fuldstændige) 


M 

e 

t 

a 

d 

a 

t 

a 

• cykel sb., cyk(e)len, cykler. 

• cykelanhænger sb., -en, -e, bf. pl. 

cykelanhængerne. 

• cykelbud sb., -det, -e. 

• cykelbukser sb. pl. 

• cykelhandler sb., -en, -e, bf. pl. cykelhandlerne. 

lemma 

ordklasse 

Datakvalitet i kliniske it-systemer 

morfologi 

fleksion 

S t r u k t u r e r e d e d a t a 

FIGUR 2. Uddrag af Retskrivningsordbogen 2001 

numerus 

bestemthed 

Troels Thomsen 

I FIGUR 2 er følgende metadata fremhævet: lemma (=opslagsord), ordklasse, morfologi 

i form af morfologisk element i alternativ stavning og fleksiver for numerus og 

bestemthed. Disse metadata har en indbyrdes rækkefølge og styrer præsentationen af 

data. Det betyder også, at man kan søge på værdierne i disse kategorier i den database, 

de ligger i. Så eftersom data er beskrevet med metadata og metadata er strukturerede, 

har vi strukturerede data. Og hvordan når vi så dertil? 

Først og fremmest ved at holde styr på vores metadata: 

Struktureret inddatering & konsistens 

Metadata Data 

Lemma 

Ordklasse 

Bestemt form, 

sing. 

Bestemt form, 

pl. 

… 

FIGUR 3. Metadata og data 

cykel 

sb. 

cyk(e)len 

cyklerne 

Tilladte værdier 

vb. 

sb. 

adj. 

adv. 

konj. 

præp. 

pron. 

interj. 

num. 


Her er vist et begrænset udfaldsrum også kaldet en værdiliste for de data (værdier), 

der er tilladt i metadatakategorien ’ordklasse’. Ved kun at tillade denne værdiliste, kan 

vi sikre konsistens i inddateringen. Konsistensen sikrer så, at vi kan sammenligne data, 

selvfølgelig under forudsætning af, at vi har fortolket data rigtigt og tilordnet dem de 

rigtige metadata. 

I disse globaliseringstider, hvor der er adgang til store datamængder og hvor behov 

for deling af data, især tænkes her på forskningsdata, er kravet til konsistens i data ultimativ. 

Skal der foretages sammenligninger, skal man have et defineret grundlag at gå 

ud fra. 

Forløbig sammenfatning: 

• Konsistent terminologi betyder, at såvel metadata som data har fastlagte definitioner, 

så både afsender og modtager fortolker samme data ens. 

• Konsistente data gør det muligt, at både afsender og modtager forstår det samme 

ved samme term. 

• Sammenligninger med internationale klassifikationer og terminologisystemer 

gør konsistens i såvel egen terminologi som den internationale ultimativ. 

To eksempler på hvad begrebsafklaring tilfører datakvaliteten 

i sundhedsfaglig applikation 

Udgangspunktet for en stor del af de nye applikationer, vi laver i Region Hovedstaden 

er et materiale, der blev indsamlet i perioden 2004-2007. Over 30 kliniske specialer 

har bidraget til at indsamle klinisk viden, som skal udgøre grundstammen af det sundhedsfaglige 

indhold i kliniske informationssystemer. Der ligger ca. 1200 unikke såkaldte 

standardplaner som udtryk for sæt af kliniske arbejdsgange. For eksempel 

rummer standardplanen Måling af vitale værdier: puls, blodtryk, iltmætning (saturation) 

og respiration, se FIGUR 4 nedenfor: 

Standardresultat 

(S R) 

Puls 

SR 

/værdi 

Frekvens 

(talværdi 

/min) 

SR /værdi SR /værdi 

SR I 

værdi 

Regelmæssig Uregelmæssig Fritekst 

Blodtryk *systolisk *Diastolisk Målt i hvile 

**Målested 

Højre 

arm 

Venstre arm 

Manchetstørrelse** 

(dropdownliste) 

SR Iværdi Kommentar 

aldersrelaterede 

normalværdier 

*(talværdi mmHg)/ (talværdi, 

mmHg) 

grænseværdier angives 

på 

afdelings/specialeniveau 

**Defaultværdi kan angives 

på afdelingsniveau 


*Temperatur Rektalt Øre Oralt Axil Inguen 

*Respirationsfrekvens 

**Saturation 

Sat. målested Finger /Tå 

Uden 02 -tilskud Med O2 

-tilskud 

Uden 02 -tilskud /Med 02tilskud 

***Antal liter O2 

***Antal I 02 

Med 

fugter 

Med 

fugter 

Med Hudsonmaske 

Med Hudsonmaske 

FIGUR 4. Standardplan for måling af vitale værdier, uddrag af: Generel lægelig udredning, objektiv 

undersøgelse, s. 31, SFI Hovedstaden 

* (talværdi, grader celsius) 

* (talværdi/min) 

***(talværdi, 1/min) 

*(Talværdi i 

%)***(talværdi, 1/min) 

Men materialet er ikke nødvendigvis konsistent. Der har ikke ligget en egentlig dokumentationsmodel 

til grund for indsamlingen, og derfor er datakvaliteten ikke altid 

optimal. Så for at fange evt. inkonsistenser eller inkonsekvenser bliver materialet udsat 

for terminologisk behandling. Terminologiarbejdet sker altid på grundlag af de enkelte 

standardplaner, så det er op til terminologen at sikre terminologien på tværs af disse. 

På grund af manglende ressourcer er terminologiarbejdet begrænset til de enkelte 

standardplaner, efterhånden som de inddrages i udviklingsprocessen. Dette sikrer 

imidlertid ikke terminologien på tværs, altså mellem standardplanerne. Derfor er der 

heller ikke sikkerhed for, at terminologien i de nye systemer i sig selv er konsistent. 

Optimalt burde terminologiarbejdet således køre i to spor. Et spor, der tager sig af de 

enkelte planer, og et spor, der tager sig af den samlede terminologi. Hvis man fx skal 

definere blodtryk med typerne systolisk blodtryk, diastolisk blodtryk og middelblodtryk 

i forhold til andre tryk, så skulle man som minimum tage de tryktyper med, som 

er relevante i den kliniske verden. Og det er temmelig mange. Andre eksempler er: 

arterielt tryk, venetryk, osmotisk tryk, ilttryk, partialtryk, hudperfusionstryk og mange 

flere Men så ville man også have både overblik over og beskrivelse af tryktyperne, når 

man når til de de planer, hvori de indgår, og man ville undgå fejl. 

Et eksempel på nogle af uhensigtsmæssigheder fås fra nedenstående eksempel, som 

er en del af den standardplan, der hedder Almentilstand, objektiv undersøgelse: 

Standardresultat 

(SR) 

Psykisk neutral 

Psykisk påvirket 

Opstemt Depressiv Manisk Usammenhængende Psykotisk 

FIGUR 5. Uddrag af standardplanen Almentilstand, objektiv undersøgelse, fra Generel lægelig udredning, 

SFI-Region Hovedstaden 


Det første, der springer i øjnene, er, at der ikke er noget overbegreb for Psykisk 

neutral og Psykisk påvirket, fx Psykisk tilstand. Men måske er de ikke engang sideordnede? 

Det næste er, at de kategorier, der nævnes under Psykisk påvirket, ikke tilhører 

samme aspekt eller inddelingskriterium, og det skaber uklarhed i kategorien Psykisk 

påvirket. 

For at skabe mere klarhed over begrebsrelationerne, er der blevet udarbejdet et begrebssystem, 

se FIGUR 6, hvor begreberne fra FIGUR5 er blevet indarbejdet: 

FIGUR 6. Udsnit af begrebssystemet: Almentilstand_kombi, Region Hovedstadens Begrebsbase 

Som det fremgår af FIGUR 6, indgår der flere begreber i beskrivelsen af psykisk tilstand, 

end der indgår i FIGUR 5. Derimod indgår Psykisk påvirket ikke. Den er heller 

ikke nødvendig, hvis man sætter overbegrebet psykisk tilstand ind. For så kunne man i 

skemaet anvende aspekterne stemningsleje og virkelighedsopfattelse. Så ville begre- 


erne for det første få en reflekteret placering, deres indbyrdes relationer ville være 

klare, og dokumentationen ville blive bedre. 

Imidlertid skal der lige sparkes to sidebemærkninger ind her, og det er for det første, 

at de begreber, der optræder i et givet begrebssystem med det formål at begrebsafklare 

et område, ikke nødvendigvis vil komme til at optræde på en brugergrænseflade. 

Det sker, hvis begreberne ikke er relevante for brugergrænsefladen og dermed dokumentationen 

af et givet område. Men de kan sagtens være nødvendige i et begrebssystem. 

For det andet kan en term i et begrebssystem sagtens have et synonym på en 

brugergrænseflade eller være repræsenteret ved en ikon eller lignende. Det siger ikke 

nødvendigvis noget om, hvordan data faktisk lagres i en database. 

Et andet eksempel er Ekspektoration fra Almentilstand, objektiv undersøgelse, fra 

SFI-standardplanen Generel lægelig udredning. Ekspektoration er det at hoste noget 

op, og ekspektoratet er det, der hostes op. I SFI-materialet forventes Ekspektoration 

dokumenteret ved hjælp af følgende kategorier: 

Standard- 

Resultat/ 

Værdi 

Intet ekspektorat 

Værdi Værdi Værdi Værdi Værdi 

Ekspektoration Klart ekspektorat 

Hvidtskummendeekspektorat 

Ekspektorat Ekspektorat 

med koagler med frisk 

blod 

Purulent Sejt ekspekto- 

ekspektorat rat 

FIGUR 7 Standardresultat for observation af ekspektoration. Uddrag af Generel lægelig udredning, 

objektiv undersøgelse, s. 29, SFI-Hovedstaden. 

Af dette skema fremgår begrebernes indbyrdes relationer ikke klart. Men det må 

formodes, at Intet ekspektorat og Ekspektoration, står i opposition til hinanden. Pudsigt 

er det, at det så ikke hedder Ingen ekspektoration eller for modpolen blot: Ekspektorat. 

Dette ikke mindst, da processen hedder ekspektoration, mens resultatet hedder 

ekspektorat. 

En rundspørge blandt læger og en efterfølgende terminologisk bearbejdelse af disse 

få begreber resulterer i følgende begrebssystem: 


FIGUR 8 Begrebssystemet Modtagelse af patient, Ekspektoration, RegionH’s begrebsbase. 

Som det fremgår af FIGUR 8, er der føjet et begreb til, nemlig skummende ekspektorat. 

Dette fordi det manglede i det oprindelige materiale. Ekspektorater kan antage 

forskellige farver, og der kunne i princippet være anført flere farver, fx ’lyserødt’ eller 

’rosa’, som er almindelige. 

Det ses også, hvilke kombinationsmuligheder systemet åbner for, idet de to begreber 

under aspektet OPACITET er oppositioner ligesom de to begreber under VISKOSI- 

TET. 

Hvad anvendelsen af disse begreber i et informationssystem angår, så er der nu 

klarhed over, hvad der kan kombineres, og dermed hvilke bindinger brugergrænsefladen 

skal rumme. Samtidig opnås klarhed over, hvilke kliniske data der kan struktureres 

hvorledes, så man opnår konsistent inddatering og efterfølgende mulighed for konsistent 

søgning af indtastede data. 

OPSUMMERING 

Jeg håber med dette indlæg at have skabt en forståelse af såvel vigtigheden som 

nødvendigheden af at tænke i at tilvejebringe strukturerede data som grundlag for 

genudnyttelse af data. Men det er ikke nogen triviel sag at tilvejebringe sådanne data. 

Det kræver, at grundlaget er i orden. At grundlaget er i orden, vil sige, at det er begrebsafklaret 

og ligger i en struktur, der kan importeres eller implementeres i det informationssystem, 

som de ønskede data skabes i. 

Optimalt vil det (afhængigt af forholdene) være at anvende en tospors-løsning, hvor 

man på den ene side udarbejder detaljerede (lokale) begrebssystemer, fx blodtryk, og 

samtidig på den anden side detaljerede globale begrebssystemer fx tryk, hvori hele eller 

dele af lokale begrebssystemer efterhånden vil blive repræsenteret, så man med tiden 

får et så fuldstændigt globalt begrebssystem, som det nu er muligt. 


REFERENCER 

SFI-Hovedstaden (2007) http://www.regionh.dk/menu/sundhedOghospitaler/SFI. 

Dansk Sprognævn (2001) Retskrivningsordbogen, Alinea A/S – Aschehoug Dansk Forlag A/S. 

Region Hovedtsadens Begrebsbase, Koncern IT 


’Specialer’ i sundhedsvæsnet i Danmark 

Anne-Mette Skou 

Region Hovedstaden, Koncern IT, Projektafdelingen 

Abstract. Jeg vil i mit indlæg gennemgå resultatet af en undersøgelse af sundhedsvæsnets 

anvendelse af begrebet ’speciale’ – og de specialeopfattelser og specialeklassifikationer, 

sundhedsvæsnet i Danmark opererer med. 

Hvilke specialer findes der? Specialerne er jo på mange måder hele sundhedsvæsnets skelet, 

men min undersøgelse har vist, at der ikke er nogen steder, man kan se det i sin helhed. De 

forskellige dele ligger forskellige steder, og ikke alle passer sammen. Der er næppe nogen i 

sundhedsvæsnet, der ikke mener at vide, hvad et speciale er, og hvilke der findes, men man får 

meget forskellige svar, alt efter hvem man spørger. 

En guidet rundtur. Jeg vil tage konferencens deltagere med på en rundtur og vise, hvad der 

kaldes ’speciale’ og hvordan det, der kaldes ’speciale’, klassificeres i sundhedssektoren med 

eksempler fra en række forskellige kildetyper, fx love og bekendtgørelser, nogle af 

Sundhedsstyrelsens klassifikationer og registre, medicinske selskabers websites, sundhedsfaglige 

råd og Region Hovedstadens hospitalsplanlægning. 

Hvad det drejer sig om. Fx er ’mammakirurgi’ (brystkirurgi) ikke et speciale iflg. lovgivningen 

om uddannelse af speciallæger, men indeholdt i det lægelige speciale ’kirurgi’. Men folk, der 

planlægger, hvilke former for behandling, der skal være på hvilke hospitaler, taler om ’specialet 

mammakirurgi’. Og fx er specialerne ’thoraxkirurgi’ og ’plastikkirurgi’ i lovgivningen om 

uddannelse af speciallæger klassificeret som ’kirurgiske specialer’, mens fx ’øjenkirurgi’ ikke er 

det. 

Én national specialeklassifikation vil være et uvurderligt redskab til forbedring af 

datakvalitet. Pointen – som efter rundturen vil være indlysende - er, at det virkelig vil kunne 

betale sig for sundhedssektoren at gennemføre et nationalt oprydningsprojekt og udarbejde en 

samlet national klassifikation – eller ontologi – et egentligt begrebssystem med termer, 

synonymer, definitioner og øvrige oplysninger i terminografiske artikler. Det vil være et 

uvurderligt redskab i udviklingen af den digitale forvaltning af sektoren - af arbejdet med 

udvikling af de af sundhedsvæsnets it-systemer, der i tabelværkerne anvender klassifikationer af 

specialer og fænomener, der er ’specialespecifikke’ og ’specialerelaterede’. 

HISTORIEN OM ONTOLOGIEN, 

DER IKKE ER UDARBEJDET 


Jeg foretog i foråret en undersøgelse, der viste, at det danske sundhedsvæsen ikke 

har én, samlet specialeontologi. Det overraskede mig, da jeg troede, at udarbejdelse af 

en sådan ville være noget af det første, man ville forestage sig som led i 

digitaliseringen af sundhedssektoren. Dette indlæg giver et lille indblik i – men 

absolut ikke et fuldstændigt billede af – hvilke former for oversigter og 

systematiseringer af ’specialer’, der arbejdes med i det danske sundhedsvæsen. 

Nedenstående gengivelse af mit indlæg indeholder ikke alle plancer, som blev 

præsenteret på konferencen. 

Koncern IT 

Hvilke specialer findes der? 

3 

www.regionh.dk 

Man får forskellige svar på det spørgsmål, alt efter hvor man spørger. Den seneste 

bekendtgørelse 1 om uddannelse af speciallæger indeholder 38 lægelige specialer = 

fagområder, inden for hvilke man kan specialisere sig som læge i det danske 

sundhedsvæsen. Disse specialer er følgende: 

Almen medicin 

Anæstesiologi 

Arbejdsmedicin 

Børne- og ungdomspsykiatri 

Dermato-venerologi (hud- og kønssygdomme) 

1 BEK nr 1248 af 24/10/2007 

https://www.retsinformation.dk/Forms/R0710.aspx?id=105090 


Diagnostisk radiologi (røntgenundersøgelse) 

Gynækologi og obstetrik (kvindesygdomme og fødselshjælp) 

Intern medicin: endokrinologi (medicinske hormonsygdomme) 

Intern medicin: gastroenterologi og hepatologi (medicinske mave-tarm- og leversygdomme) 

Intern medicin: geriatri (alderdommens sygdomme) 

Intern medicin: hæmatologi (blodsygdomme) 

Intern medicin: infektionsmedicin 

Intern medicin: kardiologi (medicinske hjerte- og kredsløbssygdomme) 

Intern medicin: lungesygdomme 

Intern medicin: nefrologi (medicinske nyresygdomme) 

Intern medicin: reumatologi (gigtsygdomme) 

Kirurgi (kirurgiske sygdomme) 

Karkirurgi (kirurgiske blodkarsygdomme) 

Plastikkirurgi (plastik- og rekonstruktionskirurgi) 

Thoraxkirurgi (brysthulens kirurgiske sygdomme) 

Urologi (urinvejenes kirurgiske sygdomme) 

Klinisk biokemi 

Klinisk farmakologi 

Klinisk fysiologi og nuklearmedicin 

Klinisk genetik 

Klinisk immunologi 

Klinisk mikrobiologi 

Klinisk onkologi (kræftsygdomme) 

Neurokirurgi (kirurgiske nervesygdomme) 

Neurologi (medicinske nervesygdomme) 

Oftalmologi (øjensygdomme) 

Ortopædisk kirurgi 

Oto-rhino-laryngologi (øre-næse-halssygdomme) 

Patologisk anatomi og cytologi (vævs- og celleundersøgelser) 

Psykiatri 

Pædiatri (sygdomme hos børn) 

Retsmedicin 

Samfundsmedicin 

Kigger man på Dansk Medicinsk Selskabs website2, får man et andet svar. Dansk 

Medicinsk Selskab, DMS, er ”aktuelt en sammenslutning af 115 danske 

lægevidenskabelige selskaber med 22.883 medlemmer.” 

DMS klassificerer de lægevidenskabelige selskaber i hhv. ’specialebærende’ og ’ikkespecialebærende’ 

selskaber og siger herom: ”Medlemsselskaberne fordeler sig på 38 

såkaldt specialebærende, som varetager de lægevidenkabelige områder der danner 

basis for specialestrukturen jvf. Indenrigs- og Sundhedsministeriets bekendtgørelse 

herom.” 

”De øvrige 77 ikke-specialebærende selskaber repræsenterer lægevidenskabelige 

områder, som er dele af specialerne (enkelte diagnoser eller kliniske områder) eller 

kliniske områder mellem flere specialer. En del af disse områder er eller vil blive 

etablerede som fagområder.” 

Der er 38 specialebærende selskaber, men ikke 38 specialer herunder. Der er to 

selskaber, der tilsammen dækker det, der engang var 2, men i dag et ét speciale, 

nemlig ’ gastroenterologi og hepatologi' . Til gengæld står specialet 

2 Citater fra DMS’s website i denne skriftlige udgave af indlægget er fra 11. august 2009. 

http://www.dms.dk/app/plsql/dms_forside.frz 


’samfundsmedicin’ (som er indeholdt i bekendtgørelsen om uddannelse af 

speciallæger som et ’fagområde’. 

Koncern IT 

37 specialer – 38 selskaber 

samfundsmedicin mangler 

72 (fag)områder 

– herunder samfundsmedicin 

9 


Kigger man i SKS, får man også et andet svar. ’SKS’ er Sundhedsvæsnets 

KlassifikationsSystem, som kan tilgås fra Sundhedsstyrelsens website3. SKS består af 

flere tusinde koder, som brugers til at levere struktureret information til forskellige 

informationssystemer. 

I SKS finder man – under ’specialerelaterede tillægskoder ZN’ - følgende: 

o ZNA 

o ZNAA: de 38 lægelige specialer, der er i ovennævnte bekendtgørelse 

o ZNAB: 55 lægelige specialer efter tidligere bekendtgørelser 

o ZNAC: 11 ’Andre sundhedsfaglige områder’ 

o ZNB: 10 ’Andre sundhedsfaglige specialer’. 

Dvs. i alt 114 koder. Der er ingen oplysninger om, hvad forskellen er på hhv. ’lægeligt 

speciale’, ’andet sundhedsfagligt område’ og ’andet sundhedsfagligt speciale’. 

’Andre sundhedsfaglige områder’ og ’andre sundhedsfaglige specialer’ er hhv.: 

3 http://www.sst.dk/Indberetning%20og%20statistik/Klassifikationer/Hvad_er_SKS.aspx 

http://www.sst.dk/Indberetning%20og%20statistik/Klassifikationer/Hvad_er_SKS/SKS_tabel.aspx 

http://www.medinfo.dk/sks/brows.php 


11 Andre sundhedsfaglige områder, SKS/ZNAC 

Koncern IT 

14 


10 Andre sundhedsfaglige specialer, SKS/ZNB 

Koncern IT 

15 


Kigger man i ’Lov om autorisation af sundhedspersoner og om sundhedsfaglig 

virksomhed’, finder man følgende sundhedsfaglige uddannelser ud over ’læge’. 


Koncern IT 

19 


Et andet sted på Sundhedsstyrelsens website finder man denne liste med 

sundhedsfaglige uddannelser. Den indeholder de samme som loven ovenfor, men har 

flere. Der er også en gruppe, der kaldes ’Øvrigt sundhedspersonale’. 

Koncern IT 

20 



’Øvrigt sundhedspersonale’ rummer 5 sundhedsfaglige uddannelser, der ikke 

forekommer i nogle af de øvrige ovenstående lister. Én af dem, Hospitalsteknisk 

assistent, underinddeles yderligere i specialer. 

Koncern IT 

Koncern IT 

21 


22 



I Region Hovedstadens Hospitalsplan figurerer en række specialer (kaldet både 

’specialer’, ’funktioner’, ’enheder’ og andre udtryk), hvoraf nogle - men ikke alle - er 

lægelige specialer iht. bekendtgørelse herom. Nogle svarer til det, der kaldes 

’fagområde’ af DMS, og enkelte er hverken specialer eller fagområder iht. 

behendtgørelse og DMS. 

Ikke lægelige eller 

tandlægelige specialer iht. BEK’er 

om speciallæger og -tandlæger 

Fagområder iht. dms.dk: 

•Akutmedicin 

•Intensiv medicin 

•Mammakirurgi 

•Børnekirurgi 

•Palliativ medicin 

•Medicinsk allergologi 

Hverken speciale eller fagområde 

Koncern IT 

27 


I hospitalsplanen ses endvidere en række specifikationer eller underinddelinger, der 

ikke ses i nogen af de andre kilder, fx 

• børnekirurgi 

• kirurgi på børn 

• kirurgi på børn < 2 år 

• kirurgi på børn > 2 år 

• mammakirurgi 

• idrætsklinik 

• øjenkirurgi 

Endvidere indeholder hospitalsplanen en række begreber (her vist som udkast til et 

begrebssystem i i-Term), der er udtryk for politisk-organisatoriske aspekter, som 

kombineres med specialerne iht. politiske beslutninger. Man kan fx skelne mellem 

’akut kirurgi’ (= ved ulykker) og ’elektiv kirurgi’ (= planlagte operationer, hvor 


patienterne få en tid). En ontologi, som også indeholder disse begreber, vil tydeligvis 

blive stærkt polyhierarkisk. 

Og så er der også … 

Koncern IT 

29 


Kigger man på hospitalers og hospitalsafdelingers websites, vil man opdage, at der 

er endnu flere ’specialer’ end ovenfor nævnt. 

Koncern IT 

30 



Klassifikationstendenser 

Der er ikke mange klassifikationstendenser – og dem der er, er ikke gennemført. I 

bekendtgørelsen om uddannelse af speciallæger er der to grupperinger: ’intern 

medicinske specialer’ og ’kirurgiske specialer’. Resten af specialerne er anført i 

alfabetisk rækkefølge. 

Koncern IT 

Neurokirurgi? 

Ortopædisk kirurgi? 

Hvorfor er der kirurgiske specialer, 

der ikke er kirurgiske specialer? 

Og som man kan se, er der ikke enighed om den sag! 

1 



Koncern IT 

35 


I hospitalsplanen forekommer begreber, der er overbegreber til de tidligere nævnte 

specialer i hospitalsplanen. Men der findes ikke en egentlig klassifikation. Det er for 

det meste uklart, hvilke konkrete specialer, der hører under hvilke af disse 

overbegreber: 

o somatisk speciale 

o psykiatrisk speciale 

o sygehusspeciale 

o sygehusbaseret lægefagligt speciale 

o klinisk speciale 

o paraklinisk funktion 

o laboratoriespeciale 

o tværgående laboratoriespeciale 

o diagnostisk speciale 

o laboratoriediagnostisk speciale 

o billeddiagnostisk speciale 

o kvinde-barn-speciale 

o hjerte-lunge-område 

o neuro-område 

o neurospeciale 

o intern medicin 

o almen intern medicin 

Alt i alt viste undersøgelsen, at ’speciale’ er en homograf, som anvendes i (mindst) 

4 betydninger. 


1. emne, område, foretagende el. andet som nogen er særlig god til el. har stor 

viden om 

I sundhedsvæsnet: 

a. primært uddannelsesområde, fx lægevidenskab, sygepleje og fysioterapi 

b. gren herunder, fx audiologi (audiologiassistent) 

c. videreuddannelsesområde, fx onkologi, tand-, mund- og kæbekirurgi 

d. gren herunder, fx mammakirurgi, audiologi og trykkammerbehandling 

e. variation, fx hospitalssocialrådgivning 

2. en funktion/funktionel enhed, der varetager opgaver inden for et videnområde, 

fx en ’kirurgisk funktion’, ’elektiv kirurgisk funktion’ eller ’elektiv kirurgi’ 

3. en konkret organisatorisk enhed 

fx ’Kirurgisk Afdeling’ på Hillerød Hospital 

4. et ’samfund’ der kan karakteriseres som en organisme, der består af mange 

forskellige elementer, der lever i indbyrdes overlap og afhængighed og 

gensidig påvirkning, 

”inden for kirurgi siger man, at …” 

Så også her er det vigtigt at vide, hvornår det er vigtigt at vide, hvad man taler om! 


Begrebsafklaring inden for området 

enzymkemi 

Ture Damhus a,b,c , Peder Olesen Larsen d , Bodil Nistrup Madsen e,f and 

Sine Zambach g 

a Novozymes A/S, DK-2880 Bagsværd, tda@novozymes.com 

b Kemisk Forenings Nomenklaturudvalg 

c Sekretær, IUPAC Division VIII 

d Kemisk Forenings Nomenklaturudvalg, pol@webspeed.dk 

e DANTERMcentret, Copenhagen Business School, DK-2000 Frederiksberg, bnm.danterm@cbs.dk 

f Formand for ISO TC 37, SC 3 Systems to manage terminology, knowledge and content 

g Datalogi, Institut for Kommunikation, Virksomhed og Informationsteknologier, Roskilde Universi- 

tet, DK-4000 Roskilde, sz@ruc.dk 

Abstract. Faget og forskningsområdet kemi har en lang tradition for at organisere og standardisere 

– for eksempel navne på kemiske forbindelser i systematisk nomenklatur og grundstofferne 

i det periodiske system. IUPAC (International Union of Pure and Applied Chemistry) har lagt et 

stort arbejde i at samle terminologien for kemiske begreber i the Gold Book, som i dag er tilgængelig 

via Gold Book on-line (IUPAC 2006). Vi har gennemført et pilotprojekt, der har til 

formål at vise, at definitionerne af begreber inden for enzym- og proteinkemi i IUPAC Gold 

Book on-line (2006) kan forbedres, hvis der anvendes terminologiske metoder (jf. for eksempel 

Madsen et al. 2006). Vi foreslår, at der udarbejdes terminologiske ontologier (begrebssystemer) 

som basis for udarbejdelsen af definitionerne af de kemiske begreber. Vi har modelleret eksempler 

fra underdomænerne enzyminhibering og proteinstruktur. Dette har medført en række afklaringer 

og har endvidere afdækket områder for videre udforskning. 

BAGGRUND FOR PROJEKTET 

Videnskabelig kommunikation foregår overvejende på engelsk. Der er imidlertid et 

stort behov for dansk terminologi inden for naturvidenskabeligt sprog: 

• Vi skal kunne undervise på dansk i for eksempel fysik og kemi i folkeskolen 

og gymnasiet. 

• Det skal være muligt at formidle forskningsresultater, produktbeskrivelser 

m.m. på dansk. 

• Danske naturvidenskabsstuderende har brug for danske termer og definitioner 

for bedre at kunne forstå undervisning på engelsk. 

• Medierne (talte, trykte, elektroniske) har brug for et alment accepteret og præcist 

sprog til behandling af videnskabelige emner. 

• Myndighederne skal kunne formulere love og bekendtgørelser og retssystemet 

behandle sager på dansk med videnskabeligt indhold. 


FORMÅLET MED PROJEKTET 

Vi satte os derfor oprindeligt som mål at undersøge mulighederne for at skabe en 

kodificeret dansk kemisk terminologi, i første omgang inden for enzymkemi, og at 

oprette en termbase med dansk og engelsk terminologi, baseret på internationale anbefalinger. 

Som udgangspunkt for dette var det nødvendigt at undersøge eksisterende 

international terminologi inden for enzymkemi. Vores arbejde med dette bekræftede 

vores formodninger om, at det ville være nødvendigt at udarbejde forslag til forbedringer 

og suppleringer af den eksisterende engelske terminologi inden for området, da 

der kunne konstateres en række problemer. Vi har derfor gennemført et pilotprojekt 

med det formål at vise, at de eksisterende definitioner kan forbedres, hvis der anvendes 

terminologiske metoder, ifølge hvilke definitionerne udarbejdes på basis af analyse 

af begrebernes karakteristiske træk og af ontologier (begrebssystemer), jf. for eksempel 

Madsen et al. (2006). 

PROBLEMER I DE EKSISTERENDE OPSLAGSVÆRKER 

Som grundlag for pilotprojektet har vi anvendt følgende opslagsværker: IUPAC Gold 

Book on-line og The Oxford Dictionary of Biochemistry and Molecular Biology, 

ODBMB (2006). 

Vi har konstateret følgende problemer med definitionerne i de eksisterende kilder: 

1. Definitionerne er af og til indbyrdes inkonsistente. 

2. Definitionerne indeholder ofte informationer, som kan betragtes som supplerende 

informationer, hvorved fås lange og mindre klare definitioner. 

3. Definitionerne er ikke baseret på en ontologi som viser specificerede relationer 

mellem begreberne. 

4. Uoverensstemmelser mellem IUPAC Gold Book on-line og ODBMB (2006). 

5. I nogle tilfælde hersker der faglig uenighed om definitionerne af et begreb. 

6. De forskellige kemiske grene forstår typisk begreber lidt forskelligt. For eksempel 

forstås begrebet proteinstruktur af røntgenkrystallografer nok ofte som 

koordinaterne i et krystalliseret protein, mens molekylærbiologer måske er mere 

tilbøjelige til at opfatte strukturen som summen af de (til dels mindre stringent 

definerede) strukturelementer, der omtales nedenfor (primær, sekundær 

osv.). 

Vi fokuserer i det følgende på problemet med inkonsistente og lange definitioner, 

der ikke er baseret på en ontologi (problem 1. og 2.) Problemet med inkonsistente definitioner 

kan i mange tilfælde føres tilbage til manglen på klare relationer mellem 

begreberne. 

I Gold Book on-line præsenteres begreberne i såkaldte ”interactive link maps”, 

som er baseret på de links mellem begreber, som findes i forbindelse med definitionerne. 

Der er dog en række problemer med begrebsrelationerne i Gold Book on-line: 

1. Relationstyperne er ikke anført, og det er dermed ikke muligt at skelne mellem 

typerelationer, del-helheds-relationer og associative relationer. 


2. Det er derfor heller ikke muligt at skelne mellem et begrebs overbegreber og 

dets andre relaterede begreber. 

3. Der er således ikke tale om egentlige ontologier, og begrebsrelationerne kan 

ikke anvendes som grundlag for definitioner som opfylder kravet til terminologiske 

definitioner: anførelse af nærmeste overbegreb og adskillende træk. 

I de tre næste figurer vises et interactive link map fra Gold Book on-line, hvor begrebet 

primary structure er det centrale. Figurerne viser tre detaljeringsgrader af det 

pågældende interactive link map. 

FIGUR 1. Interactive link map for primary structure – First level (Gold Book on-line) 


FIGUR 2. Interactive link map for primary structure – udsnit af Second level (Gold Book on-line) 


FIGUR 3. Interactive link map for primary structure – udsnit af Third level (Gold Book on-line) 

Som det fremgår af figur 1 og 2 er der i nogle tilfælde to relationer mellem to begreber, 

markeret med forskellig retning, for eksempel mellem primary structure og 

secondary structure. Men det fremgår ikke, hvilke typer relationer der er tale om. Et 

bud er, at der i forbindelse med definitionen for begge begreber er en henvisning til 

det andet begreb. Figur 3 illustrerer endnu tydeligere, hvor vanskeligt, det er at få forståelse 

for begrebernes sammenhæng og betydning ud af det store virvar af relationer. 


FORSLAG TIL ONTOLOGI OG NYE DEFINITIONER TIL BE- 

GREBER RELATERET TIL MOLECULAR STRUCTURE 

I figur 4 vises et første udkast til en delontologi for molecular structure. Diagrammet 

er fremstillet i begrebsmodelleringsmodulet i-Model, som er en del af terminologi- 

og videnshåndteringsværktøjet i-Term, udviklet af DANTERMcentret. I diagrammerne 

repræsenteres begreberne af bokse indeholdende systematiske notationer og de 

foretrukne termer. For relationerne er der anvendt følgende signaturer: 

FIGUR 4. Første udkast til ontologi for molecular structure 

Ved en nærmere analyse af begrebernes karakteristiske træk, kunne dette første udkast 

ændres til forslaget i figur 5. De fire niveauer for struktur, primary, secondary, 

tertiary og quaternary structure bliver typisk brugt sammen til at beskrive en struktur. 

Primary structure har den egenskab, at den definerer en sekvens af byggeklodser, 

hvilket for proteinstruktur er rækkefølgen af aminosyrer. Dette gør, at dette begreb 

adskiller sig fra de tre andre begreber ved at repræsentere en del af konstitutionen 

(constitution) af en molekylær struktur snarere end en del af konformationen (conformation). 


De karakteristiske træk er anført i form af trækspecifikationer under begreberne, for 

eksempel LEVEL: sequence of building blocks til begrebet primary structure. Boksene, 

som grupperer underbegreber til et begreb, indeholder inddelingskriterier (anført 

med versaler). Figur 5 er ufuldstændig, og der er udeladt nogle begreber i forhold til 

figur 4. 

FIGUR 5. Nyt udkast til ontologi for molecular structure 

I figur 6 vises definitionerne for de tre begreber primary structure, secondary structure 

og tertiary structure i hhv. ODBMB og Gold Book on-line. Endvidere vises de 

karakteristiske træk, definitioner og kommentarer, som er udarbejdet i forbindelse med 

pilotprojektet og indlæst i databasen. 


Concept Definition from ODBMB Definition from Gold Book 

on-line 

primary 

structure 

secondary 

structure 

tertiary 

structure 

The first order of complexity 

of structural organization exhibited 

by polypeptide and protein 

molecules, and by polynucleotide 

and nucleic-acid molecules. 

When applied to a segment 

of a polypeptide chain, or to a 

polypeptide or protein molecule, 

it refers to the linear sequence 

of the amino-acid residues 

of the polypeptide 

chain(s), without regard to 

spatial arrangement, apart from 

configuration at the α-carbon 

atoms (and excluding positions 

of any disulfide bonds). 

Arrangement of the polypeptide 

structure into locallyorganised, 

hydrogen-bonded 

structures, in particular αhelices 

and β sheets 

The level of protein structure 

at which an entire polypeptide 

chain has folded into a 3-D 

structure. The tertiary structure 

results from interactions between 

amino-acid residues that 

may be widely separated in the 

primary structure, but may be 

brought into proximity by the 

folding of the polypeptide 

chain. 

In the context of macromolecules 

such as proteins, 

constitutional formula, 

usually abbreviated to a 

statement of the sequence 

and if appropriate crosslinking 

of chains. 

The conformational arrangement 

(α-helix, βpleated 

sheet, etc.) of the 

backbone segments of a 

macromolecule such as a 

polypeptide chain of a protein 

without regard to the 

conformation of the side 

chains or the relationship to 

other segments. 

The spatial organization 

(including conformation) of 

an entire protein molecule 

or other macromolecule 

consisting of a single chain. 

Characteristic 

feature 

LEVEL: 

sequence of 

building blocks 

LEVEL: 

localised structure 

LEVEL: 

entire molecule 

Definition proposal based on 

the concept diagram and 

comments 

sequence of building blocks in a 

linear macromolecule, such as 

the sequence of amino acid 

residues in a polypeptide chain 

part of the conformation of a 

polypeptide (or other macromolecule) 

specifying the internal 

spatial arrangement of individual 

backbone segments 

without regard to the conformation 

of side chains or the 

relationship to other segments 

Comment: The segments are 

typically organised via hydrogen 

bonds. Examples of secondary 

structure elements are 

α-helices and β-pleated sheets in 

polypeptides. 

FIGUR 6. Eksempler på definitioner fra ODBMB, Gold Book on-line og forslag til nye definitioner 

De to definitioner af primary structure fra hhv. ODBMB og Gold Book on-line adskiller 

sig mht. om cross-linking kan betragtes som en del af primary structure. 

part of the conformation of 

an entire polypeptide (or other 

macromolecule consisting of a 

single chain) specifying the 

spatial arrangements of all 

backbone segments relative to 

each other 

Comment: The tertiary structure 

results from interactions between 

amino-acid residues that 

may be widely separated in the 

primary structure, but may be 

brought into proximity by the 

folding of the polypeptide 

chain. 


Derudover er definitionerne for de tre begreber primary structure, secondary structure 

og tertiary structure udformet forskelligt. Definitionerne i ODBMB indledes med 

hhv. 'first order of complexity of structural organization,' 'arrangement of ... structure' 

og 'level of structure'. Gold Book on-line har heroverfor 'constitutional formula ... abbreviated 

to sequence', 'conformational arrangement' og 'spatial organization'. 

Ifølge terminologiske principper skal definitioner af sideordnede begreber, som har 

samme overbegreb, indledes med netop dette overbegreb, og derefter skal de adskillende 

træk anføres. Hvis der er tale om en del-helheds-relation, kan der anføres det 

nærmeste helhedsbegreb. 

Dette princip er overholdt for de to sideordnede begreber secondary structure og 

tertiary structure, som indledes med ’part of the conformation of’, og trækspecifikationen 

for det adskillende karakteristiske træk vedrører i begge tilfælde LEVEL. Disse 

definitioner er således baseret på ontologien i figur 5. Ideelt set bør de karakteristiske 

træk fremgå eksplicit af definitionerne, hvilket vil gøre det lettere for en ikkefagkyndig, 

som skal sætte sig ind i et nyt område, at forstå definitionerne. 

Endelig skal det fremhæves, at definitionerne fra ODBMB indeholder mere end det 

som er nødvendigt for at definere termen. I den database, som er oprettet til pilotprojektet, 

findes disse supplerende informationer i et kommentarfelt. 

Første Udkast til ontologi for inhibition 

Ontologien i figur 7 afklarer forskellene mellem en række underbegreber til begrebet 

inhibition. 

FIGUR 7. Udkast til ontologi for inhibition 


I figur 8 vises definitionerne til de tre begreber allosteric inhibition, substrate inhibition 

og product inhibition. Af figur 7 fremgår det at disse tre begreber adskiller sig 

mht. MECHANISM, og derfor skulle definitionerne for disse begreber fokusere på 

mechanism. Dette fremgår imidlertid ikke af definitionerne fra ODBMB i figur 8, hvor 

de karakteristiske træk fra i figur 7 også er vist. 

Concept Definition from ODBMB Characteristic feature 

allosteric inhibition Any inhibition of an enzyme by 

a negative allosteric effector. 

substrate inhibition The inhibition of an enzyme's 

activity by its substrate by an allosteric 

mechanism. 

product inhibition The inhibition of an enzymic reaction 

caused by increased concentration 

of one or more products of 

that reaction 

MECHANISM: 

the inhibitor binds at a place different 

from the active site 

MECHANISM: 

the substrate itself is the inhibitor 

MECHANISM: 

a product of the reaction is the inhibitor 

FIGUR 8. Definitioner fra ODBMB og tilsvarende karakteristiske træk fra termbasen 

Brud på princippet om adskillende træk 

Ifølge de principper for opbygning af ontologier, som er foreslået i forbindelse med 

udviklingen af en prototype i CAOS-projektet, Computer-Aided Ontology Structuring, 

jf. for eksempel Madsen og Thomsen (2006), skal to sideordnede begreber altid adskilles 

af ét karakteristisk træk. De fire begreber i figur 7, som er underbegreber til 

reversible inhibition, adskiller sig mht. trækket KINETICS, som er et sammensat træk, 

hvis værdi består af to trækspecifikationer med attributterne: MICHAELIS CON- 

STANT og MAXIMUM RATE. 

Dette kan accepteres hvis ontologien primært skal bruges til begrebsafklaring, men 

hvis det nævnte princip skal overholdes, og hvis man vil formalisere ontologier mhp. 

konsistenskontrol skal ontologien i figur 7 ændres. 

Løsningen kan for eksempel være at introducere et niveau af ”kunstige” begreber 

mhp. at opnå polyhierarki. Disse “kunstige” begreber eksisterer logisk set, men er ikke 

leksikaliseret. Dette fænomen er ikke ualmindeligt. 

Nyt udkast til ontologi for inhibition 

I figur 9 introduceres tre begreber, som adskiller sig mht. MICHAELIS CONSTANT, 

og to begreber, som adskiller sig mht. MAXIMUM RATE. På denne måde får de fire 

begreber på det laveste niveau to overordnede begreber (polyhierarki) og dermed arver 

de ét karakteristisk træk fra hvert overordnet begreb. Yderligere forskning inden for 

området enzymkemi kan evt. lede til forslag om andre løsninger. Diagrammet i figur 9 


er anvendt i det forsøg som er udført med implementering af de her nævnte ontologier 

i Protegé vha. OWL-DL, jf. Zambach & Madsen (2009). 

FIGUR 9. Nyt udkast til ontologi for inhibition 


Ud over indførelsen af de ekstra begreber i figur 9 er inddelingskriteriet og trækspecifikationerne 

for de tre begreber allosteric inhibition, substrate inhibition og product 

inhibition ændret. Det der karakteriserer begrebet allosteric inhibition er trækket BIN- 

DING SITE OF INHIBITOR, medens de to begreber substrate inhibition og product 

inhibition adskiller sig mht. INHIBITOR OF PROCESS. Værdierne til trækket ME- 

CHANISM i figur 7 svarede nærmest til hele forklaringer, for eksempel: ’the substrate 

itself is the inhibitor’ på begrebet substrate inhibition. I figur 9 er de ændret til kortere 

formuleringer, for eksempel for substrate inhibition er værdien til INHIBITOR OF 

PROCESS ‘substrate’. Ideelt set bør værdierne i trækspecifikationerne svare til begreber. 

De her nævnte ændringer er ikke gennemdrøftet i projektgruppen, og derfor ikke 

indført i databasen. 

KONKLUSION 

Vores arbejde har identificeret uklarheder og inkonsistenser i eksisterende opslagsværker 

inden for området enzymkemi. Vi har anvendt terminologiske metoder til opbygning 

af ontologier baseret på karakteristiske træk og til udarbejdelse af definitioner, 

og kan konkludere, at der på basis af ontologierne kan udarbejdes korte, klare og 

konsistente definitioner. 

Vi har arbejdet med to afgrænsede delområder, enzyminhibering og proteinstruktur, 

men vi mener at principperne kan anvendes på større områder. 

I vores ontologi for inhibition er nogle af begreberne defineret ved en kombination 

af karakteristiske træk. Dette udfordrer teorien om, at der skal være netop ét adskillende 

træk for hvert begreb i en terminologisk ontologi. Vi foreslår en metode til at undgå 

dette problem (jf. også indlægget ”Terminologiske ontologier og beskrivelseslogik” 

(Zambach & Madsen 2009). 

Vi kan konkludere, at terminologiarbejde bør udføres i et samarbejde mellem kemikere 

og terminologer, og at det er hensigtsmæssigt at anvende et begrebsmodelleringsværktøj, 

som for eksempel i-Model (særligt modul i i-Term). 

Vi foreslår et fælles IUPAC-IUBMB projekt mhp. at udbygge vores resultater og at 

opstille retningslinjer for fremtidigt arbejde. 

ACKNOWLEDGEMENTS 

Annemette Wenzel og Lone Bo Sisseck, begge tidligere medarbejdere ved DAN- 

TERMcentret, deltog i de tidlige faser af pilotprojektet. 


REFERENCER 

i-Term: www.i-Term.dk, Terminologi- og videnshåndteringsværktøj udviklet af DANTERMcentret, et 

dansk terminologicenter på Copenhagen Business School. 

IUPAC Gold Book On-line (2006): Compendium of Chemical Terminology, 2 nd ed. (the Gold Book). 

Redigeret af A. D. McNaught and A.Wilkinson. Blackwell Scientific Publications, Oxford (1997). 

XML on-line corrected version: http://goldbook.iupac.org (2006) created by M. Nic, J. Jirat, B. Kosata; 

opdateringer ved A. Jenkins. 

Madsen, Bodil Nistrup & Hanne Erdman Thomsen (2006): ‘Terminological ontologies and normative 

terminology work’. Proceedings of TSTT 2006 – Third International Conference on Terminology 

Standardization and Technology Transfer. 

ODBMB (2006): The Oxford Dictionary of Biochemistry and Molecular Biology, 2 nd Ed. Oxford University 

Press. Redaktør: Cammack, R. et al. 

Zambach, Sine & Bodil Nistrup Madsen (2009): Terminologiske ontologier og beskrivelseslogik: Et 

eksperiment inden for domænet enzymkemi. Udkommer i Proceedings fra NORDTERM 2009, 11.- 

12. juni, Copenhagen Business School. 


Terminologiske ontologier og beskrivelseslogik: 

Et eksperiment inden for domænet enzymkemi 

b 

Sine Zambach a og Bodil Nistrup Madsen b 

a 

Roskilde Universitet, Universitetsvej 1, Roskilde,Denmark, sz@ruc.dk 

Copenhagen Business School, Dalgas Have 15, Frederiksberg, Denmark, bnm .isv@cbs.dk 

Abstract. I dette indlæg beskriver vi en metode til at formalisere terminologiske begrebssystemer. 

Vores domæne er enzymkemi som vi har arbejdet med, med henblik på at forbedre IUPAC Gold 

book (McNaught et al., 1997). Vi benytter ISO 704 ( 2000) standarden for terminologiske 

principper og formaliserer ontologien ved hjælp af W3C’s anbefalede ontologiformatet, OWL. 

Indlægget diskuterer de formelle egenskaber, som den resulterende ontologi får, samt fordele og 

ulemper ved at bruge OWL til visualisering og modellering. 

INTRODUKTION 

For at fremme anvendelsen af terminologiske begrebssystemer bør de være både 

logisk konsistente og formaliserede. I vores indlæg vil vi præsentere en metode til at 

implementere en terminologisk ontologi inden for området enzymkemi i 

beskrivelseslogik-formalismen. 

Ved terminologiske ontologier, forstår vi ontologier, der er udarbejdet i 

overensstemmelse med de terminologiske principper for udarbejdelse af 

begrebssystemer, som bl.a. er beskrevet i ISO 704 (2000), og som er yderligere 

formaliseret, idet begrebernes karakteristiske træk modelleres vha. formelle 

trækspecifikationer, der består af en attribut og en tilhørende værdi: [ATTRIBUT: 

værdi], jf. Carpenter (1992), Thomsen (1998) og Madsen et al. (2004). Sideordnede 

underbegreber inddeles i grupper vha. inddelingskriterier, som svarer til attributterne i 

trækspecifikationerne. Et begreb må højst have én adskillende trækspecifikation, 

medmindre det indgår i polyhierarki, dvs. at det har to overbegreber. Hvis et begreb 

indgår i polyhierarki, skal de to overbegreber høre til to forskellige inddelingskriterier. 

Som baggrund for eksperimentet anvender vi en ontologi for inhibering (hæmning), 

som vi har udarbejdet i et pilotprojekt, der har til formål at vise, at definitionerne af 

begreber inden for enzym- og proteinkemi i IUPAC Gold Book on-line, McNaught et 

al (2006), kan forbedres, hvis der anvendes terminologiske metoder (jf. indlægget 

”Begrebsafklaring inden for området enzymkemi”, Damhus et al. (2009). Den ontologi 

for inhibering, som er udarbejdet i pilotprojektet, overholder ikke princippet om én 

adskillende trækspecifikation for hvert begreb. Vi har derfor udarbejdet en ny version 

af ontologien, hvor der er introduceret polyhierarki ved hjælp af indførelse af en række 

’kunstige’ begreber, som hører til to forskellige inddelingskriterier, hvorved 


underbegreberne kan arve træk fra to overbegreber, og derved defineres vha. en 

kombination af træk. 

Vi har implementeret denne ontologi både i begrebsmodelleringsmodulet i-Model i 

terminologi- og videnshåndteringsværktøjet i-Term® og i beskrivelsesogik-værktøjet 

Protegé 3.4, OWL DL. 

TERMINOLOGIMODELLERING SOM BASIS 

En terminologisk ontologi er en domænespecifik ontologi, jf. fx kategoriseringen af 

ontologier i (Guarino, 1998). Principperne for terminologiske ontologier er beskrevet i 

fx (Madsen et al. 2004) og er baseret på principperne for begrebssystemer, som 

normalt bruges i terminologiarbejde, fx (ISO 704, 2000). 

I terminologiske ontologier udgøres knuderne af begreber, som defineres ved hjælp 

af begrebsrelationer og karakteristiske træk, der beskriver egenskaberne ved 

individuelle referenter, som hører til et begrebs ekstension. I figur 1 vises et udsnit af 

ontologien for inhibering, som blev udarbejdet i det ovennævnte pilotprojekt 

vedrørende ontologier inden for enzymkemi. I terminologiarbejde anvendes alle typer 

af begrebsrelationer: typerelationer (ISA-relationer), del-helheds-relationer og 

associative relationer, som fx årsagsrelationer. I figur 1 vises del-helheds-relationer 

som kantede linjer, medens alle andre relationer er typerelationer. 

Begrebers karakteristiske træk præsenteres som trækspecifikationer i form af 

attribut-værdi-par (Carpenter, 1992), fx MICHAELIS CONSTANT: increased. På basis 

af disse trækspecifikationer introduceres inddelingskriterier, som giver et godt 

overblik og hjælper terminologen til at udarbejde konsistente definitioner af 

sideordnede begreber, det vil sige definitioner i hvilke de adskillende træk er baseret 

på den samme attribut med forskellige værdier. Inddelingskriterier er i figur 1 og 2 

repræsenteret ved hjælp af bokse med tekst i versaler. 

Et begreb må højst have én adskillende trækspecifikation, medmindre det indgår i 

polyhierarki, dvs. at det har to (eller flere) overbegreber. Hvis et begreb indgår i 

polyhierarki, skal de to overbegreber høre til to forskellige inddelingskriterier, og det 

pågældende begreb defineres ved hjælp af kombinationen af de overordnede begrebers 

karakteristiske træk. 

I diagrammet i figur 1, som blev udarbejdet i det ovennævnte pilotprojekt, er de fire 

underbegreber til begrebet reversible inhibition adskilt med hensyn til trækket 

KINETICS, som er et sammensat træk hvis værdi består af to trækspecifikationer med 

attributterne MICHAELIS CONSTANT og MAXIMUM RATE. Dette strider mod 

principperne for terminologiske ontologier, og hvis vi vil formalisere den 

terminologiske ontologi med henblik på implementering i OWL-DL, bør diagrammet 

ændres. 

En mulig løsning er at introducere nogle ”kunstige” begreber, det vil sige tre 

begreber, som adskiller sig med hensyn til Michaelis constant, og to begreber, som 

adskiller sig med hensyn til Maximum rate. Denne løsning ses i figur 2, hvor de fire 

begreber på det laveste niveau alle har to overordnede begreber og således arver et 


FIGUR 1. Tidlig version af diagrammet Inhibition fra enzymkemiprojektet. 

karakteristisk træk fra hvert af de to overordnede begreber. Logisk set eksisterer de 

fem ”kunstige” begreber, men der er (endnu) ikke leksikaliseret. Yderligere forskning 

inden for området enzymkemi kan lede til en anden løsning. Det er imidlertid 

diagrammet i figur 2, som vi har anvendt til implementering i OWL-DL. 

Diagrammet i figur 1 er et godt udgangspunkt for diskussion mellem terminologer 

og fageksperter med henblik på at opnå begrebsafklaring. Men for at opnå en 

formaliseret beskrivelse, som blandt andet kan anvendes til konsistenstjek, er det ikke 

optimalt. Ideelt set bør attributværdien i en trækspecifikation svare til et begreb, og 

dette er ikke tilfældet i figur 1. Et eksempel er værdien “the substrate itself is the 

inhibitor” i trækspecifikationen til begrebet substrate inhibition. I figur 2 er 

trækværdien blevet ændret til substrate og det adskillende træk er nu INHIBITOR OF 

PROCESS. 

Alle trækspecifikationer kan repræsenteres som en relation mellem to begreber, og 

omvendt: en begrebsrelation kan repræsenteres som en trækspecifikation. Hvis alle 

trækspecifikationer imidlertid er repræsenteret som begrebsrelationer, kan det være 

sværere at få et overblik, da mange af begreberne, som dermed introduceres, ikke 

nødvendigvis er de mest centrale begreber inden for området. 

Når man ser nærmere på trækspecifikationerne for de tre underbegreber, som falder 

ind under inddelingskriteriet MECHANISM i figur 1, kan det ses, at de adskiller sig 

mht. to forskellige træk: BINDING SITE og INHIBITOR OF PROCESS. Dette 

skyldes, at allosteric inhibition defineres med hensyn til binding site, medens 

substrate inhibition og product inhibition adskiller sig med hensyn til inhibitor of the 

process. 


FIGUR 2. Diagrammet Inhibition med ekstra begreber og inddelingskriterier. 

MODELLERING I BESKRIVELSESLOGIK 

Ontologien der er vist i figurerne 3-6 sidst i artiklen er modelleret ved hjælp af 

beskrivelseslogik i OWL-DL ved hjælp af Protegé 3.4. Vi har valgt at bruge dette 

format fordi det bruges til vidensrepræsentation af mange i for eksempel The Semantic 

Web society og fordi det giver mulighed for logisk ræsonnering over relationer og en 

mere kompleks nedarvning end standard databaserepræsentation. Den logiske 

formalisme, beskrivelseslogik, kaldes på engelsk Description Logic og forkortes DL. 

Vi har fulgt den vejledning i navngivning og formalisering som er beskrevet i 

Horridge et al (2004). 

I Protege svarer classes groft sagt til hvad vi har kaldt begreber og object properties 

svarer til begrebsrelationer i i-Term. Desuden findes der en såkaldt datatype property 

der går fra et begreb eller individ til en form for data. Denne datatype property har vi 

valgt til at repræsentere inddelingskriterier, hvor værdien er det adskillende træk. 

Dette er gjort ved at definere datatype = string når en datatype property skal defineres 

i Protegé. 

Implementering i OWL 

For at bygge ontologien i OWL må man starte med at lave et typehierarki med den 

terminologiske ontologi man har modelleret. Begreber svarer her til ”Classes” og man 

kan rykke rundt på begreberne og ændre navnet på dem i Protegé 3.4. 


Hernæst skal relationerne defineres som ”properties” og tildeles egenskaber. Object 

properties kan tildeles for eksempel egenskaber som transitivitet og logiske 

kvantifikatorer og kan hermed have flere egenskaber end datatype properties, hvis 

værdier blot kan nedarves i klassehierarkiet. 

For eksempel er begrebet substrate inhibition fra den terminologiske ontologi, med 

det adskillende træk, INHIBITOR OF PROCESS: substrate formaliseret til class: 

SubstrateInhibition med datatype property: hasInhibitorOfProcess has (value) 

”Substrate”. Denne definition angivet i kategorien ”necessary and sufficient 

conditions” svarende til ækvivalensoperatoren (≡). Dette begreb er vist i figur 4. 

I opbygningen af det føromtalte polyhierarki er for eksempel competitive inhibition 

formaliseret til class: CompetitiveInhibition med MichaelisConstantIncreased og 

MaximumRateUnchanged i kategorien ”necessary and sufficient conditions”. Derved 

får begrebet ikke sin egen datatype property (adskillende træk) men nedarver det fra 

de to overbegreber. Dette begreb er vist i figur 5. Ifølge Horridge et al (2004) bør man 

dog i værktøjer som Protege være varsom med at gøre dette, da begreberne vil fremstå 

som underbegreber to eller flere forskellige steder (i modsætning til repræsentationen i 

fx i-Term). De anbefaler derfor at man nøjes med at skrive det fulde antal adskillende 

træk ned og lade det logiske maskineri i ræsonnerings-programmet holde styr på 

polyhierarkiet (den multible nedarvning). 

Object properties er brugt til at definere del-helhedsrelationen og kan potentielt set 

bruges til alle relationer mellem begreber og individer. Her skal man dog være 

opmærksom på de logiske følger der er i de to kvantorer, ”for alle” ( ∀ ) og ”der 

eksisterer mindst et” ( ∃ ). En definition som: 

Inhibition ⊆ ∃partOf 

. Kinetics 

betyder: for alle forekomster af inhibition eksisterer der en kinetik-instans som 

inhibition er en del af. Havde man i stedet skrevet: 

Inhibition ⊆ ∀partOf 

. Kinetics 

tolker OWL det som: for alle instanser af inhibition og for alle de ting som 

inhibition instanserne er en del af, er det kinetik, inhibition er en del af. Da inhibition i 

princippet godt kunne have en delheds-relation til andre begreber end kinetik, er denne 

formulering dog ikke helt korrekt og man skal være varsom med at bruge den i 

beskrivelses-logiske systemer. ”For alle” ( ∀ ) bruges dog i de såkaldte ”closure 

axioms” som kan anvendes hvis noget alene er definerende. Fx hvis kinetics kun kan 

have inhibition og activation som dele kan det bruges således: 

Kinetics ⊆ ∀( 

∃hasPart. 

Inhibition ∃hasPart. 

Activation) 

Ontologiens egenskaber 

Den resulterende ontologi får den egenskab at den har et minimum af logiske 

operatorer i ”necessary and sufficient conditions” for hvert begreb. Netop det at have 


som mål at definere ét adskillende træk eller alternativt have polyhierarki, hvor to eller 

flere træk ”blot” nedarves, gør at hvert begreb er enkelt defineret. 

Det er desuden på linje med Grubers ”minimal ontological commitment” (1993) 

hvor han foreslår at man forsøger at begrænse hvad der skal siges om de begreber man 

har konceptualiseret i sit begrebssystem. Da hvert begreb skal have et adskillende 

træk, kommer alle begreber til at være såkaldt ”Defined” frem for ”Primitives”. 

Eksempler på beskrivelser for hver ”Class” kan ses i figur 3-5. Typehierarkiet er vist 

i figur 6. 

MODELLERINGSPROCEDURE 

I dette afsnit giver vi et resumé af, hvordan man kan bruge de terminologiske 

modelleringsprincipper sammen med OWL til at konstruere ontologier i 

beskrivelseslogik. 

Terminologimodelleringsprocedure 

1. Find sideordnede begreber der er relateret til et overbegreb. Fx: substrate 

inhibition og product inhibition der er underbegreber til inhibition. 

2. Identificer de karakteristiske træk for de sideordnede begreber. Fx er substrate 

inhibition og product inhibition adskilt med hensyn til hvad der er inhibitoren 

for inhibition-processen. 

3. Hvis begreberne kan adskilles af netop et træk, skal et attribut-værdipar 

introduceres for hvert begreb. Fx: substrate inhibition, INHIBITOR OF 

PROCESS: substrate, 

4. Grupper begreberne ved hjælp af et eller flere adskillende træk. 

5. Hvis det ikke er muligt at adskille begreber ved hjælp af kun ét adskillende 

træk, kan man introducere et ekstra lag af begreber således at de sideordnede 

begreber udgør en del af et polyhierarki. Det vil sige at de karakteristiske træk 

fra to eller flere overbegreber nedarves til underbegreberne. 

Implementering i OWL DL, her i Protegé version 3.4 

6. Definer begreberne som Classes i OWL-DL. 

7. Inddelingskriterierne skal være modelleret som datatype property med værdien 

”string”. 

8. Definer de adskillende træk for sideordnede begreber ved hjælp ækvivalensopratoren 

(≡), hvor streng-værdien er værdien for det adskillende træk. Hvis 

der er tale om et polyhierarki, er det overbegreberne der benyttes som 

ækvivalenter og derved kombinationen af deres adskillende træk der bliver 

definerende for begrebet. For eksempel: SubstrateInhibition ≡ 

hasInhibitorOfProcess has ”substrate”. Eksempler på disse ses i figur 3-5. 


FIGUR 3. OWL-udgaven af begrebet “Reversibel inhibition” modelleret i Protegé. 

FIGUR 4. OWL-udgaven af begrebet “Substrate inhibition” modelleret i Protegé. 


FIGUR 5. OWL-udgaven af begrebet “Competitive inhibition” modelleret i Protegé. 

DISKUSSION 

Resultaterne af vores eksperiment viser, at det er muligt at implementere en 

terminologisk ontologi i Protegé og derved opnå fordele i form af konsistenstjek og et 

populært format. 

Vores implementering er på linje med Grubers ”ontological commitments” (1993): 

”coherence” (sammenhæng), ”extendability” (udvidelsesbarhed), ”clarity” (klarhed), 

”minimal ontological commitment” (minimalt ontologisk indhold) og til dels 

”encoding bias” (ontologien bør ikke være afhængig af et bestemt software). 

Minimalt ontologisk indhold har vi netop opnået ved den modelleringsprocedure vi 

forslår med netop ét adskillende træk. Sammenhængskraft er opnået ved at benytte de 

ontologi-testende ”reasoners” som findes i Protegé, ligesom ontologien i høj grad kan 

udvides. Klarhed er opnået ved at formalisere ontologien i et logisk sprog. På den 

anden side gives der også køb på klarheden ved at bruge netop et formelt sprog som 

ikke er tydeligt læsbart for alle mennesker i lige så høj en grad som for eksempel i- 

Term-implementeringen er det. 

Om ontologien er afhængig af softwaren eller ej kan naturligvis diskuteres. På den 

ene side kan man formelt udnytte de muligheder der er i Protegé optimalt. Men det er 

imidlertid en ulempe ved Protegé, at der mangler en mulighed for at skrive betegnelser 

for begreber, karakteristiske træk og begrebsrelationer i et naturligt sprog, hvilket er 

muligt i et terminologisk orienteret værktøj, som fx i-Term. 


Endvidere er det endnu ikke muligt grafisk at vise inddelingskriterier dynamisk 

under modelleringen i Protegé – der kan blot genereres en graf som den på figur 6, når 

man er færdig med modelleringen. Endelig giver ontologier, som bygger på 

principperne fra terminologiske ontologier, ifølge hvilke et begreb er defineret vha. 

nærmeste overbegreb og ét adskillende træk operationelle fordele frem for ontologier, 

der er defineret med tilfældigt mange træk, som det er tilladt i OWL DL. 

Vi foreslår at modelleringsproceduren der er beskrevet ovenfor skal analyseres 

nærmere og kan være med til at give en mere finkornet ontologimodelleringsmetode 

og formalisering end de standarder, der nu findes i form af for eksempel Methontology 

(Lopez, 1997). 

FIGUR 6. En grafisk repræsentation af typehierarkiet for vores ontologi i Protegé. 

REFERENCER 

Baader, F., Calvanese, D., McGuiness, D.L., Nardi, D. And Patel-Schneider, P.F. editors, 2003. The 

Description Logic Handbook. Theory, Implementation and Applications. Cambridge, UK.: 

Cambridge University press. 

Carpenter, Bob (1992): “The Logic of Typed Feature Structures”. Cambridge, Mass.: Cambridge 

University Press. 

Damhus, T., Olesen Larsen, P. Madsen, B.N. and Zambach, S., 2009. How to work systematically 

towards a consistent and codified chemical terminology – a pilot study. To be published in Chemistry 

International, July 2009. 

Damhus, T., Olesen Larsen, P. Madsen, B.N. and Zambach, S., 2009. Begrebsafklaring inden for 

området enzymkemi. To be published in the proceedings of NORDTERM 2009, June 11-12, 

Copenhagen Business School. 

Gruber, T.R., 1993. Toward Principles for the Design of Ontologies Used for Knowledge Sharing. In 

Formal Ontology in Conceptual Analysis and Knowledge, Kluwer Academic Publishers. 


Guarino, N., 1998. Formal Ontology and Information Systems. In: Formal Ontology in Information 

Systems, Proceedings of the First International Conference , June 6-8, Trento, Italy, 3-15. 

Amsterdam: IOS Press. 

Horridge, M., Knublauch, H., Rector, A., Stevens, R., Wroe, C., 2004. A Practical Guide To Building 

OWL Ontologies Using The Protegé-OWL Plugin and CO-ODE Tools, Edition 1.0, August 27, 

University of Manchester, pp. 1-99. 

ISO 704:2000. Terminology work – Principles and methods. International Organization for 

Standardization, TC 37, Terminology and other language resources (under revision). 

i-Term: http://www.i-Term.dk, 

terminologi- og videnshåndteringsværktøj udviklet af 

DANTERMcentret, Copenhagen Business School. 

Lopez, M.F., Gomez-Perez, A., Juristo, N., 1997. In Proc. AAAI Spring Symp. Series, AAAI Press, 

Menlo Park, pp. 33-40. 

Madsen, Bodil Nistrup, Hanne Erdman Thomsen and Carl Vikner (2004):”Principles of a system for 

terminological concept modelling”. In: Proceedings of the 4th International Conference on Language 

Resources and Evaluation, Vol. I. Lisbon: 15-18. 

McNaught, A.D. and Wilkinson, A., 1997. IUPAC. Compendium of Chemical Terminology, 2nd ed. 

Blackwell Scientific Publications, Oxford. XML on-line corrected version: http://goldbook.iupac.org 

(2006-) 

Protégé: http://protege.stanford.edu/. (2009) 

Stearns, M.Q., Price, C., K.A. Spackman, and A.Y. Wang, 2001. SNOMED clinical terms: overview of 

the development process and project status, in Proc AMIA Symp, pp. 662–666. 

Thomsen, Hanne Erdman. (1998). Typed Feature Structures for Terminology Work - Part II. In: LSP - 

Identity and Interface - Research, Knowledge and Society. Proceedings of the 11th European 

Symposium on Language for Special Purposes. Copenhagen, August 1997. Copenhagen Business 

School, 349-359. 


a 

Insulinontologi til Søgeprojekt 

Bodil Nistrup Madsen a , Hanne Erdman Thomsen a , Tine Lassen b , og 

Sine Zambach b 

Institut for Internationale Sprogstudier og Vidensteknnologi, CBS - Handelshøjskolen i København 

{bnm.isv@cbs.dk, het.isv@cbs.dk}. 

b 

Institut for Kommunikation, Virksomhed og Informationsteknologier, Roskilde Universitet 

{tlassen@ruc.dk, sz@ruc.dk} 

Abstract. I forbindelse med det tværvidenskabelige projekt SIABO (Semantic Information 

Access through Biomedical Ontologies) som omhandler ontologibaseret søgning i tekster om 

insulin, arbejder vi med opbygning af domæneontologier for insulinrelaterede begreber. Vi 

opbygger domæneontologierne som en statisk basis for såkaldt generative ontologier, hvor det 

generative består i at nye begreber kan dannes automatisk ud fra semantiske regler. 

Begrundelsen for at opbygge en egen domæneontologi er at eksisterende ontologier ikke er 

specifikke nok, hverken hvad angår begreber eller hvad angår begrebsrelationer. Ud fra et 

mindre korpus af domænespecifikke tekster har vi udtrukket frekvenslister, og efterfølgende 

genereret nøgleordslister ved sammenligning med et almensprogligt korpus. Ud fra disse er der 

efterfølgende i samarbejde med domæneeksperter udvalgt en mængde centrale begreber 

vedrørende insulinproduktion. Ved anvendelse af principper for terminologiske ontologier har vi 

sikret en klar afgrænsning af begreber, og været i stand til a t identificere entydige 

begrebsrelationer. 

INTRODUKTION 

I forbindelse med det tværvidenskabelige projekt SIABO (Semantic Information 

Access through Biomedical Ontologies) som omhandler ontologibaseret søgning i 

tekster om insulin (patenter, videnskabelige artikler med mere) arbejder vi med 

opbygning af domæneontologier for insulinrelaterede begreber. 

En vigtig del af projektet er en såkaldt generativ ontologi, hvor det generative 

består i at nye begreber kan dannes automatisk ud f ra statiske begreber i en 

skeletontologi samt en mængde semantiske regler. 

I de følgende afsnit gives en introduktion til SIABO-Projektet, en beskrivelse af 

begrebet generative ontologier og en beskrivelse af vores motivation for at opbygge en 

egen domæneontologi samt metoden der er anvendt i opbygningen af samme. Herefter 

beskrives udvalgte eksempler fra domæneontologien og endelig konkluderes der på 

arbejdet med opbygning af en domæneontologi for insulinrelaterede begreber. 


SIABO-projektet 

Dette arbejde finder sted inden for rammerne af SIABO-projektet (Semantic Information 

Access through Biomedical Ontologies). SIABO-projektets overordnede mål 

er at udvikle semantisk baserede søgemuligheder i store tekstsamlinger. 

Projektet er et tværinstitutionelt projekt med deltagere fra Danmarks Tekniske 

Universitet (DTU), Copenhagen Business School (CBS), Roskilde Universitet (RUC), 

samt en industriel partner, Novo Nordisk. Projektet er støttet af Det Strategiske 

Forskningsråd, Programkomiteen for Nanovidenskab og -teknologi, Bioteknologi og 

IT (NABIIT) 

I takt med at volumen af tekstsamlinger vokser overalt i samfundet, bliver konventionel 

nøgleordsbaseret søgning mere og mere utilstrækkelig. Projektet søger derfor at 

udvikle en tilgang til søgning der bevæger sig ud over en sådan konventionel nøgleordsbaseret 

søgning, hvor der søges indholdsbaseret ved hjælp af ontologier. Vi ønsker 

specifikt at udvikle metoder til o ptimering af søgning i s tore samlinger af tekst 

indenfor domænet ‘biomedicin’. Til dette formål anvender projektet såkaldt generative 

ontologier, som tillader indeksering af tekster i forhold til sammensatte begreber som 

afspejler tilsvarende komplekse lingvistiske udtryk. 

Generative ontologier 

En ontologi er en formalisering af en fælles forståelse af begreber og relationer 

mellem dem inden for et domæne, og er som udgangspunkt statiske modeller. En 

vigtig del af projektet er en generativ ontologi, hvor det generative består i at nye 

sammensatte begreber kan dannes automatisk ud fra semantiske regler. Generative 

ontologier er baseret på statiske ontologier, der er ordnet efter inklusionsrelationen 

‘isa’ – denne del kalder vi for skeletontologien. f.eks.: 

FIGUR 1. Udsnit at en skeletontologi, der viser en sti af isa-relationer fra begrebet 'secretion' til 

topbegrebet 'entity' 


Ontologien bliver generativ ved tilføjelse af en mængde semantiske relationer, 

f.eks. AGENT, PATIENT, RESULT, eller specialiseringer af disse, f.eks. ACTIVITY- 

AGENT, ACTIVITY-PATIENT, INSTRUMENT-RESULT, samt muligheden for at 

danne sammensatte begreber ved attributering: 

secretion[ACTIVITY-RESULT:insulin] 

FIGUR 2. Det sammensatte begreb secretion[ACTIVITY-RESULT:insulin], og dets placering i den 

generative ontologi. 

Dette sammensatte begreb afspejler det begrebsmæssige indhold i de sproglige 

udtryk: 

• secretion of insulin 

• insulin secretion 

• release of insulin 

• insulin is being secreted 

• etc … 

Motivation 

Vi opbygger domæneontologierne som en statisk basis for den generative ontologi. 

Begrundelsen for at vi selv opbygger domæneontologien, er at eksisterende ontologier, 

som f.eks. UMLS (Unified Medical Language Systems), ikke er specifikke nok, hverken 

hvad angår begreber eller hvad angår begrebsrelationer. 

Som en yderligere motivation for arbejdet, vil Novo Nordisk kunne bruge domæneontologien 

og en tilhørende termbase som intern videnbase. 


METODE 

Terminologiske ontologier 

Vi arbejder med terminologiske ontologier, det vil sige vi baserer strukturen på 

karakteristiske træk og inddelingskriterier som beskrevet i (Madsen et al., 2005), hvor 

vi bruger et udbygget sæt af begrebsrelationer, f.eks. ACTIVITY-AGENT, 

ACTIVITY-PATIENT, INSTRUMENT-RESULT (se Madsen et al., 2002). 

Karakteristiske træk 

Karakteristiske træk afspejler fælles egenskaber ved entiteter som hører til de relevante 

begrebers ekstension. Der kan være et stort antal af sådanne egenskaber. I takt 

med at vores viden om et begreb øges, kan der knyttes flere og flere karakteristiske 

træk til d et. Det er dog klart at disse træk ikke alle vil være lige vigtige for 

afgrænsningen af det pågældende begreb i forhold til andre begreber. 

Vi arbejder med to typer karakteristiske træk: 

• Adskillende træk 

• Ikke-adskillende træk 

Vi antager at det ikke er nødvendigt at knytte mere end ét adskillende træk til et 

begreb. Dette betyder at vi går ud fra en hypotese om at et adskillende træk repræsenterer 

en nødvendig og tilstrækkelig betingelse for at kunne adskille et begreb fra andre 

begreber. Hvis det findes nødvendigt at knytte mere end ét karakteristisk træk til et 

begreb (dvs. at hvert af trækkene betragtes som nødvendige, men at ingen af dem i sig 

selv er tilstrækkelige), kan dette være et tegn på at der er ”huller” i begrebssystemet. 

Disse ”huller” fyldes ud ved at tilføje relevante overbegreber på passende steder i 

begrebssystemet. 

Inddelingskriterier 

Et inddelingskriterium under et begreb er en attribut som anvendes i en trækspecifikation 

på et af begrebets underbegreber. Et inddelingskriterium er altså en attribut 

hvis mulige værdier tillader at skelne mellem nogle af det pågældende begrebs underbegreber. 

Et eller flere inddelingskriterier under et begreb kan udpeges som inddelende inddelingskriterier, 

dvs. inddelingskriterier der kan bruges i definitionerne af nogle af det 

pågældende begrebs nærmeste underbegreber. Begrebet process har underbegreberne 

inhibition og stimulation, hvor inddelingskriteriet er ’INFLUENCE ON OTHER 

PROCESS’, jf. figur 3. Dvs., vi kan definere inhibition som en type process som har 

en negativ indflydelse på andre processer. 


Figur 3 viser et udsnit af en domæneontologi for en delmængde af termerne der er 

fundet i vores diabetes-domænekorpus. Figuren viser inddelingskriterier samt karakteristiske 

træk, samt en mapning til andre ontologiressourcer for visse begreber. 

FIGUR 3. Udsnit af domæneontologi for en delmængde af termerne der er fundet i det anvendte 

diabeteskorpus. 

Identifikation af begreber 

Der er taget udgangspunkt i et mindre korpus af domænespecifikke tekster hvorfra 

der er udtrukket frekvenslister med weirdness-scores (cf. Gillam, 2004). På baggrund 

af frekvenser i vores korpus sammenlignet med frekvenser i British National Corpus 

(BNC), er der beregnet weirdness-scores for alle ord der forekommer i teksterne. På 

baggrund af disse weirdness-scores, er der efterfølgende genereret nøgleordslister, og i 

samarbejde med domæneeksperter fra Novo Nordisk er de mest centrale begreber 

vedrørende insulinproduktion blevet udvalgt. 

Et weirdness-score er et statistisk mål for hvor tæt på/forskelligt fra distributionen 

af et givent ord i en given tekstsamling er i forhold til distributionen i et referencekorpus. 

Det beregnes på baggrund af frekvens af en given term samt antallet af 

løbende ord i hhv. et almensprogligt korpus og et domænekorpus: 


Hvor NGLer antal løbende ord i et referencekorpus (typisk et almensprogligt 

korpus), NSLer antal løbende ord i domænekorpusset, fSLer frekvens af ordet i 

domænekorpusset og fGLer frekvens af ordet i referencekorpusset. 

Jo højere et ords relative frekvens er i et domænekorpus i forhold til den relative 

frekvens i et referencekorpus, jo højere weirdness-score. Jo mere ens distributionen i 

de to korpora er, jo tættere på 0 tilnærmes weirdness-score. 

Vi benytter i det følgende eksempel det almensproglige korpus BNC, som består af 

~85.000.000 tokens som referencekorpus, og et korpus bestående af Medline-abstracts 

på ~17.000.000 tokens som domænekorpus. 

Eksempel: 

Ord: hyperglycemia 

f BNC = 0 

f Medline = 676 

weirdness = (85.000.000*676)/((1+0)* 17.000.000) = 3442 

Ord: become 

f BNC = 67.219 

f Medline = 6.528 

weirdness = (85.000.000*6.528)/((1+67.219)*17.000.000) = 0,49 

Tabel 1 Nøgleordskandidater baseret på højeste weirdness-scores for ord i en eksempeltekst: 

‘Chapter 2: The Pancreatic Beta Cell’ (Eisenbarth) 


I ovenstående beregninger af weirdness scores for de to ord hyperglycemia og 

become, ser vi at hyperglycemia scorer relativt højt, og at become scorer relativt lavt. 

Vi kan udlede af dette, at distribibutionen for hyperglycemia i de to korpora er meget 

uens , svarende til at ordet er en nøgleordskandidat, og at distributionen for become er 

tæt på at være ligelig, svarende til at ordet ikke er en nøgleordskandidat. 

I Tabel 1 ses en nøgleordskandidatliste dannet på baggrund af højeste weirdnessscores 

for ord i et lille korpus bestående af en tekst om beta-celler. 

ONTOLOGI FOR INSULINPRODUKTION 

Der eksisterer en række tilgængelige ontologiressourcer som dækker det relevante 

domæne i større eller mindre grad. Vi benytter imidlertid ikke disse ressourcer direkte 

som domæneontologier i forbindelse med søgning, men benytter dem udelukkende 

som referenceværker i forbindelse med vores modelleringsarbejde. Vi giver herunder 

eksempler på forskelle imellem vores behov og det som en given eksisterende 

ressource, UMLS, indeholder. 

Problemerne ved eksisterende ressourcer som UMLS i forhold til vores behov 

består bl.a. i: 

• Manglende sammenhæng mellem forskellige delressourcer 

• Manglende dækning (langt fra alle diabetesrelaterede begreber findes) 

• Ikke altid dækkende termvariantmængder 

• Ikke-dækkende relationssæt 

• Ingen inddelingskriterier eller trækspecifikationer 

Figur 4-6 illustrerer udsnit af UMLS-ressourcer som inkluderer begreber der er 

identificeret som domænebegreber via vores domænekorpus: 

• Inhibition 

• Stimulation 

• Stimulation of insulin secretion 

Termen inhibition findes ikke tilknyttet et begreb i UMLS, men ved nærmere 

eftersyn findes et begreb med samme begrebsmæssige indhold, nemlig negative 

regulation of biological process, som illustreret i Figur 4. Der mangler altså en 

termvariant knyttet til begrebet. Begrebet eksisterer i delressourcen Gene Ontology, 

men kan ikke knyttes sammen med begreber i andre delressourcer da en mapning 

mellem de enkelte ressourcer ikke findes. 


Figur 4 Udsnit af UMLS-delressourcen Gene Ontology indeholdende begrebet ’negative 

regulation of biological process’ 

Ligeledes findes termerne stimulation og stimulation of insulin secretion ikke tilknyttet 

et begreb i UMLS, men det begrebsmæssige indhold er dækket af begreberne 

positive regulation of biological process og positive regulation of insulin secretion 

også i Gene Ontology, som illustreret i Figur 5 og Figur 6. 

FIGUR 5. Udsnit af UMLS-delressourcen Gene Ontology indeholdende begrebet ’positive 

regulation of biological process’ 


FIGUR 6. Udsnit af UMLS-delressourcen Gene Ontology indeholdende begrebet ’positive 

regulation of insulin secretion’ 

KONKLUSION 

Ved at benytte principper for terminologiske ontologier, har vi været i stand til at opbygge 

en domæneontologi for insulinrelaterede begreber, hvor der er en klar afgrænsning 

af begreber og entydige begrebsrelationer samt mapning til eksisterende ontologiressourcer 

for domænet. Med dette resultat kan vi levere et velfunderet stabilt grundlag 

for den generative ontologi. 

REFERENCER 

Gillam, L. (2004): Systems of concepts and their extraction from text. Unpublished PhD thesis,. 

University of Surrey. 

Madsen, Bodil Nistrup; Bolette Sandford Pedersen & Hanne Erdman Thomsen (2002): ”Semantic 

Relations in Content-based Querying Systems: a Research Presentation from the OntoQuery 

Project”. In: K. Simov and A. Kiryakov (Eds.): Ontologies and Lexical Knowledge Bases. 

Proceedings of the 1 st 

International Workshop, OntoLex 2000. OntoText Lab., Sofia. Pp. 72-82 


Madsen, Bodil Nistrup; Hanne Erdman Thomsen, Carl Vikner (2004): ‘Comparison of Principles 

Applying to Domain Specific versus General Ontologies’. In: Alessandro Oltramari, Patrizia Paggio, 

Aldo Gangemi, Maria Teresa Pazienza, Nicoletta Calzolari, Bolette Sandford Pedersen, Kiril Simov 

(eds.): OntoLex 2004: Ontologies and Lexical Ressources in Distributed Environments. ELRA, 

2004, pp. 90-95 

George S. Eisenbarth (editor): Type 1 Diabetes: Cellular, Molecular & Clinical Immunology, Online 

Edition Version 3.0: http://www.uchsc.edu/misc/diabetes/books/type1/type1.html 


Working Towards a Common Danish Upper 

Ontology 

a 

Camilla Wiberg Danielsen a 

National Board of Health, Health Documentation, Denmark, Terminologist. 

Abstract. More and more domains within the public sector start developing domain specific 

concepts. As the work progresses the domains realize that they share a need for the same very 

general concepts. Therefore the development of a co mmon national upper ontology seems to 

come closer. This paper describes the ontology work in the Danish Health Care Service where a 

domain specific upper ontology has been developed which could be the starting point for a 

common national upper ontology. Advantages and challenges of creating a co mmon national 

ontology will be discussed. 

ONTOLOGY WORK IN THE DANISH HEALTH CARE SECTOR 

In 2004 The National Board of Health in Denmark started to work with ontologies 

in order to define central concepts from the information model for electronic health 

care records that was then being elaborated. 

The work was defined in the National IT strategy 2003-2007for the Danish Health 

Care Service that stated “The National Board of Health is in charge of establishing a 

widely anchored organization whose purpose it is to evaluate and develop concepts in 

the health care service. Through a database, these will be made available to all 

activities relating to analysis and development in the healthcare service.” 

The result of this initiative was that a national concepts council for health care was 

established, a database with an interface that is accessible for the public was developed 

and a secretariat that supports the work was set up. 

The actual work defining the concepts is being carried out in work groups that work 

within specific health care related sub-domain for instance ‘medicine’, ‘examination’ 

or ‘administrative concepts’. The National Concepts Council was responsible for 

appointing members for work groups so that the members of the single work group 

would be subject matter experts that represent a broad range of special interest groups. 

The delivery of a work group is a concept system with definitions and terms as well as 

other relevant information about the concepts. When work is finished within a subdomain 

the concept system with definitions and other information about the concepts 

is send out into public hearing and the hearing comments will be adapted into the 

concept system. Finally the council would approve the concept system or perhaps ask 

for further development before approving the work. 

In 2008 a Council for Content Standards was established in Denmark and The 

National Concepts Council was closed down. The work of defining central health care 


concepts now refers to The Council for Content Standards but is mainly being carried 

out as before this organizational change. 

The work that is being carried out within this frame is using terminological working 

methods and principles that are in accordance with ISO 704 and a handbook for 

terminology work in the Danish Health Care Service has been written to support the 

work and the participants in the work groups. 

Do we need to define concepts within the public sector? 

Especially the very central concepts within a sector or domain are very often the 

most difficult to write one common definition for. The reason for this is that they are 

already defined in a range of ways in accordance with use in specific situation. It 

seems, however, that there is an increasing acknowledgement of the fact that a 

common understanding and a uniform way of applying concepts and terms is 

necessary within the public sector. 

Also the increasing need for operability and interoperability within systems that 

collect and exchange data has made the need for common understanding of concepts 

explicit. When we implement IT systems, report or collect data there is a need for 

common, structured and detailed terminology. 

We now have many separate systems that work well but with the development of 

these an immense amount of coding and registration has followed that is now a burden 

to the employees in the public sector. To ease this and to facilitate the exchange of 

data and the development of new systems ontology work is a major issue. 

The Danish Health Care Ontology 

Since we started working with the Danish health care ontology nine workgroups 

have developed ontologies within as many sub-domains. These are: 

• Administrative concepts 

• Clinical process 

• Medication 

• Quality concepts 

• Adverse events 

• Information security 

• Disease prevention, health promotion and population health status 

• Examination concepts 

• Clinical pathways 

Of course the number of concepts treated within each sub-domain varies, but each 

work group has collected and defined approximately fifty concepts. 

While defining concepts within the single work group it became obvious that some 

concepts were common for more or all groups. To avoid that these concepts were 

defined by more groups and to make sure that there would be only one common 


viden 

definition of these concepts it was decided to establish a special group to define these 

concepts: 

• General concepts 

Typically the concepts that the sub-domains would send on to this special group 

would be very general concepts that were super-ordinate to concepts within the subdomain, 

but were not really a part of the sub-domain. Also concepts that were used in 

definitions, but were of a more common type would be treated by this group. The 

group would of course also use the common principles for the terminology work in the 

Health Care Services stated in the handbook and the result should be a concept system. 

In order to create a coherent concept system it was necessary to add some concepts to 

the ontology. In this way the work was driven by the need of the sub-domains and was 

not developed in order to describe “everything in the world” as is often the case of 

upper ontologies. 

The National Concept Work for the Danish Health Care Services can now present 

an ontology that consists of: 

• One layer called the upper ontology 

This layer contains concepts like activity, object, factor, occurrence 

• One layer containing general health care concepts 

The concepts described are for instance health condition, ill, health sector 

• One layer made up by 9 ontologies each dealing with a sub-domain 

These will describe concepts like direct patient examination, dose, patient 

pathway 

proces 

konsekvens 

aktivitet 

forudsætter 

objekt 

resultat adfærd proces 

begivenhed 

aktør 

faktor 

indsats 

metode 

oprindelse 

resulterer i 

fører 

til 

formål 

sigter imod 

specificerer 

tidsmæssig 

afgrænsning 

forløb 

mål handling 

udføres af udføres af 

tidsmæssig 

udstrækning 

redskab 

hensigt 

hændelse 

ulykke 

deltager i 

virkning 

målgruppe 

individ 

entitet 

rolle livsform 

repræsentation afgrænsethed ordning 

kan være 

person 

består af 

gruppe af 

individer 

består af 

formål 

primærsektor 

art 

samfund 

grafisk 

dokument 

organisation 

består af 

samfundssektor 

område 

sundhedssektor 

dokumentation 

består af 

information 

sekundærsektor 

forandring 

tegn 

data 

medlemstype gruppe 

model 

arketype 

system 

formalisering formål ensartethed 

sundhedsvilkår 

FIGURE 1. UML diagram showing the upper ontology and the general health concepts in the ontology 

for the Danish Health Care Service 

omfatter 

påvirkning 

sundhedsramme 

område 

domæne 

indvirker på 

ramme struktur 

befinder sig i 

afgrænsethed 

domæne 

objekt relation 

kvalitet 

egenskab 

ramme sund 

helbred 

sundhedsvæsen 

begreb 

forbinder 

begrebsrelation 

formål 

område 

rask 

helbredskvalitet 

syg 

supplerende 

træk 

funktion 

helbredsstatus 

beskrivelse formål 

specificerer 

kontekst 

usund 

helbredspotentiale 

sygdom 

tilstand 

adskillende 

træk 

differentiering 

karakteristisk 

beskrives med 

træk 

normativ 

beskrivelse 

informativ 

beskrivelse 

mål 

sundhed 

virkefelt 

formål 

intentionalitet 

udstrækning 

forstyrrelse 

trækspecifikation 

består af 

standard 

instruks 

vejledning 

helbredstilstand 

består af helbred 

sundhedstilstand 

folkesundhed 

indvirker på 

udstrækning 

attribut 

attributværdi 

indvirker på 

inddelingskriterium 

specificerer 


A COMMON NATIONAL ONTOLOGY 

The concept modeling within the health care sector has been going on f or 

somewhat longer than in most other sectors and no ot her sector has an equivalent 

concept system describing general concepts. 

Within resent years more and more public institutions have shown interest in 

defining concepts and more and more show interest in creating a common upper 

ontology. Also there is a common acknowledgement, that is seems sensible to take an 

offset in the health care upper ontology. 

Advantages 

The development of a common national upper ontology would have a number of 

advantages for the ontology work in all sectors. 

• The single sector will not develop its own sector specific upper ontology and 

create similar concepts with different definitions 

• It will be easy for new domains to attach their concepts or concept systems to 

concepts in the upper ontology 

• It is much easier to see what concepts you miss in the concept system when you 

have a fairly well developed concept system 

• Defining this type of concepts is not easy as very often the same term is well 

established in different sectors for concepts that are defined slightly different. 

However, having well defined concepts makes it much easier to see where you 

do not agree and need to define another concept that is in accordance with the 

specific use in a specific sector 

• The community of people working with ontologies in the public sector in 

Denmark is very small. Therefore, it is a great advantage, if we can share our 

knowledge and experiences and thus share the work load. 

Challenges 

Working together on a common ontology across sectors will of course also give 

some challenges: 

• In the work that has been made within the health sector one of the biggest 

challenges has been to make definitions that are both short, exact and 

understandable for a wide range of uses 

• To sort out, separate or agree upon c ommon definitions for concepts behind 

well integrated terms in different sectors will be difficult 

• To establish the resources that is needed for the work to be carried out will be a 

major challenge 

• To establish the governance that is needed in order to host the common 

ontology and to secure the dissemination of the definitions will be a challenge. 


How to proceed from here 

At the moment the National Concept Work for the Danish Health Care Services is 

reviewing the current upper ontology. As work in the sub-domains progresses it has 

become clear, that some of the descriptions of the concepts in the top levels of the 

health care upper ontology are too difficult to understand. Therefore the group has 

reassembled to review the definitions and especially to add comments and examples to 

better describe the concepts. This work will be finished in the autumn of 2009. At the 

same time the definitions will be translated into English in order to have a basis for 

collaboration internationally. When the review is finished the work will be send out in 

public hearing. 

A group of people working with concept definitions in the public sector 1 

Denmark has started to meet every second to third month. The aim of these meeting is 

to share knowledge and experiences by sharing the concept work within each sector. 

There is a great interest within this group to develop a common national ontology, but 

there is also a great lack of resources for this type of work. One of the group’s 

initiatives is the establishment of a forum for discussion on the internet. On this forum 

both members of the public sector as well as other interested parties can discuss the 

concept work in the public sector. 

A very important issue for The National Concept Work for the Danish Health Care 

Services is that the common work is based on the use of standards including ISO 704 

Principles and Methods and ISO 1087 Terminology Work, Vocabulary. 

On the homepage of The National Concept Work for the Danish Health Care 

Services http://begrebsbasen.sst.dk/ there is a link for the Handbook for Terminology 

Work in the Danish Health Care Service. 

Also a common format for exchange of data will have to be discussed in order to 

share and store definitions and relations between concepts. 

Finally a common public storage, distribution and governance of the concepts will 

be needed in order to secure that the work is developed, stored and distributed in a 

way that makes it used throughout the sectors. 

REFERENCES 

Bodil Nistrup Madsen (1999). Terminologi, principper og metoder, Gads Forlag. 

ISO (2000). ISO 1087-1, Terminology work – Vocabulary – Part 1: Theory and application 

ISO (2001). ISO 704, Terminology work – Principles and methods 

National Board of Health (2005). Håndbog i Begrebsarbejde, del 1: Principper, Sundhedsstyrelsen. 

1 Central Customs and Tax Administration, Danish, Government IT Services, Danish Institute for Quality and Accreditation in 

Healthcare, Danish Prison & Probation Service, Digital Health, Local Government Denmark, National Board of Health, National 

Board of Social Services, National it and telecom agency Denmark, The Capital Region of Denmark, The Police 

NORDTERM 2009, København 9.-12. juni 2009 75 

in

National Board of Health (2006). Håndbog i Begrebsarbejde, del 2: Metoder og arbejdsforløb, 

Sundhedsstyrelsen. 


TNCs arbete med en basordlista – 

en ontologi med definitioner? 

Cecilia Lind 

Terminologicentrum TNC, Västra vägen 7 B, SE-169 61 Solna, Sverige, 

+46 8 446 66 03, cecilia.lind@tnc.se 

Abstract. Genom att fastlägga fackspråkliga betydelser hos ord som förekommer frekvent i 

många olika fackspråk, så skapar man en grund för formulering av entydiga definitioner, vilket 

är en förutsättning för terminologiarbete med kvalitetsanspråk. Detta har TNC arbetat med i 

olika omgångar ända sedan 1941 (då TNC bildades). Det senast publicerade materialet i TNCs 

basordsarbete är ordlistan Tekniska basord som kom 1995. Den ordlistan koncentrerades kring 

tekniska basord och hade en preliminär prägel; det sägs i förordet att den skulle fungera som en 

remissutgåva och läsarna uppmanades att inkomma med synpunkter. På sin webbplats uppmanar 

nu TNC intresserade personer att inkomma med förslag till basord som behöver preciseras. År 

2006 sökte och fick TNC ett bidrag från Marcus och Amalia Wallenbergs stiftelse för att åter 

bearbeta och precisera betydelsen i ett antal basord. Arbetet påbörjades samma år. 

Utgångspunkten har varit Tekniska basord men omfånget har vidgats och omfattar nu 

ämnesområden utanför tekniken, t.ex. organisation, förvaltning och dokumentation. Varje basord 

– eller term – som definieras, grundas på belägg, excerpter, ur ett stort antal källor, 

huvudsakligen från det material som finns i TNCs interna termdatabas. Men även från mer 

allmänt material, som Nationalencyklopedin och Wikipedia, har belägg hämtats. Under arbetet 

har följande problemtyper visat sig: olika uppfattningar om ett ords betydelse; begreppskluster 

där det kan vara svårt att avgöra var gränserna mellan begreppen går och vilka; relationer som 

gäller mellan begreppen; vanligt förekommande termer som sällan förklaras eller där begreppen 

bakom termerna är svårfångade; termen förekommer inom många olika områden och där i 

(något) olika betydelse. Terminologiarbetets bärande princip, att utgå från begreppet och inte 

termen, visar sig vara till stor hjälp också i arbetet med att precisera basord som används inom 

flera fackområden. Det finns företeelser som begreppsmässigt är ”maskiner” men som benämns 

”apparater” och vice versa. Givetvis kan man inte göra mycket åt väl etablerade termer men man 

kan ha nytta av basordens definitioner när man vill benämna nya föremål. Att välja en term som 

entydigt svarar mot begreppet underlättar förståelsen och är i vissa fall eftersträvansvärt i 

terminologiarbete. 

UTVECKLINGEN AV EN TERMINOLOGISK BASORDLISTA 

På Nordterm i R eykjavik 1995 be rättade Lars Törnqvist från Tekniska 

nomenklaturcentralen om sitt arbete med Tekniska basord och under Nordterm 2009 i 

Köpenhamn fick deltagarna höra om Terminologicentrum TNCs arbete med 


evisionen av Tekniska basord. Revisionen har inneburit ett horisontellt 

terminologiarbete på en övergripande begreppsnivå för att definiera termer som 

behövs för att förklara termer på lägre nivåer. För att kunna definiera skruvmejsel så är 

det lämpligt att ha definierat verktyg osv. 

DEFINIERA PÅ ÖVERGRIPANDE NIVÅ 

Målet med Basorden är att formulera definitioner som kan fungera inom många 

flera olika områden; gärna så många som möjligt. Detta har lett till a tt många 

definitioner har vidgats och att många insnävningar har tagits bort i jämförelse med 

den äldre upplagan. Det har vi kunnat göra eftersom kärnegenskaperna ofta är 

desamma även när en term förekommer inom flera ämnesområden men i lite olika 

betydelse. De begrepp som inkluderas i Basord bör ligga högt upp i 

begreppshierarkierna. En svårighet har dock varit urvalet av termer och begrepp; att 

hamna på ungefär samma horisontella nivå i begreppshierarkierna. 

NYTT OMFÅNG – NY TITEL 

Det är Gunnel Johansson som leder revisionen och som har lagt upp arbetet. 

Begreppen i boken har delats in i avsnitt med besläktade begrepp. Nya områden, som 

t.ex. organisation och dokumentation har tillkommit även om de tekniska termerna 

ännu är i majoritet. Arbetsnamnet har därför ändrats till Basord eftersom området nu 

utvidgats utanför det rent tekniska. Vi är väl medvetna om att ordet basord är TNCjargong 

för facktermer som kan förekomma inom flera fackområden och ännu är den 

slutliga titeln på ordlistan inte fastställd. (Basord används inom lexikografin i en annan 

betydelse.) 

PROBLEM I DE HÖGRE HIERARKIERNA 

Den här artikeln kommer att behandla olika typer av problem som vi stött på under 

arbetet, t.ex. problem med avgränsning, svårfångade begrepp och begrepp där antingen 

fackexperterna har olika uppfattning om begreppet bakom termen eller där det finns 

små begreppsskillnader mellan närliggande ämnesområden. Varje term som definieras 

grundas på belägg, excerpter, ur ett stort antal källor, huvudsakligen från det material 

som finns i TNCs interna termdatabas. Men excerpter har även hämtats från mer 

allmänna källor, som svenska Nationalencyklopedin och Wikipedia. 

SVÅRUTREDDA KOMPLEX 

Vid en första anblick kan en grupp närliggande begrepp verka lätta att förklara och 

enkla att skilja från varandra. Men vid en närmare granskning kan det visa sig att det 

inte är så enkelt att hitta de särskiljande kännetecknen. Gränserna mellan begreppen 


visar sig vara otydliga och ibland verkar det som om begreppen delvis överlappar 

varandra. Vari ligger t.ex. skillnaden mellan maskin, apparat, instrument och verktyg? 

Man får akta sig för att ta för mycket fasta på uttryckssidan eftersom t.ex. det som 

begreppsmässigt är en maskin kan kallas apparat, och vice versa. 

Ett annat exempel på två begrepp som kan vara svåra att skilja åt är teknik och 

metod. Problemet är av samma slag som det ovan beskrivna. Varför säger man t.ex. 

skidåkningsteknik men vallningsmetod? 

Ett tredje exempel är begreppen energi, arbete och effekt inom fysik. Dessa begrepp 

definieras ofta med hjälp av varandra. Man får ett antal yttre cirklar. Det blir svårt att 

välja ut ett av begreppen och hitta en självständig definition. Det är tydligt att energi är 

ett så pass komplext begrepp att det inte går att definiera utan cirkeldefinition och en 

lösning är att undvika att definiera energi och därmed utgå ifrån att begreppet är 

självklart i sitt sammanhang. 

TEKNISK DEFINITION SAKNAS MEN ALLMÄNSPRÅKLIG 

FINNS 

I vissa fall saknas en teknisk vetenskaplig definition, men det går att finna 

förklaringar i mer allmänspråkliga källor. Begreppen antas förmodligen vara så 

självklara inom sitt fackområde att de inte har definierats där. Atom är ett exempel på 

term med få eller inga fackspråkliga definitioner. TNCs interna termdatabas, som 

innehåller ca 265 000 termposter och många fler termer, ger en enda träff, visserligen 

från en vederhäftig källa, TNC 90 K ärnenergiordlista, men ändå endast en träff. 

Dessutom saknas det ordböcker på svenska inom ämnesområdet fysik. Atom förklaras 

däremot i de mer allmänspråkliga källorna Nationalencyklopedin och Wikipedia. Det 

leder till att de allmänspråkliga källorna får procentuellt stort inflytande över TNCs 

definitionsformulering så vida vi inte går direkt till experterna. 

Ett annat exempel är termen elementarpartikel som saknas helt i T NCs interna 

termdatabas. Det verkar dessutom finnas en äldre, mer etablerad, skola och en nyare 

skola när det gäller vad som bör räknas som elementarpartiklar och hur dessa kan 

indelas. Vilket synsätt ska man då redovisa i ordlistan? Vi valde att redovisa synsättet 

från den äldre skolan eftersom det nya inte tycktes ha vunnit genomslag i s amma 

omfattning. 

SVÅRFÅNGADE BEGREPP 

Olika termer kan stå för mycket likartade begrepp. Detta gäller t.ex. lag, formel och 

sats inom naturvetenskap. Det har varit omöjligt att hitta särskiljande kännetecken 

med hjälp av excerpterna och därför har vi antagit att lag och sats är synonymer, som 

t.ex. i Ohms lag och Pythagoras sats. 


MÅNGTYDIGHET 

Ett annat problem har varit mångtydigheten hos vissa termer. Hur många av dessa 

betydelser bör redovisas i en ordlista av detta slag? Bör man ta med flera betydelser av 

en sådan term än vad som egentligen är berättigat, enbart för att få en mer fullständig 

bild? Vi har sett två typer av mångtydighet nämligen homonymi inom och mellan 

fackområden samt mångtydighet i excerpter. Det senare avser att samma begrepp 

förklaras olika i olika excerpter. När det gäller homonymi inom samma fackområde så 

har vi ställts inför frågan om vilka begrepp som är relevanta för Basordens målgrupp. 

Har det funnits en gemensam kärna så har vi försökt hitta den och formulera en 

övergripande definition i enlighet med den horisontella begreppstanken. 

HOMONYMI 

Lite extra svårt blir det när en term står för flera begrepp inom samma 

ämnesområde. Då måste man bli mer precis när det gäller insnävningstexten, dvs. i 

vilket fackområde begreppet förekommer. Det räcker då inte att t.ex. ange "(inom 

matematik:)". Exempel på en sådan term är bas inom matematik. Här finns minst tre 

olika betydelser inom tre underområden: 

(inom geometri:) sida som valts ut i samband med areaberäkning; 

(i en potens:) det tal eller uttryck som upphöjs till något, t.ex. talet a i a²; 

(i ett positionssystem:) positivt heltal som anger antalet möjliga värden som varje 

sifferposition kan anta. 

Termen bas förekommer dessutom i andra betydelser inom ett flertal andra 

ämnesområden. 

AVSAKNAD AV ENTYDIGHET 

Excerpterna som använts som underlag för definitionerna har ibland visat på 

avsaknad av en entydig bild. Inte så sällan pekar excerpterna ut ett antal olika 

överordnade begrepp. Det kan då bli svårt att välja den relevanta överordnade termen 

för definitionen. Någon gång har vi dessutom valt en annan överordnad term än de 

som förekommer i excerpterna. Vi har då tyckt att excerpterna inte har lyckats fånga 

det centrala i begreppet. Ibland kan infallsvinkeln vara olika i olika excerpter. Man 

beskriver samma begrepp men utifrån olika perspektiv. Det gör att begreppet kan få 

olika kännetecken i olika excerpter. Det är då inte så lätt att hitta begreppets kärna. Till 

exempel kan kon o ch cylinder definieras olika beroende på om man ser det strikt 

matematiskt eller utifrån ett mer allmänt perspektiv. Strikt matematiskt kan en kon 

eller cylinder ha vilken basyta som helst medan en mer allmän uppfattning är att den 

ska vara cirkulär. Koner och cylindrar är dessutom oändliga enligt en strikt 

matematisk definition, men i de flesta fall ses de som begränsade. 


ARDETETS UPPLÄGGNING 

Tekniska basord var indelad i fackområden t.ex. brand och ytbehandling. Inför 

revisionen har vi valt en annan indelningsgrund som delvis är ämnesoberoende och 

mer övergripande: 

1. Egenskaper 

2. Processer, operationer 

3. Tillstånd, förhållanden 

4. Ämnen, material 

5. Produkter, varor 

6. Mekaniska och elektriska föremål 

7. Storheter, enheter 

8. Bygg och anläggningar 

9. Övriga fenomen och företeelser 

10. Organisation 

11. Dokumentation 

Den gamla upplagan bestod av 1 462 antal termer och är i skrivandes stund uppe i 1 

592 poster. 

Jämfört med Tekniska basord har drygt 200 termposter plockats bort eftersom de 

ansetts för smala eller inte längre aktuella. I stället har ca 330 nya begrepp tillförts. 

Vissa ämnesområden, t.ex. kemi och dokumentation, var tidigare dåligt 

representerade. Revidering har till största delen skett inom TNC. Vi har då litat till den 

fackkunskap som TNCs medarbetare besitter. Experter har självfallet tillfrågats där 

intern kunskap saknats. 

VAD HÄNDER SADAN? 

Efter en första genomgång krävs att hela materialet läses igenom och ensas. Detta 

kommer att innebära ett stort arbete. Den nya upplagan kommer att ingå i 

Rikstermbanken och kommer eventuellt också i tryckt upplaga. Basorden kommer att 

vara under ständig revidering eftersom begreppen kan förändras över tid och mellan 

fackområden. Genom Rikstermbankens kommentarfunktion finns en möjlighet att 

kommentera termposterna direkt till sekretariatet via webben. Det är en möjlighet för 

allmänheten att påverka Basordens innehåll. 

NYTTAN MED FACKSPRÅKLIGA BASORD 

Man kan idag inte göra så mycket åt väl etablerade termer som ursprungligen inte 

är så väl valda men för framtida termval kan man ha nytta av basordens definitioner. 

Att välja en term som entydigt svarar mot begreppet underlättar förståelsen och är 

eftersträvansvärt i terminologiarbete. Basorden kan förhoppningsvis också göra det 

lättare att välja en korrekt överordnad term vid skrivning av definitioner. När 

översättare måste skapa en ny svensk term för ett begrepp som saknar en etablerad 

sådan har även de nytta av att begreppet beskrivs med hjälp av en korrekt överordnad 

term. 


Som det ser ut i dag kan den nya titeln bli Tvärvetenskapliga basord för att 

tydliggöra att termerna utgör basord inom flera olika fackspråk som behövs vid 

formulering av definitioner. Inte de basord som barn lär sig först utan de överordnade 

termer som behövs för att kunna uttrycka en definition inom ett fackspråk. 


Begreppsrelationer som verktyg för 

begreppsanalysen 

Anita Nuopponen 

Vasa universitet 

Abstract. This paper presents a set of models that can be used as tools for analysing concepts. 

The models are based on an updated and modified classification of concept relations presented 

originally in Nuopponen 1994 and revised in various papers later on. The suggested systematic 

concept analysis starts by selecting a concept of departure, after which a preliminary overall picture 

of concepts and concept systems of the target field is obtained by using satellite model, i.e. a 

uniform, mind-map-like way to graphically represent concepts and different types of relations 

between them. The branches of the resulting presentation are scrutinized separately. This may be 

done with the help of their own satellite models if needed. At this phase, the concept relation 

models discussed in this paper can be applied to clarify relation types between the concepts (generic, 

origination, developmental, contiguity, activity, transmission, causal, and dependence relations). 

The models can be modified and applied according to the needs of the domain. This 

analysis phase results in detailed information of the concepts and their relations to other concepts. 

The information received when going through different relation models helps also to modify 

the preliminary generic concept system(s). Finally, as a synthesis a new version of the whole 

overall concept system (or ontology) consisting of different types of minor concept systems is 

compiled. The results can be utilised in writing definitions, compiling ontologies etc. The analysis 

process can be integrated in e.g. terminology or ontology work, technical writing or academic 

research. 

INLEDNING 

I detta bidrag beskrivs modeller som kan användas för att analysera olika typer 

relationer mellan begreppen. Terminologilärans begreppsrelationer har under det 

senaste decenniet fått betydelse som verktyg för ontologier och andra system för 

kunskapsorganisation 1 . Därför har jag också under de senaste åren återvänt till 

klassifikationen i Nuopponen 1994 och omarbetat den bit för bit 2 

. I det följande samlar 

jag ihop dels sådant som jag har presenterat tidigare i o lika sammanhang och dels 

lägger till några nya relationstyper och grupperar begreppsrelationer på ett något 

annorlunda sätt än tidigare. Avsikten är att öka begreppsrelationernas tillämpbarhet 

som verktyg för systematisk begreppsanalys. 

1 

T.ex. TKE 2008 konferens hade som tema "Managing Ontologies and Lexical Resources" och specialtemat på NORDTERM 

symposium 2009 var "Ontologier og taksonomier". 

2 

Se källförteckningen. 


Systematisk begreppsanalys 

Begreppsrelationer betraktas som väsentliga verktyg för systematisk begreppsanalys. 

Systematisk begreppsanalys bygger på begrepp och metoder som skapats för 

terminologiarbete och terminologisk forskning. En speciell betoning ligger på 

begreppsrelationer och begreppssystem. Systematisk begreppsanalys kan tjäna som en 

metod för vilken som helst undersökning där man behöver klargöra (fack)begrepp och 

deras relationer till varandra. 

När man analyserar begrepp, rör man sig på tre olika nivåer som man borde hålla 

isär: referentnivån (entiteter och deras egenskaper i den verkliga världen eller i en 

föreställd värld), begreppsnivån (begrepp och deras kännetecken) och uttrycks- eller 

representationsnivån (benämningar och begreppsdefinitioner). Begreppet begrepp 

definieras i Nordterms ordlista Terminologins terminologi på nordiska som 

"kunskapsenhet som skapats genom en unik kombination av kännetecken", vilket 

innebär att ett begrepp skiljer sig från andra begrepp genom ett eller flera särskiljande 

kännetecken. Ett kännetecken i sin tur är en "abstraktion av en egenskap hos en viss 

referent eller hos en grupp av referenter" enligt ordlistan medan en referent är en 

"entitet 3 

som kan påvisas eller uppfattas eller som man kan föreställa sig och som ett 

begrepp kan knytas till". Begreppen utgörs alltså av kännetecken som också är 

begrepp − begrepp vars referenter är de egenskaper som iakttagits. 

För att uttrycka fackbegrepp använder man termer, dvs. benämningar för 

allmänbegrepp som tillhör ett fackområde, begreppsdefinitioner 

Det finns flera olika sätt att analysera begrepp systematiskt, och i min forskning 

håller jag på att reda ut dessa möjligheter. I detta bidrag koncentrerar jag mig på ett 

tillvägagångssätt som har visat sig vara effektivt när man vill kartlägga större 

områden. Denna metod kunde också kallas för "satellitmetod" på grund av dess 

viktigaste verktyg s.k. satellitmodell. I det följande diskuterar jag de faser som gäller 

val av ett utgångsbegrepp, utarbetande av en preliminär helhetsbild (satellitmodell) 

och närmare granskning av relationer mellan begreppen (begreppsrelationsmodeller). 

Det är den sistnämnda fasen som står i fokus i detta bidrag. 

4 

och andra – både 

skriftliga och muntliga – begreppsbeskrivningar samt visuella representationsformer. 

Benämningar för individualbegrepp, dvs. egennamn, behövs dock ibland också (se 

Nuopponen & Pilke 2008). 

Satellitmodell - en helhetsbild av fackområdet 

Själva begreppsanalysen börjar med att man skaffar man sig en preliminär 

helhetsbild av det analyserade begreppets område eller fackområde. Även om man ska 

analysera bara ett enda begrepp är det nödvändigt att kartlägga åtminstone dess 

närmaste begrepp för att få en uppfattning av dess innehåll. Begreppsinnehållet hänger 

ihop med begreppets placering i begreppssystemet. 

3 

I litteraturen förekommer det också t.ex. termer företeelse, fenomen, föremål och objekt som synonymer till entitet. Här används 

termen företeelse. 

4 

TSK 2006: "beskrivning som ska avgränsa begreppet mot relaterade begrepp". 


Som verktyg kan man använda s.k. satellitmodell som är ett grafiskt presentationssätt 

skapat för terminologiarbete och som liknar idékartor (mindmap) men som går 

djupare in i relationer mellan begreppen 5 

. Satellitmodellen kunde karakteriseras som 

en dynamisk begreppskarta, eftersom den växer, modifieras och specificeras allt efter 

man under analysens gång får mera information om de analyserade begreppen. Man 

börjar med en preliminär helhetsbild och går över till att granska begreppen i 

satelliterna och deras satelliter osv. Hur djupt in i fackområdets vetande ska man gå 

beror på analysens avsikt och tiden som man har till förfogande. 

Valet av utgångsbegreppet 

För satellitmodellen behöver man ett utgångsbegrepp eller en annan gemensam 

nämnare för fackområdet vars begrepp och termer ska undersökas. Som 

utgångsbegrepp kan fungera t.ex. ett begrepp på en högre abstraktionsnivå eller ett 

begrepp som annars kan föra ihop de undersökta begreppen. Det kan hänvisa till 

exempel till: 

• ett fackområde eller en disciplin eller en del eller variant av dessa, t.ex. 

lingvistik, lexikologi; sjukvård, närsjukvård; trädgårdsskötsel, kompostering; 

japansk teceremoni, Urasenke-tetradition. 

• en handling, en aktivitet, en process eller en händelse, t.ex. ordbildning, 

medicinsk diagnos, plantering, temae (proceduren för att förbereda te). 

• ett materiellt eller immateriellt föremål, ett objekt, ett tillstånd; t.ex. språk, 

morfem; läkemedel, tandläkare, feber; pion, kompost; teskål, tehus, osv. 

Utgångsbegreppet placeras i centralnoden och de viktigaste besläktade begreppen i 

"satellitnoderna" omkring den. För att framställningen skulle bli åskådligare är det 

ändamålsenligt att gruppera begrepp med hjälp av hjälp- eller "pseudonoder", t.ex. om 

utgångsbegreppet avser en aktivitet, utgörs de viktigaste satellitnoderna av 

hjälpnoderna "aktör", "objekt", "verktyg", osv. I en noggrannare analys av 

fackområdets begrepp kan vart och ett begrepp tas som utgångsbegrepp i tur och 

ordning. Satellitnoderna får sina egna satelliter och t.ex. hjälpnoden "verktyg" binder 

ihop begrepp för alla verktyg som används för att genomföra aktiviteten. Dessa kan 

vidare delas i underbegrepp eller man kan redogöra för verktygens beståndsdelar, 

material, ursprung, osv. 

Under den systematiska analysen kan tyngdpunkten flyttas till ett annat begrepp 

som kan ta över rollen som utgångsbegrepp. Om man arbetar med ett stort fackområde 

eller ett mera komplicerat fenomen eller om man ska jämföra olika syn på begrepp och 

deras referenter, kan det uppstå flera alternativa satellitmodeller. 

BEGREPPSRELATIONSMODELLER 

I den tidigare forskningen har jag utarbetat en detaljerad klassifikation av 

begreppsrelationer som kan användas vid terminologisk begreppsanalys. Vissa 

5 Se mera t.ex. i Nuopponen 2000. 


elationer (aktivitets- och upphovsrelationer) har jag grupperat i modeller som kan 

fungera som utgångspunkter för en satellitmodell. I det följande presenterar jag ett 

försök att gruppera resten av begreppsrelationer i liknande "begreppsrelationsmodeller". 

Modellerna kan vara alternativa och tillämpas i den ordning som tycks vara 

ändamålsenlig i vart och ett fall. Element ur olika modellerna kan kombineras enligt 

behov. 

Begreppsrelationstyperna är generaliserade för att kunna tillämpas i a lla möjliga 

fall. De baserar sig på människans grundläggande sätt att strukturera och kategorisera 

världen. Benämningarna som jag har valt är allmänna (t.ex. ändamålsrelation) eller 

metaforiska lån från ett fackområde (t.ex. ingrediensrelation; patient). 

Avsikten med 

termvalet har varit att ge plats för olika tolkningar och tillämpningsmöjligheter inom 

olika fackområden. Modellerna är avsedda som utgångspunkter och idégivare för var 

och ens egen metodutveckling. Man kan plocka det som lämpar sig för fackområdet i 

fråga och utarbeta modeller som fungerar där. Innan man väljer modellerna som ska 

användas, lönar det sig dock att testa alla för att undvika förutfattade föreställningar 

om fackområdets begreppsapparat. För att snabbt komma i gång med analysen kan 

man formulera nyckelfrågor som är relevanta för det undersökta området. 

Typer och egenskaper 

Oberoende av begreppets typ är det väsentligt att bestämma begreppets plats i ett 

generiskt begreppssystem (syn. logiskt begreppssystem): vad är dess överbegrepp, 

sidobegrepp och underbegrepp samt eventuella indirekta sidobegrepp. 

FIGUR 1. Analysmodell för generiska begreppsrelationer och kännetecken. 

När man försöker bestämma det generiska överbegreppet 6 till utgångsbegreppet 

(se figur 1) letar man efter information om ett begrepp vars omfång 7 

täcker också 

utgångsbegreppet, dvs. en större klass av företeelser som referenten hör till. 

Svårigheter förorsakas t.ex. av att överbegreppet kan vara under diskussion inom 

själva fackområdet eller disciplinen. Det kan finnas många olika tolkningar hur 

referenten borde klassificeras, t.ex. diskuterar olika forskare om japansk teceremoni 

6 

TSK 2006: "begrepp som står i generisk relation till ett annat begrepp och vars intension inkluderas i intensionen av det andra 

begreppet". 

7 

TSK 2006: "uppsättning referenter som kan knytas till ett visst begrepp". 


(jap. chadô "teets väg") skulle betraktas som en typ av ceremoni, ritual, konst, kult, 

tedrickande, filosofi, religion osv. I vissa sammanhang måste man klassificera eller 

definiera utgångsbegreppet och således fatta beslutet vad som skall uppfattas som ett 

överbegrepp. 

I innehållsdefinitionen som är den klassiska definitionsmodellen beskrivs begreppet 

"genom att ange dess överordnade begrepp och dess särskiljande kännetecken" (TSK 

2006). I vissa fall måste man ersätta den term som representerar överbegreppet med ett 

allmänt ord, t.ex. "tradition, som...", "ett sätt att…" 8 

. Valet av ett överbegrepp 

påverkar också termvalet, t.ex. om man väljer att behandla japansk teceremoni som en 

ceremonityp, väljer man termen 'teceremoni' eller om man ser den som en konstform, 

föredrar man termen 'tekonst'. Gör man en deskriptiv studie, kan begreppet få flera 

överbegrepp (se figur 1). 

För att kunna definiera begreppet behövs det (ett eller flera) särskiljande kännetecken 

som skiljer det undersökta begreppet från andra begrepp på samma 

abstraktionsnivå, dvs. dess generiska sidobegrepp ska kartläggas och skillnaderna 

mellan dem redogöras för. Till exempel om man vill definiera japansk tekonst, ska 

man fråga hur den avviker från andra konstformer, eller om man betraktar den som en 

ceremonityp, är man tvungen att klargöra hur teceremonin avviker från andra 

ceremoniformer och hur den japanska teceremonin avviker från t.ex. kinesiska eller 

koreanska teceremonier. Om man ser på chadô i sin japanska kontext, likställs det som 

ett parallellt fenomen till andra dô, dvs. "vägar", t.ex. kadô (ikebana), judô, kendô, 

budô, osv. 

Ofta kommer det vid analysen fram begrepp som är nära det undersökta begreppet, 

men tycks inte ha samma direkta överbegrepp. Ändå kan det vara viktigt att avgränsa 

dem från det undersökta begreppet för att få en vattentätare definition. Dessa begrepp 

ligger längre borta i det generiska begreppssystemet än de direkt sidoordnade begreppen 

eller relationen är annars oklar. De kan även höra till ett alternativt generiskt 

begreppssystem. 

En del underbegrepp finner man vanligen redan i början av analysen, men man får 

en bättre uppfattning om dem och deras innehåll under analysens gång samtidigt som 

man undersöker andra relationstyper. Då kommer det fram nya indelningskriterier och 

annan dylik information; t.ex. skillnaden mellan olika typer av öl klargörs när man 

bekantar sig med framställningsmetoder och bryggningsprocess. Man ska under hela 

analysprocessen leta efter information som kompletterar det generiska begreppssystemet. 

Också annars ska man under analysen återkomma till skedet där man preliminärt 

har klargjort begreppets kännetecken och generiska relationer. 9 

Ursprung, utveckling och processer 

När man bekantar sig med en företeelse får man ofta information om dess ursprung 

och utveckling. Detta är typiskt för encyklopediartiklar eller läroböcker. Dessa 

beskrivningar ger uppgifter om upphovs- och utvecklingsrelationer mellan begreppen. 

Upphovsrelationer baserar sig på förhållanden mellan utgångsbegreppets referent 

och andra företeelser eller faktorer som har med dess ursprung eller uppkomst att göra: 

8 Se Vehmas-Lehto 2006. 

9 Se mera i Nuopponen 1994. 


vem tillverkar eller har tillverkat den, var, varför, hur, av vilket material ("ingredienser"), 

med vad och när (se figur 2). Det är lätt att finna dessa relationer när man 

analyserar en konkret företeelse, t.ex. cappuccino, men svårare när man har med en 

immateriell företeelse att göra, t.ex. teceremoni. Till exempel i litteraturen om japansk 

teceremoni kommer det fram olika människor, skolbildningar och faktorer som har 

bidragit till att denna aktivitetsform existerar. Vissa tidsperioder uppges också ha haft 

betydelse. Ingredienser som cappucino tillverkas av är espresso, ångad mjölk och 

mjölkskum medan i fråga om japansk teceremoni (t.ex. som en konstform) kunde man 

räkna som "ingredienser" inflytande från olika religioner, arkitektur och andra 

konstarter (blomsterkonst, keramik, kalligrafi, etc.) som har styrt teceremonins 

utveckling. 

FIGUR 2. Analysmodell för upphovsrelationer 10 

. 

FIGUR 3. Analysmodell för utvecklingsrelationer och temporala begreppsrelationer. 

Utvecklingsrelationer anknyter sig till fenomenets utveckling (se figur 3). 

Encyklopediartiklar och läroböcker redogör för också dessa begreppsrelationer när de 

10 I de flesta figurerna har termerna förkortats och uttryck som "ÄNDAMÅL", "INGREDIENS" osv. ska läsas 

"ändamålsbegrepp", "ingrediensbegrepp" osv. Om man vill kan man bilda termer för dessa begrepp, jfr. helhetsbegrepp, 

delbegrepp. 


presenterar utvecklingshistorien bakom företeelsen: Vilka utvecklingsstadier går en 

individ eller ett material igenom, vilka företrädare och efterträdare har företeelsen, 

hur har hela arten utvecklats och vilka generationer kan man urskilja? 

Sammansättning, struktur och läge 

En grupp av begreppsrelationer har med referentens rumsliga kontakt att göra (se 

figur 4). Till den mest centrala informationen hör referentens indelning i delar, 

komponenter, element el.dyl. Frågan Vilken större helhet företeelsen hör till? leder till 

information om utgångsbegreppets helhetsbegrepp 11 , dvs. begreppet som är överordnat 

till det i ett partitivt begreppssystem. Utgångsbegreppets partitiva sidobegrepp och 

delbegrepp finner man genom att ställa frågorna Vilka andra delar hör till samma 

helhet? respektive Av vilka delar, beståndsdelar eller komponenter består referenten 

själv av? 

FIGUR 4. Analysmodell för partitiva och närliggande begreppsrelationer. 

Vid sidan av egentliga delar kan det även vara frågan om något som kan anknytas 

till en företeelse som en "extra utrustning" (t.ex. trädgård – belysning; kaffedryck – 

socker). Det kan också gälla en egenskap hos utgångsbegreppets referent (t.ex. kaffe – 

koffeinhaltig), dess ämneskomponent (t.ex. kaffe – koffein), ingredienser som den 

tillverkats av (se exemplen i 2.1) eller "läge" (espresso – espressokopp). Dessa 

relationer kan vändas om på liknande sätt som partitiv över- och underordning. Då kan 

man t.ex. fråga Vilken företeelse har utgångsbegreppets referent utvunnits ur? 12 

Materialrelationer kunde också kallas "ämneskomponentrelation" eller "utvinnings- 

relation" för att uttrycka bättre materialets roll i denna relationstyp. 

11 

TSK 2006: "begrepp i en partitiv begreppsrelation som avser helheten". 

12 

Se mera i Nuopponen 1994. 


Aktivitet 

Ett aktivitetssystem är en naturlig utgångspunkt för områdets satellitmodell om man 

analyserar begrepp som har med en aktivitet, ett aktivitetsområde eller en handling att 

göra (se figur 5). Man ställer då frågor om aktiviteten. Vilka av dessa frågor man 

ställer, hur man formulerar frågorna och hurudana svar man får beror mycket på 

fackområdet T.ex. terminologiarbete görs av en terminolog och aktiviteten har termer 

och begrepp som objekt. Som verktyg räknas här utom själva verktyg också material, 

sätt och metod som man använder för att utföra handlingen eller aktiviteten. Vid 

terminologiarbetet används det olika terminologiska metoder, dataprogram osv. 

Aktiviteten eller handlingen kan anknytas till en viss plats, t.ex. terminologiarbete 

− terminologicentra, översättningsavdelning; teceremoni − tehus osv. Man kan också 

fastställa en tidpunkt eller en tidsperiod då den idkas, t.ex. julfirande − jul. Aktiviteten 

eller handlingen kan ha ett eller flera mål eller syften, t.ex. tävling − vinst; 

terminologiarbete − begreppslig reda, terminologisk standardisering/harmonisering. I 

många fall sammanfaller mål- och resultatbegreppet men ibland kan det vara ändamålsenligt 

att göra skillnad mellan målrelation och teleologisk aktivitetsrelation, t.ex. ett 

resultat av terminologiarbetet kan vara en ordlista. Aktiviteten kan ha en speciell rutt 

som används för att genomföra den. Rutten kan bestå av olika etapper. (Se figur 5.) 

FIGUR 5. Analysmodell för aktivitetsrelationer och temporala begreppsrelationer. 

Ibland är den granskade aktiviteten en fas i en mera omfattande process och den 

kan också ha sina egna underfaser. Relationer mellan faserna leder till temporala 

begreppsrelationer. Var och en av faserna kan analyseras med aktivitetsrelationsmodellen 

då de tillsammans bildar en kedja. 13 

13 Se mera Nuopponen 1994, 2006, 2007. 


Överföring, transmission 

En typ av aktiviteter är olika slags överförings- eller transmissionsprocesser. Jag 

har klassificerat denna typ av aktiviteter skilt eftersom dessa processer medför 

ytterligare komplexitet. Om själva överföringsprocessen (t.ex. betalning) tas som 

utgångsbegrepp, kan modellen för analysen av aktivitetsrelationer tillämpas till en stor 

del (se figur 6), eftersom överföring eller transmission är en aktivitet och samma typer 

av relationer är inblandade (Vad är objektet för överföring, vem utför överföringen, 

vilken väg och instrument används? Osv.). 

FIGUR 6. Analysmodell för transmissionsrelationer. 

När man har företeelsen som överförs som utgångspunkt är det möjligt att fastställa 

relationstyper, som är specifika för överföringsprocesser (se figur 6). En sådan är t.ex. 

relationen mellan begreppen som avser det som överförs och sändaren (t.ex. skatt − 

skattebetalare). Man kan också ta vilken som helst av begreppen som utgångspunkt 

och få fram några ytterligare relationstyper. Till exempel om begreppet som avser 

sändaren (t.ex. författare) tas som utgångsbegrepp kommer det att anknytas med 

begreppen som avser mottagaren (t.ex. läsare) och förmedlaren (t.ex. översättare) 

(direkt resp. sekventiell transmissionsrelation). 14 

Orsak och verkan 

I kausala begreppssystem kan man skilja mellan begrepp som avser olika typer av 

orsak och följd (t.ex. finanskris − lågkonjunktur). Orsaker kan vara en agent som kan 

tänkas ha förorsakat någonting (kausal agent), en händelse som leder till följder och 

bildar eventuellt en kausalkedja (producerande orsak), eller omständigheter som kan 

tänkas ha förorsakat någonting (förklarande orsak). T.ex. vid den globala finanskrisen 

som började sommaren 2007 kunde man betrakta banker som kausal agenter och deras 

osund kreditgivning som producerande orsak och början på en kausalkedja som ledde 

till krisen. Patientbegreppet (t.ex. ekonomi) hänvisar till någonting som påverkas och 

hos vilken/vilket symptom (t.ex. arbetslöshet, tillväxt, inflation) förekommer. Också 

här kan man ta vilket som helst begrepp som utgångsbegrepp och få fram olika 

synvinklar på orsak och följd. 



FIGUR 7. Analysmodell för kausala begreppsrelationer med följdbegreppet som utgångspunkt. 

I analysmodellen i figur 7 har följdbegreppet tagits som utgångsbegrepp (t.ex. 

lågkonjunktur). Mellan det och orsaksbegreppet finns det en orsaksrelation, vilken är 

den primära kausala begreppsrelationen. De övriga kan man inte undvika när man 

analyserar kausala förhållanden närmare. Det finns t.ex. vissa åtgärder (motverkande 

orsak) med vilka man kan försöka komma ur lågkonjunkturen eller förhindra den, men 

om det inte lyckas, kan lågkonjunkturen ha t.ex. depression som konsekvens. Man kan 

skilja ytterligare relationstyper i k ausala begreppssystem, t.ex. olika symptom kan 

förekomma i olika delar av "patienten" och ha sina egna konsekvenser och 

"botemedel". 15 

Beroende och jämförelse 

I figur 8 har jag samlat relationer som inte nödvändigtvis formar ett sammanhängande 

begreppssystem eller kan fungera som sådan som en utgångspunkt för en 

satellitmodel. De anknyter sig på ett eller annat sätt till b eroende och jämförelse 

mellan företeelser och kan integreras i de övriga modellerna enligt behov. I de tidigare 

klassifikationerna har jag placerat dessa relationer på olika ställen, de flesta som 

kontakt- och interaktionsrelationer. 16 

FIGUR 8. Olika typer av beroende. 

Ägarrelationen baserar sig på sambandet mellan referenten och den som äger den 

eller tvärtom, om referenten är den som äger något. Dessa relationer är ofta nära 

partitiva begreppsrelationer eller tillhörighetsrelationer, men ibland kan ägarrelationen 


16 Se mera i Nuopponen 1994, 2005. 


vara nyttig vid begreppsanalysen när ägandeförhållandet betonas speciellt (t.ex. 

skogsägare − skog). I vissa fall fungerar "ägare" också bättre som metafor. Exempel 

på en avhänginghetsrelation är relationerna mellan begreppen värd − gäst och 

långivare − låntagare. En korrelationsrelationen finns det t.ex. mellan begreppen pris 

− efterfrågan och symbolrelationer mellan riksdagsledamot − valkrets och term − 

begrepp. Rangrelationen har att göra med företeelsernas placering i den skala som 

uppstår av jämförelsen (t.ex. huvudgäst, andra gäst, tredje gäst vid den japanska 

teceremonin). Rollrelationen råder mellan utgångsbegreppet och begreppen som avser 

företeelsens roller (t.ex. professor − sakkunnig; journalist − grindvakt; museum − 

upplysare). 

SYNTES 

De begreppsrelationsmodeller presenterades i denna artikel är avsedda för det första 

att komma i gång med begreppsanalysen och att skapa en preliminär helhesbild i form 

av en satellitmodell. För det andra stöder de arbetet när man ska reda ut och 

specificera olika typer av begreppsrelationer och begreppssystem(fragment) som man 

har funnit inom det undersökta fackområdet. 

Under den systematiska genomgången av den preliminära satellitmodellen får man 

ytterligare information för att klargöra olika typer av begreppssystem(fragment). 

Speciellt värdefullt är informationen som preciserar de preliminära generiska begreppssystemen. 

Det som man samlar och sorterar med hjälp av begreppsrelationsmodeller 

och satellitmodellen kan utom begrepp och termer vara information om 

referenternas egenskaper. Man kan då kartlägga och jämföra begreppskännetecken 17 

. 

Även om all denna information inte nödvändigtvis direkt bygger upp begrepps- 

systemet kan den hjälpa på flera andra sätt vid begreppsanalysen. 

Den sista fasen i en systematisk begreppsanalys består av att sammanfatta analysens 

resultat i en reviderad satellitmodell. Efter att ha klargjort den preliminära 

satellitmodellens delar "satellit" för "satellit" så långt som man vill komma in i 

fackområdets vetande, återkommer man alltså till helheten och modifierar den så att 

alla bitar faller på plats. Som slutresultat uppstår det ett "heltäckande" begreppssystem 

eller en ontologi för det valda fackområdet. I vissa fall uppstår det flera alternativa 

eller parallella helhetsbilder, t.ex. när man jämför skillnader mellan begreppssystem i 

olika länder, teorier, företag osv. 

Slutresultaten kan tillämpas när man ska skriva definitioner, utarbeta ordlistor, 

ontologier, termbanker, osv. I enlighet med den allmänna terminologilärans traditioner 

är den systematiska begreppsanalysmetoden avsedd för att vara allmänt tillämpbar 

oavsett språk och fackområde eller oavsett vem som använder den. Analysprocessen 

kan integreras som ett moment inte bara i te rminologiarbete utan i o ntologiarbete, i 

teknikinformatörens arbete eller i vetenskaplig forskning. Metoden och dess verktyg är 

inte heller bundna vid ett visst modellerings- eller databassystem. Friheten från dessa 

begränsningar har gjort det lättare att testa olika möjligheter och att ändra 

klassifikationen. Detta har bidragit också till a tt satellitmetoden och klassifikationer 

har kunnat tillämpas och modifieras för olika syften 18 

. 

17 

Se mera i Nuopponen 2000. 

18 

T.ex. Kristiansen 2000; Hedin osv. 2000. 


REFERENSER 

Hedin, Anita, Lena Jernberg, Hans Christian Lennér, Torsten Lundmark & Sven-Bertil Wallin (2000). 

Att mena och mäta samma sak: en begreppsorienterad metod för terminologiskt arbete. Lund: Studentlitteratur. 

Kristiansen, Marita (2000). Emerging disciplines in the behavioural sciences. Assessment of disciplinary 

autonomy by terminological conceptual analysis. In Unesco Alsed-LSP Newsletter vol. 23, no. 

2 (50) 2000. Copenhagen: Copenhagen Business School. 

Nuopponen, Anita (1994). Begreppssystem för terminologisk analys. Acta Wasaensia. Vaasa: 

University of Vaasa. 

Nuopponen, Anita (1996). Att strukturera kunskap. Om systematisk begreppsanalys. I: J. Myking, R. 

Sæbøe & B. Toft (red.), Terminologi − system og kontekst , 171−196. Oslo: Noregs forskingsråd. 

Nuopponen, Anita (1997). A model for systematic terminological analysis. In L. Lundquist & H. Picht 

& C. Quistguaard (Eds.), LSP − Identity and Interface Research, Knowledge and Society, 363−372. 

Copenhagen: Copenhagen Business School. 

Nuopponen, Anita (2000). Satelliter och system − att integrera begreppssystem i terminologiarbetet. I 

A. Nuopponen, B. Toft & J. Myking (red.), I terminologins tjänst. Festskrift för Heribert Picht på 

60-årsdagen, 128−45. Vaasa: Vaasan yliopisto. 

Nuopponen, Anita (2005). Concept Relations v2 An update of a concept relation classification. In Terminology 

and Content Development, 127−138. B. Nistrup Madsen & H. Erdman Thomsen (Eds.). 

Copehagen: Litera. 

Nuopponen, Anita (2006). A model for structuring concept systems of activity. In Y. Wang, Y. Wang & 

Y. Tian (Eds.), Terminology, Standardization and Technology Transfer, Proceedings of the 

TSTT'2006 Conference. Beijing: Encyclopedia of China Publishing House. 

Nuopponen, Anita (2007). Terminological modelling of processes: an experiment. In B.E. Antia (ed.), 

Indeterminacy in Terminology and LSP: Studies in honour of Heribert Picht, 199–213. John Benjamins. 

Nuopponen, Anita (2008). Causal concept systems. In B. Nistrup Madsen & H. Erdman Thomsen 

(Eds.), Managing ontologies and lexical resources, 17− 28. Copenhagen: Copenhagen Business 

School. 

Nuopponen, Anita & Nina Pilke (2010). Ordning och reda. Terminologilära i teori och praktik. 

Stockholm: Norstedts Akademiska Förlag. (I tryck). 

Nuopponen, Anita & Nina Pilke (2008). Radiccio, Bond och Conax – om termer och namn i fackordlistor. 

I Kunnskap og fagkommunikasjon, 182−191. Nordterm 15. Red. Jan Hoel. Oslo: Språkrådet i 

Noreg. 

Terminologins terminologi på nordiska (2005). http://www.nordterm.net/info/Publ/PNORDTERM13sv.html. 

Nationella upplagor: Se TNC 2008, TSK 2006. 

TNC (2008). Terminologins terminologi: ordlistan. Stockholm: TNC. 

http://www.tnc.se/images/stories/Bokhandel/ TT_ordlistan.pdf. 

TSK (2006). Terminologian sanasto. Terminologins terminologi. Helsinki: TSK. 

http://www.tsk.fi/tiedostot/pdf/ TerminologianSanasto.pdf 


Vehmas-Lehto, Inkeri (2006). Yläkäsite – määritelmien toimittamisen kulmakivi. I Fackspråk och 

översättningsteori. VAKKI-symposium XXVI. Vasa 11.–12.2.2006, 319–330. Vasa: Vasa universitet. 

Humanistiska fakulteten. 


From concept models to conceptual data 

models 

Bodil Nistrup Madsen & Anna Elisabeth Odgaard 

Abstract. In order to develop a harmonised and efficient IT system, such as a database, it is 

important to be familiar with the underlying concept model (concept systems) for the relevant 

domain which the IT system should be designed to accommodate, as this forms the necessary firm 

foundation for designing the conceptual data model. Although there is no one-to-one correlation 

between concept and characteristic features in the concept model and classes and attributes in the 

conceptual data model, there are many similarities between concept modelling and conceptual data 

modelling, and by closely examining the relationship between the two models, we have strived to 

construct an algorithm for creating conceptual data models in Unified Modelling Language (UML) 

on the basis of concept models that adhere to the traditional principles and methods of terminology 

work. 

THE FOUR MODELLING PHASES 

Ideally, the modelling procedure for developing an IT system that comprises a 

database should consist of four phases: Concept modelling, conceptual data modelling, 

logical data modelling and physical data modelling, cf. Figure 1. 

FIGURE 1.The Four Modelling Phases 

Unfortunately, the concept modelling phase is often omitted and IT developers set 

out to design the conceptual data model first off. This causes problems as a conceptual 


data model, which is also inappropriately referred to as a semantic model, contains no 

information about meaning, rather, what kind of information should be recorded in the 

database. If concepts are not clarified and consensus regarding the content of concepts 

and usage of terms has not been reached, problems and misunderstandings could arise 

in connection with the data models. Therefore conceptual data models should be 

constructed on the basis of concept models and recent research in this area is already 

beginning to yield valuable findings (Kop 2008). However, we will go one step further 

as we set out to construct an algorithm for automatically generating conceptual data 

models on the basis of concept models. In our description of the four phases below we 

will use the design of a database for information about a conference system as an 

example, cf. Figure 2. This example has been inspired but not constrained by a case 

presented by Mathiassen et al. (2008), as we include a concept model and present a 

different data model. 

FIGURE 2. Extract of a concept model for a conference system 

PHASE 1: In the first phase of concept modelling, the domain experts draw upon 

their knowledge and understanding of the domain to identify the concepts and terms 

which are relevant for the proposed IT system. This information may also be extracted 

from requirement and design specifications. Assisted by terminologists or having the 


necessary terminological prerequisites, the domain experts then proceed to organise 

concepts visually in a concept model where the mutual semantic relations between the 

concepts are recognized and defined. Finally, the subdivision criteria and 

characteristic features are identified allowing for the production of short, simple and 

precise concept definitions. 

PHASE 2: Once a concept model has been produced, a conceptual data model in 

UML can be created on the basis of the conceptual information contained in the 

concept model in the form of characteristic features and concept relations. In this 

work, we have attempted to closely study and formalise to the extent possible, the 

many considerations and decisions of this conversion process. As a general trend, it 

can be observed that some concepts correspond to classes, attributes or attribute values 

while other concepts in the concept model are not to be found at all as elements in the 

data model. Furthermore, the relations between concepts in a concept model can differ 

from the associations in the corresponding conceptual data model. 

FIGURE 3. Algorithm for creating a conceptual data model on the basis of a 

concept model 


By applying the algorithm on a concept model, it would be possible to generate a 

conceptual data model in UML semi-automatically. However, this does imply that the 

concept model is complete, that concepts which are irrelevant to the IT system are 

identified manually, that multiplicity is specified manually and that any simplifications 

are carried out manually. Figure 3 shows the draft algorithm. 

In order to move through the concept model and process all the concepts, 

subdivision criteria and relations in the appropriate way, the algorithm identifies the 

initial focus concepts which are characterized by not having any super ordinate 

concepts nor do they solely enter into an associative relation as the target concept. 

Subsequently, a series of properties are analyzed to establish which role the focus 

concept, relevant subdivision criteria and relations should play in the conceptual 

model. For instance, if a focus concept has several subordinate concepts, then the 

focus concept is converted to a class in UML and each subdivision criteria is similarly 

converted to a class with an attribute corresponding to the name of the class. In 

addition, a “has” relation is created from the class of the focus concept to the class of 

the subdivision criteria, and the associated subordinate concepts become attribute 

values in the class of the subdivision criteria. Another part of the algorithm accounts 

for the measures to be taken when the focus concept enters into associative relations as 

the source concept. In this case, the focus concept is converted to a class, if it has not 

been converted already, and the associatively related concepts become classes as well 

with attributes corresponding to the names of the classes. Lastly, a “has” relation is 

created from the class of the focus concept to the associatively related classes. Another 

rule in the algorithm states that if a subconcept of a focus concept has subconcepts 

itself or enters into associative relations as the source concept, then this subconcept 

should be treated as a focus concept too. The algorithm is thus repeatedly traversed 

until all concepts have been processed. Figure 4 shows an example of a conceptual 

data model generated on the basis of the concept model in Figure 2. 


FIGURE 4. Extract of a conceptual data model generated on the basis of the 

concept model 

Next, each relation in the new intermediate model will have to be carefully 

scrutinized to determine multiplicity. The domain experts and IT developers will also 

be able to make simplifications in order to facilitate implementation or cater for 

specific user requirements, before the conceptual model can be considered actually 

complete and ready for phase 3. 

PHASE 3. Concerning the logical data modelling phase, principles and 

recommendations for converting a conceptual data model to a logical data model 

already exist (Connelly & Begg: 2004, Applied Information Science: 1997). During 

this conversion, all classes are provided with a primary key corresponding to the name 

of the class joined with the identifier string “ID” and the relevant attribute is given a 

(pk) marking. Many-to-many relations transformed into a new intermediate class and 

two one-to-many relations from the two original classes to the new intermediate class 

are created. All classes which take part in a one-to-many relation are joined by a 

primary key (pk) on the “one” side and a foreign key (fk) on the “many” side. An 

example of a logical model, which is created on the basis of the conceptual data model 

in figure 4, is given in Figure 5. 


FIGURE 5. Extract of a logical data model created on the basis of the conceptual data model 

PHASE 4: Implementing a physical data model in the last phase calls for 

considerations regarding the facilities and constraints of a given schema and query 

language, such as SQL or XML, including technical specifications, such as data types 

or the sequence order of elements. Once this has been established, the database can be 

implemented. 

Figure 6 shows an overview of the phases 1 to 3: from concept model to 

logical data model. 

CONSIDERABLE POTENTIAL 

Formalising the crucial step of converting a concept model to a conceptual data 

model has clear benefits and considerable potential, especially in the current age of 

digitalization where the necessity of organising and clarifying concepts as a basis for 

data modelling has become apparent. By providing guidelines for converting a concept 

model to a data model, we hope to pave the way for consistently anchoring data 

models in concept models, implementing a mediating framework for a dialogue 

between domain experts, terminologists and IT developers, and reducing resource 

costs by avoiding errors, ambiguity and vagueness during IT system development. 


Result of Phase 1: 

Concept Model 


Logical Data Model 

automatic 

automatic 


Conceptual Data Model 

Figure 6: Overview of the phases 1 to 3: from concept model to logical data model 

FUTURE WORK 

manual 

In future work, we plan to investigate the relationship between concept models and data 

models even further and apply the algorithm to a wide range of concept models and 

subsequently potentially extend and improve the algorithm. An interesting direction for future 

research in this area would also be to devise a methodological workflow for progressing 

through the four modelling phases and specify the necessary skills and competencies for the 

various profiles involved both directly and indirectly in IT system development. 

REFERENCES 

Ambler, Scott (2004): "The Object Primer 3rd Edition - Agile Model-Driven Development with UML 2. 

0" ,Cambridge University Press, retrieved 20 th August 2009 from 

http://www.agiledata.org/essays/dataModeling101.html 

Applied Information Science (1997): “Conceptual ~ Logical ~ Physical Models”, retrieved 20 th August 

2009 from http://www.aisintl.com/case/CDM-PDM.html 

Connolly, Thomas & Begg, Carolyn (2004): "Database Systems 4.ed - A Practical Approach to Design, 

Implementation and Management" Pearson Education Limited 


Kop, Christian (2008): “Conceptual modelling tool for novice designers”, International Journal of 

Metadata, Semantics and Ontologies, v.3 n.2, p.151-165 

Mathiassen, Lars et al. (1998): ”Objekt-Orienteret Analyse og Design”. Forlaget Marko Aps, Aalborg 

Yeung, Albert (1998): "Unit 051 - Information Organization and Data Structure", retrieved 20 th August 

2009 from http://www.ncgia.ucsb.edu/giscc/units/u051/u051.html 


Interoperabilitet 2.0: sømløse emnekort i digital 

forvaltning 

Lars Johnsen 

Syddansk Universitet, Engstien 1, 6000 Kolding, Danmark 

Abstract. I denne artikel gives der en kort introduktion til Topic Maps, en model og teknologi til 

udvikling og udveksling af digitale emnekort, og det demonstreres, hvordan sådanne emnekort 

kan anvendes til organisering og integration af videns- og informationsressourcer i digital 

forvaltning. Blandt andet anføres det, hvordan emnekort kan bruges til integration af konceptuel 

og sproglig viden i f.eks. begrebssystemer og termbaser med OIOXML, det fællesoffentlige 

sprog til dataudveksling mellem it-systemer i den offentlige sektor i Danmark. 

BAGGRUND 

Inden for digital forvaltning er der stor fokus på interoperabilitet. Interoperabilitet 

kan i bred forstand forstås som it-systemers evne til at agere i samspil, herunder især 

deres mulighed for at udveksle og anvende oplysninger og viden på tværs af tekniske 

platforme og organisatoriske skel. Der er i Danmark således blevet iværksat flere 

projekter og initiativer, som har til f ormål at understøtte interoperabilitet i d en 

offentlige sektor. Disse initiativer har resulteret i en lang række konkrete og brugbare 

informationsressourcer, også kaldet interoperabilitetsaktiver, så som ontologier, 

taksonomier, datastandarder (= OIOXML-skemaer) og webservice-beskrivelser. Og 

ikke mindst med IT- og Telestyrelsens nye strategi for fællesoffentlig 

datastandardisering er der al mulig grund til at tro på, at der fremover vil ske en 

voldsom vækst i antallet og omfanget af disse ressourcer. 

Det spørgsmål, der rejser sig, er imidlertid, hvordan man sikrer sig adgang, 

sammenhæng, overblik og struktur i dette univers af distribuerede, heterogene, digitale 

ressourcer produceret og publiceret af mange forskellige myndigheder og 

organisationer, offentlige som private. 

Noget af svaret ligger gemt i de portaler, repositorier og web 2.0-platforme som 

inden for de sidste par år har set dagens lys. Det gælder f.eks. SEMIC.EU, 

Digitaliser.dk og socialebegreber.dk, som på henholdsvis EU-, nationalt og 

sektorniveau forsøger at skabe bedre rammer for vidensdeling inden for digital 

forvaltning. 

SEMIC.EU er et EU-finansieret og -drevet website, der giver aktører i digital 

forvaltning mulighed for at dele interoperabilitetsaktiver på tværs af nationale grænser. 

Dette sker med udgangspunkt i et åbent repositorie og en defineret clearing-proces, der 

skal sikre kvalitet i de ressourcer, der uploades til sitet. 

Digitaliser.dk er en fællesoffentlig webbaseret samarbejdsplatform for alle, der 

arbejder med digitalisering i Danmark. Digitaliser.dk er baseret på en web 2.0- 


tankegang, der blandt andet betyder, at sitets informationsarkitektur primært er 

centreret omkring brugergrupper eller communities. Udover en række 

brugerorienterede funktioner, der tillader upload og tagging af ressourcer, debat, 

nyhedsformidling, etc., har sitet et REST-baseret API, gennem hvilket sitets indhold 

og metadata kan udstilles i et maskinlæsbart XML-format. 

Endelig er socialebegreber.dk et eksempel på et website, der har til formål at 

fremme vidensdeling og fælles begrebsdannelse samt understøtte bedre it-løsninger 

inden for en enkelt sektor, i dette tilfælde det sociale område. 

I sig selv er de tre websites eksempler på gode og fremadrettede initiativer, der hver 

på deres måde bidrager til udbredelse og kvalitetssikring af information og viden om 

digitalisering, herunder interoperabilitet. Problemet er desværre, at der – lige nu – ikke 

sker en egentlig integration af de ressourcer, som publiceres på websites som disse. 

Sagt lidt firkantet er der i dag ikke nogen større interoperabilitet mellem (ressourcer 

på) offentlige websites, hvis formål blandt andet er at understøtte interoperabilitet i 

digital forvaltning. 

Et konkret eksempel på den manglende sammenhæng er fraværet af eksplicitte 

koblinger mellem begrebssystemer, datastandarder og eksisterende lovgivning i form 

af bekendtgørelser, regelsæt, love, etc. Kigger man f.eks. på den standard, der 

specificerer, hvordan en borgers civilstand skal repræsenteres i OIOXML, det 

fællesoffentlige format til dataudveksling, vil man eksempelvis kunne se, at det skal 

gøres med XML-koden … og en af 

følgende dataværdier: 

• married 

• divorced 

• widow 

• registered partnership 

• abolition of registered partnership 

• longest living partner 

• deceased 

• unmarried 

( Se http://digitaliser.dk/resource/4615) 

Der er imidlertid intet i datastandarden, dvs. OIOXML-skemaet og dets tilhørende 

dokumentationsfil, der forklarer disse dataværdiers semantik, deres brug eller 

lovgivningsmæssige forankring. I det konkrete tilfælde kan det f.eks. undre, at 

”widow” åbenbart er en gyldig værdi til angivelse af en persons civilstand, men ikke 

”widower”. Så hvordan skal man egentlig angive i OIOXML, at en person er 

enkemand? I en praktisk sammenhæng er det selvsagt et problem for den 

datamodellør, it-arkitekt eller softwareudvikler, der f.eks. skal planlægge og udvikle 

en it-løsning til beregning og overførsel af pensionsudbetalinger. 

Der er med andre ord brug for en model og en teknologi, der kan integrere 

heterogene interoperabilitetsaktiver, som f.eks. begrebssystemer og datastandarder, på 

tværs af websites og stille resultatet til rådighed på en brugbar, gennemskuelig, og 

ikke mindst navigerbar facon. 


TOPIC MAPS 

En sådan løsning kunne være Topic Maps. Topic Maps er en model, baseret på en 

ISO-standard, og tilhørende teknologier til u dvikling og udveksling af såkaldte 

emnekort. Emnekort er digitale ”kort”, der kobler vidensstrukturer sammen med 

(referencer til) informationsressourcer. Et emnekort indeholder et eller flere emner. Et 

emne er en repræsentation af noget, man ønsker at lagre information om: et abstrakt 

begreb, en hændelse, et billede eller noget helt andet. Emner kan have et eller flere 

navne, og de kan forbindes i navngivne relationer og inddeles i klasser eller typer. Til 

emner kan der knyttes informationsressourcer. Det kan være oplysninger, som angives 

i selve emnekortet, eller eksterne ressourcer, der linkes til, typisk websider og 

lignende. Et centralt aspekt ved emnekort er begrebet identitet. Identitet drejer sig om 

at kunne identificere de emner, der optræder i emnekort: f.eks. at kunne skelne mellem 

Paris, byernes by, Paris, helten fra den trojanske krig, og Paris, mediedarlingen med 

efternavnet Hilton. Måden at identificere et emne på er at udstyre det med en eller 

flere emneidentifikatorer. En emneidentifikator er normalt enten en URL (webadresse 

på nettet), der peger på en emneindikator, en webside eller andet dokument, der 

beskriver eller ”indikerer”, hvad emnet er, eller, hvis emnet i s ig selv er et digitalt 

objekt, objektets egen adresse på nettet eller i et lokalt filsystem. Identifikatorer er 

centrale i Topic Maps-paradigmet, blandt andet fordi de muliggør programmatisk 

sammenfletning af flere emnekort i en sammenhængende struktur. Ved en sådan 

sammenfletning vil emner med samme identitet således automatisk blive fusioneret, 

deres indhold ”lagt sammen” og redundant information blive fjernet. Emnekort kan 

repræsenteres i en række formater, herunder et standardiseret XML-format kaldet 

XTM, og bruges ofte som grundlag for udvikling af semantiske portaler og lignende. 

I forhold til in tegration af heterogene, distribuerede interoperabilitetsaktiver har 

emnekort den fordel, at de bygger på en meget fleksibel datamodel, der tillader en 

kombination af forskellige organiseringstilgange. F.eks. kan man med emnekort 

integrere ontologier/begrebssystemer, taksonomier og folksonomies, dvs. sæt af 

brugergenererede tags. Og lige netop denne mulighed vil være oplagt, når det gælder 

om at skabe en bedre sammenhæng mellem interoperabilitetsaktiver af den type, der 

blev nævnt ovenfor. Figur 1 illustrerer således, hvordan konceptuel viden (her fra det 

sociale område) kan kobles til en taksonomisk struktur, der klassificerer relevante 

OIOXML-skemaer, som igen er tagget med et eller flere brugergenererede tags, mens 

figur 2 vi ser, hvordan koblingen konkret kan ske ved, at to (eller flere) emnekort 

flettes sammen, hvorved emner med samme identifikator automatisk lægges sammen, 

i dette tilfælde to OIOXML-skemaer. 

Visionen for anvendelsen af Topic Maps i digital forvaltning er således at kunne 

generere, mere eller mindre automatisk, digitale emnekort, der i standardiseret form 

kortlægger, organiserer eller integrerer data fra diverse interoperabilitetsaktiver. 

Sådanne ”OIO-emnekort” vil i sig selv være åbne overlejrede datastrukturer, der 

maskinelt kan behandles, udveksles eller sammenflettes, og som kan fungere som 

navigeringsværktøjer eller portaler i forbindelse med browsing og søgning. 


FIGUR 1. Integration af ontologi, taksonomi og folksonomy i et emnekort. 

FIGUR 2. Emner (fra forskellige emnekort) sammenflettes, hvis de har samme emneidentifikator. 


OIO-EMNEKORT 

Det er uden for rammerne af denne korte artikel at diskutere nøjere, hvordan OIOemnekort 

bør eller kan modelleres og struktureres. Men det kan måske være på sin 

plads lige at eksemplificere, hvordan begrebsmæssige oplysninger og OIOXML rent 

faktisk kan integreres og repræsenteres i XTM 2.0, det nyeste XML-format til 

udveksling af emnekort. Nedenfor ses et eksempel på dele af et simplificeret, fiktivt 

emnekort, der indeholder udvalgte oplysninger om et enkelt begreb, nemlig ”enke”, 

herunder dets OIOXML-repræsentation. Det fremgår således af emnekortet, at ”enke” 

er et OIO-begreb, hvis emneindikator kan findes på en nærmere angivet webadresse på 

Digitaliser.dk; at begrebet har navnet, eller termen, ”enke” på dansk; og at der til 

begrebet er knyttet en informationsressource af typen OIOXML, som har værdien 

widow. 

 

 

 

 

 

 

 

 

 

 

enke 

 

 

 

 

 

 

widow 

 

 

 

.. 

 

Læg mærke til, at elementet: 

• er den container, som indeholder selve emnekortet 

• indeholder alle oplysningerne om et enkelt emne 

• angiver emnets type 

• er koden for emnets identifikator 

• angiver emnets navn samt i hvilken kontekst (scope), dette navn er 

gyldigt 

• giver oplysninger om en informationsressource, der er knyttet til 

emnet 

• viser, hvilken type denne informationsressource har 


• indeholder informationsressourcens indhold, som i dette 

tilfælde i sig selv er et XML-element, dvs. 

Bemærk også, at symbolet #, som optræder i attributten ”href” i elementet ”topicRef” 

angiver, at der er tale om en reference til et selvstændigt emne. Selvstændige emner er 

således typeangivelser som ”OIOConcept” og ”OIOXML” og sproget dansk ”DA”. 

Disse emner er dog af overskuelighedshensyn udeladt i eksemplet. 

AFSLUTTENDE BEMÆRKNINGER 

Forudsætningen for, at brugbare OIO-emnekort kan genereres og sammenflettes på 

basis af udtræk af datasæt fra interoperabilitetsaktiver som begrebssystemer, termbaser 

og OIOXML-skemaer, er dog nok, at disse datasæt i højere grad ”sættes fri”, end 

tilfældet er i dag. Det vil især sige, at de: 

• frigøres fra system- og rettighedsmæssige bindinger 

• udstilles i veldefinerede og f orudsigelige strukturer og i et standardiseret 

maskinlæsbart format, f.eks. via et REST API 

• udstyres med konsistente identifikatorer 

Det vil med andre ord sige, at ethvert fagligt begreb på eksempelvis 

socialebegreber.dk eksempelvis bør kunne tilgås ved hjælp af en logisk URL, og at 

man via denne URL automatisk er sikret relevante oplysninger om begrebet i en 

veldefineret og gennemskuelig struktur i XML. 

En URL på socialebegreber.dk kunne se således ud: 

http://www.socialebegreber.dk/begreber/maalgruppe/ADHD 

Her angiver adressen et bestemt begreb (ADHD) inden for et nærmere emne 

(målgruppe) inden for et specifikt domæne, nemlig det sociale område. 

Og aktiveringen af denne URL kunne generere en simpel XML-struktur som f.eks.: 

 

b345 

http://www.socialebegreber.dk/begreber/maalgruppe/ADHD 

 

ADHD 

udviklingsforstyrrelse, der er kendetegnet ved 

opmærksomhedsforstyrrelse og/eller hyperaktivitet og 

impulsadfærd 

... 

 


(Oplysningerne er her taget fra begrebsdatabasen på socialebegreber.dk). 

Der vil altså her være tale om en slags kontrakt, der sikrer, at et givet sæt af data altid 

udstilles på samme måde, uanset hvordan disse data er organiseret eller teknisk 

implementeret i d et underliggende it-system på det pågældende website, her 

socialebegreber.dk. 

REFERENCER 

Garshol, L.M (2004): Metadata? Thesauri? Taxonomies? Topic Maps! Making sense of it all. 

(http://www.ontopia.net/topicmaps/materials/tm-vs-thesauri.html). 

Garshol, L.M. & Moore, G. (red.) (2006): Topic Maps – XML Syntax. 

ISO/IEC JTC1/SC34. Information Technology - Document Description and Processing Languages. 

(http://www.isotopicmaps.org/sam/sam-xtm/). 

Johnsen, L. (2009): National Data Standardization: A Place for Topic Maps? (upubliceret). 


Terminologisamordning inom svenska 

myndigheter 

Ny språklag på väg 

Anna-Lena Bucher 


+46 8 446 66 18, anna-lena.bucher@tnc.se 

Abstract. TNC fick 2003 e tt särskilt bidrag från Näringsdepartementet för att föreslå hur en 

utvidgad terminologisk infrastruktur för Sverige (TISS) skulle kunna se ut. I TNCs förslag 

framhölls särskilt två viktiga komponenter: 1. en allmänt tillgänglig rikstermbank borde 

utvecklas – av TNC (!) och 2. inom varje myndighet, företag och organisation borde det finnas 

en funktion för terminologisamordning och terminologiarbete. Den första punkten har redan 

förverkligats: Rikstermbanken lanserades den 19 mars 2009. Den andra punkten, 

terminologisamordning på myndigheter, ser nu också ut att kunna bli verklighet i en mycket 

större omfattning än vad som hittills varit fallet. Den 1 juli 2009 kommer nämligen den svenska 

riksdagen att anta en språklag som innehåller bestämmelser om svenska språket, de nationella 

minoritetsspråken och det svenska teckenspråket. I lagens paragraf 12 sägs det: ”Myndigheter 

har ett särskilt ansvar för att svensk terminologi inom deras olika fackområden finns tillgänglig, 

används och utvecklas.” Med den nya lagen uppstår nya möjligheter för TNC. Vilka dessa nya 

möjligheter är och hur utvecklingen och spridningen av terminologiarbete i myndighetsvärlden 

kan se ut kommer att belysas i föredraget. 

Bakgrund 

Under 16 månader mellan oktober 2002 o ch december 2003 fick Terminologicentrum 

TNC en särskild finansiering av Näringsdepartementet för att genomföra en 

studie om hur en utvidgad terminologisk infrastruktur skulle kunna se ut, vari ingick 

en studie av det terminologiska landskapet i Sverige. Anledningen till att 

Näringsdepartementet ville att TNC skulle göra studien vid just denna tidpunkt var 

den pågående utvecklingen av den svenska e-förvaltningen. 

Studien lyfter fram två ingredienser som särskilt väsentliga i en terminologisk 

infrastruktur. Det ena är en terminologiportal på Internet där en nationell termbank, 

Rikstermbanken, skulle stå i centrum. Det andra är organisatorisk terminologisamordning 

i form av ett nätverk av personer på myndigheter och företag med 

terminologiarbete som sin främsta arbetsuppgift. 


Rikstermbanken 

Nu har Rikstermbanken blivit verklighet. Den gjordes allmänt tillgänglig den 19 

mars 2009 oc h invigningen skedde med viss pompa och ståt. Mottagandet har varit 

positivt vilket illustreras i följande presscitat: 

”Rikstermbanken […] är en gåva till mänskligheten och särskilt till fackfolk och 

översättare.” 

”Jag sökte också på ”lane departure warning”, på både svenska och engelska, men 

fick ingen träff. Det kanske inte är en term? Den naturliga frågan blir då: Vad är en 

”term”? Träff! […] Och ett ”begrepp” – vad är det? […] Ja, så kan man hålla på. 

Utan att det kostar några pengar.” 

”Nu har nämligen Rikstermbanken öppnat. […] Kolla gärna under rubriken Källor 

så ser ni att den gör fog för namnet bank. Det är det ju inte alla banker som gör 

nuförtiden.” 

Men det finns också uttryck för besvikelse för att en viss term saknas: 

”Söker man på ”ord” hittar man däremot ingen definition. Ordet ”ord” skulle 

alltså inte vara en term enligt Rikstermbanken. Fast det är nog snarare ett uttryck för 

att databasen, trots sina 54 962 termposter, än så länge är rätt begränsad.” 

I och med lanseringen av Rikstermbanken är vi alltså i mål med en viktig del i den 

svenska terminologiska infrastrukturen. 

Terminologisamordning 

Med samordning menar TNC ungefär detsamma som man menar i en statlig 

offentlig utredning 1 

: 

”aktivitet som innebär att se till att den verksamhet som bedrivs av olika samhällsorgan genomförs 

med utgångspunkt i gemensamma utgångspunkter och att själva genomförandet inte präglas av 

divergerande mål mellan olika samhällsorgan”. 

Här kan man enkelt byta ut ”verksamhet” mot terminologiarbete för att förstå vad 

terminologisamordning skulle kunna stå för. Det säger dock inget om hur en sådan 

terminologisamordning rent praktiskt kan uppnås och vilka åtgärder som krävs. 

TNC har fört fram idén om ett nätverk av så kallade terminologisamordnare i flera 

olika sammanhang under de senaste tre–fyra åren. Bland annat ordnade TNC ett 

seminarium för terminologiskt intresserade personer på myndigheter hösten 2006. Där 

1 SOU 2007:31 Alltid redo! En ny myndighet mot olyckor och kriser 


skisserade vi en modell för hur terminologisamordning i myndighetsvärlden skulle 

kunna se ut. Viktiga förutsättningar är förstås att personer utses och att tid och medel 

avsätts. Men det handlar i nuläget också om att förse dessa personer med argument för 

terminologiarbetet och om att konkretisera det, till e xempel genom att visa vilka 

verktyg (bland annat Rikstermbanken) som redan finns tillgängliga. 

Följande arbetsuppgifter är tänkbara för en terminologisamordnare på en 

myndighet. Terminologisamordnaren ska: 

1. informera internt om att terminologisamordning sker på myndigheten och vad detta 

innebär 

2. identifiera delfackområden som är specifika för myndigheten och inventera 

terminologi inom dessa 

3. hantera enstaka termfrågor från de anställda samt dokumentera både frågor och 

svar 

4. bilda nätverk eller grupper inom myndigheten av experter inom olika 

delfackområden 

5. medverka i harmonisering och samordning av olika terminologier, inom och mellan 

myndigheter 

6. initiera projekt där terminologi inom myndighetens delfackområden utreds 

7. medverka till att nya svenska termer skapas för till exempel EU-specifika begrepp 

8. se till att myndighetens terminologi finns lätt åtkomlig samt ansvara för kontinuerlig 

uppdatering av det som är publicerat 

9. delta i nätverksaktiviteter som rör språk och terminologi 

10. ha klart för sig hur termer hanteras i myndighetens arbete med klarspråk 

11. utarbeta och tillhandahålla en intern handledning över hur terminologisamordning 

på myndigheten ska se ut 

12. ha kontakten med TNC och anlita TNCs kompetens när det är befogat. 

Den nya svenska språklagen och dess paragraf 12 om 

myndigheternas terminologiansvar 

Under årens lopp har TNC idkat lobbyverksamhet för idén med 

terminologisamordning inom den offentliga förvaltningen, med viss framgång. Ett 

mycket tydligt exempel på framgångsrikt lobbningsarbete måste paragraf 12 i Sveriges 

nya språklag anses vara. Den paragrafen tilldelar myndigheterna ett eget ansvar för 

den egna terminologin. 

Den svenska språklagen antogs av riksdagen den 20 m aj i år (2009) och lagen 

trädde i kraft den 1 j uli 2009. Lagen lagfäster svenskan som huvudspråk i Sverige, 

vilket betyder att svenska ska kunna användas inom alla samhällsområden. Detta 

ställer förstås krav på att svenskan, och särskilt svensk terminologi, utvecklas och 

används också inom högre utbildning och forskning. 

Paragraf 12 av språklagen lyder: 

”Myndigheter har ett särskilt ansvar för att svensk terminologi inom deras olika fackområden finns 

tillgänglig, används och utvecklas.” 


Myndigheterna ska alltså se till att deras terminologi ”finns tillgänglig, används och 

utvecklas” – en skrivning som mycket väl omfattar det som TNC avsett med 

terminologisamordning. Fortfarande återstår dock att konkretisera dessa tre typer av 

terminologiansvar. 

Trots att det kan ses som en framgång att lagen innehåller en paragraf om 

terminologi, har den paragrafen tyvärr inte varit särskilt uppmärksammad, varken i 

samband med presentationen av lagförslaget eller efter det att lagen antagits i 

riksdagen. Om man läser snabbprotokollet från riksdagsdebatten den 20 maj är det 

heller ingen riksdagsledamot som särskilt berör paragraf 12. Debatten handlar i stället 

om vilket parti som först kom på idén att Sverige skulle ha en språklag (mycket 

utrymme i debatten ägnas åt detta) och hur lagens intentioner ska kunna förverkligas. 

Man pratar om läsfrämjande åtgärder med hänvisning till att bokläsandet har minskat 

på en del håll, om behovet av undervisning i skolan i dialekter och attitydförändrande 

insatser avseende dialekter, om stärkandet av minoritetsspråken och teckenspråket, om 

vikten av att svenskan inte trängs undan i EU – men inte ett ord om terminologi. En 

vänsterpartist påpekar att svenska språkets ställning inom forskning och högre 

utbildning har behandlats styvmoderligt i regeringens proposition, men närmare 

fackspråk än så kommer inte debatten. Det är på något vis symptomatiskt för den 

breda språkdebatten i Sverige i dag: man talar gärna om språkets estetiska sida och 

ofta ligger debatten på en övergripande nivå, till exempel svenskan i EU och i 

forskning och högre utbildning. Många talar om risken för domänförlust och om 

vikten av den semantiska interoperabiliteten i samband med utvecklingen av eförvaltningen 

– men nästan ingen utanför TNC kommer in på vilka konkreta 

handlingar som behövs för att undvika domänförlust – eller uppnå domänvinster – och 

för att möjliggöra en semantisk interoperabilitet. Som slagord fungerar ändå 

domänförlust och semantisk interoperabilitet, närmare precisering behövs inte. 

Det återstår alltså en del arbete för att konkretisera paragraf 12. Fortfarande är det 

en viktig pedagogisk uppgift för oss terminologer att ständigt missionera, förklara, 

argumentera och visa exempel på när terminologiarbete behövs i samhället. Mycken 

okunskap råder alltjämt om terminologiarbetets natur och syfte, därför ”glöms” ofta 

paragraf 12 bort när språklagen debatteras bland politiker, språkfolk och journalister. 

Men i och med lagen och paragraf 12 ha r TNC fått en ny bas att utgå ifrån i sin 

pedagogiska uppgift; myndigheterna kan inte längre blunda utan måste se till att de 

ägnar terminologifrågorna viss uppmärksamhet. En ny uppgift – och utmaning – för 

TNC blir att verka för att paragrafen efterlevs. 

Vilka är myndigheterna och hur bör de ta sitt 

terminologiska ansvar? 

Beroende på hur man definierar ”myndighet” kan antalet svenska myndigheter 

variera. Som högst brukar man räkna att Sverige har cirka 300 m yndigheter. I den 

vidaste definitionen inräknas också universitet bland myndigheter. Då uppstår förstås 

frågan om vilket som är ”deras olika fackområden”. Universitetsadministration, kurs- 


och studieplanering i den högre utbildningen, är naturligtvis ett fackområde, men 

universiteten arbetar ju inom ett stort antal fackområden via sin undervisning och det 

finns många fackområden som det undervisas i på många universitet. Hur ska man 

göra här? 

TNC har den uppfattningen att det ska bildas termgrupper bestående av ett nätverk 

med representanter för olika universitet, privata företag och myndigheter när det är 

relevant. Termgruppsmodellen fungerar bra för sådant här fortlöpande terminologiarbete 

som berör många olika organisationer. I Sverige finns redan Svenska 

datatermgruppen, Svenska biotermgruppen och Svenska optiktermgruppen. Flera 

liknande termgrupper kan behöva bildas nu. För ett sådant här terminologiarbete kan 

definitionerna i Rikstermbanken vara både ett bra underlag och fungera som en 

katalysator för själva arbetet. 

Lagens efterlevnad 

Språklagen är en ramlag vilket betyder att den ger riktlinjer. Det finns andra lagar 

som också säger något om språk och språkbehandling och dessa ”tar då över” 

språklagen. Till exempel säger minoritetsspråklagarna att enskilda har rätt att i s ina 

kontakter med förvaltningsmyndigheter och domstolar använda samiska, finska och 

meänkieli. 

Det är också en skyldighetslag vilket betyder att det allmänna har vissa skyldigheter 

när det gäller språket i samhället. 

Språkrådet, sedan 2007 en statlig myndighet, kommer att ha uppgiften att 

kontrollera hur lagens intentioner uppfylls och de har av den anledningen för 2010 fått 

ett utökat statligt bidrag. I sin förberedande planering räknar man inom Språkrådet 

med att uppgiften kan bestå i att göra stickprov och titta på myndigheternas utåtriktade 

texter. Är texterna skrivna på ett vårdat, enkelt och begripligt språk? Språkrådet 

kommer att titta på vilka universitet och högskolor som har uttalade principer för 

språkval, och hur dessa ser ut. Hur många engelskspråkiga doktorsavhandlingar som 

skrivs i Sverige har en sammanfattning på svenska? Hur ser situationen ut vad gäller 

tolkning och översättning till svenska inom EUs organ? Hur många grundskoleelever 

går i friskolor med engelska som undervisningsspråk, hur utvecklas dessa elevers 

svenskkunskaper? Språkrådet kommer också att behöva välja vilken eller vilka 

paragrafer man ska fokusera på under en viss period. Enligt uppgifter från Språkrådet 

kommer man att börja med att undersöka hur det ser ut med undervisning på engelska 

på universiteten. 

När det gäller paragraf 12 är TNC och Språkrådet överens om att TNC har en viktig 

roll när det gäller att se hur den paragrafen efterlevs. Det innebär, som vi ser det, att 

TNC har ansvaret för att redovisa hur det står till med det offentliga terminologiska 

landskapet. Det bör förstås också vara TNC som genom särskilda uppdrag på olika sätt 

stöttar myndigheterna i deras terminologiarbete. Det är viktigt att alla myndigheter lär 

sig samma metoder för sitt terminologiarbete, och poängen med det är att få ett 

kvalitativt bättre och mer enhetligt resultat tvärs över alla myndigheter. Vi vill också 

starkt understryka att man ska satsa resurser på själva terminologiarbetet och inte på 

att bygga några interna IT-verktyg för publicering av resultatet, till det finns nu 


Rikstermbanken – där kan alla terminologiska ordlistor samlas och göras lätt 

tillgängliga för alla, vilket enkelt realiserar en del av ansvaret i paragraf 12. 

Trots att många myndigheter, de flesta, inte har terminologer anställda eller någon 

terminologisk samordningsfunktion, har ändå många ordlistor på sina webbplatser. 

Syftet med dessa ordlistor är inte alltid att effektivisera kommunikationen internt. De 

är snarare avsedda att vara till stöd för medborgarna när de besöker myndighetens 

webbplats; myndigheten förklarar där några för verksamheten centrala termer. På 

Åklagarmyndigheten förklaras till exempel vad en ”åklagare” är, medan Ekonomistyrningsverket 

förklarar vad ”ekonomisk styrning” är. Ordlistorna, som sägs ge 

förenklade och korta förklaringar, är avsedda både för en intresserad allmänhet och för 

dem som arbetar med ämnesinriktade frågor. Ofta är det myndigheternas 

informationsavdelningar som utarbetat ordlistorna. 

Dessa ordlistor är av skiftande kvalitet, kanske bland annat därför att de har en bred 

målgrupp. Dessutom är de många gånger ett engångsarbete, det vill säga de uppdateras 

inte regelbundet, och de kan i många avseenden vara ofullständiga. 

Sammanfattningsvis kan man säga om förutsättningarna för efterlevnaden av 

paragraf 12: Vi på TNC tror att det är bra att Rikstermbanken kom först och språklagen 

sedan. Rikstermbanken har redan visat sig fungera som en katalysator och den 

har väckt den terminologiska medvetenheten på många håll. Rikstermbanken kan 

därför bana väg för utbyggnaden av myndighetsinterna terminologisamordningsfunktioner. 

Utmaningar 

TNC ser en rad utmaningar för verksamheten om paragraf 12 s ka få den verkan 

som lagen avser. Vilka är då utmaningarna förutom att konkretisera paragrafens 

innehåll i tänkbara åtgärdssteg? Här kommer några av de viktigaste: 

1. Eftersom terminologikompetens är en bristvara i Sverige måste TNC medverka till att 

alla som ska arbeta med terminologi inom myndigheterna får en grundläggande 

utbildning i terminologiarbetets metoder och principer. Vi måste utbilda och sälja 

terminologisk kompetens, men vi får inte göra oss själva överflödiga! 

2. Vi måste också sälja in att våra tjänster behövs även efter det att myndigheten 

utbildat egna terminologer. Varför? Jo, TNC måste alltid ha en bredare erfarenhet 

och en djupare kompetens, vi måste ha en bättre överblick än de enskilda 

myndigheterna. Vi måste fortsätta att vara bäst på att bedöma kvaliteten i de 

enskilda myndigheternas terminologiarbete och kunna ställa krav på kvaliteten 

eftersom terminologierna ska komma in i Rikstermbanken som TNC förvaltar. 

3. Vi bör börja tala om ”terminologisk konsekvensanalys” i våra kontakter med 

myndigheterna. Visa med tydliga exempel vilken roll terminologin spelar i alla 

dokument och vad som kan hända om man inte har överblick, samordning eller 

ordning och reda. Vidare bör beslut fattas på goda terminologiska grunder. 

4. Vi måste klargöra förhållandet mellan att göra ordlistor på webben som ska vara till 

stöd för allmänheten och ordlistor som syftar till att effektivisera kommunikationen 

internt. I det sammanhanget måste vi också tala om klarspråksarbetet, som har fått 


stor framgång på många myndigheter, och dess förhållningssätt till terminologi. 

Klarspråksarbete uppfattas ibland som en motsättning till terminologiarbete men vi 

menar att man måste framhålla att de båda arbetssätten kompletterar varandra. 

5. Vi måste framhålla att terminologi är betydelsefullt för svenskans ställning och 

användning i EU. När myndigheterna ska hjälpa EU:s översättare är det viktigt att de 

angriper ”översättningen” av termer med terminologiska metoder. 

6. Vi måste få universiteten, forskning och högre utbildning att förstå att de inte kan få 

till en parallellspråkighet eller sammanfattningar på svenska på avhandlingar om de 

inte också investerar i ett terminologiarbete. 

7. Just nu är även Sverige drabbat av den finansiella krisen. TNC har fått besked från 

både Näringsdepartementet och Kulturdepartementet om att de måste ha en viss 

återhållsamhet när det gäller finansiering av termgrupper eller förvaltning och drift 

av Rikstermbanken. Även hos myndigheterna själva finns en återhållsamhet just nu, 

många har anställningsstopp och man anlitar utomstående konsulter i mindre 

utsträckning än annars. Frågan är då om man anser att man kan sätta igång med 

terminologiarbete? Vår utmaning blir att visa att det kan vara mycket lämpligt att 

satsa på ett sådant infrastrukturellt arbete just i ekonomiskt svåra tider, eftersom det 

är en bra förberedelse till de bättre tiderna. 

8. Vi måste, oavsett finanskris eller inte, utveckla kringtjänster som ger oss stöd för 

driften av Rikstermbanken. Och vi har börjat planera för sådana. 

9. Sist men inte minst: Vi måste ständigt, ständigt arbeta för att höja den 

terminologiska medvetenheten i samhället ett par nivåer. 

Terminologisk medvetenhet 

Avslutningsvis vill jag med ett citat visa hur sådan terminologisk medvetenhet som 

TNC efterlyser kan se ut. Det är hämtat ur ett förord till en terminologisk ordlista som 

görs inom Dietisternas Riksförbund. Arbetet sker helt ideellt och med stor entusiasm 

bland förbundets medlemmar. De motiverar varför de arbetar med sin terminologi så 

här, något som fler borde kunna skriva under på: 

- Terminologin ska ligga till grund för ett gemensamt fackspråk för dietister. 

- Terminologin ska förbättra, underlätta och standardisera dokumentation och 

utvärdering av behandlingen. 

- Terminologin ska underlätta kvalitetsarbete, t.ex. utveckling av standarder, riktlinjer, 

behandlingsplaner och kvalitetsregister. 

- Terminologin ska underlätta forskning genom ett väl definierat fackspråk. 

- Terminologin ska tydliggöra dietistens yrkesroll. 2 

ReferensER 

Bucher, A.-L. (2007). Terminology work the Swedish way. In Terminologija 14. Vilnius: Lietuvių 

2 Dietisternas Riksförbund, 2009 


kalbos institutas, ss. 37–48, ISSN 1392-267X 

Bucher, A.-L. (2008). Terminologiepolitik und Terminologieinfrastruktur in Schweden, In: eDITion, 

Ausgabe 2/2008, Deutscher Terminologie-Tag e.V. (DTT): Heidelberg, ss. 21–24, ISSN 1862-023X 

Bilaga: Språklagen 

Lagens innehåll och syfte 

1 § I denna lag finns bestämmelser om svenska språket, de nationella 

minoritetsspråken och det svenska teckenspråket. Lagen innehåller även bestämmelser 

om det allmännas ansvar för att den enskilde ges tillgång till s pråk samt om 

språkanvändning i offentlig verksamhet och i internationella sammanhang. 

2 § Syftet med lagen är att ange svenskans och andra språks ställning och användning i 

det svenska samhället. Lagen syftar också till att värna svenskan och den språkliga 

mångfalden i Sverige samt den enskildes tillgång till språk. 

3 § Om en annan lag eller en förordning innehåller någon bestämmelse som avviker 

från denna lag, gäller den bestämmelsen. 

Svenska språket 

4 § Svenska är huvudspråk i Sverige. 

5 § S om huvudspråk är svenskan samhällets gemensamma språk, som alla som är 

bosatta i S verige ska ha tillgång till och som ska kunna användas inom alla 

samhällsområden. 

6 § Det allmänna har ett särskilt ansvar för att svenskan används och utvecklas. 

De nationella minoritetsspråken 

7 § D e nationella minoritetsspråken är finska, jiddisch, meänkieli, romani chib och 

samiska. 

8 § Det allmänna har ett särskilt ansvar för att skydda och främja de nationella 

minoritetsspråken. 

Det svenska teckenspråket 


9 § Det allmänna har ett särskilt ansvar för att skydda och främja det svenska 

teckenspråket. 

Språkanvändningen i offentlig verksamhet 

10 § S pråket i domstolar, förvaltningsmyndigheter och andra organ som fullgör 

uppgifter i offentlig verksamhet är svenska. I annan lag finns särskilda bestämmelser 

om rätt att använda nationella minoritetsspråk och annat nordiskt språk. När det gäller 

skyldigheten för domstolar och förvaltningsmyndigheter att anlita tolk och att 

översätta handlingar finns det särskilda bestämmelser. 

11 § Språket i offentlig verksamhet ska vara vårdat, enkelt och begripligt. 

12 § Myndigheter har ett särskilt ansvar för att svensk terminologi inom deras olika 

fackområden finns tillgänglig, används och utvecklas. 

Svenskan i internationella sammanhang 

13 § Svenska är Sveriges officiella språk i internationella sammanhang. 

Svenskans ställning som officiellt språk i Europeiska unionen ska värnas. 

Den enskildes tillgång till språk 

14 § Var och en som är bosatt i Sverige ska ges möjlighet att lära sig, utveckla och 

använda svenska. Därutöver ska 

1. den som tillhör en nationell minoritet ges möjlighet att lära sig, utveckla och 

använda minoritetsspråket, och 

2. den som är döv eller hörselskadad och den som av andra skäl har behov av 

teckenspråk ges möjlighet att lära sig, utveckla och använda det svenska 

teckenspråket. Den som har ett annat modersmål än de språk som anges i första 

stycket ska ges möjlighet att utveckla och använda sitt modersmål. 

15 § Det allmänna ansvarar för att den enskilde ges tillgång till språk enligt 14 §. 


Koll på innehåll igen: 

Vad har kommit med i Rikstermbanken? 

Claudia Dobrina a och Henrik Nilsson b 

a Terminologicentrum TNC, Västra vägen 7 B, SE-169 61 Solna, Sverige, 

+46 8 446 66 07, claudia.dobrina@tnc.se 

b Terminologicentrum TNC, Västra vägen 7 B, SE-169 61 Solna, Sverige, 

+46 8 446 66 10, henrik.nilsson@tnc.se 

Abstract. Rikstermbanken öppnades på webben den 19 mars 2009. Rikstermbankens användare 

får tillgång till termer och begrepp från ett stort antal ämnesområden: ekonomi och teknik, 

juridik och humaniora. I Rikstermbanken finns till största delen termer på svenska, men också 

termer på flera av Sveriges minoritetsspråk och på andra språk, bland annat på engelska, franska, 

danska, norska, finska och ryska – i nuläget drygt 20 språk. I vårt föredrag under Nordterm 2007 

diskuterade vi våra ambitioner för innehållet i Rikstermbanken: det skulle vara omfattande, 

representativt, varierande, tillförlitligt och av god terminologisk kvalitet. I detta uppföljningsföredrag 

kommer vi att berätta om och hur våra ambitioner har förverkligats, om våra 

erfarenheter av arbetet med insamlingen och bearbetningen av olika typer av terminologiska 

data, om åtgärder (även automatiska) för kvalitetshöjning av materialet, och om kontakter med 

dem som levererat material. Frågor om aktualisering och revidering av termposter som finns i 

Rikstermbanken kommer också att beröras. Avslutningsvis kommer vi även att redovisa 

mottagandet av Rikstermbanken i Sverige och våra visioner för att utveckla termbanken vidare. 

FRÅN VISIONER TILL VERKLIGHETEN 

I vårt föredrag vid Nordterm ’07 1 tog vi upp en del krav som innehållet i vår (då) 

framtida Rikstermbanken skulle uppfylla: Rikstermbankens innehåll skulle vara 

omfattande, representativt, varierande, tillförlitligt, av god terminologisk kvalitet och 

upphovsrättsligt oklanderligt. Två år och många arbetstimmar senare är det dags för 

den första avstämningen: har vi lyckats? För att besvara vår första fråga tar vi en 

ögonblicksbild på Rikstermbankens innehåll denna oktoberdag 2009. 

Omfattande? 

Kan Rikstermbanken med sina 60 000 termposter och 250 000 termer på ett tjugotal 

språk beskrivas som omfattande? Frågan beror förstås på vad man jämför med, men 

svaret är nog: knappast. Å andra sidan befinner vi oss bara i början och inget (förutom 

förstås tid, pengar och eventuellt upphovsrättsliga frågor) hindrar att det blir fler och 

fler. 

1 Dobrina & Nilsson, 2007 


Representativt? 

Med ”representativt” menade vi att det skulle finnas termer från de mest centrala 

fackområdena samt från områden av intresse för stora användargrupper. I 

Rikstermbanken finns nu begrepp inom bland annat ekonomi och juridik, energi och 

bygg, jordbruk och medicin och miljö. Under resans gång har vi dock kommit fram till 

insikten hur värdefull information från smala fackområden kan vara. Just på grund av 

deras relativa snävhet är de oftast svårtillgängliga. Vi hoppas att terminologisamlingar 

från områden som musiketnologi, osttillverkning och anordning av lotterier hittar sina 

– och nya – användare tack vare Rikstermbanken. 

Varierat? 

Detta krav innebär att materialet i Rikstermbanken ska: 

1) täcka ett brett spektrum av terminologiska resurser – från renodlade 

terminologiska ordlistor till termdatabaser, ontologier och tesaurusar 

2) komma från olika leverantörer 

3) innehålla relevant terminologisk information på ett stort antal språk. 

1) Än så länge är alla källor i Rikstermbanken ordlistor, om än av olika slag: 

ordlistor utarbetade enligt terminologins alla regler, ordlistor som bara innehåller 

termer och deras ekvivalenter på olika språk, webbordlistor med endast några begrepp 

förklarade och gamla hederliga pappersalster (som följaktligen behövde skannas). Vad 

gäller andra typer av terminologiska resurser som vi hoppades på (ontologier, 

taxonomier m.m.) hör de fortfarande till visionerna … 

2) Drömmen om många och olika leverantörer har gått i uppfyllelse: 

300 terminologisamlingar från ett 100-tal leverantörer från Sverige och andra nordiska 

länder – myndigheter, företag, stiftelser, föreningar och privatpersoner – har lagts in i 

Rikstermbanken. Ytterligare en variationsfaktor är namnen på de terminologisamlingar 

som levererats: ”Ordlista”, ”Begreppslista”, ”Centrala definitioner”, 

”Teoretiska definitioner”, ”Några begrepp”, ”Viktiga begrepp”, ”Ordförklaringar”, 

”Vad betyder alla ord?” osv. Denna variation, kombinerad med det faktum att 

funktionaliteten hos många sökfunktioner på webbplatser, hör till det som faktiskt 

försvårat urvalsarbetet till Rikstermbanken. I varje söksystem måste man nämligen 

använda en uppsättning av ”metatermer” för att hitta fram till intressant material, och 

det finns fortfarande en stor risk att man missar intressant material. 

3) Mångspråkigheten har inte heller blivit lidande: termer på 20 språk finns 

representerade. Hur många språk som finns med i varje termpost varierar med de olika 

källorna – från enbart svenska upp till ett tiotal andra språk. Utgångspunkten i Rikstermbanken 

har varit att beskriva den svenska begreppsvärlden, och i varje termpost 

finns antingen termer på svenska eller på något av Sveriges minoritetsspråk (finska, 

meänkieli, romani chib, samiska och yiddisch). 


Tillförlitligt? 

Detta tål att diskuteras gång på gång. Med erfarenhet av drygt 300 bearbetade 

källor tycker vi att det viktigaste när det gäller en ordlistas tillförlitlighet är 

kompetensen hos upphovsmännen. Och med kompetensen menar vi i första hand 

fackområdeskompetensen men också den terminologiska kompetensen. Fackområdeskompetens 

har funnits hos många leverantörer och ett typiskt exempel är Regelsamling 

för byggande från Boverket som utarbetats av experter inom byggområdet. Med den 

terminologiska kompetensen verkar det ibland ha varit mer problematiskt – det visar 

sig i den ibland varierande terminologiska kvaliteten i de levererade samlingarna. Men 

eftersom allt som kommit in i Rikstermbanken har genomgått en terminologisk 

kontroll och bearbetats (mer om det nedan) kan man om, än med visst förbehåll, bocka 

av även detta krav. 

För att ytterligare hjälpa användaren i tillförlitlighetsbedömningen av 

Rikstermbanken har dessutom en förhållandevis stor mängd metadata inkluderats för 

varje källa. Dessutom har (i möjligaste mån) en länk tillbaka till originalkällan lagts in 

vilket gör att en användare själv kan gå tillbaka och jämföra med originalet. En risk 

för dubbellagring och misstämning mellan material som finns lagrat på två ställen 

föreligger alltid när man inte arbetar med en distribuerad databaslösning; TNCs 

lösning på detta är ett påminnelsesystem där varje leverantör uppmanas och 

regelbundet påminns att meddela eventuella ändringar i material till Rikstermbankens 

sekretariat 2 . Detta är också ett sätt att öka tillförlitligheten till en viss källa – och 

förstås till Rikstermbanken som helhet. 

Av god terminologisk kvalitet? 

God terminologisk kvalitet är som bekant resultatet av idogt arbete. Dessutom 

krävs en hög terminologisk medvetenhet och en bred terminologisk kompetens när en 

ordlista ska utarbetas. Så var inte alltid fallet med alla de ordlistor som levererades. 

Det saknades ibland definitioner, och det som kallades för definitioner var inte riktigt 

det en terminolog skulle kalla definition. Följaktligen krävs det fortfarande mycket 

arbete med att höja den terminologiska medvetenheten och många utbildningsinsatser 

för att detta krav på sikt ska kunna uppfyllas. Å andra sidan utgör de samlingar som 

utarbetats av fackexperter tillsammans med terminologer (t.ex. TNCs egna 

terminologiska ordlistor) en stor del av materialet – och de håller måttet. 

Upphovsrättsligt oklanderligt? 

Detta har vi sett till genom att bara importera material som vi fått tillåtelse att lägga 

in liksom även i någon mån det som kan anses vara ”fritt” material (visst 

myndighetsmaterial). I det brev som skickats ut till svenska myndigheter med en 

förfrågan om deras material har vi bland annat tryckt på det EU-direktiv 3 som uppmuntrar 

till vidareanvändning av offentlig information. Vi lyckades också få tillstånd 

2 

Allt arbete med Rikstermbanken har bedrivits av en projektgrupp som bestod av några TNCs terminologer. Nu efter lanseringen 

har vi skapat en särskild enhet inom TNC som har ansvaret för det fortsatta arbetet – Rikstermbankssekretariatet. 

3 

Europaparlamentets och rådets direktiv 2003/98/EG av den 17 november 2003 om vidareutnyttjande av information från den 

offentliga sektorn 


från förlag för några publicerade samlingar. I de enstaka fall detta inte var möjligt fick 

vi avstå från att ta med det materialet. 

PÅ ANDRA SIDAN SÖKGRÄNSNITTET 

FIGUR 1. Rikstermbankens sökgränssnitt (för enkel sökning). 

I Rikstermbanken finns tre huvudtyper av terminologisamlingar: terminologiska 

ordlistor från TNC (drygt 40 ordlistor) och TSK i Finland, ett stort antal terminologier 

från olika myndigheter och organisationer i Sverige samt ett urval termer och 

definitioner ur lagtexter, föreskrifter och Statens offentliga utredningar (SOU). 

TNCs och TSKs ordlistor är resultatet av ett mångårigt samarbete mellan 

terminologer och experter inom olika fackområden, som tillsammans använt 

beprövade terminologiska metoder och principer i sitt arbete. I dessa samlingar fanns i 

de flesta fall begreppsbeskrivningar i form av definitioner och kompletterande 

information (anmärkningar) samt ekvivalenter på flera språk. Till exempel har TNC:s 

geologiska ordlista svenska termer, definitioner, anmärkningar samt ekvivalenter på 

åtta språk. TSKs Mobilordlista har termer, definitioner och anmärkningar på svenska, 

finska och engelska. 

Det material som hämtades från andra organisationer visade en mycket större 

variation vad gäller terminologisk kvalitet samt mängd och typer av information i 

termposterna. I Svensk-engelsk ordlista från Migrationsverket innehåller termposten 

bara den svenska termen och dess engelska ekvivalent. I Läkemedelsverkets Svenska 

definitioner av läkemedelsformer finns både terminologiskt korrekta definitioner och 

beskrivningar som ger en viss information om begreppet utan att avgränsa det mot 

relaterade begrepp. Majoriteten av materialet hade tidigare publicerats på webbplatser, 

men det finns också exempel på material som publicerats i bokform. Materialet från de 

svenska termgrupperna utgör ett annat välkommet inslag i Rikstermbanken, det 

handlar ju om aktuella begrepp inom deras respektive områden. 

Termerna och definitionerna ur Svensk författningssamling (SFS), föreskrifter och 

Statens offentliga utredningar (SOU) ger en inblick i hur juridiska definitioner 

utformas. Dessa är inte alltid uppbyggda enligt samma principer som terminologiska 

definitioner och är i många fall nära knutna till sina respektive dokument. I de fall 


denna koppling varit alltför tydlig, och när den terminologiska kvaliteten varit för låg, 

har dessa inte tagits med (se vidare nedan). 

VÄGEN IN I RIKSTERMBANKEN 

Nu kommer vi att titta närmare på både de utmaningar som arbetet med att 

förbereda denna brokiga samling av terminologiskt material för import i en och 

samma termbank medfört, och på de lösningar som vi hitintills kommit fram till. Det 

handlar om urval, bedömningar och bearbetningar som till exempel omformatering 

(vilket bland annat innefattar borttagning av ”bokmässiga” aspekter), kompletteringar, 

språkliga och faktamässiga justeringar, men också om automatisk importkontroll – ett 

verktyg som varit en stor hjälp i bearbetningen. 

VAL AV LEVERANTÖRER 

En första fråga blev vem vi skulle kontakta och om vilket material. Lyckligtvis hade 

TNC genom sitt tidigare arbete inom infrastrukturprogrammet TISS 4 undersökt vilka 

terminologiska samlingar som finns bland olika organisationer. Dock krävdes ändå en 

hel del detektivarbete, inte minst vad gäller ordlistor som inte är publicerade som 

separata dokument utan som ingår som bilagor i till exempel rapporter och andra 

dokument. 

När det gäller själva uppsökandet av material generellt uppstår också andra frågor, 

relaterade till aspekter som representativitet och balans: Vilken av alla kommunordlistor 

ska man välja: alla eller någon viss, och i så fall, varför just den framför en 

annan? Bör man fråga alla banker som har ordlistor eller kan man nöja sig med vissa? 

Är det till exempel önskvärt att arbetsrelaterade ordlistor från både arbetsgivar- och 

arbetstagarorganisationer tas med eftersom detta kan påverka hur definitioner 

formuleras? osv. Svaret blir olika i de olika fallen, och kriterier som kvalitet och 

aktualitet har förstås varit viktiga. 

BEDÖMNING OCH URVAL 

Den första preliminära bedömningen av materialet gjordes utifrån de krav och 

prioriteringar som vi diskuterade i början av artikeln, bland annat om materialet är 

informativt, bearbetbart, tillförlitligt, aktuellt och unikt. Dessa låg till grund för ett 

urval på makrostrukturnivå, även om det bör sägas att det är enklare att bedöma enligt 

vissa av kraven, till exempel bearbetbarhet och informationsinnehåll än de tre sistnämnda. 

Just ”unikheten” är den aspekt som kan förväntas bli viktigare i takt med att 

mängden termposter i Rikstermbanken växer; då ökar nämligen också risken att ett 

visst begrepp, men en snarlik definition redan finns med. 

För urvalet på mikrostrukturnivå gällde frågan om allt i en viss samling skulle tas 

med eller om något borde tas bort. Detta förutsätter naturligtvis att innehållet kan 

tolkas entydigt vilket dock inte alltid varit fallet. Utgångspunkten här har varit att 

materialet ska läggas in i sin helhet, men i vissa fall har termposter tagits bort eftersom 

4 TISS = terminologisk infrastruktur för Sverige. Se Nilsson, 2005. 


ett visst begrepp har varit perifert i förhållande till ordlistans eller 

leverantörens huvudsakliga fackområde, 

de har varit bristfälliga på ett eller flera sätt, 

de har varit alltför interna och specifika, till exempel anpassade till en viss 

målgrupp, 

de har innehållit värderande formuleringar (ibland i form av smygreklam), 

det redan har funnits flera snarlika termposter eller termposter av högre 

kvalitet i Rikstermbanken. 

BEARBETNING 

Som man lätt kan ana har den största utmaningen varit att ensa och importera ett 

terminologiskt material som hämtats från många olika håll, ett material som utarbetats 

av personer med mycket varierande grad av terminologisk kompetens, ett material 

som producerats mellan 1940-talet och 2000-talet, ett material där många sätt att 

strukturera information finns representerade, ett material som täcker såväl 

traditionella, hårda fackområden som ”mjuka” fackområden, till exempel förvaltning 

och administration där variationen vad gäller både uttryck och innehåll är stor osv. 

Under bearbetningen var vi tvungna att hantera både teoretiska och många praktiska 

utmaningar. Som exempel på de första kan man nämna valet av definition eller 

förklaring, aktualitet kontra korrekthet, införande av termstatus och avgränsning av 

fackområde. Och de praktiska? Det räcker kanske med att nämna att ”bokmässiga 

aspekter” av samlingarna på många sätt behövde anpassas till termbanksformatet. 

Under de flesta av rubrikerna nedan förklaras de olika utmaningarna, men de lösningar 

vi kommit fram till finns också beskrivna. 

Även om det mesta av bearbetningen har inneburit uppdelning av materialet har 

även sammanslagningar av material gjorts. I de fall en viss terminologisk samling 

funnits på flera språk, men varit lagrad i separata filer har dessa slagits samman till en 

enda, flerspråkig ordlista. I sådana fall har ett ”bryggspråk”, oftast svenska, underlättat 

sammanslagningen. 

I andra existerande termbanker 5 har även termposter som innehåller olika 

information (till exempel termer på olika språk) om ett och samma begrepp slagits 

samman till en enda. Detta ställer höga krav på att det av informationen i termposterna 

säkert går att avgöra om det handlar om samma begrepp; detta har hittills inte 

genomförts i Rikstermbanken. 

Definition eller förklaring? 

Som vid all kodning av material till en termbank är det viktigt att informationen 

fördelas på ett lämpligt sätt mellan de fält som bestämts i termbanksstrukturen. Redan 

i ett tidigt skede valde vi att skilja mellan definition och förklaring, och vi införde 

därför ett förklaringsfält som alternativ till definitionsfältet. Följden av detta blev ett 

vägval mellan två möjliga typer av begreppsbeskrivningar. Enkelt uttryckt bestämdes 

det att i de fall en begreppsbeskrivning inte enkelt lät sig göras om till en termino- 

5 EuroTermbank och den iriska termbanken Focal.ie. 


logiskt korrekt definition 6 har den i stället angivits som förklaring. Felber skriver: ”If, 

for some reason or other, it is not possible to give a precise or complete definition, at 

least an approximate one should be given instead (explanation)” 7 . Vad kan det då vara 

som gör att det är svårt att klassa och koda något som en definition? Det kan till 

exempel handla om att definitionen inleds med uttryck av typen ”Med X avses”, att 

informationen är alltför generellt uttryckt för att kunna kallas definition eller att det 

saknas särskiljande kännetecken. Med tiden utvecklades också en viss praxis i fall där 

valet mellan definition och förklaring är diskuterbart; så kallade ”samlingsdefinitioner” 

8 , dvs. definitioner som inleds med ”sammanfattande benämning på” och 

liknande formuleringar, har kodats som förklaringar. 

Aktualitet korrekthet 

Vi anser att en rikstermbank bör representera de ingående källorna så väl som 

möjligt, och i viss mån även redovisa termer som inte längre används. Samtidigt måste 

en användare tydligt få veta vilken terminologi som är aktuell vid en viss tidpunkt. I 

nuläget signalerar sekretariatet en avvikelse från den ursprungliga källan med hakparenteser 

i termposten: 

svensk term: friggebod 

definition: mindre byggnad (på högst 10 kvadratmeter) [sedan 2008: 15 

kvadratmeter] som hör till ett småhus och som får byggas utan 

bygglov 

Denna typ av markering har även tillämpats för andra faktaändringar, till exempel 

Ceylon [numer Sri Lanka]” och för metaupplysningar av typen ”som uppfyller kraven 

i SS 84 21 08 (ISO 1496/3) [upphävd].” Detta system har dock nackdelar och kommer 

på sikt att ändras till ett särskilt kommentarfält på termpostnivå där sådan information 

i stället kan ges. 

Ett särskilt problem uppstår när en ordlista i Rikstermbanken innehåller termer som 

inte längre används och de nyare termerna ännu inte finns med. När den nyare termen 

inte finns med kan en ”uppehållande” kommentar anges på det sätt som angetts ovan. 

Exempel: I TNCs ordlista för arbetslivsinrikad rehabilitering (från 1995) används 

termen ”förtroendeläkare” som i dag ersatts av termen ”försäkringsläkare” inom 

Försäkringskassan. Försäkringskassan har dock ännu inte levererat material till 

Rikstermbanken och följaktligen går det inte att göra en korsreferens till en sådan 

termpost. I stället kan ett tillägg av typen ”[OBSERVERA: Informationen i den här 

termposten är föråldrad. Numer används termen ”försäkringsläkare” av Försäkringskassan.]” 

vara ett bättre alternativ än att ta bort hela termposten. Det kvarstår dock en 

del frågor kring aktualisering av material – ska till exempel samma upplysning in i alla 

termposter där ”förtroendeläkare” nämns? Och påverkas utländska ekvivalenter till 

”förtroendeläkare”? Ett särskilt problem gäller lagtexter; är terminologi som ingick i 

en tidigare lagtext som upphävts och inte finns med i den nya versionen också att anse 

som ”upphävd”? 

6 

Se till exempel ISO 704:2000 eller Terminologiguiden.. 

7 

Felber, 1984 

8 

Se vidare Nilsson, 2009 


Ett liknande problem kan uppkomma när ett material innehåller termer som av 

svenska termgrupper eller liknande (Svenska Läkaresällskapet, Svenska datatermgruppen, 

Svenska biotermgruppen och Svenska optiktermgruppen) anses mindre 

lämpliga; till exempel kan en kommentar av typen ”[OBSERVERA: Svenska 

datatermgruppen rekommenderar” eller ”Svenska Läkaresällskapet rekommenderar 

stavning med]” läggas till. 

Termval 

Om det i originalmaterialet fanns flera termer som benämner ett visst begrepp kan 

en fråga uppstå vilken av dessa som ska anges som den första. Enligt 

Terminologiguiden kan bara en av dessa anges som rekommenderad term, och en 

sådan presenteras i Rikstermbanken överst och andra (tillåtna termer) därunder. Vad 

gäller statusangivelse för de termer som ingår i en termpost används i Rikstermbanken 

statusbeteckningarna ”rekommenderad”, ”accepterad” (synonym) och ”avrådd” (som 

dessutom markeras grafiskt med överstrykning). Detta vållade inga problem när 

termstatusangivelserna fanns i det ursprungliga materialet, vilket oftast var fallet för 

TNCs egna ordlistor. För andra samlingar hade man inte alltid tydligt angivit vilken 

term som föredrogs och vi har i sådana fall försökt tillämpa ”sedvanliga” termkriterier 

(genomsynlighet, språkekonomi, etableringsgrad etc.) så som de beskrivs i ISO 704 

för att välja vilken term som ska placeras överst. Då anges inte heller uttryckligen 

”rekommenderad” i presentationen av termposten utan den tolkningen stöds endast av 

placeringen. Överlag har också tydligare, längre former valts framför kortformer. 

Jargongliknande termer, till exempel ”biträde” i Rättshjälpmyndighetens ordlista har 

placerats under den tydligare termen ”rättshjälpsbiträde”. 

Från ”bok” till termbank: korsreferenser, delar av termer, 

homonymi och polysemi 

Trots att den stora majoriteten av det material som matats in i Rikstermbanken 

utgörs av ordlistor i digital form som (oftast) varit publicerade på webben, har många 

av dessa behållit drag av traditionella, tryckta ordlistor. Just den detaljen hade kanske 

inte spelat så stor roll om det hade varit upphovsmännen själva som hade matat in sin 

ordlista i termbanken; i nuläget ledde det dock till en del problem. I många webbordlistor 

finns till exempel ofta ett stort antal termposter som endast består av en 

hänvisning till en annan termpost: ”A, se B” (till exempel ”Depå, se Aktiedepå”) 9 . En 

sådan upplysning är ganska onödig om man lagrar materialet i en termbank och 

bygger snarare på att användaren använder webben som en bok och ”rullar sig 

igenom” snarare än söker efter en viss term. Problem kan uppstå när det sedan inte 

tydligt framgår i termposten för B varför man hänvisats dit från A. I exemplet med 

”depå” ges under ”aktiedepå” endast följande upplysning: ”En tjänst som banker och 

andra fondkommissionärer erbjuder för hantering av aktier.” Är ”depå” då att betrakta 

som synonym trots att detta inte nämns uttryckligen? Normalt har detta kunnat lösas, 

9 Aktiespararna: Ordlista 


men ibland har det krävts kontakter med leverantören för att klargöra vilket 

förhållande som råder. 

I andra fall nämns det kanske något om A i förklaringen av B utan att A för den 

skull är en synonym. Då handlar det inte om synonymi utan om så kallade 

inkorporerade termer, som står för ett annat begrepp, och som man av någon 

anledning inte velat beskriva i en separat termpost. I de fall dessa inte gått att ”bryta 

ut” till en egen termpost har i stället termen angivits i ett separat fält. Detta förfarande 

medför att termen ifråga blir sökbar och det underlättar sökningen för användaren; 

hade detta inte gjorts hade användaren nämligen enbart fått träff om fritextsökning 

använts. 

Ett annat specialfall är när man låtit begreppsinformationen för en sådan 

inkorporerad term stå kvar i en termpost men ändå skapat en separat termpost för att 

där kunna återge ekvivalenterna till termen på andra språk (vilket hade varit svårt i den 

ursprungliga termposten). I sådana fall har en speciell typ av korsreferens skapats 

(med texten ”Se under”) till den termpost där begreppsinformationen finns. 

En annan typisk ”bokaspekt” som ofta lever kvar även i webbordlistor är 

användningen av parenteser för att indikera att vissa delar av termer inte är 

obligatoriska. Sådana ”platsbesparande former” har vi genomgående ”löst upp” och då 

valt att sätta den längre formen först (om inte annat indikerats i ordlistan). Ett exempel 

på detta är den engelska termen ”(acoustic) absorption factor” som kodades som två 

olika termer: ”acoustic absorption factor” och ”absorption factor”. Vissa längre uttryck 

som inte kunde anses utgöra fraser 10 har sönderdelats: en del har angetts i termfältet, 

och den andra delen (som ibland snarare kunde ses som användningsområdet) 

presenteras i webbgränssnittet inom parentes efter termen. Ett exempel på detta är det 

engelska uttrycket ”connecting box for an air terminal device” som i gränssnittet 

presenteras som ”connecting box (for an air terminal device)”. 

En annan ”bokmässig” aspekt som justerats är det i allmänna ordböcker så vanliga 

sättet att presentera alla betydelser under ett och samma uppslagsord. I sådana fall har 

vi delat upp denna information i separata termposter och givit termerna nummer (som 

gäller inom en och samma terminologisamling). Dessutom har dessa termposter när så 

varit möjligt kompletterats med angivelse om särskilt användningsområde. 

incidens 1. antalet fall av en viss sjukdom som uppträder i en befolkning under viss tid; anges t ex som 

antalet diagnoser per 1 000 invånare per år. 2. antalet av en viss studerad »händelse i en klinisk 

prövning eller kohortundersökning, dividerat med antalet deltagare i gruppen. Graden av skillnad 

mellan två gruppers incidenstal kan uttryckas genom att det ena divideras med det andra till en 

incidenskvot. (originalordlistan) 

10 Vi har också fraser som typ av benämning i Rikstermbanken. 


FIGUR 2. Exempel på uppdelning i två termposter med numrerade termer (homonymer eller 

polysemer). 

Språkliga justeringar 

När det kommer till språkliga aspekter finns inga begränsningar vad gäller de 

teckenuppsättningar som används i Rikstermbanken i dag (latin, grekiska, ryska), dock 

ingår ännu inget material på språk som skrivs från höger till vänster. Vissa av TNCs 

ordlistor hade ryska termer (translittererade) och dessa har nu fått sitt kyrilliska 

utseende tillbaka i Rikstermbanken. Däremot har japanska termer än så länge behållits 

i sin translittererade11 form. Det mesta av arbetet med den språkliga anpassningen har 

dock gällt skrivregler och teckenrepresentation. 

TNC deltar i det nationella språkvårdsarbetet och bedriver naturligtvis även 

fackspråkvård. Innehållet i Rikstermbanken måste därför också vara oklanderligt ur 

fackspråkligt skrivregelsperspektiv vilket bland annat innebär att skrivregler som finns 

beskrivna i TNCs skrivregelssamling måste följas. Stor och liten bokstav, användningen 

av bindestreck, tankstreck, punkt i förkortningar är bara några exempel där 

justeringar behövts: till exempel ändrades Monte Carlo metoden till Monte Carlometoden 

och Avtalet om ursprungsregler ändrades till avtalet om ursprungsregler. 

Särskild möda har ägnats åt att införa Unicode-koder för diverse specialtecken 

(minustecken −, dimensionskryss × med flera) och index och exponenter (i kemiska 

formler) som förekommer i många termposter. Eventuella felstavningar har 

naturligtvis även korrigerats, även för andra språk. 12 Särskild kodning har införts för 

kursiv och fet stil. 

Harmonisering på alla nivåer 

När en terminologisk samling lämnar sin ursprungliga kontext och splittras upp i 

enstaka termposter måste varje definition kunna ”stå på egna ben”. Detta får olika 

konsekvenser: när det gäller språket har vissa ordlistor ett personaliserat tilltal som blir 

underligt när inte längre en viss organisation lika tydligt är avsändare till 

informationen (även om det förstås framgår i termpostens källa). Följaktligen har, med 

tillstånd från respektive organisation, ”du” (och varianter och böjningar av detta 

uttryckssätt) ändrats till ”man” eller passiv form. Viss information – till exempel 

referenser till andra dokument eller delar av dokument, interna koder etc. – har också 

utelämnats eftersom den inte längre blir meningsfull i Rikstermbanken. Dock har 

11 Enligt Kunrei-Siki. 

12 En genomgång av tyska termer enligt modern tysk rättstavning genomförs till exempel under hösten 2009. 


elationer mellan termposter behållits om dessa uttryckts i texten språkligt eller 

grafiskt (till exempel genom fet eller kursiv stil). 

Hjälp på vägen: automatisk importkontroll 

Vår börda har blivit lite lättare att bära tack vare ett egenutvecklat verktyg för 

automatisk kontroll av det material som importeras i Rikstermbanken. Utan att 

fördjupa oss i den bakomliggande tekniken 13 kan vi här ge en liten fingervisning om 

hur det går till. Den textfil som är utgångspunkt genomsöks för inkonsekvenser och 

felaktiga kodningar. Resultatet av genomsökningen presenteras som fel och varningar. 

Felen måste korrigeras för att filen ska kunna importeras, medan varningarna kan 

förbises. Vanliga feltyper som avslöjas i importkontrollen är felaktiga fältkoder och 

homonymer utan numrering, men inte felstavning eller såklart inte fel val av fält! Av 

särskild hjälp är indikationen av felaktiga korsreferenser mellan termposter (vilket ofta 

beror på en inkonsekvent skrivning av termerna på olika ställen i ordlistan eller att 

vissa termposter tagits bort och korsreferensen därefter inte justerats) eftersom 

storleken på materialet i många fall hade gjort det nästintill omöjligt att upptäcka felet 

manuellt. 

BEARBETNINGEN I BACKSPEGELN 

När vi nu ser tillbaka på allt det arbete som vi faktiskt lagt ner på det material som 

finns i Rikstermbanken kan man konstatera att det är mångfacetterat och tids- och 

resurskrävande. Alla termposter har bearbetats mänskligt och maskinellt utifrån de 

prioriteringar och beslut som fattas under processens gång och endast vissa av dessa 

moment kan automatiseras med gott resultat. Nya samlingar har inneburit nya 

utmaningar och ibland även medfört ändringar av Rikstermbankens datamodell. Med 

tanke på bristen på litteratur som beskriver det praktiska arbetet med att samla och 

ensa brokigt terminologiskt material kan förhoppningsvis dokumentation och 

beskrivningar av det praktiska arbetet med termbanksinnehåll (som den här artikeln 

och EuroTermBanks publikationer) vara till hjälp för andra som står i begrepp att 

bygga upp termbanker. (Norge och Danmark har båda uttryckt intresse för en nationell 

termbank.) 

Man kan också se att många av åtgärderna som genomförts under bearbetningen på 

olika sätt har lett till en högre terminologisk kvalitet än vad som var fallet i det 

ursprungliga materialet (TNCs ordlistor utgör i denna respekt inget undantag). I flera 

fall har det handlat om att utnyttja den information som redan fanns i materialet men 

som inte använts i ordlistans struktur och presentation. De korsreferenser som angavs i 

originalet (till exempel genom markering med fetstil o.d.) har i Rikstermbanken 

omvandlats till klickbara länkar, men även i fall där originalkällan inte uttryckligen 

angivit detta har sådan information tillförts i möjligaste mån. På det sättet kan 

materialet utnyttjas till fullo och förutsättningar för fördjupade kunskaper om 

begreppssamband ges. 

13 Se vidare Svanberg i denna volym. 


Vi har i vissa fall även tillfört annan information i termposter för att ytterligare 

tydliggöra begreppet eller ge upplysningar om termen. Exempel på sådana tillägg är 

information om särskilt användningsområde, ordklass, böjning och uttal. 

VISIONER 

Rikstermbanken har lanserats och blir alltmer känd, använd, uppskattad och använd 

som referens. Det återstår dock en hel del att göra och vår slogan ”Alla termer på ett 

ställe” kommer att kräva mycket tid och resurser både från Rikstermbankssekretariatet 

och från alla som i framtiden kommer att försörja Rikstermbanken med material. Vi 

hoppas att den blir hela Sveriges angelägenhet – och för att komma dit behöver den 

ha: 

ökad omfattning och variation, 

ökad interaktivitet, 

ständig aktualisering, 

högre användaranpassning, bland annat genom flera sökalternativ och genom 

integrering med andra programvaror (Word, översättningsminnen), 

bredare ändamålsanpassning: Rikstermbanken ska inte bara användas för 

sökning utan också för lagring (arkivering av terminologi), för forskning och 

undervisning, 

kontinuerligt finansiellt stöd. 

Förhoppningsvis kan Rikstermbanken på ett generellt plan vara ett föredome och 

bli en angelägenhet även för andra utanför Sveriges gränser; på ett mer konkret plan 

kan detta åstadkommas genom att samsökningar med andra termbanker (IATE, 

EuroTermBank) möjliggörs eller genom att den inkorporeras i andras söksystem (till 

exempel söksystemet Quest inom EU). 

När det gäller andra typer av terminologiskt material är visionen att förutom 

ordlistor av alla slag även lägga in andra typer av terminologiskt relevant material 

(ontologier, taxonomier etc.). 

En tanke som påverkat det urval och de bearbetningar som beskrivits ovan är att 

Rikstermbanken i början befinner sig i en presentationsfas, dvs. de termposter som 

finns inom olika områden presenteras – och finns det flera för ett visst begrepp inom 

ett visst fackområde så presenteras de ”bredvid” varandra. Tanken är på sikt att denna 

fas kan övergå i en konsolideringsfas där vissa termposter kan ensas och en gemensam 

definition utvecklas som flera organisationer kan enas kring. Då har den verkligen 

blivit den viktiga komponenten i en nationell terminologisk infrastruktur 14 den är tänkt 

att vara. 

REFERENCER 

Dobrina C., Nilsson H. (2007). Koll på innehåll. Vad ska in i en nationell termbank? In NORDTERM 15 

Kunnskap og fagkommunikasjon. Oslo, ss.69–75. 

14 Se vidare Bucher i denna volym. 


EuroTermBank Consortium (2006). Towards consolidation of European Terminology Resources. 

Experience and Recommendations from EuroTermBank Project. Tilde: Riga 

Felber, H. (1984). Terminology Manual. Unesco: Infoterm. 

ISO 704:2000 Terminology work – Principles and methods. 

Nilsson, H. (2005). TISS & IATE. Svensk terminologisk infrastruktur och svensk rikstermbank. I: 

Nordterm 14: Ord og termer. (Reykjavík, Island, 9.–11. juni 2005). Reykjavík. 

Nilsson, H. (2009). The realisation of a national term bank – how and why? (under publicering). 

Suonuuti, H. (2004). Terminologiguiden: en introduktion till terminologiarbete i teori och praktik. 

Solna: Terminologicentrum TNC. 


Från Termdok på cd-rom till Rikstermbanken 

Peter Svanberg a 

a 


+46 8 446 66 15, peter.svanberg@tnc.se 

Abstract. Sveriges nationella termbank, Rikstermbanken, öppnades den 19 mars 2009 på 

webben. Vilka utmaningar stod TNC inför när terminologiska data skulle bli allmänt tillgängliga 

och lätt sökbara via en söktjänst på webben? Vad kunde användas av de tekniska lösningarna 

från utvecklingen av Termdok på cd-rom och vad nytt behövde göras för Rikstermbankens 

behov? Här ges inblickar i uppbyggnaden av programvaran, databasstrukturen, gränssnitet och i 

hanteringen av befintliga termpostdata. 

Hur det börjadE 

Den ursprungliga planen för Rikstermbanken var att använda programvaran i EUtermbanken 

IATE (http://iate.europa.eu/). Det ansågs som en bra lösning – den var 

redan utvecklad och TNC hade i ett särskilt projekt (finansierat av statliga Vinnova) 

testat programvaran och funnit den användbar för våra behov, efter vissa anpassningar. 

Men vidare efterforskningar visade att drift av IATE förutsatte innehav och drift även 

av databasprogrammet Oracle, vilket skulle bli mycket dyrt för det förhållandevis lilla 

system vi tänkte oss. Vi planerade att driva det själva på TNC, men med oklar framtida 

finansiering. Ett annat problem var att ägarskapet för IATE var oklart, vilket ledde 

till att det var svårt att få besked om huruvida vi skulle få använda programmet. 

Samtidigt fick vi tips om att det fanns en programmerare i Stockholm som arbetat med 

IATE-programvaran. Allt detta ledde till att vi beslutade att inleda egen utveckling av 

programvara för Rikstermbanken. 

TNC och NTRF 

En central fråga i utvecklingsarbetet var hur vi skulle arbeta med terminologiska data 

– vilket format skulle användas och hur skulle data redigeras? 

NTRF, Nordic Terminological Record Format (Hjulstad 1999), är ett termpostformat 

som utvecklades i ett samarbete mellan Nordiska terminologer under 1980talet, 

främst för att förenkla produktion av tryckta ordlistor. Det florerar olika ”dialekter” 

av detta format men grundprinciperna är desamma. Data lagras i enkla textfiler 

(dvs. utan någon formatering) och redigeras med ordbehandlingsprogram, normalt 

Microsoft Word. Exempel: 

KL XXX klassifikation 

svTE konvexform term 


svAVTE hanform avrådd term 

svAVTE patris 

svDF formhalva med upphöjda arbetsytor definition 

svRETE konkavform länk till relaterad termpost 

enTE positive mould term på engelska 

enSYTE male mould 

frTE moule positif term på franska 

GNGR m grammatisk information 

frSYTE poinçon 

GNGR m 

noTE konveks formdel term på norska 

noSYTE positiv form 

Varje fält hör till en viss hierarkisk nivå, som påverkar fältvärdets giltighet, se tabell 1. 

Ett fält på termnivå måste komma efter – kopplas till – det språknivåfält som det knyts 

till. Regler finns för vilka termnivåfält som får knytas till vilka språknivåfält. 

TABELL 1 . Nivåer för fält i NTRF. 

Nivå Giltighet Exempel 

postnivå hela termposten KL – klassifikation av termpostens begrepp 

språknivå för ett visst språk svTE, svSYTE, svDF – term, synonym term resp. 

definition på svenska 

termnivå för ett visst fält som tillhör 

språknivån 

GNGR – genus för en viss term 

Med dagens utvecklingsnivå inom datahantering framstår NTRF-formatet och användning 

av MS Word for redigeringen som gammalmodigt och ineffektivt. Om man 

skulle utarbeta en termdatahantering idag skulle man troligen välja en XML-lösning, 

använda XML-editorer för redigeringen och XSLT för att extrahera data på olika sätt. 

Men nu var NTRF det lagringsformat som TNC-terminologer var vana vid att hantera 

och som allt TNC:s termdatamaterial var lagrat med. För Rikstermbanken krävdes 

följaktligen att program måste utvecklas för att tolka NTRF-data. Detta gjorde att vi 

valde att använda NTRF som importformat för Rikstermbanksdata. 

Under utvecklingen och utprovningen av NTRF-tolkningen insåg vi successivt: 

• Detta att data matas in i MS Word utan några automatiska kontroller medför att 

olika typer av fel uppstår i NTRF-filer: 

◦ syntaxfel (felstavad kod, uteblivna eller oavsiktliga radbyten) 

◦ logiska fel (fel ordning på koderna) 

◦ referensfel (felstavad referens eller referens till borttagen termpost) 


• Strikt specifikation av regler saknades – data har lagrats på lite olika sätt under 

olika tidsperioder och av olika personer 

Detta fick konsekvenserna att en tydlig specifikation gjordes, som kompletterades 

efterhand, och att vi implementerade en omfattande importkontroll i systemet (se 

nedan). 

DATAMODELLEN 

Nästa fråga i utvecklingen var vilken datamodell som skulle användas i Rikstermbankens 

databas, dvs. vad som skulle lagras om varje termpost. Här valde vi att utgå 

från IATE:s hierarkiska datamodell (vilken i sin tur ungefär överensstämmer med ISO 

16642). Dess grundstruktur överensstämmer med strukturen i NTRF, så mappningen 

mellan NTRF och denna datamodell var till stora delar självklar. Men för vissa data 

krävdes en mer strikt specifikation av vad som ska lagras, och hur. 

Vi klargjorde också vissa implicita tolkningar. Ett exempel på detta var uppdelningen 

mellan term och synonym. Det finns en kod (TE) för term och en för synonym 

(SYTE). Men är det säkert en skillnad mellan dessa – är termen alltid den som rekommenderas, 

medan synonymer är mindre lämpliga och ska användas med försiktighet? 

Vi kom fram till att det bara är för vissa av de ordlistor där TNC medverkat som vi 

kan vara säkra på att en sådan uppdelning medvetet gjorts, och då bara för termerna på 

svenska. Detta ledde till att vi för varje ordlista måste ange hur dessa koder ska tolkas. 

En annan tolkningsupplysning vi insåg behövdes var hur ordklassinformation var 

kodad. Oftast var bara ordklass angiven för en term då den – för en läsare med viss 

erfarenhet av språket – inte var självklar. Men i vissa källor finns ordklassdata för alla 

termer. 

Att TNCs ordlistdata innehöll i vissa ordlistor ofullständiga termposter. I anmärkningen 

till en termpost om begreppet A nämns ibland termer för ett annat begrepp B. I 

de fall då man haft termer på andra språk för B har man gjort en termpost för B som 

saknar definition men som hänvisar till A (”se under”). Detta hanteras i Rikstermbankens 

datamodell med en riktad relation mer information finns i från termposten för 

B till termposten för A. I andra fall har bara existensen av termen för B markerats i Atermposten 

(kod UPTE, uppslagsterm). Detta hanteras med ett fält ”inkorporerad 

term” i vår datamodell. 

Förutom ovan nämnda tolkningsinformation krävdes förstås även att rena 

bibliografiska data om varje källa angavs: titel, utgivningsår, utgivare osv. Även en 

kortfattad bakgrund till och viktiga upplysningar om källan lagrades. 

Vad gäller tecken används genomgående teckenkoden Unicode. 

IMPORT TIL RIKSTERMBANKEN 

Import till Rikstermbanken sker via ett webbgränssnitt där en noggrann kontroll av 

indata görs: syntax och regler måste följas, korsreferenser kontrolleras. Dessutom görs 

försök att upptäcka och varna för vanliga fel, såsom glömda radbyten. Denna 

hantering har medfört en avsevärd kvalitetsförbättring: Många misstag i ordlistdata har 

upptäckts och rättats. 


GRÄNSSNITTET 

Rikstermbankens gränssnitt ägnade vi mycket tid åt att utarbeta. Att Rikstermbanken skulle 

finnas gratis tillgänglig för alla på webben var ju en ny situation för en termbank: Det var inte 

längre bara vi själva eller särskilt intresserade och terminologiskt kunniga som skulle använda 

den och tolka termdata utan vem som helst kunde hamna på vår webbplats. Det ställde höga 

krav på gränssnittet – det måste vara mycket enkelt att förstå. 

Den enkla sökningen, som man ser direkt på ingångssidan – hur skulle den utformas? 

Det finns många fördelar med att källspråket är känt när man gör sökning i en 

termbank: användaren slipper onödiga träffar, vissa förutsättningar om böjningsmönster 

kan göras, etc. Men hur utformar man ett enkelt gränssnitt med en språkangivelse 

så att alla förstår att man syftar på källspråket (och inte målspråket)? Vi kom fram till 

att det inte går – risken för missförstånd blir stor hur man än gör. Dessutom bedömde 

vi att nackdelarna med att komplicera det enkla gränssnittet var allvarligare än 

nackdelarna med att källspråk inte är känt. Däremot kostade vi på oss att möjliggöra 

ett val mellan sökning bara i termer respektive sökning även i andra fält. Se figur 1. 

FIGUR 1. Rikstermbankens ingångssida, med gränssnitet för enkel sökning. 

Hur träfflistan skulle presenteras var en annan stötesten. Traditionell visning i form 

av en tabell kändes omodernt, svårläst och platsineffektivt. Istället valde vi en presentation 

med en några raders sammanfattande visning av det viktigaste om varje träff – 

ungefär som i Google. Definition eller förklaring visas alltid (ev. avkortat om den är 

lång) men termer på andra språk visas inte. Tanken med detta är att användaren snabbt 

ska hitta rätt termpost, och sedan lockas att titta på hela termposten, för att få all 

information. Den sökta texten framhävs i träfflistan (med mörkare bakgrund) så att det 

är lätt att se var man fick träff i termposten. Vad som presenteras om varje termpost i 

träfflistan styrs av var matchningen skedde. Först i träfflistvisningen står alltid den 

svenska termen, men om det blev träff i en term på ett annat språk visas den termen 


också. Anmärknings- och exempelfälten visas bara om sökmatchningen endast var i 

det fältet. 

Sorteringen av träfflistan är noga genomtänkt: Termposterna i träfflistan sorteras 

efter bl.a. följande kriterier och nivåer 1 

: 

1. efter matchande språk – svenska först, sedan engelska, tyska, franska osv. 

2. efter plats – alla träffar där termen matchar först, därefter träffar i andra fält 

3. efter matchningens exakthet – träff på hela termen först, därefter träff på ett 

ord i en flerordsterm 

4. efter källas ålder – nyaste källor först 

Effekten av detta blir att först kommer alla träffar där träffen var på svenska, därefter 

de på engelska osv. Inom alla sådana delmängder (t.ex. träffar på svenska) kommer 

först alla träffar med matchning i termen, därefter de med matchning i andra fält. Inom 

varje sådan delmängd (t.ex. träffar i termen bland träffar på svenska) kommer först … 

Så fortsätter det för varje nivå. Se exempel i figur 2. 

PROGRAMMERINGSARBETET 

Programutvecklingsarbetet har utförts av en TNC-anställd (jag själv) och inhyrda programmerare 

från en konsultbyrå. Vi har använt öppen och fri programteknik: servletmotorn 

Apache Tomcat, sökmotorn Lucene, databashanteraren Mysql, programspråket 

Java, Javaprogramramverket Appfuse m.m. Utvecklingen har i stor utsträckning skett 

iterativt, dvs. genom successiva små förbättringar. Projektadministrationen har skötts 

via en webbtjänst. 

1 Med sortering i nivåer i menas att vid avgörande av ordningen mellan två objekt används först kriteriet för nivå 1. Bara om det 

inte räckte för att avgöra ordningen används kriteriet för nivå 2 osv. 


FIGUR 2. Exempel på träfflista vid sökning efter investering i alla textfält. 


VISIONER 

Självklart har vi önskemål och visioner för framtida utveckling av Rikstermbanken. Här följer 

några: 

• Stabila webbadresser (URL:er): Det finns flera som uttryckt önskemål att i 

dokument vill länka från en term i den egna texten till dess termpost i 

Rikstermbanken. För tillfället är det olämpligt, eftersom adresser in till en 

termpost inte är stabila – de kan ändras när vi ändrar i databasen. Vi tycker det 

är intressant med sådana länkar och ska försöka lösa detta problem. 

• Andra typer av sökning: Indexlista; på källkategori; expertsökning 

• Anpassning till användning på små skärmar – avancerade mobiltelefoner 

• Gränssnitt på andra språk 

• Möjlighet att göra en särskild ingång för organisationer, så att 

Rikstermbanken kan avlasta organisationen från arbetet att publicera materialet 

på egna webbplatser. 

• Hantering av begreppssystem och begreppsdiagram. 

• Exporthantering till TBX, Excel etc. 

• Dubblettkontroll/sammanslagning av termposter à la Eurotermbank 

ReferensER 

Hjulstad H., Eckmann, C. B. (1999). Nordic Terminological Record Format, Rådet för teknisk 

terminologi. 

ISO (2003). ISO 16642:2003, Computer applications in terminology -- Terminological markup framework. 


Domænemodellering som grundlag for 

terminologier og ontologier: 

afgrænsningsproblemet 

Birthe Toft 

Insitut for Fagsprog, Kommunikation og Informationsvidenskab 

Syddansk Universitet 

Engstien 1 

DK-6000 Kolding 

Abstract. Indlægget omhandler hvordan et sæt grundlæggende ontologiske og epistemiske 

kategorier, udviklet af I. Dahlberg til brug for et universelt klassifikationssystem, ICC, kan 

bruges som udgangspunkt for en checkliste med generelle, grundlæggende spørgsmål til et givet 

domæne. Det påvises gennem eksempler, at besvarelse af spørgsmålene kan understøtte såvel 

den første afgrænsning af et domæne som den indledende begrebsmodellering. Da visse 

grundlæggende epistemiske kategorier som tid og sted ikke er relevante i forbindelse med især 

rent abstrakte domæner, anbefales det her at supplere med såkaldte kognitive metaforiske 

modeller, som antages at kunne kombineres med de øvrige kategorier. 

Dette indlæg er en videreførelse af mit indlæg på TKE-konferencen i København i august 

2008 (Toft 2008), hvor jeg gjorde et første forsøg på at opstille nogle generelle retningslinjer 

for afgrænsning og indledende modellering af domæner i forbindelse med terminologiske og 

ontologiske projekter. 

Jeg mener dengang at have påvist, at det er muligt at opstille sådanne generelle - og derfor 

nødvendigvis meget overordnede - retningslinjer. I dette indlæg har jeg inddraget yderligere 

to eksempeldomæner, og jeg har justeret og udbygget retningslinjerne. Desuden har jeg 

kombineret dem med kognitive metaforiske modeller, en fremgangsmåde som især viser sig 

at være relevant i de tilfælde, hvor det på grund af domænets natur ikke er muligt at 

anvende de grundlæggende dimensioner tid, sted og position til afgrænsning og indledende 

modellering. 

En domænemodel omfatter normalt en funktionel og en strukturel del, hvoraf sidstnævnte 

svarer til en terminologisk begrebsmodel. Jeg mener at mine retningslinjer, i kraft af deres 

meget generelle karakter, har betydning for begge modellens dele. 


DE PRÆSENTEREDE PROJEKTER OG DOMÆNER 

TABEL 1. I tabellen præsenteres de fire domæner, jeg bruger som eksempler, plus de projekter som 

modelleringen af de enkelte domæner indgår i. 

Domæne Projekt: formål med modelleringen 

arkitektur 

historie 

ernæring 

økonomi 

web-portal til arkitekturinteresserede borgere 

etablering af virtuelt museum om den dansk/tyske grænseregions 

historie 

oprettelse af forbruger-webportal med ernæringsråd 

etablering af termbase/vidensformidling (undervisning) 

Domænemodelleringens indledende faser 

I litteraturen om domænemodellering lægges der som regel stor vægt på vigtigheden af at 

fastlægge et projekts purpose (formål) og scope (’omfang’, ’rækkevidde’ eller 

’dækningsområde’). De to beslutninger har naturligvis afgørende betydning for hele 

processen og for resultatet. 

Jeg har valgt at inddele den indledende domænemodellering i to faser, hvoraf den første 

består i indledende afgræsning og ’chunking’ (dvs. grovinddeling), der til dels falder sammen 

med fastlæggelse af purpose og scope, medens den anden udgøres af den indledende 

begrebsmæssige modellering. Det er ikke muligt at skelne skarpt mellem de to faser. 


Hverken i den terminologiske litteratur eller i litteraturen om vidensmodellering og 

ontologier finder man egentlige praktiske råd om, hvordan man tager de første skridt i 

domænemodelleringsprocessen. Felber og Budin (1989:222) beskriver for eksempel 

afgrænsningsprocessen forud for terminologisk behandling af et fagområde på denne måde: 

- afgræns fagområdet (det er ikke tilstrækkeligt at navngive det) 

- beskriv fagområdets omfang ved hjælp af så mange underinddelinger som muligt 

- undersøg anvendeligheden af eksisterende klassifikationer og systematisk ordnede 

indholdsfortegnelser i fagbøger 

Kun det sidste råd har vist sig at være brugbart i praksis, eksempelvis i arkitekturprojektet, 

hvor mine studerende og jeg foretog følgende ’chunking’ af domænet arkitektur på basis af 

en anbefalet lærebog (se også Bilag 1): 

- arkitekturhistorie 

- stilarter 

- grundlæggende teoretiske begreber 

- de fysiske omgivelser 

- oplevelse af arkitektur 

I økonomiske lærebøger bruges ofte nedenstående inddeling af faget. I højre side har jeg 

angivet, hvordan de enkelte dele af inddelingen kan hjælpe til at udføre indledende 

afgrænsning og ’chunking’: 

- Hvad er økonomi? 

o det økonomiske problem Afgrænsning i f.t. 

o økonomi som socialvidenskab andre videnskaber 

- mikroøkonomi 

o prissystemet 

o forbrug, produktion og omkostninger 

o markeder og prisfastsættelse 

o faktorprissættelse og indkomstfordeling ’Chunking’ 

- makroøkonomi 

o nationalindkomst og finanspolitik 

o penge, bankvæsen og pengepolitik 


Den teoretiske baggrund for retningslinjerne 

De retningslinjer, jeg foreslår, hviler som beskrevet i Toft 2008 på et systemisk og 

evolutionært videnskabsteoretisk fundament (Budin 1996, Vollmer 1983). Den direkte 

inspiration stammer fra Information Coding Classification (ICC), et universelt klassifikations- 

og vidensstruktureringsystem til brug for hele Informations- og Dokumentationsområdet, der 

blev udviklet af Ingetraut Dahlberg i 1970erne og 1980erne. I Dahlberg 1978 beskrives det, 

hvordan ICC direkte bygger på Feiblemans teori om virkeligheden som et gigantisk niveaudelt 

system af integrerede systemer (objektområder) samt dertil svarende videnskabelige 

discipliner (Feibleman 1965). 

Dahlberg byggede ICC på 9 generelle værenskategorier (ontiske kategorier), der kunne 

kombineres med 9 generelle formkategorier (epistemiske kategorier). Begge typer af 

kategorier er opdelt i hovedgrupper. 

Værenskategorierne tager udgangspunkt i virkeligheden som niveaudelt, integreret system, 

hvor graden af kompleksitet er stigende fra det nederste til det øverste niveau. I Tabel 2, der 

er udarbejdet på grundlag af Dahlberg 1982, er rækkefølgen dog af en eller anden grund den 

omvendte, således at gruppen af mest komplekse virkelighedsfænomener befinder sig 

nederst. 

TABEL 2. Generelle værenskategorier (baseret på Dahlberg 1982) 

I: stof og struktur 1. rene former og strukturer 

2. energi og stof 

3. jorden og rummet 

II: levende væsener 4. biologiske entiteter 

5. mennesker 

6. samfund 

III: artefakter 7. materielle produkter skabt af menneske eller samfund 


8. intellektuelle produkter skabt af menneske eller samfund 

9. kulturelle og åndelige produkter skabt af menneske eller 

samfund 

Formkategorierne (Tabel 3) repræsenterer en udbygning af Aristoteles’ kategorier, men 

modsat listen over værenskategorierne er de mest grundlæggende kategorier her anført 

nederst. 

TABEL 3. Generelle formkategorier (baseret på Dahlberg 1982) 

I: objekttyper 1. principper 

2. materielle objekter 

3. abstrakte objekter 

II: attributter 4. mængde 

5. egenskab 

6. relation 

III: aktiviteter 7. tilstand 

8. proces 

9. operation 

IV: dimensioner 10. sted 

11. position 

12. tid 

Menneskelig erkendelse og vidensskabelse består i følge Dahlberg i kombination af værens- og 

formkategorier, for eksempel ved at værenskategorien 6 (samfund) bestemmes og beskrives 


ved hjælp af formkategorierne 1 (abstrakt objekt) og 7 (tilstand). Bestemmelse og beskrivelse 

foregår naturligvis iterativt, hvilket vil sige, at eksisterende kombinationer af værens- og 

formkategorier indgår i nye kombinationer. 

Dahlberg beskriver den ramme, inden for hvilken kombination af værens- og formkategorier 

finder sted i ICC, som en ‘sequence of facets’ eller en ’systematifier’, der blandt andet muliggør 

systematisering af emne- og vidensområder gennem en bestemt rækkefølge af kombinationer 

af værens- og formkategorier (Dahlberg 1982: 88). I tabel 4 vises et lille uddrag af ICC-tabellen 

over emneområder, som bygger på denne ramme. 

TABEL 4. Udsnit af ICC – subject groups according to general entity areas (baseret på Dahlberg 1982) 

VÆRENSKATEGORIER FACETTER 

PRINCIP AKTIVITET RELATION 

form og struktur logik statistik ... 

energi og stof mekanik teknisk fysik kemi 

mennesker human biologi patologi og medicin psykologi 

samfund sociologi offentlig administration samfundsplanlægning 

materielle produkter økonomi teknologi generelt transport og service 

Retningslinjer i form af checkspørgsmål 

Inspireret af Dahlbergs ’systematifier’ har jeg udarbejdet en liste over checkspørgsmål til det 

enkelte domæne, baseret på værens- og formkategorierne i ICC. Spørgsmålene stilles i den 

indledende fase af domænemodelleringen. 

TABEL 5. Liste over checkspørgsmål 


1. Inden for hvilke værensområder skal viden modelleres? 

2. Hvilken grundlæggende dimension (tid, sted, position) er vigtigst? 

3. Hvordan kan dimensionerne bruges i fase 1 og 2 af vidensmodelleringen? 

4. Hvilke andre formkategorier har betydning for afgrænsning og ’chunking’? 

5. Spiller svarene på spørgsmål 1 – 4 ind på den indledende begrebsmodellering? 

Jeg mener, at svarene på disse spørgsmål bidrager til at klargøre nogle basale egenskaber ved 

domænet, og at de samtidig muliggør endelig afgrænsning samt letter den indledende 

’chunking’ og begrebsmodellering. Checkspørgsmålene giver således svar på spørgsmål som 

- hvilke ’virkelighedsniveauer’ skal modelleres, og hvilke kan følgelig udelades? 

- kan de grundlæggende dimensioner anvendes som parametre for afgrænsning og 

modellering, og i bekræftende fald hvilke? 

- hvilke andre formkategorier er i fokus, og hvilke kan der ses bort fra? 

Eksempler på besvarelse af checkspørgsmålene 

Den følgende gennemgang af de svar, jeg for de fire valgte domæners vedkommende har givet 

på de 5 checkspørgsmål, giver anledning til nogle generelle kommentarer. 


TABEL 6. Besvarelse af checkspørgsmål for domænet arkitektur. Formål: Web-portal til 

arkitekturinteresserede borgere 

SPØRGSMÅL SVAR 

1 Inden for hvilke værensområder skal viden 

modelleres? 

2 Hvilken grundlæggende dimension (tid, position, sted) 

er vigtigst? 

8 intellektuelle produkter 

9 kulturelle og åndelige 

produkter 

tid; sted og position kan 

derimod spille en større rolle i 

andre arkitekturprojekter 

3 Hvordan kan dimensionerne bruges i fase 1 og 2? tid bruges som grundlæggende 

afgrænsnings- og modelleringsparameter; 

overlapper til dels 

med ’stilarter’ (abstrakt objekt) 

4 Hvilke andre formkategorier har betydning for 

afgrænsning og ’chunking’? 

5 Spiller svarene på 1 – 4 ind på den indledende 

begrebsmodellering? 

3 abstrakte objekter (stilarter) 

8 processer (historisk udvikling) 

(deldomænet ’konkrete 

bygningsværker’ udelades) 

kategorierne ’perioder,’ 

’stilarter’ og ’grundlæggende 

arkitektoniske begreber’ 

underinddeles og forbindes så 

vidt muligt 

Kommentarer: Domænet egner sig fortrinligt til afgrænsning og modellering ved hjælp af de to 

grundlæggende dimensioner tid og sted. Valget af tidsdimensionen som den basale i netop 

dette projekt har afgørende betydning for afgrænsning og indledende modellering. 

Muligheden for at se bort fra visse formkategorier bidrager ligeledes til at lette afgrænsning og 

modellering. 

Nedenstående ses de studerendes skitse til domænemodel, udarbejdet i mind map-værktøjet 

Freemind. 



TABEL 7. Besvarelse af checkspørgsmål for domænet den dansk/tyske grænseregions historie. Formål: 

etablering af virtuelt museum 



modelleres? 


er vigtigst? 

5 mennesker 

6 samfund 

7 materielle produkter 


9 kulturelle og åndelige 

produkter 

tid; derefter sted og position 

3 Hvordan kan dimensionerne bruges i fase 1 og 2? grundlæggende afgrænsning 

sker på basis af periode (1830 – 

2000) og region (Nord- og 

Sydslesvig) 





næsten alle formkategorier 

involveret – derfor har de ringe 

betydning 

prioritering mellem 

værensområderne 6 (samfund) 

og 5 (mennesker) påvirker 

begrebsmodelleringen 

definitionen af begrebet 

’periode’ (granularitet, national 

synsvinkel) har stor betydning 

for modelleringen 

Kommentarer: projektet er afsluttet, og resultatet kan ses på nedenstående adresse 1 

. 

Checkspørgsmålene er således ikke blevet anvendt i praksis i dette projekt, men 

1 

http://www.vimu.info/general_01.jsp?lang=da&u=general&flash=true&s=B04FA8A033E6AA97CA9A 


tankeeksperimentet har været meget nyttigt. Især viser det tydeligt, hvor grundlæggende 

dimensionerne tid og sted er, og hvor nyttige de er som parametre for afgrænsning og 

chunking i mange projekter, omend langt fra i alle, som det ses af de to sidste domæner. 

I det aktuelle projekt har det inden for dimensionen tid været vigtigt – og vanskeligt – at 

definere begrebet ’periode’, idet perioder både kan være rent numeriske og dermed objektive 

fænomener (f.eks. perioden 1910-1920) og kulturelt eller nationalt definerede fænomener 

som f.eks. perioden ’den tyske besættelse af Danmark 1940 - 45’, der formentlig ikke vil spille 

nogen rolle set fra et tysk historisk synspunkt. 

TABEL 8. Besvarelse af checkspørgsmål for domænet basisernæring. Formål: Web-portal om ernæring 



modelleres? 


er vigtigst? 

2 energi og stof 


ingen af dimensionerne spiller 

nogen rolle 

3 Hvordan kan dimensionerne bruges i fase 1 og 2? ingen af dimensionerne kan 

derfor anvendes hverken til 

afgrænsning eller chunking 





1 principper (råd om ernæring) 

2 mængde 

5 egenskab 

6 relation 

de to relevante 

værenskategorier fin-inddeles, 

og deres egenskaber, indhold 

(mængde) og indbyrdes 

relationer klargøres. Endelig 

BDE2DE55F7E7. Se også Granlie og Toft (2008), der handler om projektets terminologiske og 

vidensmodelleringsmæssige aspekter. 


forbindes de med principper i 

form af råd om indtag af det 

enkelte næringsstof / den 

enkelte fødevare 

Kommentarer: I projektet drejer det sig om at angive anbefalede mængder af næringsstoffer 

samt hvilke mængder af næringsstofferne, der findes i bestemte fødevarer. På den ene side 

har man altså brug for inddeling af fødevarer og næringsstoffer i underkategorier, på den 

anden side har man brug for en række anbefalinger med hensyn til, hvilke af disse 

næringsstoffer og dermed fødevarer, der bør indgå i en sund kost. 

For dette domænes vedkommende er det den klare afgræsning af værensområderne og det 

klare fokus på de relevante formkategorier, der er resultatet af besvarelsen af 

checkspørgsmålene. Domænet er samtidig et klart eksempel på, at de grundlæggende 

dimensioner tid og sted langtfra kan anvendes som afgrænsnings- og ’chunking’-redskaber 

ved alle domæner. 

TABEL 9. Besvarelse af checkspørgsmål for domænet økonomi. Formål: etablering af termbase samt 

vidensformidling 



modelleres? 


er vigtigst? 

5 mennesker 

6 samfund 

7 materielle produkter 


ingen dimension er væsentlig 

3 Hvordan kan dimensionerne bruges i fase 1 og 2? grundlæggende dimensioner 

kan dermed ikke anvendes til 

afgræsning eller ’chunking’ 



3 abstrakte objekter 

4 mængde 




5 egenskab 

6 relation 

7 tilstand 

8 proces 

i høj grad. Der modelleres kun 

abstrakte objekter, disses 

egenskaber og indbyrder 

relationer samt de tilstande og 

processer, de indgår i 

Kommentarer: Alle svarene fortæller os, hvad vi måske godt var klar over i forvejen, nemlig at 

vi har at gøre med et rent abstrakt domæne. Ganske vist indgår værensområderne 5 - 7, 

mennesker, samfund og materielle produkter, men kun i form af abstraktioner. 

Ligesom det var tilfældet med domænet basisernæring, spiller de to grundlæggende 

dimensioner tid og sted ingen rolle for hverken afgræsning eller ’chunking’, men for økonomis 

vedkommende er årsagen udelukkende domænets rent abstrakte natur, hvilket man 

formentlig ikke kan hævde om domænet basisernæring. 

I sidste afsnit vil jeg komme ind på, hvordan kognitive metaforiske modeller så at sige kan 

erstatte de to grundlæggende dimensioner som ’skelet’ for modellering af visse domæner. 

Brug af kognitive metaforiske modeller som supplement 

Ved afgrænsning og modellering af rent abstrakte domæner kan de grundlæggende 

dimensioner tid, sted og position som nævnt ikke anvendes som redskaber til afgrænsning og 

’chunking’. For nogle domæners vedkommende kan en kognitiv metaforisk model imidlertid 

anvendes til erstatning for dimensionerne; det gælder eksempelvis for domænet økonomisk 

teori. 


Kognitive metaforiske modeller er et begreb der stammer fra eksperientiel kognitionsteori, 

hvor det antages, at erkendelse og forståelse af nye begreber forudsætter skabelse af 

omfattende kognitive modeller med metaforisk basis. Modellerne fungerer som rammer, 

inden for hvilke det er muligt at kategorisere og forstå nye vidensområder metaforisk eller 

analogt, idet viden overføres fra et erfaringsdomæne til et nyt. 

Som omtalt i Toft 2007 kan klassisk økonomiske teori betragtes som en abstraktion, der hviler 

på en såkaldt ’rod’-metafor eller ’rod’-analogi, nemlig analogien til markedet med dets aktører 

og de kræfter, der spiller ind på aktørernes beslutninger. I økonomiske lærebøger udnyttes 

markeds-analogien faktisk i praksis, især på grundlæggende niveauer. Det sker i form af det 

såkaldte økonomiske kredsløb, der bruges som visuelt redskab og som udgangspunkt for 

gennemgangen af økonomiske begreber. 

Jeg mener, at det må være muligt at ’koble’ de relevante værens- og formkategorier på den 

eksisterende rod-analogi til erstatning for de grundlæggende dimensioner tid og sted. Ikke blot 

for teoretisk økonomis vedkommende, men også for andre rent abstrakte domæners 

vedkommende. 

Alene i kraft af, at al forståelse i følge eksperientiel kognitionsteori sker via metaforisk 

overførsel af viden fra et erfaringsområde til et andet, vil det nærmest være naturstridigt ikke 

at anvende denne metode, men det er blot vigtigt, at den anvendes bevidst og konsekvent, og 

at man ved hjælp af checkspørgsmålene gør sig klart, hvornår den er anvendelig. 

REFERENCER 

Budin, G. (1996). Wissensorganisation und Terminologie. Die Komplexität und Dynamik 

wissenschaftlicher Informations- und Kommunikationsprozesse. Tübingen: Gunter Narr Verlag. 

Dahlberg, I. (1978). Ontical Structures and Universal Classification. Bangalore: Sarada Ranganathan 

Endowment for Library Science. 

Dahlberg, I. (1982). ICC – Information Coding Classification – Principles, Structure and Application 

Possibilities. International Classification 9 (1982), No. 2. 

Feibleman, J.K. (1965). Theory of Integrative Levels. Kyle, B. (ed.): Focus on Information. London: 

Aslib. 

Felber, H., Budin, G. (1989). Terminologie in Theorie und Praxis. Tübingen: Günter Narr Verlag. 

Granlie, J. & B. Toft (2008). The Virtual Museum Project – From a Knowledge Modelling and 

Implementation Point of View, i: K. Robering (ed.): Information Technology for the Virtual Museum; 


Museology and the Semantic Web. LIT Verlag. 

Temmerman, R. (2000. Towards New Ways of Terminology Description; The Sociocognitive Approach. 

Amsterdam: John Benjamins. 

Toft, B. (2007). Concept formation and indeterminacy in the LSP of Economics, i: B.E. Antia (ed.): 

Indeterminacy in terminology and LSP. Studies in honour of Heribert Picht. John Benjamins 

Publishing Company. 

Toft, B. (2008). Initial Delimitation of Domains and Initial Conceptual Modelling: Can General 

Guidelines be Devised?, i: Nistrup Madsen, B., Erdman Thomsen, H. (eds.): Managing Ontologies 

and Lexical Resources: Proceedings of the 8th International Conference on Terminology and 

Knowledge Engineering, Copenhagen Business School, 19. – 20. August, 2008. København: Institut 

for Internationale Sprogstudier og Vidensteknologi. S. 79-87. 

Vollmer, G. (1983). Evolutionäre Erkenntnistheorie. Stuttgart. 


Personaliseret information 

Emnesystematik bag kommunikation af 

videnskabelig information på Internettet 

Jørgen Burchardt 

seniorforsker, Nyt om Arbejdsliv, Nyborgvej 13, 5750 Ringe www.burchardt.name. 

Abstract. Med relativt små midler kan en emnesystematik udvikles til brug hos en videnskabelig 

nyhedstjeneste. Med eksempel fra Nyt om Arbejdsliv fortælles hvorledes man ”quick and dirty” 

kan udarbejde en emnesystematik. Den er blevet en central del af hjemmesidens systemarkitektur, 

hvorved mere end 100.000 personer hvert år finder oplysninger blandt nettets mange 

milliarder sider. En systematik er samtidig nødvendig, idet folk ikke interesserer sig for et fag, 

men oftest kun for et afgrænset emne. 

HVORFOR PERSONALISERET INFORMATION 

Mængden af viden er de seneste årtier nærmest eksploderet. Digitaliserede arkiver er 

blevet fyldt med information, og Internettet har gjort dette tilgængeligt på en fantastisk 

effektiv måde. Søgemaskiner kan give adgang til dette næsten uendeligt store materiale. 

Med få tastetryk står man med links til det materiale man ønsker. Google har i skrivende 

stund efterår 2009 indekseret mere end 17 milliarder sider. 

Som bruger kan det imidlertid godt være vanskeligt at få adgang til den ønskede 

information. Det var lettere i 1472, hvor størstedelen af verdens bøger fandtes på et 

bibliotek som Queens College med dets i alt 199 bøger. Der er nemlig et meget stort 

problem: Der er så store mængder, at søgeresultaterne oftest er så omfattende med så 

mange henvisninger, at det er blevet vanskeligt og tidskrævende at finde de rigtige 

oplysninger. ”Information overload” hedder fænomenet, hvor man bliver overbelastet 

af for mange oplysninger, så man ikke kan finde den ønskede nål i høstakken. 

Dette problem vil naturligt vokse, idet mængderne af information fortsat vil vokse. 

Problemet eksisterer ikke alene på hele nettet. Selv på hjemmesider fra 

informationsudbydere er mængden af information vokset således at det bliver umuligt 

at overskue alt materialet. På vores nyhedstjeneste Nyt om Arbejdsliv har vi mere end 

8.000 sider. Kun en målrettet søgning kan forhindre spild af tid. 

Personaliseret information er løsningen på dette ”information overload” problem. 

Der skal kun bringes de informationer, som jeg er interesseret i, og ikke alle de øvrige, 

som ville spilde min tid. 


Denne måde at organisere og vise oplysninger på er ikke ny. Kunderne hos 

Amazon.com kender til de anbefalede bøger, som firmaet anbefaler ud fra lighed med 

de tidligere købte bøger. Datamining har længe været benyttet af store ressourcerige 

firmaer. 

Denne arbejdsmåde kan også benyttes af fattigere organisationer, og 

informationerne kan ordnes på en endnu mere kvalificeret måde, end det er tilfældet 

hos Amazon.com. 

Emnesystematik er et vigtigt redskab i opbygningen af den interne infrastruktur, 

hvor det ønskes, at brugerne vælger lige præcis de emner, de er interesserede i, og som 

de til gengæld kan blive optimalt informeret om. 

ERFARINGSMATERIALET 

Jeg vil fortælle om erfaringerne fra et tværvidenskabeligt forskningsområde om arbejdsliv, 

arbejdsmarked og arbejdsmiljø. Mere end 500 danske forskere er aktive på feltet både på 

universiteter og private forskningsinstitutioner, og deres forskning bliver i stor udstrækning 

gjort tilgængelig for samfundet – lægmænd som andre forskere – gennem Internetportalen 

”Nyt om Arbejdsliv”. En del af de samme oplysninger findes på engelsk ”Working Life Info” i 

en automatisk ”spejlet” udgave. 

En emnesystematik på dansk og engelsk med en specifik udarbejdet liste over 

emneord er central i den etablerede IT-platform. Alle videnskabelige produkter – 

artikler, anmeldelser og bøger – bliver kategoriseret sammen med tilbud om møder og 

konferencer. Hvert år er der omkring 168.000 såkaldte unikke besøgende, hvilket i 

realiteten betyder, at ca. 100.000 forskellige personer benytter denne tjeneste gennem 

deres mere end 250.000 besøg. 

Vi startede op i 2003 og kan således give erfaring fra mere end 6 år videre. 

Brugernes ønsker – et emne 

Det er brugernes ønsker, som vi må tage udgangspunkt i, når vi designer en 

nyhedstjeneste på nettet. Vi har naturligvis vores egne ønsker og idéer, men når vi kommer 

til den endelige udformning, er det brugerne, vi i stor udstrækning skal tage hensyn til. 

Det var et forhold, vi meget hurtigt blev klar over, da vi havde lavet de første 

udgaver af vores hjemmeside og efterfølgende så på hvorledes brugerne i 

virkeligheden udnyttede de muligheder, vi havde stillet til rådighed for dem. Det blev 

vist gennem alle vores undersøgelser via interviews og gruppesamtaler med brugere 

samt ved analyse af logfiler. 

Vi må konstatere, at brugerne i stor udstrækning opførte sig helt anderledes, end vi 

havde forventet. Vores udgangspunkt er en forening for alle forskere inden for 

området arbejdsliv, som dækker alle områder af ”arbejdsliv”. Det viste sig hurtigt, at 

brugerne ikke interesserede sig for faget som sådan, men kun for et eller få emner. 


Det blev derfor naturligt for os, at tage udgangspunkt i brugernes behov, nemlig det 

at de ville vide noget om et begrænset emne, mens de øvrige emner på det nærmeste 

var irrelevante. Vores nyhedstjeneste skulle derfor gøre det muligt at levere 

personaliseret information. 

Emnefeltet arbejdsliv 

Vores område er ”arbejdsliv”. Det er faktisk ikke nærmere defineret, men er blevet 

afgrænset af de aktiviteter, som vores organisation Center for Studier i Arbejdsliv står for. 

Forskningsfeltet er tværfagligt, idet der er aktive forskere fra så forskellige 

fagområder som sociologi, psykologi, medicin, etnografi, økonomi, politologi, jura, 

historie samt en del yderligere fagområder. Fagets emner er således ikke udviklet 

inden for en enkelt videnskab, men benyttes af en række forskellige forskere fra 

forskellige fag. Dette gør tillige, at der ikke findes en 100 % holdbar systematik for 

forskerne fra alle forskningsfelter. 

Af praktiske årsager har vi ladet aktiviteterne i Tidsskrift for Arbejdsliv definere 

områdets omfang og indhold. 

Tidsskriftet havde eksisteret siden 1999, og der var på det tidspunkt tale om 

omkring 100 artikler i tidsskriftet. Hertil kom omkring 1.000 bøger, som tidsskriftets 

anmelderredaktion havde udvalgt til at være relevante for anmeldelse i tidsskriftet. 

Dette har været en pragmatisk måde til at definere feltet på. Metoden vil derfor 

kunne bruges til fortsat at udvikle emneordslisten i takt med at området fagligt ændrer 

sig. 

Denne quick and dirty måde at definere emneområdet på har selvfølgelig en stor 

fordel ved at kunne etableres på meget kort tid. Svagheden er, at den er afhængig af 

relativt få menneskers beslutninger, nemlig redaktionens optagelse af artikler og en 

enkelt anmelderredaktørs beslutning om hvilke bøger, der skal medtages på 

tidsskriftets anmeldelsesliste. 

Disse begrænsninger er dog ikke særlig alvorlige, da det netop har drejet sig om at 

få indekseret bidragene til tidsskriftet samt de løbende boglister. Hvis der løbende 

bliver justeret, vil emneordslisten til stadighed være ajour i forhold til det aktuelle 

behov. 


FIGUR 1. Denne hjemmeside er en nyhedstjeneste, som Center for Studier i Arbejdsliv udgiver med 

den nyeste forskning fra områdets mere end 500 forskere. Artikler og anmeldelser fra Tidsskrift for 

Arbejdsliv er unikt materiale, der suppleres med nyheder om bøger og konferencer. Mere end 1.700 

modtager CSA’s nyhedsmail, og årligt besøges siden mere end 250.000 gange. 

Emneordslistens opbygning 

Da vi startede arbejdet, havde vi ingen erfaringer på området. Vi kunne se, at det ville 

være ønskeligt med en systematik på flere hundrede emneord, således at mængden ved 

søgning via et emneord kunne reducere resultatet til en delmængde på i gennemsnit en 

hundrededel eller mindre. 

I første omgang blev det undersøgt, om der i forvejen fandtes et bestående system, 

som blot kunne overtages evt. efter en simpel revision. Det viste sig desværre ikke at 

være tilfældet. 

De første systemer var systemerne fra de danske folkebiblioteker og et officielt 

system fra IT- og Telestyrelsen. De viste sig ikke at kunne opfylde vores krav til 

detaljeringsgrad. Samtidig havde de begge en form for systematik, som i hvert fald for 

vores system ikke ville fungere optimalt. Bibliotekernes system kunne således ikke 

bruges i sin helhed, men de fundne ord blev lagt i en database for efterfølgende 

behandling. Det officielle danske IT-væsen havde selv et ønske om at benytte 


systematik til sin sagsbehandling og brug af automatisk journalisering. Vi så nærmere 

på systemet, men måtte konstatere, at det var alt for simpelt. 

Større held var der med bibliotekssystemet hos det nu nedlagte Arbetslivsinstitutets 

bibliotek, som dengang var Europas mest omfattende forskningsinstitution på området. 

Der var ikke tale om en systematik, men mange gode emneord blev samlet sammen og 

supplerede den oparbejdede database. 

Jagten fortsatte, og mange andre udenlandske systemer blev gennemgået. Et af de 

mest gennemarbejdede systemer var det finske Työterveyslaitos. Det havde sin 

begrænsning i kun at medtage en del af det emneområde, vi gerne ville dække. Til 

gengæld var det på mange måder et optimalt udført arbejde. Mange ord var defineret, 

og der fandtes samtidig et tilsvarende engelsk begreb i mange tilfælde. 1 

Arbejde udført fra grunden 

Efter det forberedende arbejde havde vi opstillet en længere liste af ord. Vi vidste dog, at 

hele emneområdet ikke var dækket. Nu kom vi til det tidskrævende arbejde at få listen 

suppleret med de manglende ord. 

Her valgte vi at få suppleret ved at gennemgå 1.000 bøger, artikler og konferencer. 

Hver enkelt blev vurderet for hvad man kunne kategorisere dem at omhandle. 

Af praktiske årsager var det kun muligt at kategorisere ud fra titel, undertitel samt 

for bøger og tidsskriftsartiklers vedkommende fra det korte resumé leveret af forfatter 

eller udgiver. 

Dette arbejde gav mange nye begreber, som ikke havde været omfattet i de 

hidtidige emneordslister og systematikker. Der opstod dog samtidig et nyt problem, 

der skulle afklares, nemlig at mange ord dækkede et for detaljeret begreb, at det ikke 

ville være praktisk at benytte det i en systematik. Vi skulle ikke udarbejde en udførlig 

fagterm, men kun vælge de ca. 20 % mest brugbare og dækkende termer. I en artikel 

om arbejdsmiljø, kunne der til eksempel være omtalt begrebet ”sikkerhedsudvalgsmøde”. 

Det dækker over et reelt begreb, men det ville nok give en for 

detaljeret ordliste, hvis alle disse ord skulle medtages. ”Sikkerhedsarbejde” og 

”sikkerhedsudvalg” ville nok være begreber, der dækker møderne. Der var mange af 

denne type afgørelser, der skulle træffes. Af hensyn til de få ressourcer i projektet, 

måtte der hurtigt træffes en beslutning, hvilket skete uden større argumentering men 

blot ud fra en fornemmelse af, at dette eller hint begreb nok blev for specielt. 

1 Vi har bl.a. fået inspiration fra Mannheimer Zentrum für Europäische Sozialforschung, Library of Congress, Outline of Cultural 

Material, Universel Decimalklasse Klassifikation, Arbetslivsinstituttet, AMI, Svenska ämnesord, UNESCO Thesaurus ULCC, 

EUROVOC thesaurus, Cambridge Scientific Abstracts. Sociology Thesaurus, Työterveyslaitos (Työsuojelusanasto). 


FIGUR 2. Emnet ”arbejdsliv” består af begreber fra en lang række fag. Det er derfor kun folk med 

føling i alle disse områder, der kan bedømme termer. 

HVEM KAN UDARBEJDE EN SYSTEMATIK? 

Vores erfaringer fra et fattigt forskningsfelt viser, at det kan lade sig gøre at etablere en 

fungerende emneordsliste med relativt få midler. Hvis bare metoderne er gennemtænkte, 

kan tingene udformes rimelig let. 

I praksis har der været få mennesker involveret i arbejdet. Det har ikke været 

nødvendigt at involvere mange mennesker i den første forberedende fase. Det har dog 

været et udgangspunkt, at mindst én person med et kendskab til hele forskningsfeltet 

har skullet deltage. Det praktiske arbejde omkring programmering og tilretning kunne 

udføres af personer uden for fagmiljøet. 

Det har i mange forbindelser været ønsket, at få tilbagemelding fra 

forskningsmiljøet. Sådanne tilbagemeldinger har det ikke været muligt at få i særligt 

omfattende eller gennemgribende omfang. Derimod er der modtaget mange 

enkeltstående kommentarer om fortrinsvis enkelte begrebers brugbarhed. 

At benytte en systematik 

Da vi startede op i 2003 ønskede vi ikke alene at have en emneordsliste. Listen skulle 

samtidig være systematisk. Det var et optimalt ønske, idet man herved kunne give brugerne 

mulighed for at søge på et meget snævert emne, men kunne samtidig give en alternativ 

mulighed for at vælge et større emne. Til eksempel kan man vælge emnet 

”lærlingeuddannelse”, men man kan også vælge det mere omfattende ”uddannelse”, som 

omfatter mange andre former for uddannelse. 

Det var et fint ideal. Virkeligheden viste sig at være mere problematisk. Vi starte 

med en usystematisk liste på 400 ord, og øvelsen var så at gruppere dem i et system. I 


lighed med selve emneordene, fandtes der ingen systematik at bygge videre på. Det 

hele skulle udvikles fra grunden. 

Mange ord var lette at organisere. Størstedelen af ordene faldt nærmest af sig selv 

ind i en systematik. Arbejdet bestod ”blot” i at sætte etiketter på et hierarki, som man 

kunne forestille sig kun ventede på at dette meget indlysende arbejde skulle blive 

foretaget. 

Der var desværre en relativ stor gruppe ord tilbage, som ikke egentlig havde nogen 

systematik at høre til eller – hvilket var værre – kunne høre til to eller flere andre dele 

af den udarbejdede systematik. 

Det første kunne godt løse sig ved at lave nogle overbegreber, som blot dækkede 

disse emner. Det andet problem var vanskeligere – for ikke at sige umuligt - at løse, og 

det måtte man lære at leve med, at der var denne synlige svaghed. 

En systemarkitektur for personaliseret information 

I sommeren 2003 var arbejdet med systematikken afsluttet. Der var lavet en systematik 

med knap 400 emneord, som var blevet inddelt i et mindre antal overordnede begreber. Nu 

kunne systemet for alvor blive indført. 

Der blev valgt at arbejde med en relationelt opbygget database. Ønsket var at starte 

med at arbejde i den simple og billige database Access, som de fleste i forvejen har 

liggende på deres computer. Det var meningen senere at skalere til et større 

databasesystem. Der viste sig da også nogle kapacitetsproblemer med Access, da 

systemet kom i drift. Hvis der var for mange samtidig brugere, kunne systemet 

blokere, og kun en genstart af serveren kunne få systemet i gang igen. Det var et 

problem, som vi skulle identificere, og som vi efterfølgende skulle bede web-hotellet 

om at løse. Inden vi havde opdaget, at der var en fejl, kunne der gå dage, og hvis det 

skete ved en weekend, kunne der gå yderligere en del timer mens hjemmesiden ikke 

var tilgængelig. 

En omlægning ville tage ret lang tid, og da vi endelig havde besluttet at starte at 

omlægge til det forbedrede databasesystem, var der imidlertid ingen problemer mere 

på IT-siden. Web-hotellet havde på grund af forbedrede opsætninger gjort systemet 

mindre sårbart, samtidig med at Microsoft leverede bedre programmer både ved selve 

Access programmet, men også de servere og de web værktøjer vi havde valgt (hvilket 

var .Net tilsvarende fra Microsoft). Vi kører således med stor tilfredshed på en Access 

database, hvor oppetiden er på over 99,9% 

Vi valgte at arbejde med referencefiler til hver enkelt af de kategorier, der blev 

indtastet. Det har været en god løsning, idet det har fungeret robust, og hvor det har 

været let at udnytte emneordene gennem programmering af web-systemet. 

Det må nævnes, at vi havde valgt selv at opbygge vores CMS, hvorved de nævnte fordele let 

har kunnet implementeres. Det må dog også nævnes, at et standard CMS ville have løst os 

fra nogle af de opgaver, der løbende har været med opdatering til nye forhold. 


FIGUR 3. Allerede ved planlægningen af nyhedstjenestens infrastruktur blev den systematiske 

emneordsliste indtænkt. Illustrationen viser tabellerne i den relationelle database. 

IGANGSÆTNING 

Da arbejdet skulle igangsættes, havde vi allerede omkring 1.000 dokumenter i systemet. 

Det var rimelig let at udføre indekseringen, idet der på indtastningsskærmen var blevet 

placeret et vindue, hvor man kunne vælge de ønskede emneord ud fra en menu. 

I praksis viste det sig, at det var relevant at give en bog, artikel eller konference 

mellem to eller tre emneord. Kun sjældent var der kun tale om et så smalt emne, at kun 

et enkelt ord var dækkende. Omvendt var der sjældent tale om at give mere end seks 

ord, og som nævnt var det mest almindelige to til tre ord. 

Der var naturligvis i f.eks. en bog berørt mange hundrede begreber. Imidlertid 

måtte vi som registratorer identificere bogens hovedemner. Som nævnt blev arbejdet 

udført med meget få ressourcer, hvorfor dette arbejde måtte udføres med en meget kort 

beslutningstid for hver enkelt enhed. Til en slags trøst vidste vi, at alle 

kategoriseringer kunne ændres, hvis de viste sig at være forkerte eller hvis de 

manglede emner. Dette har det dog ikke været tale om. 

Ved dette arbejde viste der sig imidlertid også en række svagheder ved det 

udarbejdede system, og en justering af ordlisten blev udført løbende i et vist omfang. 

Det kunne ske ved tilføjelse af nye ord til de etablerede begreber. Derimod viste det 

sig heldigvis ikke nødvendigt at flytte rundt på begreber eller ændre hierarkiet. 


ORDLISTE PÅ ENGELSK 

Det var naturligt at udarbejde en engelsk ordliste, da vi skulle etablere en nyhedstjeneste 

på engelsk. I stor udstrækning var denne hjemmeside en ”spejling” af den danske udgave, 

således at indekseringen af bøger, artikler og begivenheder i den danske udgave automatisk 

blev overført til den engelske udgaves bøger, artikler og begivenheder (der var en del bøger 

og begivenheder på dansk, norsk og svensk, som ikke var medtaget i den engelske udgave). 

Vi fandt hurtigt ud af, at mange af de engelske begreber ikke kunne findes via en 

standard ordbog. Dels var der mange ord, som ikke fandtes i ordbogen, eller også 

fandtes der flere muligheder, hvor vi ikke var i stand til at bedømme, hvilke der var de 

rigtige. Det gav – i hvert fald i begyndelsen – en ordliste med visse svagheder. 

WIKI OG ORDBOG 

Svaghederne i den engelske ordliste blev dog efterhånden begrænset, og ordlisten fik 

herved nye brugsmuligheder. 

Vi søgte at finde de rigtige engelske begreber til at bekræfte eller supplere ordlisten. 

Det kunne blandt andet ske ved at se brugen af begreber i bøger, som vi tilfældigvis 

fik lejlighed til at gennemlæse. 

En anden og meget vellykket metode var at lade læserne kommentere og supplere 

ordlisten. Denne Wiki-metode fungerede især ved at folk påpegede fejl og svagheder 

ved ordlisten, hvor det engelske ord ikke svarede til det danske eller ikke helt havde 

den samme betydning. Der kom dog også nogle enkelte tilføjelser via denne metode. 

I lighed med den folkelige deltagelse, blev ordlisten samtidig en lille ordbog 

mellem dansk og engelsk. Herved har folk fået et gratis opslagsværk på dette 

fagområde. 

6 ÅRS GODE ERFARINGER 

Systemet har nu været i funktion i 6 år i den danske udgave, og det fungerer stadigvæk. 

Det bør justeres, som de angives i næste kapitel, men det har trods alt fungeret og fungerer 

stadigvæk godt. 

Emneordene har været nyttige på to helt forskellige områder. 

Det ene er den direkte personalisering, hvor hjemmesidens brugere har kunnet søge 

via emneord. De har haft mulighed for at vælge de overordnede begreber, eller de har 

kunnet vælge mere smalle begreber. 

Den anden brug har faktisk vist sig at være den vigtigste. Hjemmesiden er blevet 

opbygget således, at søgemaskinernes robotter har høstet hjemmesiden efter emne 

(samt navn og andre dimensioner). Denne opbygning har betydet, at til eksempel 

Google har indekseret vores hjemmeside meget høj på mange af de 400 emneord. Den 


seneste opgørelse er fra 2007, hvor 70 af vores emneord lå inden for 20 af Googles 

bedste pladser. Af dem var 20 førstepladser. Derved har brugen af emneord været en 

forudsætning for at vores hjemmeside har haft en søgemaskineoptimering, som må 

betegnes at være tæt på det optimale. 

De mange mangler 

Jeg har ikke påstået, at systemet er perfekt. Det vil en emneordsliste eller en systematik 

vistnok aldrig kunne blive. 

Bortset fra enkelte tilføjelser af ord til listen, har der ikke været udført en egentlig 

revision. En sådanne står umiddelbart foran sin effektuering. 

Igennem alle årene er der blevet skrevet en ”fejlrapport”, når der har været en bog 

eller artikel, som ikke havde sit emne på listen. Der er derved blevet udarbejdet en 

liste på efterhånden mere end 100 ord. 

Årsagen er delvist, at den oprindelige ordliste allerede ved fødslen havde 

svagheder, således at den ikke kunne tage højde for videnskabelige resultater omkring 

visse specielle smalle emner, der kun opstod meget sjældent. 

En anden årsag er, at faget har udviklet sig. I tidsskriftets efterhånden mere end 10 

års forløb har videnskaben ændret sig både i takt med at samfundet har ændret sig, 

men sandelig også, fordi der i videnskaben selv har været en udvikling, som ikke 

nødvendigvis er parallel med samfundets udvikling 

Alle disse mangler skal der tages højde for ved den snarlige revision. 

Systematikkens svagheder 

Selvom systematikken benyttes, er der nogle svagheder i systemet, som ikke sådan lige er 

til at komme udenom. Det er tilfældet, når nogle ord benyttes ualmindeligt meget eller når 

de ikke udnyttes særlig meget. 

Nogle ord benyttes så meget, at de ikke er særlig velegnede til at lave en 

delmængde. F.eks. behandler mange bøger ”globalisering” eller de kan i det mindste 

have et aspekt omkring emnet. En søgning på dette emne i bøger på vores hjemmeside 

vil give 110 henvisninger, hvilket er et meget stort antal at forholde sig til. 

Af de mange søgeord havde 12 flere end 40 hits. Det må ved systematikkens videre 

udvikling søges at bringe dette antal ned. Ved begrebet globalisering må der til 

eksempel opfindes nye begreber, der underinddeler og findeler emnet. Det kunne til 

eksempel være ”globalisering, økonomi”, ”globalisering, ledelse” og tilsvarende 

opdeling af globalisering. 

Denne svaghed findes udelukkende ved brug af systematikken. Hvis man søger på 

emneord, vil man kunne kombinere ”globalisering” med et andet begreb og herved 

reducere antallet af hits. 

En anden svaghed er hvor emneord har få eller ingen resultater. 130 af emneordene 

havde faktisk kun én eller ingen bøger at henvise til. Med så få tilfælde kan man sige, 


at disse emneord er for specifikke, og at de på en måde er ”støj”, der fylder op og gør 

tingene uoverskuelige. Det er ikke et mål i sig selv, at udvikle et ”optimalt” system, 

der dækker alle begreber. Der skal være en pragmatisk fornuft, og der vil derfor ikke 

ske noget ved at fjerne størstedelen af dem. 

FIGUR 4. Begreber med for få eller for mange henvisninger var uhensigtsmæssige. 

DEN MÅLBARE SUCCES – ELLER FIASKO 

Ved Internettet er vi så heldig, at vi i stor udstrækning kan se hvordan vores brugere 

benytter vores tjeneste. Mens man ved en udgivelse i bogform ikke kan se, om læserne 

benytter et indeks eller stikordsregister, er det helt anderledes let at se, hvorledes brugerne 

navigerer rundt på en hjemmeside. Faktisk er det muligt at registrere hvert eneste tastetryk. 

Det er ren Big Brother. 

Brugen af emneord viser sig således kun at være en betinget succes, eller i hvert 

fald, at kun en mindre del af brugerne udnytter de nye muligheder til at navigere via 

systematikken. Kun 50 ud af 1.000 besøgende udnyttede denne mulighed. 

Om dette nu er en fiasko, skal der en nærmere vurdering til for at afklare. Mange 

ikke-brugere navigerer efter andre metoder. De ser f.eks. alle bøger igennem på de 

aktuelle boglister, hvorved de bliver orienteret om hele forskningsfeltet. Andre søger 

efter en enkelt forfatter eller en bestemt artikel og er tilsyneladende tilfreds med dette. 

Den relativt ringe brug af systematikken kan have flere årsager – hvis det altså er en 

ringe brug. Det kunne være, at navigationen til systematikken var for besværlig. Det 

kunne man få bekræftet eller afkræftet ved at gøre navigationen i en periode 

ualmindelig let at komme til og herefter se, om det skulle være årsagen. 

Det kan også være, at en systematik kun benyttes, når en forsker skal i gang med et 

forskningsprojekt og her ønsker at få et overblik over den totale litteratur på et 

område. At det kun er de rigtige ”professionelle”, der benytter systematikken, men 

altså også, at almindelige mennesker måske ikke kender til fordelene ved at benytte en 

sådan mulighed. 


De største succeser 

Inden vi kaster systematikken bort, vil jeg dog berette om dens brug på to områder, hvor 

den virkelig har vist at have berettigelse. 

Det ene er på muligheden for målrettet information, en aktiv push fra 

indholdsleverandørens side, til folk, der er interesseret i at følge med i bestemte 

områder. Det har vi organiseret via RSS, hvor brugerne har mulighed for at vælge 

mellem 216 emner. Når der på hjemmesiden kommer en ny bog, vil der blive givet 

sendt besked til brugernes RSS læser om nyheden. 

Den tekniske konstruktion af RSS bygger på emneordene, og her må vi konstatere, 

at det er en succes i stort omfang. Der er således udvalgt mere end 5.000 RSS-emner, 

hvilket vi er rimelig tilfredse med. Vores sammenligningsgrundlag er, at vi har 500 

abonnenter på den bogtrykte udgave af vores tidsskrift, og da vi har konstateret, at 

brugerne i gennemsnit kun vælger et par få emner at abonnere på, er der tale om flere 

tusinde brugere. 

Største succes for Google søgerne 

Den anden – og vel nok langt den største - succes for systematikken er for brugerne af 

søgemaskiner. Når man søger efter et ord, vil man typisk kun se efter søgeresultater på den 

første side og oftest kun efter de første få øverste resultater. 

Her har vores hjemmeside en ualmindelig god stilling. En analyse af hjemmesidens 

placering af søgeord viste i 2007, at stillingen for vores søgeord var blevet væsentlig 

forbedret siden indførelse af den nye teknik for søgemaskineoptimering baseret på 

systematikken. 71 begreber lå på de øverste 9 pladser i Google, den altdominerende 

søgemaskine, og heraf havde vi endda 21 ord på førstepladsen. 

Det er helt sikkert den vigtigste årsag bag vores hjemmesides succes. En meget stor 

del af de besøgende på vores hjemmeside kommer ind via søgemaskiner – mere end 

en tredjedel er der tale om ved de konkrete målinger, og da mange af de øvrige 

brugere, som linker direkte til hjemmesiden, i første omgang er blevet opmærksom på 

hjemmesiden på grund af en vellykket søgning, er resultatet efter brug af søgeord langt 

mere end halvdelen af hjemmesidens brug i det hele taget. 

Succes for det interne arbejde 

Ud over den nævnte direkte brug for de besøgende på hjemmesiden, har vi internt i 

redaktionen yderligere haft udbytte af systematikken. Ved at analysere brugernes 

anvendelse af systematikken, er vi blevet klogere og kan derved lave et bedre produkt. 

Vi har til eksempel set på hvilke begreber, som brugerne har benyttet og hvilke de 

ikke har benyttet. Det giver os herved en mulighed for at justere vores udvælgelse. 

Selvfølgelig skal det – efter vores mening – ikke været styret fuldt ud af brugernes 


interesser. Det er os i redaktionen, som har forstand på kvalitet og som redigerer ud fra 

denne selvforståelse. Det vil dog være ufornuftigt, hvis vi ikke lader os inspirere af de 

ord, som brugerne i særdeleshed efterspørger, idet de afslører et behov for viden på 

disse områder hos brede kredse, hvilket vi kan lade indgå i vores fremtidige arbejde. 

Der må dog nævnes et negativt aspekt ved brug af denne type analyser: De tager 

tid. Det er i hvert fald for vores nyhedstjeneste ikke muligt at udføre denne type 

analyser mere end én gang om året. 

KONKLUSION 

Det må konstateres, at vores nyhedstjeneste har haft et stort udbytte af at benytte en 

faglig systematik inden for det tværfaglige forskningsfelt, arbejdsliv. Alle vores oplysninger er 

blevet indekseret, således at hver bogomtale, artikel, anmeldelse eller præsentation af 

konference har fået et eller oftest flere emner koblet til dig. 

Emnesystematikken er blevet udviklet af vores egne redaktører, som er de bedste 

(og vel også eneste) med et indgående kendskab til fagområdets begreber. Vi har ikke 

haft økonomi til at få erfarne emneordsudviklere til at hjælpe os med systemet, men 

kunne dog godt have tænkt os at have fået hjælp undervejs, hvilket ville have lettet os 

arbejdet og sikkert givet et bedre resultat. 

Selvom vi har gjort brug af og blevet inspireret af samtlige nationale og 

internationale emneordslister i og omkring vores område, har vi måtte udføre arbejdet 

fra grunden af. Vi kunne dog godt tænke os, at arbejdet med emneord på bedre vis 

bliver koordineret internationalt, således at andre vil kunne udnytte vores systematik 

og vi omvendt få hjælp af andre. Det ville være en god forudsætning for en fremtidig 

udveksling af oplysninger baseret på emneord og systematik. 

REFERENCER 

Nyt om Arbejdsliv, systematik www.nyt-om-arbejdsliv.dk/systematik.aspx 

Working Life Info, systematik www.workinglife.info/esystematik.aspx 


Ordningen i redan 

– om uppräkningar i begreppsbeskrivningar 

Henrik Nilsson 


+46 8 446 66 10, henrik.nilsson@tnc.se 

Abstract. De extensionella ”definitionerna” (det vill säga en begreppsbeskrivning som innebär 

någon form av uppräkning, av underbegrepp eller referenter) har ofta diskuterats i 

terminologivärlden. Detta föredrag kommer genom exempel från olika områden att titta närmare 

på denna och andra liknande begreppsbeskrivningar. Kan dessa ”definitioner” användas praktiskt 

och vad bör man tänka på i så fall? Är de ibland t.o.m. att föredra framför andra typer av 

definitioner? Och vilken relation finns till klassifikation – särskilt vad gäller de närliggande 

typer av begreppsbeskrivningar som man skulle kunna kalla ”referensdefinitioner” och ”rubrikdefinitioner”? 

Särskilt kommer fokus att ligga på om och i så fall hur själva ordningen på de 

uppräknade elementen (referenter eller underbegrepp) påverkar definitionens innehåll. 

INLEDNING 

Den brittiske filmaren och konstnären Peter Greenaway tyckte inte att bara USA 

skulle få bestämma vilka objekt som skulle skickas med vid rymdfärder för att 

representera mänskligheten. Han skapade därför en ”prop-opera” som han kallade 

”100 objects to represent the world” 1 

. Hans uppräkning av 100 objekt (som bland 

annat omfattar regnbågen, en kyss, stolar, Mozarts kranium, själen, kvicksilver, Venus 

från Willendorf, Freuds hatt och portfölj, röda böcker, skräp och Archaeopteryx) är 

hans personliga uppfattning av vad som kan representera världen av i dag, men kan 

inte ses som en definition av världen. Det handlar endast om ett urval, och dessutom 

av fenomen och objekt blandat. I de fall uppräkningar använts som metod (i s.k. 

extensionella ”definitioner”) för att beskriva begrepp terminologiskt har kravet just 

varit att uppräkningen ska vara uttömmande. 

De så kallade extensionella ”definitionerna” – det vill säga definitioner som räknar 

upp alla referenter som begreppet syftar på eller alla underordnade begrepp – har inte 

ansetts riktigt rumsrena i terminologiarbetet. Många menar att de inte bör kallas 

definitioner alls. Men i själva verket rymmer begreppsbeskrivningar (för att nu 

undvika termen ”definitioner”) väldigt ofta uppräkningar i någon form. När vi på TNC 

importerat terminologiskt material till Rikstermbanken har vi gått igenom tusentals 

definitioner. Det har då visat sig att icke-uttömmande uppräkningar inte så sällan 

används som begreppsbeskrivningar, särskilt i lagtexter, och inte alls är ovanliga i 

begreppsbeskrivningar. 

1 Se vidare: http://www.changeperformingarts.it/Greenaway/100objects.html 


I den här artikeln koncentrerar jag mig på hur och var uppräkningar används i och 

som begreppsbeskrivningar, med fokus på uppräkningen som begreppsbeskrivning i 

sig och dess lämplighet. 

Det är inte helt enkelt att hitta en definition av ”uppräkning” utan att hamna i 

mycket generella beskrivningar av typen ”redogörelse i (viss) ordningsföljd” 2 

. Denna 

definition är dock inte ointressant och just användningen av ”viss” behandlas i slutet 

av den här artikeln. 

UPPRÄKNINGAR I DEFINITIONER 

En första distinktion som kan göras är den mellan uppräkningar i 

begreppsbeskrivningar och uppräkningar som begreppsbeskrivningar. 

Den vanligaste typen av terminologisk definition, den s.k. intensionella 

definitionen, kan innehålla en uppräkning, ofta som en (då icke-uttömmande) 

exemplifiering i slutet: 

biomassa 

material med biologiskt ursprung och som inte eller endast i ringa grad omvandlats, till 

exempel energigröda, energiskog, halm, trä, vass 

I en äldre TNC-artikel står följande att läsa: ”Även om [exempel] inte kan anses 

tillhöra själva definitionen kan de dock tillfogas direkt efter, eller infogas i, 

definitionen. […] Exemplen kan framför allt avse uppslagstermens användning; ibland 

anger exemplet någon belysande omständighet av annan art; i andra fall kan 

exemplifieringen gälla något i ordförklaringen.” 3 

. Även Wright & Strehlow (1995) har 

påpekat nyttan av att göra beskrivningen av ett begrepp tydligare med hjälp av 

exemplifieringar; de säger dock inget om var detta bör göras. I Rikstermbanken har 

sådana exempel i stället placerats i ett separat exempelfält som presenteras separat från 

definitionen. På så sätt renodlas själva definitionen ytterligare. 

I vissa definitioner är det i stället överbegreppet som utgörs av en uppräkning, även 

om detta är ovanligare: 

stiftare 

person, företag eller förening som startar ett aktiebolag 

kylmedium 

gas eller vätska som transporterar bort värme, till exempel från en reaktorhärd 4 

2 Nationalencyklopedins ordbok 

3 TNC, Ord och uttryck, 1963 

4 TNC: manus till basordlista 


I just det här exemplet hade den inledande uppräkningen kunnat undvikas genom att ”vätska 

eller gas” kunnat ersättas med ”fluid” (som i sig definieras just extensionellt som ’vätska eller 

gas’ 5 

). 

Till detta kommer definitioner som utgör hybridformer mellan intensionella och 

extensionella definitioner: 

intermediära varor 

insatsvaror, halvfabrikat och komponenter av olika slag, det vill säga normalt varor som ingår 

som en delprodukt i en slutlig vara/produkt 

I ovanstående definitionsexempel kombineras extensionens underbegrepp 

(insatsvaror, halvfabrikat och komponenter) och intensionens beskrivning (”varor som 

ingår som en delprodukt i en slutlig vara/produkt”) – något som förstås även kunde ha 

gjorts i ett separat fält i termposten (se ovan). 

Referensdefinitioner 

Särskilt i lagtexter förekommer ett specialfall av den extensionella definitionen som 

skulle kunnas kallas referensdefinition. I själva definitionen finns det egentligen inte 

så mycket relevant information om begreppet utan i stället bara en referens till det 

ställe där den informationen finns – i till exempel en paragraf eller bilaga. Där görs då 

inte sällan en – ofta ganska utrymmeskrävande – uppräkning. Det som alltså kan se ut 

som en intensionell definition, med överbegrepp och kännetecken blir en sorts 

”förtäckt” extensionell definition: 

”med hushållstjänster avses de tjänster som är uppräknade i 4 § lagen (2007:346) om 

skattereduktion för hushållsarbete” 

I exemplet ovan specificeras överbegreppet ”tjänster” på detta, ”referentiella” sätt 

(och i 4 § räknas sedan det som räknas till hushållstjänster upp: städarbete eller annat 

rengöringsarbete som utförs i bostaden, vård av kläder och hemtextilier som utförs i 

bostaden, matlagning som utförs i eller i nära anslutning till bostaden […]) 6 

5 TNC 98: Tekniska basord (1995) 

6 Lag om ändring i lagen (2007:346) om skattereduktion för hushållsarbete (SFS 2009:538) 


Uppräkningar som definitioner 

Även om ovanstående exempel är intressanta utgör de ändå en minoritet, och den 

kategori där uppräkningar i sig utgör hela begreppsbeskrivningen, det vill säga ”egna” 

definitioner, överväger. Sedan tidigare finns här början till en typologi med en 

indelning utifrån vad som räknas upp i ”traditionella” extensionella definitioner 

(eventuellt med ovan nämnda undertyp referensdefinition) och beståndsdelsdefinitioner. 

Kanske finns här dock behov av fler typer, uppdelade utifrån det sätt 

definitionen skapas på; här kallade rubrikdefinitioner. 

Den ”traditionella” extensionella definitionen (som i litteraturen även kallats 

omfångsdefinition, denotativ definition och extensiv definition) är en ”definition som 

räknar upp begreppets alla underordnade begrepp eller referenter enligt en viss 

indelningsgrund” 7 

: 

flerbostadshus 

gathus, lamellhus, smalhus, skivhus, stjärnhus, loftgångshus eller låghus 

En ofullständig exemplifiering kan inte sägas utgöra en definition, det vill säga allt 

som ingår i begreppets extension måste räknas upp. Det sista elementet i uppräkningen 

måste också föregås av ”eller” för att definitionen ska vara användbar som definition. 

Angivandet av vad som räknas upp har växlat i definitionen av extensionell 

definition under årens lopp. Det vanligaste fallet är att begreppets extension 

(begreppsomfång) räknas upp, det vill säga underbegreppen (som i sig är sidobegrepp 

och företrädesvis på samma nivå i ett begreppssystem) eller referenterna. I många fall 

är den bakomliggande begreppsrelationen då ”antingen–eller” (det som Nuopponen et 

al kallar ”extensionell disjunktion”): 

kronprinsessa 

kvinnlig tronföljare eller gemål till en kronprins 8 

klausul 

tilläggsbestämmelse eller förbehåll 9 

Beståndsdelsdefinitioner 

Extensionella definitioner där delbegrepp räknas upp är också ganska vanligt 

förekommande; dessa kallas då ofta för beståndsdelsdefinition, och de uppräknade 

elementen (delbegreppen) har en partitiv relation till helhetsbegreppet: 

7 Nordterm 13: ”Terminologins terminologi på nordiska” 

8 Nordisk förvaltningsordbok, 1991 

9 Nordisk förvaltningsordbok, 1991 


vecka 

måndag, tisdag, onsdag, torsdag, fredag, lördag och söndag 

Rubrikdefinitioner 

Så långt är det hela föga komplicerat – underbegrepp, referenter eller delbegrepp 

räknas upp. Det finns dock en del fall där det verkar råda en annan typ av 

begreppsrelation mellan det som definieras och de begrepp som räknas upp: 

kalandrering 

utvalsning, laminering, dubblering, friktionering eller beläggning (1) i kalander 

I det här exemplet handlar det inte om underbegrepp (inget av dem definieras som 

’kalandrering som …’) eller referenter och inte heller om delbegrepp. Snarare har 

dessa begrepp något gemensamt – en kalander ingår i alla processerna. Samtidigt 

antyder definitionens ”eller” att man inte bara klumpat ihop begreppen för att man kan 

använda termen ”kalandrering” för att kunna tala om alla dessa processer samtidigt. 

När ordet ”kalandrering” används kan snarare någon av dessa processer avses. Valet 

att definiera på det här sättet verkar alltså vara avsiktligt. Att det hade varit möjligt att 

definiera intensionellt visar andra ordlistor som innehåller definitioner av just 

begreppet ”kalandrering”: ’ytförändrande mekanisk behandling i valsverk 

(kalander)’ 10 

. 

Även syftet med att göra uppräkningar i begreppsbeskrivningar är intressant. 

Österberg skriver i sin bok ”Hierarkisk begreppsanalys” (1979) att man i processen att 

skapa en begreppshierarki kan gå i två riktningar. ”Riktningen ’uppifrån och ned’ 

motsvarar […] ’division’. ’Nedifrån och upp’ motsvaras av ’klassifikation’. Kan det 

vara så att vissa uppräkningar som begreppsbeskrivningar uppstår i sammanhang när 

man egentligen vill klassificera och egentligen inte definiera, det vill säga när man vill 

kunna tala om flera begrepp med en gemensam rubrik, och alltså slippa upprepa alla 

elementen i uppräkningen varje gång de förekommer i en text? 

förnybar energi 

vindkraft, solenergi, vågenergi, geotermisk energi, biobränslen och vattenkraft 

10 TNC 76: Textilordlista, 1981 


anordningar för personlig hygien 

omklädningsrum, dusch, handtvättanordningar och liknande 11 

I de här exemplen understryks detta av det faktum att uppräkningarnas sista element 

föregås av ”och” och inte av ”eller”; det är helheten som avses, inte vart och ett av de 

uppräknade elementen. Man kan konstatera att den här typen av begreppsbeskrivningar, 

som man skulle kunna kalla rubrikdefinitioner, är vanligare 

förekommande i vissa texttyper (bland annat lagtexter) där de verkar ha skapats just av 

klassificerings- och regelskäl. Uppräkningen utgör således en helhet för vilken man i 

ett dokument använder en ”rubrikterm” för att slippa upprepa alla elementen. På det 

sättet liknar dessa definitioner det man hittar under ”rubrikord” som ibland används i 

ordlistor där man under ett gemensamt uppslagsord samlar allt som på något sätt har 

en association till begreppet ifråga att göra och på så sätt stafettmässigt leder 

användare vidare i ordlistan: 

glasteknik 

hyttarbetat (drivet), formblåst (fastblåst, optikblåst, stött), gjutet (sandgjutet), centrifugerat, 

pressglas, automatblåst (till exempel buteljtillverkning), studioglas, fusing, slumping, 

bending, paté [sic] de verre, limmat, kulat 12 

I vissa fall kan man nästan misstänka att begreppsanalysen i sig givit upphov till 

den här typen av definition, och att det som i själva verket är en indelningsgrund i ett 

begreppssystem får status av term – vars motsvarande begrepp då lämpligen definieras 

just med en rubrikdefinition (de element som räknas upp i definitionen har då ofta 

heller inga egna definitioner i ordlistan ifråga): 

trafikslag 

vägtrafik, järnvägstrafik, luftfart och sjöfart 

Samlingsdefinitioner 

Ibland kan det vara svårt att avgöra om en definition är en intensionell definition 

med ett mycket generellt överbegrepp (verksamhet i exemplet nedan) eller snarare 

någon form av extensionell definition med en inledningsfras: 

11 föreskrift från Arbetsmiljöverket 

12 Svensk Forms Opinionsnämnd Ordbok, 2001 


telekrigföring 

Verksamhet omfattande signalspaning, falsk signalering, insats av telemotmedel, insats mot 

teleanläggningar av signalsökande vapen samt teleskydd. 13 

telekrigföring 

sammanfattande benämning på militära åtgärder för att upptäcka, utnyttja, påverka, 

försvåra eller förhindra motståndarens användning av telemedel, som utnyttjar 

elektromagnetisk vågutbredning, samt egna åtgärder för att minska verkan av 

motståndarens telekrigföring. 14 

Under en kurs i definitionsskrivning som hölls på TNC 1975 angav man att sådana 

definitioner, som skulle kunna kallas samlingsdefinitioner, som inleds med en metaformulering 

som ”sammanfattande benämning på …”, också skulle räknas som 

extensionella definitioner. För det är nog tveksamt om den typen av formuleringar ska 

anses utgöra ett överbegrepp i något som liknar en intensionell definition. Oavsett hur 

man ser på det är ”samlingsdefinitionen” inte ovanlig och det förekommer många 

varianter, bland annat ”Samlingsterm för …”,”Sammanfattande benämning för …”, 

och ”Begreppet omfattar …”. (I samtliga dessa fall anges ”och” före det sista 

elementet i uppräkningen.) 

banljus 

Sammanfattande beteckning för bankantljus, tröskelljus, banändljus, centrumlinjeljus, 

sättningszonljus och ljus vid utrullningsområde. 15 

Hur räknas det upp? 

Om man nu i stället frågar sig hur det räknas upp i begreppsbeskrivningar sker det 

oftast uttömmande enligt en viss indelningsgrund med de uppräknade elementen på 

samma begreppsnivå (dock icke-uttömmande i exemplifieringar och liknande som 

visats ovan, det vill säga när uppräkningar ingår i en definition). 

I vilken ordning räknas så elementen upp – och ger ordningen någon information 

om det bakomliggande begreppet? Jag ger här en bakgrund till min fråga: 

När jag en gång (innan Pluto blivit dvärgplanet 16 

) gjorde en OH-bild av en 

extensionell definition av begreppet planet med planeterna i bokstavsordning möttes 

det av förundran hos kollegerna: ”Så kunde man väl inte göra – de måste ju stå i 

13 

Frivilliga Radioorganisationen, http://www.fro.se/ordlista 

14 

ÖB 

15 

Luftfartsstyrelsen: Definitionssamling, 2008 

16 

I lanseringen av Nationalencyklopedins nya, uppdaterade kortversion (20 band) i Sverige lyfter man bland annat fram att Pluto 

inte längre är en planet. Detta är helt sant efter att den astrononiska unionen IAU röstat och kommit fram till att Pluto enligt den 

nya intensionella definitionen av ”planet” snarare ska räknas till dvärgplaneterna, men det är intressant att noterat man väljer att 

just ta upp något som är så inlärt (i en viss ordning) sedan skoltiden som planeterna i solsystemet. 


ordningen från Solen räknat!?” Men gjorde bokstavsordningen dem mindre till planet 

– var det inte bara så att ett kännetecken mindre uttrycktes? 

planet 

Merkurius, Venus, Jorden, Mars, Jupiter, Saturnus, Uranus, Neptunus eller Pluto 

Ordningen från Solen räknat är den vi lärt oss i skolan och den som känns naturlig; 

någon annan ordning, även bokstavsordning, om än mer logisk på ett sätt, blir svårare 

att komma ihåg. Det är svårt att dra slutsatser om den ordning som används när 

element räknas upp som begreppsbeskrivningar, men ofta verkar det ske i en för 

fackområdet och målgruppen logisk ordning (till exempel vad gäller planeterna), det 

vill säga enligt ett underförstått kännetecken (avstånd från solen). I exemplet om 

”ädelgas” känner många säkert igen ordningen (som gjorts efter det underförstådda 

kännetecknet ”plats i periodiska systemet”), men förmodligen för att ordningen är 

inlärd snarare än för att man i detalj kan redogöra för det periodiska systemets 

uppbyggnad. Men kanske den definitionen inte alls är tänkt för lekmän utan för 

experter? Men då behöver den väl inte nödvändigtvis vara särdeles pedagogisk? 

ädelgas 

helium, neon, argon, krypton, xenon eller radon 

Varför räknas det upp? 

Om man sammanfattar vilka skälen kan vara till att element räknas upp i och som 

begreppsbeskrivningar förefaller det som att de praktiska skälen är de vanligaste, till 

exempel för att det kan vara svårt att skriva en intensionell definition eller som i 

följande fall, där man just vill undvika att specificera och istället använder ett 

överordnat uttryck – något som snarare liknar ett klassifikationsskäl. Ibland framgår 

motivet tydligt: 

sorption 

överterm för absorption och adsorption 

Termen används när man ej kan avgöra om absorption eller adsorption föreligger. 

Till dessa kan läggas ”traditionsenliga” och kunskapsmässiga såväl som 

mnemotekniska skäl, det vill säga att man har lärt in något i en viss ordning som 

förefaller naturlig i ett visst sammanhang eller i en viss kultur (börjar till exempel 

veckan på söndag eller måndag i en extensionell definition av ”vecka”?). 

Picht & Draskau (1985) har påpekat att extensionella definitioner är kortare och 

mer förklarande. Åhlberg (1986) framhåller att det är enklare att använda de här 

typerna av definitioner för estetiska begrepp eftersom det ofta råder större enighet om 

konnotationen av ett begrepp än av denotationen, det vill säga uppräkningen är minst 


provokativ. Frågan kvarstår dock om dessa beskrivningar – som i litteraturen har 

framhållits som pedagogiska trots att de egentligen säger lite om det begrepp som 

”definieras” – verkligen är så pedagogiska i alla sammanhang, särskilt om det 

underförstådda kännetecken som uttrycks genom elementens ordning endast är 

självklart för en liten grupp fackexperter. 

Särskilt i lagtext verkar den extensionella definitionen vara vanlig. I en offentlig 

utredning (SOU 2008:120 Bättre kontroll av missbruksmedel. En effektivare 

narkotika- och dopningslagstiftning m.m.) beskrivs nio olika sätt att definiera inom 

juridiken, bland annat uppräkningsdefinitioner och s.k. definitionsmängder som kan 

vara slutna eller öppna. Den slutna definitionsmängden ”innebär att den mängd 

företeelser som definitionen åsyftar är bestämd eller känd vid ett visst givet tillfälle.” 

Man kan alltså ange alla element i definitionsmängden. Ofta sker det genom 

uppräkning. Inga nya element kan tillfogas mängden, som inte kan växa i omfång om 

inte definitionen ändras. Den öppna definitionsmängden innebär i stället att det kan 

tillfogas nya element som motsvarar definitionens kriterier. En öppen 

definitionsmängd kan alltså växa i omfång utan att definitionen behöver ändras. 

När det gäller begreppen ”narkotika” och ”dopningsmedel”, som är fokus för 

utredningen, beskrivs de med en sluten respektive en öppen definitionsmängd. Även 

om man i definitionen av narkotika anger ett överbegrepp (”läkemedel eller 

hälsofarliga varor”) så blir i praktiken ”den svenska narkotikadefinitionen en 

uppräkningsdefinition, genom att all narkotika anges på Läkemedelsverkets narkotikaförteckningar” 

och utgör alltså en sluten definitionsmängd. Detta anges i utredningen 

ha haft fördelar eftersom man enkelt har kunnat säga om ett ämne varit narkotika eller 

inte. Samtidigt framhåller man att den snabba utvecklingen av nya droger gör att 

förteckningarna snart blir inaktuella vilket påverkar rättssäkerheten. Det innebär att en 

extensionell definition är olämplig när extensionen ofta ändras. En önskan om en 

”generell” definition framhålls således samtidigt som man har invändningar mot en 

sådan eftersom man då riskerar att täcka in för många preparat och ev. kriminalisera 

tidigare legala ämnen. 

Man ska inte heller glömma att användningen av extensionella definitioner även har 

många andra nackdelar: de ger inte någon egentlig information om begreppet, det 

finns sällan en uttömmande extension och de är ej alltid särskilt varaktiga eftersom 

extensionen i många fall ändras med tiden. Dessutom avspeglar de inte alltid tydligt 

ett bakomliggande begreppssystem och anger inte alltid tydligt de uppräknade 

elementens position i ett sådant begreppssystem (handlar det t.ex. om underbegrepp, 

referenter eller exempel?). De uttrycker inte alltid explicit grunden för sin 

presentation, det vill säga ordningen, och de kan svårligen användas i stället för 

termen (Försök att fråga någon: Vilken januari, februari, mars, april, maj, juni, juli, 

augusti, september, oktober, november eller december fyller du år?). 

Till sist … 

I den här artikeln har jag försökt se på en kategori av ”definitioner” som visat sig 

vara ganska vanlig utan att gå till botten med uppräkningarnas alla mysterier. Mer 

skulle behöva göras och förhoppningsvis kan detta resonemang uppmuntra till mer 

forskning på den här typen av begreppsbeskrivningar. Mycket är ogjort och det är till 


exempel inte uppenbart hur ett begreppssystem över den här typen av ”definitioner” 

skulle se ut: 

intensionell definition 

definition 

(relat ionstyp och form) 

extensionell definition 

(riktning) 

? ”traditionell” 

extensionell 

definition 

? 

(”rubrikdefinition”) 

beståndsdelsdefinition (”samlingsdefinition”) 

uppräkningar 

FIGUR 1. Útkast till begreppssystem för ”uppräkningsdefinitioner”. 

Till sist vill jag räkna upp några punkter om uppräkningar som kan användas i det 

praktiska definitionsarbetet. Tänk på att: 

• uppräkningar kan fylla olika funktioner och ha sitt berättigande även som egna 

begreppsbeskrivningar – när det verkligen finns skäl 

• man bör vara medveten om varför och hur uppräkningen görs 

• man bör ange sorteringsgrunden när uppräkningar görs, i alla fall när de används som 

begreppsbeskrivningar! 

REFERENCER 

Nilsson, H. (2008). Ordning i redan – om extensionella ”definitioner”. I: Med tydlig intension, Solna: 

Terminologicentrum TNC, ISBN 978-91-633-3194-7, ss. 111–128 

Nilsson, H. (2009). X. I: Terminfo nr X 2009, Helsingfors: Terminologicentralen TSK 

Picht, H. & Draskau, J. (1985) Terminology : an introduction Guildford: Univ. of Surrey, ISBN: 0- 

9510943-1-9 

SOU 2008:120 Bättre kontroll av missbruksmedel. En effektivare narkotika- och dopningslagstiftning 

m.m., Socialdepartementet, Narkotikautredningen, Stockholm: Fritzes, ISBN 978-91-38-23114-2, 

http://www.sweden.gov.se/sb/d/10057/a/117523, 2009-09-04 


Wright, S.E. & Strehlow, R.A. (red.) (1995) Standardizing and harmonizing terminology : theory and 

practice, Philadelphia: ASTM, ISBN: 0-8031-1984-4 

Åhlberg, L.-O. (1986) Konst, språk och värde : om begrepp och definitioner inom de estetiska 

vetenskaperna. Uppsala: Uppsala univ., Inst. f. estetik, ISBN: 91-506-0475-9 

Österberg, H. (1979), Hierarkisk begreppsanalys : ett hjälpmedel vid undersökning av komplexa 

forskningsproblem, Stockholm: EFI : Norstedt, 91-1-787741-5 

Exemplen är (om inte annat nämns) hämtade från Rikstermbanken: . 


TERMDIST – nordisk terminologiutbildning i 

ljuset av europeiskt utbildningsoch 

certifieringsarbete inom terminologi 

Henrik Nilsson a och Niina Nissilä b 

a Terminologicentrum TNC, Västra vägen 7 B, SE-169 61 Solna, Sverige, +46 8 446 66 10, 

henrik.nilsson@tnc.se 

b Vasa universitet/Vaasan Yliopisto, Institutionen för nordiska språk, PB 700, FI-65101 Vasa, 

+358 6 324 81 11, niina.nissila@uwasa.fi 

Abstract. Sedan ett par år har C openhagen Business School (København), Norges 

Handelshøyskole (Bergen), Syddansk Universitet (Kolding), Terminologicentrum TNC 

(Stockholm) och Vasa u niversitetet (Vasa), Tolk- och översättarinstitutet (Stockholms 

universitet, Stockholm) och Stofnun Árna Magnússonar í íslenskum fræðum (Reykjavík) samarbetat 

inom projektet TERMDIST. Målet är att sk apa ett nätbaserat magister-/masterprogram i 

terminologi. Projektet presenterades under Nordterm 2007, och sedan dess har arbetet fortskridit. 

Höstterminen 2009 genomförs en pilotkurs. Denna kurs ska sedan upprepas som ett första steg i 

ett längre magister-/masterprogram, eventuellt med start hösten 2010. I denna artikel kommer vi 

att redovisa hur arbetet har fortskridit med kursen och på vilket sätt en nordisk utbildning av det 

här slaget är i ntressant för nordiska företag och deras anställda. Under ett seminarium om 

terminologens yrkesroll som hölls i Paris i feb ruari 2009 presenterade TermNet en plan för hur 

”terminologihanterare” (”terminology managers”) ska kunna certifieras (ino m projektet EU- 

CERT). Planen innehöll bland annat de l ärmoduler som ansågs behöva ingå i terminologiutbildningar 

för att en så dan certifiering skulle kunna ske. Artikeln kommer därför även att 

behandla i vilken mån innehållet i det tänkta nordiska magister-/masterprogrammet (sett även i 

förhållande till an dra existerande europeiska masterprogram) kommer att motsvara den 

planerade certifieringen. Mer information finns på: . 

TERMDIST: NÄTVERK OCH UTBILDNING 

Det nordiska nätverket TERMDIST skapades 2005 med stöd från Nordplus Språk. 

Nätverket TERMDIST arbetar aktivt m ot målet att skapa en samnordisk utbildning i 

terminologi på master-/magisternivå 1 . 

I nätverket ingår för närvarande fyra nor diska högre utbildningsinstitutioner där det 

bedrivs forskning och undervisning i terminologi och fackspråk och ett företag som är 

en drivkraft för terminologisk utveckling i sitt land: 

Copenhagen Business School (Handelshøjskolen i København), Institut for 

internationale sprogstudier og vidensteknologi, Danmark 

Norges Handelshøyskole, Institutt for fagspråk og interkulturell 

kommunikasjon, Norge 

1 Här råder viss språkförbistring mellan länderna varför både beteckningarna magisterprogram och masterprogram används. 


Stofnun Árna Magnússonar í íslenskum fræðum, Island 

Syddansk Universitet i Kolding, Institutt for fagsprog, kommunikation og 

informationsvidenskab, Danmark 

Terminologicentrum TNC, Sverige 

Vasa universitet, Institutionen för nordiska språk, Finland 

Förutom dessa har Tolk- och översättarin stitutet TÖI (Stoc kholms Universitet) 

också deltagit i nätverket. 

Förutom nätverksorganisationernas egen finansiering har projektet m ottagit stöd 

från Nordplus Språk under 2005–2008. Språkrådet i Norge bidrar till utveckling av 

läromedel. Utveckling av den kurs i term inologi som ges hösten 2009 (projektåret 

2008/09) finansieras av Norgesuniversitetet. 

Magister-/masterprogrammet 2 har p lanerats som ett Internetbaserat p rogram (60 

ECTS, högskolepoäng) enligt Bolognam odellen. Fokus kommer att ligga på distansundervisning. 

Enligt planerna ska programmet omfatta ett år, men kommer tidsmässigt 

att fördelas över två år så att det går att kombinera med till exempel förvärvsarbete. 

PILOTKURSEN 2009 

Hösten 2009 genomför s den första m odulen (Terminologi I) i nordiska m aster-/ 

magisterprogrammet som en pilotkurs ”Nordi sk kurs i terminologi”. Kursen riktar sig 

till kunskapsförmedlare, kommunikationsmedarbetare, översättare och 

dokumentalister, men också till fackexpert er med interesse för effektiv språklig 

kommunikation. Kursen ger 7,5 ECTS och varar 11 veckor (v. 40–50) hösten 2009. 

De medverkande instanserna kommer att va ra ansvariga för olika delar av kursen. 

Deltagarna kommer från alla de nordiska länderna. 

Kursen är nätbaserad och genom förs i nätinlärningsplattform en It’s learning. 

Undervisningen sker i form av självstudi er, presentationer på nätet, asynkron dialog, 

synkron chatt i mindre grupper, och övningar i grupper eller individuellt. 

It’s learning fungerar som kurswebbplats, so m används som materialbank för 

studiematerialet, som diskussionsplattform för m edstuderande och lärare, som 

postfack för inläm ningsuppgifter och övninga r och som ”lärarrum”. Undervisningsspråket 

varierar m ellan danska, norska oc h svenska. En del av övningarna och 

grupparbetena genomförs i bl andade nordiska grupper, en del av dem är språkspecifika. 

Antagningskrav är minst tre års utbildni ng på universitets- och högskolenivå. Den 

främsta målgruppen är personer som i sitt arbete kan tänkas ha nytta av terminologiska 

principer och metoder. 

Kursens mål är att ge studenterna färdigheter i terminologiarbete, ge grundläggande 

kunskaper om terminologi och terminologins teoretiska och m etodologiska grunder i 

ett nordiskt perspektiv, och ge en uppfattni ng om term inologins roll för en effektiv 

fackspråklig kommunikation. Studenterna får träning i att analysera och systematisera 

begrepp, identifiera och värdera term er i texter, utarbeta och bedöma definitioner och 

analysera texter term inologiskt. Kursinnehållet är f örankrat i te rminologistandarder 

2 Se nedan. 


utarbetade av ISO. Exempel och övningar som ingår är of ta hämtade från praktiskt 

terminologiarbete. Dessutom får student erna bekanta sig m ed terminologiska 

problemställningar på alla niv åer, från det lokala till det nordiska planet. Kursen är 

tänkt att utgöra en bas för fortsatta studier i terminologi. 

Kursen kommer att ge en översikt över terminologins centrala begrepp (begrepp, 

referent, begreppskännetecken, begreppsrelationer och be greppssystem, definitioner, 

termer etc.), förhållandet mellan fackspråk och allmänspråk, samt förhållandet mellan 

terminologilära och lexikografi. Det i ngår många övningar i praktisk term inologiarbete, 

såsom strukturering av begreppssystem, definitionsskrivande och 

termskapande. För att kunna göra övningarn a får man en introduktion i term inologihanteringssystemen 

i-Term och i-Model. Efter kursen ska studenterna kunna: 

Strukturera begrepp i begreppssystem 

Använda principerna för definitionsskrivning korrekt och redogöra för dem 

Känna till principerna för termskapande 

Välja ut termer utifrån etablerade kriterier 

Argumentera för terminologins roll i en effektiv fackspråklig 

kommunikation, både fackinternt och fackexternt 

Använda terminologins terminologi korrekt 

Examen genomförs som en digital portfölj 3 evaluering. Detta betyder att man under 

kursens gång ska lämna in fyra uppgifter, varav man sedan omarbetar tre med hjälp av 

individuella kommentarer från läraren. Den slutgiltiga ”portföljen” ska innehålla dessa 

tre uppgifter, både i den version som först lämnades in och i en bearbetad form samt 

en reflektionstext. 

Undervisningen genomförs av nordiska terminologiexperter med erfarenhet av 

undervisning, forskning och praktiskt terminologiarbete. Lärarna på kursen har alla en 

anknytning till nordiska forskningsinstitutioner eller terminologicentrum. 

MAGISTER-/MASTERPROGRAM 

Den ovan beskrivna pilotkurse n är tänkt att utgöra en fö rsta modul i ett ettårigt 

master-/magisterprogram 4 omfattande 60 HCTS fördelade på 8 moduler som är tänkta 

att distribueras enligt följande: 

3 

I Danmark där metoden är vanlig pratar man både om ”portfolio” och ”portefølje” i pedagogiska sammanhang (Nyt fra 

sprognævnet, 2009/2, s. 13). 

4 

Intresset för ett sådant magisterprogram undersöks nu inom ramen för en doktorsavhandling vid Vasa universitet. En inledande 

enkätundersökning visar intressanta, preliminära resultat, bland annat att en stor andel skulle skicka sina anställda på en sådan 

kurs, att de föredrar två år framför ett år och att de skulle uppskatta terminologisk kompetens vid nyanställning. 


TABELL 1. Översikt över det planerade magister-/masterprogrammet. 

År 1 År 2 

Terminologi I (7, 5 ECTS) 

Terminologihanteringssystem (TMS:er) 

(7,5 ECTS) 

Terminologi II (7,5 ECTS) 

Projektledning (7,5 ECTS) 

Språkpolitik (5 ECTS) 

Kunskapsstrukturering (5 ECTS) 

Översättningsorienterat 

terminologiarbete (5 ECTS) 

Masteropgave (15 ECTS) 

I nuläget finns inte så m ånga andra liknande utbildningar 5 , men i Spanien erbjuds en 

Master Online en Terminología 6 och vi har därför valt att även jäm föra med deras 

moduler; även om en sådan jämförelse endast kan bli förhållandevis ytlig; djuplodande 

information om vad som ingår i respektive modul har inte funnits tillgänglig. 

TABELL 2. Översikt över IULAs ”Master Online en Terminología” 

Obligatoriska moduler Valbara moduler 

Online Postgraduate Diploma: 

Terminology and Professional Needs 

(20 ECTS) 

Methodology on terminological work 

(10 ECTS) 

Supervised Master Project (10 ECTS) 

Online Postgraduate Course on 

Introduction to Terminology 

(10 ECTS) 

Resource for terminology by Internet: 

search and evaluation (5 ECTS) 

Using corpora for terminology 

(5 ECTS) 

Terminology management on computer 

assisted translation (5 ECTS) 

Making Terminological DB (5 ECTS) 

Problems of terminological work 

Redan den här enkla överblicken ger vid ha nden att det m esta av innehållet i den 

spanska utbildningen överensstämm er med som ingår i det planerade nordiska 

magister-/masterprogrammet, även om omfattningen i E CTS varierar något. Som i 

TERMDIST finns en grundläggande kurs som också ges separat (Online Postgraduate 

Course on Introduction to Terminology). En skillnad är den vikt man i Spanien lägger 

på korpusbaserat terminologiarbete. 

Exemplet EU-CERT 

Inom EU-CERT 7 (European Certificates Campus Project) pågår för närvarande ett 

projekt för certifiering av ”terminology managers” och ”financial term inology 

managers” med deltagare från Ungern, Rum änien, Spanien och Österrike (Term Net). 

5 Vi räknar här inte med de självstudiekurser som erbjuds av bland annat Termisti i Belgien: Abrégé de terminologie multilingue 

() och Translation Bureau (BtB) i Kanada: Terminology Tutorial (”Le Pavel”) 

(). Vi har heller inte jämfört med EMLex: 

European Master in Lexicography: . 

6 Se vidare för vidare information om det spanska magisterprogrammet. 

7 Se för mer information om projektet. 


Nedanstående översikt presenterades vi d EAFTs seminarium ”The Term inology 

Profession and the Marketplace” 8 som hölls i Paris i februari 2009. Enligt denna ska 

en certifiering bygga på att term inologen har en utbildning som motsvarar sex s.k. 

”skill units” (kompetensenheter) med tillhörande ”learning e lements” (lärkomponenter). 

Dessa presenteras närmare i figur 1: 

FIGUR 1. Översikt över de delar som ingår i den certifiering av ”terminologihanterare” som föreslagits 

inom projektet EU-CERT. 

8 Dokumentation finns på . 


I det följande komm er vi att jäm föra innehållet i den tänk ta certifieringen med de 

moduler som i dag finns planerade för TER MDISTs magister-/masterprogram. På det 

sättet kan man få en uppfattning om huruvi da de som kommer att följa den nordiska 

utbildningen skulle kunna certifiera sig i framtiden. Jämförelser med den spanska 

utbildningen kommer också att göras. 

Även om en sådan jämförelse inte kan bli helt fullödig eftersom information om 

EU-CERTs olika kom petensenheter inte h ar funnits tillgänglig kan det ändå ge en 

uppfattning om vad som tidigare, och i nuläget, anses tillhöra term inologens 

grundutbildning. I beskrivningen av profilen för ”certified terminology manager” sägs 

att ”Terminology and term inology management build an in tegral, high quality and 

quality assuring part of the end products, services and tolls in the fields of infor mation 

& communication, classification & categorization, translation & localization. The new 

job profile “Certified Term inology Manager” combines and bundles the various 

competencies of professionals active in these areas”. 9 

Överlag kan man konstatera att fyra av de sex modulerna verkar täckas in väl i både 

det nordiska och det spanska programmet, även om momentet om standardisering inte 

får lika stor plats som det verkar ha i EU-CERT. Modulerna om affärsprocesser och 

samarbete och psykologi är de som inte täcks in i nuläget. Man ka n då diskutera om 

dessa bör ingå eller om de fra mtida terminologerna ska ha detta i bagaget alternativt 

skaffa sig den utbildningen någon annans tans. Den här frågan diskuterades under 

ovannämnda EAFT-seminarium och Gabriele Sauberer från TermNet varnade då för 

att terminologen kan bli en ”eierlegende W ollmilchsau” 10 , dvs. en m ultikonstnär som 

ska klara allt, eventu ellt med tveksamt resultat. Man kan diskutera om detta är en 

önskvärd utveckling m en vi kan inte förd jupa den diskussionen här utan bara 

konstatera att man bör väga in tidigare kom petenser och kompletterande studier när 

man bedömer term inologens kompetens. Nedan beskriver vi varje kom petensenhet 

från EU-CERT med vad som nämns i olika yrkesprofiler och med praktisk erfarenhet 

av terminologiarbete och terminologiundervisning. 

Kompetensenheten ”Understanding Term inology Management” motsvarar huvudsakligen 

det som i TERMDIST ingår i m odulerna Terminologi I och Term inologi i 

Norden och de därtill kopplade lärkom ponenterna är sådana som en terminolog 

använder när han eller hon de ltar i aktiviteter som rör terminologiplanering, ensar och 

harmoniserar terminologier, skapar nya termer, produktnamn eller funktionsbeskrivningar, 

normerar terminologier eller granskar och följer upp terminologier så 

att termer och begrepp används på ett rikt igt sätt. Annorlunda ut tryckt, när han eller 

hon agerar term inograf, dokumentalist, fackspråkrådgivare, granskare, redaktör eller 

fackspråkvårdare. Det ingår mer övergripande moment som att skriva handledningar i 

begreppsanalys och term inologiarbete och delta i m er övergripande term inologiplanering 

på företags-, myndighets- eller sa mhällsnivå – aktiviteter som term inologer 

bevisligen arbetar med i Sverige i dag. 

Terminologyrket håller, som så m ånga andra, på att bli alltm er tekniskt och allt 

oftare ställs krav på kunnande i hanteri ng av olika term hanteringssystem. När det 

gäller kompetensenheten ”Terminology Management Skills” ligger dock Norden väl 

9 

http://www.iscn.com/projects/eu_cert/index.php?id=52 (2009-05-30) 

10 

Ung. ”äggläggande ullig gris som går att mjölka”, dvs. ett djur som ger både ull, mjölk, ägg och fläsk – en metafor för en person 

med extremt bred kompetens. 


framme: i Danm ark och Sverige finns fler a lokalutvecklade term inologihanteringssystem 

(TMS:er) o ch diskussioner om olika typer av m odellering och notation av 

begreppssystem fortgår. Det finns oc kså en god inblick och m ånga praktiska 

erfarenheter av hur term inologiprojekt bäst bedrivs. I Sverige och D anmark finns 

också några terminologer anställda inom offentlig och privat sekt or. I det planerade 

magister-/masterprogrammet motsvaras denna enhet av flera moduler: Terminologi II, 

Översättningsorienterat terminologiarbete, Kunskapsstrukturering och Projektledning. 

Den sistnämnda har tidigare ingått i den Master of La nguage Administration (MLA) 

som tidigare getts vid Handelshøjskolen i København 11 

Man ska inte underskatta den ökade ”t eknifiering” som också skett av 

terminologyrket (automatisk excerpering, kor pusbaserat terminologiarbete etc.) och 

Hayhoe (2000) uttrycker detta på följande sät t: ”If we want to prom ote our profession 

and ourselves, of course we m ust be competent users of tools. But at the sam e time, 

we should not led the tools define us or di stract us, our m anagers, or our audiences 

from the essential expe rtise that makes us effective communicators of specialized 

information. […] Wha t’s important about our work is the effectiveness and 

appropriateness of the content that we deve lop […], not the tools we use to encode 

that content. The tools make the production and delivery of the content easier, but it’s 

our technical subject matter expertise and communication skills that make us technical 

communicators.” Även om detta gällde teknikinformatörer kan mycket sägas vara sant 

även för terminologer. 

Den översättning av Snom ed (Systematized Nomenclature of Medicine) som har 

sysselsatt och sysselsätter m ånga i Danm ark och Sverige är bara ett ex empel på en 

tillämpning av terminologiläran inom en vi ss sektor. Och många fler sådana exem pel 

finns, liksom exempel på terminologiska tillämpningar i den semantiska webben och i 

lokalisering. Det finns alltså ett bra utgångs material för den kompetensenhet som EU- 

CERT kallar ”Application, Scenarios”. 

Norden har också varit och är fram trädande inom ISO och standardisering av 

terminologins egen terminologi och terminologiska arbetsmetoder vilket i sig gör att 

det finns mycket att ta upp i den kompetensenhet som kallas just ”Standards and Legal 

Issues”. ISO-standardisering utgör bas för den metodik som lärs ut. 

Detsamma gäller utbytesformat för terminologiska data (EU-CERT nämner TBX 12 ) 

där de nordiska länderna har en ganska lång tradition. Däremot finns det nog en del att 

komplettera med vad gäller sambandet terminologi och juridik, till exempel 

upphovsrätt och liknande frågor. 

Som tidigare nämnts är de två kvarv arande kompetensenheterna ”Business Process 

& Management Skills” och ”Tea m Working & Communication Skills” d e som i 

nuläget minst finns representerade i utbildni ngar. Att terminologiarbete inte är något 

ensamarbete är ingen nyhet, och när det gäller den mer ”psykologiska delen” av att till 

exempel arbeta m ed en expertg rupp och få m edlemmarna att komm a till konsensu s 

kring en definition eller en term finns det en hel del kunskap och erfarenhet bland 

yrkesverksamma terminologer. Kanske finns dock inte så mycket av detta beskrivet i 

11 Se vidare . 

12 TBX (Term Base eXchange) är en öppen, XML-baserad standard för utbyte av terminologiska data som utvecklats av LISA 

men som kommer att publiceras som ISO-standard (ISO 30042). Mer information finns på . 


form av utbildningsm aterial och teorier. När det gäller den m er affärsmässiga och 

ekonomiska delen har den komm it att bli en del av mången terminologs vardag i takt 

med att det krävs alltfler hå rda argument för att m otivera ett terminologiprojekt eller 

inköp av ett term inologihanteringssystem. Går det att räkna hem ? Det finns dock 

exempel på hur sådan argum entation kan ly ckas; ett sådant är uppbyggnaden av en 

termbank på Finlands Bank 13 . 

Allt innehåll i dessa kompetensenheter är dock inte helt och hållet frånvarande från 

planerade och existerande utbildningar – och i viss utsträckning kan nog en del av dem 

vara något som en term inolog har m ed sig sedan tidigare (p resentations- och 

undervisningskompetens etc.). En helt annan fråga är i vilken omfattning dessa 

moment som å ena sidan är specialkompetens, men å andra sidan allt viktigare som en 

del av te rminologiarbetet ska ing å i en terminologiutbildning – kan det räcka m ed 

gästföreläsningar eller krävs hela moduler med andra lärare än de som i dag undervisar 

terminologi? 

Certifiering av terminologer? 

Man kan här stanna upp och fråga sig om idén med en certifiering är lämplig för 

den lilla yrkeskår som kallar sig terminologer i Norden. Men allra först, några ord om 

begreppet certifiering. Begreppet kan definieras som ”handling utförd av en tredje part 

som visar att tillräcklig tilltro uppnåtts att en vederbörligt identifierad produkt, process 

eller tjänst är i överen sstämmelse med en bestäm d standard eller m ed ett annat 

regelgivande dokument” 14 , men nämns ofta ( i Sverige) i samma a ndetag som 

ackreditering, legitimering och auktorisering, och kring dessa begrepp råder, i varje 

fall i Sverige ibland viss förvirring. 15 Vi ska dock inte fördjupa denna diskussion här, 

men man kan konstatera att det teoretiskt skul le vara möjligt att i Sverige certifiera 

personer 16 . 

Diskussionen om certifiering har interna tionellt förts bland teknikinform atörer 

(Turner & Rainey, 2004; Rainey, Turn er & Dayton, 2005; W hiteside, 2003; Brady 

2007, Hayhoe 2000) – en yrkesgrupp som har beröringspunkter med terminologerna, 

varför dessa diskussioner kan vara intr essanta att app licera på term inologernas 

situation. Enligt dessa (Turner & Rainey, 2004) förutsätter certifiering bland annat: 

ett giltigt testförfarande 

en överenskommen kunskapsbas 

en kompetent administration 

ett tillförlitligt certifieringsorgan 

en rimlig kostnad 

13 

Se vidare Puttonen i denna volym. 

14 

SS-EN 45 011 (utg 1), 1989: Certifieringsorgan – Allmänna krav vid certifiering av produkter. Det finns dock flera snarlika 

definitioner i andra standarder och ordlistor. 

15 

Turner & Rainey (2004) definierar begreppet ”certification” som ”recognition or validation by a professional organization 

(including a college or university) or agency that an invididual possesses the qualification for engaging in a specific profession”. 

TNC har inlett en analys av dessa begrepp och deras svenska termer. 

16 

Det finns yrken som kan få titeln ”legitimerad” (inom vårdsektorn) och andra som är ”auktoriserade” (revisor och translator). 


En grundläggande fråga blir då om det fö r terminologer går att ta fram en sådan 

överenskommen kunskapsbas (body of knowledge) – som definierats som ”essential 

information of which practitioners m ust demonstrate mastery to be certified as 

professionals in that field” (Hayhoe , 2000). När det gäller kompetenser och 

kvalifikationer finns o m möjligt ännu fler begrepp och definition er i om lopp: 

kvalifikation, kompetens, skill, qualification, competence … Men oavsett vad man 

lägger i dessa begrepp och i begreppet kunskapsbas 

17 har det redan gjorts ett antal 

sammanställningar, yrkesprofiler, för term inologer 18 som just försöker beskriv a 

terminologens olika yrkesroller och länka dessa till nödvändiga kompetenser: 

RaDT: Berufsprofil 19 

Quirion, Caignon & Mareschal, 2004: ”Formation de terminologues” 

OTTIAQ : Kompetenstabeller (”Grilles de compétence”) 

EU 

Syddansk Universitet, Danmark 

Dessa profiler och deras innehåll utgör en bra utgångspunkt för en internationell 

kunskapsbas. Men kanske kan det be hövas ytterligare uppspjälkning av 

kompetenserna. För det ändamålet kan en diskussion som förts av Ellström (1997) och 

en tillhörande modell tjäna som utgångspunkt: 

p 

attribut 

hos 

individen 

formal competence 

officially demanded competence 

{ 

competence in use 

actual competence 

competence required by the job 

FIGUR 2. Modell över yrkeskompetenser (Ellström, s. 268). 

Ellström (1997) beskriver den term inologiska oreda som föreligger när det gäller 

kompetens och börjar m ed att skilja m ellan begreppen ”competence”, ”occupational 

competence” och ”qualification”. 

Kompetens (competence 20 ) definierar han som ”the potential capacity of an 

individual (or a co llective) to successfully (acc ording to certain form al or inform al 

criteria, set by oneself or by som ebody else) handle certain situations or com plete a 

certain job or task” 

Denna ”capacity” kan, enligt Ellström, beskrivas ytterligare genom fem klasser av 

”skills”: motoriska, kognitiva, affektiva, personlighetsrelaterade och sociala. 

17 I det här sammanhanget talas det också ibland om s.k. generiska kompetenser men då avses oftast kompetenser en person bör ha 

oavsett yrke. Dahllöf (2006) beskriver dessa kompetenser som ”sådana som är av en allmän relevans för många ämnesområden 

och som man som student därför torde kunna ta med sig från ett sammanhang till ett annat”. 

18 Se vidare Grinsted (2007) för en jämförelse av existerande profiler. 

19 Se vidare < http://www.radt.org/veroeffentlichungen.html>. 

20 Vi har valt att ibland behålla Ellströms engelska termer (och ibland även definitioner) i stället för att riskera att använda en 

felaktig eller olämplig svensk ekvivalent (om sådana ens finns). 


{ 

attribut 

hos 

arbetet

Yrkeskompetens (”occupational competence”) kan då ses som ett komplex av dessa 

fem klasser, en relation m ellan en individs kapacitet och det en viss s ituation eller 

uppgift kräver vilket gör det snarare till en potentiell kapacitet än en verklig kapacitet. 

Detta resonemang leder till att begreppet ”qualification” kan definieras som en typ av 

kompetens: ”the com petence that is act ually required by the work task; and /or 

implicitly or explicitly prescribed by the employer” (Ellström, 1997) 

Han fortsätter därefter med att ta upp fe m typer av kompetens och tre sätt att se på 

kompetens. Enligt de t första sättet (till vänster i bilden) ses kom petensen som ett 

kapital som individen besitt er och man talar då om ”formell” eller ”verk lig” 

kompetens: 

formal competence: kompetens som kan mätas i antal skolår, examina eller i 

vitsord från referenspersoner etc. 

actual competence: den potentiella kapaciteten hos person att klara av 

arbetsuppgift (baseras på utbildning och erfarenheter) 

Mycket av fokus har i m ånga sammanhang legat på den formella kompetensen och 

hur den säger något om den verkliga kom petensen. Ellström betonar d ock att d etta 

synsätt har kritiserats eftersom man inte alltid vägt in kvaliteten på olika utbildningar. 

Man har också tyckt att allt för stor vikt har lagts vi d intellektuella ”skills” på 

bekostnad av de övriga (till exem pel attityd, motivation och intressen) Dessutom bör 

man inte glömm a att den verkliga kom petensen innefattar även sådant som lärs in 

under själva arbetet och inte bara resultatet av utbildning. (Ellström, s. 268). Tillämpar 

man det här synsättet på term inologyrket infinner sig nog en mycket jäm nare 

fördelning mellan tyngden i form ell och verk lig kompetens; eftersom det saknas ett 

regelrätt utbildningsprogram handlar det i många sammanhang om att som terminolog 

lära sig genom att arbeta handfast m ed terminologi (”learning by doing”), genom en 

sorts modernt lärlingsutbildning. Samtidigt kan tidigare utbildning i både 

terminologilära och andra äm nen påverka ens yrkeskompetens som terminolog och 

bör därför vägas in vid kompetensbedömningar. 

Det andra synsättet (till höger i bilden) betonar yrkeskompetensen som något som 

framkommer i kraven som ställs för ett vi sst jobb, i en viss jobbannons, på en viss 

arbetsplats, av en chef etc. Detta gör att yrkeskompetens närmar sig begreppet 

”qualification” (se ovan). Ellström trycker på att det kan f innas skillnader mellan vad 

som officiellt krävs och vad som verkligen krävs, särskilt om man inte noggrant 

analyserat vad ett visst jobb innebär och vilka krav som bör ställas: 

”officially demanded competence”: föreskrivna kompetenskrav 

(platsannonser) 

competence required by the job: verkliga/egentliga kompetenskrav 

”Terminologjobbet” har väl inte hittil ls varit föremål för någon riktigt 

genomgripande analys (även om flera av de ovannäm nda yrkesprofilerna tar upp 

exempel på arbetsuppgifter en term inolog kan – och får – ut föra) och det skulle alltså 

kunna finnas en risk att det som föreskrivs (i jobbannonser och likna nde) inte är det 

som krävs – och inte heller det som tagits upp i term inologiutbildningen. Ellström 


etonar dock att den typen av jobbanalyser inte är enkla att genomföra. I stället vill 

han föra fram ett tredje, och mer interaktivt synsätt (mitten av bilden): 

”competence in use”: fokus ligger här på interaktionen mellan individ och 

arbete och den kompetens som verkligen används när arbetet utförs . 

Yrkeskompetensen är alltså varken ett attribut som hör till individen eller till själva 

yrket/jobbet utan om den kompetens som utvecklas i interaktionen m ellan individen 

och arbetet, den kom petens som verkligen används. Och det är kanske snarare den 

som beskrivits i de existerande yrkespro filerna för term inologer; eftersom många 

utvecklat yrkesrollen, åtminstone i Norden, genom praktiskt arbete har m an studerat 

vilka arbetsuppgifter man verkligen har utfört och inte resonerat fram vad man borde 

kunna göra med en viss utbildning i bagaget. 

Flera andra frågor kvarstår naturligtvis rörande kompetens och certifiering: Bör en 

analys av terminologjobb i Norden genomföras och på vilket sätt? Vilket organ skulle 

utföra en certifiering i varje land? Förmodligen bör certifieringen utföras lokalt, m en 

ett alternativ vore a tt en internationell organisation på terminologiområdet, som till 

exempel Infoterm eller TermNet, skulle sköta detta, men en förutsättning är då att d et 

finns beskrivningar som är jämförbara för existerande terminologiutbildningar. 

Alldeles oavsett om certifieringen realiseras eller in te kan det vara in tressant att 

föra en diskussion om terminologyrkets status och utveckling. I takt m ed att yrkeskåren 

förhoppningsvis växer bör man studera vilka krav som kan komma att ställas. 

Återigen kan man jämföra med teknikinformatörerna; i studier (W hiteside, 2003) har 

det framkommit att det som nyutexaminerade teknikinformatörer och chefer anser vara 

det viktigaste att komplettera en utbildning med är: 

”business operations 

project management 

problem-solving skills 

scientific and technical knowledge” 

Återigen är det inte svårt att tänka sig att flera av de här punkterna är relevanta även 

för terminologer, särskilt med tanke på de kom petensenheter i de n föreslagna 

certifieringen som i dag verkar vara något mindre utvecklade i terminologiutbildningar 

(ekonomisk argumentationsförmåga etc.). 

Diskussionens vågor för och em ot certifiering har alltså sva llat höga bland teknikinformatörer 

och inform ationsspecialister, men enbart nyligen väckts bland 

terminologer. Man kan därför fråga sig om det är lika relevant med en certifiering för 

terminologer och vad den i så fall skulle tjäna till. Följande uppställning presenterar 

några argument för och emot: 

För: 

Kan ge yrket status och 

legitimitet – och eventuellt 

högre löner 

Ansvarsmekanism 

Dokumenterar 

yrkeskunskaper 

Skapa (inter)nationell samhörighet 


Emot: 

För få yrkesutövande 

terminologer 

Svårt att sätta upp kriterier 

Svårt att få fram objektiva 

data om vad som efterfrågas 

på arbetsmarknaden 

Av en sådan samm anställning är d et förstås svårt att dra några slutsatser om en 

certifiering bör genomföras eller e j, men den kan möjligtvis väcka en diskussion som 

kan fortsätta inom bland annat Nordterm s ramar. Vad m an kan konstatera är att 

terminologyrket innehåller et t brett spektrum av roller och uppgifter och att 

terminologen ofta innehar många roller på samma gång. 

Terminologiutbildning – några utmaningar och frågor 

Alldeles oavsett om den ovannämnda certifieringen realiseras eller inte kan det vara 

intressant att fortsätta föra en diskussi on om terminologyrkets status och utveckling 

och vilka konsekvenser detta får för aktuell och framtida utbildning av term inologer. 

Redan i dag finns m ånga utmaningar för terminologiutbildningen i de nordiska 

länderna: 

Inget större genomslag av terminologi som akademiskt ämne och 

terminologiprofessurer finns i få nordiska länder. 

Otillräckligt antal studenter: en av anledningarna att TERMDIST startades 

var just att det i varje nordiskt land inte ansågs finnas tillräckligt studenter 

för att kunna starta en längre utbildning i terminologi. 

Olika utbildningskontexter (nätkurser, självstudiekurser, kurser i samband 

med projekt, kurser som ingår i introduktioner för nyanställda etc.) ställer 

olika (och nya?) krav på innehåll och metodik. 

En förändrad arbetsmarknad (och en framtida certifiering) ställer nya krav 

på innehållet i terminologiutbildningar vilka i sin tur ställer nya krav på 

terminologiutbildarna och på tvärvetenskapliga samarbeten. 

När det gäller målgrupper för terminologiutbildningar kan man fundera på om man 

bör sträva mot en ”terminologisering” av andra yrkesgrupper – och utbildningar?, dvs. 

parallellt nyutbilda terminologer vid universitet och högskolor i särskilda program 

men också erbjuda fortbildning för yrkesverksamm a personer från andra områden och 

erbjuda terminologi som en m odul i he lt andra utbildningsprogram än enbart 

språkorienterade? Quiron et al (2004) nä mner i sin yrkes- oc h kompetensprofil för 

terminologer att när det gäller term inologens kunskaper i ett fackområde kan man 

antingen tillgodose detta genom en introduktio n i fackområdet eller genom att ställa 

krav på tid igare studier inom detta om råde. Ska m an alltså, annorlu nda uttryckt, 

utbilda terminologer i kem i och andra fackom råden och parallellt utbilda kemister, 

fysiker etc. i term inologi? Kan man då i förlängningen tänka sig att en utbildning i 

terminologi ska kunna ses som en del i livs långt lärande och något som man snarare 

ska kunna få lära på/i jobbet vilket i sin tur ställer andra krav på didaktik och metodik. 

En annan relaterad fråga är hur m an bör resonera kring antagningskraven till 

terminologiutbildningarna. I Kanada har m an på Translation Bureau, som anställer 


många terminologer, nyligen ändrat kraven så att det nu krävs en översättarexamen för 

att få påbörja det tvååriga interna utbildningsprogrammet som leder fram till titeln 

terminolog. På TNC arbetar flera te rminologer som har annan huvudsaklig 

utbildningsbakgrund än språklig, vilket ibla nd har förvånat utländska term inologer. 

Även i TERMDIST di skuterades dessa frågor eftersom det ibland ställs krav in om 

institutioner på särskilda bakgrundsstudier för studenter som vill söka till ett nys tartat 

magister-/masterprogram. 

SLUTSATSER OCH IDÉER 

En bit in i p ilotkursen framstår TERMDIST som ett gott n ordiskt samarbete, som 

trots många utmaningar och olikheter kunna t realiseras. TE RMDIST-samarbetet har 

satt fingret på viktiga skillnader i uppfa ttningar och undervisningmetoder – något som 

också förtjänas att beskrivas i en egen artikel. Det framstår allt tydligare att det än så 

länge kan bli svårt för varje nordiskt land att få tillräckligt med studenter för att ordna 

ett eget master-/magisterprogram i terminologi, men det förhållandet kan naturligtvis 

ändras. Dock ändras inte det faktum att en samnordisk kurs är berikande på flera sätt, 

både för lärare och studenter. 

I ljuset av europeiskt arbete m ed certifiering och europeisk term inologutbildning 

kan det magister-/m asterprogram som skisserats inom TERMDIST, m ed vissa 

tänkbara kompletteringar, sägas väl motsvara EU-CERTs tänkta certifiering, och även 

täcka in innehållet i andra utom nordiska motsvarande program. Och de EU-CERTenheter 

som i dag saknas eller är m indre utvecklade skulle kunna ge upphov till nya 

intressanta tvärvetenskapliga samarbeten som kan bli till gagn även för utveckling av 

terminologiläran. 

Vi vill avs luta med några f rågor och idéer på tem at yrkeskompetens och 

certifiering: Frågan om certifiering skulle behöva fortgå – varför inte inom ramen för 

Nordterm, som ett nytt gem ensamt nordiskt projekt? – och utv ecklingen inom DTTs 

arbetsgrupp för utbildning där m an nyligen skapat ett system för viktning och arbetat 

fram kompetensmatriser bör följas. Ka nske dessa kan anpassas till nordiska 

förhållanden på samma sätt som deras Berufsprofil? 

Den enkätundersökning som genomförs vid Vasa universitet blir en intressant 

utgångspunkt för diskussioner och eventuellt fler undersökningar om olika typer av 

kompetenser hos terminologer. Kanske bör man djupdyka i vilka behov som finns på 

arbetsmarknaden av färdigutbildade te rminologer – och av vidareutbildning i 

terminologi av andra yrkesgrupper som kan pågå parallellt. Skulle en studie av 

jobbannonser och intervjuer m ed anställda och chefer kunna vara produktivt för en 

sådan diskussion eller varför inte ett sem inarium om kompetenser o ch en eventuell 

certifiering i Norden? 

REFERENCER 

Brady, A. (2007). What We Teach and What They Use. Teac hing and Learning in Scientific and 

Technical Communication Programs and Beyond.. In Journal of Business and Technical 

Communication 21(1), Sage Publications, ss. 37–61. 

Dahllöf, M. (2006). ”Generiska kompetenser”. PM, Uppsala: Uppsala universitet, Institutionen för 


lingvistik och filologi, , hämtad 2009-07-31 

Ellström, P.-E. (1997). The many meanings of occupational competence and qualification. In Journal of 

European Industrial Training 21/6/7. MCB University Press, ss. 266–273 

Grinsted, A. (2008). TERMdist. Et Nordisk Initiativ om en Masteruddannelse I Terminologi. In J. Hoel 

(red.) Kunnskap og fagkommunikasjon. (Nordterm 15, Nordterm 2007, 13.–16. juni 2008) Oslo: 

Språkrådet, ss. 76--84. 

Grinsted, A. (2007). TERMdist. Sammenligning af pr ofiler. Terminologer. Opublicerat 

projektdokument. 

Hayhoe, G.F. (2000). What Do Technical Communicators Need to Know? In Technical Communication 

47(2), ss. 151–153. 

Nilsson, H. (2009). Le terminologue en profil | The terminologist in profile. Opublicerad presentation 

framförd vid EAFTs seminarium The Terminology Profession and the Marketplace som hölls i Paris 

den 19 februari 2009. 

Pulitano, D. (2009). Le profil du terminologue du RaDT. Opublicerad presentation framförd vid EAFTs 

seminarium The Terminology Profession and the Marketplace som hölls i Paris den 19 februari 

2009. 

Rogers, M. (2000). Training in Terminology. In Conference on Co-operation in the Field of 

Terminology in Europe, Union Latine & EAFT: Paris, ss. 167–177. 

Sauberer, G. (2009). Terminology and the famous RoI. Opublicerad presentation framförd vid EAFTs 

seminarium The Terminology Profession and the Marketplace som hölls i Paris den 19 februari 

2009. 

Turner, R.K., Rainey, K. T. (2004). C ertification in Technical Communication. In Technical 

Communication Quarterly 13(2). Hillsdale, NJ: Lawrence Erlbaum Associates, ss. 211–234. 

Turner, R.K., Rainey, K.T. & Dayton, D. (2005). Do Curricula Correspond to Managerial Expectations? 

Core Competencies for Technical Communicators. In Technical Communication 52(3), ss. 323–352. 

Whiteside, A.L. (2003). The Skills that Technical Communicators Need: An Investigation of Technical 

Communication Graduates, Managers, and Curricula. In Journal of Technical Writing and 

Communication 33(4), Baywood Publishing Co, ss. 303–318. 


Begreppsstrukturer i språkbadselevers 

ämnesspecifika skriftliga produktion 

Niina Nissilä a och Nina Pilke 

aInstitutionen för nordiska språk, Vasa universitet 

Abstrakt. Den här artikeln diskuterar terminologiska metoder i analysen av begreppsstrukturer i 

skolelevers skriftliga produktion på L2. Materialet består av 117 uppsatser skrivna av 

språkbadselever på årskurs 6. Elevernas begreppsorientering undersöks med hjälp av 

begreppskartor (satellitmodell) som förväntas visa hur eleverna strukturerar ett angivet tema 

(väder) med tanke på olika nivåer. Studien visar att med stöd av begreppskartor är det möjligt att 

identifiera olika känneteckenkategorier på olika nivåer. Med hjälp av de terminologiska metoderna 

kan man därmed få en helhetsbild av hurdana begreppshierarkier det finns i texterna och på detta 

sätt få en uppfattning om hur elever på en viss årskurs strukturerar ämnesspecifik kunskap. 

INLEDNING 

I vår artikel diskuterar vi användning av terminologiska metoder i analysen av 

begreppsstrukturer i skolelevers skriftliga produktion på L2 (andra språket). Vår studie 

är en del av forskningsprojektet Begreppsvärldar i svenskt språkbad (BeVis) vid 

institutionen för nordiska språk vid Vasa universitet. 

Vi är intresserade av på vilket sätt (om och hur) terminologiska metoder kan 

tillämpas i en ämnesspecifik kontext som ändå inte är kommunikation mellan experter. 

Vi undersöker elevernas begreppsorientering med hjälp av begreppskartor som 

förväntas visa hur eleverna strukturerar ett angivet tema med tanke på olika nivåer. Vi 

kommer också att göra en preliminär analys av begreppskännetecken genom att 

undersöka vilka aspekter eleverna har med i sina texter. 

PROJEKTET BEVIS OCH MATERIAL 

Det övergripande syftet med det bakomliggande större forskningsprojektet (BeVis) 

är att studera hur språkbadselevernas ämnesspecifika kunskapsstrukturer och 

kunskapshantering utvecklas i den grundskoleundervisning som ges via både 

språkbadsspråket svenska och första språket finska (BeVis 2009). Svenskt språkbad i 

Finland är ett flerspråkigt undervisningsprogram där barn som har majoritetsspråket 

finska som sitt förstaspråk lär sig språk och innehåll parallellt. Språkbadet 

introducerades i mitten av 1980-talet i Vasa med en grupp i daghem. (Laurén 1999). 

Idag deltar ca 4000 elever i svenskt språkbad på daghems- och grundskolenivå på 13 

orter. (Laurén & Buss 2009: 3). 

Projektet BeVis förenar två forskningstraditioner vid institutionen för nordiska 

språk, nämligen forskning i svenskt språkbad och forskning i fackspecifik 


b

kommunikation. Forskargruppen be står av fackspråksforska re och språkbadsforskare 

på post doc -nivå, doktorander och avhand lingsskribenter på magisternivå. Denna 

kombination förväntas ge dels nya insikter i åldersrelaterad ämnesspecifik kompetens i 

andraspråk i språkbad, dels nytt ve tande om tillämpningen av term inologiska och 

fackspråkliga metoder i en ny kontext. 

Materialinsamlingen inom projektet inleddes 2004 m ed en skriftlig 

pilotundersökning och avslutades 2009 med klassrumsobservationer och 

lärarintervjuer. Den insamlade korpusen består av enkät, muntlig t material, skriftligt 

material och klassrumsobservationer på tre årskurser (3, 6 och 9) i tre städer i Finland 

(Esbo, Åbo och Vasa). I denna artik el sätter vi det skriftliga materialet på årskurs 6 

som samlats in i oktober 2005 i fokus. 

På uppgiftspapperet har eleverna fått krys sa för kön (flicka/pojke) och skriva in 

klass. Själva uppgiften är som följer: 

Berätta för en språkbadselev i Australien vad som händer när det blir vinter i 

Finland. På papperet finns några ledtrådar som ger dig idéer vad du kan skriva 

om. Du får välja så många av dem som du vill. Sätt ”Nu blir det vinter i 

Finland” som rubrik. 

Eleverna har därm ed haft som uppgift att under ungefär 30 m inuter skriva en 

uppsats med rubriken Nu blir det vinter i Finland utgående från sex ämnesspecifika 

stimulusord (vädret, marken, vattendragen, växterna, djuren, människan). Eleverna på 

årskurs 6 i Esbo, Åbo och Va sa har skrivit 119 uppsatser som innehåller sammanlagt 

18121 ord. Ord har räknats som grafiska ord med hjälp av W ord i den autentiska 

kontext där de förekomm er. Felaktig sä rskrivning av sa mmansättningar (t.ex. minus 

grader, Golf strömen, jätte kalt) resulterar således i tv å eller flera ord. Bland 

skribenterna finns det enligt den inform ation som eleverna ger på uppgiftspapperet 56 

flickor och 61 pojkar. Därtill finns det 2 el ever som inte har angett sitt kön. Av dessa 

finns den ena bland flickorna (93 ord) och de n andra bland pojkarna (104 ord) i tabell 

1. 

TABELL i). Ord i uppsatserna. 

Flickor Pojkar Totalt 

Ord 10936 7186 18121 

Flickorna har skrivit knappt 11000 ord (i genomsnitt 192 ord/uppsats) och pojkarna 

drygt 7 000 ord (i geno msnitt 113 ord/uppsats). I genomsnitt har eleverna skrivit 152 

ord i sina uppsatser (rubriken inte m edräknad) och variationsvidden för ländgen mätt i 

ord i det utvalda m aterialet är 10–388 ord. En kvantitativ genom gång av m aterialet 

ifråga om ledtråden väder visar att endast två elever av 119 inte alls diskuterar 

begreppet ’väder’ i sina texter. En kvalitativ analys av hur de 117 eleverna presenterar 


egreppet ’väder’ i sina texter gör vi genom att analysera vilka begreppsstrukturer som 

förekommer i materialet. 

I vår analys använder vi terminologiska metoder med vissa modifieringar. Texterna 

är skriva av barn/ungdomar på ett andraspråk och därmed kan man varken förvänta sig 

helt korrekta term er eller att de olika begr eppsnivåerna och alla begreppsrelationer 

uttrycks explicit i tex terna. Däremot är det av intress e att und ersöka vilka 

begreppsnivåer eleverna på årskurs 6 i svenskt språkbad se r ut att favorisera, vilken 

intension i form av kännetecken de ger de begrepp som de har valt att diskutera och 

hur de uttrycker det ämnesspecifika innehåll et i sina texter. Alla exem pel som vi 

presenterar nedan är autentiska (f elen är därmed inte rättade) och kodade (inom 

parentes ges årskurs, kön, ort, skola, skribent). 

GRÄNSDRAGNINGAR 

Vi har inte sett på hur eleverna definierar begreppet ’vinter’, utan koncentrerar oss 

på kännetecken som de använder när de be skriver vädret. Gränsdragningen för vilka 

kännetecken som har tagits m ed i analysen baserar sig på Nationalencyklopedins 

(1996) definition av väder. Där definieras sökordet ”väder” på följande sätt: 

rådande tillstånd i fråga om vind, nederbörd, temperatur och liknande 

naturföreteelser i den närmast omgivande atmosfären på viss plats vid visst 

tillfälle el. under viss tidrymd. 

I fråga om ’nederbörd’ har vi avgränsat de t undersökta materialet så att vi tar m ed 

de uttryck som hänvisar till väderlek (t.ex. händelserna det snöar, det regnar, det faller 

snö), men inte de uttryck som beskriver hur det ser ut i Finlan d på vintern (t.ex. 

tillståndet marken är helt vit av snö). Enligt samma princip har vi i d et här sk edet 

utelämnat uttryck som marken blir kallare och kallare och marken är frysen, och har i 

stället koncentrerat oss på uttryck som klart anknyter till väder och ’temperatur’ (t.ex. 

sen blir vädret kallare och det blir hela tiden kallare och kallare). Längden på dagen 

och mörkret ingår inte i definitionen av ’väder’. Därför läm nas exempelvis 

beskrivningar som det är mycket mörkare än på sommaren utanför den nu aktuella 

analysen. 

Texterna ger många forskningsmöjligheter. Vår gränsd ragning att ta enbart 

begreppet ’väder’ som undersökningsobjekt medför att flera intressanta teman den här 

gången lämnas utanför vår analys. Ett av de m är begreppsrelationerna mellan de olika 

stimulusbegreppen. 

Begreppet ’väder’ i uppsatserna 

Vi har upprättat ett satellitsystem (mer om satellitsystem i Nuopponen 2000) 

utgående från de begrepp och kännet ecken som förekommer i uppsatserna. 

Satellitsystemet kan användas som verkt yg i arbetsprocessen då m an skapar en 

indelning för ett om råde. Det kan också användas för att hålla samman fackom rådets 

begreppssystem. Satellitsystem kan fungera som visuellt verktyg när man vill illustrera 

komplicerade begreppsproblem och som flexibelt begreppsligt verktyg som tillåter 


förändringar, avgränsningar och specifi ceringar under arbetets gång (Nuopponen 

2000: 130, 142ff.). 

Vi har excerperat kännetecken på ’väder’ i uppsatserna och använder 

satellitsystemet för att illustrera kollektivt alla känn etecken på ’väder’ s om 

förekommer i uppsatserna från årskurs 6. På de t sättet vill vi illust rera hur barnen på 

årskurs 6 ordnar sitt vetande och hurdana be greppshierarkier barnen skapar när de 

beskriver begreppet ’väder’. I fortsättni ngen kommer vi att upprätta likadana system 

utgående från det övriga undersökningsm aterialet från årskur serna 3 och 9, och 

jämföra systemen med varandra. De olika sy stemen förväntas visa hur elever i o lika 

åldrar strukturerar ämnesspecifikt vetande. 

Vi har byggt satellitsystemet runt begreppet ’väder’ (se Bilaga). Satellitsystemet har 

tre satellitnoder. För tydlighetens skull har vi i vår tex t markerat med fet stil de taljer 

som är med i figuren. Vi beskriver en satellitnod åt gången, och går vidare med en nod 

åt gången från helhet till detalj. Vi koncen trerar oss främst på begreppsnivån och 

bortser från eventuella språkfel. 

Enligt eleverna på årskurs 6 är den kalla temperaturen och nederbörden i form av 

snö de två viktigaste kännetecknen på ’vin ter’. De här två har fått egna noder i vårt 

satellitsystem om väde r. De mer sällsynta företeelserna i uppsatserna, d.v.s. solen, 

molnigheten, vinden och åskan presenterar vi i en tredje nod (Andra företeelser). 

NEDERBÖRD 

Enligt eleverna på årskurs 6 hör nederbörd ti ll vinter. Att det snöar är enligt barnen 

ett viktigt kännetecken på vinterväder, det näm ns i näs tan alla uppsatser (1a). 

Nederbörden kommer enligt barnen i form av snö, slask eller regn (1b och 1c): 

Ex.1 a) I Finland snöar det på vintern. (6FV17) 

b) I mällan kan det rägna slask (6FED5) 

c) Ibland regnar det, ibland snöar det (6FÅ1) 

Barnen skriver om hur ofta det snöar ( frekvens), hur m ycket det snöar ( mängd) 

och när och var det snöar ( lokalisering). Frekvensen utgör en skala från att det snöar 

några gånger eller ibland till att d et snöar ofta (2a) eller att de t snöar oftast flera 

gånger i veckan. Det intressanta i dessa klimatförändringens tider är observationen att 

det kanske inte alltid snöar (2b) på vintern. Mängden va rierar likaså på en skala från 

lite till mycket och mera (2c). 

Ex. 2 a) Det snöar ganska ofta. (6PV112) 

b) De är kanske trokigt när där komma inte snö (6FED6) 

c) Det snöar jätte mycke när de är vinter. (6PV116) 

Lokaliseringen av snön är både tidsmässig och rumsmässig i uppsatserna. Ifråga om 

tid menar eleverna att d et snöar på vintern och både hela vintern och varje vinter 

(3a) nämns i texterna. Snöandet börjar enligt eleverna i början av vintern eller i 

december (3b). Uppgiften att skriva ett brev st yr innehållet i texterna så att några 

elever har en starkt deiktisk syftning (s e Aristotle 1989; Saarin en 1999: 140f.) i sina 


texter (dagsaktuella förhållanden) och skriver att det snöar idag. Att det till sist snöar 

är en konsekvens av att vädret blir kallare och att det först regnar mycket. 

Ex. 3 a) Det regnar snö varje vinter i Finland. (6PED8) 

b) Ibland smälter snön i november men senast i december kommer det 

ny snö. (6PV117) 

c) Här i Finland Faller snö från himlet. (6PV19) 

d) Snö flingorna kommer ner till marken. (6FEA3) 

Rumsmässigt nämns det i de fles ta uppsatserna att det snöar i Finland (3a, 3c) på 

vintern. Några har specificerat att det snöar mest i Lappland eller tänkt på sin hem ort 

och konstaterar att det snöar i Vasa på vintern. De som anger riktning skriver att snön 

kommer från himlen (3c) och att snön faller till marken (3d). 

Ex. 4 a) Oftast regnar det mycket före de första snön kommer. (6PEA24) 

b) Först regnar det litet (6PEA17) 

Tidsmässigt menar barnen att det kan regna ibland eller hela vintern. I fråga om 

mängden av regn menar de att det regnar oftast mycket (4a) eller först litet (4b). 

TEMPERATUR 

I sina uppsatser nämner alla elever som skriver om väder i vårt m aterial 

kännetecknet temperatur i en eller annan form. En del hänvisar till 

temperaturbegreppet genom att skriva att d et är minusgrader respektive plusgrader. 

Alla går längre ner i begreppshierar kin och ger tem peraturbegreppet en tidsmässig, 

rumslig, kvantitativ (mängd) eller kvalitativ (sätt) avgränsning. De kan ha preciserat 

att det är hela tiden (5a) eller oftast minusgrader, att det är minusgrader ute (5b), att 

det brukar vara (5c) minusgrader eller att temperaturen går neråt (5d): 

Ex. 5 a) På vinter är temperaturen nästan hela tiden på minus. (6PV27) 

b) Alltså ute blir minusgrader. (6FV215) 

c) Det brukar oftast vara minus grader men (6FV211) 

d) Temperaturen går neråt och neråt (6FED14) 

De som diskuterar kvantiteten skriver att det är flera minusgrader (6a) eller 

alternativt nämner de grader med hjälp av ett värde (6b) eller en skala (6c): 

Ex. 6 a) Flera minus grader. (6PÅ24) 

b) På vinter kan det vara över -20c° kallt. (6FED11) 

c) När det komm er vinter till Fi nland blir det kalt (-5°C - -15°C). 

(6PV16) 

Vid sidan av tem peratur är det vanligt att eleverna diskuterar kyla (några även 

värme) i sina texte r. Vanligast är att de t är e ller blir kallt (7a,b) e ller att d et blir 

kallare (7c): 


Ex. 7 a) Vädret är kallt (6PV212) 

b) När Finland kommer vinter så vädret blir kalt (6PED3) 

c) När det blir vinter här i Finland blir vädret kallare. (6FÅ18) 

I en del texter har fenom enet kyla fått en totalitetsbetydelse (allt är ka llt) medan 

samma fenomen i andra te xter får avgränsningen ganska kallt och jättekallt. Det är 

intressant att notera att eleverna tycks jämföra även om de inte nämner explicit vad de 

jämför med (se ex. 7c ovan). De som ger fenomenet kallare en precisering jäm för 

platser (Tyskland, Lappland, 8a,b), olika årstider (8c) eller månader (8d). 

Ex. 8 a) I Finland är det oftast en kallare vinter, än t.ex. i Tyskland. (6FEC3) 

b) I Lappland är det mycket kallare. (6FÅ1) 

c) Vädret k ommer att bli kallar e än i sommar elle r höst. 

(6FV216) 

d) Kallaste är i december, januar och februar. (6FÅ17) 

Kännetecknet kallt finns m ed även i de uppsatser som beskriver förhållandena på 

vintern som inte varma. Begreppet värme behandlas i några upps atser. Eleverna har 

tagit fasta på både sätt ( ganska varmt) och orsakerna bakom att det är varm t 

(Golfströmmen). 

ANDRA FÖRETEELSER 

Den tidsmässiga dimensionen finns också m ed när barnen skriver om solen på 

vintern. De m enar att det är soligt bara på dagen och att solen är ” nere än på 

sommaren” (d.v.s. lägre ner, 9a). Båda observati onerna implicerar en jämförelse med 

de andra årstiderna. Frekvensen för ett soligt väder varierar från att det är mycket 

soligt till att solen inte syns så bra eller att solen inte skiner på vintern (9b). Solens 

funktion på vinter är att ge ljus, men till egenskaperna hör att den inte värmer (9c). 

Ex. 9 a) På vintern syns solen inte så bra när solen är nere än på sommaren. 

(6FEA4) 

b) Solen skinen inte hela vintren. (6FEA3) 

c) Vädret kan ändö vara solig, eller molnig, men fast det skulle vara 

soligt betyder det inte att det skulle vara så mycket varmare. (6FED15) 

Moln (9c) och vind nämns bara i några en staka uppsatser. Det är enligt en elev 

ibland mulet på vintern, det kan vara vindigt (10a) eller vinden kan vara stark/hård. 

En av eleverna skriver att det inte åskar på vintern (10b). 

Ex. 10 a) Vädret blir kallt och vindigt. (6FEA18) 

b) På vinter åskar det inte. (6FEA7) 


DISKUSSION 

I vår artikel har vi visat hur man kan använda terminologiska metoder i analysen av 

begreppsstrukturer i skol elevers skriftliga produkti on på L2 (andraspråket). 

Satellitsystem är ett flexib elt verktyg, som kan användas fö r att illustrera en helhet 

som byggs upp av en heterogen sam ling av egenskaper. Vi använder satellitsystem 

som begreppskartor vilka visar hur eleverna strukturerar ett angivet tema med tanke på 

olika nivåer. Kartorna ger en helhetsbild av hurdana begreppshierarkier det finns i 

texterna. En språkbadslärare t.ex. kan tänkas ha nytta av att kunna få en helhetsbild av 

hur eleverna tänker när de st rukturerar ämnesspecifikt innehåll i en viss ålder. Då kan 

läraren anpassa både innehållet och f ormen i sin undervisning till elevernas kunskaper 

och utvecklingsnivå. Lärarna kan också tänkas ha nytta av att kunna relatera elevernas 

produktion som helhet till det som de har gått igenom i undervisningen. 

Vårt mål har varit att testa hur terminologiska metoder kan tillämpas i analysen av 

elevtexter. Pilotstudien visar att det på uttrycksnivå inte är ä ndamålsenligt att i f örsta 

hand prioritera termer eftersom det är fråga om språkinlärning. Bristande användning 

av termer (t.ex. regna snö istället för snöa) är dock inget hinder för våra analyser. 

Läraren kan på uttrycksnivån se vilka luc kor det finns i ordfö rrådet inom det givna 

temat. Uppsatserna är resultatet av en urvalsprocess och visar därmed naturligtvis inte 

allt vad eleverna kan om ifrågavarande tema. 

Begreppet ’väder’ och dess kännetecken i texterna kan analyseras m ed hjälp av 

terminologisk begreppsanalys. Med stöd av våra begreppskartor har vi kunnat 

identifiera olika känneteckenkategorier på olika nivåer. Det finns flera möjligheter att 

redovisa resultaten. För det första kan m an ge en helhetsbild där m an har m ed alla 

kännetecken som eleverna n ämner. För det andra kan m an begränsa 

resultatredovisningen till att gälla bara de kännetecken som är de mest frekventa (t.ex. 

nämns i 50 % av texterna). I fortsätt ningen kommer vi att se på själva 

begreppsorienteringen med kartorna so m utgångspunkt, dvs. undersöka vilka slags 

begreppsrelationer som finns mellan kännetecknen inne i ett begrepp (begreppsinterna 

begreppsrelationer) och m ellan olika stimulusbegrepp (begreppsexterna 

begreppsrelationer). De begreppsinterna relationerna indelas i v år studie dels i 

horisontala relationer, dels i vertikala relationer. 

Eleverna ser ut att definiera begrepp i sina texter vilket styrs av uppgiften. Eleverna 

har i sina uppsatser bl.a. ofta gett begreppen ’snö’ och ’jul’ en längre beskrivning som 

förklarar fenomenet för en som inte känner ti ll det. Definitionsstrategier är därm ed 

också ett möjligt tema för fortsatt forskning. 

REFERENCER 

Aristotle (1989). Categories. In: Aristotle’s Categories and De Interpretaione, 3–42. Clarendon Aristotle 

Series. Oxford: Clarendon Press. 

BeVis (2009). Begreppsvärldar i sv enskt språkbad. Tillgänglig: http://www.uwasa.fi/pohjoismaiset/ 

forskning/koi/ 

Laurén, Christer (1999). Språkbad. Forskning och praktik. Vaasan yliopiston julkaisuja. Tutkimuksia 


226. Vaasa: Vaasan yliopisto. 

Laurén, Christer & Martina Buss (2009). Samhället som språklärare i språkbad: För att förstå behöver 

man inte kunna varje ord. Tillgänglig: http://www.uwasa.fi/midcom-admin/ais/midcomserveattachment-6753/sprakbad. 

Vaasa. 

Nationalencyklopedins ordbok (1996). Tredje bandet. Språkdata, Göteborg, och Bokförlaget Bra Böcker 

AB, Höganäs. 

Nuopponen, Anita (2000). Satelliter och system – att integrera begreppssystem i terminologiarbetet. I: 

Nuopponen, Toft & Myking (red.) I terminologins tjänst. Festskrift för Heribert Picht på 60årsdagen, 

128–145. Vaasan yliopiston julkaisuja. Selvityksiä ja raportteja. Vaasa. 

Saarinen, Irja (1999). Kvantitatiivinen silmänkääntötemppu ja miten se tehdään. Määrien retoriikkaa 

Suomen Kuvalehdessä. I: Käytännön sanelema juttu? Aikakauslehtigenreä etsimässä, 140–176. 

Kielen opissa nro 3. Helsinki, Helsingin yliopiston Suomen kielen laitos. 


Compiling a Glossary for a Special Language 

Learning Tool 

Päivi Pasanen 

Kymenlaakso University of Applied Sciences 

P.O. Box 9, FI-48401 Kotka, Finland 

Abstract. This paper is based on the experience received from two Leonardo da Vinci projects, 

MarEng and MarEng Plus 1 . During the MarEng project a web-based maritime English learning 

tool was compiled. The learning tool was published on a CD-ROM and on the internet in the 

Spring of 2007. Maritime students and workers all over the world have taken the learning tool 

into wide use. However, based on the feedback, elementary level material and material on some 

relevant themes are in demand, as well as a teacher’s manual. The aim of the ongoing MarEng 

Plus project is to respond to this feedback. One of the aims of the MarEng Plus project is to 

update the glossary which was compiled during the MarEng project. This paper considers the 

glossary from a terminological point of view and suggests some guidelines which could be 

applied in the glossary work. Terminologists might meet similar challenges or tasks in event that 

existing company glossaries are used as a source for a termbank or terminology work on a 

special field. 

background 

For a long time, English has been the common language at the seas. This is more 

apparent in today’s market with multinational and multicultural crews. Sufficient 

command of English, and more precisely, maritime English, is crucial, not only for 

everyday work, but especially for safety reasons. To ensure the safety, security and 

efficiency of seafaring and port operations messages must be understood correctly in 

spite of the different cultural and national backgrounds of the speakers. All 

communications must be conducted in a manner which will avoid confusion and 

misunderstanding, especially in emergency situations. These demands are a challenge 

to seafarers, who cannot attend traditional language training because of the long 

sailing periods (very often from six months up to one year). Besides seafarers, the tool 

is intended for landlubbers working ashore in maritime business and for maritime 

English teachers and students all around the world. The lack of maritime English 

teaching material which is available at low cost or free stimulated the project coordinators 

to start planning the MarEng project. 

The aim of the first MarEng project was to promote the maritime English language 

competences of those working in various maritime professions in Europe. During the 

project a web-based maritime English learning tool was compiled. The MarEng 

Learning Tool is an organised database of various maritime English teaching and 

learning materials which are grouped in thematic modules, each containing a number 

of units. The materials represent two language levels, intermediate and advanced. The 


themes are, such topics as, port operations and cargo operations, shipping and 

maritime management, vessel types and parts (the engine room, cargo space) and the 

crew, weather, radio communication, standard marine communication phrases, 

emergency situations, vessel traffic services and ice navigation. 

The aim of the ongoing MarEng Plus project (MarEng Plus Learning Tool and 

New Applications) is to respond to the feedback received from the learning tool. The 

usability of the learning tool will be improved and the user group will be widened by 

adding elementary level materials to the tool. Also, two new themes will be included. 

These are Maritime Security and the Marine Environment. The teacher’s manual will 

give instructions to English teachers on how to use the tool. 

mareng glossary 

One of the aims of the MarEng Plus project is to update the glossary which was 

compiled during the MarEng project. The English-English glossary is based on the 

materials produced for the learning tool. Every partner made a selection of headwords 

from his or her material and suggested them to the partners responsible for the 

glossary compilation. All learning material is English-English and is based on 

language used in actual situations on board ships and in ports. The texts are carefully 

thought out dialogue and information written with a professional maritime flavour. In 

addition no rules, regulations, international conventions or other legal texts are 

included. They are not needed in the tool, because teachers have access to the original 

legal texts. 

According to the project plan of the MarEng Plus project, the material in the 

existing glossary will be preserved and completed with new themes and new 

headwords selected from the new elementary level material. For financial reasons, in 

the new tool the glossary will be in pdf format. Furthermore, the glossary will be 

transferred into a form which can be utilised in a mobile phone even when the phone 

is out of satellite connection. 

The aim of the glossary is to facilitate the use of the learning tool. Terminologists 

might meet similar challenges or tasks in the case existing company glossaries are 

used as a source for a termbank or terminology work on a special field. The existing 

glossaries may not be user-friendly, because even if they are electronically readable, it 

may be that they have different formats and structures. Very often they are just unclear 

paper copies with hand-written side notes. Glossaries which have been compiled from 

different sources contain overlapping information or concepts which are out of date. 

At the same time, some important (new) concepts are missing. In this case a 

terminologist has to address the questions, how to utilize existing resources, how to 

instruct material producers and how to find possible inconsistencies. The quickest way 

to solve the problem is to just add new headwords and definitions to the existing 

glossary. The hardest way is to compile a completely new terminological glossary. Or, 

as a compromise light renovation could be a suitable solution. In the following, I will 

discuss some aspects of a glossary work to be considered if the choice is to lightly 

renovate an existing glossary. 


The headwords of the glossary 

Glossaries are structered into two easily distinguished parts, which can be called the 

left hand side and the right hand side. On the left are the headwords and on the right is 

the information about the headwords, such as definitions, examples, grammatical 

information etc. (see e.g. Kudashev 2007: 33–42). The size of a glossary is normally 

indicated with the number of headwords. Having 1400 headwords (and 33 pages), the 

existing MarEng Glossary could be called handysize. With new themes and the new 

level the number will grow, maybe double. The student will have difficulty in finding 

the word or words in question. Obviously, the number of headwords should be 

reduced. Handbooks on terminology work (e.g. Sanastotyön käsikirja 1988: 153) 

instruct to start reduction from general language words. So, I checked the left hand 

side of the glossary with the aim to detect unnecessary general language headwords. 

As a result, I detected 24 headwords which could be considered as general language 

words. General language words should not be found as headwords in a special 

language glossary, unless they have a special meaning in the field (cf. Kudashev 2007: 

97). The following headwords can be mentioned as examples of general language 

words included in the glossary: 

(1) automotive 

(2) average 

(3) can 

The idea of the compilers was to give the general language meaning for a word 

which is a part of a compound term, for example, the noun can is a part of can buoy (a 

cylindrical unlighted buoy used as a channel marker). Still, I would exclude can from 

the glossary and show the necessary information in the definition of the term. The 

same would apply for ore and side. Furthermore, the adjectives automotive, average, 

total and firm, for example, have the same meaning in the maritime context as they 

have in the general language. 

The question about inclusion of multiword language units (MWLU), such as 

compound terms, collocations and idioms, is more complicated, since English for 

special purposes is rich in multiword units. A collocation is a relationship involving 

the co-occurrence of words (Perea Barberá 1999: 290), whereas a compound is a 

combination of two or more words with a new meaning (Sager 1990: 76). As Pritchard 

(2003: 7) says, in English it is often difficult to decide whether a certain multiword 

unit is a compound or a collocation. I will not discuss the difference between 

compound terms and collocations, but instead, will consider them as a whole having 

the concept multiword language unit as the superordinate concept for both. As a rule, 

the number of multiword language units is higher in specilized dictionaries than in 

general language dictionaries (Pritchard 2003: 2). It has been agreed that about 80 

(60–95) per cent of special language dictionary headwords are multiword units 

(Kudashev 2007: 186). In the MarEng Glossary one will find the portion of multiword 

heads is a lower percentage. There are at least four possible explanations for this. 


Either there are too many one word heads or some multiword heads are missing. The 

third explanation is that the maritime language is the necessary exception from the rule 

or the material does not include multiword terms. None of these explanations in my 

view seems valid. Instead, I believe the explanation can be found in the part of speech 

devision of the headwords. The avarage proportion of multiword units as headwords 

has been counted from dictionaries with nouns or noun phrases as headwords. The 

MarEng Glossary includes a number of verbs and adjectives as head words, although, 

normally adjectives would be in a glossary as a constituent of a noun phrase. The 

compilers of the glossary have wanted to give the meaning of constituents of 

multiword terms, being it an adjective or a noun. In most cases this practise is quite 

justified, since nouns normally are terms alone, as the noun deck in the term deck 

cargo: 

(4) deck cargo cargo and goods carried on deck 

Besides nouns and noun phrases, the MarEng Glossary includes a number of 

adjectives and verbs as headwords: 

(5) inbound inward bound e.g. inbound ships, ships sailing into the port, 

channel or fairway 

(6) flammable easily set on fire 

According to Grinёv (1993: 28–29), almost all terms are nouns, since verb terms 

can always be transformed to nouns. The compilers have often included both the verb 

and the noun having the same baseform. The number of headwords could be reduced 

by leaving just one of them in the glossary, since they designate the same concept. 

This is evident from the definitions which have the same characteristics, as is the case 

in the following examples: 

(7) cool to bring to cold temperature 

(8) cooling lowering the temperature of cargo 

The choice between a noun and a verb depends on the use of the terms in the 

material. From this point of view, it could be justified to place a verb as a headword. 

On the other hand, from a terminological point of view, it could be justified to place a 

noun as a headword, since nouns are easier to define than verbs. 

Synonyms are normally accepted in a special field glossary. Since they name the 

same concept, they are recorded in the same entry in the MarEng Glossary. The 

problem is that the reader cannot find the synonym if it is embedded in the same entry 

with another term. Every synonym should have an entry of its own, but the definition 

should come with either but not both. In the example 9 below, the synonym lighter 

should appear as a separate headword with the notion: see barge. 


(9) barge a lighter, a flat-bottomed vessel, usually intended to be towed or 

pushed, for transporting cargo or passangers 

Some headwords have variant spellings and forms: 

(10) astern full speed! /full speed astern!/ full speed backwards! 

(11) liquefied natural gas carrier, LNG carrier a ship specially constructed for 

the carriage of natural gas in a liquid form 

What is said about the synonyms above, applies to variants as well. Every variant 

should have an entry of its own and the definition should appear together with the 

variant most frequently used. Other spellings should be cross-referred to the main 

entry. However, if the variants appear next to each other in alphabetics, it might be 

reasonable to place them in one entry. This is an exception, though. There are just a 

few examples about variants having almost identical spellings, like the variants 

fo’c’sle and foc’sle, for example. 

Extensive use of abbreviations is typical of maritime English. It is important to 

explain them in the glossary, because the exclusive use of abbreviations creates a false 

feeling of familiarity (Pasanen 2006: 237). Concerning abbreviations, the MarEng 

Glossary is inconsistant. An abbreviation is normally given together with the long 

form on the same line with or without a definition. But, as a rule, the abbreviation and 

a long form do not appear as two separate headwords, as they should. In terminology 

work, there is a rule to avoid duplicate definitions. Therefore, the definition should be 

given only in one place, either in connection with the abbreviation or with the long 

form, which is the normal practice in dictionaries. The solution suggested here is that 

the abbreviation and the long form appear as separate headwords and the definition 

goes with the long form (see other dictionaries e.g. Webster’s New World Dictionary). 

As an example, the following abbreviations can be found in the glossary: 

(12) bill of lading / B/L / a document stating that goods have been shipped on 

board and are to be delivered to a consignee at a port of destination 

(13) C.P.A. = Closest Point of Approach 

(14) CPA = Closest Point of Approach the shortest passing distance 

In the example 12 the abbreviation is embedded in the headword together with the 

long form of the term. There is no headword starting with the abbreviation B/L in the 

glossary. Therefore, a reader may not find an explanation for the abbreviation. In the 

examples 13 and 14 the abbreviations are synonymous variants, which are placed in 

different places in alphabetics. Traditionally, abbreviations consisting of capital letters 

separated with full stops, start a section in a glossary, while abbreviations without full 

stops appear later in the section. There is no need to change this order, as far as the 


abbreviations are followed with a cross reference to the main entry and the definition 

follows the main headword. 

In the MarEng Glossary, proper names are included only in the form of 

abbreviations. In this respect the glossary meets the requirements of a terminological 

glossary. The glossary does not take the task to give an explanation of the roles of 

different organisations and bodies in the maritime field: 

(15) INMARSAT = International Maritime Satellite Organization 

THE DEFINITIONS IN THE GLOSSARY 

After making a decision about headwords necessary for the target group, the 

compiler has to decide which kind of information is needed at the right hand side of 

the glossary. Besides definitions or explanations, the list of information types which 

might be useful for the reader, may include phonetics, subject labels, grammatical 

information, style, age, information about locality or encyclopaedic information, for 

example (Kudashev 2007: 197). At the moment, there are definitions, but no other 

information about the headwords in the MarEng Glossary. Sometimes there is more 

than one definition, since some headwords have more than one meaning. For example, 

berth has at least three meanings which are valid in the maritime context: 

(16) berth 1. any place for securing a vessel (for conducting commercial 

operations); 2. a bed in a passenger cabin; 3. distance (give this object a wide 

berth) keep well clear of 

For the sake of the mobile version of the glossary, the different meanings should be 

placed in separate entries. This means that the number of headwords will grow 

remarkably. Therefore, the number of different meanings has to be kept in minimum. 

Browsing through the glossary gives the impression that this might be difficult with 

some verbs and nouns, which have more than one meaning. The solution suggested 

here, is that the meaning of some verbs could be narrowed with prepositions. For 

example, the meaning of the verb heave can be narrowed with prepositions away, in, 

on, to or up. Some verbs might be merged together with nouns as headwords. 

Phonetic transcriptions may be helpful in the English word list (Perea Barberá 

1999: 290). It could be claimed, however, that students are not familiar with the 

phonetic symbols. The most helpful means would be to include audios. Technically 

this should be possible but the phonetic transcription is not included in the existing 

MarEng Glossary. 

Subject labels would be helpful in some cases. For example, there are plenty of 

headwords having the upper level concept device. Why not label them with eng. 

meaning engine room, or bridge meaning that the device is mounted on the bridge. 

Also, the student might be interested to know, if the headword denotes to an act or a 

device. The structure of the MarEng Glossary does not necessarely follow concept 

systems and the definitions do not always show concept relations. Therefore, strictly 

speaking, the glossary is not terminological. It would be useful to know the upper 


level concept, to which concept group does the concept belong, is it a device or a 

place, is it human or not. The example 17 shows a definition in which the upper level 

concept is missing: 

(17) booster pump used to increase pressure in a liquid line, or pulls liquid 

from a tank and pressurizes a system 

Although it is quite obvious that a booster pump is a kind of a pump, the definition 

shoud explicitely indicate the superordinate concept. Furthermore, even if the concept 

relations are not indicated, the definition should contain at least one delimiting 

characteristic. In the example 18 a characteristic is missing. A reader might be 

interested to know; what is the cause of corrosion and what are the consequencies of 

the process? 

(18) corrosion rusting 

The glossary is full of verbs, probably, because they are typical for the field and 

have to be included in the glossary. Verbs have not been in the focus of terminology 

research and the technique to define verbs is not well developed. In the book 

Sanastotyön käsikirja, which is the Finnish version of the handbook of terminology 

work, this topic occupies five lines and one example. The book says that verbs can be 

defined with functional characteristics describing method, result, agent or device used 

for the act. In the existing MarEng Glossary most verbs are accompanied with near 

synonyms from general language, often more than one of them. The general language 

verbs lack the essential special field information which the head verb has. The 

compilers have tried to compensate this lack by adding more general language verbs to 

the list. By adding more general language verbs, the compilers actually do students a 

disservice, because there is a risk that the student chooses the wrong near synonym. 

This problem has been discussed in Perea Barberá (1999: 292) stating that most 

dictionaries frequently provide lists of equivalents with no discriminating label or 

encyclopaedic note. Proper definitions or encyclopaedic information would be useful, 

since the students might be familiar with the field, but still have some gaps in the 

encyclopaedic knowledge. 

concluding remarks 

When starting a glossary project, the first thing to do is to decide the amount of 

information to be included: number and form of headwords (terms, compound terms, 

collocations, phrases, commands), grammatical information, examples, phonetics, 

subject labels, encyclopaedic information. The decision will depend on the language 

skills and needs of the intended users of the glossary. The size of the glossary should 

be kept within reasonable limits. Normally, the users will appreciate handysize 

glossaries including all essential information and excluding unnecessary headwords or 

repetition. How do we meet these demands in MarEng Plus glossary project? First, 

start downsizing. Find synonyms and join them where possible, cut off extensive 

definitions and use cross-referencies, instead. Secondly, add the superordinate 


concepts where they are missing, if not the closest, then a concept on the upper level. 

Thirdly, group concepts belonging to the same semantic group and subdivide them to 

find conceptual relations. For example, devices belonging to the engine room 

comprise one group, devices belonging to the bridge comprise the second group, and 

cargo handling devices comprise the third group. Change the superordinate concept, if 

there is one which is closer to the concept, check the definitions and correct 

inconsistencies. Finally, find characteristics for the verbs, at least some of them. In this 

way, the work will be heading to the direction predicted by Boris Pritchard (2000: 97) 

in his article on pragmatic information in maritime dictionaries: 

“We may therefore predict three likely trends in maritime lexicography of the 

future, involving: 

- development of multilingual terminological dictionaries with English as the key 

language, 

- conceptual (thematic) approach to dictionary macrostructure, or a mixed approach 

including alphabetical macrostructure and conceptual arrangement for selected entries 

within the alphabetical word list, 

- methodology of compiling, sampling and making dictionaries mainly based on 

corpus linguistics and availability of electronic data banks.” (Pritchard 2000: 97). 

References 

Grinёv 1993 = Гринев, С. В. (1993). Введение в терминоведение. Москва: Московский Лицей. 

Kudashev 2007 = Кудашев, И. С. (2007). Проектирование переводческих словарей специальной 

лексики. Helsinki University Translation Studies Monographs 3. Helsinki: Helsinki University Print. 

Pasanen, Päivi (2006). Standard Marine Communication Phrases as a Maritime Language Norm. In E. 

Lehtinen & N. Niemelä (Eds.), LSP and Theory of Translation. 26 th VAKKI Symposium. Vaasa, 11.– 

12.2.2006. Vaasa: University of Vaasa, pp. 230--239. 

Perea Barberá, M. D. (1999). An Approach to the Typology of Contemporary Spanish-English / 

English-Spanish Maritime Dictionaries: the Terminology of Shipbuilding. In D. L. Newman & M. 

Van Campenhoudt (Eds.) Maritime Terminology: Issues in Communication and Translation. 

Proceedings of the First International Conference on Maritime Terminology. Brussels, 15–16 May 

1998. Bruxelles: Éditions du Hazard, pp. 285--293. 

Pritchard, B. (2000). Pragmatic Information in Maritime Dictionaries. In J. Vainio (Ed.) Maritime 

Terminology: Dictionaries and Education. Proceedings of the Second International Conference on 

Maritime Terminology. Turku, 11–12 May 2000. Publications from the Centre for Maritime Studies A 

36. Turku: University of Turku Centre for Maritime Studies, pp. 83--99. 

Prichard, B. (2003). Multiword lexical units in maritime dictionaries. In 3 rd International Conference on 

Maritime Terminology. Lisboa, 23–24 June 2003. CD-ROM. 

Sager, J. (1990). A Practical Course in Terminology Processing. Amsterdam/Philadelphia: John 

Benjamins. 

Sanastotyön käsikirja (1988). Soveltavan terminologian periaatteet ja työmenetelmät. SFS-käsikirja 50. 


Terminor og Termportalen – nye initiativer for 

norsk terminologisk infrastruktur 

b 

Gisle Andersen a, b og Marita Kristiansen a 

a 

Institutt for fagspråk og interkulturell kommunikasjon 

Norges Handelshøyskole (NHH) 

Helleveien 30 

NO-5045 Bergen 

Unifobs avdeling for kultur, språk og informasjonsteknologi (Unifob AKSIS) 

Allégaten 27 

NO-5007 Bergen 

Abstract. I denne artikkelen presenterer vi to prosjekter som har som mål å fremme og gjøre 

tilgjengelig norsk terminologi for ulike fagområder. Det ene prosjektet er nylig gjennomført og det 

andre er planlagt. 

Det første prosjektet, Termportalen, er et prosjekt som har vært gjennomført ved Unifobs Avdeling 

for kultur, språk, og informasjonsteknologi (Unifob AKSIS). Prosjektet har vært et første steg mot 

en nasjonal infrastruktur for terminologi og fagspråk og fungerer som et slags pilotprosjekt i 

forhold til det langt mer omfattende Terminor-prosjektet. Et system for søking på tvers av 

heterogene termbaser er utviklet, og en nettportal for norsk terminologi er etablert. 

I det andre prosjektet, Terminor, ønsker vi å fylle termportalen med innhold ved å utvikle 

oppdatert terminologi for en rekke fagfelt. I tillegg ønsker vi å videreutvikle den teknologiske 

infrastrukturen og utarbeide en felles nasjonal standard for terminologiarbeidet i prosjektet. 

Initiativet til prosjektet er tatt av Norges Handelshøyskole (NHH), i nært samarbeid med Unifob 

AKSIS og Universitetet i Bergen (UiB). 

INTRODUKSJON 

De siste årene har det blitt et stadig sterkere fokus på språkplanlegging i Norge og 

situasjonen for norsk som fagspråk i forhold til særlig engelsk har vært kraftig debattert. En 

årsak til dette er en økende trussel om domenetap innen sentrale fagområder etter hvert 

som engelsk tar over som hovedspråket på disse fagområdene. Denne diskusjonen er 

oppsummert i St.meld.nr. 35 (2007-2008) Mål og meining. Ein heilskapleg norsk språkpolitikk 

(Språkmeldingen). Behovet for å intensivere arbeidet med norsk fagspråk er dessuten slått 

fast i en rekke publikasjoner og utredninger, slik som Norsk i hundre! og har vært tema ved 

flere seminarer, bl.a. Språkrådets strategikonferanse om fagterminologi i oktober 2004 og en 

konferanse om terminologi og økonomisk lønnsomhet i Bergen i november 2005. Flere av 

innleggene på forrige Nordterm-konferanse slo fast at arbeidet med norsk fagspråk befinner 


seg i en uavklart situasjon (Andersen 2008; Kristoffersen 2008; Leonteva 2008). Det finnes 

mange tidligere terminologiressurser som ligger brakk og som ikke ivaretas på en forsvarlig 

måte, slik som dataene fra Norsk termbank (NOT-basen) og Rådet for teknisk terminologi 

(RTT). Samtidig er flere miljøer i ferd med å utvikle nye termressurser, slik som arbeidet med 

Den grønne ordboka (Kerner 2008), brannfaglig terminologi (Liebe 2008), 

samfunnsøkonomisk terminologi (Hjelmbrekke 2008; Kristiansen 2009), osv. 

Både brukere av terminologi og terminologiutviklere har interesse av at det som finns av 

eksisterende terminologiressurser blir tatt vare på og gjort tilgjengelig. Søking i mange ulike 

databaser, med mange ulike grensesnitt og brukertilganger, er både tungvint og tidkrevende. 

Slik vi vurderer det, er det et tydelig behov for at arbeidet med terminologi koordineres på 

nasjonalt plan. I denne artikkelen vil vi presentere to prosjekter, Termportalen og Terminor, 

som begge har som mål å fremme og gjøre tilgjengelig norsk terminologi for ulike 

fagområder gjennom etablering av en nasjonal terminologiressurs. Slik vil prosjektene også 

bidra til de føringene som legges i Språkmeldingen gjennom at norsk fagspråk ivaretas og 

videreutvikles parallelt med engelsk. 

TERMPORTALEN 

Termportalen er et prosjekt som har vært gjennomført ved Unifob AKSIS. Bakgrunnen for 

prosjektet er erkjennelsen av behovet for å fremskaffe en samlet og oppdatert oversikt over 

eksisterende terminologiressurser. Unifob AKSIS har gjennom årene utviklet en lang rekke 

termbaser og det var ønskelig å undersøke muligheter og forutsetninger for å gjøre dem 

tilgjengelig gjennom et felles grensesnitt, i tillegg til at det trengtes en kartlegging av norske 

termressurser mer generelt. Prototypen Termportalen er et forslag til en slik nasjonal 

ressurs. Den er utformet som en nettportal som er ment for alle som på ulike måter er i 

befatning med norsk fagspråk og terminologi. I tillegg til oppdaterte oversikter med lenker til 

utvalgte nettbaserte terminologiressurser, er det et langsiktig mål at portalen skal kunne 

tilby brukerne informasjon om alt fra konferanser, kurs og faglitteratur til hjelp med å finne 

terminologisk eller teknisk bistand. 

Termportalen foregikk ved Unifob AKSIS i perioden 1. desember 2007-22. april 2009. 

Prosjektet var hovedsakelig internt finansiert, men i prosjektets siste del (fra august 2008) 

hadde det en delfinansiering fra Språkrådet. Arbeidet har vært et første steg mot en nasjonal 

infrastruktur for terminologi og fagspråk og fungerer som et slags pilotprosjekt i forhold til 

det langt mer omfattende Terminor-prosjektet som vi vil beskrive nærmere under. 

Prosjektet forløp i tre faser. I første fase var målet å kartlegge i bredest mulig grad hva 

som er tilgjengelig av norske terminologiressurser på Internett. Det ble samlet inn et stort 

antall lenker til aktuelt materiale, hver enkel lenke ble undersøkt og vurdert, og til sist sto vi 

igjen med et 40-talls referanser til ulike nettsteder som inneholder norsk terminologi. 

Ressursene ble så gruppert etter fagområde. En oversikt over ressursene som portalen 

henviser til finnes på Termportalens ressursside, som vist i Figur 1 under. 


I prosjektets annen fase ble denne oversikten videreutviklet. I tillegg ble det skannet en 

del materiale ved Unifob AKSIS som ikke var elektronisk tilgjengelig, nemlig tre termlister 

tilknyttet maritime fag. Disse er foreløpig inkorporert i portalen i form av søkbare pdfdokumenter, 

men har bare vært gjenstand for sporadisk korrekturlesning. I tillegg gjorde 

prosjektgruppen forsøk på å få tilgang til de verdifulle termressursene som i sin tid ble 

utviklet av RTT. Dette arbeidet lyktes, og en avtale ble inngått med den nåværende eieren av 

dette rikholdige materialet. I denne fasen utarbeidet vi dessuten en søknad til Språkrådet om 

støtte til prosjektet Termportalen – fra lenkesamling til nasjonal infrastruktur, og denne ble 

innvilget i september 2008. 


FIGUR 1. Termportalens lenkesamling 

Prosjektets tredje fase var altså delfinansiert av Språkrådet, og målet med denne fasen 

var å ta steget fra en lenkesamling til en mer fullverdig digital infrastruktur for terminologi. 

Arbeidet i denne fasen dreide seg først og fremst om å utvikle en ny databaseløsning som 

gjør det mulig å søke på tvers av databaser som inneholder terminologi for ulike fagområder. 

Gruppen gjorde også en kartlegging av innholdet i RTT-materialet og vurderte tekniske 

forutsetninger for å innlemme det i den nasjonale portalen. 

Den nye tekniske løsningen er en prototyp for databaseløsning og grensesnitt som i sin 

helhet er basert på åpen kildekode. Den benytter seg av programmeringsspråket Common 

Lisp, såkalte Weblocks og databasespråket PostgreSQL. Fordelene ved dette er åpenbare. Det 

innebærer at kildekoden er tilgjengelig for programmerere, noe som forenkler fremtidig 

videreutvikling og feilkorrigering. Det er heller ingen restriksjoner på distribuering eller salg 

av systemet. Grensesnittet er programmert i Common Lisp med verktøyet Weblocks for 

laging av vebbapplikasjoner med tett integrasjon av databaser, automatisk 

sesjonshåndtering, med støtte for vebbutviklingsteknologi basert på AJAX (asynkron Java og 

XML). 

Så langt har fire termbaser blitt importert i den nye termportalen: EØS-sekretariatets 

terminologidatabase og norske oversettelser av rettsakter innlemmet i EØS-avtalen (EØS-EUbasen), 

KB-N-basen utviklet under prosjektet Kunnskapsbank for norsk økonomiskadministrativt 

domene, NOT-basen utviklet av Norsk termbank, og RTT-materialet utviklet av 

Rådet for teknisk terminologi. Samlet utgjør dette et stort materiale, nærmere 128 000 

termposter. Fordelingen på de ulike deldatabasene er som vist i Tabell 1. 

TABELL i). Oversikt over terminologiske ressurser i Termportalen 

Termbaser Fagområder Antall termposter* 

KB-N økonomi og administrasjon 8 467 

EØS-basen 70 fagområder, EØS-rettsakter 40 348 

NOT-basen 38 fagområder, Norsk 

termbank 

30 521 

RTT-materialet 48 314 


Til sammen 127 650 

* per 19. oktober 2009 

I menyvalget Termsøk er det mulig å søke både i enkeltressurser og parallelt i flere ressurser 

samtidig. Dette er vist i Figur 2. 


FIGUR 2. Termportalen, søk i spesifikk termbase 

Per i dag ligger NOT-basen, KB-N, RTT-materialet og EØS-EU-basen inne som eksempler, 

men infrastrukturen kan raskt utvides. Det vil være mulig for andre termressurser å bli 

tilknyttet den nasjonale portalen. Teknisk sett er en slik integrering forholdsvis ukomplisert, 

så lenge det ikke er juridiske forhold som hindrer dette. Termportalen skal i utgangspunktet 

være gratis og fritt tilgjengelig for alle, men de deler som er beskyttet på grunn av 

opphavsrett vil være passordbeskyttet. 

I den gjeldende løsningen kan man bruke ulike søkbegrensende kategorier, i tillegg til å 

begrense søket til individuelle termbaser. Figur 3 viser hvilke språk som er representert i 

Termportalen. 


FIGUR 3. Termportalen – søk i språkspesifikke felt 

Dessuten kan man søke i spesifikke felt i en termpost, slik som Hovedterm og Synonym. 

Videre kan man søke med utgangspunkt i Definisjon og Kontekst, og man kan søke blant 

frarådde termer, som vist i Figur 4. 


FIGUR 4. Termportalen – søk i bestemte felt i termposter 

TERMINOR – TERMINOLOGISK INFRASTRUKTUR FOR 

NORSK 

I det planlagte prosjektet Terminor ønsker vi å videreføre arbeidet med 

Termportalen ved å bygge ut en bred terminologisk infrastruktur for norsk. Målet er å 

etablere en nasjonal kunnskapsbase bestående av kvalitetssikrede terminologiske 

ressurser som er fritt tilgjengelig via én felles internettbasert portal. 


En viktig motivasjon for prosjektet er å få etablert en infrastruktur for 

begrepsmessig harmonisering og enhetlig terminologibruk i Norge. Ved at denne 

infrastrukturen gjøres tilgjengelig for forskere, studenter og samfunnet for øvrig, vil 

portalen kunne bli en viktig ressurs for norske forskningsmiljøer som i stadig større 

grad jobber på tvers av institusjoner, fagmiljø og nasjonale grenser i både 

interdisiplinære og transdisiplinære prosjekter. Således tar Terminor mål av seg å møte 

ufordringen med et stadig mer globalisert og dynamisk forskningssamfunn og vil 

danne grunnlag for forsknings- og utviklingsarbeid på tvers av akademiske og 

næringsrelaterte virksomheter. 

Samtidig vil prosjektet fremme internasjonaliseringen av norsk forskning gjennom 

at prosjektet kobles opp mot den infrastrukturen som bygges opp i ESFRI-prosjektet 

CLARIN (Common Language Technology Infrastructure, http://www.clarin.eu). 

CLARIN er et europeisk initiativ for å skape, koordinere og gjøre språk- og 

språkteknologiressurser tilgjengelige på tvers av språk og landegrenser. Det vil også 

være nærliggende å ta lærdom av erfaringer fra Terminors ”søsterprosjekt” 

Rikstermbanken, som allerede er etablert av Terminologicentrum TNC i Sverige 

(http://www.rikstermbanken.se/). 

En fullstendig utbygd nasjonal forskningsinfrastruktur for norsk fagspråk vil måtte 

omfatte alle fagområder og -miljø som er aktive innen FoU-arbeid i Norge. For å 

komme i gang med dette arbeidet vil vi i Terminor-prosjektet fortsette å fylle 

Termportalen med innhold ved å utvikle oppdatert terminologi for en rekke fagfelt. I 

tillegg ønsker vi å videreutvikle den teknologiske infrastrukturen og utarbeide en felles 

nasjonal standard for terminologiarbeidet i prosjektet. Dette innebærer at den planlagte 

infrastrukturen i hovedsak vil bestå av fire komponenter som vi i det følgende vil 

beskrive som innhold, system, metode, og verktøy. Vi vil også presentere hvordan 

Terminor-prosjektet er tenkt organisert. 

Infrastrukturens innhold 

Infrastrukturen skal inkludere eksisterende nasjonale termbaser med flerspråklige 

oppslag for begreper og begrepsbeskrivelser, slik som hovedtermer, synonymer, 

definisjoner og begrepsrelasjoner, basert på konsensus mellom fagspesialister på de 

ulike fagområdene. I tillegg vil det være et mål i prosjektet å utvide infrastrukturen til 

også å inkludere nye fagområder. 

Fem konkrete fagområder har blitt valgt ut som fokusdomener i prosjektet – 

økonomi og administrasjon, energi, miljø, helse og informasjonsteknologi. Disse 

fagområdene har blitt valgt ut fordi det her er et stort behov for begrepsmessig 

harmonisering og avklaring på tvers av både nasjonale forskningsmiljøer og 

internasjonale prosjektsamarbeid. Fagområdenes betydning er også understreket i det 

norske forskningsrådet (NFR) sitt strategiske dokument Verktøy for forskning. 

Alle de fem fokusområdene opplever et stadig økende press fra engelsk som 

rådende fagspråk. Det er derfor innen disse fagområdene et umiddelbart behov for å 

forhindre domenetap på norsk, og å sikre at norsk fagspråk vedlikeholdes og utvikles 

sammen med fagenes lingua franca som jo er engelsk. Det vil derfor være et viktig 

mål for den planlagte infrastrukturen å bidra til å sikre fagspråkskommunikasjonen, 


ikke bare mellom fagspesialistene, men også mellom spesialistene, høyere 

utdanningsinstitusjoner, næringslivet og samfunnet for øvrig. 

I tillegg til de fem fokusområdene vil infrastrukturen, som nevnt over inkorporere 

relevante terminologiske ressurser som allerede eksisterer. Denne delen av prosjektet 

vil ta utgangspunkt i tidligere norske terminologiske initiativer som har resultert i de 

ressursene som per i dag er tilgjengelige i Termportalen, altså EØS/EU-termbasen, 

KB-N-basen, NOT-basen og RTT-materialet. 

Den tekniske infrastrukturen vil imidlertid være fleksibel slik at det kan åpnes for at 

andre fagområder enn de som er valgt ut som fokusområder kan inkluderes i portalen. 

Infrastrukturen vil dermed fungere som en nasjonal sentral for terminologiske 

ressurser som er utviklet av aktører som ikke er direkte involvert i selve Terminorprosjektet. 

Infrastrukturen som system 

Gjennom Terminor-prosjektet vil det bli utviklet en teknisk arkitektur som 

integrerer flerspråklige kunnskapsbaser (termbaser) gjennom en felles internettbasert 

søkeportal. Målet vil være at denne portalen skal være fritt tilgjengelig, men at ulike 

former for tilgang (inkludert redigeringstilgang) kan gis for ulike brukergrupper. 

Gjennom den tekniske infrastrukturen vil fragmenterte terminologiske ressurser bli 

omdannet til en felles nasjonal infrastruktur. Infrastrukturen vil bygge direkte videre 

på teknologi og ressurser som er tilgjengelige gjennom CLARIN-nettverket, samt 

termbaseteknologi utviklet over flere tiår i en rekke prosjekter som har sin opprinnelse 

i Norsk Termbank og det NFR-finansierte prosjektet KB-N. Som i CLARIN er det et 

mål at eksisterende enkeltstående ressurser skal fortsette å eksistere som sådanne. Det 

Terminor vil bidra med, er å samle alle disse ressursene i en nasjonal paraplystruktur 

slik at brukerne vil kunne nå alle eller deler av ressursene gjennom et felles 

søkegrensesnitt. Gjennom at disse blir innlemmet i den nasjonale infrastrukturen i 

Terminor vil brukerne få en unik tilgang til kvalitetssikrede terminologiske ressurser. 

Eksisterende ressurser vil ha ulike tekniske løsninger og det vil derfor være et fokus 

i Terminor å utvikle et system som vil kunne søke i ressurser som er lagret i en rekke 

relasjonsdatabaser slik som for eksempel Oracle og MySQL, og presentere data på en 

enhetlig måte gjennom å generere en veldefinert XML-representasjon av data som kan 

presenteres på en fleksibel måte gjennom bruk av XSLT-stilark. 

Infrastrukturens metode 

For et så stort nasjonalt terminologisk prosjekt vil det være nødvendig å utvikle effektive 

systemer for kunnskapshåndtering og standardiserte måter å representere innholdet på. En 

viktig del av prosjektet vil derfor være å komme fram til et felles teoretisk og metodologisk 

rammeverk for hvordan informasjonen i nye ressurser som bygges opp behandles og 

presenteres. Dette innebærer blant annet et felles rammeverk for hvordan strukturere 

begreper, lage definisjoner og anvende metadata. En utfordring vil her være å få på plass en 

metodologi for hvordan avgrense domener og subdomener (Kristiansen 2006) siden en slik 


avklaring vil være avgjørende for hvor anvendbare dataene vil være for diskusjoner innad og 

på tvers av ulike forskningsmiljø. 

Her vil prosjektet basere seg på internasjonalt utviklede metoder for å utvikle et 

rammeverk som i størst mulig grad samsvarer med tilsvarende ressurser i andre land. Et 

naturlig utgangspunkt for etableringen av dette rammeverket vil være ISO 704 ”Terminology 

Work – Principles and Methods” og ISO1087 ”Terminology Work – Vocabulary” som begge 

beskriver god praksis for terminologisk arbeid. Dessuten vil det være viktig å ta utgangspunkt 

i rammeverket som etableres i CLARIN-nettverket. Dette nettverket, som initiativtakerne til 

prosjektet deltar i, utvikler internasjonale standarder og taksonomier for språkressurser. 

Infrastrukturen som verktøy for forskning 

Når det gjelder infrastrukturen som et verktøy for forskning, vil det bli utviklet løsninger 

for visning av begrepsrelasjoner, tekstbasert termekstraksjon, håndtering av 

domenespesifikke korpora og kobling mellom oppslag i termbasene og tekstbaser. Det 

innebærer at det vil bli utviklet nye terminologiske ressurser kombinert med at eksisterende 

ressurser utnyttes. 

En pilotstudie gjennomført i Termportal-prosjektet har vist at eksisterende norske 

terminologiske ressurser er forholdsvis heterogene når det gjelder formater, innhold, 

dekningsgrad, struktur og metadata. Håndteringen av slike ressurser krever derfor effektive 

og fleksible konverteringsverktøy. I tillegg vil Terminor dra nytte av en rekke mer generelle 

dataverktøy som kan gjøre det terminografiske arbeidet mer effektivt for nye domener. 

Dette inkluderer verktøy for håndtering av termbaseoppslag, for hierarkisk organisering og 

grafisk visning av ontologiske relasjoner, for korpusbasert termekstraksjon og for å knytte 

termbaseoppslag til relevante domenespesifikke korpora. Gjennom tidligere prosjekter har 

prosjektgruppen tilgang på en rekke språkteknologiske verktøy. Spesielt kan nevnes et 

verktøy for korpusbasert termekstraksjon for norsk som har blitt utviklet i KB-N prosjektet. 

Videre har en i det NFR-finansierte infrastrukturprosjektet Norsk Aviskorpus 

(http://avis.uib.no) utviklet systemer for semi-automatisk domeneklassifikasjon av tekster og 

identifikasjon av kollokasjoner og flerordsuttrykk. Dette vil gi et godt utgangspunkt for å 

fange opp mulige termer og ekstrahere termer fra et bredere sett av korpustekster enn 

snevert definerte domenespesifikke tekster. 

Organisering av Terminor-prosjektet 

Selv om fagspråksmiljøet i Bergen, med NHH i spissen, har vært initiativtakere til 

prosjektet, er målet å få etablert et nasjonalt prosjekt med størst mulig bredde. Vi ønsker å 


dra nytte av et bredest mulig nettverk av forsknings- og utdanningsinstitusjoner for å sikre 

begrepsmessig harmonisering og avklaring innad og på tvers av vitenskapelige fagområder. 

Deltagelse av organisasjoner som Universitets- og høyskolerådet (UHR) i Norge er derfor 

viktig for å kunne etablere en ressurs som kan vinne fram og få gjennomslag i sentrale 

vitenskaplige miljø for å motvirke domenetap på norsk. 

I figur 5 under viser hvordan Terminor er tenkt organisert og et utsnitt av bredden av 

aktuelle samarbeidspartnere som vi ønsker å få på plass i oppbyggingen av den 

terminologiske infrastrukturen. Samarbeidspartnere vil omfatte både høyere 

utdanningsinstitusjoner og andre virksomheter som arbeider med fagspråk og terminologi, 

både fra offentlig og privat sektor. 

FIGUR 5. Terminor – organisering og mulige samarbeidspartnere 

Som nevnt over er det valgt ut fem fokusdomener, nemlig økonomiskadministrative 

fag, energi, miljø, inkludert marin sektor, klima og klimaendringer, 

meteorologi og oseanografi, helse, og informasjons- og kommunikasjonsteknologi. 

Hvert av disse fokusdomenene organiseres som en terminologisk arbeidsgruppe (WP 

4-8), og skal ledes av en sentral forsker på det aktuelle fagområdet sammen med to 

terminologer. Arbeidsgruppene skal organisere en prosjektgruppe og et nasjonalt 

nettverk med ansvar for konsensus og kvalitetssikring på de respektive fagområdene. 


Typiske oppgaver for arbeidsgruppene vil være å kartlegge og vurdere eksisterende 

terminologiske ressurser og annet relevant materiale slik som for eksempel sentrale 

lærebøker og fagordbøker. Videre skal arbeidsgruppene sikre korrekt overføring av 

eksisterende ressurser til kvalitetssikrete termoppslag i den digitale infrastrukturen, 

oppdatere eksisterende terminologisk ressurser og bygge ut termbasen som en del av 

den nasjonale terminologiske infrastrukturen. 

En viktig fase i prosjektet vil være formidling av resultatene og samfunnskontakt (WP9). 

Videre vil det være essensielt å få etablert en plan for langsiktig drift av infrastrukturen og 

ressursene for at disse skal forbli oppdaterte og relevante etter hvert som fagområdene og 

kunnskapen utvikler seg videre. 

Som en overbygning til arbeidsgruppene WP 4-8 vil det bli etablert to grupper (WP 

2 og 3) som skal ha fokus på infrastrukturens metode og infrastrukturen som verktøy 

(jf. avsnitt 3.3 og 3.4 over). 

OPPSUMMERING 

I denne artikkelen har vi argumentert for at terminologi bør betraktes som en form 

for forskningsinfrastruktur og at en bred og omfattende videreutvikling av norsk 

terminologi er en nødvendig forutsetning for å sikre god fagkommunikasjon og unngå 

domenetap. Vi har beskrevet to prosjekter som har dette som et felles mål. Prosjektet 

Termportalen har vært gjennomført og kan vise til interessante resultater, og en 

begrenset videreutvikling er planlagt. Prosjektet Terminor befinner seg derimot på 

visjonsstadiet mer enn på gjennomføringsstadiet. Vi mener at en slik nasjonal dugnad 

som prosjektet legger opp til vil være av stor betydning for å nå målene som er uttrykt 

i strategidokumenter som Norsk i hundre! og Mål og meining. Det gjenstår imidlertid 

å få en avklaring av om dette vil bli prioritert av bevilgende myndigheter. 

REFERENCER 

Andersen, G. 2008. Terminologi som språkressurs og forskningsinfrastruktur. 

NORDTERM 15, 53-58. 

Hjelmbrekke, S. 2008. Av studentar, for studentar. Produksjon av småordlister, døme frå 

samfunnsøkonomi. NORDTERM 15, 94-97. 

ISO 1087 (1990). Terminology — Vocabulary. International Organization for 

Standardization. 

ISO DIS 704 (1987). Principles and Methods of Terminology. International Organization 

for Standardization. 

Kerner, K. 2008. Gresset er alltid grønnere på den andre siden. Erfaringer fra oppbgging av 

en flesrspråklig termbase. NORDTERM 15, 113-116. 

Kristiansen, M. (2006). A terminological approach to multi-disciplinary domains and 

disciplinary autonomy. I Toft, Birthe/Nina Pilke (eds) Terminology science and 


esearch - Journal of the International Institute of Terminology Research (2006) 

vol. 17. 

Kristiansen, M. 2009. Language Planning in Higher Education. The Case of 

Microeconomics. I Proceedings from the XVII European Symposium on LSP, 17.- 

.21. august 2009, Århus (under publisering). 

Kristoffersen, G. 2008. Terminologi i den nye norske språkpolitikken. NORDTERM 15, 

26-32. 

Leontieva, A. N. 2008. Terminologi for tolker innen offentlig tjenesteyting. Erfaringer fra 

tolkeutdanningen ved Universitetet i Bergen, med fokus på juridisk terminologi. 

NORDTERM 15, 148-151. 

Liebe, G. 2008. Norsk brannfaglig terminologi under utvikling. NORDTERM 15, 157-161. 

Norsk Aviskorpus < http://avis.uib.no> 

Norsk i Hundre! 

Rapport Termportalen – Prototype per 22.04.09. Rapport levert til språkrådet. Unifob 

AKSIS 2009. 

St.meld.nr. 35 (2007-2008) Mål og meining. Ein heilskapleg norsk språkpolitikk 

 

Verktøy for forskning 


En termbank växer fram: Från kostnadsnyttoanalys via 

terminologisk analys till praktisk tillämpning 

Eija Puttonen 

INLEDNING 

En god översättning ska återspegla textens innehåll och stil och innehålla korrekt och konsekvent 

terminologi. De terminologiska källorna är i dagens läge många och det tar tid att leta sig fram 

mellan vanliga ordböcker, elektroniska ordböcker, termbanker och översättningsminnen – ibland 

dessutom utan resultat. När det gäller specialterminologi, framför allt nya termer, står den bästa 

expertisen ofta att finna inom den egna organisationen hos någon expert eller kollegan i rummet 

intill. I takt med omvärldsförändringar vinner nya begrepp och termer terräng. Se bara på den 

växande floran av nya företeelser och benämningar till följd av EU och Eurosystemet! Det är därför 

nödvändigt att resultatet av en termsökning dokumenteras så detaljerat som möjligt för framtida 

behov. I en organisation med flera översättare är det dessutom viktigt att dela med sig av resultatet 

för att skapa en enhetlig och konsekvent terminologi och undvika dubbelt arbete. För det behövs 

fungerande rutiner och ändamålsenliga verktyg. 

KVALITET OCH EFFEKTIVITET 

När översättarna själva insett fördelarna med en egen termbank gäller det att övertyga ledningen 

om behovet. Det råder ingen brist på hållbara argument, men ett termbanksprogram är dyrt och 

kräver dessutom tid och resurser för terminologiarbete. Att insatserna sedan ger utdelning i form av 

en högklassig samling facktermer inte bara för översättarna utan också för andra medarbetare, som i 

sin tur garanterar en enhetlig användning av terminologin, tillvaratar medarbetarnas "tysta kunskap" 

och stöder introduktionen av nya medarbetare, är inte tillräckligt. Konkreta inbesparingar i arbetstid 

och - i slutändan - reda pengar förutsätts också. För att påvisa att termbanken minskar tiden för 

termsökningar och därigenom leder till större kostnadseffektivitet i arbetet genomfördes därför en 

kostnadsnyttoanalys. 

Det har blivit allt vanligare med kostnadsnyttoanalys av termbanker och termarbete, och 

undersökningar pågår för att ta fram konkreta modeller och metoder. Att prissätta termarbete är 

givetvis ingen lätt uppgift. Det är viktigt att kunna påvisa inbesparingar, men inte på bekostnad av 

kvaliteten. 

I den kostnadsnyttoanalys som genomfördes på Finlands Bank bedömdes lönsamheten enligt 

både kvalitativa och kvantitativa kriterier. Analysen visade att den största kvantitativa nyttan av en 

termbank var – kanske inte helt oväntat – inbesparingar i arbetstid för bankens experter inklusive 

översättarna. Den potentiella inbesparingen i experternas totala arbetstid uppskattades till cirka 80 


persondagar per år under åren efter att termbanken tagits i drift. Motsvarande inbesparing för 

översättarna beräknades vara 75 persondagar på årsnivå. 

Bland de kvalitativa fördelarna nämndes konsekvent användning av riktiga och aktuella termer, 

vilket bidrar till både den interna informationsförmedlingen och kommunikationen utåt och stärker 

därigenom företagets image. En gemensam termbank för hela organisationen ger alla möjlighet att 

bidra med sin sakkunskap och skapar därigenom förutsättningar för en fruktbar dialog mellan 

översättare och andra experter, vilket garanterar att termbanken hålls uppdaterad och föråldrade 

termer eller direkta fel utmönstras. Det minskar risken för missförstånd och feltolkningar och höjer 

kvaliteten i kommunikationen. 

Termbanken är också tänkt att bli ett hjälpmedel för introduktionen av nya medarbetare. Syftet är 

likaså att tillvarata termkompetensen hos översättare som snart går i pension. Målet är att överföra 

åtminstone en del av de erfarna översättarnas "tysta kunskap" både till bankens andra översättare 

och till de frilansöversättare som banken anlitar, som också enligt planerna ska få tillgång till 

termbanken. 

KOSTNADSNYTTOANALYS 

Kostnadsnyttoanalysen på Finlands Bank genomfördes i samarbete mellan språkservicebyrån 

och ekonomibyrån. På det sättet kunde både språklig och ekonomisk expertis utnyttjas. För analys 

av kostnader och fördelar användes tre olika metoder: pay back-metoden, nuvärdesmetoden och 

annuitetsmetoden. Investeringens lönsamhet bedömdes således enligt återbetalningstiden, 

intäkterna, årsbesparingarna och årsutgifterna. Resultatet av analysen var positivt, oavsett vilken 

metod som användes. Beräkningarna visade att enbart effektivitetsvinsterna av den inbesparade 

arbetstiden betydde att investeringen var lönsam. De uppenbara kvalitativa fördelarna i form av en 

enhetlig användning av terminologin och färre missförstånd bidrog ytterligare till lönsamheten och 

stödde bankens strategi. Tillsammans med de andra motiveringarna ledde kostnadsnyttoanalysen till 

ett positivt beslut. 

En termbank för översättare av översättare 

Överlag medför en egen termbank större effektivitet och bättre kvalitet i översättnings- och 

språkgranskningsarbetet, framför allt som den kan integreras med översättningsminnet och 

därigenom bidra till hela översättningsprocessen. Detta är helt i linje med bankens strategi där ett av 

de uppställda målen är välfungerande interna processer. Vidare ger programmet synergifördelar, 

eftersom samma program används av översättarna på Europeiska centralbanken (ECB) och vissa 

andra nationella centralbanker. Utöver direkt utbyte av termposter, vilket kan tänkas bli aktuellt i 

framtiden, har vi haft fördelen att kunna dra nytta av deras sakkunskap och erfarenheter i 

planeringsfasen. Denna typ av "benchmarking" har varit viktig för att kunna ta ställning till frågor 

som "hur många språk ska termbanken innehålla, vilka termposter behövs, ska materialet delas in 

efter fackområde eller något annat kriterium, behövs obligatoriska termposter, hur och när sker 

inmatning och validering och vad är viktigare: kontext eller definition?" 


Även om programmet är sofistikerat och ger oanade möjligheter, bör termbankens struktur vara 

enkel och tydlig. Informationen ska vara överskådlig och tjäna som vägledning för översättare och 

andra experter. Onödiga datafält ska utmönstras. Onödiga musklickar höjer tröskeln för att lägga till 

termer. Vidare bör termbanken läggas upp så att den passar den målgrupp den är avsedd för. Det 

lönar sig därför att tänka igenom vem som kommer att använda termbanken och för vilket ändamål. 

Meningen är att termbanken ska komplettera existerande hjälpmedel för översättningsarbetet, 

framför allt översättningsminnet och dess konkordansfunktion, som hittills varit den huvudsakliga 

källan för termsökningar. Detta syfte gav anledning att undersöka å ena sidan termbankens och å 

andra sidan översättningsminnets egenskaper och funktion närmare. Skillnaderna kan 

sammanställas i följande tabell: 

Översättningsminne vs. termbank 

Översättningsminne Termbank 

- deskriptiv - preskriptiv 

- flera förekomster av samma term: - en termpost/begrepp 

- termen i dess rätta kontext - plats för beskrivning av kontext 

- begränsade källhänvisningar - utförliga källhänvisningar, t.ex. med 

länkar till webbsidor 

- inga definitioner - plats för definitioner 

Den största fördelen med översättningsminnet som terminologisk källa är att det ger termen i 

dess rätta sammanhang. Hänvisningar till de ursprungliga källorna saknas däremot ofta. Det 

mervärde som en termbank således kan tillföra översättningsprocessen är utförliga källhänvisningar 

med länkar till webbsidor där informationen hämtats. 

Skillnaderna i funktion mellan översättningsminnen och termbanker märks likaså. En 

konkordanssökning på en termsträng får gärna ge flera träffar och styra valet av term och 

uttryckssätt efter sammanhanget, medan alla upptänkliga synonymer och kontexter inte får plats i en 

termbank. Definitioner kan och ska däremot dokumenteras om de finns att tillgå, men det är inte 

motiverat eller ens klokt att själv börja skriva definitioner. I en termbank med flera språk är 

definitionens viktigaste uppgift att tjäna som vägledning för valet av motsvarigheter. Noteras bör 

emellertid att många existerande definitioner är legala definitioner, ett slags kontext, och inte några 

egentliga definitioner i terminologisk bemärkelse. Men det är kanske inte så relevant för ett företags 

interna termbank. 


Documentation of Sources in Terminology 

Management Systems, with Particular Emphasis 

on Collaborative Platforms 

Igor Kudashev 

University of Helsinki 

Abstract. Documentation of sources is an important means of quality assurance in 

terminological work, especially in collaborative projects. However, support of source 

documentation in terminology management systems is currently insufficient. In this article we 

discuss the general principles of source documentation in terminology work, types of data 

related to documentation of sources, different levels of detail of bibliographic data, minimal 

requirements for source documentation in terminology management systems as well as means of 

advanced support and customization of source management. 

INTRODUCTION 

Indication of sources in terminological products is valuable information for both 

users and compilers. For users, indication of sources allows to estimate the quality of 

terminological information. In case of doubts they can check the source of information 

and also consult it directly for details. For compilers, indication of sources is useful for 

several reasons: 

− By indicating the sources compilers show respect to the intellectual rights of other 

authors and at the same time shift a large share of responsibility to them. 

− Indication of sources is a strong argument in disputes with domain experts, editors, 

other members of the community and critics. 

− Indication of sources helps find inconsistencies between different sources and resolve 

them. 

− Keeping record of sources saves a lot of time and effort in the future. 

The importance of source indication in terminological resources is confirmed by the 

existence of a dedicated ISO standard (ISO 12615:2004, Bibliographic references and 

source identifiers for terminology work). Different formats have also been developed 

for the exchange of bibliographic data between terminological collections (e.g. TeDIF 

– see Betz & Schmitz 1999; bibliographic data section in TBX – see ISO 30042:2008 

and ISO 12620:1999: 45–48). 

However, standards mentioned above are not the answer to every problem. First, 

some important parts of source references are not covered in them (for example, 

indication of the exact location of the cited passage in the original document and 

additional modifiers like cf. and as cited in). Second, there are many competing 

standards and formats, and the choice between them is not always easy. Third, 


equirements of different applications vary a lot, and it is difficult to satisfy them 

equally well. 

In this article, we discuss the general principles of documenting sources in 

terminological management systems, with a particular focus on collaborative 

platforms. For a long time terminology management systems have been addressed to 

relatively small groups of language professionals and domain experts. The inspiring 

example of Wikipedia and other collaborative projects has given an impulse to the 

development of platforms for collaborative terminology work. One of these platforms 

called TermFactory is being developed at the University of Helsinki. 

Documentation of sources is particularly important in collaborative platforms as it 

is one of the main means of quality assurance. At the same time, collaborative work 

requires more flexibility and compromises than traditional terminology work, and 

documentation of sources is no exception. 

TYPES OF DATA RELATED TO DOCUMENTATION OF 

SOURCES 

Data related to the documentation of sources in terminological databases consists of 

source references and bibliographic records to which these references are made. 

Source references contain at least one source identifier which may be supplemented 

with several optional fields. Source reference may also be complex and contain two or 

more source identifiers with optional fields related to them. 

In theory, source identifiers may be equal to bibliographic records. In practice, 

however, bibliographic records are usually stored separately. There are several reasons 

for doing so. 

The first reason is space saving and user-friendliness. Bibliographic descriptions 

are usually quite long, so shorter aliases for them have to be used in the entries to save 

space and improve the readability of the entries. 

The second reason is reusability. The same source is usually referred to more than 

once in a database, so it is reasonable to record the full description once and make 

shorter references to it. In this way there is also no need to make multiple corrections 

if the record has to be modified for one reason or another. 

The third reason is modularity. If bibliographic records are stored separately, it is 

possible to provide them with additional data, split them into smaller pieces of data 

and make advanced queries about them. For example, it is possible to filter outdated 

sources and entries which contain references to them. 

Separate storage of source references and bibliographic records has two important 

implications. First, source identifiers have to be unique. Second, source identifiers 

have to be unambiguously linked to the corresponding bibliographic records. These 

two conditions have to be met at any time in any given term bank, which has to be 

taken into account in data exchange and restoration of archived data. 

From the point of view of user friendliness, source identifiers used in the entries 

should be relatively short and transparent, i.e. they should give some clue about the 

source and not be totally cryptic. A short and meaningful identifier is, however, a bad 

choice form the technical point of view as it is hard to guarantee its uniqueness. There 


may also be situations when a source identifier has to be changed because it doesn’t 

sound good in other languages. 

These problems can be solved if a difference is made between a source identifier 

visible to the user and a permanent source ID code which is used by the system to 

unambiguously identify the source and link it to the corresponding bibliographic 

record. The source ID code may be based on URL, ISBN or any other system of 

global identifiers. 

Bibliographic records and references usually have to be supplemented with some 

administrative data, such as technical parameters required for the correct automatic 

processing and display of the data, information about different transactions, 

responsible persons, etc. 

LEVEL OF DETAIL OF THE DATA RELATED TO 

DOCUMENTATION OF SOURCES 

Due to the variety of applications different methods and levels of detail are used to 

record bibliographic information on t erminology sources (ISO 12615:2004: 4). The 

more data is provided about the sources and the better this data is classified, the richer 

the functionality of the system. Detailed description and fine granulation enable 

advanced queries about different characteristics of the sources and automatic 

generation of bibliography in different styles. Dedicated applications, such as source 

management systems, provide a good example of such facilities. 

However, it is unlikely that a terminology management system, especially a 

collaborative platform, would reach the level of the best source management systems 

and library services. On one hand, designers of a terminology management system are 

hardly able to provide and keep up-to-date facilities for professional-level source 

management. On the other hand, it is hard to expect that community members would 

have enough energy, time and expertise to document sources with professional-level 

depth and precision. 

To achieve the best results, designers of a collaborative platform have to make sure 

that the minimum set of data is provided about every source and at the same time they 

should give free hands to those users who want to follow the best practices and share 

them. It is also important to provide facilities for advanced customization of different 

parameters. 

MINIMAL REQUIREMENTS FOR DUCUMENTATION OF 

SOURCES 

The two most important things that users of a terminological management system 

want to know about the sources is how reliable they are and how they can be accessed. 

Besides, users want bibliographic records to be accurate, uniform and compliant with 

one of the common formats. Source identifiers and bibliographic records have to be 

unique and properly linked to each other. These are the starting points for formulating 

minimal requirements for the documenting and management of terminological 

sources. 


The main data category which has to be filled in a bibliographic record is 

bibliographic citation. This category corresponds to the element bibliographicCitation 

in Dublin core (http://purl.org/dc/terms/bibliographicCitation). In this field, 

information about the source should be provided in the way the user wants it to appear 

in the bibliography. If the user wants to provide additional important information 

about the source which does not belong in the bibliographicCitation category, he 

should use the supplementaryInformation field. 

There are no restrictions concerning the style for presenting bibliographic data but 

it is recommended to follow generally accepted standards and best practices and be 

consistent. Information provided about the source has to be sufficient for its 

unambiguous identification. 

The following general categories are typically used for the identification of sources: 

name of the source (e.g. title of a publication), responsibility (authors, editors, etc.), 

place and date (e.g. place and date of publication). Besides, reference to the host 

document and location within it has to be specified for contributions. Information 

about version or edition has to be specified for repetitive works. Concrete 

representation of these categories depends on the type of the source. 

Two other mandatory parameters which are not necessarily required for the 

identification of the source but which are important pragmatically include format of 

the source and accessibility. Format of the source may be picked from a predefined 

list. The following values borrowed from the International Standard Bibliographic 

Description (2007: 11) will supposedly cover the vast majority of cases: printed text, 

electronic resource, multimedia resource, moving images, sound recording, still 

images, cartographic resources, notated music resource. It should also be possible to 

choose the option “other source”, name it and provide a short annotation for it. 

Data category accessibility should inform the users whether the source is public or 

private, published or unpublished, how it can be accessed and when it was retrieved. 

Distinction between public/private and published/unpublished sources may seem 

questionable at the first glance but this distinction is made for a reason. Unpublished 

works are not necessarily private. For example, graduation papers, dissertations, etc. 

are unpublished but public. At the same time, access to published sources may be 

restricted. 

Each bibliographic record should be provided with its shorter alias (source 

identifier) which will be used in the entries. Source identifier has to be unique within 

the term bank. Different methods may be used for forming source identifiers. It is 

desirable that source identifiers should provide some information about the source. For 

example, source identifier may be a combination of the author and the year of 

publication. Documents created by several authors or with no author specified may be 

abbreviated by initial letters of the title brought to uppercase, as described in the ISO 

standard (ISO 12615: 2004: 8). 

Source references have to be automatically updated by the system if a s ource 

identifier is modified, and automatically deleted if the corresponding bibliographic 

record is deleted. Notification about the changes in source identifiers has to be sent to 

the persons responsible for the entries in which these identifiers occur. It is strongly 

recommended to keep the history of transactions and provide the means for data 

restoration. Otherwise a sophisticated system of privileges is required. 


As was mentioned earlier, source ID code must be assigned to every 

bibliographical record for its unambiguous identification. The source ID code must be 

generated automatically by the system. 

Since inline formatting (e.g. italics) is very common in bibliographic descriptions, 

terminology management system has to provide the means for adding inline 

formatting to bibliographic records. The addition of inline formatting may not have a 

negative impact on the functionality or speed of search. 

In some cases it may be necessary to contact the person responsible for the 

bibliographic record, for example to request more information on t he source or to 

report mistakes. It is also useful to know who and when has created and updated the 

record. This implies that bibliographic records should be provided with some 

administrative data. 

Proposed administrative data categories include creator, updater(s), creation date, 

update date(s) and responsible person(s). By default responsible person is the creator 

of the record unless specified otherwise. Categories other than responsible person 

should be automatically managed by the system and be read-only. The 

responsiblePerson category should contain a link to the person’s profile rather than a 

plain name. In any case contact information of the responsible person has to be 

provided. 

In order for the bibliographical data to be presented correctly to the final users, 

some technical data has to be provided including encoding, style and other layout 

features. Some of these parameters are application-specific and are not subject to 

change, others may be customizable. 

It should be technically possible to add source references to almost every data field 

related to the description of headwords. Sometimes it ma y also be necessary to add 

source references to parts of the fields, for instance, for multiple examples in the 

example field. It should also be technically possible to add two or more source 

references to the same field. 

ADVANCED SUPPORT OFR SOURCE MANAGEMENT 

The sky is the limit in the development of different instruments for source 

management. Below are described a few features which in our opinion should be 

implemented in the first place if designers of a collaborative terminology management 

system want to provide a better support for the documentation of sources. 

It is convenient for users that bibliography is automatically generated for every 

terminological collection or user-defined subset. Sources in different scripts usually 

have to be placed in different sections of bibliography (e.g. first Latin, then Cyrillic, 

then Chinese), and different methods of sorting may be used in different languages. 

The correct sorting of sources requires that a minimal set of information is provided 

about the language, script and preferred collation of every bibliographical citation. 

Codes of languages, scripts and collations have to be provided in a standardized 

form. Language and script codes and the rules for their construction are described in 

ISO standards 631-1:2002, 631-2:1999, 15924:2004 as well as in BCP 47 (Phillips & 

Davis 2006). Collation has to be specified only if it differs from the default Unicode 

collation. Many systems already provide mechanisms for creating user-defined 


collation schemes (e.g. MultiTerm, TshwaneTerm) but these mechanisms can be 

extended further. 

Since users may have different preferences concerning the style of the presentation 

of sources in the bibliography, they should be able to add alternative versions of the 

bibliographicCitation field. A meaningful name, short description and optional 

language indication should be provided for each alternative version. 

Users may then specify in which style they want bibliographic record to be 

presented in the bibliography. It should be possible to choose different styles for the 

sources documented in different languages and scripts. If specified style is not 

available for all sources included in the bibliography, the default version may be used 

and highlighted. Alternative versions should be shareable, i.e. available to other users 

as well. This is one possible implementation of the collaborative approach in source 

management. 

Information contained in the bibliographic citation may be split and presented in 

separate data categories. Minimum set of data may be supplemented with other data 

which the users find important. There are many different formats from where 

additional categories may be borrowed (some of them are listed in Bibliography). Fine 

granulation of data allows advanced queries and arrangement of data based on 

different characteristics of the sources. 

When documenting private sources such as domain experts it is important to take 

into account the recommendations provided in the ISO standard (ISO 12612:2004: 

13). First, it is desirable to make a distinction between information needed for the 

bibliographic reference and what may be needed to maintain or establish contact with 

an individual. Second, in some countries there may be a legal requirement to declare 

that a file containing personal data is being maintained. 

Different templates may be provided for different types of sources and the library 

of templates may be enriched collaboratively. Other collaborative elements may 

include feedback to the person who is responsible for the bibliographic record, forumstyle 

comments by the users available to everyone else as well as voting and ranking 

mechanisms. 

Ideally, proper names such as geographical objects and publishing houses as well as 

dates should be presented in bibliographical records in a standardized form. There are 

different standards and ontologies from which such values may be borrowed. 

Standardized forms considerably improve the quality of the search. Integration of a 

spellchecker into the system helps prevent typing mistakes. 

Depending on their needs and preferences users should be able to choose different 

views of source references. They may want to see more detailed information about the 

source than coded in a source identifier, all the way to the full bibliographic citation. 

Bibliographical references should be customizable in other respects as well. Concrete 

parameters which can be customized are described below, after a closer look at some 

optional elements of source references. 

ADDITIONAL ELEMENTS OF SOURCE REFERENCES 

In addition to one or several source identifiers, source reference may contain 

optional fields. The most common and obvious of them include source label, one or 


more indications of location of the cited abstract in the original document and 

additional modifiers, for example, indications of source usage like “cf.”, “as cited in” 

and “see also”. 

Source labels 

Source labels visually separate source identifiers from the preceding field and may 

provide additional information about the source, particularly about its type. For 

example, printed sources may be preceded by an “open book” symbol () and 

Internet sources by a PC icon (). Dictionary of Lexicography (1998) provides an 

example of such usage. 

Source labels may be graphical images or “letters” of symbolic fonts like Symbol, 

Wingdings or Webdings which can be found on pr actically every PC using the 

Windows operating system. Usage of symbolic fonts has many advantages but it 

may be problematic across platforms. 

Indication of citation’s location 

In many cases it is necessary to provide information about the location of the cited 

passage in the original document. Page numbers are the most common type of 

references. They may also be supplemented with the number of column, paragraph, 

row, etc. In highly structured documents like laws and in documents with no 

pagination references are usually made to logical divisions of the text (chapters, 

sections, paragraphs, etc.). In some types of electronic documents references can be 

made to special bookmarks or anchors within the document. 

Indication of source usage 

In terminological databases, like in other types of texts, it is sometimes necessary to 

indicate more complex relations between the text and the source than direct 

borrowing. These cases may be marked with special expressions or symbols. Symbols 

have the benefit of being language-independent (although not necessarily cultureindependent). 

For example, indirect borrowing may be indicated by the “approximately” symbol 

(≈) placed before or after the source label. This is the way it was done in the Finnish- 

Russian Forestry Dictionary (Suomalais-venäläinen metsäsanakirja 2008) to mark 

cases where definitions or notes based on certain sources had been modified: 

aapasuo YS 

suoyhdistymä, jonka keskiosa on reunoja alempana ≈ SESMS 

See references (as in “see Laine & Vasander 1990”) can be expressed with the help 

of an arrow pointing right: Laine & Vasander 1990. Cf. references (as in “cf. 

Laine & Vasander 1990”) can be indicated with an arrow pointing in both directions: 

Laine & Vasander 1990. As cited in references (e.g. “Laine & Vasander 1990: 


22, as cited in Laine 1995: 52” ) can be marked with an arrow pointing left: Laine 

& Vasander 1990: 22 Laine 1995: 52. 

When making references to private consultations it may be necessary to distinguish 

the cases when new information was provided by the consulting person from the cases 

when the consulter confirms information which is “common knowledge” in the 

domain in question. For example, in the Finnish-Russian Forestry Dictionary the 

“confirmation” symbol followed by the name of the consultant was used to indicate 

the latter type of referencing. 

CUSTOMIZATION OF SOURCE REFRENCES 

It is desirable that users of a terminology management system should be able to 

customize the structure and layout of source references. Source references can form 

quite complex objects, and their customization is not a trivial task. There are many 

levels of customization, and designers should choose the one which suits their goals 

and ambitions best. 

The first level is customization of individual fields which form a source reference. 

This includes customization of contents of the fields, their layout and visibility. 

Customization of contents means that users can specify objects (characters, images, 

etc.) which will be presented in the field. For example, users may want to specify what 

kind of source labels should be used for different types of sources. If the field can 

accept two or more values (e.g. two or more location indicators), users should be able 

to specify what delimiter should be used between them (e.g. comma, semicolon, etc.). 

Customization of layout includes specification of inline formatting parameters, such 

as font settings. For example, users may want to specify that source identifiers should 

be italicized. 

Customization of visibility means that users can make fields visible, invisible and 

partially visible. For example, users may want to hide all indications of citations’ 

location in the original documents. Or they may want to set the maximum length of 

the field after which it will be automatically truncated by the system and transformed 

into a clickable link. 

The next level is customization of the structure and layout of a source reference as a 

whole. This includes several layers: order of the fields, delimiters between them, 

combinations of the fields, etc. 

The order of the fields in source references is usually fixed except for additional 

modifiers. The default delimiter between the fields is space character but it ma y be 

necessary to customize this, for example to merge source label and additional 

modifiers. Location indicators are usually separated from the source identifier with a 

comma or a colon. Users should be able to choose between these separators or to add 

their own ones. 

Combination of fields is relevant mostly for source label and additional modifiers. 

Some additional modifiers may substitute source label, as in the case of the 

confirmation symbol in the example above. 

On the next level of customization it should be possible to specify different 

parameters for complex source references consisting of two or more instances. For 

example, if two or more sources are of the same type, source labels may not be needed 


efore the second and subsequent sources. However, this is a matter of taste and 

should be customizable. 

Finally, source references may be customized in all their complexity as a whole, 

including their global layout parameters and position vis-à-vis other elements. 

SOME CONSIDERATIONS FOR USER INTERDACE 

One way to add source references in the editing form of a terminology management 

system is to use pick-up lists. However, the number of sources in a large terminology 

database can reach hundreds and thousands of records which makes the use of pick-up 

lists practically impossible. Pick-up lists also have to be updated in real time which is 

difficult to implement in a dynamic multi-user environment. 

A better solution is to let users choose the correct source identifier in a separate 

window with search possibilities. When the correct source is located, user can press 

the link to insert the corresponding source identifier into the editing form. A similar 

approach may be used in respect of additional fields. 

Access to full bibliographic records from the entries should be quick and easy. This 

can be implemented in the form of pop-ups or by showing records in a separate 

window. We favor the latter option as it has lower risk of bugs and hang-ups and 

allows copying data into the clipboard. 

CONCLUSION 

Source management is almost a must in modern terminology management systems, 

especially collaborative ones. However, at present the support for the documenting of 

sources in most terminology management systems is insufficient, so a lot has to be 

done in this respect. 

Universal solutions for source management are hardly possible due to the variety of 

applications and user requirements. To achieve the best results, designers of 

terminology management systems have to make sure that the minimum set of data is 

provided about every source and at the same time they should give free hands to those 

users who want to follow the best practices and share them. 

Collaborative approach is one of the strengths which may lead to better quality of 

source documentation. Instead of imposing unnecessary constraints on t he structure, 

content and representation of the data, designers of terminology management systems 

should encourage contributions from the community and provide support to them. 

REFERENCES 

Betz A. & Schmitz K.-D. (1999). The Terminology Documentation Interchange Format TeDIF. In 

Sandrini, P. (Ed.), Terminology and Knowledge Engineering TKE ‘99, Innsbruck, August 1999. Wien: 

TermNet, pp. 782--792. 

Dictionary of Lexicography (1998) / R.R.K. Hartmann and Gregory James. London: Routledge. 

Dublin Core Metadata Initiative. Retrieved 20.08.2009 from http://dublincore.org. 

Functional Requirements for Bibliographic Records (2009) / International Federation of Library 


Associations and Institutions (IFLA), February 2009. Retrieved 20.08.2009 from 

http://www.ifla.org/files/cataloguing/frbr/frbr_2008.pdf. 

Identification of Existing Terminology Resources. EUROTERMBANK project. Deliverable 2.1, version 

I.I, 31/12/2005 / Raguz, M., Raupauch, I. & Schmitz, K.-D. Retrieved 20.08.2009 from 

http://project.eurotermbank.com/uploads/D2.1%20Identification%20of%20existing%20terminology 

%20resources.pdf. 

International Standard Bibliographic Description (ISBD) (2007) / International Federation of Library 

Associations and Institutions (IFLA). Retrieved 20.08.2009 from 

http://www.ifla.org/files/cataloguing/isbd/isbd-cons_2007-en.pdf. 

ISO 12615:2004(E) Bibliographic References and Source Identifiers for Terminology Work. Geneva: 

ISO. 

ISO 12620:1999(E) Computer Applications in Terminology – Data Categories. Geneva: ISO. 

ISO 15924:2004. Information and Documentation – Codes for the Representation of Names of Scripts. 

Geneva: ISO. 

ISO 30042:2008 Systems to Manage Terminology, Knowledge and Content – TermBase eXchange 

(TBX). Geneva: ISO. 

ISO 690:1987 Documentation – Bibliographic References – Content, Form and Structure. Geneva: ISO. 

ISO 690-2:1997 Information and Documentation – Bibliographic References – Part 2: Electronic 

Documents and Parts thereof. Geneva: ISO. 

Suomalais-venäläinen metsäsanakirja (2008) / Kudasheva, I. ja Kudashev, I. (tekijät); Vehmas-Lehto, I. 

ja Gerd, A. (toim.). Helsinki: Metsäkustannus. 

Phillips, A. & Davis, M. (Eds.) (2006) Tags for Identifying Languages. Best Current Practice 47. 

Request for Comments 4646. September 2006. Retrieved 20.08.2009 from http://www.rfceditor.org/rfc/rfc4646.txt. 

vCard standard (2009). Version 3.0. Retrieved 20.08.2009 from http://www.imc.org/pdi. 


CLS Terminology Adapting to the Needs of the 

Market 

Jeannette Ørsted 

Group Manager Terminology, CLS Communication AG, Elisabethenanlage 11, 4051 Basel 

Abstract. CLS-Communication is a globally active language service provider specializing in the financial and life 

science sectors. The company covers the entire linguistic value chain from editing to publishing. Terminology and 

electronic dictionaries are marketed as separate services, but also as an integral part of the quality assurance for 

translations. 

CLS offers databases designed to specific company needs as well as online access to industry or sector-specific 

databases. Today the industry termbase contains more than 150.000 terms from the banking, insurance, legal, 

telecommunications and life science sectors and five full-time terminologists are working in the department. 

The selling price of these services takes into account that terminology is a highly sophisticated product produced 

by highly educated terminologists and experts and we are faced with the fact that many potential customers are 

substituting a customer-specific database with a free dictionary on the internet. In response to this development 

the CLS Terminology Team has initiated a strategic development of small sector-specific databases based on the 

contents of the existing industry termbase. To accompany this initiative the team has analysed all elements of the 

terminology products to provide an extensive list of benefits stressing the added-value to the client, meeting 

requirements at all levels from simple glossary-work to sophisticated knowledge-sharing. 

The presentation will describe the elements and challenges involved in creating new „baskets“ of languages and 

subjects on the basis of existing TDBs. In addition to this, customer benefits will be highlighted taking the value 

beyond quality and consistency showing how terminology gives added value to the organization. 

As a consequence of the changing marketplace and product development, working procedures have to be 

adapted so that a high output is reached without compromising quality. I will briefly discuss some of the possible 

key performance indicators (KPIs) that could serve as a basis for measurement. 

Presentation notes 

CLS Communication was originally the internal translation department of a big Swiss Bank. When the 

department was outsourced, support services such as the terminology unit was also outsourced. In the 

following ten years the department's size was more or less retained at the same level (10 people) and 

the original database with entries in five languages was continuously updated and extended so as to 

serve as support for translators. Concurrently new databases were formed within telecommunications, 

life science and energy. However, the original database with banking, insurance and legal terms 

remained the backbone of the work in the terminology unit. 


In 2005 it was decided to offer this database in an online form and a special webinterface was 

developed for CLS. Customers could now subscribe to the database and get online access to up to 

60.000 terms. With a constantly growing database the amount of information which the customer will 

find is growing and in a market with increasing time pressure the need for a pre-defined filtering of the 

information required, has become stronger. At the beginning of the information era it was thought 

that access to a lot of information in itself was a convincing argument, but we now hear that targeted 

information is considered more valuable. 

In order to meet this requirement we have tried to develop new filters in the webinterface to be able 

to offer limited subject areas to the customers. In that process we ran into quite a number of 

difficulties because touching the datastructure in the old TDB also disturbs the cross references. This 

leads to a high number of errors and the result will not meet customer expectations. 

We are currently trying to develop a new profile in the webinterface that will take out the crossreferences 

automatically, or at least make it possible for us to edit these manually. Fundamentally we 

want to keep the root database and use it as a tool for editing, maintaining and updating separate 

subjects and then be able to offer selected parts targeted on customer needs. If we succed in finding a 

solution we only have to update in a central database and can make sub-areas available. On the other 

hand splitting up the database will entail a loss of information and knowledge. Finally the the cost of 

maintaining separate TDBs cannot be covered by customer fees. 

The challenge is thus double – both finding a technical solution and enhancing the efficiency of the 

terminologists. Both are work-in-progress being done under the constant price pressure of the market. 


Cost-benefit begrebsafklaring 

Annelise Grinsted a og Hanne Erdman Thomsen b 

a Institut for Fagsprog, Kommunikation og Informationsvidenskab, Syddansk Universitet, Engstien 1, 

6000 Kolding, annelise@sitkom.sdu.dk. 

b Institut for Internationale Sprogstudier og Vidensteknologi, Copenhagen Business School, 

Dalgas have 15, 2000 Frederiksberg, het.isv@cbs.dk 

Abstract. I Grinsted & T homsen (2008:318) præsenterede vi en model for en cost-benefit 

analyse i forbindelse med introduktionen af termbaser og sy stematisk terminologiarbejde. I 

denne artikel følger vi mere konkret op på termerne for begrebet “costs”, og hvad afklaringen af 

begreberne har betydet for vores model. 

INTRODUKTION 

Man kan selvfølgelig spørge sig selv, hvorfo r det er interessant at lave en costbenefit 

analyse af terminologiarbejde. Vi har forsøgt at afdække, hvad der tidligere er 

blevet skrevet om denne type cost-benefit analyser og finder he le tiden den sam me 

forklaring, hvorfor vi citerer den m eget relevante canadiske Guy Cha mpagne rapport 

(2004:5): 

“(….) few attempts have been made in the past to assess the economic value 

of terminology. Industry professionals do not necessarily see their work and 

their profession from this angle. They see terminology’s qualitative impact on 

the language process, but definitely not its economic impact”. 

I samme rapport fremføres en række argum enter for indførelse af term inologiske 

værktøjer og gennem førelse af system atisk terminologiarbejde, hvoraf vi nævner 

nogle af de vigtigste: 

Terminologiarbejde er nødvendigt i 4-6 % af alle ord i en tekst 

Mellem 15-30 % af resurser anvendt i over sættelser relaterer sig til 

terminologi 

Investeringsafkastet (ROI 1 ) er 10 % 

Terminologiske værktøjer øger produktiviteten med 20 % 

For personer, der har arbejdet konkret m ed terminologiarbejde, er der næppe nogle 

af disse argum enter som ikke er genkende lige, skønt der m åske ikke har været sat 

konkrete tal på. 

Men der kan også fremføres argum enter af helt andre typer. For eksem pel 

introducerer Wright (1996:7) begrebet ”criticality” og relaterer det til spørgsmålet om, 

hvor detaljeret terminologiarbejdet kan / skal være, og hvilke konsekvenser m angler i 

3. ROI står for Return on Investment. I dette tilfælde betyder det at en investering på DKK 100 giver DKK 110 

tilbage til virksomheden 


terminologiarbejdet eventuelt måtte have. Hun indfører 3 grader af ” criticality”, som 

kan bruges til at vurdere hvor detaljeret terminologiarbejdet bør være: 

kritisk mangel: en virksom hed kan udsætte s for et betragteligt tab 

(menneskeliv, sundhedsfare, skade på ejendom, etc.) 

alvorlig mangel: har strategisk betydning fo r virksomhedens målsætninger 

og konkurrencesituation 

mindre mangel: medfører irriterende kommunikationsfejl internt og 

eksternt i virksomheden 

Så argumenter for introduktion af term baser og derm ed også system atisk 

terminologiarbejde er mangfoldige, og en brugb ar metode er en cos t-benefit analyse, 

der retter sig direkte mod hvad en ledelse er interesseret i – de økonom iske fordele og 

ulemper. 

COST-BENEFIT MODELLEN 

Vi tog i G rinsted & Thom sen (2008:318) udgangspunkt i m odellen i figur 1, 

oprindeligt introduceret i Holm -Rasmussen et al. (2005:487), idet vi også selv skulle 

til at sætte os ind i arbejdet med cost-benefit analyser. 

FIGUR 1. Model for cost-benefit analyse baseret på Holm-Rasmussen et al. (2005:487) 


accessional cost 

accounting cost 

achieved cost 

acquisition cost 

actual cost 

administrative 

cost 

all-in cost 

allocable cost 

alteration cost 

alternative cost 

amortized cost 

applied cost 

appraisal cost 

average cost 

average fixed 

cost 

average variable 

cost 

avoidable cost 

avoided cost 

batch cost 

benefit cost 

analysis 

breakage cost 

burden cost 

capital cost 

carriage cost 

carrying cost 

choice cost 

closing costs 

collateral cost 

common cost 

conceptual cost 

construction cost 

controllable costs 

conversion cost 

cost factor 

cost of lost sales 

cost of poor 

quality 

cost of quality 

cost of sales 

cost of work 

cost per response 

cost profile 

cost recovery 

cost tradeoff 

TABEL 1. Omkostningstermer fra en kombineret søgning i 

http://www.businessdictionary.com og http://investorwords.com/ 

cost-benefit ratio 

costs 

distributable cost 

distributable labor cost 

distributed cost 

distributed labor cost 

economic cost 

embedded cost 

executory cost 

explicit cost 

extraordinary cost 

factor cost 

fixed cost 

fixed overhead cost 

follow through costs 

current cost 

customer costs 

depreciable cost 

development cost 

differential cost 

direct cost 

direct labor cost 

direct material cost 

direct overhead cost 

directly associated cost 

discretionary cost 

frictional cost 

full cost 

funding cost 

hard cost 

hidden cost 

historical cost 

holding cost 

implicit cost 

implied cost 

imputed cost 

increasing opportunity 

cost 

operating cost 

opportunity cost 

order generation costs 

ordering cost 

organizational costs 

other costs 

ownership cost 

period cost 

prime cost 

private cost 

product cost 

projected total life cost 

quality costs 

reasonable cost 

recurring cost 

rehabilitation cost 

relevant cost 

removal cost 

reorder cost 

replacement cost 

replacement cost policy 

roll up costs 

running cost 

selling costs 

severance costs 

step variable costs 

switching costs 

trading costs 

transaction costs 

incremental cost 

incurred cost 

indirect cost 

indirect maintenance cost 

indirect overhead cost 

intermediary cost 

inventory carrying cost 

inventory cost 

joint cost 

labor cost 

landed cost 

legacy costs 

managed cost 

manufacturing cost 

marginal cost 

marginal external cost 

marginal private cost 

marginal social cost 

mixed cost 

moving average inventory 

cost 

non value adding cost 

non-production costs 

non-recurring cost 

non-traceable common 

cost 

normal cost 

notional cost 

occupancy cost 

operating and support 

cost 

semi variable cost 

separable cost 

settlement cost 

setup cost 

shared costs 

shortages costs 

soft cost 

standard cost 

startup costs 

step cost 

stockout costs 

stranded cost 

sue and labor costs 

sunk cost 

support costs 

switching cost 

syndication cost 

target cost 

technology cost 

tooling costs 

total acquisition cost 

(TAC) 

traceable cost 

transaction cost 

transfer cost 

true interest cost (TIC) 

turnover cost 

unallowable cost 

unit cost 

usage cost 

user cost 

value added cost 

variable cost 

will cost 

zero cost option 

below cost 

cost/benefit analysis 

depreciated cost 

flotation costs 

gross capitalized cost 

operating costs 

original cost 

quality cost 

settlement costs 


Vi forsøgte at klassificere de om kostninger, der blev om talt i de ovenf or nævnte 

artikler og rapporter om cost-benefit anal yser, efter om kostningstyperne i denne 

model. Men efterhånden som arbejdet skred fremad, gik det op for os, a t det også var 

nødvendigt at gennemføre et solidt terminologiarbejde på begrebet cost (”omkostning” 

på dansk). 

Ved en helt enkel søgning på nettet fandt vi frem til en ov ervældende mængde af 

omkostningstermer, som er vist i tabel 1, så det var oplagt, at en afklaring og 

afgrænsning var nødvendig. 

UDGANGSPUNKT 

I den følgende begrebsafklaring ta ger vi udgangspunkt i vores im plicitte 

begrebssystem over ”omkostninger” (Grinsted & Thomsen 2008). 

FIGUR 2. Begrebssystemet bag Grinsted & Thomsen (2008) 

De grå kasser i figur 2 repræsenterer begreber, hvorunder er anført adskillende 

træk, og de hvide kasser repræsenterer indd elingskriterier. I begrebssystem et er 

intangible cost (vanskeligt m ålbar omkostning) synonym m ed ”strategic cost 

(strategisk omkostning), og de nne sidste term kan derfor ikke ses i diagramm et. 

Desuden var det vores opfattelse at direct og indirect costs (direkte og indirekte 

omkostninger) altid kan måles i kroner og øre (eller en anden valuta). 

Siden har vi forsøgt at inddrage flere begr eber for at skabe et bedre overblik, bl.a. 

gennem input fra eksperter og definitioner fra forskellige medier. 

EKSPERTER 

For at s ikre at r esultatet ikke bare kom til at af spejle vores egen opfattelse af 

domænet, har vi rådført os med eksperter på området fra både Syddansk Universitet og 

Copenhagen Business School. Eksperterne fik en ganske kort orientering om 


terminologiske begrebssystemer og blev herefter bedt om at systematisere sedler med 

udvalgte termer i et begrebssystem. Resultatet af dette blev lidt forskelligt fra den ene 

ekspert til den anden med den forklaring, at det naturligvis komm er an på hvilken 

synsvinkel man har på en cost-benefit anal yse: marketing, produktion etc. Interessant 

er det, at der ikke fremkom nye t ermer, mens nogle af dem vi havde udvalgt blev 

klassificeret som synonymer eller nærsynonymer. 

OVERVEJELSER I FORBINDELSE MED BEGREBSAFKLARING 

Når man ser på om kostninger, er det relevant at ske lne mellem initial cost og 

operating cost (etableringsomkostning og driftsomkostning), to begreber som ikke er 

med i begrebssys temet i f igur 2. If ølge den litteratu r vi så på, er 

etableringsomkostninger altid direkte, da de er direk te forbundet m ed formålet med 

investeringen, mens driftsomkostninger både kan være direkte og indirekte, som vist i 

figur 3. Her har vi også taget et par andre begreber med, som så ud til at høre hjemme i 

denne sammenhæng: non-recurring og recurring cost (engangsomkostning og 

gentagen omkostning). 

FIGUR 3. Begrebssystem udvidet med initial, operating, non-recurring og recurring cost. 

Efter at have kigget på vores eksem pler på konkrete om kostninger, nåede vi fre m 

til, at initial costs altid er non-recurring og operating costs altid recurring. Da vi ikke 

kunne finde andre ting, der adskilte non-recurring cost fra initial cost eller recurring 

cost fra operating cost, så det ud til, at der var tale om synonymer. Det blev bekræftet 

af de eksperter, vi har konsulteret. 

I en term base ville vi vælge at vise dette m ed noter, som hjælper til at vælg e 

betegnelse alt efter hvor ens fokus er, nem lig om hovedvægten ligger på en skelnen 


mellem engangsudgifter og udgifter som går igen, eller på en skelnen m ellem 

opstarten og den daglige drift. 

Man kan også sige at sondringen m ellem recurring og non-recurring costs 

(gentagne og ikke gentagne om kostninger) ikke er interessant, når vi klassificerer 

omkostninger forbundet m ed terminologiarbejde – hvis vi allerede skelner m ellem 

initial og operating costs (etablerings- og driftsomkostninger). 

NEDARVNINGSPROBLEMER 

Begrebssystemet i f igur 3 er im idlertid problematisk. Hvis operating cost er underbegreb 

til både direct og indirect cost, arver det to f orskellige værdier til trækket 

RELATION som illustreret i figur 4, og det bliver umuligt at forklare begrebet. 

FIGUR 4. Begrebssystemet fra figur 3 nu med karakteristiske træk. 

Det er jo ikke sådan, at en given dr iftsomkostning kan være BÅDE direkte OG 

indirekte – nej, driftsomkostninger kan være ENTEN direkte ELLER indirekte. Det vil 

resultere i to nye underbegreber: direct operating cost og indirect operating cost. Og 

det er så disse to underbegreber, der skal arve fra direkte og i ndirekte omkostninger, 

som vist i figur 5. 


FIGUR 5. 2 nye begreber arver trækkene [RELATION: direct] og [RELATION: indirect]. 

Initial og operating cost (etablerings- og driftsomkostninger) må altså flyttes et sted 

hen, hvor operating cost ikke kan arve disse modstrid ende træk, f.eks. helt op under 

det øverste begreb, som vist i figur 6, hvor de nye begreber er indsat i et polyhierarki. 

FIGUR 6. Polyhierarki. 

Nu kan man se, at operating costs (driftsomkostninger) kan være enten direkte eller 

indirekte, mens initital costs (etableringsomkostninger) altid er direkte. 

På dette punkt i analysen m åtte vi overveje, om det også var sådan, at intangible 

cost (de vanskeligt m ålbare omkostninger) kunne kombineres med nogle af de andre. 

Findes der f.eks. intangible initial costs (vanskeligt målbare 

etableringsomkostninger)? Det kunne f.eks. være den ’m odstand mod forandringer’ 


som opstår, når nye rutiner og ny teknolog i indføres. Det taler for, at alle 

inddelingskriterierne skal helt op på øverste niveau, hvilket vil resultere i et m eget 

fladt begrebssystem med mulighed for at la ve mange polyhierarkiske kombinationer 

under det første niveau. I sådan et system kan intangible initial cost (vanskeligt målbar 

etableringsomkostning) indsættes, som vist i figur 7. 

FIGUR 7. Fladt system med polyhierarki. 

I figur 7 har vi kun taget de kom binationer med, som vi mener er relevante at tage i 

betragtning i forbindels e med en cost-benef it analyse af term inologiarbejde. F.eks. 

underinddeler vi ikke de vanskeligt målbare omkostninger i direkte og indirekte, da vi 

ikke mener, at det vil give bedre overblik over omkostningerne i praksis. Et eksempel 

på direct tangible initial cost (direkte m ålbar etableringsomskostning) kunne vær e 

installation af software til en te rmbase, mens en intangible initial cost (vanskeligt 

målbar etableringsomkostning) - som nævnt - kunne være ’modstand mod 

forandringer’. 

Systemet bliver lidt svært at over skue med de krydsende linier, m en det er udtryk 

for, at der i økonomisk samm enhæng bruges forskellige kriterier i forskellige 

sammenhænge. I nogle samm enhænge er det f. eks. mere relevant at se på, om en 

udgift gentages, end om det er etablering eller drift, nogle gange er det interessant at se 

på direkte omkostninger over for indirekte, m ens det andre gange i kke er relevant at 

skelne på denne måde. 

Som nævnt i starten var der en overvæl dende mængde af begreber bare for 

omkostninger (se tabel 1). Hvis de alle sammen kan sættes parvis op med forskellige 

inddelingskriterier som i figur 7, så tyder det på, at det er rigtigt at sige, at der er 

mange forskellige synsvinkler, og at m an i en given analyse vælger de inddelinger 

som er relevante. Som nævnt fandt vi ud af, at parret initial / operating også kunne 

benævnes recurring / non-recurring, og det er højst sandsynligt, at der er mange sæt af 

synonyme eller næsten-synonyme par. Man kan spekulere over, hvorfor der er denne 

overflod af termer – og dermed også begreber. En delvis forklaring blev fremført af en 


af vores eksperter som udtalte: ”Alle forske re vil sige noget nyt. De laver lidt om og 

kalder det noget andet”. 

REVIDERET COST-BENEFIT MODEL 

Efter denne begrebsafklaring må vi modificere den oprindelige cost-benefit-model. 

De 6 kategorier fra figur 7 kan nu organise res som vist i tabel 2 i stedet for den 

oprindelige liste i modellen i figur 1. De omkostninger, der viser sig ved undersøgelser 

af terminologiarbejde i virksom heder og or ganisationer, kan vi så klassificere i 

tabellen. 

Costs 

TABEL 2. Klassifikation af omkostninger efter begrebsafklaring 

Tangible costs Intangible costs 

Direct costs Indirect costs 

Initial costs Direct tangible initial 

costs 

Tools 

Customizing 

Licenses 

Training courses 

Conversion of existing 

data 

Testing 

Operating 

costs 

Direct tangible operating 

costs 

Upgrades 

Maintenance 

Licenses 

Training courses 

Terminology work 

Indirect tangible initial 

costs 

Project management 

Indirect tangible 

operating costs 

Project management 

Derivative products 

(e.g. reports) 

Technical expertise 

Intangible initial costs 

Resistance to change 

Uncertainty 

Intangible operating 

costs 

Involvement of 

subject experts 

Den samlede cost-benefit model kommer så til at se ud som vist nedenfor i figur 8. 

Vi skal herefter også se, om der skal laves en lignende revision på benefitsiden. 

KONKLUSION 

I forbindelse m ed vores arbejde med cost -benefitanalyse af terminologiarbejde, 

blev det nødvendigt at lave en regulær te rminologisk begrebsafklaring, fordi nogle af 

termerne blev brugt i flæng, og for di der også dukkede en del term er op som lignede 

synonymer eller nærsynonym er. Og selv om det har kræ vet et større 

udredningsarbejde at blive sikre på begrebernes indhold, så viser det, at terminologisk 

ekspertise er et godt grundlag for at sætte sig ind i et ukendt emneområde. 


FIGUR 8. Model for cost-benefitanalyse af terminologiarbejde. 

Den terminologiske metode til afklaring af begreber har m edført en detaljeret 

diskussion af begrebernes indhold til gavn for en videreudvikling af cost-ben efit 

analysen, men også i forhold til eksperternes bevidsthed om begrebernes indhold. 

Ved at bruge de ’strenge’ term inologiske nedarvningsprincipper har vi fået m ere 

klarhed over begreberne, og det har gjort de t muligt at lave en klassifikation på 

grundlag af et polyhierarkisk begrebssystem. 

I forbindelse med begrebsafklaringen blev nedarvning af karakteristiske træk brugt 

til at strukturere begreberne, og det gav en flad struktur m ed mulighed for m ange 

polyhierarkiske kombinationsbegreber svarende til de forskell ige synsvinkler, som 

eksperterne gav udtryk for. Det kunne derfor være interessant at undersøge, om der er 

en tilsvarende begrebsdannelse inden for a ndre dele af økonomisk terminologi – altså 

om det er et udtalt træk ved økonomisk sprog, at m an laver mange små variationer i 

betydning, som kun har lille betydning for økonomiske analyser. 

Cost 

Initial 

Operating 

Tangible Intangible 

Direct Indirect 


Det er ikke alle begreber, der er relevante for en give n analyseopgave, og man skal 

ikke gøre det vanskeligere ved at forsøge at få så mange begreber med som muligt. På 

trods af de m ange omkostningsbegreber vi fa ndt, må vi konstatere, at det udvalg af 

begreber og derm ed inddelingskriterier, som 2 sproglige novicer udi cost-benef it 

analyser indledningsvis havde fundet frem til, har vist sig at være stort set 

anvendelige, når vi skal klassificere omkostninger i ”praksis”. 

Endelig var arbejdet med de konkrete om kostninger også en hjælp til at teste de 

polyhierarkiske underbegreber, f.eks. ved at se på om det var m uligt at finde 

eksempler på intangible initial costs (vanskeligt målbare etableringsomkostninger). 

Vi har endnu ikke set på, om vi kan bruge præcis den samme i nddeling i 

forbindelse med benefits (gevinster). 

Afslutningsvis vil vi gøre opm ærksom på, at vi stad ig er interesserede i at f å 

afprøvet modellen i praksis, og vi vil derf or gerne i kontakt m ed virksomheder, som 

vil indgå i et samarbejde om cost-benefit analyse af terminologiarbejde. 

ACKNOWLEDGEMENTS 

Vi vil gerne takke de forskere som har bi stået os m ed afklaringen af cost-benefitterminologien. 

Det drejer sig om Professor Niels Bjørn Ande rsen fra Copenhagen 

Business School; ph.d.-studerende Frederik Zachariasen og Profes sor Per Vagn 

Freytag, begge fra Syddansk Universitet. 

REFERENCER 

Guy Champagne Inc. (2004a). Portrait of Terminology in Canada. Report submitted to the Translation 

Bureau of Canada, Part I. 

Guy Champagne Inc. (2004b). The Economic Value of Terminology. Report submitted to the Translation 

Bureau of Canada, Part II and Summary. 

Grinsted, Annelise; Hanne Erdman Thomsen (2008). Cost-benefit Analysis of the Introduction and 

Implementation of a Terminology Management System. In: Madsen, B.N. and H.E.Thomsen (eds.): 

Managing Ontologies and Lexical Re-sources. Litera. ISBN: 87-91242-50-9. Pp. 317-332 

Holm-Rasmussen, Søren; Jens Ocksen Jensen; Lone Hansen (2005). Virksomhedsøkonomi til 

videregående uddannelser. Systime Academic, ISBN 87-7675-213-5. 

Wright, Sue Ellen (1996). Economic Issues of Terminology Management. In TermNet News 54/55, p. 4- 

10. 


Automatic Extraction and Manual Validation of 

Hierarchical Swedish Patent Terminology 

Magnus Merkela, Jody Fooa, Mikael Anderssonb, Lars Edholmb, Mikaela 

Gidlundb, Sanna Åsbergb 

aDepartment of Computer Science and Information Technology, {magme,jodfo}@ida.liu.se 

bFodina Language Technology AB, {mikael.andersson, lars.edholm, mikaela.gidlund, 

sanna.asberg}@fodina.se 

Abstract. Several methods can be applied to create a set of validated terms from existing 

documents. In this paper we describe an a utomatic bilingual term candidate extraction 

method, and the validation process used to create a hierarchical patent terminology. The 

process described was used to extract terms from patent texts, commissioned by the Swedish 

Patent Office with th e purpose of using the terms for machine translation. Information 

on the correct linguistic inflection patterns and hierarchical partitioning of terms 

based on their use are of utmost importance. 

The process contains six phases, 1) Analysis of the source material and system configuration; 

2) Term candidate extraction; 3) Term candidate filtering and initial linguistic validation; 

4) Manual validation by domain experts; 5) Final linguistic validation; and 6) 

Publishing the validated terms. Input to the extraction process consisted of more than 

91.000 patent document pairs in English and Swedish, 565 million words in English and 

450 million words in Swedish. The English documents were supplied in EBD SGML 

format and the Swedish documents were supplied in OCR processed scans of patent documents. 

After grammatical and statistical analysis, the documents were word aligned. Using 

the word aligned material, candidate terms were extracted based on linguistic patterns. 

750,000 term candidates were extracted and stored in a relational database. The term candidates 

were processed in 8 months resulting in 181.000 unique validated term pairs 

which were then exported into several hierarchically organized OLIF files. 

INTRODUCTION 

Applying for a patent is a com plex process. Before applying for a patent, it is im - 

portant to research whether or not th ere already exists a conflicting patent. In the case 

of applying for European patents, this involves searching the patent databases of many 

different countries. The m ain obstacle for such a search is that all patents in such a 

database might not be available in the langua ge of the patent a pplicant. One way of 

solving this is to contact a local patent agency and acquire their service. However, this 

often implies additional costs, and almost certainly an increase in handling time. 

One solution to the lan guage barrier in the con text of patent search is to provide a 

cross-lingual search engine. Using a cross-li ngual search engine a patent stakeholder 

can perform a search using his or her own language, e.g. Swedish and find results 

from non-Swedish patent repo sitories. Furthermore the fo reign language patent text 

can be automatically translated into the language that was us ed for the search, in this 

case Swedish. For such a service to be made possible, the system needs to have a d ictionary 

containing translations of patent terms. These translations can be used either to 

translate the search query, and/or translate the patent texts in the foreign repositories. 


This paper describes a proce ss of extracting and validating terms from a bilingual patent 

text corpus for use in Espacenet, a cross-lingual patent search system built by the 

European Patent Office. This paper starts of by introducing the area of patent texts, 

how they can be searched and who the different people are that search patent texts. We 

then describe the process that we developed and used to extract and validate hierarchically 

organized English-Swedish patent terms. 

BACKGROUND 

A validated bilingual patent terminology is a crucial component in cross-lingual patent 

search that uses a rule based machine translation system. As we cannot assume that the 

intricacies of the cross-lingual patent search domain are known to all readers, this section 

will provide some background on the topic. 

Patent texts 

Patent texts are classified and organized according to the IPC standard (W IPO 2005). 

In this standard, patents ar e grouped into sections, classe s and subclasses. A section 

contains several classes, which contain se veral subclasses. A c onsequence of this 

structure is that extracted term inology must also be hierarchically structured, in order 

to make sure that terms are used correctly in its intended section. 

The patent application 

To be granted a patent for a technical solution the invention must meet certain criteria 

(PRV 2009), it must be: 

new – the invention must not be known before you submit your patent 

application. The invention is considered known even if the inventor 

him/herself has published it. 

inventive – The invention m ust differ signifi cantly from what is already 

known. 

industrially applicable – the invention m ust be of a technical nature, have 

technical effect and be reproducible. The invention must not be just a theory 

but a product or a process; it must solve a problem in a technical way. It also 

has to be possible for others to repr oduce the invention and have the sam e 

results as from the original invention. 

A patent application must contain the following: 

A completed application form –the application for m must contain information of 

the invention’s title, the inventor and the applicant 

A description of your invention – The purpose of the description is to explain your 

invention. The description contains two part s; one general and one specific. In the 

general part, the applicant should present the field of application if the invention and 

the problem to be solved, along with the actual solution. In the specific part the appli- 


cant should describe the invention in greater detail and give concrete examples of how 

it can be realized. The desc ription must be comprehens ive enough to enable a technical 

professional in the area to use the invention. 

One or more patent claims – the wording of the patent claims defines the invention, 

and is determining the scope of the patent pr otection. It is therefore very important to 

be accurate when writing the claims. 

An abstract – the abstract is written to summarize the technical content of the application 

and give an overview of the invention for interested parties. 

Drawings and appendices that further clarify the proposed invention can also be included. 

Patent search 

This section is an overview of relevant research and the status of patent search (novelty 

searches and patent examinations). 

Novelty searches 

Usually applicants choose to perform a novelty search of their invention, to see that 

the technical solution is not already known. It is common t o consult a specialist for 

performing the novelty search. Th e search specialist initially has to read the application 

(or the basis of the future applica tion) and understand the technological field. 

Then he/she starts to form a search expression used in different tools for searching in 

database collections. Because of the large am ount of information in the databases, the 

search queries will have to be refined during a number of iterations to find the relevant 

collections of documents relevant to the search. 

Patent examination 

When an application is filed to the patent office, the process of examining the application 

starts. A patent exam iner reads the applica tion to get the background of the field 

of the application. Then he/she starts perfor ming searches in the databases after other 

patents, articles or other non-patent literatu re to see if there are any docum ents that 

contradicts any of the three cr iteria for getting a patent granted. The process of patent 

examination is mainly the same as for novelty searches. The goal with patent examination 

is to make sure that there is nothing that prevents the patent from being granted. 

Espacenet 

A service has been created at the Eur opean Patent Office (EPO) in 1996 called 

Espacenet where anyone can search for patent in formation in several databases. They 

also have a m achine translation service for enabling people to search in their nativ e 

language, but find documents in other languages. To be able to do this in a good way, 

it demands that EPO has access to terms and their corresponding translation to English 

(which is the pivot language) and that is where the term extraction becomes important. 

An overview of the EPO/Espacenet translation system is given in Täger (2007). 


Stakeholders 

In the “official” patent process, there are several stakeholders that are concerned by 

using terms in their work. Inventors often consult patent attorneys for writing the patent 

application. It is of high importance that the patent attorneys carefully choose 

their words, especially in the patent claim s since the scope of th e patent protection is 

defined there-in. In general, people who have their profession in the patent area have a 

good knowledge about terms, and the experience to know which term s are usable and 

which are not in a search query. 

The users o f Espacenet probably h ave a m ore shattered k nowledge base, and it 

seems more important to have an efficient terminology support tool to help the users 

of Espacenet to form good search expressions. 

CHALLENGES 

The task at hand was to extract and valid ate terminology from existing patent documents 

that existed in English and Swedish versions. These bilingual terms should then 

be produced in a form at that th e Machine Translation (MT) engin e used within 

Espacenet could handle, nam ely the Open Lexicon Interchange format (OLIF) an d 

contain entries in both directions, Eng lish-Swedish and Swedish-English. Furthermore, 

all term entries must be organized hierarchically according to the IPC system. A 

baseline already established was that for German around 120,000 unique term entries 

had been produced, which meant that this number was what was aimed for. 

THE PROCESS 

The process developed at Fodina Language Technology AB for extracting and validating 

terminology consists of six steps; source data analysis and system configuration, 

term candidate extraction, term candidate filtering and initial linguistic validation, 

manual validation by domain experts, final linguistic validation and publication of the 

validated terms. The process is visualized in Figure 1 below. 


FIGURE 1. Process for term extraction and validation. Starting with patent documents and ending up 

with validated term entries in the OLIF format. 

All input data was provided as either SGML texts (for English) or as pure Latin-1 

texts for Swedish. The Swedish documents had been scanned OCR:ed by the Swedish 

Patent Office. 

Source data analysis and system configuration 

We analyzed the source data and configured the systems to the source data. In tota l 

there were over 91,000 docum ent pairs. The English SG ML texts were no rmalized 

into pure text format. The Swedish OCR f iles were processed to handle line breaks, 

standard hyphenation and page breaks. Furthe rmore, the Swedish texts were also prepared 

by automatic modification of frequent OCR errors. 

After the input texts had been norm alized, the whole docum ent set was sentence 

aligned, i.e., all texts were synchronized on the sentence level, to produce a parallel 

corpus. The corpus was created on the subc lass level which meant that a subcorpus 

was created for each su bclass. This was then the starting point for the next steps: 1) 

grammatical analysis and 2) statistical analysis and 3) patent dom ain training of word 

alignment. 

The grammatical analysis used to provide linguistic information, such as partsofspeech, 

base form and morpho-syntactic attributes, was done with the aid of Connexor’s 

Machinese Syntax system for English and Swedish respectively (Tapanainen 

& Järvinen 1997). 

The statistical analys is performed was done on the pa rallel material at both the 

word form level and at the base form level to provide probabilistic bilingual dictionaries 

that was used as input for the word alignment system. 

Before the automatic term extraction could take place, three patent subclasses were 

processed using the ILINK syste m (from Fodina and Linköping University – Ahren- 


erg et al. 2003). By using ILINK which is an interactive word alignm ent system, a 

number of resources were created that furt her contributed to increasing the performance 

of the autom atic term extraction. Th ese resources created interactively were 

bilingual resources both on the lexical and th e syntactic level which would let the system 

be fine-tuned for the specific properties of patent translations between English 

and Swedish. 

A number of tests on how to configure the automatic word alignm ent system 

(ITRIX) were then performed where different combinations of system settings and use 

of resources were evaluated. This testing pha se then resulted in a default system configuration, 

which was then used for all the automatic extraction. 

Each subclass was then word aligned automatically using ITRIX, which resulted in 

word alignments of the input patent texts. 

Term candidate extraction 

After automatic word alignm ent of the bilingual subclasses using ITRIX, term candidates 

were extracted and stored in a datab ase. A sentence pair from the corpus is 

shown in Figure 2 below. The X’s in the m atrix show alignments between the English 

and the Swedish sentence. Two X’s on the sam e row means that a multiword unit has 

been aligned (for exam ple, living space-livsrummet and incubation environmentinkubationsmiljön). 


FIGURE 2. Term extraction from word aligned material. 


The boxed word units in Figure 2 are exam ples of what the term extraction component 

has decided to be term candidates. As can be seen, function words such as prepositions, 

articles and common verbs such as “provide” are no t regarded as term candidates. 

The term extraction component utilizes res ources such as general dictionaries and 

exception lists to determine what could be regarded as non-terms. This process is quite 

chosen to be rather non-strict, as we are still only concerned with term candidates, not 

the final term sets. The final decision on wh at should be a term has to be decided in 

the next step. 

But before validation can start, all term candidate pairs are imported into a 

relational database where all grammatical information and examples from the corpus 

are kept. 

Term candidate filtering and initial linguistic validation 

Before domain experts are called in to va lidate the term candidates, term candidates 

that do not fulfill certain requirements are filtered out in the database. Gradually, during 

the linguistic validation, errors in the automatic word alignment were collected and 

tagged which meant that this information could be used as resource for filtering out 

faulty term candidate pairs. 

As manual validation is a costly pr ocess, the goal of this stage is to re move term 

candidates from the work set so that the m anual validation process can be as efficient 

as possible. The way we rem oved term candidates from the work set to be passed to 

the domain experts was to set up four criteria for all term candidates to be passed on: 

• Term candidates must not be general language 

• Term candidates must not be erroneously aligned 

• Term candidates must have a source or target frequency above 4 

• Term candidates must have a Q-value above a subclass-specific threshold 

Deciding whether or not a word is general language or domain specific is a difficult 

question and cannot be done perfectly by a co mputer. In our case the goal was to remove 

as much general language as possible, but not too m uch. To do this we used a 

custom dictionary to remove the term candidates that were most likely to be gener al 

language. Using information on previous alignm ent errors and the work done during 

the linguistic validation, term candidates containing alignment errors could be removed. 

Also, term candidates were required to have a corpus frequency (either source 

or target word) of five or more within its subclass. The final requirement is for the 

alignment confidence, called Q-value, to be above a threshold set by the project managers 

for each clas s/subclass. For a m ore detailed description of how t he Q-value is 

used, see Merkel & Foo 2007). Here are som e numbers from the filtering process of 

subclass C04B. Note that the num ber term candidates that m atch each criterion are 

listed independently of whether or not they also match other criteria. • Total number of 

term candidate pairs extracted: 143,341 

• General language entries removed: 18,764 


• Link errors removed: 653 

• Freq >4 src|trg: 9,064 

• Q-value filtering: keep 4,076 (q-val>1.9) 

• Total after filtering: 3,179 

As you can see, the criterion which is the ha rdest to pass is the Q-value threshold. Only 

4,076 term candidates pass this test, or in other words, 139,265 term candidates 

were rejected because of this criterion. The combination (not the sum) of the different 

criteria leaves us with 3,179 term candidates for the domain experts to validate. 

Manual validation by domain experts 

Rather than using professiona l domain experts, such as university lecturers, patent 

engineers from each domain, etc., which would have b een optimal, we chose to use 

university students from the various fields to validate the term candidates. What the 

expert validation meant in practice was that the domain experts either accept the term 

candidate as a term that belongs to the domain, or reject the term candidate as it is not 

specific to the domain. 

For each term candidate the domain expert also had access to the English and Swedish 

text passages from which the term s had been extracted. The basic task was then 

provide a simple Yes or No to the question on whether the term pair belonged to the 

domain of the particular subclass. 

Final linguistic evaluation 

After the dom ain experts have reje cted all inap propriate term candidates, additional 

linguistic metadata such as inflection patterns were added to the validated terms before 

they were published. The final linguistic validation also included m anual scrutiny of 

part-of-speech, gender and number. 

As this validation is a very tedious and time-consuming process, several steps were 

taken to make the final validation as efficient as possible. One such step was to develop 

a process that captures the corrections made by the linguistic validators. These decisions 

(e.g. for the term pair X and Y, corr ect Y to W) are then reused, i.e. reapp lied 

to similar term pairs (i.e. term pair X and Y in another s ubclass). These automated 

corrections however, do not automatically get promoted to “validated”, but are instead 

marked as “automatically corrected”. Depending on the source of the correction data, 

the correction was also marked as “very reli able” or “less reliable”. Correction data 

from the same IPC class was deemed to be more reliable than e.g. correction data from 

another section. In most cases the automatic correction is valid, and the human in the 

loop only has to accept the correction as opposed to actually making the correction. 

To assist the final linguist ic validation, Fodina TermVi ewer was specifically designed 

for this task. Fodina Term Viewer is an environm ent for revising term candidates 

before final publishing of the terms. A screenshot from Fodina TermViewer as it 

was used during the final linguistic validation is shown in Figure 3 below. 


FIGURE 3. Fodina TermViewer for Final linguistic validation. 

The Fodina TermViewer application gives the linguistic validator inform ation on 

the source term, target term, head words, part-of -speech, inflection patterns, morphosyntactic 

information as well as on if the term pair information has been recycled in 

any way. In the lower panel, contexts for the term pairs in the patent documents are 


also available. By selecting the butto n at the lower right-hand corner labeled “Ready 

for Export”, the validator has approved the term pair. 

Publishing the validated terms 

After the final linguistic validation, the terms can be published as a set of hierarchically 

structured OLIF lexicon files. The OL IF lexicon files were produced in two directions; 

one set for English to Swedish and one set for Swedish to English. 

Each subclass of the IPC standard is f illed with the validated terms, and then terms 

from subclasses belonging to a class are propa gated to the class leve l dictionary. This 

goes on up to the section level, and then to a default top dictionary level as depicted in 

Figure 4 below. 

FIGURE 4. Building hierarchical OLIF lexicons with patent terms. 

RESULTS 

After 8 months work, the complete term extraction and validation was finalized. More 

than 91,000 document pairs had then been processed from clean-up to final validation, 

providing more 181,260 unique term pairs. 

Most of the process was fully autom atic; clean-up, sentence-alignm ent, tagging, 

statistical analysis, word alignment and term candidate pair extraction. 

The time-consuming and mostly intense phase was of course the validation phase, 

but thanks to efficient and user-friendly environments like the Term Viewer, the linguistic 

and dom ain expert validation could be done e fficiently. The way that 

TermViewer was designed in order to gi ve maximal overview and also by providing 

keyboard shortcuts (instead of using graphi cal buttons) also increased the efficiency 

during the course of the projec t. At the end of the project w e estimate that an expert 

doing domain validation processed between 4, 000 and 6,000 term candidate pairs per 


working day. Expert validation is an easier ta sk than linguistic validation as it is binary, 

it only required a Yes or a No. For linguistic validation we estim ate that a linguist 

processed between 2,000 and 3,000 term pairs per working day. The way that linguistic 

information was reused and tagged considerably made this performance possible. 

In Table 1 below, the progress of the project is illus trated. We started off with the 

smaller sections D, E and F, in order to build up efficient strategies to handle the logistics. 

The co lumns give inform ation of how large each section was in the Eng lish- 

Swedish corpus; the D, E and F sections together made up 12 per cent of the total document 

set, whereas section C alone was over 28 per cent of the total document set. 

TABLE 1. Size of IPC sections and number of accumulated extracted term pairs 

As can be seen in Table 1, the grow th of validated unique term pairs actually is m ore 

or less proportional to the size of the sections. This is shown clearer in the graph de - 

picted in Fig. 5 below. 


FIGURE 5. Growth of validated term pairs in relation to total size of source documents. 

The fact that the growth of the number of validated term pairs is more or less linear 

is maybe somewhat surprising. Before embarking on this project we had expected that 

it would be harder and harder to detect “new” unique term pairs. 

DISCUSSION 

This paper has presented an efficient and l ogistically feasible approach extracting and 

validating terminology for a large area. The goal was to create a validated terminology 

base to be used in machine translation and this means that one does not have to deal 

with creating terminological concepts. Another difference from more traditional use of 

terminology is that the term bank is not normative or standardized. Only the m ost frequent 

terms have survived the extraction a nd validation stages described earlier. Although, 

a large number of terms have been produced, this is still only the tip of the iceberg 

when it comes to terminology used in patent texts. 181,000 unique term pairs is a 

large set of terms, but as terms with lower frequency and only the most frequent translation 

is kept, it is obvious that there are many more terms that could be extracted from 

this material, but it is a very good start. Th ere are of course bits that could be im - 

proved in the process but we regard the key 

benefits of this approach as the way we r ecycled information from previously validated 

term pairs, using students as dom ain experts and the developm ent and use of an 

efficient validation tool. An area that obviously could need more research is the automation 

of improved term filtering. 

ACKNOWLEDGMENTS 


We would like to thank the people at the Swedish Patent Office (PRV), especially Leif 

Stolt, for excellent cooperation. We are also grateful to everybody at the European 

Patent Office who assisted us with OLIF and formal information. Finally, thanks to all 

the experts who helped us during the domain validation. 

REFERENCES 

Ahrenberg, L., Merkel, M., Petterstedt M. (2003). Interactive Word Alignment for Corpus Linguistics. 

In Proceedings from the International Conference of Corpus Linguistics, (pp. 533-542). Lancaster. 

Merkel, M., Foo, J. (2007). Terminology extraction and term ranking for standardizing term banks. In: 

Proceedings of the 16th Nordic Conference of Computational Linguistics, NODALIDA-07: May 

25- 

26 2007; Tartu; 2007: 349-354. 

PRV (2009). Patent- och registreringsverket (PRV, The Swedish Patent Office). http://www.prv.se/en 

(accessed 2009-10-01). 

Tapanainen, P., Järvinen, T. (1997). A non-projective dependency parser. In Proceedings of the 5th 

Conference on Applied Natural Language Processing, April 1997, Washington, D.C., Association 

of 

Computational Linguistics, pp. 64-71. 

Täger, W. (2007). European Machine Translation Programme. Presentation given at the Machine 

Translation Summit XI, Copenhagen September 11-14, 2007. 

WIPO 2005. World Intellectual Property Organization, International Patent Classification (IPC), 

Eighth Edition WIPO Publication Number 560/8, 2005. 


ONKI-ontologibiblioteket: tjänster för 

upprätthållare, indexerare och 

informationssökare 

Katri Seppälä a , Eero Hyvönen b , Jouni Tuominen b och Kim Viljanen b 

a Terminologicentralen TSK och SeCo-gruppen (Semantic Computing Group) ,Tekniska högskolan, laboratoriet för mediateknik, fornamn.efternamn@tsk.fi 

b SeCo-gruppen (Semantic Computing Group), Tekniska högskolan, laboratoriet för mediateknik, fornamn.efternamn@tkk.fi 

Abstrakt. Ontologier behöver tjänster som underlättar deras användning och ett 

ontologibibliotek är för sin del nyttigt bara om det innehåller systematiska ontologier som 

uppfyller användarnas krav. För att främja användning av ontologier behövs alltså en modell för 

ontologiernas struktur och en metod för publicering av ontologier. I vår artikel kommer vi att 

diskutera hur ett ontologibibliotek kan användas av upprätthållare, indexerare och 

informationssökare och hur ontologier och ontologibiblioteket indirekt och direkt underlättar 

informationssökningen. 

FinnONTO 2.0-projektet 

Projektet Finska semantiska webbens ontologier (FinnONTO) pågick 2003–2007, 

och nu fortsätter arbetet i ett nytt projekt FinnONTO 2.0 (2008–2009). Projektet 

koordineras av professor Eero Hyvönen från Tekniska högskolan i Esbo, Finland, och 

dess forskningsgrupp består av cirka 20 forskare. Projektets huvudfinansiär är Tekes 

(utvecklingscentralen för teknologi och innovationer) och projektet har 38 deltagare, 

som är organisationer från olika specialområden: biblioteksväsen, informationsteknik, 

kartografi, kommunikation, litteratur, museiverk, social- och hälsovård, 

språkteknologi, terminologi, undervisning, metallindustri och maskinindustri. 

Projekten har redan producerat flera finska ontologier som är strukturerade efter en 

gemensam modell. Ontologierna har publicerats med hjälp av ONKIontologibiblioteket 

1 och de används till exempel i två portaler som forskningsgruppen 

har byggt upp: hälsoinformationsportalen TerveSuomi 2 och 

kulturinformationsportalen Kulttuurisampo 3 

. Det nuvarande projektet avslutas i slutet 

av år 2009 men en fortsättning på projektet är under planering. 

FinnONTO-ontologier 

I detta sammanhang hänvisar ordet ontologi till en exakt definiering av ett visst 

begreppssystem i en maskinläsbar form. TSK har i FinnONTO-projekten deltagit i 

uppbyggandet av den Allmänna finska ontologin, som baserar sig på den Allmänna 

1 http://www.yso.fi/ 

2 http://www.tervesuomi.fi/ 

3 http://www.kulttuurisampo.fi/ 


tesaurusen på finska, och kompletteringen av den allmänna ontologin med 

specialontologier. FinnONTOs specialontologier bygger på följande tesaurusar och 

ordlistor: Allmän tesaurus på finska, Ordlista för museibranschen, Ordlista för 

fotografi, Tesaurus för design och kommunikation, Agriforest-tesaurus, Tesaurus för 

hälsofrämjande, Tesaurus för sjöfartsbranschen, CILLA-specialtesaurus för musik och 

Bella-specialtesaurus för fiktivt material. Den enhetliga hierarkin, som används i alla 

FinnONTO-ontologier, är uppbyggd enligt en modell som skapades för den Allmänna 

finska ontologin. I motsats till tesaurusar och ordlistor har homonymer och polysemer 

åtskiljts och partitiva relationer tillagts i ontologierna. Dessa ontologier är lämpliga för 

samma användningsändamål som tesaurusar: indexering och sökning av olika slags 

material (t.ex. textdokument, bilder, föremål, musik). Däremot är ontologierna för 

inexakta för dataöverföring även om systematiken är bättre än i tesaurusar. 

ONKI-ontologibibliotekET 

Professor Eero Hyvönen, Jouni Tuominen och Kim Viljanen från FinnONTOgruppen 

har koncentrerat sig på utvecklingen av ONKI-ontologibiblioteket. ONKIontologibiblioteket 

är en server, där flera ontologier kan lagras, upprätthållas och 

användas och som erbjuder tjänster för flera användargrupper. 

BILD 1. ONKI-bläddrare. 


ONKI för upprätthållare 

För upprätthållare ger ONKI en möjlighet att upprätthålla kombinerade ontologier, 

inte enbart upprätthållarens egen ontologi. Kombinerade ontologier kan bestå av 

ontologier med en gemensam struktur, t.ex. KOKO-ontologin, eller ontologier med 

olika strukturer, t.ex. den Allmänna finska ontologin och WordNet 4 

. 

Forskningsgruppens egen kombinerade ontologi KOKO har redan publicerats. Den 

innehåller flera av FinnONTOs specialontologier. Det finns planer att komplettera den 

Allmänna finska ontologin med ekvivalensrelationer till WordNets begrepp. Eftersom 

begreppen i ontologin har definierats med hjälp av relationer till näraliggande begrepp, 

är det möjligt att ge exakta ekvivalenter på olika språk. Dessutom är det möjligt att 

koordinera upprätthållandet av ontologierna eftersom alla upprätthållare har 

gemensamma regler för gemensamma strukturer, alla intresserade får information om 

ändringar och information om de äldre versionerna av ontologierna kan behållas på 

servern. Speciellt för små organisationer är det av stor hjälp att kunna utnyttja de 

centraliserade resurserna för maskinvara (en gemensam server) och användarstödet för 

de registrerade användarna. Det går också att integrera ONKI med andra system (för 

sökning och indexering) med hjälp av ett web service-gränssnitt. 

ONKI för indexerare 

ONKI-ontologibiblioteket underlättar en indexerares arbete eftersom det erbjuder 

en möjlighet att indexera med hjälp av en kombination av ontologier och därför 

behöver man inte längre söka i flera separata tesaurusar. I ONKI är det lätt att välja 

vilka ontologier man vill använda och det rätta begreppet kan hittas snabbt i den valda 

ontologin med hjälp av auto completion-funktionen. Auto completion-funktionen visar 

alla ord med den teckensträngen som har skrivits i sökfältet, om ett sådant begrepp 

finns i de valda ontologierna. När man klickar på det önskade indexeringsordet 

överförs informationen om begreppet (benämningen och URI) till det andra systemet 

som ONKI är integrerat med utan att man behöver kopiera och klistra in texten. 

Ontologins hierarki gör det lätt att välja det rätta och exakta begreppet vid indexering 

och då blir indexeringen enhetligare även om flera personer tar hand om den. 

Indexeringen blir också enklare eftersom det behövs endast ett indexeringsord per en 

hierarki, därför att ontologin innehåller information om över- och underordnade 

begrepp. 

ONKI för informationssökare 

Ontologierna och ontologibiblioteket möjliggör begreppsbaserad sökning. När man 

använder auto completion-funktionen som är kopplad till ontologin, är det inte möjligt 

att välja sökord som inte finns i ontologin. Ontologibiblioteket ger också en möjlighet 

att använda nya sökmetoder och formulera sökresultatet. Sökbegreppets hierarkiska 

underbegrepp används automatiskt i sökningen, men sökresultatet formuleras så att de 

sökträffarna som hittades med det exakta sökbegreppet visas först. Dessutom kan de 

4 http://wordnet.princeton.edu/ 


avrådda indexeringsorden användas vid sökningen. Vid sidan av sökträffarna kan 

ONKI ge rekommendationer om andra potentiellt intressanta objekt genom att 

använda de överordnade begreppen till sökbegreppet och begrepp som har associativa 

relationer till sökbegreppet (t.ex. om man söker information om arbetsredskap, är man 

kanske också intresserad av arbetskläder). Om ontologin är flerspråkig är det möjligt 

att byta mellan olika språk vid sökningen. 

I ett icke-semantiskt söksystem ska beskrivningen av ett föremål, dokument eller 

liknande innehålla exakt de indexeringsord som används vid sökningen – annars hittar 

man dem inte. Men om söksystemet utnyttjar ontologier räcker det att beskrivningen 

innehåller ett indexeringsord som hänvisar till ett underordnat begrepp till sökordet. 

Till exempel om man använder kärl som sökbegrepp, hittar man också föremål som 

har beskrivits med indexeringsorden kopp eller fat. Eller om man söker kärl som har 

tillverkats i Europa, hittar man kärl, som har tillverkats i Tyskland. På motsvarande 

sätt hittar man porslin, när man söker efter keramik. 

Eftersom det inte är lätt att snabbt ersätta de existerande IT-systemen är det viktigt 

att det är lätt att integrera ONKI med andra system. Då kan ontologierna tas i bruk 

även i de existerande systemen. För integrering av ONKI behövs bara cirka två rader 

Javascript-kod, vilken tillsammans med övriga instruktioner ligger på SeCo-gruppens 

webbplats 5 

. Integreringen har demonstrerats med Kantapuu-systemet (Stamträdet), 

som är en finskspråkig databas för samlingar som är gemensamma för ett flertal 

museer, t.ex. Lusto - Finlands skogsmuseum. Museerna ville inte ändra Kantapuusystemet 

men ville använda ontologierna vid sökning för att öka uppfångningen. Efter 

integreringen av ONKI-ontologibiblioteket i Kantapuu-systemet, breddas sökningen 

med hjälp av de underordnade begreppen till sökbegreppet. Skillnaden i 

uppfångningen är betydelsefull. Om man använder sökbegreppet 

työvälineet/arbetsredskap och söker med hjälp av ONKI, används också det 

underordnade begrepp till sökbegreppet, t.ex. sahat/sågar, och man får 4900 

sökträffar. Utan ONKI blir det bara 3509 sökträffar. Eftersom ontologin som används i 

systemet är tvåspråkig, kan man vid sökningen använda finska eller svenska sökord, 

även om indexeringen endast är gjord på finska. Också den Finska ortontologin med 

tidsperspektiv (SAPO) används i samband med Kantapuu och den hjälper att hitta 

information relaterad till orter trots kommunalsammanslagningar och förändringar av 

gränserna under tiden. Om man till exempel söker publikationer som har använts i 

Joensuu, får man som sökresultat publikationer som har Eno som användningsort. 

Grunden för resultatet är att ONKI använder också ortsnamnet Eno i sökningen 

eftersom Eno nuförtiden hör till Joensuu och information om denna 

kommunsammanslagning ingår i ontologin. Om informationssökaren inte är medveten 

om kommunsammanslagningen kan resultat först se förvirrande ut. Efter att ha kollat 

relationen mellan Joensuu och Eno märker man dock att ibland kan ontologierna eller 

söksystemet veta mer än personen som använder systemet. 

5 http://www.yso.fi/onkiselector/ 


BILD 2. Kantapuu-systemet som använder ONKI-ontologibiblioteket. 

AVSLUTNING 

Under de senaste åren har intresset för ontologierna varit stort. När antalet 

ontologibaserade system ökar, blir det lättare att demonstrera och å andra sidan förstå 

nyttan av ontologierna i olika sammanhang. Eftersom arbetet med ontologier är 

tidskrävande hoppas vi att vi hittar organisationer som efter forskningsprojekten tar 

ansvaret för upprätthållandet av FinnONTOs ontologier och tjänster så att de är fritt 

tillgängliga för alla intresserade också i framtiden. 

Vi tackar Tekes (utvecklingscentralen för teknologi och innovationer) och de 38 

deltagande organisationerna för finansiering av FinnONTO-projekten. 

REFERENCER 

Eero Hyvönen, Kim Viljanen, Jouni Tuominen and Katri Seppälä: Building a National Semantic Web 

Ontology and Ontology Service Infrastructure--The FinnONTO Approach. In Proceedings of the European 

Semantic Web Conference (ESWC 2008), Springer-Verlag, 2008. 

Jouni Tuominen, Matias Frosterus, Kim Viljanen and Eero Hyvönen: ONKI SKOS Server for 

Publishing and Utilizing SKOS Vocabularies and Ontologies as Services. In Proceedings of the 6th 

European Semantic Web Conference (ESWC 2009), Springer-Verlag, 2009. 

Jouni Tuominen, Tomi Kauppinen, Kim Viljanen and Eero Hyvönen: Ontology-Based Query Expansion 


Widget for Information Retrieval. In Proc. of Scripting and Development for the Semantic Web 

Workshop at the ESWC, Heraklion, Greece, May 31, 2009, CEUR Workshop Proceedings, ISSN 

1613-0073, online CEUR-WS.org/Vol-449/, 2009. 

Kim Viljanen, Jouni Tuominen and Eero Hyvönen: Ontology Libraries for Production Use: The Finnish 

Ontology Library Service ONKI. In Proceedings of the 6th European Semantic Web Conference 

(ESWC 2009), Springer-Verlag, 2009. 


Etablering af termbase over dragt- og 

tekstilbegreber 

a 

a,b 

Susanne Lervad 

Termplus Aps, Symbion Science Parc, Fruebjergvej 3 

2100 København Ø www.termplus.dk; sl@termplus.dk 

. 

b 

CRTT, Centre de Recherche en Terminologie et Traduction, 

Université Lyon86, rue Pasteur, F-69365 Lyon Cedex 

Abstract. Digitalisering: “Et klik på internettet – og De har svaret på hvad f.eks. en 

dullemøsse er. Det vil de danske museer have sikret om et par år med en digital ordbog over 

gamle udtryk og betegnelser for klædedragt og tekstiler. En dullemøsse er for øvrigt en hvid 

blondebesat hovedbeklædning for fine kvinder fra 1600- tallet”. 

Ny ordbog om gamle klæder 

Som medlem af Dragtpuljen under Kulturarvstyrelsen og som terminolog i arbejdsgruppen 

for ordbogsdatabasen i denne pulje, vil jeg forsøge at beskrive baggrunden for dette 

ordbogsprojekt, som arbejder med at sikre en autoriseret terminologi for dragter og tekstiler 

på de danske museer.. Baggrunden for samarbejdet er et ph.d. projekt om tekstilterminologi 

SDU og arbejdet med terminologi på forskningscentret CRTT ved universitetet I Lyon, samt 

tekstilmuseet og det internationale modeuniversitet i Lyon. 

Siden 2003 har jeg desuden arbejdet med udviklingen af termdatabase programmet 

Termplus Manager, der også er rettet til gruppens arbejde. 

En lang række danske museer har samlinger af historiske dragter og tekstiler, og i 

registreringen af disse er der anvendt forskellige ord, der betyder det samme, men som 

skifter over tid. Det er ikke hensigtsmæssigt i hverken forskning eller formidling, og derfor er 

der et stort arbejde i gang med at etablere en fælles database over dragt- og tekstiludtryk fra 

1600-tallet og fremefter. 

Projektets overordnede formål er dels at bevare den immaterielle kulturarv, som dragt- og 

tekstiludtrykkene er, og dels at gøre udtrykkene og deres betydning tilgængelige for alle 

interesserede via en database på internettet. 


Tekstiludtryk er en vigtig kulturarv, som bør bevares. Nye generationer må kunne hente 

inspiration ikke kun i museernes tekstilsamlinger, men også i en videnbank med oplysninger 

om gamle tekstiludtryk. 

Museerne har i de senere år oplevet en stigende interesse for tidligere tiders dragter og 

tekstiler og dermed også for de udtryk, som knytter sig hertil. En orddatabase vil være et 

meget anvendeligt arbejdsredskab for alle, som beskæftiger sig med dette område, for 

eksempel håndarbejdsstuderende, universitetsstuderende, og forskere. Databasen vil også 

være til stor hjælp i museernes registreringsarbejde. Den vil sikre en mere ensartet 

terminologi, ligesom den vil være et vigtigt supplement til museernes arbejde med 

forespørgsler og formidling. Orddatabasen bliver en digital videnbank tilgængelig for alle, og 

den vil kunne give svar, hvor ordbøger og leksika i dag er utilstrækkelige. 

Arbejdsgruppen om ordbogen blev nedsat i 2004. Siden da har den arbejdet frem mod at 

registrere dragtterminologi, men da termer ændrer betydning over tid, betyder det f.eks. at 

kun folk over en vis alder vil kende det udgåede ord. Det er også planen at inkorporere andre 

projekter vedrørende historiske ord/termer inden for området dragt og tekstil i DK i det 

samlede arbejde. 

Et af målene med arbejdet er at registrere ud fra en præcis og autoriseret terminologi. F.eks. 

gælder det for termen giraftrusser at folk af en anden og yngre alder vil kende betegnelsen 

gamacher som et almindeligt udtryk, og nu ser vi alle betegnelsen leggings i stormagasiner 

og tøjforretninger. 

Fra starten ville arbejdsgruppen også have kildehenvisninger i orddatabasen, fordi det ville 

gøre den mere frugtbar som arbejdsredskab for alle. Dette niveau blev senere suppleret med 

et litterært niveau med citater, der bedre end mange forklaringer kunne vise den måde, 

termerne på et vist tidspunkt var blevet anvendt. Det ville kunne give dem både et tidsaspekt 

og et aspekt af termers brug i forskellige sociale niveauer og sammenhænge. 

Tidligt i arbejdet var der enighed om hvilke elementer der burde indgå i databasen: 

Dragtdele og dragtens enkelte elementer, materialer, teknik, historisk dimension, stil og de 

faglige tilgange. 

Men før det kunne realiseres var der mange debatter om struktur og eksperimenter med 

databasesystemer, der skulle gennemleves. Danmarks Center for Tekstilforskning på 


Københavns Universitet koordinerede arbejdsgruppens ønsker om databasens elementer. 

Hvad databasen skal have af muligheder, blev i Termplus Manager omsat til fire 

sammenknyttede baser med indbyrdes søgemuligheder. Det blev til følgende klassifikation af 

begreberne i dragt og tekstildatabasen: 

1) Tekstiler og fremstillingsteknikker 

2) Dragter og dragtdele 

3) Dekoration og dekorationsteknikker 

4) Talemåder 

Kilderne til termbasen er kendte museumsfolk og forskeres opbyggede seddelkartoteker af 

Margrethe Hald. Ellen Andersen, Erna Lorenzen og Else Østergaard. Arbejdet med ar 

gennemgå selve ordene er påbegyndt med udgangspunkt i Erna Lorenzens seddelkartotek, 

som er yderst grundigt og systematisk. 

Det er gruppens mål at gøre ordene aktive netop ved at lade dem være offentligt 

tilgængelige på internettet forsynet med kildebelagte ordforklaringer, variationsmuligheder i 

staveformer, systematisering i typer og et litterært niveau med citater, der placerer ordene i 

tid og sted. Det er også målet at alle ord skal forsynes med illustrationer – gerne fra de 

danske muséers samlinger. 

Her følger nogle eksempler på definitioner af tekstiltermer og hvordan grundbegreber inden 

for vævning optræder i arbejdet med tekstilterminologi. Der kommer også eksempler på 

synonymi og ortografiske varianter. 

Grundelementer for en vævning er 

Binding: Vinkelret krydsning af lodret gående (kæde/skudtråde) og vandret gående tråde 

(skud/islættråde) udført efter tælleprincip for hvilke tråde, der skal hæves og sænkes for den 

mest enkle binding kan fremkomme 


Bindingspunkt: Skuddet lægger sig ovenpå kæden eller går under, og der opstår derved en 

sammenfletning af to vinkelrette tråde. 

Rapport : mindste gentagelse af binding og dermed mindste gentagelsesenhed. 

Der findes tre grundbindinger og det er grundbegreberne i vævning og alt efter om man 

befinder sig i en håndværksmæssig eller industriel tilgang hedder de længdegående tråde 

trend eller kæde og de tværgående tråde islæt eller skud. 

Men så klar en skelnen er langtfra altid tilfældet i terminologi for feltet. 

De tre grundbindinger i vævning : lærred, kiper og satin kan også nemlig også betegnes: 

Lærred/toskaftsbinding 

Kiper/köper/kipper 

Satin/firskaftsbinding/atlask 

Traditionelt har terminologi som disciplin stræbt imod at undgå synonymi, men spørgsmålet 

er om det i en offentligt tilgængelig base er hensigtsmæssigt at reducere synonymi. Netop 

den brede skare af brugere af sådan en base ville have glæde af at kunne søge med 

ortografiske varianter som. f.eks. kiper/kipper eller med synonymi i skud/kæde eksemplet, 

der afspejler henholdsvis en industriel og en håndvæksmæssig sammenhæng. 

Termplus Manager systemet er derudover tilpasset til at kunne notere hvad der er den 

foretrukne term (t) og hvad der er synonym (s), sådan at der i en form for tragtmodel kan 

fremkomme en avanceret søgning med resultater med mange synonymer, men samtidig 

også en udvælgelse af den mest gængse term hvis en sådan findes. 

Derudover er det meningen, at der skal inddrages illustrationer i basen, som netop tydeliggør 

begreberne og medfører at lange tekstforklaringer ikke er 


så nødvendige. 

Et andet eksempel med synonymi er grundbindingen lærred: 

Definition: ”En av de tre grundbindingarna. Rapporten består av två varp- och två 

inslagstrådar. Varje inslagstråd går växelvis över en och under en varptråd.” 

Kilde: Nordisk Textilteknisk Terminologi, s. 44 

Svensk: tuskaftsbindning; lärftsbinding 

Norsk: toskaftsbinding, lærredsbinding 

Dansk:. toskaftsbinding, lærredsbinding 

Engelsk: tabby 

Fransk:. taffetas, toile 

Tysk: Leinwandbindung 

Lærred kan illustreres på flere måder og her kommer blot én af muligehderne 


FIGUR 1. 

En anden mulighed er en diagramform til at vise det binære symbol for hvordan en skudtråd 

går skiftevis over og under en kædetråd. På den måde bliver definitionen maskinlæsbar og 

kan bruges i computerprogrammer f.eks. som opskrift 

eller kan rejse over sproggrænser med en kode (værdi 0 eller 1). 

Der er en lang række afledninger af lærred, som alle har meget synonymi (panama, hopsack, 

reps etc.), men ved hjælp af. kodebrug fra f.eks standardiseringsnormen ISO 9354 bliver 

definitionen entydig uden brug af sproglige midler, og synonymi er derfor ikke så 

problematisk. 10 01010100 er koden for lærred i ISO normen 9354, og heraf er det første 

element bindingstype, det andet element er krydsningen af tråde, (kædetråde op eller ned). 

Det tredje.element er kædetrådenes gruppering (enkeltvis eller i gruppe) og endelig er det 

fjerde element springtallet for bindingen. 

Kipper/kiper/köper er den anden grundbinding, vi behandler. 

Definition 


En av de tre grundbindingarna, karakteriserad av att bindepunktarna för varje inslag 

förflyttas ett steg åt sidan och bilda diagonllinjer (da. Kipergraden, ty. Grate) i vävnaden. 

Rapporten består alltid av samma antal varp- som inslagstrådar, minsta antalet är tre. En 

kypert definieras med hjälp av siffror, vilkas summa ger rapportens trådantal. Första sifffran 

betcknar det antal inslagstrådar över vilka en varptrådar över vilka en varptråd flotterar. 

Andra siffran det antal inslagstrådar samma varptråd passerar under o.s.v. Ex: sv. Kypert 3/1, 

no. kypert 3/1, eng. 3/1 twill, ty. K 3/1 = fyrskafdad kypert med varpeffekt på den sida 

beskrivningen avser.” 

Eksempler: 

Svensk: Kypert, 

Dansk: Kiper, köper 

Norsk: Kypert 

Engelsk: Twill, 

Fransk: Sergé 

Tysk: Köperbindungg 

Kilde: s.32-33 i Nordisk Textilteknisk terminologi 


. 

FIGUR 2. 

Satin, atlask 

Den sidste grundbinding er satin og den vises her kun med to diagramformer, der tydeligt 

viser, at der her er springende bindingspunkter 

De afledte bindinger er ligeledes meget komplicerede at beskrive verbalt, så den non-verbale 

beskrivelse er her meget gunstig. 

Både kipper og satin er meget produktive til afledninger, hvilket betyder, at det er endnu 

mere vigtigt at kunne bruge en entydig kode og visuelle hjælpemidler også internationalt og 

over sproggrænser. 

Svensk Satin/Atlaskbindning 

Dansk Satin, atlask 

Norsk Sateng 

Engelsk Satin 


Fransk Satin 

Tysk Atlasbinding, Atlas 

Definition 

“En av grundbindingarna karakteriserad av att alla bindepunkter åtskiljas i alla riktningar av 

en eller flere varptrådar och ett eller flera inslag. Rapporten består alltid av samma antal 

varp- som inslagstrådar. Minsta antalet är 5. Är skridningstalet hela tidan detsamma, bildas 

skönjbara diagonaler i vävnaden. 

En satinbinding definieras genom att man anger: antalet varptrådar i rapporten = det antal 

skaft som fordras för vävningen samt bindningens skridningstal. Ex. sv. 5-skaftad satin med 

skridningstal 2, da. 5 skaftat satin med skridiningstal 2, no. 5 skaftet sateng med 

skridningstall 2, eng. 5-end satin, interruption 1, fr. satin de 5, interruption 1 eller 

décochement 2, ty. 5-binding Atlasbindung mit Fortschreitungszahl 2”. 

Kilde: Nordisk textilteknisk terminology, p. 49 


FIGUR 3. 

FIGUR 4. 


VÆVEEKSEMPLER I DE HISTORISKE DRAGTER 

Et eksempel på lærredsvævning til dragter i perioden 1600- er taboret og floret. 

“Taboret er en ulden toskaftsvævning med nuancerede smalle striber i kæderetningen, til 

tider med en ekstra lancerende mønskerkæde og ofte brocherede strøbuketter. Taboret er 

vidt udbredt til kvindetrøjer, skørter og kjoler. 

Der er en lærredsvævet bund og lanceret flerfarvet mønster og kæderetning. Tit findes tillige 

brocherede strøblomster. Det var ligesom calemank uldent og glittet og kom til kontinentet 

fra England. 

Sluteffekten var en glitning med vox og påfølgende presning, der gjorde tjet silkeagtigt blankt 

men temmelig stift. Der var mange variationer, som gav romantiske og salgsbare navne”. 

Kilde: Erna Lorenzen: Folks tøj: 1675-1850 

Floret: Silke (toskaftsvævning og væveteknik overført til silke). 

Sluteffekten var en glitning med voks og påfølgende presning, der gjorde tøjet silkeagtigt 

blankt men temmelig stift. Der var mange variationer som man gav romantiske og salgsbare 

navne: sirts, kattun, lærredscattung og sirtscattung mm.) 

Kipper: Drejlstøj som mere jordnært end satinvævning og ofte er det kraftigt bomuldstøj. 

(daldrejl og halvdrejl). Drejl har ofte mindre gentagen rapport. 

Damask (satin/atlask væve er en ensfarvet vævning i satindamask binding, hvor mønstret på 

den ene side står mat mens bunden da nødvendigvis bliver blank. Det er det skiftende spil i 

trådretningerne, som fremhæver mønstret. På den modsatte side er det mønstret, der er 

blankt, men bunden er mat. 

Egentlig stof fra Damaskus. Oprindelig kun af silke, senere også af uld, hør eller bomuld. 

Mønstervirkningen fremkommer ved vekselvirkning mellem kæde og skudeffekt. 

KONKLUSION 


Formålet med artiklen er at vise hvordan et tekstilterminologisk projekt kan gribes an og 

hvordan grundbegreberne i f.eks. vævning kan struktureres og klassificeres med forskellige 

former for definitioner , verbale som non-verbale. Med satin eller atlaskbinding – den sidste 

af grundbindingerne, som blev gennemgået i artiklen er det tydeligt at en non-verbal 

forklaring – et diagram, f.eks. letter forståelsen. 

En anden konklusion er at der kan være synonymi såvel som semantisk fleksibilitet for 

termer, og at det ikke behøver være noget der skal undgås i et fagleksikon. Det kan ligesåvel 

betragtes som en del af begrebsdannelsen som i de viste væveeksempler. 

Som afsluttende bemærkning vil jeg lade dragtpuljesekretær, museumsinspektør Tove 

Mathiassen fra Den Gamle By I Århus få ”ordet” : 

”I anledning af 200 året for H.C.Andersens fødsel arrangerede den Gamle by i Århus hvor TM 

arbejder en stor udstilling hvor mange af de hverdagsting som H.C.Andersen nævner i sine 

eventyr, var udstillet, f.eks. klodssko. 

Begreber fra eventyrene var illustreret med tingene, så publikum kunne gå på opdagelse. 

Ordene var ukendte for nutidens mennesker, velkendte for 1800- tallets. 

Det er et eksempel på hvordan et museum arbejder aktivt med de aspekter, som 

sprogudvalgets rapport ”Sprog til tiden” anfører: Sproget er først og fremmest noget, der 

lever i vores bevidsthed som et væsentligt mentalt organiseringsmiddel, som et redskab for 

tænkning og refleksion og som bærer af vores egen historie”. 

Ord er kulturarv som bør bevares og føres aktiv af mange grunde. Hvis vi skal kunne blive ved 

med at læse H.C.Andersen og anden skøn- eller faglitteratur på dansk eller forstå regnskab, 

skifter og andre slags skriftlige kilder. Samtidig har tekstilers produktion haft stor økonomisk 

betydning op gennem tiden. Derfor findes der vældig mange termer og begreber for dragt og 

tekstil. Med dette arbejde mener vi at de danske museers dragt og tekstilpulje kan være 

med til at bevare en immateriel kulturarv. En kulturarv som bidrager til at fastholde dansk 

som kultursprog”. 


References 

Lorenzen, E. (1975). Folks tøj i og omkring Århus ca. 1675-1850, Århus Universitetsforlag 

Andersen, E: (1960): Danske bønders klædedragt, Carit Andersens forlag, København 

Budin, G & Wright, S.E. (1997) S.E. Handbook of Terminology Management, Volume 1. John Benjamins 

Publishing Company, Amsterdam, Philadelphia. 

CIETA (1997) Vocabulaire français, allemand, anglais, espagnol, italien, portugais et suédois. Centre 

International d’Etude des Textiles Anciens, Lyon. 

Dury, P. & Lervad, S. (2008) : La variation synonymique dans la terminologie de l’énergie : approches 

synchronique diachronique, deux études de cas. LSP and Professional Communication, Vol. 8, No.2, pp. 

66-79 

Dury, P & Lervad S. : Synonymic Variation in the Field of Textile Terminology: A study in Diachrony and 

Synchrony in proceedings ”Textile terminologies from the explorative seminar at Centre of Textile 

Research at the University of Copenhagen. March 2009 (coming soon) 

Geier (A), Hald (M), Hoffmann, Strömberg (1979): Nordisk tekstilteknisk terminology : ”Förindustriell 

vävnadsproduktion”, Oslo 

ISO 9354, (1989) Weaves,Coding systems and examples, case postale, 56, CH-211 Geneva, Switzerland. 

, 

Lervad, S. (1999) Les éléments graphiques dans la terminologie des textiles. LSP and Professional 

Communication, Vol. 22, No.2 (48), pp. 38-47 


Lervad, S. (1998) Analyse comparative de trois ouvrages de lexicographie spécialisée dans le domaine 

de textiles concernant les définitions comme rerésentation de connaissances. In La banque des mots, 

N.8 spécial, Qualité et terminologie. 

Nordisk Textilteknisk terminologi (1967) Vävnader med de engelska, franska och tyska paralleltermer 

enligt C.I.E.T.A , Terminologie textile, tissus, danois, norvégien, suédois, anglais, français ; allemand,, 

Lyon 


Arbeid med nordiske termer i språkteknologi 

Torbjørg Breivik 

Språkrådet, Norge 

Abstract. Å sørge for at ny teknologi blir lansert på eget språk, er viktig for et lands 

språkpolitikk. Hvilket språk som brukes i de nye produktene og tjenestene vi nå får, har 

betydning for hvem som kan benytte dem. Det forventes at vi alle skal bli aktive og kompetente 

borgere i kunnskapssamfunnet, og det er et språkpolitisk spørsmål om et samfunn vil gjøre den 

innsatsen som kreves for at borgerne skal bli det, bl.a. gjennom at de får se og bruke sitt eget 

språk i teknologien også. Forslaget om å etablere et nordisk prosjekt for å arbeide med 

språkteknologiske termer må sees lys av framveksten av kunnskapssamfunnet. Arbeidet med å 

utvikle og standardisere språkteknologisk terminologi for de nordiske språkene er tiltak innenfor 

rammene av en aktiv nordisk språkpolitikk. 

HISTORIKK 

Nordisk ministerråd bevilget i 2000 midler til et femårig nordisk språkteknologisk 

forskningsprogram. Programmet kom i gang fra 2001 og Nordisk 

Forskeruddanningsakademi (NorFA) administrerte programmet. For å få størst mulig 

effekt av programmet oppfordret man til å søke samarbeid på tvers og samarbeid med 

prosjekter som alt var i gang. Det ble bevilget penger til å etablere nasjonale 

dokumentasjonssentre for å lette tilgangen til informasjon om hvilke 

språkteknologiske prosjekter som var i gang hvor, hvem som arbeidet med dem, 

hvilken kompetanse fantes hvor osv. Arbeidet med dokumentasjonssentrene ble 

koordinert av Center for Sprogteknologi i København og gikk under forkortelsen 

NorDokNet. 

Det ble opprettet ett nordisk nettsted og flere nasjonale nettsteder. Nettstedene ble 

strukturert etter samme mal som gjorde det lett for brukerne å finne samme type 

informasjon på alle sidene, selv om utformingen varierte. Flere av deltakerne i 

NorDokNet underviste i språkteknologiske emner på sine respektive institusjoner, og 

de hadde sett behovet for en nasjonal, ikke-engelsk fagterminologi. Det fantes en del 

terminologi tilgjengelig på andre språk, og noen hadde laget oversettelser til eget bruk, 

men det fantes ikke standardiserte, kvalitetssikrede termer på noen av de nordiske 

språkene. At det ikke finnes gode termer og godt fagspråk på de nordiske språkene, er 

ikke spesielt for språkteknologi. Men skal man utvikle faget og rekruttere nye 

studenter til fag som er i rivende utvikling, og som har stor innvirkning på 

hverdagslivet til folk flest, er det viktig at rekrutteringen ikke hindres av et haltende 

fagspråk. Når produktene og tjenestene skal tas i bruk, er det viktig at tekst og tale 

som ligger i dem, er forståelig og på det språket brukeren behersker. 

NorDokNet startet arbeidet med terminologien mot slutten av perioden for 

forskningsprogrammet, og meningen var at de nasjonale dokumentasjonssentrene 

skulle arbeide videre i egen regi. Man tok utgangspunkt i en kort, flerspråklig liste 

med 41 termer som skulle oversettes til de nordiske språkene. Listen ble oversatt til de 


nordiske språkene og hadde engelsk som nøkkelspråk. Det fantes også tyske og 

nederlandske termer i lista. Det skulle så skrives forklaringer til termene og helst også 

utarbeides definisjoner for dem. 

Deretter skulle listen utvides. Et moment som kom til mot slutten av arbeidet i 

NorDokNet, var at en standardisert liste over termer på flere språk, kan brukes i 

flerspråklig søking, og dette ble det eksperimentert litt med. Eksperimentet ble 

videreført i prosjektet Nordisk nettordbok /Tvärrsøk som ble avsluttet i 2007. 

De fleste dokumentasjonssentrene ble lagt på vent da pengene fra 

språkteknologiprogrammet tok slutt, men noen har arbeidet videre med termlisten. 

Arbeidsgruppa for språkteknologi i Norden (ASTIN) inviterte til diskusjoner om 

muligheten for å gå videre med utvikling av en nordisk språkteknologisk terminologi 

på en workshop under Nordterm 2009. Diskusjonene viste at det er interesse for, og 

ønske om, å etablere et nordisk prosjekt, og ASTIN har tatt mål av seg å få dette til. 

EUROPEISKE STANDARDER OG RESSURSER 

I forbindelse med terminologiarbeidet i NorDokNet undersøkte vi hva som fantes 

av standardisert språkteknologisk terminologi på andre språk. På Internett fant vi noen 

lister og samlinger av termer. Kvaliteten viste seg å variere ganske mye. Det ble raskt 

klart at det ikke fantes noen ISO-standard som dekker fagområdet selv om noen ISOstandarder 

har med termer som også er relevante i språkteknologi. En liste vi 

undersøkte nærmere, var LT-worlds (www.lt-world.org). Den ble laget av DFKI i 

Tyskland, og viste seg også å være av variabel kvalitet 1 

. NorDokNet tok kontakt med 

DFKI og andre miljø i EU som arbeider med språkteknologi og de mente det kunne 

være en god ide å standardisere termene. Det ble skrevet en søknad til EU om 

etablering av et nettverk som kunne arbeide med dette, uten at det førte fram. Det 

finnes materiale fra andre EU-prosjekt som i noen grad har beskjeftiget seg med 

terminologi for språkteknologiområdet, og et prosjekt man bør se mer på, er 

EAGLES/ISLE Meta Data Initiativ. 

SPRÅKTEKNOLOGISK SATSING I DET NORDISKE 

SAMARBEIDET 

I perioden 2003 – 2008 satset Nordens språkråd og Nordisk ministerråd mye på 

språkteknologi, og bevilget midler til flere større prosjekt utover satsinga i det 

nordiske språkteknologiprogrammet. Det ble bl.a. bevilget penger til en islandskdansk 

idiomatisk ordbok som benyttet språkteknologiske metoder, en nordisk 

nettordbok ble utredet og et prosjekt satt i gang, en nordisk språkportal ble utredet og 

det ble utformet en strategi for hvordan Norden kunne bli en foregangsregion for 

språkteknologi (Vismannsrapporten SpråkVis 2007). Nordens språkråd så hvor viktig 

det var at språknemndene har en aktiv holdning til de språkpolitiske sidene av 

teknologiutviklingen ved å være pådriver for å bruke eget språk i de nye produktene 

og tjenestene. Helt sentralt sto bevisstheten om at de nordiske språkene, - ikke 

1 Listen er ikke lenger tilgjengelig på nettsiden. 


engelsk, skulle være de primære språkene i språkteknologiske produkter og tjenester 

for det nordiske markedet. Denne oppfatningen delte politikerne i Nordisk råd og i 

Ministerrådet. Den nordiske språkdeklarasjonen ble vedtatt på Nordisk råds sesjon 

høsten 2006, og i diskusjonen understreket flere av innlederne at en aktiv 

språkpolitikk, inkludert satsing på språkteknologi, er avgjørende for at de nordiske 

språkene også i framtida skal beholde sin posisjon som samfunnsbærende språk. 

Språknemndenes prioritering av språkteknologien i perioden 2003 – 2008 viste igjen i 

prioriteringer i programmene for formannskapene i Nordisk råd og Nordisk 

ministerråd gjennom flere år. 

Hvor står den språkteknologiske satsinga i det nordiske samarbeidet i 

dag? 

I inneværende år (2009) har Island formannskapet i Nordisk råd. I programmet for 

formannskapet står det lite om språk og språkteknologi. Språknemndene i Norden 

samarbeider gjennom et nettverk, og satsingen på språkteknologi vises bl.a. gjennom 

at nettverket har en egen gruppe for samarbeidet på dette området (ASTIN). 

Nettverket har sørget for penger til arbeidsgruppens virksomhet, og aktiviteten har 

vært stor etter opprettelsen i 2005. Gruppen har organisert arbeidsseminarer om 

utvalgte emner i språkteknologi der både innledere og deltakere har vært invitert med 

tanke på tettere samarbeid mellom forskere og kommersielle aktører. Gruppen har 

også arrangert workshops i tilknytning til relevante konferanser som de nordiske 

datalingvistikkdagene (NoDaLiDa) og Nordterm. Nordisk råd og Ministerrådet har 

ikke lenger egne prosjekter innenfor språkteknologi. På begynnelsen av 2009 etablerte 

Ministerrådet en ekspertgruppe for språk som avløste Nordens språkråd. Mandatet for 

ekspertgruppa ble dreid i retning undervisning og nabospråksforståelse, og det er ikke 

kjent om noen av medlemmene i ekspertgruppa er opptatt av språk og språkteknologi. 

Ministerrådet ønsker å bedre koordineringen mellom områder som grenser inn mot 

hverandre, og har opprettet en nordisk språkkoordinatorfunksjon for å ivareta dette. 

Nettverket for språknemndene i Norden skal heretter få sine midler gjennom 

koordinatoren, og det er vedtatt en arbeidsplan for de to årene prosjektet skal vare. 

Enkeltprosjekter i språkteknologi er tatt med på planen, og det gjenstår å se hvor stort 

gjennomslag språknemndene får for denne delen av språkpolitikken. 

Terminologi og standardisering på nordisk nivå – hvorfor? 

I hvert av de nordiske landene har språknemndene i varierende grad oppgaver som 

grenser inn mot terminologiarbeid. I Sverige har de et eget organ som arbeider med 

terminologi, mens Språkrådet i Norge fra 2009 har fått ansvaret for fagspråk og 

terminologi. Språkrøkt og arbeid med terminologi og fagspråk henger tett sammen. 

Fagområdet språkteknologi er nytt, men mye av det terminologiske grunnarbeidet som 

må gjøres, er det likt uavhengig av fag. 

Universiteter i Norden tilbyr undervisning i språkteknologiske emner, og i 

næringslivet foregår mye forskning og produktutvikling, men fagspråket som brukes, 


er engelsk. Det vil være en styrke at et termprosjekt i faget språkteknologi er nordisk: 

man får flere å diskutere med og man får et enhetlig fagspråk i hele Norden. Det er få 

kurs og utdanningstilbud på området og en samordnet terminologi kan gjøre det lettere 

for studenter å ta kurs andre steder i Norden. Næringslivet kan få tilgang til fagtermer 

for alle de nordiske språkene de ønsker å utvikle tjenester og produkter for i stedet for 

å si at de har bare engelsk tilgjengelig. Terminologi som standardiseres er nyttig å ha 

for alle fagområder. At termene samtidig gjøres flerspråklige, vil ha betydning for 

utvikling av tjenester som flerspråklig søking og maskinstøttede oversettelser. 

Globaliseringen krever mer og mer oversettelse mellom språk, muntlig som skriftlig, 

og med engelsk som nøkkel i bunnen, vil dette blir nyttige ressurser i mange typer 

prosjekter. 

ASTIN ser behovet for å få nordiske terminologiprosjekter som en viktig del av sin 

virksomhet, og vil utarbeide en prosjektplan i nært samarbeid med relevante miljø i de 

nordiske landene. Det er viktig å bygge på materiale som finnes, vurdere og 

kvalitetssikre dette og deretter se hvilke delområder i språkteknologien man bør gå 

videre med. Forslaget fra ASTIN vil være at man etablerer en prosjektgruppe med en 

representant fra hvert land. I prosjektgruppen må det være ekspertise i 

terminologiarbeid kombinert med ekspertise i språkteknologi. Det kan være nyttig 

med en større referansegruppe for å sikre kvaliteten og en faglig konsensus i miljøene 

i Norden. Næringslivet bør være representert i alle fall i referansegruppen. 

NORDISK SPRÅKBANK 

Språkene i Norden har få brukere sammenlignet med f.eks. engelsk. Markedet i 

Norden teller vel rundt 25 millioner mennesker, men disse er delt opp i mange 

forskjellige språkgrupper. Kunnskapssamfunnet betyr at nye produkter og tjenester 

utvikles raskt og tas i bruk raskt. Muligheten for fortjeneste på salg av produktene går 

ned med antall brukere som kan tenkes å ta dem i bruk. Ved at myndighetene stiller 

krav om bruk av nasjonalspråket og legger til rette for at forskningsmiljø og 

kommersielle interesser får tilgang til språkressurser på nasjonalspråket, blir det mulig 

å gjennomføre i praksis den vedtatte språkpolitikken. I den nordiske 

språkdeklarasjonen er språkteknologi grunnlaget for to av de fire sakene man vil 

arbeide med for å oppnå målene man har satt seg når det gjelder språkforståelse og 

språkkunnskap: utarbeide internordiske ordbøker i elektronisk format og utvikle 

maskinoversettelsesprogrammer for Nordens samfunnsbærende språk og flerspråklige 

søkeprogrammer. I de nasjonale språkpolitikkene står tilsvarende formuleringer, 

gjerne sterkere, og dette støtter opp om prosjekter som det å utvikle nordiske 

termressurser. SpråkVis-rapporten som ble lagt fram for Nordisk råd i 2007, 

framhever de mulighetene Norden har for å bli ledende på språkteknologiområdet. 

Samlet har man i Norden bred kompetanse og store muligheter for dette, og som en 

del av satsingen, ser man for seg en nordisk språkbank der man samler språkressurser 

(som f.eks. termbaser) og verktøy for de nordiske språkene. 

INTERNASJONALT SAMARBEID – FlaReNet + CLARIN 


Arbeidsgruppa for språkteknologi i Norden (ASTIN) følger med i det som skjer 

internasjonalt på området språkteknologi, inkludert arbeid som foregår på 

terminologiområdet. Medlemmene av gruppa deltar aktivt på konferanser med innlegg 

og i debatter, deltar i internasjonale nettverk som FlaReNet og CLARIN, arrangerer 

egne konferanser og initierer (og arrangerer) workshops på andres konferanser. 

REFERANSER 

Deklaration om nordisk språkpolitik, Nordisk ministerråd, 2006 

Nordisk sprogteknologi, årsmeldinger 2001-2005, NorFA. 

SpråkVis, Expert Panel report: The Nordic Countries – A Leading Region in Language Technology, 

edited by Koskenniemi, Kimmo, Lindén, Krister and Nordgård, Torbjørn, utarbeidet på oppdrag av 

Nordens språkråd og levert Nordisk råd i 2007. 

Språkteknologisk infrastruktur i Norden, ASTIN-rapport fra et arbeidsseminar, Gøteborg 2006. 

Benchmarkundersøgelse af den sprogteknolgiske udvikling i Europa, EUROMAP-undersøgelsen, Rose 

Locwood og Andrew Joscelyne, København 2003. 

Samling og tilgjengeliggjøring av norske språkteknologiske språkressurser, Norsk språkråd 2002. 


Forskningsbegreber og Terminologi 

Peder Olesen Larsen a b 

and Bodil Nistrup Madsen 

a Kemisk Forenings Nomenklaturudvalg, pol@webspeed.dk 

b DANTERMcentret, Copenhagen Business School, DK-2000 Frederiksberg, 

bnm.danterm@cbs.dk 

Abstract. I forskningen har kommunikation, publikation og diskussion været central i mange 

hundrede år. På mange forskningsområder er der opbygget en omfattende systematik og terminologi. 

Men for forskningen selv er terminologien ikke gennemarbejdet og klar. En af grundene er måske, at 

forskerne i en vis forstand er anarkister, som vil gøre, hvad der passer dem uden at skulle klassificeres. 

Der er en løbende diskussion om forskning og forskningspolitik. Forskningen er også selv 

genstand for forskning og for måling. Det har ført til en lang række forskningsbegreber, men ikke til 

klare og brugbare definitioner af disse og ikke til, at brugerne er enige om, hvad begreberne står for. 

FORSKNING VS. VIDENSKAB 

Lad os starte med selve ordet forskning. Det findes på dansk, norsk og svensk. 

På finsk har vi tutkimus. Et tilsvarende ord findes på hovedsprogene, om end det 

engelske research er blevet så udvandet, at der i dag tales om scientific research. 

Vi har også ordet videnskap, som igen findes på dansk, norsk og svensk, og 

hvor finsk har et tilsvarende ord, tiede. Vi har Wissenschaft på tysk, men der er ikke et 

tilsvarende ord på engelsk og fransk. Der har vi science, som både kan stå for 

naturvidenskab og i bredere betydning omfattende en række underbegreber, for 

eksempel medical science, natural science, social science og technical science. 

Humaniora hører ikke under science på engelsk, hvorimod fransk har begrebet 

sciences humaines. 

Denne forskel, som vi kan betegne forskellen mellem den 

kontinentaleuropæiske tradition og den anglo-amerikanske tradition, giver problemer 

blandt andet i forskningsstatistik. 

Vil det være korrekt at sige, at videnskab og science angiver områder, mens 

forskning angiver en proces? I så fald hvad betyder det så, at det danske 

forskningsministerium i 2001 skiftede navn til Ministeriet for Videnskab, Teknologi 

og Udvikling. Videnskab angiver et område, mens forskning og udvikling naturligvis 

angiver processer. Teknologi kan stå for den videnskab, som undersøger og udvikler 

metoder til brug i den private og offentlige sektor. I så fald er teknologi et område på 

linie med videnskab eller et delområde under videnskab. Teknologi kan imidlertid 

også stå for (avancerede) metoder på alle områder i det moderne samfund. I så fald er 

teknologi et middel. Ministeriet arbejder med eller for udvikling af teknologi og for 

udbredelse eller anvendelse af ny teknologi. Hvordan det så er, er de tre betegnelser 

for ministeriets arbejdsområde ikke sidestillede begreber. 


GRUNDFORSKNING VS, ANVENDT FORSKNING 

Lad os derefter se på de mange forskningsbegreber. De hyppigst brugte er 

grundforskning og anvendt forskning, (Larsen 2003). 

Ordet grundforskning er overraskende nyt i det danske sprog. Det er først i 

1946 registreret anvendt. 

Inden da talte vi om ren forskning og fri forskning. I dag tales der ikke om ren 

forskning, men det betegnede det samme som nutidens grundforskning. Fri forskning 

var noget andet end grundforskning. Fri forskning var forskning, som ikke var 

underlagt begrænsninger udefra, specielt forskning, som ikke var underlagt 

begrænsninger eller indflydelse fra kirken. Fri forskning kunne både være 

grundforskning og anvendt forskning. 

Begrebet anvendt forskning har været i brug længe, men det har tidligere været 

brugt til at beskrive anvendelse af forskning, ikke en særlig slags forskning. Det er helt 

i overensstemmelse med Pasteurs opfattelse, udtrykt i det klassiske citat fra 1871: 

Nej, tusinde gange nej, der findes ikke en del af forskningen, til hvilken 

man kan give navnet anvendt forskning. Der er forskning og anvendelser 

af forskningen, sammenknyttede lige som frugten hører til det træ, som 

bærer den. 

(Non, mille fois non, il n’existe pas une catégorie de science auxquelles 

on puisse donner le nom de sciences appliqués. Il y a la science et les 

applications de la science, liées entre elles comme le fruit a l’arbre qui 

l’a porté). 

I dag er den almindelige opfattelse, at grundforskning og anvendt forskning er 

to forskellige ting. Skellet anvendes verden over i forskningsstatistik. I den danske 

forskningsstatistik angives således: 

Grundforskning er originalt eksperimenterende eller teoretisk arbejde 

med det primære formål at opnå ny viden og forståelse uden nogen 

bestemt anvendelse i sigte. 

Anvendt forskning er ligeledes originale undersøgelser med henblik på at 

opnå ny viden. Den er primært rettet mod bestemte praktiske mål. 

I forskningsstatistikken er forskning enten det ene eller det andet. Der skelnes i 

praksis. Samtidig er der en omfattende international litteratur, som sætter 

spørgsmålstegn ved den traditionelle skelnen mellem grundforskning og anvendt 

forskning. Er det i realiteten forskningsstatistikken, som fordeler mellem to kasser og 

derved bestemmer, hvad der er grundforskning og hvad der er anvendt forskning? Sker 

det på trods af, at der er gode grunde til at tro, at meget hører hjemme i begge kasser 


og måske også, at det er lidt tilfældigt, hvad der kommer i hvilken kasse? De to 

begreber anvendes ikke i databaser og søgemaskiner. 

STRATEGISK FORSKNING VS. FRI FORSKNING 

I de sidste 25 år er begrebet strategisk forskning kommet på banen. Det kan 

defineres på følgende måde: 

Strategisk forskning er offentligt tilgængelig forskning inden for fag eller 

teknologier, hvor det er vigtigt at have vidensberedskab og 

forskningspotentiale, og hvor der er udsigt til gevinst. 

Dermed angives, at der udefra gennem styring bliver lagt bånd på, hvad 

forskerne kan arbejde med opgaver, forskerne har valgt uden indflydelse udefra. 

Dermed angives det, at strategisk forskning er i modsætning til fri forskning. Der er 

imidlertid gode eksempler på, at fri forskning kan have stor betydning. 

Et godt eksempel er udviklingen af bioinformatik i Danmark. Vi kom i gang, 

fordi enkelte forskere så de store udfordringer og muligheder på området. De fik med 

stort besvær støtte til deres arbejde. Det viste sig imidlertid få år senere, at det var af 

stor betydning i Danmark, at vi var med i udviklingen. Vi ville på brede områder af 

biologien stå svagt, hvis ikke vi havde kompetence inden for bioinformatik. 

I 2005 blev den danske forskningsrådsstruktur ændret. De traditionelle 

fagorienterede forskningsråd blev afløst af Det Frie Forskningsråd og Det Strategiske 

Forskningsråd. Det betyder ikke, at vi har fået et forskningsråd for grundforskning og 

et forskningsråd for anvendt forskning. Det Frie Forskningsråd kan støtte anvendt 

forskning, blot forslaget til opgave kommer fra forskerne selv og ikke udefra. Det 

Strategiske Forskningsråd kan støtte grundforskning, hvis rådet finder, at der er et 

behov for at støtte dansk forskning på et bestemt område. 

DE MANGE SLAGS FORSKNING 

Hertil har vi kun talt om toppen af isbjerget. Der er en mængde andre 

forskningsbegreber på banen. En lille del af dem er anført i følgende tabel. Tabellen 

fortæller også, hvilke begreber der antages at være komplementære eller i modsætning 

til hinanden. Matematisk kan det udtrykkes ved, at de to mængder af forskning 

henhørende under de to begreber er disjunkte. Men opfører forskerne og dermed 

forskningen sig altid matematisk korrekt? 

Forskningsbegreb Komplementært begreb 

Grundforskning Anvendt forskning 

Målforskning 

Ren grundforskning Målrettet grundforskning 

Grundlæggende forskning 


Grundlagsskabende forskning 

Ren forskning 

Fri forskning Strategisk forskning 

Bunden forskning 

Nedefra og op forskning 

Oppefra og ned forskning 

Bottom up forskning 

Top down forskning 

Grundlagsskabende forskning 

Prækompetitiv forskning Ikke offentligt tilgængelig forskning 

Offentligt tilgængelig forskning 

Teoretisk forskning Eksperimentel forskning 

Skrivebordsforskning 

Multidisciplinær forskning Disciplinforskning 

Transdisciplinær forskning 

Tværfaglig forskning 

Tværvidenskabelig forskning 

Komplementære sæt må være baseret på inddelingskriterier. 

Et inddelingskriterium er, om forskningen er tilgængelig eller ej eller med 

andre ord om forskningsresultaterne bliver offentliggjort eller ej. 

Et andet inddelingskriterium beror på, hvem der finansierer forskningen. Der 

kan for eksempel skelnes mellem forskning betalt af det offentlige og forskning betalt 

af private virksomheder. 

Et tredje inddelingskriterium vedrører beslutningen om, hvad der skal forskes 

i. Bliver beslutningen herom taget af den enkelte forsker eller af en gruppe af 

samarbejdende forskere, eller bliver beslutningen taget af andre, for eksempel 

bevillingsgivere eller overordnede? Der er imidlertid tale om en kunstig modsætning. 

Megen forskning bliver ført ud i livet på grundlag af en samtale mellem nysgerrige 

forskere og personer udefra, som har ønsker til forskningen. 

Det er ikke altid muligt at fastlægge klare inddelingskriterier. Hvis det ikke 

blot skyldes metodisk uformåenhed, betyder det, at nogle af de opdelinger, vi bruger i 

daglig tale, ikke er opdelinger i disjunkte mængder, eller med andre ord at forskning 

kan både være det ene og det andet. 

Et godt eksempel er angivelsen af nysgerrighedsdreven forskning som en 

modsætning til målforskning. Forskere er stort set altid nysgerrige, også når de er i 

gang med målforskning. Hvis forskere ikke er nysgerrige, skulle de måske have fundet 

sig et andet erhverv. 

For to begreber i modsætning til hinanden melder også spørgsmålet sig, om de 

tilsammen dækker al forskning. Sagt mere præcist: Er fællesmængden af forskning 

henhørende under de to begreber identisk med grundmængden af al forskning, eller er 

der forskning, som ikke er omfattet af mindst et af de to begreber? 


BEGREBSSYSTEMER SOM GRUNDLAG FOR 

BEGREBSAFKLARING 

Terminologer anvender begrebssystemer (ontologier) til at fastlægge 

definitioner og afklare forskelle mellem begreber inden for et domæne (Madsen & 

Thomsen 2006). Begrebssystemer opbygges i et samarbejde med domæneeksperter, og 

har ofte til formål at fastlægge (standardisere) begrebers betydning, så de kan 

anvendes entydigt fx i forbindelse med statistikker. 

I figur 1 findes et lille udsnit af et udkast til et begrebssystem for 

forskningsbegreber. 

Figur 1: Udsnit af begrebssystem for forskningsbegreber 

På baggrund af informationerne ovenfor og begreberne i tabellen kan nogle 

inddelingskriterier foreslås uden problemer. For eksempel er det oplagt at foreslå de 

tre inddelingskriterier: SIGTE, EMNEVALG og TILGÆNGELIGHED. De to 

begreber, som adskiller sig mht. SIGTE, er grundforskning, som ikke sigter mod 

nogen bestem anvendelse og anvendt forskning, som sigter med en bestemt 

anvendelse. Begreberne fri forskning og strategisk forskning adskiller sig mht. hvem 

der foretager emnevalget, og begreberne prækompetitiv forskning (med synonymet: 

offentlig tilgængelig forskning) og ikke offentlig tilgængelig forskning adskiller sig 

mht. TILGÆNGELIGHED: hhv. offentligt tilgængelig og ikke offentligt tilgængelig. 

For andre begreber bliver det straks vanskeligere, at sætte dem ind i 

begrebssystemet under et inddelingskriterium. 

FLERE BEGREBER? 

Vi savner et vigtigt begreb, forskning rettet mod en profession eller med 

henblik på at give grundlag for fagfolks arbejde. Professionelle uddannelser er for 

eksempel lægeuddannelsen, farmaceutuddannelsen, psykologuddannelsen, 

ingeniøruddannelsen, og juristuddannelsen. Hvad har det med forskning at gøre? 


Professionerne er ikke opstået som produkter af videnskab. De har deres egne rødder. 

Mange er fra begyndelsen opfattet som håndværk. Vi taler den dag i dag om 

lægegerningen og lægekunst. Vi taler også om lægevidenskab eller medicinsk 

videnskab. Det er den videnskab eller forskning, som understøtter lægegerningen, det 

er ikke lægegerningen selv. Tilsvarende leverer ingeniørvidenskaberne den forskning, 

som understøtter ingeniørerne i deres arbejde. 

Vi savner også et vigtigt begrebspar, på den ene side forskning, som 

traditionelt udføres af enkeltpersoner og som ikke kræver samarbejde, og på den anden 

side forskning, som nødvendigvis må udføres i samarbejde. Det er tæt på opdelingen 

af forskningen mellem teoretisk forskning eller skrivebordsforskning og eksperimentel 

forskning, men der er ikke fuld overensstemmelse. Begrebsparret er vigtigt for at 

forstå, at der på det første område kan være en høj grad af individuel forskningsfrihed, 

mens der på det andet område kun er begrænset individuel forskningsfrihed, men til 

gengæld kan være forskningsfrihed for en gruppe forskere. 

BEHOV FOR BEGREBSAFKLARING? 

Alle begreberne anvendes i den løbende diskussion om forskningen, og det må 

vi selvfølgelig acceptere. Vi må også i stor udstrækning affinde os med, at deres 

betydning kun kan udledes af en kontekst. Vi må se i øjnene, at begreberne anvendes 

forskelligt at forskellige deltagere i diskussionen. Samtidig er der dog grund til at 

erindre om, at mange uenigheder og konflikter her i verden skyldes, at ord bruges 

forskelligt af de stridende parter. 

Begreberne anvendes også i love, bekendtgørelser og anordninger med 

retsvirkning. Danmarks Grundforskningsfond er oprettet ved lov. Selv i vores 

skattelovgivning skrives der om grundforskning og anvendt forskning. Er det ikke en 

rimelig antagelse, at ord, der bruges i lovgivning, ikke må kunne misforstås? I hvert 

fald må begreber anvendt i lovgivning være præcise nok til, at det giver retssystemet 

mulighed for at fortolke love entydigt. 

Vi kan sikkert blive enige om, at de nuværende definitioner af 

forskningsbegreber ikke er præcise og nok heller ikke kan være det i en kompleks 

virkelighed. Men er det nødvendigt at gøre noget ved det, kan der gøres noget ved det, 

vil der være fordele ved at gøre noget ved det, og er der et ønske om at gøre noget ved 

det? 

Og endelig: 

Er der nogenlunde overensstemmelse i anvendelsen af begreberne mellem 

dansk, finsk, islandsk, norsk og svensk? Kan vi gøre noget i fællesskab? 


Referencer 

Larsen, Peder Olesen (2003): Forskningens Verden. Prydhave. Nyttehave. Vildnis. Aarhus 

Universitetsforlag. 

Madsen, Bodil Nistrup & Hanne Erdman Thomsen (2006). “Terminological ontologies in normative 

terminology work”. In: TSTT'06: Proceedings of the International Conference on Terminology, 

Standardization and Technology Transfer. Beijing: Encyclopedia of China Publishing House, 2006. 

p.122-133. 


KNowaboUT – A Work-In-Progress Study On 

How To Fruitfully Combine The Theories Of 

Terminology And Lexicography 

Lise Mourier and Birthe Vesterli 

Associate Professors, Department of International Language Studies and Computational Linguistics, 

Copenhagen Business School, Dalgas Have 15, DK-2000 Frederiksberg 

. Email: lm.isv@cbs.dk and bv.isv@cbs.dk 

Abstract. Traditionally, terminology and lexicography have been separate research fields with 

different approaches to compilation and presentation of lexical data. However, today LSP 

lexicography is utilizing many of the opportunities of modern technology with respect to data 

structure and presentation in electronic databases that terminology is traditionally drawing on, and 

thus the two fields seem to be converging. The Research Group for Terminology, Lexicography and 

Specialized Communications at the Department for International Language Studies and 

Computational Linguistic is therefore working at “A contrastive analysis of theories and methods 

within LSP lexicography and terminology with a view to developing principles for target-group 

oriented knowledge transfer”. 

The study intends to develop a new model for the creation of an LSP database targeted to a defined, 

heterogeneous user group. The objective is to find whether – and to which extent – a meaningful 

combination of the lexicographical and the terminological approaches in one single electronic 

database will provide added user value. We aim to build a database that embodies both concept 

systems and lexical articles with various data fields offering encyclopaedic as well as lexicalsemantic 

knowledge. The empirical subject-matter of the pilot project is selected concepts and terms 

within the domain of auditing in Danish, English (including international English and British 

English) and German. 

As a tool, the terminological management system i-Term will be used for compilation, analysis and 

presentation of concepts and terms as well as for experimenting with target-group oriented 

approached and determination of best practice. i-Term has been developed by DANTERM, the 

terminology centre at CBS. 

As the title suggests, the paper intends to present our pilot project, share it with conference 

participants and discuss our work at the initial stage and our findings so far. We shall present our 

challenges in compiling an appropriate text corpus within a delimited subject area (auditing), 

selecting relevant concepts, preparing concept systems, selecting user-needed data fields and 

clarifying advantages or barriers to the building of a multilingual database as well as our 

considerations in respect of phrasing appropriate definitions that will ensure establishing proof or 

lack of equivalence. All seen as important building blocks in our strive to design a well-structured 

database that includes both terminological and lexicographical data with the objective of creating an 

easily accessible and meaningful tool to the defined users. 


The Interface Between TERMINOLOGY and LSP 

LEXICOGRAPHY 

Traditionally, terminology and lexicography have been separate research fields 

with different approaches to compilation and presentation of lexical data. However, 

today LSP lexicography is utilizing many of the opportunities of modern technology 

with respect to data structure and presentation in electronic databases that terminology 

is traditionally drawing on, and thus the two fields seem to be converging. The 

Research Group for Terminology, Lexicography and Specialized Communications at 

the Department for International Language Studies and Computational Linguistic is 

therefore working at “A contrastive analysis of theories and methods within LSP 

lexicography and terminology with a view to developing principles for target-group 

oriented knowledge transfer”. 

The study intends to develop a new model for the creation of an LSP database 

targeted to a defined, heterogeneous user group. The objective is to find whether – and 

to which extent – a meaningful combination of the two research methods of 

terminology and LSP lexicography in one single electronic database will provide 

added user value and create further opportunities for target-group knowledge transfer. 

Therefore, we aim to build a database that embodies both concept systems and lexical 

articles with various data fields offering encyclopaedic as well as lexical-semantic 

knowledge. 

Our project 

The first step is a pilot project whose empirical subject-matter will focus on 

selected concepts and terms within the domain of auditing in Danish, English 

(including international English and British English) and German. This paper intends 

to present our pilot project and discuss our work at the initial stage as well as our 

findings so far. The research project will include the following steps: 

(1) a contrastive analysis of the selected concepts and terms within the domain of 

auditing in Danish, English and German; 

(2) experimental work concentrated on combining terminological, lexicographical 

and encyclopedic information types and data structures; and 

(3) the development of principles and models for target-group oriented knowledge 

transfer. 

As a tool, the terminological management system i-Term will be used for 

compilation, analysis and presentation of concepts and terms as well as for 

experimenting with target-group oriented approached and determination of best 

practice. i-Term has been developed by DANTERM, the terminology centre at CBS. 

A spin-off of the research work will be an easily accessible resource containing up-todate 

terms and knowledge within the area of auditing. This resource will be an 

invaluable tool both internally for CBS students and lecturers, and externally for 

language and communications professionals, experts and decision-makers in business 

enterprises navigating in a global business environment subject to ever-changing rules. 

Furthermore, the project will be the basis for new inspiration and ideas for the 

development of i-Term and thereby terminological management systems. 


Hypothesis 

Our starting point in the project work is the hypothesis that by drawing on the 

theories of both terminology and LSP lexicography it is possible to build a state-ofthe-art 

LSP database in which all information needed by a diversified user group is 

structured and presented in a clear and easily accessible form. 

The definition of the target group is important: we want to offer a heterogeneous 

user group an electronic, multilingual LSP database catering to the greatest possible 

extent for the specific needs of such a group, well aware that such needs may indeed 

be diverse. We have chosen to highlight semi-professional users (e.g. translators), but 

at the same time cater for experts (e.g. auditors and accountants) and, lastly, laymen. 

This means creating a multi-functional database that is both communicative and 

knowledge oriented. What can terminology, an electronic database and LSP 

lexicography each offer to create added value? 

Terminology 

Let us first look at terminology: For the purpose of our project, the terminology 

method will be the knowledge base approach (Madsen, Thomsen and Vikner (1999)). 

This approach uses the term terminological ontology as synonym to the term concept 

system, which is normally used in terminology work. Terminological ontologies are 

knowledge-enriched, meaning that – compared to other types of ontologies – they will 

comprise richer semantic information, i.e. formal specifications of both concept 

relations and characteristics that may form the basis for (semi)-automatic positioning 

and consistency checking. 

Clarification of concepts is a prerequisite to achieving precise definitions and 

adequate choice of equivalent in the target language. Concept definitions are written 

on the basis of concept relations and characteristic features. Only one term is chosen 

as the preferred term. However, synonyms may be registered as terms 2 or 3 etc. to 

help users. Building the concept system based on the characteristic features of the 

concepts will ensure correct mapping of the concepts and prove their interrelations: 

subordinates will inherit characteristics from their superordinate concept etc. This 

structure enables precise definitions that are brief and to the point: they take the 

superordinate concept as a starting point and add the delimiting feature(s). The 

inherited features are implicit and need not be repeated, but will of course require user 

knowledge about the superordinate concept, based on orientation in the concept 

system. It is obvious that concepts suitable for this approach are primarily nouns, 

however, verbs and other word classes may be included in the concept system by way 

of associative relations. Polysemy does not offer any challenge when building a 

termbase based on a concept system: polysemous terms are only relevant to include if 

they belong to the same domain as the other concepts in the ontology; if not, they do 

not belong in the termbase in question. 


The Electronic Database 

The second value-adding element is the electronic database. In fact, this tool 

constitutes the foundation that will make building the multi-functional database 

feasible. First of all, the electronic medium is open-ended which means that there is no 

limit to the amount of data included. As many data fields as appropriate can be 

included. Users may jump from one data field to another, even between several 

articles or databases on line. Lastly, and not least important, the data included are 

easily and continuously updatable and extendable. In short: an electronic database 

provides database builders with space and speed, features that mean a wide step 

forward in the compilation, presentation and use of lexical data. This leads us to the 

third important research area: LSP lexicography. 

LSP Lexicography 

Lexicography is the science of dictionaries, and the products of lexicography are 

dictionaries. Originally, lexicographic theory was seen as part of linguistics, and 

dictionaries as reference material mapping the vocabulary of language. Later research 

(covered by lexicographers and researchers such as Wiegand, Bergenholtz, Tarp, and 

Nielsen) sees lexicographic theory as a separate science based on the user and the use 

of dictionaries. As the object of lexicography is dictionaries, it makes sense to focus 

on dictionaries as tools with certain functions, i.e. the use of such dictionaries and their 

users. Modern lexicographical method focuses on determining the functions of a given 

dictionary based on the mapping of types of (1) users, (2) user situations, and (3) user 

needs (Tarp (2003:48)). 

The functional lexicography theory defines a dictionary as a lexicography 

reference work designed to fulfil one or more functions, to contain lexicographic data 

supporting the function(s), and to contain lexicographic structures that combine and 

link the data to fulfil the function(s) (Nielsen and Mourier (2007:121)). 

The function-based approach distinguishes between two main types of function: 

communication-oriented and knowledge-oriented functions. Communication-oriented 

functions focus on text reception in users’ native language (L1) or/and in a language 

foreign to users (L2), the translation of texts from/to L1 to/from L2, and the 

production, revision and editing of texts in either L1 or L2. Knowledge-oriented 

functions focus on acquiring information and deriving and verifying knowledge. This 

may be general knowledge about the L1 and/or L2, or about specific delimited subject 

areas in L1 and/or L2 (Nielsen and Mourier (2007:122)). 

A dictionary or termbase aiming at covering both the communication-oriented and 

the knowledge-oriented functions must therefore include a large amount of data in 

order to give answers to users needing the dictionary or termbase for both purposes. 

As pointed out by Nielsen and Mourier (2007:123-25), lexicographers compiling such 

a multifunctional dictionary need to find the best possible way of arranging the 

linguistic and informative data to facilitate user search. 

For the LSP dictionary applies that all word classes can be lemmatised. Lemmata 

are arranged in articles providing both linguistic and knowledge data – and certainly, 

as already mentioned, the electronic medium addresses the challenges of space and 


quick access to a high amount of data. Definitions are typically long: they are meant to 

delimit the L1 term and justify equivalence with the L2 term. Besides, they should 

also give users relevant background knowledge by providing encyclopedic data. The 

lexicographer may consider using extra data fields to provide useful linguistic 

information, e.g. concerning different meanings of the term in the singular and plural 

forms. Other fields can be used to inform users about synonyms, antonyms and other 

cross-references as well as source references, where appropriate – and these terms and 

references may be clickable so that they will instantaneously take users to the relevant 

term or external source reference. Polysemous terms are found under the same main 

article, where the equivalent to the term in question is provided according to the 

definition of that term. For English, users will need information if the English terms 

differ according to variety of English: international, US or UK English. Last, but not 

least important to the communication-oriented functions is the inclusion of 

collocations and text examples, preferably with translations between L1 and L2. 

THE ELECTRONIC INTERNET ACCOUNTING DICTIONARIES 

Examples of electronic dictionaries already moving in this direction are found in 

the interlinked English-English, English-Danish, Danish-Danish and Danish-English 

Accounting Dictionaries on the Internet (Nielsen, Mourier and Bergenholtz (2003- 

06)). They constitute advanced bilingual LSP electronic dictionaries with focus on 

heterogeneous users and their diversified needs. They provide communication- and 

knowledge-oriented (encyclopedic) data and offer a wide range of the advantages 

inherent in the electronic medium. 

Our empirical study 

The reason for selecting our empirical data within the domain of auditing is that 

just now this subject area is undergoing many changes both in content and 

terminology. Our focus will therefore be on the new international auditing and 

assurance standards that are being implemented nationally in EU member states, 

including Denmark. The national implementation process offers terminology 

challenges going from international English to e.g. Danish, and the study will 

therefore contribute to the identification of differences between English and Danish, 

and at the same time develop a new model for the constellation of knowledge and 

consequent transfer of this knowledge to target groups with different requirements. 

Our first step is to make a contrastive analysis of Danish and English concepts 

with particular focus on the new terminology of auditors’ engagements. The analysis 

will lead to the building of an LSP mini-database based on the methods of terminology 

and LSP lexicography and contribute to the verification or falsification of our 

hypothesis (see above). Later steps will be to include other languages such as German, 

French and Russian. 

Our LSP database intends to 

Our LSP Database 


provide precise definitions (building on concept systems (terminological 

method)) 

select adequate equivalents to concepts (building on these definitions) 

include linguistic and encyclopedic data (building on LSP lexicography) 

include collocations and text examples with translations (building on LSP 

lexicography) 

provide easy access to all data (building on both terminology and 

lexicograhy) 

and in this way seek to create added value to builders and users of termbases. 

The initial stage of our work has been the building of an appropriate text corpus 

for background knowledge: selecting legal texts, rulebooks, auditing and assurance 

standards as well as other valid, relevant auditing text material. The next stage has 

been concentrated on selecting relevant concepts (terms) for the database. Now, we are 

in the process of building the concept system. 

The first challenge we met with was deciding the subdivision criteria. It turned 

out that there is not one obvious criterion to apply on the first level, but a number of 

relevant options. The established possible subdivisions for auditors’ engagements are: 

assurance/conclusion is included or not included 

degree of assurance is high or limited 

statement by the responsible party is available or not available to the intended 

users 

issuance is voluntary or statutory 

subject matter concerns financial statements or other than financial statements 

user is the engaging party or not the engaging party only. 

Criteria 2 and 3 may indisputably be attributed as further subdivision criteria to 

criterion 1. Criterion 1 and criteria 4 to 6 exist side by side and lead to separate sets of 

concepts and terms focussing on different aspects of the superordinate. At the same 

time, some concepts exist as subordinates to several superordinates. If all these 

possible combinations are to be shown in a concept system unambiguously and 

according to the strict rules of terminology, it is necessary to introduce a multitude of 

non-lexicalised concepts. 

However, including a great number of such non-lexicalised concepts strains the 

potential of a conventional concept system to a great extent and makes the concept 

system close to chaotic, contrary to our wish for user-friendliness. Therefore, we 

decided to limit the number of non-lexicalised concepts to a minimum, thus 

simplifying the system. The first draft of such a simplified concept system is shown in 

Figure 1 below: 


FIGURE 1. Concept system of auditors’ engagements. Birthe Vesterli and Lise Mourier, CBS 2009. 


Another challenge is that in practice the same lexical item or term is sometimes 

applied to two different concepts at the risk of creating confusion or misunderstandings. 

A case in point is that the Danish term erklæringsopgave has been found to cover 

both the English equivalent engagement (with the synonym: auditors’ engagement) 

and the English equivalent assurance engagement. The latter English concept is also 

expressed with the Danish term erklæringsopgave med sikkerhed. Working with 

definitions and concept characteristics helps to clarify such ambiguity and leads to the 

building of a concept system showing erklæringsopgave both as a superordinate of 

erklæringsopgave med sikkerhed (assurance engagement) and beslægtet opgave 

(related service or non-assurance engagement) that are divided by the assurance 

criterion, and as a synonym to the subordinate concept of erklæringsopgave med 

sikkerhed (assurance engagement). 

Definitions should always start with the superordinate, since a subordinate 

concept inherits the characteristics of its superordinate (see the above section on 

Terminology). In casu erklæringsopgave med sikkerhed can be determined as: 

“erklæringsopgave, hvor revisor udtrykker en konklusion, der er udformet for at 

højne troværdigheden og øge graden af tillid til emnet for erklæringen over for de 

tiltænkte brugere af den pågældende information.” 

[engagement where the auditor provides a conclusion to increase the credibility 

and reliability of the subject matter of the report to the intended users of the 

information in question]. 

We have compared our findings with the lemma articles in the Danish-English 

Accounting Dictionary (Nielsen, Mourier, Bergenholtz: Den Dansk-Engelske 

Regnskabsordbog (2003)), which present erklæringsopgave and erklæringsopgave 

med sikkerhed, respectively, with the following definitions (excerpts): 

1. erklæringsopgave – assurance engagement 

Definition: 

En erklæringsopgave er en opgave, hvor en revisor afgiver en erklæring om et 

specifikt forhold vedrørende en virksomhed og derved optræder som en 

tillidsrepræsentant for offentligheden. Eksempler på erklæringsopgaver er 

revision af årsrapporter, erklæringer ved fusion, spaltning og kapitalnedsættelse, 

og erklæringer på opgørelsen af skattepligtig indkomst. 

[Translation: An assurance engagement is an engagement where the auditor 

expresses a conclusion on a specific matter concerning an enterprise and thereby 

acts as a public representative. Examples of assurance engagements are audits of 

annual reports, reports in connection with mergers, demergers or capital 

reduction and reports on income tax statements.] 

2. erklæringsopgave med sikkerhed – assurance engagement 

Definition: 

Erklæringsopgaver med sikkerhed er opgaver, hvor revisor afgiver en erklæring 

om et eller flere undersøgte forhold og udtrykker en grad af sikkerhed, som er 


passende afhængigt af, om der er tale om en opgave med høj sikkerhed, fx 

revision, eller en opgave med begrænset sikkerhed, fx review. 

[Translation: Assurance engagements are engagements where the auditor 

expresses a conclusion on the outcome of one or several matters investigated and 

expresses assurance, depending on whether the engagement is a reasonable 

assurance engagement, e.g. audit, or a limited assurance engagement, e.g. 

review.] 

When comparing the lemma excerpts with our findings, we established that the 

definition of erklæringsopgave (1) as the superordinate is correct. However, there are 

two problems: (a) There is no information that the term erklæringsopgave is also used 

in practice for the subordinate erklæringsopgave med sikkerhed, and more 

problematic: (b) the English equivalent (assurance engagement) refers to the 

subordinate instead of to the superordinate that is the lemma of this article – the 

correct equivalent referring to the superordinate is engagement (with the synonym: 

auditor’s engagement). 

The definition of erklæringsopgave med sikkerhed (2) is also correct. However, this 

lemma article might have helped the user by including a comment field with the same 

information as under (a) above. 

The above example proves that the terminological approach adds value to LSP 

lexicography and will lead to the correct choice of equivalent. 

CONCLUSION 

Our findings are that adding definitions to an LSP dictionary improves user value, 

but only the terminological method will ensure precise mapping of concepts/terms so 

that full equivalence between terms in different languages may be achieved. This 

proves that terminology is a valuable contribution to LSP lexicography. However, the 

inclusion of all possible concept variants in a concept system will complicate the 

system and necessitates a multitude of non-lexicalised concepts that users neither 

know nor need to know. Therefore, builders of concept systems may have to give 

priority to user-friendliness rather than to the strict application of the terminological 

method. 

LSP lexicography can contribute values to terminology as a terminological 

database will profit from including additional communicative and knowledge data to 

the database by way of adding data fields with such information. 

An electronic LSP database of the quality we want to offer can only be established 

by drawing on the terminological method. 

PERSPECTIVE 

Our next step is to focus on the LSP lexicographical method and how to present 

lexicographical data such as collocations and text examples in our database articles. 

We shall then proceed to work with the structure of concept articles in a multilingual 


ase and provide extra definitions addressed to a heterogeneous user group (semiexperts 

and laypeople). We will also work with the presentation of easily retrievable 

(clickable) data fields with a view to finding the optimum structure of a multilingual, 

electronic LSP database catering for the specific needs of many users. 

REFERENCES 

Bekendtgørelse om godkendte revisorers erklæringer (erklæringsbekendtgørelsen). Nr. 668 af 26. juni 

2008. I: Lovtidende A. 

Dansk Standard (1998). DS 2394.1: Leksikalske datasamlinger. Indholds- og strukturbeskrivelse. Del 1: 

Taksonomi til klassifikation af oplysningstyper. 84 pp. København. 

Erhvervs- og Selskabsstyrelsen (2009). Vejledning om bekendtgørelsen om godkendte revisorers 

erklæringer (erklæringsbekendtgørelsen) af 24. marts 2009. 

Foreningen af Statsautoriserede Revisorer (2006). Retningslinjer for revisorers etiske adfærd. (Etiske 

regler for revisorer). 

International Federation of Accountants (IFAC) (2008). Handbook of International Auditing, 

Assurance, and Ethics Pronouncements. Part II. Glossary of Terms. At: http://www.ifac.org. 

(downloaded March 2009). 

Lov nr. 468 af 17. juni 2008 om godkendte revisorer og revisionsvirksomheder (revisorloven). 

Nistrup Madsen, B. (1999). Terminology – Principper og Metoder, Bd. I, 231 pp., København: Gads 

Forlag. 

Nielsen, S., L. Mourier (2007). Design of a function-based internet accounting dictionary. Dictionary 

Visions, Research and Practice. Eds. H. Gottlieb & J.E. Mo gensen, Terminology an Lexicography 

Research and Practice. Vol. 10, pp. 119-135. Amsterdam/Philadelphia: John Benjamins Publishing 

Company. 

Nielsen, S., L. Mourier & H. Bergenholtz (2003). Den Dansk-Engelske Regnskabsordbog: 

www.Ordbogen.com. Design and layout: R. Almind, Aarhus: Centre for Lexicography. Also printed 

as: Nielsen, Mourier, Bergenholtz (2004). Regnskabsordbogen Dansk-Engelsk, Publ. Forlaget 

Thomson A/S, Copenhagen. 

Tarp, S. ( 2006). Leksikografien i grænselandet mellem viden og ikke-viden. Bd. 1 (2). 199 pp. 

Doktorafhandling. Aarhus: Center for Leksikografi. 


Ontology-based Triangulated Terminology 

Management 

Fumiko Kano Glückstad 

International Language Studies and Computational Linguistics 

Copenhagen Business School 

Dalgas Have 15, DK-2000 Frederiksberg, Denmark 

+45 3815 3335 

fkg.isv@cbs.dk 

Abstract. First, I demonstrate that there exist two types of transitive translations when name of a 

country specific Named Entity (NE) is translated from a source language to a target language in 

rare language combinations. The first type is human-based official transitive translation often 

having official English expression as inter-lingua. The second type is dictionary-based lexical 

transitive translation that is necessary in the process of directly translation from a source 

language to a target language in a rare language combination. Second, I argue about 

consequences created by the official- and lexical transitive translations in the context of Cross 

Lingual Information Retrieval. And finally, I propose a multilingual ontology solution referred 

to as a ontology-based terminology management. 

Keywords. Transitive translation, multilingual ontology, named entity disambiguation, 

terminology, cross lingual information retrieval 

INTRODUCTION 

My research issue has been raised by a question: Is it possible to identify local firsthand 

information produced in non-English speaking countries from Japanese queries 

translated from their official English information sources? Specifically, the issue is 

rooted in a plurality of inconsistencies found between Japanese translations made 

through the direct lexical translation from Danish to Japanese and Japanese 

translations made through the transitive translation using official English translations 

as source. A typical example of such a translation problem is illustrated where the 

formal English name of the Danish authority “Økonomistyrelsen” is “The Danish 

Agency for Governmental Management.” The Danish originated name, 

“Økonomistyrelsen”, will most likely be translated into a completely different 

Japanese expression through lexical English translations, “Economy Agency (keizaityou)” 

using available language resources such as Danish-English and English- 

Japanese dictionaries. Eventually, it becomes increasingly difficult for Japanese 

readers to identify the original Danish NE in the process of Cross Lingual Information 

Retrieval (CLIR) due to inconsistent Japanese translations. This type of problem is 


likely identified in rare language combinations consisting of non-English languages, 

especially less-similar language combination such as the EU- and the Asian language 

combinations. In this study, I will use the Danish-Japanese combination as an 

example. In this work, I describe the relevant researches on the transitive translation in 

the context of CLIR in chapter 2. In chapter 3, I report the preliminary survey of 

measuring frequency and inconsistency of the official- and lexical transitive 

translation of names of Danish NEs. Finally, I propose a multilingual ontology 

solution referred to as a triangulated terminology management approach in chapter 4 

followed by conclusion in chapter 5. 

OFFICIAL – AND LEXICAL TRANSITIVE TRANSLATION 

In CLIR, there are three types of basic methods in query translations: a) dictionarybased 

machine translation, b) corpus-based machine translation, and c) ontology based 

machine translation. The problem with a) and b) is that there is no sufficient language 

resource available for most language pairs that are part of rare combinations. Hence, it 

is required to employ a word-by-word lexical transitive translation technique using a 

pivot language. Gollins and Sanderson (2001) pointed out that, this technique 

increases the likelihood of translation errors, caused mainly by incorrect identification 

of the sense of ambiguous words. Ballesteros (2001) examined the impact of transitive 

translations and discovered that using simple word-by-word transitive translations 

from Spanish to French via English degraded performance by 91% when compared to 

direct bilingual translation from Spanish to French. Gollins and Sanderson (2001) 

introduced an approach to reducing errors by combining translations from two 

different transitive routes, a process known as lexical triangulation. Their results 

showed that the lexical triangulation approach to the transitive translation eliminated 

the difference in retrieval between transitive translated queries and equivalent direct 

translated queries. 

However, considering the aforementioned specific example of the Danish NE 

expression, “Økonomistyrelsen”, there are two types of transitive translation and the 

solution proposed by Gollins and Sanderson (2001) only addresses issues arisen from 

the lexical transitive translation. It means that it is necessary to distinguish the 

transitive translation using official English translation as inter-lingua from the lexical 

transitive translation. 

PRELIMINARY SERVEY 

In order to compare differences between official- and lexical transitive translations 

of original Danish NEs, I have selected names of Danish governmental organizations 

(ministries and institutions under the ministries) from web sites of the Danish 

ministries, most of which provide official English names of their organizations. For 

performing a lexical translation of the Danish names into English, I used one of the 

most popular Danish-English dictionary series in Denmark entitled “Gyldendals Røde 

Ordbøger”. Regarding the lexical translation, I defined the following rules: 1) names 


consisting of several words should be translated word-by-word; 2) If the dictionaries 

propose an English translation equal to the corresponding official English translation, 

the official English expression should be applied. Accordingly, I translated all of 70 

Danish names into English and extracted 26 English lexical translations that were not 

identical to the official translations. Since these English translations of Danish names 

are Multi-Word Expressions, I further decomposed them into each lexical unit (word) 

and enlisted the inconsistent word pairs that were scope for further inconsistency 

analysis. For comparing the inconsistencies of these word pairs, I used a semantic 

similarity measure based on a basic path length calculation provided on the web 

interface of the WordNet::Similarity (Pedersen et.al. 2004). The result showed the 

semantic distance in most of the inconsistent word pairs produced via official- and 

lexical English translations (Figure 1). That is to say, the similarity measures based on 

path length indicate the inconsistency level of English translations made through the 

official- and the lexical translation. 

beginning 

innovation 

Root* 

entity 

abstraction 

psychological_feature 

event 

act 

action 

change 

change_of_state 

improvement 

development 

Path length : 5 

Semantic Similarity: 1 / 5 = 0.2 

Root* 

entity 

abstraction 

psychological_feature 

event 

act 

activity 

work 

investigation 

research 

12 

1 / 12 = 0.0833 

FIGURE i). Example of Semantic Similarity 

OUTLOOK 

cognition 

content 

knowledge_domain 

discipline 

science 

The result of preliminary study showed that there are often semantic distances 

between English translations made through a so-called official translation and a socalled 

lexical translation. The noteworthy question is how a Japanese translation of 

these pairs of English translations will turn out. My initial assumption is that these 

Japanese translations will create expressions with an even deeper level of 

inconsistency (i.e. FIGURE 2). It means that it will be increasingly difficult to identify 

the original Danish NEs from various Japanese translations. If there were universal 

rules defining “a name should always be translated based on the lexical meaning of its 

original language”, these inconsistencies would potentially be tremendously reduced. 

However, the decision of names and their translations usually involves a plurality of 


issues, such as political (domestically, internationally), cultural, social and so on. It 

means that problems originating from both official- and lexical transitive translations 

should be carefully dealt with in terms of a so-called Named Entity Disambiguation. 

As a solution, I propose an ontology-based triangulated terminology management 

approach. The approach is based on the idea that a country specific NE has a unique 

ontological structure, since a named entity is per definition unambiguously defined on 

a global scale. For example, the Danish governmental organizations are existing 

according to a Danish governmental structure that is uniquely defined in this country. 

It means that the ontological structure is unique even though each named entity is 

expressed in different languages. Therefore, an ontology-based terminology database 

consists of three layers: a) each NE expressed in a source language, b) its official 

expression in an inter-lingual language (usually in English), and c) all possible 

expressions in a target language (FIGURE 3). These three layers should have a 

triangulated relationship as shown in FIGURE 4. The key issue is that the name of an 

entity expressed in a source language and an official expression in an inter-lingual 

language should have a relationship linking them like “is translation of” each other. 

However, an expression in a target language that “is translation of” either a name of an 

entity expressed in a source language or an official expression in an inter-lingual 

language is uni-directionally linked and hence cannot be traced the other way around. 

A frame for expressions in a target language should contain all possible translations 

from any available corpora in the target language. It is my aim to establish a 

triangulated terminology database in the Danish e-government domain based on an 

ontology-based terminology management system developed by Copenhagen Business 

School (Madsen et.al. 2006). 

FIGURE ii). Inconsistent Official- and Lexical translations 


Named Entity expressed 

in a source language 

Official expression 

in a inter lingual language 

Expressions 

in a target language 

- Country specific NE has 

a unique ontological structure 

-NE should contain identifiers 

specifying time/period/place 

(e.g. country code) 

FIGURE iii). Ontology-based Terminology Management 

The Veterinary and Food 

Administration 

Official expression 

in a inter-lingual language 

Is translation of 


Triangulated 

terminology 

management 

using standard 

identifier 

食品管理庁 

食糧庁 

食品局 

獣医・食品管理庁 


Fødevarestyrelsen 

Named Entity expressed 

in a source language 

Expressions 

in a target language 

FIGURE iv). Triangulated Terminology Management 


CONCLUSION 

In this paper, I first demonstrated phenomena identified in translation processes in 

rare language combinations such as Danish and Japanese. These phenomena will 

potentially create problems for readers of the translated texts due to the diversion of 

translations. As a solution, I proposed an ontology-based triangulated terminology 

management approach. 

ACKNOWLEDGMENTS 

I would like to thank my supervisor, Hanne Erdman Thomsen for helpful advices on my 

project. 

REFERENCES 

Gollins, T. and Sanderson, M. (2001) Improving Cross Language Information Retrieval with 

Triangulated Translation, Proceedings of the 24 th 

annual international ACM SIGIR conference on 

Research and development in information retrieval, New Orleans, Louisiana, United States:pp.90-95 

Ballesteros, L. (2001) Cross Language Retrieval via transitive translation, In Croft W. B. (ed). Advances 

in Information Retrieval: recent Research from the CIIR, Kluwer Academic Publishers, pp.203-234 

Pedersen, T., Patwardhan, S., and Michelizzi, J. (2004) WordNet::Similarity – Measuring the 

Relatedness of Concepts. Available from: http://search.cpan.org/dist/WordNet-Similarity. 

Madsen, B, Thomsen, H. and Wenzel, A (2006) i-Term for NORDTERM 5th International Conference 

on Language Resources and Evaluation (LREC 2006), Workshops Proceedings: W16 Terminology 

Design: Quality Criteria and Evaluation Methods (TermEval). Genova, Italy 


Oppsummering – arbeidsseminar om 

språkteknologiske termer på de nordiske 

språkene 

Torbjørg Breivik 

Språkrådet, Norge 

Abstract. De nordiske språknemndenes arbeidsgruppe for språkteknologi (ASTIN) arrangerte en 

workshop i tilknytning til Nordterm 2009. Utgangspunktet var et arbeid med språkteknologiske 

termer for de nordiske språkene som ble påbegynt av de nasjonale dokumentasjonssentrene for 

forskningsprogrammet Nordisk Språkteknologi. Det nordiske nettverket for disse sentrene ble 

kalt NorDokNet. Alle sentrene hadde egne nettsider der oppsett og innhold skulle være likt, men 

utformingen kunne variere. For å kunne publisere samme type informasjon på nettsidene var det 

nødvendig å bruke samme ”merkelapp” på de ulike delene av innholdet. Mange av personene 

som var involverte i dette arbeidet, var også involvert i undervisning i språkteknologi på sine 

respektive institusjoner og hadde sett behovet for å ha en terminologi på eget språk. 

Terminologien er også nødvendig for å kunne formidle hva språkteknologi er, f.eks. ved 

rekruttering av studenter. Arbeidet med termene startet mot slutten av perioden for 

forskningsprogrammet og meningen var at de enkelte involverte skulle sørge for videre arbeid i 

egen regi. Dette har i varierende grad skjedd. ASTIN ønsket derfor å diskutere muligheten for å 

gå videre med utvikling av en nordisk språkteknologisk terminologi og om det er grunnlag for å 

etablere et nordisk prosjekt. Innlederne på workshoppen var personer som var involvert i 

arbeidet fra starten av, og personer som representerer miljø med høy kompetanse i 

terminologiarbeid. Rundt 20 personer deltok på møtet. 

INNLEGGENE 

Innleggene på seminaret tok for seg ulike aspekter ved terminologiarbeidet som er 

gjort: hva ble gjort i det enkelte land innenfor NorDokNet og hva er gjort i ettertid. I 

tillegg hadde innlederne blitt utfordret til å si noe om videre arbeid og hvordan et slikt 

arbeid kan organiseres. 

Torbjørg Breivik fra ASTIN ga en kort introduksjon til workshoppen der 

bakgrunnen for møtet ble trukket opp. Formålet med møtet var å undersøke om det var 

interesse for å etablere et nordisk prosjekt for språkteknologitermer. ASTIN kan påta 

seg å stå for å koordinere arbeidet med en prosjektskisse og selve søkeprosessen, men 

arbeidet kan ikke settes i gang uten av de som representerer fagområdet i de enkelte 

landene deltar. Om diskusjonen skulle vise at det var enighet om å starte prosessen 

med etablering av prosjektet, var også arbeidsmåten et aktuelt tema. Hvilke verktøy og 

hvilke kanaler kan være effektive for formålet? Arbeidet må kunne foregå på nettet 

med mulighet for et eget diskusjonsforum. 


Koenraad de Smedt, Norge, var med i terminologiarbeidet innenfor NorDokNet og 

det var han som trakk fram den korte, flerspråklig lista over språkteknologitermer som 

i sin tid var utgangspunktet for det NorDokNet gjorde. Meningen var at lista skulle 

kompletteres med definisjoner og/eller forklaringer på de nordiske språkene, legges ut 

på nettsidene til dokumentasjonssentrene og deretter utvides litt etter litt. De Smedt ga 

en oversikt over hva som finnes på norsk av termlister for språkteknologi. De fleste er 

noen år gamle og lite nytt arbeid har blitt gjort på dette feltet i Norge etter at det 

nordiske forskningsprogrammet i språkteknologi ble avsluttet. Hans konklusjon var at 

det finnes noen lister, utvalget av termer er lite, ofte tilfeldig og det er lite 

terminologisk informasjon til den enkelte term. Han framhevet at det er positivt at 

listene har flere språk. Videre arbeid må være å legge til terminologisk informasjon, 

utvide antallet og få med opplysninger om subdomene, bruksområder og semantiske 

relasjoner. Han pekte på at man kan bygge en termbase basert på verktøy i Wiki. Det 

er avgjørende for nytteverdien av basen at man tar med informasjon som subdomene, 

semantiske relasjoner osv. for den enkelte term som legges inn. 

Henrik Nilsson ga en oversikt over situasjonen i Sverige: der finnes en egen 

referansegruppe for språkteknologi som er satt sammen av personer fra sentrale 

aktører innenfor språkteknologiområdet inklusive Språkrådet. Det finnes et eget 

nettsted (språkteknologi.se) for arbeidet som gjøres på området, og dette vil utgjøre en 

stor ressurs om det etableres et eget prosjekt for språkteknologiske termer for de 

nordiske språkene. Det arbeides systematisk med terminologi i Sverige og under 

hovedkonferansen for Nordterm 2009 presenterte TNC (Terminologicentrum) 

Rikstermbanken som skal inneholde kvalitetssikrede termer for mange fagområder. 

Store deler av ressursene i Rikstermbanken vil være flerspråklige. Det finnes ikke 

noen egen aktivitet bare for språkteknologiske termer. 

Arbeidet som ble gjort innenfor NorDokNet, omfattet svenske termer og er 

inkludert i det den svenske referansegruppen arbeider med. 

Nilsson presenterte en oversikt over terminologiressurser som ellers finnes for 

svensk, og som kan ha relevans for det videre arbeidet. Han trakk særlig fram arbeidet 

som er gjort, og gjøres, i den svenske datatermgruppen. 

Utfordringene og problemene ifølge Nilsson er at dette er et smalt fagområde, man 

får problem med tilgrensende områder innenfor IKT-fagene. Det finnes både markeds- 

og forskningstermer, og det kan by på utfordringer ved valg av målgruppe. Hvem skal 

man lage denne terminologien for? Bransjen er heterogen og perspektivene blandes. 

Terminologi brukes ofte i markedsføring, men her ser man en stor og ofte unødvendig 

variasjon i termbruken som bidrar til forvirring og uklarheter. Det finnes ingen 

lærebøker i språkteknologi på svensk. Det er også et spørsmål om den store 

termvariasjonen er uttrykk for synonymi eller om det er reelle forskjeller. Fagområdet 

har stor innflytelse fra andre språk, og særlig fra engelsk lånes mange ord og termer. 

Spørsmålet er om man bare kan følge utenlandske standardverk i valg av termer? Det 

vil si bare oversette de utenlandske termene eller er det andre hensyn som også må tas, 

f.eks. til eget språk og tilgrensende, etablerte terminologier? 


Nilsson avsluttet med å peke på den organisatoriske og terminologifaglige 

kompetanse TNC har, samt det nettverket av fageksperter og høringsinstanser de har 

knyttet til seg gjennom mange år. Dette er en styrke om man skal etablere et nytt 

nordisk prosjekt, men ethvert fagområde byr også på mange språkfaglige utfordringer, 

og tverrfaglig samarbeid er nødvendig. 

Hanne Fersøe presenterte status for arbeidet med språkteknologiske termer i 

Danmark. Hun startet med å vise til arbeidet som ble gjort av dokumentasjonssentrene 

for språkteknologi (NorDokNet). Hun viste også en oversikt over europeiske, 

flerspråklige termprosjekt, bl.a. en termliste for språkteknologi som ble laget innenfor 

Euromap/Hope-prosjektene. NorDokNet satte også i gang et eksperiment med 

automatisk ekserpering av flerspråklig terminologi hentet fra tekst på flerspråklige 

nettsider. Resultatet fra eksperimentet ble brukt i prosjektet Nordisk nettordbok som 

ble avsluttet i 2007. 

Ifølge Fersøe er det i dag ingen generell aktivitet på utvikling av terminologi 

innenfor språkteknologi, men i enkelte prosjekt arbeides det med terminologiske 

problemstillinger (Nordisk nettordbok). Center for Sprogteknologi (CST) har tidligere 

vært involvert i spesifikasjon av den europeiske termbasen IATE, utvikling av rutiner 

for import av eksisterende termbaser til IATE, analyse og spesifikasjon av automatisk 

identifisering og fletting av dubletter i samme base. De har også arbeidet med 

utvikling av metoder og standarder i EuroTermBank-prosjektet, og er positive til å 

delta i diskusjoner om hvordan dansk terminologi for språkteknologi kan utvikles 

videre i nordisk regi. 

Kimmo Koskenniemi hadde to oppgaver på workshoppen: han skulle først gi en 

oversikt over situasjonen i Finland per i dag, og deretter presentere et verktøy som kan 

brukes i et nordisk samarbeidsprosjekt. 

I Finland har Koskenniemi arbeidet videre med den lista som ble utviklet under 

NorDokNet. Lista over nøkkelord er gruppert i over- og underordnede klasser. De 

underordnede ordene i hver klasse kommer fram om man klikker på det overordnede 

ordet. Treffene gir opplysninger om kilde og man kan spesifisere søkene innenfor de 

rammene man har i søkemotoren SiteSeeker. SiteSeeker brukte i sin tid lista fra 

NorDokNet til å teste funksjonaliteten for flerspråklig søking. 

Koskenniemi har etablert et Wiki-forum for å kunne diskutere og arbeide med 

språkteknologisk terminologi og presenterte dette. Han pekte på at dette er et enkelt og 

billig verktøy å jobbe med og han mente det er et godt argument for å bruke det i det 

videre arbeidet. 

DISKUSJONEN 

Diskusjonen viste raskt at det var interesse for å gå videre med arbeidet. Innlederne hadde 

også konkludert med dette, og alle deltakerne i diskusjonen støttet dette. 


Koskenniemis måte å tilrettelegge terminologien på, er ryddig og oversiktlig, og den viser 

hvordan begrepene henger sammen og forholder seg til hverandre. Ulempen kan være at den 

som ikke kjenner fagområdet, men som ønsker dels å finne ut hva et ord står for eller betyr, 

ikke finner det så lett. En slik organisering kan også være lite brukervennlig f.eks. for 

studenter som er i ferd med å velge fag og som kan være interessert i språkteknologi. Analyse 

og valg av hvem man skal vurdere som den mest aktuelle brukergruppen, må bli gjenstand for 

grundige diskusjoner i prosjektet før man velger presentasjonsmåte for innholdet. 

Diskusjonen dreide seg mest om metode, arbeidsmåte og valg av verktøy for å gjøre jobben 

effektivt. De fleste nordiske land var representerte med ressurspersoner innenfor terminologi 

og fagspråk selv om ikke alle var like godt kjent med språkteknologi. Island hadde før møtet 

informert initiativtakerne om at de er interessert i å delta i et nordisk prosjekt for å realisere en 

felles nordisk terminologi på området. 

Konklusjonen ble at ASTIN som tok inititativet til møtet, arbeider videre med prosjektet og 

lager en prosjektsøknad som sendes Nordspråk pluss. ASTIN kan koordinere og styre 

prosjektet på nordisk nivå, men det må etableres nasjonale arbeidsgrupper der man har 

representert kompetanse innenfor språk, språkteknologi og terminologiutvikling. Arbeidet som 

alt er gjort på området, tas med videre og bygges ut. Resultatet må bli tilgjengelig på et 

nordisk nettsted i tillegg til nasjonale nettsteder, og muligheten for å søke på tvers av språkene 

må også videreføres. 


Språkteknologisk (meta)terminologi 

– situationen i Sverige 

Ola Karlsson a och Henrik Nilsson b 

a 

Språkrådet, Box 20057, 104 60 Stockholm, Sverige, +46 8 442 42 04, ola.karlsson@sprakradet.se 

b 

Terminologicentrum TNC, Västra vägen 7 B, SE-169 61 Solna, Sverige, +46 8 446 66 10, 

henrik.nilsson@tnc.se 

Situationen i Sverige 

Denna artikel är en kort rapport över situationen i Sverige vad gäller språkteknologisk 

(meta)terminologi. Den behandlar kort existerande materiella resurser i 

form av olika terminologisamlingar men också immateriella resurser i form av grupper 

och nätverk som arbetar inom området. Vidare berörs de utmaningar och problem man 

kan se utifrån ett svenskt perspektiv samt om det i svensk språkteknologisk 

terminologi finns några särskilt svenska aspekter, t.ex. språkvårdsaspekter. 

Organisatoriskt finns i Sverige flera instanser som i sig ingår i upparbetade nätverk 

med experter och remissinstanser och som har ett etablerat samarbete mellan sig. 

Svenska datatermgruppen som funnits sedan 1996 är ett exempel på samarbete, och 

även om arbetet där inte varit särskilt inriktat på språkteknologisk terminologi finns 

viktiga erfarenheter att hämta, t.ex. vad gäller systematik och metodik vid val av 

svenska termer. Att det dessutom finns ett nationellt terminologicentrum (TNC) med 

lång metodikerfarenhet av terminologiprojekt är en annan svensk styrka. 

Språkrådets språkteknologiska referensgrupp 

En ny viktig resurs för ett arbete med språkteknologisk (meta)terminologi är 

Språkrådets referensgrupp för språkteknologi. Gruppen (som är ganska nyinstiftad och 

en av flera referensgrupper som finns inom Språkrådet) ska främja Språkrådets 

kontakter med språkteknologisk forskning och industri. På ett mer konkret plan ska 

gruppen bland annat: 

• främja språkteknologiskt infrastrukturarbete 

• vidareutveckla webbplatsen Språkteknologi.se 

• diskutera juridiska frågor kring tillgängliggörande av resurser 

• ta fram och sprida förslag på språkteknologiska projektarbeten 

• främja rekrytering till språkteknologiutbildningarna 

• diskutera webbtillgänglighetsfrågor 

• diskutera teckentillgänglighet och standardisering 

• överblicka andra länders språkpolitik gällande språkteknologi 


• ta fram terminologi på språkteknologiområdet. 

Den sistnämnda punkten är naturligtvis särskilt intressant i det här sammanhanget. I 

gruppen medverkar representanter för följande organisationer 1 

, vilket vittnar om en 

bred förankring och variation i kompetensen: 

• Språkrådet 

• Göteborgs universitet (ordförande) och Språkbanken 

• Kungliga tekniska högskolan KTH 

• Lunds universitet 

• Sics (Swedish institute for computer science) 

• Terminologicentrum TNC. 

Det finns även ett nationellt informationscentrum för svensk språkteknologi: 

Språkteknologi.se. Där kan både allmänhet, näringsliv, forskare och andra 

språkteknologiskt intresserade hitta information om språkteknologi: produkter, 

teknikbeskrivningar, forskningsrapporter, konferenser, kontaktuppgifter till personer 

och organisationer, en omfattande länksamling till nordisk och internationell 

språkteknologi och mycket annat. Webbplatsen utvecklas av Språkrådet i samarbete 

med Sveriges nationella forskarskola i språkteknologi, GSLT. Språkteknologi.se 

samarbetar med NorDokNet, ett nätverk av språkteknologiwebbplatser i Norden, och 

LT-World, en informationswebbplats om språkteknologi i världen. 2 

Existerande svensk (meta)terminologi 

För området språkteknologi har det i Sverige inte tagits något samlat grepp förrän 

nu. Detta innebär att de resurser som finns är spridda och av varierande kvalitet. 

Det finns existerande terminologisamlingar hos ACM, TNC, Svenska datatermgruppen, 

i Rikstermbanken 3 och naturligtvis som diverse webblistor. Svenska 

termer finns även i det material som nås via webbplatsen Språkteknolologi.se: dels i 

form av intern terminologi på webbplatsen, dels genom externa länkar till ett försök 

till standardiserad nordisk terminologi som togs fram 2005, en lista administrerad av 

Kimmo Koskenniemi i Finland 4 . Denna nordiska parallellterminologi har använts för 

att möjliggöra flerspråkig sökning på Nordokwebbplatserna med sökmotorn 

Siteseeker. En bredare flerspråkig lista, som också inkluderar språk som tyska och 

spanska, finns publicerad på de finska Nordoksidorna 5 

. 

Utmaningar och problem 

När det gäller terminologi för språkteknologi generellt får det anses vara ett ganska 

litet fackområde, vilket också kan konstateras genom antalet specifika termer i 

förhållande till närliggande områden som datavetenskap och IT. Det är också ett 

1 Båda artikelförfattarna medverkar i gruppen. 

2 Se vidare: . 

3 Sveriges nationella termbank som öppnades i mars 2009: . 

4 Publicerad på 

5 På 


fackområde där det kan vara svårt att göra gränsdragningar mot andra närliggande 

områden (datavetenskap, lingvistik med flera) – vilka termer, om några, är unika för 

språkteknologiområdet? Dessutom är det inte helt enkelt att dela in området i 

delområden, t.ex. utifrån teknik- och tillämpningsområden, vilket man bland annat har 

konfronterats med i arbetet med Språkteknologi.se. 

Branschen är heterogen till sin natur vilket gör att olika perspektiv blandas, och det 

kan i sin tur påverka den terminologi som används. Marknadsorienterade termer (elearning) 

blandas med akademiska och forskningsinriktade termer (ytparsning, 

probabilistisk kontextfri grammatik) och det sker ibland målgruppsanpassningar i 

manualer, reklammaterial etc. som påverkar terminologin. Som i alla branscher där det 

finns en marknadspotential finns också en risk att terminologi används som 

marknadsföringsredskap, dvs. att termer skapas i syfte att skilja ut en produkt från en 

konkurrents vilket leder till en onödig termvariation och oegentlig synonymi som kan 

förvirra. 

Ett annat (potentiellt) problem är att en stor del av den språkteknologiska 

terminologin i praktiken baserats på några få utländska (engelskspråkiga) 

standardverk 6 

. I till exempel termurval för sökapplikationer är det tveksamt att bara 

efterapa taxonomier som förekommer i dessa verk, eftersom de ofta är teknik- och 

standardiseringsorienterade och inte alltid så användarorienterade. Många av termerna 

är för smala och irrelevanta när människor ska söka språkteknologiskt relaterad 

information (som på Nordoks webbplatser) eller använda språkteknologiska 

tillämpningar. Det är viktigt att (också) utkristallisera bredare och mer användar- 

orienterade termer. 

Det problemet har till exempel funnits i kategoriseringen av innehållet på 

Språkteknologi.se, där redaktionen fått välja ut ett mindre antal frekventa termer för 

att täcka in så mycket innehåll som möjligt. 

En annan bidragande orsak till bristen på bra svenska termer är att det finns få 

läroböcker på svenska (ett undantag är Tekniken bakom språket, R. Domeij och 

Språkrådet 2008). I det material man har att utgå ifrån, normalt engelskspråkigt, 

förekommer däremot en stor termvariation, och det krävs ibland resurser och 

kunnande för att avgöra om uttrycken som används är synonyma eller inte. Den 

situationen är i och för sig inte unik för det språkteknologiska området, men inte desto 

mindre resurskrävande. 

Att en stor del av terminologin kommer från engelskan föranleder en diskussion 

som har beröringar dels med språkvårdens praktiska anpassning av lånord (läs mer 

under nästa rubrik), dels med övergripande språkpolitik och det allmännas ansvar för 

att det skapas svensk vetenskapsterminologi inom svensk forskning och 

högskoleverksamhet. Eftersom språkteknologi är en del av Språkrådets (Institutet för 

språk och folkminnens) verksamhet, är det kanske särskilt angeläget att det utarbetas 

svensk terminologi just inom det området. Med den minoritetslag som träder ikraft den 

1 januari 2010 i Sverige, kan svensk terminologi också komma att inbegripa terminologi 

för de nationella minoritetsspråken (i synnerhet för samiska och romani chib). I 

frekvent använd teknik kan det även gälla stora invandrarspråk i Sverige. 

6 

Detta gäller inte minst standardverket Survey of the State of the Art in Human Language Technology 


Över huvud taget är det viktigt med språkvårdssynpunkter – och tvärfacklig 

diskussion – kring termerna. Den nordiska termlista som togs fram för Nordok och 

Tvärsök 2005 var en bra början, men med mer terminologisk diskussion hade 

resultatet blivit ännu bättre. En översyn av listan behövs därför. 

Specifika svenska problem 

Det specifikt svenska på det organisatoriska planet har redan behandlats ovan. När 

det gäller svenska språkliga egenheter får dessa anses vara få, och den svenska 

terminologin är inte spretigare än den som finns på andra nordiska språk. Ett 

svenskspråkigt problem är den variation som förekommer mellan datalingvistik och 

datorlingvistik – och deras förhållande till begreppet språkteknologi. En liknande 

distinktion som varit föremål för diskussion under mycket lång tid är den mellan 

teknologi och teknik (som egentligen inte förändras när språk- läggs till som förled). 

Det förekommer även problem kring synonymi och hyponymi, delvis specifikt 

svenska, där olika perspektiv, tillämpningar och forskningsdiscipliner blandas. Det 

kan till exempel gälla begreppskluster som språkkontroll – språkverktyg – språkstöd. 

Halten av engelska lånord på det språkteknologiska området är inte värre i Sverige 

än i andra länder, men mycket bör anpassas mer till svenska förhållanden. Hur detta 

ska göras får man, med Svenska datatermgruppens metodik, ta ställning till i varje fall 

för sig. 

Slutsatser och idéer 

Man kan avsluta med att ställa några frågor som bör behandlas i det fortsatta arbetet 

med nordisk språkteknologisk terminologi: 

• Vem är målgrupp för termerna? Krävs det flera termer för att täcka in olika 

discipliner och verksamhetsområden, och hur påverkas i så fall urvalet av 

termerna? 

• Hur hanterar man överlappningen med närliggande termområden där ibland 

samma term ges olika begreppsinnebörd i språkteknologi, lingvistik och 

datavetenskap? 

• Bör samma termer användas i internt fackspråkliga och mer publika 

sammanhang, eller bör terminologin målgruppsanpassas mer? 

• Bör någon sorts språkteknologisk terminologi prioriteras i arbetet med att se 

över och skapa nya termer? 

• Bör även termer från andra språk än engelska användas som utgångspunkt (i 

den mån sådana finns)? 

• Bör man i ännu högre grad än tidigare arbeta med nordisk ensning av 

termerna? Hur ska resultatet av det arbetet användas? 

ReferensER 

Karlsson, O. (1996), Principer för Datatermgruppens termarbete (www). Hämtat från 

 


ISBN 978-87-994577-0-0 

9 788799 457700

Indlæg - CBS

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?