18.09.2013 Views

verslag werkzaamheden 2001 werkprogramma 2002 - Europa

verslag werkzaamheden 2001 werkprogramma 2002 - Europa

verslag werkzaamheden 2001 werkprogramma 2002 - Europa

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

worden. Dit heeft er tevens toe geleid dat een aantal modules ontwikkeld of aanzienlijk<br />

verbeterd is.<br />

c. De terminologiedatabase van het Vertaalbureau (Euroterms)<br />

De sectie Taaltechnologie heeft haar <strong>werkzaamheden</strong> betreffende de inhoud van Euroterms<br />

voortgezet. Deze verbeteringen hadden niet alleen betrekking op uitbreiding van de omvang<br />

van de database (dat wil zeggen het aantal trefwoorden), maar ook op aanpassing van de<br />

vorm en het opschonen van een belangrijk deel van de database. Dit was noodzakelijk om<br />

ervoor te zorgen dat de structuur van de terminologie-eenheden overeenstemt met de<br />

internationale normen op dit gebied. Dankzij het werk dat verricht is wordt het aanmerkelijk<br />

eenvoudiger om de database Euroterms te integreren in de interinstitutionele database van de<br />

Europese Unie (IATE).<br />

In <strong>2001</strong> zijn 57 710 nieuwe trefwoorden in de database Euroterms ingevoerd. De belangrijkste<br />

uitbreiding van de database betrof terminologie betreffende de Europese Centrale Bank<br />

(ongeveer 9 300 trefwoorden), Europol (13 500 trefwoorden) en EMEA (13 100). Momenteel<br />

bevat de database 145 000 trefwoorden. De terminologie-uitbreiding is een combinatie van<br />

bijdragen van interne vertalers en van externe glossaria die verzameld en toegevoegd zijn door<br />

de voor de terminologie verantwoordelijke groep.<br />

d. Tests met software voor automatische terminologie-extractie<br />

Terminologiebronnen ontstaan in veel gevallen doordat vertalers deze tijdens hun dagelijkse<br />

<strong>werkzaamheden</strong> opbouwen. Het komt echter ook voor dat terminologiebronnen als nieuw<br />

product worden opgezet. Dit betekent vaak dat er met bestaande, meertalige teksten moet<br />

worden gewerkt. De afgelopen jaren is een aantal softwareprogramma’s op de markt gebracht<br />

waarin eenvoudige doch doeltreffende methoden worden toegepast om terminologen te helpen<br />

dergelijke teksten te benutten. Een aantal van deze toepassingen voor gegevensextractie op<br />

basis van tekstgegevens (text mining) is in <strong>2001</strong> getest door leden van de sectie<br />

Taaltechnologie. Alle programma’s lijken het opstellen van meertalige terminologielijsten met<br />

de meest relevante termen van een gegeven tekstbestand mogelijk te maken. De tests hebben<br />

echter aangetoond dat een volledig geautomatiseerde procedure voor dit soort<br />

<strong>werkzaamheden</strong> nog lang geen realiteit is, ondanks de onmiskenbare vorderingen die op dit<br />

gebied gemaakt zijn. Het percentage "ruis", ofwel het aantal voorstellen dat nutteloos of zonder<br />

betekenis is, ligt nog steeds hoger dan het percentage correcte resultaten, waardoor<br />

menselijke tussenkomst noodzakelijk blijft. Desalniettemin waren de testresultaten dusdanig<br />

veelbelovend, dat nader onderzoek op dit gebied gerechtvaardigd is.<br />

B. EXTERNE VERTALING<br />

In totaal zijn er 124 808 bladzijden door externe vertalers vertaald. Het merendeel van deze<br />

vertalers heeft ingeschreven op één of meer door het Vertaalbureau uitgeschreven<br />

aanbestedingen. Alleen voor buitengewoon gespecialiseerde teksten of bijzondere<br />

talencombinaties zijn rechtstreeks vertalers geworven.<br />

VERSLAG VAN DE WERKZAAMHEDEN <strong>2001</strong><br />

14

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!