verslag werkzaamheden 2001 werkprogramma 2002 - Europa
verslag werkzaamheden 2001 werkprogramma 2002 - Europa
verslag werkzaamheden 2001 werkprogramma 2002 - Europa
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
worden. Dit heeft er tevens toe geleid dat een aantal modules ontwikkeld of aanzienlijk<br />
verbeterd is.<br />
c. De terminologiedatabase van het Vertaalbureau (Euroterms)<br />
De sectie Taaltechnologie heeft haar <strong>werkzaamheden</strong> betreffende de inhoud van Euroterms<br />
voortgezet. Deze verbeteringen hadden niet alleen betrekking op uitbreiding van de omvang<br />
van de database (dat wil zeggen het aantal trefwoorden), maar ook op aanpassing van de<br />
vorm en het opschonen van een belangrijk deel van de database. Dit was noodzakelijk om<br />
ervoor te zorgen dat de structuur van de terminologie-eenheden overeenstemt met de<br />
internationale normen op dit gebied. Dankzij het werk dat verricht is wordt het aanmerkelijk<br />
eenvoudiger om de database Euroterms te integreren in de interinstitutionele database van de<br />
Europese Unie (IATE).<br />
In <strong>2001</strong> zijn 57 710 nieuwe trefwoorden in de database Euroterms ingevoerd. De belangrijkste<br />
uitbreiding van de database betrof terminologie betreffende de Europese Centrale Bank<br />
(ongeveer 9 300 trefwoorden), Europol (13 500 trefwoorden) en EMEA (13 100). Momenteel<br />
bevat de database 145 000 trefwoorden. De terminologie-uitbreiding is een combinatie van<br />
bijdragen van interne vertalers en van externe glossaria die verzameld en toegevoegd zijn door<br />
de voor de terminologie verantwoordelijke groep.<br />
d. Tests met software voor automatische terminologie-extractie<br />
Terminologiebronnen ontstaan in veel gevallen doordat vertalers deze tijdens hun dagelijkse<br />
<strong>werkzaamheden</strong> opbouwen. Het komt echter ook voor dat terminologiebronnen als nieuw<br />
product worden opgezet. Dit betekent vaak dat er met bestaande, meertalige teksten moet<br />
worden gewerkt. De afgelopen jaren is een aantal softwareprogramma’s op de markt gebracht<br />
waarin eenvoudige doch doeltreffende methoden worden toegepast om terminologen te helpen<br />
dergelijke teksten te benutten. Een aantal van deze toepassingen voor gegevensextractie op<br />
basis van tekstgegevens (text mining) is in <strong>2001</strong> getest door leden van de sectie<br />
Taaltechnologie. Alle programma’s lijken het opstellen van meertalige terminologielijsten met<br />
de meest relevante termen van een gegeven tekstbestand mogelijk te maken. De tests hebben<br />
echter aangetoond dat een volledig geautomatiseerde procedure voor dit soort<br />
<strong>werkzaamheden</strong> nog lang geen realiteit is, ondanks de onmiskenbare vorderingen die op dit<br />
gebied gemaakt zijn. Het percentage "ruis", ofwel het aantal voorstellen dat nutteloos of zonder<br />
betekenis is, ligt nog steeds hoger dan het percentage correcte resultaten, waardoor<br />
menselijke tussenkomst noodzakelijk blijft. Desalniettemin waren de testresultaten dusdanig<br />
veelbelovend, dat nader onderzoek op dit gebied gerechtvaardigd is.<br />
B. EXTERNE VERTALING<br />
In totaal zijn er 124 808 bladzijden door externe vertalers vertaald. Het merendeel van deze<br />
vertalers heeft ingeschreven op één of meer door het Vertaalbureau uitgeschreven<br />
aanbestedingen. Alleen voor buitengewoon gespecialiseerde teksten of bijzondere<br />
talencombinaties zijn rechtstreeks vertalers geworven.<br />
VERSLAG VAN DE WERKZAAMHEDEN <strong>2001</strong><br />
14