23.11.2013 Aufrufe

tekom-Jahrestagung 2012 - ActiveDoc

tekom-Jahrestagung 2012 - ActiveDoc

tekom-Jahrestagung 2012 - ActiveDoc

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Sprachtechnologie / Language Technology<br />

Die unterschiedlichen<br />

Blickwinkel<br />

verschiedener<br />

Werkzeuge<br />

Das Konfliktpotenzial<br />

serieller Einzelbestände<br />

Methodik zur Ermittlung<br />

des Konfliktpotenzials<br />

Konsolidierung von<br />

Teilbeständen zu einem<br />

Gesamtbestand<br />

Hier müssen Inkonsistenzen unter Umständen temporär hingenommen<br />

werden. Das wiederum sollte bei der Ausgestaltung der Struktur des<br />

Terminologiebestandes bedacht werden.<br />

Das Heben des Terminologieschatzes ist in der Regel eine mühselige<br />

Angelegenheit, wenn man versucht, die robusten Werkzeuge aus der<br />

Welt der Translation-Memory-Systeme oder andere, ähnlich gestrickte<br />

Komponenten zu verwenden, die mit Linguistik nicht viel am Hut<br />

haben.<br />

Effiziente Terminologieprozesse können tatsächlich nur mit linguistischen<br />

Werkzeugen abgebildet werden, mit deren Hilfe zum Beispiel die<br />

Grundformen in der Terminologiedatenbank recht verlässlich mit den<br />

oft flektierten Formen in einem Text abgeglichen werden können.<br />

Auf diese Weise können auch der Repräsentationsgrad einer Terminologie<br />

und der Terminologiebedarf einer Textmenge sinnvoll ermittelt<br />

werden.<br />

Wir zeigen das im Fachvortrag an konkreten Beispielen in einer exemplarisch<br />

gestalteten Arbeitsumgebung.<br />

Ein Eintrag und seine Konkurrenten<br />

Wie kommt man zu einem notwendigen, harmonisierten Gesamtbestand,<br />

wenn Terminologie bislang separat, an verschiedenen Orten<br />

entstand?<br />

Es kann interessant sein zu wissen, welche potenziellen Konflikte in<br />

einem zusammengeführten Terminologiebestand oder zwischen verschiedenen<br />

betrachteten Einzelbeständen vorliegen.<br />

Die Kenntnis der Anzahl möglicher Konflikte kann dabei helfen, den<br />

Aufwand für die Herstellung einer konsolidierten Gesamtterminologie<br />

zu beziffern.<br />

Wir zeigen in unserer exemplarischen Arbeitsumgebung, nach welcher<br />

Methodik Konfliktmatrizen berechnet werden können, die einerseits<br />

ein Bild von der Diffusität eines Terminologiebestandes zeichnen und<br />

die andererseits auch als Brille genutzt werden können, um potenzielle<br />

Konflikte aufzulösen oder Benennungen innerhalb eines Konzepts als<br />

sinnvolle Synonyme zu bestimmen.<br />

Um jedoch eine effiziente Vorgehensweise festzulegen, sollten zunächst<br />

der Repräsentationsgrad der einzelnen Bestände für besonders relevante<br />

Textmengen und zweitens der Terminologiebedarf dieser Textmengen<br />

bezogen auf den jeweiligen Terminologie-Teilbestand ermittelt<br />

werden.<br />

Bei einer solchen Vorgehensweise kann oft schon die Spreu vom Weizen<br />

getrennt und ermittelt werden, für welche Datenbestände man welche<br />

Mühe sinnvoll aufwenden sollte.<br />

Und das macht man dann.<br />

<strong>tekom</strong>-<strong>Jahrestagung</strong> <strong>2012</strong><br />

245

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!