23.11.2013 Aufrufe

tekom-Jahrestagung 2012 - ActiveDoc

tekom-Jahrestagung 2012 - ActiveDoc

tekom-Jahrestagung 2012 - ActiveDoc

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Offene technische Standards<br />

OTS 2<br />

Fachvortrag<br />

TBX – ein Standard für den Austausch<br />

terminologischer Daten: Anforderungen,<br />

Probleme, Verbesserungen<br />

Klaus-Dirk Schmitz, Fachhochschule Köln<br />

Die Erarbeitung konsistenter und zuverlässiger Terminologie ist zeitaufwändig<br />

und kostenintensiv. Deshalb wird eine möglichst häufige<br />

Wiederverwendung der Daten angestrebt, die aber nur durch einen<br />

Austausch terminologischer Daten zwischen unterschiedlichen Terminologieverwaltungssystemen<br />

geschehen kann.<br />

Auch im Zusammenspiel zwischen Auftraggebern, Sprachdienstleistern<br />

und Freiberuflern ist die Weitergabe terminologischer Daten in beide<br />

Richtungen durchaus üblich. Unternehmen stellen ihre Terminologie<br />

für den Übersetzungs prozess zur Verfügung und Übersetzer geben<br />

aktualisierte Terminologiebestände wieder zurück. Besonders die Einhaltung<br />

konsistenter Terminologieverwendung in größeren Projekten,<br />

an denen mehrere Parteien beteiligt sind, kann nur dann sichergestellt<br />

werden, wenn alle auf die gleiche Terminologie zugreifen können; unterschiedliche<br />

Terminologiewerkzeuge und individuelle Modellierungen<br />

von Terminologiebeständen erschweren aber den verlustfreien und<br />

konsistenten Austausch von terminologischen Daten.<br />

Als letztes wichtiges Szenario für den Austausch terminologischer Daten<br />

muss noch die Migration von Terminologie von einem System auf<br />

ein anderes genannt werden. Dies kann notwendig werden, wenn ein<br />

Anwender von einem Terminologiever waltungssystem auf ein System<br />

eines anderen Herstellers umsteigt, aber auch, wenn terminologische<br />

Daten in anderen Programmen wie z. B. Content-Management-Systemen<br />

oder (regelbasierten) Maschinellen Übersetzungssystemen oder<br />

auch in anderen Formaten wie z. B. HTML oder XML gebraucht werden.<br />

Anforderungen<br />

Will man terminologische Daten zwischen zwei bestimmten Systemen<br />

austauschen oder Daten aus einem System für eine andere Anwendung<br />

nutzen, so müssen normalerweise individuelle Konvertierungsroutinen<br />

entwickelt werden. Hierzu ist es einerseits erforderlich, die individuellen<br />

Export- und Importformate der beteiligten Systeme zu kennen und<br />

in den Konvertierungen zu berücksichtigen; andererseits muss man<br />

aber auch die „Semantik“ der Datenkategorien und der Datenmodelle<br />

der beiden beteiligten Systeme richtig interpretieren.<br />

Sind mehrere Systeme am Austausch terminologischer Daten beteiligt,<br />

so erhöht sich sehr schnell die Anzahl der notwendigen Konvertierungsroutinen.<br />

Deshalb möchte man gerne auf genormte Austauschformate<br />

zurückgreifen, wobei jedes der beteiligten Terminologieverwaltungssysteme<br />

„nur“ einen Import von Daten aus dem genormten<br />

Austauschformat und „nur“ einen Export in das genormte Austauschformat<br />

bereitstellen muss.<br />

Eines der bekanntesten und oft bereitgestellten Formate für den Datenaustausch<br />

ist das CSV-Format (comma-separated values). Bei diesem<br />

Format werden Informationen durch Kommata oder Tabulatoren und<br />

338<br />

<strong>tekom</strong>-<strong>Jahrestagung</strong> <strong>2012</strong>

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!