23.11.2013 Aufrufe

tekom-Jahrestagung 2012 - ActiveDoc

tekom-Jahrestagung 2012 - ActiveDoc

tekom-Jahrestagung 2012 - ActiveDoc

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Sprachtechnologie / Language Technology<br />

Manuelle Wartung/<br />

Pflege großer TMs<br />

Automatische Prüfungen<br />

an der Textoberfläche<br />

Linguistisch intelligente<br />

Softwarewerkzeuge<br />

Auf diesem Hintergrund ist klar, dass die Bearbeitung bzw. Pflege solcher<br />

Translation Memorys – insbesondere im Hinblick auf die Qualität<br />

– nur noch bedingt manuell erfolgen kann. Folglich stehen viele TM-<br />

Nutzer nun vor dem gravierenden Problem, die mittlerweile im Umfang<br />

sehr groß gewordenen TMs „reinigen“ zu müssen, dies aber am besten<br />

ausschließlich maschinell und nur eingeschränkt manuell geschehen<br />

kann.<br />

Fehleranalyse<br />

Die Struktur der Fehler, die in einem großen Translation Memory vorkommen<br />

können, ist sehr heterogen. Neben häufigen Fehlern auf der<br />

formalen Ebene können dies Fehler auf der sprachlichen, inhaltlichen<br />

bzw. auch logischen Ebene sein. Eine Vielzahl der vorkommenden falschen<br />

bzw. fehlerhaften Übersetzungseinheiten/Segmente können<br />

schon mit existierenden Softwarefunktionen der einzelnen Translation-<br />

Memory-Systeme bzw. mit speziell für diese Aufgabe programmierten<br />

Software-Skripten automatisch bereinigt werden. Dies erfolgt zunächst<br />

rein statistisch auf der Basis schlichter String- bzw. Attributvergleiche.<br />

Viele Translation-Memory-Systeme haben schon einige dieser sehr<br />

nützlichen Prüfungen eingebaut. Darüber hinaus bieten ausgesuchte<br />

Übersetzungsdienstleister skriptbasierte TM-Optimierungen an [2]. Die<br />

Bandbreite dieser Prüfungen reicht von der Validierung von Formaten<br />

(TXT, RTF, XML usw.), der Überprüfung von ID-Konsistenz über den<br />

Vergleich von Ausgangs- und Zieltext im Hinblick auf fehlende Übersetzungen,<br />

Zahlenformate etc. bis hin zur automatischen Zusammenführung<br />

von Satzfragmenten bzw. der Filterung von Doubletten und<br />

Varianten.<br />

Alle diese Prüfungen berücksichtigen jedoch ausschließlich die Textoberfläche.<br />

Und indem sie keine Korrekturen in der Quellsprache vornehmen,<br />

setzen sie alle indirekt voraus, dass der Kunde sich an seine<br />

eigenen Vorgaben (Rechtschreibung, Grammatik, spezielle Styleguides<br />

etc.) hält. Die Erfahrung zeigt dagegen, dass in vielen Fällen auch auf<br />

der Seite der Quellsprache verschiedene falsche bzw. fehlerhafte Segmente<br />

im Translation Memory vorkommen können. Diese sind mit einer<br />

automatischen Prüfung an der Textoberfläche nicht mehr zu erfassen.<br />

Mit Hilfe von bereits auf dem Markt vorhandener linguistisch intelligenter<br />

Software ist dies jedoch möglich.<br />

An erster Stelle ist hier der Einsatz von existierenden Rechtschreibund<br />

Grammatikprüfprogrammen sowohl auf quell- als auch zielsprachlicher<br />

Seite möglich. Damit können – über die statistischen Prüfungen<br />

hinaus – weitere falsche bzw. fehlerhafte Übersetzungseinheiten/<br />

Segmente problemlos automatisch entfernt werden, falls solche Prüfungen<br />

nicht schon beim Befüllen des TMs durchgeführt wurden. Ein<br />

weiterer Schritt ist – eine zweisprachige Terminologie vorausgesetzt –<br />

die Evaluierung des TMs anhand dieser Terminologie, d. h. ein Filtern<br />

der Segmente im Hinblick auf die verwendete Terminologie in jeweils<br />

Quell- und Zielsprache. Auch dieser Prozess-Schritt kann automatisch<br />

durchgeführt werden. An dieser Stelle kann die zweisprachige Terminologie<br />

darüber hinaus sehr gut genutzt werden, um eine Variantenreduktion<br />

der Segmente auf der zielsprachlichen Seite durchzuführen.<br />

Dazu werden zielsprachliche Segmente im Vergleich mit quellsprachlichen<br />

daraufhin untersucht, inwieweit die vorgegebene Terminologie<br />

in der Übersetzung verwendet wurde. Dieser Schritt kann – unter<br />

248<br />

<strong>tekom</strong>-<strong>Jahrestagung</strong> <strong>2012</strong>

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!