27.10.2014 Aufrufe

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

3. Ansätze zur Lösung der Übersetzungsprobleme<br />

• zu lange Sätze,<br />

• Homographen,<br />

• Fragen,<br />

• kurze Parenthesen,<br />

• nicht gefundene/vorhandene Wörter und<br />

• Mehrdeutigkeiten.<br />

Einem Text wird zu Beginn des Bewertungsprozesses zunächst willkürlich ein Wert <strong>von</strong><br />

7 als Ausgangswert für seine Übersetzbarkeit zugewiesen. Je stärker die eben genannten<br />

Faktoren im Text zu Tage treten, desto mehr wird dieser Ausgangswert vermindert. Ein<br />

Text gilt als geeignet für eine automatische Übersetzung, wenn sein LTI einen Mindestwert<br />

übertrifft. Am Ende der Bewertung wird dem Autor die Übersetzbarkeit seines Textes<br />

zusammen mit relativ allgemein gehaltenen Verbesserungsvorschlägen präsentiert.<br />

3.3.2. Translation Confidence Index<br />

1999, fünf Jahre nach dem LTI, wurde bei IBM der Translation Confidence Index (TCI)<br />

fertiggestellt [Ber99]. Er wird während der Übersetzung eines Textes ermittelt und danach<br />

für jeden einzelnen Satz angezeigt. Dazu wird das Vertrauen in die bereits erstellte Übersetzung<br />

mit Werten zwischen 0 (sehr gering) und 100 (sehr hoch) angegeben. Dies ist somit<br />

auch ein nachträglich erstelltes Maß für die Übersetzbarkeit. Fällt nun ein Satz unter eine<br />

bestimmte Schwelle, bietet es sich an, ihn in der Ausgangssprache zu überarbeiten und<br />

dann erneut übersetzen zu lassen, um den Nachbearbeitungsaufwand zu minimieren. Die<br />

Genauigkeit bei einer Aufteilung in akzeptable und unbrauchbare Übersetzungen (Grenze<br />

bei 70 Punkten) beträgt über 70 Prozent [Ber99]. Der TCI kann auf beliebige englische<br />

Texte angewandt werden, die ins Deutsche übersetzt werden sollen.<br />

Im Gegensatz zum LTI betrachtet der TCI nicht nur bestimmte Textmerkmale wie zum<br />

Beispiel Präpositionalphrasen oder unbekannte Wörter, sondern auch, wie oft das jeweilige<br />

Übsersetzungsprogramm, in das die TCI-Bewertung integriert wurde, aus verschiedenen<br />

Möglichkeiten auswählen musste. Aus dem Zusammenspiel beider Faktoren werden dann<br />

die <strong>von</strong> 100 abzuziehenden Strafpunkte errechnet.<br />

3.3.3. Translatability Checker<br />

Einen dritten Ansatz, der im Jahre 2001 entwickelt wurde, stellt der sogenannte Translatability<br />

Checker (TC) dar [JU01]. Hierbei handelt es sich um ein Programm, das sowohl<br />

einzelne Sätze wie auch den gesamten Text beurteilt und anschließend satzweise eine<br />

Analyse mit detaillierten Hinweisen auf mögliche Probleme liefert. Allerdings konzentriert<br />

der TC sich ausschließlich auf englische Texte. Bei der Bewertung wird zwischen<br />

allgemeingültigen und für das jeweilige MÜ-System spezifischen Kritierien unterschieden.<br />

Als allgemeine Kriterien, die die Übersetzbarkeit negativ beeinträchtigen, gelten:<br />

• Abwesenheit eines Verbs,<br />

• Abwesenheit eines finiten Verbs,<br />

26

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!