Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
3. Ansätze zur Lösung der Übersetzungsprobleme<br />
• zu lange Sätze,<br />
• Homographen,<br />
• Fragen,<br />
• kurze Parenthesen,<br />
• nicht gefundene/vorhandene Wörter und<br />
• Mehrdeutigkeiten.<br />
Einem Text wird zu Beginn des Bewertungsprozesses zunächst willkürlich ein Wert <strong>von</strong><br />
7 als Ausgangswert für seine Übersetzbarkeit zugewiesen. Je stärker die eben genannten<br />
Faktoren im Text zu Tage treten, desto mehr wird dieser Ausgangswert vermindert. Ein<br />
Text gilt als geeignet für eine automatische Übersetzung, wenn sein LTI einen Mindestwert<br />
übertrifft. Am Ende der Bewertung wird dem Autor die Übersetzbarkeit seines Textes<br />
zusammen mit relativ allgemein gehaltenen Verbesserungsvorschlägen präsentiert.<br />
3.3.2. Translation Confidence Index<br />
1999, fünf Jahre nach dem LTI, wurde bei IBM der Translation Confidence Index (TCI)<br />
fertiggestellt [Ber99]. Er wird während der Übersetzung eines Textes ermittelt und danach<br />
für jeden einzelnen Satz angezeigt. Dazu wird das Vertrauen in die bereits erstellte Übersetzung<br />
mit Werten zwischen 0 (sehr gering) und 100 (sehr hoch) angegeben. Dies ist somit<br />
auch ein nachträglich erstelltes Maß für die Übersetzbarkeit. Fällt nun ein Satz unter eine<br />
bestimmte Schwelle, bietet es sich an, ihn in der Ausgangssprache zu überarbeiten und<br />
dann erneut übersetzen zu lassen, um den Nachbearbeitungsaufwand zu minimieren. Die<br />
Genauigkeit bei einer Aufteilung in akzeptable und unbrauchbare Übersetzungen (Grenze<br />
bei 70 Punkten) beträgt über 70 Prozent [Ber99]. Der TCI kann auf beliebige englische<br />
Texte angewandt werden, die ins Deutsche übersetzt werden sollen.<br />
Im Gegensatz zum LTI betrachtet der TCI nicht nur bestimmte Textmerkmale wie zum<br />
Beispiel Präpositionalphrasen oder unbekannte Wörter, sondern auch, wie oft das jeweilige<br />
Übsersetzungsprogramm, in das die TCI-Bewertung integriert wurde, aus verschiedenen<br />
Möglichkeiten auswählen musste. Aus dem Zusammenspiel beider Faktoren werden dann<br />
die <strong>von</strong> 100 abzuziehenden Strafpunkte errechnet.<br />
3.3.3. Translatability Checker<br />
Einen dritten Ansatz, der im Jahre 2001 entwickelt wurde, stellt der sogenannte Translatability<br />
Checker (TC) dar [JU01]. Hierbei handelt es sich um ein Programm, das sowohl<br />
einzelne Sätze wie auch den gesamten Text beurteilt und anschließend satzweise eine<br />
Analyse mit detaillierten Hinweisen auf mögliche Probleme liefert. Allerdings konzentriert<br />
der TC sich ausschließlich auf englische Texte. Bei der Bewertung wird zwischen<br />
allgemeingültigen und für das jeweilige MÜ-System spezifischen Kritierien unterschieden.<br />
Als allgemeine Kriterien, die die Übersetzbarkeit negativ beeinträchtigen, gelten:<br />
• Abwesenheit eines Verbs,<br />
• Abwesenheit eines finiten Verbs,<br />
26