27.10.2014 Aufrufe

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

5. Untersuchung der Textmerkmale auf Fehlerrelevanz<br />

Untersuchungsergebnisse<br />

Fehlerhäufigkeit Das Ergebnis war überaus unerwartet, wie Tabelle 5.9 zeigt: Zwar sank<br />

die Fehlerhäufigkeit <strong>von</strong> der Übersetzung des originalen zu der des bearbeiteten Textkorpus<br />

<strong>von</strong> 0, 2180 Fehlern pro Wort auf nur noch 0, 1913, allerdings bei stark erhöhter<br />

Wortzahl (statt 1908 nun 2404). Absolut gesehen nahm die Fehlerzahl aber <strong>von</strong> 832 auf<br />

920 zu, das heißt, durch das Umformulieren komplizierter Komposita sind 88 Fehler hinzugekommen.<br />

Dies entspricht einer Zunahme <strong>von</strong> 10, 58 Prozent.<br />

Trotz der Seltenheit und Komplexität (minimal 30 Zeichen) der ausgewählten Komposita<br />

nützt es also nichts, auf sie zu verzichten. Eine derartige Überarbeitung eines Textes<br />

erhöht den Nachbearbeitungsaufwand sogar noch und ist daher kontraproduktiv.<br />

Satzart Wörter Fehler ∅ Fehler pro Wort 12<br />

Original 1908 832 0,2180<br />

Bearbeitet 2404 920 0,1913<br />

Tabelle 5.9.: Nominalkomposita und Fehlerhäufigkeit<br />

Veränderungen der Fehlerzahl Wie sich die Fehlerzahl verändert, wenn man Zahl und<br />

Komplexität der Nominalkomposita reduziert, zeigt Abbildung 5.9. Die grüne Linie steht<br />

dabei für die Ergebnisse mit Babel Fish, die blaue für Personal Translator 2006 und die<br />

rote für das aggregierte Gesamtergebnis. Die durchschnittliche Änderung der Fehlerzahl<br />

beträgt 0, 44 Fehler pro Satz, jeder bearbeitete Satz weist also im Durchschnitt 0, 44 Fehler<br />

mehr auf als das Original.<br />

Von den insgesamt 200 Übersetzungen des zweiten Korpus zeigten 71 keine Veränderung<br />

der Fehlerzahl gegenüber dem Original. Bei 39 Übersetzungen kam es zu einer Abnahme<br />

der Fehlerzahl, da<strong>von</strong> 27-mal um einen Fehler, fünfmal zum zwei Fehler, sechsmal um drei<br />

Fehler und einmal um fünf Fehler. Die restlichen 90 Übersetzungen der bearbeiteten Sätze<br />

lieferten schlechtere Ergebnisse als die Originale, wo<strong>von</strong> 55 um einen Fehler zulegten, 19<br />

um zwei Fehler, elf um drei Fehler. Immerhin drei Sätze enthielten nach der Bearbeitung<br />

sogar vier Fehler mehr und zwei sogar fünf Fehler.<br />

Erklärungsversuche Die Zunahme der Fehlerzahl bei den Übersetzungen des bearbeiteten<br />

Textkorpus war das überraschendste Ergebnis der gesamten Testreihen. Es scheint<br />

in der Tat, als hätten beide Programme gelernt, mit derartigen Wörtern umzugehen.<br />

Verweigerte Übersetzungen <strong>von</strong> Komposita kamen nur in den seltensten Fällen vor.<br />

Vielfach war statt dessen zu beobachten, dass beide Programme unbekannte Wörter korrekt<br />

in ihre Bestandteile zerlegten und diese dann einfach übersetzten, manchmal mit<br />

weniger Erfolg, manchmal mit mehr Erfolg, wobei Personal Translator 2006 alles in allem<br />

weniger Probleme zu haben schien als Babel Fish. Personal Translator 2006 etwa<br />

übersetzte Stabhochsprungvizeweltmeisterin korrekt mit pole vault vice-world champion,<br />

während Babel Fish mit staff high jump vice-world champion zwar eine äußerst wörtliche,<br />

jedoch auch äußerst falsche Übersetzung präsentierte. Und ein Steuerberater bleibt auf<br />

Englisch immer noch ein tax advisor, auch wenn beide MÜ-<strong>Systeme</strong> tax counsel oder tax<br />

consultant vorschlugen.<br />

12 Zur Berechnung der Fehlerzahlen siehe Abschnitt 4.4.1, letzten Absatz.<br />

56

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!