Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
5. Untersuchung der Textmerkmale auf Fehlerrelevanz<br />
Abbildung 5.6.: Absolute Veränderungen der Fehleranzahl beim Ausfüllen <strong>von</strong> Ellipsen für<br />
die einzelnen Übersetzungsprogramme (Babel Fish grün, Personal Translator<br />
2006 blau) und aufsummiert (rot, mit Werteangaben)<br />
überprüft, weil sie als besonders schwierig zu handhaben einzuschätzen war. Dabei wurde<br />
gezählt, wie viele Fehler direkt auf diese Form <strong>von</strong> Auslassungen zurückzuführen waren,<br />
wobei vorwiegend falsch gewählte Wörter berücksichtigt wurden, weil andere Fehler wie<br />
beispielsweise eine Verfälschung der Wortstellung im übersetzen Satz auch auf andere<br />
Änderungen am Ausgangssatz zurückzuführen sein könnten.<br />
(Fehler verteilt auf 61 Sätze) Fehler vorher Fehler nachher Veränderung<br />
Babel Fish 46 34 −12 ≡ −26, 09%<br />
Personal Translator 2006 39 28 −11 ≡ −28, 21%<br />
Gesamt 85 62 −23 ≡ −27, 06%<br />
Tabelle 5.6.: Fehler vor und nach der Beseitigung abgetrennter Kompositionsglieder<br />
Insgesamt traten in 61 der 100 Ausgangssätze derartige Ellipsen auf, die insgesamt 85<br />
Übersetzungsfehler verursachten (siehe Tabelle 5.6). Nach der Bearbeitung wurden nur<br />
noch 62 Fehler beobachtet, was einer Abnahme um 23 Fehler oder um 27, 06 Prozent<br />
entspricht.<br />
Allerdings ist die Auswirkung des Weglassens <strong>von</strong> abgetrennten Kompositionsgliedern<br />
wesentlich geringer, wenn man berücksichtigt, dass die 61 Sätze, in denen diese Ellipsen<br />
vorkamen, im ersten, unbearbeiteten Korpus insgesamt 532 Fehler aufwiesen. Dennoch<br />
verbleibt eine spürbare Reduktion der Gesamtfehlerzahl um 23 · 100 = 4, 32%. Es scheint<br />
532<br />
also sehr sinnvoll zu sein, auf diese spezielle Form der Ellipsen zu verzichten, um Fehler<br />
zu vermeiden.<br />
Erklärungsversuche Insgesamt sind die Fehlerzahlen pro Wort in beiden übersetzten<br />
Textkorpora relativ hoch. Und in der Tat werden durch Ellipsen erwartungsgemäß zahlreiche<br />
Fehler verursacht (allein 85 durch abgetrennte Kompositionsglieder, wie bereits<br />
48