27.10.2014 Aufrufe

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

5. Untersuchung der Textmerkmale auf Fehlerrelevanz<br />

Abbildung 5.6.: Absolute Veränderungen der Fehleranzahl beim Ausfüllen <strong>von</strong> Ellipsen für<br />

die einzelnen Übersetzungsprogramme (Babel Fish grün, Personal Translator<br />

2006 blau) und aufsummiert (rot, mit Werteangaben)<br />

überprüft, weil sie als besonders schwierig zu handhaben einzuschätzen war. Dabei wurde<br />

gezählt, wie viele Fehler direkt auf diese Form <strong>von</strong> Auslassungen zurückzuführen waren,<br />

wobei vorwiegend falsch gewählte Wörter berücksichtigt wurden, weil andere Fehler wie<br />

beispielsweise eine Verfälschung der Wortstellung im übersetzen Satz auch auf andere<br />

Änderungen am Ausgangssatz zurückzuführen sein könnten.<br />

(Fehler verteilt auf 61 Sätze) Fehler vorher Fehler nachher Veränderung<br />

Babel Fish 46 34 −12 ≡ −26, 09%<br />

Personal Translator 2006 39 28 −11 ≡ −28, 21%<br />

Gesamt 85 62 −23 ≡ −27, 06%<br />

Tabelle 5.6.: Fehler vor und nach der Beseitigung abgetrennter Kompositionsglieder<br />

Insgesamt traten in 61 der 100 Ausgangssätze derartige Ellipsen auf, die insgesamt 85<br />

Übersetzungsfehler verursachten (siehe Tabelle 5.6). Nach der Bearbeitung wurden nur<br />

noch 62 Fehler beobachtet, was einer Abnahme um 23 Fehler oder um 27, 06 Prozent<br />

entspricht.<br />

Allerdings ist die Auswirkung des Weglassens <strong>von</strong> abgetrennten Kompositionsgliedern<br />

wesentlich geringer, wenn man berücksichtigt, dass die 61 Sätze, in denen diese Ellipsen<br />

vorkamen, im ersten, unbearbeiteten Korpus insgesamt 532 Fehler aufwiesen. Dennoch<br />

verbleibt eine spürbare Reduktion der Gesamtfehlerzahl um 23 · 100 = 4, 32%. Es scheint<br />

532<br />

also sehr sinnvoll zu sein, auf diese spezielle Form der Ellipsen zu verzichten, um Fehler<br />

zu vermeiden.<br />

Erklärungsversuche Insgesamt sind die Fehlerzahlen pro Wort in beiden übersetzten<br />

Textkorpora relativ hoch. Und in der Tat werden durch Ellipsen erwartungsgemäß zahlreiche<br />

Fehler verursacht (allein 85 durch abgetrennte Kompositionsglieder, wie bereits<br />

48

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!