27.10.2014 Aufrufe

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

5.1. Allgemeine Textmerkmale<br />

• Vom ersten zum dritten Textkorpus nimmt die Wortanzahl um 286% zu, während<br />

die absolute Fehlerzahl infolge der Übersetzungen um 498% steigt.<br />

• Vom zweiten zum dritten Textkorpus nimmt die Wortanzahl um 75% zu, während<br />

die absolute Fehlerzahl infolge der Übersetzungen um 99% steigt.<br />

Der Schluss liegt also nahe, dass eine steigende Satzlänge die Fehlerhäufigkeit der Übersetzung<br />

stark erhöht und somit die Übersetzbarkeit verringert.<br />

5.1.2. Nebensätze (Relativsätze)<br />

Nebensätze sind ein wichtiger Bestandteil jedes längeren Textes und tragen erheblich zu<br />

dessen semantischer Gliederung bei. Durch ihr Auftreten erhöht sich die Komplexität<br />

der Satzstruktur. Es liegt daher nahe, dass Nebensätze zu einer Erhöhung der Fehlerrate<br />

beitragen. Auch der Translatability Checker [JU01] verwendet sie als Indiz für schlechtere<br />

Übersetzbarkeit<br />

Vorgehensweise<br />

Um zu überprüfen, wie es sich mit Nebensätzen tatsächlich verhält, wurde zunächst ein<br />

Textkorpus mit 100 Sätzen aus der deutschsprachigen Wikipedia erstellt, die allesamt<br />

mindestens einen Relativsatz aufwiesen, und ein zweiter, in dem die Relativsätze aus<br />

diesen Sätzen entfernt wurden. Dass Relativsätze als Repräsentanten für Nebensätze im<br />

Allgemeinen ausgewählt wurden, hat im wesentlichen einen Grund:<br />

Relativsätze sind die wohl am schwersten zu übersetzende Art <strong>von</strong> Nebensätzen in der<br />

deutschen Sprache. Sie haben durch das einleitende Relativpronomen mindestens einen<br />

Bezug zu einem Satzteil des übergeordneten Satzes, der bei der Übersetzung beachtet werden<br />

muss. Bei einem Temporalsatz reicht es beispielsweise, die einleitende Konjunktion,<br />

etwa nachdem, zu erkennen und dann mit einem der englischen Äquivalente, etwa after,<br />

wiederzugeben. Bei einem Relativsatz dagegen muss, auch wenn das englische System <strong>von</strong><br />

Relativpronomen gegenüber dem deutschen stark vereinfacht ist, beachtet werden, in welchem<br />

Kasus das deutsche Relativpronomen steht (der Abgleich <strong>von</strong> Genus und Numerus<br />

entfällt im Englischen) und ob es belebt oder unbelebt ist. So können nur Relativsätze im<br />

Englischen mit who beginnen, wenn das Bezugswort belebt ist, ansonsten muss entweder<br />

which oder that eingesetzt werden. Und nur, falls das deutsche Relativpronomen im Dativ<br />

oder Akkusativ steht, kann bei einem belebten Bezugswort whom verwendet werden. Nur<br />

bei Genitiven darf hingegen – ob belebt oder unbelebt – whose benutzt werden.<br />

Wenn also Nebensätze tatsächlich einen negativen Effekt auf die Übersetzungsqualität<br />

haben, wird dieser bei Relativsätzen voraussichtlich am stärksten ausfallen. Umgekehrt<br />

ist bei einer deutlichen Beeinflussung der Fehlerzahl durch Relativsätze auch damit zu<br />

rechnen, dass andere Nebensätze Einfluss haben, weil auch sie über einige, die Übersetzung<br />

erschwerende Merkmale <strong>von</strong> Relativsätzen verfügen, wie etwa die veränderte Wortstellung<br />

im Deutschen mit dem Prädikat am Ende.<br />

Untersuchungsergebnisse<br />

Fehlerhäufigkeit Das Resultat der Fehleranalyse (siehe Tabelle 5.2) zeigt deutlich, dass<br />

Relativsätze geringe, aber spürbare Auswirkungen auf die Fehlerhäufigkeit bei der Über-<br />

39

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!