Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
5.1. Allgemeine Textmerkmale<br />
• Vom ersten zum dritten Textkorpus nimmt die Wortanzahl um 286% zu, während<br />
die absolute Fehlerzahl infolge der Übersetzungen um 498% steigt.<br />
• Vom zweiten zum dritten Textkorpus nimmt die Wortanzahl um 75% zu, während<br />
die absolute Fehlerzahl infolge der Übersetzungen um 99% steigt.<br />
Der Schluss liegt also nahe, dass eine steigende Satzlänge die Fehlerhäufigkeit der Übersetzung<br />
stark erhöht und somit die Übersetzbarkeit verringert.<br />
5.1.2. Nebensätze (Relativsätze)<br />
Nebensätze sind ein wichtiger Bestandteil jedes längeren Textes und tragen erheblich zu<br />
dessen semantischer Gliederung bei. Durch ihr Auftreten erhöht sich die Komplexität<br />
der Satzstruktur. Es liegt daher nahe, dass Nebensätze zu einer Erhöhung der Fehlerrate<br />
beitragen. Auch der Translatability Checker [JU01] verwendet sie als Indiz für schlechtere<br />
Übersetzbarkeit<br />
Vorgehensweise<br />
Um zu überprüfen, wie es sich mit Nebensätzen tatsächlich verhält, wurde zunächst ein<br />
Textkorpus mit 100 Sätzen aus der deutschsprachigen Wikipedia erstellt, die allesamt<br />
mindestens einen Relativsatz aufwiesen, und ein zweiter, in dem die Relativsätze aus<br />
diesen Sätzen entfernt wurden. Dass Relativsätze als Repräsentanten für Nebensätze im<br />
Allgemeinen ausgewählt wurden, hat im wesentlichen einen Grund:<br />
Relativsätze sind die wohl am schwersten zu übersetzende Art <strong>von</strong> Nebensätzen in der<br />
deutschen Sprache. Sie haben durch das einleitende Relativpronomen mindestens einen<br />
Bezug zu einem Satzteil des übergeordneten Satzes, der bei der Übersetzung beachtet werden<br />
muss. Bei einem Temporalsatz reicht es beispielsweise, die einleitende Konjunktion,<br />
etwa nachdem, zu erkennen und dann mit einem der englischen Äquivalente, etwa after,<br />
wiederzugeben. Bei einem Relativsatz dagegen muss, auch wenn das englische System <strong>von</strong><br />
Relativpronomen gegenüber dem deutschen stark vereinfacht ist, beachtet werden, in welchem<br />
Kasus das deutsche Relativpronomen steht (der Abgleich <strong>von</strong> Genus und Numerus<br />
entfällt im Englischen) und ob es belebt oder unbelebt ist. So können nur Relativsätze im<br />
Englischen mit who beginnen, wenn das Bezugswort belebt ist, ansonsten muss entweder<br />
which oder that eingesetzt werden. Und nur, falls das deutsche Relativpronomen im Dativ<br />
oder Akkusativ steht, kann bei einem belebten Bezugswort whom verwendet werden. Nur<br />
bei Genitiven darf hingegen – ob belebt oder unbelebt – whose benutzt werden.<br />
Wenn also Nebensätze tatsächlich einen negativen Effekt auf die Übersetzungsqualität<br />
haben, wird dieser bei Relativsätzen voraussichtlich am stärksten ausfallen. Umgekehrt<br />
ist bei einer deutlichen Beeinflussung der Fehlerzahl durch Relativsätze auch damit zu<br />
rechnen, dass andere Nebensätze Einfluss haben, weil auch sie über einige, die Übersetzung<br />
erschwerende Merkmale <strong>von</strong> Relativsätzen verfügen, wie etwa die veränderte Wortstellung<br />
im Deutschen mit dem Prädikat am Ende.<br />
Untersuchungsergebnisse<br />
Fehlerhäufigkeit Das Resultat der Fehleranalyse (siehe Tabelle 5.2) zeigt deutlich, dass<br />
Relativsätze geringe, aber spürbare Auswirkungen auf die Fehlerhäufigkeit bei der Über-<br />
39