Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
5.1. Allgemeine Textmerkmale<br />
die Erkennung eines Relativsatzes zweifelsohne erschwert. Als Beispiel für beides diene<br />
der Satz Das Buch, das Peter kaufen möchte, kostet 10 Euro. mit seiner spanischen Übersetzung<br />
El libro que Peter quiere comprar cuesta 10 euros. und dem englischen Äquivalent<br />
The book Peter wants to buy costs 10 euros. Im Deutschen ist der Relativsatz durch Kommata<br />
und Pronomen abgegrenzt. Im Spanischen fehlen bereits die Kommata, und im<br />
Englischen fehlt auch noch das Pronomen.<br />
Veränderungen der Fehlerzahl Abbildung 5.1 zeigt, wie die Veränderungen der Fehlerzahlen<br />
bei der Gegenüberstellung der Übersetzungen der Originalsätze und der <strong>von</strong><br />
Relativsätzen befreiten Sätze für die beiden MÜ-Programme und insgesamt verteilt sind.<br />
Die durchschnittliche Veränderung während der Untersuchung betrug −0, 11 Fehler, das<br />
heißt, etwa jeder zehnte Satz wird im Durchschnitt durch eine Bearbeitung besser übersetzbar.<br />
Im Vergleich zeigten 87 Übersetzungen überhaupt keine Veränderungen, 57-mal verschlechterten<br />
sich die Übersetzungen, da<strong>von</strong> 41-mal um einen Fehler, 13-mal um zwei,<br />
zweimal um drei und sogar einmal um gleich vier Fehler. Nur 56-mal verbesserte sich<br />
das Ergebnis, 31-mal gab es einen Fehler weniger, 15-mal zwei, sechsmal drei, immerhin<br />
zweimal vier, einmal fünf und sogar einmal sechs Fehler weniger.<br />
Untersuchung anderer Arten <strong>von</strong> Nebensätzen Um zu überprüfen, ob es sich mit<br />
anderen Nebensätzen auch anders als ursprünglich erwartet verhält, wurden die anderen<br />
Arten <strong>von</strong> Nebensätzen zusätzlich auf ihre Auswirkungen auf die Fehlerzahl untersucht.<br />
Der eher geringe Einfluss der Relativsätze auf die Übersetzbarkeit war so überraschend,<br />
dass Klarheit <strong>von</strong>nöten war, ob dies nur eine Ausnahme darstellt oder ob andere Arten<br />
<strong>von</strong> Nebensätzen vielleicht sogar noch weniger Einfluss auf die Übersetzbarkeit haben.<br />
Satzart Wörter Fehler ∅ Fehler pro Wort 3<br />
Mit Nebensätzen 859 320 0,1863<br />
Mit weniger Nebensätzen 839 320 0,1907<br />
Tabelle 5.3.: Andere Nebensätze und Fehlerhäufigkeit<br />
Dazu wurden wieder zwei Textkorpora gebildet, die allerdings diesmal kleiner ausfielen<br />
und jeweils 40 Sätze enthielten, weil aufgrund der zuvor begründeten Hypothese, dass<br />
Nebensätze im Allgemeinen sich ähnlich verhalten wie Relativsätze im Speziellen, trotz<br />
des unerwarteten Ergebnisses für Relativsätze kein in großem Maßstab anderes Resultat<br />
für andere Arten <strong>von</strong> Nebensätzen zu erwarten war. Im ersten Korpus besaßen alle Sätze<br />
mindestens einen Nebensatz, während sie im zweiten Korpus <strong>von</strong> mindestens einem Nebensatz<br />
befreit wurden. In vielen Fällen konnten auch sämtliche Nebensätze vermieden<br />
werden, ohne den Sinn des Satzes zu enstellen. Bei dieser Analyse der Übersetzungen<br />
fiel das Ergebnis allerdings genauso unerwartet wie bei den Relativsätzen aus. Die zentrale<br />
Kennziffer, die absolute Fehlerzahl, änderte sich nämlich überhaupt nicht; vielmehr<br />
wiesen beide Textkorpora 320 Fehler auf, die Veränderung ist somit 0, wie man Tabelle<br />
5.3 entnehmen kann. Lediglich die Fehlerzahl pro Wort nahm marginal zu, weil sich die<br />
Wortanzahl im bearbeiteten Textkorpus leicht verringert hatte.<br />
3 Zur Berechnung der Fehlerzahlen siehe Abschnitt 4.4.1, letzten Absatz.<br />
41