27.10.2014 Aufrufe

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

5.1. Allgemeine Textmerkmale<br />

die Erkennung eines Relativsatzes zweifelsohne erschwert. Als Beispiel für beides diene<br />

der Satz Das Buch, das Peter kaufen möchte, kostet 10 Euro. mit seiner spanischen Übersetzung<br />

El libro que Peter quiere comprar cuesta 10 euros. und dem englischen Äquivalent<br />

The book Peter wants to buy costs 10 euros. Im Deutschen ist der Relativsatz durch Kommata<br />

und Pronomen abgegrenzt. Im Spanischen fehlen bereits die Kommata, und im<br />

Englischen fehlt auch noch das Pronomen.<br />

Veränderungen der Fehlerzahl Abbildung 5.1 zeigt, wie die Veränderungen der Fehlerzahlen<br />

bei der Gegenüberstellung der Übersetzungen der Originalsätze und der <strong>von</strong><br />

Relativsätzen befreiten Sätze für die beiden MÜ-Programme und insgesamt verteilt sind.<br />

Die durchschnittliche Veränderung während der Untersuchung betrug −0, 11 Fehler, das<br />

heißt, etwa jeder zehnte Satz wird im Durchschnitt durch eine Bearbeitung besser übersetzbar.<br />

Im Vergleich zeigten 87 Übersetzungen überhaupt keine Veränderungen, 57-mal verschlechterten<br />

sich die Übersetzungen, da<strong>von</strong> 41-mal um einen Fehler, 13-mal um zwei,<br />

zweimal um drei und sogar einmal um gleich vier Fehler. Nur 56-mal verbesserte sich<br />

das Ergebnis, 31-mal gab es einen Fehler weniger, 15-mal zwei, sechsmal drei, immerhin<br />

zweimal vier, einmal fünf und sogar einmal sechs Fehler weniger.<br />

Untersuchung anderer Arten <strong>von</strong> Nebensätzen Um zu überprüfen, ob es sich mit<br />

anderen Nebensätzen auch anders als ursprünglich erwartet verhält, wurden die anderen<br />

Arten <strong>von</strong> Nebensätzen zusätzlich auf ihre Auswirkungen auf die Fehlerzahl untersucht.<br />

Der eher geringe Einfluss der Relativsätze auf die Übersetzbarkeit war so überraschend,<br />

dass Klarheit <strong>von</strong>nöten war, ob dies nur eine Ausnahme darstellt oder ob andere Arten<br />

<strong>von</strong> Nebensätzen vielleicht sogar noch weniger Einfluss auf die Übersetzbarkeit haben.<br />

Satzart Wörter Fehler ∅ Fehler pro Wort 3<br />

Mit Nebensätzen 859 320 0,1863<br />

Mit weniger Nebensätzen 839 320 0,1907<br />

Tabelle 5.3.: Andere Nebensätze und Fehlerhäufigkeit<br />

Dazu wurden wieder zwei Textkorpora gebildet, die allerdings diesmal kleiner ausfielen<br />

und jeweils 40 Sätze enthielten, weil aufgrund der zuvor begründeten Hypothese, dass<br />

Nebensätze im Allgemeinen sich ähnlich verhalten wie Relativsätze im Speziellen, trotz<br />

des unerwarteten Ergebnisses für Relativsätze kein in großem Maßstab anderes Resultat<br />

für andere Arten <strong>von</strong> Nebensätzen zu erwarten war. Im ersten Korpus besaßen alle Sätze<br />

mindestens einen Nebensatz, während sie im zweiten Korpus <strong>von</strong> mindestens einem Nebensatz<br />

befreit wurden. In vielen Fällen konnten auch sämtliche Nebensätze vermieden<br />

werden, ohne den Sinn des Satzes zu enstellen. Bei dieser Analyse der Übersetzungen<br />

fiel das Ergebnis allerdings genauso unerwartet wie bei den Relativsätzen aus. Die zentrale<br />

Kennziffer, die absolute Fehlerzahl, änderte sich nämlich überhaupt nicht; vielmehr<br />

wiesen beide Textkorpora 320 Fehler auf, die Veränderung ist somit 0, wie man Tabelle<br />

5.3 entnehmen kann. Lediglich die Fehlerzahl pro Wort nahm marginal zu, weil sich die<br />

Wortanzahl im bearbeiteten Textkorpus leicht verringert hatte.<br />

3 Zur Berechnung der Fehlerzahlen siehe Abschnitt 4.4.1, letzten Absatz.<br />

41

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!