Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
5.3. Signifikanz der Ergebnisse<br />
Nebensätze (Relativsätze)<br />
In den übersetzten Textkorpora zu Nebensätzen im Allgemeinen und Relativsätzen im<br />
Speziellen waren keine bzw. recht geringe Veränderungen der Fehlerzahl zu beobachten.<br />
Die Beseitigung <strong>von</strong> Nebensätzen brachte bei einer Summe der Fehlerzahländerungen <strong>von</strong><br />
n = 82 keine Veränderung der Gesamtfehlerzahl oder k = 41 Fehlerzahlzunahmen bei<br />
41 -abnahmen in den Übersetzungen, deren Fehlerzahl sich veränderte. Die Beseitigung<br />
<strong>von</strong> Relativsätzen brachte dagegen 21 Fehler weniger, wobei es in der Summe insgesamt<br />
n = 175 Fehlerzahländerungen gab, <strong>von</strong> denen k = 98 auf die Sätze mit verringerter<br />
Fehlerzahl entfielen.<br />
Für die Nebensätze ergibt sich daraus eine Wahrscheinlichkeit <strong>von</strong> P (X ≥ 41) ≈ 0, 54394,<br />
dass in den Sätzen mit Fehlerabnahme mindestens k Fehler entfallen, wenn H 0 gilt. Die<br />
Gefahr einer fälschlichen Zurückweisung <strong>von</strong> H 0 ist daher viel zu groß, so dass sie beibehalten<br />
wird und Nebensätze aller Art nicht in den Übersetzbarkeitsindex aufgenommen<br />
werden. Bei Relativsätzen im Speziellen ergibt sich diesbezüglich mit k = 98 ein Wert <strong>von</strong><br />
P (X ≥ 98) ≈ 0, 06500. Obwohl diese Wahrscheinlichkeit größer ist als das Signifikanzniveau<br />
α = 0, 05 und Relativsätze die Übersetzbarkeit somit nicht signifikant verschlechtern,<br />
werden sie in den Index aufgenommen. Der Grund ist, dass der Wert der Verteilungsfunktion<br />
nur sehr knapp über dem Signifikanzniveau liegt (bereits bei k = 99 wäre das Ergebnis<br />
signifikant) und gleichzeitig Relativsätze in anderen Übersetzbarkeitsmaßen berücksichtigt<br />
werden (vgl. Abschnitt 3.3). Berücksichtigt man dies, so ist die Wahrscheinlichkeit,<br />
die Gegenhypothese H 1 zu Unrecht nicht anzunehmen, trotz des nicht-signifikanten Testergebnisses<br />
viel zu groß. Allerdings ist der Einfluss <strong>von</strong> Relativsätzen im Vergleich zu<br />
anderen in den Index aufgenommenen Textmerkmalen eher gering, was sich auch bei der<br />
Konstruktion des Indexes niederschlagen wird (vgl. Kapitel 6). Dementsprechend wird<br />
selbst eine möglicherweise doch fälschliche Aufnahme in den Index nicht zu großen Verzerrungen<br />
führen.<br />
Mehrdeutigkeit<br />
Insgesamt nahm die Fehlerzahl der Übersetzungen nach dem Entfernen <strong>von</strong> Mehrdeutigkeiten<br />
um 103 Fehler ab. Dabei gab es 92 Sätze ohne Veränderung der Fehlerzahl, 23 mit<br />
einer Erhöhung der Fehlerzahl und 85 mit einer Verringerung der Fehlerzahl. In diesen<br />
108 Sätzen mit veränderter Fehlerzahl kamen in den verschlechterten Sätzen 32 Fehler<br />
hinzu, k = 135 fielen in den verbesserten Sätzen weg, so dass sich als Stichprobenumfang<br />
der Fehlerzahlveränderungen n = 167 ergibt.<br />
Daraus folgt (auf fünf Stellen gerundet): P (X ≥ 135) ≈ 0, 00000. Die Fehlerzahlabnahme<br />
ist also sogar höchst signifikant, die Wahrscheinlichkeit, dass die Nullhypothese zu Unrecht<br />
verworfen wird, dementsprechend verschwindend gering. Daher werden Mehrdeutigkeiten<br />
in den Übersetzbarkeitsindex aufgenommen.<br />
Elliptischer Schreibstil<br />
Auf beide Textkorpora bezogen, ergab sich beim Entfernen <strong>von</strong> Ellipsen eine Abnahme<br />
um insgesamt fünf Fehler in den Übersetzungen. Insgesamt summierten sich die Fehlerzahlveränderungen<br />
auf n = 187, wo<strong>von</strong> k = 96 Fehlerzahlverringerungen waren.<br />
Somit ergab sich für das Komplement der Verteilungsfunktion ein Funktionswert <strong>von</strong><br />
P (X ≥ 96) ≈ 0, 38489. Die (sehr geringe) Fehlerzahlabnahme ist also bei weitem nicht<br />
61