27.10.2014 Aufrufe

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

5.3. Signifikanz der Ergebnisse<br />

Nebensätze (Relativsätze)<br />

In den übersetzten Textkorpora zu Nebensätzen im Allgemeinen und Relativsätzen im<br />

Speziellen waren keine bzw. recht geringe Veränderungen der Fehlerzahl zu beobachten.<br />

Die Beseitigung <strong>von</strong> Nebensätzen brachte bei einer Summe der Fehlerzahländerungen <strong>von</strong><br />

n = 82 keine Veränderung der Gesamtfehlerzahl oder k = 41 Fehlerzahlzunahmen bei<br />

41 -abnahmen in den Übersetzungen, deren Fehlerzahl sich veränderte. Die Beseitigung<br />

<strong>von</strong> Relativsätzen brachte dagegen 21 Fehler weniger, wobei es in der Summe insgesamt<br />

n = 175 Fehlerzahländerungen gab, <strong>von</strong> denen k = 98 auf die Sätze mit verringerter<br />

Fehlerzahl entfielen.<br />

Für die Nebensätze ergibt sich daraus eine Wahrscheinlichkeit <strong>von</strong> P (X ≥ 41) ≈ 0, 54394,<br />

dass in den Sätzen mit Fehlerabnahme mindestens k Fehler entfallen, wenn H 0 gilt. Die<br />

Gefahr einer fälschlichen Zurückweisung <strong>von</strong> H 0 ist daher viel zu groß, so dass sie beibehalten<br />

wird und Nebensätze aller Art nicht in den Übersetzbarkeitsindex aufgenommen<br />

werden. Bei Relativsätzen im Speziellen ergibt sich diesbezüglich mit k = 98 ein Wert <strong>von</strong><br />

P (X ≥ 98) ≈ 0, 06500. Obwohl diese Wahrscheinlichkeit größer ist als das Signifikanzniveau<br />

α = 0, 05 und Relativsätze die Übersetzbarkeit somit nicht signifikant verschlechtern,<br />

werden sie in den Index aufgenommen. Der Grund ist, dass der Wert der Verteilungsfunktion<br />

nur sehr knapp über dem Signifikanzniveau liegt (bereits bei k = 99 wäre das Ergebnis<br />

signifikant) und gleichzeitig Relativsätze in anderen Übersetzbarkeitsmaßen berücksichtigt<br />

werden (vgl. Abschnitt 3.3). Berücksichtigt man dies, so ist die Wahrscheinlichkeit,<br />

die Gegenhypothese H 1 zu Unrecht nicht anzunehmen, trotz des nicht-signifikanten Testergebnisses<br />

viel zu groß. Allerdings ist der Einfluss <strong>von</strong> Relativsätzen im Vergleich zu<br />

anderen in den Index aufgenommenen Textmerkmalen eher gering, was sich auch bei der<br />

Konstruktion des Indexes niederschlagen wird (vgl. Kapitel 6). Dementsprechend wird<br />

selbst eine möglicherweise doch fälschliche Aufnahme in den Index nicht zu großen Verzerrungen<br />

führen.<br />

Mehrdeutigkeit<br />

Insgesamt nahm die Fehlerzahl der Übersetzungen nach dem Entfernen <strong>von</strong> Mehrdeutigkeiten<br />

um 103 Fehler ab. Dabei gab es 92 Sätze ohne Veränderung der Fehlerzahl, 23 mit<br />

einer Erhöhung der Fehlerzahl und 85 mit einer Verringerung der Fehlerzahl. In diesen<br />

108 Sätzen mit veränderter Fehlerzahl kamen in den verschlechterten Sätzen 32 Fehler<br />

hinzu, k = 135 fielen in den verbesserten Sätzen weg, so dass sich als Stichprobenumfang<br />

der Fehlerzahlveränderungen n = 167 ergibt.<br />

Daraus folgt (auf fünf Stellen gerundet): P (X ≥ 135) ≈ 0, 00000. Die Fehlerzahlabnahme<br />

ist also sogar höchst signifikant, die Wahrscheinlichkeit, dass die Nullhypothese zu Unrecht<br />

verworfen wird, dementsprechend verschwindend gering. Daher werden Mehrdeutigkeiten<br />

in den Übersetzbarkeitsindex aufgenommen.<br />

Elliptischer Schreibstil<br />

Auf beide Textkorpora bezogen, ergab sich beim Entfernen <strong>von</strong> Ellipsen eine Abnahme<br />

um insgesamt fünf Fehler in den Übersetzungen. Insgesamt summierten sich die Fehlerzahlveränderungen<br />

auf n = 187, wo<strong>von</strong> k = 96 Fehlerzahlverringerungen waren.<br />

Somit ergab sich für das Komplement der Verteilungsfunktion ein Funktionswert <strong>von</strong><br />

P (X ≥ 96) ≈ 0, 38489. Die (sehr geringe) Fehlerzahlabnahme ist also bei weitem nicht<br />

61

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!