Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
6. Zusammenführung der Kriterien in einem Index<br />
die Fehlerzahlen pro Satz. Die Fehlerzahl pro Wort ist hier als Variable nicht relevant, weil<br />
ein kurzer Satz, dem genau dieselbe Übersetzbarkeit zugeordnet wird wie einem längeren,<br />
bei gleicher Anzahl tatsächlicher Fehler eine viel höhere Fehlerzahl pro Wort aufweist. Die<br />
Vergleichbarkeit ist somit nicht gegeben.<br />
Die 135 Sätze wurden also auf eine Korrelation zwischen Fehlerzahl und Indexwert hin<br />
untersucht. Zu diesem Zweck wurden die Indexwerte der Sätze in sieben Intervalle eingeteilt.<br />
Fünf dieser Intervalle umfassten fünf Punkte, nämlich 20 bis 25, weiter bis 30, bis<br />
35, bis 40 und bis 45 Punkte. Die Werte kleiner als 20 und größer gleich 45 bildeten jeweils<br />
eigene Intervalle. Den Intervallen wurden nun die zugehörigen aggregierten Fehlerzahlen<br />
zugeordnet und durch die Anzahl der Sätze im jeweiligen Bereich geteilt, so dass sich<br />
durchschnittliche Fehlerzahlen pro Satz ergaben, die <strong>von</strong> 2, 35 Fehlern bei Indexwerten<br />
unter 20 Punkten bis zu 6, 63 Fehlern pro Satz bei 45 und mehr Indexpunkten reichen.<br />
Die exakten Ergebnisse sind in Tabelle 6.2 aufgeführt.<br />
Wertebereich Indexwerte Anzahl Sätze Anzahl Fehler ∅ Fehler pro Satz<br />
1 0-20 17 40,0 2,35<br />
2 20-25 33 101,5 3,08<br />
3 25-30 26 77,0 2,96<br />
4 30-35 22 86,5 3,93<br />
5 35-40 14 71,0 5,07<br />
6 40-45 11 65,0 5,91<br />
7 ≥45 12 79,5 6,63<br />
Tabelle 6.2.: Zusammenhang zwischen Indexwert und Fehlerzahl pro Satz<br />
Die Werteintervalle des Indexes in der zweiten Spalte inkludieren dabei jeweils den unteren<br />
Grenzwert und schließen den oberen aus. Die Fehlerzahl in der vierten Spalte ist der<br />
Mittelwert der Summe der Fehler, die Personal Translator 2006 und Babel Fish bei der<br />
Übersetzung der Sätze, die in den jeweiligen Indexbereich fallen, verursacht haben.<br />
Abbildung 6.2.: Zusammenhang zwischen Indexwert und Fehlerzahl pro Satz<br />
70