Messung maschinellerÂ¨Ubersetzbarkeit von ... - Parallele Systeme

Weitere Magazine

Empfehlungen

Info

6. Zusammenführung der Kriterien in einem Index die Fehlerzahlen pro Satz. Die Fehlerzahl pro Wort ist hier als Variable nicht relevant, weil ein kurzer Satz, dem genau dieselbe Übersetzbarkeit zugeordnet wird wie einem längeren, bei gleicher Anzahl tatsächlicher Fehler eine viel höhere Fehlerzahl pro Wort aufweist. Die Vergleichbarkeit ist somit nicht gegeben. Die 135 Sätze wurden also auf eine Korrelation zwischen Fehlerzahl und Indexwert hin untersucht. Zu diesem Zweck wurden die Indexwerte der Sätze in sieben Intervalle eingeteilt. Fünf dieser Intervalle umfassten fünf Punkte, nämlich 20 bis 25, weiter bis 30, bis 35, bis 40 und bis 45 Punkte. Die Werte kleiner als 20 und größer gleich 45 bildeten jeweils eigene Intervalle. Den Intervallen wurden nun die zugehörigen aggregierten Fehlerzahlen zugeordnet und durch die Anzahl der Sätze im jeweiligen Bereich geteilt, so dass sich durchschnittliche Fehlerzahlen pro Satz ergaben, die von 2, 35 Fehlern bei Indexwerten unter 20 Punkten bis zu 6, 63 Fehlern pro Satz bei 45 und mehr Indexpunkten reichen. Die exakten Ergebnisse sind in Tabelle 6.2 aufgeführt. Wertebereich Indexwerte Anzahl Sätze Anzahl Fehler ∅ Fehler pro Satz 1 0-20 17 40,0 2,35 2 20-25 33 101,5 3,08 3 25-30 26 77,0 2,96 4 30-35 22 86,5 3,93 5 35-40 14 71,0 5,07 6 40-45 11 65,0 5,91 7 ≥45 12 79,5 6,63 Tabelle 6.2.: Zusammenhang zwischen Indexwert und Fehlerzahl pro Satz Die Werteintervalle des Indexes in der zweiten Spalte inkludieren dabei jeweils den unteren Grenzwert und schließen den oberen aus. Die Fehlerzahl in der vierten Spalte ist der Mittelwert der Summe der Fehler, die Personal Translator 2006 und Babel Fish bei der Übersetzung der Sätze, die in den jeweiligen Indexbereich fallen, verursacht haben. Abbildung 6.2.: Zusammenhang zwischen Indexwert und Fehlerzahl pro Satz 70
6.2. Überprüfung des Übersetzbarkeitsindexes Wie man erkennt, nimmt die Fehlerhäufigkeit bei steigenden Indexwerten zu. Es gibt zwar im dritten Intervall den Fall, dass die Fehlerzahl leicht geringer ist als im vorherigen Intervall, jedoch ist dieser Ausreißer nach unten nur sehr klein. Grafisch dargestellt ist das Ergebnis in Abbildung 6.2. Eine lineare Abhängigkeit lässt sich anhand des Verlaufs der Fehlerzahl bereits erahnen. Dementsprechend wurde zusätzlich eine lineare Regression auf den vorhandenen Werten durchgeführt, deren Gerade ebenfalls in der Abbildung eingezeichnet ist. Ihre Gleichung lautet auf drei Nachkommastellen gerundet y = 0, 736 · x + 1, 334. Die Variable x bezeichnet darin die von eins bis sieben durchnummerierten Wertebereiche, y die Fehlerzahl pro Satz. So ergibt sich etwa auf der Regressionsgeraden für das dritte Intervall ein Wert von 0, 736 · 3 + 1, 334 = 3, 542 Fehlern pro Satz. Das Bestimmtheitsmaß der Geraden beträgt R 2 ≈ 0, 96, was einen unerwartet hohen Wert und einen nahezu perfekten linearen Zusammenhang zwischen Indexintervallen und absoluter Fehlerzahl darstellt. Es besteht demnach kein Anlass, die Gewichte der in den Index einfließenden Textmerkmale oder die Satzlängenbewertung anzupassen. Die Übersetzbarkeitsfunktion wird daher unverändert in das zu erstellende Bewertungsprogramm übernommen. 71
Seite 1:
Messung maschineller Übersetzbarke
Seite 4 und 5:
Inhaltsverzeichnis Tabellenverzeich
Seite 6 und 7:
Inhaltsverzeichnis 7.4.3. Modellier
Seite 8 und 9:
Abbildungsverzeichnis 2.1. Schema f
Seite 10 und 11:
Teil I. Einführung 10
Seite 12 und 13:
1. Grundlagen der Arbeit Motivation
Seite 14 und 15:
2. Stand der Technik In den folgend
Seite 16 und 17:
2. Stand der Technik Sprache optimi
Seite 18 und 19:
2. Stand der Technik 2.4.1. Mehrdeu
Seite 20 und 21: 2. Stand der Technik Abgesehen von
Seite 22 und 23: 3. Ansätze zur Lösung der Überse
Seite 28 und 29: Teil II. Ein Modell zur Einschätzu
Seite 30 und 31: 4. Vorbereitende Maßnahmen auf fol
Seite 32 und 33: 4. Vorbereitende Maßnahmen der Unt
Seite 34 und 35: 4. Vorbereitende Maßnahmen überse
Seite 36 und 37: 4. Vorbereitende Maßnahmen Zusätz
Seite 38 und 39: 5. Untersuchung der Textmerkmale au
Seite 66 und 67: 6. Zusammenführung der Kriterien i
Seite 68 und 69: 6. Zusammenführung der Kriterien i
Seite 72 und 73: Teil III. MT Analyser: Automatische
Seite 74 und 75: 7. Modellierung von MT Analyser Ins
Seite 76 und 77: 7. Modellierung von MT Analyser auf
Seite 78 und 79: 7. Modellierung von MT Analyser Sat
Seite 80 und 81: 7. Modellierung von MT Analyser Dar
Seite 82 und 83: 7. Modellierung von MT Analyser fin
Seite 84 und 85: 7. Modellierung von MT Analyser Kla
Seite 86 und 87: 8. Implementierung von MT Analyser
Seite 116 und 117: 9. Zusammenfassung der Ergebnisse D
Seite 118 und 119: 10. Ansätze zur Weiterentwicklung
Seite 120 und 121:
GLOSSAR E EG-Kommission Vorläufer
Seite 122 und 123:
GLOSSAR S Signifikanzniveau Grenzwe
Seite 124 und 125:
Stichwortverzeichnis Lexikon, 13, 2
Seite 126 und 127:
Stichwortverzeichnis Übersetzungsp
Seite 128 und 129:
Literaturverzeichnis [Gda94] [Hoe04
Seite 130:
Literaturverzeichnis [Wag03] [Wat03
Alle anzeigen

Messung maschinellerÂ¨Ubersetzbarkeit von ... - Parallele Systeme

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?