Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
7. Modellierung <strong>von</strong> MT Analyser<br />
Insbesondere ist MT Analyser kein Programm, das bewertet, wie gut ein Mensch einen<br />
Text übersetzen kann! Hierfür hätten im Vorfeld andere Untersuchungen durchgeführt<br />
und andere Kriterien zugrundegelegt werden müssen.<br />
Außerdem soll MT Analyser kein Aufsatz für ein bereits existierendes Übersetzungsprogramm<br />
sein, sondern als unabhängiges und alleinstehendes Programm Texte hinsichtlich<br />
ihrer Übersetzbarkeit allgemeingültig analysieren, ohne auf die Stärken oder Schwächen<br />
eines bestimmten MÜ-Programms ausgerichtet zu sein. Dabei ist natürlich nicht auszuschließen,<br />
dass es eines Tages für ein Programm optimiert wird.<br />
Schließlich soll MT Analyser auch keine kontrollierte Sprache sein (vgl. Abschnitt 3.1). Es<br />
werden keine Regeln für den Sprachgebrauch vorgeschrieben, sondern lediglich Hinweise<br />
erteilt, an die die Verfasser zu übersetzender Texte sich halten können, aber nicht müssen.<br />
7.2. Anforderungen an MT Analyser<br />
Das Hauptziel der Entwicklung <strong>von</strong> MT Analyser lässt sich mit einem Satz so formulieren:<br />
Das Programm muss in der Lage sein, den in dieser Arbeit erstellten Übersetzbarkeitsindex<br />
mit seinen gewichteten Textmerkmalen auf einen deutschsprachigen<br />
Text beliebiger Länge anzuwenden und ein ausführliches Ergebnis<br />
der Bewertung der Übersetzbarkeit dieses Textes zu erzeugen.<br />
Um dies zu erreichen, muss eine Reihe <strong>von</strong> funktionalen Anforderungen erfüllt werden. Sie<br />
ergeben sich vor allem aus Abschnitt 7.1 und aus der Tatsache, dass der Wortlaut eines<br />
Textes allein nicht ausreicht, um seine Eigenschaften zu erkennen. Im einzelnen sind dies:<br />
• Die einzelnen Sätze innerhalb eines Textes müssen möglichst präzise erkannt werden.<br />
• Zu den einzelnen Sätzen müssen weitere Informationen beschafft werden. Es ist<br />
unverzichtbar zu wissen, welche Grundform zu einem Wort eines Satzes gehört und<br />
zu welcher Wortart es zählt. Die Grundform wird beispielsweise zum Auffinden<br />
<strong>von</strong> Mehrdeutigkeiten benötigt, die Wortart zum Erkennen <strong>von</strong> Verben, die für eine<br />
Verbklammer infrage kommen. Weil diese Informationen nicht ohne weiteres erlangt<br />
werden können, liegt der Einsatz eines bereits vorhandenen Programms nahe, das<br />
diese Aufgabe übernimmt und in MT Analyser eingebunden wird.<br />
• Jeder Satz muss korrekt in seine Teilsätze zerlegt werden, um sinnvoll nach Textmerkmalen<br />
suchen zu können. Nominal- und Verbklammern beispielsweise können<br />
nur zuverlässig erkannt werden, wenn klar ist, welche Wörter des Satzes zu einem<br />
Teilsatz (z. B. Hauptsatz, Konzessivsatz, Finalsatz etc.) zusammengehören und somit<br />
die Teile der Klammer bilden können.<br />
• Die verschiedenen Textmerkmale müssen unter Ausnutzung der vorhandenen Informationen<br />
mit möglichst hoher Genauigkeit erkannt werden. Hierfür sind geeignete<br />
Algorithmen zu schreiben, die jeden Satz/Teilsatz durchsuchen.<br />
• Der Wert des Übersetzbarkeitsindexes muss sowohl auf Text- als auch auf Satzebene<br />
berechnet werden, nachdem alle Textmerkmale gefunden worden sind.<br />
74