27.10.2014 Aufrufe

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

7. Modellierung <strong>von</strong> MT Analyser<br />

Insbesondere ist MT Analyser kein Programm, das bewertet, wie gut ein Mensch einen<br />

Text übersetzen kann! Hierfür hätten im Vorfeld andere Untersuchungen durchgeführt<br />

und andere Kriterien zugrundegelegt werden müssen.<br />

Außerdem soll MT Analyser kein Aufsatz für ein bereits existierendes Übersetzungsprogramm<br />

sein, sondern als unabhängiges und alleinstehendes Programm Texte hinsichtlich<br />

ihrer Übersetzbarkeit allgemeingültig analysieren, ohne auf die Stärken oder Schwächen<br />

eines bestimmten MÜ-Programms ausgerichtet zu sein. Dabei ist natürlich nicht auszuschließen,<br />

dass es eines Tages für ein Programm optimiert wird.<br />

Schließlich soll MT Analyser auch keine kontrollierte Sprache sein (vgl. Abschnitt 3.1). Es<br />

werden keine Regeln für den Sprachgebrauch vorgeschrieben, sondern lediglich Hinweise<br />

erteilt, an die die Verfasser zu übersetzender Texte sich halten können, aber nicht müssen.<br />

7.2. Anforderungen an MT Analyser<br />

Das Hauptziel der Entwicklung <strong>von</strong> MT Analyser lässt sich mit einem Satz so formulieren:<br />

Das Programm muss in der Lage sein, den in dieser Arbeit erstellten Übersetzbarkeitsindex<br />

mit seinen gewichteten Textmerkmalen auf einen deutschsprachigen<br />

Text beliebiger Länge anzuwenden und ein ausführliches Ergebnis<br />

der Bewertung der Übersetzbarkeit dieses Textes zu erzeugen.<br />

Um dies zu erreichen, muss eine Reihe <strong>von</strong> funktionalen Anforderungen erfüllt werden. Sie<br />

ergeben sich vor allem aus Abschnitt 7.1 und aus der Tatsache, dass der Wortlaut eines<br />

Textes allein nicht ausreicht, um seine Eigenschaften zu erkennen. Im einzelnen sind dies:<br />

• Die einzelnen Sätze innerhalb eines Textes müssen möglichst präzise erkannt werden.<br />

• Zu den einzelnen Sätzen müssen weitere Informationen beschafft werden. Es ist<br />

unverzichtbar zu wissen, welche Grundform zu einem Wort eines Satzes gehört und<br />

zu welcher Wortart es zählt. Die Grundform wird beispielsweise zum Auffinden<br />

<strong>von</strong> Mehrdeutigkeiten benötigt, die Wortart zum Erkennen <strong>von</strong> Verben, die für eine<br />

Verbklammer infrage kommen. Weil diese Informationen nicht ohne weiteres erlangt<br />

werden können, liegt der Einsatz eines bereits vorhandenen Programms nahe, das<br />

diese Aufgabe übernimmt und in MT Analyser eingebunden wird.<br />

• Jeder Satz muss korrekt in seine Teilsätze zerlegt werden, um sinnvoll nach Textmerkmalen<br />

suchen zu können. Nominal- und Verbklammern beispielsweise können<br />

nur zuverlässig erkannt werden, wenn klar ist, welche Wörter des Satzes zu einem<br />

Teilsatz (z. B. Hauptsatz, Konzessivsatz, Finalsatz etc.) zusammengehören und somit<br />

die Teile der Klammer bilden können.<br />

• Die verschiedenen Textmerkmale müssen unter Ausnutzung der vorhandenen Informationen<br />

mit möglichst hoher Genauigkeit erkannt werden. Hierfür sind geeignete<br />

Algorithmen zu schreiben, die jeden Satz/Teilsatz durchsuchen.<br />

• Der Wert des Übersetzbarkeitsindexes muss sowohl auf Text- als auch auf Satzebene<br />

berechnet werden, nachdem alle Textmerkmale gefunden worden sind.<br />

74

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!