Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
8. Implementierung <strong>von</strong> MT Analyser<br />
wird? Bedingung dafür, dass ein Relativsatz erkannt wird, ist außerdem, dass es sich um<br />
Formen der Pronomen der, wer, was und welcher handelt oder dass es eine Verbindung<br />
mit wo- wie womit oder worüber ist, die anstelle eines herkömmlichen Relativpronomens<br />
eingesetzt werden kann. Das Wort wo selbst wird hingegen nicht beachtet, da es vor allem<br />
für Lokalsätze benötigt wird, wenngleich es einige präpositionale Konstruktionen in<br />
Relativsätzen ersetzen kann.<br />
Beim Testen des Algorithmus mit dem unbearbeiteten Textkorpus für Relativsätze ergab<br />
sich folgendes Bild: Von den insgesamt 104 darin enthaltenen Relativsätzen wurden 97<br />
erkannt und als Übersetzungsschwierigkeit gewertet. Sechsmal hatte TreeTagger ein Relativpronomen<br />
fälschlicherweise als Artikel gekennzeichnet, so dass eine Erkennung des<br />
Relativsatzes durch MT Analyser nicht möglich war. Einmal scheiterte die Erkennung<br />
an besagtem wo. Von 98 erkennbaren Relativsätzen wurden also 97 entdeckt, was einer<br />
Quote <strong>von</strong> 99, 0 Prozent entspricht.<br />
8.3.6. Verbklammern<br />
Die Erkennung <strong>von</strong> Verbklammern grenzt einen Mindestabstand <strong>von</strong> drei Wörtern zwischen<br />
der finiten Verbform und dem zugehörigen Rest des Verbs aus, weil sich eine hundertprozentige<br />
Schließung der Lücke zwischen beiden Teilen aufgrund der häufigen Nachstellung<br />
des Personalpronomens in der deutschen Sprache nicht verwirklichen lässt und<br />
kleine Lücken den Übersetzungsprogrammen kaum Schwierigkeiten bereiten dürften. Aus<br />
diesem Grund beinhaltet auch der Textkorpus mit Verbklammern nur längere Klammern.<br />
Insgesamt werden drei verschiedene Suchmuster angewandt, wobei sich die Suche stets auf<br />
einen vollständigen Teilsatz beschränkt, weil Verbklammern nicht teilsatzübergreifend sein<br />
können. In jedem der drei Fälle wird der Satz vom Ende bis zum Anfang durchlaufen,<br />
so dass stets zu einem möglichen Ende einer Verbklammer ein passender Anfang gesucht<br />
wird. Die Suchmuster lehnen sich dabei stark an die in Abschnitt 5.2.1 beschriebenen<br />
möglichen Arten <strong>von</strong> Verbklammern an und decken sie ab, wobei sie folgendermaßen<br />
aussehen:<br />
• Finites Verb → Zwischenraum → Präfix: Zunächst wird nach einem mit PTKVZ<br />
getaggten Wort gesucht, das ein Präfix eines zusammengesetzten Verbs darstellt,<br />
etwa ab in abfahren: Ohne auf Anschlussreisende zu warten, fuhr der Zug ab. Anschließend<br />
wird der Text weiter nach vorne durchlaufen, bis das erste finite Verb<br />
gefunden ist, markiert durch die Tags VVFIN für Vollverben, VAFIN für Hilfsverben<br />
und VMFIN für Modalverben. Überschreitet die dazwischen befindliche Lücke<br />
das Mindestmaß, wird eine Übersetzungsschwierigkeit erzeugt.<br />
• Finites Verb → Zwischenraum → Infinitiv(e): Sobald der erste Infinitiv gefunden<br />
ist, markiert durch die Tags VVINF, VAINF und VMINF, wird nach finiten Formen<br />
<strong>von</strong> Modal- oder Hilfsverben gesucht, wie sie in Sätzen wie Das kann ich niemals<br />
schaffen. oder Eines Tages wirst du ganz vorne sein. vorkommen. Auch finite Formen<br />
des Vollverbs lassen werden berücksichtigt, da es in gleicher Weise wie Modalverben<br />
eingesetzt wird. Wenn ein derartiges finites Verb gefunden wurde, ist die<br />
Verbklammer vollständig und wird als Übersetzungsschwierigkeit gewertet.<br />
• Finites Hilfsverb → Zwischenraum → Partizip Perfekt: Dieses Muster deckt sämtliche<br />
zusammengesetzten Verbformen ab, in denen am Ende ein Partizip steht. Wurde<br />
102