27.10.2014 Aufrufe

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

8. Implementierung <strong>von</strong> MT Analyser<br />

wird? Bedingung dafür, dass ein Relativsatz erkannt wird, ist außerdem, dass es sich um<br />

Formen der Pronomen der, wer, was und welcher handelt oder dass es eine Verbindung<br />

mit wo- wie womit oder worüber ist, die anstelle eines herkömmlichen Relativpronomens<br />

eingesetzt werden kann. Das Wort wo selbst wird hingegen nicht beachtet, da es vor allem<br />

für Lokalsätze benötigt wird, wenngleich es einige präpositionale Konstruktionen in<br />

Relativsätzen ersetzen kann.<br />

Beim Testen des Algorithmus mit dem unbearbeiteten Textkorpus für Relativsätze ergab<br />

sich folgendes Bild: Von den insgesamt 104 darin enthaltenen Relativsätzen wurden 97<br />

erkannt und als Übersetzungsschwierigkeit gewertet. Sechsmal hatte TreeTagger ein Relativpronomen<br />

fälschlicherweise als Artikel gekennzeichnet, so dass eine Erkennung des<br />

Relativsatzes durch MT Analyser nicht möglich war. Einmal scheiterte die Erkennung<br />

an besagtem wo. Von 98 erkennbaren Relativsätzen wurden also 97 entdeckt, was einer<br />

Quote <strong>von</strong> 99, 0 Prozent entspricht.<br />

8.3.6. Verbklammern<br />

Die Erkennung <strong>von</strong> Verbklammern grenzt einen Mindestabstand <strong>von</strong> drei Wörtern zwischen<br />

der finiten Verbform und dem zugehörigen Rest des Verbs aus, weil sich eine hundertprozentige<br />

Schließung der Lücke zwischen beiden Teilen aufgrund der häufigen Nachstellung<br />

des Personalpronomens in der deutschen Sprache nicht verwirklichen lässt und<br />

kleine Lücken den Übersetzungsprogrammen kaum Schwierigkeiten bereiten dürften. Aus<br />

diesem Grund beinhaltet auch der Textkorpus mit Verbklammern nur längere Klammern.<br />

Insgesamt werden drei verschiedene Suchmuster angewandt, wobei sich die Suche stets auf<br />

einen vollständigen Teilsatz beschränkt, weil Verbklammern nicht teilsatzübergreifend sein<br />

können. In jedem der drei Fälle wird der Satz vom Ende bis zum Anfang durchlaufen,<br />

so dass stets zu einem möglichen Ende einer Verbklammer ein passender Anfang gesucht<br />

wird. Die Suchmuster lehnen sich dabei stark an die in Abschnitt 5.2.1 beschriebenen<br />

möglichen Arten <strong>von</strong> Verbklammern an und decken sie ab, wobei sie folgendermaßen<br />

aussehen:<br />

• Finites Verb → Zwischenraum → Präfix: Zunächst wird nach einem mit PTKVZ<br />

getaggten Wort gesucht, das ein Präfix eines zusammengesetzten Verbs darstellt,<br />

etwa ab in abfahren: Ohne auf Anschlussreisende zu warten, fuhr der Zug ab. Anschließend<br />

wird der Text weiter nach vorne durchlaufen, bis das erste finite Verb<br />

gefunden ist, markiert durch die Tags VVFIN für Vollverben, VAFIN für Hilfsverben<br />

und VMFIN für Modalverben. Überschreitet die dazwischen befindliche Lücke<br />

das Mindestmaß, wird eine Übersetzungsschwierigkeit erzeugt.<br />

• Finites Verb → Zwischenraum → Infinitiv(e): Sobald der erste Infinitiv gefunden<br />

ist, markiert durch die Tags VVINF, VAINF und VMINF, wird nach finiten Formen<br />

<strong>von</strong> Modal- oder Hilfsverben gesucht, wie sie in Sätzen wie Das kann ich niemals<br />

schaffen. oder Eines Tages wirst du ganz vorne sein. vorkommen. Auch finite Formen<br />

des Vollverbs lassen werden berücksichtigt, da es in gleicher Weise wie Modalverben<br />

eingesetzt wird. Wenn ein derartiges finites Verb gefunden wurde, ist die<br />

Verbklammer vollständig und wird als Übersetzungsschwierigkeit gewertet.<br />

• Finites Hilfsverb → Zwischenraum → Partizip Perfekt: Dieses Muster deckt sämtliche<br />

zusammengesetzten Verbformen ab, in denen am Ende ein Partizip steht. Wurde<br />

102

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!