27.10.2014 Aufrufe

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

8. Implementierung <strong>von</strong> MT Analyser<br />

Erweiterte Infintive<br />

Im Gegensatz zu Nebensätzen beginnt die Analyse erweiterter Infinitiven am Satzende,<br />

wo entweder ein Infintiv mit davorstehendem Partikel zu (Tagkombination PTKZU +<br />

VVINF, VAINF oder VMINF ) erwartet wird, oder ein Infinitiv, der den Partikel zu<br />

bereits in sich trägt (Tag VVIZU ). Gruppen solcher Infinitive werden auch akzeptiert,<br />

sobald aber mehr als nur eine Konjunktion oder ein den Infinitiv näher bestimmendes<br />

Adverb zwischen ihnen stehen, gilt der Teilsatz als invertiert.<br />

Hauptsätze<br />

Am schwierigsten erwies sich die Analyse der Wortstellung im Hauptsatz, weil hier viele<br />

verschiedene Fälle zu beachten sind, in denen die Wortstellung invertiert ist, und die<br />

<strong>von</strong> TreeTagger vergebenen Tags nicht immer genügend grammatikalische Information<br />

enthalten, um allein mit ihrer Hilfe eine Inversion zu bestimmen (vgl. hierzu die Beispiele<br />

in Abschnitt 5.2.4). Dabei werden nur in den Fällen Übersetzungsschwierigkeiten erzeugt,<br />

die wirklich eindeutig eine Inversion darstellen, um Falschmeldungen zu vermeiden.<br />

Als erstes wird überprüft, ob es sich um eine Frage oder einen Befehl handelt. In diesem<br />

Fall werden an der Spitze bzw. vor dem Personalpronomen stehende finite Verben nicht<br />

beanstandet. Ansonsten wird dies als Inversion markiert, etwa in dem Satz Bevor der Zoo<br />

eröffnet wurde, musste er renoviert werden. Dabei wird insbesondere überprüft, ob eine<br />

Form eines Pronomens, die eindeutig als Nominativ identifizierbar ist, direkt hinter dem<br />

finiten Verb steht. Dies ist nur für die Personal- und Indefinitpronomen ich, du, er, wir,<br />

man, jemand und niemand möglich.<br />

Analog zur Suche nach Nominativen hinter dem finiten Verb wird vor dem finiten Verb<br />

nach Formen <strong>von</strong> Pronomen gesucht, die nie im Nominativ auftreten. Bei Adjektiven<br />

an der Spitze eines Teilsatzes, die auf -en und -em enden, wird ebenfalls eine Inversion<br />

erkannt. Stehen andere Indikatoren am Satzanfang vor dem finiten Verb, die eindeutig eine<br />

Abweichung <strong>von</strong> der Standardwortfolge nach sich ziehen, wie beispielsweise Präpositionen<br />

oder ein Adverb, so wird ebenfalls eine Übersetzungsschwierigkeit erzeugt.<br />

Testergebnisse<br />

Der Algorithmus wurde mit Hilfe des unbearbeiteten Textkorpus zu Inversionen der Wortstellung<br />

getestet. Dabei wurden im gesamten Text 96 Inversionen entdeckt bei 108 vorhandenen.<br />

Dies entspricht einer Erkennungsquote <strong>von</strong> 88, 9 Prozent. Dabei kam es allerdings<br />

öfter vor, dass wegen falscher Tags und daraus resultierender falscher Zusammensetzung<br />

der Teilsätze der als invertiert angezeigte Satzausschnitt zu lang war. Ebenfalls entstanden<br />

durch falsche Tags zwei Fehlerkennungen.<br />

Beschränkt man die Betrachtung auf die 87 Sätze, in denen weder fehlerhafte Tags noch<br />

inkorrekt zusammengefügte Teilsätze die Erkennung behinderten, so ergibt sich folgendes<br />

Bild: Von 88 vorhandenen Inversionen wurden 81 erkannt, was einer Quote <strong>von</strong> 92, 0<br />

Prozent entspricht. Fehlerkennungen traten dabei nicht mehr auf.<br />

8.3.3. Mehrdeutigkeiten<br />

Der Algorithmus für die Suche nach Mehrdeutigkeiten gestaltet sich mit dem Mehrdeutigkeitslexikon<br />

im Hintergrund relativ einfach. Es bedarf lediglich eines Abgleichs zwischen<br />

96

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!