Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
8. Implementierung <strong>von</strong> MT Analyser<br />
Erweiterte Infintive<br />
Im Gegensatz zu Nebensätzen beginnt die Analyse erweiterter Infinitiven am Satzende,<br />
wo entweder ein Infintiv mit davorstehendem Partikel zu (Tagkombination PTKZU +<br />
VVINF, VAINF oder VMINF ) erwartet wird, oder ein Infinitiv, der den Partikel zu<br />
bereits in sich trägt (Tag VVIZU ). Gruppen solcher Infinitive werden auch akzeptiert,<br />
sobald aber mehr als nur eine Konjunktion oder ein den Infinitiv näher bestimmendes<br />
Adverb zwischen ihnen stehen, gilt der Teilsatz als invertiert.<br />
Hauptsätze<br />
Am schwierigsten erwies sich die Analyse der Wortstellung im Hauptsatz, weil hier viele<br />
verschiedene Fälle zu beachten sind, in denen die Wortstellung invertiert ist, und die<br />
<strong>von</strong> TreeTagger vergebenen Tags nicht immer genügend grammatikalische Information<br />
enthalten, um allein mit ihrer Hilfe eine Inversion zu bestimmen (vgl. hierzu die Beispiele<br />
in Abschnitt 5.2.4). Dabei werden nur in den Fällen Übersetzungsschwierigkeiten erzeugt,<br />
die wirklich eindeutig eine Inversion darstellen, um Falschmeldungen zu vermeiden.<br />
Als erstes wird überprüft, ob es sich um eine Frage oder einen Befehl handelt. In diesem<br />
Fall werden an der Spitze bzw. vor dem Personalpronomen stehende finite Verben nicht<br />
beanstandet. Ansonsten wird dies als Inversion markiert, etwa in dem Satz Bevor der Zoo<br />
eröffnet wurde, musste er renoviert werden. Dabei wird insbesondere überprüft, ob eine<br />
Form eines Pronomens, die eindeutig als Nominativ identifizierbar ist, direkt hinter dem<br />
finiten Verb steht. Dies ist nur für die Personal- und Indefinitpronomen ich, du, er, wir,<br />
man, jemand und niemand möglich.<br />
Analog zur Suche nach Nominativen hinter dem finiten Verb wird vor dem finiten Verb<br />
nach Formen <strong>von</strong> Pronomen gesucht, die nie im Nominativ auftreten. Bei Adjektiven<br />
an der Spitze eines Teilsatzes, die auf -en und -em enden, wird ebenfalls eine Inversion<br />
erkannt. Stehen andere Indikatoren am Satzanfang vor dem finiten Verb, die eindeutig eine<br />
Abweichung <strong>von</strong> der Standardwortfolge nach sich ziehen, wie beispielsweise Präpositionen<br />
oder ein Adverb, so wird ebenfalls eine Übersetzungsschwierigkeit erzeugt.<br />
Testergebnisse<br />
Der Algorithmus wurde mit Hilfe des unbearbeiteten Textkorpus zu Inversionen der Wortstellung<br />
getestet. Dabei wurden im gesamten Text 96 Inversionen entdeckt bei 108 vorhandenen.<br />
Dies entspricht einer Erkennungsquote <strong>von</strong> 88, 9 Prozent. Dabei kam es allerdings<br />
öfter vor, dass wegen falscher Tags und daraus resultierender falscher Zusammensetzung<br />
der Teilsätze der als invertiert angezeigte Satzausschnitt zu lang war. Ebenfalls entstanden<br />
durch falsche Tags zwei Fehlerkennungen.<br />
Beschränkt man die Betrachtung auf die 87 Sätze, in denen weder fehlerhafte Tags noch<br />
inkorrekt zusammengefügte Teilsätze die Erkennung behinderten, so ergibt sich folgendes<br />
Bild: Von 88 vorhandenen Inversionen wurden 81 erkannt, was einer Quote <strong>von</strong> 92, 0<br />
Prozent entspricht. Fehlerkennungen traten dabei nicht mehr auf.<br />
8.3.3. Mehrdeutigkeiten<br />
Der Algorithmus für die Suche nach Mehrdeutigkeiten gestaltet sich mit dem Mehrdeutigkeitslexikon<br />
im Hintergrund relativ einfach. Es bedarf lediglich eines Abgleichs zwischen<br />
96