Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
8. Implementierung <strong>von</strong> MT Analyser<br />
Abbildung 8.2.: Beispielsatz mit Hierarchisierung der einzelnen Teilsätze<br />
zwar theoretisch auf Ebene des Relativsatzes sein könnte. Weil dieser aber ein finites Verb<br />
am Ende hat und somit vom Algorithmus als abgeschlossen betrachtet wird, erniedrigt<br />
sich die Ordnungszahl auf den Wert 1. Am Ende steht der zweite Teil des Hauptsatzes,<br />
dessen Ordnungszahl auf 0 gesetzt wird, weil das vorausgehende Nebensatzkomplement<br />
mit einem finiten Verb endet und ebenfalls als abgeschlossen angesehen wird.<br />
Die Vorgehensweise des Algorithmus ist dabei allgemein folgende: Alle Teilsätze werden<br />
in der ursprünglichen Reihenfolge durchlaufen. Beginnt ein neuer Nebensatz, so wird<br />
die Ebene und damit die Ordnungszahl jeweils um 1 erhöht. Findet sich am Ende des<br />
Nebensatzes ein finites Verb, wie es die Wortstellung im Deutschen vorsieht, so wird, weil<br />
zur Vollständigkeit des Nebensatzes kein Komplement mehr benötigt wird, angenommen,<br />
dass der Nebensatz beendet ist und die Ordnungszahl wieder um 1 herabgesetzt. Dies<br />
ist nötig, weil sich sonst aufeinanderfolgende, aber nicht verschachtelte Nebensätze in<br />
verschiedenen Ebenen befinden würden, obwohl sie auf derselben Ebene der Satzhierarchie<br />
liegen. Komplemente zu Nebensätzen behalten die aktuell gültige Ebene bei.<br />
Erweiterte Infinitive erhöhen die Ordnungszahl der Satzebene nur dann, wenn sie ein<br />
Komplement benötigen, also ein Infinitiv mit zu noch fehlt. Die Anzahl dieser geöffneten<br />
erweiterten Infinitive wird gespeichert und jedesmal, wenn ein Komplement, zu dem es<br />
auch einen geöffneten erweiterten Infinitiv gibt, vorkommt, um 1 erniedrigt. Erst wenn<br />
ihr Wert auf 0 gesunken ist, wird bei einem neuen erweiterten Infinitiv die Ordnungszahl<br />
wieder erhöht.<br />
Andere Komplemente hingegen verändern die aktuelle Ordnungszahl nicht. Gleiches gilt<br />
auch für ungebundene Teilsätze.<br />
8.2.4. Zusammenfügen der atomaren Teilsätze<br />
Im letzten Schritt wird unter Zuhilfenahme <strong>von</strong> Kategorisierung und Hierarchisierung der<br />
atomaren Teilsätze in den beiden vorangegangenen Abschnitten der Analyse versucht,<br />
Teilsätze zu größeren Einheiten zusammenzufügen, so dass jeder verbliebene Teilsatz am<br />
Ende des Vorgangs einen kompletten Hauptsatz, Nebensatz oder erweiterten Infinitiv darstellt<br />
und sich für die Suche nach Textmerkmalen eignet. Für das Zusammenfügen sind die<br />
Methoden rejoinPartialSentences() in der Klasse SentenceAnalyser und attach() in der<br />
Klasse PartialSentence zuständig. Atomare Teilsätze, die bereits einem anderen Teilsatz<br />
angegliedert wurden (attached = true), werden nicht mehr untersucht, um Doppelverbindungen<br />
zu vermeiden, wohl aber die Teilsätze, denen sie angegliedert wurden.<br />
In erstgenannter Methode wird in dieser Reihenfolge für alle erweiterten Infinitve, Nebensätze,<br />
Hauptsätze und ungebundenen Teilsätze überprüft, ob es in der Gesamtheit der<br />
Teilsätze einen oder mehrere andere gibt, die <strong>von</strong> ihren Attributen her passend sind und<br />
mit dem aktuellen Satz verbunden werden können. Die Reihenfolge begründet sich damit,<br />
dass zunächst die klar markierten Anfänge <strong>von</strong> erweiterten Infinitven und Nebensätzen<br />
versuchen sollen, alle passenden Teilsätze an sich zu binden, bevor die darunterliegenden<br />
92