27.10.2014 Aufrufe

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

8. Implementierung <strong>von</strong> MT Analyser<br />

Abbildung 8.2.: Beispielsatz mit Hierarchisierung der einzelnen Teilsätze<br />

zwar theoretisch auf Ebene des Relativsatzes sein könnte. Weil dieser aber ein finites Verb<br />

am Ende hat und somit vom Algorithmus als abgeschlossen betrachtet wird, erniedrigt<br />

sich die Ordnungszahl auf den Wert 1. Am Ende steht der zweite Teil des Hauptsatzes,<br />

dessen Ordnungszahl auf 0 gesetzt wird, weil das vorausgehende Nebensatzkomplement<br />

mit einem finiten Verb endet und ebenfalls als abgeschlossen angesehen wird.<br />

Die Vorgehensweise des Algorithmus ist dabei allgemein folgende: Alle Teilsätze werden<br />

in der ursprünglichen Reihenfolge durchlaufen. Beginnt ein neuer Nebensatz, so wird<br />

die Ebene und damit die Ordnungszahl jeweils um 1 erhöht. Findet sich am Ende des<br />

Nebensatzes ein finites Verb, wie es die Wortstellung im Deutschen vorsieht, so wird, weil<br />

zur Vollständigkeit des Nebensatzes kein Komplement mehr benötigt wird, angenommen,<br />

dass der Nebensatz beendet ist und die Ordnungszahl wieder um 1 herabgesetzt. Dies<br />

ist nötig, weil sich sonst aufeinanderfolgende, aber nicht verschachtelte Nebensätze in<br />

verschiedenen Ebenen befinden würden, obwohl sie auf derselben Ebene der Satzhierarchie<br />

liegen. Komplemente zu Nebensätzen behalten die aktuell gültige Ebene bei.<br />

Erweiterte Infinitive erhöhen die Ordnungszahl der Satzebene nur dann, wenn sie ein<br />

Komplement benötigen, also ein Infinitiv mit zu noch fehlt. Die Anzahl dieser geöffneten<br />

erweiterten Infinitive wird gespeichert und jedesmal, wenn ein Komplement, zu dem es<br />

auch einen geöffneten erweiterten Infinitiv gibt, vorkommt, um 1 erniedrigt. Erst wenn<br />

ihr Wert auf 0 gesunken ist, wird bei einem neuen erweiterten Infinitiv die Ordnungszahl<br />

wieder erhöht.<br />

Andere Komplemente hingegen verändern die aktuelle Ordnungszahl nicht. Gleiches gilt<br />

auch für ungebundene Teilsätze.<br />

8.2.4. Zusammenfügen der atomaren Teilsätze<br />

Im letzten Schritt wird unter Zuhilfenahme <strong>von</strong> Kategorisierung und Hierarchisierung der<br />

atomaren Teilsätze in den beiden vorangegangenen Abschnitten der Analyse versucht,<br />

Teilsätze zu größeren Einheiten zusammenzufügen, so dass jeder verbliebene Teilsatz am<br />

Ende des Vorgangs einen kompletten Hauptsatz, Nebensatz oder erweiterten Infinitiv darstellt<br />

und sich für die Suche nach Textmerkmalen eignet. Für das Zusammenfügen sind die<br />

Methoden rejoinPartialSentences() in der Klasse SentenceAnalyser und attach() in der<br />

Klasse PartialSentence zuständig. Atomare Teilsätze, die bereits einem anderen Teilsatz<br />

angegliedert wurden (attached = true), werden nicht mehr untersucht, um Doppelverbindungen<br />

zu vermeiden, wohl aber die Teilsätze, denen sie angegliedert wurden.<br />

In erstgenannter Methode wird in dieser Reihenfolge für alle erweiterten Infinitve, Nebensätze,<br />

Hauptsätze und ungebundenen Teilsätze überprüft, ob es in der Gesamtheit der<br />

Teilsätze einen oder mehrere andere gibt, die <strong>von</strong> ihren Attributen her passend sind und<br />

mit dem aktuellen Satz verbunden werden können. Die Reihenfolge begründet sich damit,<br />

dass zunächst die klar markierten Anfänge <strong>von</strong> erweiterten Infinitven und Nebensätzen<br />

versuchen sollen, alle passenden Teilsätze an sich zu binden, bevor die darunterliegenden<br />

92

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!