Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
8.2. Algorithmen zur Satzanalyse<br />
und nicht so klar markierten Hauptsätze die übrigen Teilsätze aufnehmen sollen. In den<br />
Tests erwies sich diese Abfolge der verschiedenen Satzarten als sehr nützlich, weil ohne sie<br />
oftmals Nebensätze oder erweiterte Infinitive nur unvollständig zusammengefügt wurden.<br />
Die ungebundenen Sätze suchen erst zum Schluss nach anderen passenden Sätzen, weil<br />
sie in der Regel zu recht vielen Teilsätzen gehören könnten und es sich als günstiger herausgestellt<br />
hat, erst andere Teilsätze versuchen zu lassen, sich mit ihnen anhand besserer<br />
Kriterien zu verbinden. Im Zweifel, wenn eine eindeutige Zuordnung nicht möglich ist,<br />
bleiben sie unverbunden.<br />
Es werden im Laufe des Algorithmus nur Teilsätze miteinander verbunden, die sowohl<br />
<strong>von</strong> ihren Attributen als auch <strong>von</strong> ihrer Ordnungszahl her zueinander passen. So werden<br />
mit einer einzigen Ausnahme in einem Sonderfall bei ungebundenen Teilsätzen nur solche<br />
Teilsätze verbunden, deren Ordnungszahlen gleich sind; dies aber auch nur dann, wenn<br />
dazwischen kein anderer Teilsatz eine niedrigere Ordnungszahl oder, falls der andere Teilsatz<br />
ein neuer Nebensatz oder ein neuer erweiterter Infinitiv ist, dieselbe Ordnungszahl<br />
aufweist.<br />
Bei den Attributen gilt für Anfänge <strong>von</strong> Nebensätzen und erweiterten Infinitiven, dass sie<br />
nur mit den jeweiligen Komplementen oder ungebundenen Teilsätzen verbunden werden<br />
können. Komplemente wiederum können nur dann mit zugehörigen Anfängen verbunden<br />
werden, wenn diese vor dem Komplement liegen. Mutmaßliche Hauptsätze oder deren<br />
Komplemente können dagegen mit ungebundenen Sätzen, anderen Hauptsätzen und<br />
Hauptsatzkomplementen unabhängig <strong>von</strong> deren Position zusammengehen.<br />
Die an dieser Stelle noch übrig gebliebenen ungebundenen Teilsätze suchen nun nach<br />
anderen Teilsätzen mit gleicher Ordnungszahl. Wenn eine Zuordnung nicht möglich ist,<br />
weil etwa der infrage kommende Teilsatz auf gleicher Ebene ein Nebensatzanfang ist und<br />
hinter dem ungebundenen Satz steht, versucht der Algorithmus eine Zuordnung des ungebundenen<br />
Teilsatzes zu einem der maximal zwei direkt umgebenden Teilsätze, auch wenn<br />
leichte Abweichungen in den Ordnungszahlen vorliegen.<br />
Beispielsatz<br />
Die genaue Funktionsweise dieses Algorithmus wird anhand des bekannten Beispielsatzes<br />
(Dass ich meinen Koffer vergessen hatte, bemerkte ich, nachdem ich das Hotel, in dem<br />
ich gewohnt hatte, verlassen hatte, und machte kehrt.) wiedergegeben. Die kategorisierten<br />
und hierarchisierten Teilsätze werden nun in der oben genannten Reihenfolge durchlaufen.<br />
Weil es im Beispiel keine erweiterten Infinitive gibt, wird mit dem Zusammenfügen <strong>von</strong><br />
Nebensätzen fortgefahren.<br />
Für den einleitenden Nebensatz beginnt die Suche nach passenden Ergänzungen mit dem<br />
Teilsatz bemerkte ich. Weil dieser jedoch eine niedrigere Ordnungszahl hat als der Nebensatz,<br />
kommt er nicht infrage und ebenso wenig alle weiteren Nebensätze. Für den ersten<br />
Teilsatz gibt es also keine Ergänzungen. Als nächstes wird der dritte Teilsatz (nachdem<br />
ich das Hotel) betrachtet. Der folgende Relativsatz passt unter anderem wegen der höheren<br />
Ordnungszahl nicht, jedoch der fünfte Teilsatz vergessen hatte, weil es sich dabei um<br />
ein Nebensatzkomplement handelt und der aktuelle Nebensatz ein Komplement benötigt<br />
und dieselbe Ordnungszahl aufweist. Dementsprechend werden beide Sätze miteinander<br />
verbunden. Der letzte Teilsatz kommt wiederum nicht infrage, unter anderem weil er eine<br />
niedrigere Ordnungszahl aufweist. Der als nächstes untersuchte Relativsatz kann nicht<br />
mit anderen Sätzen verbunden werden, weil kein anderer dieselbe Ordnungszahl besitzt.<br />
93