27.10.2014 Aufrufe

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

8.2. Algorithmen zur Satzanalyse<br />

und nicht so klar markierten Hauptsätze die übrigen Teilsätze aufnehmen sollen. In den<br />

Tests erwies sich diese Abfolge der verschiedenen Satzarten als sehr nützlich, weil ohne sie<br />

oftmals Nebensätze oder erweiterte Infinitive nur unvollständig zusammengefügt wurden.<br />

Die ungebundenen Sätze suchen erst zum Schluss nach anderen passenden Sätzen, weil<br />

sie in der Regel zu recht vielen Teilsätzen gehören könnten und es sich als günstiger herausgestellt<br />

hat, erst andere Teilsätze versuchen zu lassen, sich mit ihnen anhand besserer<br />

Kriterien zu verbinden. Im Zweifel, wenn eine eindeutige Zuordnung nicht möglich ist,<br />

bleiben sie unverbunden.<br />

Es werden im Laufe des Algorithmus nur Teilsätze miteinander verbunden, die sowohl<br />

<strong>von</strong> ihren Attributen als auch <strong>von</strong> ihrer Ordnungszahl her zueinander passen. So werden<br />

mit einer einzigen Ausnahme in einem Sonderfall bei ungebundenen Teilsätzen nur solche<br />

Teilsätze verbunden, deren Ordnungszahlen gleich sind; dies aber auch nur dann, wenn<br />

dazwischen kein anderer Teilsatz eine niedrigere Ordnungszahl oder, falls der andere Teilsatz<br />

ein neuer Nebensatz oder ein neuer erweiterter Infinitiv ist, dieselbe Ordnungszahl<br />

aufweist.<br />

Bei den Attributen gilt für Anfänge <strong>von</strong> Nebensätzen und erweiterten Infinitiven, dass sie<br />

nur mit den jeweiligen Komplementen oder ungebundenen Teilsätzen verbunden werden<br />

können. Komplemente wiederum können nur dann mit zugehörigen Anfängen verbunden<br />

werden, wenn diese vor dem Komplement liegen. Mutmaßliche Hauptsätze oder deren<br />

Komplemente können dagegen mit ungebundenen Sätzen, anderen Hauptsätzen und<br />

Hauptsatzkomplementen unabhängig <strong>von</strong> deren Position zusammengehen.<br />

Die an dieser Stelle noch übrig gebliebenen ungebundenen Teilsätze suchen nun nach<br />

anderen Teilsätzen mit gleicher Ordnungszahl. Wenn eine Zuordnung nicht möglich ist,<br />

weil etwa der infrage kommende Teilsatz auf gleicher Ebene ein Nebensatzanfang ist und<br />

hinter dem ungebundenen Satz steht, versucht der Algorithmus eine Zuordnung des ungebundenen<br />

Teilsatzes zu einem der maximal zwei direkt umgebenden Teilsätze, auch wenn<br />

leichte Abweichungen in den Ordnungszahlen vorliegen.<br />

Beispielsatz<br />

Die genaue Funktionsweise dieses Algorithmus wird anhand des bekannten Beispielsatzes<br />

(Dass ich meinen Koffer vergessen hatte, bemerkte ich, nachdem ich das Hotel, in dem<br />

ich gewohnt hatte, verlassen hatte, und machte kehrt.) wiedergegeben. Die kategorisierten<br />

und hierarchisierten Teilsätze werden nun in der oben genannten Reihenfolge durchlaufen.<br />

Weil es im Beispiel keine erweiterten Infinitive gibt, wird mit dem Zusammenfügen <strong>von</strong><br />

Nebensätzen fortgefahren.<br />

Für den einleitenden Nebensatz beginnt die Suche nach passenden Ergänzungen mit dem<br />

Teilsatz bemerkte ich. Weil dieser jedoch eine niedrigere Ordnungszahl hat als der Nebensatz,<br />

kommt er nicht infrage und ebenso wenig alle weiteren Nebensätze. Für den ersten<br />

Teilsatz gibt es also keine Ergänzungen. Als nächstes wird der dritte Teilsatz (nachdem<br />

ich das Hotel) betrachtet. Der folgende Relativsatz passt unter anderem wegen der höheren<br />

Ordnungszahl nicht, jedoch der fünfte Teilsatz vergessen hatte, weil es sich dabei um<br />

ein Nebensatzkomplement handelt und der aktuelle Nebensatz ein Komplement benötigt<br />

und dieselbe Ordnungszahl aufweist. Dementsprechend werden beide Sätze miteinander<br />

verbunden. Der letzte Teilsatz kommt wiederum nicht infrage, unter anderem weil er eine<br />

niedrigere Ordnungszahl aufweist. Der als nächstes untersuchte Relativsatz kann nicht<br />

mit anderen Sätzen verbunden werden, weil kein anderer dieselbe Ordnungszahl besitzt.<br />

93

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!