Aspekte der morphologischen Analyse des Deutschen - Universität ...
Aspekte der morphologischen Analyse des Deutschen - Universität ...
Aspekte der morphologischen Analyse des Deutschen - Universität ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Kapitel 4: Ein Modell eines <strong>morphologischen</strong> <strong>Analyse</strong>systems<br />
Abb. 4.4: (Vereinfachter) Transducer T1 zur Behandlung <strong>der</strong> e-Erweiterung bei Verbstämmen auf<br />
Dental bzw. Frikativ/Nasal vor Flexiven (die Endzustände sind grau dargestellt)<br />
Die Anwendbarkeit von Two-Level-Regeln hängt nun jedoch nicht nur von phonetischen<br />
bzw. graphematischen Gesichtspunkten ab, son<strong>der</strong>n auch von morphosyntaktischen.<br />
Beispiel 4.6:<br />
Die Kette WEINTEST darf nur in <strong>der</strong> Verblesart in wein+t+st zerlegt werden; bei <strong>der</strong> Nomenlesart<br />
muß die Segmentierung wein+test lauten. Groß- und Kleinschreibung wird, aus<br />
bereits erwähnten Gründen, nicht als Mittel zur Disambiguierung herangezogen.<br />
Der Notwendigkeit <strong>des</strong> Einbeziehung von grammatischer Information durch arbiträre diakritische<br />
Symbole o<strong>der</strong> gar Merkmale auf dem Lexikonband (vgl. Karttunen et al. (1992)) zu<br />
begegnen, erscheint sehr unelegant und schafft eine ganze Reihe von Schnittstellenproblemen,<br />
beispielsweise zu Lexikon und Parser. Sehr viel besser ist <strong>der</strong> Ansatz von Trost, bisher<br />
aufgebaute Strukturen im Merkmalsstrukturformat mit einer mit <strong>der</strong> Two-Level-Regel assoziierten<br />
Filterstruktur zu unifizieren und vom Gelingen dieser Operation die Anwendung<br />
<strong>der</strong> Regel abhängig zu machen. Im übrigen kann die Ungerichtetheit <strong>der</strong> hier verwendeten<br />
Unifikationsoperation im Fall von unbekannten Teilen dazu dienen, die hierfür aufgebaute<br />
partielle Merkmalsstruktur weiter zu instantiieren.<br />
Wie kann im vorliegenden Modell sinnvoll mit regelmäßiger Allomorphie umgegangen<br />
werden? Die Grundidee hierzu sieht folgen<strong>der</strong>maßen aus:<br />
1. Der Segmentierer enthält nach wie vor alle Allomorphe eines Morphems, diese werden<br />
jedoch nun durch Präprozessierung eingeführt.<br />
2. Der Parser prüft die Zulässigkeit von Morphkombinationen.<br />
Da <strong>der</strong> Segmentierer oberflächenorientiert arbeitet, muß er alle Allomorphe eines Morphems<br />
enthalten. Hierdurch fällt auch eine <strong>der</strong> Hauptaufgaben weg, die üblicherweise durch Two-<br />
Level-Automaten geleistet wird: die Reduktion einer Form auf dem Oberflächenband auf<br />
eine Reihe von Morphemen auf dem Lexikonband.<br />
Die morphosyntaktische Kombinierbarkeit <strong>der</strong> durch den Segmentierer gelieferten Morphe<br />
wird mit Hilfe <strong>der</strong> diesen zugeordneten Merkmalsstrukturen und den Regeln und Prinzipien<br />
111