Aspekte der morphologischen Analyse des Deutschen - Universität ...
Aspekte der morphologischen Analyse des Deutschen - Universität ...
Aspekte der morphologischen Analyse des Deutschen - Universität ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Kapitel 1: Einführung<br />
Es gibt nun einige Ansätze, die sich dieser Probleme annehmen: Bear (1988) schlägt vor, bestimmte<br />
Irregularitäten <strong>des</strong> Englischen (beispielsweise ist <strong>der</strong> Plural von piano pianos und<br />
nicht pianoes.) dadurch in den Two-Level-Mechanismus zu integrieren, daß man Son<strong>der</strong>fälle<br />
dieser Art explizit im Lexikon mit einem Merkmal markiert, so daß die normalerweise angewendete<br />
Pluralregel von Nomen auf -o (o + s � oes) nicht anwendbar ist. Trost (1990) setzt<br />
hierauf auf, ersetzt jedoch das prozedural interpretierte Regelmerkmal durch eine Unifikation<br />
<strong>der</strong> bis dahin aufgebauten Merkmalsstruktur für die Syntax <strong>des</strong> analysierten Wortes mit<br />
einem <strong>der</strong> Two-Level-Regel zugeordneten Filterterm. Gelingt diese Unifikation, so kann die<br />
Regel angewendet werden. Ist beispielsweise ein Nomen mit [Umlaut: +] für die Pluralbildung<br />
markiert, so wird nur die Two-Level-Regel verwendet, die ebenfalls mit [Umlaut: +]<br />
attribuiert ist.<br />
Eine an<strong>der</strong>e Richtung für Probleme dieser Art schlagen Karttunen et al. (1992) ein: Sie schlagen<br />
vor, die <strong>morphologischen</strong> Merkmale von Morphemen nicht in einem Lexikoneintrag zu<br />
halten, son<strong>der</strong>n direkt auf das Lexikonband <strong>des</strong> Two-Level-Modells zu schreiben. Man<br />
würde dann beispielsweise auf dem Lexikonband nicht mehr try+s stehen haben, son<strong>der</strong>n<br />
try+3pers+sing. Auf diese Weise würde auch mit allomorphen Varianten verfahren werden.<br />
Der "Abstand" zwischen Oberflächen- und Lexikonband würde damit zwar vergrößert,<br />
die Autoren meinen jedoch, durch Komposition <strong>der</strong> Two-Level-Transducer mit dem gesamten<br />
Lexikon unter Vermittlung entsprechen<strong>der</strong> Zwischenbän<strong>der</strong> die Größe <strong>des</strong> entstehenden<br />
Gesamttransducers in passablen Grenzen zu halten. Details hierzu finden sich in<br />
Karttunen et al. (1992) .<br />
Abramson (1992) schlägt vor, die prozedurale Interpretation <strong>der</strong> Two-Level-Regeln als<br />
Transducer außer acht zu lassen und die Regeln vielmehr als deklarativ spezifizierte Relation<br />
zwischen den beiden Bän<strong>der</strong>n aufzufassen. Er veranschaulicht seine Idee durch die Angabe<br />
<strong>der</strong> für das Englische benötigten Two-Level-Regeln als Prolog-Klauseln und überläßt<br />
es dabei dem Prolog-System, den Pfad vom Ausgangszustand in einen Endzustand zu suchen.<br />
Am Ende dieser Übersicht zur Two-Level-Morphology möchte ich noch auf einige Probleme<br />
dieses Modells zu sprechen kommen, die generellerer Natur sind.<br />
� Zuallererst ist es Aufgabe <strong>des</strong> Computerlinguisten, bei <strong>der</strong> Regelspezifikation darauf zu<br />
achten, daß die Regeln nicht in unerwünschter Weise miteinan<strong>der</strong> interagieren. Interaktion<br />
kann auf verschiedene Weise stattfinden; <strong>der</strong> „schlimmste” Fall ist beispielsweise<br />
<strong>der</strong>, wenn in zwei verschiedenen Regeln das gleiche Symbolpaar auftritt, <strong>der</strong> verwendete<br />
Operator « ist und die linken und rechten Kontexte sich gegenseitig ausschließen. Ein<br />
„intelligenter” Regelcompiler wäre zur Vermeidung solcher Fälle nützlich.<br />
� Der zweite Punkt betrifft die implizite reguläre Organisation <strong>des</strong> Lexikons, <strong>der</strong> sog. Folgelexikamechanismus,<br />
<strong>der</strong> zu eng an die Operation <strong>der</strong> Transducer geknüpft ist. Es könnte<br />
sich herausstellen, daß die dem Lexikon implizite reguläre Grammatik zu schwach ist,<br />
um alle <strong>morphologischen</strong> Prozesse aller Sprachen zu beschreiben. Und auch wenn dies<br />
nicht <strong>der</strong> Fall ist, so könnte eine Grammatik stärkeren Typs linguistisch doch transparenter<br />
sein. 9 Auf jeden Fall wäre es besser, den regulären Lexikonmechanismus durch<br />
Angabe einer entsprechenden Grammatik explizit zu machen.<br />
� Drittens überprüfen Transducer auf <strong>der</strong> Grundlage <strong>der</strong> Two-Level-Morphology prinzipiell<br />
nur die Zulässigkeit bzw. Nichtzulässigkeit von bestimmten Morphkombinationen.<br />
9 Eine Analogie zur Satzsyntax sei hier gezogen. Man könnte den beschränkten Charakter <strong>der</strong> Zentraleinbettung<br />
in natürlichen Sprachen beispielsweise durch eine reguläre Grammatik modellieren, die<br />
in die Satzsymbole hinein den Grad ihrer Einbettung kodiert. Die entsprechende kontextfreie Grammatik<br />
für das gleiche Phänomen wäre jedoch um einiges einfacher.<br />
8