Aspekte der morphologischen Analyse des Deutschen - Universität ...
Aspekte der morphologischen Analyse des Deutschen - Universität ...
Aspekte der morphologischen Analyse des Deutschen - Universität ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Kapitel 4: Ein Modell eines <strong>morphologischen</strong> <strong>Analyse</strong>systems<br />
Ein Morphem – in üblicher strukturalistischer Weise als kleinste bedeutungstragende Einheit<br />
definiert – kann bei gleichbleiben<strong>der</strong> Bedeutung 2 eine Reihe verschiedener Oberflächenrealisationen,<br />
die sog. (Allo)Morphe, aufweisen, was auch als Allomorphie bezeichnet wird. Unter<br />
Basismorph wird im weiteren ein Stellvertreter aus <strong>der</strong> Menge <strong>der</strong> Allomorphe verstanden,<br />
<strong>der</strong> das Morphem benennt, wozu das kürzeste bzw. dasjenige Allomorph ausgewählt wird,<br />
welches die vergleichsweise allgemeinste Merkmalsbestimmung aufweist.<br />
4.2 Der segmentierende Automat<br />
Der Segmentierungsalgorithmus muß neben seiner Hauptaufgabe – dem effizienten Zerlegen<br />
eines Wortes – noch eine Reihe von weiteren Problemen lösen:<br />
1. Eine Reihe von zusammengesetzten Wörtern wie Staubecken, Wachstube, herzeigen etc.<br />
weist mehr als eine Segmentierung auf. Dies ist z.T. natürlich ein Problem <strong>der</strong> gewählten<br />
Repräsentationsebene – die orthographische Repräsentation ist ärmer als die phonetische<br />
–, stellt sich jedoch auch auf letzterer. Das Problem ist im übrigen keineswegs marginal,<br />
son<strong>der</strong>n ein Standardproblem je<strong>des</strong> Ansatzes <strong>der</strong> <strong>morphologischen</strong> <strong>Analyse</strong>. Es ist<br />
manchmal überraschend, welche sinnvollen und unsinnigen Wortanalysen ein gänzlich<br />
mechanisches Verfahren erzeugt 3 ; dies ist durchaus parallel zu sehen mit dem Phänomen<br />
<strong>der</strong> sog. attachment ambiguities, die sich aufgrund alternativer Anbindungsmöglichkeiten<br />
von Adjunktpräpositionalphrasen ergeben. Ein menschlicher Leser ist sich dieser Ambiguitäten<br />
selten bewußt, da er sie semantisch und pragmatisch auflöst, ein vollständiger<br />
Parser jedoch bringt sie ausnahmslos an den Tag.<br />
2. Komplexe Wörter können Teile enthalten, die nicht im Lexikon aufgeführt sind. Dies<br />
sollte nicht zum Abbruch <strong>der</strong> <strong>Analyse</strong> führen und auch nicht die Erkennung <strong>der</strong> bekannten<br />
Wortteile beeinträchtigen.<br />
3. Morphkonkatenation führt häufig zu phonetischen Än<strong>der</strong>ungen an den Morphgrenzen,<br />
die sich auch orthographisch nie<strong>der</strong>schlagen; so wird beispielsweise bei <strong>der</strong> Präteritumsbildung<br />
von schwachen Verben auf –chn ein e nach dem Stamm eingefügt: rechn + t ⇒<br />
rechnet. Solche Än<strong>der</strong>ungen beschränken sich nicht ausschließlich auf Morphgrenzen,<br />
son<strong>der</strong>n können sich, wie z.B. bei <strong>der</strong> Pluralumlautung von Nomen, ausschließlich beim<br />
Stammvokal bemerkbar machen.<br />
Der nächste Abschnitt stellt ein Automatenmodell vor, das sich für jeden dieser Problembereiche<br />
um eine Lösung bemüht.<br />
4.2.1 Das Automatenmodell<br />
Bei <strong>der</strong> Konzeption <strong>der</strong> Teilkomponente, die die Segmentierung eines möglicherweise komplexen<br />
Wortes in seine Bestandteile vornimmt, waren folgende Kriterien ausschlaggebend:<br />
1. Das <strong>Analyse</strong>modell muß eine Trennung zwischen den verarbeiteten Daten (den Morphen<br />
bzw. Morphemen <strong>der</strong> zu analysierenden Sprache) und dem Algorithmus, <strong>der</strong> die<br />
<strong>Analyse</strong> durchführt, gewährleisten. Auch wenn nicht die For<strong>der</strong>ung erhoben werden<br />
soll, daß das Verfahren sich für alle natürlichen Sprachen eignet, so sollte es zumin<strong>des</strong>t<br />
möglich sein, Sprachen, die dem <strong>Deutschen</strong> hinsichtlich Wortbildung und Flexion ähnlich<br />
sind, durch Austausch <strong>der</strong> Daten (also <strong>des</strong> Lexikons) zu analysieren.<br />
2 Dieses Kriterium ist nicht unproblematisch, da es von <strong>der</strong> „Trennschärfe“ <strong>des</strong> Bedeutungsbegriffs<br />
abhängt, etwa weil die Flexionskategorie „Plural“ Einfluß auf das Denotat eines Nomens nimmt.<br />
3 Beispielsweise die Zerlegung von Rin<strong>der</strong>braten in Rind+erb+rat-en.<br />
93