11.02.2013 Aufrufe

Aspekte der morphologischen Analyse des Deutschen - Universität ...

Aspekte der morphologischen Analyse des Deutschen - Universität ...

Aspekte der morphologischen Analyse des Deutschen - Universität ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Kapitel 4: Ein Modell eines <strong>morphologischen</strong> <strong>Analyse</strong>systems<br />

Ein Morphem – in üblicher strukturalistischer Weise als kleinste bedeutungstragende Einheit<br />

definiert – kann bei gleichbleiben<strong>der</strong> Bedeutung 2 eine Reihe verschiedener Oberflächenrealisationen,<br />

die sog. (Allo)Morphe, aufweisen, was auch als Allomorphie bezeichnet wird. Unter<br />

Basismorph wird im weiteren ein Stellvertreter aus <strong>der</strong> Menge <strong>der</strong> Allomorphe verstanden,<br />

<strong>der</strong> das Morphem benennt, wozu das kürzeste bzw. dasjenige Allomorph ausgewählt wird,<br />

welches die vergleichsweise allgemeinste Merkmalsbestimmung aufweist.<br />

4.2 Der segmentierende Automat<br />

Der Segmentierungsalgorithmus muß neben seiner Hauptaufgabe – dem effizienten Zerlegen<br />

eines Wortes – noch eine Reihe von weiteren Problemen lösen:<br />

1. Eine Reihe von zusammengesetzten Wörtern wie Staubecken, Wachstube, herzeigen etc.<br />

weist mehr als eine Segmentierung auf. Dies ist z.T. natürlich ein Problem <strong>der</strong> gewählten<br />

Repräsentationsebene – die orthographische Repräsentation ist ärmer als die phonetische<br />

–, stellt sich jedoch auch auf letzterer. Das Problem ist im übrigen keineswegs marginal,<br />

son<strong>der</strong>n ein Standardproblem je<strong>des</strong> Ansatzes <strong>der</strong> <strong>morphologischen</strong> <strong>Analyse</strong>. Es ist<br />

manchmal überraschend, welche sinnvollen und unsinnigen Wortanalysen ein gänzlich<br />

mechanisches Verfahren erzeugt 3 ; dies ist durchaus parallel zu sehen mit dem Phänomen<br />

<strong>der</strong> sog. attachment ambiguities, die sich aufgrund alternativer Anbindungsmöglichkeiten<br />

von Adjunktpräpositionalphrasen ergeben. Ein menschlicher Leser ist sich dieser Ambiguitäten<br />

selten bewußt, da er sie semantisch und pragmatisch auflöst, ein vollständiger<br />

Parser jedoch bringt sie ausnahmslos an den Tag.<br />

2. Komplexe Wörter können Teile enthalten, die nicht im Lexikon aufgeführt sind. Dies<br />

sollte nicht zum Abbruch <strong>der</strong> <strong>Analyse</strong> führen und auch nicht die Erkennung <strong>der</strong> bekannten<br />

Wortteile beeinträchtigen.<br />

3. Morphkonkatenation führt häufig zu phonetischen Än<strong>der</strong>ungen an den Morphgrenzen,<br />

die sich auch orthographisch nie<strong>der</strong>schlagen; so wird beispielsweise bei <strong>der</strong> Präteritumsbildung<br />

von schwachen Verben auf –chn ein e nach dem Stamm eingefügt: rechn + t ⇒<br />

rechnet. Solche Än<strong>der</strong>ungen beschränken sich nicht ausschließlich auf Morphgrenzen,<br />

son<strong>der</strong>n können sich, wie z.B. bei <strong>der</strong> Pluralumlautung von Nomen, ausschließlich beim<br />

Stammvokal bemerkbar machen.<br />

Der nächste Abschnitt stellt ein Automatenmodell vor, das sich für jeden dieser Problembereiche<br />

um eine Lösung bemüht.<br />

4.2.1 Das Automatenmodell<br />

Bei <strong>der</strong> Konzeption <strong>der</strong> Teilkomponente, die die Segmentierung eines möglicherweise komplexen<br />

Wortes in seine Bestandteile vornimmt, waren folgende Kriterien ausschlaggebend:<br />

1. Das <strong>Analyse</strong>modell muß eine Trennung zwischen den verarbeiteten Daten (den Morphen<br />

bzw. Morphemen <strong>der</strong> zu analysierenden Sprache) und dem Algorithmus, <strong>der</strong> die<br />

<strong>Analyse</strong> durchführt, gewährleisten. Auch wenn nicht die For<strong>der</strong>ung erhoben werden<br />

soll, daß das Verfahren sich für alle natürlichen Sprachen eignet, so sollte es zumin<strong>des</strong>t<br />

möglich sein, Sprachen, die dem <strong>Deutschen</strong> hinsichtlich Wortbildung und Flexion ähnlich<br />

sind, durch Austausch <strong>der</strong> Daten (also <strong>des</strong> Lexikons) zu analysieren.<br />

2 Dieses Kriterium ist nicht unproblematisch, da es von <strong>der</strong> „Trennschärfe“ <strong>des</strong> Bedeutungsbegriffs<br />

abhängt, etwa weil die Flexionskategorie „Plural“ Einfluß auf das Denotat eines Nomens nimmt.<br />

3 Beispielsweise die Zerlegung von Rin<strong>der</strong>braten in Rind+erb+rat-en.<br />

93

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!