11.02.2013 Aufrufe

Aspekte der morphologischen Analyse des Deutschen - Universität ...

Aspekte der morphologischen Analyse des Deutschen - Universität ...

Aspekte der morphologischen Analyse des Deutschen - Universität ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Kapitel 4: Ein Modell eines <strong>morphologischen</strong> <strong>Analyse</strong>systems<br />

Beispielsweise wird aus einer Merkmalsstruktur mit dem GRAPH-Wert H$aus ($ kennzeichnet<br />

den umlautenden Vokal, <strong>der</strong> durch die Funktion f_umlaut durch seinen Umlaut ersetzt<br />

wird) die Pluralstammform Häus-. Die Markierung dieser Form mit dem Pluralmerkmal<br />

stellt sicher, daß sie nur mit Pluralflexiven kombiniert werden kann. Die an<strong>der</strong>e Merkmalsstruktur<br />

beschreibt die Verwendung <strong>des</strong> Morphs (im Beispiel also Haus-) im Kontext von<br />

Flexiven mit dem Merkmal Singular. Surface ist eine Funktion, die die zur Kennzeichnung<br />

relevanter Grapheme verwendeten diakritischen Zeichen entfernt.<br />

4.4.2 Behandlung von morphographematischen Kombinationsbeschränkungen<br />

Die Markierung <strong>der</strong> durch die Allomorphieregeln erzeugten Morphe mit bestimmten<br />

Merkmalen stellt – zusammen mit den Regeln <strong>der</strong> Wortgrammatik – sicher, daß nur kompatible<br />

Morphe miteinan<strong>der</strong> kombiniert werden können. Beispielsweise erfor<strong>der</strong>t die rekursive<br />

Flexionsregel im nächsten Kapitel, daß die morphosyntaktischen Merkmale von Stamm und<br />

Flexiv miteinan<strong>der</strong> unifiziert werden. Auf diese Weise werden unzulässige Wortformen wie<br />

*Hauser aufgrund <strong>der</strong> inkompatiblen Werte <strong>des</strong> Numerus-Merkmals ausgeschlossen.<br />

Was die Unifikation von Merkmalsstrukturen allerdings nicht leistet, ist <strong>der</strong> Ausschluß von<br />

in morphographematischer Hinsicht unzulässigen Morphkombinationen wie die in Beispiel<br />

4.7 erwähnten. Dies macht daher einen weiteren Mechanismus erfor<strong>der</strong>lich, für <strong>des</strong>sen Realisierung<br />

zunächst einmal zwei grundsätzliche Möglichkeiten bestehen: Integration in die<br />

Wortgrammatik o<strong>der</strong> Integration in den Parser.<br />

Kombinationsbeschränkungen <strong>der</strong> genannten Art mit Hilfe <strong>der</strong> Wortgrammatik auszudrükken<br />

ist aus min<strong>des</strong>tens drei Gründen die theoretisch befriedigen<strong>der</strong>e Möglichkeit:<br />

1. Um sie auszudrücken macht man ebenfalls von Merkmalsstrukturen und Unifikation<br />

Gebrauch, also von den Beschreibungsmitteln, die ohnehin notwendig sind.<br />

2. Es werden keine weiteren Automaten wie Two-Level-Transducer u.ä. mehr benötigt<br />

3. Der einzige Ort, an dem morphographematische Regularitäten ausgedrückt werden, sind<br />

die Allomorphieregeln. Sie werden so erweitert, daß sie die erzeugten Morphe mit den<br />

gewünschten Beschränkungen versehen.<br />

Da die Graphematik relativ ausdrucksarm ist, wäre es notwendig, hierzu die phonetische<br />

Ebene mit einzubeziehen, was aber außerhalb <strong>des</strong> gesteckten Rahmens dieser Arbeit liegt.<br />

Daß es jedoch möglich ist, phonetische und phonologische Regelmäßigkeiten mit Unifikations-<br />

bzw. constraint-basierten Formalismen abzubilden, zeigen die Arbeiten aus dem Bereich<br />

<strong>der</strong> computational phonology (z.B. Bird (1995)).<br />

Die an<strong>der</strong>e Option, morphographematische Kombinationsbeschränkungen zu realisieren, ist,<br />

sie in Form von Automaten in den Parsvorgang zu integrieren. Dies könnte durch Hinzufügen<br />

von Zustandsinformationen dieser Automaten in die Kanten <strong>des</strong> Chart-Parsers bewerkstelligt<br />

werden, soll aber hier auch nicht weiter verfolgt werden.<br />

4.5 Weitere <strong>Aspekte</strong><br />

4.5.1 Aktualisierung <strong>des</strong> Automaten<br />

Ein Ziel <strong>des</strong> Gesamtansatzes ist, ein robustes <strong>Analyse</strong>verfahren zu entwickeln, welches mit<br />

<strong>der</strong> notorischen Unvollständigkeit <strong>des</strong> Lexikons umgeht und daher in <strong>der</strong> Lage ist, unbekannte<br />

Wortteile nicht nur zu ignorieren, son<strong>der</strong>n diese zu identifizieren und unter Ausnut-<br />

113

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!