Aspekte der morphologischen Analyse des Deutschen - Universität ...
Aspekte der morphologischen Analyse des Deutschen - Universität ...
Aspekte der morphologischen Analyse des Deutschen - Universität ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Kapitel 5: Eine merkmalsbasierte Beschreibung <strong>der</strong> Morphologie im <strong>Deutschen</strong><br />
Das zweite Problem <strong>der</strong> Methode, unbekannte Wortteile unterspezifiziert dem Parser zu<br />
präsentieren, besteht in <strong>der</strong> Vielzahl <strong>der</strong> möglichen <strong>Analyse</strong>n. Hier bietet sich <strong>der</strong> (in Kapitel<br />
4 schon einmal angedeutete) Weg an, Informationen, die ein (robuster) Satzparser über die<br />
syntaktische Umgebung <strong>des</strong> als Ganzes unbekannten Wortes gewinnen kann, über eine passende<br />
Instantiierung <strong>des</strong> Startsymbols <strong>der</strong> Wortgrammatik in die morphologische <strong>Analyse</strong><br />
einzuspeisen. Überhaupt kann die robuste Verarbeitung unbekannter Wörter nicht Aufgabe<br />
<strong>der</strong> Morphologiekomponente allein sein. Und hier liegt gerade ein Vorteil in <strong>der</strong> Tatsache,<br />
daß sich satzsyntaktische und wortsyntaktische Repräsentationen <strong>des</strong> gleichen Formalismus<br />
bedienen.<br />
Die errechneten Strukturen für Stämme vom Typ unknown_stem könnten gespeichert und<br />
bei Erreichen einer bestimmten Vorkommenshäufigkeit ihre Generalisierung berechnet werden,<br />
d.h. <strong>der</strong> spezifischste Merkmalsterm, <strong>der</strong> alle gespeicherten Merkmalsterme subsumiert.<br />
5.7 Verwandte Arbeiten<br />
5.7.1 Antworth (1994)<br />
Antworth (1994) verwendet neben einem Two-Level-Segmentierer eine unifikationsbasierte<br />
morphologische Grammatik auf <strong>der</strong> Grundlage <strong>des</strong> (nichttypisierten) PATR-II-Formalismus<br />
(Shieber (1984)). PATR kennt neben sog. Templates, die nicht-rekursiven Sorten <strong>des</strong> hier verwendeten<br />
Systems entsprechen und vor allem <strong>der</strong> Übersichtlichkeit <strong>des</strong> Lexikonaufbaus<br />
dienen, und um Pfadgleichungen erweiterte kontextfreie Regeln. Pfadgleichungen treten in<br />
zwei Formen auf: in Gestalt von = zur Festlegung von Merkmalswerten am<br />
Ende von Pfaden und in <strong>der</strong> Form = zur Angabe von Reentranzen. Nachstehend<br />
ist ein (in <strong>der</strong> Notation leicht angepaßter) Ausschnitt von Antworths Wortgrammatik<br />
für das Englische wie<strong>der</strong>gegeben:<br />
(46)<br />
R1 Word → Stem Infl<br />
= <br />
= <br />
= <br />
= < Infl TENSE><br />
= < Infl AFORM><br />
R2 Stem → Stem1 Suffix<br />
= <br />
= <br />
= <br />
= <br />
= <br />
= <br />
Regel R1 bezieht sich auf die Flexion. Genau ein Flexiv tritt zu einem Stamm, den es subkategorisiert<br />
( = ); gleichzeitig legt es die Kategorie <strong>des</strong> flektierten<br />
Wortes fest ( = ). Ähnliches gilt für Suffix in <strong>der</strong> Suffigierungsregel<br />
R2; Affixe fungieren demnach wie Slash-Kategorien <strong>der</strong> Kategorialgrammatik.<br />
Für die <strong>Analyse</strong> von Komposita wird keine erkennbare Vorsorge getroffen (wohl weil sie im<br />
Englischen durch die Satzanalyse übernommen werden kann), ebensowenig wie eine semantische<br />
Repräsentation für abgeleitete Stämme erzeugt wird.<br />
5.7.2 Ritchie et al. (1992)<br />
174