11.02.2013 Aufrufe

Aspekte der morphologischen Analyse des Deutschen - Universität ...

Aspekte der morphologischen Analyse des Deutschen - Universität ...

Aspekte der morphologischen Analyse des Deutschen - Universität ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Kapitel 5: Eine merkmalsbasierte Beschreibung <strong>der</strong> Morphologie im <strong>Deutschen</strong><br />

Das zweite Problem <strong>der</strong> Methode, unbekannte Wortteile unterspezifiziert dem Parser zu<br />

präsentieren, besteht in <strong>der</strong> Vielzahl <strong>der</strong> möglichen <strong>Analyse</strong>n. Hier bietet sich <strong>der</strong> (in Kapitel<br />

4 schon einmal angedeutete) Weg an, Informationen, die ein (robuster) Satzparser über die<br />

syntaktische Umgebung <strong>des</strong> als Ganzes unbekannten Wortes gewinnen kann, über eine passende<br />

Instantiierung <strong>des</strong> Startsymbols <strong>der</strong> Wortgrammatik in die morphologische <strong>Analyse</strong><br />

einzuspeisen. Überhaupt kann die robuste Verarbeitung unbekannter Wörter nicht Aufgabe<br />

<strong>der</strong> Morphologiekomponente allein sein. Und hier liegt gerade ein Vorteil in <strong>der</strong> Tatsache,<br />

daß sich satzsyntaktische und wortsyntaktische Repräsentationen <strong>des</strong> gleichen Formalismus<br />

bedienen.<br />

Die errechneten Strukturen für Stämme vom Typ unknown_stem könnten gespeichert und<br />

bei Erreichen einer bestimmten Vorkommenshäufigkeit ihre Generalisierung berechnet werden,<br />

d.h. <strong>der</strong> spezifischste Merkmalsterm, <strong>der</strong> alle gespeicherten Merkmalsterme subsumiert.<br />

5.7 Verwandte Arbeiten<br />

5.7.1 Antworth (1994)<br />

Antworth (1994) verwendet neben einem Two-Level-Segmentierer eine unifikationsbasierte<br />

morphologische Grammatik auf <strong>der</strong> Grundlage <strong>des</strong> (nichttypisierten) PATR-II-Formalismus<br />

(Shieber (1984)). PATR kennt neben sog. Templates, die nicht-rekursiven Sorten <strong>des</strong> hier verwendeten<br />

Systems entsprechen und vor allem <strong>der</strong> Übersichtlichkeit <strong>des</strong> Lexikonaufbaus<br />

dienen, und um Pfadgleichungen erweiterte kontextfreie Regeln. Pfadgleichungen treten in<br />

zwei Formen auf: in Gestalt von = zur Festlegung von Merkmalswerten am<br />

Ende von Pfaden und in <strong>der</strong> Form = zur Angabe von Reentranzen. Nachstehend<br />

ist ein (in <strong>der</strong> Notation leicht angepaßter) Ausschnitt von Antworths Wortgrammatik<br />

für das Englische wie<strong>der</strong>gegeben:<br />

(46)<br />

R1 Word → Stem Infl<br />

= <br />

= <br />

= <br />

= < Infl TENSE><br />

= < Infl AFORM><br />

R2 Stem → Stem1 Suffix<br />

= <br />

= <br />

= <br />

= <br />

= <br />

= <br />

Regel R1 bezieht sich auf die Flexion. Genau ein Flexiv tritt zu einem Stamm, den es subkategorisiert<br />

( = ); gleichzeitig legt es die Kategorie <strong>des</strong> flektierten<br />

Wortes fest ( = ). Ähnliches gilt für Suffix in <strong>der</strong> Suffigierungsregel<br />

R2; Affixe fungieren demnach wie Slash-Kategorien <strong>der</strong> Kategorialgrammatik.<br />

Für die <strong>Analyse</strong> von Komposita wird keine erkennbare Vorsorge getroffen (wohl weil sie im<br />

Englischen durch die Satzanalyse übernommen werden kann), ebensowenig wie eine semantische<br />

Repräsentation für abgeleitete Stämme erzeugt wird.<br />

5.7.2 Ritchie et al. (1992)<br />

174

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!