21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Grundlagen der morphologischen Analyse<br />

Allgemeinen nur in der dritten Person Singular mit einem expletiven es verwendet<br />

werden: Es regnet. Ebenso aus semantischen Gründen sind manche Adjektive<br />

nicht steigerbar (tiefblau, endlos) oder gibt es für manche Substantive keine<br />

Pluralformen (Akribie, Durst, Tod: Singulariatantum) bzw. keine Singularformen<br />

(Kosten, Leute: Pluraliatantum). Allerdings sind Sprecher des Deutschen<br />

durchaus in der Lage, die fehlenden Formen zu bilden bzw. sie zu erkennen:<br />

?Ich regne Sterne für Dich. Ich sterbe tausend Tode. Es erscheint <strong>als</strong>o durchaus<br />

plausibel, diese defektiven Paradigmen in einem Morphologiesystem genauso<br />

wie die normalen Paradigmen zu behandeln.<br />

2.2 Die Aufgabe der morphologischen Analyse<br />

Die morphologische Analyse hat traditionell zweierlei Aufgaben: Zum einen<br />

muss sie für eine gegebene Wortform ein dazugehöriges oder mehrere dazugehörige<br />

Lexeme identifizieren. Zum anderen muss sie die Stellen des Paradigmas<br />

ermitteln, die der Wortform entsprechen. Bei der morphologischen Analyse<br />

handelt es sich <strong>als</strong>o um eine Prozedur, die eine Wortform in die zugehörigen<br />

morphosyntaktischen Merkmale zerlegt. Die Ausgabe 4 besteht aus der Grundform,<br />

der Wortart und den weiteren syntaktischen Kategorien. Die Wortform<br />

Hauses beispielsweise lässt sich dem Lexem Haus in der Wortart Substantiv<br />

zuordnen, der Kasus ist Genitiv und der Numerus ist Singular. Diese Informationen<br />

werden im Folgenden in einem Analysestring 5 notiert (vgl. Beispiel 2.1).<br />

Die Grundlage für diese Notation bildet der Standard STTS (Stuttgart-Tübingen<br />

Tagset, vgl. Schiller et al. (1999)). 6<br />

(2.1)<br />

¢¡¤£¦¥¤§©¨©¨¨ ££¨¡¨£<br />

Für den Fall, dass das Lemma in einem Zusammenhang nicht relevant ist,<br />

wird ein Morphologiestring, der nur die Informationen zur Wortart und zu<br />

den morphosyntaktischen Kategorien enthält, verwendet (vgl. Beispiel 2.2).<br />

(2.2)<br />

§¨©¨¨¤£¤£¨¡ £¤<br />

4 Da die morphologische Analyse i.A. von einer Morphologiekomponente durchgeführt wird,<br />

werden die Begriffe Resultat und Ausgabe der morphologischen Analyse in dieser Arbeit synonym<br />

zueinander verwendet.<br />

5 Die Bezeichnung grammatisches Wort, die hierfür in der Literatur zu finden ist, halte ich für<br />

missverständlich in seiner Konnatation zum Begriff des Wortes, da es doch gerade nicht um die<br />

<strong>Ein</strong>heit Wort, sondern um die Darstellung der einer Wortform inhärenten morphosyntaktischen<br />

Merkmale geht.<br />

6 Kategorien lassen sich jeweils eindeutig einer Kategorisierung zuweisen. <strong>Ein</strong>e Auflistung aller<br />

Kategorisierungen und der dazugehörigen Kategorien für das Deutsche findet sich in Schiller<br />

et al. (1999). Sie ist zusätzlich in Anhang B auf Seite 141 angegeben. <strong>Ein</strong>e formale Beschreibung<br />

der Syntax von Analysestrings im EBNF-Format findet sich in Anhang A auf Seite 139.<br />

14

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!