21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Methoden der morphologischen Analyse<br />

Variante (a), auch Vollform(en)lexikon genannt, ist nicht praktikabel, da<br />

ständig neue Wörter gebildet werden, die Liste <strong>als</strong>o nie vollständig sein kann.<br />

“Ohne regelgesteuerte Wortzerlegung sind die <strong>System</strong>e auf die individuelle Erfassung<br />

der <strong>Ein</strong>zellexeme angewiesen und können mit dem ständig wachsenden<br />

<strong>Lexikon</strong> der natürlichen Sprachen nicht fertig werden.” (Hausser (1996),<br />

S. 19) In der Liste nicht enthaltene Wortformen werden nicht erkannt. Trotz<br />

dieser <strong>Ein</strong>schränkungen existiert mit der CELEX Lexical Database eine solche<br />

Ressource für die Sprachen Niederländisch, Deutsch und Englisch. 1 Der Zugriff<br />

auf diese Ressource erfolgt durch simples Nachschauen, ob eine Wortform enthalten<br />

ist.<br />

Variante (b) umfasst alle <strong>System</strong>e, in denen Flexion und/oder Wortbildung<br />

auf Regeln zurückgeführt werden. Die Regeln können fest mit der Programmlogik<br />

verbunden sein oder aber getrennt vom Programm explizit vorliegen. Sie<br />

operieren auf den <strong>Ein</strong>heiten, die im <strong>Lexikon</strong> einer Morphologiekomponente abgelegt<br />

sind. Dies können Lexeme, Stämme oder Morpheme sein. Dazu kommen<br />

Flexionselemente. In Stammlexika sind allomorphe Stämme einzeln aufgelistet,<br />

es gibt <strong>als</strong>o beispielsweise zwei <strong>Ein</strong>träge Apfel und Äpfel. In Lexemlexika muss<br />

für den <strong>Ein</strong>trag Apfel der umgelautete Plur<strong>als</strong>tamm extra berechnet werden.<br />

In einem Morphemlexikon sind sowohl Allomorphe <strong>als</strong> auch Derivationsaffixe<br />

aufgelistet. Wenn Allomorphe im <strong>Lexikon</strong> enthalten sind, kann eine Morphologiekomponente<br />

rein konkatenativ arbeiten. Die Wortformen setzen sich vollständig<br />

und disjunkt aus im <strong>Lexikon</strong> gespeicherten <strong>Ein</strong>heiten zusammen. Dieses<br />

Modell wird häufig <strong>als</strong> Item and Arrangement (IA) bezeichnet (vgl. Abschnitt<br />

4.2). Sind keine Allomorphe im <strong>Lexikon</strong> enthalten, müssen nicht konkatenativ<br />

ablaufende morphologische Prozesse wie Umlautung und Tilgung während der<br />

morphologischen Analyse berücksichtigt werden. Dieses Modell wird <strong>als</strong> Item<br />

and Process (IP) bezeichnet (vgl. Abschnitt 4.3).<br />

Beispiele für Morphologiesysteme, bei denen Allomorphe explizit im <strong>Lexikon</strong><br />

abgelegt sind, sind Morph (vgl. Hanrieder (1996)) und MPRO (vgl. Maas<br />

(1996)). In den <strong>System</strong>en Morphix (vgl. Finkler und Lutzy (1996)) und Morphy<br />

(vgl. Lezius (1996)) werden allomorphe Stämme starker Verben im <strong>Lexikon</strong><br />

gespeichert, während Umlautung <strong>als</strong> regulärer Prozess behandelt wird, <strong>als</strong>o<br />

Umlaute bei der Analyse probehalber durch die ihnen zugrundeliegenden Vokale<br />

ersetzt werden. 2 Das <strong>System</strong> LA-Morph (vgl. Schüller und Lorenz (1996))<br />

schließlich enthält Allomorph-Regeln, mit deren Hilfe vor Beginn der morphologischen<br />

Analyse aus dem Lexem-<strong>Lexikon</strong> alle allomorphen Formen berechnet<br />

werden.<br />

1 In Abschnitt 5.2 wird der deutschsprachige Teil von CELEX ausführlich vorgestellt.<br />

2 Im folgenden Abschnitt wird die Verarbeitung am Beispiel von Morphy kurz vorgestellt.<br />

22

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!