21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Methoden der morphologischen Analyse<br />

$¡ ¤¤¡¢ £¢§<br />

$¡ £ ¤¤¡¢ %<br />

$¡ ¥¤¤ ¤¤¡¢ £ £¨£<br />

$¡ ¤¤¡¢ £¨£ ¦£§<br />

¤¤¡¢ ¢ $¡ £ £¨£<br />

$¡ £¨¢© ¤ £ ¤¤¡¢<br />

¤¤¡¢ £¢ ¨£&% $¡<br />

¤¤¡¢ $¡ £¢<br />

$¡ ¤¤¡¢£ <br />

$¡ ¨£§ ¤¤¡¢£ ¨¥©<br />

¨£§ ¨£ $¡ ¤¤¡¢£<br />

¨£§ $¡ ¨¤ ¤¤¡¢£<br />

Flexionsklasse Beispiele # Stämme<br />

Angehörige, Beamte 8<br />

Buchstabe, Friede, Wille 17<br />

Abfluß, Kuß, Paß 44<br />

Beschuß, Haß 6<br />

Abriß, Krokus, Regreß 46<br />

Albatros, Rebus 11<br />

Absolutismus, Logarithmus, Zyklus 98<br />

Ablativus, Nukleus 18<br />

Allroundman:Allroundmen, Anbau:Anbauten 42<br />

Nu, Moschus, Vokalismus 308<br />

Mars, Unterricht, Zustrom 317<br />

Adel, Pardon, Äther 195<br />

Abbildung 3.18: DMOR-Flexionsklassen: Nomina maskulinum (1/2)<br />

listet. Über diese hinaus ist Komposition mit verbalem Kopf nicht zugelassen:<br />

schlangestehen und gegensteuern werden von DMOR nicht analysiert, da schlange<br />

und gegen nicht <strong>als</strong> Verbzusätze aufgelistet sind. 13 Dies gilt nicht, wenn die<br />

Wortform substantiviert ist: (das) Schlange=stehen und (das) Gegen=steuern<br />

werden über die Kompositionsregeln von DMOR erfasst. 14<br />

Das DMOR-<strong>Lexikon</strong> orientiert sich in seinem Wortbestand im Wesentlichen<br />

am HGC (vgl. Abschnitt 1.5). Daher sind Fremdwörter enthalten, sofern<br />

sie mit einer gewissen Häufigkeit im HGC vorkommen und damit <strong>als</strong><br />

’eingedeutscht’ gelten können (Beispiele nach HGC-Vorkommenshäufigkeit absteigend<br />

sortiert): liveE*IJVJVJL6K , ClinchE4S6LJL6K , FayenceE4U6F(V6K , DinnerE4UJHJV6K , DisplayE G&T6FJK ,<br />

checkenE4TJI6K , CoupéE*LJL6K , powernE*IJT6K , CompilerE4I(S,K , bleuE4UJL6K , sprayenE4UWG3K , groggyE G&U6K .<br />

Diskussion<br />

DMOR ist ein sehr mächtiges Morphologiesystem, in dem Flexionsphänomene<br />

des Deutschen durch die <strong>Ein</strong>bettung in das Zwei-Ebenen-Modell adäquat behandelt<br />

werden. Bei der Erkennung von Wortformen lag das <strong>System</strong> auf der<br />

Morpholympics bei verschiedenen <strong>Ein</strong>gabewortlisten immer bei den besseren<br />

<strong>System</strong>en (vgl. Hausser (1996), S. 14, dort PC-K abgekürzt), was zum einen<br />

auf die Größe des <strong>Lexikon</strong>s, zum anderen auf den sehr stark übergenerierenden<br />

Kompositionsmechanismus zurückzuführen ist. Reguläre systematische Phänomene<br />

wie die Substantivierung von Infinitiv- und Partizipformen und die Erkennung<br />

großgeschriebener Wortformen am Satzanfang werden systematisch<br />

13 Der Grund hierfür liegt vermutlich in der massiven Übergenerierung, wenn alle Substantive,<br />

Adjektive, Adverbien und Verben <strong>als</strong> Erstglieder für die Komposition mit Verben zugelassen<br />

werden: (ich) *schlangestehe würde analysiert.<br />

14 Die Berechtigung hierfür liegt natürlich in der Tatsache, dass flektierte Formen wie (des)<br />

Schlangestehens völlig akzeptierbare Wortformen sind.<br />

40

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!