21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Methoden der morphologischen Analyse<br />

(3.7) besser=Verdienende, höchst=Strafe, weitest=entfernt; kranken=Haus,<br />

ältesten=Rat<br />

Bei einigen Wortbildungsmustern, die nur in bestimmten Kontexten häufig<br />

auftreten, lässt DMOR Übergenerierung bewusst zu: Grundsätzlich sind die<br />

Komparativ- und Superlativform von Adjektiven <strong>als</strong> Erstglieder zugelassen. Dies<br />

erlaubt die Erkennung und Zerlegung der in 3.7 aufgelisteten Wortformen. Allerdings<br />

sind dafür im Korpus nur sehr wenige Belege zu finden.<br />

(3.8) möglicherweise, normalerweise, glücklicherweise, üblicherweise, notwendigerweise,<br />

fälschlicherweise<br />

Sehr häufig ist hingegen die Bildung von Adverbien auf -weise (vgl. 3.8), die<br />

jedoch keine Komposition, sondern Derivation darstellt. Da weise im <strong>Lexikon</strong><br />

<strong>als</strong> Adjektiv eingetragen ist, wird für alle in 3.8 angegebenen Adverbien eine<br />

Analyse erzeugt, wenn auch nicht die richtige.<br />

(3.9) best=möglich, schnellst=möglich, frühest=möglich, weitest=gehend<br />

Für Superlativ beschränken sich die Funde auf ca. 30 Adjektive in recht<br />

eingeschränkten Fügungen (vgl. 3.9).<br />

(3.10)besten=Liste, nächsten=Hilfe, jüngsten=Turnier<br />

bestenfalls, schlimmstenfalls, günstigstenfalls, äußerstenfalls,<br />

schlechtestenfalls; schlechterenfalls<br />

Für Superlativ mit -en <strong>als</strong> Fuge sind im Korpus vereinzelte Belege für Komposition<br />

mit substantivischem Kopf zu finden, aber zahlreiche Adverbbildungen<br />

auf -falls (vgl. 3.10). Da im DMOR-<strong>Lexikon</strong> jedoch falls nur <strong>als</strong> Konjunktion<br />

eingetragen ist und <strong>als</strong> solche nicht an Wortbildung teilhaben darf, werden die<br />

Bildungen auf -falls, die nicht im <strong>Lexikon</strong> eingetragen sind, nicht analysiert.<br />

Dass Derivation in DMOR nicht behandelt wird, bedeutet, dass völlig regulär<br />

gebildete Ableitungen wie brauch bar, Brauch bar keit, Un brauch bar keit<br />

usw. im <strong>Lexikon</strong> eingetragen werden müssen und nicht über die in ihnen<br />

enthaltenen Morpheme analysiert werden können. Um bei besonders häufig<br />

vorkommenden Mustern dennoch die Analyse zu ermöglichen, ist im Substantivlexikon<br />

bspw. eine Form *Losigkeit eingetragen, die aus der nicht erkannten<br />

Derivation eine erkannte Komposition macht und somit die Erkennung vieler<br />

Wortformen ermöglicht. Dass hier die Wortbildung nicht korrekt ist, wird für<br />

die korrekte Erkennung der Flexionsinformation in Kauf genommen. Diese Art<br />

des Work-arounds ist allerdings nur in sehr eingeschränkten Fällen möglich.<br />

Neben der faktischen Gleichstellung von Simplizia und Derivativa gibt es<br />

einen zweiten Kritikpunkt an DMOR: Da das <strong>Lexikon</strong> allein der Kompilierung in<br />

42

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!