21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Vorhandene <strong>Lexikon</strong>-<strong>System</strong>e<br />

gen zählen zu den komplexen Formen. Da jedoch “die Präfigierungen einfacher<br />

Basen sich häufig anders verhalten <strong>als</strong> die Basis” (ebd.), werden einfache Formen<br />

und Präfigierungen noch zum <strong>Lexikon</strong> der erweiterten einfachen Formen<br />

zusammengefasst.<br />

Die Definition der einfachen Form in CISLEX lautet wie folgt: “<strong>Ein</strong> Wort W<br />

ist eine einfache Form genau dann, wenn es keine sinnvolle Zerlegung W =<br />

WG WU gibt, so daß WG eine Folge von Morphemen ist und WU ein Wort mit denselben<br />

morphologischen Eigenschaften wie W.” (Maier-Meyer (1995), S. 31)<br />

Da vorher bereits festgestellt wird, dass das Kernlexikon “in erster Linie ein<br />

morphologisch-orientiertes <strong>Lexikon</strong> des Deutschen sein soll” (ebd.), gehe ich<br />

davon aus, dass idiomatisierte oder lexikalisierte Komposita wie Augenschein,<br />

Brombeere und Bahnhof in CISLEX <strong>als</strong> komplexe Formen behandelt werden.<br />

Die flektierenden Wortarten werden in CISLEX in Flexionsklassen eingeteilt.<br />

Aufgrund des Anspruchs der Vollständigkeit, <strong>als</strong>o der Abdeckung großer<br />

Textkorpora, gibt es bspw. für Substantive eine große Anzahl Flexionsklassen:<br />

Maier-Meyer listet allein 101 Klassen für die Plural-Deklination der Nomen auf<br />

(vgl. Maier-Meyer (1995), S. 46ff.). 7<br />

5.3.2 Bewertung<br />

Bei CISLEX handelt es sich um ein <strong>Lexikon</strong>system, das sehr pragmatisch orientiert<br />

ist: Das Ziel der vollständigen Abdeckung von Wortformen in Textkorpora<br />

lässt sich derzeit nur durch ein breit angelegtes <strong>Lexikon</strong> erreichen, nicht<br />

durch eines, das bei bestimmten Phänomenen wie der Wortbildung in die Tiefe<br />

geht. Die konsequente Benennung und Behandlung von Problemklassen, die<br />

außerhalb der Kernbereiche der Morphologie angesiedelt sind, ist zur Erreichung<br />

des Ziels unerlässlich. Es ist zu vermuten, dass CISLEX von allen verfügbaren<br />

kombinierten <strong>Lexikon</strong>-/Morphologiesystemen dieser Aufgabe am besten<br />

gerecht wird.<br />

<strong>Ein</strong> zweiter sehr beachtenswerter Aspekt bei CISLEX ist die Kaskade der<br />

Verarbeitungsschritte: Durch die Aufteilung der morphologischen Analyse vom<br />

Nachschauen in Lexika für einen schnellen Zugriff bis hin zur Anwendung von<br />

Zerlegungsalgorithmen, wenn vorher keine Analyse gefunden wurde, vermeidet<br />

das <strong>System</strong> ein Problem nicht-kaskadierter <strong>System</strong>e: dass mehrdeutige Zerlegungen<br />

gefunden werden, obwohl die richtige Lösung bereits bekannt ist.<br />

7 Darunter finden sich Beispiele wie die Grundform Targi , deren Pluralform sich durch Abschneiden<br />

der letzten vier Buchstaben und Anhängen der Zeichenkette uareg ergibt.<br />

74

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!