21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

6.1.2 Prinzipien bei der Konzeption einer Ressource<br />

6.1 Vorüberlegungen<br />

Unabhängig vom Repräsentationsformat gibt es zu strukturellen und inhaltlichen<br />

Aspekten der Ressource einige Entscheidungen zu treffen. Unter inhaltlichen<br />

Gesichtspunkten ist dies die Frage nach der Abhängigkeit von einer bestimmten<br />

Theorie. Unter strukturellen Gesichtspunkten gibt es verschiedene<br />

Varianten, in denen ein <strong>Lexikon</strong>modell realisiert werden kann. Die Frage und<br />

die Varianten werden im Folgenden beleuchtet.<br />

Theorieunabhängigkeit<br />

Es ist wünschenswert, sich nicht zu stark an Theorien zu binden, da mit einer<br />

Änderung an der Theorie immer auch Änderungen an einem darauf aufbauenden<br />

<strong>System</strong> verbunden sind. In IMSLEX besteht eine Abhängigkeit vom Modell<br />

der Zwei-Ebenen-Morphologie, was allomorphe Flexionsstämme angeht: Aus<br />

DMOR wird in IMSLEX die Kodierung umgelauteter Pluralformen von Substantiven<br />

über die Flexionsklasse übernommen. Im <strong>Ein</strong>trag Apfel verweist allein<br />

ein Dollar-Zeichen im Flexionsklassen-Bezeichner auf die Umlautung im Plural.<br />

Der umgelautete Plur<strong>als</strong>tamm selber wird nicht angegeben, sondern kann nur<br />

implizit über eine Analyse des Flexionsklassen-Bezeichners ermittelt werden. 3<br />

Die Flexionsklassen-Bezeichner können nicht ohne weiteres in ein Paradigma<br />

übersetzt werden, welches unabhängig von einem Morphologiesystem ist, das<br />

die Zwei-Ebenen-Morphologie implementiert.<br />

<strong>Ein</strong>e Theorieunabhängigkeit ließe sich hier nur erreichen, wenn man alle<br />

Flexionsparadigmen ausmultiplizierte und nach Stämmen und Endungen neu<br />

gruppierte. 4 Da das <strong>Lexikon</strong> allerdings derzeit <strong>als</strong> Datenbasis für ein Zwei-<br />

Ebenen-Morphologiesystem (SMOR, vgl. Schmid et al. (2004)) dient, bleibt die<br />

Theorieabhängigkeit zunächst bestehen.<br />

Redundanzvermeidung<br />

Redundanz in einem <strong>System</strong> kann eine erhöhte Fehleranfälligkeit zur Folge<br />

haben. Daher wird gewöhnlich versucht, Generalisierungen wahrzunehmen,<br />

die die Fehleranfälligkeit eines <strong>System</strong>s reduzieren. <strong>Ein</strong> Beispiel für eine solche<br />

Generalisierung sind die Flexionsparadigmen: Die Angabe einer Grundform<br />

und einer Flexionsklasse erspart die obligatorische Angabe aller Wortformen eines<br />

Paradigmas. Wird bei einer Wortform eine fehlerhafte Flexionsendung ent-<br />

3 Teilweise sind unregelmäßigen Stämme aber auch explizit kodiert, so bei Adjektiven (höh,<br />

höch für hoch und einige andere) und starken Verben (bäck, buk, bük etc. für backen ).<br />

4 Anstelle der e-Elisionsregel aus DMOR gäbe es dann z.B. beim <strong>Ein</strong>trag für das Verb handeln<br />

zwei Flexionsstammformen handl (ich handle) und handel (du handelst). Dies würde<br />

bedeuten, dass Flexion und Wortbildung analog behandelt werden. Die jetzige Ungleichbehandlung<br />

erklärt sich aus der Kombination der bereits bestehenden Flexionskomponente mit<br />

einem neuen Wortbildungskonzept.<br />

79

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!