21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

7.1 Anlegen des <strong>Lexikon</strong>s<br />

Vorbelegung von Attributwerten<br />

Die Frage nach der Vorbelegung der Attributwerte ist schwieriger zu beantworten,<br />

denn bei Aufzählungstypen kann der Merkmalwert nicht leer gelassen<br />

werden. Dies war der Grund dafür, bei der Konzeption des <strong>Lexikon</strong>s bei vielen<br />

Attributen einen Merkmalwert £ ¡<br />

(für ’undefiniert’) vorzusehen, der nun <strong>als</strong><br />

Default verwendet werden kann. <strong>Ein</strong>ige Merkmalwerte können allerdings vorab<br />

£<br />

bereits eine bestimmte Belegung erhalten, die später verfeinert werden kann.<br />

Bei den Merkmalen der lexiklaischen <strong>Ein</strong>heit (Element le) ist die Vorbelegung<br />

wie nachfolgend dargestellt.<br />

id <strong>Ein</strong>e XML-ID muss mit einem Buchstaben beginnen und für das gesamte<br />

Dokument eindeutig sein. In IMSLEX besteht die ID aus der abgekürzten<br />

Kategorie und einer laufenden Nummer, <strong>als</strong>o für das erste Substantiv,<br />

¤<br />

§<br />

für das zweite, usw. Sie wird beim Erzeugen der Dateien eingesetzt.<br />

kategorie Die Kategorie ergibt sich entweder aus der gerade bearbeiteten<br />

DMOR-Datei oder aus dem Flexionsklassenbezeichner. <strong>Ein</strong>e Gegenüberstellung<br />

von IMSLEX-Kategoriebezeichner und traditioneller Wortart findet<br />

sich in Abbildung 7.11 auf S. 112. Für dieses Merkmal gibt es keinen<br />

Platzhalter, da bei jeder eingetragenen lexikalischen <strong>Ein</strong>heit die Kategorie<br />

bekannt sein muss.<br />

m_form, herkunft Morphologische Form und Herkunft einer lexikalischen<br />

<strong>Ein</strong>heit werden in DMOR nicht erhoben. Diese Informationen müssen für<br />

jedes le-Element einzeln ermittelt werden. Daher werden beide zunächst<br />

¡ £<br />

mit dem Platzhalter belegt.<br />

£©<br />

m_status Der morphologische Status wird wie folgt vorbelegt: Bei Affixen und<br />

Konfixen lautet die Belegung ¢ £© £¤<br />

, bei allen anderen lexikalischen<br />

<strong>Ein</strong>heiten . £ Dies ist insofern unproblematisch, <strong>als</strong> im DMOR-<strong>Lexikon</strong><br />

außer einer kleinen Menge an Kompositionserstgliedern, die an ihrer Flexionklasse<br />

(vgl. z.B. Abbildung 3.15 auf Seite 37) eindeutig zu identifizie-<br />

¡¦ £<br />

ren sind, keine gebundenen <strong>Ein</strong>heiten enthalten sind.<br />

selegiert Bei der Selektion verhält es sich ähnlich wie beim morphologischen<br />

Status: Affixe selegieren (Belegung ), alle anderen lexikalischen <strong>Ein</strong>heiten<br />

nicht ©<br />

(Belegung ¡ ). Diese Belegungen können von vornherein<br />

vergeben werden und müssen später nur dann verfeinert werden, wenn<br />

£ <br />

sich die Theorie ändert (<strong>als</strong>o z.B. Affixoide nicht mehr <strong>als</strong> selegierend angesehen<br />

werden).<br />

lexikalisiert Dieses Merkmal ist am schwierigsten zu behandeln, da hier Morphologie<br />

und Semantik vermischt werden. In der Annahme, dass in das<br />

DMOR-<strong>Lexikon</strong> nur lexikalisierte <strong>Ein</strong>heiten aufgenommen wurden, wird<br />

95

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!