21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

¡<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

C<br />

C<br />

<br />

<br />

<br />

<br />

C<br />

<br />

<br />

<br />

Vorhandene <strong>Lexikon</strong>-<strong>System</strong>e<br />

CELEX zu den Affixen). Wenn sich Stammveränderungen ergeben, ist dies in<br />

der nächsten Spalte mit einem markiert. Im Beispiel betrifft dies ¡ das Lexem<br />

Absicht , da es sich um eine Konversion handelt, die auf absehen zurückgeführt<br />

wird. Die beiden folgenden Spalten markieren Opaqueheit und Umlautung.<br />

Opaqueheit wird hier im Sinne von Idiomatisierung verwendet, markiert<br />

werden “words whose analysis is opaque – that is, words made up of morphemes<br />

which are recognizable, but where the meaning of the head element isn’t<br />

reflected in the meaning of the full word. An example of this is Angsthase”<br />

(Gulikers et al. (1995), S. 5-65). Das Auftreten von Umlauten in der morphologisch<br />

komplexen Form, die in der Grundform nicht auftreten, ist im Beispiel bei<br />

Häuschen und Häuserblock gekennzeichnet.<br />

Es folgt eine weitere Zerlegung des Lexems, diesmal mit der Struktur der<br />

Wortbildung und der Kennzeichnung der einzelnen Bestandteile. Im Falle der<br />

¨¡¢ ¢ <br />

Konversion bei aalen beispielsweise wird durch der Zusammenhang<br />

zum Substantiv Aal angezeigt. Der ¡ ¡£ Darstellung lässt sich sogar entnehmen,<br />

welche Wortart Affixe selegieren: bedeutet, dass ein<br />

¨ ¨¡ ¢ <br />

Substantiv <strong>als</strong> Wortbildungsprodukt entsteht, wenn -chen © ¤ £ an ein Substantiv angehängt<br />

wird. Es folgen wieder drei Spalten für die Anzeige von Stammveränderung,<br />

Opaqueheit und Umlautung. Die drei letzten Spalten schließlich markieren<br />

die Trennbarkeit des Lexems (geben <strong>als</strong>o im Deutschen quasi an, dass<br />

es sich um ein Partikelverb handelt), geben das Flexionsparadigma an ( steht<br />

für Singular, für Plural, für reguläres Verb, <br />

markiert Umlautung bei Plural<br />

etc.).<br />

£ ¦ <br />

1<br />

¥¢¤<br />

¡"78"9 :¡¢<br />

¢¡¤£¢¡<br />

8C<br />

¡ ¢¡ £¦¢¢¡<br />

¥¢¤¢¥¡"78"9 :<br />

¢¡"78<br />

9 :<br />

¢<br />

¥¢¤¨£<br />

£¦¢¡<br />

£¦¢¢¡<br />

D<br />

8¤<br />

¢<br />

¥¢¤¨££¦¡"78<br />

9 :<br />

¡¥<br />

¡ £¦¢¢¡<br />

¥¢¤¨£<br />

:¡<br />

¡"78"9 :<br />

¡¤£¡?DC<br />

Abbildung 5.7: CELEX. Deutsche Morphologie, Wortform<br />

Abbildung 5.7 zeigt die Kodierung der morphosyntaktischen Kategorien für<br />

die Wortformen (aus der Datei , German Morphology, Wordforms). Neben<br />

der laufenden Nummer, der Wortform, der Frequenz und der ID des Lexems<br />

<br />

Haus ist noch eine weitere Spalte angegeben, in der Kürzel für die morphologischen<br />

Kategorien aufgelistet sind. Die Wortform Haus kann <strong>als</strong>o Nominativ<br />

Singular, Dativ Singular oder Akkusativ Singular sein, Hauses nur Genitiv Singular,<br />

Häusern Dativ Plural usw.<br />

Abbildung 5.8 zeigt die Kodierung von syntaktischen Eigenschaften der Lexeme<br />

(aus der Datei , German Syntax, Lemmas). Unter den Begriff Syntax<br />

fallen in CELEX diverse Phänomene: die Wortart, das Genus bei Substantiven,<br />

¥<br />

der semantische Typ bei Eigennamen, Verbklassen, Subkategorisierung von Ver-<br />

70

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!