21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Aufbau und Verwendung des IMSLEX<br />

zunächst die Belegung vergeben. Partikelverben und Erstglieder erhalten<br />

die Belegung ©¡<br />

£ ¡<br />

, da sie nicht für die Morphologiekomponente<br />

ausgelesen werden, sondern die <strong>Ein</strong>träge nur für die Speicherung von<br />

£©<br />

Derivations- und Kompositionsstämmen sowie von Subkatrahmen 4 dienen.<br />

Beim Element Vorkommenshaeufigkeit wird das Merkmal korpus mit dem<br />

Wert vorbelegt. Beim Element Flexionsmorphologie kommt die Information<br />

für das Merkmal DMORlex aus den DMOR-Dateien. Das Merkmal typ ¢¨¤<br />

bei<br />

Derivation und Komposition wird mit dem Wert vorbelegt, wenn die Wortart<br />

Substantiv, Adjektiv oder Verb ist. Eigennamen sind (anders <strong>als</strong> in ©¡<br />

DMOR)<br />

zunächst einmal von der Wortbildung ausgeschlossen (typ: ).<br />

<br />

Nach diesen Festlegungen können aus den DMOR-Dateien die XML-<strong>Ein</strong>träge<br />

£<br />

für die lexikalischen <strong>Ein</strong>heiten erzeugt werden.<br />

7.1.2 Die Übernahme der DMOR-<strong>Lexikon</strong>daten<br />

Aus den DMOR-Dateien lassen sich für IMSLEX die Zitierform, die<br />

Kategorie sowie Flexionsstamm und Flexionsklasse herauslesen. Jedes<br />

Stamm/Flexionsklasse-Paar aus dem DMOR-<strong>Lexikon</strong> ist genau einem Sublexikon<br />

zugeordnet, so dass das Attribut DMORlex immer eine eindeutige Belegung<br />

hat. Teilweise ist eine Fallunterscheidung erforderlich, was die Wahl der<br />

Zitierform und die Art der Kodierung der Flexionsinformation angeht. Für das<br />

Attribut DMORtyp beim Element Flexionsmorphologie muss immer eine Fallunterscheidung<br />

getroffen werden. Ist im DMOR-<strong>Lexikon</strong> beim Stammeintrag zusätzlich<br />

zum Flexionsstamm eine allomorphe Form angegeben (Atlas:Atlanten;<br />

£ ¦¦<br />

back:bük), so erfordert dies den Wert beim Attribut DMORtyp.<br />

Da es in DMOR keinen expliziten Lexembegriff gibt, muss überprüft werden,<br />

inwiefern die Zitierform oder der Stamm <strong>als</strong> Grundform in IMSLEX verwendet<br />

werden können. Im Allgemeinen stimmen diese überein; Verben sind die bekannte<br />

Ausnahme. Zunächst werden zwei Fälle regelbasierter morphologischer<br />

Verarbeitung in DMOR angesprochen, die ebenfalls einen <strong>Ein</strong>fluss auf den Lexembestand<br />

in IMSLEX haben können.<br />

Fehlende Lexeme<br />

Für zwei Phänomene sind im DMOR-<strong>Lexikon</strong> keine direkten <strong>Lexikon</strong>einträge<br />

vorgesehen, die Movierung mit dem Suffix -in und die Transposition. Während<br />

die Transposition in Morphologiekomponenten gewöhnlich regelbasiert behandelt<br />

wird, nicht durch <strong>Lexikon</strong>einträge, muss die Verschmelzung von zwei Lexemen<br />

zu einem Lexem für die Übernahme in IMSLEX rückgängig gemacht<br />

werden.<br />

4 Letzteres gilt nur für Partikelverben, nicht für Erstglieder.<br />

96

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!