21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Aufbau und Verwendung des IMSLEX<br />

allein nach den Bedürfnissen der Anwendung, die das Analyseresultat entgegennimmt.<br />

14<br />

Semantik<br />

Die DMOR-Flexionsklassen der Eigennamen enthalten teilweise die Angabe,<br />

ob es sich um (¨<br />

einen Personennamen ) oder um einen geographischen<br />

Namen ( ¡ ) handelt. Diese Vorgabe wurde verwendet, um bei der halbautomatischen<br />

Vergabe der Information zum Element SemantischerTyp 15<br />

£<br />

¨£<br />

bereits<br />

die plausibelste Information vorzugeben. Mit Hilfe eines Perl-Programms wurden<br />

alle in IMSLEX eingetragenen Eigennamen angezeigt, eine aufgrund der<br />

Flexionsklasse getroffene Hypothese über den ’Typ’ angezeigt und mittels der<br />

<strong>Ein</strong>gabe einer Nummer die gewählte Information gespeichert. 16 Dabei konnte,<br />

wenn zu einem angezeigten Eigennamen aus dem <strong>Lexikon</strong> noch kein passender<br />

Typ benannt war, zur Laufzeit des Programmes ein Typ mitsamt einer Nummer<br />

hinzugefügt werden. Auf diese Weise genügte ein einziger Durchlauf durch die<br />

Eigennamenliste, um alle Namen zu klassifizieren.<br />

Abbildung 7.6 zeigt das Resultat der Annotation (Stand Juni 2004): Dargestellt<br />

sind die im <strong>Lexikon</strong> vorkommenden semantischen Typen von Eigennamen<br />

mitsamt der Anzahl lexikalischer <strong>Ein</strong>heiten, für die sie vergeben wurden. 17<br />

7.1.6 Informationen aus anderen Ressourcen<br />

Drei weitere Arten von Informationen, die in das IMSLEX aufgenommen werden<br />

konnten, sollen hier noch erwähnt werden: Daten zur Subkategorisierung,<br />

Daten zur phonetischen Transkription sowie Daten zum syntaktischen Verhalten<br />

von Adjektiven.<br />

Die Subkategorisierungsrahmen für Verben, Adjektive und Substantive entstammen<br />

den Arbeiten von Judith Eckle-Kohler (vgl. Eckle-Kohler (1999)) und<br />

sind Ende der neunziger Jahre am IMS entstanden. Die Listen liegen im ASCII-<br />

Format vor und konnten automatisch ins IMSLEX eingefügt werden. Die In-<br />

14 Meiner Meinung nach sollte die ’maximale’ Information ausgegeben werden, <strong>als</strong>o die letzte<br />

der dargestellten Varianten, so dass eine nachfolgende Anwendung die Information herausfiltern<br />

kann, die sie benötigt.<br />

15 Die Bezeichnung EigennamenTyp wäre evtl. angemessener gewesen, passt aber nicht in das<br />

generelle Schema der Unabhängigkeit der Module von Eigenschaften wie der Wortart.<br />

16 Es ist denkbar, dass sich die Art von Informationen auch im Internet finden lässt. Zum<br />

einen jedoch erfüllen automatisch generierte Listen nicht den Qualitätsanspruch des <strong>Lexikon</strong>s,<br />

zum anderen stellt die unbesehene Übernahme von Informationen aus dem Internet in den<br />

meisten Fällen eine Urheberrechtsverletzung dar. Dies begründet die Notwendigkeit für ein<br />

eigenständig durchgeführtes Verfahren.<br />

17 Dass nur eine Währung im <strong>Lexikon</strong> vorkommt, liegt daran, dass Währungsbezeichnungen<br />

im DMOR-<strong>Lexikon</strong> zu den Substantiven zählen, <strong>als</strong>o nicht im Eigennamenlexikon zu finden<br />

sind. Die <strong>Ein</strong>tragung eines weiteren Vulkans ist in Anhang D dargestellt.<br />

104

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!