21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Zusammenspiel von IMSLEX und Morphologiekomponente<br />

werden, Kandidatenlisten für das Auffüllen der Mikrostruktur des <strong>Lexikon</strong>s zu<br />

generieren.<br />

In Stufe 5 schließlich kann nur noch über die Wortart der unbekannten<br />

Wortform spekuliert werden. Bei der weitaus größten Menge bis in diese Stufe<br />

nicht erkannter Formen handelt es sich um Eigennamen und Tippfehler. Ist<br />

beim Tippfehler das Derivationssuffix nicht betroffen, erfolgt zumindest eine<br />

Teilanalyse.<br />

Die ’longest match’-Heuristik<br />

<strong>Ein</strong>e andere Heuristik soll nicht unerwähnt bleiben. Wird das Stufenmodell<br />

nicht angewendet, umfasst das <strong>Lexikon</strong> aber einfache wie komplexe <strong>Ein</strong>heiten,<br />

so kommt es oft zu mehrdeutigen Zerlegungen mit einer unterschiedlichen<br />

Anzahl an Zerlegungsgliedern. Hier gilt fast immer der Grundsatz, dass eine<br />

Analyse mit weniger Zerlegungen besser ist <strong>als</strong> eine mit vielen. Diese Heuristik<br />

kann man <strong>als</strong> eine Art ’Stufenmodell im Kleinen’ ansehen: Ist eine morphologisch<br />

komplexe <strong>Ein</strong>heit wie Bahnhof neben den morphologisch einfachen<br />

<strong>Ein</strong>heiten Bahn und Hof im <strong>Lexikon</strong> gespeichert, so ist sicherlich die nicht zerlegte<br />

Form die gewünschte Analyse. Dasselbe gilt für alle weiteren Wortbildungen<br />

mit dieser <strong>Ein</strong>heit (Bahnhofs=Kneipe mit zwei Zerlegungsgliedern ist<br />

Bahn=Hofs=Kneipe mit drei Gliedern vorzuziehen, etc.). 16<br />

8.2.2 Verbesserung der morphologischen Analyse<br />

Im Folgenden werden für einige der im Verlauf dieser Arbeit angesprochenen<br />

Phänomene, die einer Morphologiekomponente Schwierigkeiten bereiten können,<br />

die Alternativen besprochen, die sich in Kombination von IMSLEX und<br />

SMOR für ihre Behandlung ergeben. Es wird jeweils eine Empfehlung ausgesprochen,<br />

die jedoch lediglich <strong>als</strong> Diskussionsbasis dient.<br />

Der Typ blauäugig<br />

1. <strong>Ein</strong>trag von äugig <strong>als</strong> gebundenes Lexem. Das erlaubt eine Gleichbehandlung<br />

von blau äugig und rechts kräftig, allerdings wird eine f<strong>als</strong>che Wortbildungsstruktur<br />

suggeriert (vgl. Abschnitt 4.2.5).<br />

men: Schönklängler, Klängespektrum.<br />

16 Mir sind bislang nur sehr wenige Gegenbeispiele für das Funktionieren dieser Heuristik begegnet,<br />

und die entstammen alle demselben Muster ’adjektivischer Kopf’: amtsdeutsch führt zu<br />

*Kataster=amtsdeutsch, waffentechnisch führt zu *Atom=waffentechnisch, sandfarben führt<br />

zu *Wüsten=sandfarben, rechtswidrig führt zu *Völker=rechtswidrig, und ostafrikanisch führt<br />

zu *Nord=ostafrikanisch. <strong>Ein</strong> * markiert die ungewollte Struktur.<br />

128

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!