21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Methoden der morphologischen Analyse<br />

wobei gleichzeitig eine Präferenzierung vorgenommen wird, um keine Ambiguitäten<br />

aufkommen zu lassen.)<br />

Für alle Wortarten außer Substantiven und Adjektiven, für Adjektive in<br />

Komparativ und Superlativ und für Sonderformen müssen die einzelnen Erstglieder<br />

aufgelistet und einer der in Abbildung 3.15 dargestellten Fortsetzungsklassen<br />

zugeordnet werden. 12 Verbstämme kommen zwar recht häufig <strong>als</strong> Erstglieder<br />

vor, sind in DMOR allerdings nicht generell <strong>als</strong> Erstglieder zugelassen,<br />

da die Vielzahl der Konversionen (platz(en)/Platz, still(en)/still, ruf(en)/Ruf,<br />

fett(en)/fett/Fett etc.) zu einer sehr großen Anzahl mehrdeutiger Analysen führen<br />

würde. Sie müssen daher mit Vertretern anderer Wortarten oder Sonderformen<br />

explizit aufgelistet werden (vgl. Abbildung 3.16).<br />

Erstglied Flexionsklasse Beispiele Typ<br />

Abbiege Abbiege=Spur Partikelverbstamm<br />

Sofort Sofort=Hilfe Adverb<br />

Allein Allein=Schuld<br />

Mindest Mindest=Verzehr Adjektiv<br />

Höchst Höchst=Form Adj. im Superlativ<br />

Pseudo Pseudo=Lösung neoklassisch<br />

Thermos Thermos=Kanne<br />

Binnen Binnen=Hafen Sonderformen<br />

Solidar Solidar=Gemeinsschaft<br />

Vize Vize=Präsident<br />

Abbildung 3.16: Separat aufgelistete Kompositionserstglieder in DMOR<br />

Die Möglichkeit der Auflistung bietet den großen Vorteil, dass nicht geklärt<br />

werden muss, welchem Lexem Erstglieder wie Binnen, Solidar oder auch<br />

Mindest zugeordnet sind. Es geht ausschließlich darum, sie für die Analyse<br />

von Komposita zum <strong>Lexikon</strong> hinzuzufügen. <strong>Ein</strong>e Phantasiewortform wie *Pseudohöchstthermossofortkanne<br />

erhält in der Morphologiekomponente eine eindeutige<br />

Zerlegung Pseudo=Höchst=Thermos=Sofort=Kanne, da DMOR eine unbegrenzte<br />

Zahl von Erstgliedern in einer Wortform zulässt. Der Nachteil ist, dass<br />

bei Konversionen nicht klar ist, um welche Wortart es sich in der Zerlegung<br />

handelt: Die Zerlegungen Platz=Konzert und Platz=Wunde lassen nicht erkennen,<br />

ob sich das Erstglied auf das Lexem platzen ¡ oder das Lexem Platz ¢<br />

bezieht.<br />

12 Die Bildung zusammengesetzter Zahlwörter wie einhundertunddrei findet allerdings innerhalb<br />

der Klasse der Zahlwörter statt.<br />

38

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!