Aspekte der morphologischen Analyse des Deutschen - Universität ...
Aspekte der morphologischen Analyse des Deutschen - Universität ...
Aspekte der morphologischen Analyse des Deutschen - Universität ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
1 Einführung<br />
1.1 Zielsetzung <strong>der</strong> Arbeit<br />
Kapitel 1: Einführung<br />
Das Ziel <strong>der</strong> vorliegenden Arbeit besteht ganz allgemein darin, Architekturprinzipien eines<br />
Paradigmas <strong>der</strong> Informatik und neueren Computerlinguistik mit Theorien und Resultaten<br />
<strong>der</strong> generativen Grammatik in Verbindung zu bringen, um auf diese Weise einen neuen Ansatz<br />
zur Lösung von Problemen zu entwickeln, mit denen sich die Computerlinguistik beschäftigt.<br />
Konkret geht es um den Problemkreis <strong>der</strong> maschinellen <strong>morphologischen</strong> <strong>Analyse</strong><br />
natürlicher Sprache, d.h. um die Entwicklung von Verfahren, die Wörter in ihre kleinsten<br />
Bestandteile zerlegen, um ihre syntaktischen und semantischen Eigenschaften zu bestimmen.<br />
Diese Art <strong>der</strong> <strong>Analyse</strong> ist erst relativ spät in das Zentrum <strong>des</strong> computerlinguistischen Interesses<br />
gerückt, was sich sicher auf die vorherrschende Stellung <strong>des</strong> Englischen in diesem Bereich<br />
und <strong>des</strong>sen wenig ausgeprägte Oberflächenmorphologie zurückführen läßt. Konsequenterweise<br />
wurden morphologische Regularitäten dadurch abgebildet, daß man sie „mit<br />
Silikon bewarf", wie es An<strong>der</strong>son (1988) pointiert formuliert hat – sie also überhaupt nicht<br />
berücksichtigte und sog. Vollformenlexika verwendete, somit Lexika, die alle flektierten Formen<br />
einer bestimmten Grundform enthalten und <strong>der</strong>en morphosyntaktische Merkmale verzeichnen.<br />
Die <strong>Analyse</strong>verfahren waren dementsprechend einfach und beschränkten sich im<br />
Grunde auf einen reinen Lexikonzugriff, um die Wortform aufzufinden und <strong>der</strong>en relevante<br />
Merkmale zu erhalten. Da im Zuge <strong>der</strong> internationalen Ausbreitung <strong>der</strong> Computerlinguistik<br />
auch an<strong>der</strong>e Sprachen, darunter auch solche mit ausgeprägteren <strong>morphologischen</strong> Phänomen,<br />
einer <strong>Analyse</strong> mit dem Computer zugänglich gemacht werden sollten, ergab sich jedoch<br />
die Notwendigkeit, bei <strong>der</strong> Merkmalsbestimmung von Wortformen mit Hilfe <strong>der</strong> offenkundigen<br />
und in je<strong>der</strong> Grammatik verzeichneten Regeln <strong>der</strong> Flexion und Wortbildung<br />
diese Formen in ihre Bestandteile zu zerlegen.<br />
Vollformenlexika sind folglich aus min<strong>des</strong>tens zwei Gründen inadäquat. Aus technischer<br />
Sicht führen Vollformen eine erhebliche Redundanz in die Sprachbeschreibung ein, da an<br />
sich vorhersagbare Informationen an vielen Stellen im Lexikon dupliziert werden müssen.<br />
Zum einen hat das seinen Grund darin, daß die Anzahl <strong>der</strong> flektierten Formen einer Grundform<br />
gegenüber dieser um Größenordnungen höher sein kann. In mild flektierenden Sprachen<br />
wie dem <strong>Deutschen</strong> hält sich diese noch in Grenzen, wobei sich jedoch im Verbbereich<br />
einige Dutzend Flexionsformen zu einem einzelnen Verb wie beispielsweise singen bilden<br />
lassen. In an<strong>der</strong>en Sprachen wie dem Finnischen wird das Problem jedoch deutlicher, da<br />
finnische Verben bis zu 15.000 verschiedene Formen aufweisen können (nach Karlsson<br />
(1986)). In solchen Sprachen erreicht ein hinreichend großes Lexikon Dimensionen, die auch<br />
mo<strong>der</strong>ne Computer an die Grenzen ihrer Kapazität stoßen lassen. Zum an<strong>der</strong>en verzeichnet<br />
das Lexikon üblicherweise nicht nur morphosyntaktische Merkmale wie Person, Numerus,<br />
Tempus etc. zu den enthaltenen Einträgen, son<strong>der</strong>n auch Angaben zum syntaktischen und<br />
semantischen Verhalten <strong>der</strong> Form, beispielsweise in Form eines Subkategorisierungsrahmens<br />
mit thematischen Rollen und Kasuszuweisungseigenschaften. Flexionsparadigmen<br />
sind nun gerade dadurch definiert, daß alle in ihnen enthaltenen Formen über eine annähernd<br />
gleiche Bedeutung verfügen, diese aber in einem Vollformenlexikon je<strong>der</strong> Form erneut<br />
zugeordnet werden muß.<br />
1