11.02.2013 Aufrufe

Aspekte der morphologischen Analyse des Deutschen - Universität ...

Aspekte der morphologischen Analyse des Deutschen - Universität ...

Aspekte der morphologischen Analyse des Deutschen - Universität ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

1 Einführung<br />

1.1 Zielsetzung <strong>der</strong> Arbeit<br />

Kapitel 1: Einführung<br />

Das Ziel <strong>der</strong> vorliegenden Arbeit besteht ganz allgemein darin, Architekturprinzipien eines<br />

Paradigmas <strong>der</strong> Informatik und neueren Computerlinguistik mit Theorien und Resultaten<br />

<strong>der</strong> generativen Grammatik in Verbindung zu bringen, um auf diese Weise einen neuen Ansatz<br />

zur Lösung von Problemen zu entwickeln, mit denen sich die Computerlinguistik beschäftigt.<br />

Konkret geht es um den Problemkreis <strong>der</strong> maschinellen <strong>morphologischen</strong> <strong>Analyse</strong><br />

natürlicher Sprache, d.h. um die Entwicklung von Verfahren, die Wörter in ihre kleinsten<br />

Bestandteile zerlegen, um ihre syntaktischen und semantischen Eigenschaften zu bestimmen.<br />

Diese Art <strong>der</strong> <strong>Analyse</strong> ist erst relativ spät in das Zentrum <strong>des</strong> computerlinguistischen Interesses<br />

gerückt, was sich sicher auf die vorherrschende Stellung <strong>des</strong> Englischen in diesem Bereich<br />

und <strong>des</strong>sen wenig ausgeprägte Oberflächenmorphologie zurückführen läßt. Konsequenterweise<br />

wurden morphologische Regularitäten dadurch abgebildet, daß man sie „mit<br />

Silikon bewarf", wie es An<strong>der</strong>son (1988) pointiert formuliert hat – sie also überhaupt nicht<br />

berücksichtigte und sog. Vollformenlexika verwendete, somit Lexika, die alle flektierten Formen<br />

einer bestimmten Grundform enthalten und <strong>der</strong>en morphosyntaktische Merkmale verzeichnen.<br />

Die <strong>Analyse</strong>verfahren waren dementsprechend einfach und beschränkten sich im<br />

Grunde auf einen reinen Lexikonzugriff, um die Wortform aufzufinden und <strong>der</strong>en relevante<br />

Merkmale zu erhalten. Da im Zuge <strong>der</strong> internationalen Ausbreitung <strong>der</strong> Computerlinguistik<br />

auch an<strong>der</strong>e Sprachen, darunter auch solche mit ausgeprägteren <strong>morphologischen</strong> Phänomen,<br />

einer <strong>Analyse</strong> mit dem Computer zugänglich gemacht werden sollten, ergab sich jedoch<br />

die Notwendigkeit, bei <strong>der</strong> Merkmalsbestimmung von Wortformen mit Hilfe <strong>der</strong> offenkundigen<br />

und in je<strong>der</strong> Grammatik verzeichneten Regeln <strong>der</strong> Flexion und Wortbildung<br />

diese Formen in ihre Bestandteile zu zerlegen.<br />

Vollformenlexika sind folglich aus min<strong>des</strong>tens zwei Gründen inadäquat. Aus technischer<br />

Sicht führen Vollformen eine erhebliche Redundanz in die Sprachbeschreibung ein, da an<br />

sich vorhersagbare Informationen an vielen Stellen im Lexikon dupliziert werden müssen.<br />

Zum einen hat das seinen Grund darin, daß die Anzahl <strong>der</strong> flektierten Formen einer Grundform<br />

gegenüber dieser um Größenordnungen höher sein kann. In mild flektierenden Sprachen<br />

wie dem <strong>Deutschen</strong> hält sich diese noch in Grenzen, wobei sich jedoch im Verbbereich<br />

einige Dutzend Flexionsformen zu einem einzelnen Verb wie beispielsweise singen bilden<br />

lassen. In an<strong>der</strong>en Sprachen wie dem Finnischen wird das Problem jedoch deutlicher, da<br />

finnische Verben bis zu 15.000 verschiedene Formen aufweisen können (nach Karlsson<br />

(1986)). In solchen Sprachen erreicht ein hinreichend großes Lexikon Dimensionen, die auch<br />

mo<strong>der</strong>ne Computer an die Grenzen ihrer Kapazität stoßen lassen. Zum an<strong>der</strong>en verzeichnet<br />

das Lexikon üblicherweise nicht nur morphosyntaktische Merkmale wie Person, Numerus,<br />

Tempus etc. zu den enthaltenen Einträgen, son<strong>der</strong>n auch Angaben zum syntaktischen und<br />

semantischen Verhalten <strong>der</strong> Form, beispielsweise in Form eines Subkategorisierungsrahmens<br />

mit thematischen Rollen und Kasuszuweisungseigenschaften. Flexionsparadigmen<br />

sind nun gerade dadurch definiert, daß alle in ihnen enthaltenen Formen über eine annähernd<br />

gleiche Bedeutung verfügen, diese aber in einem Vollformenlexikon je<strong>der</strong> Form erneut<br />

zugeordnet werden muß.<br />

1

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!