Aspekte der morphologischen Analyse des Deutschen - Universität ...
Aspekte der morphologischen Analyse des Deutschen - Universität ...
Aspekte der morphologischen Analyse des Deutschen - Universität ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
2 Merkmalsstrukturen<br />
Kapitel 2: Merkmalsstrukturen<br />
Merkmalsstrukturen – auch Attribut-Wert-Strukturen genannt – haben sich nach einem Entwicklungsprozeß<br />
als lingua franca <strong>der</strong> heutigen Computerlinguistik herauskristallisiert. Sie<br />
bieten eine Reihe von Vorteilen (vgl. auch Shieber (1985)):<br />
• Deklarativität<br />
• Unabhängigkeit <strong>des</strong> Ergebnisses von <strong>der</strong> Berechnungsreihenfolge<br />
• Mathematische Erschlossenheit<br />
• Mächtigkeit<br />
Nicht zuletzt gibt es eine Reihe von hochentwickelten Werkzeugen – beispielsweise CUF<br />
(Dörre et al. (1996)) – die zur Entwicklung von Sprachverarbeitungsanwendungen zur Verfügung<br />
stehen.<br />
Diese Vorteile gaben den Ausschlag, das hier vorgestellte Modell ebenfalls auf <strong>der</strong> Grundlage<br />
von Merkmalsstrukturen – genauer typisierten Merkmalsstrukturen – zu entwerfen. Der<br />
nachfolgende Abriß <strong>der</strong> Theorie typisierter Merkmalsstrukturen orientiert sich an Carpenter<br />
(1992), ist jedoch nicht vollkommen voraussetzungslos gehalten. Shieber (1986) führt alle<br />
zum Verständnis notwendigen Begriffe ein, die hier aus Platzgründen nicht definiert werden<br />
können.<br />
2.1 Typisierte Merkmalsstrukturen<br />
Typisierte Merkmalsstrukturen stellen eine Verbesserung gegenüber untypisierten Merkmalsstrukturen<br />
(vgl. Shieber (1986)) dar:<br />
• In Verbindung mit festgelegten Typisierungs- und Appropriateness-Bedingungen (s.u.)<br />
kann für jede Merkmalsstruktur festgestellt werden, ob sie in einem wohldefinierten Sinn<br />
korrekt und vollständig ist.<br />
• Typisierung erlaubt, unzulässige Merkmale und Merkmalswerte zu erkennen.<br />
Aber auch aus implementatorischer Perspektive ergeben sich einige Vorteile:<br />
• Durch die Typisierung kann für jede Merkmalsstruktur während einer Kompilationsphase<br />
<strong>der</strong> von ihr beanspruchte Speicherplatz berechnet und beim Zugriff auf bestimmte<br />
Attribute von effizienten Record-Offset-Adressierungsverfahren Gebrauch gemacht<br />
werden.<br />
• Die wichtigste, jedoch aufwendige Operation in Zusammenhang mit Merkmalstrukturen,<br />
die <strong>der</strong> Unifikation (s.u.), kann in vielen Fällen vermieden werden, wenn die zu unifizierenden<br />
Strukturen typeninkompatibel sind, was sich durch eine einfache Tabellenoperation<br />
feststellen läßt.<br />
• Nicht zuletzt erleichtert Typisierung, analog zur Festlegung von Datentypen in imperativen<br />
Programmiersprachen wie Pascal, die Feststellung von semantischen Fehlern etc.<br />
während <strong>der</strong> Implementierungsphase eines Grammatikmodells.<br />
(Typisierte) Merkmalsstrukturen werden üblicherweise als endliche Automaten formalisiert.<br />
Eine typisierte Merkmalsstruktur über einer Menge von Typen Type und einer endlichen<br />
Menge von Merkmalen Feat ist dabei ein 4-Tupel F = , wobei gilt: 1<br />
1 Zur Notation: Typen werden immer fett und kursiv wie<strong>der</strong>gegeben, MERKMALE in Kapitälchen.<br />
24