Aspekte der morphologischen Analyse des Deutschen - Universität ...
Aspekte der morphologischen Analyse des Deutschen - Universität ...
Aspekte der morphologischen Analyse des Deutschen - Universität ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Kapitel 4: Ein Modell eines <strong>morphologischen</strong> <strong>Analyse</strong>systems<br />
Interessanterweise muß das Standardverfahren <strong>des</strong> Chart-Parsings nicht geän<strong>der</strong>t werden,<br />
um mit ambigen Zerlegungen umgehen zu können. Die Funktion Complete() bedient sich<br />
nur <strong>des</strong> Kriteriums, daß sich ein Segment, welches zur Erweiterung einer aktiven Kante untersucht<br />
wird, unmittelbar anschließt an die von <strong>der</strong> Mutterkategorie dieser Kante dominierte<br />
Folge von Terminalsymbolen. Ob daneben noch an<strong>der</strong>e, überlappende Segmente existieren,<br />
spielt hierbei keine Rolle.<br />
Die Funktion Shift() erhält ein durch den Segmentierer identifiziertes Wortsegment7 , das in den aktuellen Chart integriert werden soll. Bevor dies jedoch geschieht,<br />
wird eine Funktion UnknownSegments() aufgerufen, die versucht, ausgehend von <strong>der</strong> Position<br />
<strong>des</strong> gefundenen Segments eventuell nötige Segmente vom Typ „unbekannt“ einzusetzen,<br />
die es erlauben, auch dann eine <strong>Analyse</strong> für das komplexe Wort zu finden, wenn nicht<br />
alle Teile im Listemlexikon verzeichnet sind. Diese Funktion wird weiter unten näher erläutert.<br />
Closure() testet eine übergebene Kante zunächst daraufhin, ob sie passiv<br />
ist. Ist das <strong>der</strong> Fall, so wird eine evtl. für sie definierte Bedingung ausgewertet, die, falls<br />
sie scheitert, zur Ausson<strong>der</strong>ung <strong>der</strong> Kante führt, an<strong>der</strong>nfalls jedoch Einfluß auf Variablenbindungen<br />
und -koreferenzen innerhalb <strong>der</strong> Merkmalsstrukturen in <strong>der</strong> Kante haben kann.<br />
Eine Einschränkung gegenüber den im Grammatikformalismus möglichen Bedingungen<br />
liegt darin, daß sie mit einer Kante selbst und nicht mit einzelnen Positionen innerhalb einer<br />
Kante verknüpft sind. Somit werden solche Bedingungen erst dann ausgewertet, wenn eine<br />
passive Kante dem Chart hinzugefügt wird, m.a.W. die zugrundeliegende Regel vollständig<br />
abgearbeitet wurde. Eine an<strong>der</strong>e Vorgehensweise wäre durchaus möglich, wenn auch aufwendiger<br />
und für die zu verarbeitende Grammatik, die im wesentlichen binäre Regeln enthält,<br />
nicht beson<strong>der</strong>s sinnvoll.<br />
Gelingt anschließend <strong>der</strong> Subsumptionstest, <strong>der</strong> bei Unifikationsgrammatiken das Kriterium<br />
<strong>der</strong> kategorialen Identität ersetzt, so fügt <strong>der</strong> Parser eine Kopie dieser Kante dem Chart<br />
hinzu und prüft dann (erneut), ob die Kante passiv ist. Kann dies positiv entschieden werden,<br />
so wird durch Expand() versucht, Regeln zu finden, die das Symbol auf <strong>der</strong> linken Regelseite<br />
als linke Ecke aufweisen. Expand() ist damit verantwortlich für den Aufbau „höherer“<br />
Strukturen.<br />
Complete() schließlich versucht, zu einer passiven Kante solche aktive zu finden, die die passive<br />
Kante integrieren können. Complete() kann zu nicht-lexikalischen passiven Kanten führen,<br />
die dann via Expand() den Strukturaufbau in Richtung <strong>des</strong> Startsymbols vorantreiben.<br />
Um Strukturen effizient im Chart zu repräsentieren und sie später aus dem Chart zu rekonstruieren,<br />
bedient man sich <strong>der</strong> üblichen Techniken <strong>des</strong> structure sharings und local ambiguity<br />
packings (vgl. hierzu beispielsweise Naumann/Langer (1994: 140f, 202f)). Parsergebnisse<br />
werden<br />
als 6-Tupel repräsentiert.<br />
Beispiel 4.4:<br />
Ein Chart-Eintrag<br />
<br />
repräsentiert eine passive Kante mit Mutterkategorie complex_stem 8 und zwei Töchtern <strong>der</strong><br />
Kategorie simple_stem. Diese Töchter, zusammen mit den Positionsinformationen, verweisen<br />
auf an<strong>der</strong>e Kanten im Chart und werden verwendet, um aus dem Chart Strukturbäume<br />
zu generieren.<br />
7 Der Anfangsindex <strong>des</strong> Segments wird um eins vermin<strong>der</strong>t, da beim Chart-Parsing die<br />
Symbolzwischenräume und nicht die Symbole selbst gezählt werden.<br />
8 Die Hierarchie <strong>der</strong> <strong>morphologischen</strong> Typen ist Gegenstand <strong>des</strong> nächsten Kapitels.<br />
102