11.02.2013 Aufrufe

Aspekte der morphologischen Analyse des Deutschen - Universität ...

Aspekte der morphologischen Analyse des Deutschen - Universität ...

Aspekte der morphologischen Analyse des Deutschen - Universität ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Kapitel 4: Ein Modell eines <strong>morphologischen</strong> <strong>Analyse</strong>systems<br />

Interessanterweise muß das Standardverfahren <strong>des</strong> Chart-Parsings nicht geän<strong>der</strong>t werden,<br />

um mit ambigen Zerlegungen umgehen zu können. Die Funktion Complete() bedient sich<br />

nur <strong>des</strong> Kriteriums, daß sich ein Segment, welches zur Erweiterung einer aktiven Kante untersucht<br />

wird, unmittelbar anschließt an die von <strong>der</strong> Mutterkategorie dieser Kante dominierte<br />

Folge von Terminalsymbolen. Ob daneben noch an<strong>der</strong>e, überlappende Segmente existieren,<br />

spielt hierbei keine Rolle.<br />

Die Funktion Shift() erhält ein durch den Segmentierer identifiziertes Wortsegment7 , das in den aktuellen Chart integriert werden soll. Bevor dies jedoch geschieht,<br />

wird eine Funktion UnknownSegments() aufgerufen, die versucht, ausgehend von <strong>der</strong> Position<br />

<strong>des</strong> gefundenen Segments eventuell nötige Segmente vom Typ „unbekannt“ einzusetzen,<br />

die es erlauben, auch dann eine <strong>Analyse</strong> für das komplexe Wort zu finden, wenn nicht<br />

alle Teile im Listemlexikon verzeichnet sind. Diese Funktion wird weiter unten näher erläutert.<br />

Closure() testet eine übergebene Kante zunächst daraufhin, ob sie passiv<br />

ist. Ist das <strong>der</strong> Fall, so wird eine evtl. für sie definierte Bedingung ausgewertet, die, falls<br />

sie scheitert, zur Ausson<strong>der</strong>ung <strong>der</strong> Kante führt, an<strong>der</strong>nfalls jedoch Einfluß auf Variablenbindungen<br />

und -koreferenzen innerhalb <strong>der</strong> Merkmalsstrukturen in <strong>der</strong> Kante haben kann.<br />

Eine Einschränkung gegenüber den im Grammatikformalismus möglichen Bedingungen<br />

liegt darin, daß sie mit einer Kante selbst und nicht mit einzelnen Positionen innerhalb einer<br />

Kante verknüpft sind. Somit werden solche Bedingungen erst dann ausgewertet, wenn eine<br />

passive Kante dem Chart hinzugefügt wird, m.a.W. die zugrundeliegende Regel vollständig<br />

abgearbeitet wurde. Eine an<strong>der</strong>e Vorgehensweise wäre durchaus möglich, wenn auch aufwendiger<br />

und für die zu verarbeitende Grammatik, die im wesentlichen binäre Regeln enthält,<br />

nicht beson<strong>der</strong>s sinnvoll.<br />

Gelingt anschließend <strong>der</strong> Subsumptionstest, <strong>der</strong> bei Unifikationsgrammatiken das Kriterium<br />

<strong>der</strong> kategorialen Identität ersetzt, so fügt <strong>der</strong> Parser eine Kopie dieser Kante dem Chart<br />

hinzu und prüft dann (erneut), ob die Kante passiv ist. Kann dies positiv entschieden werden,<br />

so wird durch Expand() versucht, Regeln zu finden, die das Symbol auf <strong>der</strong> linken Regelseite<br />

als linke Ecke aufweisen. Expand() ist damit verantwortlich für den Aufbau „höherer“<br />

Strukturen.<br />

Complete() schließlich versucht, zu einer passiven Kante solche aktive zu finden, die die passive<br />

Kante integrieren können. Complete() kann zu nicht-lexikalischen passiven Kanten führen,<br />

die dann via Expand() den Strukturaufbau in Richtung <strong>des</strong> Startsymbols vorantreiben.<br />

Um Strukturen effizient im Chart zu repräsentieren und sie später aus dem Chart zu rekonstruieren,<br />

bedient man sich <strong>der</strong> üblichen Techniken <strong>des</strong> structure sharings und local ambiguity<br />

packings (vgl. hierzu beispielsweise Naumann/Langer (1994: 140f, 202f)). Parsergebnisse<br />

werden<br />

als 6-Tupel repräsentiert.<br />

Beispiel 4.4:<br />

Ein Chart-Eintrag<br />

<br />

repräsentiert eine passive Kante mit Mutterkategorie complex_stem 8 und zwei Töchtern <strong>der</strong><br />

Kategorie simple_stem. Diese Töchter, zusammen mit den Positionsinformationen, verweisen<br />

auf an<strong>der</strong>e Kanten im Chart und werden verwendet, um aus dem Chart Strukturbäume<br />

zu generieren.<br />

7 Der Anfangsindex <strong>des</strong> Segments wird um eins vermin<strong>der</strong>t, da beim Chart-Parsing die<br />

Symbolzwischenräume und nicht die Symbole selbst gezählt werden.<br />

8 Die Hierarchie <strong>der</strong> <strong>morphologischen</strong> Typen ist Gegenstand <strong>des</strong> nächsten Kapitels.<br />

102

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!