Eine computerlinguistische Untersuchung des Genitivschwundes
Eine computerlinguistische Untersuchung des Genitivschwundes
Eine computerlinguistische Untersuchung des Genitivschwundes
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
4. Durchführung<br />
Dann wird nach der ersten Gruppe der adnominalen Genitive gesucht. In diesem Fall<br />
sind das diejenigen, die einen definiten Artikel enthalten. Um deren Erscheinung später<br />
auswerten und vergleichen zu können, wird hier ein Zähler mit dem Namen $def eingeführt.<br />
Nun wird als erster Schritt der adnominale Genitiv mit definitem Artikel<br />
innerhalb der Hexagramme gesucht, die aus drei Bigrammen bestehen. Hierzu wird<br />
mittels foreach je<strong>des</strong> Hexagramm $s aus dem Array @hexagram untersucht. Zu<br />
diesem Zweck wird eine if-Kontrollstruktur in der foreach-Schleife erzeugt, durch die<br />
nach bestimmten Mustern und Kombinationen gesucht werden kann.<br />
Das erste Muster, mit dem Genitive identifiziert werden, sucht durch den Binding<br />
Operator und reguläre Ausdrücke nach bestimmten Hexagrammen. Diese bestehen<br />
aus einem Nomen, gekennzeichnet durch das POS Tag NN, gefolgt von einem<br />
definiten Artikel, also der oder <strong>des</strong>, dem POS Tag für einen Artikel ART und entweder<br />
einem Nomen NN, einem Eigennamen NE, einem substituierendem Indefinitpronomen<br />
PIS oder einem attribuierenden Possessivpronomen PPOSAT. Hierbei steht der<br />
reguläre Ausdruck \s für einen Space Character beziehungsweise ein Leerzeichen und<br />
\b stellt eine Wortgrenze dar. Der Punkt steht für ein beliebiges Zeichen, was in<br />
Verbindung mit dem Kleene Star * dazu führt, dass kein oder unendlich viele Zeichen<br />
zwischen ART und dem folgenden POS Tag im Erkennungsmuster stehen können 8 . $<br />
ohne \ bezeichnet hier das Ende <strong>des</strong> Strings (siehe Schwartz et al., 2005).<br />
Abbildung 9: Suchmuster für einen adnominalen Genitiv<br />
Abbildung 9 stellt das Suchmuster dar, so wie es im Programm zu finden ist. Wird ein<br />
derartiges Muster gefunden, so wird die Subroutine &defs angewendet. Subroutinen<br />
sind vom Programmierer vordefinierte Funktionen (siehe Christiansen et al., 2012),<br />
deren Definitionen das Perlskript abschließen. Diese sind besonders dann nützlich,<br />
wenn die gleichen Befehle häufiger gebraucht werden und somit nicht je<strong>des</strong> Mal erneut<br />
eingetippt werden müssen. Die Subroutine &defs führt dazu, dass je<strong>des</strong> $s, das dem<br />
Suchmuster entspricht, in den Output gedruckt und der Zähler $def um eins erhöht<br />
wird. Im Folgenden werden für je<strong>des</strong> einzelne Suchmuster Subroutinen definiert und<br />
angewendet, die dem jeweiligen Genitivtyp und der momentan durchsuchten Fenstergröße<br />
entsprechen. Dabei wird immer auf die Ausgabe im Output und das Zählen der<br />
Genitive geachtet.<br />
8 An dieser Stelle wäre ebenso das Kleene Plus ausreichend gewesen.<br />
27