Eine computerlinguistische Untersuchung des Genitivschwundes
Eine computerlinguistische Untersuchung des Genitivschwundes
Eine computerlinguistische Untersuchung des Genitivschwundes
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
4. Durchführung<br />
innerhalb der benötigten N-Gramme gesucht. Hierbei müssen genauere Angaben über<br />
die im missinterpretierten Genitiv enthaltenen Wörter gemacht werden. Das heißt die<br />
Wörter, die in den gesuchten Konstruktionen auftreten, müssen im Suchmuster voll<br />
aufgeführt werden, damit es hier nicht zu weiteren Komplikationen kommt. Dabei muss<br />
nicht je<strong>des</strong> einzelne Wort angegeben werden. Es kommt darauf an, ob das Wort im<br />
Einzelfall nur in einer falsch erkannten Konstruktion zu finden ist oder ob es auch in<br />
einer tatsächlich genitivischen Konstruktion aufgetaucht ist. Zwei Subroutinen &nogens<br />
und &nogent sorgen an dieser Stelle dafür, dass die Konstruktionen in die Outputdatei<br />
gedruckt und gezählt werden. Der Zähler $nogen ist sehr wichtig, da damit zuerst die<br />
Angabe und Ausgabe im Output über die Anzahl der Fehlausgaben gemacht werden<br />
und zusätzlich die Berechnung der tatsächlichen adnominalen Genitiverscheinungen<br />
mit definitem Artikel erfolgen kann. Dazu wird die Anzahl der falsch erkannten Konstruktionen<br />
von der Anzahl der adnominalen Genitive mit definitem Artikel abgezogen:<br />
$def = $def - $nogen.<br />
Darüber hinaus wird die relative Frequenz dieser Genitivgruppe berechnet. Um diese<br />
zu ermitteln, wird die Anzahl aller adnominalen Genitive mit definitem Artikel durch die<br />
Summe aller Wörter geteilt, was durch $freqdef = $def\$words erreicht wird. Ferner<br />
wird der entsprechende Prozentsatz angegeben, indem $freqdef mit 100 multipliziert<br />
und auf die Variable $procentfreqdef eingelesen wird. Nun kann der Ausdruck der<br />
Anzahl dieser Genitive sowie der berechneten Prozentsätze erfolgen. Um diese Daten<br />
im Output festzuhalten und zugleich passend zu formatieren, wird auf printf anstatt<br />
print und die %f-Konversion zurückgegriffen. Diese Konversion rundet die dem String<br />
durch Komma nachgestellten Variablen je nach Angabe auf eine bestimmte Anzahl an<br />
Nachkommastellen. So bewirkt %8.6f, dass die Zahl insgesamt acht Stellen besitzt,<br />
von denen sechs hinter dem Komma, beziehungsweise hier dem Punkt, stehen. Um<br />
ein Prozentzeichen in den Output drucken zu können, muss innerhalb printf ein<br />
doppeltes Prozentzeichen angegeben werden (siehe Schwartz et al., 2005).<br />
Die zweite Untergruppe der adnominalen Genitive bilden in dieser <strong>Untersuchung</strong> diejenigen,<br />
die zusammen mit einem indefiniten Artikel auftreten. Erneut erfolgt zunächst<br />
die Angabe über den momentanen <strong>Untersuchung</strong>sgegenstand in der Outputdatei und<br />
es wird ein Zähler namens $indef für diesen Teil <strong>des</strong> Programmes erstellt. Dabei wird<br />
das vorherige Vorgehen wiederaufgenommen. Zunächst werden dreigliedrige Wortfolgen<br />
näher analysiert, welche Konstruktionen enthalten, die einem adnominalen<br />
Genitiv mit indefinitem Artikel entsprechen. Hierbei werden die gleichen Fenstergrößen<br />
wie bei jenen Konstruktionen mit definitem Artikel genutzt. Anschließend<br />
müssen wieder solche Konstruktionen, die fälschlicherweise als Genitiv erkannt<br />
29