30.01.2014 Aufrufe

Eine computerlinguistische Untersuchung des Genitivschwundes

Eine computerlinguistische Untersuchung des Genitivschwundes

Eine computerlinguistische Untersuchung des Genitivschwundes

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

4. Durchführung<br />

innerhalb der benötigten N-Gramme gesucht. Hierbei müssen genauere Angaben über<br />

die im missinterpretierten Genitiv enthaltenen Wörter gemacht werden. Das heißt die<br />

Wörter, die in den gesuchten Konstruktionen auftreten, müssen im Suchmuster voll<br />

aufgeführt werden, damit es hier nicht zu weiteren Komplikationen kommt. Dabei muss<br />

nicht je<strong>des</strong> einzelne Wort angegeben werden. Es kommt darauf an, ob das Wort im<br />

Einzelfall nur in einer falsch erkannten Konstruktion zu finden ist oder ob es auch in<br />

einer tatsächlich genitivischen Konstruktion aufgetaucht ist. Zwei Subroutinen &nogens<br />

und &nogent sorgen an dieser Stelle dafür, dass die Konstruktionen in die Outputdatei<br />

gedruckt und gezählt werden. Der Zähler $nogen ist sehr wichtig, da damit zuerst die<br />

Angabe und Ausgabe im Output über die Anzahl der Fehlausgaben gemacht werden<br />

und zusätzlich die Berechnung der tatsächlichen adnominalen Genitiverscheinungen<br />

mit definitem Artikel erfolgen kann. Dazu wird die Anzahl der falsch erkannten Konstruktionen<br />

von der Anzahl der adnominalen Genitive mit definitem Artikel abgezogen:<br />

$def = $def - $nogen.<br />

Darüber hinaus wird die relative Frequenz dieser Genitivgruppe berechnet. Um diese<br />

zu ermitteln, wird die Anzahl aller adnominalen Genitive mit definitem Artikel durch die<br />

Summe aller Wörter geteilt, was durch $freqdef = $def\$words erreicht wird. Ferner<br />

wird der entsprechende Prozentsatz angegeben, indem $freqdef mit 100 multipliziert<br />

und auf die Variable $procentfreqdef eingelesen wird. Nun kann der Ausdruck der<br />

Anzahl dieser Genitive sowie der berechneten Prozentsätze erfolgen. Um diese Daten<br />

im Output festzuhalten und zugleich passend zu formatieren, wird auf printf anstatt<br />

print und die %f-Konversion zurückgegriffen. Diese Konversion rundet die dem String<br />

durch Komma nachgestellten Variablen je nach Angabe auf eine bestimmte Anzahl an<br />

Nachkommastellen. So bewirkt %8.6f, dass die Zahl insgesamt acht Stellen besitzt,<br />

von denen sechs hinter dem Komma, beziehungsweise hier dem Punkt, stehen. Um<br />

ein Prozentzeichen in den Output drucken zu können, muss innerhalb printf ein<br />

doppeltes Prozentzeichen angegeben werden (siehe Schwartz et al., 2005).<br />

Die zweite Untergruppe der adnominalen Genitive bilden in dieser <strong>Untersuchung</strong> diejenigen,<br />

die zusammen mit einem indefiniten Artikel auftreten. Erneut erfolgt zunächst<br />

die Angabe über den momentanen <strong>Untersuchung</strong>sgegenstand in der Outputdatei und<br />

es wird ein Zähler namens $indef für diesen Teil <strong>des</strong> Programmes erstellt. Dabei wird<br />

das vorherige Vorgehen wiederaufgenommen. Zunächst werden dreigliedrige Wortfolgen<br />

näher analysiert, welche Konstruktionen enthalten, die einem adnominalen<br />

Genitiv mit indefinitem Artikel entsprechen. Hierbei werden die gleichen Fenstergrößen<br />

wie bei jenen Konstruktionen mit definitem Artikel genutzt. Anschließend<br />

müssen wieder solche Konstruktionen, die fälschlicherweise als Genitiv erkannt<br />

29

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!