Eine computerlinguistische Untersuchung des Genitivschwundes

Weitere Magazine

Empfehlungen

Info

$Handout Latex 2$

4. Durchführung innerhalb der benötigten N-Gramme gesucht. Hierbei müssen genauere Angaben über die im missinterpretierten Genitiv enthaltenen Wörter gemacht werden. Das heißt die Wörter, die in den gesuchten Konstruktionen auftreten, müssen im Suchmuster voll aufgeführt werden, damit es hier nicht zu weiteren Komplikationen kommt. Dabei muss nicht jedes einzelne Wort angegeben werden. Es kommt darauf an, ob das Wort im Einzelfall nur in einer falsch erkannten Konstruktion zu finden ist oder ob es auch in einer tatsächlich genitivischen Konstruktion aufgetaucht ist. Zwei Subroutinen &nogens und &nogent sorgen an dieser Stelle dafür, dass die Konstruktionen in die Outputdatei gedruckt und gezählt werden. Der Zähler $nogen ist sehr wichtig, da damit zuerst die Angabe und Ausgabe im Output über die Anzahl der Fehlausgaben gemacht werden und zusätzlich die Berechnung der tatsächlichen adnominalen Genitiverscheinungen mit definitem Artikel erfolgen kann. Dazu wird die Anzahl der falsch erkannten Konstruktionen von der Anzahl der adnominalen Genitive mit definitem Artikel abgezogen: $def = $def - $nogen. Darüber hinaus wird die relative Frequenz dieser Genitivgruppe berechnet. Um diese zu ermitteln, wird die Anzahl aller adnominalen Genitive mit definitem Artikel durch die Summe aller Wörter geteilt, was durch $freqdef = $def\$words erreicht wird. Ferner wird der entsprechende Prozentsatz angegeben, indem $freqdef mit 100 multipliziert und auf die Variable $procentfreqdef eingelesen wird. Nun kann der Ausdruck der Anzahl dieser Genitive sowie der berechneten Prozentsätze erfolgen. Um diese Daten im Output festzuhalten und zugleich passend zu formatieren, wird auf printf anstatt print und die %f-Konversion zurückgegriffen. Diese Konversion rundet die dem String durch Komma nachgestellten Variablen je nach Angabe auf eine bestimmte Anzahl an Nachkommastellen. So bewirkt %8.6f, dass die Zahl insgesamt acht Stellen besitzt, von denen sechs hinter dem Komma, beziehungsweise hier dem Punkt, stehen. Um ein Prozentzeichen in den Output drucken zu können, muss innerhalb printf ein doppeltes Prozentzeichen angegeben werden (siehe Schwartz et al., 2005). Die zweite Untergruppe der adnominalen Genitive bilden in dieser Untersuchung diejenigen, die zusammen mit einem indefiniten Artikel auftreten. Erneut erfolgt zunächst die Angabe über den momentanen Untersuchungsgegenstand in der Outputdatei und es wird ein Zähler namens $indef für diesen Teil des Programmes erstellt. Dabei wird das vorherige Vorgehen wiederaufgenommen. Zunächst werden dreigliedrige Wortfolgen näher analysiert, welche Konstruktionen enthalten, die einem adnominalen Genitiv mit indefinitem Artikel entsprechen. Hierbei werden die gleichen Fenstergrößen wie bei jenen Konstruktionen mit definitem Artikel genutzt. Anschließend müssen wieder solche Konstruktionen, die fälschlicherweise als Genitiv erkannt 29
4. Durchführung wurden, erfasst werden. Dabei konnte in allen drei untersuchten Texten nur ein einziges Vorkommen für diese Untergruppe gefunden werden. An dieser Stelle ist besonders wichtig, dass der Zähler dieser Konstruktionen $nogen wieder mit Null gleichgesetzt wird. Ansonsten würde einfach weitergezählt werden, was zu einem falschen Ergebnis führen würde. Zur Berechnung der adnominalen Genitive mit indefinitem Artikel wird der Zähler $nogen vom Zähler $indef abgezogen. Somit erfolgt zuerst die Angabe über die falsch erkannten Konstruktionen und deren Anzahl, gefolgt von der Angabe über die Gesamtzahl der gefundenen adnominalen Genitive mit indefinitem Artikel einschließlich relativer Häufigkeit und Angabe des Prozentsatzes. Die nächsten adnominalen Genitive, die näher betrachtet werden, sind diejenigen, die ein Possessivpronomen enthalten. Das bereits bekannte Vorgehen wird beibehalten und zunächst wird im Output angegeben, welche Untergruppe untersucht wird. Dann wird ein Zähler $poss definiert, dem die Zahl Null zugewiesen wird. Daraufhin beginnt wieder die Suche nach Wortfolgen (inklusive der Wortart), die diesem Genitivtyp entsprechen, innerhalb des kleinsten Suchfensters, das für die Erfassung eines solchen Genitivs nötig ist. Dieses Fenster wird in dieser Untergruppe ebenfalls durch das dreigliedrige Hexagramm dargestellt. Danach wird in Okta- und Dekagrammen gesucht. Auch in den Hektakaidekagrammen, welche aus acht Bigrammen bestehen, und sogar innerhalb des Arrays für zehnteilige Eikosagramme können dabei Genitive mit Possessivpronomen gefunden werden. Wieder müssen falsch erkannte Konstruktionen aufgelistet und gezählt werden, um anschließend die tatsächliche Anzahl der adnominalen Genitive mit Possessivpronomen errechnen und ausgeben zu können. Dies erfolgt erneut nach demselben Schema wie bei den beiden bereits besprochenen Untergruppen. Nachfolgend wird eine weitere Untergruppe des adnominalen Genitivs untersucht. Dabei handelt es sich um diejenigen Genitive, die in Folge eines Demonstrativpronomens auftreten. Hierzu wird in bekannter Weise ein Zähler, der als $dem definiert wird, mit Null gleichgesetzt. Dann beginnt die Suche nach diesen Genitiven zunächst innerhalb der Hexagramme. Die erste Konstruktion, die gefunden werden soll, beginnt mit einem Nomen, dessen erster Buchstabe nicht W sein soll, da ansonsten eine falsche Konstruktion als Genitiv gewertet würde. Das Auffinden dieses Anfangsbuchstaben wird verhindert, indem innerhalb eckiger Klammern, das Caret ^ vor dem Element, das nicht gematcht werden soll, eingefügt wird. Damit stellt ^ nicht den Beginn eines Strings dar, sondern bewirkt eine Negation des nachfolgenden Charakters (siehe Schwartz et al., 2005). Weiterhin folgt diesem Nomen ein Demonstrativpronomen PDAT, welches entweder dieser, dieses, jener oder jenes lautet. 30
Seite 1 und 2: Eine computerlinguistische Untersuc
Seite 3 und 4: Inhaltsverzeichnis 1. Einleitung ..
Seite 5 und 6: Tabellenverzeichnis Tabelle 1: Beis
Seite 7 und 8: 1. Einleitung gemessen werden kann.
Seite 9 und 10: 2. Theoretischer Hintergrund gezäh
Seite 11 und 12: 2. Theoretischer Hintergrund die Ge
Seite 13 und 14: 2. Theoretischer Hintergrund 1730.
Seite 15 und 16: 2. Theoretischer Hintergrund 2.2 Di
Seite 17 und 18: 2. Theoretischer Hintergrund sein F
Seite 19 und 20: 2. Theoretischer Hintergrund Der Ic
Seite 21 und 22: 3. Computerlinguistischer Hintergru
Seite 23 und 24: 4. Durchführung 4. Durchführung U
Seite 25 und 26: 4. Durchführung Abbildung 3: Progr
Seite 27 und 28: 4. Durchführung des Users wird per
Seite 29 und 30: 4. Durchführung Abbildung 6: Erste
Seite 31 und 32: 4. Durchführung ein Eikosagramm, w
Seite 33: 4. Durchführung Anschließend wird
Seite 37 und 38: 4. Durchführung Erfassung dieser a
Seite 39 und 40: 4. Durchführung erste Element kein
Seite 41 und 42: 4. Durchführung 4.2 Probleme bei d
Seite 43 und 44: 4. Durchführung wurde versucht, so
Seite 45 und 46: 5. Ergebnisse der computerlinguisti
Seite 61 und 62: 6. Diskussion Pronomen ist eher zuf
Seite 63 und 64: 6. Diskussion stattfand und währen
Seite 65 und 66: 6. Diskussion auch hier Mann einen
Seite 67 und 68: 6. Diskussion Eine weitere Schwachs
Seite 69 und 70: 6. Diskussion unerhörte Begebenhei
Seite 71 und 72: 7. Fazit 7. Fazit Mit Hilfe der com
Seite 73 und 74: Literatur- und Quellenverzeichnis A
Seite 75 und 76: Anhang Anhang 1: Auszüge aus der O
Seite 77 und 78: Zeile 590-595 (Adnominale Genitive
Seite 79: Anhang 3 CD-ROM: prep

Eine computerlinguistische Untersuchung des Genitivschwundes

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?