Eine computerlinguistische Untersuchung des Genitivschwundes

Weitere Magazine

Empfehlungen

Info

$Handout Latex 2$

3. Computerlinguistischer Hintergrund Abbildung 1: Beispielausgabe des TreeTaggers (TreeTagger, 2013) Der TreeTagger ist für mehrere Sprachen erhältlich, indem verschiedene Tagsets den jeweiligen Sprachen entsprechend benutzt werden. Zudem kann der TreeTagger auch auf weitere Sprachen erweitert werden, solange ein entsprechendes Lexikon und ein zuvor manuell annotierter Trainingskorpus vorliegen (siehe TreeTagger, 2013). 17
4. Durchführung 4. Durchführung Um den Genitivschwund umfassender untersuchen zu können, muss ein Programm in Perl geschrieben werden, das den nötigen Anforderungen entspricht. Zudem müssen die Texte für die Verarbeitung, unter anderem durch den eben erwähnten TreeTagger, vorbereitet werden. Der strukturelle Ablauf der Programmierung und auch die einzelnen Schritte, die zur Erstellung nötig waren, werden im folgenden Abschnitt verdeutlicht. Anschließend werden die Probleme, die während der Programmierung entstanden und die es zu beseitigen galt, angesprochen. 4.1 Struktureller Ablauf Der erste Schritt innerhalb der Untersuchung besteht darin, die Novellen für das POS Tagging durch den TreeTagger vorzubereiten, um unbrauchbare Ergebnisse zu vermeiden. Daraufhin werden die Novellen entsprechend durch den Tagger annotiert, damit sie dann von dem tatsächlichen Hauptprogramm analysiert werden können. Der strukturelle Aufbau des Perlskripts zur Untersuchung des Genitivschwundes wird am Ende dieses Abschnitts dargelegt. 4.1.1 Vorbereitung der Texte für das POS Tagging Zunächst werden die Novellen, die als Textdatei unter goethe_novelle.txt für „Novelle“ von Goethe, mann_todinvenedig.txt für „Der Tod in Venedig“ von Mann und entsprechend timm_currywurst.txt für „Die Entdeckung der Currywurst“ von Timm ohne Vorwort und weitere nicht-inhaltsbezogene Angaben gespeichert sind, für den darauffolgenden Prozess des Part-of-speech Taggings vorbereitet. Diese Texte sind unter anderem auf der CD-ROM in Anhang 3 zu finden. Zur Vermeidung von späteren Tagfehlern, wie etwa der Zuweisung der falschen Wortart, sollen die Dateien vor der Anwendung des TreeTaggers von bestimmten Zeichen bereinigt werden. Dafür wurde das Programm preprocess.pl 5 erstellt, welches die Texte für die Zuweisung der POS Tags vorbereitet. Der Programmaufruf kann unter anderem in der Betriebssystem-Shell erfolgen, nachdem man als erstes per Befehl cd (change directory) und der Pfadangabe des Ordners, in dem das Programm gespeichert ist, in eben diesen wechselt. Danach gibt man perl und den Namen der Programmdatei, in diesem Fall preprocess.pl, an und das Programm startet. Zu Beginn wird der Benutzer mittels des print-Statements darüber informiert, wozu das Programm dient. Nach dem Statement steht in Anführungszeichen der auszugebende 5 ebenfalls in Anhang 3 18
Seite 1 und 2: Eine computerlinguistische Untersuc
Seite 3 und 4: Inhaltsverzeichnis 1. Einleitung ..
Seite 5 und 6: Tabellenverzeichnis Tabelle 1: Beis
Seite 7 und 8: 1. Einleitung gemessen werden kann.
Seite 9 und 10: 2. Theoretischer Hintergrund gezäh
Seite 11 und 12: 2. Theoretischer Hintergrund die Ge
Seite 13 und 14: 2. Theoretischer Hintergrund 1730.
Seite 15 und 16: 2. Theoretischer Hintergrund 2.2 Di
Seite 17 und 18: 2. Theoretischer Hintergrund sein F
Seite 19 und 20: 2. Theoretischer Hintergrund Der Ic
Seite 21: 3. Computerlinguistischer Hintergru
Seite 25 und 26: 4. Durchführung Abbildung 3: Progr
Seite 27 und 28: 4. Durchführung des Users wird per
Seite 29 und 30: 4. Durchführung Abbildung 6: Erste
Seite 31 und 32: 4. Durchführung ein Eikosagramm, w
Seite 33 und 34: 4. Durchführung Anschließend wird
Seite 35 und 36: 4. Durchführung wurden, erfasst we
Seite 37 und 38: 4. Durchführung Erfassung dieser a
Seite 39 und 40: 4. Durchführung erste Element kein
Seite 41 und 42: 4. Durchführung 4.2 Probleme bei d
Seite 43 und 44: 4. Durchführung wurde versucht, so
Seite 45 und 46: 5. Ergebnisse der computerlinguisti
Seite 61 und 62: 6. Diskussion Pronomen ist eher zuf
Seite 63 und 64: 6. Diskussion stattfand und währen
Seite 65 und 66: 6. Diskussion auch hier Mann einen
Seite 67 und 68: 6. Diskussion Eine weitere Schwachs
Seite 69 und 70: 6. Diskussion unerhörte Begebenhei
Seite 71 und 72: 7. Fazit 7. Fazit Mit Hilfe der com
Seite 73 und 74:
Literatur- und Quellenverzeichnis A
Seite 75 und 76:
Anhang Anhang 1: Auszüge aus der O
Seite 77 und 78:
Zeile 590-595 (Adnominale Genitive
Seite 79:
Anhang 3 CD-ROM: prep
Alle anzeigen

Eine computerlinguistische Untersuchung des Genitivschwundes

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?