Präpositionalphrasen an der linken Peripherie ... - Fabienne Salfner

Empfehlungen

Info

KORPUS UND RECHERCHE 9 ¢¡ £¢¥¤§¦©¨ drückt aus, dass das Suchmuster ¢ m bis n mal auftreten kann. ¢�� bedeutet, dass ¢ mindestens einmal auftreten muss. CQP arbeitet auf Token-Basis. Dies bedeutet, dass ein CQP Suchmuster aus einem regulären Ausdruck besteht, der mögliche Token-Sequenzen festlegt. Die einzelnen Elemente des regulären Ausdrucks lassen sich also als zu erfüllende Bedingungen für aufeinanderfolgende Tokens interpretieren. Eine Suchanfrage könnte zum Beispiel die folgende Form haben: (1) � Bedingung 1 �� Bedingung 2 �� Bedingung 3 �� Bei Token-Sequenzen, die (1) genügen, muss das erste Token Bedingung 1 erfüllen, das zweite Token entweder Bedingung 2 oder Bedingung 3. Das � drückt aus, dass die Bedingungen 2 oder 3 nicht nur einmal sein müssen, sondern auch beliebig oft erfüllt sein können. Mögliche Ergebnisse sind Token-Sequenzen, die die Bedingungen 1 und 3 oder die Bedingungen 1 und 2, aber auch die Bedingungen 1,2 und 3 oder 1,3 und 2 erfüllen. Bedingungen für Tokens werden in Form von Attribut-Wert-Paaren angegeben, wobei drei verschiedene Attribute existieren: : Die Anforderung an das Token bezieht sich auf die Zeichenkette �� des Tokens. Es muss also das Wort “xyz” auftreten. : Die Anforderung an das Token bezieht sich auf die Part-Of-Speech- �� Kennzeichnung des Tokens. In diesem Beispiel muss das Token als Nomen gekennzeichnet sein. Es können alle Part-Of-Speech Elemente des STTS verwendet werden. : Die Anforderung an das Token bezieht sich auf den Wort- �� stamm. Sie wird also beispielsweise von Tokens mit den Worten “sehe” oder “sah” erfüllt. Allerdings kann �� nur für entsprechend annotierte Korpora verwendet werden, was bei meiner Recherche nicht bei allen der Fall ist. Die Werte der Attribut-Wert-Paare, also das was zwischen den Anführungszei- chen steht, werden ebenfalls als reguläre Ausdrücke angegeben. Das oben aufgeführ- te �� stellt einen trivialen regulären Ausdruck dar. Der komplexere Ausdruck � � � � � �� passt sowohl auf Tokens mit dem Wort “Hallo” als auch auf To- �� kens mit “Hello”. Da mehrere Bedingungen an ein Token gestellt werden können, besteht die Mög- lichkeit, die Attribut-Wert Paare aussagenlogisch zu verknüpfen. Als Verknüpfungsope- ratoren stehen Konjunktion (� ), Disjunktion ( � ) und Negation ( � ), sowie runde Klam- mern zur Gruppierung zur Verfügung.
KORPUS UND RECHERCHE 10 Zusammenfassend ergibt sich also folgende Struktur für CQP-Anfragen: Eine An- frage ist ein regulärer Ausdruck aus Token-Bedingungen (gekennzeichnet durch ecki- ge Klammerpaare). Eine Token-Bedingung besteht aus einem aussagenlogischen Aus- druck von Attribut-Wert-Paaren, wobei die Werte wiederum durch reguläre Ausdrücke zwischen Anführungszeichen spezifiziert werden. Die weite Verbreitung von regulären Ausdrücken in der Informatik ist dadurch be- gründet, dass ihre Struktur eine effiziente Verarbeitung erlauben, was für Programme wie CQP eine wichtige Eigenschaft ist. Es kann gezeigt werden, dass die mit regulären Ausdrücken assoziierten Sprachen exakt die Menge der von Chomsky eingeführten regulären (Typ 3) Sprachen darstellen. Da reguläre Sprachen eine echte Teilmenge der natürlichen Sprachen sind, wird klar, dass sich mit den von CQP verarbeiteten Suchanfragen nicht beliebige (z.B. kontext- sensitive) Strukturen extrahieren lassen. 2.1.3 Suchanfrage für nach links herausgestellte PPn Nachdem im vorherigen Abschnitt die prinzipielle Struktur von regulären Ausdrücken beschrieben wurde, soll in diesem Abschnitt die von mir verwendete CQP-Anfrage er- läutert werden. Zum besseren Verständnis ist der von mir erstellte reguläre Ausdruck hier in seine einzelnen Bestandteile aufgeschlüsselt. Alle Ausdrücke der einzelnen Zei- len hintereinander geschrieben bilden den komplexen regulären Suchanfrageausdruck. (2) ¢¡£¡£¡¥¤§¦©¨��£�£��¡��£��¤§¦©¨��£��¡£¡¥¤§¦�¨��¤�¦©¨��¤�¦©¨��£�� ¡¥¤§¦©¨��£�£��¤§¦©¨��£�£�� ¤§¦©¨�� ¤��£��£� ¡¥¤§¦©¨��£��¤§¦©¨��£�� ¡¥¤§¦©¨��£��¡¥¤§¦©¨��£�£��¡��£��£� � � ��¤��£�� ¤§�©¨��£�£�� ¡£¡£¡¥¤§¦©¨��£�£��¡¥¤§¦©¨��£��£��¡¥¤§¦¥¨��£�£��£�� Zeile 1 sichert einen Satzanfang. Sie stellt eine dreistufige Disjunktion von ei- � �� nem oder mehreren satzinternen Satzzeichen , einer satzbeendenden Interpunktion , einer nebenordnenden Konjunktion , einer unterordnenden � �� Konjunktion oder einem � �� Komma dar. Satzinterne Satzzeichen können Kommata, Klammern oder Bindestriche sein. Da auch zwei Bindestriche hintereinander auftreten können, lasse ich mehrere satzinterne Zei- chen zu (ausgedrückt � durch ). Der � �� Teilausdruck ist nötig, um eventuelle Annotationsfehler abzufangen, da Kommata in den Korpora teilweise als Kom- ma und teilweise als Satzzeichen annotiert sind. Zeile 2 sucht nach einer Präpositi- � �� on beziehungsweise nach einer Präposition mit inkorporiertem Artikel
Seite 1 und 2: Präpositionalphrasen an der linken
Seite 3 und 4: Abstract Diese Arbeit untersucht Pr
Seite 5 und 6: 4.1 ’Innere’ Semantik von Präp
Seite 7 und 8: EINLEITUNG 2 Hier wird die DP den F
Seite 9 und 10: EINLEITUNG 4 scheiden. Lötscher (1
Seite 11 und 12: KORPUS UND RECHERCHE 6 anhand derer
Seite 13: KORPUS UND RECHERCHE 8 formationen
Seite 17 und 18: KORPUS UND RECHERCHE 12 nach links
Seite 19 und 20: KORPUS UND RECHERCHE 14 tion der Ve
Seite 21 und 22: 2.3.1 Allgemeine Ergebnisse KORPUS
Seite 23 und 24: 2.3.2 Modifizierung der Anfrage KOR
Seite 25 und 26: Art der PP Arg KORPUS UND RECHERCHE
Seite 27 und 28: KORPUS UND RECHERCHE 22 der Wiedera
Seite 29 und 30: SYNTAX VON PPN AN DER LINKEN PERIPH
Seite 31 und 32: (5) a. DP DP¡ D den Studenten D NP
Seite 33 und 34: (8) CP PP C auf dem Hof C SYNTAX VO
Seite 43 und 44: 3.4 Unterscheidungskriterien SYNTAX
Seite 59 und 60: Kapitel 4 Semantik Dieses Kapitel b
Seite 61 und 62: SEMANTIK 56 (6) a. Im schönen Hilp
Seite 63 und 64: SEMANTIK 58 In den Anden ist in die
Seite 65 und 66:
SEMANTIK 60 Marinade gilt. Beides e
Seite 67 und 68:
4.3 Da als Proform für die ’Topi
Seite 69 und 70:
Status separat ermittelt werden. (2
Seite 71 und 72:
SEMANTIK 66 könnte, lassen Zifonun
Seite 73 und 74:
SEMANTIK 68 Die dargestellten Beisp
Seite 75 und 76:
SEMANTIK 70 Struktur von PPn darste
Seite 77 und 78:
ZUSAMMENFASSUNG 72 rium stellt ein
Seite 79 und 80:
LITERATURVERZEICHNIS 74 GROHMANN, K
Seite 81 und 82:
Anhang A Korpus Kurze Beschreibunge
Seite 83 und 84:
KORPUS 78 die man beim Elektromarkt
Seite 85 und 86:
KORPUS 80 den schönen Dingen der W
Seite 87 und 88:
KORPUS 82 Haushaltsjahr 2001 lautet
Seite 89 und 90:
KORPUS 84 KO-2087666: da Parallelen
Seite 91 und 92:
KORPUS 86 sind sie alle gleich, auc
Seite 93 und 94:
KORPUS 88 keinesfalls als besonders
Seite 95 und 96:
KORPUS 90 KO-8240409: stagniert ode
Seite 97 und 98:
KORPUS 92 vom Lande. Was es in der
Seite 99 und 100:
KORPUS 94 deutschösterreichische K
Seite 101 und 102:
KORPUS 96 MK1-1991254: Fritz Thiede
Seite 103 und 104:
KORPUS 98 PB-266295: Mutter oder f
Seite 105 und 106:
KORPUS 100 EU-DE-10067109: muss hie
Seite 107 und 108:
KORPUS 102 Militaristen, dafür kä
Seite 109 und 110:
PIAT attribuierendes Indefinitprono
Seite 111 und 112:
Anhang D Lebenslauf Angaben zur Per
Seite 113:
Anhang E Eidesstattliche Erklärung
Alle anzeigen

Präpositionalphrasen an der linken Peripherie ... - Fabienne Salfner

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?