Präpositionalphrasen an der linken Peripherie ... - Fabienne Salfner
Präpositionalphrasen an der linken Peripherie ... - Fabienne Salfner
Präpositionalphrasen an der linken Peripherie ... - Fabienne Salfner
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
KORPUS UND RECHERCHE 10<br />
Zusammenfassend ergibt sich also folgende Struktur für CQP-Anfragen: Eine An-<br />
frage ist ein regulärer Ausdruck aus Token-Bedingungen (gekennzeichnet durch ecki-<br />
ge Klammerpaare). Eine Token-Bedingung besteht aus einem aussagenlogischen Aus-<br />
druck von Attribut-Wert-Paaren, wobei die Werte wie<strong>der</strong>um durch reguläre Ausdrücke<br />
zwischen Anführungszeichen spezifiziert werden.<br />
Die weite Verbreitung von regulären Ausdrücken in <strong>der</strong> Informatik ist dadurch be-<br />
gründet, dass ihre Struktur eine effiziente Verarbeitung erlauben, was für Programme<br />
wie CQP eine wichtige Eigenschaft ist.<br />
Es k<strong>an</strong>n gezeigt werden, dass die mit regulären Ausdrücken assoziierten Sprachen<br />
exakt die Menge <strong>der</strong> von Chomsky eingeführten regulären (Typ 3) Sprachen darstellen.<br />
Da reguläre Sprachen eine echte Teilmenge <strong>der</strong> natürlichen Sprachen sind, wird klar,<br />
dass sich mit den von CQP verarbeiteten Such<strong>an</strong>fragen nicht beliebige (z.B. kontext-<br />
sensitive) Strukturen extrahieren lassen.<br />
2.1.3 Such<strong>an</strong>frage für nach links herausgestellte PPn<br />
Nachdem im vorherigen Abschnitt die prinzipielle Struktur von regulären Ausdrücken<br />
beschrieben wurde, soll in diesem Abschnitt die von mir verwendete CQP-Anfrage er-<br />
läutert werden. Zum besseren Verständnis ist <strong>der</strong> von mir erstellte reguläre Ausdruck<br />
hier in seine einzelnen Best<strong>an</strong>dteile aufgeschlüsselt. Alle Ausdrücke <strong>der</strong> einzelnen Zei-<br />
len hinterein<strong>an</strong><strong>der</strong> geschrieben bilden den komplexen regulären Such<strong>an</strong>frageausdruck.<br />
(2) ¢¡£¡£¡¥¤§¦©¨��������£�£��¡����£������¤§¦©¨��������£������������¡£¡¥¤§¦�¨�������������������¤�¦©¨�����������������������¤�¦©¨��������£�����������<br />
�<br />
�<br />
�<br />
�<br />
�<br />
¡¥¤§¦©¨��������£�£����������¤§¦©¨��������£�£���������������<br />
¤§¦©¨������������������<br />
¤����£�����£�<br />
¡¥¤§¦©¨��������£��������¤§¦©¨��������£�������<br />
¡¥¤§¦©¨��������£����������¡¥¤§¦©¨��������£�£��¡����£���£�<br />
�<br />
� ��¤����£����<br />
�<br />
�<br />
¤§�©¨��£�£�����������<br />
¡£¡£¡¥¤§¦©¨��������£�£��������������¡¥¤§¦©¨����������£�����������£����¡¥¤§¦¥¨��������£�£�����������£���<br />
Zeile 1 sichert einen Satz<strong>an</strong>f<strong>an</strong>g. Sie stellt eine dreistufige Disjunktion von ei-<br />
�<br />
���������������<br />
�<br />
�<br />
���<br />
�<br />
� �<br />
���������������<br />
�<br />
� �<br />
���������������<br />
nem o<strong>der</strong> mehreren satzinternen Satzzeichen , einer satzbeendenden<br />
Interpunktion , einer nebenordnenden Konjunktion , einer<br />
unterordnenden �<br />
����������������� �<br />
� Konjunktion o<strong>der</strong> einem �<br />
��������������� �<br />
� Komma dar.<br />
Satzinterne Satzzeichen können Kommata, Klammern o<strong>der</strong> Bindestriche sein. Da auch<br />
zwei Bindestriche hinterein<strong>an</strong><strong>der</strong> auftreten können, lasse ich mehrere satzinterne Zei-<br />
chen zu (ausgedrückt � durch ). Der �<br />
��������������� �<br />
� Teilausdruck ist nötig, um eventuelle<br />
Annotationsfehler abzuf<strong>an</strong>gen, da Kommata in den Korpora teilweise als Kom-<br />
ma und teilweise als Satzzeichen <strong>an</strong>notiert sind. Zeile 2 sucht nach einer Präpositi-<br />
�<br />
����������������� �<br />
� on beziehungsweise nach einer Präposition mit inkorporiertem Artikel