30.01.2013 Aufrufe

Präpositionalphrasen an der linken Peripherie ... - Fabienne Salfner

Präpositionalphrasen an der linken Peripherie ... - Fabienne Salfner

Präpositionalphrasen an der linken Peripherie ... - Fabienne Salfner

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

KORPUS UND RECHERCHE 10<br />

Zusammenfassend ergibt sich also folgende Struktur für CQP-Anfragen: Eine An-<br />

frage ist ein regulärer Ausdruck aus Token-Bedingungen (gekennzeichnet durch ecki-<br />

ge Klammerpaare). Eine Token-Bedingung besteht aus einem aussagenlogischen Aus-<br />

druck von Attribut-Wert-Paaren, wobei die Werte wie<strong>der</strong>um durch reguläre Ausdrücke<br />

zwischen Anführungszeichen spezifiziert werden.<br />

Die weite Verbreitung von regulären Ausdrücken in <strong>der</strong> Informatik ist dadurch be-<br />

gründet, dass ihre Struktur eine effiziente Verarbeitung erlauben, was für Programme<br />

wie CQP eine wichtige Eigenschaft ist.<br />

Es k<strong>an</strong>n gezeigt werden, dass die mit regulären Ausdrücken assoziierten Sprachen<br />

exakt die Menge <strong>der</strong> von Chomsky eingeführten regulären (Typ 3) Sprachen darstellen.<br />

Da reguläre Sprachen eine echte Teilmenge <strong>der</strong> natürlichen Sprachen sind, wird klar,<br />

dass sich mit den von CQP verarbeiteten Such<strong>an</strong>fragen nicht beliebige (z.B. kontext-<br />

sensitive) Strukturen extrahieren lassen.<br />

2.1.3 Such<strong>an</strong>frage für nach links herausgestellte PPn<br />

Nachdem im vorherigen Abschnitt die prinzipielle Struktur von regulären Ausdrücken<br />

beschrieben wurde, soll in diesem Abschnitt die von mir verwendete CQP-Anfrage er-<br />

läutert werden. Zum besseren Verständnis ist <strong>der</strong> von mir erstellte reguläre Ausdruck<br />

hier in seine einzelnen Best<strong>an</strong>dteile aufgeschlüsselt. Alle Ausdrücke <strong>der</strong> einzelnen Zei-<br />

len hinterein<strong>an</strong><strong>der</strong> geschrieben bilden den komplexen regulären Such<strong>an</strong>frageausdruck.<br />

(2) ¢¡£¡£¡¥¤§¦©¨��������£�£��¡����£������¤§¦©¨��������£������������¡£¡¥¤§¦�¨�������������������¤�¦©¨�����������������������¤�¦©¨��������£�����������<br />

�<br />

�<br />

�<br />

�<br />

�<br />

¡¥¤§¦©¨��������£�£����������¤§¦©¨��������£�£���������������<br />

¤§¦©¨������������������<br />

¤����£�����£�<br />

¡¥¤§¦©¨��������£��������¤§¦©¨��������£�������<br />

¡¥¤§¦©¨��������£����������¡¥¤§¦©¨��������£�£��¡����£���£�<br />

�<br />

� ��¤����£����<br />

�<br />

�<br />

¤§�©¨��£�£�����������<br />

¡£¡£¡¥¤§¦©¨��������£�£��������������¡¥¤§¦©¨����������£�����������£����¡¥¤§¦¥¨��������£�£�����������£���<br />

Zeile 1 sichert einen Satz<strong>an</strong>f<strong>an</strong>g. Sie stellt eine dreistufige Disjunktion von ei-<br />

�<br />

���������������<br />

�<br />

�<br />

���<br />

�<br />

� �<br />

���������������<br />

�<br />

� �<br />

���������������<br />

nem o<strong>der</strong> mehreren satzinternen Satzzeichen , einer satzbeendenden<br />

Interpunktion , einer nebenordnenden Konjunktion , einer<br />

unterordnenden �<br />

����������������� �<br />

� Konjunktion o<strong>der</strong> einem �<br />

��������������� �<br />

� Komma dar.<br />

Satzinterne Satzzeichen können Kommata, Klammern o<strong>der</strong> Bindestriche sein. Da auch<br />

zwei Bindestriche hinterein<strong>an</strong><strong>der</strong> auftreten können, lasse ich mehrere satzinterne Zei-<br />

chen zu (ausgedrückt � durch ). Der �<br />

��������������� �<br />

� Teilausdruck ist nötig, um eventuelle<br />

Annotationsfehler abzuf<strong>an</strong>gen, da Kommata in den Korpora teilweise als Kom-<br />

ma und teilweise als Satzzeichen <strong>an</strong>notiert sind. Zeile 2 sucht nach einer Präpositi-<br />

�<br />

����������������� �<br />

� on beziehungsweise nach einer Präposition mit inkorporiertem Artikel

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!