30.01.2013 Aufrufe

Präpositionalphrasen an der linken Peripherie ... - Fabienne Salfner

Präpositionalphrasen an der linken Peripherie ... - Fabienne Salfner

Präpositionalphrasen an der linken Peripherie ... - Fabienne Salfner

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

KORPUS UND RECHERCHE 9<br />

¢¡ £¢¥¤§¦©¨ drückt aus, dass das Suchmuster ¢ m bis n mal auftreten k<strong>an</strong>n. ¢�� bedeutet,<br />

dass ¢ mindestens einmal auftreten muss.<br />

CQP arbeitet auf Token-Basis. Dies bedeutet, dass ein CQP Suchmuster aus ei-<br />

nem regulären Ausdruck besteht, <strong>der</strong> mögliche Token-Sequenzen festlegt. Die einzel-<br />

nen Elemente des regulären Ausdrucks lassen sich also als zu erfüllende Bedingungen<br />

für aufein<strong>an</strong><strong>der</strong>folgende Tokens interpretieren. Eine Such<strong>an</strong>frage könnte zum Beispiel<br />

die folgende Form haben:<br />

(1) � Bedingung 1 ����� Bedingung 2 ����� Bedingung 3 �����<br />

Bei Token-Sequenzen, die (1) genügen, muss das erste Token Bedingung 1 erfüllen,<br />

das zweite Token entwe<strong>der</strong> Bedingung 2 o<strong>der</strong> Bedingung 3. Das � drückt aus, dass die<br />

Bedingungen 2 o<strong>der</strong> 3 nicht nur einmal sein müssen, son<strong>der</strong>n auch beliebig oft erfüllt<br />

sein können. Mögliche Ergebnisse sind Token-Sequenzen, die die Bedingungen 1 und<br />

3 o<strong>der</strong> die Bedingungen 1 und 2, aber auch die Bedingungen 1,2 und 3 o<strong>der</strong> 1,3 und 2<br />

erfüllen.<br />

Bedingungen für Tokens werden in Form von Attribut-Wert-Paaren <strong>an</strong>gegeben, wo-<br />

bei drei verschiedene Attribute existieren:<br />

: Die Anfor<strong>der</strong>ung <strong>an</strong> das Token bezieht sich auf die Zeichenkette<br />

��������������������<br />

des Tokens. Es muss also das Wort “xyz” auftreten.<br />

: Die Anfor<strong>der</strong>ung <strong>an</strong> das Token bezieht sich auf die Part-Of-Speech-<br />

����������������<br />

Kennzeichnung des Tokens. In diesem Beispiel muss das Token als Nomen ge-<br />

kennzeichnet sein. Es können alle Part-Of-Speech Elemente des STTS verwendet<br />

werden.<br />

: Die Anfor<strong>der</strong>ung <strong>an</strong> das Token bezieht sich auf den Wort-<br />

��������������������������<br />

stamm. Sie wird also beispielsweise von Tokens mit den Worten “sehe” o<strong>der</strong><br />

“sah” erfüllt. Allerdings k<strong>an</strong>n ��������� nur für entsprechend <strong>an</strong>notierte Korpora<br />

verwendet werden, was bei meiner Recherche nicht bei allen <strong>der</strong> Fall ist.<br />

Die Werte <strong>der</strong> Attribut-Wert-Paare, also das was zwischen den Anführungszei-<br />

chen steht, werden ebenfalls als reguläre Ausdrücke <strong>an</strong>gegeben. Das oben aufgeführ-<br />

te ���������<br />

stellt einen trivialen regulären Ausdruck dar. Der komplexere Ausdruck<br />

�<br />

�<br />

�<br />

�<br />

�<br />

�������<br />

passt sowohl auf Tokens mit dem Wort “Hallo” als auch auf To-<br />

�������������<br />

kens mit “Hello”.<br />

Da mehrere Bedingungen <strong>an</strong> ein Token gestellt werden können, besteht die Mög-<br />

lichkeit, die Attribut-Wert Paare aussagenlogisch zu verknüpfen. Als Verknüpfungsope-<br />

ratoren stehen Konjunktion (� ), Disjunktion ( � ) und Negation ( � ), sowie runde Klam-<br />

mern zur Gruppierung zur Verfügung.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!