Präpositionalphrasen an der linken Peripherie ... - Fabienne Salfner
Präpositionalphrasen an der linken Peripherie ... - Fabienne Salfner
Präpositionalphrasen an der linken Peripherie ... - Fabienne Salfner
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
KORPUS UND RECHERCHE 9<br />
¢¡ £¢¥¤§¦©¨ drückt aus, dass das Suchmuster ¢ m bis n mal auftreten k<strong>an</strong>n. ¢�� bedeutet,<br />
dass ¢ mindestens einmal auftreten muss.<br />
CQP arbeitet auf Token-Basis. Dies bedeutet, dass ein CQP Suchmuster aus ei-<br />
nem regulären Ausdruck besteht, <strong>der</strong> mögliche Token-Sequenzen festlegt. Die einzel-<br />
nen Elemente des regulären Ausdrucks lassen sich also als zu erfüllende Bedingungen<br />
für aufein<strong>an</strong><strong>der</strong>folgende Tokens interpretieren. Eine Such<strong>an</strong>frage könnte zum Beispiel<br />
die folgende Form haben:<br />
(1) � Bedingung 1 ����� Bedingung 2 ����� Bedingung 3 �����<br />
Bei Token-Sequenzen, die (1) genügen, muss das erste Token Bedingung 1 erfüllen,<br />
das zweite Token entwe<strong>der</strong> Bedingung 2 o<strong>der</strong> Bedingung 3. Das � drückt aus, dass die<br />
Bedingungen 2 o<strong>der</strong> 3 nicht nur einmal sein müssen, son<strong>der</strong>n auch beliebig oft erfüllt<br />
sein können. Mögliche Ergebnisse sind Token-Sequenzen, die die Bedingungen 1 und<br />
3 o<strong>der</strong> die Bedingungen 1 und 2, aber auch die Bedingungen 1,2 und 3 o<strong>der</strong> 1,3 und 2<br />
erfüllen.<br />
Bedingungen für Tokens werden in Form von Attribut-Wert-Paaren <strong>an</strong>gegeben, wo-<br />
bei drei verschiedene Attribute existieren:<br />
: Die Anfor<strong>der</strong>ung <strong>an</strong> das Token bezieht sich auf die Zeichenkette<br />
��������������������<br />
des Tokens. Es muss also das Wort “xyz” auftreten.<br />
: Die Anfor<strong>der</strong>ung <strong>an</strong> das Token bezieht sich auf die Part-Of-Speech-<br />
����������������<br />
Kennzeichnung des Tokens. In diesem Beispiel muss das Token als Nomen ge-<br />
kennzeichnet sein. Es können alle Part-Of-Speech Elemente des STTS verwendet<br />
werden.<br />
: Die Anfor<strong>der</strong>ung <strong>an</strong> das Token bezieht sich auf den Wort-<br />
��������������������������<br />
stamm. Sie wird also beispielsweise von Tokens mit den Worten “sehe” o<strong>der</strong><br />
“sah” erfüllt. Allerdings k<strong>an</strong>n ��������� nur für entsprechend <strong>an</strong>notierte Korpora<br />
verwendet werden, was bei meiner Recherche nicht bei allen <strong>der</strong> Fall ist.<br />
Die Werte <strong>der</strong> Attribut-Wert-Paare, also das was zwischen den Anführungszei-<br />
chen steht, werden ebenfalls als reguläre Ausdrücke <strong>an</strong>gegeben. Das oben aufgeführ-<br />
te ���������<br />
stellt einen trivialen regulären Ausdruck dar. Der komplexere Ausdruck<br />
�<br />
�<br />
�<br />
�<br />
�<br />
�������<br />
passt sowohl auf Tokens mit dem Wort “Hallo” als auch auf To-<br />
�������������<br />
kens mit “Hello”.<br />
Da mehrere Bedingungen <strong>an</strong> ein Token gestellt werden können, besteht die Mög-<br />
lichkeit, die Attribut-Wert Paare aussagenlogisch zu verknüpfen. Als Verknüpfungsope-<br />
ratoren stehen Konjunktion (� ), Disjunktion ( � ) und Negation ( � ), sowie runde Klam-<br />
mern zur Gruppierung zur Verfügung.