Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
8. Implementierung <strong>von</strong> MT Analyser<br />
Grammatik zur Erkennung <strong>von</strong> Nominalklammern<br />
Der letztendlich genutzte Algorithmus besteht im wesentlichen aus einer Grammatik, die<br />
eine Nominalklammer nachbildet und in Form eines regulären Ausdrucks die Tagfolge eines<br />
Teilsatzes nach Übereinstimmungen durchsucht. Zwar lassen sich durch einen regulären<br />
Ausdruck Nominalklammern als Spezialform <strong>von</strong> Nominalphrasen nicht vollständig beschreiben,<br />
weil sie durch ihre beliebig tiefe Verschachtelung eine rekursive Klammerstruktur<br />
darstellen, doch wird in der Praxis selten eine Nominalklammer benutzt, deren Schachtelungstiefe<br />
größer als zwei ist.<br />
Die folgende Grammatik G 1 = (N, T, P, NK) ist eine aus Gründen der Übersichtlichkeit<br />
leicht vereinfachte Form der im Programm verwendeten Grammatik G, in der zumeist<br />
nur die jeweils verpflichtend vorkommenden Worttypen aufgeführt werden; insbesondere<br />
zahlreiche Füllwörter wie Adverbien oder Negationen sind oft weggelassen. Nichtterminalsymbole<br />
sind in voller Schriftgröße dargestellt. Aus dem STTS stammende Tags sind<br />
Terminalsymbole und verkleinert dargestellt. Die Konjunktionen und und oder sind ebenfalls<br />
Terminalsymbole. Die Produktionsregeln lauten folgendermaßen:<br />
P = {<br />
NK → NK 1 | NK 2<br />
NK 1 → D 2 ((NP 11 | prf | AP 1 ) KON?) ∗ NP 11 AP 2<br />
+ N<br />
NK 2 → D 1 ((NP 12 | AP 1 ) KON?) ∗ NP 12 AP 2<br />
+ N<br />
NP 11 → (D 1 | ptkneg) ((AP1 ∗ N appo? KON?) | AP 1 | NP 2 + AP 2 + ) ∗ N appo?<br />
NP 12 → (D 3 | ptkneg) ((AP1 ∗ N appo? KON?) | AP 1 | NP 2 + AP 2 + ) ∗ N appo?<br />
NP 11 , NP 12 → ((AP1 ∗ N appo? KON?) | AP 1 | NP 2 + AP 2 + ) ∗ N appo<br />
NP 2 → D 1 (AP1 ∗ N appo? KON? ) ∗ AP1 ∗ N<br />
D 1 , D 2 → art | pposat | piat | pidat | pdat<br />
D 1 , D 3 → kokom | appr<br />
D 1 , D 2 , D 3 → apprart | appr (art | pposat | piat | pdat | pidat)<br />
AP 1 → (adja | card D 1 ?) +<br />
AP 2 → adja +<br />
N → nn | ne | pper | pposs | pds | pis | prf | trunc<br />
KON → und | oder }<br />
Erläuterung der Grammatik Die genaue Bedeutung der einzelnen Tags ist dem STTS<br />
gemäß [SSTT99] zu entnehmen.<br />
• NK: Die gesamte Nominalklammer. Zum Ende jeder Nominalklammer wird ein<br />
Nomen mit mindestens einer vorausgehenden Adjektivphrase AP 2 erwartet. Es werden<br />
zwei Arten <strong>von</strong> Nominalklammern unterschieden, wobei Nominalklammern, die<br />
nicht mit einem Artikel oder einer Präposition eingeleitet werden, nicht erkannt werden<br />
können, weil sie <strong>von</strong> zahlreichen anderen Konstruktionen nicht zu unterscheiden<br />
sind.<br />
– NK 1 : Nominalklammern, die mit einem Artikel, einem Pronomen oder einer<br />
Kombination <strong>von</strong> Präposition und Artikel oder Pronomen eingeleitet werden<br />
wie etwa durch die das englische Ritual befolgende Krönung. Eine Präposition<br />
ohne Artikel/Pronomen oder ein Vergleichspartikel reicht als Einleitung<br />
nicht. Hier genügt es, um sicherzugehen, dass es sich um eine Nominalklammer<br />
98