27.10.2014 Aufrufe

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

8. Implementierung <strong>von</strong> MT Analyser<br />

Grammatik zur Erkennung <strong>von</strong> Nominalklammern<br />

Der letztendlich genutzte Algorithmus besteht im wesentlichen aus einer Grammatik, die<br />

eine Nominalklammer nachbildet und in Form eines regulären Ausdrucks die Tagfolge eines<br />

Teilsatzes nach Übereinstimmungen durchsucht. Zwar lassen sich durch einen regulären<br />

Ausdruck Nominalklammern als Spezialform <strong>von</strong> Nominalphrasen nicht vollständig beschreiben,<br />

weil sie durch ihre beliebig tiefe Verschachtelung eine rekursive Klammerstruktur<br />

darstellen, doch wird in der Praxis selten eine Nominalklammer benutzt, deren Schachtelungstiefe<br />

größer als zwei ist.<br />

Die folgende Grammatik G 1 = (N, T, P, NK) ist eine aus Gründen der Übersichtlichkeit<br />

leicht vereinfachte Form der im Programm verwendeten Grammatik G, in der zumeist<br />

nur die jeweils verpflichtend vorkommenden Worttypen aufgeführt werden; insbesondere<br />

zahlreiche Füllwörter wie Adverbien oder Negationen sind oft weggelassen. Nichtterminalsymbole<br />

sind in voller Schriftgröße dargestellt. Aus dem STTS stammende Tags sind<br />

Terminalsymbole und verkleinert dargestellt. Die Konjunktionen und und oder sind ebenfalls<br />

Terminalsymbole. Die Produktionsregeln lauten folgendermaßen:<br />

P = {<br />

NK → NK 1 | NK 2<br />

NK 1 → D 2 ((NP 11 | prf | AP 1 ) KON?) ∗ NP 11 AP 2<br />

+ N<br />

NK 2 → D 1 ((NP 12 | AP 1 ) KON?) ∗ NP 12 AP 2<br />

+ N<br />

NP 11 → (D 1 | ptkneg) ((AP1 ∗ N appo? KON?) | AP 1 | NP 2 + AP 2 + ) ∗ N appo?<br />

NP 12 → (D 3 | ptkneg) ((AP1 ∗ N appo? KON?) | AP 1 | NP 2 + AP 2 + ) ∗ N appo?<br />

NP 11 , NP 12 → ((AP1 ∗ N appo? KON?) | AP 1 | NP 2 + AP 2 + ) ∗ N appo<br />

NP 2 → D 1 (AP1 ∗ N appo? KON? ) ∗ AP1 ∗ N<br />

D 1 , D 2 → art | pposat | piat | pidat | pdat<br />

D 1 , D 3 → kokom | appr<br />

D 1 , D 2 , D 3 → apprart | appr (art | pposat | piat | pdat | pidat)<br />

AP 1 → (adja | card D 1 ?) +<br />

AP 2 → adja +<br />

N → nn | ne | pper | pposs | pds | pis | prf | trunc<br />

KON → und | oder }<br />

Erläuterung der Grammatik Die genaue Bedeutung der einzelnen Tags ist dem STTS<br />

gemäß [SSTT99] zu entnehmen.<br />

• NK: Die gesamte Nominalklammer. Zum Ende jeder Nominalklammer wird ein<br />

Nomen mit mindestens einer vorausgehenden Adjektivphrase AP 2 erwartet. Es werden<br />

zwei Arten <strong>von</strong> Nominalklammern unterschieden, wobei Nominalklammern, die<br />

nicht mit einem Artikel oder einer Präposition eingeleitet werden, nicht erkannt werden<br />

können, weil sie <strong>von</strong> zahlreichen anderen Konstruktionen nicht zu unterscheiden<br />

sind.<br />

– NK 1 : Nominalklammern, die mit einem Artikel, einem Pronomen oder einer<br />

Kombination <strong>von</strong> Präposition und Artikel oder Pronomen eingeleitet werden<br />

wie etwa durch die das englische Ritual befolgende Krönung. Eine Präposition<br />

ohne Artikel/Pronomen oder ein Vergleichspartikel reicht als Einleitung<br />

nicht. Hier genügt es, um sicherzugehen, dass es sich um eine Nominalklammer<br />

98

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!