27.10.2014 Aufrufe

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

8.3. Algorithmen zur Erkennung <strong>von</strong> Textmerkmalen<br />

Abbildung 8.4.: Reduktionsbaum für eine Nominalklammer (zweites Beispiel)<br />

Testergebnisse<br />

Die Grammatik wurde am Textkorpus mit Nominalklammern getestet. Insgesamt waren<br />

88 Nominalklammern erkennbar, die restlichen vorhandenen erhielten <strong>von</strong> TreeTagger ein<br />

oder mehrere falsche Tags zugewiesen, die eine Erkennung als Nominalklammer nicht<br />

zuließen. Insbesondere wurden Artikel als substituierende Pronomen und Partizipien als<br />

finite Verben eingestuft. Von den 88 erkennbaren Nominalklammern wurden 63 korrekt<br />

identifiziert, wobei in wenigen Fällen die Länge des ausgewählten Textausschnitts zu groß<br />

war. Somit war die Erkennung zu 71, 6 Prozent vollständig. Eine weitere deutliche Steigerung<br />

der Erkennungsrate dürfte mit den vorhadenen grammatischen Informationen, die<br />

beispielsweise Kongruenzüberprüfungen nahezu ausschließen, nicht möglich sein.<br />

Das Ergebnis ist zwar deutlich schlechter als die 90-prozentige Erkennung des zweiten Ansatzes,<br />

dafür tendiert aber die zuvor überbordende Zahl an Fehlidentifikationen gen null.<br />

In den Textkorpora zu den anderen Textmerkmalen wurden insgesamt 26 Nominalklammern<br />

identifiziert, <strong>von</strong> denen auch 23 tatsächlich Nominalklammern waren. Zwei wurden<br />

durch TreeTagger falsch getaggt, eine durch den Algorithmus falsch erkannt. Bei einer<br />

Quote <strong>von</strong> 23 aus 24 erkennbaren bedeutet das eine Präzision <strong>von</strong> 95, 8 Prozent.<br />

8.3.5. Relativsätze<br />

MT Analyser durchsucht alle als Nebensätze markierten Teilsätze nach Relativpronomen<br />

(Tags PRELS, PRELAT und teilweise auch PWAV ) an erster oder zweiter Stelle des<br />

jeweiligen Teilsatzes, um auch Relativsätze in präpositionalen Konstruktionen wie Das<br />

Haus, in dem ich wohne, ist schön. zu erkennen. Darüber hinaus wird auch nach Interrogativpronomen<br />

(Tags PWAT und PWS) gesucht, die zur Einleitung <strong>von</strong> Nebensätzen<br />

genutzt werden. Ein Beispiel hierfür ist etwa: Weißt du, welches Fußballspiel übertragen<br />

101

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!