Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
8.3. Algorithmen zur Erkennung <strong>von</strong> Textmerkmalen<br />
Abbildung 8.4.: Reduktionsbaum für eine Nominalklammer (zweites Beispiel)<br />
Testergebnisse<br />
Die Grammatik wurde am Textkorpus mit Nominalklammern getestet. Insgesamt waren<br />
88 Nominalklammern erkennbar, die restlichen vorhandenen erhielten <strong>von</strong> TreeTagger ein<br />
oder mehrere falsche Tags zugewiesen, die eine Erkennung als Nominalklammer nicht<br />
zuließen. Insbesondere wurden Artikel als substituierende Pronomen und Partizipien als<br />
finite Verben eingestuft. Von den 88 erkennbaren Nominalklammern wurden 63 korrekt<br />
identifiziert, wobei in wenigen Fällen die Länge des ausgewählten Textausschnitts zu groß<br />
war. Somit war die Erkennung zu 71, 6 Prozent vollständig. Eine weitere deutliche Steigerung<br />
der Erkennungsrate dürfte mit den vorhadenen grammatischen Informationen, die<br />
beispielsweise Kongruenzüberprüfungen nahezu ausschließen, nicht möglich sein.<br />
Das Ergebnis ist zwar deutlich schlechter als die 90-prozentige Erkennung des zweiten Ansatzes,<br />
dafür tendiert aber die zuvor überbordende Zahl an Fehlidentifikationen gen null.<br />
In den Textkorpora zu den anderen Textmerkmalen wurden insgesamt 26 Nominalklammern<br />
identifiziert, <strong>von</strong> denen auch 23 tatsächlich Nominalklammern waren. Zwei wurden<br />
durch TreeTagger falsch getaggt, eine durch den Algorithmus falsch erkannt. Bei einer<br />
Quote <strong>von</strong> 23 aus 24 erkennbaren bedeutet das eine Präzision <strong>von</strong> 95, 8 Prozent.<br />
8.3.5. Relativsätze<br />
MT Analyser durchsucht alle als Nebensätze markierten Teilsätze nach Relativpronomen<br />
(Tags PRELS, PRELAT und teilweise auch PWAV ) an erster oder zweiter Stelle des<br />
jeweiligen Teilsatzes, um auch Relativsätze in präpositionalen Konstruktionen wie Das<br />
Haus, in dem ich wohne, ist schön. zu erkennen. Darüber hinaus wird auch nach Interrogativpronomen<br />
(Tags PWAT und PWS) gesucht, die zur Einleitung <strong>von</strong> Nebensätzen<br />
genutzt werden. Ein Beispiel hierfür ist etwa: Weißt du, welches Fußballspiel übertragen<br />
101