07.10.2013 Aufrufe

Kontrolliertes Englisch für Anforderungsspezifikationen

Kontrolliertes Englisch für Anforderungsspezifikationen

Kontrolliertes Englisch für Anforderungsspezifikationen

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

62 Kapitel 4<br />

Kontrollierte natŸrliche Sprachen 61<br />

Online-Dokumenten automatisch aufgebaut und anschliessend von einem Lexikographen<br />

verfeinert wird [Mitamura et al. 93]. Jedem Wort wird eine Bedeutung zugeordnet.<br />

Wenn ein Wort in einem Anwendungsbereich mehr als eine Bedeutung hat,<br />

dann untersucht der Lexikograph, ob die ŸberzŠhligen Bedeutungen des Wortes auf<br />

andere unbelegte AusdrŸcke verteilt werden kšnnen. AusdrŸcke, fŸr die sich eine<br />

solche Spezialisierung finden lŠsst, werden im Lexikon als zusammengehšrig gekennzeichnet,<br />

so dass die alternierenden Bedeutungen fŸr ClearCheck zugŠnglich werden.<br />

Wenn eine Verteilung der verschiedenen Bedeutungen nicht mšglich ist, dann fŸhrt<br />

das zu mehreren lexikalischen EintrŠgen fŸr dasselbe Wort. Die Disambiguierung<br />

kann dann erst wŠhrend der Quelltextanalyse vorgenommen werden.<br />

kann die Lesbarkeit und die VerstŠndlichkeit von technischen Dokumenten fŸr die<br />

Leser aller Sprachgruppen (Muttersprachler und Nichtmuttersprachler) verbessert<br />

werden [vgl. Hayes et al. 96:87]. Zum anderen konnten bei der maschinellen †bersetzung<br />

bessere Resultate erzielt werden, wenn die Quelltexte in kontrollierter natŸrlicher<br />

Sprache vorlagen [vgl. Mitamura & Nyberg 95:12]. Kontrollierte natŸrliche Sprachen<br />

sind in der Regeln in kurzer Zeit erlernbar, doch kann der Schreibprozess in der<br />

Anfangsphase im Vergleich zu konventioneller Sprache bis zu 20% mehr Zeit in Anspruch<br />

nehmen [vgl. Farrington 96:21, Goyvaerts 96:139].<br />

FŸr die Definition des technischen Vokabulars unterscheidet die Sprache KCE drei<br />

Kategorien:<br />

¥ Technische Phrasen (das sind oft kompositional nicht errechenbare Einheiten)<br />

¥ Technische Wšrter (Akronyme, AbkŸrzungen)<br />

¥ Technische Symbole (Zahlen, Zahlwšrter, Buchstaben und Masseinheiten)<br />

ZusŠtzlich zur BeschrŠnkung des Diskursbereichs gelten fŸr den Gebrauch des Vokabulars<br />

und der Grammatik von KCE eine Reihe von EinschrŠnkungen [Baker et al. 94,<br />

Mitamura & Nyberg 95, Nyberg & Mitamura 96]. FŸr das Vokabular gelten die folgenden<br />

Regeln:<br />

¥ Nur konsistente Orthographie ist zulŠssig.<br />

¥ Nur spezifizierter Gebrauch von Nominalkomposita ist erlaubt.<br />

¥ Nur spezifizierter Gebrauch von Funktionswšrtern ist gestattet.<br />

¥ Nur spezifizierter Gebrauch von Modalverben ist erlaubt.<br />

4.2.1 KANT Controlled English (KCE)<br />

KANT Controlled English (KCE) wird fŸr das wissensbasierte maschinelle †bersetzungssystem<br />

KANT am Zentrum fŸr maschinelle †bersetzung (CMT) der Carnegie<br />

Mellon UniversitŠt entwickelt [Carbonell et al. 92, Mitamura & Nyberg 95, Nyberg &<br />

Mitamura 96]. KANT ist fŸr die †bersetzung von technischen Dokumenten in KCE<br />

ausgelegt und basiert auf einem Interlingua-Ansatz [Lonsdale et al. 94]. Die Analysekomponente<br />

von KANT erstellt fŸr jeden Satz der Quellsprache einen Interlingua-<br />

Ausdruck, der von der Generierungskomponente in einen Satz der Zielsprache ŸberfŸhrt<br />

wird. Die Interlingua ist unabhŠngig von der Quell- und Zielsprache und beruht<br />

auf einer Menge von Konzepten (Objekte, Ereignisse und Eigenschaften), die aus dem<br />

jeweiligen Diskursbereich durch einen vorausgehenden Wissensakquisitionsprozess<br />

abgeleitet wird [Mitamura et al. 93]. KANT produziert †bersetzungen von hoher<br />

QualitŠt, ohne dass eine manuelle Nachbearbeitung nštig ist. Die Autoren werden<br />

beim Schreiben der KCE Texte durch das Werkzeug ClearCheck unterstŸtzt, mit dem<br />

sich ŸberprŸfen lŠsst, ob die SŠtze mit dem kontrollierten Vokabular und der kontrollierten<br />

Grammatik Ÿbereinstimmen. Stšsst ClearCheck auf eine lexikalische oder<br />

strukturelle Mehrdeutigkeit, wird vom Autor eine Entscheidung fŸr eine Lesart verlangt.<br />

Die Sprache KCE unterstŸtzt die Verwendung von speziellen SGML (Standard<br />

Generalized Markup Language) Tags, um die gewŸnschte Lesart von mehrdeutigen<br />

Konstruktionen zu kennzeichnen. Der Autor legt beispielsweise fŸr den Satz<br />

Die Sprache KCE unterscheidet zwischen grammatikalischen EinschrŠnkungen auf<br />

der Phrasen- und der Satzebene. Die phrasalen EinschrŠnkungen sind folgender-<br />

massen geregelt:<br />

(45) Secure the gear with twelve rivets.<br />

¥ Nominalphrasen sind mit Determinatoren zu verwenden.<br />

The primary power supply component will supply the necessary 240 Volts DC<br />

to the input lead.<br />

fest, dass die PrŠpositionalphrase with twelve rivets an das Verb secure und nicht an das<br />

Nomen gear gebunden wird. ClearCheck markiert zu diesem Zweck die entspre-<br />

chende Textstelle mit einem attach SGML Tag:<br />

(46) Secure the gear with twelve rivets.<br />

Die Sprache KCE verwendet ein bereichsspezifisches Lexikon, das aus vorhandenen

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!