Kontrolliertes Englisch für Anforderungsspezifikationen
Kontrolliertes Englisch für Anforderungsspezifikationen
Kontrolliertes Englisch für Anforderungsspezifikationen
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
62 Kapitel 4<br />
Kontrollierte natŸrliche Sprachen 61<br />
Online-Dokumenten automatisch aufgebaut und anschliessend von einem Lexikographen<br />
verfeinert wird [Mitamura et al. 93]. Jedem Wort wird eine Bedeutung zugeordnet.<br />
Wenn ein Wort in einem Anwendungsbereich mehr als eine Bedeutung hat,<br />
dann untersucht der Lexikograph, ob die ŸberzŠhligen Bedeutungen des Wortes auf<br />
andere unbelegte AusdrŸcke verteilt werden kšnnen. AusdrŸcke, fŸr die sich eine<br />
solche Spezialisierung finden lŠsst, werden im Lexikon als zusammengehšrig gekennzeichnet,<br />
so dass die alternierenden Bedeutungen fŸr ClearCheck zugŠnglich werden.<br />
Wenn eine Verteilung der verschiedenen Bedeutungen nicht mšglich ist, dann fŸhrt<br />
das zu mehreren lexikalischen EintrŠgen fŸr dasselbe Wort. Die Disambiguierung<br />
kann dann erst wŠhrend der Quelltextanalyse vorgenommen werden.<br />
kann die Lesbarkeit und die VerstŠndlichkeit von technischen Dokumenten fŸr die<br />
Leser aller Sprachgruppen (Muttersprachler und Nichtmuttersprachler) verbessert<br />
werden [vgl. Hayes et al. 96:87]. Zum anderen konnten bei der maschinellen †bersetzung<br />
bessere Resultate erzielt werden, wenn die Quelltexte in kontrollierter natŸrlicher<br />
Sprache vorlagen [vgl. Mitamura & Nyberg 95:12]. Kontrollierte natŸrliche Sprachen<br />
sind in der Regeln in kurzer Zeit erlernbar, doch kann der Schreibprozess in der<br />
Anfangsphase im Vergleich zu konventioneller Sprache bis zu 20% mehr Zeit in Anspruch<br />
nehmen [vgl. Farrington 96:21, Goyvaerts 96:139].<br />
FŸr die Definition des technischen Vokabulars unterscheidet die Sprache KCE drei<br />
Kategorien:<br />
¥ Technische Phrasen (das sind oft kompositional nicht errechenbare Einheiten)<br />
¥ Technische Wšrter (Akronyme, AbkŸrzungen)<br />
¥ Technische Symbole (Zahlen, Zahlwšrter, Buchstaben und Masseinheiten)<br />
ZusŠtzlich zur BeschrŠnkung des Diskursbereichs gelten fŸr den Gebrauch des Vokabulars<br />
und der Grammatik von KCE eine Reihe von EinschrŠnkungen [Baker et al. 94,<br />
Mitamura & Nyberg 95, Nyberg & Mitamura 96]. FŸr das Vokabular gelten die folgenden<br />
Regeln:<br />
¥ Nur konsistente Orthographie ist zulŠssig.<br />
¥ Nur spezifizierter Gebrauch von Nominalkomposita ist erlaubt.<br />
¥ Nur spezifizierter Gebrauch von Funktionswšrtern ist gestattet.<br />
¥ Nur spezifizierter Gebrauch von Modalverben ist erlaubt.<br />
4.2.1 KANT Controlled English (KCE)<br />
KANT Controlled English (KCE) wird fŸr das wissensbasierte maschinelle †bersetzungssystem<br />
KANT am Zentrum fŸr maschinelle †bersetzung (CMT) der Carnegie<br />
Mellon UniversitŠt entwickelt [Carbonell et al. 92, Mitamura & Nyberg 95, Nyberg &<br />
Mitamura 96]. KANT ist fŸr die †bersetzung von technischen Dokumenten in KCE<br />
ausgelegt und basiert auf einem Interlingua-Ansatz [Lonsdale et al. 94]. Die Analysekomponente<br />
von KANT erstellt fŸr jeden Satz der Quellsprache einen Interlingua-<br />
Ausdruck, der von der Generierungskomponente in einen Satz der Zielsprache ŸberfŸhrt<br />
wird. Die Interlingua ist unabhŠngig von der Quell- und Zielsprache und beruht<br />
auf einer Menge von Konzepten (Objekte, Ereignisse und Eigenschaften), die aus dem<br />
jeweiligen Diskursbereich durch einen vorausgehenden Wissensakquisitionsprozess<br />
abgeleitet wird [Mitamura et al. 93]. KANT produziert †bersetzungen von hoher<br />
QualitŠt, ohne dass eine manuelle Nachbearbeitung nštig ist. Die Autoren werden<br />
beim Schreiben der KCE Texte durch das Werkzeug ClearCheck unterstŸtzt, mit dem<br />
sich ŸberprŸfen lŠsst, ob die SŠtze mit dem kontrollierten Vokabular und der kontrollierten<br />
Grammatik Ÿbereinstimmen. Stšsst ClearCheck auf eine lexikalische oder<br />
strukturelle Mehrdeutigkeit, wird vom Autor eine Entscheidung fŸr eine Lesart verlangt.<br />
Die Sprache KCE unterstŸtzt die Verwendung von speziellen SGML (Standard<br />
Generalized Markup Language) Tags, um die gewŸnschte Lesart von mehrdeutigen<br />
Konstruktionen zu kennzeichnen. Der Autor legt beispielsweise fŸr den Satz<br />
Die Sprache KCE unterscheidet zwischen grammatikalischen EinschrŠnkungen auf<br />
der Phrasen- und der Satzebene. Die phrasalen EinschrŠnkungen sind folgender-<br />
massen geregelt:<br />
(45) Secure the gear with twelve rivets.<br />
¥ Nominalphrasen sind mit Determinatoren zu verwenden.<br />
The primary power supply component will supply the necessary 240 Volts DC<br />
to the input lead.<br />
fest, dass die PrŠpositionalphrase with twelve rivets an das Verb secure und nicht an das<br />
Nomen gear gebunden wird. ClearCheck markiert zu diesem Zweck die entspre-<br />
chende Textstelle mit einem attach SGML Tag:<br />
(46) Secure the gear with twelve rivets.<br />
Die Sprache KCE verwendet ein bereichsspezifisches Lexikon, das aus vorhandenen