Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
3. Ansätze zur Lösung der Übersetzungsprobleme<br />
3.1.3. Basic English<br />
Im Gegensatz zu den beiden zuvor dargestellten kontrollierten Sprachen ist Basic English<br />
wesentlich älter und wurde nicht auf eine möglichst einfache und eindeutige automatische<br />
Übersetzung ausgerichtet. Basic English wurde 1930 <strong>von</strong> dem britischen Linguisten<br />
Charles Kay Ogden [Ogd30] entwickelt und war als einfache Lingua franca zur globalen<br />
Kommunikation gedacht. Dennoch ist Basic English nicht bloß eine Plansprache wie Esperanto,<br />
sondern auch eine kontrollierte Sprache, weil sie eine stark eingeschränkte Variante<br />
des Standardenglischen ist; nur dass anders als bei neueren kontrollierten Sprachen das<br />
alleinige Ziel die einfache Erlernbarkeit durch den Menschen ist.<br />
Die bemerkenswerteste Abweichung gegenüber der englischen Sprache ist die Beschränkung<br />
auf lediglich 850 Wörter. Dieser Wortschatz setzt sich aus 600 Substantiven, 150 Adjektiven<br />
und einer Sammlung <strong>von</strong> 100 weiteren häufigen Wörtern zusammen, zu der etwa die<br />
englischen Artikel a und the gehören. Ogden behauptete, diese Wörter seien ebenso effizient<br />
wie 5.000 Wörter des Standardenglischen und könnten insgesamt sogar 20.000 Wörter<br />
abdecken [Ogd30]. Alle fehlenden Wörter werden durch zweiteilige Komposita, die aus den<br />
vorhandenen Wörtern gebildet werden, oder durch Umschreibungen ersetzt. Auffallend ist<br />
ebenso das weitgehende Fehlen <strong>von</strong> Verben. Lediglich eine Handvoll unverzichtbarer Verben<br />
wie etwa to do oder to be befindet sich unter den 100 weiteren häufigen Wörtern.<br />
Alle Tätigkeiten müssen unter Zuhilfenahme dieser Verben und passender Substantive<br />
und/oder Adjektive umschrieben werden. Diese Komposita und Umschreibungen sind in<br />
verschiedenen Wörterbüchern festgehalten, etwa in [Ogd60]. Vereinfacht wurden auch die<br />
Grammatikregeln. Verneinungen <strong>von</strong> Adjektiven werden prinzipiell durch das Präfix unausgedrückt<br />
[Ogd30]. Für Ableitungen werden die Suffixe -ed, -er, -ing benutzt. Bei den<br />
verbliebenen 16 Verben kommt -ed nur in einer Ausnahme als Vergangenheitsformen vor;<br />
die anderen sind ungerelmäßige Verben. Allerdings gab es auch Vereinfachungen, zu denen<br />
Ogden sich nicht durchringen konnte, wie etwa die Abschaffung der Ausnahmen bei<br />
der Pluralbildung (tooth → teeth) oder des s der dritten Person bei Verben im Singular,<br />
wenngleich er damit haderte [Ogd37].<br />
Basic English besitzt, wie man der vorangegangenen Beschreibung entnehmen kann, obwohl<br />
es nicht zur maschinellen Verarbeitung entworfen wurde, einige Merkmale, die seine<br />
automatische Übersetzung erleichtern. So löst der stark reduzierte Wortschatz das<br />
Problem ausufernder und unvollständiger Lexika. Der Verzicht auf die Vergangenheitsendung<br />
-ed beseitigt viele Mehrdeutigkeiten. Die hohe Regelmäßigkeit verlangt weniger<br />
Übersetzungsregeln. Es stellt sich andererseits aber wieder die Frage, ob durch die vielen<br />
erzwungenen Umschreibungen nicht neue Übersetzungsprobleme entstehen.<br />
3.2. Vorbearbeitung<br />
Eine weitere Möglichkeit, die Qualität der Übersetzungen zu erhöhen, ist die Vorbearbeitung<br />
eines Textes. Dabei werden dem Text über den eigentlichen Inhalt hinaus Metainformationen<br />
hinzugefügt, die vom MÜ-System ausgewertet und bei der Übersetzung<br />
berücksichtigt werden. Zahlreiche <strong>Systeme</strong> unterstützen zumindest einfache Direktiven,<br />
um beispielsweise Eigennamen zu kennzeichnen, so etwa das soeben vorgestellte KANT.<br />
Im folgenden wird ein komplexes System vorgestellt, das versucht, die Zusammenhänge<br />
innerhalb <strong>von</strong> Texten hervorzuheben und Mehrdeutigkeiten abzubauen. Festzuhalten ist<br />
dabei allerdings, dass nicht-marginale Vorbearbeitungen, die etwa über das Setzen <strong>von</strong><br />
24