27.10.2014 Aufrufe

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

3. Ansätze zur Lösung der Übersetzungsprobleme<br />

3.1.3. Basic English<br />

Im Gegensatz zu den beiden zuvor dargestellten kontrollierten Sprachen ist Basic English<br />

wesentlich älter und wurde nicht auf eine möglichst einfache und eindeutige automatische<br />

Übersetzung ausgerichtet. Basic English wurde 1930 <strong>von</strong> dem britischen Linguisten<br />

Charles Kay Ogden [Ogd30] entwickelt und war als einfache Lingua franca zur globalen<br />

Kommunikation gedacht. Dennoch ist Basic English nicht bloß eine Plansprache wie Esperanto,<br />

sondern auch eine kontrollierte Sprache, weil sie eine stark eingeschränkte Variante<br />

des Standardenglischen ist; nur dass anders als bei neueren kontrollierten Sprachen das<br />

alleinige Ziel die einfache Erlernbarkeit durch den Menschen ist.<br />

Die bemerkenswerteste Abweichung gegenüber der englischen Sprache ist die Beschränkung<br />

auf lediglich 850 Wörter. Dieser Wortschatz setzt sich aus 600 Substantiven, 150 Adjektiven<br />

und einer Sammlung <strong>von</strong> 100 weiteren häufigen Wörtern zusammen, zu der etwa die<br />

englischen Artikel a und the gehören. Ogden behauptete, diese Wörter seien ebenso effizient<br />

wie 5.000 Wörter des Standardenglischen und könnten insgesamt sogar 20.000 Wörter<br />

abdecken [Ogd30]. Alle fehlenden Wörter werden durch zweiteilige Komposita, die aus den<br />

vorhandenen Wörtern gebildet werden, oder durch Umschreibungen ersetzt. Auffallend ist<br />

ebenso das weitgehende Fehlen <strong>von</strong> Verben. Lediglich eine Handvoll unverzichtbarer Verben<br />

wie etwa to do oder to be befindet sich unter den 100 weiteren häufigen Wörtern.<br />

Alle Tätigkeiten müssen unter Zuhilfenahme dieser Verben und passender Substantive<br />

und/oder Adjektive umschrieben werden. Diese Komposita und Umschreibungen sind in<br />

verschiedenen Wörterbüchern festgehalten, etwa in [Ogd60]. Vereinfacht wurden auch die<br />

Grammatikregeln. Verneinungen <strong>von</strong> Adjektiven werden prinzipiell durch das Präfix unausgedrückt<br />

[Ogd30]. Für Ableitungen werden die Suffixe -ed, -er, -ing benutzt. Bei den<br />

verbliebenen 16 Verben kommt -ed nur in einer Ausnahme als Vergangenheitsformen vor;<br />

die anderen sind ungerelmäßige Verben. Allerdings gab es auch Vereinfachungen, zu denen<br />

Ogden sich nicht durchringen konnte, wie etwa die Abschaffung der Ausnahmen bei<br />

der Pluralbildung (tooth → teeth) oder des s der dritten Person bei Verben im Singular,<br />

wenngleich er damit haderte [Ogd37].<br />

Basic English besitzt, wie man der vorangegangenen Beschreibung entnehmen kann, obwohl<br />

es nicht zur maschinellen Verarbeitung entworfen wurde, einige Merkmale, die seine<br />

automatische Übersetzung erleichtern. So löst der stark reduzierte Wortschatz das<br />

Problem ausufernder und unvollständiger Lexika. Der Verzicht auf die Vergangenheitsendung<br />

-ed beseitigt viele Mehrdeutigkeiten. Die hohe Regelmäßigkeit verlangt weniger<br />

Übersetzungsregeln. Es stellt sich andererseits aber wieder die Frage, ob durch die vielen<br />

erzwungenen Umschreibungen nicht neue Übersetzungsprobleme entstehen.<br />

3.2. Vorbearbeitung<br />

Eine weitere Möglichkeit, die Qualität der Übersetzungen zu erhöhen, ist die Vorbearbeitung<br />

eines Textes. Dabei werden dem Text über den eigentlichen Inhalt hinaus Metainformationen<br />

hinzugefügt, die vom MÜ-System ausgewertet und bei der Übersetzung<br />

berücksichtigt werden. Zahlreiche <strong>Systeme</strong> unterstützen zumindest einfache Direktiven,<br />

um beispielsweise Eigennamen zu kennzeichnen, so etwa das soeben vorgestellte KANT.<br />

Im folgenden wird ein komplexes System vorgestellt, das versucht, die Zusammenhänge<br />

innerhalb <strong>von</strong> Texten hervorzuheben und Mehrdeutigkeiten abzubauen. Festzuhalten ist<br />

dabei allerdings, dass nicht-marginale Vorbearbeitungen, die etwa über das Setzen <strong>von</strong><br />

24

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!