27.10.2014 Aufrufe

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

2. Stand der Technik<br />

2.4.1. Mehrdeutigkeit<br />

Ein zentrales Problem beim Übersetzen zwischen zwei Sprachen ist, dass es in praktisch jeder<br />

natürlichen Sprache Wörter gibt, die in einer anderen Sprache zwei oder mehr mögliche<br />

Übersetzungen mit unterschiedlichen Bedeutungen haben. Dieses Phänomen bezeichnet<br />

man als lexikalische Mehrdeutigkeit (vgl. [ABM + 94]). Es ist auch in der deutschen Sprache<br />

häufig anzutreffen.<br />

Als Beispiel sei hier das deutsche Substantiv Verdienst genannt. Es kann sich dabei um<br />

ein Gehalt als auch um eine besondere Leistung handeln. Im Englischen muss je nach<br />

Bedeutung entweder income oder merit als Übersetzung gewählt werden. Für Verdienst<br />

ist diese Unterscheidung noch einfach, weil man nur auf darauf achten muss, ob es der<br />

oder das Verdienst ist. Bei Wörtern wie Zug, das noch wesentlich mehr Bedeutungen hat<br />

– Eisenbahn, Luftzug, Zug an einer Zigarette und andere –, ist es wesentlich schwerer,<br />

die korrekte Übersetzung zu ermitteln. Hier muss ein wie auch immer gearteter anderer<br />

Kontext herangezogen werden. Ein weiteres Beispiel für ein hochfrequentes mehrdeutiges<br />

Wort ist etwa das Verb fahren. Im Englischen kann es je nach Situation unter anderem<br />

go, drive, ride oder cycle heißen, im Spanischen conducir oder ir.<br />

Von lexikalischer Mehrdeutigkeit spricht man auch, wenn ein und dasselbe geschriebene<br />

Wort mehreren Wortarten angehört. Besonders im Englischen, das kaum wortartspezifische<br />

Endungen aufweist, ist dieses Phänomen weit verbreitet. So kann lunch sowohl ein<br />

Substantiv (the lunch) als auch ein Verb (to lunch) sein. Im Deutschen könnte man, wenn<br />

man statt Mittagessen unbedingt den Anglizismus benutzen möchte, immer noch zwischen<br />

dem Substantiv Lunch und dem Verb lunchen unterscheiden. Zwischen Adjektiven und<br />

Verben existieren im Englischen ebenfalls zahlreiche Homographen, etwa cool (kühl bzw.<br />

kühlen). Auch in der deutschen Sprache trifft man auf dieses Problem: Deutsch verfügt<br />

über solche Homographen im wesentlichen nur bei Adjektiven und Adverbien, so etwa bei<br />

schön: Man vergleiche beispielsweise die Sätze Margarete hat ihr Bild schön gemalt., wo<br />

schön als Adverb gebraucht wird, und Margaretes Bild ist schön., wo schön ein Adjektiv<br />

ist.<br />

Darüber hinaus gibt es noch die strukturelle Mehrdeutigkeit, die auftritt, wenn ein Satz<br />

oder ein Satzteil mehrere mögliche Strukturen hat. Ein Beispiel für dieses Problem ist<br />

der Satz Die Spaziergänger beobachteten die Sternschnuppe mit ihrem Fernglas. Für einen<br />

Menschen ist sofort klar, dass mit ihrem Fernglas sich nur sinnvoll auf die Spaziergänger<br />

beziehen kann, die es einsetzen, um den Himmelskörper zu betrachten. Für eine Maschine,<br />

die zuvorderst mit Regeln oder Wahrscheinlichkeiten und nicht mit Ratio agiert, könnte<br />

die Präpositionalphrase sich aber genauso gut auf die Sternschuppe beziehen, die mit<br />

ihrem Fernglas am Himmel entlangschwebt.<br />

Insgesamt gilt das Problem der Mehrdeutigkeit als überaus komplex und bislang noch<br />

nicht hinreichend gelöst. Dementsprechend bleibt es auch in Zukunft vielleicht die wichtigste<br />

Fehlerquelle für maschinelle Übersetzungen. In letzter Zeit haben sich wegen seiner<br />

Bedeutung viele Projekte auf dieses Problem fixiert und Lösungsansätze wie etwa die<br />

Linguistic Annotation Language, die in 3.2.1 vorgestellt wird, entworfen.<br />

2.4.2. Komposita<br />

Ebenfalls ein für MÜ-<strong>Systeme</strong> wichtiges Problem in vielen Sprachen sind Komposita,<br />

insbesondere ihre Zerlegung, wenn es in der Zielsprache kein passendes Wort oder kei-<br />

18

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!