Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
2. Stand der Technik<br />
2.4.1. Mehrdeutigkeit<br />
Ein zentrales Problem beim Übersetzen zwischen zwei Sprachen ist, dass es in praktisch jeder<br />
natürlichen Sprache Wörter gibt, die in einer anderen Sprache zwei oder mehr mögliche<br />
Übersetzungen mit unterschiedlichen Bedeutungen haben. Dieses Phänomen bezeichnet<br />
man als lexikalische Mehrdeutigkeit (vgl. [ABM + 94]). Es ist auch in der deutschen Sprache<br />
häufig anzutreffen.<br />
Als Beispiel sei hier das deutsche Substantiv Verdienst genannt. Es kann sich dabei um<br />
ein Gehalt als auch um eine besondere Leistung handeln. Im Englischen muss je nach<br />
Bedeutung entweder income oder merit als Übersetzung gewählt werden. Für Verdienst<br />
ist diese Unterscheidung noch einfach, weil man nur auf darauf achten muss, ob es der<br />
oder das Verdienst ist. Bei Wörtern wie Zug, das noch wesentlich mehr Bedeutungen hat<br />
– Eisenbahn, Luftzug, Zug an einer Zigarette und andere –, ist es wesentlich schwerer,<br />
die korrekte Übersetzung zu ermitteln. Hier muss ein wie auch immer gearteter anderer<br />
Kontext herangezogen werden. Ein weiteres Beispiel für ein hochfrequentes mehrdeutiges<br />
Wort ist etwa das Verb fahren. Im Englischen kann es je nach Situation unter anderem<br />
go, drive, ride oder cycle heißen, im Spanischen conducir oder ir.<br />
Von lexikalischer Mehrdeutigkeit spricht man auch, wenn ein und dasselbe geschriebene<br />
Wort mehreren Wortarten angehört. Besonders im Englischen, das kaum wortartspezifische<br />
Endungen aufweist, ist dieses Phänomen weit verbreitet. So kann lunch sowohl ein<br />
Substantiv (the lunch) als auch ein Verb (to lunch) sein. Im Deutschen könnte man, wenn<br />
man statt Mittagessen unbedingt den Anglizismus benutzen möchte, immer noch zwischen<br />
dem Substantiv Lunch und dem Verb lunchen unterscheiden. Zwischen Adjektiven und<br />
Verben existieren im Englischen ebenfalls zahlreiche Homographen, etwa cool (kühl bzw.<br />
kühlen). Auch in der deutschen Sprache trifft man auf dieses Problem: Deutsch verfügt<br />
über solche Homographen im wesentlichen nur bei Adjektiven und Adverbien, so etwa bei<br />
schön: Man vergleiche beispielsweise die Sätze Margarete hat ihr Bild schön gemalt., wo<br />
schön als Adverb gebraucht wird, und Margaretes Bild ist schön., wo schön ein Adjektiv<br />
ist.<br />
Darüber hinaus gibt es noch die strukturelle Mehrdeutigkeit, die auftritt, wenn ein Satz<br />
oder ein Satzteil mehrere mögliche Strukturen hat. Ein Beispiel für dieses Problem ist<br />
der Satz Die Spaziergänger beobachteten die Sternschnuppe mit ihrem Fernglas. Für einen<br />
Menschen ist sofort klar, dass mit ihrem Fernglas sich nur sinnvoll auf die Spaziergänger<br />
beziehen kann, die es einsetzen, um den Himmelskörper zu betrachten. Für eine Maschine,<br />
die zuvorderst mit Regeln oder Wahrscheinlichkeiten und nicht mit Ratio agiert, könnte<br />
die Präpositionalphrase sich aber genauso gut auf die Sternschuppe beziehen, die mit<br />
ihrem Fernglas am Himmel entlangschwebt.<br />
Insgesamt gilt das Problem der Mehrdeutigkeit als überaus komplex und bislang noch<br />
nicht hinreichend gelöst. Dementsprechend bleibt es auch in Zukunft vielleicht die wichtigste<br />
Fehlerquelle für maschinelle Übersetzungen. In letzter Zeit haben sich wegen seiner<br />
Bedeutung viele Projekte auf dieses Problem fixiert und Lösungsansätze wie etwa die<br />
Linguistic Annotation Language, die in 3.2.1 vorgestellt wird, entworfen.<br />
2.4.2. Komposita<br />
Ebenfalls ein für MÜ-<strong>Systeme</strong> wichtiges Problem in vielen Sprachen sind Komposita,<br />
insbesondere ihre Zerlegung, wenn es in der Zielsprache kein passendes Wort oder kei-<br />
18