Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
2. Stand der Technik<br />
Sprache optimiert werden. Allerdings müssen bei n Sprachen insgesamt (n 2 − n) Transfermodule<br />
erstellt werden, um <strong>von</strong> jeder Sprache in jede andere übersetzen zu können.<br />
Außerdem werden noch jeweils n Module zur Erzeugung der Zwischendarstellung und des<br />
Zieltextes benötigt. Abbildung 2.2 zeigt den Ablauf dieses Schemas.<br />
Abbildung 2.2.: Schema für Transferübersetzung<br />
2.3.3. Zwischensprache<br />
So genannte Interlingua-<strong>Systeme</strong> (lat. interlingua: Zwischensprache) erzeugen ebenfalls<br />
aus einem Ausgangstext eine Zwischendarstellung. Diese ist allerdings sprachunabhängig.<br />
So wird bei n Sprachen immer nur eine Zwischendarstellung benötigt, was den Programmieraufwand<br />
im Vergleich zu einem Transfersystem drastisch senkt. Hinzu kommen noch<br />
je n Module zur Erzeugung der Zwischendarstellung aus der Ausgangssprache und der<br />
Zielsprache aus der Zwischendarstellung. Abbildung 2.3 beschreibt den Ansatz grafisch.<br />
Das Problem bei diesem Ansatz ist die sprachunabhängige Zwischendarstellung. Bisher<br />
ist es noch nicht gelungen, eine wirklich allgemeingültige Interlingua zu erstellen. Deshalb<br />
wird trotz des höheren Aufwands der Transferansatz auch bei multilingualen MÜ-<br />
<strong>Systeme</strong>n vorgezogen.<br />
Abbildung 2.3.: Schema für Interlingua-Übersetzung<br />
2.3.4. Statistische MÜ<br />
Statistische MÜ kommt im Gegensatz zu den obigen Ansätzen ohne vorgefertigte Grammatik<br />
aus. Vielmehr werden alle benötigten Informationen wie Worthäufigkeiten, Grammatikregeln<br />
usw. mit Methoden zur Informationsgewinnung aus großen bi- und multilingualen<br />
Textkorpora für die beteiligten Sprachen extrahiert.<br />
Im Zentrum bei der Übersetzung eines Textes steht dann die Berechnung der Wahrscheinlichkeit,<br />
dass ein bestimmter Satz in der Ausgangssprache auf einen bestimmten Satz in<br />
der Zielsprache abgebildet werden kann. Zunächst wird dazu die Wahrscheinlichkeit P (A)<br />
des Auftretens des Ausgangssatzes A berechnet und anschließend die bedingte Wahrscheinlichkeit<br />
P (Z|A), dass Zielsatz Z auftritt, wenn A vorliegt. Beide Wahrscheinlichkeiten<br />
werden miteinander zu P (A) · P (Z|A) verknüpft. Diese Prozedur wird für zahlreiche<br />
mögliche Zielsätze durchgeführt, wobei am Ende derjenige gewählt wird, der die größte<br />
16