27.10.2014 Aufrufe

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

Messung maschineller¨Ubersetzbarkeit von ... - Parallele Systeme

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

2. Stand der Technik<br />

Sprache optimiert werden. Allerdings müssen bei n Sprachen insgesamt (n 2 − n) Transfermodule<br />

erstellt werden, um <strong>von</strong> jeder Sprache in jede andere übersetzen zu können.<br />

Außerdem werden noch jeweils n Module zur Erzeugung der Zwischendarstellung und des<br />

Zieltextes benötigt. Abbildung 2.2 zeigt den Ablauf dieses Schemas.<br />

Abbildung 2.2.: Schema für Transferübersetzung<br />

2.3.3. Zwischensprache<br />

So genannte Interlingua-<strong>Systeme</strong> (lat. interlingua: Zwischensprache) erzeugen ebenfalls<br />

aus einem Ausgangstext eine Zwischendarstellung. Diese ist allerdings sprachunabhängig.<br />

So wird bei n Sprachen immer nur eine Zwischendarstellung benötigt, was den Programmieraufwand<br />

im Vergleich zu einem Transfersystem drastisch senkt. Hinzu kommen noch<br />

je n Module zur Erzeugung der Zwischendarstellung aus der Ausgangssprache und der<br />

Zielsprache aus der Zwischendarstellung. Abbildung 2.3 beschreibt den Ansatz grafisch.<br />

Das Problem bei diesem Ansatz ist die sprachunabhängige Zwischendarstellung. Bisher<br />

ist es noch nicht gelungen, eine wirklich allgemeingültige Interlingua zu erstellen. Deshalb<br />

wird trotz des höheren Aufwands der Transferansatz auch bei multilingualen MÜ-<br />

<strong>Systeme</strong>n vorgezogen.<br />

Abbildung 2.3.: Schema für Interlingua-Übersetzung<br />

2.3.4. Statistische MÜ<br />

Statistische MÜ kommt im Gegensatz zu den obigen Ansätzen ohne vorgefertigte Grammatik<br />

aus. Vielmehr werden alle benötigten Informationen wie Worthäufigkeiten, Grammatikregeln<br />

usw. mit Methoden zur Informationsgewinnung aus großen bi- und multilingualen<br />

Textkorpora für die beteiligten Sprachen extrahiert.<br />

Im Zentrum bei der Übersetzung eines Textes steht dann die Berechnung der Wahrscheinlichkeit,<br />

dass ein bestimmter Satz in der Ausgangssprache auf einen bestimmten Satz in<br />

der Zielsprache abgebildet werden kann. Zunächst wird dazu die Wahrscheinlichkeit P (A)<br />

des Auftretens des Ausgangssatzes A berechnet und anschließend die bedingte Wahrscheinlichkeit<br />

P (Z|A), dass Zielsatz Z auftritt, wenn A vorliegt. Beide Wahrscheinlichkeiten<br />

werden miteinander zu P (A) · P (Z|A) verknüpft. Diese Prozedur wird für zahlreiche<br />

mögliche Zielsätze durchgeführt, wobei am Ende derjenige gewählt wird, der die größte<br />

16

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!