Messung maschinellerÂ¨Ubersetzbarkeit von ... - Parallele Systeme

Weitere Magazine

Empfehlungen

Info

2. Stand der Technik Sprache optimiert werden. Allerdings müssen bei n Sprachen insgesamt (n 2 − n) Transfermodule erstellt werden, um von jeder Sprache in jede andere übersetzen zu können. Außerdem werden noch jeweils n Module zur Erzeugung der Zwischendarstellung und des Zieltextes benötigt. Abbildung 2.2 zeigt den Ablauf dieses Schemas. Abbildung 2.2.: Schema für Transferübersetzung 2.3.3. Zwischensprache So genannte Interlingua-Systeme (lat. interlingua: Zwischensprache) erzeugen ebenfalls aus einem Ausgangstext eine Zwischendarstellung. Diese ist allerdings sprachunabhängig. So wird bei n Sprachen immer nur eine Zwischendarstellung benötigt, was den Programmieraufwand im Vergleich zu einem Transfersystem drastisch senkt. Hinzu kommen noch je n Module zur Erzeugung der Zwischendarstellung aus der Ausgangssprache und der Zielsprache aus der Zwischendarstellung. Abbildung 2.3 beschreibt den Ansatz grafisch. Das Problem bei diesem Ansatz ist die sprachunabhängige Zwischendarstellung. Bisher ist es noch nicht gelungen, eine wirklich allgemeingültige Interlingua zu erstellen. Deshalb wird trotz des höheren Aufwands der Transferansatz auch bei multilingualen MÜ- Systemen vorgezogen. Abbildung 2.3.: Schema für Interlingua-Übersetzung 2.3.4. Statistische MÜ Statistische MÜ kommt im Gegensatz zu den obigen Ansätzen ohne vorgefertigte Grammatik aus. Vielmehr werden alle benötigten Informationen wie Worthäufigkeiten, Grammatikregeln usw. mit Methoden zur Informationsgewinnung aus großen bi- und multilingualen Textkorpora für die beteiligten Sprachen extrahiert. Im Zentrum bei der Übersetzung eines Textes steht dann die Berechnung der Wahrscheinlichkeit, dass ein bestimmter Satz in der Ausgangssprache auf einen bestimmten Satz in der Zielsprache abgebildet werden kann. Zunächst wird dazu die Wahrscheinlichkeit P (A) des Auftretens des Ausgangssatzes A berechnet und anschließend die bedingte Wahrscheinlichkeit P (Z|A), dass Zielsatz Z auftritt, wenn A vorliegt. Beide Wahrscheinlichkeiten werden miteinander zu P (A) · P (Z|A) verknüpft. Diese Prozedur wird für zahlreiche mögliche Zielsätze durchgeführt, wobei am Ende derjenige gewählt wird, der die größte 16
2.4. Offene Probleme Wahrscheinlichkeit liefert. In der Praxis werden meist noch weitere Parameter hinzugefügt, um die Ergebnisse zu verbessern. Das Hauptproblem hierbei ist, dass große und vor allem in geeigneter Weise (z. B. durch Zuordnung von Sätzen in Ausgangs- und Zielsprache) aufbereitete Textkorpora relativ selten sind. Dafür erspart man sich die manuelle Erstellung komplizierter Grammatikregeln. Abbildung 2.4.: Schema für statistische Übersetzung 2.3.5. Beispielbasierte MÜ Im Gegensatz zur statistischen Übersetzungsmethode ist die beispielbasierte MÜ wieder ein regelbasiertes Verfahren, das jedoch nicht wie die ersten drei Verfahren versucht, möglichst allgemeine Grammatikregeln abzubilden. Vielmehr ist der Hauptbestandteil des Systems wie bei statistischer MÜ ein bi- oder multilinguales Textkorpus, aus dem mittels einander zugeordneter Sätze oder Phrasen zahlreiche Übersetzungsvorlagen für die jeweiligen Sprachen gewonnen werden. Diese lassen sich über mit Bedingungen versehene Regeln repräsentieren. Eine solche Bedingung könnte etwa sein, dass Zug mit train ins Englische übersetzt wird, wenn im Beispiel auch das Wort Schiene vorkommt, aber mit drag, wenn von einer Zigarette die Rede ist. Da es allerdings unmöglich ist, auf diese Weise die gesamte Sprache abzudecken, müssen Sätze in der Ausgangssprache daraufhin analysiert werden, welchem Übersetzungsbeispiel sie am ehesten ähneln. Bei fehlenden Vokabeln ist es auch möglich, ähnliche Beispiele wie Schablonen zu benutzen und Wörter einzusetzen. Abbildung 2.5.: Schema für beispielbasierte Übersetzung 2.4. Offene Probleme Wie das einführende Beispiel zeigte, bestehen trotz ausgefeilter Übersetzungstechniken immer noch starke Defizite, die komplett fehlerfreie und in vielen Fällen selbst annehmbare Übersetzungen verhindern. Im folgenden werden einige wichtige ungelöste Probleme vorgestellt, die im weiteren Verlauf dieser Arbeit in ihrer Auswirkung auf die Übersetzungsqualität betrachtet werden. Dabei gibt es sowohl allgemeingültige Probleme als auch sprachspezifische. 17
Seite 1: Messung maschineller Übersetzbarke
Seite 4 und 5: Inhaltsverzeichnis Tabellenverzeich
Seite 6 und 7: Inhaltsverzeichnis 7.4.3. Modellier
Seite 8 und 9: Abbildungsverzeichnis 2.1. Schema f
Seite 10 und 11: Teil I. Einführung 10
Seite 12 und 13: 1. Grundlagen der Arbeit Motivation
Seite 14 und 15: 2. Stand der Technik In den folgend
Seite 18 und 19: 2. Stand der Technik 2.4.1. Mehrdeu
Seite 20 und 21: 2. Stand der Technik Abgesehen von
Seite 22 und 23: 3. Ansätze zur Lösung der Überse
Seite 28 und 29: Teil II. Ein Modell zur Einschätzu
Seite 30 und 31: 4. Vorbereitende Maßnahmen auf fol
Seite 32 und 33: 4. Vorbereitende Maßnahmen der Unt
Seite 34 und 35: 4. Vorbereitende Maßnahmen überse
Seite 36 und 37: 4. Vorbereitende Maßnahmen Zusätz
Seite 38 und 39: 5. Untersuchung der Textmerkmale au
Seite 66 und 67:
6. Zusammenführung der Kriterien i
Seite 68 und 69:
Seite 70 und 71:
Seite 72 und 73:
Teil III. MT Analyser: Automatische
Seite 74 und 75:
7. Modellierung von MT Analyser Ins
Seite 76 und 77:
7. Modellierung von MT Analyser auf
Seite 78 und 79:
7. Modellierung von MT Analyser Sat
Seite 80 und 81:
7. Modellierung von MT Analyser Dar
Seite 82 und 83:
7. Modellierung von MT Analyser fin
Seite 84 und 85:
7. Modellierung von MT Analyser Kla
Seite 86 und 87:
8. Implementierung von MT Analyser
Seite 88 und 89:
Seite 90 und 91:
Seite 92 und 93:
Seite 94 und 95:
Seite 96 und 97:
Seite 98 und 99:
Seite 100 und 101:
Seite 102 und 103:
Seite 104 und 105:
Seite 106 und 107:
Seite 108 und 109:
Seite 110 und 111:
Seite 112 und 113:
Seite 114 und 115:
Seite 116 und 117:
9. Zusammenfassung der Ergebnisse D
Seite 118 und 119:
10. Ansätze zur Weiterentwicklung
Seite 120 und 121:
GLOSSAR E EG-Kommission Vorläufer
Seite 122 und 123:
GLOSSAR S Signifikanzniveau Grenzwe
Seite 124 und 125:
Stichwortverzeichnis Lexikon, 13, 2
Seite 126 und 127:
Stichwortverzeichnis Übersetzungsp
Seite 128 und 129:
Literaturverzeichnis [Gda94] [Hoe04
Seite 130:
Literaturverzeichnis [Wag03] [Wat03
Alle anzeigen

Messung maschinellerÂ¨Ubersetzbarkeit von ... - Parallele Systeme

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?