26.11.2012 Aufrufe

Jahresbericht informatik 2009 - KIT – Fakultät für Informatik

Jahresbericht informatik 2009 - KIT – Fakultät für Informatik

Jahresbericht informatik 2009 - KIT – Fakultät für Informatik

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Institut <strong>für</strong> Anthropomatik<br />

Geschwindigkeitsverbesserungen <strong>für</strong> die Verwendung von hybriden Sprachmodellen erzielt<br />

werden.<br />

Statistische Verfahren zur maschinellen Übersetzung<br />

(T. Herrmann, M. Mediani, J. Niehues)<br />

Da wirtschaftlicher und kultureller Austausch immer öfter über Ländergrenzen hinweg stattfindet<br />

und verschiedensprachige Partner umfasst, kommt der Übersetzung in der Zeit der<br />

weltweiten Globalisierung eine Schlüsselrolle zu. Ein Beispiel hier<strong>für</strong> ist die erweiterte<br />

Europäische Union, bei der Übersetzungsaufgaben speziell <strong>für</strong> wirtschaftliche<br />

Zusammenarbeit und Verwaltungsstrukturen ein sowohl finanzielles, als auch verwaltungstechnisch<br />

hohes Ausmaß angenommen haben.<br />

In Anbetracht der Verfügbarkeit, Kosten und Zeitkriterien kann ein maschinelles Übersetzungssystem<br />

in manchen Bereichen eine Alternative zum menschlichen Übersetzer sein.<br />

Datengetriebene Ansätze, die aus parallelen Texten ihre Übersetzungsmodelle generieren,<br />

sind besonders geeignet, schnell an neue Sprachen und neue Domänen angepasst zu werden.<br />

Für die automatische Übersetzung von Nachrichtentexten, aber auch von gesprochener<br />

Sprache wie Parlamentsdebatten, Nachrichtensendungen und Vorlesungen, wurden unsere<br />

bestehenden Übersetzungssysteme weiterentwickelt und um neue Sprachpaare erweitert.<br />

Im Rahmen des internationalen Workshop on Statistical Machine Translation erreichten<br />

diese Systeme sehr gute Ergebnisse. Ein neues Verfahren zum diskriminativen Training statistischer<br />

Wortalignmentmodelle verwendet zusätzliche, u.a. linguistische, Merkmale und<br />

kann Modelle anhand einer kleinen Menge von handannotierten Daten direkt auf die<br />

Alignmentfehlerrate hin optimieren. Für die Modellierung von langreichweitigen<br />

Wortumstellungen, die ein schwieriges Problem in der automatischen Übersetzung darstellen,<br />

wurde an Verfahren gearbeitet, die zusätzliche linguistische Merkmale verwenden.<br />

Gesprochene Nachrichtensendungen und Parlamentsdebatten enthalten überwiegend gut<br />

vorbereitete oder gelesene Sprache. Daneben wurde auch an der Übersetzung von stärker<br />

spontaner Sprache gearbeitet, wie sie beispielsweise in freien Vorträgen, Vorlesungen,<br />

Meetings und Konferenzen vorkommt. Der Prototyp eines automatischen<br />

Vortragsübersetzungssystems <strong>für</strong> technische Vorträge und Vorlesungen wurde weiterentwickelt,<br />

zum einen im Hinblick auf eine bessere Adaption auf die Domäne, die in der Regel<br />

im Voraus bekannt ist, und zum anderen mit dem Ziel, einer <strong>für</strong> das Übersetzungssystem<br />

optimierten selbstständigen Segmentierung des Eingangs-Wortstroms. Hierbei ist das Ziel,<br />

die Latenz des Gesamtsystems möglichst gering zu halten und gleichzeitig einen ausreichend<br />

langen Kontext <strong>für</strong> die Übersetzungskomponente bereitzustellen, um die Übersetzungsqualität<br />

insbesondere <strong>für</strong> Sprachpaare sicherzustellen, die langreichweitige<br />

Wortumstellungen erfordern.<br />

263<br />

3

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!