26.11.2012 Aufrufe

Jahresbericht informatik 2009 - KIT – Fakultät für Informatik

Jahresbericht informatik 2009 - KIT – Fakultät für Informatik

Jahresbericht informatik 2009 - KIT – Fakultät für Informatik

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Die Institute der <strong>Fakultät</strong> und ihre Forschungsvorhaben<br />

Simultane Sprach-zu-Sprachübersetzung<br />

(T. Herrmann, F. Kraft, J. Niehues, C. Saam, S. Stüker)<br />

Konferenzen in den USA, Dienstreisen nach China, Verhandlungen mit Japan <strong>–</strong> <strong>für</strong> viele<br />

Menschen gehören solche Situationen heute zum Alltag. Je mehr die Welt zusammenwächst,<br />

umso mehr erfordert sie eine Kommunikation über verschiedene Sprachen hinweg.<br />

Beispielsweise möchten Studierende oder Konferenzbesucher fremdsprachige Vorträge<br />

oder Gespräche verstehen, ohne die Sprache selber zu beherrschen. Aus diesem Grund<br />

arbeiten Forscher am Lehrstuhl von Prof. Alexander Waibel an der simultanen Sprach-zu-<br />

Sprachübersetzung von Vorträgen und Reden. In diesem Jahr lag der<br />

Entwicklungsschwerpunkt auf der Verbesserung der Grundtechniken. Zusätzlich haben wir<br />

an der Erweiterung der Benutzerschnittstelle und der Darstellungskomponenten gearbeitet.<br />

Das Übersetzungssystem verwendet statistische Übersetzungsmodelle anstelle von handgeschriebenen<br />

Grammatiken, die den Vorteil bieten, dass sie mit Hilfe von übersetzten<br />

Dokumenten trainiert werden können. Hierzu werden die Modelle mit Dokumenten der<br />

Europäischen Union und der Vereinten Nationen initialisiert und mit einer kleineren Menge<br />

von übersetzten Vorträgen anschließend auf die Zieldomäne adaptiert. Zusätzlich dazu wird<br />

versucht, automatisch nach weiteren passenden Daten im Internet zu suchen, sodass nötige<br />

Vokabeln und Redewendungen hinreichend oft in verschiedenen Kontexten in den<br />

Trainingsdaten vorhanden sind, um die Modelle robust schätzen zu können. Der letzte<br />

Schritt wird sowohl <strong>für</strong> die Sprachübersetzung als auch <strong>für</strong> die Spracherkennung zur<br />

Sprachmodelladaption durchgeführt.<br />

Neben der Adaption wird auch daran gearbeitet, die Latenz des Simultanübersetzers so<br />

gering wie möglich zu halten. Die Latenz menschlicher Interpreter bewegt sich etwa im<br />

Bereich von ein paar Sekunden, wobei menschliche Interpreter relativ einfach ihre<br />

Sprechgeschwindigkeit variieren können oder das Gesagte durch z.B. Weglassen von weniger<br />

wichtigen Nebenphrasen zusammenfassen können. Beides stellt <strong>für</strong> ein automatisches<br />

System durchaus ein Problem dar, da zum einen die verwendeten Sprachsynthesesysteme<br />

schwerer zu verstehen sind und zum anderen jedes erkannte Wort auch übersetzt werden<br />

muss. Hinzu kommen noch die Fehler, die automatische Spracherkennungs- und Übersetzungssysteme<br />

machen. Jedoch können zukünftige automatische Systeme in manchen<br />

Bereichen menschlichen Interpretern sogar überlegen sein. So besitzen sie z.B. ein unbegrenztes<br />

Gedächtnis und verlieren selbst bei schnellen Sprechern oder komplizierten<br />

Satzstrukturen nicht den Faden. Ferner können sie relativ kostengünstig wiederverwendet<br />

werden, sofern sie sich einmal auf den Sprecher, dessen Vortragsthemen und Sprachstil<br />

adaptiert haben.<br />

264

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!