18.11.2012 Aufrufe

AUTOMATISCHE SPRACHERKENNUNG

AUTOMATISCHE SPRACHERKENNUNG

AUTOMATISCHE SPRACHERKENNUNG

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Gliederung Motivation Sprachverstehen Taxonomie Schwierigkeiten Gestern & Heute Systemaufbau Zur Vorlesung<br />

Methodische Entwicklung<br />

DARPA SUR<br />

DARPA Speech & Natural Language<br />

• HARPY<br />

• SPHINX<br />

• digitale Filterung<br />

• IBM Tangora<br />

• HMM zur Spracherkennung • Triphone<br />

• Lineare Vorhersage • stochastische N-Gramme<br />

• mel-Cepstrum<br />

• Sprecherverifikation•<br />

Verbundworterkennung<br />

• n beste Wortketten<br />

• Baum-Welch-Algorithmus<br />

• LBG-Algorithmus • TDNN<br />

• schnelle DFT<br />

• Sprachsynthese vom Text • Phonotopische Karte<br />

• LPC-Metrik<br />

• backpropagation-Algorithmus<br />

• DTW-Einzelworterkenner<br />

• Mikrofonfelder<br />

• Dynamische Zeitverzerrung (DTW) • Signalprozessoren<br />

1970 1980 1990<br />

Gliederung Motivation Sprachverstehen Taxonomie Schwierigkeiten Gestern & Heute Systemaufbau Zur Vorlesung<br />

Extrempositionen<br />

” Flugzeuge schlagen nicht mit den Flügeln.“ F. Jelinek<br />

” Each time I fired a phonetician, recognition rate increased<br />

by 3%“ F. Jelinek<br />

” With friends like statistics — who needs linguistics?“ H. Ney<br />

” Die KI in der Spracherkennung hat uns 10 Jahre gekostet!“<br />

J. Mariani<br />

” We leave it to the computer to learn what we have failed to<br />

understand. It might do the job but can it tell us how?“G. Fant<br />

” What magical trick makes us intelligent? The trick is that<br />

there is no trick.“ J. Allen<br />

Gliederung Motivation Sprachverstehen Taxonomie Schwierigkeiten Gestern & Heute Systemaufbau Zur Vorlesung<br />

Paradigmenstreit<br />

” ... breaking the speech code<br />

by the knowledge-based approach?“<br />

Künstliche Intelligenz Neuerer Konnektionismus<br />

Symbolverarbeitungsparadigma Subsymbolischer Ansatz<br />

Funktionsmodell Performanzmodell<br />

Perzeptionsforschung Sprachtechnologie<br />

lokale Repräsentation verteilte Repräsentation<br />

festverdrahtet selbstorganisierend<br />

wissensbasiert “black box”<br />

Wissensakquisition Lernen, Adaption<br />

regelbasiert parametrisch<br />

Linguistik Statistik<br />

Humanwissenschaften Ingenieurwissenschaften<br />

” ... training the computer to learn the task<br />

by statistical inference?“<br />

Gliederung Motivation Sprachverstehen Taxonomie Schwierigkeiten Gestern & Heute Systemaufbau Zur Vorlesung<br />

Stand der Technik<br />

◮ es gibt kommerzielle Systeme für die Erkennung isoliert<br />

gesprochener Wörter<br />

10 bis wenige 100 Wörter<br />

mit kurzer Anpassungsphase oder sprecherunabhängig<br />

in ruhiger Umgebung oder robust gegen Fremdschall<br />

◮ es gibt kommerzielle Diktiermaschinen<br />

≥ 20 000 Wörter · sprecherabhängig · isolierte Wörter<br />

◮ es gibt Laborsysteme, die kontinuierlich gesprochene Sprache<br />

verstehen und eine sinnvolle Reaktion geben<br />

1000 oder mehr Wörter<br />

mit restriktivem Sprachmodell (Perplexität < 100)<br />

bei sehr guter Sprachqualität<br />

◮ es gelten einschneidende Beschränkungen hinsichtlich<br />

Wortschatz · Syntax · Dialekt · Problemkreis

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!