AUTOMATISCHE SPRACHERKENNUNG
AUTOMATISCHE SPRACHERKENNUNG
AUTOMATISCHE SPRACHERKENNUNG
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Gliederung Motivation Sprachverstehen Taxonomie Schwierigkeiten Gestern & Heute Systemaufbau Zur Vorlesung<br />
Methodische Entwicklung<br />
DARPA SUR<br />
DARPA Speech & Natural Language<br />
• HARPY<br />
• SPHINX<br />
• digitale Filterung<br />
• IBM Tangora<br />
• HMM zur Spracherkennung • Triphone<br />
• Lineare Vorhersage • stochastische N-Gramme<br />
• mel-Cepstrum<br />
• Sprecherverifikation•<br />
Verbundworterkennung<br />
• n beste Wortketten<br />
• Baum-Welch-Algorithmus<br />
• LBG-Algorithmus • TDNN<br />
• schnelle DFT<br />
• Sprachsynthese vom Text • Phonotopische Karte<br />
• LPC-Metrik<br />
• backpropagation-Algorithmus<br />
• DTW-Einzelworterkenner<br />
• Mikrofonfelder<br />
• Dynamische Zeitverzerrung (DTW) • Signalprozessoren<br />
1970 1980 1990<br />
Gliederung Motivation Sprachverstehen Taxonomie Schwierigkeiten Gestern & Heute Systemaufbau Zur Vorlesung<br />
Extrempositionen<br />
” Flugzeuge schlagen nicht mit den Flügeln.“ F. Jelinek<br />
” Each time I fired a phonetician, recognition rate increased<br />
by 3%“ F. Jelinek<br />
” With friends like statistics — who needs linguistics?“ H. Ney<br />
” Die KI in der Spracherkennung hat uns 10 Jahre gekostet!“<br />
J. Mariani<br />
” We leave it to the computer to learn what we have failed to<br />
understand. It might do the job but can it tell us how?“G. Fant<br />
” What magical trick makes us intelligent? The trick is that<br />
there is no trick.“ J. Allen<br />
Gliederung Motivation Sprachverstehen Taxonomie Schwierigkeiten Gestern & Heute Systemaufbau Zur Vorlesung<br />
Paradigmenstreit<br />
” ... breaking the speech code<br />
by the knowledge-based approach?“<br />
Künstliche Intelligenz Neuerer Konnektionismus<br />
Symbolverarbeitungsparadigma Subsymbolischer Ansatz<br />
Funktionsmodell Performanzmodell<br />
Perzeptionsforschung Sprachtechnologie<br />
lokale Repräsentation verteilte Repräsentation<br />
festverdrahtet selbstorganisierend<br />
wissensbasiert “black box”<br />
Wissensakquisition Lernen, Adaption<br />
regelbasiert parametrisch<br />
Linguistik Statistik<br />
Humanwissenschaften Ingenieurwissenschaften<br />
” ... training the computer to learn the task<br />
by statistical inference?“<br />
Gliederung Motivation Sprachverstehen Taxonomie Schwierigkeiten Gestern & Heute Systemaufbau Zur Vorlesung<br />
Stand der Technik<br />
◮ es gibt kommerzielle Systeme für die Erkennung isoliert<br />
gesprochener Wörter<br />
10 bis wenige 100 Wörter<br />
mit kurzer Anpassungsphase oder sprecherunabhängig<br />
in ruhiger Umgebung oder robust gegen Fremdschall<br />
◮ es gibt kommerzielle Diktiermaschinen<br />
≥ 20 000 Wörter · sprecherabhängig · isolierte Wörter<br />
◮ es gibt Laborsysteme, die kontinuierlich gesprochene Sprache<br />
verstehen und eine sinnvolle Reaktion geben<br />
1000 oder mehr Wörter<br />
mit restriktivem Sprachmodell (Perplexität < 100)<br />
bei sehr guter Sprachqualität<br />
◮ es gelten einschneidende Beschränkungen hinsichtlich<br />
Wortschatz · Syntax · Dialekt · Problemkreis