Informationsverarbeitung I Grundlagen
Informationsverarbeitung I Grundlagen
Informationsverarbeitung I Grundlagen
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
1.1.4. Akustische Eingabe<br />
Die Verarbeitung von Audioinformationen ähnelt jener von Bildinformationen. Diese<br />
Aufgabe übernimmt in der Regel ein eigener „Soundchip“ eines Computers, wobei bei der<br />
Eingabe die analoge Information in digitale umgewandelt wird und bei der Ausgabe eine<br />
Rückumwandlung stattfindet. Schwerpunkt der Audioeingabe ist die Spracheingabe.<br />
1.1.4.1. Akustische Eingabe<br />
Die Verarbeitung von Audioinformationen ähnelt jener von Bildinformationen. Diese<br />
Aufgabe übernimmt in der Regel ein eigener „Soundchip“ eines Computers, wobei bei der<br />
Eingabe die analoge Information in digitale umgewandelt wird und bei der Ausgabe eine<br />
Rückumwandlung stattfindet. Schwerpunkt der Audioeingabe ist die Spracheingabe. Der<br />
Mensch wertet gesprochene Sprache auf mehreren Ebenen aus, wie Sprachsignal, Wort, Satz,<br />
Tonfall, Tonhöhe usw.; sehr viele für das Verstehen nicht unmittelbar notwendige<br />
Informationen werden dabei mitgeliefert. Für die maschinelle Bearbeitung erweisen sich diese<br />
(für unser Ohr vertrauten) Besonderheiten der natürlich gesprochenen Sprache als Probleme<br />
bei der weiteren Bearbeitung.<br />
Die Bearbeitung von natürlich gesprochener Sprache teilt sich in zwei Teilgebiete:<br />
• Spracherkennung: Dabei soll festgestellt werden, was gesprochen wurde. Bestimmte<br />
Muster müssen durch Vergleich erkannt und verarbeitet werden. Dazu gibt es Systeme<br />
zum Erkennen isoliert gesprochener Worte (Einzelworterkennung) und zum Erkennen<br />
fließender Rede. Systeme zur Sprachanalyse und zum Sprachverstehen, die<br />
analysieren und Schlüsse ziehen, worüber gesprochen wurde, zählen zum Bereich der<br />
Künstlichen Intelligenz.<br />
• Sprechererkennung: Dabei geht es um die Ermittlung, wer gesprochen hat. Anhand<br />
des Klangbildes der Sprache (das einzigartig wie der Fingerabdruck eines Menschen<br />
ist) wird überprüft, wer der Sprecher ist. Eingesetzt wird die Sprecherverifikation für<br />
Zugangskontrollen bei Banken, Rechenzentren usw.<br />
Mit der immer größeren Rechenleistung moderner PC-Systeme steigen auch die Trefferraten<br />
bei der Spracherkennung. Dennoch soll der Sprecher die Wörter langsam und exakt<br />
aussprechen. Nach einer Trainingsphase erreichen die Systeme mittlerweile schon sehr hohe<br />
Trefferraten. Das Erkennen von fließend gesprochener Sprache, unabhängig vom Sprecher, ist<br />
derzeit auf PCs jedoch noch nicht zu 100% realisierbar.<br />
Durch die Verwendung von natürlich gesprochener Sprache wird der Eingabevorgang<br />
beschleunigt, die Einarbeitungszeit verkürzt sich, die Hände werden zur Eingabe nicht<br />
benötigt, wodurch sich die Bewegungsfreiheit erhöht. Eingesetzt werden<br />
Spracheingabesysteme beispielsweise bei der Post zur Paketumleitung oder für die<br />
16