Entwicklung einer Automatenbedienung mit einer leistungsfähigen ...

Weitere Magazine

Empfehlungen

Info

Hier könnte man auf die Idee kommen, AudioManager im asrLib- Projekt global zu deklarieren, damit alle Komponente ihn bei Bedarf verwenden können, ohne diese aufwendige Übergabe machen zu müssen. Es kann aber vorkommen, dass man die Daten über Mikrofon mit 8 kHz aufnehmen möchte, dabei aber nur die 16 kHz- Daten für die Ausgabe über die Lautsprecher zur Verfügung hat. In diesem Fall müssen mindestens zwei AudioManager erstellt werden, einen für die Aufnahme und einen für die Ausgabe. Bei dem Start von jedem Dialogsystem wird StateMachine erstellt und initialisiert, dabei wird eine Schnittstelle für die Audioausgabe über die Lautsprecher in der Action „INIT“ (ist in der Funktion „StateMachine::initialize()“ festgelegt, unter „src/StateMachine/StateMachine.cpp“, muss also in der Konfigurationsdatei nicht extra angegeben werden) als Property „SOUNDCARD_FRONTEND“ an StateMachine automatisch angehängt. AudioManager bekommt hier Standardeinstellungen (Frequenz 8000, Datentyp INT16, Abtastwerte 200). Man kann diese Einstellungen jede Zeit in der Konfigurationsdatei mit „INIT“ ändern. „ISDN_FRONTEND“ hat eine höhere Priorität, „SOUNDCARD_FRONTEND“ wird erst dann für die Audioausgabe verwendet, wenn die erste Komponente nicht vorhanden ist. Es ist schon klar, dass man zwei unterschiedliche AudioManager für die Aufnahme und Audioausgabe verwenden soll. Ein weiteres Problem tritt auf, wenn man zwei, oder noch schlimmer, mehrere, Spracherkenner mit Modellen mit unterschiedlichen Frequenzen bei einer parallelen Erkennung einsetzen möchte. Die Lösung ist, bei jedem Spracherkennungssystem ein eigenes „SOUNDCARD_FRONTEND“ mit eigenem AudioManager zu erstellen. Dabei wird es als Property mit dem Namen „AudioFrontend“ (für die bessere Unterscheidung) dem Spracherkennungssystem zugewiesen und nicht mehr der StateMachine. Alle Bedingungen bleiben erhalten. Eine weitere wichtige Einstellung für AudioManager ist der Zeitintervall für einen iterativen „Wecker“, der wie folgt gesetzt wird („* 1000.0“ für Millisekunden): audioManager->setTimeStep((float)frameSize / (float)sampleRate * 1000.0); Bei einem Verhältnis der Anzahl der Abtastwerte zur Frequenz von 1 zu 40 (200/8000) wird die Funktion „ASRApplication::onTimer()“ unter „src/ASR/ASRApplication.cpp“ alle 25 ms von diesem Wecker aufgerufen. Der Wecker wird zusammen mit dem Spracherkennungssystem gestartet und gestoppt. Das ist ein selbständiger Prozess, der mit Hilfe von POCO ausgeführt wird und parallel zum Dialogsystem läuft. Die von Seite 35
diesem Prozess angesprochene Funktion muss komplett abgearbeitet werden, bevor sie wieder vom Wecker aufgerufen werden kann, auch wenn die Bearbeitungszeit länger als 25 ms dauert. Das muss man bei der Programmierung beachten. Diese Funktion führt eine andere, abstrakte Funktion „tick()“ aus, die in einer abgeleiteten Klasse (in diesem Fall „ApplicationHGH“) erstellt werden soll und den ganzen Prozess der Spracherkennung beschreiben soll. Aber bevor ein Spracherkenner startet, soll sein vorher initialisiertes „AudioFrontend“ gestartet werden, bei dem ein zweites Wecker genauso als paralleler Prozess in Funktion tritt. Diesmal ist der Wecker die Soundkarte des Rechners, oder ihr Treiber, der von dem externen Tool „portaudio“ zur Verfügung gestellt wird. Jedes Mal, wenn der für die aufgenommenen Daten reservierte Platz voll ist, wird die Funktion „SoundcardFrontend::paCallbackFun()“ unter „src/Audio/SoundcardFrontend.cpp“ in Gang gesetzt. Bei 8 kHz und 200 Werten ist das ein Zeitintervall in genau 25 ms. Um besser zu verstehen, wozu diese zwei „Wecker“ benötigt werden, sollte man die Abbildung 16 ansehen. Die im AudioManager registrierte Komponente kann z.B. DC- Filter sein. In diesem Fall werden die aufgenommenen Daten von „SoundcardFrontend“ direkt an „DCBlocker“ übergeben und dieser stellt dann die von ihm bearbeiteten Daten als Signalabschnitte zur Verfügung. alle 25 ms alle 25 ms SoundcardFrontend:: paCallbackFun() ASRApplication:: onTimer() ApplicationHGH:: tick() Alle Komponenten des Spracherkennungssystems AnalyzerHGH::analyze() NoiseEstimator::estimate() [ AdaptionHGH::adapt() ] RecognizerHGH::process() 0 1 2 3 4 5 6 ... Signalabschnitte Abtastwerte 0 1 2 3 4 5 Merkmalsvektoren AudioManager:: tickCb() Für alle im AudioManager registrierten Komponenten: tick() BufferedIOAdaptor::tick() [ DCBlocker::tick() ] ... Abbildung 16: Ablaufplan einer Spracherkennung Seite 36
Seite 1 und 2: Entwicklung einer Automatenbedienun
Seite 3 und 4: Ich versichere an Eides Statt durch
Seite 5 und 6: Abbildungsverzeichnis Abbildung 1:
Seite 7 und 8: 2. Einleitung Diese Einleitung zur
Seite 9 und 10: 3.1.2. Sprachbasiert Nach den graph
Seite 11 und 12: 3.2. Spracherkennung Die Spracherke
Seite 13 und 14: 3.2.2. Analyse Die Analyse (oder Ku
Seite 15 und 16: 4. Betriebsmittel, Software openSUS
Seite 17 und 18: Abbildung 7: "Hello, World!" mit FL
Seite 19 und 20: 4.2. POCO POCO ist eine Sammlung vo
Seite 21 und 22: 4.3. Hilfsmittel Um die Makefiles z
Seite 23 und 24: 5.1. asrLib und CMake Um die mühsa
Seite 25 und 26: Symbolleiste mit den Werkzeugen zum
Seite 27 und 28: Die Bibliothek „libStateMachine.s
Seite 29 und 30: Bevor man StateMachine startet, sol
Seite 31 und 32: oder Variable „OUTPUT_LIBDIR“ i
Seite 33 und 34: Diese Tabelle enthält alle Namen d
Seite 35 und 36: 6. Parallele Erkennung Wie es schon
Seite 37 und 38: „PluginFactory“ ist eine Single
Seite 39: Da „ASRApplication“ die Basiskl
Seite 43 und 44: „_inputBuffer“ ist ein Teil vom
Seite 45 und 46: Auf der vorherigen Seite wurde scho
Seite 47 und 48: Die Initialisierung des Sprachdetek
Seite 49 und 50: mit. Dabei rechnet er aber nichts a
Seite 51 und 52: Nach der Darstellung des Plugins
Seite 53 und 54: am Infokasten, der mit diesem Port
Seite 55 und 56: Falls „_breakAction“ den Wert 0
Seite 57 und 58: GUI geladen wurde, kann sein Contro
Seite 59 und 60: Um den Benutzer bei der Erstellung
Seite 61 und 62: Mit der Funktion „updateControlle
Seite 63 und 64: Das Senden und das Empfangen kann m

Entwicklung einer Automatenbedienung mit einer leistungsfähigen ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?