Sprachgesteuerte 3D-Angiographie - Sympalog Voice Solutions ...
Sprachgesteuerte 3D-Angiographie - Sympalog Voice Solutions ...
Sprachgesteuerte 3D-Angiographie - Sympalog Voice Solutions ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
– Erkenner mit stochastischen Sprachmodellen: Alle Wortfolgen sind möglich;<br />
der Befehl muss auf der erkannten Wortkette in geeigneter Weise extrahiert werden.<br />
Wortfolgen, die Befehle repräsentieren, erhalten eine höhere Wahrscheinlichkeit. Die<br />
Wahrscheinlichkeiten werden auf einer Trainingsmenge geschätzt.<br />
• Dialog-Systeme Unter Umständen enthält der Befehl an ein Kommando- und Kontroll-<br />
System nicht genügend Information oder ein im aktuellen Kontext nicht mögliches Kommando.<br />
In diesen Fällen, oder wenn aus Sicherheitsgründen vor Ausführung des Kommandos<br />
eine Bestätigung durch den Anwender notwendig ist, muss ein Dialogsystem verwendet<br />
werden. Im folgenden Beispiel interagiert ein Benutzer mit einem Roboterarm:<br />
B: Drehe die Schraube fest.<br />
S: Für diesen Befehl ist eine Angabe in Newtonmeter notwenig. Mit wieviel Newtonmeter<br />
soll ich festdrehen?<br />
B: Mit 5<br />
Zur korrekten Interpretation der letzten Benutzeräußerung benötigt das System die Dialoggeschichte<br />
der vorangegangenen Befehle und Aktionen.<br />
• Benutzer-/System-initiierte Interaktion Die Art der Interaktion und die Komplexität<br />
des Interaktions-Systems wird stark davon beeinflusst, ob das System nur auf Benutzeräußerungen<br />
reagieren kann, oder auch von sich aus Interaktionen initiieren kann,<br />
etwa um den Benutzer auf eine kritische Situation aufmerksam zu machen (z.B. ein ”<br />
intelligenter<br />
Beifahrer“: Es kann sein, dass ein Lager im rechten Vorderrad defekt ist; bitte<br />
reduzieren Sie Ihre Geschwindigkeit und fahren Sie die nächste Werkstatt an).<br />
• ”<br />
Push-to-talk“-Syteme In vielen Situationen kann es sinnvoll sein, dass das Interaktionssystem<br />
erst durch einen Funktionsknopf aktiviert werden muss. Der Funktionsknopf<br />
bzw. -hebel hat den Vorteil, dass die Aktivierung “fehlerfrei” ist (kommt der Benutzer aus<br />
Versehen an den Knopf, so sieht er das als seinen Fehler an und nicht als Systemfehler)<br />
und dass das System nicht ständig mithören muss und somit keine Rechenzeit verbraucht.<br />
Typische Anwendungen sind<br />
– Fahrerassistenzsysteme (Fahrer unterhält sich viel mit Beifahrer, schlechte akustische<br />
Bedingungen), bei denen sonst unverhältnismäßig oft ein Befehl aufgrund einer<br />
Fehlerkennung ausgeführt werden würde,<br />
– Systeme, die sicherheitsrelevante Aktionen ausführen können,<br />
– Handys, die nur wenig Rechenleistung haben.<br />
• ”<br />
Aktivierungswort“-Systeme Bei dieser Art von Systemen wird der Aktivierungsknopf<br />
durch ein Befehlswort ersetzt (z.B. Sesam oder Butler). Durch die Einschränkung auf nur<br />
ein Wort kann die fehlerhafte Auslösung von Befehlen und der erforderliche Rechenaufwand<br />
während der nicht-aktiven Phase gering gehalten werden.<br />
• ”<br />
Online-“-Systeme Bei dieser Art von Systemen kann der Benutzer beliebig zwischen<br />
für das System relevanten Befehlen und irrelevanten Äußerungen hin- und herschalten.<br />
Diese Art von Systemsteuerung ist die für den Anwender bequemste und für das System<br />
rechenintensivste Lösung. Da das System ständig zuhört, aber nur auf seine Befehle reagieren<br />
soll, müssen alle möglichen irrelevanten Äußerungen ebenfalls modelliert werden.<br />
Dies geschieht mit sogenannten Müll- oder Hintergrundmodellen.<br />
• multimodale Systeme das System erlaubt mehrere Eingabe-Modi, z.B. Tastatur, Maus,<br />
Joystick, Mikrofon<br />
• multimediale Systeme das System kann über verschiedene Medien dem Benutzer Information<br />
ausgeben, z.B. Bildschirm und Lautsprecher.