LinuxUser HARDWARE - Systeme optimal einkaufen, aufsetzen und konfigurieren (Vorschau)
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Simon 0.4<br />
netz&system<br />
A Ein Konfigurationsassistent erleichtert das Einrichten aller<br />
gr<strong>und</strong>legenden Optionen von Simon.<br />
B Mehrere So<strong>und</strong>karten <strong>und</strong> Mikrofone in USB-Webcams<br />
stellen für Simon kein Problem dar.<br />
unterstützt (Abbildung A). Hier<br />
legen Sie fest, welche Szenarien<br />
<strong>und</strong> Sprachmodelle Simon später<br />
standardmäßig lädt, wo sich der<br />
Spracherkennungsserver Simond<br />
befindet, <strong>und</strong> ob er automatisch<br />
starten soll.<br />
Simond kümmert sich darum,<br />
dass die Spracheingaben der<br />
Clients ausgewertet werden.<br />
Standardmäßig läuft er auf demselben<br />
Rechner wie Simon <strong>und</strong><br />
lauscht am Port 4444. Wie es sich<br />
für einen Server gehört, darf er<br />
aber auch auf einem separaten<br />
Rechner laufen <strong>und</strong> mehrere<br />
Clients bedienen, weshalb es später<br />
eventuell noch passwortgeschützte<br />
Nutzer anzulegen gilt.<br />
In einem weiteren Schritt <strong>konfigurieren</strong><br />
Sie die So<strong>und</strong>karte (Abbildung<br />
B) <strong>und</strong> finden sich dann<br />
im Hauptfenster der Anwendung<br />
wieder (Abbildung C).<br />
zuschneiden: Damit sie korrekt<br />
funktionieren, müssen Sie sie so<br />
sprechen, wie es die Urheber des<br />
Modells vorgesehen haben.<br />
Auch angepasste Modelle liegen<br />
bereits vorgefertigt vor, lassen<br />
sich aber vom Nutzer noch für<br />
seine Stimme <strong>und</strong> Sprechweise<br />
trainieren – das erhöht die Treffergenauigkeit.<br />
Komplett nutzergenerierte<br />
Modelle müssen Sie<br />
zwar selbst erstellen, doch dafür<br />
bieten sie die höchste Trefferquote<br />
<strong>und</strong> eignen sich bestens auch<br />
für Individuen mit Sprachproblemen<br />
oder starken Dialekten.<br />
Der Einsatz angepasster <strong>und</strong><br />
nutzergenerierter Modelle setzt<br />
das Verwenden einer Spracherkennungsengine<br />
wie CMU Sphinx<br />
oder Julius voraus. Vorsicht: Die<br />
beiden verwenden nicht kompatible<br />
Modelle, weswegen sich ein<br />
Engine-Wechsel bei einem gut<br />
trainierten Modell nicht empfiehlt.<br />
Simon erkennt in der aktuellen<br />
Version das verwendete Modell<br />
<strong>und</strong> wählt automatisch das<br />
richtige Backend aus. Gute Anlaufstellen<br />
für adaptierbare Modelle<br />
bieten die Download-Funktion<br />
von Simon unter Settings |<br />
Configure Simon | Sprachmodelle |<br />
Open model | Download oder das<br />
Voxforge-Projekt [7].<br />
Von Voxforge heruntergeladene<br />
Modelle müssen Sie zunächst importieren.<br />
Um etwa das deutsche<br />
CMU-Sphinx-Modell zu nutzen,<br />
laden Sie es von Voxforge herunter<br />
<strong>und</strong> entpacken es. Danach<br />
wählen Sie in der Konfiguration<br />
bei den Sprachmodellen anstelle<br />
des Downloads den Punkt Create<br />
from model files <strong>und</strong> geben die<br />
Pfade zu den Dateien an. Analog<br />
verfahren Sie für andere Sprachen<br />
oder Julius-Modelle.<br />
Simon 0.4<br />
LU/simon/<br />
Modellpflege<br />
Um gesprochene Worte zu erkennen,<br />
greift Simon auf akustische<br />
Modelle („Basismodelle“) zurück.<br />
Diese gibt es in den drei Kategorien<br />
statisch, angepasst oder komplett<br />
nutzergeneriert. Die vorgefertigten<br />
statischen Modelle lassen<br />
sich nicht auf einzelne Nutzer<br />
Listing 1<br />
$ git clone git://anongit.kde.<br />
org/simon simonsource<br />
C Verfügbare Szenarien,<br />
erkannte Worte,<br />
Verbindungsstatus: Im<br />
Hauptfenster präsentiert<br />
Simon übersichtlich<br />
alle Informationen.<br />
Viele Funktionen erreichen<br />
Sie von hier aus<br />
per Mausklick.<br />
www.linux-user.de<br />
03 | 13 67