LinuxUser HARDWARE - Systeme optimal einkaufen, aufsetzen und konfigurieren (Vorschau)
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Netz&System<br />
Simon 0.4<br />
D Eigene Szenarien<br />
müssen Sie erst einmal<br />
mit dem benötigten<br />
Vokabular befüllen.<br />
E Ein Schattenlexikon<br />
hilft enorm,<br />
um neue Wörter in<br />
Phoneme zu zerlegen.<br />
Innerhalb von Simon lassen sich<br />
bestimmte Anwendungsfälle für<br />
die Spracherkennung in Form von<br />
Szenarien definieren. Typische<br />
Szenarien wären etwa, den Mauszeiger<br />
oder den Browser mittels<br />
Stimmein gabe zu steuern. Das<br />
Sim on-Team hat bereits einige<br />
häufige Szenarien gesammelt, die<br />
Sie über Manage scenarios |<br />
Open | Download laden können.<br />
Achten Sie darauf, dass Zielsprache<br />
<strong>und</strong> Akustikmodell stimmen,<br />
sofern Sie ein adaptiertes oder<br />
statisches Basismodell einsetzen.<br />
Ferner ist es wichtig, dass Szenario<br />
<strong>und</strong> Basismodell das gleiche<br />
Phonem-Set verwenden.<br />
Oft werden Sie eigene Szenarien<br />
anlegen wollen – etwa, weil Sie<br />
das Benötigte im Download-Bereich<br />
nicht finden oder dort vorhandene<br />
Szenarien das falsche<br />
Basismodell erfordern. Alternativ<br />
lassen sich auch bestehende Szenarien,<br />
etwa Standard, um neue<br />
Wörter erweitern. Neue<br />
Szenarien fügen Sie über<br />
Manage scenarios hinzu.<br />
Um diese mit eigenen<br />
Wörtern zu befüllen, genügt<br />
ein Klick auf Open<br />
.<br />
Hier zeigt Simon die Liste<br />
des bestehenden Vokabulars<br />
an, die es in den<br />
meisten Fällen erst noch<br />
zu befüllen gilt (Abbildung<br />
D).<br />
Anders als bei vielen<br />
kommerziellen Spracherkennungssystemen<br />
mit<br />
vorgefertigten Sprachmodellen<br />
spielen bei Simon Sprachprobleme<br />
des Nutzers kaum eine Rolle:<br />
Neben den vorgefertigten Sprach<strong>und</strong><br />
Akustikmodellen kann der<br />
Anwender auch eigene, maßgeschneiderte<br />
Versionen generieren,<br />
indem er die benötigten<br />
Wörter in Simon trainiert.<br />
Training<br />
Das Training selbst gestaltet sich<br />
recht einfach. Die Schwierigkeit<br />
besteht darin, dass man die Wörter<br />
in „Terminale“ (Verben, Pronomen<br />
etc.; in Simon auch als Kategorien<br />
bezeichnet) unterteilen<br />
<strong>und</strong> in Phoneme zerlegen muss.<br />
Da Nichtlinguisten hier Schwierigkeiten<br />
bekommen könnten,<br />
bietet Simon an, dazu sogenannte<br />
Schattenlexika zu importieren.<br />
Diese enthalten neben vielen<br />
Wörtern auch sämtliche Informationen<br />
über Terminale <strong>und</strong> die auf<br />
Phonemen basierte Aussprache.<br />
Die darin verfügbaren Wörter lassen<br />
sich leicht in den Simon-<br />
Wortschatz übernehmen. Fehlt<br />
ein Wort, können andere vorhandene<br />
Wörter als Beispiele dienen.<br />
Simon unterstützt Schattenlexika<br />
in den Formaten Hadifix,<br />
HTK, PLS, CMU Sphinx <strong>und</strong> Julius,<br />
die Sie alle über den Button<br />
Import Dictionary laden. Meist erwartet<br />
Simon dabei den Pfad zu<br />
einer auf dem Rechner liegenden<br />
Datei. Im Fall Hadifix existiert<br />
dank einer Vereinbarung mit der<br />
Universität Bonn jedoch die Möglichkeit,<br />
das Hadifix-Bomp-Lexikon<br />
direkt herunterzuladen.<br />
Hierzu müssen Sie Namen <strong>und</strong><br />
E-Mail-Adresse angeben sowie die<br />
unfreie, aber kostenlose BOMP-<br />
Lizenz akzeptieren. Eine gute <strong>und</strong><br />
ebenfalls sehr umfassende Alternative<br />
zum Bomp-Lexikon stellt<br />
das auf Voxforge verfügbare German<br />
Dictionary dar.<br />
Szenarien<br />
Nehmen Sie ein neues Wort in ein<br />
Szenario auf (Abbildung E), müssen<br />
Sie es mindestens zweimal<br />
trainieren, also ins Mikrofon<br />
sprechen. So machen Sie Simon<br />
mit Ihrer Stimme <strong>und</strong> Aussprache<br />
bekannt. Erfordert das Szenario<br />
nur wenige Worte, fällt die Erkennungsrate<br />
nach zwei Trainingsr<strong>und</strong>en<br />
schon recht akzeptabel<br />
aus. Zusätzliches Training steigert<br />
die Trefferquote jedoch gehörig<br />
<strong>und</strong> lohnt sich insbesondere<br />
bei zunehmendem Wortschatz<br />
oder ähnlich klingenden Wörtern.<br />
Wörter lassen sich gezielt trainieren,<br />
indem Sie sie mittels<br />
Train Individual Words einem Training<br />
hinzufügen (Abbildung F).<br />
Möchten Sie das Szenario später<br />
vielleicht exportieren <strong>und</strong> so der<br />
Simon-Gemeinschaft zur Verfügung<br />
stellen, lohnt sich das Erstellen<br />
spezieller Trainingstexte.<br />
Dazu wechseln Sie in die Sektion<br />
Training <strong>und</strong> klicken dort auf den<br />
Button Add Text. Den zu übenden<br />
Text – im Idealfall das gesamte<br />
Vokabular des Szenarios – importieren<br />
Sie entweder oder geben<br />
ihn manuell ein.<br />
Liegen die Trainingstexte erst<br />
einmal vor, dann lassen sich im<br />
Hauptfenster oder im geöffneten<br />
Szenario Trainingsr<strong>und</strong>en starten,<br />
indem Sie die entsprechenden<br />
Buttons betätigen. In der<br />
Voreinstellung nimmt Simon die<br />
jeweiligen Zeilen des Trainingstextes,<br />
einzelne oder mehrere<br />
Wörter, separat auf. Erscheint es<br />
Ihnen zu umständlich, zweimal<br />
pro Wort den Record-Knopf (Aufnahme<br />
starten <strong>und</strong> stoppen) zu<br />
bemühen, setzen Sie das Häkchen<br />
68 03 | 13<br />
www.linux-user.de