26.02.2014 Aufrufe

LinuxUser HARDWARE - Systeme optimal einkaufen, aufsetzen und konfigurieren (Vorschau)

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Netz&System<br />

Simon 0.4<br />

D Eigene Szenarien<br />

müssen Sie erst einmal<br />

mit dem benötigten<br />

Vokabular befüllen.<br />

E Ein Schattenlexikon<br />

hilft enorm,<br />

um neue Wörter in<br />

Phoneme zu zerlegen.<br />

Innerhalb von Simon lassen sich<br />

bestimmte Anwendungsfälle für<br />

die Spracherkennung in Form von<br />

Szenarien definieren. Typische<br />

Szenarien wären etwa, den Mauszeiger<br />

oder den Browser mittels<br />

Stimmein gabe zu steuern. Das<br />

Sim on-Team hat bereits einige<br />

häufige Szenarien gesammelt, die<br />

Sie über Manage scenarios |<br />

Open | Download laden können.<br />

Achten Sie darauf, dass Zielsprache<br />

<strong>und</strong> Akustikmodell stimmen,<br />

sofern Sie ein adaptiertes oder<br />

statisches Basismodell einsetzen.<br />

Ferner ist es wichtig, dass Szenario<br />

<strong>und</strong> Basismodell das gleiche<br />

Phonem-Set verwenden.<br />

Oft werden Sie eigene Szenarien<br />

anlegen wollen – etwa, weil Sie<br />

das Benötigte im Download-Bereich<br />

nicht finden oder dort vorhandene<br />

Szenarien das falsche<br />

Basismodell erfordern. Alternativ<br />

lassen sich auch bestehende Szenarien,<br />

etwa Standard, um neue<br />

Wörter erweitern. Neue<br />

Szenarien fügen Sie über<br />

Manage scenarios hinzu.<br />

Um diese mit eigenen<br />

Wörtern zu befüllen, genügt<br />

ein Klick auf Open<br />

.<br />

Hier zeigt Simon die Liste<br />

des bestehenden Vokabulars<br />

an, die es in den<br />

meisten Fällen erst noch<br />

zu befüllen gilt (Abbildung<br />

D).<br />

Anders als bei vielen<br />

kommerziellen Spracherkennungssystemen<br />

mit<br />

vorgefertigten Sprachmodellen<br />

spielen bei Simon Sprachprobleme<br />

des Nutzers kaum eine Rolle:<br />

Neben den vorgefertigten Sprach<strong>und</strong><br />

Akustikmodellen kann der<br />

Anwender auch eigene, maßgeschneiderte<br />

Versionen generieren,<br />

indem er die benötigten<br />

Wörter in Simon trainiert.<br />

Training<br />

Das Training selbst gestaltet sich<br />

recht einfach. Die Schwierigkeit<br />

besteht darin, dass man die Wörter<br />

in „Terminale“ (Verben, Pronomen<br />

etc.; in Simon auch als Kategorien<br />

bezeichnet) unterteilen<br />

<strong>und</strong> in Phoneme zerlegen muss.<br />

Da Nichtlinguisten hier Schwierigkeiten<br />

bekommen könnten,<br />

bietet Simon an, dazu sogenannte<br />

Schattenlexika zu importieren.<br />

Diese enthalten neben vielen<br />

Wörtern auch sämtliche Informationen<br />

über Terminale <strong>und</strong> die auf<br />

Phonemen basierte Aussprache.<br />

Die darin verfügbaren Wörter lassen<br />

sich leicht in den Simon-<br />

Wortschatz übernehmen. Fehlt<br />

ein Wort, können andere vorhandene<br />

Wörter als Beispiele dienen.<br />

Simon unterstützt Schattenlexika<br />

in den Formaten Hadifix,<br />

HTK, PLS, CMU Sphinx <strong>und</strong> Julius,<br />

die Sie alle über den Button<br />

Import Dictionary laden. Meist erwartet<br />

Simon dabei den Pfad zu<br />

einer auf dem Rechner liegenden<br />

Datei. Im Fall Hadifix existiert<br />

dank einer Vereinbarung mit der<br />

Universität Bonn jedoch die Möglichkeit,<br />

das Hadifix-Bomp-Lexikon<br />

direkt herunterzuladen.<br />

Hierzu müssen Sie Namen <strong>und</strong><br />

E-Mail-Adresse angeben sowie die<br />

unfreie, aber kostenlose BOMP-<br />

Lizenz akzeptieren. Eine gute <strong>und</strong><br />

ebenfalls sehr umfassende Alternative<br />

zum Bomp-Lexikon stellt<br />

das auf Voxforge verfügbare German<br />

Dictionary dar.<br />

Szenarien<br />

Nehmen Sie ein neues Wort in ein<br />

Szenario auf (Abbildung E), müssen<br />

Sie es mindestens zweimal<br />

trainieren, also ins Mikrofon<br />

sprechen. So machen Sie Simon<br />

mit Ihrer Stimme <strong>und</strong> Aussprache<br />

bekannt. Erfordert das Szenario<br />

nur wenige Worte, fällt die Erkennungsrate<br />

nach zwei Trainingsr<strong>und</strong>en<br />

schon recht akzeptabel<br />

aus. Zusätzliches Training steigert<br />

die Trefferquote jedoch gehörig<br />

<strong>und</strong> lohnt sich insbesondere<br />

bei zunehmendem Wortschatz<br />

oder ähnlich klingenden Wörtern.<br />

Wörter lassen sich gezielt trainieren,<br />

indem Sie sie mittels<br />

Train Individual Words einem Training<br />

hinzufügen (Abbildung F).<br />

Möchten Sie das Szenario später<br />

vielleicht exportieren <strong>und</strong> so der<br />

Simon-Gemeinschaft zur Verfügung<br />

stellen, lohnt sich das Erstellen<br />

spezieller Trainingstexte.<br />

Dazu wechseln Sie in die Sektion<br />

Training <strong>und</strong> klicken dort auf den<br />

Button Add Text. Den zu übenden<br />

Text – im Idealfall das gesamte<br />

Vokabular des Szenarios – importieren<br />

Sie entweder oder geben<br />

ihn manuell ein.<br />

Liegen die Trainingstexte erst<br />

einmal vor, dann lassen sich im<br />

Hauptfenster oder im geöffneten<br />

Szenario Trainingsr<strong>und</strong>en starten,<br />

indem Sie die entsprechenden<br />

Buttons betätigen. In der<br />

Voreinstellung nimmt Simon die<br />

jeweiligen Zeilen des Trainingstextes,<br />

einzelne oder mehrere<br />

Wörter, separat auf. Erscheint es<br />

Ihnen zu umständlich, zweimal<br />

pro Wort den Record-Knopf (Aufnahme<br />

starten <strong>und</strong> stoppen) zu<br />

bemühen, setzen Sie das Häkchen<br />

68 03 | 13<br />

www.linux-user.de

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!