LinuxUser HARDWARE - Systeme optimal einkaufen, aufsetzen und konfigurieren (Vorschau)

Netz&System 

Simon 0.4 

D Eigene Szenarien 

müssen Sie erst einmal 

mit dem benötigten 

Vokabular befüllen. 

E Ein Schattenlexikon 

hilft enorm, 

um neue Wörter in 

Phoneme zu zerlegen. 

Innerhalb von Simon lassen sich 

bestimmte Anwendungsfälle für 

die Spracherkennung in Form von 

Szenarien definieren. Typische 

Szenarien wären etwa, den Mauszeiger 

oder den Browser mittels 

Stimmein gabe zu steuern. Das 

Sim on-Team hat bereits einige 

häufige Szenarien gesammelt, die 

Sie über Manage scenarios | 

Open | Download laden können. 

Achten Sie darauf, dass Zielsprache 

und Akustikmodell stimmen, 

sofern Sie ein adaptiertes oder 

statisches Basismodell einsetzen. 

Ferner ist es wichtig, dass Szenario 

und Basismodell das gleiche 

Phonem-Set verwenden. 

Oft werden Sie eigene Szenarien 

anlegen wollen – etwa, weil Sie 

das Benötigte im Download-Bereich 

nicht finden oder dort vorhandene 

Szenarien das falsche 

Basismodell erfordern. Alternativ 

lassen sich auch bestehende Szenarien, 

etwa Standard, um neue 

Wörter erweitern. Neue 

Szenarien fügen Sie über 

Manage scenarios hinzu. 

Um diese mit eigenen 

Wörtern zu befüllen, genügt 

ein Klick auf Open 

. 

Hier zeigt Simon die Liste 

des bestehenden Vokabulars 

an, die es in den 

meisten Fällen erst noch 

zu befüllen gilt (Abbildung 

D). 

Anders als bei vielen 

kommerziellen Spracherkennungssystemen 

mit 

vorgefertigten Sprachmodellen 

spielen bei Simon Sprachprobleme 

des Nutzers kaum eine Rolle: 

Neben den vorgefertigten Sprachund 

Akustikmodellen kann der 

Anwender auch eigene, maßgeschneiderte 

Versionen generieren, 

indem er die benötigten 

Wörter in Simon trainiert. 

Training 

Das Training selbst gestaltet sich 

recht einfach. Die Schwierigkeit 

besteht darin, dass man die Wörter 

in „Terminale“ (Verben, Pronomen 

etc.; in Simon auch als Kategorien 

bezeichnet) unterteilen 

und in Phoneme zerlegen muss. 

Da Nichtlinguisten hier Schwierigkeiten 

bekommen könnten, 

bietet Simon an, dazu sogenannte 

Schattenlexika zu importieren. 

Diese enthalten neben vielen 

Wörtern auch sämtliche Informationen 

über Terminale und die auf 

Phonemen basierte Aussprache. 

Die darin verfügbaren Wörter lassen 

sich leicht in den Simon- 

Wortschatz übernehmen. Fehlt 

ein Wort, können andere vorhandene 

Wörter als Beispiele dienen. 

Simon unterstützt Schattenlexika 

in den Formaten Hadifix, 

HTK, PLS, CMU Sphinx und Julius, 

die Sie alle über den Button 

Import Dictionary laden. Meist erwartet 

Simon dabei den Pfad zu 

einer auf dem Rechner liegenden 

Datei. Im Fall Hadifix existiert 

dank einer Vereinbarung mit der 

Universität Bonn jedoch die Möglichkeit, 

das Hadifix-Bomp-Lexikon 

direkt herunterzuladen. 

Hierzu müssen Sie Namen und 

E-Mail-Adresse angeben sowie die 

unfreie, aber kostenlose BOMP- 

Lizenz akzeptieren. Eine gute und 

ebenfalls sehr umfassende Alternative 

zum Bomp-Lexikon stellt 

das auf Voxforge verfügbare German 

Dictionary dar. 

Szenarien 

Nehmen Sie ein neues Wort in ein 

Szenario auf (Abbildung E), müssen 

Sie es mindestens zweimal 

trainieren, also ins Mikrofon 

sprechen. So machen Sie Simon 

mit Ihrer Stimme und Aussprache 

bekannt. Erfordert das Szenario 

nur wenige Worte, fällt die Erkennungsrate 

nach zwei Trainingsrunden 

schon recht akzeptabel 

aus. Zusätzliches Training steigert 

die Trefferquote jedoch gehörig 

und lohnt sich insbesondere 

bei zunehmendem Wortschatz 

oder ähnlich klingenden Wörtern. 

Wörter lassen sich gezielt trainieren, 

indem Sie sie mittels 

Train Individual Words einem Training 

hinzufügen (Abbildung F). 

Möchten Sie das Szenario später 

vielleicht exportieren und so der 

Simon-Gemeinschaft zur Verfügung 

stellen, lohnt sich das Erstellen 

spezieller Trainingstexte. 

Dazu wechseln Sie in die Sektion 

Training und klicken dort auf den 

Button Add Text. Den zu übenden 

Text – im Idealfall das gesamte 

Vokabular des Szenarios – importieren 

Sie entweder oder geben 

ihn manuell ein. 

Liegen die Trainingstexte erst 

einmal vor, dann lassen sich im 

Hauptfenster oder im geöffneten 

Szenario Trainingsrunden starten, 

indem Sie die entsprechenden 

Buttons betätigen. In der 

Voreinstellung nimmt Simon die 

jeweiligen Zeilen des Trainingstextes, 

einzelne oder mehrere 

Wörter, separat auf. Erscheint es 

Ihnen zu umständlich, zweimal 

pro Wort den Record-Knopf (Aufnahme 

starten und stoppen) zu 

bemühen, setzen Sie das Häkchen 

68 03 | 13 

www.linux-user.de

Vorherige Seite

Nächste Seite

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

22

23

24

25

26

27

28

29

30

31

32

33

34

35

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

86

87

88

89

90

91

92

93

94

95

96

97

98

100

LinuxUser HARDWARE - Systeme optimal einkaufen, aufsetzen und konfigurieren (Vorschau)

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?