Java-Speech-Spezifikation

Java-Speech-Spezifikation 

Hans-Peter Cugialy Markus Lülsdorf Matthias Otto 

März 2000

INHALTSVERZEICHNIS 1 

Inhaltsverzeichnis 

1 Einleitung 4 

2 Einführung in die Sprachsynthese 6 

2.1 Direkte Sprachsynthese . . . . . . . . . . . . . . . . . . . . . . . . . . 6 

2.2 Anwendungsmöglichkeiten der Sprachsynthes . . . . . . . . . . . . . . 6 

3 Speech 7 

3.1 Interface . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 

3.1.1 AudioListener . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 

3.1.2 AudioManager . . . . . . . . . . . . . . . . . . . . . . . . . . 7 

3.1.3 EngineCentral . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 

3.1.4 EngineCreate . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 

3.1.5 Engine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 

3.1.6 EngineListener . . . . . . . . . . . . . . . . . . . . . . . . . . 10 

3.1.7 EngineProperties . . . . . . . . . . . . . . . . . . . . . . . . . 11 

3.1.8 VocabManager . . . . . . . . . . . . . . . . . . . . . . . . . . 11 

3.2 Klassen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 

3.2.1 AudioAdapter . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 

3.2.2 AudioEvent . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 

3.2.3 Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 

3.2.4 EngineAdapter . . . . . . . . . . . . . . . . . . . . . . . . . . 14 

3.2.5 EngineErrorEvent . . . . . . . . . . . . . . . . . . . . . . . . . 15 

3.2.6 EngineEvent . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 

3.2.7 EngineList . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 

3.2.8 EngineModeDesc . . . . . . . . . . . . . . . . . . . . . . . . . 16 

3.2.9 SpeechPermission . . . . . . . . . . . . . . . . . . . . . . . . . 18 

3.2.10 Word . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 

3.3 Ausnahmen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 

3.4 Fehler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 

4 Java-Speech-Synthesize 22 

4.1 Interfaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 

4.1.1 Speakable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 

4.1.2 SpeakableListener . . . . . . . . . . . . . . . . . . . . . . . . . 22 

4.1.3 Synthesizer . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 

4.1.4 SynthesizerListener . . . . . . . . . . . . . . . . . . . . . . . . 24 

4.1.5 SynthesizerProperties . . . . . . . . . . . . . . . . . . . . . . . 24 

4.2 Klassen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 

4.2.1 SynthesizerAdapter . . . . . . . . . . . . . . . . . . . . . . . . 26 

4.2.2 SynthesizerEvent . . . . . . . . . . . . . . . . . . . . . . . . . 26 

4.2.3 SynthesizerModeDesc . . . . . . . . . . . . . . . . . . . . . . . 26 

4.2.4 SynthesizerQueueItem . . . . . . . . . . . . . . . . . . . . . . 27 

4.2.5 Voice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27


Vorwort 

Java-Speech ist eines der neueren Erweiterungspakete für die Programmiersprache 

Java. Es suggeriert, daß man mit einem Programm, daß unter anderem mit Hilfe des 

Speech-Paketes programmiert wurde, direkt auf Sprache reagieren kann oder Sprache 

erzeugen kann. Betrachtet man das Paket jedoch etwas genauer, so wird man einen 

wesentlichen Unterschied zu (fast) allen anderen Erweiterungspaketen von Java (z.B. 

Java3D, Java-Sound, ...) erkennen. Auf diesen wesentlichen Unterschied wollen wir 

nun etwas näher eingehen. 

Java-Speech ist ein Erweiterungs-Paket zur Programmiersprache Java, daß von 

Sun entwickelt wurde, um auf Spracheingabe in bestimmter Weise reagieren zu können. 

Leider ist es den Entwicklern von Sun nicht bzw. noch nicht gelungen, das Paket 

unabhängig von Fremdprodukten zu halten. Dies bedeutet, daß es mit Java-Speech 

nicht möglich ist, direkt irgendwelche Hardware, wie z.B. eine Soundkarte oder ein 

Mikrofon, anzusprechen. Um dies zu erreichen muß man auf diverse Fremdprodukte 

ausweichen. Diese Fremdprodukte stellen diese Funktionen dann zur Verfügung, und 

kümmern sich um die Aufnahme und die Ausgabe von Sprache. Einige dieser Fremdprodukte 

sind für die verschiedensten Betriebssysteme erhältlich. Eines der bekanntesten 

Fremdprodukte ist das bekannte Spracherkennungssysteme von IBM ViaVoice. 

Dieses Programm stellt z.B. die Schnittstelle zwischen der Programmierspache und 

dem Betriebssystem (in diesem Fall MS Windows 9x/NT/2000) dar. 

Grundsätzlich ist nun dazu zu bemerken, daß man bei einem Java-Programm, das 

auf Sprache reagieren soll oder das auch Sprache ausgeben soll, im eigentlichen Sinne 

auf den Fremdprogrammen aufsetzt. Die eigentliche Verarbeitung und Nutzung der 

Hardware wird dann durch das entsprechende Fremdprogramm gemacht. 

Zunächst einmal muß man sich klarmachen, daß das Speech-Paket in drei große 

Gruppen unterteilt ist. Diese drei Gruppen sind die allgemeinen Speech - Pakete 

(Java - Speech), die Pakete der Spracherkennung (Java - Speech - Recognition) und 

die Pakete der Sprachausgabe (Java - Speech - Synthesis). Wir wollen versuchen, 

die Struktur der Original Java - Speech - Spezifikation zu erhalten, damit man sich 

leichter in der Speech - Spezifikation orientieren kann. 

Trotzdem sind wir der Meinung, es ist sicherlich sinnvoller, die Sprachausgabe vor 

der Spracherkennung zu bearbeiten. 

Außerdem werden wir eine weitere Unterteilung der Java - Spezifikation übernehmen. 

• Interfaces 

• Classes 

• Exceptions 

• Errors 

Wir möchten als letztes noch bemerken, daß wir keinerlei Garantie auf Vollständigkeit 

geben. Wir versuchen, die wichtigsten und meist genutzten Pakete, Klassen und


Interfaces zu beschreiben und uns weniger in Einzelheiten zu verlaufen. Dies würde 

auch das Lesen und Verstehen erschweren. 

Falls es innerhalb von bestimmten Klassen auch noch besonders wichtige Methoden 

gibt, werden wir diese hier auch ansprechen. Es sei allerdings bemerkt, daß es 

zu fast jeder Methode auch Ausnahme- und Fehlerbehandlungen gibt. Diese werden 

wir immer am Ende des entsprechenden Abschnitts auflisten. Dabei wird aber 

nicht auf die Details eingegangen. Diese können bei Bedarf direkt in der Java-Speech- 

Spezifikation (http://www.java.sun.com) nachgelesen werden. 

Wir hoffen, wir halten unsere Strukur wirklich ein und bleiben verständlich...

1 EINLEITUNG 4 

1 Einleitung 

Java-Speech ist eines der neueren Erweiterungspakete für die Programmiersprache 

Java. Es suggeriert von der Bezeichnung, daß man mit einem Programm, daß unter 

anderem mit Hilfe des Speech-Paketes programmiert wurde, direkt auf Spracheingaben 

reagieren kann oder Sprache erzeugen kann. Betrachtet man das Paket jedoch 

etwas genauer, so wird man einen wesentlichen Unterschied zu (fast) allen anderen 

Erweiterungspaketen von Java (z.B. Java3D, Java-Sound, ...) erkennen. Auf diesen 

wesentlichen Unterschied wollen wir nun etwas näher eingehen. 

Java-Speech ist ein Erweiterungs-Paket zur Programmiersprache Java, daß von 

Sun entwickelt wurde, um auf Spracheingabe in bestimmter Weise reagieren zu können. 

Leider ist es den Entwicklern von Sun nicht bzw. noch nicht gelungen, das Paket 

unabhängig von Fremdprodukten zu halten. Dies bedeutet, daß es mit Java-Speech 

nicht möglich ist, direkt irgendwelche Hardware, wie z.B. eine Soundkarte oder ein 

Mikrofon, anzusprechen. Um dies zu erreichen muß man auf diverse Fremdprodukte 

ausweichen. Diese Fremdprodukte stellen diese Funktionen dann zur Verfügung, und 

kümmern sich um die Aufnahme und die Ausgabe von Sprache. Einige dieser Fremdprodukte 

sind für die verschiedensten Betriebssysteme erhältlich – die meisten leider 

nicht kostenlos. Eines der bekanntesten Fremdprodukte ist das bekannte Spracherkennungssysteme 

von IBM, ViaVoice. Dieses Programm stellt die Schnittstelle zwischen 

der Programmierspache Java und dem Betriebssystem (in diesem Fall MS Windows 

9x/NT/2000) dar. 

Als weitere Voraussetzung benötigt man von IBM nach ein Development Kid für 

Java. Mit Hilfe dieses Development Kits kann man dann eine Programm in Java 

auf Spracheingaben reagieren lassen. Dies könnte z.B. so aussehen, daß man mit 

bestimmten Befehlen eine Menü öffnen kann oder bestimmte Audio-Dateien abspielen 

läßt. Natürlich gibt es noch viele andere Möglichkeiten auf Spracheingabe zu reagieren. 

Anders als man es erwarten würde, ist das Programm ViaVoice auch noch für die 

Sprachausgabe zuständig. Dies liegt wahrscheinlich daran, daß sich das Fremdprogramm 

sowieso mit der Hardware auseinandersetzt. Daher kann man sich vorstellen, 

daß es einfacher ist, das Ansprechen von Hardware-Ressourcen an eine Programm weiterzugeben, 

daß diese Ressourcen schon verwaltet. Dies ist wahrscheinlich der Grund 

dafür, daß sowohl die Sprachaufnahme als auch die Sprachausgabe durch das entsprechende 

Fremprogramm getätigt wird. 

Zu bemerken ist nun außerdem noch, daß es neben IBM ’s ViaVoice natürlich noch 

andere Programm gibt. Eines dieser Programm ist z.B. Festival oder Conversa. Diese 

beiden Programm sind zwar teilweise frei verfügbar, laufen aber nur unter Linux. 

Daher werden wir sie hier außen vor lassen. 

Wir möchten desweiteren bemerken, daß es uns nicht bekannt ist, ob es noch 

weitere Fremdprogramm gibt, auf denen Java-Speech aufsetzen kann. 

Im folgenden Tutorial wollen wir uns dann in gewisser Weise mit Java-Speech 

beschäftigen: 

Zunächst werden wir versuchen, einen kurzen Abriß über die Sprachsynthese zu 

geben. Dabei werden wir uns bemühen, vorzustellen, wie Sprachsynthese im Allgemeinen 

funktioniert und versuchen dabei, auf unteschiedliche Arten der Sprachsynthese

1 EINLEITUNG 5 

einzugehen. Danach wollen wir direkt näher auf Java-Speech eingehen. Dabei werden 

wir kurz das grundlegende Prinzip der wichtigsten Interface und Klassen geben. Danach 

spezialisieren wir das grundlegende Prinzip auf die Sprachausgabe, die in Java 

Synthesizer genannt wird. Die Spracherkennung werden wir in diesem Tutorial vernachlässigen, 

da diese Kapitel den Rahmen sprengen wird. Nähere Informationen zur 

Spracherkennung (Java-Recognizer) kann man aber auf den Internetseiten von Sun – 

http://www.java.sun.com/products/java-media/speech/ – entnehmen. Dort findet 

man zum gesamten Speech-Paket eine Spezifikation, eine Dokumentation und 

einen Programmier-Leitfaden. 

Am Ende dieses Tutorials werden wir eine Auflistung der vorhandenen Speech- 

Interface und Klassen geben. Dabei bemühen wir uns die grundlegende Funktion 

dieser Interface und Klasse zu beschreiben. Am Ende eines solchen Kapitels werden 

dann noch die möglichen Fehler und Ausnahmen aufgelistet, aber nicht näher 

beschrieben. Auch in dieser Auflistung wird man das Kapitel der Spracherkennung 

vergeblich suchen. 

Nun wollen wir uns aber näher mit der Sprachsynthese auseinandersetzen ...

2 EINFÜHRUNG IN DIE SPRACHSYNTHESE 6 

2 Einführung in die Sprachsynthese 

Sprachsynthese ermöglicht es, einen Text in gesprochener Sprache auszugeben. Es gibt 

mehrere Methoden, der Sprachsynthese, von denen wir allerdings nur Eine genauer 

vorstellen werden. 

2.1 Direkte Sprachsynthese 

Bei der direkten Sprachsynthese werden Teilstücke des Sprachsignals gespeichert. Die 

Teilstücke können einzelne Wörter, ganze Sätze oder Phoneme. Phoneme sind kleinste 

bedeutungsunterscheidende sprachliche Einheiten, so unterscheiden sich die Wörter 

Maus und Haus durch die Phoneme /m/ und /h/. Diese Teilstücke werden dann zu 

Wörtern und Sätzen zusammengesetzt. Diese Methode kann eine sehr gute Sprachqualität 

ergeben, wenn z.B. ganze Sätze abgespeichert werden. 

Ihre Anwendung findet diese Methode, wenn nur ein begrenztes Vokabular vorliegt, 

da der Speicherbedarf sehr groß ist. Problematisch bei der direkten Sprachsynthese 

ist, daß die Betonung eines Wortes unterschiedlich sein kann. So wird ein einzeln 

gesprochenes Wort anders betont, als das selbe Wort in einem zusammenhängenden 

Satz oder einer Frage. Daraus resultiert ein recht unnatürlicher Klang der Sprache. 

2.2 Anwendungsmöglichkeiten der Sprachsynthes 

Die Anwendungsmöglichkeiten der Sprachsynthese sind äußerst vielfältig. So ist zum 

Beispiel ein sprechender Bankautomat denkbar, der einen bittet seine Geheimzahl 

einzugeben. Oder eine sprechende Uhr, mit einem festem Trägersatz ” 

Es ist ... Uhr ...“. 

Die freien Slots werden dann mit den entsprechenden Zahlwörtern aufgefüllt. Auch 

ein fernabfragbarer Anrufbeantworter ist denkbar, welches nicht nur die Möglichkeiten 

der Sprachsynthese nutzt, sonder auch die der Spracherkennung.

3 SPEECH 7 

3 Speech 

Alle Interfaces, Klassen, Fehler und Ausnahmen des allgemeinen Speech-Paketes sind 

in der Implementation Unterzweig von javax.speech. 

3.1 Interface 

3.1.1 AudioListener 

Der AudioListener ist ein Interface in einem Programm. Dieses Interface reagiert 

auf Ereignisse, die mit Audio-Files zu tun haben. Dabei kann es sich zum Beispiel 

um das Abspielen einer Audio-Datei handeln, das Anhalten oder das regelmäßige 

Wiederholen einer Ausgabe. 

Der AudioListener arbeitet immer mit einer Engine (Maschine) zusammen. Bei 

dem Speech-Paket gibt es bis heute nur die beiden Engines der Spracherkennung 

(Recognizer) und der Sprachausgabe (Synthesizer). 

Da Java immer weiterentwickelt wird, dient dieses Interface wie auch andere Klassen 

als Platzhalter, bis die Java-Sound-API bzw. die Java-Speech-API komplett implementiert 

wurden. 

3.1.2 AudioManager 

Der AudioManager ist die eigentliche (interne) Schaltzentrale in Bezug auf Audio- 

Files. Er übergibt die Kontrolle von Audio-Dateien an Anwendungen. Außerdem 

überwacht der AudioManager Ereignisse, die vom AudioListener erkannt und an ihn 

zur weiteren Verarbeitung übergeben werden. Einem AudioManager können verschiedene 

AudioListener hinzugefügt und wieder entfernt werden (addAudioListener, 

removeAudioListener). 

3.1.3 EngineCentral 

Dieses Interface sorgt dafür, daß für jede verwendete Engine eine Beschreibungsliste 

vorhanden ist, in der man die Betriebsart ersehen kann. Diese Beschreibung ist vom 

Typ EngineModeDesc und erhält alle möglichen Betriebsarten dieser entsprechenden 

Engine. 

Um sich eine Liste von Engines zu erzeugen, kann eine Methode createEngineList 

benutzt werden. Dabei kann man als Übergabewert eine Voraussetzung mitliefern, die 

diese Engine haben muß. Die genaue Syntax dieser Methode lautet dann: 

public EngineList createEngineList(EngineModeDesc required) 

Als Ausgabe erhält man dann eine Liste der Engines, die auf diese Voraussetzung 

zutreffen. 

Ausnahmen und Fehler 

• SecurityException

3 SPEECH 8 

3.1.4 EngineCreate 

Die meisten Anwendungen brauchen dieses Interface eigentlich nicht. Man kann sich 

mit Hilfe der Methode createEngine() eine bestimmte Engine explizit erzeugen. Die 

damit erzeugte Methode hat eine Betriebsart, die abhängig von der erzeugten Engine 

ist. Beim Erzeugen von Engines können natürlich auch Fehler auftreten, die dann 

durch eine entsprechende Ausnahmebehandlung bearbeitet werden müssen. 


• IllegalArgumentException 

• EngineException 

• SecurityException 

3.1.5 Engine 

Wie schon zuvor öfter erwähnt gibt es zum momentanen Zeitpunkt nur die beiden 

Engines Recognize und Synthesize. Diese beiden Engines sind Unterklassen der 

javax.speech.Engine. Einer Engine sind Methoden zugeordnet, mit der man auf 

Engines arbeiten kann. Beispiele für solche Methoden sind folgende: 

• allocate und deallocate 

• pause und resume 

• Zugriff auf den AudioManager und VocabManager 

• Zugriff auf die Engine-Eigenschaften 

• Zugriff auf die EngineModeDesc 

• hinzufügen und entfernen von AudioListener 

Nun werden wir der Reihe nach die Punkte erläutern: 

Allocate und Deallocate Allocate und Deallocate sind Zustände, die eintreten, 

wenn eine Engine etwas macht. So wird z.B. der Zustand auf allocated geändert, 

wenn eine Audio-Datei abgespielt wird. Ebenso wird eine Engine auf deallocated 

gesetzt, wenn eine Engine eine Aufgabe beendet hat und danach die Systemressourcen 

wieder freigeben soll. Ändert eine Engine ihren Zustand von allocated in 

deallocated, so ist leicht vorstellbar, daß für diesen Vorgang einige Zeit benötigt 

wird. In dieser Zeit wird ein Zwischenzustand eingenommen. Der Zwischenzsutand 

beim Übergang von allocated zu deallocated heißt Deallocated ressource und 

der Zustand beim Übergang von Deallocated zu Allocated wird mit Allocated ressource 

bezeichnet. 

Erzeugt man eine Engine, so hat diese den Anfangszustand deallocated.

3 SPEECH 9 

Unterzustände Als Unterzustände werden Zustände bezeichnet, die immer nur in 

Beziehung mit einem anderen Zustand eintreten können. Z.B. hat allocate zwei 

Unterzustände, pause und resume. Man kann sich vorstellen, daß eine Audiodatei 

abgespielt wird und dann angehalten wird. Eine solche Engine wird dann den Zustannd 

allocate und pause haben. Dies sind die beiden einzigen Unterzustände von 

allocate. 

Deallocate hat keine Unterzustände. 

Methoden zur Statusabfrage Um Zustände abzufragen oder zu testen, benötigt 

man noch einige Methoden. In Engine-Klassen heißen die Methoden getEngineState, 

waitEngineState und testEngineState. 

Dabei ist schon aus dem Namen der Methoden zu ersehen, was sie bewirken. 

Die Methode getEngineState gibt als Ausgabe den akutellen Zustand der Engine 

aus. Die Methode waitEngineState blockiert eine arbeitende Engine solange, bis ein 

bestimmter Zustand erreicht wurde und setzt dann die Engine fort. Als letzte Methode 

testet testEngineState eine bestimmte Eninge auf einen bestimmten Zustand und 

gibt entsprechend true oder false zurück.

3 SPEECH 10 

Tab. 1: Methodenzusammenfassung des Engine 

void addEngineListener(EngineListener 

listener) 

fügt einen EngineListener zu einer bestimmten 

Engine hinzu 

void allocate() 

setzt den Zustand auf Allocated und reserviert 

alle Ressourcen, die zur Ausführung 

gebraucht werden 

void deallocate() 

setzt den Zustand auf Deallocated und 

gibt alle benutzten Ressourcen wieder frei 

AudioManager getAudioManager() man erhält als Ausgabe eine Objekt 

vom Typ AudioManager, der die Audio- 

Ereignisse dieser Engine verwaltet 

EngineModeDesc getEngineModeDesc() man erhält eine Liste der Betriebseigenschaften 

einer bestimmten Engine 

EngineProperties getEngineProperties() gibt die Eigenschaften einer bestimmten 

Engine aus 

long getEngineState() 

gibt den aktuellen Zustand dieser Engine 

aus 

VocabManager getVocabManager() 

man erhält ein Objekt als Ausgabe, das die 

unterstützten Vokabeln der Engine liefert 

void pause() 

hält eine Engine an (Der Vorgang kann 

später fortgeführt werden 

void removeEngineListener(EngineListener entfernt einen EngineListener von der entsprechenden 

lsitener) 

Engine 

void resume() 

nimmt die Arbeit einer angehaltenen Engine 

wieder auf 

boolean testEngineState(long state) testet, obe eine Engine in einem bestimmten 

Zustand ist 

void waitEngineState(long state) wartet bzw. blockiert eine Ausführung einer 

Engine solange, bis ein bestimmter Zustand 

erreicht wurde 

3.1.6 EngineListener 

Ein solches Interface muß zu einem EngineManager hinzugefügt werden, wenn dieser 

Manager auf Zustandsänderungen einer Engine reagieren soll. Der EngineListener 

registriert solche Zustandsänderungen und leitet diese dann an den EngineManager 

weiter. Der Manager reagiert dann entsprechend auf solche Zustandsänderung. Man 

könnte sich z.B. vorstellen, daß sich der Zustand eines Synthesizers von pause auf 

resume ändert. Der EngineListener registriert nun diese Zustandsänderung und gibt 

sie an den EngineManager weiter. Dieser beginnt die Audiodateien dann wieder abzuspielen.

3 SPEECH 11 

Tab. 2: Methodenzusammenfassung des EngineListener 

void engineAllocated(EngineEvent e) 

ändert den Zustand dieser Engine 

auf Allocated 

void engineAllocatingResources(EngineEvent e) bereitet eine Engine darauf vor, 

den Zustand Allocated zu erhalten 

void engineDeallocated(EngineEvent e) 

ändert den Zustand dieser Engine 

auf Deallocated 

void engineDeallocatingResources(EngineEvent e) bereitet eine Engine darauf vor, 

den Zustand deallocate zu erhalten 

void enginePaused(EngineEvent e) 

hält die Ausführung einer Engine 

an 

void engineResumed(EngineEvent e) 

nimmt die Ausführung einer Engine 

wieder auf 

3.1.7 EngineProperties 

ist meines Erachtens eigentlich nicht so wichtig (auf den ersten Blick zumindest) und 

wird daher auch zunächst nicht behandelt. 

3.1.8 VocabManager 

Der VocabManager verwaltet Wörter, die einer Speech-Engine bekannt sind bzw. von 

der eine Engine weiß, wie diese Wörter betont werden, welche Stellung sie in einem 

Satz haben und weitere Informationen über das entsprechende Wort. Es ist allerdings 

nicht zwingend, daß ein VocabManager mit einer bestimmten Engine verbunden ist. 

Wörter werden vom VocabManager als Tokens behandelt. Diese Token sind dem 

VocabManager bekannt. Außerdem sind ihm auch noch weitere Informationen – z.B. 

Betonung, grammatikalische Bedeutung im Satz und die Aussprache – zu den entsprechenden 

Token bekannt. 

Meist wird dieser Manager verwendet, wenn eine Engine nicht in der Lage ist, 

die Betonung eines Tokens zu erraten¨. Dies sind meist aber dann schon schwierigere 

Worte, die intern in einer bestimmten Liste verarbeitet werden. 

Eine weitere Möglichkeit der Unterstützung des VocabManagers ist das hinzufügen 

oder Löschen von bestimmten Token. So kann der VocabManager neue Token lernen, 

in dem man das Token mit den entsprechenden Informationen neu eingibt. Außerem 

kann man sich eine Liste der Problem-Tokenäugeben lassen. Dazu nutzt man die 

Funktion listProblemWords().

3 SPEECH 12 

Tab. 3: Methodenzusammenfassungdes VocabManagers 

void addWords(Word[] w) 

fügt mehrere Worte dem VocabManager hinzu 

void addWord(Word w) 

fügt eine Wort dem VocabManager hinzu 

Word[] getWords(String text) man erhält alle Worte aus dem Vokabular des 

VocabManagers, die den String text enthalten 

Word[] listProblemWords() 

Man erhält eine Liste mit den Token, die dem 

VocabManager nicht bekannt sind 

void removeWords(Word[] w) 

löscht mehrere Worte aus dem Vokabular des 

VocabManager heraus 

void removeWord(Word w) löscht ein Wort aus dem Vokabular des 

VocabManagers heraus

3 SPEECH 13 

3.2 Klassen 

3.2.1 AudioAdapter 

Ein AudioAdapter ist eine Abwandlung des AudioListeners. Auch er reagiert auf 

Audio-Ereignisse. Der eigentliche Unterschied zwischen AudioAdapter und AudioListener 

besteht darin, daß man den AudioAdapter nach eigenen Bedürfnissen anpassen kann. 

Dazu muß man die Methode(n) des AudioAdapters überschreiben. Außerdem wird 

der AudioAdapter durch den RecognizerAudioAdapter erweitert. Dieser fügt dem 

AudioAdapter entsprechende Funktionalitäten hinzu, die die Spracherkennung benötigt. 

3.2.2 AudioEvent 

Ein AudioEvent ist ein Ereignis, daß mit Audio-Eingabe bzw. -Ausgaben zu tun hat. 

Die Syntax des entsprechenden Konstruktors lautet exakt: 

AudioEvent(Engine source, int id) 

Damit ist gemeint, daß source die Engine ist, die das entsprechende Ereignis 

ausführen soll. Der Paramter id beschreibt einen Typ des Audio-Ereignisses (z.B. 

das Abspielen einer Audio-Datei) 

Außerdem existiert in der Klasse AudioEvent noch die Methode paramString. 

Diese Methode erzeugt einen String, der den entsprechenden Ereignis-Typ charakterisiert. 

Man könnte z.B. damit Ereignisse protokollieren. 

3.2.3 Central 

Die Klasse Central ist die Initialisierungklasse einer Engine. Sie hat die Möglichkeit, 

eine bestimmte Engine zu finden, auszuwählen oder zu erzeugen. Dies hat den Grund, 

daß man nicht eine Engine erzeugen muß, die schon die geforderten Eigenschaften 

aufweist. Diese kann die Aufgabe dann auch übernehmen. 

Erzeugen eines Recognizers und Synthesizer Um eine Engine zu erzeugen, benutzt 

man die Methode createEngine, createRecognizer oder createSynthesizer. 

Diesen Methoden muß man einen Parameter übergeben, der den Typ EngineModeDesc, 

RecognizerModeDesc oder SynthesizerModeDesc hat. So kann man einer Engine beispielsweise 

mitteilen, daß der Synthesizer eine Ausgabe als englische Frauenstimme 

erzeugt. 

Auswahl eines Recognizers oder Synthesizer Diese Funktion ermöglicht es, 

eine Engine mit geforderten Eigenschaften auszuwählen. Dadurch kann man vermeiden, 

daß Engines mit bestimmten Eigenschaften vermehrt erzeugt werden. Wird eine 

Engine mit geforderten Eigenschaften gefunden, so wird diese für entsprechende Ereignisse 

genutzt. Findet man keine entsprechende Engine, so kann eine entsprechende 

Engine erzeugt werden.

3 SPEECH 14 

Registrierung eines Recognizers und Synthesizers Damit die Engine gesucht 

und gefunden werden kann, muß sie sich selber registrieren. Dazu wird eine interne 

Liste geführt, in der die angemeldeten Engines enthalten sind. 

Bemerkung: Eine Engine, die mit createEngine o.ä. erzeugt wurde, ist nicht 

unbedingt registriert. 

Tab. 4: Methodenzusammenfassung Central 

static EngineList 

availableRecognizers(EngineModeDesc 

require) 

static EngineList 

availableSynthesizers(EngineModeDesc 

require) 

static Recognizer 

createRecognizer(EngineModeDesc 

require) 

static Synthesizer createSynthesizer 

(EngineModeDesc require) 

static void registerEngineCentral(String 

className) 

Listet alle EngineModeDesc Objekte von 

Recognizer-Engines auf, die die geforderten 

Eigenschaften besitzen 

Listet alle EngineModeDesc Objekte von 

Sythesizer-Engines auf, die die geforderten 

Eigenschaften besitzen 

erzeugt einen Recognizer mit angegebenen 

Eigenschaften 

erzeugt einen Synthesizer mit angegebenen 

Eigenschaften 

registriert die Speech-Engine für die laufende 

Anwendung 

Bemerkung: Wenn bei der Engine-Erzeugung keine Engine erzeugt werden konnte 

(z.B. weil ein Recognizer eine ausgewählte Sprache nicht unterstützt), wird der 

Rückgabewert null ausgegeben. 


• IllegalArgumentException 

• EngineException 

• SecurityException 

3.2.4 EngineAdapter 

Ein EngineAdapter ist eine Abwandlung des EngineListeners. Auch er reagiert auf 

Zustandsänderungen einer Engine. Der eigentliche Unterschied zwischen EngineAdapter 

und EngineListener besteht darin, daß man den EngineAdapter nach eigenen Bedürfnissen 

anpassen kann, genau wie den AudioAdapter. Dazu muß man die Methode(n) 

des EngineAdapters einfach überschreiben. Außerdem wird der EngineAdapter 

durch den RecognizerAdapter und den SynthesizerAdapter erweitert. Diese fügen 

dem EngineAdapter entsprechende Funktionalitäten hinzu, die die Spracherkennung 

bzw. die Sprachausgabe benötigen.

3 SPEECH 15 

Tab. 5: Methodenzusammenfassung EngineAdapter 

void engineAllocated(EnigneEvent e) 

die Engine wurde auf Allocate 

gesetzt 

void engineAllocatingResources(EngineEvent e) die Engine wird auf Allocate gesetzt 

void engineDeallocated(EngineEvent e) 

die Engine wurde auf Deallocate 

gesetzt 

void engineDeallocatingResources(EngineEvent die Engine wird auf Deallocate 

e) 

gesetzt 

void EngineError(EngineErrorEvent e) 

Eine Fehler wurde ausgelöst und 

die Engine könnte nicht normal 

weiterarbeiten 

void EnginePaused(EngineEvent e) 

die Engine wurde angehalten 

void EngineResumed(EngineEvent e) 

die Engine wurde wieder gestartet 

3.2.5 EngineErrorEvent 

Diese Klasse gibt Auskunft, ob eine interner Fehler einer Engine aufgetreten ist, 

der das normale Weiterarbeiten dieser Engine beeinträchtigt. Das Ereignis löst ein 

Throwable-Objekt aus, welches die Informationen zu diesem Fehler enthält. Diese 

Informationen kann man durch Aufruf der Methode getEngineError erhalten. Die 

genaue Syntax dieser Methode lautet: 

Throwable getEngineError() 

Desweiteren kann man mit der zuvor schon einmal erwähnten Methode paramString 

einen String erhalten, der das Ereignis identifiziert. 

3.2.6 EngineEvent 

Diese Klasse EngineEvent meldet Statusveränderungen einer Engine an den entsprechenden 

EngineListener. 

Folgende Methoden sind in dieser Klasse enthalten: 

Tab. 6: Methoden von EngineEvent 

long getNewEngineState() 

gibt den neuen Status einer Engine aus 

long getOldEngineState() 

gibt den letzten Status einer Engine aus 

String paramString() 

gibt eine String aus, der das Event identifiziert 

3.2.7 EngineList 

Die Klasse EngineList enthält eine Liste von Beschreibungen aller genutzter Engines. 

Man erhält eine Liste von Objekten von Typ EngineModeDesc. Für jeden Enginetyp 

wird eine eigene Liste erzeugt.

3 SPEECH 16 

Tab. 7: Methodenzusammenfassung von EngineList 

boolean anyMatch(EngineModeDesc gibt true aus, wenn die Eigenschaft in der 

require) 

Liste enthalten ist 

void orderByMatch(EngineModeDesc Sortiert die Liste, daß die gesuchten Elemente 

require) 

am Kopf der Liste stehen 

void rejectMatch(EngineModeDesc Entfernt Einträge aus der Liste, die den angegebenen 

Bedingungen entsprechen 

require) 

void requireMatch(EngineModeDesc Entfernt die Einträge aus der Liste, die auf 

require) 

die angegebene Eigenschaft nicht haben 

3.2.8 EngineModeDesc 

Die Klasse EngineModeDesc verwaltet die Informationen über die Betriebsart einer 

benutzten Speech-Engine. Mit Hilfe der Methode availableSynthesizer und 

availableRecognizer kann man die Informationen über die gerade benutzten Engine 

abrufen. 

Im Objekt EngineModeDesc kann man die folgenden Attribute setzen: 

• engine name 

• mode name 

• Locale 

• Running 

• Selecting 

Engine name Das Attribut Engine Name wird genutzt, wenn man einer Engine 

einen bestimmten Namen geben will. 

Mode name Das Attribut Mode Name kann dazu genutzt werden, den aktuellen 

Modus der Speech-Engine zu benennen. 

Locale Das Attribut Locale repräsentiert die benutzte Sprache nach dem ISO- 

Standard. Hier müssen die Angaben immer in Anführungszeichen gesetzt werden. 

Außerdem kann man den Ländercode optionall eingeben, falls die entsprechende Engine 

dies unterstützt. Auch dieser Code wird nach dem ISO-Standard und auch in 

Anführungszeichen eingesetzt. Z.B. würde man für das Land Canada CAëinsetzen. 

Running Boolscher Wert, der angibt, ob die Speechengine zur Zeit läuft. True falls 

sie läuft, False, falls nicht. 

Selection Man kann ein EngineModeDesc durch eine Anwendung auswählen lassen, 

wenn dies gemacht wurde, besteht die Möglichkeit die EngineModeDesc Attribute zu 

testen.

3 SPEECH 17 

Tab. 8: Constructorenzusammenfassung 

EngineModeDesc() 

Erzeugt ein EngineModeDesc Objekt und 

setzt alle Parameter auf null 

EngineModeDesc(Locale locale) 

Erzeugt ein EngineModeDesc mit der Eigenschaft 

locale 

EngineModeDesc(String engineName, Erzeugt ein EngineModeDesc mit den übergebenen 

Eigenschaften 

String modeName, Locale locale, 

Boolean running) 

Tab. 9: Methodenzusammenfassung EngineModeDesc 

booldean equals(Object anObject) gibt true aus, wenn die Parameter nicht null 

sind und eine Engine mit den entsprechenden 

Eigenschaften gefunden wurde 

String getEngineName() 

Gibt den Namen der Engine zurück 

Locale getLocal() 

Gibt die Locale-Eigenschaften der Engine 

zurück 

String getModeName() 

Gibt die Bezeichnung des Modus der entsprechenden 

Engine aus 

Boolean getRunning() 

Gibt den Status, ob die Engine läuft oder 

nicht 

boolean match(EngineModeDesc require) Bestimmt, ob EngineModeDesc alle Eigenschaften 

des Übergabeparameters definiert 

hat 

void setEngineName(String engineName) Setzt den Namen der Engine 

void setLocale(Locale locale) 

Setzt die Attribute für Locale der Engine 

void setModeName(String modeName) Setzt die Bezeichnung des Modus 

void setRunning(Boolean running) Setzt den Status der Engine auf True oder 

False

3 SPEECH 18 

3.2.9 SpeechPermission 

Diese Klasse enthält eine Art Liste aus der man entnehmen kann, ob man bestimmte 

Aktionen ausführen kann. Wenn einer Anwendung der Zugriff gewährt wurde, erhält 

sie Zugriff auf alle Resourcen, die die Engine benötigt. Wenn die Erlaubnis erteilt 

wurde, kann z. B. einen Recognizer erzeugen oder Attribute einer bestehenden Engine 

verändern. 

Tab. 10: Construktorenzusammenfassung 

SpeechPermission(String name) 

Erzeugt eine Erlaubnis mit name als Namen 

3.2.10 Word 

Die Klasse Word verwaltet folgende Information zu sprechbaren Wörtern: 

• geschriebene Form 

• gesprochene Form 

• Betonung 

• Informationen zur Grammatik 

Bemerkung Die Information über die geschriebene Form sind erforderlich. Die restlichen 

Eigenschaften sind optional. Üblicherweise sind mehr Eigenschaften angegeben. 

Es wird erlaubt mehrere Betonungen und grammatische Formen. 

• abbreviation – Beispiel: Mr., USA 

• adjective – Beispiel: rot, erster, hübsch 

• adverb – Beispiel: langsam, laut 

• auxiliary – Beispiel: haben, sein 

• cardinal – Beispiel: eins, zwei 

• conjunction – Beispiel: und, oder, wenn 

• contraction – Beispiel: don´t, can´t, (im Deutschen meist nur Umgangssprachlich) 

• determiner – Beispiel: der, die, das, einige 

• dont care 

• noun – Beispiel: Haus, Hund, Auto 

• other

3 SPEECH 19 

• preposition – Beispiel: für, mit, als 

• pronoun – Beispiel: mich, dich, uns 

• proper adjective – Beispiel: britisch, deutsch 

• proper noun – Beispiel: Singapur, England 

• unknown 

• verb – Beispiel: reiten, lachen, laufen 

Tab. 11: Methodenzusammenfassung 

long getCatagories() 

Gibt die grammatikalische Kategorie eines 

Wortes an 

String[] getPronunciations() 

Fragt die Betonungen eines Wortes ab 

String getSpokenForm() 

Fragt die gesprochene Form eines Wortes ab 

String getWrittenForn() 

Fragt die geschriebene Form eines Wortes ab 

void setCatagories(long cat) 

Setzt die grammatikalische Typ eines Wortes 

void setPronunciations(String[] pron) Legt die Betonungsarten eines Wortes fest 

void setSpokenForm(String text) Legt die Aussprache eines Wortes fest 

void setWrittenForm(String text) Bestimmt die geschriebene Form eines Wortes

3 SPEECH 20 

3.3 Ausnahmen 

AudioException 

EngineException 

SpeechException 

VendorException 

Tab. 12: Liste der Ausnahmen 

fängt Fehler ab, die bei der Verbindung zur Engine 

auftreten können 

zeigt an, daß bei Erzeugung einer Engine oder beim 

Zugriff auf eine Engine ein Fehler aufgetreten ist 

signalisiert, wenn ein Fehler in Bezug auf Speech 

(allgemein) aufgetreten ist 

zeigt an, wenn ein Fehler beim Laden / Speichern 

von Hersteller-Spezifischen Daten auftritt (Import- 

Daten)

3 SPEECH 21 

3.4 Fehler 

EngineStateError 

SpeechError 

Tab. 13: Fehler in Java-Speech 

wird ausgelöst, wenn eine Methode einer Engine 

falsch aufgerufen wird 

wird ausgelöst, wenn ein allgemeiner Fehler in Java- 

Speech aufgetreten ist

4 JAVA-SPEECH-SYNTHESIZE 22 

4 Java-Speech-Synthesize 

4.1 Interfaces 

4.1.1 Speakable 

Ein Objekt dieses Interfaces unterstützt die speak-Methode des Synthesizer. Der Text 

wird durch die getJSML Methode erreicht und durch diese so umgeformt, so daß er 

gesprochen werden kann. Fast alle Java-Objekte können mit diesem Interface implementiert 

werden. 

Bemerkung: JavaSpeechMarkupLanguage (JSML) hält sich an den Unicode und 

enthält Texte aus einfachen Sprachen, wie die Sprache vom Synthesizer. Der Text ist 

unabhängig von der Ausgabe des Synthesizers, das heíßt zum Beispiel das ein Satz 

oder eine bestimmte Redewendung als ein Objekt behandelt wird. Mit Hilfe der JavaSpeechMarkupLanguage 

ist es unter anderem möglich die Betonung einzelner Wörter, 

sowie die Geschwindigkeit mit der sie gesprochen werden zu manipulieren. Von der 

Syntax ist sie mit Html zu vergleichen, da sie beide von der StandardGeneralized- 

MarkupLanguage (SGML) abstammen. Wer näheres über JSML wissen will, sollte auf 

der Java-Speech Homepage http://java.sun.com/products/java-media/speech/ 

vorbeischauen. Dort findet man die Spezifikation von JSML. 

Tab. 14: Methodenzusammenfassung 

String getJSMLText() 

Gibt einen Text im JSML-Format zurück. 

getJSMLText Diese Methode wird sofort aufgerufen, wenn ein Speakable-Objekt 

vom Synthesizer ausgesprochen werden soll. Der entsprechende Text wird in der Warteschlange 

des Synthesizers hinterlegt. 

4.1.2 SpeakableListener 

Der SpeakableListener reagiert auf Ereignisse während der Ausgabe eines Speakable. 

Ereignisse können z. B. sein: 

• Aufruf der Methode speak oder speakPlainText 

• Hinzufügen eines SpeakableListener zu einem Synthesizer


Tab. 15: Methodenzusammenfassung des SpeakableListener 

void markerReached(SpeakableEvent e) 

Eine Markierung wurde erreicht 

void speakableCancelled(SpeakableEvent e) Eine Ausgabe wurde abgebrochen 

void speakableEnded(SpeakableEvent e) 

Die Ausgabe wurde beendet 

void speakablePaused(SpeakableEvent e) Die Ausgabe wurde angehalten 

void speakableResumed(SpeakableEvent e) Eine angehaltene Ausgabe wurde 

fortgestzt 

void speakableStarted(SpeakableEvent e) Die Ausgabe wurde gestartet 

void topOfQueue(SpeakableEvent e) Ein bestimmtes Element ist am 

Kopf der Warteschlange angekommen 

void wordStarted(SpeakableEvent e) 

Die Ausgabe eines Wortes wurde angefangen 

Methoden Genauere Angaben zu den Methoden auf Seite 

4.1.3 Synthesizer 

Die Synthesizer-Schnittstelle macht erst möglich Sprache zu erzeugen. Der Synthesizer 

ist eine Erweiterung des Engine Interface mit entsprechend zusätzlichen Fähigkeiten. 

Außerdem kontrolliert die Ausgabe von Objekten aus der Queue. 

Erzeugen eines Synthesizer Üblicherweise wird ein Synthesizer durch die createSynthesizer 

Methode des Central Interface. Desweiteren werden diverse Klassen einer Engine um 

bestimmte Eigenschaften erweitert: 

• EngineModeDesc wird zu SynthesizerModeDesc erweitert 

• EngineListener wird zu SynthesizerListener erweitert 

• Methoden wie allocate, deallocate, pause, resume können analog genutzt 

werden 

Text sprechen 

Es gibt drei Möglichkeiten Text als Sprache auszugeben: 

1. speakPlainText 

2. Ausgabe eines JSML-Objektes 

3. Ausgabe eines Speakable-Objektes von einer URL 

Beispiel für speakPlainText 

synthesizer.speakPlainText( " 

The Computer can speak on Jan. 1999\, null);


Beispiel für speak 

synthesizer.speak( " 

The Computercan speak \, null); 

Das Tag ... kennzeichnet einen Satz. Mit Hilfe von ... 

kann einem Wort eine stärkere Betonung verliehen werden. Hierbei kann man auch 

angeben wie stark das Wort betont werden soll. Für die Bedeutung der einzelnen Tags 

und ihrer Attribute sollte man auch in die JSML-Spezifikation schauen. 

Ein Synthesizer ist einsprachig, d.h. er kann Text nur in einer Sprache ausgeben. 

Benötigt eine Anwendung mehr als eine Sprache, so müssen mehrere Synthesizer 

erzeugt werden. Die Sprache die der Synthesizer nutzt, sollte bei der Erzeugung ausgewählt 

werden. Jedes Objekt wird unabhängig von anderen Objekten ausgesprochen. 

Synthesizer-Zustände 

Die vier Grundzustände sind: 

• allocate 

• deallocate 

• queue empty 

• queue not empty 

Desweiteren gibt es ebenfalls die zwei Unterzustände von allocate (pause, resume). 

Speech Output Queue Der Status der Warteschlange wird durch queque empty 

bzw. queque not empty angegeben. 

4.1.4 SynthesizerListener 

Das Interface SynthesizerListener erweitert den EngineListener um zwei Methoden: 

• queueEmptied (SynthesizerEvent e) [Typ void] 

• queueUpdated (SynthesizerEvent e) [Typ void] 

Ein Queue Emptied Ereignis zeigt an, wenn dei Text-Queue leergelaufen ist, ein 

Queue Updated Ereignis zeigt an, ob sich die Warteschlange geändert hat. 

4.1.5 SynthesizerProperties 

Das Interface SynthesizerProperties erweitert EngineProperties um weitere runtime-Eigenschaften. 

Die Eigenschaften eines Synthesizers sind folgende: 

• Speaking voice


• Baseline pitch 

• Pitch range 

• Speaking rate 

• Volume 

Tab. 16: Methodenzusammenfassung des SynthesizerProperties 

float getPitchRange() 

ermittelt den Pegelbereich zur Synthese 

float getPitch() 

ermittelt den Grundpegel 

float getSpeakingRate() 

ermittelt die aktuelle Sprechrate 

voice getVoice() 

bestimmt die aktuelle Stimme des Synthesizer 

float getVolume() 

ermittelt die aktuelle Lautstärke 

void setPitchRange (float hertz) Setzt den Pegelbereich des Synth. in Hertz 

void setPitch (float hertz) Setzt den Grundpegel in Hertz 

void setSpeakingRate (float wpm) Setzt die Sprechgeschwindigkeit zur Synthese in 

Wörtern p. Minute 

void setVoice(Voice voice) Setzt die aktuelle Stimmlage 

void setVolume(float volume) Setzt die Lautstärke des Synthesizer (zwischen 0.0 

und 1.0). 0.0 bedeutet kein Ton


4.2 Klassen 

4.2.1 SynthesizerAdapter 

Der SynthesizerAdapter erweitert den EngineAdapter und implementiert 

SynthesizerListener. Es handelt sich um einen Adapter, der Ereignisse empfängt, 

die mit Synthesizer zusammenhängen. Die Methoden in dieser Klasse sind leer und 

nur dazu gedacht, auf einfache Art und Weise Listeners zu schaffen und die Klasse zu 

erweitern. 

Tab. 17: Methodenzusammenfassung des SynthesizerAdapter 

void queueEmptied(SynthesizerEvent e) Die Text-Warteschlange ist leer 

void queueUpdated(SynthesizerEvent e) Die Text-Warteschlange hat sich geändert 

4.2.2 SynthesizerEvent 

Die Klasse SynthesizerEvent erweitert die Klasse EngineEvent um einige Ereignisse, 

die speziell für Sprachsynthese verwandt werden. Es werden zwei Methoden 

aungegeben: zum einen getTopOfQueueChanged() [Typ boolean], die angibt, ob 

sich der Anfang der Warteschlange verändert hat oder nicht. Die zweite Methode 

ist param.String() [Typ java.lang.String]. Diese gibt einen Parameterstring 

zurück, der den entspr. Event beschreibt. Zu den beiden Methoden kommen noch 

drei Felder: Queue Emptied (Typ static int), Queue Updated (static int) und 

topOfQueueChanged (boolean). Der erste Wert zeigt an, ob die Queue leer ist, der 

zweite ob die sich verändert hat und der dritte Wert zeigt an, ob sich das erste Element 

der Queue verändert hat. 

4.2.3 SynthesizerModeDesc 

SynthesizerModeDesc erweitert EngineModeDesc um zwei Eigenschaften: 

• Eine Liste der vom Synthesizer zur Verfügung gestellten Stimmen 

• Die Definition der Stimme, die der Synthesizer beim Start lädt


Tab. 18: Methodenzusammenfassung der SynthesizerModeDesc 

void addVoice(Voice v) 

Fügt eine Stimme zu der Liste der bestehenden 

Stimmen hinzu 

boolean equals(java.lang.Object Liefert den Wert true zurück, wenn der Parameter 

nicht NULL ist 

anObject) 

Voice[] getVoices() 

Gibt eine Liste der verfügbaren Stimmen 

zurück 

boolean match(EngineModeDesc require) Bestimmt, ob ein SynthesizerModeDesc alle 

Features besitzt, die vom require-Objekt 

benötig werden 

void setVoices(Voice[] v) 

Bestimmt eine Liste von Stimmen 

4.2.4 SynthesizerQueueItem 

Die Klasse SynthesizerQueueItem repräsentiert ein Objekt in der Sprachausgabe- 

Queue eines Synthesizer. Das Quellobjekt wird von der speak methode zur Verfügung 

gestellt. Dabei kann es sich um ein ¨speakable-Object¨, eine URL oder einen String 

handeln. 

Tab. 19: Methodenzusammenfassung für SynthesizerQueueItem 

java.lang.Object getSource() 

Gibt das Quelle eines in der Sprach-Queue 

des Synthesizer befindlichen Objekts zurück 

SpeakableListener 

Gibt das SpeakableLinstener objekt 

getSpeakableListener() 

zurück, oder null, falls in der Speak Method 

keines definiert ist. 

java.lang.String getText() 

Gibt einen sprechbaren Text zurück 

boolean isPlainText() 

Gibt true zurück, falls es sich um reinen Text 

(kein Java Speech Markup Language) handelt 

4.2.5 Voice 

Die umfassenste Klasse innerhalb des Synthesizers ist die Klasse 

javax.speech.synthesis.Voice. Bei ihr handelt es sich um eine Beschreibung einer 

Ausgabestimme des Sprachsynthesizer. Eine aus 11 Feldern bestehende Liste 

ermöglicht es, die Stimme, die der Synthesizer annehmen soll, gezielt zu bestimmen. 

Es ist möglich, die Stimmcharakteristik des Synthesizers auf ein Kind im Alter von 12 

Jahren einzustellen, (AGE CHILD), auf einen Erwachsenen zwischen 40 und 60 Jahren, 

einen alten Erwachsenen, männlich oder weiblich, oder neutral einzustellen.


Beispiel 

import javax.speech.*; 

import javax.speech.synthesis.*; 

import java.util.Locale; 

} 

class sprachsynthese { 

static Synthesizer synthesizer; 

static AudioListener audioListener; 

static EngineListener engineListener; 

public static void main(String[] args) throws Exception { 

//mache eine neue EngineModeDesc 

SynthesizerModeDesc desc = new SynthesizerModeDesc(); 

//mache neues Voice-Objekt 

Voice voice = new Voice(); 

//setzte das geschlecht (weiblich) und das alter (sehr alt) 

voice.setGender(2); 

voice.setAge(69); 

//füge voice zu den bestehenden Voice-Objekten hinzu 

desc.addVoice(voice); 

//setzte als Locale Deutsch 

desc.setLocale(Locale.GERMAN); 

//Erzeuge den Synthesizer 

Synthesizer synthesizer = Central.createSynthesizer(desc); 

synthesizer.allocate(); 

synthesizer.speakPlainText( " 

Das ist ein Test\, null); 

synthesizer.waitEngineState(synthesizer.QUEUE EMPTY); 

synthesizer.deallocate(); 

}

Java-Speech-Spezifikation

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?