MBROLA evaluatie
MBROLA evaluatie
MBROLA evaluatie
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Bij de <strong>evaluatie</strong> blijkt meteen al dat de pauzes waar we mee begonnen<br />
waren, veel te lang zijn. Nadat we deze pauzes aanmerkelijk verkort hebben<br />
(tot zo’n 25 ms) klinkt de spraak al veel natuurlijker. Bij een tweede maal<br />
beluisteren van de uitspraak blijkt een pauze van 25 ms (voor en na een<br />
woord) te kort te zijn. Door deze waarde aan te passen tot 30 ms wordt dit<br />
probleem verholpen. Een oplossing voor het aangeven van het begin en eindpunt<br />
van een zin is het verwerken van punten en komma’s in de lettergreepherkenner/<br />
transducer. In de lettergreepherkenner moet dan aangegeven<br />
worden dat een lettergreep mogelijk gevolgd kan worden door een punt of<br />
een komma, in de transducer worden de punten en komma’s omgezet in een<br />
stilte/ pauze.<br />
Na een eerste maal de omzetting beluisterd te hebben blijkt dat de<br />
gegeven output al redelijk goed klinkt: alle woorden worden correct en<br />
duidelijk uitgesproken (de goede difonen worden gebruikt). Het valt wel<br />
op dat het woord ’een’ steeds omgezet wordt in ’één’, terwijl dat niet de<br />
bedoeling is in de meeste gevallen (wel bij ’Taal in een hand’, maar niet<br />
bij ’een man’). Daarnaast wordt ’zo’n’ omgezet met een ’korte /o/’, wat<br />
klopt als we de transducer bekijken (het is immers voor de omzetter geen<br />
open /o/), maar niet als we het resultaat beluisteren. Verder worden alle<br />
woorden goed en volledig uitgesproken. Het ziet er naar uit alsof voor alle<br />
fonemen/clusters de goede difonen gebruikt zijn. Wel moet opgemerkt worden<br />
dat de lettergrepen/ monosyllabische woorden die volgen op ’de’ wat<br />
rommelig uitgesproken worden. Dit heeft niet te maken met de omzetting<br />
voor ’de’, deze is namelijk /d@/, maar misschien wel met de gekozen duur<br />
voor ’sjwa’. Als we de duur bijvoorbeeld met 10 ms verlengen (respectievelijk<br />
60 ms wordt 70 ms) is dit probleem misschien verholpen.<br />
Nog een punt wat opgemerkt dient te worden is het volgende: bij het<br />
maken van de transducer die de foneemnotatie naar een <strong>MBROLA</strong>-notatie<br />
moest omzetten, hebben we de toonhoogtebewegingen binnen woorden bewust<br />
achterwege gelaten. Deze toonhoogtecontouren waren namelijk alleen<br />
handig op los uitgesproken woorden: wanneer woorden in zinnen voorkomen<br />
moeten de zinnen toch hun eigen toonhoogtecontour krijgen en zouden de<br />
individuele contouren weer komen te vervallen. Wat echter ook bleek, is dat<br />
wanneer de tekst werd uitgesproken met toonhoogtebeweginkjes op afzonderlijke<br />
woorden, de uitspraak heel schokkerig ging, alsof de stem af en toe<br />
bleef haperen. Na het verwijderen van toonhoogte-informatie uit de transducer,<br />
werd de spraak minder hakkerig!<br />
Ieder lid van ons groepje heeft een stuk van ’Taal met een hand’ voor<br />
zijn/haar rekening genomen en daar het volgende over verteld:<br />
4