MBROLA evaluatie
MBROLA evaluatie
MBROLA evaluatie
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>MBROLA</strong> <strong>evaluatie</strong><br />
Groep 2<br />
20-3-2004<br />
De afgelopen weken zijn we bezig geweest met het maken van een automatische<br />
vertaalslag voor eenlettergrepige woorden uit het Nederlands naar een<br />
notatie die door het spraaksynthesesyteem <strong>MBROLA</strong> gebruikt kan worden<br />
als input.<br />
Uiteindelijk hebben we een aantal finite-state automaten gemaakt waarin<br />
rekening wordt gehouden met de duren van afzonderlijke woorden. Wanneer<br />
we gehele zinnen met onze automaten zouden omzetten en laten uitspreken<br />
door <strong>MBROLA</strong>, dan zouden we erg onnatuurlijk klinkende spraak krijgen.<br />
Dat komt door het ontbreken van goede zins-intonatiepatronen en goede<br />
duren van en pauzes tussen woorden.<br />
We hebben het volgende stuk tekst, opgebouwd uit eenlettergrepige woorden,<br />
inderdaad door onze automaten laten “vertalen” en door <strong>MBROLA</strong><br />
laten uitspreken:<br />
Taal met een hand.<br />
Whales for the Welsh is een vreemd boek. Er komt niet een<br />
lang woord in voor. Elk woord in dat boek is kort. Als men het<br />
leest weet men eerst niet wat het is, en dan moet men vaak ha!<br />
ha! doen, want het staat erg raar, een heel boek met elk woord<br />
zo kort. Vaak is het net of een kind het zegt en het geeft ook een<br />
soort toon van spot; het viel mij op dat het soms lijkt op de stijl<br />
van Piet Grijs. Ik weet niet goed hoe dat komt.<br />
Wat staat er in dat boek? Er staat in van een man die Llew<br />
Jones heet (in de taal van dat boek — want dat is niet de taal<br />
van ons land — is Jones ook een kort woord dat je in een keer<br />
zegt net als bij ons het woord zoons) en van een soort vis die heel<br />
groot is en die zwemt bij de pool; er drijft daar heel wat ijs maar<br />
die vis heeft veel spek en dat houdt hem warm. Het is niet echt<br />
een vis maar een dier met warm bloed. ‘The Whale,’ zo staat<br />
er in dat boek, ‘has a Heart with four Parts, like the heart of a<br />
Young Girl, Lungs like the lungs of a Horse and Ears like the<br />
Ears of a Mole. It has no Scales like the scales of a True Fish,<br />
1
ut it has Hair like the Hair of a Hare, While still in the Womb<br />
...’<br />
Dat is, in de taal van ons moer: ‘In het hart van dit dier is<br />
vier maal een vak, als in het hart van een jong wijf, de long is<br />
als de long van het paard en het oor als het oor van een mol. Op<br />
zijn lijf zit niet een schub als op het lijf van een vis die echt een<br />
vis is, maar het heeft haar als het haar van een haas als het nog<br />
zit in de buik van zijn ma ...’<br />
Die Llew Jones was een Bard, dat is een man die dicht, zo zijn<br />
er veel in Wales, want hij kwam uit Wales. En Llew Jones wou<br />
rood vlees op het bord van elk mens in zijn land, hij dacht: wie<br />
veel rood vlees eet wordt flink. Maar vlees is duur. Hoe kom je<br />
aan zo veel vlees? Toen dacht hij aan vlees uit de zee, het vlees<br />
van die vis met een hart als een jong wijf.<br />
Hij vindt dus een schip en dat schip brengt zo’n vis mee naar<br />
huis uit de zee bij de pool. Dat vlees van die vis blijft wel goed<br />
door het ijs dat daar drijft, dacht Llew Jones. Maar Jones had<br />
het mis: door het spek blijft het lang warm in de buik van die<br />
vis, nog wel een week na zijn dood. Zo kwam al vlug de rot in<br />
die vis en de lucht werd zo slecht dat er geen net woord voor is.<br />
Het vlees uit zee komt aan in Wales maar met zo’n leeuw van<br />
een stank dat geen hond het meer wil. Al wie het rook lei zijn<br />
hand op zijn neus en werd boos op Llew Jones. Een man gooit<br />
een steen naar zijn hoofd en nog een man knijpt met een hand<br />
zijn neus dicht, pakt een stuk van dat vlees en ook dat krijgt Llew<br />
Jones naar zijn kop.<br />
Nu wordt, door een heel klein soort beest in de darm van die<br />
vis, het vlees snel tot gif. Komt dat gif in een wond dan volgt<br />
de dood door koud vuur. Zo ging het ook met Llew Jones: ‘Next<br />
day Llew Jones was Sick. His skin was Hot and Wet. His eyes<br />
were Moist and Dim. His Breath came in Gasps.’ (De dag er na<br />
werd Jones ziek. Zijn huid was heet en klam. Zijn oog werd nat<br />
en dof. Hij hijgt en hapt naar lucht.) ‘Now they have a Test in<br />
Wales for Who is and Who is not a True Bard, and it is a test<br />
which does not Let You Down. Though they give a Prize each<br />
year to help a Bard, if a True Bard, to get a Good start in Life,<br />
they know that you have to wait till he is Dead if you want to be<br />
Quite Sure. The Test is: Were his Last Words Great Words?’<br />
(Nu is er in Wales een proef op de som om te zien wie echt een<br />
2
Bard was en wie met, en het is een proef die nooit faalt. Schoon<br />
elk jaar een bard een prijs krijgt om hem, zo hij echt een Bard<br />
is, tot steun te zijn op zijn weg, weet elk dat hij eerst dood moet<br />
zijn voor men er echt op aan kan. Die proef op de som is: was<br />
het woord dat hij het laatst sprak een groot woord?)<br />
En Jones blijkt echt een Bard want hij spreekt een groot woord<br />
als hij sterft. Wie wil zien wat dat was kijkt maar in het boek,<br />
want het is nog te koop. Als men het uit heeft denkt men nog<br />
lang net als ik nu schrijf. Het brein komt in de ban van die taal.<br />
In die taal is er van elk ding nog maar een, want twee of meer<br />
kan haast nooit. Het is iets als een taal met maar een hand, een<br />
taal die hinkt.<br />
Met de editor Fluency hebben we de bovenstaande tekst opnieuw laten<br />
uitspreken 1 , zodat we het resultaat met onze eigen, door <strong>MBROLA</strong> geproduceerde,<br />
spraak konden vergelijken. Zo hopen we nu wat te kunnen zeggen<br />
over wat er aan “onze” spraak nog veranderd moet worden wat toonhoogte<br />
en duur betreft.<br />
Enkele algemene opmerkingen<br />
De door ons gebruikte tekst bevat vrij veel Engelse woorden. Deze worden<br />
niet goed uitgesproken om de volgende 2 redenen:<br />
1. Wij hebben een transducer voor de grafeem-foneemomzetting gemaakt<br />
die alleen rekening houdt met Nederlandse woorden. Engelse woorden<br />
zullen dus, tenzij ze in de uitzonderingenlijst van de transducer staan,<br />
worden omgezet naar een Nederlandse uitspraak. Dit probleem hebben<br />
we hier nog weten te omzeilen door in de tekst zelf de Engelse woorden<br />
te vervangen door woorden Nederlandse (onzin)woorden die qua<br />
uitspraak het dichtst bij de Engelse liggen. Merk op dat dit wel een<br />
erg “Hollands klinkende” Engelse uitspraak tot gevolg had;<br />
2. <strong>MBROLA</strong> heeft voor de spraaksynthese de beschikking over een Nederlandse<br />
difoonset. Hierdoor krijgen de Engelse woorden sowieso een<br />
”Hollands-klinkendeüitspraak.<br />
In het vervolg van deze <strong>evaluatie</strong> zullen we dan ook alleen ingaan op de<br />
nederlandstalige zinnen.<br />
1 In Fluency is het mogelijk om te kiezen welk soort stem de synthese uitspreekt: man,<br />
vrouw, jongen, meisje, robot etc. Daarnaast is het mogelijk om de manier waarop iemand<br />
het uitspreekt in te stellen: normaal, levendig etc. Er is gebruik gemaakt van de<br />
mannenstem (normaal).<br />
3
Bij de <strong>evaluatie</strong> blijkt meteen al dat de pauzes waar we mee begonnen<br />
waren, veel te lang zijn. Nadat we deze pauzes aanmerkelijk verkort hebben<br />
(tot zo’n 25 ms) klinkt de spraak al veel natuurlijker. Bij een tweede maal<br />
beluisteren van de uitspraak blijkt een pauze van 25 ms (voor en na een<br />
woord) te kort te zijn. Door deze waarde aan te passen tot 30 ms wordt dit<br />
probleem verholpen. Een oplossing voor het aangeven van het begin en eindpunt<br />
van een zin is het verwerken van punten en komma’s in de lettergreepherkenner/<br />
transducer. In de lettergreepherkenner moet dan aangegeven<br />
worden dat een lettergreep mogelijk gevolgd kan worden door een punt of<br />
een komma, in de transducer worden de punten en komma’s omgezet in een<br />
stilte/ pauze.<br />
Na een eerste maal de omzetting beluisterd te hebben blijkt dat de<br />
gegeven output al redelijk goed klinkt: alle woorden worden correct en<br />
duidelijk uitgesproken (de goede difonen worden gebruikt). Het valt wel<br />
op dat het woord ’een’ steeds omgezet wordt in ’één’, terwijl dat niet de<br />
bedoeling is in de meeste gevallen (wel bij ’Taal in een hand’, maar niet<br />
bij ’een man’). Daarnaast wordt ’zo’n’ omgezet met een ’korte /o/’, wat<br />
klopt als we de transducer bekijken (het is immers voor de omzetter geen<br />
open /o/), maar niet als we het resultaat beluisteren. Verder worden alle<br />
woorden goed en volledig uitgesproken. Het ziet er naar uit alsof voor alle<br />
fonemen/clusters de goede difonen gebruikt zijn. Wel moet opgemerkt worden<br />
dat de lettergrepen/ monosyllabische woorden die volgen op ’de’ wat<br />
rommelig uitgesproken worden. Dit heeft niet te maken met de omzetting<br />
voor ’de’, deze is namelijk /d@/, maar misschien wel met de gekozen duur<br />
voor ’sjwa’. Als we de duur bijvoorbeeld met 10 ms verlengen (respectievelijk<br />
60 ms wordt 70 ms) is dit probleem misschien verholpen.<br />
Nog een punt wat opgemerkt dient te worden is het volgende: bij het<br />
maken van de transducer die de foneemnotatie naar een <strong>MBROLA</strong>-notatie<br />
moest omzetten, hebben we de toonhoogtebewegingen binnen woorden bewust<br />
achterwege gelaten. Deze toonhoogtecontouren waren namelijk alleen<br />
handig op los uitgesproken woorden: wanneer woorden in zinnen voorkomen<br />
moeten de zinnen toch hun eigen toonhoogtecontour krijgen en zouden de<br />
individuele contouren weer komen te vervallen. Wat echter ook bleek, is dat<br />
wanneer de tekst werd uitgesproken met toonhoogtebeweginkjes op afzonderlijke<br />
woorden, de uitspraak heel schokkerig ging, alsof de stem af en toe<br />
bleef haperen. Na het verwijderen van toonhoogte-informatie uit de transducer,<br />
werd de spraak minder hakkerig!<br />
Ieder lid van ons groepje heeft een stuk van ’Taal met een hand’ voor<br />
zijn/haar rekening genomen en daar het volgende over verteld:<br />
4
1 Eduard Kleerekoper<br />
Zin 1: Taal met een hand.<br />
Zoals onze Graph-fon omzetter elke ’een’ omzet naar ’één’, zo zet Fluency<br />
dit woord om in un’, dus met een sjwa. Door in de fonetische transcriptie<br />
van deze ’@’ een ’e’ te maken en er een accent (*) voor te zetten, klinkt deze<br />
zin, de titel zo goed als natuurlijk.<br />
Zin 2: Whales for the Welsh is een vreemd boek.<br />
Ingevoerd als: “Weels voor de Welsj is een vreemd boek.” Wat opvalt is<br />
dat de ’sj’ van ’Welsj’ gecoarticuleerd wordt uitgesproken met de ’i’ van is,<br />
terwijl hier in natuurlijke taal een korte pauze gehouden zal worden om aan<br />
te geven dat Whales for the Welsh een naam is. Ik heb daarom een glottale<br />
stop ingevoegd van 50 ms en de toonhoogte op de ’E’ van ’Welsj’ even voor<br />
deze stop op neutraal gezet zodat deze het woord is niet zou beinvloeden.<br />
Zin 3: Er komt niet een lang woord in voor.<br />
Evenals bij de eerste zin wordt een’ uitgesproken als un’ en wordt dit veranderd<br />
van @’ in *e’. Verder klinkt het natuurlijker wanneer de lengte van de<br />
t’ in niet’ wordt verkort van 135 naar 65 ms.<br />
Zin 4: Elk woord in dat boek is kort.<br />
De nadruk moet hier gelegd worden op elk’, dit is te doen met een accentteken<br />
(*) voor dit woord. Het is erg lastig om bij deze zin te bepalen wat er<br />
wel en niet goed wordt uitgesproken. Het enige dat ik heb veranderd is de<br />
lengte van de o’ in kort’ van 97 naar 45 ms.<br />
Zin 5: Als men het leest weet men eerst niet wat het is, en dan moet<br />
men vaak ha! ha! doen, want het staat erg raar, een heel boek met elk<br />
woord zo kort.<br />
Het accent (*) op weet’ heb ik vervangen door een lichter accent () zodat<br />
er minder nadruk op ligt. Ook heb ik een toonhoogte pitch toegevoegd<br />
op het woord niet’ en de toonhoogte verlaagd vlak voor het einde van de zin<br />
die gemarkeerd is met een komma. De uitroeptekens na ha’ laat Fluency<br />
denken dat daar de zin afgelopen is, hiertegen heb ik deze uitroeptekens<br />
5
verwijderd en de duren van beide a’s in ha’ verkort naar 110 ms. Verder heb<br />
ik de toonhoogte pitch van raar’ iets naar voren getrokken (waardoor dus<br />
de toonhoogte eerder op het woord ligt). Als laatste heb ik de toonhoogte<br />
op het eind van het woord kort’ verhoogd wat een effect geeft alsof iemand<br />
verbijsterd is van de korte woorden (z kort?!).<br />
Zin 6: Vaak is het net of een kind het zegt en het geeft ook een soort<br />
toon van spot; het viel mij op dat het soms lijkt op de stijl van Piet Grijs.<br />
Het accent op kind’ heb ik iets vervroegd en iets omhoog gezet. Het tegenovergestelde<br />
heb ik gedaan met zegt’ en hierachter een glottale stop van<br />
150 ms toegevoegd. De toonhoogte op ’geeft’ iets vervroegd en op ook iets<br />
verhoogd. Het lichte accent () op op’ vervangen door een sterker accent (*).<br />
Ook heb ik als test de duren van de woorden het’, soms’ en op’ verkort naar<br />
ongeveer tweederde van de oorspronkelijke duren, wat een veel natuurlijker<br />
resultaat opleverde.<br />
Zin 7: Ik weet niet goed hoe dat komt. Het sterke accent op weet’ heb<br />
ik veranderd in een licht accent en het omgekeerde bij komt’. Tevens heb ik<br />
de duren van t’ in weet’ en u’ in hoe’ verkort naar ongeveer tweederde.<br />
Zin 8: Wat staat er in dat boek? Het enige dat ik wilde aanpassen was het<br />
lichte accent op staat’ door een sterk accent.<br />
Er staat in van een man die Llew Jones heet (in de taal van dat boek<br />
— want dat is niet de taal van ons land — is Jones ook een kort woord dat<br />
je in een keer zegt net als bij ons het woord zoons) en van een soort vis die<br />
heel groot is en die zwemt bij de pool; er drijft daar heel wat ijs maar die vis<br />
heeft veel spek en dat houdt hem warm. Als eerste heb ik een sterk accent<br />
op in’ geplaatst en een glottale stop (150 ms) erachter gezet. De toonhoogte<br />
op heet’ heb ik verhoogd omdat dit als een eind van een zin telt. Ik heb<br />
het sterke accent op ’taal’ vervangen door licht accent en een sterk accent<br />
geplaatst op het woord ons’. Verder heb ik de duren van elk woord tussen<br />
de komma’s/ streepjes korter gemaakt, zodat het meer als een toevoeging<br />
klinkt. Ik heb vervolgens een sterk accent geplaatst op ook’, van een’ n’<br />
gemaakt, een accent gelegd op ons’ en de toonhoogte van zoons’ omhoog<br />
gezet.<br />
Bij het daadwerkelijke tweede deel van de hoofdzin heb ik een sterk accent<br />
op ’en’ gezet, een licht accent op soort’ het accent op pool’ vervroegd<br />
en een pauze van 50 ms toegevoegd. Als laatste heb ik nog een sterk accent<br />
6
op heel’ gelegd, een pauze (//) na ijs’ toegevoegd en een sterk accent op dat’<br />
gelegd.<br />
Zin 9: Het is niet echt een vis maar een dier met warm bloed.<br />
Door een komma toe te voegen voor maar’, klopt de prosodie al aardig.<br />
Wanneer ik vervolgens de accenten op echt’, dier’ en bloed’ omwissel klinkt<br />
deze zin erg natuurlijk.<br />
Zin 10: ‘The Whale,’ zo staat er in dat boek, ‘has a Heart with four Parts,<br />
like the heart of a Young Girl, Lungs like the lungs of a Horse and Ears like<br />
the Ears of a Mole.<br />
Aangezien deze zin bijna volledig Engels is, heb ik alle Engelse woorden<br />
vervangen door overeenkomende Nederlandse woorden zodat de zin uitgesproken<br />
kan worden en toch redelijk hetzelfde blijft: De Weel, zo staat er in<br />
dat boek, heeft een hart in vier deel, als het hart van een jong vrouw, long<br />
als de long van een paard, en oor als een oor van een mol. Verrasend genoeg<br />
klonk deze vervormde zin bijna volledig natuurlijk. Slechts de toonhoogte<br />
op het woord vrouw’ moest iets naar voren geschoven worden.<br />
2 Rogier Kraf<br />
Er waren in het volgende stuk (op de Engelse woorden na) geen problemen<br />
met de grafeem-foneemomzetting. Onze transducer doet z’n werk goed!<br />
Zin 11: Dat is, in de taal van ons moer:<br />
De duur van de ’A’ uit ’dat’ is wat verlengd tot 93 ms, net als de ’I’ uit<br />
’is’, die tot 118 ms verlengd werd. Hierdoor kregen de woorden een wat<br />
minder gehaaste uitspraak en werden ze beter geaccentueerd.<br />
Zin 12: ‘In het hart van dit dier is vier maal een vak, als in het hart<br />
van een jong wijf, de long is als de long van het paard en het oor als het oor<br />
van een mol.<br />
De duur van de ’i’ uit ’vier’ is verlengd tot 150 ms, om het woord wat<br />
meer te accentueren. Het woord ’vak’ werd door Fluency iets teveel benadrukt<br />
en daarom werd de duur juist ingekort tot 79 ms voor de ’A’ en het<br />
maximum van de toonhgoogtestijging verlaagd tot 130 Hz. De ’Ei’ uit ’wijf’<br />
werd langer gemaakt (185 ms) en de toonhoogtestijging die op die klank<br />
7
lag verhoogd tot 152 Hz, zodat dit functiewoord nog meer benadrukt werd.<br />
’long’ werd ook verlengd (120 ms voor de ’O’) net als ’paard’ (156 ms voor<br />
de ’a’) en het laatste woord kreeg ook een sterker toonhoogte-accent (123<br />
Hz). Tot slot werd de ’O’ uit ’mol’ flink verlengd (tot 170 ms), ten eerste<br />
omdat het een functiewoord is, ten tweede omdat het het laatste woord uit<br />
de zin is.<br />
Zin 13: Op zijn lijf zit niet een schub als op het lijf van een vis die echt een<br />
vis is, maar het heeft haar als het haar van een haas als het nog zit in de<br />
buik van zijn ma ...’<br />
Ook in deze zin werd voor een aantal woorden de duur verlengd om ze<br />
meer accent te geven. Het waren de ’Ei’ uit ’lijf’(136 ms), de ’I’ uit ’zit’(44<br />
ms), de ’i’ uit ’die’(80 ms), de ’E’ uit ’echt’(80 ms), de ’A’ uit het tweede<br />
’als’ (69 ms), de ’a’ uit het eerste ’haar’(160 ms), de ’a’ uit ’haas’(173 ms)<br />
en de ’a’ uit ’ma’(tot 192 ms, ook omdat dit het laatste woord van de zin<br />
was).<br />
Bij sommige woorden zorgde een (sterker) toonhoogte-accent voor een<br />
nog duidelijkere spraak (duidelijker in de zin van dat de betekenis beter<br />
overgebracht werd). Het betrof hier de woorden ’zit’(108 Hz), ’echt’(109<br />
Hz), het eerste woord ’haar’(107 Hz) en ’haas’(123 Hz).<br />
De woorden ’schub’ en de laatste ’als’ waren juist iets te veel beklemtoond.<br />
Bij beiden werd de duur daarom iets ingekort (62 ms voor de ’Y’ en<br />
60 ms voor de ’A’, respectievelijk).<br />
Omdat het een vrij lange zin was met soms iets te lange stukken, is er<br />
bovendien nog een stilte aangebracht tussen ’schub’ en ’als’. Deze stilte duurde<br />
80 ms, dat is een stuk minder dan bij een komma, maar het maakte de<br />
zin toch iets prettiger te beluisteren. Verder bleek het lastig om het woord<br />
’echt’ goed te benadrukken, ondanks het verlengen en aanbrengen van het<br />
toonhoogte-accent (hoedpatroon). De oplossing bleek hiervoor bleek de volgende<br />
te zijn: het aanbrengen van een glotteslag van 81 ms tussen de twee<br />
klinkers van ’die’ en ’echt’.<br />
Zin 14: Die x was een Bard, dat is een man die dicht, zo zijn er veel<br />
in ij, want hij kwam uit ij.<br />
Deze zin is eigenlijk opgebouwd uit een aantal kleine zinnetjes. Omdat<br />
’Bard’ het laatste woord is van het eerste subzinnetje, klonk het een stuk<br />
beter wanneer de toonhoogtestijging op de ’A’ vervangen werd door een<br />
toonhoogtedaling (tot 94 Hz). Hetzelfde gold voor ’dicht’ (naar een minimum<br />
van 73 Hz) en ’ij’ (80 Hz).<br />
Een aantal woorden moest weer beter geaccentueerd worden: ’dat’ kreeg<br />
8
een zogenaamd hoedpatroon (maximum 116 Hz) en de duur werd verlengd<br />
van de klinker naar 90 ms, ’zo’ kreeg een toonhoogte-accent met een maximum<br />
van 125 Hz en de duur van de ’o’ werd verlengd tot 150 ms en tot slot<br />
werd de duur van de ’A’ uit ’kwam’ verlengd naar 120 ms, naast dat er een<br />
toonhoogte-accent op die klank kwam met een maximum van 120 Hz.<br />
Zin 15: En Llew Jones wou rood vlees op het bord van elk mens in zijn<br />
land, hij dacht:<br />
In deze zin is ’land’ weer eigenlijk een laatste woord van een zin en klonk<br />
het dus beter met een toonhoogtedaling (ipv een stijging) op de ’A’ (naar<br />
een minimum van 82 Hz). De duur van diezelfde klank is verlaagd naar 68<br />
ms. Het toonhoogte-accent op ’dacht’ werd iets verscherpt: een stijging met<br />
een maximum van 102 Hz.<br />
Zin 16: wie veel rood vlees eet wordt flink.<br />
In deze zin lag teveel de nadruk op ’rood’, voor de betekenis zou het beter<br />
zijn wanneer het woord ’veel’ de nadruk krijgt. Het toonhoogte-accent op<br />
’rood’ is dus helemaal verwijderd en de ’e’ uit ’veel’ is verlengd tot 200 ms<br />
en verder geaccentueerd met een toonhoogtestijging (hoedpatroon), waarbij<br />
het maximum lag op 132 Hz.<br />
Zin 17: Maar vlees is duur.<br />
Deze zin werd door Fluency prima uitgesproken!<br />
Zin 18: Hoe kom je aan zo veel vlees?<br />
In deze zin heeft ’kom’ een accent gekregen (hoedpatroon, toonhoogte maximaal<br />
124 Hz) en is de duur van de ’O’ verlengd naar 151 ms. Het toonhoogteaccent<br />
op vlees is wat lager geworden (maximum 112 Hz).<br />
Zin 19: Toen dacht hij aan vlees uit de zee, het vlees van die vis met<br />
een hart als een jong wijf.<br />
Het woord voor de komma, ’zee’, had oorspronkelijk een toonhoogtestijging<br />
als accent, dat is weer veranderd in een daling (minimum 77 Hz). Het<br />
toonhoogte-accent op ’vlees’ is in zijn geheel verwijderd (’vlees’ is al genoemd<br />
9
in de vorige zinnen en daardoor niet zo belangrijk meer). Het toonhoogteaccent<br />
op het laatste woord, ’wijf’, is ook veranderd in een sterke daling<br />
(minimum 73 Hz).<br />
Zin 20: Hij vindt dus een schip en dat schip brengt zo’n vis mee naar<br />
huis uit de zee bij de pool.<br />
In deze zin heeft ’vindt’ een accent gekregen (hoedpatroon op de ’I’, maximum<br />
van 126 Hz, plus duurverlenging tot 98 Hz). Bij de twee voorkomens<br />
van ’schip’ is de duur verlengd tot 105 ms. De pauze tussen ’schip’ en ’en’<br />
is wat verlengd (100 ms). Het toonhoogte-accent op ’huis’ is iets verscherpt<br />
(maximum 129 Hz). Om de correcte uitspraak ’puL’ te krijgen ipv ’poL’, is<br />
de spelling van ’pool’ met de hand gewijzigd in ’poel’.<br />
Zin 21: Dat vlees van die vis blijft wel goed door het ijs dat daar drijft,<br />
dacht x.<br />
Allereerst is hier het toonhoogte-accent op ’vlees’ aangescherpt (maximum<br />
142 Hz). Op ’vis’ zat een toonhoogte-accent, maar dat is weggehaald. De<br />
daling op de ’Ei’ van ’drijft’ (voor de komma) is verscherpt (minimum 102<br />
Hz). De twee laatste woorden zijn ook meer benadrukt, door ’dacht’ een<br />
sterke toondaling mee te geven (minimum 96 Hz) en de duur de naam ’x’ te<br />
verlengen (de ’I’ duurt nu 116 ms).<br />
Zin 22: Maar Jones had het mis:<br />
De duur van de ’I’ van ’mis’ is verlengd tot 104 ms en het heeft een toondaling<br />
gekregen van 124 Hz naar 112 Hz.<br />
Zin 23: door het spek blijft het lang warm in de buik van die vis, nog<br />
wel een week na zijn dood.<br />
Het woord ’lang’ heeft een toonhoogte-accent gekregen van 109 Hz naar<br />
118 Hz naar 106 Hz. De duur van de ’A’ van ’warm’ is verlengd naar 137<br />
ms. Het woord voor de komma ’vis’ heeft ipv een sterke stijging weer een<br />
toondaling gekregen (101 Hz naar 92 Hz naar 141 Hz).<br />
10
3 Liesbeth Janzen<br />
Zin 24: Zo kwam al vlug de rot in die vis en de lucht werd zo slecht dat er<br />
geen net woord voor is.<br />
Allereerst heb ik de duur van ’vlug’ aangepast, omdat het woord beklemtoond<br />
moet worden, terwijl dit niet het geval was. De ’Y’ duurt nu 91 ms.<br />
Voor ’en’ hoort een pauze (een prosodische grens), omdat daar de scheiding<br />
tussen twee zinsdelen zit. Hiervoor moet een extra segment toegevoegd worden.<br />
De duur van dat segment wordt 219 ms. De waarde voor de duur van<br />
’A’ in ’al’ wordt verlengd tot 103 ms, waardoor de spraak minder gehaast<br />
klinkt. De toonhoogte van ’kwam’ wordt verlaagd op het punt van de ’A’,<br />
zodat er niet ten onrechte een klemtoon gezet wordt. Hetzelfde geldt voor<br />
de ’e’ in ’geen’ en ’A’ in ’al’. Ook voeg ik een accent toe op ’vis’, door de<br />
toonhoogte iets te verhogen en de duur te verlengen tot 97 ms.<br />
Zin 25: Het vlees uit zee komt aan in Wales maar met zo’n leeuw van<br />
een stank dat geen hond het meer wil.<br />
Het valt op dat de spraak van Fluency erg ’staccato’ klinkt; dat wil zeggen<br />
heel puntig, vooral in het begin van de zin. Het klinkt alsof iemand expres<br />
heel erg overdreven aan het articuleren is. Ook het intonatiepatroon klopt<br />
niet helemaal. Vooral het gedeelte ’dat geen hond het meer wil’ heeft geen<br />
goed intonatiepatroon. Op ’dat geen hond’ ligt nu de nadruk, terwijl het<br />
beter zou zijn als deze zou liggen op ’hond’, als in: ’Het vlees uit zee komt<br />
aan in Wales, maar met zo’n leeuw van een stank dat geen HOND het meer<br />
wil’. Hiervoor wordt allereerst de toonhoogte aangepast. Door een extra<br />
pitchpoint op de /o/ in ’hond’ toe te voegen en vervolgens de toonhoogte<br />
op deze plek te verhogen naar 155 Hz, klinkt het geheel al een stuk natuurlijker.<br />
Ook op ’zee’ en ’vlees’ wordt een accent gelegd, maar in mindere<br />
maten. Vervolgens moeten enkele spraakklanken van ’Wales’ vervangen worden.<br />
Fluency zet dit woord namelijk om in /w*a-l@s/. Door de /a/ om te<br />
zetten in /e/ en de /@/ te verwijderen is dit probleem opgelost. Verder<br />
loopt het intonatiepatroon na ’hond’ snel af, iets wat in natuurlijke spraak<br />
vaak het geval is. Hier klinkt dit echter niet goed, het is logischer als de<br />
toonhoogte na ’hond’ ongeveer gelijk blijft. Pas als het woord ’meer’ wordt<br />
uitgesproken laten we de toonhoogte iets dalen, met een climax na ’wil’.<br />
Zin 26: Al wie het rook lei zijn hand op zijn neus en werd boos op Llew<br />
Jones.<br />
Wat bij het beluisteren van deze zin opmerkelijk is is de uitspraak van ’Llew<br />
11
Jones’, respectievelijk /’El ?’El ?’e w*e dZ*ons/. Na de spraakklanken van<br />
deze naam veranderd te hebben in /l’i:w dZ*ons/. Op ’boos’ leggen we de<br />
klemtoon door de toonhoogte te verhogen naar 138 Hz. Ook de duur van<br />
de spraakklank /o/ wordt iets verlengd, zodat het woord nog meer geaccentueerd<br />
wordt. Dezelfde procedure passen we toe op ’al’ en in mindere<br />
mate op ’wie’, ’rook’ en ’neus’. Verder komen de duren die Fluency hanteert<br />
in dit geval voor het oor natuurlijk over.<br />
Zin 27: Een man gooit een steen naar zijn hoofd en nog een man knijpt<br />
met een hand zijn neus dicht, pakt een stuk van dat vlees en ook dat<br />
krijgt Llew Jones naar zijn kop.<br />
Door de invoer van komma’s in Fluency weet het programma al dat er een<br />
scheiding van twee zinsdelen is. Er wordt hier een goede prosodische grens<br />
gelegd. De accentuering op de woorden is echter nog niet erg goed. We verhogen<br />
de toonhoogte op ’steen’(138 Hz), ’hoofd’( 139Hz), ’hand’(134 Hz),<br />
’stuk’ (140 Hz), de tweede ’dat’(134 Hz). Na deze veranderingen klinkt de<br />
spraak al beter. Wel valt op dat vooral op het begin van de zin de algehele<br />
toonhoogte iets te hoog is. Door hier overal de toonhoogte te verlagen met<br />
zo’n 10 Hz wordt dit probleem verholpen.<br />
Zin 28: Nu wordt, door een heel klein soort beest in de darm van die<br />
vis, het vlees snel tot gif.<br />
Een van de eerste dingen die opvalt is dat er geen accent op ’wordt’ ligt,<br />
terwijl dit wel voor de hand ligt. Na het al bestaande pitchpoint verplaatst<br />
te hebben naar 144 Hz, klinkt het eerste gedeelte van de uiting al veel natuurlijker.<br />
Ook moet de /e/ in ’beest’ verlengd worden, omdat er nu geen<br />
accent op ligt en omdat het woord te snel uitgesproken wordt. Verder is<br />
de omzetting van Fluency natuurlijk, ook al zouden er nog meer accenten<br />
gelegd kunnen worden (die dan ook voor een groot deel bepaald worden door<br />
de context: wat is nieuwe en wat is oude informatie?).<br />
Zin 29: Komt dat gif in een wond dan volgt de dood door koud vuur.<br />
Omdat ’komt dat gif in een wond’ en ’dan volgt de dood door koud vuur’<br />
eigenlijk twee verschillende frasen zijn hebben we een ’glottal stop’ toegevoegd<br />
na ’wond’, waardoor het zinsverloop natuurlijker klinkt. Ook hebben we de<br />
toonhoogte van ’wond’ verhoogd naar 134 Hz, omdat de eerste frase eigenlijk<br />
een soort van vraag (indien?) is. Andere accenten heeft Fluency goed<br />
toegekend (respectievelijk op ’wond’, ’dood’ en ’koud vuur’).<br />
12
Zin 30: De dag er na werd Jones ziek.<br />
Wat hier vooral opvalt is dat er vrijwel geen accenten worden geplaatst.<br />
Door ’er na’ als een woord met klemtoon te zien klinkt het resultaat van<br />
Fluency al stukken beter. Allereerst hebben we de toonhoogte van /a/ verhoogd<br />
naar 142 Hz. Ook is de duur van de spraakklank aangepast, deze is<br />
nu 178 ms. Omdat de /w/ te snel op de /a/ volgde is er een extra segment<br />
toegevoegd na de /a/, namelijk een ’glotal stop’. Wel hebben we de duur<br />
van deze ’glotal stop’ iets verkort naar 70 ms, omdat de stilte tussen de /a/<br />
en de /w/ anders weer te groot zou zijn geworden. Zowel de toonhoogte als<br />
de zinsintonatie klopt in de rest van de zin wel.<br />
Zin 31: Zijn huid was heet en klam.<br />
Zin 32: Zijn oog werd nat en dof.<br />
Zin 33: Hij hijgt en hapt naar lucht.<br />
Zinnen 31, 32 en 33 hebben we samengenomen, omdat ze eenzelfde soort<br />
opbouw hebben en omdat Fluency dezelfde ’fouten’ maakt. De intonatie en<br />
duren zijn in principe goed, ware het niet dat de belangrijkste woorden van<br />
de zinnen niet geaccentueerd worden (iets dat we al vaker gezien hebben bij<br />
Fluency). In zin 31 hebben we daarom de toonhoogte van /ui/ in ’huid’<br />
verhoogd naar 146 Hz. In zin 32 hebben we de toonhoogte van /o/ in ’oog’<br />
verhoogd naar 135Hz. Bij zin 33 werd de /ij/ in ’hijgt’ verhoogd naar 141<br />
Hz. Op ’hapt’ lag al een accent, daar hoeft dus niets aan veranderd te<br />
worden. Nu we deze drie veranderingen zo op een rijtje zien, valt op dat<br />
als er een accent geplaatst moet worden de bijbehorende toonhoogte vaak<br />
rond de 140 Hz ligt. Blijkbaar is dat een frequentie die in natuurlijke spraak<br />
gebruikt wordt als het gaat om plaatsing van accenten.<br />
4 Charlotte Spitters<br />
Controle van de Graph2Phon omzetting:<br />
Er zijn een aantal woorden die niet helemaal correct worden uitgesproken.<br />
Het eerste probleem doet zich voor bij de Engelse zinnen. Deze hebben we zo<br />
goed mogelijk in een klankrepresentatie omgezet, maar het blijft behelpen.<br />
Het Engels kent immers andere klanken dan het Nederlands.<br />
Een tweede probleem dat opvalt, is het lidwoord ’de’. In foneemschrift<br />
’d@’. Het is zo dat de ’e’ in ’de’ een sjwa is, maar deze wordt door het<br />
programma niet goed gerealiseerd. Waarschijnlijk zou het heel wat schelen<br />
13
als de duur van de sjwa iets verlengd zou worden. Ook bij het lidwoord<br />
’een’ doet zich zulk een probleem voor. Hier echter wordt de klinker niet te<br />
kort maar te lang uitgesproken. Waar de levende Nederlander het lidwoord<br />
’een’ zal verbasteren tot iets wat meer in de richting komt van ’un’, zegt<br />
de computer steevast n. Een ander probleem zijn de r-klanken. Aan het<br />
eind van een woord heb je een andere r-klank dan aan het begin. In onze<br />
grafeemfoneem omzetter zit daar een klein foutje. De r aan het eind van<br />
het woord ’voor’ wordt veel te duidelijk gerealiseerd, terwijl die van ’maar’<br />
wel half wordt in geslikt. Het is vervreemdend dat de persoon die de tekst<br />
uitspreekt zo twee verschillende accenten lijkt te hebben. Ook bij het woord<br />
’eerst’ hebben we problemen met het laatste cluster. Dit wordt te duidelijk<br />
gearticuleerd. Een levende spreker zou de helft van het cluster nauwelijks<br />
uitspreken.<br />
De ’s’ in het woord ’som’ wordt door de computer ook verkeerd uitgesproken.<br />
De ’s’ klinkt meer als een ’z’ en zou dus harder gerealiseerd moeten<br />
worden. Dit is geen fout in ons programma, maar een gemis in Mbrola.<br />
De controle van pauzes en duren hebben we per zin gedaan, dus zullen<br />
hieronder ook per zin worden besproken. .<br />
Zin 34: Nu is er in Wales een proef op de som om te zien wie echt een<br />
Bard was en wie niet, en het is een proef die nooit faalt.<br />
We hebben de duur van ’nu’ korter gemaakt. Fluency laat door assimilatie<br />
’nu’ te veel over lopen naar ’is’, dus we hebben ’nu’ eerder laten aflopen.<br />
De duur van ’echt’ hebben we verlengd zodat ’een’ nog meer ingeslikt wordt<br />
als het ware. De ’ee’ wordt na een woord als ’echt’ dan ook bijna niet meer<br />
uitgesproken. De toonhoogte van ’zien’ hebben we verlaagd, want er lag te<br />
veel nadruk op. Ook hebben we de toonhoogte van ’bard’ iets verlaagd en<br />
de toonhoogte van ’faalt’ al iets eerder laten dalen dan Fluency doet. Bij<br />
Fluency gaat de toonhoogte aan het eind van de zin net iets te laat en te<br />
abrupt nog naar beneden. Het is natuurlijker als je al wat eerder kan horen<br />
of de zin op zijn eind is of niet. De lengte van ’Wales’ is langer gemaakt,<br />
want ’Wales’ heeft nadruk. De toonhoogte van ’proef’ hebben we iets verlaagd.<br />
De zin klinkt voor ons zo acceptabel.<br />
Zin 35: Schoon elk jaar een bard een prijs krijgt om hem, zo hij echt<br />
een Bard is,<br />
De pauze tussen krijgt en om hem hebben we een stuk langer gemaakt.<br />
Nu kan Fluency niet weten dat die pauze daar lang moet zijn, omdat Fluency<br />
aan dit stukje de gehele structuur van de zin nog niet kan aflezen. Het<br />
is alleen jammer dat Fluency de assimilatie tussen krijgt en om hem niet<br />
14
stopt. De duur van ’jaar’heb ik verlengd. En ook de duur en toonhoogte van<br />
elk is verlengd en verhoogd. De toonhoogte van jaar loopt dan weer mooi<br />
naar beneden. Het tweede gedeelte ’zo hij echt een Bard is’ klinkt prima.<br />
Zin 36: tot steun te zijn op zijn weg, weet elk dat hij eerst dood moet<br />
zijn voor men er echt op aan kan.<br />
De klemtoon moet in de zin liggen op ’elk’, dus we hebben de toonhoogte<br />
daar verhoogd. De klemtoon lag namelijk op ’weet’. Ook de toonhoogte op<br />
’weg’ hebben we wat verhoogd. Verder klinkt de zin goed.<br />
Zin 37: Die proef op de som is: was het woord dat hij het laatst sprak<br />
een groot woord<br />
We hebben de duur tussen ’proef’ en ’op’ vergroot. (de f van proef heeft<br />
nu een lengte van 154) We hebben de toonhoogte op ’som’ verhoogd ten op<br />
zichte van ’is’. We hebben extra pitchpoints op ’som’(140hz) en ’is’ (130hz)<br />
gezet. De toonhoogte was eerst op beide 126 hz. De duur tussen ’som’ en<br />
’is’ hebben we vergroot. Ook de toonhoogte op ’woord’ is veranderd. Ook<br />
al staat er in de tekst geen vraagteken, een vragende intonatie klinkt wel<br />
beter. Daartoe staat er een extra pitchpoint op de ’d’. De toonhoogte loopt<br />
van de ’o’ omhoog in een vragende intonatie. ’Woord’ eindigt op 140 Hz.<br />
Zin 38: En Jones blijkt echt een Bard want hij spreekt een groot woord als<br />
hij sterft.<br />
We hebben de toonhoogte op Jones verhoogd, die is nu 145hz. De toonhoogte<br />
op de ’e’ in ’echt’ is verhoogd naar 150 Hz. De lengte van de ’r’ in<br />
’Bard”hebben we verlengd tot 70ms. De toonhoogte hebben we verlaagd<br />
tot 105 Hz. We hebben een extra pitchpoint op de ’d’ van woord gezet op<br />
145 Hz. De toonhoogte op ’groot’ hebben we verhoogd tot 140 Hz. Lengte<br />
tussen ’want’ en ’hij’ is verkleind. De toonhoogte van ’want’ hebben we<br />
verlaagd tot 80Hz.<br />
Zin 39: Wie wil zien wat dat was kijkt maar in het boek, want het is<br />
nog te koop.<br />
De lengte tussen ’k’ en ’ij’ in ’kijkt’ hebben we korter gemaakt. De duur<br />
tussen ’wil’ en ’zien’ en ’wat’ en ’dat’ hebben we ook vergroot. Het begin van<br />
de zin werd in zijn geheel heel snel uitgesproken. Het woord ’was’ hebben<br />
15
we verlengd door de ’a’ meer tijd te geven. Die duurt nu 140 ms. De toonhoogte<br />
op ’maar’ hebben we verlaagd tot 104 Hz en die op ’in’ verhoogd tot<br />
140 Hz na toevoeging van een extra pitchpoint.<br />
Zin 40: Als men het uit heeft denkt men nog lang net als ik nu schrijf.<br />
Fluency geeft in deze zin helemaal geen accent op ’uit’ terwijl dit wel een<br />
belangrijk woord is voor de zin. We hebben een extra pitch op ’uit’ gezet<br />
van 150 Hz. We hebben de lengte tussen heeft en denkt vergroot. Hier moet<br />
ook eigenlijk een komma staan. De lengte is 265 ms. De toonhoogte op<br />
’heeft’ hebben we verlaagd naar 85 Hz en het woord hebben we verlengd.<br />
De ’e’ heeft een lengte van 190ms. Toonhoogte op denkt. De toonhoogte op<br />
’net’ hebben we verhoogd tot 150 Hz. Ook de toonhoogte op ik hebben we<br />
verhoogd tot 140Hz.<br />
Zin 41: Het brein komt in de ban van die taal.<br />
De duur tussen brein en komt hebben we verlengd tot 153ms. De duur<br />
tussen ’komt’ en ’in’ hebben we verlengd tot 163Hz. De klemtoon op brein<br />
hebben we meer aan het begin van ei gezet. De toonhoogte op ’ban’ hebben<br />
we verhoogd naar 120 Hz. De toonhoogte van taal hebben we aflaten lopen<br />
vanaf 130 Hz.<br />
Zin 42: In die taal is er van elk ding nog maar een, want twee of meer<br />
kan haast nooit.<br />
Ten eerste spreekt Fluency ’een’ uit als ’@n’. Als echter het telwoord wordt<br />
bedoeld moet het weer met een ’ee’ worden uitgesproken, dus dit hebben<br />
we aangepast. Ook de lengte van ’ee’ moest groter worden. Die is 150 ms<br />
geworden. Tussen ’taal’ en ’is’ hebben we de toonhoogte omlaag laten gaan.<br />
De toonhoogte van ’nooit’ daalde al enigszins, maar het klinkt beter als die<br />
nog wat lager is. Bij ’taal’ hebben we de toonhoogte laten beginnen op 150<br />
Hz en laten dalen tot 100 Hz. In de fluency uitspraak heeft ’taal’ een op en<br />
aflopende toonhoogte.<br />
Zin 43: Het is iets als een taal met maar een hand, een taal die hinkt.<br />
Voor ’een’ geldt hetzelfde als hierboven. Het enige wat we hier gedaan<br />
hebben is een ’h’ toegevoegd aan het begin van de regel. Dit is volgens ons<br />
de enige plek waarop die in het lidwoord ’het’ ook wordt uit gesproken.<br />
16
Dit overziend zijn er veel verschillende dingen die moeten worden aangepast.<br />
Klemtoon ligt soms op de werkwoorden, terwijl het veel natuurlijker klinkt<br />
als die op inhoudswoorden ligt.<br />
5 Bespreking<br />
Vooral in het begin van de zinnen maakt de uitspraak van Fluency een<br />
gehaaste indruk. De duren in onze omzetting zijn in principe goed (uitgezonderd<br />
van gevallen als ’één’), wel wordt het geheel misschien iets te<br />
langzaam uitgesproken (dit is te verhelpen door de pauzes tussen de woorden<br />
nog iets te verkorten). Een tekortkoming van onze omzetting is dat er<br />
niet veel rekening gehouden wordt met de zinsintonatie. Daar waar Fluency<br />
nog wat probeert: met name een afname van de toonhoogte naarmate de zin<br />
verder vordert, klinkt het geheel bij onze omzetting monotoon: de woorden<br />
afzonderlijk worden goed uitgesproken en zijn te begrijpen. Ook klinken de<br />
woorden redelijk natuurlijk. Als echter naar de zin geluisterd wordt blijkt<br />
dat op het gebied van zinsintonatie nog veel moet gebeuren. Bijvoorbeeld<br />
het toepassen van een ’standaard-toonhoogtecontour’: aflopend met accenten<br />
op bepaalde woorden. De plaatsing van de accenten zou bepaald kunnen<br />
worden door de klasse van het woord: werkwoord, naamwoord etc. Zoals<br />
al eerder vermeld, zou het dus handig zijn om een programma te maken<br />
dat onderscheid kan maken tussen de verschillende woorden en vervolgens<br />
bepaalt welk woord een klemtoon krijgt en welk woord niet. Overigens moet<br />
wel opgemerkt worden dat Fluency de Engelse woorden nog beroerder uitspreekt<br />
dan onze omzetting. Oorzaak hiervoor is dat wij de Engelse woorden<br />
op een Nederlandse manier herschreven hebben en ze vervolgens laten uitspreken<br />
m.b.v. Nederlandse difonen. Fluency spreekt de Engelse woorden<br />
direct uit alsof het Nederlandse woorden zijn (en dus ook met Nederlandse<br />
difonen). Het resultaat bij Fluency is onverstaanbaar, terwijl het bij onze<br />
omzetting klinkt als een Nederlander die (geen goed) Engels spreekt. Ook<br />
klinkt de stem van Fluency iets ’metaal-achtiger’ dan die gebruikt wordt bij<br />
de <strong>MBROLA</strong> koppeling, maar dat heeft wellicht te maken met de stem die<br />
we gekozen hebben.<br />
Het valt op dat vooral korte zinnen erg goed door Fluency worden<br />
omgezet: zowel de toonhoogte als de duren komen redelijk overeen met dat<br />
wat door de mens als natuurlijke spraak ervaren wordt. Bij langere zinnen<br />
kan de accentuering ook wel goed zijn, maar in de meeste gevallen is dit niet<br />
het geval: accenten worden onterecht (niet)geplaatst.<br />
17
6 Conclusie<br />
Het meeste effect op de verbetering van de beregeling heeft de duur. Als<br />
we de duur aanpassen in Fluency klinkt de spraak vaak natuurlijker. Ook<br />
wordt er dan meteen een accent op gelegd.<br />
Hieronder volgt een aantal simpele regels waarmee wij hopen onze monotone<br />
<strong>MBROLA</strong>-spraak wat natuurlijker te laten klinken:<br />
• Het laatste woord van de zin krijgt een duurverlenging (en daarmee<br />
een accent);<br />
• Een woord voor een komma krijgt ook vaak een duurverlening en een<br />
accent (vaak in de vorm van een toondaling);<br />
• Declinatie (een afloop van de toonhoogte naarmate het eind van de<br />
zin nadert) moet worden toegevoegd;<br />
• Onderscheid maken tussen inhouds- en functiewoorden: de inhoudswoorden<br />
krijgen in het algemeen een accent. Hiervoor zou part-of-speechtagging<br />
van pas kunnen komen;<br />
• Als het aanwijzende voornaamwoord niet gevolgd wordt door een zelfstandig<br />
naamwoord (dus wel: dat is leuk, maar niet: die man is leuk)<br />
heeft het aanwijzende voornaamwoord een accent. Hiervoor zou partof-speech-tagging<br />
van pas kunnen komen;<br />
• Bij een combinatie van zelfstandig naamwoord + bijvoeglijk naamwoord<br />
krijgt het bijvoegelijk naamwoord (ook) een accent;<br />
• Wanneer een vraagwoord wordt gevolgd door een werkwoord, krijgt<br />
dit werkwoord een accent;<br />
• Aan het einde van een vraagzin krijgt het laatste woord een stijgende<br />
toonhoogte ipv een dalende;<br />
• Een woord voor een dubbele punt wordt vaak geaccentueerd met een<br />
duurverlenging plus toonhoogtedaling.<br />
Wanneer we aan de slag gaan met part-of-speech-tagging zal moeten<br />
blijken of we deze regels daadwerkelijk kunnen implementeren en of ze het<br />
gewenste effect zullen hebben.<br />
18