05.09.2013 Views

MBROLA evaluatie

MBROLA evaluatie

MBROLA evaluatie

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>MBROLA</strong> <strong>evaluatie</strong><br />

Groep 2<br />

20-3-2004<br />

De afgelopen weken zijn we bezig geweest met het maken van een automatische<br />

vertaalslag voor eenlettergrepige woorden uit het Nederlands naar een<br />

notatie die door het spraaksynthesesyteem <strong>MBROLA</strong> gebruikt kan worden<br />

als input.<br />

Uiteindelijk hebben we een aantal finite-state automaten gemaakt waarin<br />

rekening wordt gehouden met de duren van afzonderlijke woorden. Wanneer<br />

we gehele zinnen met onze automaten zouden omzetten en laten uitspreken<br />

door <strong>MBROLA</strong>, dan zouden we erg onnatuurlijk klinkende spraak krijgen.<br />

Dat komt door het ontbreken van goede zins-intonatiepatronen en goede<br />

duren van en pauzes tussen woorden.<br />

We hebben het volgende stuk tekst, opgebouwd uit eenlettergrepige woorden,<br />

inderdaad door onze automaten laten “vertalen” en door <strong>MBROLA</strong><br />

laten uitspreken:<br />

Taal met een hand.<br />

Whales for the Welsh is een vreemd boek. Er komt niet een<br />

lang woord in voor. Elk woord in dat boek is kort. Als men het<br />

leest weet men eerst niet wat het is, en dan moet men vaak ha!<br />

ha! doen, want het staat erg raar, een heel boek met elk woord<br />

zo kort. Vaak is het net of een kind het zegt en het geeft ook een<br />

soort toon van spot; het viel mij op dat het soms lijkt op de stijl<br />

van Piet Grijs. Ik weet niet goed hoe dat komt.<br />

Wat staat er in dat boek? Er staat in van een man die Llew<br />

Jones heet (in de taal van dat boek — want dat is niet de taal<br />

van ons land — is Jones ook een kort woord dat je in een keer<br />

zegt net als bij ons het woord zoons) en van een soort vis die heel<br />

groot is en die zwemt bij de pool; er drijft daar heel wat ijs maar<br />

die vis heeft veel spek en dat houdt hem warm. Het is niet echt<br />

een vis maar een dier met warm bloed. ‘The Whale,’ zo staat<br />

er in dat boek, ‘has a Heart with four Parts, like the heart of a<br />

Young Girl, Lungs like the lungs of a Horse and Ears like the<br />

Ears of a Mole. It has no Scales like the scales of a True Fish,<br />

1


ut it has Hair like the Hair of a Hare, While still in the Womb<br />

...’<br />

Dat is, in de taal van ons moer: ‘In het hart van dit dier is<br />

vier maal een vak, als in het hart van een jong wijf, de long is<br />

als de long van het paard en het oor als het oor van een mol. Op<br />

zijn lijf zit niet een schub als op het lijf van een vis die echt een<br />

vis is, maar het heeft haar als het haar van een haas als het nog<br />

zit in de buik van zijn ma ...’<br />

Die Llew Jones was een Bard, dat is een man die dicht, zo zijn<br />

er veel in Wales, want hij kwam uit Wales. En Llew Jones wou<br />

rood vlees op het bord van elk mens in zijn land, hij dacht: wie<br />

veel rood vlees eet wordt flink. Maar vlees is duur. Hoe kom je<br />

aan zo veel vlees? Toen dacht hij aan vlees uit de zee, het vlees<br />

van die vis met een hart als een jong wijf.<br />

Hij vindt dus een schip en dat schip brengt zo’n vis mee naar<br />

huis uit de zee bij de pool. Dat vlees van die vis blijft wel goed<br />

door het ijs dat daar drijft, dacht Llew Jones. Maar Jones had<br />

het mis: door het spek blijft het lang warm in de buik van die<br />

vis, nog wel een week na zijn dood. Zo kwam al vlug de rot in<br />

die vis en de lucht werd zo slecht dat er geen net woord voor is.<br />

Het vlees uit zee komt aan in Wales maar met zo’n leeuw van<br />

een stank dat geen hond het meer wil. Al wie het rook lei zijn<br />

hand op zijn neus en werd boos op Llew Jones. Een man gooit<br />

een steen naar zijn hoofd en nog een man knijpt met een hand<br />

zijn neus dicht, pakt een stuk van dat vlees en ook dat krijgt Llew<br />

Jones naar zijn kop.<br />

Nu wordt, door een heel klein soort beest in de darm van die<br />

vis, het vlees snel tot gif. Komt dat gif in een wond dan volgt<br />

de dood door koud vuur. Zo ging het ook met Llew Jones: ‘Next<br />

day Llew Jones was Sick. His skin was Hot and Wet. His eyes<br />

were Moist and Dim. His Breath came in Gasps.’ (De dag er na<br />

werd Jones ziek. Zijn huid was heet en klam. Zijn oog werd nat<br />

en dof. Hij hijgt en hapt naar lucht.) ‘Now they have a Test in<br />

Wales for Who is and Who is not a True Bard, and it is a test<br />

which does not Let You Down. Though they give a Prize each<br />

year to help a Bard, if a True Bard, to get a Good start in Life,<br />

they know that you have to wait till he is Dead if you want to be<br />

Quite Sure. The Test is: Were his Last Words Great Words?’<br />

(Nu is er in Wales een proef op de som om te zien wie echt een<br />

2


Bard was en wie met, en het is een proef die nooit faalt. Schoon<br />

elk jaar een bard een prijs krijgt om hem, zo hij echt een Bard<br />

is, tot steun te zijn op zijn weg, weet elk dat hij eerst dood moet<br />

zijn voor men er echt op aan kan. Die proef op de som is: was<br />

het woord dat hij het laatst sprak een groot woord?)<br />

En Jones blijkt echt een Bard want hij spreekt een groot woord<br />

als hij sterft. Wie wil zien wat dat was kijkt maar in het boek,<br />

want het is nog te koop. Als men het uit heeft denkt men nog<br />

lang net als ik nu schrijf. Het brein komt in de ban van die taal.<br />

In die taal is er van elk ding nog maar een, want twee of meer<br />

kan haast nooit. Het is iets als een taal met maar een hand, een<br />

taal die hinkt.<br />

Met de editor Fluency hebben we de bovenstaande tekst opnieuw laten<br />

uitspreken 1 , zodat we het resultaat met onze eigen, door <strong>MBROLA</strong> geproduceerde,<br />

spraak konden vergelijken. Zo hopen we nu wat te kunnen zeggen<br />

over wat er aan “onze” spraak nog veranderd moet worden wat toonhoogte<br />

en duur betreft.<br />

Enkele algemene opmerkingen<br />

De door ons gebruikte tekst bevat vrij veel Engelse woorden. Deze worden<br />

niet goed uitgesproken om de volgende 2 redenen:<br />

1. Wij hebben een transducer voor de grafeem-foneemomzetting gemaakt<br />

die alleen rekening houdt met Nederlandse woorden. Engelse woorden<br />

zullen dus, tenzij ze in de uitzonderingenlijst van de transducer staan,<br />

worden omgezet naar een Nederlandse uitspraak. Dit probleem hebben<br />

we hier nog weten te omzeilen door in de tekst zelf de Engelse woorden<br />

te vervangen door woorden Nederlandse (onzin)woorden die qua<br />

uitspraak het dichtst bij de Engelse liggen. Merk op dat dit wel een<br />

erg “Hollands klinkende” Engelse uitspraak tot gevolg had;<br />

2. <strong>MBROLA</strong> heeft voor de spraaksynthese de beschikking over een Nederlandse<br />

difoonset. Hierdoor krijgen de Engelse woorden sowieso een<br />

”Hollands-klinkendeüitspraak.<br />

In het vervolg van deze <strong>evaluatie</strong> zullen we dan ook alleen ingaan op de<br />

nederlandstalige zinnen.<br />

1 In Fluency is het mogelijk om te kiezen welk soort stem de synthese uitspreekt: man,<br />

vrouw, jongen, meisje, robot etc. Daarnaast is het mogelijk om de manier waarop iemand<br />

het uitspreekt in te stellen: normaal, levendig etc. Er is gebruik gemaakt van de<br />

mannenstem (normaal).<br />

3


Bij de <strong>evaluatie</strong> blijkt meteen al dat de pauzes waar we mee begonnen<br />

waren, veel te lang zijn. Nadat we deze pauzes aanmerkelijk verkort hebben<br />

(tot zo’n 25 ms) klinkt de spraak al veel natuurlijker. Bij een tweede maal<br />

beluisteren van de uitspraak blijkt een pauze van 25 ms (voor en na een<br />

woord) te kort te zijn. Door deze waarde aan te passen tot 30 ms wordt dit<br />

probleem verholpen. Een oplossing voor het aangeven van het begin en eindpunt<br />

van een zin is het verwerken van punten en komma’s in de lettergreepherkenner/<br />

transducer. In de lettergreepherkenner moet dan aangegeven<br />

worden dat een lettergreep mogelijk gevolgd kan worden door een punt of<br />

een komma, in de transducer worden de punten en komma’s omgezet in een<br />

stilte/ pauze.<br />

Na een eerste maal de omzetting beluisterd te hebben blijkt dat de<br />

gegeven output al redelijk goed klinkt: alle woorden worden correct en<br />

duidelijk uitgesproken (de goede difonen worden gebruikt). Het valt wel<br />

op dat het woord ’een’ steeds omgezet wordt in ’één’, terwijl dat niet de<br />

bedoeling is in de meeste gevallen (wel bij ’Taal in een hand’, maar niet<br />

bij ’een man’). Daarnaast wordt ’zo’n’ omgezet met een ’korte /o/’, wat<br />

klopt als we de transducer bekijken (het is immers voor de omzetter geen<br />

open /o/), maar niet als we het resultaat beluisteren. Verder worden alle<br />

woorden goed en volledig uitgesproken. Het ziet er naar uit alsof voor alle<br />

fonemen/clusters de goede difonen gebruikt zijn. Wel moet opgemerkt worden<br />

dat de lettergrepen/ monosyllabische woorden die volgen op ’de’ wat<br />

rommelig uitgesproken worden. Dit heeft niet te maken met de omzetting<br />

voor ’de’, deze is namelijk /d@/, maar misschien wel met de gekozen duur<br />

voor ’sjwa’. Als we de duur bijvoorbeeld met 10 ms verlengen (respectievelijk<br />

60 ms wordt 70 ms) is dit probleem misschien verholpen.<br />

Nog een punt wat opgemerkt dient te worden is het volgende: bij het<br />

maken van de transducer die de foneemnotatie naar een <strong>MBROLA</strong>-notatie<br />

moest omzetten, hebben we de toonhoogtebewegingen binnen woorden bewust<br />

achterwege gelaten. Deze toonhoogtecontouren waren namelijk alleen<br />

handig op los uitgesproken woorden: wanneer woorden in zinnen voorkomen<br />

moeten de zinnen toch hun eigen toonhoogtecontour krijgen en zouden de<br />

individuele contouren weer komen te vervallen. Wat echter ook bleek, is dat<br />

wanneer de tekst werd uitgesproken met toonhoogtebeweginkjes op afzonderlijke<br />

woorden, de uitspraak heel schokkerig ging, alsof de stem af en toe<br />

bleef haperen. Na het verwijderen van toonhoogte-informatie uit de transducer,<br />

werd de spraak minder hakkerig!<br />

Ieder lid van ons groepje heeft een stuk van ’Taal met een hand’ voor<br />

zijn/haar rekening genomen en daar het volgende over verteld:<br />

4


1 Eduard Kleerekoper<br />

Zin 1: Taal met een hand.<br />

Zoals onze Graph-fon omzetter elke ’een’ omzet naar ’één’, zo zet Fluency<br />

dit woord om in un’, dus met een sjwa. Door in de fonetische transcriptie<br />

van deze ’@’ een ’e’ te maken en er een accent (*) voor te zetten, klinkt deze<br />

zin, de titel zo goed als natuurlijk.<br />

Zin 2: Whales for the Welsh is een vreemd boek.<br />

Ingevoerd als: “Weels voor de Welsj is een vreemd boek.” Wat opvalt is<br />

dat de ’sj’ van ’Welsj’ gecoarticuleerd wordt uitgesproken met de ’i’ van is,<br />

terwijl hier in natuurlijke taal een korte pauze gehouden zal worden om aan<br />

te geven dat Whales for the Welsh een naam is. Ik heb daarom een glottale<br />

stop ingevoegd van 50 ms en de toonhoogte op de ’E’ van ’Welsj’ even voor<br />

deze stop op neutraal gezet zodat deze het woord is niet zou beinvloeden.<br />

Zin 3: Er komt niet een lang woord in voor.<br />

Evenals bij de eerste zin wordt een’ uitgesproken als un’ en wordt dit veranderd<br />

van @’ in *e’. Verder klinkt het natuurlijker wanneer de lengte van de<br />

t’ in niet’ wordt verkort van 135 naar 65 ms.<br />

Zin 4: Elk woord in dat boek is kort.<br />

De nadruk moet hier gelegd worden op elk’, dit is te doen met een accentteken<br />

(*) voor dit woord. Het is erg lastig om bij deze zin te bepalen wat er<br />

wel en niet goed wordt uitgesproken. Het enige dat ik heb veranderd is de<br />

lengte van de o’ in kort’ van 97 naar 45 ms.<br />

Zin 5: Als men het leest weet men eerst niet wat het is, en dan moet<br />

men vaak ha! ha! doen, want het staat erg raar, een heel boek met elk<br />

woord zo kort.<br />

Het accent (*) op weet’ heb ik vervangen door een lichter accent () zodat<br />

er minder nadruk op ligt. Ook heb ik een toonhoogte pitch toegevoegd<br />

op het woord niet’ en de toonhoogte verlaagd vlak voor het einde van de zin<br />

die gemarkeerd is met een komma. De uitroeptekens na ha’ laat Fluency<br />

denken dat daar de zin afgelopen is, hiertegen heb ik deze uitroeptekens<br />

5


verwijderd en de duren van beide a’s in ha’ verkort naar 110 ms. Verder heb<br />

ik de toonhoogte pitch van raar’ iets naar voren getrokken (waardoor dus<br />

de toonhoogte eerder op het woord ligt). Als laatste heb ik de toonhoogte<br />

op het eind van het woord kort’ verhoogd wat een effect geeft alsof iemand<br />

verbijsterd is van de korte woorden (z kort?!).<br />

Zin 6: Vaak is het net of een kind het zegt en het geeft ook een soort<br />

toon van spot; het viel mij op dat het soms lijkt op de stijl van Piet Grijs.<br />

Het accent op kind’ heb ik iets vervroegd en iets omhoog gezet. Het tegenovergestelde<br />

heb ik gedaan met zegt’ en hierachter een glottale stop van<br />

150 ms toegevoegd. De toonhoogte op ’geeft’ iets vervroegd en op ook iets<br />

verhoogd. Het lichte accent () op op’ vervangen door een sterker accent (*).<br />

Ook heb ik als test de duren van de woorden het’, soms’ en op’ verkort naar<br />

ongeveer tweederde van de oorspronkelijke duren, wat een veel natuurlijker<br />

resultaat opleverde.<br />

Zin 7: Ik weet niet goed hoe dat komt. Het sterke accent op weet’ heb<br />

ik veranderd in een licht accent en het omgekeerde bij komt’. Tevens heb ik<br />

de duren van t’ in weet’ en u’ in hoe’ verkort naar ongeveer tweederde.<br />

Zin 8: Wat staat er in dat boek? Het enige dat ik wilde aanpassen was het<br />

lichte accent op staat’ door een sterk accent.<br />

Er staat in van een man die Llew Jones heet (in de taal van dat boek<br />

— want dat is niet de taal van ons land — is Jones ook een kort woord dat<br />

je in een keer zegt net als bij ons het woord zoons) en van een soort vis die<br />

heel groot is en die zwemt bij de pool; er drijft daar heel wat ijs maar die vis<br />

heeft veel spek en dat houdt hem warm. Als eerste heb ik een sterk accent<br />

op in’ geplaatst en een glottale stop (150 ms) erachter gezet. De toonhoogte<br />

op heet’ heb ik verhoogd omdat dit als een eind van een zin telt. Ik heb<br />

het sterke accent op ’taal’ vervangen door licht accent en een sterk accent<br />

geplaatst op het woord ons’. Verder heb ik de duren van elk woord tussen<br />

de komma’s/ streepjes korter gemaakt, zodat het meer als een toevoeging<br />

klinkt. Ik heb vervolgens een sterk accent geplaatst op ook’, van een’ n’<br />

gemaakt, een accent gelegd op ons’ en de toonhoogte van zoons’ omhoog<br />

gezet.<br />

Bij het daadwerkelijke tweede deel van de hoofdzin heb ik een sterk accent<br />

op ’en’ gezet, een licht accent op soort’ het accent op pool’ vervroegd<br />

en een pauze van 50 ms toegevoegd. Als laatste heb ik nog een sterk accent<br />

6


op heel’ gelegd, een pauze (//) na ijs’ toegevoegd en een sterk accent op dat’<br />

gelegd.<br />

Zin 9: Het is niet echt een vis maar een dier met warm bloed.<br />

Door een komma toe te voegen voor maar’, klopt de prosodie al aardig.<br />

Wanneer ik vervolgens de accenten op echt’, dier’ en bloed’ omwissel klinkt<br />

deze zin erg natuurlijk.<br />

Zin 10: ‘The Whale,’ zo staat er in dat boek, ‘has a Heart with four Parts,<br />

like the heart of a Young Girl, Lungs like the lungs of a Horse and Ears like<br />

the Ears of a Mole.<br />

Aangezien deze zin bijna volledig Engels is, heb ik alle Engelse woorden<br />

vervangen door overeenkomende Nederlandse woorden zodat de zin uitgesproken<br />

kan worden en toch redelijk hetzelfde blijft: De Weel, zo staat er in<br />

dat boek, heeft een hart in vier deel, als het hart van een jong vrouw, long<br />

als de long van een paard, en oor als een oor van een mol. Verrasend genoeg<br />

klonk deze vervormde zin bijna volledig natuurlijk. Slechts de toonhoogte<br />

op het woord vrouw’ moest iets naar voren geschoven worden.<br />

2 Rogier Kraf<br />

Er waren in het volgende stuk (op de Engelse woorden na) geen problemen<br />

met de grafeem-foneemomzetting. Onze transducer doet z’n werk goed!<br />

Zin 11: Dat is, in de taal van ons moer:<br />

De duur van de ’A’ uit ’dat’ is wat verlengd tot 93 ms, net als de ’I’ uit<br />

’is’, die tot 118 ms verlengd werd. Hierdoor kregen de woorden een wat<br />

minder gehaaste uitspraak en werden ze beter geaccentueerd.<br />

Zin 12: ‘In het hart van dit dier is vier maal een vak, als in het hart<br />

van een jong wijf, de long is als de long van het paard en het oor als het oor<br />

van een mol.<br />

De duur van de ’i’ uit ’vier’ is verlengd tot 150 ms, om het woord wat<br />

meer te accentueren. Het woord ’vak’ werd door Fluency iets teveel benadrukt<br />

en daarom werd de duur juist ingekort tot 79 ms voor de ’A’ en het<br />

maximum van de toonhgoogtestijging verlaagd tot 130 Hz. De ’Ei’ uit ’wijf’<br />

werd langer gemaakt (185 ms) en de toonhoogtestijging die op die klank<br />

7


lag verhoogd tot 152 Hz, zodat dit functiewoord nog meer benadrukt werd.<br />

’long’ werd ook verlengd (120 ms voor de ’O’) net als ’paard’ (156 ms voor<br />

de ’a’) en het laatste woord kreeg ook een sterker toonhoogte-accent (123<br />

Hz). Tot slot werd de ’O’ uit ’mol’ flink verlengd (tot 170 ms), ten eerste<br />

omdat het een functiewoord is, ten tweede omdat het het laatste woord uit<br />

de zin is.<br />

Zin 13: Op zijn lijf zit niet een schub als op het lijf van een vis die echt een<br />

vis is, maar het heeft haar als het haar van een haas als het nog zit in de<br />

buik van zijn ma ...’<br />

Ook in deze zin werd voor een aantal woorden de duur verlengd om ze<br />

meer accent te geven. Het waren de ’Ei’ uit ’lijf’(136 ms), de ’I’ uit ’zit’(44<br />

ms), de ’i’ uit ’die’(80 ms), de ’E’ uit ’echt’(80 ms), de ’A’ uit het tweede<br />

’als’ (69 ms), de ’a’ uit het eerste ’haar’(160 ms), de ’a’ uit ’haas’(173 ms)<br />

en de ’a’ uit ’ma’(tot 192 ms, ook omdat dit het laatste woord van de zin<br />

was).<br />

Bij sommige woorden zorgde een (sterker) toonhoogte-accent voor een<br />

nog duidelijkere spraak (duidelijker in de zin van dat de betekenis beter<br />

overgebracht werd). Het betrof hier de woorden ’zit’(108 Hz), ’echt’(109<br />

Hz), het eerste woord ’haar’(107 Hz) en ’haas’(123 Hz).<br />

De woorden ’schub’ en de laatste ’als’ waren juist iets te veel beklemtoond.<br />

Bij beiden werd de duur daarom iets ingekort (62 ms voor de ’Y’ en<br />

60 ms voor de ’A’, respectievelijk).<br />

Omdat het een vrij lange zin was met soms iets te lange stukken, is er<br />

bovendien nog een stilte aangebracht tussen ’schub’ en ’als’. Deze stilte duurde<br />

80 ms, dat is een stuk minder dan bij een komma, maar het maakte de<br />

zin toch iets prettiger te beluisteren. Verder bleek het lastig om het woord<br />

’echt’ goed te benadrukken, ondanks het verlengen en aanbrengen van het<br />

toonhoogte-accent (hoedpatroon). De oplossing bleek hiervoor bleek de volgende<br />

te zijn: het aanbrengen van een glotteslag van 81 ms tussen de twee<br />

klinkers van ’die’ en ’echt’.<br />

Zin 14: Die x was een Bard, dat is een man die dicht, zo zijn er veel<br />

in ij, want hij kwam uit ij.<br />

Deze zin is eigenlijk opgebouwd uit een aantal kleine zinnetjes. Omdat<br />

’Bard’ het laatste woord is van het eerste subzinnetje, klonk het een stuk<br />

beter wanneer de toonhoogtestijging op de ’A’ vervangen werd door een<br />

toonhoogtedaling (tot 94 Hz). Hetzelfde gold voor ’dicht’ (naar een minimum<br />

van 73 Hz) en ’ij’ (80 Hz).<br />

Een aantal woorden moest weer beter geaccentueerd worden: ’dat’ kreeg<br />

8


een zogenaamd hoedpatroon (maximum 116 Hz) en de duur werd verlengd<br />

van de klinker naar 90 ms, ’zo’ kreeg een toonhoogte-accent met een maximum<br />

van 125 Hz en de duur van de ’o’ werd verlengd tot 150 ms en tot slot<br />

werd de duur van de ’A’ uit ’kwam’ verlengd naar 120 ms, naast dat er een<br />

toonhoogte-accent op die klank kwam met een maximum van 120 Hz.<br />

Zin 15: En Llew Jones wou rood vlees op het bord van elk mens in zijn<br />

land, hij dacht:<br />

In deze zin is ’land’ weer eigenlijk een laatste woord van een zin en klonk<br />

het dus beter met een toonhoogtedaling (ipv een stijging) op de ’A’ (naar<br />

een minimum van 82 Hz). De duur van diezelfde klank is verlaagd naar 68<br />

ms. Het toonhoogte-accent op ’dacht’ werd iets verscherpt: een stijging met<br />

een maximum van 102 Hz.<br />

Zin 16: wie veel rood vlees eet wordt flink.<br />

In deze zin lag teveel de nadruk op ’rood’, voor de betekenis zou het beter<br />

zijn wanneer het woord ’veel’ de nadruk krijgt. Het toonhoogte-accent op<br />

’rood’ is dus helemaal verwijderd en de ’e’ uit ’veel’ is verlengd tot 200 ms<br />

en verder geaccentueerd met een toonhoogtestijging (hoedpatroon), waarbij<br />

het maximum lag op 132 Hz.<br />

Zin 17: Maar vlees is duur.<br />

Deze zin werd door Fluency prima uitgesproken!<br />

Zin 18: Hoe kom je aan zo veel vlees?<br />

In deze zin heeft ’kom’ een accent gekregen (hoedpatroon, toonhoogte maximaal<br />

124 Hz) en is de duur van de ’O’ verlengd naar 151 ms. Het toonhoogteaccent<br />

op vlees is wat lager geworden (maximum 112 Hz).<br />

Zin 19: Toen dacht hij aan vlees uit de zee, het vlees van die vis met<br />

een hart als een jong wijf.<br />

Het woord voor de komma, ’zee’, had oorspronkelijk een toonhoogtestijging<br />

als accent, dat is weer veranderd in een daling (minimum 77 Hz). Het<br />

toonhoogte-accent op ’vlees’ is in zijn geheel verwijderd (’vlees’ is al genoemd<br />

9


in de vorige zinnen en daardoor niet zo belangrijk meer). Het toonhoogteaccent<br />

op het laatste woord, ’wijf’, is ook veranderd in een sterke daling<br />

(minimum 73 Hz).<br />

Zin 20: Hij vindt dus een schip en dat schip brengt zo’n vis mee naar<br />

huis uit de zee bij de pool.<br />

In deze zin heeft ’vindt’ een accent gekregen (hoedpatroon op de ’I’, maximum<br />

van 126 Hz, plus duurverlenging tot 98 Hz). Bij de twee voorkomens<br />

van ’schip’ is de duur verlengd tot 105 ms. De pauze tussen ’schip’ en ’en’<br />

is wat verlengd (100 ms). Het toonhoogte-accent op ’huis’ is iets verscherpt<br />

(maximum 129 Hz). Om de correcte uitspraak ’puL’ te krijgen ipv ’poL’, is<br />

de spelling van ’pool’ met de hand gewijzigd in ’poel’.<br />

Zin 21: Dat vlees van die vis blijft wel goed door het ijs dat daar drijft,<br />

dacht x.<br />

Allereerst is hier het toonhoogte-accent op ’vlees’ aangescherpt (maximum<br />

142 Hz). Op ’vis’ zat een toonhoogte-accent, maar dat is weggehaald. De<br />

daling op de ’Ei’ van ’drijft’ (voor de komma) is verscherpt (minimum 102<br />

Hz). De twee laatste woorden zijn ook meer benadrukt, door ’dacht’ een<br />

sterke toondaling mee te geven (minimum 96 Hz) en de duur de naam ’x’ te<br />

verlengen (de ’I’ duurt nu 116 ms).<br />

Zin 22: Maar Jones had het mis:<br />

De duur van de ’I’ van ’mis’ is verlengd tot 104 ms en het heeft een toondaling<br />

gekregen van 124 Hz naar 112 Hz.<br />

Zin 23: door het spek blijft het lang warm in de buik van die vis, nog<br />

wel een week na zijn dood.<br />

Het woord ’lang’ heeft een toonhoogte-accent gekregen van 109 Hz naar<br />

118 Hz naar 106 Hz. De duur van de ’A’ van ’warm’ is verlengd naar 137<br />

ms. Het woord voor de komma ’vis’ heeft ipv een sterke stijging weer een<br />

toondaling gekregen (101 Hz naar 92 Hz naar 141 Hz).<br />

10


3 Liesbeth Janzen<br />

Zin 24: Zo kwam al vlug de rot in die vis en de lucht werd zo slecht dat er<br />

geen net woord voor is.<br />

Allereerst heb ik de duur van ’vlug’ aangepast, omdat het woord beklemtoond<br />

moet worden, terwijl dit niet het geval was. De ’Y’ duurt nu 91 ms.<br />

Voor ’en’ hoort een pauze (een prosodische grens), omdat daar de scheiding<br />

tussen twee zinsdelen zit. Hiervoor moet een extra segment toegevoegd worden.<br />

De duur van dat segment wordt 219 ms. De waarde voor de duur van<br />

’A’ in ’al’ wordt verlengd tot 103 ms, waardoor de spraak minder gehaast<br />

klinkt. De toonhoogte van ’kwam’ wordt verlaagd op het punt van de ’A’,<br />

zodat er niet ten onrechte een klemtoon gezet wordt. Hetzelfde geldt voor<br />

de ’e’ in ’geen’ en ’A’ in ’al’. Ook voeg ik een accent toe op ’vis’, door de<br />

toonhoogte iets te verhogen en de duur te verlengen tot 97 ms.<br />

Zin 25: Het vlees uit zee komt aan in Wales maar met zo’n leeuw van<br />

een stank dat geen hond het meer wil.<br />

Het valt op dat de spraak van Fluency erg ’staccato’ klinkt; dat wil zeggen<br />

heel puntig, vooral in het begin van de zin. Het klinkt alsof iemand expres<br />

heel erg overdreven aan het articuleren is. Ook het intonatiepatroon klopt<br />

niet helemaal. Vooral het gedeelte ’dat geen hond het meer wil’ heeft geen<br />

goed intonatiepatroon. Op ’dat geen hond’ ligt nu de nadruk, terwijl het<br />

beter zou zijn als deze zou liggen op ’hond’, als in: ’Het vlees uit zee komt<br />

aan in Wales, maar met zo’n leeuw van een stank dat geen HOND het meer<br />

wil’. Hiervoor wordt allereerst de toonhoogte aangepast. Door een extra<br />

pitchpoint op de /o/ in ’hond’ toe te voegen en vervolgens de toonhoogte<br />

op deze plek te verhogen naar 155 Hz, klinkt het geheel al een stuk natuurlijker.<br />

Ook op ’zee’ en ’vlees’ wordt een accent gelegd, maar in mindere<br />

maten. Vervolgens moeten enkele spraakklanken van ’Wales’ vervangen worden.<br />

Fluency zet dit woord namelijk om in /w*a-l@s/. Door de /a/ om te<br />

zetten in /e/ en de /@/ te verwijderen is dit probleem opgelost. Verder<br />

loopt het intonatiepatroon na ’hond’ snel af, iets wat in natuurlijke spraak<br />

vaak het geval is. Hier klinkt dit echter niet goed, het is logischer als de<br />

toonhoogte na ’hond’ ongeveer gelijk blijft. Pas als het woord ’meer’ wordt<br />

uitgesproken laten we de toonhoogte iets dalen, met een climax na ’wil’.<br />

Zin 26: Al wie het rook lei zijn hand op zijn neus en werd boos op Llew<br />

Jones.<br />

Wat bij het beluisteren van deze zin opmerkelijk is is de uitspraak van ’Llew<br />

11


Jones’, respectievelijk /’El ?’El ?’e w*e dZ*ons/. Na de spraakklanken van<br />

deze naam veranderd te hebben in /l’i:w dZ*ons/. Op ’boos’ leggen we de<br />

klemtoon door de toonhoogte te verhogen naar 138 Hz. Ook de duur van<br />

de spraakklank /o/ wordt iets verlengd, zodat het woord nog meer geaccentueerd<br />

wordt. Dezelfde procedure passen we toe op ’al’ en in mindere<br />

mate op ’wie’, ’rook’ en ’neus’. Verder komen de duren die Fluency hanteert<br />

in dit geval voor het oor natuurlijk over.<br />

Zin 27: Een man gooit een steen naar zijn hoofd en nog een man knijpt<br />

met een hand zijn neus dicht, pakt een stuk van dat vlees en ook dat<br />

krijgt Llew Jones naar zijn kop.<br />

Door de invoer van komma’s in Fluency weet het programma al dat er een<br />

scheiding van twee zinsdelen is. Er wordt hier een goede prosodische grens<br />

gelegd. De accentuering op de woorden is echter nog niet erg goed. We verhogen<br />

de toonhoogte op ’steen’(138 Hz), ’hoofd’( 139Hz), ’hand’(134 Hz),<br />

’stuk’ (140 Hz), de tweede ’dat’(134 Hz). Na deze veranderingen klinkt de<br />

spraak al beter. Wel valt op dat vooral op het begin van de zin de algehele<br />

toonhoogte iets te hoog is. Door hier overal de toonhoogte te verlagen met<br />

zo’n 10 Hz wordt dit probleem verholpen.<br />

Zin 28: Nu wordt, door een heel klein soort beest in de darm van die<br />

vis, het vlees snel tot gif.<br />

Een van de eerste dingen die opvalt is dat er geen accent op ’wordt’ ligt,<br />

terwijl dit wel voor de hand ligt. Na het al bestaande pitchpoint verplaatst<br />

te hebben naar 144 Hz, klinkt het eerste gedeelte van de uiting al veel natuurlijker.<br />

Ook moet de /e/ in ’beest’ verlengd worden, omdat er nu geen<br />

accent op ligt en omdat het woord te snel uitgesproken wordt. Verder is<br />

de omzetting van Fluency natuurlijk, ook al zouden er nog meer accenten<br />

gelegd kunnen worden (die dan ook voor een groot deel bepaald worden door<br />

de context: wat is nieuwe en wat is oude informatie?).<br />

Zin 29: Komt dat gif in een wond dan volgt de dood door koud vuur.<br />

Omdat ’komt dat gif in een wond’ en ’dan volgt de dood door koud vuur’<br />

eigenlijk twee verschillende frasen zijn hebben we een ’glottal stop’ toegevoegd<br />

na ’wond’, waardoor het zinsverloop natuurlijker klinkt. Ook hebben we de<br />

toonhoogte van ’wond’ verhoogd naar 134 Hz, omdat de eerste frase eigenlijk<br />

een soort van vraag (indien?) is. Andere accenten heeft Fluency goed<br />

toegekend (respectievelijk op ’wond’, ’dood’ en ’koud vuur’).<br />

12


Zin 30: De dag er na werd Jones ziek.<br />

Wat hier vooral opvalt is dat er vrijwel geen accenten worden geplaatst.<br />

Door ’er na’ als een woord met klemtoon te zien klinkt het resultaat van<br />

Fluency al stukken beter. Allereerst hebben we de toonhoogte van /a/ verhoogd<br />

naar 142 Hz. Ook is de duur van de spraakklank aangepast, deze is<br />

nu 178 ms. Omdat de /w/ te snel op de /a/ volgde is er een extra segment<br />

toegevoegd na de /a/, namelijk een ’glotal stop’. Wel hebben we de duur<br />

van deze ’glotal stop’ iets verkort naar 70 ms, omdat de stilte tussen de /a/<br />

en de /w/ anders weer te groot zou zijn geworden. Zowel de toonhoogte als<br />

de zinsintonatie klopt in de rest van de zin wel.<br />

Zin 31: Zijn huid was heet en klam.<br />

Zin 32: Zijn oog werd nat en dof.<br />

Zin 33: Hij hijgt en hapt naar lucht.<br />

Zinnen 31, 32 en 33 hebben we samengenomen, omdat ze eenzelfde soort<br />

opbouw hebben en omdat Fluency dezelfde ’fouten’ maakt. De intonatie en<br />

duren zijn in principe goed, ware het niet dat de belangrijkste woorden van<br />

de zinnen niet geaccentueerd worden (iets dat we al vaker gezien hebben bij<br />

Fluency). In zin 31 hebben we daarom de toonhoogte van /ui/ in ’huid’<br />

verhoogd naar 146 Hz. In zin 32 hebben we de toonhoogte van /o/ in ’oog’<br />

verhoogd naar 135Hz. Bij zin 33 werd de /ij/ in ’hijgt’ verhoogd naar 141<br />

Hz. Op ’hapt’ lag al een accent, daar hoeft dus niets aan veranderd te<br />

worden. Nu we deze drie veranderingen zo op een rijtje zien, valt op dat<br />

als er een accent geplaatst moet worden de bijbehorende toonhoogte vaak<br />

rond de 140 Hz ligt. Blijkbaar is dat een frequentie die in natuurlijke spraak<br />

gebruikt wordt als het gaat om plaatsing van accenten.<br />

4 Charlotte Spitters<br />

Controle van de Graph2Phon omzetting:<br />

Er zijn een aantal woorden die niet helemaal correct worden uitgesproken.<br />

Het eerste probleem doet zich voor bij de Engelse zinnen. Deze hebben we zo<br />

goed mogelijk in een klankrepresentatie omgezet, maar het blijft behelpen.<br />

Het Engels kent immers andere klanken dan het Nederlands.<br />

Een tweede probleem dat opvalt, is het lidwoord ’de’. In foneemschrift<br />

’d@’. Het is zo dat de ’e’ in ’de’ een sjwa is, maar deze wordt door het<br />

programma niet goed gerealiseerd. Waarschijnlijk zou het heel wat schelen<br />

13


als de duur van de sjwa iets verlengd zou worden. Ook bij het lidwoord<br />

’een’ doet zich zulk een probleem voor. Hier echter wordt de klinker niet te<br />

kort maar te lang uitgesproken. Waar de levende Nederlander het lidwoord<br />

’een’ zal verbasteren tot iets wat meer in de richting komt van ’un’, zegt<br />

de computer steevast n. Een ander probleem zijn de r-klanken. Aan het<br />

eind van een woord heb je een andere r-klank dan aan het begin. In onze<br />

grafeemfoneem omzetter zit daar een klein foutje. De r aan het eind van<br />

het woord ’voor’ wordt veel te duidelijk gerealiseerd, terwijl die van ’maar’<br />

wel half wordt in geslikt. Het is vervreemdend dat de persoon die de tekst<br />

uitspreekt zo twee verschillende accenten lijkt te hebben. Ook bij het woord<br />

’eerst’ hebben we problemen met het laatste cluster. Dit wordt te duidelijk<br />

gearticuleerd. Een levende spreker zou de helft van het cluster nauwelijks<br />

uitspreken.<br />

De ’s’ in het woord ’som’ wordt door de computer ook verkeerd uitgesproken.<br />

De ’s’ klinkt meer als een ’z’ en zou dus harder gerealiseerd moeten<br />

worden. Dit is geen fout in ons programma, maar een gemis in Mbrola.<br />

De controle van pauzes en duren hebben we per zin gedaan, dus zullen<br />

hieronder ook per zin worden besproken. .<br />

Zin 34: Nu is er in Wales een proef op de som om te zien wie echt een<br />

Bard was en wie niet, en het is een proef die nooit faalt.<br />

We hebben de duur van ’nu’ korter gemaakt. Fluency laat door assimilatie<br />

’nu’ te veel over lopen naar ’is’, dus we hebben ’nu’ eerder laten aflopen.<br />

De duur van ’echt’ hebben we verlengd zodat ’een’ nog meer ingeslikt wordt<br />

als het ware. De ’ee’ wordt na een woord als ’echt’ dan ook bijna niet meer<br />

uitgesproken. De toonhoogte van ’zien’ hebben we verlaagd, want er lag te<br />

veel nadruk op. Ook hebben we de toonhoogte van ’bard’ iets verlaagd en<br />

de toonhoogte van ’faalt’ al iets eerder laten dalen dan Fluency doet. Bij<br />

Fluency gaat de toonhoogte aan het eind van de zin net iets te laat en te<br />

abrupt nog naar beneden. Het is natuurlijker als je al wat eerder kan horen<br />

of de zin op zijn eind is of niet. De lengte van ’Wales’ is langer gemaakt,<br />

want ’Wales’ heeft nadruk. De toonhoogte van ’proef’ hebben we iets verlaagd.<br />

De zin klinkt voor ons zo acceptabel.<br />

Zin 35: Schoon elk jaar een bard een prijs krijgt om hem, zo hij echt<br />

een Bard is,<br />

De pauze tussen krijgt en om hem hebben we een stuk langer gemaakt.<br />

Nu kan Fluency niet weten dat die pauze daar lang moet zijn, omdat Fluency<br />

aan dit stukje de gehele structuur van de zin nog niet kan aflezen. Het<br />

is alleen jammer dat Fluency de assimilatie tussen krijgt en om hem niet<br />

14


stopt. De duur van ’jaar’heb ik verlengd. En ook de duur en toonhoogte van<br />

elk is verlengd en verhoogd. De toonhoogte van jaar loopt dan weer mooi<br />

naar beneden. Het tweede gedeelte ’zo hij echt een Bard is’ klinkt prima.<br />

Zin 36: tot steun te zijn op zijn weg, weet elk dat hij eerst dood moet<br />

zijn voor men er echt op aan kan.<br />

De klemtoon moet in de zin liggen op ’elk’, dus we hebben de toonhoogte<br />

daar verhoogd. De klemtoon lag namelijk op ’weet’. Ook de toonhoogte op<br />

’weg’ hebben we wat verhoogd. Verder klinkt de zin goed.<br />

Zin 37: Die proef op de som is: was het woord dat hij het laatst sprak<br />

een groot woord<br />

We hebben de duur tussen ’proef’ en ’op’ vergroot. (de f van proef heeft<br />

nu een lengte van 154) We hebben de toonhoogte op ’som’ verhoogd ten op<br />

zichte van ’is’. We hebben extra pitchpoints op ’som’(140hz) en ’is’ (130hz)<br />

gezet. De toonhoogte was eerst op beide 126 hz. De duur tussen ’som’ en<br />

’is’ hebben we vergroot. Ook de toonhoogte op ’woord’ is veranderd. Ook<br />

al staat er in de tekst geen vraagteken, een vragende intonatie klinkt wel<br />

beter. Daartoe staat er een extra pitchpoint op de ’d’. De toonhoogte loopt<br />

van de ’o’ omhoog in een vragende intonatie. ’Woord’ eindigt op 140 Hz.<br />

Zin 38: En Jones blijkt echt een Bard want hij spreekt een groot woord als<br />

hij sterft.<br />

We hebben de toonhoogte op Jones verhoogd, die is nu 145hz. De toonhoogte<br />

op de ’e’ in ’echt’ is verhoogd naar 150 Hz. De lengte van de ’r’ in<br />

’Bard”hebben we verlengd tot 70ms. De toonhoogte hebben we verlaagd<br />

tot 105 Hz. We hebben een extra pitchpoint op de ’d’ van woord gezet op<br />

145 Hz. De toonhoogte op ’groot’ hebben we verhoogd tot 140 Hz. Lengte<br />

tussen ’want’ en ’hij’ is verkleind. De toonhoogte van ’want’ hebben we<br />

verlaagd tot 80Hz.<br />

Zin 39: Wie wil zien wat dat was kijkt maar in het boek, want het is<br />

nog te koop.<br />

De lengte tussen ’k’ en ’ij’ in ’kijkt’ hebben we korter gemaakt. De duur<br />

tussen ’wil’ en ’zien’ en ’wat’ en ’dat’ hebben we ook vergroot. Het begin van<br />

de zin werd in zijn geheel heel snel uitgesproken. Het woord ’was’ hebben<br />

15


we verlengd door de ’a’ meer tijd te geven. Die duurt nu 140 ms. De toonhoogte<br />

op ’maar’ hebben we verlaagd tot 104 Hz en die op ’in’ verhoogd tot<br />

140 Hz na toevoeging van een extra pitchpoint.<br />

Zin 40: Als men het uit heeft denkt men nog lang net als ik nu schrijf.<br />

Fluency geeft in deze zin helemaal geen accent op ’uit’ terwijl dit wel een<br />

belangrijk woord is voor de zin. We hebben een extra pitch op ’uit’ gezet<br />

van 150 Hz. We hebben de lengte tussen heeft en denkt vergroot. Hier moet<br />

ook eigenlijk een komma staan. De lengte is 265 ms. De toonhoogte op<br />

’heeft’ hebben we verlaagd naar 85 Hz en het woord hebben we verlengd.<br />

De ’e’ heeft een lengte van 190ms. Toonhoogte op denkt. De toonhoogte op<br />

’net’ hebben we verhoogd tot 150 Hz. Ook de toonhoogte op ik hebben we<br />

verhoogd tot 140Hz.<br />

Zin 41: Het brein komt in de ban van die taal.<br />

De duur tussen brein en komt hebben we verlengd tot 153ms. De duur<br />

tussen ’komt’ en ’in’ hebben we verlengd tot 163Hz. De klemtoon op brein<br />

hebben we meer aan het begin van ei gezet. De toonhoogte op ’ban’ hebben<br />

we verhoogd naar 120 Hz. De toonhoogte van taal hebben we aflaten lopen<br />

vanaf 130 Hz.<br />

Zin 42: In die taal is er van elk ding nog maar een, want twee of meer<br />

kan haast nooit.<br />

Ten eerste spreekt Fluency ’een’ uit als ’@n’. Als echter het telwoord wordt<br />

bedoeld moet het weer met een ’ee’ worden uitgesproken, dus dit hebben<br />

we aangepast. Ook de lengte van ’ee’ moest groter worden. Die is 150 ms<br />

geworden. Tussen ’taal’ en ’is’ hebben we de toonhoogte omlaag laten gaan.<br />

De toonhoogte van ’nooit’ daalde al enigszins, maar het klinkt beter als die<br />

nog wat lager is. Bij ’taal’ hebben we de toonhoogte laten beginnen op 150<br />

Hz en laten dalen tot 100 Hz. In de fluency uitspraak heeft ’taal’ een op en<br />

aflopende toonhoogte.<br />

Zin 43: Het is iets als een taal met maar een hand, een taal die hinkt.<br />

Voor ’een’ geldt hetzelfde als hierboven. Het enige wat we hier gedaan<br />

hebben is een ’h’ toegevoegd aan het begin van de regel. Dit is volgens ons<br />

de enige plek waarop die in het lidwoord ’het’ ook wordt uit gesproken.<br />

16


Dit overziend zijn er veel verschillende dingen die moeten worden aangepast.<br />

Klemtoon ligt soms op de werkwoorden, terwijl het veel natuurlijker klinkt<br />

als die op inhoudswoorden ligt.<br />

5 Bespreking<br />

Vooral in het begin van de zinnen maakt de uitspraak van Fluency een<br />

gehaaste indruk. De duren in onze omzetting zijn in principe goed (uitgezonderd<br />

van gevallen als ’één’), wel wordt het geheel misschien iets te<br />

langzaam uitgesproken (dit is te verhelpen door de pauzes tussen de woorden<br />

nog iets te verkorten). Een tekortkoming van onze omzetting is dat er<br />

niet veel rekening gehouden wordt met de zinsintonatie. Daar waar Fluency<br />

nog wat probeert: met name een afname van de toonhoogte naarmate de zin<br />

verder vordert, klinkt het geheel bij onze omzetting monotoon: de woorden<br />

afzonderlijk worden goed uitgesproken en zijn te begrijpen. Ook klinken de<br />

woorden redelijk natuurlijk. Als echter naar de zin geluisterd wordt blijkt<br />

dat op het gebied van zinsintonatie nog veel moet gebeuren. Bijvoorbeeld<br />

het toepassen van een ’standaard-toonhoogtecontour’: aflopend met accenten<br />

op bepaalde woorden. De plaatsing van de accenten zou bepaald kunnen<br />

worden door de klasse van het woord: werkwoord, naamwoord etc. Zoals<br />

al eerder vermeld, zou het dus handig zijn om een programma te maken<br />

dat onderscheid kan maken tussen de verschillende woorden en vervolgens<br />

bepaalt welk woord een klemtoon krijgt en welk woord niet. Overigens moet<br />

wel opgemerkt worden dat Fluency de Engelse woorden nog beroerder uitspreekt<br />

dan onze omzetting. Oorzaak hiervoor is dat wij de Engelse woorden<br />

op een Nederlandse manier herschreven hebben en ze vervolgens laten uitspreken<br />

m.b.v. Nederlandse difonen. Fluency spreekt de Engelse woorden<br />

direct uit alsof het Nederlandse woorden zijn (en dus ook met Nederlandse<br />

difonen). Het resultaat bij Fluency is onverstaanbaar, terwijl het bij onze<br />

omzetting klinkt als een Nederlander die (geen goed) Engels spreekt. Ook<br />

klinkt de stem van Fluency iets ’metaal-achtiger’ dan die gebruikt wordt bij<br />

de <strong>MBROLA</strong> koppeling, maar dat heeft wellicht te maken met de stem die<br />

we gekozen hebben.<br />

Het valt op dat vooral korte zinnen erg goed door Fluency worden<br />

omgezet: zowel de toonhoogte als de duren komen redelijk overeen met dat<br />

wat door de mens als natuurlijke spraak ervaren wordt. Bij langere zinnen<br />

kan de accentuering ook wel goed zijn, maar in de meeste gevallen is dit niet<br />

het geval: accenten worden onterecht (niet)geplaatst.<br />

17


6 Conclusie<br />

Het meeste effect op de verbetering van de beregeling heeft de duur. Als<br />

we de duur aanpassen in Fluency klinkt de spraak vaak natuurlijker. Ook<br />

wordt er dan meteen een accent op gelegd.<br />

Hieronder volgt een aantal simpele regels waarmee wij hopen onze monotone<br />

<strong>MBROLA</strong>-spraak wat natuurlijker te laten klinken:<br />

• Het laatste woord van de zin krijgt een duurverlenging (en daarmee<br />

een accent);<br />

• Een woord voor een komma krijgt ook vaak een duurverlening en een<br />

accent (vaak in de vorm van een toondaling);<br />

• Declinatie (een afloop van de toonhoogte naarmate het eind van de<br />

zin nadert) moet worden toegevoegd;<br />

• Onderscheid maken tussen inhouds- en functiewoorden: de inhoudswoorden<br />

krijgen in het algemeen een accent. Hiervoor zou part-of-speechtagging<br />

van pas kunnen komen;<br />

• Als het aanwijzende voornaamwoord niet gevolgd wordt door een zelfstandig<br />

naamwoord (dus wel: dat is leuk, maar niet: die man is leuk)<br />

heeft het aanwijzende voornaamwoord een accent. Hiervoor zou partof-speech-tagging<br />

van pas kunnen komen;<br />

• Bij een combinatie van zelfstandig naamwoord + bijvoeglijk naamwoord<br />

krijgt het bijvoegelijk naamwoord (ook) een accent;<br />

• Wanneer een vraagwoord wordt gevolgd door een werkwoord, krijgt<br />

dit werkwoord een accent;<br />

• Aan het einde van een vraagzin krijgt het laatste woord een stijgende<br />

toonhoogte ipv een dalende;<br />

• Een woord voor een dubbele punt wordt vaak geaccentueerd met een<br />

duurverlenging plus toonhoogtedaling.<br />

Wanneer we aan de slag gaan met part-of-speech-tagging zal moeten<br />

blijken of we deze regels daadwerkelijk kunnen implementeren en of ze het<br />

gewenste effect zullen hebben.<br />

18

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!