3 Automatisk detektering av partikelverb - Stp - Uppsala universitet
3 Automatisk detektering av partikelverb - Stp - Uppsala universitet
3 Automatisk detektering av partikelverb - Stp - Uppsala universitet
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Produktion <strong>av</strong> syntetiskt tal<br />
För att en dator ska klara <strong>av</strong> att läsa upp en skriven text med någorlunda<br />
naturligt uttal måste texten först konverteras till en underliggande fonetisk<br />
beskrivning. Ett grundläggande steg i denna process är att den fonetiska<br />
transkription för alla orden i texten slås upp i lexikon. Ett alternativ till detta är<br />
att använda grafem-till-fonemregler i kombination med ett undantagslexikon.<br />
Ett annat viktigt steg är den lingvistiska analysen. Omfattningen <strong>av</strong> analysen<br />
varierar mycket mellan olika system men den är nödvändig för att åstadkomma<br />
en hyfsad prosodi då lingvistisk analys gör det möjligt att sätta ut prosodiska<br />
markörer. Syntaktisk, morfologisk och ibland även semantisk analys gör att vi<br />
kan sätta markörer för t.ex. st<strong>av</strong>elsestruktur och frasgränser. Dessa markörer<br />
styr sedan talljudens längd, grundtonskurvans mönster och intensiteten och de<br />
är <strong>av</strong>görande för prosodins kvalitet. Även mänskliga faktorer såsom ålder, kön,<br />
ansatsrörets längd, hälsa och sinnesstämning påverkar indirekt prosodin men<br />
dessa parametrar går sällan att få fram utifrån den skrivna texten.<br />
Den färdiga fonetiska representationen konverteras sedan till tal. Det finns<br />
olika tekniker för detta; formantsyntes är parameterstyrd och helt<br />
datorgenererad, konkateneringssyntes innebär att förinspelade ljudsegment från<br />
en människa, t.ex. difoner, klistras ihop. En difon består <strong>av</strong> övergången mellan<br />
två ljud, t.ex. andra halvan <strong>av</strong> ett ”b” följt <strong>av</strong> första halvan <strong>av</strong> ett ”a”. Vitsen<br />
med difoner är att man fångar övergångarna mellan olika fonem (t.ex.. låter ”b”<br />
framför ett ”a” lite annorlunda än framför ett ”i”). För att syntestisera ordet<br />
”bad” hämtas följande difoner från en difondatabas: tystnad+b, b+a, a+d<br />
och d+tystnad.<br />
Motivering <strong>av</strong> uppgiften<br />
Varför är det då viktigt att kunna detektera <strong>partikelverb</strong> vid text-tilltalomvandling?<br />
För det första skiljer sig <strong>partikelverb</strong>ens betoningsmönster<br />
från andra verbfrasers och detta påverkar prosodin. Detta gör att om man inte<br />
kan hitta <strong>partikelverb</strong>en kommer dessa alltid att betonas fel vilket leder till att<br />
det kan vara svårt att förstå vad som menas och helhetsintrycket <strong>av</strong> syntesen<br />
blir sämre. För att göra syntesen så lättförståelig som möjligt är det därför<br />
viktigt att hitta <strong>partikelverb</strong>en men att samtidigt se till att andra, liknande<br />
konstruktioner inte får <strong>partikelverb</strong>sbetoning om de inte ska ha det. För det<br />
andra är det behändigt att kunna behandla <strong>partikelverb</strong>en som hela enheter i<br />
stället för två ord (verb och partikel) under förarbetet <strong>av</strong> texten inför syntesen.<br />
Detta gäller framför allt när verbet och partikeln står efter varandra. I dessa<br />
fall blir materialet enklare att parsa, d.v.s. analysera syntaktiskt, och vi får en<br />
bättre grammatisk beskrivning. Detta i sin tur leder till att det är lättare att sätta<br />
ut prosodiska markörer. Summan <strong>av</strong> det hela är att vi får ett naturligare uttal på<br />
både fras- och meningsnivå.<br />
2 Definition <strong>av</strong> <strong>partikelverb</strong><br />
Att hitta en definition <strong>av</strong> ordet ”<strong>partikelverb</strong>” i svenska grammatikböcker är<br />
inte lätt då det oftast inte finns med. Dock verkar grammatikboksförfattarna<br />
vara ense om att det finns konstruktioner i svenskan som består <strong>av</strong> ett<br />
obetonat verb följt <strong>av</strong> en betonad partikel eller ett verb med en betonad<br />
9