OM KOMMUNIKATION, INNOVATION OG TEKNIK SEP 2006 - IT- og ...
OM KOMMUNIKATION, INNOVATION OG TEKNIK SEP 2006 - IT- og ...
OM KOMMUNIKATION, INNOVATION OG TEKNIK SEP 2006 - IT- og ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
ORD PÅ 2 SEKUNDER<br />
AF NANET POULSEN<br />
Blot at nå til det aktuelle dikteringsværktøj,<br />
der omsætter tale fra et menneske til<br />
tekst i løbet af få sekunder, har krævet et<br />
omfattende udviklingsarbejde. I den første<br />
version af det danske talegenkendelsessystem,<br />
Dictus, som er udviklet med støtte<br />
fra Videnskabsministeriet, kræves det, at<br />
der opbygges n<strong>og</strong>et, der ligner en personlig<br />
relation mellem menneske <strong>og</strong> maskine. Det<br />
enkelte menneske skal indtale tekst af op til<br />
en times varighed, før der er tilstrækkelig<br />
sikkerhed for, at pr<strong>og</strong>rammet forstår denne<br />
persons tale. Der skulle jo gerne komme til<br />
at stå ”Kære mor” i e-mailen <strong>og</strong> ikke ”Kager<br />
mor”. Talegenkendelse indebærer, at lydbølger<br />
fra den menneskelige stemme filtreres <strong>og</strong><br />
omdannes til en akustisk model bestående<br />
FOTO: LES KANER<br />
-Taleteknol<strong>og</strong>i vil blive en utrolig vigtig komponent<br />
i automatisering af service. I virkeligheden er det<br />
<strong>og</strong>så en mere naturlig ting at tale til sin pc frem<br />
for at sidde med et gammeldags skrivemaskinelignende<br />
tastatur, mener Jens Kjærum fra PDC.<br />
af lyde <strong>og</strong> pauser. Alle lyde slås op i en<br />
spr<strong>og</strong>model, der er bygget ud fra mere end<br />
600 millioner sandsynlige ord <strong>og</strong> sætninger.<br />
Det er en sandsynlighedsberegning på denne<br />
spr<strong>og</strong>model, der får systemet til at forstå,<br />
at man taler om at ”køre bil” <strong>og</strong> ikke ”køre<br />
pil”.<br />
-Faktisk har vores største udfordring været<br />
at skaffe de rigtige tekster til at lægge ind<br />
i den statistiske spr<strong>og</strong>model, fortæller Jens<br />
Kjærum fra TDC, der står bag Dictus. Og<br />
derudover har det været at få hastighed på<br />
systemet:<br />
-I vores første test af systemet i december<br />
sidste år gik der i gennemsnit 4 sekunder, fra<br />
et ord blev sagt, til teksten kom på skærmen.<br />
Nu er vi nede på gennemsnitligt under 2 se-<br />
kunder. Og det er forskellen på at virke <strong>og</strong><br />
ikke at virke, siger han. –Teksten skal jo på,<br />
mens personen, der taler, er på skærmen.<br />
PDC, DR, TV2 <strong>og</strong> Videnskabsministeriet<br />
har haft markant fokus på systemets genkendelsesprocent.<br />
Den ligger nu på 96-97.<br />
Og her oppe skal den være, for at deltagerne<br />
er tilfredse.<br />
>I<br />
Læs mere om talegenkendelse www.pdc.dk/dictus,<br />
www.oio.dk søg på tale-til-tekst<br />
www.vtu.dk søg på Speech Technol<strong>og</strong>y<br />
eDK 06 #3 05