29.08.2013 Views

OM KOMMUNIKATION, INNOVATION OG TEKNIK SEP 2006 - IT- og ...

OM KOMMUNIKATION, INNOVATION OG TEKNIK SEP 2006 - IT- og ...

OM KOMMUNIKATION, INNOVATION OG TEKNIK SEP 2006 - IT- og ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

ORD PÅ 2 SEKUNDER<br />

AF NANET POULSEN<br />

Blot at nå til det aktuelle dikteringsværktøj,<br />

der omsætter tale fra et menneske til<br />

tekst i løbet af få sekunder, har krævet et<br />

omfattende udviklingsarbejde. I den første<br />

version af det danske talegenkendelsessystem,<br />

Dictus, som er udviklet med støtte<br />

fra Videnskabsministeriet, kræves det, at<br />

der opbygges n<strong>og</strong>et, der ligner en personlig<br />

relation mellem menneske <strong>og</strong> maskine. Det<br />

enkelte menneske skal indtale tekst af op til<br />

en times varighed, før der er tilstrækkelig<br />

sikkerhed for, at pr<strong>og</strong>rammet forstår denne<br />

persons tale. Der skulle jo gerne komme til<br />

at stå ”Kære mor” i e-mailen <strong>og</strong> ikke ”Kager<br />

mor”. Talegenkendelse indebærer, at lydbølger<br />

fra den menneskelige stemme filtreres <strong>og</strong><br />

omdannes til en akustisk model bestående<br />

FOTO: LES KANER<br />

-Taleteknol<strong>og</strong>i vil blive en utrolig vigtig komponent<br />

i automatisering af service. I virkeligheden er det<br />

<strong>og</strong>så en mere naturlig ting at tale til sin pc frem<br />

for at sidde med et gammeldags skrivemaskinelignende<br />

tastatur, mener Jens Kjærum fra PDC.<br />

af lyde <strong>og</strong> pauser. Alle lyde slås op i en<br />

spr<strong>og</strong>model, der er bygget ud fra mere end<br />

600 millioner sandsynlige ord <strong>og</strong> sætninger.<br />

Det er en sandsynlighedsberegning på denne<br />

spr<strong>og</strong>model, der får systemet til at forstå,<br />

at man taler om at ”køre bil” <strong>og</strong> ikke ”køre<br />

pil”.<br />

-Faktisk har vores største udfordring været<br />

at skaffe de rigtige tekster til at lægge ind<br />

i den statistiske spr<strong>og</strong>model, fortæller Jens<br />

Kjærum fra TDC, der står bag Dictus. Og<br />

derudover har det været at få hastighed på<br />

systemet:<br />

-I vores første test af systemet i december<br />

sidste år gik der i gennemsnit 4 sekunder, fra<br />

et ord blev sagt, til teksten kom på skærmen.<br />

Nu er vi nede på gennemsnitligt under 2 se-<br />

kunder. Og det er forskellen på at virke <strong>og</strong><br />

ikke at virke, siger han. –Teksten skal jo på,<br />

mens personen, der taler, er på skærmen.<br />

PDC, DR, TV2 <strong>og</strong> Videnskabsministeriet<br />

har haft markant fokus på systemets genkendelsesprocent.<br />

Den ligger nu på 96-97.<br />

Og her oppe skal den være, for at deltagerne<br />

er tilfredse.<br />

>I<br />

Læs mere om talegenkendelse www.pdc.dk/dictus,<br />

www.oio.dk søg på tale-til-tekst<br />

www.vtu.dk søg på Speech Technol<strong>og</strong>y<br />

eDK 06 #3 05

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!