22.01.2014 Views

Taleteknologi - Institutt for elektronikk og telekommunikasjon - NTNU

Taleteknologi - Institutt for elektronikk og telekommunikasjon - NTNU

Taleteknologi - Institutt for elektronikk og telekommunikasjon - NTNU

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Taleteknol<strong>og</strong>i</strong><br />

Torbjørn Svendsen<br />

<strong>Institutt</strong> <strong>for</strong> <strong>elektronikk</strong> <strong>og</strong> <strong>telekommunikasjon</strong><br />

<strong>NTNU</strong><br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 1


<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 2


<strong>Taleteknol<strong>og</strong>i</strong><br />

“Speech is not just the future of Windows, but the future of<br />

computing itself”<br />

William H. Gates III<br />

“Computers are starting to do what most two-year-olds can do:<br />

identify spoken words and answer back”<br />

IEEE Spectrum, Jan. 1997<br />

Hyde’s lov:<br />

”The accuracy of speech rec<strong>og</strong>nizers is 98%”<br />

S.R. Hyde, Joint Speech Research Unit, 1969<br />

Korrolar:<br />

”Because speech rec<strong>og</strong>nizers have an accuracy of 98%, tests must be<br />

arranged to prove it”<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 3


Hvor<strong>for</strong> tale?<br />

• Enkelt<br />

– naturlig kommunikasjons<strong>for</strong>m<br />

– krever ingen særskilte <strong>for</strong>kunnskaper eller ferdigheter<br />

• Frigjørende<br />

– hender <strong>og</strong> øyne fri til andre oppgaver → kan unngå tastatur <strong>og</strong><br />

skjerm<br />

– hjelp <strong>for</strong> funksjonshemmede<br />

• Tilgjengelighet av in<strong>for</strong>masjon<br />

– hvor som helst, når som helst, hvem som helst<br />

– For eksempel: Enkelt grensesnitt basert på tale <strong>og</strong> telefon<br />

• Tale- <strong>og</strong> språkteknol<strong>og</strong>i på norsk må ha en norsk basis<br />

– språkkunnskap <strong>og</strong> teknol<strong>og</strong>ikunnskap<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 4


<strong>Taleteknol<strong>og</strong>i</strong> - flerfaglig<br />

Elektro-<br />

nikk<br />

Signal-<br />

behandling<br />

Lingvistikk<br />

Statistikk<br />

<strong>Taleteknol<strong>og</strong>i</strong><br />

Fonetikk<br />

Psykol<strong>og</strong>i<br />

Språkdata<br />

In<strong>for</strong>matikk<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 5


Talekoding<br />

Kompresjon/<br />

dekompresjon<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 6


Talekoding<br />

• Kompresjon <strong>for</strong> å spare båndbredde eller lagerplass<br />

– Telefoni<br />

• GSM, satellitt<br />

• Internett<br />

• Bildetelefon, MPEG<br />

– Digital kringkasting<br />

– Talepost<br />

– Kombinasjon med eller supplement til talesyntese<br />

• Manipulering av talesignaler<br />

• Digital signalbehandling + kunnskap om taleproduksjon <strong>og</strong><br />

talepersepsjon<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 7


Talegjenkjenning<br />

Send epost<br />

til Petter<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 8


Talegjenkjenning<br />

• Tale-til-tekst<br />

• Internasjonal status: God<br />

ytelse under kontrollerte<br />

<strong>for</strong>hold<br />

• Problemer:<br />

– Støy (bakgrunn, linje)<br />

– talervariasjon<br />

– uttalevariasjon<br />

– variasjon i uttrykksmåte<br />

• Behov <strong>for</strong> robust<br />

talegjenkjenning<br />

Tale<br />

Egenskapsuttrekking<br />

Mønstergjenkjenning<br />

Statistisk<br />

grammatikk<br />

Tekst<br />

Akustiske<br />

modeller<br />

Uttaleleksikon<br />

Grammatikk<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 9


Talegjenkjenning<br />

• Kompleksitet (<strong>og</strong> ytelse) avhenger av<br />

– Talemodus<br />

• Isolerte ytringer - kontinuerlig tale<br />

– Talermodus<br />

• Talertrent - taleruavhengig - taleradaptivt<br />

– Ord<strong>for</strong>råd<br />

– Naturlighet<br />

• Lest tale / diktering<br />

• Spontan, naturlig tale<br />

– Støy<strong>for</strong>hold<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 10


Talegjenkjenning - ytelse<br />

Oppgave Ord<strong>for</strong>råd Modus Ordnøyaktighet<br />

Oppgave Ord<strong>for</strong>råd Perpl Ordnøyaktighet<br />

Tall (0-9) 10 SI ~100% Sammenhengende<br />

tall<br />

10 10 ~99%<br />

Stemme-oppringing 37 SD 100% Sjø<strong>for</strong>svar<br />

ressurshåndtering<br />

991


Stemmegjenkjenning<br />

Jeg er<br />

Torbjørn<br />

Det er feil!<br />

Du er ikke<br />

Torbjørn.<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 12


Stemmegjenkjenning<br />

• Talerverifikasjon<br />

– Verifisering av påstått identitet<br />

– Adgangskontroll (fysisk eller l<strong>og</strong>isk)<br />

– Feiltyper: Feil taler akseptert/Sann taler avvist<br />

– Typisk ytelse: ca. 1-2 % feilrate<br />

• Taleridentifikasjon<br />

– Bestemmelse av en talers identitet<br />

– Ofte kriminaltekniske anvendelser<br />

– Generelt ~uendelig sett av mulige talere → vanskelig å<br />

estimere feilrate<br />

– Hvis endelig antall mulige talere, pålitelig (jfr. talerverifikasjon)<br />

• Baseres ofte på samme teknol<strong>og</strong>i som talegjenkjenning<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 13


Talesyntese<br />

Du har fått<br />

epost fra<br />

Petter<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 14


Talesyntese<br />

• Konvertering fra tekst til tale:<br />

– ”Frasekonkatenering” -<br />

skjøting av setningsdeler<br />

• Begrenset<br />

meldingsrepertoar<br />

• Tungvint å gjøre endringer<br />

– Tekst-til-tale syntese (TTS)<br />

• All tekst kan leses opp<br />

• Begrensning på språk<br />

Tekst<br />

Tekst til<br />

lydskrift<br />

Intonasjon<br />

TTS<br />

Uttaleordliste<br />

<strong>og</strong> -regler<br />

Modeller<br />

<strong>og</strong> regler<br />

• Behov <strong>for</strong> <strong>for</strong>bedret<br />

talekvalitet<br />

– Prosodimodellering<br />

– Lydgenerering<br />

Lydgenerering<br />

Tale<br />

Lyddata<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 15


Eksempel - norsk talesyntese<br />

Norsk:<br />

”De enkleste <strong>og</strong> mest etablerte <strong>for</strong>mer <strong>for</strong><br />

taleteknol<strong>og</strong>iske anvendelser er i sin<br />

helhet basert på generelle prinsipper <strong>for</strong><br />

digital signalbehandling. Dette vil si at<br />

tale, i <strong>for</strong>m av anal<strong>og</strong>e lydsignaler, kodes<br />

digitalt, <strong>for</strong> dermed å kunne lagres i<br />

datamaskiner <strong>og</strong> ved behov<br />

reproduseres som anal<strong>og</strong>e signaler<br />

gjennom dekoding. Det er dette som<br />

skjer ved vanlig telefoni (etter<br />

digitaliseringen av telenettet) <strong>og</strong><br />

naturligvis ved GSM mobiltelefoni, som i<br />

utgangspunktet er et heldigitalt system.”<br />

Engelsk (på norsk):<br />

“The simplest and most established<br />

applications of speech technol<strong>og</strong>y are<br />

completely based on general<br />

principles of digital signal processing.<br />

This means that speech, represented<br />

by anal<strong>og</strong> signals, are digitally<br />

encoded <strong>for</strong> computer storage, and<br />

can be reproduced on demand as<br />

anal<strong>og</strong> signals through decoding. This<br />

is what happens in ordinary telephony<br />

(since the telecommuncations<br />

networks became digital) and of<br />

course in GSM mobile telephony,<br />

which from the origin was a completely<br />

digital system.”<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 16


Dial<strong>og</strong>system<br />

Hvor skal du<br />

reise fra?<br />

Når går neste<br />

buss til sentrum?<br />

Talegjenkjenning<br />

Grammatisk <strong>og</strong><br />

semantisk<br />

analyse<br />

Dial<strong>og</strong>håndtering<br />

Data<br />

Talesyntese<br />

Dial<strong>og</strong>system<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 17


Dial<strong>og</strong>analyse<br />

• 400 opptak av dial<strong>og</strong> menneske-menneske<br />

– deprimerende lytting……..<br />

• 150 WoZ-dial<strong>og</strong>er over tele<strong>for</strong>n<br />

– mer optimistisk …<br />

• ~ 30 k tekstbaserte <strong>for</strong>espørsler<br />

– gjorde oss oppmerksom på betydningen av semantikk<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 18


TABOR-dial<strong>og</strong> (<strong>for</strong>enklet)<br />

Eksempel 1<br />

Eksempel 2<br />

Nei<br />

Info<br />

Start<br />

Velkommen<br />

Vet…?<br />

Ja<br />

Fra<br />

hvor ?<br />

Til<br />

hvor ?<br />

Bussinfo<br />

Tidsinfo<br />

Avgang el.<br />

ankomst?<br />

Dag ?<br />

Ja<br />

Tidsinfo<br />

?<br />

Ja<br />

Ja<br />

Nei<br />

Gjenta?<br />

Nei<br />

Annen<br />

avgang ?<br />

Nei<br />

Annen<br />

buss ?<br />

Nei<br />

Stopp<br />

Ja<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 19


Et nettverk <strong>for</strong> tidsangivelse<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 20


Start<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 21


”Korrekt” tidsangivelse<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 22


”Vanlig” tidsangivelse<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 23


Tekniske spesifikasjoner<br />

• Linux basert PC-platt<strong>for</strong>m<br />

• TABULIB: C/C++ pr<strong>og</strong>ramvarebasis (Telenor FoU)<br />

• TABUSS/BUSTUC: Prol<strong>og</strong> basert NLP-del<br />

• Dial<strong>og</strong>håndtering i Perl<br />

• Frasekonkatenering<br />

• 6 <strong>for</strong>skjellige talegjenkjennere<br />

– valg av gjenkjenner avhengig av hvor i dial<strong>og</strong>en man befinner<br />

seg<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 24


Noen ut<strong>for</strong>dinger<br />

• Varierende måte å uttale tall <strong>og</strong> tidspunkt<br />

• Folk benytter synonymer <strong>for</strong> navn på holdeplasser<br />

• Folk vet ikke navnene på holdeplassene<br />

• Systemet bryter sammen i kraftig bakgrunnsstøy<br />

• For dårlig ytelse <strong>for</strong> barnestemmer<br />

• Klar degradasjon i nøyaktighet <strong>for</strong> mobiltelefon<br />

• Degradasjon i nøyaktighet <strong>for</strong> høyttalende telefoner<br />

• Rigid dial<strong>og</strong><br />

– neste generasjon er mer fleksibel<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 25


Omgivelseskontroll<br />

• Styring av omgivelsene ved bruk av talte kommandoer<br />

• Hovedkostnaden ligger i automatisering <strong>og</strong> elektrisk/<br />

maskinelt utstyr<br />

• Nøyaktighet <strong>og</strong> brukervennlighet i talegjenkjenneren er<br />

vesentlig<br />

– enkeltstående kommandoord eller<br />

– setningskommandoer<br />

– valg av vokabular er viktig<br />

• <strong>for</strong>bedrer ytelsen til talegjenkjenneren<br />

• unngå utilsiktet aktivisering av omgivelseskontrollen<br />

– bruk tale der tale er best, bruk andre metoder der de er best!<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 26


Diktering<br />

• Erstatning <strong>for</strong> tastaturbruk - hjelp <strong>for</strong> synshemmede,<br />

bevegelseshemmede, personer med lese- <strong>og</strong> skrivevansker<br />

• Korrespondanse <strong>og</strong> annen tekstgenerering<br />

• Dagens systemer gir noenlunde akseptabel ytelse <strong>for</strong> de<br />

fleste brukere<br />

• Foreløpig ingen dikteringssystemer <strong>for</strong> norsk tale<br />

• Krever normalisert uttale - ikke dialekt<br />

• Mange (tillatte) alternative skrivemåter <strong>og</strong> bøynings<strong>for</strong>mer<br />

skaper spesielle problemer <strong>for</strong> norsk<br />

• Egennavn (person-, steds-, firma-navn osv.)<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 27


Eksempel - svensk diktering<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 28


Lesemaskiner<br />

• Talesyntese (tekst-til-tale)<br />

• Lesehjelp til<br />

– elektroniske dokumenter<br />

– epost<br />

– nettsider (inklusive nyheter <strong>og</strong> andre in<strong>for</strong>masjonstjenester)<br />

– tekst på papir (ved hjelp av optisk leser/scanner <strong>og</strong> optisk<br />

karaktergjenkjenning)<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 29


Taleprotese<br />

• Talesyntese <strong>for</strong> personer med tapt/nedsatt taleevne<br />

• Vanlig tastatur eller symboltastatur<br />

• Forståelighet <strong>og</strong> naturlighet viktig<br />

• Personlig tilpasning av syntetisk stemme<br />

– stemmen en viktig del av personlig identitet<br />

– relativt enkelt med ”gammeldags” syntese, men dårlig kvalitet<br />

– hittil et omfattende arbeid med moderne metoder som gir høy<br />

kvalitet<br />

– <strong>for</strong>enklinger/<strong>for</strong>bedringer <strong>for</strong>ventes<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 30


Døvetelefon<br />

• Talegjenkjenning <strong>for</strong> oversettelse fra tale til tekst<br />

• Gjenkjent tale vises på monitor/display<br />

• Tekst til tale ved hjelp av talesyntese<br />

Talegjenkjenner<br />

Bla bla<br />

bla bla<br />

Talesyntese<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 31


Synface<br />

• Hjelp <strong>for</strong> hørselshemmede<br />

• Gir mulighet <strong>for</strong> munnavlesning som hjelp ved telefonbruk<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 32


”Teleface”<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 33


Skrivestøtte<br />

• Hjelp til ort<strong>og</strong>rafi <strong>og</strong> <strong>for</strong>mulering, spesielt rettet mot personer<br />

med lese- <strong>og</strong> skrivevansker<br />

• Enkelt system:<br />

– Gi brukeren valg (meny) mellom sannsynlige ordalternativer<br />

når feilstavede ord detekteres<br />

– Inkluderer ord<strong>for</strong>klaring, ordklasse<br />

– eks: ”jærne” - alternativer hjerne, gjerne, jernet<br />

• Mer avansert system:<br />

– Automatisk tekstanalyse detekterer skrivefeil<br />

– Analysen reduserer antall valgmuligheter<br />

– Valgmulighetene kan leses opp med syntetisk tale (evt. hele<br />

setningen), eller listes opp i en meny<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 34


Nasjonal FoU-kompetanse<br />

• Telenor R&I:<br />

– ca. 4 <strong>for</strong>skere<br />

– Talesyntese, talegjenkjenning, dial<strong>og</strong><br />

– kompetanse på talekoding<br />

• SINTEF IKT<br />

– 2 <strong>for</strong>skere med doktorgrad<br />

– FoU innen<br />

• Talegjenkjenning, dial<strong>og</strong>systemer<br />

• <strong>NTNU</strong><br />

– 6 professorer/1.amanuenser, 3 <strong>for</strong>skere/postdocs, 8-10<br />

dr.gradsstipendiater aktive innen taleteknol<strong>og</strong>i<br />

– etablert flerfaglig samarbeid<br />

• signalbehandling, akustikk, <strong>elektronikk</strong>, lingvistikk, fonetikk, NLP<br />

– talegjenkjenning, talesyntese, dial<strong>og</strong>, stemmegjenkjenning,<br />

(talekoding)<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 35


Norsk tale- <strong>og</strong> språkteknol<strong>og</strong>i<br />

• Språkteknol<strong>og</strong>ien får økende betydning i IKT-samfunnet<br />

• Språket viktig kulturbærer, <strong>og</strong> viktig <strong>for</strong> identitet <strong>og</strong><br />

tilhørighet<br />

• Behov <strong>for</strong> produkter <strong>og</strong> kunnskap <strong>for</strong> norsk språk<br />

• Stadig mer avanserte systemer krever både<br />

språkkompetanse <strong>og</strong> teknol<strong>og</strong>isk kompetanse<br />

– behov <strong>for</strong> mer kompetanse - økt utdanning på hovedfags- <strong>og</strong><br />

doktorgradsnivå<br />

– mange uløste problemer, behov <strong>for</strong> mer kunnskap - <strong>for</strong>skning<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 36


Norsk tale- <strong>og</strong> språkteknol<strong>og</strong>i<br />

• Språkteknol<strong>og</strong>ien er avhengig av språkdata<br />

– f.eks. dikteringssystemer:<br />

• relevante taledata (lest/diktert tale, mange talere) - 300-1000 timer<br />

• relevante tekstdata (> 200 millioner ord)<br />

• uttaleleksikon (~100.000 grunnord)<br />

• bokmål/nynorsk?<br />

– telefonbasert dial<strong>og</strong>system (talegjenkjenner):<br />

• telefontale, utrente brukere, støy<br />

• tekst <strong>og</strong> uttaleleksikon som over<br />

• Lite marked, store datamengder (<strong>og</strong> kostnader)<br />

• Norsk språkbank<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 37


Hvor god er teknol<strong>og</strong>ien i dag?<br />

• <strong>Taleteknol<strong>og</strong>i</strong>en har <strong>for</strong>tsatt betydelig <strong>for</strong>bedringspotensial<br />

– Gjelder spesielt talegjenkjenning<br />

• Likevel - tilstrekkelig god ytelse til at det er mulig å lage<br />

mange gode hjelpemidler - hvis man tar hensyn til at<br />

teknol<strong>og</strong>ien ikke er perfekt i designet<br />

• Tale kan være svaret på mange problemer, men langt fra<br />

alle. Alternativer er bl.a.:<br />

– sporing av øyefokus<br />

– enkle knappeløsninger<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 38


Hva med norsk?<br />

• Foreløpig lite av norske produkter basert på taleteknol<strong>og</strong>i<br />

• Hovedproblem: Mangel på språkdata<br />

– Data fra NSTs konkursbo kjøpt våren 2007<br />

– Akustiske data (>1000 timer)<br />

– Tekstdata (~700 MOrd)<br />

• Max Manus har dikteringssystemer <strong>for</strong> sykehusdomenet (Philips)<br />

• Nuance har gjenkjennere <strong>for</strong> telefonanvendelser<br />

• Telenor utvikler tjenester med taleteknol<strong>og</strong>i<br />

• Kommersiell norsk talesyntese fra Nuance (NST) <strong>og</strong> Acapela<br />

(Sverige)<br />

• Flere (enkle) talebaserte tjenester tilgjengelig (systemintegrasjon)<br />

• Behov <strong>for</strong> langt mer<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 39


Forskningsprosjekter ved<br />

<strong>NTNU</strong><br />

• BRAGE - Brukergrensesnitt med naturlig tale<br />

• VOCALS - Voice Centric User Interfaces <strong>for</strong> Location Based<br />

Services<br />

• FONEMA - Metodeutvikling <strong>for</strong> naturtro norsk talesyntese<br />

• SVOG - Storvokabular gjenkjenner <strong>for</strong> norsk<br />

• SIRKUS - Spoken In<strong>for</strong>mation Retrieval by Knowledge Utilization<br />

in Statistical Speech Processing<br />

• RUNDKAST - En transkribert database av kringkastede<br />

nyhetssendinger <strong>for</strong> språkteknol<strong>og</strong>iske anvendelser<br />

• Digitale ut<strong>for</strong>dringer - deltakelse <strong>og</strong> funksjonshemming i<br />

in<strong>for</strong>masjonssamfunnet<br />

• SMUDI - Stemmestyring <strong>for</strong> multimodal dial<strong>og</strong><br />

• S2S - Sound to sense (Marie Curie nettverk)<br />

<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 40

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!