Taleteknologi - Institutt for elektronikk og telekommunikasjon - NTNU
Taleteknologi - Institutt for elektronikk og telekommunikasjon - NTNU
Taleteknologi - Institutt for elektronikk og telekommunikasjon - NTNU
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>Taleteknol<strong>og</strong>i</strong><br />
Torbjørn Svendsen<br />
<strong>Institutt</strong> <strong>for</strong> <strong>elektronikk</strong> <strong>og</strong> <strong>telekommunikasjon</strong><br />
<strong>NTNU</strong><br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 1
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 2
<strong>Taleteknol<strong>og</strong>i</strong><br />
“Speech is not just the future of Windows, but the future of<br />
computing itself”<br />
William H. Gates III<br />
“Computers are starting to do what most two-year-olds can do:<br />
identify spoken words and answer back”<br />
IEEE Spectrum, Jan. 1997<br />
Hyde’s lov:<br />
”The accuracy of speech rec<strong>og</strong>nizers is 98%”<br />
S.R. Hyde, Joint Speech Research Unit, 1969<br />
Korrolar:<br />
”Because speech rec<strong>og</strong>nizers have an accuracy of 98%, tests must be<br />
arranged to prove it”<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 3
Hvor<strong>for</strong> tale?<br />
• Enkelt<br />
– naturlig kommunikasjons<strong>for</strong>m<br />
– krever ingen særskilte <strong>for</strong>kunnskaper eller ferdigheter<br />
• Frigjørende<br />
– hender <strong>og</strong> øyne fri til andre oppgaver → kan unngå tastatur <strong>og</strong><br />
skjerm<br />
– hjelp <strong>for</strong> funksjonshemmede<br />
• Tilgjengelighet av in<strong>for</strong>masjon<br />
– hvor som helst, når som helst, hvem som helst<br />
– For eksempel: Enkelt grensesnitt basert på tale <strong>og</strong> telefon<br />
• Tale- <strong>og</strong> språkteknol<strong>og</strong>i på norsk må ha en norsk basis<br />
– språkkunnskap <strong>og</strong> teknol<strong>og</strong>ikunnskap<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 4
<strong>Taleteknol<strong>og</strong>i</strong> - flerfaglig<br />
Elektro-<br />
nikk<br />
Signal-<br />
behandling<br />
Lingvistikk<br />
Statistikk<br />
<strong>Taleteknol<strong>og</strong>i</strong><br />
Fonetikk<br />
Psykol<strong>og</strong>i<br />
Språkdata<br />
In<strong>for</strong>matikk<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 5
Talekoding<br />
Kompresjon/<br />
dekompresjon<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 6
Talekoding<br />
• Kompresjon <strong>for</strong> å spare båndbredde eller lagerplass<br />
– Telefoni<br />
• GSM, satellitt<br />
• Internett<br />
• Bildetelefon, MPEG<br />
– Digital kringkasting<br />
– Talepost<br />
– Kombinasjon med eller supplement til talesyntese<br />
• Manipulering av talesignaler<br />
• Digital signalbehandling + kunnskap om taleproduksjon <strong>og</strong><br />
talepersepsjon<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 7
Talegjenkjenning<br />
Send epost<br />
til Petter<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 8
Talegjenkjenning<br />
• Tale-til-tekst<br />
• Internasjonal status: God<br />
ytelse under kontrollerte<br />
<strong>for</strong>hold<br />
• Problemer:<br />
– Støy (bakgrunn, linje)<br />
– talervariasjon<br />
– uttalevariasjon<br />
– variasjon i uttrykksmåte<br />
• Behov <strong>for</strong> robust<br />
talegjenkjenning<br />
Tale<br />
Egenskapsuttrekking<br />
Mønstergjenkjenning<br />
Statistisk<br />
grammatikk<br />
Tekst<br />
Akustiske<br />
modeller<br />
Uttaleleksikon<br />
Grammatikk<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 9
Talegjenkjenning<br />
• Kompleksitet (<strong>og</strong> ytelse) avhenger av<br />
– Talemodus<br />
• Isolerte ytringer - kontinuerlig tale<br />
– Talermodus<br />
• Talertrent - taleruavhengig - taleradaptivt<br />
– Ord<strong>for</strong>råd<br />
– Naturlighet<br />
• Lest tale / diktering<br />
• Spontan, naturlig tale<br />
– Støy<strong>for</strong>hold<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 10
Talegjenkjenning - ytelse<br />
Oppgave Ord<strong>for</strong>råd Modus Ordnøyaktighet<br />
Oppgave Ord<strong>for</strong>råd Perpl Ordnøyaktighet<br />
Tall (0-9) 10 SI ~100% Sammenhengende<br />
tall<br />
10 10 ~99%<br />
Stemme-oppringing 37 SD 100% Sjø<strong>for</strong>svar<br />
ressurshåndtering<br />
991
Stemmegjenkjenning<br />
Jeg er<br />
Torbjørn<br />
Det er feil!<br />
Du er ikke<br />
Torbjørn.<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 12
Stemmegjenkjenning<br />
• Talerverifikasjon<br />
– Verifisering av påstått identitet<br />
– Adgangskontroll (fysisk eller l<strong>og</strong>isk)<br />
– Feiltyper: Feil taler akseptert/Sann taler avvist<br />
– Typisk ytelse: ca. 1-2 % feilrate<br />
• Taleridentifikasjon<br />
– Bestemmelse av en talers identitet<br />
– Ofte kriminaltekniske anvendelser<br />
– Generelt ~uendelig sett av mulige talere → vanskelig å<br />
estimere feilrate<br />
– Hvis endelig antall mulige talere, pålitelig (jfr. talerverifikasjon)<br />
• Baseres ofte på samme teknol<strong>og</strong>i som talegjenkjenning<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 13
Talesyntese<br />
Du har fått<br />
epost fra<br />
Petter<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 14
Talesyntese<br />
• Konvertering fra tekst til tale:<br />
– ”Frasekonkatenering” -<br />
skjøting av setningsdeler<br />
• Begrenset<br />
meldingsrepertoar<br />
• Tungvint å gjøre endringer<br />
– Tekst-til-tale syntese (TTS)<br />
• All tekst kan leses opp<br />
• Begrensning på språk<br />
Tekst<br />
Tekst til<br />
lydskrift<br />
Intonasjon<br />
TTS<br />
Uttaleordliste<br />
<strong>og</strong> -regler<br />
Modeller<br />
<strong>og</strong> regler<br />
• Behov <strong>for</strong> <strong>for</strong>bedret<br />
talekvalitet<br />
– Prosodimodellering<br />
– Lydgenerering<br />
Lydgenerering<br />
Tale<br />
Lyddata<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 15
Eksempel - norsk talesyntese<br />
Norsk:<br />
”De enkleste <strong>og</strong> mest etablerte <strong>for</strong>mer <strong>for</strong><br />
taleteknol<strong>og</strong>iske anvendelser er i sin<br />
helhet basert på generelle prinsipper <strong>for</strong><br />
digital signalbehandling. Dette vil si at<br />
tale, i <strong>for</strong>m av anal<strong>og</strong>e lydsignaler, kodes<br />
digitalt, <strong>for</strong> dermed å kunne lagres i<br />
datamaskiner <strong>og</strong> ved behov<br />
reproduseres som anal<strong>og</strong>e signaler<br />
gjennom dekoding. Det er dette som<br />
skjer ved vanlig telefoni (etter<br />
digitaliseringen av telenettet) <strong>og</strong><br />
naturligvis ved GSM mobiltelefoni, som i<br />
utgangspunktet er et heldigitalt system.”<br />
Engelsk (på norsk):<br />
“The simplest and most established<br />
applications of speech technol<strong>og</strong>y are<br />
completely based on general<br />
principles of digital signal processing.<br />
This means that speech, represented<br />
by anal<strong>og</strong> signals, are digitally<br />
encoded <strong>for</strong> computer storage, and<br />
can be reproduced on demand as<br />
anal<strong>og</strong> signals through decoding. This<br />
is what happens in ordinary telephony<br />
(since the telecommuncations<br />
networks became digital) and of<br />
course in GSM mobile telephony,<br />
which from the origin was a completely<br />
digital system.”<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 16
Dial<strong>og</strong>system<br />
Hvor skal du<br />
reise fra?<br />
Når går neste<br />
buss til sentrum?<br />
Talegjenkjenning<br />
Grammatisk <strong>og</strong><br />
semantisk<br />
analyse<br />
Dial<strong>og</strong>håndtering<br />
Data<br />
Talesyntese<br />
Dial<strong>og</strong>system<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 17
Dial<strong>og</strong>analyse<br />
• 400 opptak av dial<strong>og</strong> menneske-menneske<br />
– deprimerende lytting……..<br />
• 150 WoZ-dial<strong>og</strong>er over tele<strong>for</strong>n<br />
– mer optimistisk …<br />
• ~ 30 k tekstbaserte <strong>for</strong>espørsler<br />
– gjorde oss oppmerksom på betydningen av semantikk<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 18
TABOR-dial<strong>og</strong> (<strong>for</strong>enklet)<br />
Eksempel 1<br />
Eksempel 2<br />
Nei<br />
Info<br />
Start<br />
Velkommen<br />
Vet…?<br />
Ja<br />
Fra<br />
hvor ?<br />
Til<br />
hvor ?<br />
Bussinfo<br />
Tidsinfo<br />
Avgang el.<br />
ankomst?<br />
Dag ?<br />
Ja<br />
Tidsinfo<br />
?<br />
Ja<br />
Ja<br />
Nei<br />
Gjenta?<br />
Nei<br />
Annen<br />
avgang ?<br />
Nei<br />
Annen<br />
buss ?<br />
Nei<br />
Stopp<br />
Ja<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 19
Et nettverk <strong>for</strong> tidsangivelse<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 20
Start<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 21
”Korrekt” tidsangivelse<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 22
”Vanlig” tidsangivelse<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 23
Tekniske spesifikasjoner<br />
• Linux basert PC-platt<strong>for</strong>m<br />
• TABULIB: C/C++ pr<strong>og</strong>ramvarebasis (Telenor FoU)<br />
• TABUSS/BUSTUC: Prol<strong>og</strong> basert NLP-del<br />
• Dial<strong>og</strong>håndtering i Perl<br />
• Frasekonkatenering<br />
• 6 <strong>for</strong>skjellige talegjenkjennere<br />
– valg av gjenkjenner avhengig av hvor i dial<strong>og</strong>en man befinner<br />
seg<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 24
Noen ut<strong>for</strong>dinger<br />
• Varierende måte å uttale tall <strong>og</strong> tidspunkt<br />
• Folk benytter synonymer <strong>for</strong> navn på holdeplasser<br />
• Folk vet ikke navnene på holdeplassene<br />
• Systemet bryter sammen i kraftig bakgrunnsstøy<br />
• For dårlig ytelse <strong>for</strong> barnestemmer<br />
• Klar degradasjon i nøyaktighet <strong>for</strong> mobiltelefon<br />
• Degradasjon i nøyaktighet <strong>for</strong> høyttalende telefoner<br />
• Rigid dial<strong>og</strong><br />
– neste generasjon er mer fleksibel<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 25
Omgivelseskontroll<br />
• Styring av omgivelsene ved bruk av talte kommandoer<br />
• Hovedkostnaden ligger i automatisering <strong>og</strong> elektrisk/<br />
maskinelt utstyr<br />
• Nøyaktighet <strong>og</strong> brukervennlighet i talegjenkjenneren er<br />
vesentlig<br />
– enkeltstående kommandoord eller<br />
– setningskommandoer<br />
– valg av vokabular er viktig<br />
• <strong>for</strong>bedrer ytelsen til talegjenkjenneren<br />
• unngå utilsiktet aktivisering av omgivelseskontrollen<br />
– bruk tale der tale er best, bruk andre metoder der de er best!<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 26
Diktering<br />
• Erstatning <strong>for</strong> tastaturbruk - hjelp <strong>for</strong> synshemmede,<br />
bevegelseshemmede, personer med lese- <strong>og</strong> skrivevansker<br />
• Korrespondanse <strong>og</strong> annen tekstgenerering<br />
• Dagens systemer gir noenlunde akseptabel ytelse <strong>for</strong> de<br />
fleste brukere<br />
• Foreløpig ingen dikteringssystemer <strong>for</strong> norsk tale<br />
• Krever normalisert uttale - ikke dialekt<br />
• Mange (tillatte) alternative skrivemåter <strong>og</strong> bøynings<strong>for</strong>mer<br />
skaper spesielle problemer <strong>for</strong> norsk<br />
• Egennavn (person-, steds-, firma-navn osv.)<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 27
Eksempel - svensk diktering<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 28
Lesemaskiner<br />
• Talesyntese (tekst-til-tale)<br />
• Lesehjelp til<br />
– elektroniske dokumenter<br />
– epost<br />
– nettsider (inklusive nyheter <strong>og</strong> andre in<strong>for</strong>masjonstjenester)<br />
– tekst på papir (ved hjelp av optisk leser/scanner <strong>og</strong> optisk<br />
karaktergjenkjenning)<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 29
Taleprotese<br />
• Talesyntese <strong>for</strong> personer med tapt/nedsatt taleevne<br />
• Vanlig tastatur eller symboltastatur<br />
• Forståelighet <strong>og</strong> naturlighet viktig<br />
• Personlig tilpasning av syntetisk stemme<br />
– stemmen en viktig del av personlig identitet<br />
– relativt enkelt med ”gammeldags” syntese, men dårlig kvalitet<br />
– hittil et omfattende arbeid med moderne metoder som gir høy<br />
kvalitet<br />
– <strong>for</strong>enklinger/<strong>for</strong>bedringer <strong>for</strong>ventes<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 30
Døvetelefon<br />
• Talegjenkjenning <strong>for</strong> oversettelse fra tale til tekst<br />
• Gjenkjent tale vises på monitor/display<br />
• Tekst til tale ved hjelp av talesyntese<br />
Talegjenkjenner<br />
Bla bla<br />
bla bla<br />
Talesyntese<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 31
Synface<br />
• Hjelp <strong>for</strong> hørselshemmede<br />
• Gir mulighet <strong>for</strong> munnavlesning som hjelp ved telefonbruk<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 32
”Teleface”<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 33
Skrivestøtte<br />
• Hjelp til ort<strong>og</strong>rafi <strong>og</strong> <strong>for</strong>mulering, spesielt rettet mot personer<br />
med lese- <strong>og</strong> skrivevansker<br />
• Enkelt system:<br />
– Gi brukeren valg (meny) mellom sannsynlige ordalternativer<br />
når feilstavede ord detekteres<br />
– Inkluderer ord<strong>for</strong>klaring, ordklasse<br />
– eks: ”jærne” - alternativer hjerne, gjerne, jernet<br />
• Mer avansert system:<br />
– Automatisk tekstanalyse detekterer skrivefeil<br />
– Analysen reduserer antall valgmuligheter<br />
– Valgmulighetene kan leses opp med syntetisk tale (evt. hele<br />
setningen), eller listes opp i en meny<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 34
Nasjonal FoU-kompetanse<br />
• Telenor R&I:<br />
– ca. 4 <strong>for</strong>skere<br />
– Talesyntese, talegjenkjenning, dial<strong>og</strong><br />
– kompetanse på talekoding<br />
• SINTEF IKT<br />
– 2 <strong>for</strong>skere med doktorgrad<br />
– FoU innen<br />
• Talegjenkjenning, dial<strong>og</strong>systemer<br />
• <strong>NTNU</strong><br />
– 6 professorer/1.amanuenser, 3 <strong>for</strong>skere/postdocs, 8-10<br />
dr.gradsstipendiater aktive innen taleteknol<strong>og</strong>i<br />
– etablert flerfaglig samarbeid<br />
• signalbehandling, akustikk, <strong>elektronikk</strong>, lingvistikk, fonetikk, NLP<br />
– talegjenkjenning, talesyntese, dial<strong>og</strong>, stemmegjenkjenning,<br />
(talekoding)<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 35
Norsk tale- <strong>og</strong> språkteknol<strong>og</strong>i<br />
• Språkteknol<strong>og</strong>ien får økende betydning i IKT-samfunnet<br />
• Språket viktig kulturbærer, <strong>og</strong> viktig <strong>for</strong> identitet <strong>og</strong><br />
tilhørighet<br />
• Behov <strong>for</strong> produkter <strong>og</strong> kunnskap <strong>for</strong> norsk språk<br />
• Stadig mer avanserte systemer krever både<br />
språkkompetanse <strong>og</strong> teknol<strong>og</strong>isk kompetanse<br />
– behov <strong>for</strong> mer kompetanse - økt utdanning på hovedfags- <strong>og</strong><br />
doktorgradsnivå<br />
– mange uløste problemer, behov <strong>for</strong> mer kunnskap - <strong>for</strong>skning<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 36
Norsk tale- <strong>og</strong> språkteknol<strong>og</strong>i<br />
• Språkteknol<strong>og</strong>ien er avhengig av språkdata<br />
– f.eks. dikteringssystemer:<br />
• relevante taledata (lest/diktert tale, mange talere) - 300-1000 timer<br />
• relevante tekstdata (> 200 millioner ord)<br />
• uttaleleksikon (~100.000 grunnord)<br />
• bokmål/nynorsk?<br />
– telefonbasert dial<strong>og</strong>system (talegjenkjenner):<br />
• telefontale, utrente brukere, støy<br />
• tekst <strong>og</strong> uttaleleksikon som over<br />
• Lite marked, store datamengder (<strong>og</strong> kostnader)<br />
• Norsk språkbank<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 37
Hvor god er teknol<strong>og</strong>ien i dag?<br />
• <strong>Taleteknol<strong>og</strong>i</strong>en har <strong>for</strong>tsatt betydelig <strong>for</strong>bedringspotensial<br />
– Gjelder spesielt talegjenkjenning<br />
• Likevel - tilstrekkelig god ytelse til at det er mulig å lage<br />
mange gode hjelpemidler - hvis man tar hensyn til at<br />
teknol<strong>og</strong>ien ikke er perfekt i designet<br />
• Tale kan være svaret på mange problemer, men langt fra<br />
alle. Alternativer er bl.a.:<br />
– sporing av øyefokus<br />
– enkle knappeløsninger<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 38
Hva med norsk?<br />
• Foreløpig lite av norske produkter basert på taleteknol<strong>og</strong>i<br />
• Hovedproblem: Mangel på språkdata<br />
– Data fra NSTs konkursbo kjøpt våren 2007<br />
– Akustiske data (>1000 timer)<br />
– Tekstdata (~700 MOrd)<br />
• Max Manus har dikteringssystemer <strong>for</strong> sykehusdomenet (Philips)<br />
• Nuance har gjenkjennere <strong>for</strong> telefonanvendelser<br />
• Telenor utvikler tjenester med taleteknol<strong>og</strong>i<br />
• Kommersiell norsk talesyntese fra Nuance (NST) <strong>og</strong> Acapela<br />
(Sverige)<br />
• Flere (enkle) talebaserte tjenester tilgjengelig (systemintegrasjon)<br />
• Behov <strong>for</strong> langt mer<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 39
Forskningsprosjekter ved<br />
<strong>NTNU</strong><br />
• BRAGE - Brukergrensesnitt med naturlig tale<br />
• VOCALS - Voice Centric User Interfaces <strong>for</strong> Location Based<br />
Services<br />
• FONEMA - Metodeutvikling <strong>for</strong> naturtro norsk talesyntese<br />
• SVOG - Storvokabular gjenkjenner <strong>for</strong> norsk<br />
• SIRKUS - Spoken In<strong>for</strong>mation Retrieval by Knowledge Utilization<br />
in Statistical Speech Processing<br />
• RUNDKAST - En transkribert database av kringkastede<br />
nyhetssendinger <strong>for</strong> språkteknol<strong>og</strong>iske anvendelser<br />
• Digitale ut<strong>for</strong>dringer - deltakelse <strong>og</strong> funksjonshemming i<br />
in<strong>for</strong>masjonssamfunnet<br />
• SMUDI - Stemmestyring <strong>for</strong> multimodal dial<strong>og</strong><br />
• S2S - Sound to sense (Marie Curie nettverk)<br />
<strong>Taleteknol<strong>og</strong>i</strong> - introduksjon Professor Torbjørn Svendsen, <strong>NTNU</strong> 40