24.01.2015 Views

ARHITEKTURA GOVORNIH PORTALA I MOGUĆNOSTI ... - Telfor

ARHITEKTURA GOVORNIH PORTALA I MOGUĆNOSTI ... - Telfor

ARHITEKTURA GOVORNIH PORTALA I MOGUĆNOSTI ... - Telfor

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

XIII Telekomunikacioni forum TELFOR 2005, Beograd, Sava Centar, 22.-24.11.2005.g.<br />

<strong>ARHITEKTURA</strong> <strong>GOVORNIH</strong> <strong>PORTALA</strong> I MOGUĆNOSTI PRIMENE<br />

ASR I TTS U POZIVNIM CENTRIMA NA SRPSKOM GOVORNOM<br />

PODRUČJU<br />

Sovilj-Nikić S. 1 , Delić V. 1<br />

1 Fakultet tehničkih nauka, Novi Sad<br />

I UVOD<br />

Govorna komunikacija čoveku predstavlja najprirodniji i<br />

najpogodniji način komuniciranja.<br />

U eri ubrzanog tehnološkog razvoja postoji prirodna<br />

čovekova težnja da i sa mašinama uspostavi komunikaciju<br />

putem govora. Zahvaljujući razvoju novih govornih<br />

tehnologija ostvarena je govorna komunikacija između<br />

čoveka i mašine.<br />

U ovom radu, pored opisa govornih tehnologija, tj.<br />

automatskog prepoznavanja i sinteze govora, prikazani su<br />

govorni portali i automatizacija pozivnog centra kao dve<br />

najznačajnije moguće komercijalne primene novih govornih<br />

tehnologija za srpski jezik.<br />

II GOVORNE TEHNOLOGIJE<br />

Govorne tehnologije koje omogućavaju dvosmernu<br />

komunikaciju između čoveka i mašine jesu automatsko<br />

prepoznavanje govora (eng. Automatic Speech Recognition-<br />

ASR) i konverzija teksta u govor (eng. Text-to-Speech-TTS).<br />

Krajem 20. veka došlo je do integracije računarstva i<br />

telefonije (eng. Computer Telephony Integration-CTI) i<br />

pojave mnogobrojnih CTI aplikacija sa sasvim novim<br />

servisima do tada nezamislive funkcionalnosti. Međutim,<br />

osnovni korisnički interfejs - telefonska tastatura predstavljao<br />

je sve veće ograničenje pri primeni datih aplikacija. Primena<br />

novih govornih tehnologija (ASR, TTS) prevazilazi ovo<br />

ograničenje i pruža korisnicima prirodan interfejs - govor ka<br />

svetu integrisanog računarstva i telefonije. Sa druge strane,<br />

integracija računarstva i telefonije doprinela je da se povećaju<br />

mogućnosti primene govornih tehnologija. ASR i TTS nalaze<br />

značajnu primenu u raznim telekomunikacionim službama,<br />

kao što su čitanje e-mail i faks poruka korisnicima preko<br />

telefona, govorna pošta, iščitavanje sadržaja obimnih baza<br />

podataka, pristup informacijama na Internetu putem telefona,<br />

itd. Pored toga, govorne tehnologije nalaze svoju primenu i u<br />

proizvodima namenjenim informisanju, obrazovanju i<br />

pomoći hendikepiranim osobama, softverima za učenje<br />

stranih jezika, kao i u raznim aplikacijama zabavnog<br />

karaktera.<br />

Automatsko prepoznavanje govora omogućava<br />

komunikaciju između čoveka i mašine u kojoj se čovek<br />

obraća mašini izdavanjem odgovarajućih komandi putem<br />

glasa. Ova komunikacija podrazumeva konverziju govora u<br />

odgovarajuću informaciju (kod) na način koji omogućava<br />

izvršavanje određene radnje od strane mašine (računara,<br />

robota, automata, itd.). Automatsko prepoznavanje govora<br />

jeste proces kojim računar konvertuje akustički govorni<br />

signal u tekst.<br />

Sistemi za automatsko prepoznavanje govora mogu biti<br />

takvi da se prepoznavanje govora vrši zavisno, odnosno<br />

nezavisno od govornika. Ukoliko se parametri ASR sistema<br />

podešavaju na osnovu izgovora osobe koja će taj sistem i<br />

koristiti u pitanju je prepoznavanje govora zavisno od<br />

govornika. ASR sistem kod kojeg se prepoznavanje vrši<br />

nezavisno od govornika namenjen je da radi i za one<br />

govornike čiji glas nije korišćen za obuku sistema.<br />

Sistemi za prepoznavanje govora se takođe razlikuju<br />

prema veličini rečnika, kao i prema tipu govora koji<br />

prepoznaju. Postoje sistemi koji su namenjeni za<br />

prepoznavanje pojedinačnih reči, u tom slučaju radi se o<br />

prepoznavanju izolovano izgovorenih reči. Ukoliko je sistem<br />

namenjen za prepoznavanje celih rečenica razlikuju se dva<br />

slučaja. Kada su reči izgovorene jedna po jedna, tj. sa jasnim<br />

pauzama između njih, radi se o sistemu za prepoznavanje<br />

diskontinualnog govora, odnosno u pitanju je prepoznavanje<br />

povezano izgovorenih reči. Takođe, postoje i sistemi kod<br />

kojih se vrši prepoznavanje kontinualnog govora, tj. govora u<br />

kojem se rečenice izgovaraju prirodno, sa manjim ili većim<br />

pauzama između ili bez pauza između reči.<br />

Sinteza govora je govorna tehnologija koja omogućava<br />

da se mašina ’’obrati’’ čoveku. Na upit korisnika govorni<br />

automat sintetizovanim govorom saopštava traženu<br />

informaciju. Kod TTS sistema vrši se proces konverzije<br />

teksta u govor, odnosno automatska sinteza govora na osnovu<br />

teksta.<br />

Dva osnovna zahteva postavljena pred TTS sistem jesu<br />

postizanje razumljivosti i prirodnosti sintetizovanog govora.<br />

Da bi se informacija prenela do slušaoca potrebno je, pre<br />

svega, da sintetizovan govor bude razumljiv. Pored toga,<br />

sintetizovan govor treba da zvuči što prirodnije jer prirodnost<br />

govora u mnogome doprinosi njegovoj razumljivosti. Postići<br />

prirodnost sintetizovanog govora znači održati prozodijski<br />

kontinuitet, akcenatsku strukturu i emocionalne efekte.<br />

Prirodnost sintetizovanog govora je u uskoj vezi sa njegovim<br />

prozodijskim obeležjima, odnosno sa jačinom, visinom i<br />

trajanjem pojedinih slogova u okviru reči, kao i pojedinih reči<br />

u okviru rečenice. Današnji TTS sistemi postižu<br />

zadovoljavajući nivo razumljivosti sintetizovanog govora,<br />

dok je njegova prirodnost često vrlo skromna jer postizanje<br />

prirodnosti predstavlja mnogo veći problem [1].<br />

III MOGUĆNOSTI PRIMENE NOVIH <strong>GOVORNIH</strong><br />

TEHNOLOGIJA<br />

Automatsko prepoznavanje govora (ASR) i sinteza<br />

govora na osnovu teksta (TTS) omogućavaju dvosmernu<br />

govornu komunikaciju između čoveka i računara, što ima niz<br />

mogućih primena. Međutim, govorne tehnologije su veoma<br />

složene, zavisne od jezika i ne mogu se, kao mnoge druge


nove tehnologije, jednostavno uvesti iz inostranstva i<br />

primeniti na nekom govornom području. Potrebno ih je<br />

posebno razvijati za skoro svaki jezik. Za uspešan razvoj<br />

ASR i TTS komponenti potrebno je objediniti znanja iz više<br />

disciplina (lingvistika, fonetika, akustika, psiholingvistika,<br />

digitalna obrada signala, matematika i programiranje),<br />

povezati ih sa specifičnostima jednog jezika i implementirati<br />

u okruženje raspoloživih računara, kako bi oni mogli da<br />

pretvaraju tekst u tečan i razumljiv govor (TTS) ili da<br />

razumeju čovekove govorne komande (ASR).<br />

Zahvaljujući dostignućima u istraživanju i razvoju<br />

govornih tehnologija na Fakultetu tehničkih nauka (FTN) i u<br />

preduzeću AlfaNum iz Novog Sada, srpski jezik je svrstan<br />

među relativno mali broj jezika u svetu gde su govorne<br />

tehnologije dostigle visok kvalitet i već pronašle prve<br />

primene. Građanima na srpskom govornom području<br />

omogućeno je da koriste prednosti koje nove govorne<br />

tehnologije pružaju.<br />

Automatizacija pozivnih centara, govorni portali i<br />

samouslužni govorni automati, čitanje sadržaja baza<br />

podataka, čitanje e-mail i faks poruka, govorni softveri za<br />

učenje srpskog kao stranog jezika, govorna pošta - samo su<br />

neke od mogućih komercijalnih primena novih govornih<br />

tehnologija. Pored komercijalnih primena i doprinosa u<br />

razvoju više naučnih disciplina, razvoj govornih tehnologija<br />

ima izuzetan značaj za osobe sa invaliditetom. Humane<br />

primene govornih tehnologija doprinose praktičnom<br />

ostvarivanju prava na komuniciranje i informisanje osoba sa<br />

invaliditetom i stoga imaju veliki društveni značaj, ali isto<br />

tako mogu poslužiti i kao test pre puštanja u eksploataciju<br />

masovnih komercijalnih primena.<br />

IV KOMERCIJALNE PRIMENE <strong>GOVORNIH</strong><br />

TEHNOLOGIJA<br />

Iskustva u svetu (Datamonitor 2003.) pokazuju da su<br />

govorne tehnologije vrlo brzo našle svoje prve velike<br />

primene i predviđa se izuzetno velika stopa rasta u prvoj<br />

dekadi 21. veka. Takođe, svetska iskustva ističu najbrži<br />

prodor govornih tehnologija u samouslužnim telefonskim<br />

aplikacijama. Ova iskustva i predviđanja odnose se na velike<br />

svetske jezike za koje su govorne tehnologije već razvijene i<br />

primenjene. S obzirom na stepen dostignuća u istraživanju i<br />

razvoju govornih tehnologija za srpski jezik na FTN i u<br />

preduzeću AlfaNum iz Novog Sada omogućena je njihova<br />

primena u savremenim korisničkim servisima i aplikacijama<br />

na srpskom govornom području.<br />

Potrebno je pažljivo analizirati potrebe našeg društva i<br />

tržišta kako bi se pronašle praktično ostvarive primene<br />

govornih tehnologija za srpski jezik i to u skladu sa njihovim<br />

trenutnim mogućnostima. Telekom operator sa svojim<br />

mrežama fiksne i mobilne telefonije svakako predstavlja<br />

najveći poligon za primene govornih tehnologija na srpskom<br />

jeziku i može od toga da ima najveće koristi. Investiranje u<br />

nove tehnologije je neminovno i po pravilu veoma isplativo,<br />

naročito u velikim telekomunikacionim sistemima kao što je<br />

telekom operator. Investiranje u razvoj govornih tehnologija<br />

za srpski jezik doprineće većem kvalitetu i široj primeni, što<br />

će ubrzati povraćaj ove i budućih investicija u govorne<br />

tehnologije, korisničke servise i aplikacije na bazi tih<br />

tehnologija. Stoga, važno je planski, sistematski i stručno<br />

uvoditi u primenu govorne tehnologije u skladu sa realno<br />

sagledanim potrebama i trenutnim mogućnostima i<br />

dostignućima u razvoju govornih tehnologija. Takođe,<br />

potrebno je dalje unapređivati govorne tehnologije za srpski<br />

jezik, pratiti njihovu primenu u velikim telekomunikacionim<br />

sistemima i usmeravati razvoj u skladu sa potrebama telekom<br />

operatora i sa ciljem unapređenja kvaliteta korisničkih servisa<br />

i usluga na bazi govornih tehnologija.<br />

V GOVORNI PORTALI<br />

Tehnološka revolucija koju je izazvao Internet,<br />

konvergencija mreža za prenos govora i podataka, kao i sve<br />

veća konkurencija doveli su do pojave nove generacije IVR<br />

(eng. Interactive Voice Response) tehnologije. Do tada, IVR<br />

aplikacije funkcionisale su na bazi tonskog biranja i<br />

preslušavanja unapred snimljenih govornih informacija.<br />

Zahvaljujući pojavi novih govornih tehnologija, koje<br />

omogućavaju automatsko prepoznavanje i sintezu govora,<br />

nova generacija IVR aplikacija je značajno unapređena što<br />

dovodi do pojave tzv. govornih portala (eng. Voice Portals).<br />

Govorni portal je sistem koji korisniku omogućava<br />

pristup informacijama na Internetu u svako doba i na svakom<br />

mestu, i to pomoću telefona i sopstvenog glasa. Pre pojave<br />

govornih portala, za pristup informacijama na Internetu bio je<br />

potreban pre svega računar, ali isto tako i određeni nivo<br />

znanja, obučenosti i iskustva. Sa druge strane, pokazalo se da<br />

ljudi radije koriste telefone, kojih ima i daleko veći broj nego<br />

računara, pa je izuzetno značajna mogućnost da se i tom<br />

velikom broju ljudi omogući pristup vrednim informacijama.<br />

Procenjeno je da trenutno u svetu 4,9 milijardi ljudi koristi<br />

telefon, a oko 800 milinona Internet što opravdava uvođenje<br />

govornih portala [2]. Portal na vebu jeste pristupna tačka<br />

preko koje korisnici traže željene informacije. Dakle, govorni<br />

portal je telefonski broj koji omogućava ovakav pristup<br />

pomoću telefona i navigaciju koristeći govorne komande.<br />

Nove govorne tehnologije, automatsko prepoznavanje govora<br />

(ASR) i sinteza govora na osnovu teksta (TTS) predstavljaju<br />

ključne elemente govornog portala.<br />

Komunikacija koja se odvija između korisnika i uređaja<br />

može se na najopštijem nivou predstaviti u nekoliko koraka<br />

(slika 5.1):<br />

• korisnik putem telefona izgovarajući govorne<br />

komande zahteva da pristupi željenoj aplikaciji;<br />

• voice server registruje poziv korisnika i odgovara na<br />

njega;<br />

• na osnovu informacija koje je voice server prikupio<br />

od korisnika šalje se zahtev za URL (predstavlja<br />

univerzalnu adresu svakog resursa na Internetu) preko<br />

Internet ili LAN mreže korisnikovom veb serveru;<br />

• traženu informaciju veb server u vidu VoiceXML<br />

dokumenta vraća voice server-u koji je u vidu<br />

govorne informacije prezentuje korisniku.<br />

Slika 4.1: Dijagram arhitekture sistema govornog portala


Da bi se ovaj proces komunikacije između korisnika i<br />

sistema obavio kvalitetno i efikasno neophodno je da sistem<br />

govornog portala sadrži sledeće hardverske, softverske i<br />

mrežne elemente:<br />

• telefonsku mrežu,<br />

• voice server (VoiceXML Gateway),<br />

• veb/aplikacioni server,<br />

• Internet mrežu,<br />

• VoiceXML dokumente,<br />

• gramatičke fajlove i<br />

• audio fajlove.<br />

Voice server predstavlja ključnu komponentu sistema<br />

govornog portala koja u sebi sadrži telefonski interfejs, ASR<br />

uređaj, TTS uređaj i VoiceXML browser.<br />

Svrha telefonskog interfejsa je da omogući korisniku da<br />

pozove govorni portal koristeći običan telefonski aparat. On<br />

predstavlja primarni interfejs govornog portala za krajnjeg<br />

korisnika. Ukoliko korisnik upućuje govorne komande pri<br />

komunikaciji sa mašinom, telefonski interfejs prosleđuje<br />

govorni signal korisnika uređaju za prepoznavanje govora<br />

(ASR). Sa druge strane, informaciju koju je korisnik tražio<br />

preuzima od TTS uređaja i prosleđuje je korisniku. Naravno<br />

prezentacija informacija korisniku ne mora da se vrši samo<br />

pomoću TTS uređaja, već se za to mogu koristiti i prethodno<br />

snimljeni segmenti, audio fajlovi, itd. ASR uređaj pretvara<br />

govorni signal u tekst koji se potom prosleđuje VoiceXML<br />

browser-u. Sa druge strane, TTS uređaj konvertuje tekst<br />

poslat od strane VoiceXML browser-a u govor.<br />

VoiceXML browser je ključna komponenta voice servera.<br />

On šalje zahteve za dobijanje VoiceXML dokumenata,<br />

interpretira dobijene dokumente i kontroliše tok dijaloga (tzv.<br />

dialog manager). Pored toga, on kontroliše rad celokupnog<br />

voice server-a, odnosno uređaja za prepoznavanje govora,<br />

uređaja za sintezu govora i telefonske komponente. Stoga,<br />

VoiceXML browser je moguće podeliti na dva dela: deo koji<br />

upravlja ostatkom voice server-a i deo koji zahteva i izvršava<br />

VoiceXML dokumente, nazvan VoiceXML interpreter.<br />

VoiceXML browser prezentuje primljene dokumente<br />

korisniku pomoću TTS uređaja. Uređaj za prepoznavanje<br />

govora (ASR) prevodi korisnikove zahteve VoiceXML<br />

browser-u na osnovu kojih on šalje HTTP (eng. Hyper Text<br />

Transfer Protocol) zahtev veb/aplikacionom serveru.<br />

Veb/aplikacioni server prima zahtev i traženi dokument šalje<br />

u obliku VoiceXML dokumenta. VoiceXML dokument u<br />

suštini predstavlja dokument koji definiše interakciju između<br />

korisnika i mašine, kao i sam tok dijaloga. Njegova uloga je<br />

od izuzetne važnosti za pravilan rad voice server-a jer na<br />

osnovu njega VoiceXML browser upravlja radom uređaja za<br />

prepoznavanje govora.<br />

Govorni portali u svetu postaju jedan novi vid<br />

komunikacije sa okruženjem za koji Datamonitor predviđa<br />

izuzetno brz rast iz razloga što ljudi radije koriste telefon<br />

nego računar da dođu do željenih informacija. Govor daje<br />

jednu novu dimenziju korisničkim servisima, stoga<br />

samouslužni govorni automati i informacioni govorni portali<br />

implementirani u preduzeću telekom operatora bi svakako<br />

mogli doprineti zadržavanju postojećih i privlačenju novih<br />

korisnika, razlikovanju od konkurencije i boljem povezivanju<br />

sa korisnicima, a samim tim i povećanju prihoda kompanije.<br />

Zahvaljujući primeni govornih tehnologija u savremenim<br />

korisničkim servisima i aplikacijama moguće je pružiti nove i<br />

unaprediti postojeće usluge, što povećava produktivnost<br />

opsluživanja korisnika i kvalitet poslovanja. Međutim, da bi<br />

se to i ostvarilo neophodno je ljudima ponuditi servise koji su<br />

im potrebni i za koje su spremni da plate. Sadržaji koji<br />

najčešće zanimaju većinu ljudi jesu bioskopski i pozorišni<br />

repertoar, red vožnje prigradskih i međugradskih autobusa,<br />

vremenska prognoza, informacije o kulturno-umetničkim i<br />

sportskim događajima u gradu, stanja na putevima, horoskop,<br />

sportski rezultati, itd.<br />

VI AUTOMATIZACIJA POZIVNOG CENTRA<br />

Pozivni centar (eng. Call Center) predstavlja centar u<br />

kome veliki broj operatera i drugog osoblja centra obrađuje<br />

korisničke zahteve. To je sistem koji organizovano i manje ili<br />

više automatizovano prima brojne telefonske pozive, pruža<br />

osnovne informacije pozivaocu, izvršava akcije u skladu sa<br />

svojim mogućnostima i komandama pozivaoca (zadatim<br />

govorom ili unosom određenih cifara preko telefonske<br />

tastature), a u slučaju potrebe može da prenese pozive do<br />

kompetentnih operatera koji su na raspolaganju - automatska<br />

distribucija poziva (eng. Automatic Call Distribution - ACD).<br />

Do pre nekoliko godina, pozivni centri posmatrani su u<br />

svetlu njihove tradicionalne funkcije - centra za organizovani<br />

prijem telefonskih poziva uz prosleđivanje veze do<br />

odgovarajućih lokala. Međutim, nekoliko novih tehnologija<br />

kao što su integracija računarstva i telefonije, automatsko<br />

prepoznavanje i sinteza govora, napredne tehnike rutiranja<br />

kroz inteligentne mreže, razvoj korisničkih baza podataka,<br />

kao i povezivanje sa Internetom značajno su promenile ulogu<br />

pozivnih centara. Danas, moderni pozivni centar jednog<br />

preduzeća preuzima funkciju komunikacionog interfejsa za<br />

sve vrste poslovne komunikacije sa korisnicima usluga tog<br />

preduzeća, tako da postaje osnovna tačka pristupa tom<br />

preduzeću.<br />

Osnovni elementi svakog pozivnog centra su:<br />

• telefonski resuri,<br />

• računarski resursi,<br />

• osoblje.<br />

Osnovni alat radnika pozivnog centra jeste telefonski<br />

aparat, a pružanje efikasne usluge zahteva povezivnje<br />

telefonskog sistema sa informacionim sistemom, odnosno<br />

implementaciju savremenog CTI sistema [2].<br />

Skoro svaka organizacija koja je takvog obima da joj je<br />

potreban pozivni centar, već sadrži određene računarske<br />

resurse. To su veliki centralni računari sa brojnim važnim<br />

podacima koji su najčešće pod nadzorom posebnog osoblja.<br />

Razvoj PC računara i klijent-server arhitektura omogućio je<br />

razvoj fleksibilnih i funkcionalnih pozivnih centara koji<br />

uspešno koriste informacije iz glavnih računara bez<br />

narušavanja njihovog integriteta.<br />

Osoblje pozivnog centra učestvuje sa 60 do 70% u<br />

strukturi troškova poslovanja pozivnog centra. Efikasno<br />

korišćenje zaposlenih u pozivnom centru može imati<br />

značajne finansijske efekte, koji se ogledaju u manjem<br />

rashodu preduzeća zbog plata operatera, kao i u smanjenju<br />

potreba za prostorom. Stoga, neophodno je optimizovati broj<br />

zaposlenih u skladu sa potrebama u toku različitih<br />

vremenskih perioda. Povezivanjem servisa pozivnih centara<br />

sa IVR, ASR, TTS i ostalim CTI servisima najveći broj<br />

poziva može se obraditi automatski, bez angažovanja<br />

operatera. Primenom govornih tehnologija moguće je<br />

ostvariti značajne uštede. Automatizacijom sistema za<br />

masovno opsluživanje telefonskih poziva telekom operatora<br />

moguće je ostvariti izuzetno velike uštede, naročito zbog


smanjenja potrebnog broja zaposlenih koji rade na prijemu<br />

telefonskih poziva. Iskustva pokazuju da je automatizovani<br />

prijem i obrada poziva 4 do 10 puta jeftinija od obrade poziva<br />

uz pomoć operatera, a veliki broj poziva odnosi se na rutinske<br />

servise za koje nije potreban živi operater. Primena ASR<br />

tehnologije dovodi do skraćenja prosečnog trajanja poziva i<br />

time se omogućuje prijem većeg broja poziva, što pored<br />

uštede u vremenu doprinosi i uštedama u novcu. Takođe,<br />

ASR tehnologija omogućava korisniku da na mnogo lakši i<br />

komforniji način dođe do željene informacije. Automatizacija<br />

pozivnog centra direktno doprinosi optimizovanju broja<br />

zaposlenih, kao i povećanju njihove produktivnosti jer<br />

rutinske operacije se obavljaju automatski dok se operateri<br />

pozivnog centra mogu posvetiti složenijim interaktivnim<br />

zadacima i specifičnim potrebama korisnika. Zahvaljujući<br />

primeni novih govornih tehnologija povećava se efikasnost<br />

pružanja usluga korisničkih servisa, što doprinosi povećanju<br />

zadovoljstva korisnika i ugleda preduzeća. Bliže povezivanje<br />

sa korisnicima kroz unapređenje postojećih i uvođenje novih<br />

servisa, kao i veća efikasnost i produktivnost vode ka<br />

povećanju prihoda i profita.<br />

VII ZAKLJUČAK<br />

Svi krajnji korisnici, od poslovnih ljudi do običnih<br />

građana, veoma su zainteresovani za usluge koje mogu dobiti<br />

telefonom: od raznih tehnika kontrole i usmeravanja poziva,<br />

čitanja elektronske pošte i faks poruka, pa do pristupa<br />

najraznovrsnijim informacijama. Sve ove usluge danas se<br />

ostvaruju uz pomoć prozvoda vodećih CT kompanija koje u<br />

najnovijim CT sistemima sve više koriste nove govorne<br />

tehnologije, odnosno automatsko prepoznavanje (ASR) i<br />

sintezu govora (TTS). Upravo ASR i TTS jesu ono po čemu<br />

se CT tehnologije danas razlikuju od onih u ne tako davnoj<br />

prošlosti. ASR i TTS tehnologije omogućile su da se<br />

prevaziđu ograničenja telefonske tastature kao interfejsa<br />

između čoveka i CT sistema. Zahvaljujući primeni novih<br />

govornih tehnologija pozivaocu je omogućeno da odmah<br />

kaže šta želi, a ne da pomoću telefonske tastature kreće kroz<br />

složene strukture menija. Sa druge strane, integracija<br />

računarstva i telefonije doprinela je povećanju mogućnosti<br />

primene novih govornih tehnologija (pristup innformacijama<br />

na Internetu putem telefona, čitanje e-mail i faks poruka<br />

preko telefona, govorna pošta, itd.). Budućnost ASR i TTS<br />

tehnologija leži u njihovoj sposobnosti da izgrade moćne<br />

aplikacije kakve nije mogućno izgraditi bez usavršenih ASR i<br />

TTS proizvoda.<br />

S obzirom na zavisnost govornih tehnologija od jezika,<br />

zahvaljujući doprinosima u istraživanju i razvoju govornih<br />

tehnologija za srpski jezik na FTN i u preduzeću AlfaNum iz<br />

Novog Sada otvorena je mogućnost i za građane na srpskom<br />

govornom području da koriste prednosti koje ove nove<br />

tehnologije pružaju, ravnopravno sa građanima iz razvijenih<br />

zemalja za čije su jezike govorne tehnologije već razvijene i<br />

primenjene. Sada je vreme da se akcenat stavi na komercijalne<br />

primene novih govornih tehnologija, na inovativne<br />

aplikacije i korisničke servise. Telekom operator svakako<br />

predstavlja najveći poligon za primene novih govornih<br />

tehnologija (automatizacija pozivnog centra, govorni portali,<br />

čitač SMS i e-mail poruka). Komercijalna primena govornih<br />

tehnologija doprineće njihovom daljem usavršavanju u cilju<br />

unapređenja kvaliteta korisničkih servisa i usluga na bazi<br />

govornih tehnologija.<br />

LITERATURA<br />

[1] M. Sečujski, R. Obradović, D. Pekar, Lj. Jovanov and V.<br />

Delić, “AlfaNum System for Speech Synthesis in<br />

Serbian Language,” in Proc. 5 th Conf. Text, Speech and<br />

Dialogue, pp. 237-244, Brno, Czech Republic, 2002.<br />

[2] Delić V., Glavatović D. i Sečujski M.: ”CTkurs-kurs iz<br />

serije Napredne komunikacione tehnologije”, Centar za<br />

telekomunikacije, Fakultet tehničkih nauka, Novi Sad,<br />

mart 2003.<br />

[3] V. Delić, D. Pekar, R. Obradović, and M. Sečujski:<br />

”Speech Signal Processing in ASR&TTS Algorithms”,<br />

Facta Universitatis (Niš), Series: Electronics and<br />

Energetics, vol. 16, no. 3, pp. 355-364, December 2003.<br />

[4] “When Machines Talk–Speech Technology in Human-<br />

Machine Communication,” Special Section in IEEE<br />

Signal Processing Magazine, vol. 22, no. 5, pp. 16-126,<br />

September 2005.<br />

[5] V. Delić: ”Govorna komunikacija čoveka i mašine”,<br />

Zbornik radova 10. konf. TELFOR, pp. 31-34, Beograd,<br />

nov. 2002.<br />

[6] Speech Magazine: http://www.speechmag.org<br />

Zahvalnica: Ovaj rad je pisan u okviru projekta TR-6144A<br />

Ministarstva nauke i zaštite životne sredine koji podržava i<br />

preduzeće “Telekom Srbija”, pod nazivom “Razvoj govornih<br />

tehnologija za srpski jezik i primena u Telekomu”.<br />

Abstract: The speech technologies which enable communi–<br />

cation between man and machine are automatic speech<br />

recognition (ASR) and text-to-speech (TTS). Taking<br />

language dependance of speech technologies into<br />

consideration, thanks to contributions in the research and<br />

developement of speech technologies for Serbian language at<br />

Faculty of Technical Sciences (FTN) and in the enterprice<br />

AlfaNum in Novi Sad, people on the Serbian language area<br />

obtained a possibility to use advantages of new speech<br />

technologies. Now, it is time to put emphasis on the<br />

commercial applications of new speech technologies.<br />

Certainly, telekom operator represents the biggist polygon for<br />

applications of new speech technologies (automatization of<br />

call center, voice portals, SMS and e-mail reader).<br />

VOICE PORTALS ARCHITECTURE AND APPLI–<br />

CATION OF ASR AND TTS TECHNOLOGY IN CALL<br />

CENTERS ON THE SERBIAN LANGUAGE AREA,<br />

Sandra Sovilj-Nikić, Vlado Delić

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!