Proceedings - Natural Language Server - IJS

More documents

Recommendations

Info

naslednjem poglavju pa bolj podrobno obravnavamo nekaj razlinih možnih varnostno-nadzornih scenarijev, pri katerih pridejo v poštev navedene tehnologije. Uporaba teh tehnologij odpira precej pravnih in etinih vprašanj, ki jih naslavljamo v zadnjem delu lanka. Dejstvo pa je, da se v Evropi in po svetu te tehnologije razvija in uporablja tudi v vedno bolj integriranih nadzornih sistemih. 2. Varnostno-nadzorni scenariji Pri razvoju novih tehnologij navadno izvedemo študijo in ovrednotenje scenarijev njihove smiselne uporabe. Pri pametnih nadzornih sistemih, ki vkljuujejo tehnologije govorjenega jezika, pridejo v poštev varnostno-nadzorni scenariji, ki se kakor koli nanašajo na samodejno raunalniško analizo zajetih zvonih govornih signalov. 2.1. Avdio nadzor komunikacijskih kanalov Uporaba tehnologij govorjenega jezika za nadzor avdio-komunikacijskih in informacijskih kanalov je med vsemi obravnavanimi varnostno-nadzornimi scenariji še najbolj znana in tudi razvita. Zaradi nacionalnih varnostnih interesov razvoj teh tehnologij v najveji meri neposredno podpirajo kar vlade razlinih najbolj razvitih držav. Na tem podroju se za proaktivne nadzorne sistem štejejo predvsem sistemi za samodejno zaznavanje in razpoznavanje (identifikacijo) govorcev, ki jih varnostnoobveševalne službe obravnavajo in spremljajo zaradi utemeljenih sumov storitve kaznivih dejanj in katerih govor se pojavi v avdio-komunikacijskih kanalih. S tehnologijo razpoznavanja govora pa se poskuša samodejno zaznati in razpoznati izgovorjena sporoila, ki so varnostno sumljiva (denimo, napeljevanje in napovedovanje kriminalnih ali teroristinih dejanj ipd) in so potrebna proaktivne in preventivne obravnave varnostnoobveševalnih služb. Poleg navedenih tehnologij je za tovrstne varnostnonadzorne scenarije uporabna tudi tehnologija razpoznavanja govorjenega jezika, s katero se lahko doseže, da nadzorni sistem samodejno zazna in razpozna jezik govorca ali celo njegov materni jezik, ko ta govori tuj jezik. 2.2. Integrirani avdio-vizualni nadzor prostorov Varnostni nadzor prostorov se danes izvaja predvsem z video-nadzornimi sistemi. Veino tovrstnih varnostnih scenarijev je mogoe razširiti z dodajanjem funkcije pametnega avdio nadzora. Ta razširitev predvideva obstoj možnosti namestitve mikrofonov za zajemanje zvonih signalov. Najsodobnejše motorizirane mrežne nadzorne kamere imajo pogosto že vgrajen mikrofonski vhod (slika 1) in z njihovo primerno namestitvijo lahko postavimo nadzorno polje mikrofonov. S sodobnimi postopki obdelave zvonih signalov iz polja mikrofonov lahko izvedemo asovno in prostorsko lokalizacijo zvonih virov, ki se pojavljajo v nadzorovanem prostoru (Keyrouz, 2007). Po lokalizaciji zvonih virov lahko izvedemo postopke samodejnega razpoznavanja varnostno sumljivih zvokov, med katerimi je lahko tudi govor in drugi loveški glasovi, kot so krianje, izgovarjanje groženj, klici na pomo ipd. 39 Po lokalizaciji in razpoznavanju varnostno sumljivih zvokov ali glasov bi takšen sistem lahko preusmeril pozornost in vidno polje motoriziranih video-nadzornih kamer v smeri teh zvonih virov in pritegnil pozornost morebitnih loveških varnostnih operatorjev in služb. Slika 1: Primer mrežne motorizirane video-nadzorne kamere firme Axis z mikrofonskim vhodom. Tipini varnostno-nadzorni scenariji, ki bi vkljuevali takšne razširjene sisteme, so danes že skoraj obiajni varnostni nadzori javnih prostorov, kot so mestne ulice, potniške postaje, podhodi in dvigala ter javna parkiriša, garaže, igriša in tudi javna prevozna sredstva. V primeru zaprtih varovanih javnih prostorov, kjer je veja možnost poskusov ropa (to so na primer zlatarne, pošte, banke ipd), bi samodejnemu razpoznavanju izgovorjenih groženj, krianja in klicev na pomo lahko dodali tudi funkcijo za samodejno govorno proženje alarma ter klic policije in reševalnih služb z izgovarjanjem vnaprej predvidenih prikritih prožilnih govornih izjav. S tehnologijami samodejnega razpoznavanja psihofizinega stanja govorca pa bi bilo sistem možno usposobiti tudi tako, da bi samodejno zaznal izrazito agresivnost ali prestrašenost govoreih prisotnih ljudi. Tovrstni sistemi bi tako lahko reševali življenja, saj so znani primeri (ropi na poštah in v zlatarnah), ko v ropu ranjeni ljudje niso uspeli sprožiti klasinega alarma ali pravoasno priklicati pomoi. 2.3. Samostojni avdio-nadzor prostorov V primerih, ko video nadzor še ni ali ne more/sme biti vzpostavljen (slaba vidljivost ali varovanje zasebnosti), je mogoe razmišljati o uporabi samostojnih pametnih avdio-nadzornih sistemov. Takšni sistemi bi prišli denimo v poštev v javnih prostorih, kjer je veja možnost kriminalnih dejanj v nonem asu (spolno nadlegovanje, poskusi ropa ipd). Primeri takšnih prostorov so odprta ali pokrita slabo osvetljena parkiriša, garažni koridorji, cestni podhodi in prehodi, javna dvigala, javna straniša ipd. V vseh teh primerih bi prišel v poštev samostojni avdio-nadzorni sistem, ki bi imel poleg samodejnega razpoznavanja varnostno sumljivih zvokov, kot je razbijanje in drug neobiajen hrup, tudi zmožnost samodejnega razpoznavanja krianja, izgovorjenih groženj, klicev na pomo ipd. V primeru, ko so v prostor namešeni tudi zvoniki (tipino je to v dvigalih), bi lahko sistem tudi govorno opozoril prisotne na zaznano neobiajno obnašanje, kar bi lahko prisotne obvarovalo ali odvrnilo od kriminalnih dejanj. Avdio-nadzorne sisteme je mogoe uporabiti tudi za druge namene, kot je le prepreevanje kriminala in terori-
zma. Možno jih je namre uporabiti tudi v zasebnih varovanih stanovanjih, v katerih bivajo ostareli, bolni ali onemogli ljudje, ki jih zaradi zasebnosti moti video nadzor. V teh primerih bi avdio-nadzorni sistem lahko uporabili za samodejno razpoznavanje klica na pomo ali poslabšanega psihofizinega stanja oziroma stiske varovancev. Tak sistem bi lahko samodejno razpoznal tudi druge neobiajne zvoke v prostoru, kot je hrup padajoih predmetov ipd. Tovrstni sistemi bi lahko prepreili pogoste neprijetne dogodke, ko osamljeni onemogli starejši varovanci po padcu na svojem domu ležijo tudi po nekaj dni na tleh in ne uspejo priklicati pomoi. Vsi navedeni varnostno-nadzorni scenariji ponujajo precej možnosti bolj intenzivnega razvoja tehnologij govorjenega jezika, ki presega uporabo v klasinih uporabniških vmesnikih za mobilne in druge informacijskokomunikacijske platforme. 3. Varnostno-nadzorne govorne tehnologije Pri razvoju in uporabi obstojeih tehnologij govorjenega jezika v pametnih nadzornih sistemih se izkaže, da jedro teh tehnologij navadno ni potrebno posebej prilagajati varnostno-nadzornemu podroju uporabe. Še najve težav se pojavlja pri pridobivanju primernih zbirk zvonih govornih posnetkov, ki ustrezajo izbranim varnostnonadzornim scenarijem in so nujno potrebne za izvedbo raznih unih postopkov in ovrednotenje zanesljivosti delovanja sistemov. 3.1. Varnostno-nadzorne zbirke govornih posnetkov Pri pridobivanju varnostno-nadzornih zbirk govornih posnetkov je možnih ve pristopov in vsak ima svoje slabosti in prednosti. Pridobivanje govornih posnetkov, ki verodostojno odražajo obravnavan varnostno-nadzorni scenarij, je razmeroma zahtevno in pri tem se navadno poslužujemo ene od treh metodologij. Pri prvi se zanašamo na snemanje govora v igranih razmerah, ki jih izvedemo posebej za te potrebe, pogosto pa uporabimo kar posnetke igranih ali dokumentarnih filmov, ki vsebujejo primerne filmske sekvence. Druga možnost je, da pri pridobivanju govorne zbirke sodelujejo prostovoljci, ki jih z razlinimi psihološkimi tehnikami spodbudimo k priakovanemu obnašanju. Najtežje pa je pridobiti posnetke resninih varnostno-nadzornih razmer, kot so posnetki že namešenih avdio-vizualnih nadzornih sistemov, posnetki klicev ljudi v komunikacijski center policije ali reševalnih služb ipd. Te zbirke najbolj verno odražajo resnine varnostno-nadzorne razmere, vendar jih je zelo težko pridobiti zaradi pravnih in drugih ovir. S to razmeroma zahtevno problematiko se ubadajo predvsem raziskovalci na podroju ustvenega raunalništva (angl. affective computing), ki v okviru razlinih projektov in mrež odlinosti (denimo, http://emotionresearch.net) pridobivajo tovrstne zbirke avdio-vizualnih posnetkov (denimo, korpus SAFE – Clavel, 2006). 3.2. Razpoznavanje govora Obstojeo razmeroma razvito tehnologijo samodejnega razpoznavanja govora je mogoe neposredno uporabiti za razline varnostno-nadzorne scenarije (razpoznavanje 40 izgovorjenih groženj, klicev na pomo in varnostno sumljivih izjav ter prikrito govorno proženje alarma ipd). Ta tehnologija danes v glavnem temelji na raunalniškem izvajanju postopka dekodiranja govornega signala z uporabo govornega modela, ki je predstavljen kot hierarhina struktura verjetnostnih konnih avtomatov. Najvišji nivo te hierarhine strukture modelira dani govorjeni jezik, vmesni nivo slovar izgovarjav danih besed in najnižji nivo akustine uresniitve posameznih glasov danega govorjenega jezika. Celotno strukturo govornega modela se lahko obravnava kot strukturirani konni pretvornik (angl. Finite State Transducer), ki v najnižjem nivoju vsebuje stanja prikritih Markovovih modelov (Jelinek, 1998; Mohri et al.,2008). Takšen govorni model se je izkazal kot zelo prilagodljiv razlinim podrojem uporabe. Za sisteme avdio-nadzora prostora je potrebnega še nekaj razvojnega in raziskovalnega dela za zagotavljanje veje robustnosti delovanja v zahtevnih akustinih okoljih (ulini hrup ipd), ter za boljšo izrabo metod asovne in prostorske lokalizacije govornih zvonih virov v prostoru. 3.3. Razpoznavanje govorcev Postopke razpoznavanja govorcev bi lahko v grobem razdelili v dve skupini. V prvo uvršamo postopke, ki se uporabljajo za besedilno-odvisno razpoznavanje, v drugo pa postopke, ki se uporabljajo za besedilno neodvisno razpoznavanje. Za avdio-nadzorne sisteme (razpoznavanje poljubnega govora znanih kriminalcev in osumljencev) pridejo v poštev predvsem besedilno-neodvisni sistemi. Tehnologija besedilno-neodvisnega razpoznavanja govorcev je v zadnjem poldrugem desetletju doživela precejšen napredek. V veliki meri gre zasluge za to pripisati ameriški organizaciji NIST, ki je z rednim prirejanjem dogodkov, na katerih se med seboj »pomerijo« najboljši raziskovalci s tega podroja, uspela privabiti ugledne raziskovalne ustanove s celega sveta. Eden izmed kljunih prebojev na tem podroju je bil dosežen z uvedbo t.i. splošnega modela govorcev (UBM), ki iz ve sto ur posnetkov govora velikega števila razlinih govorcev strne veino pomembnih akustinih lastnosti govorcev v relativno majhno množico parametrov statisti- nega modela mešanice Gaussovih porazdelitev (GMM) (Reynolds et.al., 2000). Uvedba modela UBM pa je poleg številnih drugih prednosti preko postopka najveje posteriorne verjetnosti (MAP) uspela zagotoviti visoko zanesljivost razpoznavanja. Pristop z uporabo modela UBM je zelo uinkovit v primeru, ko so akustine razmere (šum, lastnosti mikrofona in prenosnih poti itd.) v govornih posnetkih enake, a se uspešnost razpoznavanja precej poslabša, kadar temu ni tako. Raziskovalci so predlagali številne rešitve, s katerimi so poskušali izniiti ali vsaj zmanjšati vpliv sejne spremenljivosti. Med vsemi predlaganimi rešitvami je bila najveje pozornosti deležna analiza vezanih faktorjev (JFA) (Kenny et al., 2007; Dehak et al. 2011), s katero se govorne posnetke danega govorca da pretvoriti v nizkorazsežen vektor znailk (poimenovan i-vektor), ki ohrani veino diskriminatorne informacije, ki jo potrebujemo za loevanje med razlinimi govorci.
Page 2 and 3: Zbornik 15. mednarodne multikonfere
Page 4 and 5: PREDGOVOR MULTIKONFERENCI INFORMACI
Page 6 and 7: KONFERENČNI ODBORI CONFERENCE COMM
Page 8 and 9: KAZALO / TABLE OF CONTENTS Jezikovn
Page 10: Zbornik 15. mednarodne multikonfere
Page 13 and 14: RECENZENTI • doc. dr. Simon Dobri
Page 15 and 16: language similarity as a feature of
Page 17 and 18: ually annotating 345 sentences and
Page 19 and 20: Disambiguating vectors for bilingua
Page 21 and 22: Language POS Source word Slovene se
Page 23 and 24: 4. Evaluation and discussion of the
Page 25 and 26: , Iztok Kosem**, Berginc*** * Troj
Page 27 and 28: vseh besed, se pravi, da bi ta
Page 29 and 30: 3. Spletni vmesnik za dostop do kor
Page 31 and 32: SPOOK.Sem: semantično označevanje
Page 33 and 34: uporabili samo za angleški del kor
Page 35 and 36: Vsekakor pa nas je pri označevanju
Page 37 and 38: Sistem vsebinskega priporočanja do
Page 39 and 40: poljubno, avtor pa svetuje vrednost
Page 41 and 42: Tabela 5: Filtriranje z dinamično
Page 43 and 44: Luka *, * Artificial Intelligence
Page 45 and 46: 4. Technical approaches and algorit
Page 47: Tehnologije govorjenega jezika v pa
Page 51 and 52: Kaja Dobrovoljc, 1 Simon Krek, 2 Ja
Page 53 and 54: 3.1.4. fazah: v prvi fazi s
Page 55 and 56: (del, dol, vez, skup) in pri poveza
Page 57 and 58: ˇSirjenje slovarja in dvoprehodni
Page 59 and 60: Uporabili smo orodje s katerim smo
Page 61 and 62: zbirka besedil, korpus, slovar Toma
Page 63 and 64: -8"?> -c.org/ns/1.0" type="pb" xml:
Page 65 and 66: 6. Dostopnost virov dejanska možn
Page 67 and 68: prinašajo 185 milijonov besed oz.
Page 69 and 70: Ugotovimo lahko, da po številu pol
Page 71 and 72: predlog, zadeva, podatek, podlaga,
Page 73 and 74: Their main differences between them
Page 75 and 76: The corpus was PoS-tagged and lemma
Page 77 and 78: 5. Conclusions In this paper we pre
Page 79 and 80: 2000) is an English computer tutor
Page 81 and 82: Table 5: Classifier performance wit
Page 83 and 84: forms of Croatian proper names, but
Page 85 and 86: on the output of the first CRF. We
Page 87 and 88: Table 4: CroNER performance dependi
Page 89 and 90: Table 1: Description of the picture
Page 91 and 92: syntactic movement out of the objec
Page 93 and 94: and other agreement markers are use
Page 95 and 96: Figure 2. A FST representing a simp
Page 97 and 98: encoded text representation as seen
Page 99 and 100:
Izhodišče segmentacijsko-tokeniza
Page 101 and 102:
3. Učni korpus ssj500k 4 Učni kor
Page 103 and 104:
azreševanje stavčne ali celo meds
Page 105:
težavnosti; pri oceni berljivosti
Page 110 and 111:
Kako dobro programi popravljajo vej
Page 112 and 113:
okviru projekta ESS Uspešno vklju
Page 114 and 115:
Besana opozarja na manjkajoče veji
Page 116 and 117:
Umetno tvorjenje slovenskega govora
Page 118 and 119:
Tabela 1: Analiza čistopisa zbirke
Page 120 and 121:
Distributional Semantics Approach t
Page 122 and 123:
3.2.1. Random indexing Random index
Page 124 and 125:
Table 2: Accuracy for all considere
Page 126 and 127:
Avtomatsko luščenje leksikalnih p
Page 128 and 129:
3.1. Metodologija in zaporedje post
Page 130 and 131:
začetku povedi in upoštevanje t.
Page 132 and 133:
Izdelava XML-shem za slovarske proj
Page 134 and 135:
standardi še niso bili vzpostavlje
Page 136 and 137:
nepričakovan zapis ali napačen za
Page 138 and 139:
Building Named Entity Recognition M
Page 140 and 141:
corpus token transfer type transfer
Page 142 and 143:
morphological information, for Slov
Page 144 and 145:
Luščenje terminoloških kandidato
Page 146 and 147:
3.1. Enobesedni terminološki kandi
Page 148 and 149:
Rezultati priklica so dobri. Od 109
Page 150 and 151:
Event and Temporal Relation Extract
Page 152 and 153:
Table 1: Event annotation summary E
Page 154 and 155:
Table 3: Event extraction performan
Page 156 and 157:
Korpusna analiza slovenskega delež
Page 158 and 159:
Vrsta besedila Izbrana področja (i
Page 160 and 161:
primerih (11) in (12), ne pa za del
Page 162 and 163:
Identifying Fear Related Content in
Page 164 and 165:
not present” by 23 annotators. Th
Page 166 and 167:
A Web Service Implementation of Lin
Page 168 and 169:
equired to install the specific sof
Page 170 and 171:
In both figures the same workflow i
Page 172 and 173:
Termania - prosto dostopni spletni
Page 174 and 175:
informacije so poleg same vsebine g
Page 176 and 177:
Izdelava slovensko-srbskega vzpored
Page 178 and 179:
dovoljeno odstopanje do 1 sekunde.
Page 180 and 181:
Poleg navedenih težav so se pojavl
Page 182 and 183:
Topic ontology construction from En
Page 184 and 185:
Fig. 2: English topic ontology afte
Page 186 and 187:
4. Topic ontologies constructed fro
Page 188 and 189:
Translating news to CycL using the
Page 190 and 191:
and the Cyc concept, which correspo
Page 192 and 193:
without parsing. One type of such s
Page 194 and 195:
Guessing the Correct Inflectional P
Page 196 and 197:
noted that the distribution of LPPs
Page 198 and 199:
Table 1: Feature selection analysis
Page 200 and 201:
Razpoznavanje imenskih entitet v sl
Page 202 and 203:
N − log Z(x (i) ) − i=1 K k=1
Page 204 and 205:
F1 1.0 0.8 0.6 0.4 0.2 0.0 0.63 0.4
Page 206 and 207:
sloWCrowd: orodje za popravljanje w
Page 208 and 209:
2.2. Uporabniški vmesnik Osnovna f
Page 210 and 211:
uporabnikov z večanjem stopnje zan
Page 212 and 213:
Korpus slovenskega znakovnega jezik
Page 214 and 215:
Posnetki se v anonimizirani obliki
Page 216 and 217:
ZEN: zasnova glasovnih e-storitev v
Page 218 and 219:
Rešitev je bila izvedena na podlag
Page 220 and 221:
predpisane aktivnosti v poteku zdra
Page 222 and 223:
Indeks avtorjev / Author index Agi
show all

Proceedings - Natural Language Server - IJS

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?