29.08.2013 Views

Norsk i den digitale tidsalderen - Meta-Net

Norsk i den digitale tidsalderen - Meta-Net

Norsk i den digitale tidsalderen - Meta-Net

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

ponent som genererer oversatt tekst på målspråket. Sel-<br />

skapet Clue Norge spesialiserer seg på elektroniske ord-<br />

bøker for næringslivet, og utviklet for omtrent ti år si-<br />

<strong>den</strong> systemet Textran for maskinoversettelse fra engelsk<br />

til norsk. Systemet eksisterer fortsatt, men har ikke blitt<br />

videreutviklet fordi jevnt pålitelige maskinoversettelser<br />

av høy kvalitet er meget vanskelig å oppnå, mens bruker-<br />

gruppene ikke ønsket å betale for et system som gjorde<br />

feil. Selv om det foregår en betydelig forskningsinnsats<br />

på dette området, både nasjonalt og internasjonalt, har<br />

datadrevne og hybride systemer så langt vært mindre vel-<br />

lykket i applikasjoner for næringslivet enn i forsknings-<br />

laboratoriet. I Norge finnes <strong>den</strong> viktigste forskningseks-<br />

pertisen ved Universitetet i Oslo og Universitetet i Ber-<br />

gen.<br />

Språktjenesteindustrien i Norge later til å ha et<br />

underforbruk av språkteknologiske ressurser.<br />

Bruk av maskinoversettelse kan øke produktiviteten be-<br />

tydelig, forutsatt at systemet er tilpasset brukerspesifikk<br />

terminologi og er godt integrert i arbeidsflyten på en ar-<br />

beidsplass. Generelt later imidlertid språktjenesteindu-<br />

strien i Norge til å ha et underforbruk av språkteknolo-<br />

giske ressurser. Sektoren kan deles i to grupper: på <strong>den</strong><br />

ene si<strong>den</strong> har man frilansoversettere og oversetterbyråer<br />

som retter seg mot enkeltpersoner, næringslivet og of-<br />

fentlig sektor; på <strong>den</strong> andre si<strong>den</strong> har man oversettere<br />

som er tilknyttet Oversetterforeningen og <strong>Norsk</strong> faglit-<br />

terær forfatter- og oversetterforening.<br />

I <strong>den</strong> siste gruppen framstår bruken av språkteknolo-<br />

gi som begrenset. Den førstnevnte gruppen bruker oe<br />

Trados, som er det klart mest brukte oversettelsesverk-<br />

tøyet for profesjonelle oversettere. Trados har imidler-<br />

tid ingen egen modul for norsk, men støtter seg i ste-<br />

det på Hunspell, en åpen-kilde-løsning med stavekon-<br />

troll og et morfologisk analyseverktøy som opprinnelig<br />

ble utviklet for ungarsk. Selv om det er en funksjonell<br />

og åpen løsning, trenger <strong>den</strong> ytterligere utvikling for å<br />

fungere som en optimal ressurs for språktjenestesekto-<br />

ren i Norge. Særlig stort er behovet for å forbedre ana-<br />

lysen av sammensatte ord på norsk. I tillegg bruker pro-<br />

fesjonelle oversettere termbaser (DU, IATE), og til en<br />

viss grad er der et samarbeid med universitetssektoren i<br />

utviklingen av termbaser. Det tilsynelatende underfor-<br />

bruket av språkteknologiske ressurser i språktjenestein-<br />

dustrien skyldes delvis mangelen på gode ressurser for<br />

norsk, men også manglende kontakt mellom språktje-<br />

nesteleverandører og forskermiljøene. Derfor kan kunn-<br />

skap om det fulle potensialet for språkteknologi blir for<br />

begrenset, og det kan være vanskelig for kommersielle<br />

aktører å vurdere kvaliteten på eksisterende ressurser.<br />

Kvaliteten på maskinoversettelsessystemer har fremde-<br />

les et stort forbedringspotensial. Blant utfordringene er<br />

å tilpasse språkressurser til et gitt emne eller brukerom-<br />

råde, og å integrere teknologien i en arbeidsflyt som al-<br />

lerede inneholder termbaser og oversettelsesminne. I til-<br />

legg er de fleste systemene som er i bruk rettet mot en-<br />

gelsk, og støtter bare sjel<strong>den</strong> oversettelse til og fra norsk.<br />

Dette gir forstyrrelser i prosessen med å få tekst oversatt,<br />

og tvinger maskinoversettelsesbrukere til å lære seg ulike<br />

kodingsverktøy for forskjellige systemer.<br />

Gjennom evalueringskampanjer sammenlignes kvalite-<br />

ten på ulike maskinoversettelsessystemer og tilnærmin-<br />

ger og ikke minst hva som er status for systemene for uli-<br />

ke språkpar. Prosjektet EuroMatrix+ gjennomførte en<br />

studie av kvaliteten på maskinoversettelsessystemer for<br />

22 offisielle EU-språk. <strong>Norsk</strong> var ikke inkludert i dette<br />

prosjektet. Figur 7 (s. 26), som ble laget gjennom pro-<br />

sjektet EuroMatrix+, viser en parvis sammenligning av<br />

resultatene for 22 av de 23 EU-språkene (irsk var ikke<br />

med i sammenligningen). Resultatene er rangert med<br />

bruk av BLEU-poenggivning, som gir høyere poeng for<br />

bedre oversettelser [27]. En menneskelig oversetter vil-<br />

le vanligvis oppnå rundt 80 poeng. De beste resultate-<br />

ne (i grønt og blått) finnes blant de språk som nyter<br />

25

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!