Norsk i den digitale tidsalderen - Meta-Net
Norsk i den digitale tidsalderen - Meta-Net
Norsk i den digitale tidsalderen - Meta-Net
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Statistisk språkmodell<br />
Tekstinput Stavekontroll Grammatikkontroll Korreksjonsforslag<br />
Det mest brukte korrekturverktøyet for norsk finnes i<br />
Microso Office-pakken, og er laget av det finske fir-<br />
maet Lingso, mens deler av grammatikkontrollen for<br />
bokmål ble utviklet av forskere ved Universitetet i Oslo.<br />
Stavekontroll for bokmål og nynorsk med åpen kilde-<br />
teknologi, som Hunspell, er også tilgjengelig.<br />
En annen norsk kommersiell aktør er Tansa, som spesia-<br />
liserer seg på korrekturverktøy tilpasset større bedriers<br />
spesifikke behov og ordforråd. De dekker flere språk i til-<br />
legg til norsk bokmål og nynorsk (for eksempel engelsk,<br />
tysk, spansk og fransk), og kun<strong>den</strong>e spenner fra NRK<br />
til Financial Times. Nynodata AS tilbyr et oversettelses-<br />
verktøy fra bokmål til nynorsk som samtidig hjelper bru-<br />
keren å følge en konsekvent formbruk.<br />
Tre selskaper retter seg spesifikt mot skrilige hjelpe-<br />
midler for dyslektikere. To av dem, Lingit og Inclu-<br />
de, inneholder en stavekontrollmodul i tillegg til and-<br />
re lese- og skriveverktøy (ordprediksjon, tekst-til-tale-<br />
komponenter), mens MikroVerkstedet tilbyr fullføring<br />
av ord og ordprediksjon.<br />
Ved første øyekast fremstår dermed situasjonen for kor-<br />
rekturverktøy på norsk som god. Men samtidig er fle-<br />
re av initiativene nokså sårbare. For eksempel er norsk<br />
korrekturlesning basert på åpen kildekode (aspell, Hun-<br />
spell) drevet av tre enkeltpersoner som gjør dette på fri-<br />
ti<strong>den</strong>. Med andre ord er en av de viktigste norske kon-<br />
kurrentene til Microsos programvare avhengig av et<br />
personlig initiativ fra en håndfull idealistiske enkeltper-<br />
soner, snarere enn en systematisk innsats for å utvikle<br />
moduler med åpen kildekode. Videre er det en viktig<br />
3: Korrekturlesning (over: statistisk; under: regelbasert)<br />
utfordring for de fleste norske korrekturlesningsverk-<br />
tøyene å forbedre eksisterende ressurser ved å utvikle<br />
mer avanserte språkteknologiske verktøy. Det mangler<br />
også språkspesifikke verktøy for automatisk oversettel-<br />
se og oversettelsesstøtte. Verktøy med oversettelsesmin-<br />
ne som Trados finnes, men de har ingen språkspesifikk<br />
tilpasning til norsk utover en grunnleggende stavekon-<br />
troll.<br />
Utover korrekturlesning og skrivestøtte er korrektur-<br />
verktøy også viktig innenfor data-assistert språklæring.<br />
Korrekturverktøy kan også automatisk korrigere nett-<br />
søk, som i Googles Mente du… – forslag til korrekte nett-<br />
søk.<br />
4.2.2 <strong>Net</strong>tsøk<br />
Digitale søk er sannsynligvis <strong>den</strong> mest brukte språktek-<br />
nologiske applikasjonen, men <strong>den</strong> er samtidig i stor grad<br />
underutviklet. Søkemotoren Google, som ble opprettet<br />
i 1998, utfører nå omtrent 80% av alle nettsøk [24].<br />
Googles søkegrensesnitt og resultatvisning har ikke end-<br />
ret seg vesentlig si<strong>den</strong> <strong>den</strong> første versjonen. Men i <strong>den</strong><br />
nåværende versjonen tilbyr Google stavekorrigering for<br />
feilstavede ord, og har innarbeidet grunnleggende se-<br />
mantiske søkemuligheter som kan forbedre nøyaktighe-<br />
ten gjennom analyser av ordets betydning i en gitt søke-<br />
kontekst [25]. Googles suksess viser at med store meng-<br />
der tilgjengelige data kan statistiske metoder gi relativt<br />
gode resultater.<br />
For mer sofistikerte informasjonssøk er det imidler-<br />
tid avgjørende å integrere dypere lingvistiske analyser<br />
19