29.08.2013 Views

Norsk i den digitale tidsalderen - Meta-Net

Norsk i den digitale tidsalderen - Meta-Net

Norsk i den digitale tidsalderen - Meta-Net

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Statistisk språkmodell<br />

Tekstinput Stavekontroll Grammatikkontroll Korreksjonsforslag<br />

Det mest brukte korrekturverktøyet for norsk finnes i<br />

Microso Office-pakken, og er laget av det finske fir-<br />

maet Lingso, mens deler av grammatikkontrollen for<br />

bokmål ble utviklet av forskere ved Universitetet i Oslo.<br />

Stavekontroll for bokmål og nynorsk med åpen kilde-<br />

teknologi, som Hunspell, er også tilgjengelig.<br />

En annen norsk kommersiell aktør er Tansa, som spesia-<br />

liserer seg på korrekturverktøy tilpasset større bedriers<br />

spesifikke behov og ordforråd. De dekker flere språk i til-<br />

legg til norsk bokmål og nynorsk (for eksempel engelsk,<br />

tysk, spansk og fransk), og kun<strong>den</strong>e spenner fra NRK<br />

til Financial Times. Nynodata AS tilbyr et oversettelses-<br />

verktøy fra bokmål til nynorsk som samtidig hjelper bru-<br />

keren å følge en konsekvent formbruk.<br />

Tre selskaper retter seg spesifikt mot skrilige hjelpe-<br />

midler for dyslektikere. To av dem, Lingit og Inclu-<br />

de, inneholder en stavekontrollmodul i tillegg til and-<br />

re lese- og skriveverktøy (ordprediksjon, tekst-til-tale-<br />

komponenter), mens MikroVerkstedet tilbyr fullføring<br />

av ord og ordprediksjon.<br />

Ved første øyekast fremstår dermed situasjonen for kor-<br />

rekturverktøy på norsk som god. Men samtidig er fle-<br />

re av initiativene nokså sårbare. For eksempel er norsk<br />

korrekturlesning basert på åpen kildekode (aspell, Hun-<br />

spell) drevet av tre enkeltpersoner som gjør dette på fri-<br />

ti<strong>den</strong>. Med andre ord er en av de viktigste norske kon-<br />

kurrentene til Microsos programvare avhengig av et<br />

personlig initiativ fra en håndfull idealistiske enkeltper-<br />

soner, snarere enn en systematisk innsats for å utvikle<br />

moduler med åpen kildekode. Videre er det en viktig<br />

3: Korrekturlesning (over: statistisk; under: regelbasert)<br />

utfordring for de fleste norske korrekturlesningsverk-<br />

tøyene å forbedre eksisterende ressurser ved å utvikle<br />

mer avanserte språkteknologiske verktøy. Det mangler<br />

også språkspesifikke verktøy for automatisk oversettel-<br />

se og oversettelsesstøtte. Verktøy med oversettelsesmin-<br />

ne som Trados finnes, men de har ingen språkspesifikk<br />

tilpasning til norsk utover en grunnleggende stavekon-<br />

troll.<br />

Utover korrekturlesning og skrivestøtte er korrektur-<br />

verktøy også viktig innenfor data-assistert språklæring.<br />

Korrekturverktøy kan også automatisk korrigere nett-<br />

søk, som i Googles Mente du… – forslag til korrekte nett-<br />

søk.<br />

4.2.2 <strong>Net</strong>tsøk<br />

Digitale søk er sannsynligvis <strong>den</strong> mest brukte språktek-<br />

nologiske applikasjonen, men <strong>den</strong> er samtidig i stor grad<br />

underutviklet. Søkemotoren Google, som ble opprettet<br />

i 1998, utfører nå omtrent 80% av alle nettsøk [24].<br />

Googles søkegrensesnitt og resultatvisning har ikke end-<br />

ret seg vesentlig si<strong>den</strong> <strong>den</strong> første versjonen. Men i <strong>den</strong><br />

nåværende versjonen tilbyr Google stavekorrigering for<br />

feilstavede ord, og har innarbeidet grunnleggende se-<br />

mantiske søkemuligheter som kan forbedre nøyaktighe-<br />

ten gjennom analyser av ordets betydning i en gitt søke-<br />

kontekst [25]. Googles suksess viser at med store meng-<br />

der tilgjengelige data kan statistiske metoder gi relativt<br />

gode resultater.<br />

For mer sofistikerte informasjonssøk er det imidler-<br />

tid avgjørende å integrere dypere lingvistiske analyser<br />

19

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!