SPROG TIL TIDEN RAPPORT FRA ... - Kulturministeriet
SPROG TIL TIDEN RAPPORT FRA ... - Kulturministeriet
SPROG TIL TIDEN RAPPORT FRA ... - Kulturministeriet
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
80 <strong>SPROG</strong> <strong>TIL</strong> <strong>TIDEN</strong><br />
KAPITEL 5<br />
Flere kulturinstitutioner har i de senere år fået midler til konkrete<br />
digitaliseringsprojekter på kulturarvsområdet. Denne udvikling<br />
forventes at fortsætte i de kommende år. Det skal sikres, at vi også<br />
fremover har sprogteknologiske værktøjer, der kan hjælpe os med at<br />
bearbejde den digitaliserede kulturarv og f.eks. udvikle mere intuitive<br />
navigationsformer i de litterære og historiske tekster. Her skal<br />
der også tages hensyn til problemet med copyright. Det bør overvejes,<br />
om der skal indføres særlige regler for brug af digitale tekster,<br />
tekster på internettet osv., når det gælder sprogteknologiske projekter.<br />
Formålet med at bruge teksterne til forskning i eller udvikling<br />
af sprogteknologi er jo ikke at bruge dem til det, som de oprindeligt<br />
er produceret til, men at anvende dem i en sammenhæng, hvor<br />
værkets status som kunstværk træder i baggrunden.<br />
Der er stor interesse i forskningsmiljøerne for et samarbejde om<br />
at indsamle litterære og fagsproglige data og udvikle værktøjer<br />
i fællesskab. En stor gruppe humanistiske forskningsmiljøer er i<br />
2007 gået sammen for at skabe en fælles forskningsinfrastruktur<br />
DK-CLARIN, der bl.a. tilgodeser den fremtidige anvendelse af ressourcerne<br />
til sprogteknologiske formål.<br />
Et særligt aspekt ved indsamlingen af sproglige ressourcer er imidlertid<br />
den konstante forandring, der fi nder sted. Verden ændrer sig,<br />
sproget udvikler sig, og der er brug for løbende indsamling af data og<br />
udvikling af ressourcer, hvis vi vil følge med. En styrkelse af dansk<br />
sprogteknologi bør derfor ikke kun ske i form af enkeltbevillinger og<br />
enkeltstående projektmidler. Der er brug for en kontinuerlig indsats,<br />
ellers vil det indsamlede materiale hurtigt blive forældet.<br />
DK-CLARIN er en forskningsinfrastruktur for humaniora, med<br />
sprogligt fokus: skrevet, talt og multimodalt. DK-CLARIN vil indeholde<br />
store tekstkorpusser med ældre og moderne dansk, parallelle<br />
tekster (samme tekst på to sprog), talt sprog, ordbøger, videosekvenser<br />
mv. Disse ressourcer vil blive opmærket med lingvistisk og<br />
anden information ved hjælp af automatiske værktøjer. Opmærkningerne<br />
gør det muligt at fi nde og kombinere resultater på helt<br />
nye måder. Det betyder at DK-CLARIN vil støtte forskerne på hidtil<br />
usete måder og give adgang til nye forskningsresultater inden for<br />
sprogvidenskab, litteratur, historie mv. Hertil kommer, at de sprogressourcer,<br />
der bliver indsamlet, produceret og gjort tilgængelige<br />
på denne måde, kan bruges som basismateriale i sprogteknologiske