18.07.2013 Views

Korpus 2000 ? til hvilken nytte? - Det Danske Sprog- og ...

Korpus 2000 ? til hvilken nytte? - Det Danske Sprog- og ...

Korpus 2000 ? til hvilken nytte? - Det Danske Sprog- og ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

I det følgende afsnit gives eksempler på en række sammenlignende undersøgelser,<br />

man kan foretage på de to korpusser, <strong>og</strong> mulige fortolkninger af<br />

resultaterne drøftes.<br />

2. Sammenlignende undersøgelser <strong>og</strong> fortolkningen af resultater<br />

Søger man på enkeltord i K<strong>2000</strong>-systemet, vises hyppigheder <strong>og</strong> kollokater i<br />

kontrastive oversigter for K<strong>2000</strong> <strong>og</strong> K90, der muliggør en umiddelbar sammenligning<br />

af ords udbredelse <strong>og</strong> kollokationelle egenskaber i de to korpusser. Således<br />

får brugeren straks et indtryk af de forandringer, der måtte være sket inden<br />

for ordforråd, bøjning <strong>og</strong> kombinatorik/semantik i løbet af den tid, der ligger<br />

mellem udarbejdelsen af de to korpusser. Ulempen ved den kontrastive<br />

præsentation af undersøgelsesresultater er, at brugeren let kan forledes <strong>til</strong> at<br />

drage uhensigtsmæssige slutninger, der giver et forvrænget billede af formodede<br />

spr<strong>og</strong>lige forandringer.<br />

2.1. Ordforråd<br />

En sammenligning af alle ords hyppigheder i K<strong>2000</strong> <strong>og</strong> K90 viser ikke overraskende,<br />

at n<strong>og</strong>le ord forekommer betydeligt oftere i det ene korpus end i det<br />

andet. Hvis man antager, at begge korpusser afspejler deres tids danske spr<strong>og</strong>brug,<br />

altså K90 spr<strong>og</strong>brugen i perioden 1983-1992 <strong>og</strong> K<strong>2000</strong> spr<strong>og</strong>brugen i<br />

perioden 1998-2002, så kan man med en vis rimelighed fortolke hyppighedsforskelle<br />

som forskelle i udbredelsen af de pågældende ord i dansk som helhed.<br />

Figur 1 nedenfor viser, hvordan hyppighederne for formerne af substantivet<br />

regn oplyses i brugerinterfacet: første søjle oplister samtlige mulige bøjningsformer<br />

af lemmaet, anden søjle oplister hver forms hyppighed i K<strong>2000</strong> <strong>og</strong> tredje<br />

søjle de <strong>til</strong>svarende hyppigheder i K90. I nederste række står hyppighederne for<br />

hele lemmaet regn, dvs. summen af alle dets forskellige former. 8 Hyppighederne<br />

oplyses ikke i absolutte tal, men som l<strong>og</strong>aritmiske størrelser i form af mellem<br />

0 <strong>og</strong> 7 røde (på figuren mørke) prikker. Fordelen ved at udtrykke hyppigheden<br />

som en af otte mulige hyppighedsklasser er, at måske <strong>til</strong>fældigt betingede forskelle<br />

i et ords hyppighed i de to korpusser udviskes <strong>til</strong> en vis grad <strong>og</strong> risikoen<br />

for at brugeren fejlfortolker hyppighedsoplysningerne følgelig mindskes n<strong>og</strong>et.<br />

8 <strong>Det</strong> glade ansigt viser, at lemmaets stavning er i overensstemmelse med<br />

Retskrivningsordb<strong>og</strong>ens normering. Hyppighedstabellerne kan <strong>og</strong>så indeholde former <strong>og</strong><br />

stavemåder, der afviger fra den officielle norm – de vil da være markeret med et vredt<br />

ansigt.<br />

STU DIE R I NORDISK 2002-2003 19

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!