Korpus 2000 ? til hvilken nytte? - Det Danske Sprog- og ...
Korpus 2000 ? til hvilken nytte? - Det Danske Sprog- og ...
Korpus 2000 ? til hvilken nytte? - Det Danske Sprog- og ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
I det følgende afsnit gives eksempler på en række sammenlignende undersøgelser,<br />
man kan foretage på de to korpusser, <strong>og</strong> mulige fortolkninger af<br />
resultaterne drøftes.<br />
2. Sammenlignende undersøgelser <strong>og</strong> fortolkningen af resultater<br />
Søger man på enkeltord i K<strong>2000</strong>-systemet, vises hyppigheder <strong>og</strong> kollokater i<br />
kontrastive oversigter for K<strong>2000</strong> <strong>og</strong> K90, der muliggør en umiddelbar sammenligning<br />
af ords udbredelse <strong>og</strong> kollokationelle egenskaber i de to korpusser. Således<br />
får brugeren straks et indtryk af de forandringer, der måtte være sket inden<br />
for ordforråd, bøjning <strong>og</strong> kombinatorik/semantik i løbet af den tid, der ligger<br />
mellem udarbejdelsen af de to korpusser. Ulempen ved den kontrastive<br />
præsentation af undersøgelsesresultater er, at brugeren let kan forledes <strong>til</strong> at<br />
drage uhensigtsmæssige slutninger, der giver et forvrænget billede af formodede<br />
spr<strong>og</strong>lige forandringer.<br />
2.1. Ordforråd<br />
En sammenligning af alle ords hyppigheder i K<strong>2000</strong> <strong>og</strong> K90 viser ikke overraskende,<br />
at n<strong>og</strong>le ord forekommer betydeligt oftere i det ene korpus end i det<br />
andet. Hvis man antager, at begge korpusser afspejler deres tids danske spr<strong>og</strong>brug,<br />
altså K90 spr<strong>og</strong>brugen i perioden 1983-1992 <strong>og</strong> K<strong>2000</strong> spr<strong>og</strong>brugen i<br />
perioden 1998-2002, så kan man med en vis rimelighed fortolke hyppighedsforskelle<br />
som forskelle i udbredelsen af de pågældende ord i dansk som helhed.<br />
Figur 1 nedenfor viser, hvordan hyppighederne for formerne af substantivet<br />
regn oplyses i brugerinterfacet: første søjle oplister samtlige mulige bøjningsformer<br />
af lemmaet, anden søjle oplister hver forms hyppighed i K<strong>2000</strong> <strong>og</strong> tredje<br />
søjle de <strong>til</strong>svarende hyppigheder i K90. I nederste række står hyppighederne for<br />
hele lemmaet regn, dvs. summen af alle dets forskellige former. 8 Hyppighederne<br />
oplyses ikke i absolutte tal, men som l<strong>og</strong>aritmiske størrelser i form af mellem<br />
0 <strong>og</strong> 7 røde (på figuren mørke) prikker. Fordelen ved at udtrykke hyppigheden<br />
som en af otte mulige hyppighedsklasser er, at måske <strong>til</strong>fældigt betingede forskelle<br />
i et ords hyppighed i de to korpusser udviskes <strong>til</strong> en vis grad <strong>og</strong> risikoen<br />
for at brugeren fejlfortolker hyppighedsoplysningerne følgelig mindskes n<strong>og</strong>et.<br />
8 <strong>Det</strong> glade ansigt viser, at lemmaets stavning er i overensstemmelse med<br />
Retskrivningsordb<strong>og</strong>ens normering. Hyppighedstabellerne kan <strong>og</strong>så indeholde former <strong>og</strong><br />
stavemåder, der afviger fra den officielle norm – de vil da være markeret med et vredt<br />
ansigt.<br />
STU DIE R I NORDISK 2002-2003 19