18.07.2013 Views

Korpus 2000 ? til hvilken nytte? - Det Danske Sprog- og ...

Korpus 2000 ? til hvilken nytte? - Det Danske Sprog- og ...

Korpus 2000 ? til hvilken nytte? - Det Danske Sprog- og ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

de altså andelen af genitivformer – blandt samtlige substantiviske former i hele<br />

korpus – et forhold, som Elbro i øvrigt udtrykkeligt anfører.<br />

2.3. Kollokation<br />

K<strong>2000</strong>-systemet kan vise både hyppige <strong>og</strong> typiske kollokater (“naboer”) <strong>til</strong> ord.<br />

Hyppige kollokater giver oplysninger om et ords funktionelle kombinatoriske<br />

egenskaber, fx hvilke præpositioner de hyppigt optræder sammen med. Hyppige<br />

kollokater bestemmes ganske enkelt ved at tælle, hvilke ord der hyppigst optræder<br />

i den umiddelbare omgivelse af det ord, man undersøger. De otte hyppigste<br />

kollokater <strong>til</strong> venstre for lemmaet debat i K90 er eksempelvis en, i, den, <strong>til</strong>,<br />

offentlige, <strong>og</strong>, den <strong>og</strong> under. Typiske kollokater derimod bestemmes vha. en<br />

statistisk metode, mutual information, 11 <strong>og</strong> fremhæver ord, der især <strong>til</strong>trækkes<br />

af det undersøgte ord, men ikke i nær samme grad af det overvejende flertal af<br />

andre ord i korpus. Resultatet er et indtryk af ordets semantiske kombinatoriske<br />

egenskaber – de ti mest typiske kollokater <strong>til</strong> venstre for lemmaet debat i K<strong>2000</strong><br />

er heftig, følelsesladet, offentlig, saglig, folkelig, livlig, konstruktiv <strong>og</strong> heftige.<br />

Kollokater vises i K<strong>2000</strong>-systemet som tabeller med fire kolonner: én for<br />

hhv. højre- <strong>og</strong> venstrekollokater for hvert af de to korpusser. Kollokaterne er<br />

sorteret i faldende orden efter antal samforekomster (hyppighed) eller efter<br />

deres mutual information score (typiskhed). Både antal samforekomster samt<br />

scoren udtrykkes ikke som absolutte talværdier, men omregnes <strong>til</strong> et antal prikker<br />

(1-5), der synes bedre egnet <strong>til</strong> at visualisere kollokaters ‘tyngde’. Figur 2<br />

viser som eksempel de typiske kollokater for lemmaet terrorist.<br />

Figur 2. Typiske kollokater for terrorist<br />

Oversigten i figur 2 kan fortolkes på følgende måde: et af de træk ved terrorist,<br />

11<br />

Jf. Church&Hanks (1989) eller Church et al. (1991). I K<strong>2000</strong>-systemet er mutual<br />

information modificeret med en række filtre, der bl.a. reducerer statistisk støj, jf.<br />

Asmussen (under udgivelse).<br />

STU DIE R I NORDISK 2002-2003 23

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!