18.07.2013 Views

Korpus 2000 ? til hvilken nytte? - Det Danske Sprog- og ...

Korpus 2000 ? til hvilken nytte? - Det Danske Sprog- og ...

Korpus 2000 ? til hvilken nytte? - Det Danske Sprog- og ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

der d<strong>og</strong> så alligevel er præget af <strong>til</strong>fældigheder <strong>og</strong> unøjagtigheder i en grad, så<br />

man er henvist <strong>til</strong> sin egen spr<strong>og</strong>lige intuition, når man skal vurdere undersøgelsesresultaterne.<br />

Problemet er d<strong>og</strong> næppe brugen af et korpus som sådan, men<br />

snarere de metoder, man lægger <strong>til</strong> grund for korpusbaserede undersøgelser i<br />

almindelighed <strong>og</strong> for sammenlignende undersøgelser i særdeleshed.<br />

En grundlæggende metodisk vanskelighed ved korpusbaserede spr<strong>og</strong>undersøgelser<br />

er muligheden for at kvantificere spr<strong>og</strong>lige fænomener, mens traditionelle<br />

spr<strong>og</strong>undersøgelser ofte tager udgangspunkt i en kvalitativ beskrivelse af<br />

et bestemt spr<strong>og</strong>ligt fænomen, som man – måske <strong>til</strong>fældigt – er stødt på. Undersøgelsens<br />

fokus forskydes altså i korpusbaserede undersøgelser let fra en<br />

beskrivelse af hvad man ser, <strong>til</strong> en beskrivelse af, hvor meget man ser – hvor<br />

idealet måske burde være en kombination: både beskrivelsen af et fænomen <strong>og</strong><br />

dets måske skiftende udbredelse.<br />

Her<strong>til</strong> kommer, at de forekomsttal, man umiddelbart ser ved sammenligningen<br />

af to korpusser, ikke nødvendigvis er sammenlignelige. I den fysiske verden<br />

er det for de fleste evident, at én kilometer er mere end ti kilometer, men om én<br />

kilometer er meget eller lidt, afhænger <strong>og</strong>så af den kontekst, hvori mængedeangivelsen<br />

bliver brugt. Ti kilometer kan således være en ganske betragtelig<br />

vejlængde, hvis den skal <strong>til</strong>bagelægges <strong>til</strong> fods, mens den samme vejlængde<br />

<strong>til</strong>bagelagt i bil er knapt så imponerende. Ganske <strong>til</strong>svarende gælder for de<br />

forekomsttal, man finder i et korpus: de giver ingen mening i sig selv, men kun<br />

i forhold <strong>til</strong> n<strong>og</strong>et andet, indenfor en kontekst – det er således ganske intetsigende,<br />

at konstatere at mand har 1.936 genitivformer i K90 mod 1.606 i K<strong>2000</strong>, når<br />

man ikke i det mindste sætter disse tal i forhold <strong>til</strong>, hvor mange forekomster<br />

lemmaet mand har i de to korpusser: gør man det, finder man, at andelen af<br />

genitivformer for lemmaet mand er 2,0% i begge korpusser. Med andre ord kan<br />

forekomsttal aldrig tages for pålydende i korpusundersøgelser, <strong>og</strong> for hver type<br />

undersøgelse kræves der en række metodiske overvejelser, inden man giver sig<br />

<strong>til</strong> at konkludere. Som K<strong>2000</strong>'s søgesystem er opbygget nu, får brugeren i virkeligheden<br />

ikke megen metodisk hjælp – det overlades i vid udstrækning <strong>til</strong> brugeren<br />

selv at fortolke de kvantitative resultater hensigtsmæssigt. Så selvom sigtet<br />

med K<strong>2000</strong>'s webbaserede søgesystem var, at gøre det let for enhver spr<strong>og</strong>interesseret<br />

af lave sine egene spr<strong>og</strong>lige undersøgelser, bidrager grænsefladen<br />

ikke <strong>til</strong> at minimere metodiske fejlgreb – en ulempe, som fremtidige versioner<br />

af grænsefladen bør råde bod på.<br />

Her<strong>til</strong> kommer så spørgsmålet, hvad sammenlignelighed af korpusser egentlig<br />

vil sige. K90's <strong>og</strong> K<strong>2000</strong>'s sammensætning er <strong>til</strong>stræbt identiske, men i<br />

praksis, dvs. i de viste eksempler, er der n<strong>og</strong>et, der tyder på, at sammensætningen<br />

ikke kan være så identisk endda. <strong>Det</strong> gælder først <strong>og</strong> fremmest forskelle i<br />

udbredelsen af bestemte lemmaer, som man intuitivt skulle mene havde en<br />

STU DIE R I NORDISK 2002-2003 27

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!