PDF-fil. - Det Danske Sprog- og Litteraturselskab
PDF-fil. - Det Danske Sprog- og Litteraturselskab
PDF-fil. - Det Danske Sprog- og Litteraturselskab
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
¦ <br />
forholdsvist simpelt tagsæt – ingen lægfolk kan forventes at have tålmodighed til f.eks.<br />
at sætte sig ind i PAROLE-tagsættet 8 .<br />
For at kunne anvende korpusset til f.eks. sætningsanalyse skal det yderligere tagges på<br />
sætningsniveau - syntaktisk tagging. Den morfosyntaktiske tagging danner grundlaget<br />
for en sådan annotering af teksterne, der giver brugeren et overblik over de syntaktiske<br />
forhold ordene imellem. Dermed bliver det muligt at søge på syntaktiske funktioner.<br />
Endvidere ville det være optimalt med semantisk tagging, således at det fremgår af<br />
opmærkningen, hvilken betydning hom<strong>og</strong>rafer som f.eks. kost eller bank skal tillægges i<br />
de enkelte tilfælde.<br />
De interviewede lagde vægt på, at forkerte former eller ukorrekt spr<strong>og</strong>brug skal fremgå<br />
af taggingen, så det tydeliggøres for brugeren, at der er tale om ikke-normeret dansk.<br />
Korpus 2000 er som alle andre korpora deskriptivt, således at det afspejler den aktuelle<br />
spr<strong>og</strong>brug <strong>og</strong> dermed ikke nødvendigvis spr<strong>og</strong>normen. At der således ikke kritikløst kan<br />
sættes lighedstegn mellem teksteksemplerne <strong>og</strong> grammatikalitet, bør ifølge de<br />
interviewede fremhæves over for brugeren.<br />
Tags øger værdien af et korpus 9 , men samtidigt mindskes den umiddelbare læsbarhed af<br />
teksteksemplerne. Derfor ville det efter de interviewedes mening være optimalt, hvis<br />
man enten kunne vælge at skjule de forskellige tags eller alternativt arbejde med to<br />
versioner af korpusset – en tagget <strong>og</strong> utagget.<br />
Muligheden for at vælge til <strong>og</strong> fra blev der lagt stor vægt på i interviewene. Da for<br />
mange valg kan forvirre <strong>og</strong> føles overvældende 10 , blev det påpeget, at det er mest<br />
hensigtsmæssigt at arbejde ud fra et princip om tilvalg, således at brugeren ikke fra<br />
starten skal tage stilling til en mængde søgemuligheder, men kan starte bredt med at<br />
8<br />
Keson, Britt, Vejledning til det danske morfosyntaktisk taggede PAROLE-korpus. <strong>Det</strong> <strong>Danske</strong> <strong>Spr<strong>og</strong></strong><strong>og</strong><br />
<strong>Litteraturselskab</strong>, København.<br />
9<br />
Garside, R<strong>og</strong>er, Leech, Geoffrey <strong>og</strong> McEnery, Tony, ibid, s. 2.<br />
10<br />
Hackos, JoAnn T., <strong>og</strong> Stevens, Dawn M., Standards for Online Communication: Publishing<br />
Information for The Internet/World Wide Web/Help Systems/Corporate Intranets, s. 34-36. John<br />
Wiley & Sons, Inc., New York 1997.<br />
¤