18.07.2013 Views

PDF-fil. - Det Danske Sprog- og Litteraturselskab

PDF-fil. - Det Danske Sprog- og Litteraturselskab

PDF-fil. - Det Danske Sprog- og Litteraturselskab

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

¦ <br />

forholdsvist simpelt tagsæt – ingen lægfolk kan forventes at have tålmodighed til f.eks.<br />

at sætte sig ind i PAROLE-tagsættet 8 .<br />

For at kunne anvende korpusset til f.eks. sætningsanalyse skal det yderligere tagges på<br />

sætningsniveau - syntaktisk tagging. Den morfosyntaktiske tagging danner grundlaget<br />

for en sådan annotering af teksterne, der giver brugeren et overblik over de syntaktiske<br />

forhold ordene imellem. Dermed bliver det muligt at søge på syntaktiske funktioner.<br />

Endvidere ville det være optimalt med semantisk tagging, således at det fremgår af<br />

opmærkningen, hvilken betydning hom<strong>og</strong>rafer som f.eks. kost eller bank skal tillægges i<br />

de enkelte tilfælde.<br />

De interviewede lagde vægt på, at forkerte former eller ukorrekt spr<strong>og</strong>brug skal fremgå<br />

af taggingen, så det tydeliggøres for brugeren, at der er tale om ikke-normeret dansk.<br />

Korpus 2000 er som alle andre korpora deskriptivt, således at det afspejler den aktuelle<br />

spr<strong>og</strong>brug <strong>og</strong> dermed ikke nødvendigvis spr<strong>og</strong>normen. At der således ikke kritikløst kan<br />

sættes lighedstegn mellem teksteksemplerne <strong>og</strong> grammatikalitet, bør ifølge de<br />

interviewede fremhæves over for brugeren.<br />

Tags øger værdien af et korpus 9 , men samtidigt mindskes den umiddelbare læsbarhed af<br />

teksteksemplerne. Derfor ville det efter de interviewedes mening være optimalt, hvis<br />

man enten kunne vælge at skjule de forskellige tags eller alternativt arbejde med to<br />

versioner af korpusset – en tagget <strong>og</strong> utagget.<br />

Muligheden for at vælge til <strong>og</strong> fra blev der lagt stor vægt på i interviewene. Da for<br />

mange valg kan forvirre <strong>og</strong> føles overvældende 10 , blev det påpeget, at det er mest<br />

hensigtsmæssigt at arbejde ud fra et princip om tilvalg, således at brugeren ikke fra<br />

starten skal tage stilling til en mængde søgemuligheder, men kan starte bredt med at<br />

8<br />

Keson, Britt, Vejledning til det danske morfosyntaktisk taggede PAROLE-korpus. <strong>Det</strong> <strong>Danske</strong> <strong>Spr<strong>og</strong></strong><strong>og</strong><br />

<strong>Litteraturselskab</strong>, København.<br />

9<br />

Garside, R<strong>og</strong>er, Leech, Geoffrey <strong>og</strong> McEnery, Tony, ibid, s. 2.<br />

10<br />

Hackos, JoAnn T., <strong>og</strong> Stevens, Dawn M., Standards for Online Communication: Publishing<br />

Information for The Internet/World Wide Web/Help Systems/Corporate Intranets, s. 34-36. John<br />

Wiley & Sons, Inc., New York 1997.<br />

¤

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!