Vejledning til det danske Parole-korpus - Det Danske Sprog- og ...
Vejledning til det danske Parole-korpus - Det Danske Sprog- og ...
Vejledning til det danske Parole-korpus - Det Danske Sprog- og ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
6.3.3 Forkortelser 54<br />
6.3.4 Sammenskrivning 55<br />
6.3.5 Udenlandske sted- <strong>og</strong> indbyggerbetegnelser 55<br />
6.3.6 <strong>Danske</strong> ord af udenlandsk oprindelse 56<br />
7. LITTERATURLISTE 57<br />
8. APPENDIKS 59<br />
8.1 Fordeling af tekstord <strong>og</strong> ordtyper på ordklasser 59<br />
8.2 Fortegnelse over samtlige værdier i <strong>det</strong> <strong>danske</strong> PAROLE-tagsæt 60<br />
8.3 Antal forekomster af de forskellige morfosyntaktiske analyser i PAROLE-<strong>korpus</strong>set 62<br />
8.4 Fortegnelse over koderne <strong>til</strong> <strong>korpus</strong>teksternes klassifikation ifølge medium, genre <strong>og</strong> emne 63<br />
8.4.1 Medium 63<br />
8.4.2 Genre 64<br />
8.4.3 Emne 65<br />
8.5 Samlet oversigt over flerordsforbindelser i PAROLE-<strong>korpus</strong>set 66<br />
8.5.1 Gruppesammensætninger 66<br />
8.5.2 Forkortelser 66<br />
8.5.3 Faste ordforbindelser 66<br />
8.5.4 Fossilerede dativer/genitiver 67<br />
8.5.5 An<strong>det</strong> 67<br />
FIGURLISTE:<br />
Figur 1: Opbygning af de forskellige PAROLE-korpora 5<br />
Figur 2: Korpussamarbej<strong>det</strong>s forløb 5<br />
Figur 3: Eksempler på DAN-TWOL-analyser (fra Bilgram & Keson, 1998) 7<br />
Figur 4: <strong>Det</strong> <strong>danske</strong> PAROLE-tagsæt 8<br />
Figur 5: Tre eksempler på morfosyntaktisk taggede tekstord 8<br />
Figur 6: PAROLE-<strong>korpus</strong>sets SGML-opmarkerede struktur 10<br />
Figur 7: PAROLE-<strong>korpus</strong>hove<strong>det</strong> 11<br />
Figur 8: Et PAROLE-teksthoved 11<br />
Figur 9: SGML-koder inde i de taggede tekster 12<br />
Figur 10: Resultat af DAN-TWOL-tokeniserens ordinddeling 13<br />
Figur 11: Interpunktionstegn <strong>og</strong> symboler (samt '&'-tegnet) 14<br />
Figur 12: Fordeling af ordklasser i <strong>det</strong> morfosyntaktisk taggede <strong>korpus</strong> 18<br />
Figur 13: Ikke-underspecificeret markering af transkategorisering af participier 32<br />
Figur 14: Interpunktionstegn 47<br />
3