18.07.2013 Views

Vejledning til det danske Parole-korpus - Det Danske Sprog- og ...

Vejledning til det danske Parole-korpus - Det Danske Sprog- og ...

Vejledning til det danske Parole-korpus - Det Danske Sprog- og ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

6.3.3 Forkortelser 54<br />

6.3.4 Sammenskrivning 55<br />

6.3.5 Udenlandske sted- <strong>og</strong> indbyggerbetegnelser 55<br />

6.3.6 <strong>Danske</strong> ord af udenlandsk oprindelse 56<br />

7. LITTERATURLISTE 57<br />

8. APPENDIKS 59<br />

8.1 Fordeling af tekstord <strong>og</strong> ordtyper på ordklasser 59<br />

8.2 Fortegnelse over samtlige værdier i <strong>det</strong> <strong>danske</strong> PAROLE-tagsæt 60<br />

8.3 Antal forekomster af de forskellige morfosyntaktiske analyser i PAROLE-<strong>korpus</strong>set 62<br />

8.4 Fortegnelse over koderne <strong>til</strong> <strong>korpus</strong>teksternes klassifikation ifølge medium, genre <strong>og</strong> emne 63<br />

8.4.1 Medium 63<br />

8.4.2 Genre 64<br />

8.4.3 Emne 65<br />

8.5 Samlet oversigt over flerordsforbindelser i PAROLE-<strong>korpus</strong>set 66<br />

8.5.1 Gruppesammensætninger 66<br />

8.5.2 Forkortelser 66<br />

8.5.3 Faste ordforbindelser 66<br />

8.5.4 Fossilerede dativer/genitiver 67<br />

8.5.5 An<strong>det</strong> 67<br />

FIGURLISTE:<br />

Figur 1: Opbygning af de forskellige PAROLE-korpora 5<br />

Figur 2: Korpussamarbej<strong>det</strong>s forløb 5<br />

Figur 3: Eksempler på DAN-TWOL-analyser (fra Bilgram & Keson, 1998) 7<br />

Figur 4: <strong>Det</strong> <strong>danske</strong> PAROLE-tagsæt 8<br />

Figur 5: Tre eksempler på morfosyntaktisk taggede tekstord 8<br />

Figur 6: PAROLE-<strong>korpus</strong>sets SGML-opmarkerede struktur 10<br />

Figur 7: PAROLE-<strong>korpus</strong>hove<strong>det</strong> 11<br />

Figur 8: Et PAROLE-teksthoved 11<br />

Figur 9: SGML-koder inde i de taggede tekster 12<br />

Figur 10: Resultat af DAN-TWOL-tokeniserens ordinddeling 13<br />

Figur 11: Interpunktionstegn <strong>og</strong> symboler (samt '&'-tegnet) 14<br />

Figur 12: Fordeling af ordklasser i <strong>det</strong> morfosyntaktisk taggede <strong>korpus</strong> 18<br />

Figur 13: Ikke-underspecificeret markering af transkategorisering af participier 32<br />

Figur 14: Interpunktionstegn 47<br />

3

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!