13.07.2015 Views

pdf ke stažení - Ústav českého jazyka a teorie komunikace

pdf ke stažení - Ústav českého jazyka a teorie komunikace

pdf ke stažení - Ústav českého jazyka a teorie komunikace

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

KOLEGOVÉ A PŘíZNIVCICeskj něroni kl"'as a ieho iaZYka'í zlaCko,ěniI. ÚvodNa konci října roku 2000 došlo na české lingvistické scéně k důležité události:byla ukončena první dlouhá etapa vývoje největšího <strong>českého</strong> lingvistickyzpracovaného zdroje jazykových dat - Ceského národního korpusu (ČNK) .Tento korpus počítačově uložených textů obsahující dnesjiž okolo 100 miliónůslovních tvarů má sloužit jako rozsáhlá reprezentativní databáze. které lze využítpro nejrůznější účely. Korpus je totiž zejména:základním východis<strong>ke</strong>m pro budování nového velkého slovníku současnéčeštinyzákladem pro tvorbu nejrůznějších jazykových příruček, učebnic a vědeckopopulámíchpublikací o češtiněstudnicí lingvistických dat pro teoretické studium současné psané češtiny:pro studium její morfologie, syntaxe. sémantiky, pragmatiky a dalších úrovnía aspektů jejího jazykového popisu.V tomto příspěvku se zaměřím na CNK z hlediska morfologického a syntaktickéhoa budu se zabývat jeho jazykovým značkováním, zejména pakznačkováním morfologickým.2. Jazykové zDalkováDlkorpusuJazykovým značkováním v širším smyslu rozumím obecně přidání lingvistickéinformace k surovému nebo dosud jazykově nezpracovanému textu alneboformální, explicitní zachyceni lingvistické informace, která je již v textupřítomna - každé jazykové značkování je tedy jistnu lingvistickou interpretacítextu, výrazem našeho pohledu na příslušný text. Toto značkování formálněvyjádřené tzv. značkami (ragy) má řadu podob podle toho,jaké informace chcemev korpusu mít a co chceme na jejich základě zkoumat. Základním typemznačkování je segmentace surového textu, \j . rozčlenění nějakého textu, jehož10

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!