SLAVNI pllEDCIIŮDCI tESKÉHO NÁRODNIHO KORPUSU VII. Mezi· neprávem zapomenuté milníky české korpusové historie patři skutečnost, žejiž v roce 1933 byl v rámci vytváření nástrojů pro plně elektrifikovanýkorpus Křižík uveden do provozu první automatický slovnědruhový třidič . Nanákresu je zřetelně vidět jednak srdce celého zařízení , tvořené šesti komorovýmsystémem pro tříděni slov do slovních druhů, jednak pravostranný vstup proneurčené jednotky (input) a o něco níže znázorněný výstup pro jednotkyslovnědruhově určené (output). Na třidiči z roku 1933 je dodnes oceňovánapřímočarost, s níž odrážel stav lingvistického poznáni, resp. ochotu lingvistůshodnout se na slovnědruhové interpretaci řady pomezních případů . Přístrojvycházel ze zásady, že při třídění není třeba se řídit apriorními lingvistickýmikritérii, vedoucími nevyhnutelně k řadě sporů, a třídil slova podle tzv.ekviprobabilitní gramatiky odvozené z metody Monle Carlo: do každé komoryreprezentující slovní druh (počet šcsti komor, a tedy i §esti slovních druhů bylzvolen z čistě konstrukčních důvodů) připadla vždy prakticky přesně §estinatřiděných slovnich jednotek a zdůvodnění, proč příslušné výskyty slov bylyzařazeny právě do jednotlivých slovnědruhových komor, bylo ponecháno nanásledné lingvistické interpretaci. Koncepce třidiče realisticky počítala s tím,že schopný lingvista dokáže konkrétní výsledky ekviprobabilitního tříděnípřesvědčivě zdůvodnit, a účinnost tohoto přístupu se skutečně ukázala jakoneobyčejně vysoká (pohybovala se mezi 99,893 a 99,998 'Vo).Karel Kučera
teský národnl korpus a lexikální archl,Ústllu pro jazyk teský , PrazeNad prací nMich předků se nám občas tají dech. Dívám se na fotografiedůstojnýc h pánů. kteří v roce 1906 pojali myšlenku, že kulturně jazyková situacečeštiny dospěla tak daleko, že je nezbytné lexikograficky zpracovat moderníslovní zásobu. Celou věc inicioval lingvista František Pastrnek spolu s lingvistyEmilem Smetánkou a Josefem Zubatým. Ustavili v roce 1906 Lexikografickoua dialektologickou komisi III. třídy Akademie a začali přípravné práce na tezauru<strong>českého</strong> <strong>jazyka</strong>. Navštívili Mnichov, vyžádali si informace z Krakova,Bělehradu , Záhřebu a Petrohradu a poučili se o švédském slovníku.Již v roce 1911 byla založena Kancelář Slovníku <strong>jazyka</strong> <strong>českého</strong> a začalypráce na budování archívu. Tehdy vznikla první excerpční pravidla. Excerpcezahrnovala literaturu od roku 1770. Exc.rpčnílistek obsahoval v záhlaví slovo,kterého se výpis týkal, ve slovníkovém tvaru, byl uveden slovní druh, vazbanebo spojení, ve kterém se slovo vyskytovalo, kontext, dostatečně široký, abyz něho byl význam slova jasný, slovo, které bylo v záhlaví, bylo v kontextupodtržené, dole byl uveden zdroj, ve kterém bylo slovo nalezeno. O každémexcerpovaném díle byl veden speciální záznam, tzv. zrcadlo, kde byly uvedenyvšechny bibliografické údaje. Zpočátku byly excerpční lístky psané rukou,později na psacím stroji. Na excerpci se podílelo velké množstvi dobrovolnýchexcerptorů, z velké části to byli středoškolští profesotí a učitelé, kteří pracovaliv různých místech republiky. Naše řeč občas uváděla přehledy vykonané práce.Ukázka z Naší řeéi z rolru 1935Z Kum 'tláře Slovníkujatyka teslcěhoOd I. ledna do 31. prosince byly zpracovány .y.o tikoly: I. Spisy z r. 1834 (exccrpovalJaroslavPoch, profesor v Praze, Ii •• kd 3635). 2. Spisy AI. Jiraska (exc. Jarosl. Svoboda. lič . adjunk. fin .led. v Bn.islavě,listkd 10513). 3. Li.erámi lisly z 1881 až 1887 (exc. Jos. Soukup. uf. zems<strong>ke</strong>hoúf. v Prau, lIstkd 3598). 4. Spisy K. V. Raise (exc. dr. AI. Získal, prof. v Praze, lislkd 16000). 5.NIŮe dobo (exc. Jos. Franc, r.di.el Rálky v Olomouci, Ustkd 13221). 6. Spisy Ter. Novákové(exc. Marie Holubová, prof. v HradiAťk.u u Kolína. lístktl3558). 7. Spisy 1. Liera (exc. Jarosl.Malý, úl. knihovny Akad. domu v Praze. Hstkia 471). 8. Spisy Josefa Holečka (exc. MarieRylánková, chol' profesan v B~, lístkd 7018). 9. V. Mr!lík, Zumfi (exc. Ant Ucha, prof. v~ , listkd 3560). 10. Spisy V. S.echa(exc. lor .. Vym ... lovi, prof.v.v. v Cery. Kos.elci,lis'kd5200). II . Spisy B. Ben~Jové . M. Majerové. M. Pujmanové. R. Svobodové (exc. Pfem. Hájek.prof. v Pnu, Iislkd 7396)75
- Page 1 and 2:
čeština doma a ve světěROČNíK
- Page 3 and 4:
ČEŠTINADOMA A VE SVĚTĚ .Téma C
- Page 5 and 6:
POHLED DO KORPUSUIslandY prvním od
- Page 7 and 8:
ulička (2164)holčička (1974)=ahr
- Page 9 and 10:
sebou jakási pomyslná políčka a
- Page 11 and 12:
pouze se odlišuje tvarově "jemnos
- Page 13 and 14:
SLAVNI PŘEDCHŮDCI ČESKÉHO NÁRO
- Page 15 and 16:
méně časlo) v roce 1991 speciál
- Page 17 and 18:
jako jsem uvedla na začátku tohot
- Page 19 and 20:
helma. Znamená 10, že helma a př
- Page 21 and 22:
lidi, zemí fjordů (i když toto o
- Page 23 and 24: 10. zajisté 8.432 1.727 0.2188 3II
- Page 25 and 26: použita pouze dvěma různými aut
- Page 27 and 28: POHLED NA JAZYKKonferenceStaré zn
- Page 29 and 30: km!!erence je slovo organizace nazn
- Page 31 and 32: jako jedinečn) ' softwarový produ
- Page 33 and 34: kompromis a koupila si boloňského
- Page 35 and 36: směřují vpravo, ale našinec si
- Page 37 and 38: ,,rimejkaci" (ta je nám neústrojn
- Page 39 and 40: napřed jít a vyměřit ho. A to b
- Page 41 and 42: charakteru. Vytčený se téměř n
- Page 43 and 44: o nesouhlas s ním. Kontexty nachá
- Page 45 and 46: JazYková poradna. korpus a interne
- Page 47 and 48: SLAVNI PŘEDCHŮDCI CESKÉHO NARODN
- Page 49 and 50: Další skupínu tvoři slova zakon
- Page 51 and 52: Následující ukázky studentskýc
- Page 53 and 54: ~Id a dlbll na materiálu CNIČert
- Page 55 and 56: V současných slovnících - SSČ
- Page 57 and 58: do jedenáctiletkydo přednášekdo
- Page 59 and 60: ukládání dat dodnes nepřekonan
- Page 61 and 62: celistvá podoba se nazývá dokume
- Page 63 and 64: spojitelnosti jsou velmi cenné. Ne
- Page 65 and 66: ženy: tvar=ženy. lemma=žena, slo
- Page 67 and 68: a angličtiny -jazyk s poměrně ve
- Page 69 and 70: Tato předložka jednoznačně vyž
- Page 71 and 72: důležitou složkou celé koncepce
- Page 73: • identifikací větných členů
- Page 77 and 78: 3. materiál - 1945-1964 - obsahuje
- Page 79 and 80: SVN2000. Vzhledem k nutnosti manuá
- Page 81 and 82: ámec prostého srovnávání pomě
- Page 83 and 84: nevokalizovaného textu s textem pl
- Page 85 and 86: Je však nutno konstatovat, že tat
- Page 87 and 88: yly informace dostupné, jsou zařa
- Page 89 and 90: I V tomto článku použlváOle zje
- Page 91 and 92: v textu o léčení v 18. století)
- Page 93 and 94: c) podstatná jména, slovesa, př
- Page 95 and 96: 19. Který měsíc má nejvíce vý
- Page 97 and 98: Vyhodnocení:: A B C DI. O I 3 I2.
- Page 99 and 100: a 2690157se 1997092v I 836848na I 5
- Page 101 and 102: o 660813do 621814klke 523095pro 401
- Page 103 and 104: a v jazyce se s nimi prakticky nese
- Page 105 and 106: Slovensko 20353Francie 16591Polsko
- Page 107 and 108: o třiaosmdesát let později. Podo
- Page 109 and 110: které zahrnuje předev§ím příj
- Page 111 and 112: 4 1038265 85077O 845777 6622610 633
- Page 113 and 114: jeden 211 586dva 153 114tři86 III
- Page 115 and 116: 22. Která denní hodina je v korpu
- Page 117 and 118: Asi vám nebude známý posledni ti
- Page 119 and 120: 27. Sefaďte následující adjekti
- Page 121 and 122: Za Jakých podmlnek můžete pracov
- Page 123: Chodit do. chodit na (Miroslava Kaz