13.07.2015 Views

pdf ke stažení - Ústav českého jazyka a teorie komunikace

pdf ke stažení - Ústav českého jazyka a teorie komunikace

pdf ke stažení - Ústav českého jazyka a teorie komunikace

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

SLAVNI pllEDCIIŮDCI tESKÉHO NÁRODNIHO KORPUSU VII. Mezi· neprávem zapomenuté milníky české korpusové historie patři skutečnost, žejiž v roce 1933 byl v rámci vytváření nástrojů pro plně elektrifikovanýkorpus Křižík uveden do provozu první automatický slovnědruhový třidič . Nanákresu je zřetelně vidět jednak srdce celého zařízení , tvořené šesti komorovýmsystémem pro tříděni slov do slovních druhů, jednak pravostranný vstup proneurčené jednotky (input) a o něco níže znázorněný výstup pro jednotkyslovnědruhově určené (output). Na třidiči z roku 1933 je dodnes oceňovánapřímočarost, s níž odrážel stav lingvistického poznáni, resp. ochotu lingvistůshodnout se na slovnědruhové interpretaci řady pomezních případů . Přístrojvycházel ze zásady, že při třídění není třeba se řídit apriorními lingvistickýmikritérii, vedoucími nevyhnutelně k řadě sporů, a třídil slova podle tzv.ekviprobabilitní gramatiky odvozené z metody Monle Carlo: do každé komoryreprezentující slovní druh (počet šcsti komor, a tedy i §esti slovních druhů bylzvolen z čistě konstrukčních důvodů) připadla vždy prakticky přesně §estinatřiděných slovnich jednotek a zdůvodnění, proč příslušné výskyty slov bylyzařazeny právě do jednotlivých slovnědruhových komor, bylo ponecháno nanásledné lingvistické interpretaci. Koncepce třidiče realisticky počítala s tím,že schopný lingvista dokáže konkrétní výsledky ekviprobabilitního tříděnípřesvědčivě zdůvodnit, a účinnost tohoto přístupu se skutečně ukázala jakoneobyčejně vysoká (pohybovala se mezi 99,893 a 99,998 'Vo).Karel Kučera

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!