23.07.2013 Views

Počítačové zpracování přirozeného jazyka

Počítačové zpracování přirozeného jazyka

Počítačové zpracování přirozeného jazyka

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

typické dvoucestné komunikace mezi lidmi. To dovedou do jisté míry systémy<br />

pro porozumění PJ, které by pak mohly mít jako vstup právě výstup<br />

z rozpoznávače řeči.<br />

2.1 Roviny analýzy <strong>jazyka</strong><br />

Systémy pro <strong>zpracování</strong> PJ se neobejdou bez potřebných znalostí o vlastní<br />

struktuře <strong>jazyka</strong>, musí v nich být zabudovány znalosti o tom:<br />

• – co jsou slova (slovní tvary a jejich složky – morfémy),<br />

• – jak se slova (větné složky) kombinují do vět,<br />

• – co slova označují, jaké jsou jejich významy,<br />

• – jak se význam věty skládá z významů slov a slovních spojení (větných<br />

složek).<br />

To však ještě nestačí – inteligentní jazykové chování uživatele <strong>jazyka</strong> – člověka<br />

(dále UJ) se opírá o obecnou (encyklopedickou) znalost světa a jeho inferenční<br />

schopnosti a také o znalost komunikační situace a komunikačního kontextu a<br />

pravidel, podle nichž se komunikační procesy řídí.<br />

I když to, co jsme právě uvedli, vypadá na první pohled celkem jednoduše a<br />

samozřejmě, skutečnost je podstatně komplikovanější. Znalosti relevantní pro<br />

počítačové <strong>zpracování</strong> <strong>přirozeného</strong> <strong>jazyka</strong> (dále ZPJ) mají komplikovanou hierarchickou<br />

povahu, proto je obvyklé mluvit v této souvislosti o jednotlivých<br />

rovinách popisu, tj. o rovině:<br />

1. fonetické a fonologické – postihuje vztahy mezi zvuky a dalšími jednotkami<br />

(např. slabikami), z nichž se slova tvoří. Rozlišují se tu fonémy,<br />

což jsou nejmenší jednotky <strong>jazyka</strong> schopné rozlišit význam (např. m<br />

a t ve slovech máme a máte nebo m a n v tomu a tonu. Tyto a další<br />

znalosti jsou podstatné pro systémy založené na rozpoznávání mluvené<br />

řeči,<br />

2. morfologické – popisuje, jak se slova skládají ze základnějších jednotek<br />

nazývaných morfémy. Jsou to nejmenší jednotky <strong>jazyka</strong>, které mohou<br />

nést význam. To lze demonstrovat na příkladech segmentace výrazů<br />

jako nej-ne-u-věř-i-t-eln-ějš-ího, uč-e-n-í, v nichž rozlišujeme jednotky<br />

jako kořeny, kmeny, kmenotvorné přípony, prefixy, sufixy, koncovky. Ve<br />

11

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!