Počítačové zpracování přirozeného jazyka
Počítačové zpracování přirozeného jazyka
Počítačové zpracování přirozeného jazyka
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
typické dvoucestné komunikace mezi lidmi. To dovedou do jisté míry systémy<br />
pro porozumění PJ, které by pak mohly mít jako vstup právě výstup<br />
z rozpoznávače řeči.<br />
2.1 Roviny analýzy <strong>jazyka</strong><br />
Systémy pro <strong>zpracování</strong> PJ se neobejdou bez potřebných znalostí o vlastní<br />
struktuře <strong>jazyka</strong>, musí v nich být zabudovány znalosti o tom:<br />
• – co jsou slova (slovní tvary a jejich složky – morfémy),<br />
• – jak se slova (větné složky) kombinují do vět,<br />
• – co slova označují, jaké jsou jejich významy,<br />
• – jak se význam věty skládá z významů slov a slovních spojení (větných<br />
složek).<br />
To však ještě nestačí – inteligentní jazykové chování uživatele <strong>jazyka</strong> – člověka<br />
(dále UJ) se opírá o obecnou (encyklopedickou) znalost světa a jeho inferenční<br />
schopnosti a také o znalost komunikační situace a komunikačního kontextu a<br />
pravidel, podle nichž se komunikační procesy řídí.<br />
I když to, co jsme právě uvedli, vypadá na první pohled celkem jednoduše a<br />
samozřejmě, skutečnost je podstatně komplikovanější. Znalosti relevantní pro<br />
počítačové <strong>zpracování</strong> <strong>přirozeného</strong> <strong>jazyka</strong> (dále ZPJ) mají komplikovanou hierarchickou<br />
povahu, proto je obvyklé mluvit v této souvislosti o jednotlivých<br />
rovinách popisu, tj. o rovině:<br />
1. fonetické a fonologické – postihuje vztahy mezi zvuky a dalšími jednotkami<br />
(např. slabikami), z nichž se slova tvoří. Rozlišují se tu fonémy,<br />
což jsou nejmenší jednotky <strong>jazyka</strong> schopné rozlišit význam (např. m<br />
a t ve slovech máme a máte nebo m a n v tomu a tonu. Tyto a další<br />
znalosti jsou podstatné pro systémy založené na rozpoznávání mluvené<br />
řeči,<br />
2. morfologické – popisuje, jak se slova skládají ze základnějších jednotek<br />
nazývaných morfémy. Jsou to nejmenší jednotky <strong>jazyka</strong>, které mohou<br />
nést význam. To lze demonstrovat na příkladech segmentace výrazů<br />
jako nej-ne-u-věř-i-t-eln-ějš-ího, uč-e-n-í, v nichž rozlišujeme jednotky<br />
jako kořeny, kmeny, kmenotvorné přípony, prefixy, sufixy, koncovky. Ve<br />
11