13.07.2015 Views

pdf ke stažení - Ústav českého jazyka a teorie komunikace

pdf ke stažení - Ústav českého jazyka a teorie komunikace

pdf ke stažení - Ústav českého jazyka a teorie komunikace

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Kdo začal , má hotovou půlku .Horatius (Listy)CLARA: Corpus Linauae Arabicae a prOblém,poCítaCového zpracování arabitin,Arabština představuje pro počitačové zpracování textů zvláštní problém.Tento problém tkvi především ve způsobu záznamu arabštiny - arabské písmo(podobné jako některá další písma použivaná pro semitské jazyky, např.hebrejštinu) totiž v naprosté většině nevyznačuje krátké samohlásky, i kdyžpro jejich vyjádření existují příslušné symboly, a další značky užívané projednoznačné určení textu, jako značka pro zdvojení, pádové koncovky apod.,se v textu objevují jen zřídka. Tyto značky se obvykle objevují v případě , žeautor chce usnadnit čtení textu či chce zdůraznit některý gramatický jev. Plněvokalizovaný text (tj. text obsahující vyznačení samohlásek a všech dalšíchjevů, jako je zdvojení, neurčité členy, pádové koncovky apod.) se objevuje jenvelmi zřídka, především v případě kanonických textů (Korán, Bible) nebo knihpro děti (slabikáře, pohádky pro nejmenší). Pro čtení textu je tedy třeba znátjazyk, a to jak jeho gramatiku, tak i významy jednotlivých slov, která se ve větěvyskytuji.Příklad :Věta s plnou vokalizací:kataba 'l-mu 'allifa riwájatan'napsal (ten) spisovatel román(spisovatel napsal román)Tatáž věta bez vokalizace:krb 'lm '/f rwájtJe poměrně obtížné stanovit přesně poměr grafémů tzv. vokalizovaného textu(tj. textu s vyznačením samohlásek a dalších jevů, např. zdvojeni souhlásky),protože arabština, jejíž spisovná forma je značně odlišná od tzv. arabskýchdialektů, kterými se hovoří v jednotlivých zemích, připouští ještě i tzv.substandardní normu, kterou je možno charakterizovat jako jakousi zjednodušenouformu <strong>jazyka</strong>. Tato norma se vyznačuje především tím, že i v mluvenéformě často vypouští především pádové koncovky a neurčitý člen - totovypouštění pak bývá nahrazováno pevnějším pořád<strong>ke</strong>m slov, který jinak vespisovné arabštině může být relativně volný. Nicméně při konfrontaci čistě82

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!