Daniel OlejÃ¡r, Martin Stanek: Ãvod do teÃ³rie kÃ³dovania

Úvod do teóriekódovaniaDaniel OlejárMartin Stanek24. augusta 2007

iThis book was developed during the project Thematic Network 114046-CP-1-2004-1-BG-ERASMUS-TNc○Daniel Olejár, 2007All rights reserved. No part of this publication may be reproduced, stored in a retrievalsystem, or transmitted, in any form or by any means, electronical, mechanical,photocopying, recording or otherwise, without the prior written permission of the author.Typeset by L A TEX2e.

Obsah1 Úvod 32 Základné pojmy a označenia 72.1 Abecedy, slová a jazyky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.2 Údaje, informácia a komunikácia . . . . . . . . . . . . . . . . . . . . . . . . 102.3 Kódovanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18I Kódovanie zdroja 213 Nerovnomerné kódy 233.1 Rozdelitel’né kódy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.1.1 Prefixové kódy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.1.2 Kraftova - McMillanova nerovnost’ . . . . . . . . . . . . . . . . . . . 253.1.3 Úplné kódy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303.1.4 Kódové stromy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323.1.5 Automatové dekódovanie. . . . . . . . . . . . . . . . . . . . . . . . . 333.2 Cena kódu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353.3 Kvázioptimálne kódy a optimálny kód . . . . . . . . . . . . . . . . . . . . . 363.3.1 Shannonov kód . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383.3.2 Fanov kód . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393.3.3 Huffmanov optimálny kód . . . . . . . . . . . . . . . . . . . . . . . . 403.3.4 Rozšírenie kódu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423.3.5 Chyby v pravdepodobnostiach zdrojových symbolov . . . . . . . . . 443.3.6 Kódovanie Markovovského zdroja . . . . . . . . . . . . . . . . . . . . 46iii

ivOBSAH3.4 Kódovanie pomocou orákula . . . . . . . . . . . . . . . . . . . . . . . . . . . 514 Metódy kompresie údajov 554.1 Slovníkové metódy kompresie dát . . . . . . . . . . . . . . . . . . . . . . . . 554.2 LZ77 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 554.2.1 Kompresia (kódovanie) . . . . . . . . . . . . . . . . . . . . . . . . . . 554.2.2 Dekompresia (dekódovanie) . . . . . . . . . . . . . . . . . . . . . . . 564.2.3 Poznámky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 574.2.4 LZSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 574.3 LZW . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584.3.1 Kompresia (kódovanie) . . . . . . . . . . . . . . . . . . . . . . . . . . 584.3.2 Dekompresia (dekódovanie) . . . . . . . . . . . . . . . . . . . . . . . 594.3.3 Poznámky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 614.4 Aritmetické kódovanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 614.4.1 Kompresia (kódovanie) . . . . . . . . . . . . . . . . . . . . . . . . . . 614.4.2 Dekompresia (dekódovanie) . . . . . . . . . . . . . . . . . . . . . . . 634.4.3 Implementačné poznámky . . . . . . . . . . . . . . . . . . . . . . . . 634.4.4 Poznámky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644.5 BWT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644.5.1 Kódovanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644.5.2 Dekódovanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 654.5.3 MTF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 664.5.4 Poznámky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 675 Kódovanie zvuku a obrazu 696 Kolmogorovská zložitost’ a hranice kompresie údajov 71II Samoopravné kódy 737 Základné princípy samooopravných kódov 757.1 Binárny symetrický kanál bez pamäte . . . . . . . . . . . . . . . . . . . . . 757.2 Geometrická interpretácia samoopravného kódu . . . . . . . . . . . . . . . 77

OBSAHv7.3 Jednoduché kódy odhal’ujúce/opravujúce chyby . . . . . . . . . . . . . . . . 817.3.1 Testovanie parity. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 817.3.2Obdĺžnikové kódy. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 817.4 Hammingov kód . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 838 Lineárne kódy 878.1 Základné vlastnosti linerárnych kódov . . . . . . . . . . . . . . . . . . . . . 888.2 Dekódovanie lineárnych kódov . . . . . . . . . . . . . . . . . . . . . . . . . 948.3 Reed-Mullerove kódy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 979 Cyklické kódy 1039.1 Polynomický popis cyklických kódov . . . . . . . . . . . . . . . . . . . . . . 1069.2 Maticový popis cyklických kódov . . . . . . . . . . . . . . . . . . . . . . . . 1099.3 Kódovanie pomocou cyklických kódov . . . . . . . . . . . . . . . . . . . . . 1119.4 Dekódovanie cyklických kódov . . . . . . . . . . . . . . . . . . . . . . . . . . 1129.5 Error trapping dekódovanie . . . . . . . . . . . . . . . . . . . . . . . . . . . 1189.6 Golayov kód . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1219.7 Dokonalé a kvázidokonalé kódy . . . . . . . . . . . . . . . . . . . . . . . . . 12710 Bose-Chandhury-Hocquenghemove kódy 12910.1 Binárne BCH kódy opravujúce 2 chyby . . . . . . . . . . . . . . . . . . . . . 12910.2 Definícia BCH kódov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13610.3 Hranica BCH kódov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13710.4 Peterson-Gorenstein-Zierlerov algoritmus dekódovania BCH kódov . . . . 13910.5 Iné metódy dekódovania BCH kódov . . . . . . . . . . . . . . . . . . . . . . 14910.6 Zvláštnosti dekódovania binárnych BCH kódov . . . . . . . . . . . . . . . . 15910.7 Reed-Solomonove kódy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15911 Modifikácie samoopravných kódov 16312 Prínos kódovania 16713 Shannonova teoréma 173

viOBSAH14 Hranice parametrov samoopravných kódov 181III Matematické základy teórie kódovania 18315 Algebra 18715.1 Grupy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18715.2 Okruhy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19415.3 Polynómy a okruhy polynómov . . . . . . . . . . . . . . . . . . . . . . . . . 19715.4 Konečné polia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20315.5 Vektorové priestory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21315.6 Lineárna algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21616 Entropia a množstvo informácie 217

Kapitola 1ÚvodThe fundamental problem of communication is that of reproducing at onepoint either exactly or approximately a message selected at another point.(Claude Shannon, 1948)Komunikácia (výmena informácie medzi dvoma alebo viacerými zúčastnenými stranami)je nutným predpokladom existencie a vývoja akéhokol’vek systému, ktorého častimusia navzájom spolupracovat’ pri plnení spoločných úloh. Aby bola možná koordináciaspolupracujúcich častí, komunikácia, ktorá medzi nimi prebieha, musí byt’ efektívnaa spol’ahlivá. Efektívnost’ komunikácie znamená, že výmena informácie musí prebehnút’vo vymedzenom čase (nesmie trvat’ príliš dlho) a s vynaložením ohraničenéhoúsilia (napríklad finančných zdrojov, energie). Aby sme mohli komunikáciu považovat’za spol’ahlivú, správa sa počas prenosu nesmie modifikovat’ tak, aby ju príjemca nedokázalsprávne interpretovat’; t.j. príjemca musí dokázat’ na základe prijatej správydostatočne presne zrekonštruovat’ odvysielanú správu. Okrem toho sa na komunikáciučasto kladie aj tretia požiadavka—bezpečnost’. 1 Bezpečnost’ komunikácie je predmetomzáujmu disciplíny nazývanej informačná bezpečnost’ a v tejto práci sa ňou nebudemezaoberat’.Požiadavky na efektívnost’ a spol’ahlivost’ komunikácie sú už na prvý pohl’ad v priamomprotiklade (náklady na prenos informácie a výkon vysielača) a tak býva častoproblém nájst’ pre komunikačný systém nejaké uspokojivé riešenie. Ešte v nedávnejminulosti sa kompromis medzi efektívnost’ou a spol’ahlivost’ou komunikácie riešil (acelkom úspešne) empiricky. V roku 1948 vyšiel článok Claude Shannona A MathematicalTheory of Communication, ktorý položil základy dvoch matematických teórií—teórie informácie a teórie kódovania. Tieto teórie pomohli exaktne sformulovat’ známeproblémy efektívnosti a spol’ahlivosti komunikácie a vytvorit’ rámec pre ich riešenie.Teória informácie skúma ohraničenia na prenos informácie a teória kódovania sa usiluje1 Bezpečnost’ komunikácie má viacero aspektov, z ktorých najdôležitejšie sú dôvernost’, integrita aautentickost’ prenášanej informácie. Bezpečnost’ komunikácie sa zaist’uje pomocou rozličných prostriedkov(kryptologických, technických, organizačných, právnych a pod.).1

2 KAPITOLA 1. ÚVODnájst’ taký spôsob zápisu (kódovanie) informácie, ktorý by umožnil dosiahnut’ hranicestanovené teóriou informácie. Vznik a rozvoj teórie informácie a teórie kódovania bolmotivovaný potrebou riešenia praktických problémov komunikácie 2 . Napriek tomu, žesa obe teórie vyvíjali ako matematické teórie (teória informácie využíva najmä analytickéa pravdepodobnostné metódy, kým teória kódovania používa algebraické metódy),neodtrhli sa od problémov reálnej komunikácie. Najmä komunikácia s kozmickýmisondami prinášala trvalé podnety pre hl’adanie efektívnych samoopravných kódov. Vsúčasnosti zažíva aplikačný boom najmä teória kódovania. Postupujúca informatizáciaspoločnosti prináša digitalizáciu informácie; elektronické dokumenty nahrádzajúpapierové, digitalizuje sa telefonická komunikácia, rozhlasové a televízne vysielanie,analógový zápis zvuku, obrazu a videa je rýchle nahradzovaný digitálnym. Rôzne aplikácievyužívajúce digitálne zapísanú informáciu kladú čoraz náročnejšie požiadavkyna spol’ahlivost’ a efektívnost’ komunikácie. (Napríklad digitálny zápis filmov na DVDsi vyžaduje zápis vel’kého množstva informácie vo forme, ktorá umožní on-line dekódovaniea je zároveň dostatočne odolná voči chybám.) Používatelia videa, MP3 prehrávačov,mobilných telefónov, ani laickí používatelia informačných a komunikačných systémovnepotrebujú študovat’ teóriu kódovania, ani teóriu informácie na to, aby dokázalirozličné informačné a komunikačné zariadenia úspešne používat’. V inej situácii sú informatici,ktorí budú pracovat’ s rozsiahlymi údajmi a budú potrebovat’ zvolit’ na ichspracovanie čo najefektívnejšie metódy. Dokonca aj v prípade, ked’ budú mat’ k dispozíciihotové programy, budú potrebovat’ aspoň základné znalosti teórie informácie ateórie kódovania na to, aby dokázali posúdit’, či sú dané programy vhodné na spracovanieich údajov a ak nie, či vôbec existujú efektívne metódy riešenia.Od uverejnenia Shannonovho článku vyšlo množstvo dobrých kníh z teórie kódovania(a samozrejme aj teórie informácie). Viacero z nich je dostupných na Internete. Na Internetemožno nájst’ aj univerzitné prednášky, informácie o štandardoch, spôsoboch kódovaniarozličných druhov informácie aj najnovšie vedecké výsledky teórie kódovania a teórieinformácie. S výnimkou elementárnych učebných textov si však uvedené informácie odčitatel’a vyžadujú aspoň základné poznatky, ktorých získanie samostatným štúdiom nemusíbyt’ ani jednoduché, ani efektívne. V slovenskej odbornej literatúre bola teórii kódovaniavenovaná jedna kapitola v Jablonského knihe Úvod do diskrétnej matematiky zroku 1982 a Adámkova Teorie kódování, ktorá vyšla v roku 1988, ale ucelená učebnicaalebo monografia z teórie kódovania chýba. Touto knihou chceme spomínanú medzeru vslovenskej odbornej literatúre zaplnit’. Kniha je určená predovšetkým univerzitným študentominformatiky, informatikom, matematikom a všetkým, ktorí majú záujem o teóriukódovania. U čitatel’a predpokladáme aspoň základné znalosti z matematickej analýzy,algebry, lineárnej a teórie pravdepodobnosti v rozsahu úvodných kurzov magisterského,resp. inžinierskeho štúdia. Ciel’om knihy je oboznámit’ čitatel’a so základnými problémami,ktoré teória kódovania rieši, metódami návrhu dobrých kódov, efektívnnymimetódami kódovania a dekódovania informácie, ako aj hranicami, ktoré pre konštrukciukódov vyplývajú z teórie informácie. Preštudovanie tejto knihy by mu mohlo pomôct’využívat’ výsledky teórie kódovania na riešenie vlastných problémov súvisiacich s kódovaníminformácie. Ak sme u čitatel’a vzbudili záujem o samotnú teóriu kódovania, vzávere knihy mu odporúčame literatúru pre d’alšie štúdium. Rozsah súčasného pozna-2 Claude Shannon a Richard Hamming, ktorý rozpracoval základy teórie kódovania, pracovali v tom časev American Telephone and Telegraph’s Bell Laboratories

3nia v teórii kódovania vyžaduje prijat’ rozhodnutie, ktorými čast’ami teórie kódovaniasa v knihe zaoberat’ nebudeme. Rozhodli sme sa obetovat’ teoretickejšie časti, ktoré sabezprostredne nedajú použit’ na konštrukciu kódov, resp. na posudzovanie ich vlastností.Čitatel’a, ktorému by tieto časti chýbali, odkazujeme na literatúru uvedenú v zozname,resp. odporúčania pre d’alšie štúdium uvedené v záverečnej kapitole.Táto kniha vznikla na základe prednášok z teórie kódovania, ktoré sme na Fakultematematiky, fyziky a informatiky Univerzity Komenského prednášali pre študentov informatikyod polovice 80-tych rokov. Pôvodne sme vychádzali z klasických prác [12], [3],resp. [6] a prednáška bola koncipovaná viac teoreticky ako aplikačne. Vzhl’adom nazameranie poslucháčstva, medzi ktorým prevládali informatici (a časovým obmedzeniam)sa postupne t’ažisko prednášky presunulo od matematickej teórie k algoritmom. Inšpiráciusme našli v Blahutovej knihe [2], ktorý nielen našiel rozumný kompromis medzinevyhnutnou, pomerne abstraktnou teóriou a efektívnymi algoritmami, ale dokázal tútonáročnú problematiku podat’ vel’mi prístupným spôsobom. Z tejto knihy sme intenzívnečerpali podnety pre prednášku aj pre túto knihu. Lintova kniha [15] nám poskytla informácieo aktuálnych teoretických výsledkoch, prehl’adný dôkaz Shannonovej vety azaujímavý pohl’ad na vzt’ah medzi technickými prostriedkami a samoopravnými kódmipri zaistení spol’ahlivosti komunikácie. Pozreli sme si množstvo prednášok z teórie kódovaniana špičkových svetových univerzitách; za všetkých spomenieme najmä metodickypekne spracované učebné texty J.I.Halla, [7] z Michigen State University a vel’miobsažné prednášky Mahdu Sudana z MIT. Vel’mi inšpiratívne boli Shannonovské prednáškyRoberta J. McEliecea z Caltechu o úlohe samoopravných kódov pri kozmickomvýskume. Teória kódovania a teória informácie sa od svojho vzniku uberali vlastnýmicestami. Hamming [3] ukázal na súvislosti výsledkov oboch teórií; v podobnom duchu,s aktuálnym obsahom a širším záberom je napísaná kniha [11]. Títo a d’alší kolegovia,matematici a inžinieri pracujúci v teórii kódovania prispeli k rozvoju nášho poznaniahĺbky a krásy tejto teórie a významu jej aplikácií, za čo im patrí naša úprimná vd’aka.Ďakujeme aj tvorcom programu Maple, vd’aka ktorému sme mohli do knihy zaradit’viacero príkladov, ktorých vypracovanie presiahlo možnosti ručných výpočtov; tvorcomprogramov TEXa L A TEX, pomocou ktorých sme mali možnost’ upravit’ podl’a vlastnýchpredstáv grafickú podobu tejto knihy.Počas práci na knihe sa jej pôvodné zameranie menilo a postupne presiahlo aj rozsahzákladnej prednášky z teórie kódovania. Snažili sme sa preto o taký výklad problematiky,ktorý by umožnil použit’ časti knihy ako učebné texty pre rozličné kurzy. Niektoré z nichuvádzame na nasledujúcich schémachTO DOPracovné verzie knihy slúžili ako študijné texty pre túto prednášku. Vd’aka tomusme dostali množstvo pripomienok, upozornení na existujúce chyby i návrhov na doplneniea prepracovanie niektorých častí. Za všetky pripomienky a námety, ktoré prispelik zlepšeniu obsahu i formy prezentácie úprimne d’akujeme. Osobitne by sme chcelipod’akovat’ Broni Brejovej a Tomášovi Vinařovi za príspevok k Reed Mullerovým kódom,Jánovi Mazákovi za podrobné errata a Monike Steinovej za spracovanie príkladu onebinárnych BCH kódoch.Daniel Olejár a Martin Stanek

4 KAPITOLA 1. ÚVODPoznámka. Poznámka. Tento text je pracovnou verziou knihy z teórie kódovania.Je určený ako študijný text pre poslucháčov informatiky na Univerzite Komenského vBratislave. Akékol’vek iné použitie si vyžaduje písomný súhlas autorov.(C) D.Olejár a M. Stanek, 2006.

Kapitola 2Základné pojmy a označeniaMnohé pojmy teórie kódovania sa stali súčast’ou bežného jazyka a l’udia ich často používajúbez toho, aby si uvedomovali ich presný význam. V bežnej komunikácii to natol’koneprekáža, ale pri odbornom výklade by rozličná interpretácia základných pojmov mohlaviest’ k nedorozumeniam. Aby sme sa v d’alšom výklade vyhli zbytočným problémom, vybudujemeexaktne potrebný pojmový aparát.2.1 Abecedy, slová a jazykyAbeceda je l’ubovol’ná konečná neprázdna množina. Prvky abecedy budeme nazývat’znakmi alebo symbolmi. Abecedu budeme označovat’ symbolom Σ; ak bude potrebné rozlišovat’rozličné abecedy, budeme symbol Σ indexovat’ (Σ 1 , Σ 2 , . . . ). L’ubovol’ná konečnápostupnost’ znakov z abecedy Σ sa nazýva slovom nad abecedou Σ. Ak nebude podstatnéo akú abecedu ide alebo z kontextu bude známe, o ktorú abecedu sa jedná, budeme kvôlistručnosti slová „nad abecedou Σ“ vynechávat’. Zjednodušíme aj zapisovanie slov; symbolyv postupnosti nebudeme oddel’ovat’ čiarkami a slovo (napr.) a, b, e, c, e, d, a budemezapisovat’ v tvare, ako sa slová v textoch štandardne zapisujú; t.j. abeceda. Nech jew slovo nad abecedou Σ, potom počet znakov slova w nazveme dĺžkou slova w. Dĺžkuslova w budeme označovat’ symbolom l(w). Tak napríklad l(slovo) = 5, l(abeceda) = 7,l(a) = 1. Postupnost’ znakov nad abecedou Σ môže byt’ aj prázdna. Takáto postupnost’sa nazýva prázdnym slovom a označuje sa symbolom ε. Pre dĺžku prázdneho slovaplatí l(ε) = 0. Teraz definujeme operácie nad slovami, pomocou ktorých bude možnévytvárat’ nové slová. Nech sú u, v dve slová nad abecedou Σ; u = a 1 . . . a n ; v = b 1 . . . b m .Zret’azením slov u, v je slovo w = uv = a 1 . . . a n b 1 . . . b m nad abecedou Σ. (Je zrejmé,že operácia zret’azovania slov je asociatívna, ale vo všeobecnosti nie je komutatívna;prázdne slovo ε je obojstranným neutrálnym prvkom vzhl’adom na operáciu zret’azeniaslov: pre l’ubovol’né slovo w platí wε = εw = w). Slovo možno zret’azit’ aj so sebousamým, napr. uu = a 1 . . . a n a 1 . . . a n . Pre l’ubovol’né slovo w a l’ubovol’né číslo k ∈ Ndefinujeme:5

6 KAPITOLA 2. ZÁKLADNÉ POJMY A OZNAČENIA1. w 0 = ε,2. w k+1 = w k w.Nech u = a 1 . . . a n je l’ubovol’né slovo, potom súvislú podpostupnost’ z = a i a i+1 . . . a i+k−1 ;1 ≤ i, i + k < n nazveme podslovom slova u. Ak 0 < k < n, slovo z nazveme vlastnýmpodslovom slova u. Slová u a ε sú triviálnymi podslovami slova u a v kódovaní sa nimizvlášt’ zaoberat’ nebudeme. Zato však v teórii kódovania zohrávajú dôležitú úlohupodslová, ktoré sú začiatkom alebo koncom nejakého slova. Zavedieme pre ne špeciálnepomenovania. Nech u = a 1 . . . a n je l’ubovol’né slovo, slovo z = a 1 . . . a k , 0 < k ≤ nnazveme počiatočným podslovom (prefixom) slova u a slovo x = a i a i+1 . . . a n ; 1 ≤ i = nnazveme koncovým podslovom (sufixom) slova u. Znaky v slove možno aj preusporiadat’.Dôležitým prípadom preusporiadania znakov je otočenie slova: zrkadlovým obrazom slovau = a 1 . . . a n nazveme slovo u R = a n . . . a 1 .Slová môžeme zoskupovat’ do množín. Takéto množiny slov budeme nazývat’ jazykmi.Presnejšie, l’ubovol’nú množinu slov nad abecedou Σ nazveme jazykom nad abecedouΣ. Ked’že jazyky sú množiny slov, možno z existujúcich jazykov vytvárat’ nové jazykypomocou množinových operácií, ako sú zjednotenie, doplnok, rozdiel, prienik, symetrickádiferencia množín a prípadne iné. Pre slová sme zaviedli operáciu zret’azovania(slov). Zavedieme teraz užitočné operácie s jazykmi, ktoré sú založené na zret’azovaníslov. Nech sú L 1 , L 2 jazyky nad abecedou Σ, potom L = L 1 L 2 je jazyk nad abecedou Σdefinovaný nasledovne: L = {uv; u ∈ L 1 , v ∈ L 2 }. Jazyk možno zret’azovat’ so sebousamým; pre l’ubovol’ný jazyk L a l’ubovol’né číslo k ∈ N definujeme:1. L 0 = {ε},2. L k+1 = L k L.Na záver uvedieme ešte dve operácie nad jazykmi, ktoré nám umožnia popísat’ množinuvšetkých možných slov, ktoré sa dajú vytvorit’ pomocou operácie zret’azovania jazyka.Nech L je l’ubovol’ný jazyk, potom jazyky L + = ⋃ ∞i>0 Li a L ∗ = ⋃ ∞i≥0 Li sa nazývajúkladná, resp. nezáporná iterácia jazyka L i . Všimnite si, že abecedu Σ možno chápat’aj ako jazyk pozostávajúci zo všetkých slov dĺžky 1 nad abecedou Σ a Σ∗ predstavujemnožinu všetkých slov nad abecedou Σ.Ilustrujeme zavedené pojmy na príkladoch.Príklad.1. Binárna abeceda Σ 1 je l’ubovol’ná dvojprvková množina. Znaky binárnej abecedynajčastejšie označujeme číslicami 0, 1; binárnu abecedu budeme v tomto prípadechápat’ ako množinu Σ 1 = {0, 1}.2. Na zápis prirodzených čísel vystačíme s abecedou 0, 1; Σ 2 = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}.3. Racionálne čísla možno zapísat’ v podobe slov nad abecedou Σ 3 = Σ 2 ∪ {" + ", ", "."}.4. Σ 4 = {a, b, c, d, e, f, g, i, j, k, l, m, n, o, p, q, r, s, t, v, w, x, y, z} je abeceda pozostávajúcaz malých písmen anglickej abecedy.

2.1. ABECEDY, SLOVÁ A JAZYKY 75. Abecedu Σ 5 = {A, B, C, D, E, F, G, I, J, K, L, M, N, O, P, Q, R, S, T, V, W, X, Y, Z} tvoria vel’képísmená anglickej abecedy.6. Σ 6 = Σ 4⋃Σ5 .7. Abecedu Σ 7 = {α, β, γ, δ, ɛ, ε, ζ, η, θ, ϑ, ι, κ, λ, µ, ν, ξ, o, π, ϖ, ρ, ρ, σ, σ, τ, υ, φ, ϕ, χ, ψ, ω}tvoria malé písmená gréckej abecedy.8. Ďalšími užitočnými abecedami by mohli byt’ rozličné znakové sady, napr. všetkyznaky kódov ASCII. V teórii kódovania budeme často pracovat’ s abedcedami, ktorýchsymboly sú prvkami konečných polí. Tieto symboly budeme zapisovat’ pomocouprirodzených čísel; Σ 8 = Z m = {0, 1, . . . m − 1}.9. Slovo 2.78128 je slovom nad Σ 3 , ale nie je slovom nad abecedou Σ 2 (pretože obsahujesymbol ".", ktorý sa v abecede Σ 2 nenachádza).10. Zret’azením slov w 1 = pismeno a w 2 = male dostávame slová (napr. nad abecedouΣ 4 ) w 1 w 2 = pismenomale a w 2 w 1 = malepismeno .11. Nech je dané slovo w 1 = pismeno nad abecedou Σ 4 , počiatočné a koncové podslovátohto slova sú uvedené v nasledujúcej tabul’ke:prefixεppipispismpismepismenpismenosufixpismenoismenosmenomenoenonooε12. Nech je dané slovo w 1 = pismeno nad abecedou Σ 4 , zrkadlový obraz slova w 1 jeslovo w R 1 = onemsip nad abecedou Σ 4.13. Nech sú L 1 = {ne, pre, po, vy}, L 2 = {mysli, hovor, pis, padni} jazyky nad abecedouΣ 4 . Jazyk L 1 L 2 je uvedený v nasledujúcej tabul’ke:L 1 /L 2 ne pre po vymysli nemysli premysli pomysli vymyslihovor nehovor prehovor pohovor vyhovorpis nepis prepis popis vypispadni napadni prepadni popadni vypadni14. Uvažujme binárnu abecedu Σ 1 = {0, 1}. Uvedieme množiny slov Σ k 1pre niekol’ko

8 KAPITOLA 2. ZÁKLADNÉ POJMY A OZNAČENIApočiatočných hodnôt k:k Σ k 10 {ε}1 {0, 1}2 {00, 01, 10, 11}3 {000, 001, 010, 011, 100, 101, 110, 111}4 {0000, 0001, 0010, 0011, 0100, 0101, 0110, 0111, 1000, 1001, 1010, 1011, 1100,1101, 1110, 1111}5 {00000, 00001, 00010, 00011, 00100, 00101, 00110, 00111, 01000, 01001, 01010,01011, 01100, 01101, 01110, 01111, 10000, 10001, 10010, 10011, 10100, 10101,10110, 10111, 11000, 11001, 11010, 11011, 11100, 11101, 11110, 11111}2.2 Údaje, informácia a komunikáciaV bežnom živote sa pojem informácie používa vol’ne a v rozličných významoch; hovorísa o rozličných druhoch informácie (obrazová, knižná, zvuková, genetická, novinová) ainformácii sa pripisujú rozličné atribúty (overená, čerstvá, aktuálna, pochybná, škandalóznaa i.) V teórii kódovania nás nebude zaujímat’ pôvod, význam ani hodnotenieinformácie; jediné čo pre nás bude podstatné je množstvo informácie. Budeme pracovat’s údajmi a správami, ktoré budú obsahovat’ nejakú informáciu, tieto údaje budemespracovávat’ a budeme sa snažit’ nájst’ pre zápis informácie, ktorú údaje obsahujú formuktorá je z hl’adiska spracovania údajov/informácie najvhodnejšia.V hovorovom jazyku sa pojmy informácia, správa a údaje chápu ako synonymá;ukážeme, že tieto pojmy majú odlišný význam. Ilustrujeme rozdiel medzi pojmami údajea informácia na príklade. Predstavme si1. binárny ret’azec 0000000000001010,2. výraz 0 12 (01) 2 ,3. slovné spojenie „dvanst’ núl, jednotka, nula, jednotka, nula“,4. 10,5. A,6. 000A.Vo všetkých prípadoch ide o jednoznačné určenie tej istej binárnej postupnosti dĺžky16; v prvom prípade je popisom explicitné vymenovanie členov postupnosti, v druhom jejzápis pomocou regulárneho výrazu, v tret’om slovný popis vo štvrtom vyjadrenie číselnejhodnoty binárneho čísla v desiatkovej sústave (predpokladáme, že informácia o dĺžkeslova je známa), v piatom ide o hexadecimálny zápis toho istého čísla (s vynechanímpočiatočných núl) a napokon posledný výraz je hexadecimálny zápis binárneho ret’azca,vrátane prvých troch nulových hexadecimálnych číslic. Všetky popisy majú spoločnéto, že umožňujú v množine všetkých binárnych ret’azcov (v našom prípade dĺžky 16)

2.2. ÚDAJE, INFORMÁCIA A KOMUNIKÁCIA 9jednoznačne identifikovat’ daný ret’azec; t.j. obsahujú rovnakú informáciu. Údaje tedapredstavujú záznam informácie; informácia je obsahom údajov. Niekedy sa pojeminformácia spája aj so sémantikou (významom) údajov, ale toto spojenie chápanie informáciekomplikuje, pretože do pojmu informácia zavádza subjektívný aspekt (toho,kto údaje interpretuje a kontext). Preto sa budeme pridržiavat’ vyššie uvedeného chápaniainformácie ako obsahu údajov. 1 Pojem správa sa zvykne používat’ na označenieúdajov, ktoré majú istý formát a sú prenášané z jedného miesta na druhé. Okrem prenosuúdajov v priestore sa údaje často prenášajú aj v čase: zapíšu sa na nejaké médiuma po čase sa z neho čítajú. Pod komunikáciou budeme rozumiet’ činnost’ dvoch aleboviacerých entít (účastníkov komunikácie), ktorá pozostáva z prenosu údajov/správ odjedného účastníka (odosielatel’a) k druhému/iným (príjemca/príjemcovia). Existuje mnohospôsobov komunikácie, ktoré závisia tak od použitých komunikačných prostriedkov(pošta, telefón, telegraf, televízia, rozhlas, a i.), typu údajov, ktoré sa pri komunikáciiprenášajú aj účelu komunikácie. Nebudeme ich rozoberat’, namiesto toho zavediemepomerne všeobecný model komunikačného systému, popíšeme úlohu jeho jednotlivýchsubsystémov a ukážeme, aké úlohy sa musia pri komunikácii riešit’. Uvedený modelpoužijeme tak na popis prenosu údajov v priestore, ako aj v čase.Na obrázku 2.1 je uvedený Shannonov model komunikačného systému. Hoci je tentomodel vel’mi všeobecný, hodí sa na popis mnohých komunikačných systémov a pre d’alšie(napríklad komunikačný systém so spätnou väzbou) môže Shannonov model poslúžit’ako základ, ktorý sa dá vhodne upravit’. Podrobnejší model komunikačného systému,odvodený zo Shannonovho modelu je uvedený na obrázku 2.2správasignálprijatýsignálsprávazdrojinformácie✲ vysielač ✲ kanál ✲ prijímač ✲ príjemca✻zdrojšumuObrázok 2.1: Shannonov model komunikačného systémuZdroj informácie/údajov. Aby sme sa nemuseli zaoberat’ tým, odkial’ údaje (informácia)pochádzajú, budeme predpokladat’, že existuje nejaký zdroj informácie (údajov), S(Source). Zdroju prislúcha nejaká abeceda, Σ S , ktorú budeme nazývat’ zdrojovou abecedou,alebo abecedou zdroja. Ďalej Σ S budeme predpokladat’, že zdroj S generuje postupnost’znakov x i , x i+1 , . . . ; x i+j ∈ Σ S ; napríklad tak že v diskrétnych časových okamihoch(taktoch) sa na výstupe zdroja budú objavovat’ symboly zo zdrojovej abecedy. Postupnost’znakov zdrojovej abecedy môžeme spracovávat’ po znakoch, alebo rozdelit’ na slovákonečnej dĺžky. Bez ujmy na všeobecnosti môžeme predpokladat’, že údaje, ktoré budeme1 Základné poznatky o meraní množstva informácie v údajoch sú uvedené v kapitole 16

10 KAPITOLA 2. ZÁKLADNÉ POJMY A OZNAČENIAspracovávat’, majú formu postupnosti slov 2 nad abecedou Σ S .Kóder K 1 – kódovanie zdrojových údajov. Forma, v ktorej sú zapísané zdrojové údaje,nemusí byt’ vhodná pre d’ašie spracovanie, a preto je postupnost’ slov vytvorená zdrojompred d’alším spracovaním zakódovaná. Toto kódovanie sa nazýva kódovanie zdrojovejinformácie, alebo kódovanie zdroja a realizuje ho kóder K 1 . Výsledkom kódovaniazdrojovej informácie je postupnost’ symbolov kódovej ebecedy Σ C , ktorú budeme nazývat’správou. Ked’že pôvodnú informáciu ziskavame priamo zo zdroja, kódovanie zdrojanemusí riešit’ ochranu údajov pred prípadnými chybami, ale plní inú úlohu—zaist’ujedosiahnutie efektívnosti zápisu zdrojovej informácie. Výsledkom kódovania zdrojovýchúdajov je (v ideálnom prípade) najkratšia správa nad kódovou abecedou, na základektorej možno v plnom rozsahu zrekonštruovat’ zdrojové údaje v pôvodnej podobe. Požiadavkana efektívnost’ kódovania správy sa dá vyjadrit’ tak, že vo výslednej (kódovanej)správe sa l’ubovol’ná k-tica znakov kódovej abecedy bude vyskytovat’ s rovnakou pravdepodobnost’ou3 .príjemca ✛dekóderD 1✛ dekóderD 2✛ demodulátor✛ prijímač ✛pren osovýk análšum✲zdroj S ✲ kóder K ✲ 1 kóder K 2✲ modulátor ✲ vysielač ✲Obrázok 2.2: Zovšeobecnený model komunikačného systémuNa tomto mieste sa na chvíl’u zastavíme. Shannonov model komunikačného systémupredpokladá, že v ideálnom prípade sa príjemcovi podarí zrekonštruovat’ správu vpôvodnom tvare. Aj ked’ sa v reálnych systémoch používa kódovanie zdroja, ktoré realizujetzv. bezstratovú kompresiu (data compaction), údaje generované zdrojom častokrátobsahujú informáciu, ktorú príjemca nedokáže využit’. Bezstratová kompresia takýchtoúdajov by viedla ku správam, ktoré by boli zbytočne rozsiahle. Ak dokážeme určit’, ktoráinformácia obsiahnutá v zdrojových údajoch je podstatná a ktorá nie, môžeme na kódovaniezdrojových údajov použit’ efektívnejšie kódovanie, založené na odfiltrovaní takredundancie, ako aj nepodstatnej informácie obsiahnutej v zdrojových údajoch. Takétokódovanie zdroja, pri ktorom dochádza k istej strate informácie sa nazýva (kompresiaso stratou informácie, data compression). Príkladom môže byt’ kódovanie hudby,ktoré využíva skutočnost’, že údaje obsahujú informáciu ktorú príjemca nedokáže využit’(nepočutel’né zvuky); táto informácia sa pri kódovaní zdroja jednoducho odfiltruje a tým2 v krajnom prípade slov dĺžky 1, teda znakov zdrojovej abecedy3 Zmyslom kódovania zdroja je odstránit’ redundanciu (nadbytočnost’) pôvodného zápisu. Požiadavkana rovnakú pravdepodobnost’ výskytu všetkých k-tic kódovej abecedy znamená, že v kódovanej správe užnebude možné objavit’ nejakú zákonitost’, ktorá by sa dala využit’ na d’alšie zefektívnenie zápisu.

2.2. ÚDAJE, INFORMÁCIA A KOMUNIKÁCIA 11zvýši efektívnost’ zápisu (porovnajte nejakú hudobnú skladbu zapísanú na audio CDa zápis tej istej skladby vo formáte MP3, príp. iných). Na druhej strane mechanicképoužitie kompresie so stratou informácie nebude asi použitel’né pri spracovávaní exesúborov (hoci inteligentná revízia zdrojových textov tých istých programov by nepochybneodhalila možnosti optimalizácie textu.)Správa Kódovanú správu rozdelíme na bloky vhodnej dĺžky k. (O výbere k budeme hovorit’neskôr.) Pripomíname, že ak bol kóder K 1 dostatočne kvalitný a kódovaná správadostatočne dlhá, všetky slová dĺžky k by sa v nej mali vyskytovat’ s rovnakými pravdepodobnost’ami.Kóder K 2 Na rozdiel od kódovania zdroja, kde nebolo treba rátat’ so šumom a úlohoukódera K 1 bolo redokovat’ redundanciu zdrojových údajov, správu budeme čoskoroposielat’ cez komunikačný kanál, na ktorý pôsobí šum. Úlohou druhého kódera jetransformovat’ slová dĺžky k nad kódovou abecedou Σ C na slová dĺžky kn (kvôli jednoduchostipredpokladajme, že nad tou istou kódovou abecedou Σ C ) tak sa len mierne zvýšilaredundancia a príjemca bol schopný odhalit’/opravit’ chyby, ktoré vzniknú pri prenoseprenosovým kanálom. Najprv budeme uvažovat’ kóder bez pamäte. Tento kóder realizujeinjektívne zobrazenieENC : Σ k C → Σn C .Kódery bez pamäte sa používajú na kódovanie pomocou blokových kódov a vyznačujúsa tým, že nezohl’adňujú žiadne vzt’ahy medzi k-ticami vstupných údajov; to isté slovo(dĺžky k) sa zakaždým zobrazí na to isté slovo (dĺžky n). Existujú aj kódery s pamät’ou,ktoré pri kódovaní znaku (zväčša kódujú znak po znaku) zohl’adňujú aj predchádzajúcesymboly. Tieto kódery sa používajú pri tzv. konvolučných kódoch.Modulátor Správy sa prenášajú z jedného miesta na druhé pomocou fyzikálnych veličín,ktoré sa dokážu šírit’ cez vhodné prostredie. Fyzikálna reprezentácia správy sa nazývasignál. (My budeme pomocou jedného signálu reprezentovat’ menšie časti správy,napríklad slová, alebo znaky kódovej abecedy.) Zariadenie, ktoré transformuje fyzikálnuveličinu tak, aby predstavovala príslušný signál, sa nazýva modulátor. Predstavmesi napríklad rádiovú vlnu so sínusovým priebehom a amplitúdou 1 a binárnu kódovúabecedu Σ = {0, 1}. Symbolu 0 priradíme hodnotu −1 a symbolu 1 hodnotu +1. Postupnost’0, 0, 1, 1, 0, 1, 0, 1 bude reprezentovaná signálom, ktorého priebeh je uvedený naodrázku 2.3. Pre zaujímavost’ uvedieme aj hodnoty signálov reprezentujúcich jednotlivébity:−0.9479054106 −0.9450567393 0.9450567393 0.9479054110−0.9180252682 0.9222918778 −0.9222918783 0.9180252668Vysielač je d’alším prvkom komunikačného systému. Jeho úlohou je generovat’ signálydostatočne silné na to, aby prekonali cestu k príjemcovi.Prenosový kanál Signály sa môžu šírit’ v rôznorodých prostrediach; napríklad kozmickýmpriestorom, po kovovom kábli, optickom vlákne a pod. Médium umožňujúce prenossignálov budeme nazývat’ prenosovým kanálom. Predpokladáme, že prenosový kanál jevystavený vplyvom okolitého prostredia, ktoré ovplyvňujú správy prenášané kanálom.Faktorov, ktoré môžu pôsobit’ na prenosový kanál je tak vel’a, že sa dost’ dobre nedá skúmat’vplyv jednotlivých faktorov, ale namiesto toho sa skúmajú dôsledky ich spoločného

12 KAPITOLA 2. ZÁKLADNÉ POJMY A OZNAČENIA1.210.80.60.40.2–3 –2 –1–0.2 0 1 x 2 3–0.4–0.6–0.8–1–1.2Obrázok 2.3: Signálpôsobenia. Rôzne rušivé faktory vplývajúce na prenosový kanál, budeme nazývat’ zdrojmišumu a výsledok ich pôsobenia—šumom . Budeme predpokladat’, že šum má podobusignálov, ktoré ovplyvňujú signály prenášajúce správu (napríklad sa s nimi skladajú), vdôsledku čoho dôchádza k zmenám signálov, ktoré sa v prenášanej správe prejavujú akochyby troch základných typov:1. nahradenie jedného symbolu prenášanej správy iným symbolom (kódovej abecedy);2. zmazaním symbolu (čo môžeme chápat’ tak, že symbol prenášanej správy je nahradenýsymbolom, ktorý nepatrí do kódovej abecedy);3. výpadkom/doplnením nového symbolu (kódovej abecedy) do prenášanej správy (poruchasynchronizácie).Šumový signál je zobrazený na obrázku 2.4V tejto knihe sa budeme zaoberat’ kódmi, ktoré umožnia riešit’ chyby prvého a druhéhodruhu; t.j. odhal’ovat’ a opravovat’ chyby. Poruchami synchronizácie sa nebudeme zaoberat’,čitatel’ovi odporúčameTO DOSignály prenášané prenosovým kanálom zachytáva prijímacia strana pomocou prijímača(napríklad anténa mobilného telefónu). Abstrahujeme od transformácií signálov,ktoré realizuje prijímač a predpokladáme, že prijaté signály vstupujú do demodulátora,ktorý transformuje signály na postupnost’ znakov kódovej abecedy. Demodulátoruž v podstate robí prvú korekciu chýb. V dôsledku pôsobenia šumu na kanál prijatésignály nebudú mat’ zd’aleka ideálny priebeh, obr. 2.5. Postupnost’ 0, 0, 1, 1, 0, 1, 0, 1 je

2.2. ÚDAJE, INFORMÁCIA A KOMUNIKÁCIA 131.210.80.60.40.2–3 –2 –1 0–0.21 x 2 3–0.4–0.6reprezentovaná postupnost’ou hodnôt 4Obrázok 2.4: Šumbit pôvodný signál prijatý signál interpretácia„tvrdá“ „mäkká“0 −0.9479054106 0.1824649004 1 ?0 −0.9450567393 −0.2506249324 0 ?1 0.9450567393 0.4439007163 1 11 0.9479054110 0.5558633849 1 10 −0.9180252682 −0.5960788882 0 01 0.9222918778 1.195406403 1 10 −0.9222918783 −1.159436952 0 01 0.9180252668 0.7084777992 1 1Ani jedna z prijatých hodnôt (signálov) nepatrí do množiny {−1, 1}. Aby dekódermohol transformovat’ prijaté signály na znaky kódovej abecedy, musí použit’ pružnejšiepravidlo; napríklad, signály s nezápornými hodnotami budú reprezentovat’ 1 a ostatnésignály budú reprezentovat’ kódový znak 0. Pri použití tohto pravidla sa značne deformovanésignály transformujú na postupnost’ 1, 0, 1, 1, 0, 1, 0, 1. Demodulátor môže byt’navrhnutý tak, aby zakaždým prijal rozhodnutie o interpretácii signálu (hard quantization).To by však mohlo viest’ k nesprávnej interpretácii signálov blízkych k 0 demodulátoroma problém (identifikáciu a opravenie chyby) by musel riešit’ dekóder. Napriektomu, že pri „tvrdej“ transformácii spojitého signálu na diskrétne hodnoty sa dosahujenajvyššia pravdepodobnost’ správneho priradenia, často sa používa alternatívne riešenia,tzv. soft quantization. V krajnom prípade demodulátor neinterpretuje žiadne signályako kódové znaky a posunie dekóderu vypočítané číselné hodnoty signálov na jed-4 tieto predstavujú hodnoty signálu v strede príslušných intervalov.

14 KAPITOLA 2. ZÁKLADNÉ POJMY A OZNAČENIA1.510.5–3 –2 –1 1 x 2 3–0.5–1–1.5Obrázok 2.5: Prijatý signálnotlivých časových intervaloch. Tým sa prakticky celé spracovanie prijatej správy presuniena dekóder, čo však zvyšuje nároky na jeho výkonnost’ (zložitost’ a zrejme aj cenu).Rozumné je preto kompromisné riešenie, kedy demodulátor predspracuje prijaté signálynapríklad tak, že jednoznačne interpretuje tie signály, ktorých hodnoty dostatočne dobrezodpovedajú hodnotám reprezentujúcim jednotlivé znaky kódovej abecedy, problematickéhodnoty signálu bude reprezentovat’ nejakým novým symbolom a tieto výsledkyodovzdá dekóderu. Presnejšie, nech s k označuje priemernú hodnotu signálu v takte k,a a k je hodnota symbolu kódovej abecedy zodpovedajúca signálu s k . Potom pravidlo prebinárnu kódovú abecedu by mohlo vyzerat’ napríklad takto⎧⎪⎨ 1 s k ≥ 0.3,a k = 0 s k ≤ −0.3,⎪⎩? −0.3 < s k < 0.3.V našom prípade by demodulátor postupnost’ prijatých signálov interpretoval ako postupnost’?, ?, 1, 1, 0, 1, 0, 1. Ak počas prenosu došlo ku chybe (nahradenie jedného znakukódového slova iným), informácia, ktorú dostal dekóder od demodulátora by mu umožnilaodhadnút’ najpravdepodobnejšie miesta, na ktorých mohlo dôjst’ ku chybe (v našompríklade sú podozrivé prvé dva symboly), čím by sa (ako uvidíme neskôr) značne zjednodušilodekódovanie.Dekódery D 2 a D 1 Hlavnou úlohou dekódera D 2 je čo najlepšie rekonštruovat’ odvysielanúsprávu. Predpokladajme, že poznáme všetky kódové slová (budeme ich označovat’ akou i ), všetky možné prijaté slová v j a podmienené pravdepodobnosti p i,j = p(v j |u i ). Pravdepodobnost’p i,j vyjadruje pravdepodobnost’ toho, že po odvysielaní kódového slova u i boloprijaté (nejaké) slovo v j . Základom pre rozhodovanie dekódera D 2 je nasledujúci princípdekódovania na základe maximálnej pravdepodobnosti (Maximum Likelihood Decoding,MLD):

2.2. ÚDAJE, INFORMÁCIA A KOMUNIKÁCIA 15Prijaté slovo v j dekódujeme na také kódové slovo u i , pre ktoré je podmienenápravdepodobnost’ p(v j |u i ) maximálna.Dekódovanie na základe maximálnej pravdepodobnosti vždy dáva výsledok (kódovéslovo). Takéto dekódovanie sa nazýva úplné dekódovanie . Ako sa dá očakávat’, okremúplného dekódovania bude existovat’ aj nejaké alternatívne riešenie, ktoré budeme nazývat’neúplným dekódovaním. Pri neúplnom dekódovaní môžu nastat’ dva prípady:1. dekóder dekóduje prijaté slovo na kódové slovo,2. dekóder namiesto kódového slova vypíše nejaký dohodnutý symbol (napríklad ∞).Druhý prípad nastane vtedy, ked’ dekóder našiel v prijatom slove chybu, ale nebolju schopný opravit’. Takúto situáciu nemôžeme vylúčit’, pretože dekóder nie je schopnýopravit’ slová, ktoré boli výrazne modifikované. V takom prípade je lepšie požiadat’o opätovné zaslanie informácie, ako sa pokúšat’ opravit’ prijaté slovo a dekódovat’ho nesprávne. Ani takýto prístup však nezaručuje, že dekódované slovo sa zhoduje sodvysielaným kódovým slovom. Ked’že dekóder rozhoduje na základe syntaxe (napr. zoznamukódových slov) a nie sémantiky prijatých správ, ak počas prenosu kódového slovanastala chyba, ktorá ho transformovala na iné kódové slovo, dekóder takúto chybunedokáže identifikovat’. Preto dekóder postavený na princípe MLD bude mat’ síce najvyššiupravdepodobnost’ správneho dekódovania, ale ak sa pomýli, tak je dekódovanáspráva zat’ažená chybou, ktorú je t’ažko odhalit’. Preto väčšina dekóderov, ktorými sabudeme zaoberat’, vychádza z trocha slabšieho princípu, nazývaného IMLD (IncompleteMaximum Likelihood Decoding); neúplné dekódovanie na základe maximálnej pravdepodobnosti:Prijaté slovo v j dekódujeme bud’ na také kódové slovo u i , pre ktoré je podmienenápravdepodobnost’ p(v j |u i ) maximálna, alebo na symbol ∞; bola odhalenáchyba.Napriek použitiu samoopravných kódov nedokážeme garantovat’ správne dekódovanieprijatej správy. Budeme rozlišovat’ dva problematické prípady: chyba dekódera (decodererror) nastáva vtedy, ked’ dekóder nesprávne dekódoval prijaté slovo; t.j. interpretovalho ako iné kódové slovo, ako bolo to, ktoré bolo odvysielané. Zlyhanie dekódera zahŕňatak chybu dekódera, ako aj ten prípad, ked’ dekóder odhalil chybu ale nebol ju schopnýopravit’.Dekóder D 1 transformuje dekódovanú správu do podoby, v ktorej ju môže d’alej spracovávat’príjemca. Dobrým príkladom je dekódovanie binárne zapísanej zvukovej informácie(hudby) do počúvatel’nej podoby, alebo dekódovanie digitálne zapísaných filmovna DVD.Všimneme si, že hoci sme v modeli prenosového kanála hovorili o prenose správ, možnotento model priamo použit’ aj na popis uchovávania a opätovného čítania údajov. Zaznamenávanieúdajov a ich opätovné čítanie možno chápat’ ako prenos informácie v čase,zatial’ čo pri prenose správ sa jedná o prenos informácie v priestore. Jeden podstatný

16 KAPITOLA 2. ZÁKLADNÉ POJMY A OZNAČENIArozdiel medzi prenosom údajov v čase a priestore však je. Ak pri prenose informácie vpriestore dôjde k odhalitel’nej ale neopravitel’nej chybe, príjemca má možnost’ požiadat’odosielatel’a o opätovné zaslatie správy. Ak však dôjde k poškodeniu údajov zapísanýchna nejakom pamät’ovom médiu, opätovné čítanie neumožní prečítat’ správne údaje. Oto dôležitejšie je pri uchovávaní údajov na pamät’ových médiách ochrana ich integritynapríklad pomocou samoopravných kódov. Z hl’adiska úloh, ktoré rieši teória kódovanianie je rozdiel informácie v čase a priestore podstatný, a preto sa v d’alšom sa sústredímena problémy vznikajúcimi pri prenose informácie v priestore.2.3 KódovanieVrát’me sa k modelu komunikačného systému z predchádzajúcej časti. Zostáva vyriešit’problém, ako zapisovat’ správy, ktoré generuje zdroj S v podobe postupnosti znakov nadabecedou Σ S pomocou kódovej abecedy Σ C . Existuje viacero riešení tohto problému. Začnemetým najjednoduchším—kódovaním jednotlivých znakov zdrojovej abecedy. NechΣ S = {s 0 , . . . , s m−1 } je zdrojová abeceda a Σ C = {b 0 , . . . , b r } je kódová abeceda a nech súv 0 , . . . , v m−1 navzájom rôzne slová nad kódovou abecedou Σ C . Potom zobrazenies 0 → v 0s 1 → v 1.s m−1 → v m−1budeme nazývat’ kódovaním symbolov zdrojovej abecedy slovami nad abecedou Σ C . MnožinaV = {v 0 , . . . , v m−1 } sa nazýva kód a prvky množiny V sa nazývajú kódovými slovami.Všimneme si, že kódovanie po písmenách je totálnym (všade definovaným) zobrazením aked’že zdroj S generuje len postupnosti znakov nad abecedou Σ S , každá správa vytvorenázdrojom S sa dá vyjadrit’ pomocou postupnosti kódových slov kódu V. Problém všakvzniká pri dekódovaní kódovaných správ. Predpokladajme, že je daná nejaká správas i1 , . . . , s in nad zdrojovou abecedou a jej prislúchajúca kódovaná správa vyjadrená akopostupnost’ kódových slov v i1 , . . . , v in . Postupnost’ v i1 , . . . , v in sa však prenáša po znakocha pred dekódovaném je potrebné ju rozdelit’ na kódové slová. Ak sa to podarí, nie je problémdekódovat’ jednotlivé kódové slová a získat’ pôvodnú správu s i1 , . . . , s in . Nasledujúcipríklad ukazuje, že existujú také kódy, pre ktoré sa nie každá postupnost’ kódových symbolovdá jednoznačne rozdelit’ na kódové slová.Príklad. Abeceda zdroja Σ S = {0, 1, 2, 3} pozostáva zo štyroch symbolov (prvých štyrochdesiatkových číslic) a kódová abeceda je binárna; Σ C = {0, 1}. Kódovanie prirad’uje desiatkovejčíslici jej binárny zápis:0 → 0 1 → 12 → 10 3 → 11

2.3. KÓDOVANIE 17Uvažujme napr. binárnu postupnost’ 001011. Táto postupnost’ sa dá interpretovat’ viacerýmispôsobmi, a síce ako binárny zápis desiatkových postupností 001011, 00103, 00211,0023.Jednoznačnost’ dekódovania je prirodzenou požiadavkou, ktorá sa kladie na kódovanie.Nutným predpokladom jednoznačnosti dekódovania je tzv. rozdelitel’nost’ kódu.Definícia 2.3.1. Kód V = {v 0 , . . . , v m−1 } nad abecedou Σ C sa nazýva rozdelitel’ným, akpre l’ubovol’nú rovnost’ postupností kódových slovplatí l = k, i 1 = j 1 , . . . , i k = j k .v i1 . . . v ik = v j1 . . . v jlČo vlastne vyjadruje rozdelitel’nost’ kódu? Ak je kód V rozdelitel’ný, znamená to, žel’ubovol’nú postupnost’ nad Σ ∗ Cbud’ môžeme rozdelit’ na postupnost’ kódových slov jednoznačnýmspôsobom, alebo ju nemôžeme rozdelit’ vôbec. Pre rozdelitel’ný kód nemôženastat’ taká situácia, kedy by sme nejakú postupnost’ kódových symbolov mohli rozdelit’na postupnost’ kódových slov dvoma rozličnými spôsobmi. Jednoduchým riešením problémurozdelitel’nosti sú blokové alebo rovnomerné kódy. Blokový kód sa vyznačuje tým,že všetky jeho kódové slová majú rovnakú dĺžku.Príklad. Rozšírime predchádzajúci príklad a uvedieme dva spôsoby binárneho kódovaniadesiatkových číslic—rovnomerné a nerovnomerné:desiatkový binárny blokovýzápis zápis kód0 0 00001 1 00012 10 00103 11 00114 100 01005 101 01016 110 01107 111 01118 1000 10009 1001 1001Dekódovanie postupnosti znakov kódovej abecedy bude v prípade blokového kódu relatívnejednoduché: postupnost’ sa najprv rozdelí na slová dĺžky rovnej dĺžke bloku apotom sa (napríklad na základe tabul’ky) jednotlivým kódovým slovám priradia symbolyzdrojovej abecedy.Príklad. Postupnost’ 100001001100100100110010 rozdelíme na kódové slová:1000 0100 1100 1001 0011 0010 a dekódujeme pomocou tabul’ky z predchádzjúceho príkladu:843932. Všimneme si, že existujú aj binárne postupnosti, ktoré sa nedajú dekódovat’,nakol’ko slová 1111, 1110, 1101, 1100, 1011, 1010 nie sú kódové slová.S rozdelitel’nost’ou vznikajú problémy pri použití niektorých kódov, ktoré obsahujúslová nerovnakej dĺžky; tzv. nerovnomerných kódoch. Postupnost’ kódových symbolov

18 KAPITOLA 2. ZÁKLADNÉ POJMY A OZNAČENIAv tomto prípade nemožno mechanicky rozdelit’ na bloky rovnakej dĺžky, ale je potrebnéurčit’ kódové slová. To sa v prípade nerovnomerných kódov vo všeobecnosti nemusídat’ spravit’ (alebo nedá spravit’ jednoznačne). Ale aj medzi nerovnomernými kódmi existujúrozdelitel’né kódy. Nakol’ko tieto kódy umožňujú zapisovat’ informáciu častokrátúspornejšie ako blokové kódy, používajú sa najmä na (bezstratovú) kompresiu údajov.Podrobnejšie sa nimi budeme zaoberat’ v nasledujúcich kapitolách. Vrát’me sa ku kódovaniuzdrojovej informácie. Zatial’ sme kódovali jednotlivé znaky kódovej abecedy,teraz pojem kódovania znakov zdrojovej abecedy zovšeobecníme.Definícia 2.3.2. Nech je Σ S zdrojová abeceda, nech je množina U = {u 0 , . . . , u M } nejakýchslov nad zdrojovou abecedou a nech sú v 0 , . . . , v M slová nad kódovou abecedou Σ C . Zobrazenieu 0 → v 0u 1 → v 1.u M → v Mbudeme nazývat’ kódovaním množiny U kódom V.Všimneme si, že táto definícia kódovania zahŕňa aj kódovanie znakov zdrojovej abecedy;stačí položit’ U = Σ S .Príklad. Nech je U rovná množine všetkých podmnožín množiny prirodzených čísel{0, . . . .99}, V = {0, 1} 100 je množina binárnych vektorov dĺžky 100. Podmnožine {i 0, . . . , i k }z U je priradené slovo v 5 j , ktoré má jednotkové hodnoty na pozíciách i 0 , . . . , i k a nuly naostatných pozíciách. Je zrejmé, že V kóduje množinu U a že toto kódovanie je bijekciou.Poznajúc mohutnost’ kódu V vieme určit’ aj mohutnost’ množiny U: |U| = 2 100 .5 tzv. charakteristický vektor

Čast’ IKódovanie zdroja19

Kapitola 3Nerovnomerné kódyVhodný kód na kódovanie daného zdroja informácie môžeme spravidla vybrat’ z viacerýchkandidátov. To ktorý z nich nakoniec použijeme, závisí od účelu ktorý chcemekódovaním zdroja dosiahnut’. Ak sme už spomenuli v predchádzajúcej kapitole, jednouz prirodzených požiadaviek na kódovanie zdroja je, aby zakódovaná správa bola čo najkratšia(a zároveň jednoznačne dekódovatel’ná); t.j. aby sa pri kódovaní nepoužívali zbytočnedlhé kódové slová; resp. aby kódovanie bolo efektívne. 1 Ak má množina (znakovalebo slov) ktorú potrebujeme kódovat’ mohutnost’ n, tak na rozlíšenie prvkov kódovanejmnožiny budeme potrebovat’ blokový kód so slovami dĺžky aspoň ⌈log m n⌉, kde m jemohutnost’ kódovej abecedy. V prípade, ked’ zdroj informácie generuje všetky znakypribližne rovnako často (a nie sú známe iné využitel’né vzt’ahy medzi znakmi/slovamizdojových správ) 2 , je celkom efektívne kódovanie zdoja pomocou blokových kódov. Inásituácia však nastane, ked’ sa niektoré zo symbolov zdrojovej abecedy (slov nad zdrojovouabecedou) vyskytujú v správach výrazne častejšie ako iné; t.j. ak sa množstvo informácieobsiahnuté v jednotlivých zdrojových symboloch (slovách nad zdrojovou abecedou)výrazne odlišuje. V takomto prípade by kódovanie správ pomocou nerovnomerných kódov,v ktorých by boli častejšie sa vyskytujúcim symbolom (slovám) priradené kratšiekódové slová efektívnejšie 3 , ako použitie blokových (rovnomerných) kódov.Základným predpokladom praktickej použitel’nosti nerovnomerných kódov je rozdelitel’nost’.V tejto kapitole sa budeme zaoberat’ rozdelitel’nými nerovnomernými kódami. Najprvzavedieme vel’mi užitočnú triedu efektívne dekódovatel’ných nerovnomerných kódov, tzv.prefixové kódy. Potom dokážeme Kraftovu-McMillanovu nerovnost’, ktorá predstavujekritérium pre existenciu (nerovnomerného) rozdelitel’ného kódu s danými dĺžkami kódovýchslov. Nakoniec zavedieme pojem ceny kódu, skonštruujeme dolný odhad ceny kódua budeme sa zaoberat’ konštrukciami optimálnych a kvázioptimálnych kódov. Kvôlizjednodušeniu výkladu budeme v priebehu tejto kapitoly predpokladat’, že kódová abecedaje binárna a ak nebude explicitne povedané inak, budeme kódovat’ znaky zdrojovejabecedy; t.j. správy vytvorené zdrojom informácie budeme kódovat’ po znakoch.1 Zatial’ vystačíme s intuitívnym chápaním efektívnosti kódovania, neskôr ho upresníme pomocou pojmuceny kódu.2 jednotlivé zdrojové symboly obsahujú približne rovnaké množstvo informácie3 pre m-prvkovú kódovú abecedu a n prvkovú kódovanú množinu bude priemerný počet znakov kódovejabecedy potrebný na zakódovanie jedného prvku kódovanej množiny nižší ako ⌈log m n⌉21

22 KAPITOLA 3. NEROVNOMERNÉ KÓDY3.1 Rozdelitel’né kódy3.1.1 Prefixové kódyŠtúdium nerovnomerných rozdelitel’ných kódov začneme skúmaním základných vlastnostíprefixových kódov. Prefixové kódy totiž predstavujú rozsiahlu triedu nerovnomernýchkódov s dobrými vlastnost’ami (vyznačujú sa najmä rozdelitel’nost’ou a jednoduchost’oudekódovania), ktoré budeme používat’ priamo na kódovanie zdrojových údajov, ale aj nakonštrukciu iných kódov a pri skúmaní parametrov nerovnomerných kódov. Definujemeprefixový kód formálne.Definícia 3.1.1. Kód V = {v 0 , . . . , v m−1 } sa nazýva prefixovým kódom, ak pre l’ubovol’név i , v j ∈ V, i ≠ j; v i nie je prefixom slova v j .Prefixový kód sa teda vyznačuje tým, že žiadne jeho slovo nemôže byt’ počiatočným podslovominého kódového slova. Kód z príkladu 2.3 nebol prefixový; kódové slovo 1 boloprefixom kódového slova 10. „Prefixovost’“ kódu je taká silná vlastnost’, že z nej vyplývarozdelitel’nost’ kódu; ináč povedané, prefixovost’ je postačujúcou podmienkou prerozdelitel’nost’ kódu. Sformulujeme a dokážeme toto tvrdenie formálne.Veta 3.1.1. Nech je V = {v 0 , . . . , v m−1 } (binárny) prefixový kód, potom je V (binárny)rozdelitel’ný kód.Dôkaz. Predpokladajme, že V je prefixový, ale nie je rozdelitel’ný kód. Potom existujeaspoň jedna binárna postupnost’, ktorá je rozdelitel’ná na postupnost’ kódových slov aspoňdvoma rozličnými spôsobmi. Vyberieme zo všetkých takých binárnych postupnostípostupnost’ β s minimálnou dĺžkou. Pre postupnost’ β teda platí :v i1 . . . v ik = v j1 . . . v jl .Z toho, že postupnost’ β má minimálnu dĺžku vyplýva, že v i 1 ≠ v j1 . V opačnom prípadeby bolo totiž možné slovo v i1 z postupnosti β vynechat’ a dostali by sme kratšiu binárnupostupnost’, pre ktorú by platilo:v i2 . . . v ik = v j2 . . . v jl .To je však v spore s predpokladom o minimálnej dĺžke postupnosti β. Ak však v i 1 ≠ v j1 ,potom bud’ slovo v i1 je prefixom slova v j1 alebo slovo v j1 je prefixom slova v i1 . To je zasa vspore s predpokladom o tom, že kód V je prefixový. To znamená, že postupnost’ kódovýchsymbolov, ktorá sa dá rozdelit’ na postupnost’ kódových slov aspoň dvoma rôznymi spôsobminemôže existovat’, a teda kód V je rozdelitel’ný.Tvrdenie sme síce dokázali pre binárny prípad, ale platí všeobecne pre l’ubovol’núkódovú abecedu, ktorá obsahuje aspoň dva symboly. Prefixovost’ teda postačuje na to,aby bol kód rozdelitel’ný; prirodzenou otázkou je, či je prefixovost’ zároveň nutným predpokladomrozdelitel’nosti kódu, alebo ináč povedané, či existujú aj iné rozdelitel’né kódy

3.1. ROZDELITEL’NÉ KÓDY 23okrem prefixových. Ukazuje sa, že nie. Uvedieme príklad rozdelitel’ného kódu, ktorý nieje prefixový.Príklad. Kód V = {0, 01, 11} síce nie je prefixový, ale napriek tomu to je rozdelitel’ný kód.Kód z predchádzajúceho príkladu je tzv. sufixový kód, ktorý sa vyznačuje tým, že žiadnekódové slovo nie je sufixom iného kódového slova. Vytvorili sme ho tak, že sme „otočili“slová prefixového kódu {0, 10, 11}. Postupnost’ kódových symbolov správy kódovanej pomocousufuxového kódu budeme rozdel’ovat’ na kódové slová „odzadu“; t.j. až vtedy, ked’máme k dispozícii celú kódovanú správu. Príkladom takejto postupnosti, ktorá sa nedározdelit’ na postupnost’ kódových slov, kým sa nedočíta do konca, je postupnost’:0111 . . . 1Ak táto postupnost’ obsahuje párny počet jednotiek (napr. 2k), dá sa rozdelit’ nasledovne:0(11) k ; ak obsahuje nepárny počet jednotiek (2k + 1), tak sa rozdelí na kódové slovánasledovne: 01(11) k .TO DO: silne rozdelitel’né kódy3.1.2 Kraftova - McMillanova nerovnost’Aby sme získali čo najkratší zápis správy, snažíme sa na kódovanie používat’ kódy s krátkymikódovými slovami. Ak je mohutnost’ abecedy zdroja menšia alebo rovná mohutnostikódovej abecedy, tak potom možno znaky zdrojovej zbecedy kódovat’ slovami dĺžky 1(znakmi kódovej abecedy). V opačnom prípade (a tých je prevažná väčšina) budemepotrebovat’ použit’ kód s väčšími dĺžkami kódových slov. Je zrejmé, že si dĺžky kódovýchslov nemôžeme volit’ l’ubovol’ne; ked’že existujú len dve binárne slová dĺžky 1 (0 a 1)a štyri binárne slová dĺžky 2 (00,01,10,11) binárne kódy s tromi slovami dĺžky 1 alebopiatimi slovami dĺžky 2 zrejme nemôžu existovat’. Ale existuje napríklad binárny kódso štyrmi kódovými slovami dĺžok 1, 2, 2, 2; resp. existuje rozdelitel’ný kód nad abecedoumohutnosti q ≥ 2 s dĺžkami kódových slov l i = l(v i ); i = 0, . . . , m − 1? Na túto otázkudáva odpoved’ veta 3.1.2, ktorú vyslovíme a dokážeme v tejto časti. Kvôli zjednodušeniuvýkladu budeme v d’alšom predpokladat’, že kódová abeceda je binárna a že zdrojováabeceda Σ S obsahuje aspoň dva symboly, t.j. m ≥ 2.Veta 3.1.2 (Kraftova-McMillanova nerovnost’). Nech sú l 0 , . . . , l m−1 l’ubovol’né nenulovéprirodzené čísla. Potom rozdelitel’ný kód V = {v 0 , . . . , v m−1 } s dĺžkami kódových slovl i = l(v i ); i = 0, . . . , m − 1 existuje práve vtedy, ak platí nasledujúca nerovnost’m−1∑i=02 −l i≤ 1. (3.1)

24 KAPITOLA 3. NEROVNOMERNÉ KÓDYDôkaz. Najprv dokážeme, že podmienka je nutná. Nech je V = {v 0 , . . . , v m−1 } l’ubovol’-ný kód. Priradíme mu generujúcu funkciu (enumerátor dĺžok kódových slov) definovanúnasledujúcim spôsobom:h V (x) =m−1∑i=0x −l(v i) .Zavedieme teraz n-násobné zret’azenie (rozšírenie) kódu V;V n = {w i ; w i = v i1 . . . v in , v ij ∈ V, j = 1, . . . , n}Bude nás zaujímat’, aký je vzt’ah medzi vytvárajúcimi funkciami kódu V a jeho rozšírenia,V n . Kvôli lep3iemo pochopeniu si tento problém najprv ilustrujeme na jednoduchompríklade.Príklad. Uvažujme kód V = {0, 10, 11}. Jeho vytvárajúca funkcia jeh V (x) = x −1 + x −2 + x −2 = x −1 + 2x −2 .Dvojnásobným zret’azaním kódu V dostávame kódV 2 = {00, 010, 011, 100, 1010, 1011, 110, 1110, 1111}s enumerátoromh V 2(x) = x −2 + 4x −3 + 4x −4 = (x −1 + 2x −2 ) 2 .Pokračovanie dôkazu. To, čo sme videli na príklade, platí aj vo všeobecnosti a dá sadokázat’ matematickou indukciou; t.j.h V n(x) =( m−1n∑x i)) −l(v . (3.2)i=0Predpokladajme teraz, že V = {v 0 , . . . , v m−1 } je rozdelitel’ný kód s dĺžkami kódovýchslov l i = l(v i ), i = 0, . . . , m − 1. Symbolom M i označíme počet slov dĺžky i v rozšírenomkóde V n . a pomocou hodnôt M i zapíšeme enumerátor kódu V n . Označíme maximálnudĺžku slova v kóde V symbolom l max. Potom dĺžka l’ubovol’ného slova kódu Vn nepresiahnen·l max (v kóde aspoň jedno slovo takej dĺžky existuje, a je to slovo, ktoré sme dostalin-násobným zret’azením slova maximálnej dĺžky kódu V.) To znamená, že M i = 0 prei > n · l max a generujúcu funkciu kódu V n môžeme vyjadrit’ nasledovneh V n(x) =n·l∑ maxDosadíme v (3.3) namiesto premennej x hodnotu 2 a dostávame:i=0M i x −i . (3.3)

3.1. ROZDELITEL’NÉ KÓDY 25h V n(2) =n·l∑ maxi=12 −i M i . (3.4)Všimneme si, že suma v (3.4) môže obsahovat’ nulové členy; ak totiž V neobsahuje slovonulovej dĺžky ε, tak každé slovo v kóde Vn bude mat’ dĺžku minimálne n · l min, kde l min jeminimálna dĺžka kódového slova kódu V. Potom M 1 = M 2 = · · · = M n·lmin −1 = 0. Podobne,ak by kód V obsahoval len slová párnej dĺžky, tak ani kód Vn nemôže obsahovat’ slovánepárnej dĺžky. Využijeme teraz skutočnost’, že kód V je rozdelitel’ný. Z toho vyplýva, ževšetky slová kódu V n sú rôzne, a ked’že V n je binárny kód, znamená to, že M i ≤ 2 i . Vopačnom prípade by sa aspoň jedna binárna postupnost’ dĺžky i musela dat’ poskladat’ zoslov kódu V rôznymi spôsobmi, čo to je v spore s predpokladom o rozdelitel’nosti kódu V.Na druhej strane niektoré binárne postupnosti sa nemusia dat’ poskladat’ zo slov kóduV a v tomto prípade M i < 2 i . Dosadíme horný odhad hodnoty M i do vzt’ahu (3.4) a pojednoduchých úpravách dostávame:h V n(2) =n·l∑ maxi=12 −i M i ≤n·l∑ maxNa druhej strane, zo vzt’ahov (3.2), (3.5) vyplývai=12 −i 2 i = n · l max . (3.5)h V n(2) =Ale nerovnost’ (3.6) platí pre l’ubovol’né n. Ak by teda( m−1n∑2 i)) −l(v ≤ n · l max . (3.6)i=0m−1∑i=02 −l(v i) = a > 1,tak by existovalo také n 0 , že pre všetky n > n 0 bya n > n · l max ,pretože exponenciálna funkcia so základom a > 1 rastie rýchlejšie ako polynomická. Tovšak je v spore so vzt’ahom (3.6), a teda platím−1∑i=02 −l(v i) ≤ 1.Dostatočnost’. Predpokladajme, že l 0 ≤ l 1 · · · < l m−1 ; dĺžky kódových slov sú usporiadanévzostupne, a že platí Kraftova-McMillanova nerovnost’. Ukážeme, že je možnézostrojit’ rozdelitel’ný kód s dĺžkami kódových slov l 0, . . . , l m−1 .1. konštrukcia [1]. Použijeme matematickú indukciu.1. Vyberieme l’ubovol’né binárne slovo dĺžky l 0 ako kódové slovo v 0 .

26 KAPITOLA 3. NEROVNOMERNÉ KÓDY2. Predpokladáme, že sme už vybrali slová v 0 , . . . , v k−1 , k ≤ m − 1, dĺžok l 0, . . . , l k−1ktoré tvoria rozdelitel’ný (prefixový) kód.3. V množine binárnych vektorov dĺžky l k nájdeme také slovo v k (dĺžky l k), že žiadnezo slov v 0 , . . . , v k−1 nie je jeho prefixom. Ukážeme, že také slovo existuje. Všetkýchbinárnych slov dĺžky l k, ktoré majú prefix v 0 dĺžky l 0 je 2 l k−l 0. (Prvých l 0 bitov sazhoduje so slovom v 0 , ostatných l k − l 0 bitov možno vybrat’ l’ubovol’ným spôsobom.)Všetkých binárnych slov dĺžky l k, ktorých prefixom je niektoré zo slov l 0 , . . . , l k−1je∑k−12 l k−l i. (3.7)i=0Teraz využijeme predpoklad, že pre doteraz zostrojený kód platí Kraftova-McMillanovanerovnost’ a že k < m; t.j. žem−1∑i=02 −l i≤ 1.Rozdelíme sumu z poslednej nerovnosti na dve časti:m−1∑i=0∑k−12 −l i=i=0m−1∑2 −l i+i=k2 −l i≤ 1. (3.8)Ked’že že všetky sčítance v sume (3.8) sú kladné čísla, vynechaním niektorých členovdruhej sumy z (3.8) sa nerovnost’ zachová (existuje aj taká možnost’, že druhásuma bude obsahovat’ len jediný člen, 2 −l k):∑k−12 −l i+ 2 −l k

3.1. ROZDELITEL’NÉ KÓDY 27Kraftova-McMillanova nerovnost’. Zavedieme čísla q k , k = 0, . . . , m − 1 odvodené oddĺžok kódových slov. Čísla q k definujeme nasledovne:∑k−1q 0 = 0, q k = 2 −l i; k = 1, . . . , m − 1. (3.11)i=0Z Kraftovej-McMillanovej nerovnosti vyplýva, že čísla q k ; k = 0, . . . , m − 1 spĺňajú podmienky0 ≤ q k < 1. Zapíšeme teraz čísla q k v binárnom tvare. Zo spôsobu vytvárania q ka zo skutočnosti, že l 0 ≤ l 1 · · · < l m−1 , vyplýva, že q k sa dá zapísat’ akoq k = (0.b k,1 . . . b k,lk−1 ) 2 ,kde b k,i ∈ {0, 1}. Kód V = {v 0 , . . . , v m−1 } vytvoríme potom z binárnej reprezentácie číselq k nasledujúcim spôsobom:v i = b i,1 . . . b i,li−1 0 . . . 0;} {{ }l it.j. kódové slovo v i pozostáva z prvých l i binárnych číslic nasledujúcich po rádovej čiarkev rozvoji čísla q i . Tvrdíme, že takto zostrojený kód je prefixový, a teda aj rozdelitel’ný.Predpokladajme opak, t.j. že kód V nie je prefixový. Potom obsahuje kódové slová,z ktorých jedno je prefixom druhého. Nech h je najmenšie také číslo, že pre slovo v hexistuje kódové slovo (označme ho symbolom v i ), ktoré je jeho prefixom. Ked’že v i jeprefixom v h , l i < l h , a teda aj i < h. Z toho že v i je prefixom v h a zo spôsobu konštrukciekódových slov vyplýva, že v i je prefixom slov v i+1 , . . . , v h−1 , v h . Ked’že v h je prvé kódovéslovo, ktoré má prefix v i , h = i + 1. Pozrieme sa teraz na slová v i , v i+1 podrobnejšie,preskúmame čísla q i , q i+1 .{ }} {q i = 0. b i,1 . . . b i,li−1 0 . . . 0} {{ }l i−1q i+1 = q i + 2 −l i= 0. b i,1 . . . b i,li−1 0 . . . 10 . . . 0} {{ }l i+1l iMôžu nastat’ dve možnosti:1. l i < l i+1 ; v tomto prípade má slovo v i na mieste l i znak 0 a slovo v i+1 znak 1;2. l i = l i+1 . Pripočítaním hodnoty 2 −l iku q i sa zmení niektorá z prvých l i číslic číslaq i , a teda slová v i a v i+1 sa odlišujú aspoň v jednom z prvých l i znakov.To znamená, že v i nemôže byt’ prefixom slova v i+1 , a teda kód V je prefixový.

28 KAPITOLA 3. NEROVNOMERNÉ KÓDYDôsledok 1. Pre l’ubovol’ný rozdelitel’ný kód V = {v 0 , . . . , v m−1 } existuje prefixový kódW = {w 0 , . . . , w m−1 }, taký, že l(v i ) = l(v i ), i = 0, . . . , m − 1.Z uvedeného dôsledku vyplýva, že ak nám nezáleží na konkrétnej podobe kódovýchslov, môžeme rozdelitel’ný kód s dĺžkami kódových slov l 0, . . . , l m−1 nahradit’ prefixovýmkódom s tými istými dĺžkami kódových slov, t.j. l 0, . . . , l m−1 . Túto možnost’ budeme vd’alších úvahách využívat’ a budeme často predpokladat’, že rozdelitel’ný kód je zároveňaj prefixový kód. Skôr ako budeme pokračovat’ v skúmaní vlastností nerovnomerných kódov,uvedieme príklad Shannonovho kódu, ktorý sme použili v dôkaze Kraftovej-McMillanovejnerovnosti.Príklad. Uvažujme nasledujúce dĺžky kódových slov: 2,3,3,4,5,5,6,6. Ked’že 2−2 + 2 −3 +2 −3 +2 −4 +2 −5 +2 −5 +2 −6 +2 −6 = 0.65625 < 1, z vety 3.1.2 vyplýva, že existuje prefixový kóds týmito dĺžkami kódových slov. Vypočítame hodnoty q i a vyjadríme príslušné kódovéslová.q 0 = 0.00 l 0 = 2 v 0 = 00q 1 = 0.01 l 1 = 3 v 1 = 010q 2 = 0.011 l 2 = 3 v 2 = 011q 3 = 0.1 l 3 = 4 v 3 = 1000q 4 = 0.1001 l 4 = 5 v 4 = 100010q 5 = 0.10011 l 5 = 5 v 5 = 100011q 6 = 0.101 l 6 = 6 v 6 = 101000q 7 = 0.101001 l 7 = 6 v 7 = 1010013.1.3 Úplné kódyKód z príkladu 3.1.2 je síce prefixový, ale má jeden vážny nedostatok. Existujú binárnepostupnosti, ktoré sa nedajú rozbit’ na kódové slová. Okrem triviálnych postupnostídĺžky 1 sú to napríklad postupnosti začínajúce dvojicou symbolov 11. Nemá však zmyselpožadovat’, aby platilo V ∗ = B ∗ , pretože to je možné len v prípade, ak B ⊆ V. Intuitívnejpožiadavke, aby každá binárna postupnost’ predstavovala alebo sa dala doplnit’na postupnost’ kódových slov, vyhovujú tzv. úplné kódy.Definícia 3.1.2. Binárny rozdelitel’ný kód V sa nazýva úplným kódom práve vtedy, akpre l’ubovol’nú binárnu postupnost’ β ∈ B ∗ existuje také kódové slovo v i ∈ V, že bud’postupnost’ β je prefixom slova v i , alebo slovo v i je prefixom postupnosti β.Príklad. Uvažujme blokový kód V = {00, 01, 10, 11}. Ked’že kód V obsahuje všetkybinárne slová dĺžky 2, spĺňa podmienky definície 3.1.2 a je úplný. Každú binárnu postupnost’párnej dĺžky možno jednoznačne rozdelit’ na postupnost’ kódových slov.Overovat’, či nejaký kód s vel’kým počtom kódových slov spĺňa podmienky definície3.1.2, by nemuselo byt’ jednoduché. Našt’astie úplnost’ kódu úzko súvisí s Kraftovou-McMillanovou nerovnost’ou a prefixovými kódmi.Veta 3.1.3. Binárny rozdelitel’ný kód V = {v 0 , . . . , v m−1 } je úplný práve vtedy, ak je pre-

3.1. ROZDELITEL’NÉ KÓDY 29fixový a platím−1∑i=02 −l i= 1. (3.12)Dôkaz. Predpokladajme, že V = {v 0 , . . . , v m−1 } je prefixový kód, pre ktorý platí rovnost’(3.12), ale V nie je úplný. To znamená, že existuje binárna postupnost’ β ∈ B ∗ taká, žežiadne kódové slovo v i ∈ V nie je prefixom postupnosti β a postupnost’ β nie je prefixomžiadneho kódového slova kódu V. Potom však môžeme zostrojit’ nový prefixový kód V ′ =V ∪ {β}, pre ktorý platím−1∑2 −l i+ 2 −l(β) = 1 + 2 −l(β) > 1. (3.13)i=0Ale nerovnost’ (3.13) je v rozpore s Kraftovou-McMillanovou nerovnost’ou (3.1). To znamená,že postupnost’ β požadovaných vlastností nemôže existovat’, a teda kód V je úplný.Dokážeme druhú čast’ tvrdenia sporom. Nech je V úplný rozdelitel’ný kód. Predpokladajme,že V nie je prefixový, alebo preň neplatí rovnost’ (3.12). Ked’že z rozdelitel’nostikódu V vyplýva platnost’ Kraftovej-McMillanovej nerovnosti (3.1), znamená to, že prekód V platím−1∑i=02 −l i< 1. (3.14)Zhrnieme naše predpoklady: kód V je úplný a platí ∑ m−1i=0 2−l i< 1. Z úplnosti kódu Vvyplýva, že každá binárna postupnost’ dĺžky n > l max, kdel max = maxv i ∈V {l(v i)}musí mat’ ako prefix nejaké kódové slovo. Spočítame počet takýchto postupností:m−1∑i=02 n−l i≥ 2 n . (3.15)Ak by kód V bol prefixový, potom je kódové slovo, ktoré je prefixom nejakej binárnejpostupnosti dĺžky n dané jednoznačne. Potom by však platiloam−1∑i=0m−1∑i=02 n−l i= 2 n , (3.16)2 −l i= 1, (3.17)čo je v spore s predpokladom (3.14) To znamená, že platí ∑ m−1i=0 2−l i< 1, kód V je úplnýale nie je prefixový. Potom však existujú kódové slová v i ≠ v j také, že (napr.) v i je

30 KAPITOLA 3. NEROVNOMERNÉ KÓDYprefixom v j . Z úplnosti kódu V vyplýva, že každá binárna postupnost’ dĺžky n > l maxmusí začínat’ nejakým kódovým slovom kódu V. Potomm−1∑i=02 n−l i> 2 n , (3.18)lebo postupnosti začínajúce slovom v j sú už zarátané v sume (3.18) ako postupnosti začínajúceslovom v i . Na druhej strane nemôže platit’ nerovnost’m−1∑k=02 n−l k− 2 n−l(v j) < 2 n , (3.19)pretože to by znamenalo, že odstránením slova v j z kódu V sa stratí úplnost’ kódu; t.j.potom bude existovat’ binárna postupnost’ β dĺžky n > l max, ktorej prefixom nie je žiadnekódové slovo kódu V. Ale to znamená, že jej prefixom nemohlo byt’ odstránené slovo v j ,pretože v tom prípade by prefixom postupnosti β bolo slovo v i , a teda kód V by nebolúplný. To znamená, že platí nerovnost’ (3.18). Platnost’ nerovnosti (3.18) je však v rozpores tvrdením vety 3.1.2. Dostávame spor, ktorý dokazuje platnost’ nášho tvrdenia.3.1.4 Kódové stromyNa skúmanie vlastností nie príliš rozsiahlych nerovnomerných kódov je možné výhodnepoužívat’ orientovaný ohodnotený graf, nazývaný kódovým stromom. Uvažujme orientovanýbinárny strom T hĺbky n s hranami a vrcholmi ohodnotenými nasledujúcim spôsobom:najprv ohodnotíme jeho hrany, pričom budeme postupovat’ od koreňa k listom;ak z vrcholu vychádzajú dve (neohodnotené) hrany tak jednej z nich priradíme hodnotu0 a druhej hodnotu 1. Ak z vrcholu vychádza jediná (neohodnotená) hrana, priradímejej jednu z hodnôt {0, 1}. Po ohodnotení hrán ohodnotíme vrcholy binárneho stromu T :koreňu priradíme prázdne slovo ε a vrcholu v priradíme postupnost’ binárnych hodnôt,ktoré boli priradené hranám ležiacim na ceste, spájajúcej koreň s vrcholom v. 5 Ked’že Tje súvislý acyklický graf, medzi l’ubovol’nými dvoma vrcholmi v ňom existuje jediná cesta,a teda binárna postupnost’ priradená vrcholu je určená jednoznačne. Binárny kódovýstrom binárneho kódu V; T (V) dostaneme tak, že z binárneho stromu T hĺbky n ≥ l max,kde l max = max vi ∈V{l(v i )} a binárny strom T je ohodnotený spôsobom uvedeným vyššie,odstránime všetky podstromy, ktoré neobsahujú vrchol s ododnotením zodpovedajúcimniektorému kódovému slovu kódu V. Na obr. 3.1 je zobrazený binárny (ohodnotený)strom hĺbky 2.Binárny kódový strom kódu V z príkladu 3.1.2 je zobrazený na obr. xxx Všimnemesi, že všetky vrcholy zodpovedajúce kódovým slovám, sú listy (vrcholy, z ktorých nevychádzajúžiadne hrany). To nie je náhoda. Ak by nejaké slovo v i bolo prefixom inéhoslova v j , vrchol v i by musel ležat’ na ceste spájajúcej koreň s vrcholom v j , a teda bymusel byt’ vnútorným vrcholom kódového stromu.Veta 3.1.4. Nech je V prefixový kód. Potom v kódovom strome T (V) zodpovedajú kódovýmslovám listy.5 V d’alšom budeme vrchol v označovat’ binárnym slovom, ktoré mu je priradené.

003.1. ROZDELITEL’NÉ KÓDY 0310 ✒❩01 ❩❩❩7λ ✒ 01❅ 1 0 10❅❅❅❘✚ ✚✚✚❃❅ 1❅❅❅❘11Obrázok 3.1: Ohodnotený binárny stromDôkaz.Prenechávame čitatel’ovi.Pomocou kódového stromu je možné l’ahšie formulovat’ aj podmienku úplnosti kódu.Ako sme už ukázali, kód V z príkladu 3.1.2 nie je úplný; problémy spôsobujú postupnostizačínajúce dvojicou 11. Pri skúmaní kódového stromu kódu V zistíme, že z vrcholu 1vychádza len jedna hrana, ktorej je priradená hodnota 0. Ak túto hranu odstránime avrchol 1 stotožníme s pôvodným vrcholom 10, dostaneme kódový strom T (V ′ ) prefixovéhokódu V ′ = {00, 010, 011, 100, 1010, 1011, 11000, 11001}.Kódový strom T (V ′ ) obsahuje ešte dva vnútorné vrcholy (11, 110) stupňa 1. Odstránenímhrán vychádzajúcich z týchto vrcholov, vrcholu 110 a stotožnením vrcholov 11 a1100 stromu T (V ′ ) dostávame kódový strom T (V ′′ ) prefixového kódu V ′′ = {00, 010, 011,100, 1010, 1011, 110, 111}. Pre kód V ′′ platí ∑ v i ∈V ′′ 2l(v i) = 1. Kód V ′′ je úplný. Každýbinárny 6 prefixový kód, ktorý nie je úplný, možno týmto spôsobom transformovat’ naúplný kód.3.1.5 Automatové dekódovanie.Vel’kou prednost’ou prefixových kódov je to, že okamžite po dočítaní posledného symbolukódového slova dokážeme určit’, o aké kódové slovo ide. (Pre porovnanie pripomínamesufixový rozdelitel’ný kód z príkladu 3.1.1, pre ktorý existovali správy, ktoré bolo možnédekódovat’ až po prijatí posledného symbolu správy.) Prefixové kódy sa vd’aka možnostipriebežného dekódovania správy nazývajú aj okamžitými kódmi alebo automatovýmikódmi. Ten druhý názov získali vd’aka tomu, že na ich dekódovanie možno použit’konečný automat.6 Ako uvidíme neskôr, mnohé z vlastností nerovnomerných kódov nezávisia od počtu znakov kódovejabecedy. Transformácia prefixového kódu na úplný prefixový kód, ktorú sme popísali vyššie, podstatnevyužíva to, že kódová abeceda je binárna; a nedá sa priamo zovšeobecnit’ na prípad kódovej abecedy sväčším počtom kódových symbolov.

32 KAPITOLA 3. NEROVNOMERNÉ KÓDYDefinícia 3.1.3. Konečný automat je usporiadaná šestica A = (Σ i , Σ o , Q, Φ, Ψ, q), kdeΣ i je vstupná, Σ o výstupná abeceda, Q, je konečná množina stavov, Φ : Σ i × Q → Q jeprechodová funkcia, Ψ : Σ i ×Q → Σ o je výstupná funkcia a q je počiatočný stav konečnéhoautomatu A.Konečný automat si môžeme predstavit’ ako zariadenie so vstupnou a výstupnoupáskou, riadiacou jednotkou, čítacou a zapisovacou hlavou, obr. 3.2. Vstupná páskaje rozdelená na políčka, v každom políčku je zapísaný symbol vstupnej abecedy. Podobneje výstupná páska rozdelená na políčka a v políčku je zapísaný jeden zo symbolov výstupnejabecedy, alebo je políčko prázdne. Čítacia hlava sa pohybuje po vstupnej páskezl’ava doprava, v každom kruku číta jeden symbol z políčka vstupnej pásky a po prečítanísa presunie o jedno políčko doprava. Zapisovacia hlava v každom kroku zapisujena políčko výstupnej pásky jeden symbol výstupnej abecedy a posunie sa o jedno políčkodoprava, alebo nezapíše nič a zostáva na tom istom políčku aj v nasledujúcom kroku. Automatzačína pracovat’ v počiatočnom stave q a skončí, ked’ prečíta celý vstup zo vstupnejpásky.Pri dekódovaní binárnych prefixových kódov pomocou konečného automatu bude vstupnáabeceda Σ i = {0, 1}, výstupná abeceda sa bude zhodovat’ so zdrojovou abecedou;Σ o = Σ S a prechodovú a výstupnú funkciu definujeme pomocou tabul’ky. Ilustrujemedekódovanie binárnárneho prefixového kódu na príklade.Príklad. Uvažujme kód V ′′ z predchádzajúceho príkladu. Predpokladáme, že kódovéslová slúžia na zápis prvých písmen anglickej abecedy:a 00 e 1010b 010 f 1011c 011 g 110d 100 h 111Vstupná abeceda konečného (dekódovacieho) automatu A je binárna: Σ i = {0, 1}, výstupnáabeceda Σ o = {a, b, c, d, e, f, g, h, λ}, množina stavov Q = {q, q 0 , q 1 , q 01 , q 10 , q 11 , q 101 } aprechodová a výstupná funkcia sú uvedené v tabul’ke. Počiatočným stavom je q.stav vstup0 1q q 0 , λ q 1 , λq 0 q, a q 01 , λq 01 q, b q, cq 1 q 10 , λ q 11 , λq 10 q, d q 101 , λq 101 q, e q, fq 11 q, g q, hJe daná binárne kódovaná správa 010011111. Ukážeme, ako ju automat A dekóduje.Kvôli jednoduchosti budeme pozíciu čítacej hlavy na vstupnej páske a stav automatu Azapisovat’ tak, že stav automatu zapíšeme pred symbol, ktorý v danom kroku automatA číta. Symboly, ktoré by sa zapisovali na výstupnej páske budeme zapisovat’ pod dekódovanéslová binárnej správy.

3.2. CENA KÓDU 33a a a a a a a a✻✤✜q i✣✢❄| | | | | | | |Obrázok 3.2: Konečný automatq010011111 ↦→ 0q 0 10011111 ↦→ 01q 01 0011111 ↦→ }{{} 010 q011111b}{{} 010 0q 0 11111 ↦→ }{{} 010 01q 01 1111 ↦→ }{{} 010 }{{} 011 q111 ↦→ }{{} 010 }{{} 011 1q 1 11bbb cb c010 011 11q 11 1 ↦→ 010 011 111 q}{{}b}{{}c}{{}b}{{}c}{{}h↦→↦→3.2 Cena kóduNerovnomerné rozdelitel’né kódy sa dajú výhodne použit’ v takých prípadoch, ked’ saslová (alebo znaky), ktoré sa kódujú, vyskytujú nerovnako často. Vtedy je možné častosa vyskytujúcim slovám (znakom) priradit’ kratšie kódové slová a tak dosiahnut’, že kódovanáspráva bude v priemernom prípade kratšia, ako keby sa na kódovanie používaliblokové napríklad kódy. V d’alšom túto intuitívnu predstavu upresníme. Kvôli jednoduchostibudeme kódovat’ znaky zdrojovej abecedy Σ S = {a 0 , . . . , a m−1 }. Zavedieme prvý,značne zjednodušený matematický model zdroja S. Budeme predpokladat’, že zdroj S jenáhodný generátor, ktorý generuje znaky zdrojovej abecedy náhodne a nezávisle na sebe.Zdroj S je charakterizovaný rozdelením pravdepodobností P = {p 0 , . . . , p m−1 }; p i ≥ 0, i =0, . . . , m − 1; ∑ m−1i=0 p i = 1 výskytu jednotlivých symbolov zdrojovej abecedy. (Z matematickéhohl’adiska je sdroj S náhodná premenná, nadobúdajúca hodnotu a i s pravdepodobnost’oup i , i = 0, . . . , m − 1.) Je zrejmé, že existuje viacero spôsobov kódovania znakovzdrojovej abecedy. Aby sme mohli porovnat’ efektívnost’ jednotlivých kódov, zavediemepojem ceny kódu.Definícia 3.2.1. Nech je P = {p 0 , . . . , p m−1 } rozdelenie pravdepodobností znakov zdrojovejabecedy Σ S = {a 0 , . . . , a m−1 }; nech V = {v 0 , . . . , v m−1 } je kód kódujúci znaky kódovej

34 KAPITOLA 3. NEROVNOMERNÉ KÓDYabecedy, a i → v i , i = 0, . . . , m − 1 a nech l i = l(v i ) sú dĺžky kódových slov kódu V. Potomcenou kódu V pri rozdelení pravdepodobností nazvemeL(P, V) =Cena kódu V pri rozdelení pravdepodobností P nie je z matematického hl’adiska ničiné, než stredná hodnota dĺžky kódového slova, t.j. počet symbolov kódovej abecedypripadajúcich na zakódovanie jedného znaku zdrojovej abecedy. (V prípade kódovaniaslov z nejakej množiny M by to bol počet symbolov kódovej abecedy pripadajúcich nazakódovanie jedného slova z množiny M.)Aká je minimálna hodnota L(P, V) pri danom rozdelení pravdepodobností? Existujúkódy dosahujúce túto minimálnu hodnotu a ak áno, sú známe metódy ich zostrojovania?Na tieto i d’alšie otázky dáme odpoved’ v nasledujúcich častiach tejto kapitoly.m−1∑i=0l i p i .3.3 Kvázioptimálne kódy a optimálny kódKód V = {v 0 , . . . , v m−1 } s dĺžkami kódových slov l(v i) = l i , i = 0, . . . , m − 1 nazveme optimálnymkódom pre rozdelenie pravdepodobností P = {p 0 , . . . , p m−1 }, ak pre l’ubovol’nýkód W = {w 0 , . . . , w m−1 } platíL(P, V) ≤ L(P, W).Cenu optimálneho kódu pri rozdelení pravdepodobností P označíme L(P). Prirodzenáotázka je, aká je cena optimálneho kódu.Veta 3.3.1. Nech je P = {p 0 , . . . , p m−1 } l’ubovol’né rozdelenie pravdepodobností, p 0 ≥ p 1 ≥· · · ≥ p m−1 > 0. Potom platíRovnost’m−1∑i=0m−11∑p i · log 2 ≤ L(P) ≤p im−1∑i=0i=0platí práve vtedy, ak p i = 2 −l i, l i ∈ N, i = 0, . . . , m − 1.p i · log 21p i+ 1.p i · log 21p i= L(P) (3.20)Dôkaz. Dolný odhad. Predpokladajme, že V = {v 0 , . . . , v m−1 } je l’ubovol’ný prefixovýkód s dĺžkami kódových slov l(v i) = l i , i = 0, . . . , m − 1. Porovnáme cenu kódu V sentropiou zdroja H 2 (P) = ∑ m−1i=0 p 1i · log 2 p i:m−1∑i=0m−11 ∑p i · log 2 −p ii=0l i p i =m−1∑i=0[] m−11∑p i · log 2 − logp 2 2 l i=ii=0p i · log 22 −l ip i.

3.3. KVÁZIOPTIMÁLNE KÓDY A OPTIMÁLNY KÓD 35Teraz prevedieme binárny logaritmus na prirodzený, využijeme nerovnost’ ln x ≤ x − 1 aupravíme:m−1∑i=02 −l ip i · log 2 = 1 m−1∑p i ln 2i=0[= 1 m−1 ∑2 −l i−ln 2i=0p i · ln 2−l i≤ 1 m−1∑p i ln 2m−1∑i=0p i]i=0[= 1 m−1]∑2 −l i− 1 .ln 2i=0[ 2−l i]p i · − 1 = (3.21)p iKód V je prefixový a teda z Kraftovej-McMillanovej nerovnosti vyplýva, že ∑ m−1i=0 2−l i≤1. Ked’že 2 > 1, ln 2 > 0 platí[ m−1]1 ∑2 −l i− 1 ≤ 0.ln 2i=0To však znamená, že pre l’ubovol’ný prefixový kód V = {v 0 , . . . , v m−1 } platíH 2 (P) ≤ L(P, V).Horný odhad.Dokážeme, že existuje (prefixový) kód, ktorý dosahuje cenu H 2 (P) + 1.Položíme l i = ⌈log 21p i⌉. Potom platí:m−1∑i=02 −l i=m−1∑i=02 ⌈log m−12 1 ∑⌉ p i ≤i=02 − log 2 1 p i =m−1∑i=0p i = 1;a teda existuje prefixový kód s dĺžkami kódových slov l i = ⌈log 21p i⌉, i = 0, . . . , m − 1.Cena tohto kódu jeL(P, V) =m−1∑i=0p i l i =m−1∑i=0m−11 ∑p i ⌈log 2 ⌉ ≤p ii=0[ ] m−11 ∑p i log 2 + 1 =p ii=0p i log 21p i+ 1.Vrát’me sa ešte k dôkazu rovnosti (3.20). Ak P = {p i = 2 −l i, l i ∈ N, i = 0, . . . , m − 1}je rozdelenie pravdepodobností, potom podl’a vety 3.1.2 existuje prefixový kód s dĺžkamikódových slov11⌈log 2 ⌉ = ⌈logp 2i 2 −l ⌉ = ⌈log i 2 2l i⌉ = ⌈l i ⌉ = l i ,ktorý má cenuNa druhej strane, akm−1∑i=0m−1∑i=0p i l i =p i l i =m−1∑i=0m−1∑i=0p i log 21p i.p i log 21p ito znamená, že v odvodení 3.21 nastala rovnost’. To však znamená, že 2−l ip ip i = 2 −l i(ln x = x − 1 pre x = 1).= 1, resp.

36 KAPITOLA 3. NEROVNOMERNÉ KÓDYJeden kód, ktorého cena sa vel’mi nelíši od ceny optimálneho kódu už poznáme. Jeto Shannonov kód. Konštrukcia, ktorú sme použili v dôkaze Kraftovej-McMillanovejnerovnosti však vychádzala zo znalosti dĺžok kódových slov a nie z rozdelenia pravdepodobnostízdrojových symbolov. Ukážeme, ako možno zostrojit’ Shannonov prefixovýkód pre dané rozdelenie pravdepodobností źdrojových symbolov.3.3.1 Shannonov kódVeta 3.3.2 (Shannonov kód). Nech je P = {p 0 , . . . , p m−1 } l’ubovol’né rozdelenie pravdepodobností,p 0 ≥ p 1 ≥ · · · ≥ p m−1 > 0; čísla q k ; 0 ≤ q k < 1 sú definované nasledovneq 0 = 0,q k =∑k−1p j , k = 1, . . . m − 1;a nech pre prirodzené čísla (dĺžky kódových slov) platíĎalej, nechj=0l k = ⌈lg 1/p k ⌉ pre k = 0, . . . m − 1.q k = 0.b (k)1. . . b (k)l k. . .je binárny zápis čísla q k , (k = 0, . . . , m − 1). Pre k = 0, . . . , m − 1 definujeme kódové slovow k = b (k)1. . . b (k)l k.Potom kód W = {w 0 , . . . , w m−1 } je prefixový kód, nazývaný Shannonovým kódom.Dôkaz. Dokážeme, že kód W = {w 0 , . . . , w m−1 } je prefixový. Pozrieme sa najprv nadĺžky kódových slov. Zapíšeme pravdepodobnosti zdrojových symbolov binárne:p k = a (k)1. . . a (k)l k. . . k = 0 . . . m − 1.Pripomenieme, že pre dĺžky kódových slov platí l k = ⌈lg 1/p k ⌉ k = 0 . . . m − 1. To znamená,že12 ≤ p k < 1 l k = 114 ≤ p k < 1 2l k = 218 ≤ p k < 1 l k = 34. . . . . .t.j. hodnota l k je jednoznačne určená pozíciou prvej jednotky v binárnom zápise čísla p k ;akp k = 0. 0 } .{{ . . 01}. . .s

3.3. KVÁZIOPTIMÁLNE KÓDY A OPTIMÁLNY KÓD 37tak potom 2 −s ≤ p k < 2 −s+1 , 2 s−1 < 1/p k ≤ 2 s a teda l k = s. Predpokladajme teraz, žekód W nie je prefixový. To znamená, že existujú kódové slová slová w r , w t ; r < t také, žew r je prefixom slova w t . Kódové slová w r , w t boli vytvorené z číselq r = 0.b (r)1 . . . b(r) l r. . .q t = 0.b (t)1 . . . b(t) l r. . . b (t)l t. . . ;q t = q r + p r + · · · + p t−1 .Pre pravdepodobnost’ p r však platí 2 −l r≤ p r < 2 −l r+1 . To znamená, že2 −lr ≤ p r + · · · + p t−1 .Potom sa však q t odlišuje aspoň na jednom z prvých l r miest po rádovej čiarke od q r ,lebo už pre t = r + 1 platía teda w r nie je prefixom slova w t .q r = 0.b (r)1 . . . b(r) l r. . .+ p r = 0.0 . . . 1 . . .= q r+1 ≠ 0.b (r)1 . . . b(r) l r. . .Skôr, ako ukážeme, ako sa konštruuje optimálny kód, uvedieme ešte jednu jednoduchúmetódu konštrukcie kódu, ktorého cena je blízka k cene optimálneho kódu, Fanov kód.(Shannonov a Fanov kód sa nazývajú kvázioptimálne kódy.)3.3.2 Fanov kódPredpokladáme, že je dané rozdele-Fanova konštrukcia kvázioptimálneho kódu.nie prevdepodobností P = {p 0 , . . . , p m−1 }1. usporiadame pravdepodobnosti zostupne p 0 ≥ p 1 ≥ · · · ≥ p m−1 > 0 a zapíšeme do 1.stĺpca tabul’ky. Jednotlivým pravdepodobnostiam (zastupujúcim symboly zdrojovejabecedy) priradíme prázdne slová λ.2. Ak tabul’ka obsahuje aspoň dva riadky, rozdelíme ju na 2 časti tak, aby sa súčetpravdepodobností v hornej časti tabul’ky líšil čo najmenej od súčtu pravdepodobnostív dolnej časti tabul’ky a pokračujeme krokom 3. Ak tabul’ka obsahuje jedinýriadok, jej spracovanie ukončíme.3. Slová v i priradené pravdepodobnostiam v hornej polovici tabul’ky zret’azíme spravaso znakom 0, a slová z dolnej polovice tabul’ky zret’azíme sprava so znakom 1.Pokračujeme v spracovaní hornej a dolnej časti tabul’ky podl’a kroku 2.Ked’že tabul’ka obsahuje m riadkov, krok 2 sa uplatní najviac m − 1-krát. Ilustrujemekonštrukciu Fanovho a Shannonovho kódu na nasledujúcom príklade.

38 KAPITOLA 3. NEROVNOMERNÉ KÓDYPríklad.p 0 0.25 0 00p 1 0.20 0 01p 2 0.13 1 10 100p 3 0.12 1 10 101p 4 0.10 1 11 110 1100p 5 0.08 1 11 110 1101p 6 0.07 1 11 111 1110p 7 0.05 1 11 111 1111Fanov kódp i q i l i v i0.25 0.0 2 000.20 0.010 3 0100.13 0.011 3 0110.12 0.1001 4 10010.10 0.1011 4 10110.08 0.1100 4 11000.07 0.1110 4 11100.05 0.11110 5 11110Shannonov kódFanov kód má cenu 2.85 a Sahnnonov 3.22 a entropia je 2.822. Shannonov kód ešte možnoupravit’ (skrátit’). Ked’že slovo 100 je prefixom jediného kódového slova, možno toto slovo1001 nahradit’ slovom 100; podobne možno skrátit’ kódové slovo 1011 na 101; kódovéslovo 1100 na 110 a napokon kódové slovo 11110 na 1111. Takto upravený (skrátený)Shannonov kód má cenu 2.87.3.3.3 Huffmanov optimálny kódUvedieme teraz metódu konštrukcie optimálneho kódu. Podstata Huffmanovej metódyspočíva v tom, že sa zostrojenie optimálneho kódu pre m znakov redukuje na konštrukciuoptimálneho kódu pre m − 1 znakov. Pri dôkaze budem potrebovat’ nasledujúcu lemu.Veta 3.3.3. Nech je P = {p 0 , . . . , p m−1 } l’ubovol’né rozdelenie pravdepodobností, p 0 ≥ p 1 ≥· · · ≥ p m−1 > 0. Potom existuje prefixový kód V = {v 0 , . . . , v m−1 } s dĺžkami kódovýchslov l i = l(v i ), i = 0, . . . , m − 1 optimálny pre rozdelenie pravdepodobností P, taký, žeminimálnym pravdepodobnostiam p m−2 , p m−1 zodpovedajú slová v m−2 , v m−1 maximálnejdĺžky l m−1, ktoré majú spoločný prefix dĺžky l m−1 − 1.Dôkaz. Ak by v kóde V neboli priradené slová maximálnej dĺžky minimálnym pravdepodobnostiam,kód by nebol optimálny. To znamená, že minimálnym pravdepodobnostiamp m−2 , p m−1 musia byt’ priradené slová maximálnej dĺžky. Predpokladajme, že slová

3.3. KVÁZIOPTIMÁLNE KÓDY A OPTIMÁLNY KÓD 39v m−2 , v m−1 nemajú spoločný prefix dĺžky l m−1 − 1. To znamená, že existuje slovo v j maximálnejdĺžky l m−1, ktoré má spoločný prefix dĺžky l m−1 − 1 so slovom v m−1 . V opačnomprípade by slovo v m−1 bolo možné nahradit’ jeho prefixom dĺžky l m−1 − 1, čo je v spore soptimálnost’ou kódu V. (Z podobných dôvodov musí existovat’ slovo v k maximálnej dĺžkyl m−1 , ktoré má spoločný prefix dĺžky l m−1 − 1 so slovom v m−2 .) „Zámenou“ slov v m−2 a v jdostávame kód s rovnakou cenou, ako bola cena pôvodného kódu, spĺňajúci podmienkyLemy.Teraz už môžeme vyslovit’ a dokázat’ vetu, ktorá je teoretickým zdôvodnením Huffmanovejkonštrukcie optimálneho kódu.Veta 3.3.4. Huffmanov kód. Nech V = {v 0 , . . . , v m−1 }, m > 1 je optimálny prefixový kódpre rozdelenie pravdepodobností P = {p 0 , . . . , p m−1 }, pričom p j = q 0 + q 1 a p 0 ≥ p 1 ≥ · · · ≥p m−1 ≥ q 0 ≥ q 1 > 0. Potom kód V = {v 0 . . . , v j−1 , v j+1 , . . . , v m−1 , v j 0, v j 1} je optimálny kódpre rozdelenie pravdepodobnostíP ′ = {p 0 . . . , p j−1 , p j+1 , . . . , p m−1 , q 0 , q 1 }.Dôkaz Kód V ′ je tiež prefixový a jeho cena je L(P ′ , V ′ ) = L(P, V) + p j . Aby sme ukázali,že V ′ je optimálny kód, musíme dokázat’, že pre l’ubovol’ný kód W ′ = {w 0 , . . . , w m } prerozdelenie pravdepodobností P ′ platí L(P ′ , W ′ ) ≥ L(P ′ , V ′ ) = L(P, V) + p j . Predpokladajme,že W ′ je optimálny kód pre rozdelenie pravdepodobností P ′ , ktorý naviac spĺňa podmienkyvety 3.3.3. To znamená, že minimálnym pravdepodobnostiam q 0 , q 1 zodpovedajúslová maximálnej dĺžky w1, w0. Uvažujme teraz kód W = {w 0, . . . , w j−1 , w, w j+1 , . . . ,w m−1 }pre rozdelenie pravdepodobností P. Ked’že pre rozdelenie pravdepodobností P je optimálnykód V, platí L(P, V) ≤ L(P, W). Ale potomL(P ′ , V ′ ) = L(P, V) + p j ≤ L(P, W) + p j = L(P ′ , W ′ ),a teda kód V ′ je optimálny pre rozdelenie pravdepodobností P ′ .Popíšeme metódu konštrukcie Huffmanovho kódu pre rozdelenie pravdepodobnostíP = {p 0 , . . . , p m−1 }.Konštrukcia optimálneho kódu.1. usporiadaj pravdepodobnosti p 0 , . . . , p m−1 do zoznamu zostupne. Ak m > 1 pokračujkrokom 2, ináč chod’ na krok 3.2. Opakuj m − 2 krát nasledujúcu činnost’:• sčítaj posledné dve (minimálne) pravdepodobnosti usporiadaného zoznamu;• odstráň tieto dve pravdepodobnosti zo zoznamu a zarad’ do zoznamu ich súčettak, aby bol nový zoznam usporiadaný zostupne;• zapamätaj si miesto v zozname, na ktoré bola zaradená nová hodnota.3. Zoznam obsahuje dve pravdepodobnosti; prirad’ (napríklad) väčšej z nich slovo 0 amenšej slovo 1; ak m = 1 skonči, ináč pokračuj krokom 4.4. Opakuj m − 2 krát nasledujúcu činnost’ a potom skonči:

40 KAPITOLA 3. NEROVNOMERNÉ KÓDY• urči tú pravdepodobnost’ p j v aktuálnom usporiadanom zozname, ktorá bolavytvorená ako posledná súčtom nejakých dvoch minimálnych pravdepodobnostíq 0 , q 1 ;• odstráň pravdepodobnost’ p j zo zoznamu, doplň doň pravdepodobnosti q 0 , q 1 ausporiadaj ho;• ak bolo pravdepodobnosti p j priradené slovo v, prirad’ pravdepodobnostiamq 0 , q 1 slová v0, v1.Ilustrujeme Huffmanovu konštrukciu na príklade.Príklad.0.25 0.25 0.25 0.25 0.31∗ 0.44∗ 0.56∗ 0∗ 1∗ 00∗ 01 01 01 010.20 0.20 0.20 0.24∗ 0.25 0.31 0.44 1 00 01 10∗ 11 11 110.13 0.13 0.18∗ 0.20 0.24 0.25 01 10 11 000∗ 001 0010.12 0.12 0.13 0.18 0.20 11 000 001 100 1000.10 0.12∗ 0.12 0.13 001 100 101∗ 00000.08 0.10 0.12 101 0000 00010.07 0.08 0001 10100.05 1011Huffmanov kódPravdepodobnosti, ktoré vznikli sčítaním minimálnych pravdepodobností v predchádzajúcomkroku, sú uznačené hviezdičkou. Kvôli jednoduchosti sú hviezdičkou označené ajslová prislúchajúce týmto pravdepodobnostiam.Huffmanov kód má cenu 2.85. Je zaujímavé, že aj ked’ sú Fanov a Huffmanov kódrôzne, majú rovnakú cenu. Vo všeobecnosti však Huffmanova metóda umožňuje získat’lepšie kódy ako Fanova metóda vd’aka tomu, že „preusporiadavaním“ pravdepodobnostílepšie „vyvažuje“ tabul’ku pravdepodobností. Čo však v tom prípade, ked’ je tabul’kapravdepodobností nevyvážená už na samom začiatku; ak sa jeden symbol vyskutuje vel’-mi často a ostatné zriedkavo? Uvedieme extrémny prípad a ukážeme, ako sa dá riešit’.3.3.4 Rozšírenie kóduPríklad. Zdrojová abeceda pozostáva zo symbolov {a, b} a rozdelenie pravdepodobnostíje P = {0.9, 0.1}. Optimálny kód V = {0, 1} má cenu L = 1.0 a entropia zdroja je0.4689955936. Rozdiel medzi entropiou a cenou optimálneho kódu je príliš vel’ký. Podstataproblému je v tom, že zdrojová abeceda je príliš malá a nemáme možnost’ rozlíšit’často (a) a zriedkavo (b) sa vyskytujúce symboly, ale obom sme priradili slová rovnakejdĺžky. Pri kódovaní zdrojovej abecedy s takým extrémnym rozdelením pravdepodobnostíuplatníme nasledujúci postup. Namiesto jednotlivých znakov kódovej abecedy budemekódovat’ n-tice znakov zdrojovej abecedy. Využijeme pritom predpoklady o charakterezdroja: znaky generuje nezávisle na sebe a s nemennými pravdepodobnost’ami. „Abeceda“Σ 2 s, jej rozdelenie pravdepodobností a príslušný Huffmanov kód V 2 sú uvedené vnasledujúcej tabul’ke.

3.3. KVÁZIOPTIMÁLNE KÓDY A OPTIMÁLNY KÓD 41aa 0.81 0ab 0.09 11ba 0.09 100bb 0.01 101Cena kódu V 2 je 1.29. Treba si však uvedomit’, že to je počet binárnych symbolov pripadajúcichna jedno zdrojové slovo, ktoré má dĺžku 2, a preto cena kódu, meraná počtomkódových symbolov potrebných na zakódovanie jedného symbolu zdrojovej abecedy jeL(P ′ , V ∈ ) = 1.29/2 = 0.645. Táto hodnota je už podstatne bližšia k entropii zdroja, akocena pôvodného kódu. Ďalšie rozšírenie zdrojovej abecedy (kódovanie trojznakových slovnad zdrojovou abecedou) už neprinesie takú podstatnú redukciu ceny kódu:aaa 0.729 0aab 0.081 100aba 0.081 101baa 0.081 110abb 0.009 11100bab 0.009 11101bba 0.009 11110bbb 0.001 11111L(P ′′ , V ∋ ) = 1.599/3 = 0.533. Aby sme si spravili predstavu o to, ako rýchlo sa približujecena kódu pre narastajúcu hodnotu n k entropii, vypočítame cenu neskráteného Shannonovhokódu pre rozličné hodnoty n:n 3 4 5 10 20 30 50 100 200 1000 2000L 0.6333 0.5509 0.5163 0.5070 0.5006 0.4863 0.4789 0.4741 0.4713 0.4695 0.4692Upozorňujeme, že n-násobným rozšírením (dvojprvkovej) zdrojovej abecedy dostanememnožinu slov mohutnosti 2 n , a tak je použitie tejto metódy pre konštrukciu kódov scenou blízkou k dolnej hranici danej entropiou pre väčšie hodnoty n a/alebo rozsiahlejšieabecedy zdroja prakticky nepoužitel’né.Metóda konštrukcie Huffmanovho kódu nie je jednoznačná. Ak v zozname pravdepodobnostíuž existuje hodnota rovná tej, ktorú sme dostali v niektorom kroku súčtomminimálnych pravdepodobností, máme možnost’ zaradit’ vypožčítanú pravdepodobnost’za alebo pred pravdepodobnost’ v pôvodnom usporiadanom zozname. Uplatnenímrozličných stratégií zarad’ovania rovnakých pravdepodobností do zoznamu, dostanemekódy, ktoré majú rovnakú cenu, ale môžu mat’ rozličné dĺžky kódových slov.Príklad.0.375 0.375 0.375 0.375 0.625∗ 0 1 1 1 10.250 0.250 0.250 0.375∗ 0.375 1 00 01 01 010.125 0.125 0.250∗ 0.25 01 000 001 0010.125 0.125 0.125 001 0000 00000.0625 0.125∗ 0001 000100.0625 00011

42 KAPITOLA 3. NEROVNOMERNÉ KÓDYHuffmanov kód V0.375 0.375 0.375 0.375∗ 0.625∗ 0 1 00 00 000.250 0.250 0.250∗ 0.375 0.375 1 00 01 10 100.125 0.125∗ 0.250 0.25 01 10 11 0100.125 0.125 0.125 11 010 0110.0625 0.125 011 1100.0625 111Huffmanov kód V ′ .l’ahko sa presvedčíme o tom, že L(V, P) = L(V ′ , P) = 2.375.Ktorý zo zostrojených kódov je lepší? Ak sa v nejakom texte vyskytujú zdrojové symbolys pravdepodobnost’ami zodpovedajúcimi pravdepodobnostiam z rozdelenia pravdepodobnostíP, oba kódy zakódujú daný text rovnako efektívne. Ak však kód zostrojujemena základe predpokladaného rozdelenia pravdepodobností, ktoré sa od skutočnéholíši, môže sa cena skonštruovaného kódu viac alebo menej odlišovat’ od ceny optimálnehokódu a rozdiel medzi skutočnou a minimálnou cenou bude závisiet’ aj od spôsobukonštrukcie kódu.3.3.5 Chyby v pravdepodobnostiach zdrojových symbolovPredpokladajme, že je dané rozdelenie pravdepodobností P = {p 0 , . . . , p m−1 }, na základektorého sme zostrojili Huffmanov kód V = {v 0 , . . . , v m−1 } s dĺžkami kódových slov{l 0 , . . . , l m−1 }. Nech je P ′ = {p ′ 0 , . . . , p′ m−1}, skutočné rozdelenie pravdepodobností zdrojovýchsymbolov; p ′ i= p i + e i , i = 0, . . . , m − 1, kde e i je chyba v odhade pravdepodobnosti∑výskytu i-teho symbolu. Ked’že P ′ , P sú rozdelenia pravdepodobností, platí:m−1i=0 p′ i = ∑ m−1i=0 p i + e i = 1 + ∑ m−1i=0 e i; a teda ∑ m−1i=0 e i = 0. Zistíme, aký bude rozdielcien kódu V pri rozdelení pravdepodobností P ′ a P:L(V, P ′ ) =m−1∑i=0m−1p ′ i l ∑i = (p i + e i )l i =i=0m−1∑i=0m−1∑p i l i +i=0m−1∑l i e i = L(V, P) +Zistíme, kedy nadobúda ∑ m−1i=0 l ie i extrémne hodnoty. Použijeme na to metódu Lagrangeovýchneurčitých koeficientov [13]. Vyjadríme najprv podmienky, za ktorých budemehl’adat’ extrémy funkcie ∑ m−1i=0 l ie i . Odchýlky e i od pravdepodobností výskytu symbolovbudeme chápat’ ako výsledky náhodnej premennej e; pričom P(e = e i ) = 1 m , m =0, . . . , m − 1. Potom stredná hodnota chyby jeVyjadríme disperziu chýb:Var(e) =m−1∑i=0e 2 iE(e) =(1m − 1mm−1∑i=0m−1∑i=01e im = 1 m−1∑me i) 2= 1 mm−1∑i=0i=0i=0l i e ie i = 0. (3.22)e 2 i − 0 = 1 mm−1∑i=0e 2 i = σ2 . (3.23)

3.3. KVÁZIOPTIMÁLNE KÓDY A OPTIMÁLNY KÓD 43Využijeme (3.22) a (3.23) a zostrojíme Lagrangeovu funkciu pre veličinu ∑ m−1i=0 l ie i (λ, µsú Lagrangeove neurčité koeficienty):F = 1 mm−1∑i=0l i e i + λ(1mm−1∑i=0e i)+ µ(1mm−1∑i=0e 2 i − σ2 ). (3.24)Vypočítame parciálne derivácie funkcie F podl’a e i , i = 0, . . . , m−1 a položíme ich rovnýminule:∂F∂e i= 1 m (l i − λ − 2µe i ) = 0; i = 0, . . . , m − 1. (3.25)Sčítame rovnice (3.25) a vyjadríme koeficient λ.a tedam−1∑i=01m (l i − λ − 2µe i ) = 1 m−1∑mλ = 1 mi=0m−1∑i=0l i − λ − 2µ mm−1∑i=0e i = 0;l i . (3.26)Vrátime sa k sústave rovníc (3.25). Jednotlivé rovnice vynásobíme zodpovedajúcimi hodnotamie i a výsledok spočítame cez všetky hodnoty i. DostávameUpravíme1mm−1∑i=0a určíme koeficient µ:()l i e i − λe i − 2µe 2 i = 1 m−1∑mi=0m−11 ∑l i e i = 2µ mmi=0µ = 12mσ 2 m−1l i e i − λ mm−1∑i=0e 2 i ,m−1∑i=0e i − 2µ mm−1∑i=0e 2 i = 0.∑l i e i . (3.27)Napokon vynásobíme jednotlivé rovnice sústavy (3.25) príslušnými hodnotami l i a výsledkynásobenia sčítame cez všetky i:1mm−1∑i=0)(l 2 i − λl i − 2µl i e i = 1 mm−1∑i=0i=0l 2 i − λ mDosadíme hodnoty konštánt µ, λ do (3.28) a upravíme(m−11 ∑l 2 im−i=0(m−11 ∑l 2 im−i=01m1mm−1∑i=0m−1∑i=0m−1∑i=0∑i=0l i − 2µ mm−1∑i=0) 2 (l i − 1 m−1) 2σ 2 m 2 l i e i = 0;) 2 (l i = 1 1σ 2 mm−1∑i=0l i e i) 2.l i e i = 0. (3.28)

44 KAPITOLA 3. NEROVNOMERNÉ KÓDY⎡⎣ 1 mm−1∑i=0(l 2 i − 1mm−1∑i=0) 2⎤(m−1l i⎦ · σ 2 1 ∑= Var(l)Var(e) =mi=0l i e i) 2.To znamená, že pre fixovanú hodnotu disperzie chýb, σ 2 , sa extrémne odchýlky cenykódu (v kladnom alebo zápornom smere) dosahujú pre kódy, ktoré majú vel’kú disperziudĺžok kódových slov. Ináč povedané, čím väčšie sú rozdiely v dĺžkach kódových slov,tým väčšiu ochýlku (zlepšenie alebo zhoršenie) ceny kódu môžu spôsobit’ chyby v pravdepodobnostiachjednotlivých zdrojových symbolov. Príkladom kódu so stabilnou cenou jeblokový kód, pre ktorý sa žiadne odchýlky v pravdepodobnostiach neprejavia zmenouceny kódu. (Otázne však je, či pre skutočné rozdelenie pravdepodobností bude pôvodnýkód optimálny. Tento problém naše odvodenie nerieši.)Príklad.Ilustrujeme predchádzajúce úvahy na Huffmanových kódoch z príkladu 3.3.4.Pripomíname, že sme zostrojili dva optimálne Huffmanove kódy pre rozdelenie pravdepodobnostíP, pričom kód V mal kódové slová dĺžok {1, 2, 3, 4, 5, 5} a kód V′ mal kódovéslová dĺžok {2, 2, 3, 3, 3, 3}. V prvom prípade bola disperzia dĺžok kódových slov Var(l) =209 , v druhom Var(l′ ) = 2 9. V nasledujúcej tabul’ke uvádzame príklad chýb v pravdepodobnostiachźdrojových symbolov, ktoré viedli k rozličným odchýlkam cien kódov.p i l i l ′ ie i △ i △ ′ i0.375 1 2 −0.1250 −0.1250 −0.2500.250 2 2 0 0 00.125 3 3 0 0 00.125 4 3 0 0 00.0625 5 3 +0.0625 +0.3125 +0.18750.0625 5 3 +0.0625 +0.3125 +0.18750 +0.500 +0.125Vplyv chýb v pravdepodobnostiach symbolov na cenu Huffmanovho kódu.Huffmanov kód je pomerne odolný voči malým odchýlkam v pravdepodobnostiachzdrojových symbolov. Ak chceme minimalizovat’ vplyv týchto odchýlok na cenu kódu,pri konštrukcii Huffmanovho kódu budeme zarad’ovat’ vypočítanú pravdepodobnost’ dozoznamu tak vysoko, ako sa len bude dat’.3.3.6 Kódovanie Markovovského zdrojaMatematický model, ktorý sma používali až doteraz na popis zdroja informácie, bolznačne zjednodušený. V textoch zapísaných v prirodzenom jazyku sú medzi jednotlivýmiznakmi závislosti, ktoré sme doteraz zanedbávali. Napríklad v slovenčine sa pomäkkých spoluhláskach takmer nikdy nepíše ypsilon, po tvrdých spoluhláskach zasamäkké i, v textoch sa nevyskytujú viac ako tri za sebou idúce samohlásky ani dlhé postupnostizložené zo samotných spoluhlások a pod. Popísat’ však dostatočne presne takétozákonitosti prirodzeného jazyka by bolo dost’ náročné. Pre naše potreby vystačímes omnoho jednoduchším matematickým modelom a zdroj budeme popisovat’ pomocouMarkovovských ret’azcov. Budeme predpokladat’, že zdroj S v diskrétnych časovýcho

3.3. KVÁZIOPTIMÁLNE KÓDY A OPTIMÁLNY KÓD 45okamihoch (taktoch, krokoch) generuje symboly zo zdrojovej abecedy Σ S = {s 0 , . . . , s q−1 };činnost’ zdroja budeme popisovat’ pomocou postupnosti náhodných premenných S t , t =0, . . . , 7 ktorá spĺňa nasledujúcu podmienku: pre l’ubovol’né prirodzené číslo n a l’ubovol’-né čísla i 0 , . . . , i n+1 ∈ {0, . . . , q − 1} platíP(S n+1 = s in+1 |S 0 = s i0 , . . . , S n = s in ) = P(S n+1 = s in+1 |S n = s in ). (3.29)Podmienka 3.29 vyjadruje skutočnost’, že pravdepodobnost’ výskytu symbolu v (n + 1)-vom kroku závisí len od toho, aký symbol bol na výstupe zdroja v predchádzajúcomkroku n. Postupnost’ náhodných premenných ktorá spĺňa podmienku 3.29 sa nazývaMarkovovský ret’azec. Analogicky, zdroj S ktorý spĺňa podmienku 3.29, budeme nazývat’Markovovským zdrojom. Podmienené pravdepodobnosti P(S n+1 = s in+1 |S n = s in ) sanazývajú pravdepodobnost’ami prechodu. Pravdepodobnosti prechodu vo všeobecnostizávisia od parametra n (znaky sa vyskytujú s inými pravdepodobnost’ami napríklad vhlavičkých ako v textoch programov). Budeme však predpokladat’, že pravdepodobnostiprechodu nezávisia od časového parametra n. Takýto Markovovský zdroj sa nazývahomogénny. Zdroj S popíšeme pomocou matice pravdepodobností prechodu. Kvôlizjednodušeniu zápisu budeme pravdepodobnost’ P(S n+1 = s j |S n = s k ) označovat’ symbolomp j,k . Matica pravdepodobností prechodu zdroja S bude mat’ nasledujúci tvar:M =⎛⎞p 0,0 p 1,0 . . . p q−1,0⎜ p 0,1 p 1,1 . . . p q−1,1⎟⎝⎠p 0,q−1 p 1,q−1 . . . p q−1,q−1Matica M má všetky prvky nezáporné a súčet prvkov v l’ubovol’nom riadku je rovný 1.(Takáto matica sa nazýva stochastická.) Ak poznáme symbol, ktorý sa objavil na výstupezdroja, pomocou matice pravdepodobností prechodu M vieme určit’ pravdepodobnostivýskytu symbolov na výstupe zdroja v nasledujúcom i v d’alších časových okamihoch.Nech sa v 0-tom kroku objavil na výstupe zdroja symbol s 0 . Potom sa v nasledujúcomkroku budú na výstupe zdroja objavovat’ symboly zo zdrojovej abecedy s pravdepodobnost’ami(1, 0, . . . , 0) × M = (p 0,0 , p 1,0 , . . . , p q−1,0 ).Rozdelenie pravdepodobností symbolov na výstupe zdroja v d’alšom kroku by sme vypočítaliako súčin rozdelenia pravdepodobností v 1. kroku a matice M:(p 0,0 , p 1,0 , . . . , p q−1,0 ) × M = (1, 0, . . . , 0) × M 2 .(Namiesto toho, aby sme v každom kroku prácne počítali súčin vektora a matice M,využijeme poznatok, že matica pravdepodobností prechodu po m krokoch sa rovná m-tej mocnine matice pravdepodobností prechodu po jednom kroku; M. [14].) Ilustrujemeuvedené pojmy na príklade.Príklad. Uvažujeme Markovovský zdroj S so štvorprvkovou abecedou Σ S = {a, b, c, d}.Vzt’ahy medzi symbolami sú popísané pomocou nasledujúcej matice pravdepodobností7 rozdelenie pravdepodobností symbolov s 0 , . . . , s q−1 v t-tom kroku budeme označovat’ nasledovne:{p (t)0 , . . . , p(t) q−1 }.

46 KAPITOLA 3. NEROVNOMERNÉ KÓDYprechodov:M =⎛⎜⎝0.1 0.4 0.2 0.30.5 0.1 0.2 0.20.5 0.2 0.2 0.10.6 0.1 0.2 0.1⎞⎟⎠Nech p = (1, 0, 0, 0) je rozdelenie pravdepodobností symbolov v kroku 0. Potom rozdeleniepravdepodobností symbolov v kroku 1 bude (0.1, 0.4, 0.2, 0.3). Vypočítame niekol’komocnín matice M :M 16 =M 8 =⎛⎜⎝⎛⎜⎝M 4 =M 2 =⎛⎜⎝⎛⎜⎝0.49 0.15 0.20 0.160.32 0.27 0.20 0.210.31 0.27 0.20 0.220.27 0.30 0.20 0.23⎞⎟⎠0.3933 0.2160 0.2000 0.19070.3619 0.2379 0.2000 0.20020.3597 0.2394 0.2000 0.20090.3524 0.2445 0.2000 0.2031⎞⎟⎠0.37199797 0.23084535 0.20000000 0.197156680.37092176 0.23159571 0.20000000 0.197482530.37084603 0.23164851 0.20000000 0.197505460.37059591 0.23182290 0.20000000 0.197581190.3712427184 0.2313719296 0.2000000000 0.19738535200.3712414540 0.2313728112 0.2000000000 0.19738573480.3712413650 0.2313728732 0.2000000000 0.19738576170.3712410712 0.2313730782 0.2000000000 0.1973858506V postupnosti matíc je vidiet’ istú zákonitost’—ako keby matice konvergovali k nejakejlimitnej matici. Pozrieme sa na túto skutočnost’ z iného hl’adiska. Ako ovplyvnívýskyt konkrétneho symbolu v 0-tom kroku rozdelenie pravdepodobností výskytu symboluv n-tom kroku? V nasledujúcej tabul’ke je uvedené rozdelenie pravdepodobností(náhodnej premennej) S 16 za predpokladu, že S 0 = a (b, c, d).⎞⎟⎠⎞⎟⎠p a p b p c p dS 0 = a 0.3712427184 0.2313719296 0.2000000000 0.1973853520S 0 = b 0.3712414540 0.2313728112 0.2000000000 0.1973857348S 0 = c 0.3712413650 0.2313728732 0.2000000000 0.1973857617S 0 = d 0.3712410712 0.2313730782 0.2000000000 0.1973858506Vidíme, že že rozdelenie pravdepodobností symbolov v 16-tom kroku nezávisí od toho,aký symbol bol na výstupe zdroja v nultom kroku. Markovovský zdroj popísaný v príklade3.3.6 je zvláštnym prípadom tzv. ergodického Markovovského zdroja. Definujemeergodický Markovovský zdroj formálne.

3.3. KVÁZIOPTIMÁLNE KÓDY A OPTIMÁLNY KÓD 47Definícia 3.3.1. Nech rozdelenie pravdepodobností náhodnej premennej S n konvergujek limitnému rozdeleniu pravdepodobností; t.j.limn→∞ p(n) k= p k ; k = 0, . . . , q − 1a limitné rozdelenie pravdepodobností {p 0 , . . . , p q−1 } nezávisí od počiatočného rozdeleniapravdepodobností symbolov, potom sa Markovovský zdroj nazýva ergodickým Markovovskýmzdrojom.Z hl’adiska kódovania nás zaujíma predovšetkým spomínané limitné rozdelenie pravdepodobností.Ak je zdroj S ergodický, tak takéto limitné rozdelenie pravdepodobností existujea musí spĺňat’ nasledujúci vzt’ah:(p 0 , . . . , p q−1 ) × M = (p 0 , . . . , p q−1 ). (3.30)Podmienku, ktorú musí spĺňat’ zdroj na to, aby bol ergodický, stanovuje nasledujúcaveta.Veta 3.3.5. (Markovova, [14]) Nech je S Markovovský zdroj s abecedou Σ S = {s 0 , . . . , s q−1 }a p (m)j,kje pravdepodobnost’ prechodu s j → s k po m krokoch. Ak existujú také prirodzenéčísla s > 0, k 0 ≥ 0, že ∀j, j = 0, . . . , q − 1 platí p (s)j,k 0> 0; t.j. v matici M s existuje aspoňjeden stĺpec, ktorý má všetky prvky kladné, tak potom je Markovovský zdroj S ergodický,t.j. existujú limitné pravdepodobnostilimn→∞ p(n) j,k = p k, k = 0, . . . , q − 1,nezávislé na indexe j. Postupnost’ p 0 , . . . , p q−1 je jediné nezáporné riešenie sústavy rovnícktoré vyhovuje podmienkeq−1∑p k = p j p j,k , k = 0, . . . , q − 1,j=0q−1∑p j = 1.j=0T.j. limitné rozdelenie p 0 , . . . , p q−1 je stacionárnym rozdelením pravdepodobností Markovovskéhozdroja.Poznámka. Stacionárne rozdelenie pravdepodobností je počiatočné rozdelenie pravdepodobností,pri ktorom majú všetky (náhodné premenné) S n , n = 0, . . . rovnaké rozdeleniepravdepodobností.Ak teda v matici M alebo jej niektorej nenulovej mocnine existuje stĺpec, v ktoromsú všetky prvky nenulové, potom je zdroj S ergodický a riešením sústavy (3.30) nájdemestacionárne limitné rozdelenie pravdepodobností. Pripomíname, že matica M nie je regulárna,a preto sústavu (3.30) treba riešit’ za predpokladup 0 + · · · + p q−1 = 1.

48 KAPITOLA 3. NEROVNOMERNÉ KÓDYPríklad. Nájdeme stacionárne limitné rozdelenie pravdepodobností ergodickéhoMarkovovského zdroja S z príkladu 3.3.6. (Ergodickost’ Markovovského zdroja S vyplývaz toho, že už v samotnej matici M sú všetky prvky kladné.) Riešime sústavu rovnícp a = 0.1 ∗ p a + 0.5 ∗ p b + 0.5 ∗ p c + 0.6 ∗ p dp b = 0.4 ∗ p a + 0.1 ∗ p b + 0.2 ∗ p c + 0.1 ∗ p dp c = 0.2 ∗ p a + 0.2 ∗ p b + 0.2 ∗ p c + 0.2 ∗ p dp d = 0.3 ∗ p a + 0.2 ∗ p b + 0.1 ∗ p c + 0.1 ∗ p d1 = p a + p b + p c + p dRiešením tejto sústavy je vektorP = (p a = 0.3712418301, p b = 0.2313725490, p c = 0.2000000000, p d = 0.1973856209).Poznanie limitného rozdelenia pravdepodobností možno využit’ na zostrojenie Huffmanovhokódu Markovovského zdroja S. V našom prípade by Huffmanov kód bol blokovýkód dĺžky 2 s cenou L(V, P) = 2. Huffmanov kód Markovovského zdroja S však nevyužívalvzt’ahy medzi jednotlivými symbolmi. Navrhneme efektívnejšie kódovanie Markovovskéhozdroja S . Najprv zostrojíme Huffmanove kódy V a , V b , V c , V d pre rozdelenia pravdepodobnostíP( |a), P( |b), P( |c), P( |d). Jednotlivé kódy a ich ceny sú uvedené v tabul’ke.a b c d L(V x , P)V a 001 1 000 01 1.9V b 1 001 01 000 1.8V c 1 01 000 001 1.8V d 0 100 11 101 1.6vytvorenú Markovovským zdrojom S budeme kó-Postupnost’ symbolov s i0 s i1 . . . s imdovat’ nasledovne:1. prvý symbol, s i0 zakódujeme pomocou pevne stanoveného kódu, napríklad V s0 ;2. i-ty symbol postupnosti zakódujeme pomocou kódu V si−1 ; i = 1, . . . m.Pri dekódovaní najprv dekódujeme prvý symbol,s i0 , zakódovaný pomocou kódu V s0 ; najeho základe určíme kód V si0 , ktorým je kódovaný druhý symbol, s i1 , atd’. Kód Markovovskéhozdroja budeme kvôli jednoduchosti nazývat’ Markovovským kódom.Príklad. Nech postupnost’ ababcadadca vytvoril Markovovský zdroj z príkladu 3.3.6.Jeho kódovanie je popísané v nasledujúcej tabul’ke.znak a b a b c a d a d c apoužitý kód V a V a V b V a V b V c V a V d V a V d V ckódové slovo 001 1 1 1 01 1 01 0 01 11 1Na zakódovanie postupnosti dĺžky 11 sme potrebovali 17-bitový ret’azec.

3.4. KÓDOVANIE POMOCOU ORÁKULA 49Cena kódu Markovovského zdroja závisí od cien čiastkových kódov V si a limitnéhorozdelenia pravdepodobností a dá sa vypočítat’ na základe nasledujúceho vzt’ahu:q−1∑L(M, V) = p i L(P( |s i ), V si ).i=0Porovnáme na záver cenu Hufmannovho kódu (pre limitné rozdelenie pravdepodobností),entropiu limitného rozdelenia pravdepodobností a cenu kódu Markovovskéhozdroja z predchádzajúceho príkladu.entropia limitného rozdelenia 1.945755388cena Huffmanovho kódu 2.000000000cena Markovovského kódu 1.797647058Využitím závislostí medzi jednotlivými symbolmi sme dostali cenu kódu, ktorá je výraznenižšia ako entropia limitného rozdelenia pravdepodoboností. 83.4 Kódovanie pomocou orákulaHuffmanov kód využíval to, že sme poznali rozdelenie pravdepodobností symbolov vzdrojovom texte; Markovovský kód zasa vychádzal z poznania štatistických zákonitostímedzi symbolmi, ktoré nasledovali bezprostredne za sebou. Bolo by možné zostrojit’aj iné kódy, ktoré by využívali iné zákonitosti v zdrojových textoch. Uvedieme jednuvšeobecnú metódu kódovania, tzv. kódovanie s predpoved’ou, ktorá zahŕňa viacerošpeciálnych prípadov. Podstata tejto metódy spočíva v nasledujúcom (Obr. 3.3): ZdrojS generuje binárnu postupnost’ α = a 0 a 1 . . . , orákulum O 1 sa pokúša „uhádnut’“ výstupzdroja S a generuje binárnu postupnost’ β = b 0 b 1 . . . . Obe postupnosti sa následnesčítavajú bit po bite modulo 2 a výsledná postupnost’ {a i ⊕ b i } i≥0 vstupuje do kódera.Ak sa orákulu podarí „uhádnut’“ správne hodnotu symbolu a i generovaného zdrojom,a i ⊕ b i = 0. Postupnost’ α ⊕ β vstupujúca do kódera pozostáva zo súvislých postupnostípozostávajúcich zo samých núl, ktoré sú oddelené jednotkami. Kóder zakóduje pozíciejednotiek a pošle ich po prenosovom kanáli príjemcovi. Dekóder príjemcu transformujekódovanú správu opät’ do tvaru postupností núl oddelených jednotkami;{a i ⊕ b i } i≥0 . Tátopostupnost’ vstupuje do člena realizujúceho sčítanie modulo 2, v ktorom sa sčítava svýstupom orákula O 2 generujúceho tú istú binárnu postupnost’ β = b 0 b 1 . . . ako orákulumO 1 . Výsledkom je postupnost’ {a i ⊕ b i ) ⊕ b i } i≥0 = {a i } i≥0 ; t.j postupnost’ generovanázdrojom S. Doplníme niektoré predpoklady a ukážeme, aké výsledky sa dajú dosiahnut’omocou kódovania s predpoved’ou. Predpokladáme, že orákulump O 1 „uhádne“ správnyvýsledok (jeden bit generovaný zdrojom S ) s pravdepodobnost’ou p a generuje opačnúhodnotu s pravdepodobnost’ou q = 1 − p. Ďalej predpokladáme, že výsledok hádaniasymbolu v i-tom kroku neovplyvní výsledok hádania v d’alších krokoch.Pozrime sa teraz na kódovanie postupnosti {a i ⊕b i } i≥0 . V závislosti od kvality orákula(vyjadrenej pravdepodobnost’ou p) budú sa v binárnej postupnosti vyskytovat’ kratšie8 ktorá závislosti medzi jednotlivými symbolmi nezohl’adňuje.

50 KAPITOLA 3. NEROVNOMERNÉ KÓDY✓✏ ✓✏✓✏S ✲ + ✲ kóder ✲ dekóder ✲ + ✲✒✑ ✒✑✒✑✓✏ ✻✓✏ ✻O 1O 2✒✑✒✑Obrázok 3.3: Kódovanie s predpoved’oualebo dlhšie postupnosti núl ukončené jednotkami:α ⊕ β = 000001001100000000000010000100000010010010100011...Takúto postupnost’ možno jednoznačne určit’ postupnost’ou prirodzených čísel, n 0 , n 1 , . . .vyjadrujúcich dĺžky nulových podpostupností. Pre vyššie uvedenú binárnu postupnost’α ⊕ β bude postupnost’ prirodzených čísel vyzerat’ nasledovne:5, 2, 0, 12, 4, 6, 2, 2, 1, 3, 0, . . . .Existuje viacero možností kódovania postupnosti n 0 , n 1 , . . . . Kvôli jednoduchosti použijemena začiatok blokový kód dĺžky k. Ked’že binárne slovo dĺžky k dokáže rozlíšit’ 2khodnôt, postupnosti 0 n 1 kde n ≥ 2 k sa už pomocou jedného kódového slova nedajú zakódovat’.Označíme symbolom C kódovú transformáciu realizovanú kóderom, potom Cmožno definovat’ nasledovne:{ n ak n < 2C(0 n k − 1,1) =2 k − 1C(0 n−2k +1 ) ak n ≥ 2 k − 1.Binárna postupnost’0 } .{{ . . 0}0 } .{{ . . 0}0 } .{{ . . 0}12 k −1 2 k −1 2 k −2bude kódovaná binárne zapísanou trojicou čísel 2 k − 1, 2 k − 1, 2 k − 2 dĺžky 3k. Už z tohtojednoduchého príkladu je zrejmé, že efektívnost’ kódovania s predpoved’ou bude závisiet’od výberu parametra k. Ukážeme, ako na základe p vybrat’ optimálnu hodnotu parametrak. Postupnosti 0 j 1 sa vyskytujú s pravdepodobnost’ami p j q j = 0, 1, . . . . Ked’že∑p j q = q ∑ p j =q1 − p = 1,j≥0 j≥0množina postupností {0 j 1} j≥0 s pravdepodobnost’ami P(0 j 1) = p j q tvorí pravdepodobnostnýpriestor. Vypočítame dĺžky kódov jednotlivých postupností a potom určíme strednúhodnotu dĺžky kódovej postupnosti potrebnej na zakódovanie jednej postupnosti 0j 1. Vnasledujúcej tabul’ke sú uvedené dĺžky kódov postupností 0j 1 pre jednotlivé hodnoty j(označme kvôli zjednodušeniu zápisu symbolom m hodnotu 2 k − 1):dĺžka postupnosti dĺžka kódu0 . . . m − 1 km . . . 2m − 1 2k2m . . . 3m − 1 3k

3.4. KÓDOVANIE POMOCOU ORÁKULA 51Stredná hodnotu dĺžky kódovej postupnosti potrebnej na zakódovanie jednej postupnosti0 j 1 je[] []k q + pq + · · · + p m−1 q + 2k p m q + p m+1 q + · · · + p 2m−1 q +[]+3k p 2m q + p 2m+1 q + · · · + p 3m−1 q + · · · = kq 1 − pm []1 + 2p m + 3 2m + . . . =1 − pk=1 − q m .Na zaklade výrazuvýpočet minima výrazuk1−q mk1−q mnájdeme optimálnu hodnotu dĺžky bloku k. Ked’že analytickýby mohol byt’ príliš zložitý,(1 − p 2k −1 ) −1+kp 2k −1 2 k ln(2) ln(p)(1 − p 2 k −1 ) 2= 0vypočítame hodnoty výrazuk1−q m pre rozličné p a k a určíme optimálne k:p 0.5 0.6 0.7 0.8 0.9 0.95 0.99 0.999k = 1 2.0 2.5 3.3 5.0 10 20 100 1000k = 2 2.29 2.55 3.04 4.09 7.38 14.02 67.33 667.33k = 3 3.02 3.09 3.27 3.80 5.75 9.94 44.16 429.86k = 4 4.00 4.00 4.02 4.15 5.04 7.45 28.58 268.54k = 5 5.00 5.00 5.00 5.00 5.20 6.28 18.68 163.72k = 6 6.00 6.00 6.00 6.00 6.00 6.24 12.79 98.22k = 7 7.00 7.00 7.00 7.00 7.00 7.01 9.71 58.66k = 8 8.00 8.00 8.00 8.00 8.00 8.00 8.66 35.52k = 9 9.00 9.00 9.00 9.00 9.00 9.00 9.05 22.48k = 10 10.00 10.00 10.00 10.00 10.00 10.00 10.00 15.61k = 11 12.63

52 KAPITOLA 3. NEROVNOMERNÉ KÓDY

Kapitola 4Metódy kompresie údajov4.1 Slovníkové metódy kompresie dátV tejto kapitole uvedieme niektoré slovníkové metódy kompresie dát. Tieto metódy sasnažia využit’ na kompresiu skutočnost’, že v dátach sa častokrát opakujú rovnaké postupnostiznakov.4.2 LZ77Autormi tohto algoritmu sú Lempel a Ziv (v roku 1977). Mnohé d’alšie slovníkové algoritmyboli inšpirované práve LZ77. Pri popise algoritmu budeme používat’ nasledujúcepojmy:• Pozícia – aktuálna pozícia, na ktorej sa pri kódovaní/dekódovaní nachádzame. Začínamena prvom znaku a postupne pokračujeme až k poslednému znaku vstupnéhotextu.• Okno – posledných w spracovaných znakov (pri kompresii). Znak na pozícii sa dookna už nepočíta.• Buffer – postupnost’ znakov vo vstupnom texte začínajúca pozíciou.4.2.1 Kompresia (kódovanie)Označme vstupný (komprimovaný) text T a nech jeho dĺžka je n. Nech p ∈ {0, . . . , n − 1}označuje pozíciu. To znamená, že okno je postupnost’ (podret’azec) T[p − w, . . . , p − 1] abuffer T[p, . . . , n − 1]. Ak p < w, tak je okno, prirodzene, kratšie. Hlavná myšlienkaalgoritmu spočíva v tom, že hl’adáme najdlhší ret’azec v okne, ktorý je zároveň prefixombuffra. Teda hl’adáme maximálne k ≤ n − p také, že existuje i ∈ {p − w, . . . , p − k}:T[i, . . . , i + k − 1] = T[p, . . . , p + k − 1]. (4.1)53

54 KAPITOLA 4. METÓDY KOMPRESIE ÚDAJOVp-wip……………oknobufferPostup pri kompresii je nasledujúci:1. p = 12. pokial’ je p < n opakujeme:(a) nájdeme i a k podl’a (4.1)(b) výstupom je trojica〈i − (p − w) + 1, k, T[p + k]〉(c) p ← p + k + 1Prvý člen vo výstupnej trojici označuje index v okne, číslovaný pre aktuálne okno od1, kde začína nájdený najdlhší zhodný ret’azec. Tento spôsob zaručuje, že index je vždyprvok z {1, . . . , w}. Uvedený postup nerieši niektoré situácie, ktoré pri kompresii môžunastat’. Prípad k = 0 nastane, ak sa v okne nenachádza znak T[p]. Vtedy dáme na výstuptrojicu 〈0, 0, T[p]〉. Ak najdlhší podret’azec „vyčerpá“ všetky znaky z buffra, t.j. k = n − p,tak zhodu skrátime o 1 a na výstup dáme trojicu 〈i − (p − w) + 1, k − 1, T[n − 1]〉.Príklad: Nech T = aababbcbababcb (n = 14). Tabul’ka ukazuje priebeh činnosti algoritmu,pričom zhoda udáva najdlhší nájdený ret’azec v okne. Vzhl’adom na malý rozsahpríkladu nie je vel’kost’ okna obmedzená.p T[p] zhoda výstup0 a − 〈0, 0, a〉1 a a 〈1, 1, b〉3 a ab 〈2, 2, b〉6 c − 〈0, 0, c〉7 b bab 〈3, 3, a〉11 b bcb 〈6, 2, b〉4.2.2 Dekompresia (dekódovanie)Dekóvanie je jednoduché. Podobne ako pri kódovaní si budujeme a udržiavame okno, vtomto prípade to bude posledných w znakov daných na výstup. Na začiatku je, prirodzene,prázdne. Postupne čítame trojice zo vstupu a na výstup dáme príslušný ret’azec z okna(určený indexom a dĺžkou) doplnený znakom z trojice. Ak má vstupná trojica tvar〈0, 0, x〉, tak je výstupom samotný znak x.

4.2. LZ77 554.2.3 PoznámkyLZ77 je relatívne rýchly algoritmus, pričom dekódovanie je ovel’a rýchlejšie ako kódovanie,ked’že nie je potrebné vyhl’adávat’ najdlhší zhodný podret’azec a len sa „vypisuje“.Podstatnou z hl’adiska rýchlosti kódovania a dosiahnutého kompresného pomeru jevol’ba vel’kosti okna. Dlhé okno umožňuje nachádzat’ lepšie zhody, ale zároveň podstatnezvyšuje časovú zložitost’ kódovania. Navyše, dlhšie okno zvyšuje počet bitov potrebnýchna zápis indexu a dĺžky vo výstupe (prvý a druhý prvok výstupnej trojice). Krátke oknonaopak „zahadzuje“ potenciálne cenné informácie o prechádzajúcej podobe textu skoro,čím obmedzuje možnost’ nájst’ dlhšie ret’azce zhody a predlžuje výstupný text. Na druhejstrane krátke okno znižuje časovú zložitost’ a dovol’uje použit’ na zápis indexu a dĺžkymenší počet bitov.Použitie okna v LZ77 zabezpečuje, že algoritmus je orientovaný na využitie poslednevidených znakov. Teda charakteristiky zo začiatku textu neberieme do úvahy. To môžebyt’ pri niektorých typoch dát podstatnou výhodou.LZ77 je možné rôzne modifikovat’ – použit’ cyklické okno, variabilne menit’ vel’kost’okna a podobne. Medzi významnejšie úpravy patrí spracovanie výstupu d’alšími algoritmami.Dá sa očakávat’, že žiadna z troch súradníc výstupnej trojice nie je rovnomernedistribuovanou náhodnou premennou. Preto môžeme použit’ štatistické kódovanie (napr.Huffmanovo, aritmetické) na následnú transformáciu jednotlivých „stôp“ výstupu.4.2.4 LZSSDôležitým algoritmom odvodeným z LZ77 je LZSS. LZSS rieši problém znakov, ktoré sanevyskytujú v okne inak ako LZ77. LZSS si stanoví, akú minimálnu dĺžku musí mat’ret’azec zhody. Ak je nájdený ret’azec kratší, tak na výstup ide samotný znak (T[p])a posunieme pozíciu d’alej. Ak má ret’azec dostatočnú dĺžku, dáva na výstup dvojicu〈i − (p − w), k〉 (bez d’alšieho znaku, preto aj posun p je iný: p ← p + k). Teda LZSS dávana výstup dva typy informácií. Aby ich bolo možné rozlíšit’ pri dekódovaní, pridáme predoba typy identifikačný bit.Uved’me príklad činnosti LZSS pre vstupný text T = aababbcbababcb (rovnaký akov príklade pre LZ77). Minimálna požadovaná vel’kost’ zhody je 2.p T[p] zhoda výstup0 a − 0, a1 a a 0, a2 b − 0, b3 a ab 1, 〈1, 2〉5 b b 0, b6 c − 0, c7 b bab 1, 〈2, 3〉10 a ab 1, 〈1, 2〉12 c cb 1, 〈6, 2〉LZSS vo všeobecnosti dosahuje lepšie kompresné pomery ako LZ77, s porovnatel’ný-

56 KAPITOLA 4. METÓDY KOMPRESIE ÚDAJOVmi pamät’ovými a časovými nárokmi. Dekódovanie je vel’mi jednoduché a rýchle. Pretoslúži ako základ pre d’alšie známe algoritmy – ARJ (kombinácia LZSS s Huffmanovýmkódovaním), PKZip a pod. Odlišnosti iných algoritmov môžu spočívat’ vo vel’kosti okna,v spracovaní výstupov (pozícií) a znakov štatistickým kódovaním (napr. Huffmanovým),v spôsobe posunu okna a jeho premenlivej vel’kosti, v spôsobe určenia minimálnej dĺžkyret’azca zhody a pod.4.3 LZWAutorom algoritmu je Welch (1984). LZW je v podstate vylepšením algoritmu LZ78.Špeciálna implementácia LZW sa používa na kompresiu v grafickom formáte GIF. Inývariant používa utilita compress v UNIXových systémoch. Algorimus si počas spracovávaniavstupu buduje slovník, ktorý využíva na kódovanie. Pri popise algoritmu budemepoužívat’ nasledujúce pojmy:• Slovník – postupnost’ ret’azcov• Kódové slovo – index (pozícia) konkrétneho ret’azca v slovníku4.3.1 Kompresia (kódovanie)Symbolom + označíme zret’azenie dvoch ret’azcov, teda x + y označuje zret’azenie ret’azcovx a y. Nech D je slovník kódových slov a nech D(x) označuje kódové slovo ret’azca xv slovníku D. Postup pri kódovaní je nasledujúci:1. zaradíme všetky znaky abecedy do D2. p ← (inicializujeme p ako prázdny ret’azec)3. pokial’ nie sme na konci vstupu:(a) c ← d’alší znak zo vstupu(b) ak je p + c v D:p ← p + c(c) inak:dáme na výstup D(p)pridáme p + c do Dp ← c4. dáme na výstup D(p)Poznamenajme, že uvedený postup nepočíta s prázdnym vstupom. Demonštrujme sipostup kódovania LZW na príklade.

4.3. LZW 57Príklad: Nech T = aababbcbababcb je vstupný text. Tabul’ka ukazuje priebeh činnostialgoritmu, pričom stĺpec „slovník“ uvádza kódové slovo a prislúchajúci ret’azec pridanýdo slovníka v danom kroku výpočtu. Na začiatku obsahuje slovník tri znaky. Stĺpec prehodnotu p udáva túto hodnotu na konci spracovania vstupného znaku v premennej c.c slovník p výstup0, a1, b2, ca − aa 3, aa a 0b 4, ab b 0a 5, ba a 1b − abb 6, abb b 4c 7, bc c 1b 8, cb b 2a − bab 9, bab b 5a − bab − babc 10, babc c 9b − cb− 84.3.2 Dekompresia (dekódovanie)Dekódovanie prebieha analogicky ako kódovanie. Konštruujeme slovník, ktorý následnepoužívame na dekódovanie a ret’azce zodpovedajúce kódovým slovám dávame na výstup.Na začiatku je opät’ slovník naplnený všetkými znakmi abecedy.Pri dekódovaní môžu nastat’ dva prípady: kódové slovo sa v slovníku nachádza alebonie. Ak je vstupné kódové slovo už v slovníku, vieme dat’ na výstup príslušný ret’azec.Zároveň vieme, že pred kódovaním tohto ret’azca sme do slovníka zaradili ret’azec, ktorýaj teraz potrebujeme do D dostat’. Tento ret’azec pozostáva z ret’azca určeného prechádzajúcimkódovým slovom a prvým znakom ret’azca určeného aktuálnym kódovým slovom.Druhý prípad (vstupné kódové slovo nie je v slovníku) môže nastat’, lebo budovanieslovníka je pri dekódovaní oneskorené. Nastane však len v tom prípade, ked’ pri kódovanídáme na výstup kódové slovo, ktoré bolo do slovníka pridané ako posledné. Tovšak znamená, že v texte sa vyskytoval za sebou dvakrát rovnaký ret’azec. Preto jeprvý znak ret’azca prislúchajúceho vstupnému kódovému slovu zhodný s prvým znakomret’azca určeného predchádzajúcim kódovým slovom. Teda vieme, aký ret’azec potrebujemepridat’ do slovníka a následne aj vypísat’ na výstup. Nasledujúce obrázky ilustrujúoba uvedené prípady (označenia sú prebrané z nižšie uvedeného popisu algoritmu).

58 KAPITOLA 4. METÓDY KOMPRESIE ÚDAJOVp’c’……cdo slovníkap’…cdo slovníkac’= p’…Pre zjednodušenie zápisu označme D(x ′ ) ret’azec prislúchajúci kódovému slovu x ′ , tedaopačné zobrazenie ako pri kódovaní. Postup pri dekódovaní je nasledujúci (premennés čiarkou označujú kódové slová, bez čiarky sú to ret’azce):1. zaradíme všetky znaky abecedy do D2. c ′ ← prvé kódové slovo zo vstupu3. dáme na výstup D(c ′ )4. pokial’ nie sme na konci vstupu:(a) p ′ ← c ′(b) c ′ ← d’alšie kódové slovo zo vstupu(c) ak je D(c ′ ) v D:dáme na výstup D(c ′ )p ← D(p ′ )c ← prvý znak z D(c ′ )pridáme p + c do D(d) inak:p ← D(p ′ )c ← prvý znak z D(p ′ )dáme na výstup p + c (zhodné s D(c ′ ))pridáme p + c do DPríklad: Nech abeceda je {a, b, c} a nech postupnost’ kódových slov (0, 0, 1, 4, 1, 2, 8, 9, 3)je vstupný text. Poznamenajme, že postupnost’ je na začiatku zhodná s výstupom predchádzajúcehopríkladu (pre kontrolu) a na záver sa odlišuje (pre lepšiu demonštráciupostupu). Tabul’ka ukazuje priebeh činnosti algoritmu pri dekódovaní. Stĺpce p, p′ a czobrazujú hodnoty premenných na konci spracovania vstupného kódového slova.

4.4. ARITMETICKÉ KÓDOVANIE 59vstup p ′ p c slovník výstup0, a1, b2, c0 − a0 0 a a 3, aa a1 0 a b 4, ab b4 1 b a 5, ba ab1 4 ab b 6, abb b2 1 b c 7, bc c8 2 c c 8, cc cc9 8 cc c 9, ccc ccc3 9 ccc a 10, ccca aa4.3.3 PoznámkyVýhoda LZW oproti LZ77 spočíva najmä v rýchlosti kódovania, pretože sa porovnávamenší počet ret’azcov. Modifikácie LZW môžu zahŕňat’ premenlivú dĺžku zápisu kódovýchslov (v závislosti na aktuálnej vel’kosti D), odstraňovanie starých ret’azcov zoslovníka a podobne.4.4 Aritmetické kódovanieAritmetické kódovanie je alternatívou k Huffmanovmu kódovaniu. Odstraňuje niektoréjeho nedostatky – oddel’uje pravdepodobnostný model zdroja od procesu kódovania (pretosa dá l’ahšie upravit’ na adaptívnu verziu) a nevyžaduje celý počet bitov na kódovaniekaždého znaku (preto je v situáciach ako p a = 1 10 , p b = 9 10výhodnejšie). Spoločnou črtouaritmetického a Huffmanovho kódovania je rovnaký model zdroja – pravdepodobnostivýskytov znakov zdrojovej abecedy (nezávislé). Ked’že pri kódovaní nevyužívajú žiadnekontextové informácie (pozičné závislosti znakov), zvyknú sa označovat’ ako „zero-ordercoders“. Do tejto skupiny patrí aj Shannonov-Fanov kód.4.4.1 Kompresia (kódovanie)Pri kompresii najskôr určíme pravdepodobnosti výskytu jednotlivých znakov zdrojovejabecedy. Nech {c 1 , c 2 , . . . c n } je zdrojová abeceda a nech p 1 , p 2 , . . . p n sú príslušné pravdepodobnosti.Proporčne, podl’a pravdepodobností rozdelíme interval 〈0, 1) na n častí:I 1 = 〈0, p 1 )I 2 = 〈p 1 , p 1 + p 2 )I 3 = 〈p 1 + p 2 , p 1 + p 2 + p 3 ).I n = 〈p 1 + p 2 + · · · + p n−1 , 1).

60 KAPITOLA 4. METÓDY KOMPRESIE ÚDAJOVOznačme p ′ k = ∑ ki=1 p i, pričom p ′ 0= 0. Zároveň symbolom |〈d, h)| označíme dĺžkuintervalu, t.j. hodnotu h − d. Algoritmus na začiatku vychádza z intervalu I = 〈0, 1). Poprečítaní prvého znaku sa interval zúži na príslušnú čast’, podl’a tohto znaku. Teda akje znak na vstupe c k , zúžime interval na I k . Čítaním d’alších znakov nad’alej intervalzužujeme:cI = 〈d, h) ↦−→k〈d + p′k−1 |I|, d + p ′ k |I|). (4.2)Výstupom je l’ubovol’né číslo z výsledného intervalu (najlepšie to, ktoré má najkratšízápis). Hlavná myšlienka spočíva v tom, že znaky, ktoré majú vysokú pravdepodobnost’,zužujú interval najmenej. Čím je interval menší, tým viac bitov potrebujeme na zápisniektorého z čísel, ktoré doň patria (očakávaný počet potrebných bitov je log 21|I| ).1. I ← 〈0, 1)2. pokial’ nie sme na konci vstupu(a) načítame d’alší znak – c k(b) upravíme interval I podl’a (4.2)3. dáme na výstup l’ubovol’né číslo z intervalu IPríklad: Nech vstupným textom je ret’azec aababbcbababcb. Potom pravdepodobnostivýskytu jednotlivých znakov zdrojovej abecedy {a, b, c} sú p a = 5 14 , p b = 7 14 a c = 2 14 .Nasledujúca tabul’ka ukazuje zmenu intervalu I počas spracúvania vstupu. Dolné ahorné hranice sú počítané na 14 desatinných miest.c I〈0 , 1)a 〈0, 00000000000000 , 0, 35714285714286)a 〈0, 00000000000000 , 0, 12755102040816)b 〈0, 04555393586006 , 0, 10932944606414)a 〈0, 04555393586006 , 0, 06833090379009)b 〈0, 05368856726364 , 0, 06507705122865)b 〈0, 05775588296543 , 0, 06345012494794)c 〈0, 06263666180758 , 0, 06345012494794)b 〈0, 06292718435771 , 0, 06333391592789)a 〈0, 06292718435771 , 0, 06307244563277)b 〈0, 06297906338452 , 0, 06305169402205)a 〈0, 06297906338452 , 0, 06300500289792)b 〈0, 06298832749645 , 0, 06300129725315)c 〈0, 06299944443076 , 0, 06300129725315)b 〈0, 06300010615304 , 0, 06300103256424)Potom napríklad číslo 0, 063000679016 . . . je z výsledného intervalu a jeho binárny rozvojje 0, 00010000001000001101. Teda výsledkom kódovania je uvedený dvadstat’bitový ret’azec(bez 0 pred desatinnou čiarkou). Len pre porovnanie, Huffmanov kód potrebuje 21 bitov(a = 10, b = 0, c = 11).

4.4. ARITMETICKÉ KÓDOVANIE 61Spracovanie vstupu bca ilustruje aj nasledujúci obrázok:hcb c abda4.4.2 Dekompresia (dekódovanie)Pri dekódovaní postupujeme analogicky, ako pri kódovaní. Na začiatku nastavíme intervalI = 〈0, 1). Na vstupe máme číslo x ∈ I. Pre zistenie prvého znaku je potrebnéurčit’, v ktorom z potenciálnych n intervalov I 1 , . . . , I n sa x nachádza. Príslušný interval(povedzme I k ) určuje znak (c k ) a zároveň umožní zúžit’ I (I ↦→ I k ).Podobne postupujeme d’alej. Pre aktuálny interval I určujeme k také, že x je prvkomintervalu, ktorý toto k „vyrobí“ z intervalu I podl’a (4.2). Na výstup dáme c k a zúžime I.Otázkou je, ako zistit’, že sme už dekódovali posledný znak. Možné sú dve riešenia:1. Pridáme do abecedy špeciálny znak „EOF“ (koniec súboru) a pri dekódovaní postupujemeaž dovtedy, kým tento znak nedekódujeme.2. Spolu s výsledným číslom dáme pri kódovaní na výstup aj dĺžku kódovaného ret’azca.Teda dekóder skončí po vypísaní daného počtu znakov.4.4.3 Implementačné poznámkyAritmetické kódovanie môžeme efektívne realizovat’ pomocou celočíselnej aritmetiky.Interval 〈0, 1) nahradíme intervalom celých čísel, napríklad 〈0x0000, 0xffff) (vyjadrenéhexadecimálne, teda 〈0, 65535). Základné pozorovanie, ktoré umožní ostat’ počas celéhovýpočtu len v tomto intervale: ak sa začiatočné čísla (napr. bity) dolnej a hornej hraniceaktuálneho intervalu zhodujú, už ostanú rovnaké. Dôvod je prostý: interval sa počaskódovania zužuje, preto zhody na začiatku sa už nezmenia. To znamená, že ak takútozhodu zaznamenáme, môžme ju z oboch hraníc intervalu odstránit’ (a dat’ na výstup).Napríklad, ak po úprave intervalu dostaneme h = 0x6807 a d = 0x4af1, tieto sazhodujú na prvých dvoch bitoch (01), ktoré dáme na výstup a následne upravíme hranice– h = 0xa01f, d = 0x2bc4. Hornú hranicu dopĺňame jednotkami a dolnú nulami.Prirodzene, dekóder musí pri práci s intervalmi aplikovat’ rovnaký postup.Problém môže nastat’, ak pri zužovaní intervalu dostávame (binárne) h = 1000zzz ad = 0111www. V takomto prípade nielen nevieme čo dat’ na výstup (kam sa nakoniec„preklopí“ najvyšší bit), ale aj strácame presnost’ (dĺžku intervalu). Riešenie spočíva vtom, že v týchto situáciach odstránime úvodné nulové bity z h a úvodné jednotkové z d:

62 KAPITOLA 4. METÓDY KOMPRESIE ÚDAJOVh = 1zzz a d = 0www. Popritom si zapamätáme počet takto odstránených bitov a ked’sa najbližšie zhodnú najvyššie bity hraníc, budeme vediet’, kol’ko a akých bitov dat’ navýstup.4.4.4 PoznámkyAritmetické kódovanie, podobne ako Huffmanovo sa zvyčajne nepoužíva samostatne, alevystupuje ako súčast’ zložitejších kompresných algoritmov (najčastejšie ako záverečnáfáza). Môžeme ho kombinovat’ so slovníkovými metódami (napr. LZARI je kombináciaLZSS a aritmetického kódovania), v štatistických metódach vyšších rádov (napr. PPM)aj v iných metódach (pozri napr. čast’ 4.5).Problémom aritmetického kódovania je rýchlost’ – ktorá nie je príliš vel’ká. Kompresnýpomer je zvyčajne o čosi lepší ako pri Huffmanovom kódovaní (ale nie o vel’a).Jednoduché je modifikovat’ aritmetické kódovanie na adaptívnu verziu. Jednoducho začnemes rovnomerne distribuovanými pravdepodobnost’ami a každý načítaný znak zovstupu najskôr spracujeme (zúžime interval), a potom príslušne upravíme pravdepodobnosti(teda zväčšíme početnost’ tohto znaku). Samozrejme, aj Huffmanovo kódovanie jemožné upravit’ na adaptívne, avšak nie tak priamočiaro.Adaptívne verzie aritmetického alebo Huffmanovho kódovania majú výhodu v tom,že nie je potrebné prenášat’ frekvenčnú tabul’ku znakov a pri kódovaní nemusíme čítat’vstup dvakrát (najskôr na zistenie frekvenčnej tabul’ky a potom na samotné kódovanie).4.5 BWTBWT (Burrows-Wheeler Transformation) v podstate nie je algoritmus na kompresiu dát.Je to invertovatel’ná transformácia, ktorá ret’azec znakov transformuje na iný ret’azecznakov. Výstupný ret’azec je potom vhodnejší na kompresiu ako pôvodný ret’azec. Metódakompresie dát využíva BWT ako úvodnú transformáciu, nasledovanú napríklad MTF(pozri čast’ 4.5.3) a štatistickým kóderom nultého rádu tak, ako je to zobrazené naobrázku. Prirodzene, možné sú aj d’alšie modifikácie.vstupBWTMTFARIHUFvýstup4.5.1 KódovanieTransformácia pracuje nad blokom dát (ret’azcom znakov) dĺžky n. Vytvoríme z ret’azcan ret’azcov dĺžky n tak, že vstupný ret’azec rotujeme. Získané ret’azce utriedime. Výstupomtransformácie je ret’azec pozostávajúci z posledných znakov v ret’azcoch (teda ak

4.5. BWT 63prejdeme v poradí utriedenia po ret’azcoch a vypíšeme ich posledné znaky) a z pozíciepôvodného vstupného ret’azca medzi utriedenými ret’azcami.Hlavná myšlienka BWT spočíva v tom, že rovnaké kontexty (podret’azce vstupu) súzvyčajne uvádzané rovnakými znakmi (je to podobná úvaha ako pri znakoch za kontextami).Rovnaké kontexty dáme k sebe triedením. Znaky, ktoré sú pred týmito kontextamisú na konci ret’azcov. Teda na konci ret’azcov môžeme očakávat’ častý výskyt rovnakýchznakov vedl’a seba.Príklad: Nech vstupným textom je ret’azec aababbcbababcb. Potom utriedenie jednotlivýchrotácií dopadne takto (i označuje pozíciu začínajúceho znaku v pôvodnom ret’azci):i ret’azec0 aababbcbababcb1 ababbcbababcba8 ababcbaababbcb3 abbcbababcbaab10 abcbaababbcbab13 baababbcbababc7 bababcbaababbc2 babbcbababcbaa9 babcbaababbcba4 bbcbababcbaaba11 bcbaababbcbaba5 bcbababcbaabab12 cbaababbcbabab6 cbababcbaababbVýstupom z BWT je v tomto prípade ret’azec babbbccaaaabbb a pozícia, na ktorej sanechádza pôvodný ret’azec, teda 0.4.5.2 DekódovaniePri dekódovaní máme k dispozícii ret’azec zložený z posledných znakov utriedenýchret’azcov a index, kde treba hl’adat’ pôvodný ret’azec. Modelujme dekódovanie na tabul’ke,akú sme použili v príklade kódovania. Teda poznáme posledný stĺpec znakov. Poznámeaj prvý stĺpec, stačí znaky len utriedit’.Pozrime sa na posledný znak v prvom riadku (inými slovami prvý znak v poslednomstĺpci). Nech je to x. Vieme, že toto x je ten istý znak, ktorý sa ako prvé x vyskytne vprvom stĺpci. Dôvod je ten, že za ním v ret’azci nasleduje lexikograficky najmenší ret’azec(inak by nebol v prvom riadku) a najmenší ret’azec spomedzi ostatných začínajúcich xmusí nasledovat’ aj za znakom, ktorý je prvým výskytom x v prvom stĺpci (inak by tonebol prvý výskyt). Túto pozíciu x v prvom stĺpci si označme ako obsadenú.Zoberieme druhý znak v poslednom stĺpci, nech je to y. Opät’ hl’adáme v prvom stĺpciprvý neobsadený výskyt znaku y. Postupujeme takto d’alej, až kým neurčíme pre všetky

64 KAPITOLA 4. METÓDY KOMPRESIE ÚDAJOVznaky z posledného stĺpca, ktorým znakom z prvého stĺpca zodpovedajú.Teraz rekonštruujeme ret’azec v prvom riadku. Ked’že vieme, že posledný znak vriadku je v ret’azci pred prvým znakom v riadku, dokážeme spätne prejst’ a odzadurekonštruovat’ požadovaný ret’azec. Potom ho stačí len zrotovat’, utriedit’ a vybrat’ výstupnýret’azec zo správnej pozície.Drobný problém v prezentovanej rekonštrukcii by mohol nastat’, ak sú prvý znaka posledný v prvom riadku zhodné. Potom ale celý ret’azec obsahuje len tento znak amôžeme sa podl’a toho zariadit’.Poznamenajme, že v praktickej implementácii BWT sa dekódovanie dá robit’ na jedenprechod v lineárnom čase O(n).Príklad: Ilustrujme dekódovanie na výstupe príkladu kódovania, teda máme na vstuperet’azec babbbccaaaabbb a pozíciu 0. Rekonštruujeme prvý stĺpec a potom dekódovanieprebieha naznačeným spôsobom podl’a šípiek (šípky označujú zodpovedajúcimsi znakom). Čísla pri znakoch hovoria o poradí znakov pri spätnej rekonštrukcii.14a13ab1a146ab711ab124ab51bc 27bc 812ba135ba610ba113ba49bb102cb 38cb94.5.3 MTFMTF (Move to front) je heuristika, ktorou sa snažíme pozičnú blízkost’ rovnakých znakovpretransformovat’ do štatistickej významnosti znakov. MTF nekomprimuje text, alevytvára predpoklady na úspešnú aplikáciu štatistických kóderov nultého rádu tým, žesa snaží znižovat’ entropiu.MTF má pole, v ktorom sú usporiadané znaky. Po prečítaní znaku dá na výstup index(pozíciu) tohto znaku v poli a zároveň znak presunie v poli na začiatok. Takto pokračuje,až kým nevyčerpá celý vstup.Príklad: Demonštrujme si MTF na príklade výstupu z BWT, teda na ret’azci aababbcbababcb.Stĺpec „pole“ ukazuje poradie prvkov v poli po spracovaní príslušného znaku.

4.5. BWT 65pole výstupabcb bac 1a abc 1b bac 1b bac 0b bac 0c cba 2c cba 0pokr.pole výstupa acb 2a acb 0a acb 0a acb 0b bac 2b bac 0b bac 0Hoci náš príklad nie je ideálnym na demonštráciu výhod MTF, porovnajme entropiepôvodného a nového ret’azca:( 5H14 , 714 , 2 )≈ 0, 437114( 8H14 , 314 , 3 )≈ 0, 431814Teda MTF sa snaží posúvat’ aktuálne spracúvané znaky na začiatok pol’a a zabezpečit’častý výskyt nízkych indexov vo výstupe. Ked’ vo vstupe prejdeme na iný blok rovnakýchznakov, až na prvý index opät’ dostávame na výstup nízke hodnoty. Výsledkom je zníženieentropie a môže nasledovat’ úspešná aplikácia štatistického kódovania.Dekódovanie MTF prebieha podobne ako kódovanie. Začneme s utriedeným pol’omznakov. Prečítame index zo vstupu. Príslušný znak z pol’a dáme na výstup. Zároveňpresunieme znak na začiatok pol’a a načítame d’alší index zo vstupu. Toto opakujeme,až kým neprečítame celý vstup.4.5.4 PoznámkyIná možnost’ pri spracovaní výstupu BWT (namiesto MTF, prípadne navyše k MTF) jepoužit’ RLE. RLE (Run Length Encoding) je jednoduchý spôsob kódovania, ked’ namiestoret’azca rovnakých znakov dávame na výstup len jeden znak a dĺžku ret’azca.Časovo najnáročnejšou operáciou v BWT je triedenie pri kódovaní. Dá sa napríkladpoužit’ kombinácia radix-sortu (napr. na prvé dva znaky) s následným quicksortom (nautriedenie vnútri skupín). Prirodzene, pri kódovaní nie je ani potrebné vytvárat’ d’alšieret’azce – stačí správne indexovat’ do pôvodného ret’azca.Príkladom praktického použitia BWT je program Bzip2, ktorý je kombináciou BWT,MTF a Huffmanovho kódovania.

66 KAPITOLA 4. METÓDY KOMPRESIE ÚDAJOV

Kapitola 5Kódovanie zvuku a obrazuV tejto kapitole budeme hovorit’ o efektívnych metódach kódovania obrazovej informáciea zvuku (hudby).67

68 KAPITOLA 5. KÓDOVANIE ZVUKU A OBRAZU

Kapitola 6Kolmogorovská zložitost’ ahranice kompresie údajovPozrieme sa, ako to vyzerá so stlačitel’nost’ou informácie vo všeobecnosti a ukážeme, ževäčšina údajov je nestlačitel’ná.69

70KAPITOLA 6. KOLMOGOROVSKÁ ZLOŽITOSŤ A HRANICE KOMPRESIE ÚDAJOV

Čast’ IISamoopravné kódy71

Kapitola 7Základné princípysamooopravných kódovPri konštrukcii nerovnomerných kódov v predchádzajúcej kapitole sme predpokladali, žeprenosový kanál realizuje identickú transformáciu; t.j. že sa správa pri prenose nemení.Tento optimistický predpoklad nebýva v reálnom živote naplnený. Preto sa budeme zaoberat’takým zápisom informácie, ktorý umožní kontrolovat’ zmeny, ku ktorým došlov priebehu prenosu informácie. 1 Najprv zavedieme model prenosového kanála, ktorýnám umožní matematicky popísat’ výskyt chýb pri prenose správ. Potom ukážeme, akomožno pridaním doplnkovej informácie (zväčšením redundancie správ) zvýšit’ jej odolnost’voči chybám. Na geometrickom modeli kódu ukážeme, aké podmienky musí spĺňat’kód, ktorý má odhal’ovat’/opravovat’ istý počet chýb a uvedieme základný vzt’ah medziredundanciou a opravnou schopnost’ou kódu. Potom budeme konštruovat’ jednoduchérovnomerné (blokové) kódy, ktoré budú schopné odhal’ovat’ chyby (t.j. príjemca budeschopný zistit’, či v prijatom slove vznikli určité chyby alebo nie) alebo ich dokoncaopravovat’ (príjemca bude pri dekódovaní schopný rekonštruovat’ pôvodne odvysielanékódové slovo) a popíšeme efektívne metódy kódovania a dekódovanie informácie pomocoutakýchto kódov.7.1 Binárny symetrický kanál bez pamäteNa rozdiel od nerovnomerných kódov nebudeme skúmat’ zdroj informácie, ale prenosovýkanál. Na popis prenosového kanála na ktorý pôsobí šum spôsobujúci chyby v prenášanýchsprávach zavedieme model, ktorý budeme nazývat’ q-nárnym symetrickým prenosovýmkanálom bez pamäte. Špeciálnym a najčastejšie používaným q-nárnym symetrickýmprenosovým kanálom bez pamäte je binárny (q = 2) symetrický kanál bez pamäte, ktorýje zobrazený na obrázku 7.1. Upresníme teraz predstavu o tom, aké chyby môžu vznikat’pri prenose správ q-nárnym symetrickým prenosovým kanálom bez pamäte. Budeme1 Pripomíname, že z hl’adiska kódovania nie je principiálny rozdiel, či ide o prenos informácie v čase alebov priestore. Aj preto sa v tejto kapitole budeme zaoberat’ kódovaním informácie pre prenášanie v priestore,ale riešenia, ktoré navrhneme budú rovnako dobré aj pre ochranu informácie prenášanú v čase.73

74 KAPITOLA 7. ZÁKLADNÉ PRINCÍPY SAMOOOPRAVNÝCH KÓDOVp1 ❞❍✲ ❞❍❍❍❍❍❍❍❍❍❍❍❍ ✟✯ 11-p1-p❞ ✟ ✟✟✟✟✟✟✟✟✟✟✟✟ ✲❍❥0 ❞ 0pObrázok 7.1: Binárny symetrický kanál bez pamätepredpokladat’, že pri prenose správ• dochádza k zámene jedného prenášaného symbolu kódovej abecedy na iný symbolkódovej abecedy,• žiaden symbol nie je odolnejší voči chybe ako iný symbol; symbol sa prenáša správnes pravdepodobnost’ou p a transformuje sa pri prenose na ktorýkol’vek iný symbols pravdepodobnost’ou 1−pq−1 ;• výsledok prenosu jedného symbolu neovplyvňuje to, či bude nasledujúci symbolprenesený správne alebo nie.Kódy opravujúce chyby predstavujú rozličné algebraické štruktúry ako vektorovépriestory, okruhy polynómov, ideály a podobne. Aby mohli kódové slová bez problémovtvorit’ takéto algebraické štruktúry, budeme predpokladat’, že kódová abeceda je podmnožinouprirodzených čísel; Σ = {0, . . . , q − 1}. Aj ked’ teoretické konštrukcie budemerobit’ pre všeobecný prípad, v d’alšom výklade sa budeme najčastejšie zaoberat’ binárnymikódmi, ktoré sa v súčasnosti najčastejšie používajú.V čom je podstata kódov odhal’ujúcich, resp. opravujúcich chyby? Ak by sme na kódovaniespráv používali úplné kódy, pri prenose správ by sa jedno kódové slovo mohlov dôsledku šumu nahradit’ iným kódovým slovom a príjemca by mal problém určit’, čiprijal odvysielané kódové slovo, alebo došlo k chybe pri prenose. Preto nie je možnépri komunikácii prostredníctvom kanála so šumom používat’ úplné kódy. Podstata kódovodhal’ujúcich a opravujúcich chyby je v tom, že množina kódových slov tvorí lenpodmnožinu všetkých možných slov a tak, ked’ dôjde počas prenosu správy ku chybe,prijaté slovo s vel’kou pravdepodobnost’ou nie je kódovým slovom. Zdôrazňujeme slovás vel’kou pravdepodobnost’ou, pretože nie je vylúčené, že počas prenosu vznikne chyba,ktorá prenášané kódové slovo transformuje na iné kódové slovo. Pri konštrukciisamoopravných kódov sa snažíme minimalizovat’ pravdepodobnost’ takejto možnosti.Vychádzame z toho, že pre (binárny) prenosový kanál platí p >> 1 − p 2 ; t.j. je pravdepodobnejšie,že pri prenose kódového slova vznikne menej chýb. Ilustrujeme to na príklade.Príklad. Uvažujme binárny symetrický kanál bez pamäte s parametrami p = 0.99,1 − p = 0.01, binárny blokový kód dĺžky 15 opravujúci tri chyby. V nasledujúcej tabul’kesú uvedené pravdepodobnosti chýb2 V podstate však stačí, aby p ≠ 1 − p.

7.2. GEOMETRICKÁ INTERPRETÁCIA SAMOOPRAVNÉHO KÓDU 75počet chýb pravdepodobnost’0 (0.99) 15 0.8600583546412891 15 · (0.99) 14 · (0.01) 0.130311871915347(215)2 · (0.99)13 · (0.01) 2 0.009213970741489(315)3 · (0.99)12 · (0.01) 3 0.000403305116631)> 3· (0.99)15−j · (0.01) j 0.000012497585244∑j>3( 15jPravdepodobnost’ toho, že v prenášanom slove vzniknú 4 a viac chýb je síce nenulová0.000012497585244 ale podstatne menšia ako to, že v slove budú najviac 3 chyby, ktoré sapri dekódovaní dajú opravit’.7.2 Geometrická interpretácia samoopravného kóduSkôr ako pristúpime ku popisu a konštrukcii samoopravných kódov, využijeme geometrickúinterpretáciu kódu a vysvetlíme princíp kódov opravujúcich a odhal’ujúcich chyby.Predpokladáme, že máme zostrojit’ kód dĺžky n opravujúci t chýb. (Na začiatku kvôlizjednodušeniu popíšeme konštrukciu binárneho kódu opravujúceho 1 chybu a potomkonštrukciu zovšeobecníme.) Zavedieme najprv dva dôležité pojmy, ktoré budeme prikoštrukcii samoopravného kódu potrebovat’.Definícia 7.2.1. Nech sú u, v dva vektory vektorového priestoru V; nech u = (u 1 , . . . u n );v = (v 1 , . . . v n ). Hammingovou váhou vektora u nazveme prirodzené číslo wt(u), definovanénasledovne:n∑wt(u) = (u i ≠ 0)Hammingovou vzdialenost’ou vektorov u, v nazveme prirodzené číslo d(u, v);id(u, v) = wt(u − v) =n∑(a j ≠ b j ).j=1Hammingova váha vektora je počet jeho nenulových zložiek a Hammingova vzdialenost’dvoch vektorov udáva, v kol’kých zložkách sa tieto dva vektory odlišujú. Vrát’mesa teraz ku konštrukcii binárneho samoopravného kódu opravujúceho 1 chybu 3 . Zostrojímeho tak, že budeme postupne vyberat’ kódové slová. Ako prvé kódové slovo v 0môžeme vybrat’ l’ubovol’ný binárny vektor z množiny {0, 1} n . Bez ujmy na všeobecnostimôžeme vybrat’ v 0 = (0, . . . , 0); t.j. nulový vektor. Vyberieme teraz druhé kódové slovov 1 . Predpokladajme, že d(v 0 , v 1 ) = 1 a položme v 1 = (1, 0, . . . , 0). Potom však existujechyba (ktorú budeme reprezentovat’ binárnym vektorom) váhy 1 ktorá transformujekódové slovo v 1 na kódové slovo v 0 :3 Vzhl’adom na typ chýb, ktorými sa budeme zaoberat’, budeme pojmy "t chýbä "chyba váhy t"používat’ako synonymá.

76 KAPITOLA 7. ZÁKLADNÉ PRINCÍPY SAMOOOPRAVNÝCH KÓDOVv 0 000 . . . 0v 1 100 . . . 0e 1 100 . . . 0v 1 ⊕ e 1 000 . . . 0 = v 0To znamená, že ak kód opravuje jednu chybu, tak potom d(v 0 , v 1 ) > 1. Nech d(v 0 , v 1 ) =2 a vyberme ako druhé kódové slovo napríklad v 1 = (1, 1, 0, . . . , 0). Žiadna chyba váhy1 nemôže transformovat’ slovo v 1 na slovo v 0 . Čo sa však stane, ak sme prijali slovo0100 . . . 0? Existujú dve rovnako pravdepodobné možnosti (a množstvo menej pravdepodobnýchiných):v 0 000 . . . 0v 1 110 . . . 0e 1 100 . . . 0e 2 010 . . . 0v 0 ⊕ e 1 = 100 . . . 0 = v 1 ⊕ e 2v i ⊕ e j = 100 . . . 0 e j = v i ⊕ 100 . . . 0Ak sme teda prijali slovo 0100 . . . 0, je zrejmé, že to nie je kódové slovo a odhalili sme chybu,ale nevieme ju opravit’ a určit’ odvysielané kódové slovo. Ak stačí, aby kód odhal’ovalchyby váhy 1, vektor v 1 = (110 . . . 0) môže byt’ kódovým slovom. Ak požadujeme, aby kódopravoval chyby váhy t ≥ 1, vektor v 1 = (110 . . . 0) a žiaden vektor váhy 2 nemôže byt’kódovým slovom. Nech teda d(v 0 , v 1 ) = 3 a v 1 = (1, 1, 1, 0, . . . , 0). Chybou váhy 1 sa slovov 1 transformuje v najhoršom prípade na slovo váhy 2, ale chybou váhy 1 sa zo slova v 0stane vektor váhy 1:v 0 0000 . . . 0v 1 1110 . . . 0e 1 1000 . . . 0e 2 0100 . . . 0e 3 0110 . . . 0v 0 ⊕ e 1 = 1000 . . . 0 wt(v 0 ⊕ e 1 ) = 1v 1 ⊕ e 3 = 1000 . . . 0v 1 ⊕ e 2 = 1010 . . . 0 wt(v 1 ⊕ e 2 ) = 2Ak sme prijali slovo 1000 . . . 0, dekódujeme ho na základe toho, žeP(1000 . . . 0|v 0 ) > P(1000 . . . 0|v 1 ),ako v 0 . (Ak použijeme hodnoty n = 15, p = 0.99 z predchádzajúceho príkladu, takP(1000 . . . 0|v 0 ) = 0.00868745812768978 > 0.0000877521022998968 = P(1000 . . . 0|v 1 ),a teda pravdepodobnost’ toho, že bolo odvysielané slovo v 0 je podstatne väčšia.) Zovšeobecnímeteraz našu konštrukciu na prípad, ked’ má kód opravovat’ chyby váhy t > 1.Ukázalo sa, že rozhodujúcim parametrom, od ktorého závisí opravná schopnost’ kódu jeminimálna vzdialenost’ kódových slov. Zavedieme pre tento pojem špeciálne označenie:minimálnou vzdialenost’ou kódu C nazveme prirodzené číslod ∗ = min d(u, v).u,v∈C

7.2. GEOMETRICKÁ INTERPRETÁCIA SAMOOPRAVNÉHO KÓDU 77Ak by bola minimálna vzdialenost’ kódu C d ∗ ≤ t tak potom chybou váhy menšejalebo rovnej t by sa mohlo transformovat’ jedno kódové slovo na iné kódové slovo. Akd ∗ = t + 1, kód C dokáže odhal’ovat’ chyby váhy t. Na to, aby kód C opravoval chyby váhyt musí byt’ d ∗ ≥ 2t + 1.Popri samoopravnej schopnosti (danej minimálnou vzdialenost’ou kódu) je zaujímavoukvantitatívnou charakteristikou kódu, ktorá vyjadruje jeho efektívnost’, počet kódovýchslov. Extrémnym prípadom je kód dĺžky 2n + 1 ktorý má dve kódové slová(napr. 0 . . . 0 a 1 . . . 1). Tento kód má síce maximálnu opravnú schopnost’ (je schopnýopravovat’ n chýb), ale na prenos jedného bitu správy potrebuje 2n + 1 kódovýchsymbolov. Pri konštrukcii samoopravných kódov sa snažíme o kompromis medzi opravnouschopnost’ou a mohutnost’ou kódu. Kol’ko kódových slov môže vlastne obsahovat’samoopravný kód dĺžky n opravujúci t chýb? Pozrieme sa najprv na binárny prípad.Množina binárnych vektorov (neskôr ukážeme, že sa jedná o vektorový priestor), z ktorejvyberáme kódové slová, má 2 n prvkov. Označíme symbolom B r (v) množinu vektorov;B r (v, r) = {u|u ∈ {0, 1} n & d(u, v) ≤ r},ktorú budeme nazývat’ gul’ou s polomerom r a stredom v. Je zrejmé, že pre 0 ≤ r ≤ tplatí∀u, v ∈ C; (u ≠ v) ⇒ B r (u) ⋂ B r (v) = ∅a mohutnost’ B(v) je|B r (v| =r∑j=0( nj).Ak by kód C mal maximálny počet kódových slov (pre dĺžku kódu n a opravnú schopnost’t), potom by množina vektorov {0, 1} n musela byt’ pokrytá disjunktnými gul’ami polomerut so stredami v kódových slovách. Mohutnost’ kódu C by v takomto prípade bola|C| =2 n∑ tj=0( nj).2Je zrejmé, že je len málo takých hodnôt n, t pre ktoré by bol podieln|S(v,r)|celočíselný.Ak by sme sa však aj uspokojili s kódom menšej mohutnosti, zostáva otázkou, ako hozostrojit’. Úplné preberanie neprichádza do úvahy, nakol’ko jeho zložitost’ je odvodená odčísla(2 n )2⌊ ∑ ntj=0 ( n j) ⌋ ,ktoré je už pre relatívne malé hodnoty n, t vel’ké (pozri nasledujúcu tabul’ku). V tejtokapitole sa budeme zaoberat’ metódami systematického vytvárania samoopravnýchkódov.

78 KAPITOLA 7. ZÁKLADNÉ PRINCÍPY SAMOOOPRAVNÝCH KÓDOVn t mohutnost’ početkódumožných kódov7 1 16 933430212012621774007 2 4 106680007 3 2 812815 5 6 171857424069145502713446415 4 16 8413732123974805236379052905176580137165242881749473138892815 3 56 0.9837970552 × 10 17815 2 270 0.7332302377 × 10 67815 1 2048 0.1094851418 × 10 3326Poznámka. Aká bude mohutnost’ samoopravných kódov nad inou ako binárnou abecedou?Mohutnost’ gule s polomerom t vo vektorovom priestore {0, . . . , q − 1} jet∑j=0( nj)(q − 1) j .Ak q > 2 nestačí len vybrat’ j zložiek vektora ( ( )nj ), ktoré treba zmenit’, ale je potrebné ajurčit’ ktorým z ostatných q−1 symbolov sa má pôvodný symbol nahradit’. Pre mohutnost’q-kódu V dĺžky n, opravujúceho t chýb platí|V| ≤∑ tj=0q n( nj)(q − 1) j .Vrát’me sa ešte ku geometrickému modelu samoopravných kódov, aby sme zaviedliniekol’ko dôležitých pojmov, ktoré majú názornú geometrickú interpretáciu. Predstavmesi, že je daný q-árny samoopravný kód V dĺžky n opravujúvci t chýb. Kódu V zodpovedámnožina bodov-vektorov vektorového priestoru GF(q) n . Vytvoríme gule polomeru 1 sostredmi v kódových slovách ( „kódové“ gule). Postupne budeme zväčšovat’ polomery „kódových“gulí: r = 2, 3, . . . , t − 1. Prvá dôležitá hodnota polomeru je t. To je maximálnahodnota, pri ktorej sú sféry so stredmi v kódových slovách ešte disjunktné. Hodnota tsa nazýva aj hranicou sférického uloženia kódu (sphere packing bound). Pri dekódovanísa všetky vektory z gule B t (u) zobrazia na vektor u. Vo väčšine kódov gule polomeru tso stredmi v kódových slovách. nepokryjú všetky vektory vektorového priestoru GF(q) n .To znamená, že budú existovat’ slová-vektory, ktoré nepatria do žiadnej gule a pri dekódovanísa nezobrazia na žiadne kódové slovo. Ak by sme d’alej zväčšovali polomer gulí(r = t + 1, . . . , T), po konečnom počte krokov dospejeme do štádia, ked’ každý vektorvektorového priestoru GF(q) n patrí aspoň do jednej gule B T (u). Minimálna hodnotapolomeru, pri ktorej sa dosahuje, žeGF(q) n = ⋃ u∈VB T (u)sa nazýva hranicou pokrytia kódu V. Teraz môžeme formalizovat’ aj intuitívne predstavyo efektívnosti kódovania.

7.3. JEDNODUCHÉ KÓDY ODHAL’UJÚCE/OPRAVUJÚCE CHYBY 79Definícia 7.2.2. Kód V sa nazýva dokonalý, ak sa hranica sférického uloženia rovnáhranici pokrytia kódu V.Ináč povedané, kód V je dokonalý, ak každý vektor vektorového priestoru GF(q) n sanachádza vo vzdialenosti nanajvýš t od práve jedného kódového slova. Ako sa ukáženeskôr, dokonalých kódov je málo.Skôr ako sa budeme zaoberat’ systematicky metódami konštrukcie rozličných samoopravnýchkódov, uvedieme niekol’ko jednoduchších príkladov kódov opravujúcich aleboodhal’ujúcich chyby a ilustrujeme na nich už zavedené, resp. zavedieme niektoré novépojmy. Odteraz sa až do odvolania budeme opät’ zaoberat’ binárnymi kódmi.7.3 Jednoduché kódy odhal’ujúce/opravujúce chyby7.3.1 Testovanie parity.Nech je daná množina binárnych vektorov dĺžky n. Pridáme ku každému vektoru n + 1-bit tak aby počet jednotkových bitov vo vektore (dĺžky n + 1) bol párny. Kódové slovábudú potom vyzerat’ nasledovne (doplnený bit je oddelený medzerou):01000011100001010 001011010010101011 1. . .Doplnený bit sa nazýva paritným bitom. Ak v kódovom slove vznikne pri prenose chybanepárnej váhy (1, 3, 5, . . . ) počet jednotkových bitov v prijatom slove bude nepárny a príjemcabude vediet’, že nastala chyba (aj ked’ nedokáže určit’, kde.) Ak by však pri prenosenastala chyba nepárnej váhy (2, 4, . . . ), v prijatom slove bude párny počet jednotkovýchbitov a príjemca bude prijaté slovo považovat’ za kódové slovo. Ak sa vrátime k predchádzajúcemupríkladu (p = 0.99, n = 15), tak pravdepodobnost’ neodhalenej chyby je0.009226196681.7.3.2Obdĺžnikové kódy.Uvažujme opät’ binárne zapísanú informáciu, ktorú chceme upravit’ do formy umožňujúcejopravit’ aspoň jednu chybu (chybu váhy 1). Zapíšeme informáciu do obdĺžnikovejmatice typu m × n a pridáme k nej jeden kontrolný riadok a jeden kontrolný stĺpec.0110101010 11110000111 01010101010 10010000111 0Na i-tom mieste kontrolného stĺpca sa bude nachádzat’ paritný bit i-teho riadku (a i,10 =a i,0 ⊕· · ·⊕a i,9 ), na j-tom mieste kontrolného riadku sa bude nachádzat’ paritný bit j-teho

80 KAPITOLA 7. ZÁKLADNÉ PRINCÍPY SAMOOOPRAVNÝCH KÓDOVstĺpca (a 3,j = a 0,j ⊕ · · · ⊕ a 2,j ). Predpokladajme, že nastala chyba váhy 1 napríklad namieste (0, 4). Príjemca vyčísli kontrolné sumy pre riadky aj stĺpce prijatej matice a zistípozíciu chyby:0110001010 1 11110000111 0 01010101010 1 00010000111 0 00000100000 0Všimneme si, že ak vznikne chyba váhy 1 v kontrolnom riadku alebo v kontrolnom stĺpci,pozícia chyby sa určí úplne rovnako, ako v prípade chyby v ïnformačnom"symbole:0110101010 1 01110000111 0 01010101010 1 00010000110 0 10000000001 0Obdĺžnikový kód je schopný opravovat’ chyby váhy 1. Čo sa stane, ak v kódovom slovevznikne chyba väššj váhy? Predpokladajme, že vznikla chyba váhy 2:0110101010 1 11110000111 0 01010101010 1 00010000110 0 11000000001 0Vyčíslením kontrolných súm príjemca zistí, že vznikla chyba väčšej váhy. Ak by aj uhádol,že ide o chybu váhy 2, nevie či chyby vznikli v symboloch a 0,0 , a 3,9 alebo a 3,0 , a 0,9 .Ak by chyba váhy 2 vznikla v tom istom riadku (stĺpci), na kotrolnej sume príslušnéhoriadku (stĺpca) by sa to neprejavilo, a príjemca by vedel akurát povedat’, že v niektorýchstĺcoch (riadkoch) vznikla chyba väčšej váhy.1110101011 1 01110000111 0 01010101010 1 00010000111 0 01000000001 0Samoopravné kódy sa zakladajú na tom, že• nie každé možné slovo je kódovým slovom;• kódové slová sú „dost’ d’aleko od seba“.Minimálna vzdialenost’ kódu vyjadrená pomocou Hammingovej vzdialenosti kódovýchslov nám umožnila precizovat’ význam slov „dost’ d’aleko od seba“. Pomocou obdĺžnikovýchkódov ilustrujeme pojem „redundancie (nadbytočnosti)“, ktorý upresňuje prvú požiadavkukladenú na samoopravné kódy. V kódovom slove obdĺžnikového kódu rozlišujemedva druhy symbolov: informačné (pomocou nich sa zapisuje informácia, ktorú má

7.4. HAMMINGOV KÓD 81kódové slovo preniest’) a kontrolné symboly (zaznamenávajúce štruktúru kódového slova.)Dĺžka kódového slova sa zvykne označovat’ symbolom n, počet informačných symbolovk a počet kontrolných symbolov je potom n − k. Samoopravný kód, ktorý má dĺžkun a počet informačných symbolov k sa označuje aj ako (n, k)-kód. Počet kontrolnýchsymbolov sa nazýva absolútnou redundanciou kódu. Kódy s rozličnými dĺžkami môžumat’ rozličné počty kontrolných symbolov. Aby ich bolo možné porovnávat’ z hl’adiska redundancie,zavádzame pojem relatívnej redundancie kódu, definovanej ako podiel počtun−kkontrolných symbolov k celkovej dĺžke kódového slova;n= 1 − k n. Určíme absolútnua relatívnu nadbytočnost’ obdĺžnikových kódov. Predpokladajme kvôli jednoduchosti, žekódové slovo obdĺžnikového kódu má tvar štvorcovej matice4 typu m × m. Táto maticaobsahuje štvorcovú podmaticu (m−1)×(m−1) informačných symbolov a 2m−1 kontrolnýchsymbolov. Relatívna nadbytočnost’ štvorcového kódu je 2m−1 = 2 m 2 m − 1 . Pre vel’kém 2m je relatívna nadbytočnost’ štvorcového kódu zanedbatel’ná.V prípade obdĺžnikového kódu bolo možné rozlíšit’ informačné a kontrolné symboly.Existujú samoopravné kódy, pre ktoré takéto rozdelenie symbolov kódového slova neexistuje.Aby bolo možné vyjadrit’ redundanciu aj pre tieto kódy, zovšeobecníme pojemredundancie nasledujúcim spôsobom.Definícia 7.3.1. Nech V je kód dĺžky n nad abecedou {0, . . . , q − 1}. (Relatívnou) redundancioukódu V jeR(V) = log q |V| .nRedundancia kódu úzko súvisí s d’alším dôležitým pojmom, pomocou ktorého sa vyjadrujeefektívnost’ kódu; s prenosovou rýchlost’ou. Prenosová rýchlost’ kódu je číslo zintervalu < 0, 1 >, ktoré je definované akopočet prenesených informačných symbolovcelkový počet prenesených symbolov= 1 − R.V d’alšom sa budem zaoberat’ kódmi, ktoré majú vysoké prenosové rýchlosti a zároveňdobré opravné schopnosti. Začneme zaujímavým kódom opravujúcim jednu chybu.7.4 Hammingov kódHammingove kódy sú binárne (n, k)-kódy, s parametrami n = 2 m −1, m ≥ 3, m ∈ N, k =2 m −1−m opravujúce chyby váhy 1. Princíp vytvárania Hammingových kódov, kódovaniea dekódovanie ilustrujeme na Hammingovom (15, 11)-kóde.Predpokladajme, že sme už vytvorili kódové slovo v = (v 1 , . . . , v 15 ). Z jednotlivýchkomponentov kódového slova vytvoríme 4 kontrolné sumy s 0 , s 1 , s 2 , s 3 , pomocou ktorýchbudeme schopní rozlišovat’ 16 rozličných udalostí: pri prenose nenastala žiadna chyba,nastala chyba váhy 1 v 1., . . . , 15. komponente kódového slova. Zavedieme dva potrebnépojmy a potom vytvoríme kontrolné sumy. Symbolom σ(i, n) budeme označovat’ n-bitový4 v takomto prípade hovoríme o štvorcovom kóde

82 KAPITOLA 7. ZÁKLADNÉ PRINCÍPY SAMOOOPRAVNÝCH KÓDOVvektor, ktorý je binárnou reprezentáciou čísla i. Nech sú u = (u 1 , . . . , u n ), v = (v 1 , . . . , v n )dva binárne vektory, symbolom u&v budeme označovat’ vektor u&v = (u 1 v 1 , . . . , u n v n ).Pre j = 0, 1, 2, 3 platí:⊕s j =v i ,t.j.σ(i,4)&σ(2 j ,4)=σ(2 j ,4)s 0 = v 1 ⊕ v 3 ⊕ v 5 ⊕ v 7 ⊕ v 9 ⊕ v 11 ⊕ v 13 ⊕ v 15s 1 = v 2 ⊕ v 3 ⊕ v 6 ⊕ v 7 ⊕ v 10 ⊕ v 11 ⊕ v 14 ⊕ v 15s 2 = v 4 ⊕ v 5 ⊕ v 6 ⊕ v 7 ⊕ v 12 ⊕ v 13 ⊕ v 14 ⊕ v 15s 3 = v 8 ⊕ v 9 ⊕ v 10 ⊕ v 11 ⊕ v 12 ⊕ v 13 ⊕ v 14 ⊕ v 15 .Všimnime si, že komponent v i sa vyskytuje práve vo wt(σ(i, 4)) kontrolných sumách.Ked’že existujú práve štyri binárne vektory dĺžky 4 s Hammingovou váhou 1 reprezentujúcečísla 1, 2, 4, 8, každý z komponentov v 1 , v 2 , v 4 , v 8 vystupuje v jednej kontrolnej sume.To znamená, že ak zvolíme hodnoty komponentov v 3 , v 5 , v 6 , v 7 , v 9 , v 10 , v 11 , v 12 , v 13 , v 14 , v 15kódového slova l’ubovol’ne, vhodnou vol’bou komponentov v 1 , v 2 , v 4 , v 8 dosiahneme, žekontrolné sumy budú pre kódové slovo nulové: s 0 = s 1 = s 2 = s 3 = 0. Stačí položit’:v 1 = v 3 ⊕ v 5 ⊕ v 7 ⊕ v 9 ⊕ v 11 ⊕ v 13 ⊕ v 15v 2 = v 3 ⊕ v 6 ⊕ v 7 ⊕ v 10 ⊕ v 11 ⊕ v 14 ⊕ v 15v 4 = v 5 ⊕ v 6 ⊕ v 7 ⊕ v 12 ⊕ v 13 ⊕ v 14 ⊕ v 15v 8 = v 9 ⊕ v 10 ⊕ v 11 ⊕ v 12 ⊕ v 13 ⊕ v 14 ⊕ v 15 .Kódovanie správ pomocou Hammingovho (15, 11)-kódu prebieha tak, že sa správanajprv rozdelí na bloky dĺžky 11 a tie sa doplnia 4 kontrolnými symbolmi na kódovéslovo:1 1 1 1 0 0 0 0 1 1 1 informačný vektor1 1 1 1 0 0 0 0 1 1 1 informačný vektor1 1 0 1 kontrolný vektor1 1 1 0 1 1 1 1 0 0 0 0 1 1 1 kódové slovoDekódovanie Hammingovho (15, 11)-kódu. Predpokladajme, že pri prenose kódovéhoslova vznikla chyba váhy 1 v i-tom komponente kódového slova; t.j. bolo prijatéslovov 0 , . . . , v i−1 , v i ⊕ 1, v i+1 , . . . , v 15 .Chyba spôsobí, že všetky kontrolné sumy, ktoré obsahujú komponent v i nadobudnú hodnotu1. To sú však práve tie sumy s j , pre ktoré σ(i, 4)&σ(2 j , 4) = σ(2 j , 4); t.j. binárnyvektor s = (s 3 , s 2 , s 1 , s 0 ) predstavuje číslo σ(i, 4). Vektor hodnôt jednotlivých kontrolnýchsúm sa nazýva syndróm chyby. V našom prípade syndróm chyby predstavuje pozíciu,na ktorej chyba váhy 1 v kódovom slove vznikla, resp. nulová hodnota syndrómu chybyznamená, že bolo prijaté kódové slovo.Príklad. Predpokladajme, že chyba vznikla v 13. komponente kódového slova. Potombolo prijaté slovo:v 1 , . . . , v 12 , v 13 ⊕ 1, v 14 , v 15 .

7.4. HAMMINGOV KÓD 83Kontrolné sumy nadobúdajú hodnoty:s 0 = v 1 ⊕ v 3 ⊕ v 5 ⊕ v 7 ⊕ v 9 ⊕ v 11 ⊕ (v 13 ⊕ 1) ⊕ v 15 = 1s 1 = v 2 v 3 ⊕ v 6 ⊕ v 7 ⊕ v 10 ⊕ v 11 ⊕ v 14 ⊕ v 15 = 0s 2 = v 4 ⊕ v 5 ⊕ v 6 ⊕ v 7 ⊕ v 12 ⊕ (v 13 ⊕ 1) ⊕ v 14 ⊕ v 15 = 1s 3 = v 8 ⊕ v 9 ⊕ v 10 ⊕ v 11 ⊕ v 12 ⊕ (v 13 ⊕ 1) ⊕ v 14 ⊕ v 15 = 1Hammingov kód nie je schopný opravovat’ chyby váhy ≥ 2. Pri dekódovaní sa takétochyby bud’ vôbec neodhalia alebo sa interpretujú ako chyby váhy 1:1 1 1 0 1 1 1 1 0 0 0 0 1 1 1 kódové slovo1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 chybový vektor0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 prijaté slovo0 0 0 0 syndróm chyby0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 predpokladaná chyba0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 dekódované slovo1 1 1 0 1 1 1 1 0 0 0 0 1 1 1 kódové slovo1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 chybový vektor0 0 1 0 1 1 1 1 0 0 0 0 1 1 1 prijaté slovo0 0 1 1 syndróm chyby0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 predpokladaná chyba0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 dekódované slovoPorovnáme ešte redundanciu Hammingových R H a obdĺžnikových kódov R O.n a × b (n − k) H (n − k) O R H R O7 (∗) 2 × 4 3 5 0.4285 0.625015 3 × 5 4 7 0.2666 0.466631 (∗) 4 × 8 5 10 0.1612 0.312563 7 × 9 6 15 0.0952 0.2380127 (∗) 8 × 16 7 23 0.0551 0.1796255 15 × 17 8 31 0.0313 0.1215511 16 × 32 9 72 0.0176 0.14091023 31 × 33 10 63 0.0097 0.0615V prípadoch označených hviezdičkou neexistujú obdĺžnikové kódy potrebnej dĺžky (n jeprvočíslo), a preto sme Hammingove kódy dĺžky n porovnávali s obdĺžnikovými kódmidĺžky n + 1. Aj pre n = 511 má obdĺžnikový kód dĺžky 512 rozmerov 16 × 32 menšiuredundanciu (0.0917) ako obdĺžnikový kód dĺžky 511 rozmerov 7 × 73.Poznámka. Pre Hammingove kódy platí (n = 2 m − 1, m ≥ 3)[( ( n n+ | 20)1)]n ,a teda Hammingove kódy sú dokonalé binárne kódy.

84 KAPITOLA 7. ZÁKLADNÉ PRINCÍPY SAMOOOPRAVNÝCH KÓDOV

Kapitola 8Lineárne kódyPredchádzajúce konštrukcie samoopravných kódov (obdĺžnikové kódy, Hammingove kódy)nám umožnili zostrojit’ samoopravné kódy opravujúce chyby váhy 1. Ak je všakpravdepodobnost’ chyby pri prenose znaku dostatočne vysoká, budeme na zaistenie spol’ahlivéhoprenosu správ takýmto prenosovým kanálom potrebovat’ samoopravné kódy svyššou opravnou schopnost’ou. Vychádzajúc z geometrickej predstavy o samoopravnýchkódoch by sme teoreticky mohli skonštruovat’ potrebný samoopravný kód, ale je otáznejednak to, či by sa táto konštrukcia dala uskutočnit’ v rozumnom čase a či by pre taktozostrojený kód existovali efektívne metódy kódovania a dekódovania. Schodnejšou cestoupre konštrukciu samoopravného kódu je nájst’ vhodnú algebraickú štruktúru a jejprvky použit’ ako kódové slová. Prvé čo nás napadne, je zobrat’ konečnú grupu a ako kódpoužit’ nejakú jej vhodnú podgrupu. Kódy, ktorých slová s nejakou binárnou operácioutvoria grupu, skutočne existujú a nazývajú sa grupové kódy.Príklad. Nech je (G, +) konečná grupa s (napríklad) aditívnou operáciou. Množina(G n , ⊕) je grupa, ktorej prvkami sú usporiadané n-tice prvkov grupy G a operácia⊕ je odvodená z aditívnej operácie grupy G nasledovne: nech u = (u 1 , . . . , u n av = (v 1 , . . . , v n ) sú prvky G n , potom u ⊕ v = (u 1 + v 1 . . . u n + v n ). Je zrejmé, že operácia⊕ je asociatívna, množina G n je uzavretá vzhl’adom na operáciu ⊕, neutrálnymprvkom v G n vzhl’adom na opráciu ⊕ je vektor (0, . . . , 0), kde 0 je neutrálny prvok grupyG a napokon,k l’ubovol’nému prvku (u 1 , . . . , u n ) ∈ G n existuje (−u 1 , . . . , −u n ) ∈ G n , kde−u i je opačný prvok k prvku u i , i = 1, . . . , n. 1Aby sme dosiahli požadovanú efektívnost’ kódovania a dekódovania, budeme na konštrukciusamoopravných kódov používat’ o niečo zložitejšie štruktúry, ako sú grupy.Predpokladáme, že je dané konečné pole GF(q), kde q je mocnina nejakého prvočísla p.(Najčastejšie budeme pracovat’ s q = p = 2.) Množina GF(q) n n-tíc (vektorov) nad pol’omGF(q) s aditívnou operáciou "+" (sčítanie po zložkách) a multiplikatívnou operáciou "·" (násobeniezložiek vektora prvkom pol’a GF(q)) tvorí vektorový priestor. Lineárnym kódomnad abecedou GF(q) je l’ubovol’ný vektorový (lineárny) podpriestor vektorového priestoruGF(q) n . Ak je dimenzia vektorového podpriestoru C rovná k, lineárny kód C sa nazýva1 Tam, kde to nepovedie k nedorozumeniu, budeme v dalšom aditívnu operáciu nad vektormi označovat’symbolom "+"85

86 KAPITOLA 8. LINEÁRNE KÓDYlineárnym (n, k)-kódom.Príklad. Nech q = 2, n = 8. Pozrieme sa najprv na dva extrémne prípady. Ak k = 8,kód C má 2 8 = 256 kódových slov. Tento kód pozostáva zo všetkých možných binárnychvektorov/slov dĺžky 8, má prenosovú rýchlost’ 1 ale jeho opravná schopnost’ je nulová.Druhým extrémnym prípadom je lineárny (8, 0) kód, ktorý má dimenziu 0, jediné kódovéslovo (napríklad v 0 = (00000000)), ale je na prenos informácie prakticky bezcenný,lebo nedokáže preniest’ jediný bit informácie 2 Prakticky použitel’ný kód s najmenšímpočtom kódových slov je lineárny (8, 1 kód, s mohutnost’ou 2. Tento kód obsahuje dvekódové slová: nulové slovo v 0 = (00000000) a nenulové slovo v 1 . Slovo v 1 môžeme vybrat’l’ubovol’ne, pretože v 1 + v 1 = (00000000) a tak konštruovat’ kódy s rozličnými opravnýmischopnost’ami. Položíme v 1 = (11111111) a dostávame kód s maximálnou vzdialenost’oud = 8 rozpoznávajúci chyby váhy ≤ 7 a opravujúci chyby váhy ≤ 3. Prenosová rýchlost’tohto kódu je 1/8 a redundancia 7/8.8.1 Základné vlastnosti linerárnych kódovLinerny kód je teda l’ubovol’ná neprázdna množina vektorov (n-tíc) C taká, že pre l’ubovol’név 1 , . . . , v m ∈ C, a 1 , . . . , a m ∈ GF(q) patrí aj lineárna kombinácia a 1 v 1 + · · · + a m v mdo množiny C. To znamená, že pre l’ubovol’né kódové slovo u a prvok a ∈ GF(q) patrí dokódu C aj slovo au a pre l’ubovol’né dve kódové slová u, v je potom aj u + v a u − v kódovéslovo kódu C. Ked’že pre l’ubovol’né u ∈ C platí u − u = 0, nulové slovo patrí vždy do kóduC. Vzhl’adom na tieto skutočnosti sa štúdium viacerých vlastností lineárnych kódovredukuje na skúmanie vzt’ahov medzi nulovým kódovým slovom a ostatnými kódovýmslovami lineárneho kódu C.Veta 8.1.1. Nech je C lineárny kód. Potom pre minimálnu vzdialenost’ d ∗ kódu C platínasledujúci vzt’ahd ∗ = min d(u, v) = min wt(u).u,v∈C u≠0∈CDôkaz. Nech sú u, v dve slová, ktorých vzdialenost’ sa rovná minimálnej vzdialenostikódu C: d(u, v) = d ∗ . Slovo u − v je tiež kódové slovo a pre jeho váhu platí wt(u − v) =d(u, v) = d ∗ . Na druhej strane, ak by v kóde C existovalo nenulové kódové slovo ws váhou wt(w) < d ∗ , potom by aj d(w, 0) < d ∗ čo je v spore s definíciou minimálnejvzdialenosti.Ak si dáme do súvislosti geometrickú interpretáciu samoopravných kódov s tvrdenímvety, tak vidíme, že na zostrojenie samoopravného kódu opravujúceho chyby váhy t stačízostrojit’ lineárny kód s minimálnou váhou w ∗ ≥ 2t + 1.Budeme pokračovat’ v skúmaní lineárnych kódov. Pripomenieme, že skalárny súčindvoch vektorov u = (u 1 , . . . , u n a v = (v 1 , . . . , v n je definovaný ako〈u, v〉 = u 1 v 1 + · · · + u n v n .2 Aj takto kód sa však dá použit’ v špeciálnych prípadoch, napríklad pri testovaní prenosového kanála.

8.1. ZÁKLADNÉ VLASTNOSTI LINERÁRNYCH KÓDOV 87Nech C je lineárny podpriestor vektorového priestoru GF(q) n . Dá sa l’ahko overit’, žemnožina C ⊥ , definovaná nasledovneC ⊥ = {u ∈ GF(q) n ; ∀ v ∈ C 〈u, v〉 = 0}tvorí lineárny podpriestor vektorového priestoru GF(q) n . (Podpriestor C ⊥ sa nazývaortogonálny doplnok podpriestoru C.) Kedže C ⊥ je lineárny podpriestor vektorovéhopriestoru GF(q) n , predstavuje podl’a definície lineárneho kódu taktiež lineárny kód, ktorýbudeme nazývat’ duálnym kódom kódu C.Poznámka. To, že je C ⊥ ortogonálnym doplnkom lineárneho podpriestoru C neznamená,že sú tieto podpriestory disjunktné. Zrejme 0 ∈ C ⊥ ⋂ C a existujú dokoncalineárne kódy, pre ktoré platí C ⊥ = C (samoduálne lineárne kódy.)Vd’aka tomu, že lineárny kód C predstavuje lineárny podpriestor vektorového priestoruGF(q) n , možno ho popísat’ efektívnejšia, ako tie blokové kódy, ktoré nemali žiadnurozumnú štruktúru a bolo ich potrebné popísat’ vymenovaním všetkých kódovýchslov. Lineárny podpriestor je jednoznačne zadaný pomocou množiny vektorov, ktoráho generuje. Spomedzi všetkých množín vektorov, generujúcich daný lineárny podpriestor(lineárny kód) C vyberieme množinu s minimálnym počtom prvkov 3 , bázu avektory prvky bázy zapíšeme ako riadky matice G. Matica G sa nazýva generujúcoumaticou lineárneho kódu C, pretože l’ubovol’ný vektor-kódové slovo kódu C možno zapísat’pomocou lineárnej kombinácie riadkov-vektorov matice G. Ak je C lineárnym podpriestoromdimenzie k vektorového priestoru dimenzie n, tak jeho generujúca matica Gmá k (lineárne nezávislých) riadkov a n stĺpcov. Pripomíname, že samotný kód C mápotom q k kódových slov.Generujúca matica umožňuje efektívne vytváranie kódových slov. L’ubovol’ný vektori ∈ GF(q) k ; i = (i 1 , . . . , i k ) môžeme chápat’ ako k-ticu informačných symbolov (informačnývektor) a transformovat’ ho na kódové slovo nasledujúcim spôsobomu = iG,kde G je generujúca matica lineárneho (n, k) kódu. Pripomíname, že existuje viacerospôsobov výberu generujúcej matice G lineárneho kódu a tak sa informačnému vektorui v závislosti od výberu G vo všeobecnosti priradia rozličné slová. V časti ?? sa budemepodrobnejšia zaoberat’ vplyvom výberu generujúcej matice na vlastnosti lineárneho kódu.Ako vyzerá kódovanie správy 4 pomocou lineárneho (n, k) kódu? Postupnost’ znakovsprávy sa rozdelí na bloky dĺžky k a tie sa postupne vynásobia generujúcou maticou G atak sa transformujú na postupnost’ kódových slov, obr. 8.1Ilustrujeme kódovanie správy pomocou lineárneho kódu na nasledujúcom jednoduchompríklade.Príklad. Hammingove kódy opravujúce chyby váhy 1 sú lineárne kódy. Kvôli zjednodušeniuvýpočtov zoberieme kratší Hammingov kód, ako sme skonštruovali v časti 7.4;3 pripomíname, že takýchto množín je viac a tak vyberieme l’ubovol’nú z nich.4 predpokladáme, že správa je zapísaná ako postupnost’ znakov - prvkov GF(q)

88 KAPITOLA 8. LINEÁRNE KÓDYi 1 . . . i k i k+1 . . . i 2k i 2k+1 . . . i 3k i 3k+1 . . .↓ ↓ ↓ ↓iG iG iG . . .↓ ↓ ↓ ↓u 1 . . . i n u n+1 . . . u 2n u 2n+1 . . . u 3n u 3n+1 . . .Obrázok 8.1: Kódovanie správy pomocou lineárneho kódu s generujúcou maticou GHammingov (7, 4) kód C. Kód C je binárny kód dĺžky 7 s minimálnou vzdialenost’ou d∗ =3; kódové slovo má 4 informačné a 3 kontrolné symboly. Nech sú i 1 , i 2 , i 3 , i 4 informačnésymboly kódového slova u = (u 1 , . . . , u 7 ). Položíme u 3 = i 1 , u 5 = i 2 , u 6 = i 3 , u 7 = i 4 .Hodnoty kontrolných symbolov u 1 , u 2 , u 4 vypočítame pomocou troch kontrolných súm("+öznačuje súčet modulo 2):u 1 + u 3 + u 5 + u 7 = 0 u 1 = i 1 + i 2 + i 4u 2 + u 3 + u 4 + u 7 = 0 u 2 = i 1 + i 3 + i 4u 4 + u 5 + u 6 + u 7 = 0 u 4 = i 2 + i 3 + i 4Nulový vektor spĺňa vyššie uvedené vzt’ahy a teda nulové slovo je kódovým slovom Hammingovho(7, 4) kódu. Nech sú u, v dve kódové slová Hammingovho (7, 4) kódu; t.j.u = (u 3 + u 5 + u 7 , u 3 + u 4 + u 7 , u 3 , u 5 + u 6 + u 7 , u 5 , u 6 , u 7 ),v = (v 3 + v 5 + v 7 , v 3 + v 4 + v 7 , v 3 , v 5 + v 6 + v 7 , v 5 , v 6 , v 7 ).Potom súčet vektorovu + v = (u 3 + u 5 + u 7 + v 3 + v 5 + v 7 , u 3 + u 4 + u 7 + v 3 + v 4 + v 7 , u 3 + v 3 ,u 5 + u 6 + u 7 + v 5 + v 6 + v 7 , u 5 + v 5 , u 6 + v 6 , u 7 + v 7 ) =(u 3 + v 3 + u 5 + v 5 + u 7 + v 7 , u 3 + v 3 + u 4 + v 4 + u 7 + v 7 , u 3 + v 3 ,u 5 + v 5 + u 6 + v 6 + u 7 + v 7 , u 5 + v 5 , u 6 + v 6 , u 7 + v 7 )tiež spĺňa kontrolné sumy a teda patrí do kódu C. Tým sme dokázali, že l’ubovol’nálineárna kombinácia vektorov-slov kódu C je kódovým slovom (pripomíname, že GF(2) 7s operáciami modulárneho sčítania po zložkách je vektorový priestor a koeficienty vlineárnej kombinácii sú prvky pol’a GF(2), t.j. prvky množiny {0, 1}, a teda aj to, že Hammingovkód je lineárny kód. (Hammingov (7,4) kód je uvedený v nasledujúcej tabul’ke).0000000 1110000 1001100 01010101101001 0111100 1011010 00110011100110 0100101 1000011 00101101010101 0110011 0001111 1111111Generujúca matica Hammingovho (7,4)-kódu vyzerá nasledovne:

8.1. ZÁKLADNÉ VLASTNOSTI LINERÁRNYCH KÓDOV 89G =⎡⎢⎣1110000100110001010101101001⎤⎥⎦Vytvoríme kódové slovo pre informačný vektor i = (1111):⎡ ⎤1110000(1111)⎢ 1001100⎥⎣ 0101010 ⎦ = (1111111).1101001Pri dekódovaní správ zakódovaných pomocou lineárneho kódu C možno výhodnepoužit’ generujúcu maticu duálneho kódu C ⊥ , ktorú označíme symbolom H. Ak je Clineárny (n, k)-kód, C ⊥ je lineárny (n, n − k)-kód a generujúca matica kódu C ⊥ má n − kriadkov a n stĺpcov, pričom riadky matice H tvoria vektory bázy lineárneho podpriestoruC ⊥ . Ked’že C je ortogonálny doplnok lineárneho podpriestoru C ⊥ , každý vektor (kódovéslovo) u ∈ C je ortogonálny na l’ubovol’ný vektor v ∈ C ⊥ a špeciálne, na l’ubovol’nývektor-riadok matice H. To znamená, že u je kódové slovo práve vtedy, akuH ⊤ = 0kde 0 je v tomto prípade nulový vektor dĺžky n − k Ked’že matica H umožňuje overit’, čije nejaké slovo kódovým slovom kódu C, nazýva sa kontrolnou maticou kódu C. Pripomínameešte, že generujúca matica G kódu C je kontrolnou maticou jeho duálneho kóduC ⊥ .Príklad. Kontrolná matica Hammingovho (7, 4) kódu z príkladu 8.1 má tvar⎡ ⎤1010101H = ⎣ 0110011 ⎦0001111Na základe kontrolnej matice je možné určit’ minimálnu vzdialenost’ príslušnéholineárneho kódu.Veta 8.1.2. Lineárny kód C nad pol’om GF(q) obsahuje nenulové kódové slovo váhy menšejalebo rovnej w práve vtedy, ak jeho kontrolná matica H obsahuje w lineárne závislýchstĺpcov.Dôkaz Označme vektory-stĺpce kontrolnej matice H symbolmi h 1, . . . , h n ;H = [h 1 ⊤ , . . . , h n ⊤ ].Nech v množine vektorov {h 1 , . . . , h n } existuje w lineárne závislých vektorov h i1 , . . . , h iw ;t.j. existujú také konštanty a i1 , . . . , a iw ∈ GF(q), žea i1 h i1 + . . . , a iw h iw = 0

90 KAPITOLA 8. LINEÁRNE KÓDYMedzi konštantami a i1 , . . . , a iw ∈ GF(q) je aspoň jedna nenulová, a teda vektor a ktoréhokomponenty na pozíciách i 1 , . . . , i w nadobúdajú v poradí hodnoty a i1 , . . . , a iw a ostatnékomponenty sú nulové, predstavuje nenulové kódové slovo váhy ≤ w, nakol’koaH ⊤ = a i1 h i1 + . . . , a iw h iw = 0.Na druhej strane, nech v kóde C existuje kódové slovo a váhy w s nenulovými komponentamia i1 , . . . , a iw . Ked’že a je kódové slovo, platí preňaH ⊤ = a i1 h i1 + . . . , a iw h iw = 0;t.j. vektory-stĺpce kontrolnej matice h i 1, . . . , h iw sú lineárne závislé.Dôsledok. Lineárny kód C s kontrolnou maticou H má minimálnu vzdialenost’ w právevtedy, ak je v matici H l’ubovol’ných w − 1 stĺpcov lineárne nezávislých a v H existuje wlineárne záviských stĺpcov.To znamená, že ak chceme zostrojit’ lineárny (n, k)-kód C opravujúci chyby váhy aspoňt, musíme skonštruovat’ maticu H typu (n−k)×n, v ktorej je l’ubovol’ných 2t stĺpcovlineárne nezávislých a použit’ ju ako kontrolnú maticu kódu C. Ked’že medzi vektormidĺžky n − k môže byt’ nanajvýš n − k lineárne nezávislých vektorov, matica H môžu byt’nezávislé nanajvýš všetky (n−k)-tice stĺpcov ale l’ubovol’ná (n−k+1)-tica stĺpcov maticeH je lineárne závislá. Tým sme dokázali nasledujúcu vetu.Veta 8.1.3 (Singeltonova hranica). Pre minimálnu vzdialenost’ (minimálnu váhu) lineárneho(n, k)-kódu platí nasledujúca nerovnost’d ∗ ≤ 1 + n − k.L’ubovol’ný lineárny kód s minimálnou vzdialenost’ou, ktorá spĺňa rovnost’d ∗ = 1 + n − ksa nazýva lineárnym kódom s maximálnou vzdialenost’ou. Zo Singeltonovej hranice vyplýva,že na to, aby kód bol schopný opravovat’ chyby váhy t musí v kódovom slove byt’aspoň 2t kontrolných symbolov; t.j aspoň dva kontrolné symboly na chybu v jednom komponentekódového slova. Väčšina samoopravných kódov má viac kontrolných symbolov.Aj ked’ je l’ubovol’ná n × k matica, ktorej riadky tvoria bázu lineárneho podpriestorudimenzie k generujúcou maticou lineárneho (n, k)-kódu, kvôli zjednodušeniu výpočtovupravíme generujúcu maticu na nasledujúci štandardný tvar; G = [I k .P], kde I k je jednotkovámatica rádu k a P je matica typu k × (n − k). (Výhodou štandardného tvarugenerujúcej matice je o.i. aj to že sa z nej dá jednoducho odvodit’ kontrolná matica.)Ukážeme, že pre l’ubovol’ný lineárny (n, k)-kód generovaný generujúcou maticou G existujelineárny (n, k)-kód generovaný generujúcou maticou v štandardnom tvare s rovnakýmiparametrami.Nech je lineárny G generujúca matica lineárneho (n, k)-kódu C. Riadky matice Gtvoria bázu lineárneho podpriestoru C. Z lineárnej algebry je známe (pozri napr. [4]), žeak vektory bázy transformujeme pomocou nasledujúcich transformácií

8.1. ZÁKLADNÉ VLASTNOSTI LINERÁRNYCH KÓDOV 91• vektor nahradíme jeho nenulovým násobkom;• k vektoru bázy pripočítame l’ubovol’nú lineárnu kombináciu ostatných vektorov,výsledná množina vektorov bude tvorit’ bázu pôvodného lineárneho priestoru. To znamená,že l’ubovol’ná matica G ′ , ktorú dostaneme z generujúcej matice G pomocou vyššieuvedených elementárnych operácií nad riadkami, je generujúcou maticou pôvodného kóduC.Ďalšou transformáciou generujúcej matice je výmena jej stĺpcov. Nech je G = [g 1g 2. . . g n ] generujúca matica kódu C. Predpokladajme kvôli jednoduchosti, že v generujúcejmatici G vymeníme prvý a druhý stĺpec, t.j. dostávame maticu G′′ = [g 2 g 1 . . . g n ]. Jezrejmé, že riadky matice G ′′ sú lineárne nezávislé, a teda matica G ′′ je generujúcoumaticou lineárneho (n, k)-kódu, ktorý označíme symbolom C ′′ . Nech je i = (i 1 . . . i k )l’ubovol’ný informačný vektor. Pre vektor i zostrojíme kódové slová tak v kóde C ako aj vC ′′ :iG = (〈i, g 1 〉, 〈i, g 2 〉, . . . , 〈i, g n 〉) = u = (u 1 , u 2 , . . . , u n );iG ′′ = (〈i, g 2 〉, 〈i, g 1 〉, . . . , 〈i, g n 〉) = u ′′ = (u 2 , u 1 , . . . , u n ).Z vyššie uvedeného vyplýva, že výmena i-teho a j-teho stĺpca generujúcej matice kóduC zodpovedá s výmenou i-teho a j-teho komponentu v kódových slovách kódu C. Nechje π l’ubovol’ná permutácia množiny 1 . . . n a nech sú u, v l’ubovol’né kódové slová kóduC, resp. u ′′ , v ′′ im prislúchajúce kódové slová kódu C ′′ , ktorý dostaneme permutácioukomponentov kódových slov permutáciou π potomd(u, v) =∑1≤i≤n(u i ≠ v i ) =∑π(i),1≤i≤n(u π(i) ≠ v π(i) ) = d(u ′′ , v ′′ )To znamená, že kódy, ktoré dostaneme z kódu C pomocou elementárnych operácií nadriadkami a permutácii stĺpcov generujúcej matice G majú rovnaké parametre (počet kódovýchslov, minimálnu vzdialenost’) ako kód C a preto ich budeme nazývat’ ekvivalentnýmikódmi. Pomocou vyššie popísaných transformácií nad riadkami a stĺpcami generujúcejmatice možno l’ubovol’nú generujúcu maticu transformovat’ na tvarG = [I k .P],kde I k je jednotková matica rádu k a P je matica typu k × (n − k). Generujúca matica vtvare G = [I k .P] sa nazýva generujúcou maticou v systematickom tvare. Ak G = [I k .P],príslušná kontrolná matica má tvarH = [−P ⊤ .I n−k ],nakol’ko GH ⊤ = −P + P = 0. Ak má kód generujúcu maticu v systematickom tvare, tak vjeho kódových slovách nasledujú kontrolné symboly až za informačnými. Takýto kód saniekedy nazýva systematickým kódom [2, 1].

92 KAPITOLA 8. LINEÁRNE KÓDYPoznámka. Jacobus van Lint [15] definuje systematický kód odlišne: kód C je systematickýv k komponentoch, ak |C| = q k a pre l’ubovol’ný výber hodnôt v daných kkomponentoch existuje práve jedno kódové slovo. Ked’že lineárny systematický (n, k)-kód podl’a našej definície je systematickým kódom aj podl’a van Linta (ale nie naopak),budeme sa pridržiavat’ zavedenej definície systematického kódu.Veta 8.1.4. Ku každému lineárnemu kódu existuje ekvivalentný systematický lineárnykód.Dôkaz. Nech je C l’ubovol’ný lineárny (n, k)-kód s generujúcou maticou G. Potomgenerujúcu maticu G možno transformovat’ na maticu G ′′ v systematickom tvare, ktoráje generujúcou maticou kódu ekvivalentnému kódu C. Ked’že G ′′ je systematickom tvare,kód ktorý generuje je systematický.Poznámka. Z predchádzajúcej vety vyplýva, že ak to bude potrebné, môžeme bez ujmyna všeobecnosti predpokladat’, že lineárny kód je systematický.8.2 Dekódovanie lineárnych kódovNech je daný lineárny kód C a nech u ∈ C je odvysielané kódové slovo. Predpokladajme,že pri prenose slova u vznikla chyba e v jej dôsledku bolo prijaté slovo w = u + e. Akotabul’ku dekódovania budeme na dekódovanie lineárnych kódov budeme používat’ tzv.maticu štandardného rozkladu, ktorú vytvoríme tak, že faktorizujeme aditívnu grupu(GF(q) n , +) podl’a C a za reprezentantov jednotlivých tried rozkladu vyberieme vektoryminimálnej váhy, ktoré sa v daných triedach rozkladu nachádzajú. Rozklad potom zapíšemev podobe matice, kde v prvom stĺpci sú uvedení reprezentanti tried rozkladu a vprvom riadku kódové slová kódu C:v 0 v 1 v 2 . . . v q k −1e 1 v 1 + e 1 v 2 + e 1 . . . v q k −1 + e 1e 2 v 1 + e 2 v 2 + e 2 . . . v q k −1 + e 2... ..e q n−k −1 v 1 + e q n−k −1 v 2 + e q n−k −1 . . . v q k −1 + e q n−k −1Dekódovanie pomocou tabul’ky dekódovania vyzerá nasledovne: nájdeme v tabul’keprijaté slovo w. Ak sa w nachádza v stĺpci j dekódujeme ho ako kódové slovo v j; t.j. akokódové slovo, ktoré sa nachádza v prvom riadu a j-tom stĺpci tabul’ky dekódovania. Jezrejmé, že dekódovanie pomocou tabul’ky dekódovania naráža na niekol’ko problémov.Prvým je možnost’ nesprávneho dekódovania prijatého slova. Ak pri prenose kódovéhoslova u vznikne chyba v + e, kde v je kódové slovo, tak sa prijaté slovo w = u + (v + e)dekóduje nesprávne na kódové slovo u + v. Kritériá správneho dekódovania lineárneho 5kódu pomocou tabul’ky dekódovania uvádza nasledujúca veta.5 tvrdenie vety platí pre blokový kód nad GF(q)

8.2. DEKÓDOVANIE LINEÁRNYCH KÓDOV 93Veta 8.2.1. Ak sa matica štandardného rozkladu používa ako matica dekódovania lineárnehokódu, tak sa prijatý wektor w dekóduje na odvysielaný vektor (kódové slovo) u právevtedy, ak chyba w − u, ktorá vznikla pri prenose je reprezentantom niektorej triedy rozkladu.Dôkaz. Nech je e i = w − u reprezentantom niektorej triedy rozkladu. Potom prijatývektor w patrí do triedy [e i ] a v tabul’ke dekódovania sa nachádza v stĺpci určenom vektoromu = w − e i , a teda bude dekódovaný správne.Nech na druhej strane e i = w − u nie je reprezentantom niektorej triedy rozkladu; t.j.prijaté slovo w patrí do triedy [e j ], i ≠ j. Potom sa však w nachádza v stĺpci zodpovedajúcomkódovému slovu w − e j , a teda sa dekóduje nesprávne.Z vety 8.2.1 vyplýva, že nie je možné vylúčit’ možnost’ nesprávneho dekódovanialineárneho kódu. Predpokladajme, že prenosový kanál je q-nárny symetrický kanál 6a potom vhodnou vol’bou reprezentantov tried rozkladu môžeme minimalizovat’ pravdepodobnost’nesprávneho dekódovania. Využijeme nasledujúci dôsledok predchádzajúcejvety.Dôsledok vety 8.2.1 (Lineárny) kód opravuje chyby váhy ≤ t práve vtedy, ak súreprezentantami tried rozkladu všetky vektory váhy t a menšej.Kód, definujúci rozklad, v ktorom sú reprezentantmi tried rozkladu všetky vektoryváhy t a menšej, sa nazýva dokonalým kódom. Ak sa dekódovanie prijatého slovarobí na základe maximálnej pravdepodobnosti (t.j. prijaté slovo sa dekóduje na kódovéslovo, ktoré bolo s najvyššou pravdepodobnost’ou odvysielané), tak pravdepodobnost’ nesprávnehodekódovania dokonalého kódu je minimálna. Problém je v tom, že dokonalýlineárny (n, k)-kód nad GF(q) opravujúci chyby váhy ≤ t, musí spĺňat’ nasledujúcu podmienku:t∑j=0( nj)(q − 1) j = q n−ka kódov, ktorých parametre túto podmienku spĺňajú takmer niet (ako sme už spomínali,jedinými známymi dokonalými kódmi sú Hammingove kódy a Golayov kód). Pretosa podmienka o reprezentantoch tried rozkladu mierne oslabuje a zavádza sa pojemkvázidokonalého kódu ako kódu definujúceho rozklad, v ktorom sú reprezentantmi triedrozkladu všetky vektory váhy t a menšej a niekol’ko vektorov váhy t + 1. Ilustrujemezavedené pojmy na nasledujúcom príklade.Príklad.[2] Lineárny (5,2)-kód C s generujúcou maticouG =[ 1011101101]6 Pripomíname, že pri prenose slova q-nárnym symetrickým kanálom je pravdepodobnost’ toho, ževznikne chyba menšej váhy väčšia, ako pravdepodobnost’ toho, že vznikne chyba väčšej váhy.

94 KAPITOLA 8. LINEÁRNE KÓDYa kontrolnou maticouH =⎡⎣111001001011001má minimálnu vzdialenost’ 3 a umožňuje opravovat’ chyby váhy 1. Matica štandardnéhorozdelenia kódu C vyzerat’ nasledovne:⎤⎦00000 10111 01101 1101000001 10110 01100 1101100010 10101 01111 1100000100 10011 01001 1111001000 11111 00101 1001010000 00111 11101 0101000011 10100 01110 1100100110 10001 01011 11100Kód C je kvázidokonalý kód, pretože okrem nulového vektora a piatich vektorov váhy1 sú reprezentantami tried rozkladu aj dva vektory váhy 2. Kód opravuje všetky chybyváhy 1 a dve z desiatich možných chýb váhy 2. Pravdepodobnost’ nesprávneho dekódovaniakódového slova preneseného binárnym symetrickým kanálom (s pravdepodobnost’ousprávneho prenosu znaku p = 0.99) je 0.0007860898.Matica štandardného rozkladu môže byt’ pre praktické používanie príliš vel’ká. Využijemeteraz to, že dekódujeme lineárny kód a na jeho dekódovanie zostrojíme podstatnemenšiu tabul’ku dekódovania. Predpokladajme znova, že bolo odvysielané kódové slovou a že pri prenose nastala chyba e, v dôsledku ktorej bolo prijaté slovo w = u + e.Vynásobíme prijaté slovo kontrolnou maticou a dostávame(u + e)H ⊤ = uH ⊤ + eH ⊤ = 0 + eH ⊤ = s,kde s je vektor dĺžky n − k, nazvaný syndrómom chyby. Ako sme videli, syndróm chybynezávisí od odvysielaného kódového slova, ale len od samotného chybového vektora e.Pozrime sa teraz na triedu rozkladu s reprezentantom e i :[e i ] = v 0 + e i , . . . , v q k −1 + e i.Pre l’ubovol’ný vektor w = v j + e i z triedy [e i ] platí(w)H ⊤ = v j H ⊤ + e i H ⊤ = 0 + e i H ⊤ = s i ;t.j. všetky vektory z triedy [e i ] majú rovnaký syndróm, s i . Ak budeme používat’ metódudekódovania na základe maximálnej pravdepodobnosti (prijaté slovo w dekódovat’ na tokódové slovo, ktoré bolo odvysielané s najväčšou pravdepodobnost’ou) tak:1. vypočítame syndróm (w)H ⊤ = s i ,2. v tabul’ke dekódovania nájdeme reprezentanta triedy rozkladu, ktorej zodpovedásyndróm s i ; e i ,

8.3. REED-MULLEROVE KÓDY 953. vypočítame kódové slovo: w − e i .Tabul’ka dekódovania, ktorú sme použili v druhom kroku má q n−k riadkov a dva stĺpce;v prvom sú uvedené syndrómy chýb a v druhom im prislúchajúci reprezentanti triedrozkladu.Príklad.[2] Lineárny (5,2)-kód C z predchádzajúceho príkladu má tabul’ku syndrómovpredstavitel’ triedy syndrómrozkladu00000 00000001 00100010 01000100 10001000 10110000 11100011 01100110 1108.3 Reed-Mullerove kódyV tejto časti uvedieme podrobnejšie jeden špeciálny prípad lineárnych kódov, Reed-Mullerovekódy, ktoré majú jednoduchý popis a jednoduché dekódovanie. Reed-Mullerovekódy sú charakterizované dvoma základnými parametrami - rádom r a hodnotou m; 0 ≤r < m určujúcou dĺžku kódového slova. Existujú Reed-Mullerove kódy s rozličnýmidĺžkami kódových slov a rôznymi opravnými schopnost’mi. Reed-Mullerov kód s parametramir, m budeme označovat’ symbolom R(r, m). V nasledujúcej tabul’ke sú uvedenézákladné parametre kódu R(r, m).n = 2 mk = ∑ ( m)0≤j≤r jn − k = ∑ ( m)r

96 KAPITOLA 8. LINEÁRNE KÓDYAby sme mohli popísat’ konštrukciu generujúcej matice G kódu R(r, m), zavediemeoperáciu súčinu vektorov. Nech sú u = (a 1 , . . . , a n ) a v = (b 1 , . . . , b n ) dva vektory vektorovéhopriestoru V. Súčinom (pozor, nejedná sa ani o vektorový ani o skalárny súčinvektorov) vektorov u, v nazveme vektor uv = (a 1 b 1 , . . . , a n b n ). (Ide o súčin vektorovpo zložkách; v binárnom prípade môžeme pomocou konvencie jazyka C zapísat’ súčinvektorov u, v nasledovne uv = u&v.) Podmatice G 0 , . . . , G r generujúcej matice G sú definovanénasledovne:1. G 0 je jednotkový vektor dĺžky 2m ;2. G 1 je matica typu m × 2 m , ktorej stĺpcami sú všetky možné binárne vektory dĺžkym;3. G l , 1 ≥ l ≥ r je binárna matica typu ( ml)× 2 m ; riadkami podmatice G l sú všetkyvektory, ktoré sú výsledkom súčinu l vektorov z matice G 1 .Ilustrujeme konštrukcie generujúcej matice Reed-Mullerových kódov na príklade R(3, 4).Príklad.⎡G 0 = [ 1111111111111111 ] ⎤⎡⎤0000000011111111G 1 = ⎢ 0000111100001111⎥⎣ 0011001100110011 ⎦0101010101010101⎡⎤00000000000011110000000000110011G =G 2 =0000000001010101⎢ 0000001100000011⎥⎣ 0000010100000101 ⎦0001000100010001⎡⎤0000000000000011⎢⎣G 3 = ⎢ 0000000000000101⎥ ⎥⎣ 0000000000010001 ⎦ ⎦0000000100000001Generujúca matica kódu R(3, 4) je matica typu (15, 16). To znamená, že kód R(3, 4) má 15informačných a 1 kontrolný symbol. (Kód R(3, 4) je triviálny kód s testom parity, schopnýmodhal’ovat’ chyby párnej váhy.) Neskôr zostrojíme aj netriviálny Reed-Mullerovkód a na ňom ilustrujeme metódy kódovania a dekódovanie informácie. SkonštruujemeR(2, 4), Reed-Mullerov kód rádu 2 dĺžky 16 s generujúcou maticou typu (11, 16) :⎡ ⎤G 0G = ⎣ G 1⎦G 2Z konštrukcie generujúcej matice Reed-Mullerovko kódu vyplýva, že R(r − 1, m) jemožné zostrojit’ z R(r, m) tak, že sa z generujúcej matice G kódu R(r, m) vynechá podmaticaG r . To ale znamená, že R(r−1, m) ⊂ R(r, m), a teda minimálna vzdialenost’ d ∗ kóduR(r, m) nemôže byt’ väčšia ako je minimálna vzdialenost’ kódu R(r − 1, m). Ukážeme,

8.3. REED-MULLEROVE KÓDY 97žed ∗ = 2 m−r .Každý riadok podmatice G s generujúcej matice G kódu R(r, m) má váhu 2 m−s , 0 ≤ s ≤r < m. Ked’že aj riadky generujúcej matice predstavujú kódové slová kódu R(r, m),d ∗ ≤ 2 m−r .Ukážeme, že kód R(r, m) opravuje chyby váhy 2 m−r−1 − 1 a teda jeho minimálna vzdialenost’nie je menšia ako 2 m−r − 1. Vzhl’adom na to, že kód R(r, m) obsahuje len slovápárnej váhy, z vyšie uvedeného potom vyplýva, že d ∗ = 2 m−r . Ked’že Reed-Mullerovekódy sú lineárne kódy, mohli by sme pre kód R(r, m) zostrojit’ kontrolnú maticu a nadekódovanie prijatých slov použit’ klasickú metódu dekódovania lineárnych kódov. Reednavrhol zvláštnu metódu dekódovania Reed-Mullerových kódov, ktorá umožňuje rekonštruovat’informačné symboly na základe prijatého slova priamo, bez toho, aby bolo potrebnévypočítat’ syndróm chyby a určovat’ vektor chýb. Popíšeme teraz Reedovu metódu dekódovania.Nech je daný informačný vektor i = (i 0 , . . . , i k−1 ). Vzhl’adom na štruktúru generujúcejmatice kódu R(r, m), rozdelíme aj informačný vektor na bloky vel’kost’ou zodpovedajúcepodmaticiam G j generujúcej matice: i = (i 0 , i 1 , . . . , i r ). Pripomíname, že blok i l budemat’ dĺžku ( )ml . Kódové slovo u zodpovedajúce informačnému vektoru i zostrojíme tak,že vynásobíme informačný vektor generujúcou maticou kódu:⎡u = iG = (i 0 , i 1 , . . . , i r ) × ⎢⎣⎤G 0G 1⎥. ⎦G rPredpokladajme, že pri prenose kódového slova došlo ku chybám, v dôsledku ktorýchbolo prijaté slovo v = u + e, wt(e) < 2 m−r−1 . Podstata Reedovho algoritmu spočíva vtom, že sa pomocou kontrolných súm, ktorých argumentami sú symboly prijatého slovav určia informačné symboly bloku i r a potom sa vypočíta slovo⎡ ⎤G 0v (1) G 1= v − i r G r = (i 0 , . . . , i r−1 ) × ⎢ ⎥⎣ . ⎦ + e,G r−1ktoré je „pokazeným“ kódovým slovom kódu R(r − 1, m). Podobným spôsobom postupneurčíme hodnoty informačných symbolov z blokov i r−1 , . . . , i 1 . Hodnotu poslednéhoinformačného bitu, i 0 = i 0 určíme zo slovav (r) = v (r−1) − i 1 G 1 = i 0 × G 0 + e.Ak i 0 = 0, v (r) = e, v opačnom prípade v (r) = e. To znamená, že ak wt(v (r) ) < 2 m−1 , i 0 =0; v opačnom prípade i 0 = 1. Otvorenou otázkou zostáva, ako zostavit’ kontrolné sumyna výpočet informačných symbolov i 1 , . . . , i k−1 . Riešenie tohto problému ilustrujeme naavizovanom príklade dekódovania kódu R(2, 4).

98 KAPITOLA 8. LINEÁRNE KÓDYPríklad. Nech je C Reed-Mullerov kód rádu 2, dĺžky 16. Generujúca matica kódu C, doplnenákvôli názornosti o riadok obsahujúci kódové slovo a stĺpec obsahujúci informačnývektor, je uvedená v nasledujúcej tabul’ke.Nech jev 0 v 1 v 2 v 3 v 4 v 5 v 6 v 7 v 8 v 9 v 10 v 11 v 12 v 13 v 14 v 15i 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1i 1 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1i 2 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1i 3 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1i 4 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1i 5 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1i 6 0 0 0 0 0 0 0 0 0 0 1 1 0 0 1 1i 7 0 0 0 0 0 0 0 0 0 1 0 1 0 1 0 1i 8 0 0 0 0 0 0 1 1 0 0 0 0 0 0 1 1i 9 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 1i 10 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1i = (1 0011 100001)informačný vektor, potom kódové slovo prislúchajúce vektoru i jeu = (1000 1000 1000 0111).Predpokladajme, že pri prenose vznikla chyba e váhy 1;a bolo prijaté slovoe = (0001 0000 0000 0000),v = u + e = (1001 1000 1000 0111).Pri konštrukcii kontrolných sú, budeme vychádzat’ zo vzt’ahu u = iG; t.j. zo vzt’ahovmedzi informačnými symbolmi a symbolmi kódového slova:u 0 = i 0u 1 = i 0 + i 4u 2 = i 0 + i 3u 3 = i 0 + i 3 + i 4 + i 10. . .u 15 = i 0 + i 1 + · · · + i 10Vyjadríme neznáme hodnoty informačných symbolov i 5 , . . . , i 10 pomocou známych symbolovprijatého slova:i 10 = v 0 + v 1 + v 2 + v 3i 10 = v 4 + v 5 + v 6 + v 7i 10 = v 8 + v 9 + v 10 + v 11i 10 = v 12 + v 13 + v 14 + v 15

8.3. REED-MULLEROVE KÓDY 99Všimneme si, že každý symbol prijatého slova vystupuje práve v jednej kontrolnej sume.To znamená, že ak pri prenose vznikla chyba váhy 1, chyba ovplyvní výsledok právejednej kontrolnej sumy. Hodnotu i 10 určíme „hlasovaním“; v našom prípade sú hodnotykontrolných súm 0, 1, 1, 1 a teda i 10 = 1. Podobne zostavíme kontrolné sumy pre informačnésymboly i 9 , i 8 , i 7 , i 6 , i 5 a určíme hodnoty uvedených informačných symbolovi 9 = v 0 + v 1 + v 4 + v 5 = 0i 9 = v 2 + v 3 + v 6 + v 7 = 1i 9 = v 8 + v 9 + v 12 + v 13 = 0i 9 = v 10 + v 11 + v 14 + v 15 = 0i 8 = v 0 + v 2 + v 4 + v 6 = 0i 8 = v 1 + v 3 + v 5 + v 7 = 1i 8 = v 8 + v 10 + v 12 + v 14 = 0i 8 = v 9 + v 11 + v 13 + v 15 = 0i 7 = v 0 + v 1 + v 8 + v 9 = 0i 7 = v 2 + v 3 + v 10 + v 11 = 1i 7 = v 4 + v 5 + v 12 + v 13 = 0i 7 = v 6 + v 7 + v 14 + v 15 = 0i 6 = v 0 + v 2 + v 8 + v 10 = 0i 6 = v 1 + v 3 + v 9 + v 11 = 1i 6 = v 4 + v 6 + v 10 + v 12 = 0i 6 = v 5 + v 7 + v 13 + v 15 = 0i 5 = v 0 + v 4 + v 8 + v 12 = 1i 5 = v 1 + v 5 + v 9 + v 13 = 1i 5 = v 2 + v 6 + v 10 + v 14 = 1i 5 = v 3 + v 7 + v 11 + v 15 = 0i 9 = 0i 8 = 0i 7 = 0i 6 = 0i 5 = 1Blok i 2 = (100001) informačných symbolov vynásobíme podmaticou G 2 generujúcej maticeG a výsledok odpočítame od prijatého slova v:v = 1001 1000 1000 0111i 2 G 2 = 0001 0001 0001 1110v (1) = v − i 2 G 2 = 1000 1001 1001 1001

100 KAPITOLA 8. LINEÁRNE KÓDYPripomíname, že slovo v (1) je kódové slovo kódu R(1, 4) „pokazené“ chybou e. Zostavímekontrolné sumy na výpočet informačných symbolov i 1 , . . . , i 4 :i 4 = 1v 0 + v 1 = 1 v 2 + v 3 = 0v 4 + v 5 = 1 v 6 + v 7 = 1v 8 + v 9 = 1 v 10 + v 11 = 1v 12 + v 13 = 1 v 14 + v 15 = 1i 3 = 1v 0 + v 2 = 1 v 1 + v 3 = 0v 4 + v 6 = 1 v 5 + v 7 = 1v 8 + v 10 = 1 v 9 + v 11 = 1v 12 + v 14 = 1 v 13 + v 15 = 1i 2 = 0v 0 + v 4 = 0 v 1 + v 5 = 0v 2 + v 6 = 0 v 3 + v 7 = 1v 8 + v 12 = 0 v 9 + v 13 = 0v 10 + v 14 = 0 v 11 + v 15 = 0i 1 = 0v 0 + v 8 = 0 v 1 + v 9 = 0v 2 + v 10 = 0 v 3 + v 11 = 1v 4 + v 12 = 0 v 5 + v 13 = 0v 6 + v 14 = 0 v 7 + v 15 = 0Vynásobíme blok i 1 = (0011) informačných symbolov podmaticou G 1 generujúcej maticekódu C a výsledok odčítame od vektora v (1) :v (1) = 1000 1001 1001 1001i 1 G 1 = 0110 0110 0110 0110v (2) = v (1) − i 1 G 1 = 1110 1111 1111 1111Napokon určíme i 0 . Váha wt(v (2) ) = 15 > 8, a to znamená, že i 0 = 1.

Kapitola 9Cyklické kódyLineárne kódy, ktoré sme študovali v predchádzajúcej časti, boli príkladom samoopravnýchkódov, ktoré sa dali efektívne konštruovat’ a pre ktoré existovali efektívne metódykódovania a (aspoň principiálne efektívne metódy) dekódovania. Pri štúdiu lineárnychkódov sme zaviedli základné parametre samoopravných kódov (opravná schopnost’, minimálnavzdialenost’, prenosová rýchlost’ a i.) a určili vzt’ahy medzi nimi. Z praktickéhohl’adiska je však najmä dekódovanie dlhších lineárnych kódov výpočtovo náročné. Pretoje potrebné hl’adat’ iné triedy samoopravných kódov, ktoré by zachovávali dobré vlastnostilineárnych kódov a vyznačovali sa aj výpočtovo efektívnymi metódami dekódovania.Cyklické kódy, ktoré sú podtriedou lineárnych kódov, vd’aka silnejšej algebraickejštruktúre, čiastočne spĺňajú uvedené požiadavky.Definícia 9.0.1. Lineárny kód C nazveme cyklickým kódom, ak pre l’ubovol’né kódovéslovo u = (u 0 , u 1 , . . . , u n−1 ) ∈ C platí u ′ = (u n−1 , u 0 , u 1 , . . . , u n−2 ) ∈ C.Názov cyklický kód vyplýva z toho, že operácia na slovách(u 0 , u 1 , . . . , u n−1 ) → (u n−1 , u 0 , u 1 , . . . , u n−2 )predstavuje cyklický posun kódového slova. Na cyklické kódy sa môžeme teda dívat’ akona lineárne podpriestory vektorového priestoru GF(q)nspĺňajúce dodatočnú podmienkuna uzavretost’ vzhl’adom na cyklickú posun kódových slov. Z hl’adiska konštrukcie, kódovaniaale najmä dekódovania bude efektívnejšia polynomická reprezentácia cyklickýchkódov; t.j. reprezentácia kódových slov z C ⊂ GF(q) n pomocou polynómov z faktorovéhookruhu GF(q)[x]/x n − 1.Príklad. Uvažujme Hammingov (15, 11) kód, ktorý sme zaviedli v časti 7.4 s kontrolnoumaticou⎡⎤1 0 1 0 1 0 1 0 1 0 1 0 1 0 1H = ⎢ 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1⎥⎣ 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 ⎦0 0 0 0 0 0 0 1 1 1 1 1 1 1 1Permutáciou stĺpcov kontrolnej matice H dostaneme kontrolnú maticu H′ kódu, ktorý101

102 KAPITOLA 9. CYKLICKÉ KÓDYje ekvivalentný pôvodnému Hammingovmu (15, 11) kódu:H ′ = H =⎡⎢⎣1 0 0 0 1 0 0 1 1 0 1 0 1 1 10 1 0 0 1 1 0 1 0 1 1 1 1 0 00 0 1 0 0 1 1 0 1 0 1 1 1 1 00 0 0 1 0 0 1 1 0 1 0 1 1 1 1Stĺpce kontrolnej matice H′ môžeme chápat’ dvojako: bud’ ako vektory dĺžky 4 nad pol’omGF(2), alebo ako prvky pol’a GF(2 4 ). Nech je α primitívny prvok pol’a GF(2 4 ), potom stĺpcekontrolnej matice H ′ môžeme vyjadrit’ pomocou mocnín prvku α nasledovne:[H ′ = α 0 , α 1 , α 2 , α 3 , α 4 , α 5 , α 6 , α 7 , α 8 , α 9 , α 10 , α 11 , α 12 , α 13 , α 14] .Ako bude vyzerat’ dekódovanie? Nech u = (u 0 , u 1 , . . . , u 14 ) ∈ C je kódové slovo. PotomuH ′⊤ = 0.Posledný vzt’ah môžeme rozpísat’ nasledovne:uH ′⊤ = u 0 α 0 + u 1 α 1 + u 2 α 2 + u 3 α 3 + u 4 α 4 + u 5 α 5 + u 6 α 6 + u 7 α 7 + u + 8α 8 + u 9 α 9 ++ u 10 α 10 + u 11 α 11 + u 12 α 12 α 13 + u 14 α 14 = 0.⎤⎥⎦ .Zavedieme teraz prirodzenú korešpondenciu medzi kódovými slovami Hammingovho(15, 11) kódu a polynómami z okruhu polynómov GF(2)[x]/x 15 − 1:(u 0 , u 1 , . . . , u 14 ) ↔ u 0 + u 1 x + u 2 x 2 + · · · + u 14 x 14 ,resp. vo všeobecnom prípade vektor v = v 0 , . . . , V n−1 nad pol’om GF(q) budeme reprezentovat’polynómom v 0 + v 1 x + · · · + v n−1 x n−1 z okruhu polynómov GF(q)[x]/x n − 1. Vrát’mesa ku príkladu. Násobenie vektora v kontrolnou maticou H ′ predstavuje vyčíslenie hodnotypolynómu v(x) v prvku α ∈ GF(2 4 ). Je zrejmé, že prijaté slovo v je kódovým slovomHammingovho (15, 11) kódu práve vtedy, ak v(α) = 0. Polynómy zodpovedajúce kódovýmslovám, budeme nazývat’ kódovými polynómami.V predchádzajúcom prípade sme od kontrolnej matice nad pol’om GF(q) prešli k takejreprezentácii kontrolnej matice, v ktorej celému vektoru-stĺpcu zodpovedal jeden prvoknejakého rozšírenia pôvodného pol’a (prvok pol’a GF(q m )). Toto však nie je jedinámožnost’, ako vyjadrit’ kontrolnú maticu ako maticu nad rozšírením pôvodného pol’a.Predpokladajme, že je daná kontrolná matica H typu (n − k) × n nad pol’om GF(q) a číslo(n − k) je delitel’né m; t.j. (n − k) = mr. Vektor-stĺpec dĺžky (n − k) môžeme rozbit’ na rblokov dĺžky m a každý blok reprezentovat’ prvkom pol’a GF(qm ):Kontrolná matica H sa potom transformuje na nasledujúcu maticu:⎡H = ⎢⎣⎤β 11 β 12 . . . β 1nβ 21 β 22 . . . β 2n⎥. . . . . . ⎦ ;β r1 β r2 . . . β rn

103kde β ij ∈ GF(q m ), i = 1 . . . , r; j = 1, . . . , n. Namiesto pôvodnej kontrolnej matice typu(n − k) × n nad pol’om GF(q) dostávame kontrolnú maticu typu r × n nad pol’om GF(q m );kde r = (n − k)/m. Aby sme pri dekódovaní mohli nahradit’ násobenie prijatého slovau kontrolnou maticou dosadzovaním prvkov pol’a GF(q m ) do polynómu u(x), budemekontrolnú maticu H zapisovat’ v tvare⎡H = ⎢⎣γ 0 1γ 1 1. . . γ n−11γ 0 2γ 1 2. . . γ n−12. . . . . .γ 0 r γ 1 r . . . γ n−1rkde γ 1 , . . . , γ r ∈ GF(q m ). Parametre n, q, m nie sú celkom nezávislé. Na začiatok budemepredpokladat’, že n = q m − 1, neskôr ukážeme, aké d’alšie hodnoty môže dĺžka kódunadobúdat’.Dekódovanie prijatého slova u = (u 0 , u 1 , . . . , u n−1 ) možno realizovat’ dvojako: prijatéslovo vynásobíme kontrolnou maticou H v ktorej prvky γ j inahradíme príslušnýmivektormi dĺžky m nad pol’om GF(q) a vypožítame syndróm s;s = uH ⊤ .V druhom prípade násobeniu prijatého vektora (slova) u kontrolnou maticou H nadpol’om GF(q m ) zodpovedá dosadzovanie prvkov γ 1 , . . . , γ r ∈ GF(q m ) do polynómu u(x):⎤⎥⎦ ;uH ⊤ =u 0 γ 0 1 + u 1γ 1 1 + · · · + u n−1γ n−11= u(γ 1 ),u 0 γ 0 2 + u 1γ 1 2 + · · · + u n−1γ n−12= u(γ 2 ),..u 0 γ 0 r + u 1 γ 1 r + · · · + u n−1 γ n−1r = u(γ 2 r).Podmienka uH ⊤ = 0 je ekvivalentná tomu, že prvky γ 1 , . . . , γ r ∈ GF(q m ) sú korenepolynómu u(x). Ilustrujeme uvedenú konštrukciu na príklade.Príklad. Nech je α primitívny prvok pol’a GF(2 4 ), nech n = 15. Položíme γ 1 = α, γ 2 = α 3a zostrojíme kontrolnú maticu H (15, 7)-kódu:[ α0αH =1 α 2 α 3 α 4 α 5 α 6 α 7 α 8 α 9 α 10 α 11 α 12 α 13 α 14 ]α 0 α 3 α 6 α 9 α 12 α 15 α 18 α 21 α 24 α 27 α 30 α 33 α 36 α 39 α 42Prvky pol’a GF(2 4 ) môžeme reprezentovat’ pomocou binárnych vektorov dĺžky 4 (pozritabul’ku 15.6). Kontrolná matica bude potom binárnou maticou typy 8 × 15:⎡⎤1 0 0 0 1 0 0 1 1 0 1 0 1 1 10 1 0 0 1 1 0 1 0 1 1 1 1 0 00 0 1 0 0 1 1 0 1 0 1 1 1 1 0H =0 0 0 1 0 0 1 1 0 1 0 1 1 1 11 0 0 0 1 1 0 0 0 1 1 0 0 0 1⎢ 0 0 0 1 1 0 0 0 1 1 0 0 0 1 1⎥⎣ 0 0 1 0 1 0 0 1 0 1 0 0 1 0 1 ⎦0 1 1 1 1 0 1 1 1 1 0 1 1 1 1

104 KAPITOLA 9. CYKLICKÉ KÓDYPri štúdiu Bose-Chandhury-Hocquenghemových (BCH) kódov v nasledujúcej podkapitoleukážeme, že kód z predchádzajúceho príkladu je BCH kód (15, 7) opravujúcichyby váhy 2.9.1 Polynomický popis cyklických kódovV tejto časti popíšeme najprv algebraickú štruktúru cyklických kódov a potom ukážeme,ako na základe týchto poznatkov možno konštruovat’ cyklické kódy. Budeme uvažovat’cyklický kód C dĺžky n nad pol’om GF(q). Pripomenieme, že cyklický kód C je lineárnympodpriestorom vektorového priestoru dimenzie n nad pol’om GF(q) a že C je uzavretý nacyklický posun svojich prvkov. Vektorový priestor GF(q) n možno prirodzeným spôsobomzobrazit’ na faktorový okruh polynómov GF(q)[x]/x n − 1:∀u ∈ GF(q) n ; u = (u 0 , u 1 , . . . , u n−1 ) ↔ u 0 + u 1 x + u 2 x 2 + · · · + u n−1 x n−1Dá sa l’ahko overit’, že faktorový okruh polynómov GF(q)[x]/x n − 1 má vlastnosti vektorovéhopriestoru. Naviac, vo faktorovom okruhu GF(q)[x]/x n − 1 je definované (modulárne)násobenie polynómov:∀a(x), b(x) ∈ GF(q)[x]/x n − 1 : a(x) · b(x) = a(x) · b(x) (mod x) n − 1.Zostáva nájst’ vyjadrenie cyklického posunu pomocou operácií nad polynómami v okruhuGF(q)[x]/x n −1. Cyklický posun vektora u zodpovedá súčinu polynómov x·u(x). Skutočne,pričomx · u(x) = u n−1 x n + u n−2 x n−1 + · · · + u 1 x 2 + u 0 x (mod x n − 1),u n−1 x n +u n−2 x n−1 + . . . +u 1 x 2 + u 0 x : (x n − 1) = u n−1− u n−1 x n +u n−1u n−2 x n−1 + . . . +u 1 x 2 + u 0 x + u n−1Cyklický kód môžeme teraz charakterizovat’ nasledujúcim spôsobom:Veta 9.1.1. Nech GF(q)[x]/x n − 1 je faktorový okruh polynómov nad pol’om GF(q). Podmnožinapolynómov C ⊂ GF(q)[x]/x n − 1 tvorí cyklický kód práve vtedy, ak1. C je aditívna podgrupa okruhu GF(q)[x]/x n − 1,2. ak u(x) ∈ C a a(x) ∈ GF(q)[x]/x n − 1, taka(x) · u(x) (mod x n − 1) ∈ C.

9.1. POLYNOMICKÝ POPIS CYKLICKÝCH KÓDOV 105Dôkaz. Cyklický kód je zároveň lineárnym kódom. To znamená, že C tvorí aditívnupodgrupu okruhu GF(q)[x]/x n − 1. Z lineárnosti kódu C vyplýva, že aj súčin l’ubovol’néhoprvku a ∈ GF(q) a polynómu u(x) ∈ C patrí do C. Z cyklickosti C vyplýva, že pre u(x) ∈ Caj x k · u(x) ∈ C. To znamená, že pre l’ubovol’ný polynóm a(x) ∈ GF(q)[x]/x n − 1; a(x) =a 0 + a 1 x + · · · + a n−1 x n−1 patria aj polynómy a 0 · u(x), a 1 x · u(x), . . . , a n−1 x n−1 · u(x) do Ca z toho, že C je aditívna grupa vyplýva, že aja 0 · u(x) + a 1 x · u(x) + · · · + a n−1 x n−1 · u(x) = a(x) · u(x) ∈ C.Opačne, nech C spĺňa uvedené dve podmienky. Z prvej vyplýva, že C je uzavretá nasčítanie a z druhej, že C je uzavretá na násobenie skalárom (ostatné vlastnosti násobeniaa sčítania sa do C prenášajú z okruhu GF(q)[x]/x n − 1). To znamená, že C tvorí lineárnypodpriestor (lineárny kód). Z druhej podmienky naviac vyplýva, že C je uzavretá nacyklický posun; t.j. C je cyklický kód.Poznámka.hlavný ideál.Množina C tvorí ideál okruhu GF(q)[x]/x n − 1. Neskôr dokážeme, že C jePreskúmame teraz množinu C podrobnejšie. Budeme v nej hl’adat’ polynóm g(x),ktorý je nenulový, normovaný a má spomedzi všetkých (nenulových) prvkov-polynómovmnožiny C minimálny stupeň. Ked’že C je neprázdna množina, nenulový normovanýpolynóm g(x) minimálneho stupňa existuje. Ukážeme, že je daný jednoznačne. Predpokladajmeopak, t.j. že v C existujú dva rôzne polynómy g 1 (x) a g 2 (x) požadovanýchvlastností. Potom aj ich rozdiel, polynóm g 1 (x) − g 2 (x) patrí do C. Ale polynómy g 1 (x)a g 2 (x) majú ten istý stupeň a sú normované. To znamená, že ich rozdiel je nenulovýpolynóm nižšieho stupňa, z ktorého po vydelení koeficientom pri najvyššej mocninemožno vytvorit’ normovaný nenulový polynóm nižšieho stupňa ako je stupeň polynómovg 1 (x) a g 2 (x). Spor. Polynóm g(x) je teda daný jednoznačne a z dôvodu, ktorý zakrátkouvedieme, nazýva sa generujúcim polynómom kódu C Preskúmame vzt’ah polynómu g(x)a ostatných prvkov (polynómov) kódu C. Nech je u(x) nenulový kódový polynóm kódu C.Potom existujú polynómy q(x) a r(x) také, žeu(x) = q(x)g(x) + r(x) mod x n − 1,pričom deg(r(x) < deg(g(x)). Ked’že g(x) ∈ C, tak potom podl’a vety 9.1.1 aj q(x)g(x) ∈ C.To však znamená, že aju(x) − q(x)g(x) ∈ C,nakol’ko ide o rozdiel dvoch kódových slov a C je cyklický a teda aj lineárny kód. Aleu(x) − q(x)g(x) = r(x)a deg(r(x) < deg(g(x)). To by znamenalo, že v kóde C existuje polynóm nižšieho stupňaako je stupeň generujúceho polynómu. To však je možné len v prípade, ked’ r(x) = 0.Potom však pre l’ubovol’ný kódový polynóm u(x) z C platíTým sme dokázali nasledujúcu vetuu(x) = q(x)g(x).

106 KAPITOLA 9. CYKLICKÉ KÓDYVeta 9.1.2. Nech C ⊆ GF(q)[x]/x n − 1 je cyklický kód dĺžky n. Potom v kóde C existujejediný nenulový normovaný polynóm g(x) stupňa n − k taký, žeC = {a(x)g(x);a(x) ∈ GF(q)[x], deg(g(x)) < k}.Ked’že cyklický kód je jednoznačne zadaný svojím generujúcim polynómom, ponúkajúsa prirodzené otázky, či sa tento vzt’ah nedá využit’ pri konstrukcii, kódovaní i dekódovanícyklických kódov a ak áno, ako. Odpoved’ na tieto otázky budeme hl’adat’ vnasledujúcej časti tejto kapitoly. Začneme základnou otázkou: aké vlastnosti musí mat’polynóm, aby bol generujúcim polynómom cyklického kódu? Odpoved’ na táto otázkudáva nasledujúca veta.Veta 9.1.3. Cyklický kód Cak g(x)|x n − 1.dĺžky n s generujúcim polynómom g(x) existuje práve vtedy,Dôkaz. Predpokladajme, že C ⊆ GF(q)[x]/x n − 1 je cyklický kód dĺžky n s generujúcimpolynómom g(x). Platíx n − 1 = q(x)g(x) + r(x),kde q(x), r(x) ∈ GF(q)[x]/x n − 1 a deg(r(x)) < deg(g(x)). Ked’že platía deg(r(x)) < n, tak potomx n − 1 = 0 mod x n − 10 = (q(x)g(x) + r(x)) mod x n − 1 = (q(x)g(x)) mod (x n − 1) + r(x).Kód C je cyklický a g(x) je jeho generujúci polynóm, preto aj (q(x)g(x)) mod x n − 1 jekódový polynóm kódu C. Ked’že 0 je tiež kódový polynóm, potom aj r(x) = 0 − q(x)g(x)musí byt’ kódovým polynómom kódu C. To je však možné len v prípade, ked’ r(x) = 0, atedax n − 1 = q(x)g(x).Nech opačne g(x) ∈ GF(q)[x], g(x)|x n − 1, deg(g(x)) = n − k. Množina polynómov C ={a(x)g(x); a(x) ∈ GF(q)[x], deg(g(x)) < k} je podl’a vety 9.1.1 cyklickým kódom.To, že polynóm g(x) delí polynóm x n − 1 znamená, že existuje polynóm, označíme hoako h(x), taký, že x m − 1 = g(x)h(x). Ak je g(x) generujúcim polynómom cyklického kóduC, tak potom sa polynóm h(x) nazýva kontrolným polynómom cyklického kódu C. Podobneako generujúci polynóm, zohráva aj kontrolný polynóm v teórii lineárnych kódov dôležitúúlohu.Pozrime sa teraz na polynóm x n − 1 nad pol’om GF(q). Vyjadríme x n − 1 ako súčinireducibilných polynómov nad pol’om GF(q):x n − 1 = f 1 (x) · f 2 (x) · · · · · f l (x).Generujúci polynóm g(x) cyklického kódu dĺžky n nad pol’om GF(q) sa dá potom vyjadrit’ako súčin vybraných ireducibilných polynómov z rozkladu x n − 1:g(x) = f i1 (x) · f i2 (x) . . . f ij (x).

9.2. MATICOVÝ POPIS CYKLICKÝCH KÓDOV 107Ked’že polynóm x n − 1 má l ireducibilných faktorov nad pol’om GF(q), existuje 2 l rozličnýchgenerujúcich polynómov a práve tol’ko cyklických kódov dĺžky n nad pol’om GF(q).Cyklický kód však tvoria kódové polynómy, ktoré sú násobkami generujúceho polynómu;u(x) = a(x)g(x). Kódový polynóm má stupeň nanajvýš n − 1. Ak bude mat’ generujúcipolynóm stupeň n − k, tak potom kód bude obsahovat’ 2 k kódových slov. Z toho vyplýva,že niektoré polynómy nebudú generovat’ použitel’né kódy. Ilustrujeme vytváraniecyklických kódov pomocou generujúcich polynómov na príklade [1].Príklad. Uvedieme všetky binárne cyklické kódy dĺžky 7. Polynóm x7 − 1 1 má tri ireducibilnéfaktory 2 x 7 − 1 = (x + 1)(x 3 + x + 1)(x 3 + x 2 + 1).To znamená, že teoreticky existuje 8 binárnych cyklických kódov dĺžky 7.generujúci polynóm kontrolný polynóm kód1 x 7 − 1 C 1x + 1 (x 3 + x + 1)(x 3 + x 2 + 1) C 2(x 3 + x + 1) (x + 1)(x 3 + x 2 + 1) C 3(x 3 + x 2 + 1) (x + 1)(x 3 + x + 1) C 4(x + 1)(x 3 + x + 1) (x 3 + x 2 + 1) C 5(x + 1)(x 3 + x 2 + 1) (x 3 + x + 1) C 6(x 3 + x + 1)(x 3 + x 2 + 1) (x + 1) C 7x 7 − 1 1 C 8• kód C 1 pozostáva zo všetkých binárnych vektorov dĺžky 7, jeho opravná schopnost’je nulová.• kód C 2 je kód s testom na paritu a má 64 kódových slov dĺžky 7 (párnej váhy)• kódy C 3 a C 4 sú Hammingove (7,4) kód opravujúce jednu chybu. Majú 16 kódovýchslov• kódy C 5 a C 6 sú duálne kódy k Hamingovému (7,4) kódu, majú 8 kódových slov• kód C 7 má dve kódové slová 0000000, 1111111, opravuje 3 chyby a nazýva sa kód sopakovaním (repetition code).• kód C 8 má jediné kódové slovo 0000000 a je prakticky nepoužitel’ný.9.2 Maticový popis cyklických kódovCyklické kódy sú podmnožinou lineárnych kódov. Lineárne kódy je možné zadat’ pomocougenerujúcej, resp. kontrolnej matice. Jeden typ kontrolnej matice pre cyklické kódy1 pripomíname, že nad pol’om GF(2) x 7 − 1 = x 7 + 12 o ireducibilite polynómov (x 3 + x + 1), (x 3 + x 2 + 1) sa presvedčíme l’ahko; ak by totiž boli reducibilné,museli by mat’ aspoň jeden faktor stupňa 1, a teda ako koreň prvok z pol’a GF(2).

108 KAPITOLA 9. CYKLICKÉ KÓDYsme už uviedli v úvode tejto kapitoly. Medzitým sme zistili, že cyklické kódy je možnépopísat’ pomocou generujúcich a kontrolných polynómov. Ukážeme teraz, aký je vzt’ahmedzi generujúcim plonómom agenerujúcou maticou a kontrolným polynómom a kontrolnoumaticou cyklického kódu. Uvažujme cyklický kód C dĺžky n nad pol’om GF(q)s generujúcim polynómom g(x) stupňa n − k a kontrolným polynómom h(x). Ked’žecyklický kód C pozostáva zo všetkých násobkov generujúceho polynómu g(x), kódovýmipolynómami budú aj polynómy g(x), x · g(x), . . . , x k−1 · g(x). Ukážeme, že polynómyg(x), x · g(x), . . . , x k−1 · g(x), resp. vektory ich koeficientov sú lineárne nezávislé. Predpokladajmeopak, potom by musela existovat’ k-tica prvkov a 0 , . . . , a k−1 ∈ GF(q), s aspoňjedným nenulovým prvkom taká, že (v polynomickom vyjadrení)Zo vzt’ahu 9.1však vyplýva, žea 0 · g(x) + a 1 · x · g(x) + · · · + a k−1 · x k−1 · g(x) = 0 (9.1)(a 0 + a 1 · x + · · · + a k−1 · x k−1 ) · g(x) = 0,resp.(a 0 + a 1 · x + · · · + a k−1 · x k−1 ) = 0,čo je však v spore s nenulovost’ou vektora prvkov a 0 , . . . , a k−1 . To znamená, že vektorykoeficientov polynómov g(x), x · g(x), . . . , x k−1 · g(x) sú nezávislé a ked’že cyklický kód C jezároveň lineárny kód dimenzie k, vektory koeficientov polynómov g(x), x · g(x), . . . , x k−1 ·g(x) tvoria jeho bázu. Táto báza zapísaná v podobe matice predstavuje generujúcumaticu cyklického kódu C:G =⎡⎤0 . . . 0 0 g n−k g n−k−1 . . . g 2 g 1 g 00 . . . 0 g n−k g n−k−1 g n−k−2 . . . g 1 g 0 00 . . . g n−k g n−k−1 g n−k−2 g n−k−3 . . . g 0 0 0⎢⎥⎣ .. ⎦g n−k . . . . . . 0 0 0(9.2)Teraz zostrojíme kontrolnú maticu cyklického kódu C pomocou jeho kontrolného polynómuh(x).Ked’že h(x)|x n − 1 existuje lineárny kód C ′ s generujúcim polynómom h(x).Generujúcu maticu H ′ kódu C ′ možno taktiež vyjadrit’ v tvare 9.2. Kód C ′ však nie jeduálnym kódom kódu C, pretože G · H ′⊤ ≠ 0, a teda matica H ′ nie je kontrolnou maticoukódu C. Ukážeme, že kontrolná matica cyklického kódu C odvodená z jeho kontrolnéhopolynómu h(x) existuje a má tvarH =⎡0 . . . 0 0 h k h k−1 . . . h 2 h 1 h 00 . . . 0 h k h k−1 h k−2 . . . h 1 h 0 00 . . . h k h k−1 h k−2 h k−3 . . . h 0 0 0⎢⎣ ..h k . . . . . . 0 0 0⎤⎥⎦(9.3)

9.3. KÓDOVANIE POMOCOU CYKLICKÝCH KÓDOV 109Potrebujeme dokázat’, že G·H ⊤ = 0. Využijeme skutočnost’, že h(x)·g(x) = 0 mod x n −1.To znamená, žeg 0 h 0 = 1,(g 0 h 1 + g 1 h 0 ) = 0,(g 0 h 2 + g 1 h 1 + g 2 h 0 ) = 0,. . .(g n−k−1 h k + g n−k h k−1 ) = 0,g n−k h k = 1.(9.4)Súčinom matíc G · H ⊤ je matica typu (n − k) × (n − k) ktorú možno zapísat’ v tvareG · H ⊤ =⎡⎢⎣⎤a n−1 a n−2 . . . a ka n−2 a n−3 . . . a k−1⎥.. ⎦a n−k a n−k−1 . . . a 1(9.5)kdea m =m∑g m−i h i , 0 < m < n.i=0Zo vzt’ahov 9.4 vyplýva, že a m = 0 pre m = 1, . . . , n − 1 a teda matica 9.3 je kontrolnoumaticou kódu C. Ukážeme, že lineárny kód C ⊥ , duálny ku kódu C je zároveň cyklickýkód s generujúcim polynómom x k · hx −1 . Stačí ukázat’, že polynóm x k · hx −1 delí polynómx n −1. Vyjadríme polynóm x n −1 v podobe súčinu generujúceho a kontrolného polynómux n − 1 = g(x) · h(x), dosadíme x := x −1 a výslednú rovnost’ vynásobíme polynómom x n .Dostávame rovnost’x n · g(x −1 ) · h(x −1 ) = x n−k g(x −1 ) · c k · h(x −1 ) = 1 − x n .Z poslednej rovnosti vyplýva, že polynómom x k · h(x −1 ) delí polynóm x n − 1.Poznámka. Kód C ′ zadaný generujúcou maticou H ′ sa niekedy tiež nazýva duálnymkódom kódu C. V skutočnosti sa však nejedná o duálny kód (pretože G · H ′⊤ ≠ 0) ale idelen o kód ekvivalentný s duálnym kódom C ⊥ .9.3 Kódovanie pomocou cyklických kódovSprávu, ktorú potrebujeme zakódovat’ pomocou cyklického (n, k)-kódu C (s generujúcimpolynómom g(x) stupňa n − k rozdelíme na postupnost’ disjunktných blokov dĺžky k(informačné vektory). Každému informačnému vektoru i = (i 0 , . . . , i k−1 ) priradíme informačnýpolynóm i(x) = i 0 + i 1 · x + · · · + i k−1 · x k−1 stupňa nanajvýš k − 1.Ked’že kódovéslová (polynómy) cyklického kódu C sú násobkami generujúceho polynómu g(x), stačíinformačný polynóm vynásobit’ generujúcim polynómom a dostaneme kódový polynómkódu Cu(x) = i(x) · g(x).

110 KAPITOLA 9. CYKLICKÉ KÓDYTakýto spôsob kódovania je korektný, ale je nesystematický, pretože z kódového polynómuu(x) sa nedá bezprostredne určit’ informačný polynóm i(x). Existuje aj systematickýspôsob kódovania, ktorého podstata je nasledovná:• Informačný polynóm i(x) vynásobíme polynómom x n−k .• Vypočítame x n−k · i(x) mod g(x)• Od polynómu x n−k ·i(x) odčítame x n−k ·i(x) mod g(x) a dostávame hl’adané kódovéslovo x n−k · i(x) − x n−k · i(x) mod g(x).Ked’že stupeň polynómu x n−k · i(x) mod g(x)je nanajvýš n − k − 1 a prvky informačnéhovektora tvoria v kódovom slove koeficienty pri mocninách x n−k , . . . , x n−1 , v kódovomslove sú jednoznačne oddelené informačné a „kontrolné“ symboly tak, ako smepožadovali, obr. 9.1.i(x)−x n−k · i(x) mod g(x)Obrázok 9.1: Kódové slovo systematického cyklického kódu9.4 Dekódovanie cyklických kódovKed’že cyklické kódy sú podmožinou lineárnych kódov, možno na ich dekódovanie použit’tie isté metódy ako na dek=odovanie lineárnych kódov. Pri dekódovaní lineárnych kódovs väčšou opravnou schopnost’ou sme narážali na to, že si bolo potrebné pamätat’ rozsiahludekódovaciu tabul’ku (obsahujäcu zoznam syndrómov chýb a im prislúchajúcichchybových vektorov). Využijeme algebraickú štruktúru cyklických kódova na zostrojenieefektívnejšieho algoritmu dekódovania. Predpokladajme, že informácia, ktorú spracovávame,je zapísaná vo forme polynómov. Do popisu spracovania zahrnieme aj kódovaniespráv:1. informačný vektor i transformujeme na informačný polynóm i(x),2. informačný polynóm (napríklad nesystematicky) transformujeme na kódový polynóm:u(x) = i(x) · g(x) s vektorom koeficientov u,3. koeficienty kódového polynómu sa prenášajú prenosovým kanálom. Počas prenosuvznikne chyba e, ktorá transformuje prenášané kódové slovo na slovo v = u + e. Vpolynomickom vyjadrení v(x) = u(x) + e(x).4. Príjemca interpretuje prijaté slovo v ako polynóm v(x), vydelí prijatý polynómgenerujúcim polynómom a vypočíta zvyšok po delení:v(x) mod g(x) = (u(x) + e(x)) mod g(x) = u(x) mod g(x) + e(x) mod g(x) == e(x) mod g(x) = s(x).

9.4. DEKÓDOVANIE CYKLICKÝCH KÓDOV 111názov označenie stupeňgenerujúci polynóm g(x) n − kkontrolný polynóm h(x) kinformačný polynóm i(x) k − 1kódový polynóm u(x) n − 1chybový polynóm e(x) n − 1prijatý polynóm v(x) n − 1syndrómový polynóm s(x) n − k − 1Tabul’ka 9.1: Polynómy cyklických kódovVýsledkom delenia je polynóm s(x), ktorý sa nazýva syndrómový polynóm. Je zrejmé,že deg(s(x)) < deg(g(x)). Ked’že l’ubovol’né kódové slovo u(x) je násobkomgenerujúceho polynómu g(x), u(x) mod g(x) = 0 a teda syndrómový polynóm nezávisíod odvysielaného kódového polynómu, ale len od polynómu chýb.Skôr ako budeme pokračovat’ vo výklade, uvedieme kvôli prehl’adnosti zoznam polynómov,ktoré sa používajú pri popise, kódovaní a dekódovaní cyklického (n, k)-kódu.Aby bolo možné používat’ syndrómový polynóm s(x) na určenie chyby e(x), potrebujememat’ záruku, že syndróm chyby určuje chybu 3 jednoznačne; t.j. že neexistujú dverôzne chyby váhy menšej alebo rovnej opravnej schopnosti kódu s tým istým syndrómom.Túto dôležitú vlastnost’ cyklických kódov sformulujeme a dokážeme v nasledujúcej vete.Veta 9.4.1. Nech je d minimálna vzdialenost’ cyklického kódu C, potom každému polynómuchýb váhy menšej ako d/2 zodpovedá práve jeden syndrómový polynóm.Dôkaz. Každému chybovému polynómu e(x) zodpovedá nejaký syndrómový polynóms(x) = e(x) mod g(x). Predpokladajme, že existujú dva rozličné chybové polynómy váhymenšej ako d/2; e 1 (x) ≠ e 2 (x) s tým istým syndrómovým polynómom s(x). To znamená,žeale potom je rozdiel chybových polynómove 1 (x) = q 1 (x) · g(x) + s(x)e 2 (x) = q 2 (x) · g(x) + s(x)e 1 (x) − e 2 (x) = (q 1 (x) − q 2 (x)) · g(x) (9.6)násobkom generujúceho polynómu, a teda kódovým slovom. Ale polynóm e 1 (x) − e 2 (x)má váhu < d, čo je v spore s minimálnou váhou kódu C. To znamená, že e 1 (x)−e 2 (x) = 0,resp. e 1 (x) = e 2 (x).Príklad. Uvažujeme (7, 4) Hammingov cyklický kód s generujúcim polynómom g(x) =x 3 + x + 1. Tento kód má minimálnu vzdialenost’ 3, a opravuje chyby váhy 1. Všetky3 podobne ako pri lineárnych kódoch, aj tu sa rozumie chyba váhy menšej alebo rovnej opravnej schopnostikódu

112 KAPITOLA 9. CYKLICKÉ KÓDYchybové polynómy váhy nanajvýš 1 a im prislúchajúce syndrómové polynómy sú uvedenév tabul’kechybový polynóm e(x) syndrómový polynóm s(x)0 01 1xxx 2 x 2x 3 x + 1x 4x 2 + xx 5 x 2 + x + 1x 6 x 2 + 1Príklad spracovania (kódovanie, prenos a dekódovanie) správ pomocou Hammingovhokódu je uvedený v tabul’kevektor/polynóm označenie vektor polynóm spôsob výpočtuinformačný i(x) 1011 x 3 + x + 1kódový u(x) 1000101 x 6 + x 2 + 1 u(x) = i(x) · g(x)odvysielaný u(x) 1000101 x 6 + x 2 + 1chybový e(x) 0010000 x 4prijatý v(x) 1010101 x 6 + +x 4 + x 2 + 1 v(x) = u(x) + e(x)syndrómový s(x) 110 x 2 + x v(x) mod g(x)chybový e(x) 0010000 x 4 s(x) ↔ e(x)opravený u(x) 1000101 x 6 + x 2 + 1 u(x) = v(x) − e(x)informačný i(x) 1011 x 3 + x + 1 i(x) = u(x) ÷ g(x)Použitie polynomickej reprezentácie kódu umožnilo nahradit’ maticové oprácie (násobenievektorov generujúcou, resp. kontrolnou maticou) jednoduchšie realizovatel’nýmnásobením a resp. delením generujúcim polynómom, ale základný problém dekódovanialineárnych kódov—potrebu rozsiahlej dekódovacej tabul’ky—nevyriešilo. Využijemeteraz silnejšiu algebraickú štruktúru cyklických kódov na návrh efektívnejšej metódydekódovania.Predpokladajme, že kódové slovo u(x) bolo pri prenose modifikované chybou e(x) av dôsledku toho bolo prijaté slovo v(x) = u(x) + e(x). Základná myšlienka dekódovaniaspočíva v tom, že pri cyklickom posune prijatého slova sa súčasne posúva kódové slovoaj chyba:x · v(x) = x · u(x) + x · e(x) mod x n − 1.To znamená, že po istom počte cyklických posunov prijatého slova dostaneme slovo,ktoré bude predstavovat’ kódové slovo (kódový polynóm), v ktorom bude chybou modifikovanýkoeficient pri mocnine x n−1 (a možno aj niektoré iné koeficienty). Ak by smetúto chybu dokázali odhalit’ a opravit’, potom by stačilo cyklicky posunút’ opravené slovoo patričný počet miest, aby sme dostali pôvodne odvysielané kódové slovo u(x). Čopotrebujeme na to, aby sme dokázali odhalit’ chybu v koeficiente pri najvyššej mocnineprijatého polynómu? Stačilo by na to mat’ zoznam syndrómov chýb zodpovedajúcichvšetkým (daným kódom opravitel’ným) kódovým slovám e(x), e n−1 ≠ 0. Potombude stačit’ posúvat’ prijaté slovo, vyčísl’ovat’ v každom kroku syndróm chyby a porovnávat’ho s redukovanou tabul’kou syndrómov. Na tejto myšlienke je postavený Meggitov

9.4. DEKÓDOVANIE CYKLICKÝCH KÓDOV 113algoritmus dekódovania cyklických kódov, ktorý bol publikovaný v roku 1960. Meggitovalgoritmus naviac využíva tú skutočnost’, že na výpočet postupnosti syndrómovpolynómov v(x), x · v(x), . . . , x n−1 · v(x) nie je potrebné počítat’ ((x j · v(x) mod x n − 1)mod g(x), j = 0, . . . , n − 1, ale stačí počítat’ (x j · s(x) mod g(x). Toto zjednodušenie sazakladá na tvrdení nasledujúcej vety.Veta 9.4.2. Nech je daný cyklický kód C s generujúcim polynómom g(x) a nech je v(x)polynóm prijatý po odvysielaní (nejakého) kódového slova kódu C. Nech je s(x) syndrómovýpolynóm polynómu v(x), potom má polynóm x · v(x) mod x n − 1 (cyklický posunprijatého slova) syndrómový polynóm x · s(x) mod g(x).DôkazNech je v(x) = v 0 + v 1 · x + · · · + v n−1 · x n−1 prijatý polynóm. Platív(x) = q(x) · g(x) + s(x).Cyklický posun prijatého slova je (v polynomickom vyjadrení):x · v(x) mod x n − 1 = v n−1 + v 0 · x + v 1 · x 2 + · · · + v n−2 · x n−1 == x · v(x) − v n−1 · (x n − 1) = x · v(x) − v n−1 · g(x)h(x) == x · (q(x) · g(x) + s(x)) − v n−1 · g(x)h(x) = x · s(x) + x · q(x) · g(x) − v n−1 · g(x)h(x) == x · s(x) + g(x) · (x · q(x) − v n−1 · h(x)) = x · s(x) mod g(x).Uvedieme teraz Meggitov algoritmus dekódovania cyklických kódov. Kvôli jednoduchostivýkladu sa obmedzíme na binárne cyklické kódy; zovšeobecnenie Meggitovho algoritmuna q-árne cyklické kódy ponecháme na čitatel’a. Predpokladáme, že• C je cyklický (n,k)-kód nad pol’om GF(2) s generujúcim polynómom g(x)• bol odvysielaný kódový polynóm u(x),• pri prenose vznikla (kódom C korigovatel’ná) chyba e(x), v dôsledku čoho bol prijatýpolynóm v(x).Meggittov algoritmus dekódovania binárnych cyklických kódov [1][1 ] Vytvor dekódovaciu tabul’ku obsahujúcu všetky syndrómy, zodpovedajúce predstavitel’omtried rozkladu faktorového okruhu GF(2)[x]/x n − 1, podl’a cyklickéhokódu C; chybovým polynómom stupňa n − 1.[2 ] Vydel’ prijatý polynóm v(x) generujúcim polynómom g(x) a vypočítaj syndrómovýpolynóm: s(x) = v(x) mod g(x).[3 ] Porovnaj syndróm s(x) so syndrómami v dekódovacej tabul’ke; ak sa s(x) nachádzav dekódovacej tabul’ke, oprav (aktuálne) najvyšší koeficient prijatého polynómuv(x):v(x) ← v(x) + x n−1 .

114 KAPITOLA 9. CYKLICKÉ KÓDY[4 ]Vykonaj cyklický posun prijatého polynómu:v(x) ← x · v(x) mod x n − 1a cyklický posun syndrómu podl’a generujúceho polynómu g(x):s(x) ← x · s(x)mod g(x).Ak sa krok 4 vykonal n−1-krát, vykonaj posledný cyklický posun polynómu v(x) a skonči.(Dekódované slovo predstavujú koeficienty polynómu v(x).) V opačnom prípade pokračujkrokom 3.Poznámka. Meggittov algoritmus sa dá vel’mi efektívne realizovat’ pomocou dekodérazaloženého na posuvných registroch s lineárnou spätnou väzbou (linear feedback shiftregister, LFSR), pomocou ktorých sa vykonávajú cyklické posuny, modulárne násobeniea delenie polynómov. Nie je problém v prípade potreby modifikovat’ najvyšší bit,ktorý LFSR obsahuje, ale konštrukcia LFSR by sa skomplikovala, ak by bolo potrebnézabezpečit’, aby bolo možné v každom kroku menit’ l’ubovol’né bity LFSR. Preto sa v 3.kroku koriguje len aktuálne najvyšší bit slova, ktoré register obsahuje, hoci syndrómovýpolynóm jednoznačne určuje aj prípadné d’alšie chyby. Na druhej strane, ked’že sa v3. kroku opravuje len najvyšší bit spracovávaného slova, dekódovacia tabul’ka nemusíobsahovat’ chybové polynómy.Ilustrujeme teraz Meggittov algoritmus na príklade [1].Príklad. Uvažujme binárny cyklický (15,7)-kód C s generujúcim polynómom g(x) =x 8 + x 7 + x 6 + x 4 + 1, opravujúci chyby váhy 2. Dekódovacia tabul’ka obsahuje 15 syndrómovýchpolynómov. Kvôli názornosti v nej uvádzame aj syndrómom prislúchajúcechybové polynómy, ktoré však v d’alšom pri dekódovaní nebudeme používat’.chybový polynóm syndrómový polynóm syndrómx 14 x 3 + x 5 + x 6 + x 7 000101111 + x 14 1 + x 3 + x 5 + x 6 + x 7 10010111x + x 14 x + x 3 + x 5 + x 6 + x 7 01010111x 2 + x 14 x 2 + x 3 + x 5 + x 6 + x 7 00110111x 3 + x 14 x 5 + x 6 + x 7 00000111x 4 + x 14 x 3 + x 4 + x 5 + x 6 + x 7 00011111x 5 + x 14 x 3 + x 6 + x 7 00010011x 6 + x 14 x 3 + x 5 + x 7 00010101x 7 + x 14 x 3 + x 5 + x 6 00010110x 8 + x 14 1 + x 3 + x 4 + x 5 10011100x 9 + x 14 1 + x + x 3 + x 4 + x 7 11011001x 10 + x 14 x + x 2 + x 3 01110000x 11 + x 14 x + x 2 + x 4 + x 5 + x 6 + x 7 01101111x 12 + x 14 x + x 4 + x 6 + x 7 01001011x 13 + x 14 x 2 + x 3 + x 4 + x 7 00111001

9.4. DEKÓDOVANIE CYKLICKÝCH KÓDOV 115Predpokladáme, že bolo odvysielané slovo u(x), počas prenosu vznikla chyba e(x) abolo prijaté slovo v(x):u(x) 100011111101110 1 + x 4 + x 5 + x 6 + x 7 + x 8 + x 9 + x 11 + x 12 + x 13e(x) 000010000100000 x 4 + x 9v(x) 100001111001100 1 + x 5 + x 6 + x 7 + x 8 + x 11 + x 12 + x 13V nasledujúcej tabul’ke sú uvedené hodnoty koeficientov spracovávaného polynómuv(x) a syndrómu s(x) v jednotlivých krokoch algoritmu. Kvôli stručnosti uvádzame lenvektory koeficientov príslušných polynómov, pričom koeficienty pri najvyšších mocnináchsú vpravo.krok v(x) s(x) s(x) ∈ DT?0. 1000 0111 1001 110 1100 0110 −1. 0100 0011 1100 111 0110 0011 −2. 1010 0001 1110 011 1011 1010 −3. 1101 0000 1111 001 0101 1101 −4. 1110 1000 0111 100 1010 0101 −5. 0111 0100 0011 110 1101 1001 ̌6. 1011 1010 0001 111 1110 0111 −7. 1101 1101 0000 111 1111 1000 −8. 1110 1110 1000 011 0111 1100 −9. 1111 0111 0100 001 0011 1110 −10. 1111 1011 1010 000 0001 1111 ̌11. 1111 1101 1101 000 1000 0100 −12. 0111 1110 1110 100 0100 0010 −13. 0011 1111 0111 010 0010 0001 −14. 0001 1111 1011 101 1001 1011 −15. 1000 1111 1101 110 −Poznámka. Vrát’me sa ešte k predchádzajúcemu príkladu. Z porovnania zložitostidekódovania uvedeného (15,7)-kódu pomocou štandardnej metódy dekódovania lineárnychkódov a Meggittovej metódy, jednoznačne vychádza lepšie Meggittova metóda. Štandardnátabul’ka dekódovania obsahuje 256 dvojíc (syndróm, chyba), zatial’ čo Meggittovdekóder pracuje s tabul’kou pozostávajúcou z 15 položiek (syndrómov). Meggittovametóda umožňuje opravit’ všetky chyby váhy najviac 2; t.j. 121 rozličných chýb. Chybyváhy väčšej ako 2 Meggittov dekóder neopravuje. Ak sa na (15,7)-kódu pozeráme ako nalineárny kód, tak zostávajúcich 135 tried štandardného rozkladu vektorového priestoruGF(2) 15 podl’a kódu má ako predstavitel’ov vektory-chyby váhy väčšej ako 2. Ked’žebinárnych vektorov dĺžky 15 váhy 3 je 455, v ideálnom prípade (ak by predstavitel’miostávajúcich tried rozkladu boli chybové vektory váhy 3), by dekóder lineárneho kóduumožnil popri chybách váhy 0,1 a 2 opravit’ asi 30% chýb váhy 3.Cyklický posun prijatých slov kódovaných pomocou cyklických kódov možno využit’na ešte efektívnejšie dekódovanie, ako poskytuje Meggittov dekóder v prípade, ak sa

116 KAPITOLA 9. CYKLICKÉ KÓDYchyby v prijatom slove nenachádzajú príliš d’aleko od seba. V takomto prípade je možnépoužit’ metódu nazývanú error trapping , ktorú podrobnejšie popíšeme v nasledujúcejčasti.9.5 Error trapping dekódovanieError trapping dekódovanie („chytanie/lapanie“ chýb) je metóda dekódovania cyklickýchkódov. Vhodná je pri kódoch opravujúcich jednu, prípadne dve chyby a v situáciach, ked’očakávame výskyt chýb na blízkych pozíciach v kódovom slove (tzv. burst chyby).Budeme predpokladat’, že C je cyklický (n, k) kód nad GF(2) opravujúci t chýb. Tedakódové slová v C majú dĺžku n a k informačných symbolov. Nech g(x) je generujúcipolynóm kódu C . Metóda error trapping funguje správne vtedy, ak je najviac t chýbrozmiestnených na najviac n − k susedných pozíciach.nx xxx x xn – k∑Nech f(x) = a 0 + a 1 x + a 2 x 2 + · · · + a n x n je polynóm nad GF(2). Označme wt(()f(x)) =i a i jeho váhu. Nech w je slovo s najviac t chybami. Potom platia nasledujúce tvrdenia.Lema 1. Ak je váha syndrómu slova w najviac t, tak chybový polynóm je rovný syndrómu.Dôkaz. Označme s(x) syndróm a e(x) príslušný chybový polynóm slova w. Potom platí:s(x) = e(x) mod g(x).Inak povedané, e(x) = q(x)g(x) + s(x). Z predpokladu o počte chýb vo w vyplýva, žewt(e(x)) ≤ t. Navyše vieme, že wt(s(x)) ≤ t (predpoklad lemy). Teda váha e(x) − s(x)je najviac 2t. Kód C opravuje t chýb, teda minimálna vzdialenost’ l’ubovol’ných dvoch kódovýchslov je aspoň 2t + 1. Ked’že e(x) − s(x) je kódové slovo (je to násobok generujúcehopolynómu) s váhou najviac 2t a 0 je tiež kódové slovo, dostávame:e(x) − s(x) = 0.Odtial’ bezprostredne vyplýva tvrdenie lemy.Lema 2. Ak sú chyby na najviac n − k susedných pozíciach, tak existuje cyklický posunw, ktorý má syndróm váhy najviac t.Dôkaz. Vezmime taký cyklický posun w, pre ktorý sú chyby „najviac vpravo“ (formálne,stupeň chybového polynómu pre príslušný cyklický posun je minimálny). Označmetakýto posun w ′ a prislúchajúci chybový polynóm e ′ (x). Podl’a predpokladu lemy je

9.5. ERROR TRAPPING DEKÓDOVANIE 117deg(e ′ (x)) ≤ n − k − 1, kde symbolom deg označujeme stupeň polynómu. Pre syndróms ′ (x) máme:s ′ (x) = e ′ (x) mod g ′ (x).Ked’že g(x) je generujúcim polynómom kódu C , deg(g(x)) = n − k. Preto s ′ (x) = e ′ (x). Pozohl’adnení predpokladu o počte chýb vo w dostávame wt(s ′ (x))) ≤ t.Predchádzajúce dve lemy poskytujú teoretické zdôvodnenie pre error trapping dekódovaniecyklických kódov (samozrejme, pri splnení predpokladov o umiestnení chýb vdekódovanom slove w). Postupne skušame pre všetky rotácie w ′ slova w:1. s ′ (x) ← w ′ (x) mod g(x)2. ak wt(s ′ (x)) ≤ t (podl’a lemy 2):(a) oprav w ′ : w ′ (x) ← w ′ (x) + s ′ (x) (lema 1)(b) w ← aplikuj „inverznú“ rotáciu na w ′(c) koniecPod pojmom inverzná rotácia máme na mysli to, že ak sme w ′ dostali z w cyklickým posunomo p pozícií dol’ava, tak teraz opravené w ′ posunieme cyklicky o p pozícií doprava.Na konci dostaneme vo w opravené slovo.Príklad. Uvažujme binárny cyklický kód (15, 7) opravujúci 2 chyby, s generujúcimpolynómomg(x) = x 8 + x 7 + x 6 + x 4 + 1.V tomto prípade bude error trapping metóda dekódovania úspešná pre tie dvojice chýb,ktoré sú od seba vzdialené (cyklicky) o najviac 15 − 7 = 8 pozícií. A to sú všetkySamozrejme, slová s jednou (alebo dokonca žiadnou) chybou dokáže error trappingdekódovat’ vždy.Príklad. Uvažujme binárny cyklický kód (15, 5) opravujúci 3 chyby, s generujúcimpolynómomg(x) = x 10 + x 8 + x 5 + x 4 + x 2 + x + 1.Vzdialenost’ chýb musí byt’ v tomto prípade najviac 15 − 5 = 10. Pre chyby váhy menšejako 3 je podmienka triviálne splnená. Demonštrujme si príklad dokódovania na slovew = 100000100010110. Poznamenajme, že pri výpočtoch budeme polynómy reprezentovat’ako vektory ich koeficientov (pre prehl’adnejší zápis). Postupne rotujeme w dol’ava,počítame syndróm a hl’adáme taký, ktorý má váhu najviac 3:

118 KAPITOLA 9. CYKLICKÉ KÓDYposun: 01000001000101101010011011110010011001101010011011111010111010101001101111110001101posun: 10000010001011011000101101posun: 200001000101101010100110111101101101posun: 3000100010110100101001101111011011010posun: 400100010110100010100110111101101101001010011011110000011Váha syndrómu pre posun 4 je rovná 3. Takže môžeme opravit’ slovo w ′ = 001000101101000⊕10000011 = 001000111101011 a posunút’ ho naspät’ (o 4 pozície doprava). Teda opravenéslovo w je:101100100011110.Urobme ešte skúšku správnosti, ked’ skúsime vydelit’ toto slovo generujúcim polynómom(pre kódové slovo očakávame zvyšok 0):10110010001111010100110111101001101110101001101110V prípade binárneho cyklického (15, 5) kódu môže nastat’ práve pät’ rozmiestnení 3chýb, ked’ tieto neležia v úseku dĺžky 10. Jedno rozmiestnenie je nakreslené na nasledujúcomobrázku, ostatné sú jeho cyklickými posunmi.x x xPravdepodobnost’, že takáto situácia nastane pri náhodnej vol’be práve 3 chýb je5/ ( 153)∼ 0, 011.

9.6. GOLAYOV KÓD 1199.6 Golayov kódV časti 7.2 sme zaviedli pojem dokonalého kódu a následne sme ukázali, že Hammingovekódy sú dokonalé binárne kódy. Okrem triviálnych kódov nepárnej dĺžky pozostávajúcichz dvoch kódových slov s maximálnou možnou vzdialenost’ou slov sa nám iné dokonalékódy nepodarilo nájst’. To naznačuje, že dokonalých kódov nemusí byt’ vel’a, resp. že inédokonalé kódy ani nemusia existovat’. V tejto časti najprv popíšeme netriviálny binárnycyklický dokonalý kód opravujúci 3 chyby a potom v nasledujúcej časti uvedieme výsledkyo (ne-)existencii dokonalých kódov.Nutnou podmienkou existencie dokonalého q-árneho kódu opravujúceho t chýb jesplnenie rovnostit∑( ) nq n | (q − 1) j ,jj=0t.j. mohutnost’ „kódovej gule“ musí byt’ mocninou q. Táto podmienka je splnená pre n =23, q = 2 a t = 3, nakol’ko( ) ( ) ( ) ( )23 23 23 23+ + + = 2 11 .0 1 2 3Ukážeme, že kód s uvedenými parametrami skutočne existuje. Ide o Golayov binárnycyklický (23,12)-kód opravujúci tri chyby.Najprv nájdeme generujúci polynóm daného kódu. (Pripomíname, že by to mal byt’polynóm stupňa 11 nad pol’om GF(2), ktorý delí polynóm x 23 − 1). Rozložíme polynómx 23 − 1 na vhodné činitele:kdex 23 − 1 = (x − 1) · g(x) · ˜g(x),g(x) = 1 + x 2 + x 4 + x 5 + x 6 + x 10 + x 11 (9.7)˜g(x) = 1 + x + x 5 + x 6 + x 7 + x 8 + x 11 (9.8)Vyberieme ako generujúci polynóm cyklického kódu C a ukážeme, že že tento kód skutočneopravuje 3 chyby. Kedže generujúci polynóm g(x) má 7 nenulových koeficientov,mainimálna vzdialenost’ kódu C nemôže presiahnut’ hodnotu 7. Ukážeme, že minimálnavzdialenost’ kódu C je skutočne 7. Kód C je lineárny, a preto by stačilo zostrojit’ jehokontrolnú maticu a ukázat’, že jej l’ubovol’ných 6 stĺpcov je lineárne nezávislých. To byvšak znamenalo preverit’ ( )236 = 100947 možností čo by sa pomocou počítača dalo spravit’.Uvedieme iný, rafinovanejší kombinatorický dôkaz [2]), ktorého podstata spočíva v tom,že vylúčime existenciu kódových slov váhy menšej ako 7 v kóde C. 4 Dôkaz rozdelímena tri časti, v ktorých postupne ukážeme, že kód C neobsahuje slová1. váhy menšej alebo rovnej 4;2. váhy 2,6,10,14,18,22;4 Idea dôkazu sa nikde inde nevyužíva, a preto dôkaz možno pri prvom čítaní preskočit’.

120 KAPITOLA 9. CYKLICKÉ KÓDY3. váhy 1,5,9,13,17,21.Najprv ukážene, že g(x) a ˜g(x) sú ireducibilné polynómy nad pol’om GF(2), potom sapozrieme na korene týchto polynómov v rozšírenom poli GF(2 11 ). Nech je α generátorcyklickej grupy pol’a GF(2 11 ). To znamená, že rád prvku α je 2 11 − 1 = 2047. Číslo 2047sa dá rozložit’ na súčin prvočísel 23 · 89. Potom prvok β = α 89 aj inverzný prvok k prvkuβ, prvok β −1 = α 1958 pol’a GF(2 11 ) majú rád 23. Označme minimálne polynómy prvkov βa β −1 symbolmi m β (x), resp. m β −1(x). Koreňmi minimálneho polynómu m β (x) sú prvkyβ 2 , β 4 , β 8 , β 16 , β 32) = β 9 , β 64 = β 18 , β 128 = β 13 , β 256 = β 3 , β 512 = β 6 , β 1024 = β 12 , β 2048 = β,a koreňmi minimálneho polynómu m β −1(x) sú všetky prvky pol’a GF(2 11 ) tvaru (β −1 ) 2j j =1, 2, . . . ; t.j. prvkyβ 22 , β 19 , β 15 , β 7 , β 14 , β 5 , β 10 , β 20 , β 17 , β 11 .Oba minimálne polynómy m β (x), m β −1(x) majú po 11 koreňov; t.j. majú stupeň 11 adajú sa vyjadrit’ ako súčin lineaárnych činitel’ov:m β (x) = (x − β) · (x − β 2 ) · · · · · (x − β 12 )m β −1(x) = (x − β 22 ) · (x − β 19 ) · · · · · (x − β 11 )Ked’že multiplikatívna podgrupa pol’a GF(2 11 ) generovaná prvkom β má prvočíselný rád(23), každý z prvkov β, β 2 , . . . , β 22 má rád 23, a teda polynóm x−β j delí polynóm (x−β 23 ),j = 1, . . . , 22 a, samozrejme, aj polynóm x − 1 delí polynóm (x − β 23 ). To znamená, žepolynóm (x − β 23 ) môžeme vyjadrit’ v tvare súčinu(x − β 23 ) = m β (x) · m β −1(x)(x − 1).Rozklad polynómu na súčin ireducibilných polynómov (nad daným pol’om) je jednoznačný,a to znamená, žem β (x) · m β −1(x) = g(x) · ˜g(x),resp. (napríklad)m β (x) = g(x)˜g(x) = m β −1(x),t.j. generujúce polynómy g(x) a ˜g(x) sú zároveň minimálnymi polynómami prvkov βa β −1 pol’a GF(2 11 ). Teraz vylúčime existenciu nenulových kódových slov váhy menšejalebo rovnej 4 v kóde C.Lema 3. Cyklický kód C s generujúcim polynómom g(x) neobsahuje nenulové kódovéslová váhy menšej alebo rovnej 4.Dôkaz. Ked’že prvky β, β 2 , β 3 , β 4 sú koreňmi generujúceho polynómu g(x) a každý kódovýpolynóm je násobkom generujúceho polynómu, musia byt’ uvedené prvky koreňmikaždého kódovéhom polynómu kódu C. V maticovom vyjadrení to vyzerá nasledovne: akje u(x) kódový polynóm kódu C, tak u · H ⊤ = 0, kde u je vektor koeficientov kódovéhopolynómu u(x) a H je matica tvaru⎡1 β β 2 . . . β 22 ⎤H = ⎢ 1 β 2 β 4 . . . β 21⎥⎣ 1 β 3 β 6 . . . β 20 ⎦1 β 4 β 8 . . . β 19

9.6. GOLAYOV KÓD 121Matica H je zrejme kontrolnou maticou kódu C. Ak vyberieme l’ubovol’né 4 stĺpce maticeH, dostávame štvorcovú podmaticu, ktorej determinant sa dá vyjadrit’ v tvareβ i 1β i 2β i 3β i 41 1 1 1β 2i 1β 2i 2β 2i 3β 2i 4β 3i 1β 3i 2β 3i 3β 3i 4= β 4(i 1+i 2 +i 3 +i 4) ·β i 1β i 2β i 3β i 4β 2i 1β 2i 2β 2i 3β 2i 4.∣ β 4i 1β 4i 2β 4i 3β 4i 4 ∣∣ β 3i 1β 3i 2β 3i 3β 3i 4 ∣Determinant na pravej strane je Vandermondov determinant, ktorého hodnota∏(β i j− β i l)j>lje nenulová, nakol’ko β i j≠ β i lak j ≠ l. To znamená, že l’ubovol’ná štvorcová podmatica4 × 4 kontrolnej matice H je regulárna, resp. minimálna vzdialenost’ kódu C je aspoň5.Teraz vylúčime existenciu kódových slov váhy 2,6,10,14,18,22.Lema 4. Nech C je cyklický (23,12) kód s generujúcim polynómom g(x) a nech je u(x)kódový polynóm párnej váhy. Potom je váha kódového polynómu u(x) delitel’ná 4.Dôkaz. Nech je u(x) = u 0 + u 1 x + . . . u 22 x 22 kódový polynóm kódu C. V dôkaze budemevyužívat’ obe interpretácie kódových slov - aj polynomickú, aj vektorovú. Označíme pretosymbolom u = (u 0 , u 1 , . . . , u 22 ) kódové slovo–vektor koeficientov–kódového polynómuu(x). Ked’že C je cyklický kód, kódový polynóm u(x) sa dá vyjadrit’ v podobe súčinuu(x) = g(x) · a(x),kde a(x)je polynóm nad GF(2). Ak je váha kódového slova u párna, tak je hodnota ∑ i u ipárna, resp.∑u i = 0 mod 2. (9.9)iDosadíme do kódového polynómu u(x) hodnotu 1 a na základe 9.9 dostávameu(1) = u 0 + u 1 + · · · + u 22 = 0 mod 2.To znamená, že 1 je koreňom kódového polynómu u(x), resp., žeu(1) = g(1) · a(1) = 0 (9.10)Ked’že prvok 1 nie je koreňom generujúceho polynómu g(x), zo vzt’ahu 9.10 vyplýva, žeprvok 1 je koreňom polynómu a(x), a kódový polynóm možno rozložit’ na súčin nasledujúcichčinitel’ov:u(x) = g(x) · b(x) · (x − 1). (9.11)Uvažujeme teraz zrkadlový obraz kódového slova u, slovo u R = u 22 . . . u 1 u 0 . Slovu u Rpriradíme polynómũ(x) = ũ 0 + ũ 1 x + · · · + ũ 21 x 21 + ũ 22 x 22 = (9.12)= u 22 + u 21 x + · · · + u 1 x 21 + u 0 x 22 . (9.13)

122 KAPITOLA 9. CYKLICKÉ KÓDYDá sa l’ahko overit’, že pre koeficienty polynómov ũ(x) a u(x) platía samotné polynómy sú spojené vzt’ahomũ i = u 22−i , i = 0, . . . , 22; (9.14)ũ(x) = x 22 · u(x −1 ). (9.15)V d’alšom budeme kombinovat’ polynómy ũ(x) a u(x). Prvok β −1 (= β 22 ) je koreňompolynómu ũ(x), pretože podl’a 9.15ũ(β −1 ) = β −22 · u(β) = 0.Minimálnym polynómom prvku β −1 je polynóm ˜g(x). Ak β −1 je koreňom polynómu ũ(x),tak ˜g(x) delí ũ(x); t.j. existuje polynóm ã(x) taký, žeTeraz vynásobíme polynómy ũ(x) a u(x):ũ(x) = ˜g(x) · ã(x). (9.16)ũ(x) · u(x) = ˜g(x) · ã(x) · g(x) · b(x) · (x − 1) = ˜g(x) · g(x) · (x − 1) · b(x) · ã(x) == (x 23 − 1) · b(x) · ã(x). (9.17)Vyjaríme súčin polynómov ũ(x) a u(x) explicitne, aby sme mohli kombinovat’ ich koeficientyũ(x) · u(x) = ũ 0 · u 0 + (ũ 0 · u 1 + ũ 1 · u 0 ) · x + (ũ 0 · u 2 + ũ 1 · u 1 + ũ 2 · u 0 ) · x 2 ++ (ũ 0 · u 3 + ũ 1 · u 2 + ũ 2 · u 1 + ũ 3 · u 0 ) · x 3 + · · · + ũ 22 · u 22 · x 44 .Využijeme vzt’ah 9.14, v súčine polynómov ũ(x) a u(x) nahradíme koeficienty ũ i „obyčajnými“koeficientami a vyjadríme ho v tvare konvolúcie postupností koefiecientov.∑44∑22ũ(x) · u(x) = u i · u 22+i−j · x j .j=0 i=0Kvôli zjednodušeniu úprav položíme u i = 0 pre (i < 0) ∨ (i > 22). Rozšírime terazsumačný rozsah premennej i v poslednej sumeũ(x) · u(x) =∑44∞∑j=0 i=−∞u i · u 22+i−j · x j (9.18)a rozdelíme sumačný rozsah premennej j na tri disjunktné intervaly: (0 ≤ j ≤ 44) = (0 ≤j < 22) ∨ (j = 22) ∨ (23 ≤ j ≤ 44). Potom sa súčin polynómov ũ(x) a u(x) rozpadáva na trisumy:ũ(x) · u(x) =∑21∞∑j=0 i=−∞u i · u 22+i−j · x j +∞∑i=−∞u 2 i · x22 +∑44j=23 i=−∞∞∑u i · u 22+i−j · x j (9.19)

9.6. GOLAYOV KÓD 123Koeficienty u i sú prvky pol’a GF(2), a preto u 2 i= u i. Kódové slovo u má párnu váhu ateda druhá suma v súčine 9.19 je nulová 5∞∑i=−∞u 2 i · x22 = x 22 ·∞∑i=−∞u i = 0.Teraz upravíme 1. a 3. sumu v súčine 9.19. Posunieme hranice sumácie v prvej zuvedených súm substitúciou j := j − 1, resp. j := j + 22 v druhej sume:ũ(x) · u(x) =∑22∞∑j=1 i=−∞u i · u 23+i−j · x j−1 +22∑∞∑j=1 i=−∞Teraz zavedieme substitúciu i := i + j v druhej sume 9.20a upravímeũ(x) · u(x) =∑22∞∑j=1 i=−∞u i · u 23+i−j · x j−1 +22∑∞∑j=1 i=−∞u i · u i−j · x j+22 (9.20)u i · u i+j · x j+22 (9.21)=22∑ũ(x) · u(x) =−[ ∞∑22∑∞∑u i · u 23+i−j · x j−1 +22∑j=1 i=−∞j=1 i=−∞22∑22∞∑∑u i · u i+j · x j−1 +∞∑j=1 i=−∞j=1 i=−∞u i · u 23+i−j + u i · u i+j]· x j−1 + ⎣j=1 i=−∞j=1 i=−∞⎡22∑∞∑u i · u i+j · x j−1 −u i · u i+j · x j+22 =⎤∞∑u i · u i+j · x j−1 ⎦ · (x 23 − 1) (9.22)Súčin polynómov ũ(x)·u(x) je podl’a vzt’ahu 9.17 delitel’ný polynómom (x 23 −1) Z rovnosti9.22 vyplýva, že aj polynóm[∑22∑ ∞]u i · u 23+i−j + u i · u i+j · x j−1 (9.23)j=1i=−∞musí byt’ násobkom polynómu (x 23 − 1). Polynóm 9.23 má však stupeň menší ako 23, aak má byt’ násobkom polynómu (x 23 − 1), musí byt’ nulový. To znamená, že∞∑i=−∞u i · u 23+i−j + u i · u i+j = 0 mod 2, j = 1, . . . , 22. (9.24)Ak v sústave 9.24 prejdeme od modulárnej k celočíselnej aritmetike, sústavu rovníc 9.24možno zapísat’ nasledovne∞∑i=−∞5 v modulárnej aritmetike nad pol’om GF(2).u i · u 23+i−j + u i · u i+j = 2d j ; d j ∈ Z, j = 1, . . . , 22. (9.25)

124 KAPITOLA 9. CYKLICKÉ KÓDYAk vo vzt’ahu 9.25 zavedieme substitúciu j := 23 − j, dostávame2d j−23 =∞∑i=−∞u i · u i+j + u i · u 23+i−j = 2d j ; d j ∈ Z, j = 1, . . . , 22. (9.26)To znamená, že d j = d j−23 pre j = 1, . . . , 22. Spočítame teraz hodnotu súčtu súm z 9.25 vceločíselnom obore22∑∞∑j=1 i=−∞u i · (u 23+i−j + u i+j ) = 222∑j=1∑11d j = 4 d j = 4d, (9.27)kde d je nejaké celé číslo. Rozdelíme sumu 9.27 na dve sumy. Vzhl’adom na to, že každýzo sumandov obsahuje faktor u 0 , môžeme zúžit’ sumačný rozsah premennej i na interval0 ≤ i ≤ 22. Potom v prvej sume použijeme substitúciu j := 23 − j∑22∞∑j=1 i=−∞∑22∑22u i · (u 23+i−j + u i+j ) = u i · u i+j +j=1 i=0j=122∑22∑j=1 i=0u i · u i+j . (9.28)Všimneme si, že sumy v pravej časti rovnosti (9.27) obsahujú všetky dvojice u i · u j také,že i ≠ j; t.j.22∑∞∑22∑ ∑u i · (u 23+i−j + u i+j ) = u i · u j = 4d. (9.29)j=1 i=−∞Nech je wt([)u] = w. Sumu (9.29) rozložíme na dve sumy podl’a toho, akú hodnotunadobúda u i : a upravíme:22∑i=0∑u i · u j = ∑ ij≠ii=0∑u i · u j · (u i = 0) + ∑ ij≠i= 0 + ∑ i(u i = 1) ∑ j≠iu j = ∑ ij≠i∑u i · u j · (u i = 1) =j≠i(u i = 1) · (w − 1) = w · (w − 1).Z posledného vzt’ahu a z (9.29) dostávame, žew · (w − 1) = 4d.Ked’že Hammingova váha slova u je párna, hodnota w − 1 je nepárna, a teda w musí byt’delitel’né 4.Golayov kód teda neobsahuje slová párnej váhy, ktorá nie je delitel’ná 4. To znamená,že spomedzi kandidátov na kódové slová vypadávajú slová váh 2, 6, 10, 14, 18, 22. Potenciálneváhy kódových slov sú teda 5, 7, 8, 9, 11, 12, 13, 15, 16, 19, 20, 21, 23. Problematickésú slová váhy 5, pretože ak by Golayov kód obsahoval také kódové slová, znamenaloby to, že jeho minimálna vzdialenost’ je 5. Existenciu kódových slov váhy 5 (a d’alších)vylúčime v nasledujúcej leme.Lema 5. Golayov kód neobsahuje kódové slová váh 1, 5, 9, 13, 17, 19, 20, 21.

9.7. DOKONALÉ A KVÁZIDOKONALÉ KÓDY 125Dôkaz.Pripomenieme, že polynóm x 23 − 1 sa dá vyjadrit’ v podobe súčinux 23 − 1 = (x − 1) · g(x) · ˜g(x).To znamená, že polynómf(x) = x 23 − 1/(x − 1) = 1 + x + x 2 + x 3 + · · · ∗ x 22je kódovým slovom Golayovho kódu, nakol’kox 23 − 1/(x − 1) = g(x) · ˜g(x).Golayov kód je zároveň lineárnym kódom, a to znamená, že súčet dvoch kódových slov(kódových polynómov)je opät’ kódovým slovom (polynómom). To znamená, že pre l’ubovol’nýkódový polynóm u(x) je aj polynóm u(x) + f(x) kódovým polynómom. Kódový polynómf(x) má Hammingovu váhu 23; Hammingova váha kódového polynómu u(x) + f(x) je23 − wt(u). Ak teda Golayov kód neobsahuje slová váhy w, nemôže obsahovat’ ani slováváhy 23 − w. Z tohto faktu a z liem 3 a 4 vyplýva tvrdenie našej lemy. Teraz môžemesformulovat’ základné tvrdenie o Golayovom kóde.Veta 9.6.1. Binárny Golayov (23, 12) kód je dokonalý kód opravujúci 3 chyby.Dôkaz. Vyplýva priamo z tvrdení liem 3, 4 a 5.Blahut [2] pomocou počítača analyzoval váhy slov Golayovho kódu. Výsledky jehoskúmania sú uvedené v nasledujúcej tabul’keváha počet slov0 17 2538 50611 128812 128815 50616 25323 1spolu 4096Tabul’ka 9.2: Váhy slov Golayovho (23,12)-kódu9.7 Dokonalé a kvázidokonalé kódy

126 KAPITOLA 9. CYKLICKÉ KÓDY

Kapitola 10Bose-Chandhury-HocquenghemovekódyBose-Chandhury-Hocquenghemove (BCH) kódy 1 tvoria pomerne rozsiahlu podtriedu cyklickýchkódov, ktoré sa vd’aka svojim dobrým vlastnostiam často používajú v praxi asú predmetom intenzívneho teoretického štúdia. Záujem o BCH kódy vyplýva podl’a [2]najmä z toho, že1. BCH kódy existujú pre pomerne rozsiahlu množinu parametrov (dĺžka, minimálnavzdialenost’ a i.); a už pre malé dĺžky (kódu) existujú dobré BCH kódy,2. pre BCH kódy existujú jednoduché metódy kódovania a dekódovania,3. podtriedou BCH kódov sú známe kódy Reed-Solomona, ktoré sú nelineárne, v niektorýchparametroch optimálne samoopravné kódy a4. štúdium BCH kódov je dobrým základom pre pochopenie zložitejších kódov.Výklad BCH kódov začneme konštrukciou binárnych BCH kódov opravujúcich 2 chyby.Potom zavedieme BCH kódy formálne a dokážeme vetu o minimálnej vzdialenostiBCH kódu. V d’alšom sa budeme zaoberat’ rozličnými metódami dekódovania BCH kódova kapitolu zavŕšime čast’ou venovanou spomínamím Reed-Solomonovým kódom.10.1 Binárne BCH kódy opravujúce 2 chybyBCH kódy sú zovšeobecnením Hammingových kódov. Kým však Hammingove kódy majúdĺžky qm −1 a opravujú jednu chybu 2 , BCH kódy sú podstatne rozmanitejšie: existujú1 BCH kódy objavil v roku 1959 A. Hocquenghem a nezávisle od neho v roku 1960 R.C.Bose a D.K.Ray-Chaurhuri.2 my sme sa zaoberali binárnymi Hammingovými kódmi127

128 KAPITOLA 10. BOSE-CHANDHURY-HOCQUENGHEMOVE KÓDYBCH kódy rôznych dĺžok nad pol’om GF(q), q ≠ 2, ktoré opravujú t chýb, t > 1. Skôr, akosa budeme konštrukciou, vlastnost’ami a dekódovaním BCH kódov zaoberat’ vo všeobecnosti,pozrieme sa na zvláštny prípad BCH kódov—binárne BCH kódy opravujúce 2chyby a ilustrujeme na nich konštrukcie, ktoré budeme v d’alších častiach tejto kapitolypoužívat’.Vrát’me sa k Hammingovmu (15, 11) kódu zo začiatku kapitoly 9. Tento kód smezadali pomocou kontrolnej matice H ′ , ktorá sa dala interpretovat’ dvojako: bud’ akomatica typu (4, 14) nad pol’om GF(2), alebo ako matica typu (1, 14) nad pol’om GF(2 4 ).V druhom prípade sa kontrolná matica redukovala na 1 riadok, obsahujúci postupnost’mocnín primitívneho prvku α pol’a GF(2 4 ):H ′ = [1 α α 2 . . . α 14 ]a dekódovanie prijatého slova v = (v 0 , v 1 , . . . , v 14 ) = u + e; t.j. výpočetv · H ′⊤ = u · H ′⊤ + e · H ′⊤ ,sa dalo interpretovat’ ako vyčíslenie hodnoty polynómu v(x) = v 0 + v 1 · x + v 2 · x 2 + · · · +v 14 · x 14 v prvku α; t.j. výpočet hodnoty v(α). Ak počas prenosu kódového slova nevzniklachyba (resp. vznikla chyba, ktorá odvysielané kódové slovo u transformovala na inékódové slovo v) tak v(α) = 0. Predpokladajme, že počas prenosu vznikla chyba váhy 1;t.j. chybový polynóm bude mat’ tvar e(x) = x i . Potom po dosadení prvku α do prijatéhopolynómu v(x) dostávame hodnotu syndrómuv(α) = u(α) + e(α) = e(α) = α i .Poznámka. V d’alšom budeme kvôli jednoduchosti hodnoty jednotlivých zložiek syndrómuoznačovat’ symbolmi S i ; v(α i ) = S i , i = 1, 2, . . . . Pripomíname, že hodnoty S i niesú koeficientami syndrómového polynómu s(x), ale tak syndróm S 1 , . . . ako aj syndrómovýpolynóm s(x) nesú tú istú informáciu.V prípade Hammingovho kódu informácia, ktorú obsahuje syndróm S 1 postačuje naurčenie chyby. Stačí určit’ hodnotu exponentu (S 1 = α i ) čo sa dá spravit’ napríklad pomocoutabul’ky a potom negovat’ i-ty bit prijatého slova. Prejdeme teraz od konkrétnehoHammingovmu (15, 11) kódu k všeobecnému Hammingovmu kódu dĺžky n = 2m − 1 skontrolnou maticouH = [1 α α 2 . . . α n−1 ]a pozrieme sa na to, čo by sa stalo, keby počas prenosu vznikli v odvysielanom kódovomslove dve chyby. Neche(x) = x i 1+ x i 2.Dosadením prvku α do prijatého polynómu dostávame hodnotuv(α) = e(α) = α i 1+ α i 2.Táto hodnota na určenie pozícií chýb nestačí a preto potrebujeme nájst’ d’alšie vzt’ahymedzi α i 1, α i 2. Skúsime rozšírit’ kontrolnú maticu H pridaním d’alšieho riadku tak, abynásobenie prijatého vektora kontrolnou maticou viedlo k sústave rovníc s neznámymi

10.1. BINÁRNE BCH KÓDY OPRAVUJÚCE 2 CHYBY 129α i 1, α i 2. Nový riadok kontrolnej matice bude mat’ rovnaký tvar ako riadok pôvodnejkontrolnej matice; t.j. 1 β β 2 . . . β n−1 . Ak β = α j , (α je primitívny prvok pol’a GF( m ))tak súčin v · H ⊤ možno zapísat’ v podobe sústavy dvoch rovnícv(α) = S 1 ,v(β) = v(α j ) = S jAko vybrat’ prvok β? Je zrejmé, že β ≠ α, pretože v opačnom prípade by kontrolná maticaH obsahovala dva rovnaké riadky a súčin v·H ⊤ by viedol k „sústave“ dvoch identickýchrovníc. Ako sa ukáže neskôr β nemôže patrit’ do množiny (cyklu) α, α 2 , α 4 , . . . α 2j , . . . ,pretože v tomto prípade by rovnice v sústave zadanej súčinom v · H ⊤ boli závislé. Toznamená, že spomedzi kandidátov na prvok β vypadli α, α 2 a prvým prirodzeným kandidátomje α 3 . Kontrolná matica bude po rozšírení vyzerat’ nasledovne: 3H =[ 1 α α2. . . α n−1 ]1 α 3 α 6 . . . α 3(n−1) .Kontrolná matica H určuje cyklický kód C, ktorý sa vyznačuje tým, že všetky kódovépolynómy majú korene α, α 3 , pretože[] []u ∈ C ↔ u · H ⊤ = 0 ↔ u(α) = u(α 3 ) = 0 .To znamená, že generujúcim polynómom kódu C budeg(x) = lcm(m α (x), m α 3(x)),resp. kedže minimálne polynómy prvkov α, α 3 sú rôzne, nemôžu mat’ spoločný faktor, atedag(x) = m α (x) · m α 3(x)).Ak pri prenose kódového slova vznikli 2 chyby; e(x) = x i 1+ x i 2, tak pri dekódovanívyčíslime hodnotu prijatého polynómu v(x) v prvkoch α, α 3 a dostávame sústavuv(α) = e(α) = α i 1+ α i 2Aby sme trocha zjednodušili zápis, zavedieme označeniev(α 3 ) = e(α 3 ) = α 3i 1+ α 3i 2. (10.1)X 1 = α i 1, X 2 = α i 2a prepíšeme sústavu (10.1) do prehl’adnejšej podoby:X 1 + X 2 = S 1X 3 1 + X3 2 = S 3 . (10.2)Hodnoty X 1 , X 2 ∈ GF(2 m ) sa nazývajú lokátory chýb. Ak sa nám totiž podarí na základesyndrómu vypočítat’ hodnoty lokátorov chýb X 1 , X 2 , tak potom vypočítame log α (X 1 ) = i 1a log α (X 2 ) = i 2 a tak určíme pozície i 1 , i 2 na ktorých vznikli chyby. Sústavu (10.2) nebudemeriešit’ priamo, ale spravíme trochu umelý krok. Zavedieme pomocný polynóm3 Kontrolná matica H zapísaná v binárnej podobe nad pol’om GF(2) má 2m riadkov.

130 KAPITOLA 10. BOSE-CHANDHURY-HOCQUENGHEMOVE KÓDYΛ(x) nad pol’om GF( m ), ktorého koreňmi budú práve lokátory chýb a ukážeme, že pomocouhodnôt syndrómu dokážeme vyjadrit’ koeficienty uvedeného polynómu:Λ(x) = (x − X 1 )(x − X 2 ) = x 2 + (X 1 + X 2 ) · x + X 1 · X 2 . (10.3)Potrebujeme nájst’ explicitné vyjadrenie súčinu X 1 · X 2 z (10.3) pomocou známych hodnôtsyndrómu. SpočítameS 3S 1= X3 1 + X3 2X 1 + X 2= X 2 1 + X 1 · X 2 + X 2 2 = (X 1 + X 2 ) 2 + X 1 · X 2 = S 2 1 + X 1 · X 2 .Teraz vyjadríme súčin lokátorovX 1 · X 2 = S 3S 1+ S 2 1 = S 3 + S 3 1S 1.Nakoniec vyjadríme explicitne pomocou syndrómu koeficienty polynómu lokátorov chýb:Λ(x) = x 2 + S 1 · x + S 3 + S 3 1S 1. (10.4)Ked’že koeficienty polynómu Λ(x) dokážeme vyjadrit’ pomocou hodnôt syndrómu, polynómlokátorov chýb dokážeme na základe prijatého slova zostrojit’ a nájdením jeho koreňovurčit’ aj pozície, na ktorých sú v prijatom chyby. Korene polynómu Λ(x) možno v prípademalého m nájst’ úplným preberaním. Existujú však aj efektívne metódy faktorizáciekvadratických polynómov nad pol’om GF(2 m ), pomocou ktorých možno nájst’ korenepolynómu Λ(x) rýchlejšie ako úplným preberaním. Zostrojený kód opravuje 2 chyby.Pozrime sa ešte na to, čo sa stane, ak pri prenose vzniknú chyby inej váhy ako 2.Chyba váhy 0 V tomto prípade je chybový polynóm e(x) nulový, v(x) = u(x) aS 1 = v(α) = v(α 3 ) = S 3 = 0.Chyba váhy 1 Chybový polynóm e(x) = x i a syndróm bude vyzerat’ nasledovne:S 1 = v(α) = α i ;S 3 = v(α 3 ) = α 3i = S 3 1 .Chyba váhy > 2 Uvedený BCH kód opravuje chyby váhy 2. To znamená, že jeho minimálnavzdialenost’ je 5. Chyby váhy 3 a väčšej kód môže odhalit’, ale nedokážesprávne opravit’.Zhrnieme teraz získané poznatky a uvedieme dekóder binárneho BCH kódu opravujúceho2 chyby [16].1. Vypočítaj hodnoty syndrómuv(α) = S 1 v(α 3 ) = S 3

10.1. BINÁRNE BCH KÓDY OPRAVUJÚCE 2 CHYBY 1312. Ak S 1 = S 3 = 0, bolo prijaté kódové slovo. (Predpokladáme, že pri prenose nevzniklachyba).3. Ak S 1 ≠ 0 a S 3 = S 3 1, predpokladáme, že pri prenose vznikla chyba váhy 1. Lokátorchyby je S 1 = x 1 a hodnota log α S 1 = i určuje miesto, na ktorom v prijatom slovevznikla chyba.4. Ak S 1 ≠ 0 a S 3 ≠ S 3 1, predpokladáme, že pri prenose vznikla chyba váhy 2. Zostrojímepolynóm lokátorov chýb Λ(x) a nájdeme jeho korene. Ak má Λ(x) dva rozličnékorene X 1 ≠ X 2 , tak chyby nastali na pozíciách i 1 , i 2 ; X 1 = α i 1, X 2 = α i 2. V opačnomprípade (polynóm lokátorov chýb Λ(x) nemá dva rozličné korene) nastala počasprenosu neopravitel’ná (ale odhalitel’ná) chyba.5. Ak S 1 = 0, S 3 ≠ 0, počas prenosu došlo ku chybe váhy ≥ 3. Túto sme síce pridekódovaní odhalili, ale nedokážeme ju opravit’.Ilustrujeme popísanú metódu na príklade.Príklad. Zostrojíme binárny BCH (15,7)-kód opravujúci 2 chyby a ukážeme, ako sadekódujú prijaté slová, zat’ažené chybami váhy 0,1,2 a 3. Budeme potrebovat’ konečnépole GF(2 4 ). Jeho konštrukcia je podrobne popísaná časti 15.4 a preto len pripomenieme,že stačí faktorizovat’ okruh polynómov GF(2)[x] vhodným ireducibilným polynómomstupňa 4 nad pol’om GF(2). Vyberieme polynóm 1+x+x 4 a faktorový okruh polynómovGF(2)[x]/1 + x + x 4 predstavuje hl’adané pole. Označíme symbolom α primitívnyprvok pol’a GF(2 4 ). Prvky pol’a GF(2 4 ) vyjadrené v binárnom tvare a pomocou mocnínprimitívneho prvku sú uvedené v tabul’ke 15.6. Zostrojíme generujúci polynóm BCH(15,7)-kódu. Minimálne polynómy prvkov α, α 3 súa generujúci polynóm bude mat’ tvarm α (x) = 1 + x + x 4 ,m α 3(x) = 1 + x + x 2 + x 3 + x 4g(x) = lcm (m α (x), m α 3(x)) = m α (x) · m α 3(x) == 1 + x 4 + x 6 + x 7 + x 8 .Potrebujeme ešte nejaké kódové slovo. Vynásobíme generujúci polynóm vhodným informačnýmpolynómom a dostávameu(x) = (1 + x + x 5 ) · g(x) = 1 + x + x 4 + x 6 + x 11 + x 12 + x 13 .Budeme predpokladat’, že pri prenose kódového slova u(x) vznikla chyba e(x) a boloprijaté slovo v(x) = u(x) + e(x).Chyba váhy 0 e(x) = 0, v(x) = u(x). Využijeme binárnu reprezentáciu prvkov pol’aGF(2 4 ) (tabul’ka 15.6) a vypočítame syndróm chyby. (Pri výpočtoch budeme využívat’,že pole GF(2 4 ) má charakteristiku 2, t.j. pre l’ubovol’ný prvok β ∈ GF(2 4 ) platí

132 KAPITOLA 10. BOSE-CHANDHURY-HOCQUENGHEMOVE KÓDYβ + β = 0 a že α j = α j mod 15 .) Výpočet kvôli stručnosti uvádzame v tabul’kovejforme.v(x) v(α) v(α 3 )1 1 0001 1 0001x α 0010 α 3 1000x 4 α 4 0011 α 12 1111x 6 α 6 1100 α 3 1000x 11 α 11 1110 α 3 1000x 12 α 12 1111 α 6 1100x 13 α 13 11101 α 9 1010S 1 = 0000 S 3 = 0000Ked’že syndróm chyby je nulový, predpokladáme, že bolo prijaté odvysielané kódovéslovo (polynóm) u(x) = 1 + x + x 4 + x 6 + x 11 + x 12 + x 13 . Informačný polynómpotom dostaneme vydelením prijatého polynómu generujäcim polynómom:i(x) = u(x) : g(x) = 1 + x + z 5 .Chyba váhy 1 e(x) = x 11 , bolo prijaté slovo (polynóm)v(x) = 1 + x + x 4 + x 6 + x 12 + x 13 .Vypočítame syndrómv(x) v(α) v(α 3 )1 1 0001 1 0001x α 0010 α 3 1000x 4 α 4 0011 α 12 1111x 6 α 6 1100 α 3 1000x 12 α 12 1111 α 6 1100x 13 α 13 11101 α 9 1010S 1 = 1110 S 3 = 1000Syndróm chyby nadobúda v tomto prípade hodnoty S 1 = α ( 11), S 3 = α 3 . Obe zložkysyndrómu sú nenulové, ale (α) 11 ) 3 = α 33 = α 3 , a teda S 3 = S 3 1. To znamená že vprijatom slove je chyba váhy 1. Ked’že S 1 = α ( 11), chybový vektor je e(x) = x 11 .Opravíme prijaté slovo:v(x) + e(x) = u(x) = 1 + x + x 4 + x 6 + x 11 + x 12 + x 13 .Chyba váhy 2 e(x) = x 7 + x 12 , bolo prijaté slovo (polynóm)v(x) + e(x) = u(x) + e(x) = 1 + x + x 4 + x 6 + x 7 + x 11 + x 13 .

10.1. BINÁRNE BCH KÓDY OPRAVUJÚCE 2 CHYBY 133Vypočítame syndrómv(x) v(α) v(α 3 )1 1 0001 1 0001x α 0010 α 3 1000x 4 α 4 0011 α 12 1111x 6 α 6 1100 α 3 1000x 7 α 7 1011 α 6 1100x 11 α 11 1110 α 3 1000x 13 α 13 11101 α 9 1010S 1 = 0100 S 3 = 0000t.j. S 1 = α 2 , S 3 = 0. Ked’že S 1 ≠ 0 a S 3 ≠ S 3 1, predpokladáme, že v slove v(x) je chybaváhy 2. Zostrojíme polynóm lokátorov chýb (10.4)Λ(x) = α 4 + α 2 · x + x 2a postupným prehl’adávaním pol’a GF(2 4 ) nájdeme jeho korene.v(0) = α 4 α 4 ≠ 0v(1) = α 4 + α 2 + 1 = α 5 ≠ 0v(α) = α 4 + α 3 + α 2 = α 12 ≠ 0v(α 2 ) = α 4 + α 4 + α 4 = α 4 ≠ 0v(α 3 ) = α 4 + α 5 + α 6 = α 14 ≠ 0v(α 4 ) = α 4 + α 6 + α 8 = α 9 ≠ 0v(α 5 ) = α 4 + α 7 + α 10 = α 12 ≠ 0v(α 6 ) = α 4 + α 8 + α 12 = α 14 ≠ 0v(α 7 ) = α 4 + α 9 + α 14 = 0 ̌Našli sme prvý koreň, α 7 . Ušetríme si d’alšie prehl’adávanie a vydelíme polynómlokátorov chýb polynómom x + α 7 . DostávameΛ(x) = (x + α 7 ) · (x + α 12 ),t.j. koreňmi polynómu Λ(x) sú α 7 , α 12 . Z toho vyplýva, že e(x) = x 7 + x 12 . Opravímeprijaté slovov(x) + e(x) = u(x) = 1 + x + x 4 + x 6 + x 11 + x 12 + x 13 .Chyba váhy 3 Nech e(x) = x 11 + x 12 + x 13 a bolo prijaté slovo v(x) = 1 + x + x 4 + x 6 .Syndróm chyby v tomto prípade budev(x) v(α) v(α 3 )1 1 0001 1 0001x α 0010 α 3 1000x 4 α 4 0011 α 12 1111x 6 α 6 1100 α 3 1000S 1 = 1100 S 3 = 1110

134 KAPITOLA 10. BOSE-CHANDHURY-HOCQUENGHEMOVE KÓDYt.j. S 1 = α 6 , S 3 = α 11 a S 3 ≠ S 3 1. Usúdime, že pri prenose nastala chyba váhy 2.Zostrojíme polynóm lokátorov chýbΛ(x) = α 2 + α 6 · x + x 2a určíme jeho korene. Tými sú prvky α 7 , α 10 , ktoré určujú chybový polynóm e ′ (x) =x 7 + x 10 . Prijaté slovo upravíme na kódové slovov(x) + e ′ (x) = 1 + x + x 4 + x 6 + x 7 + x 10 ,ktorý sa však nezhoduje s odvysielaným kódovým slovom u(x).Tým istým spôsobom, ako sme zostrojili binárny kód opravujúci 2 chyby, možnozostrojit’ aj BCH kód opravujúci tri chyby (kontrolná matica sa rozšíri o 3. riadok:1, α 5 , α 10 , . . . , α 5(n−1) ). My sa touto konštrukciou nebudeme zaoberat’, prípadných záujemcovodkazujeme na [16] a prikročíme k formalizácii a zovšeobecneniu BCH kódov.10.2 Definícia BCH kódovBCH kódy sú cyklické kódy nad pol’om GF(q), ktoré sú definované pomocou prvkov zrozšírenia pôvodného pol’a, GF(q m ).Definícia 10.2.1. Nech β ∈ GF(q m ) je prvok rádu n; t je l’ubovol’né prirodzené a ll’ubovol’né celé číslo. Potom cyklický kód C s generujúcim polynómomg(x) = lcm { m β l+1(x), m β l+2(x) . . . , m β l+2t(x) } ,kde m β j(x) je minimálny polynóm prvku β j , sa nazýva BCH kódom.Ak n = q m − 1; t.j. β je primitívny prvok pol’a GF(q m ), BCH kód dĺžky n sa nazývaprimitívnym BCH kódom. Parameter l sa často kladie rovným nule (v mnohých alenie všetkých prípadoch to vedie ku konštrukcii generujúceho polynómu minimálnehostupňa). BCH kódy s hodnotou parametra l = 0 sa nazývajú BCH kódmi v úzkom zmysle.Uvedieme niekol’ko príkladov rôznych BCH kódov. Začneme binárnym kódom dĺžky 15,na ktorom budeme neskôr demonštrovat’ metódy dekódovania BCH kódov.Príklad. Nech q = 2, l = 0, t = 3, m = 4. BCH kód s danými parametrami existuje,je to binárny (15,5) kód opravujúci 3 chyby. Zadáme ho pomocou jeho generujúcehopolynómu. Ked’že ide o primitívny BCH kód, budeme potrebovat’ prvok rádu 15, t.j.primitívny prvok pol’a GF(2 4 ). Nechje α daný primitívny prvok. Koreňmi generujúcehopolynómu budú prvky α, α 2 , α 3 , α 4 , α 5 , α 6 ; t.j. enerujúci polynóm budeg(x) = lcm {m α (x), m α 2(x), . . . , m α 6(x)} .Prvky α, α 2 , α 4 však majú ten istý minimálny polynóm, podobne prvky α 3 , α 6 ;α, α 2 , α 4 ↔ m α (x) = 1 + x + x 4 ,α 3 , α 6 ↔ m α 3(x) = 1 + x + x 2 + x 3 + x 4 ,α 5 ↔ m α 5(x) = 1 + x + x 2 .

10.3. HRANICA BCH KÓDOV 135To znamená, žeg(x) = (1 + x + x 4 ) · (1 + x + x 2 + x 3 + x 4 ) · (1 + x + x 2 ) == 1 + x + x 2 + x 4 + x 5 + x 8 + x 10 . (10.5)10.3 Hranica BCH kódovVyužijeme skutočnost’, že cyklické kódy sú zároveň lineárne kódy, určíme rang kontrolnejmatice BCH kódu a potom na základe vety 8.1.2 a jej dôsledku určíme minimálnuvzdialenost’ BCH kódov, resp. jej dolný odhad.Veta 10.3.1. Nech je g(x) generujúci polynóm BCH kódu C dĺžky n, s koreňmi βl+1 , . . . ,β l+2t , kde β je prvok rádu n pol’a GF(q m ). Potom minimálna vzdialenost’ d kódu C jeaspoň 2t + 1.Dôkaz.Kontrolnú maticu BCH kódu C možno zapísat’ v tvareH =⎡⎢⎣1 β (l+1) β 2(l+1) . . . β (n−1)(l+1) ⎤1 β (l+2) β 2(l+2) . . . β (n−1)(l+2)⎥.. ⎦1 β (l+2t) β 2(l+2t) . . . β (n−1)(l+2t)Ukážeme, že l’ubovol’ná štvorcová podmatica typu (2t, 2t) kontrolnej matice H je regulárna;t.j. že l’ubovol’ných 2t stĺpcov kontrolnej matice je lineárne nezávislých (a tedaminimálna váha kódu C je aspoň 2t + 1). Určíme hodnotu determinantu štvorcovej podmaticetvorenej vybranými stĺpcami j 1, h 2 , . . . , j 2t kontrolnej matice H:⎡β j 1(l+1)β j 2(l+1). . . β j ⎤2t(l+1)β j 1(l+2)β j 2(l+2). . . β j 2t(l+2)det ⎢⎥⎣ .. ⎦ =β j 1(l+2t)β j 2(l+2t). . . β j 2t(l+2t)⎡β j 1(l+1)β j 2(l+1). . . β j ⎤2t(l+1)= β 2t(j 1+j 2 +···+j 2t )·(l+1) β j 1(l+2)β j 2(l+2). . . β j 2t(l+2)det ⎢⎥⎣ .. ⎦ .β j 1(l+2t)β j 2(l+2t). . . β j 2t(l+2t)Druhá matica je Vandermondova matica, ktorej determinant má tvar∏i>k( )β j i− β j k. (10.6)Ked’že β je prvok rádu n, prvky β j 1, . . . , β j 2t(10.6) je rôzny od nuly.sú navzájom rôzne, a teda determinant

136 KAPITOLA 10. BOSE-CHANDHURY-HOCQUENGHEMOVE KÓDYPoznámka. Hodnota 2t + 1 garantovaná predchádzajúcou vetou sa nazýva konštrukčnouvzdialenost’ou BCH kódu. Je daná dĺžkou súvislej postupnosti mocnín prvku β(β l+1 , . . . , β l+2t ), ktoré sú koreňmi generujúceho polynómu kódu. Ale ked’že generujúcipolynóm g(x) je definovaný ako najmenší spoločný násobok minimálnych polynómovsvojich koreňov a minimálne polynómy prvkov β l+1 , . . . , β l+2t nie sú vo všeobecnostilineárne, môžu mat’ aj iné korene, ktoré „predĺžia“ postupnost’ βl+1 , . . . , β l+2t . Potombude skutočná minimálna vzdialenost’ kódu väčšia ako jeho konštrukčná vzdialenost’.Existujú odhady skutočnej minimálnej vzdialenosti BCH kódov. Skôr, ako sa nimi budemezaoberat’, uvedieme niekol’ko príkladov, na ktorých ilustrujeme rozdiel medzi konštrukčnoua minimálnou vzdialenost’ou BCH kódu.Príklad. Uvažujme binárny BCH kód C dĺžky 31 (v úzkom zmysle) opravujúci 4 chyby,Nech α je primitívny prvok pol’a GF(2 5 ). Koreňmi generujúceho polynómu g(x) kódu Cmusia byt’ prvky α, α 2 , . . . , α 8 pol’a GF(2 5 ); resp. generujúci polynóm g(x) možno definovat’akog(x) = lcm m α (x), m α 2(x), . . . , m α 8(x),kde m α j(x) je minimálny polynóm prvku α j . Bez toho, aby sme zostrojili generujúcipolynóm g(x), ukážeme, že minimálna vzdialenost’ kódu C prevyšuje konštrukčnú vzdialenost’.Využijeme na to skutočnost’, že ak má v poli charakteristiky 2 polynóm f(x)koreň β, tak potom má aj korene β 2 , β 4 , . . . , β 2j , . . . . Rozdelíme prvky pol’a GF(2 5 ) do tried(cyklov); do jednej triedy dáme všetky prvky β, β 2 , β 4 , . . . , β 2j , . . . . kde β ∈ GF(2 5 ). Je zrejmé,že každej triede rozkladu zodpovedá jeden (minimálny) polynóm, ktorého koreňmisú práve prvky z danej triedy.triedaminimálnypolynóm0 m 0 (x)1 m 1 (x)α α 2 α 4 α 8 α 16 m α (x)α 3 α 6 α 12 α 24 α 17 m α 3(x)α 5 α 10 α 20 α 9 α 18 m α 5(x)α 7 α 14 α 28 α 25 α 19 m α 7(x)α 11 α 22 α 13 α 26 α 21 m α 11(x)α 15 α 30 α 29 α 27 α 23 m α 15(x)Z uvedenej tabul’ky rozkladu pol’a GF(2 5 ) vyplýva, žeg(x) = m α (x) · m α 3(x) · m α 5(x) · m α 7(x)a polynóm g(x) má teda okrem požadovaných koreňov α, α 2 , . . . , α 8 aj korene α 9 a α 10 .To však znamená, že minimálna vzdialenost’ BCH kódu C je 11. Pre zaujímavost’ dopočítameaj hodnoty jeho ostatných parametrov: stupeň generujúceho polynómu je 20, a tedapočet informačných symbolov v kódovom slove je 11. Kód C je teda binárny (31,11) BCHkód (v úzkom zmysle) opravujúci 5 chýb.Rozdiel medzi konštrukčnou a minimálnou vzdialenost’ou BCH kódu môže byt’ vel’ký.Berlekamp uvádza príklad binárneho BCH kódu v úzkom zmysle dĺžky 212 −1 s konštrukčnouvzdialenost’ou 768, ktorého skutočná minimálna vzdialenost’ je 819 ([7]). Uvedené

10.4. PETERSON-GORENSTEIN-ZIERLEROV ALGORITMUS DEKÓDOVANIA BCH KÓDOV137príklady môžu vzbudit’ pochybnosti o tom, aká je výpovedná hodnota dolnej hranice BCHpre opravnú schopnost’ BCH kódu. V práci [12] je uvedená rozsiahla tabul’ka, ktorúzostavil Chen, obsahujúca všetky binárne cyklické kódy nepárnej dĺžky (n ≤ 65) spolu sich najdôležitejšími parametrami, vrátane dolnej hranice BCH a skutočnej minimálnejvzdialenosti. Hranica BCH sa od skutočnej minimálnej vzdialenosti odlišuje pomernečasto a v niektorých prípadoch aj dost’ výrazne. Vzt’ah medzi hranicou BCH a skutočnouminimálnou vzdialenost’ou pre pomerne širokú podtriedu BCH kódov vyjadruje nasledujúcaveta [12].Veta 10.3.2. Nech je d BCH konštrukčná vzdialenost’ primitívneho BCH kódu nad pol’omGF(q). Potom pre minimálnu vzdialenost’ d tohto kódu platíd ≤ q · d BCH + q − 2.Dôkaz. Neuvádzame, čitatel’ ho môže nájst’ v práci [12].Poznámka. V binárnom prípade skutočná minimálna vzdialenost’ (primitívneho) BCHkódu neprevyšuje dvojnásobok konštrukčnej vzdialenosti.10.4 Peterson-Gorenstein-Zierlerov algoritmus dekódovaniaBCH kódovBCH kódy sú cyklické kódy, a preto na ich dekódovanie je možné použit’ l’ubovol’númetódu dekódovania cyklických kódov. Existujú však efektívnejšie metódy dekódovania,navrhnuté špeciálne pre BCH kódy. V tejto časti popíšeme Peterson-Gorenstein-Zierlerov algoritmus dekódovania.Predpokladáme, že je daný BCH kód C dĺžky n opravujúci t chýb nad pol’om GF(q),s generujúcim polynómom g(x) Kvôli zjednodušeniu výkladu budeme tiež predpokladat’,že C je BCH kód v úzkom zmysle, t.j. že koreňmi g(x) súprvky β, β 2 , . . . , β 2t .(Prvok βnemusí byt’ primitívnym prvkom pol’a GF(q m ); zrejme stačí, aby jeho rád n delil q m − 1.)Nech bolo odvysielané slovo u(x) a počas prenosu nastala chyba váhy ν, 0 ≤ ν ≤ t, ktorúzapíšeme v podobe chybového polynómu:e(x) = e 0 + e 1 x + e 2 x 2 + · · · + e n−1 x n−1 .Chybový polynóm má práve ν koeficientov nenulových. Označme tieto koeficienty e i1 , . . . , e iνa vynechajme v e(x) nulové členy. Chybový polynóm bude po redukcii vyzerat’ nasledovnee(x) = e i1 x i 1+ e i2 x i 2+ · · · + e iν x i ν. (10.7)Prijali sme polynóm (slovo) v(x) = u(x)+e(x). Pre prijaté slovo v(x) možno vypočítat’ dvarozličné syndrómy:• syndrómový polynóm s(x) = v(x) mod g(x) a

138 KAPITOLA 10. BOSE-CHANDHURY-HOCQUENGHEMOVE KÓDY• syndróm (S 1 , S 2 , . . . , S 2t ), ktorého zložky (parciálne syndrómy) sa dajú vypočítat’ zovzt’ahu S j = v(β j ) = e(β j ). Pripomenieme, že pre tento syndróm platí aj[S 1 , S 2 , . . . , S 2t ] = [v 0 , v 1 , . . . , v n−1 ] · H ⊤ ,kde H je kontrolná matica kódu C a (v 0 , v 1 , . . . , v n−1 ) prijaté slovo (koeficienty prijatéhopolynómu).Vypočítame parciálne syndrómy dosadením koreňov generujúceho polynómu do prijatéhopolynómu v(x):S j = v(β j ) = e i1 β i 1+ e i2 β i 2+ · · · + e iν β i ν, j = 1, . . . , 2t.Aby sme zjednodušili zápis, zavedieme podobne ako v prípade binárnych BCH kódovnové označenie:• hodnoty β i 1, . . . , β i νoznačíme symbolmi X 1 , . . . , X ν ; X k = β i ka nazveme lokátormichýb;• hodnoty chýb označíme symbolmi Y k ; e i1 = Y 1 , . . . , e iν = Y ν .Pripomíname, že lokátory chýb sú prvky pol’a GF( m ) a hodnoty chýb sú prvky pol’a GF(q).Parciálne syndrómy môžeme potom vyjadrit’ pomocou sústavy rovníc:S 1 = Y 1 X 1 + . . . + Y ν X νS 2 = Y 1 X 2 1+ . . . + Y ν X 2 ν. ..S 2t = Y 1 X 2t1+ . . . + Y ν X 2tν(10.8)Našou úlohou je nájst’ na základe známych hodnôt syndrómu S 1 , . . . , S 2t neznáme hodnotylokátorov chýb a hodnôt chýb: X 1 , dots, X ν ; Y 1 , dots, Y ν . Ukžeme, že systém rovníc(10.8) má práve jedno riešenie. Vzhl’adom na nelineárnost’ systému (10.8) by jeho priameriešenie bolo náročné. Preto podobne ako v predchádzjúcej časti zavedieme pomocnýpolynóm Λ(x) lokátorov chýb; tentoraz však v mierne modifikovanej podobe: jeho koreňminebudú lokátory chýb, ale prevrátené hodnoty lokátorov chýb.Λ(x) = (1 − xX 1 )(1 − xX 2 ) . . . (1 − xX ν ) = 1 + λ 1 x + λ 2 x 2 + · · · + λ ν x ν . (10.9)Ak by sme poznali koeficienty λ 1 , . . . , λ ν , dokázali by sme zostrojit’ polynóm Λ(x) a (napríkladúplným preberaním) nájst’ jeho korene X −11 , . . . , X−1 ν . Problém je v tom, že nepoznámeani len stupeň ν polynómu Λ(x), t.j. váhu chyby ktorá vznikla pri prenose. Ukážeme,ako sa dajú určit’ koeficienty polynómu Λ(x) na základe známych hodnôt parciálnychsyndrómov S 1 , . . . , S 2t pomocou riešenia systému lineárnych rovníc. Ked’že koreňmipolynómu Λ(x) sú prevrátené hodnoty lokátorov chýb, platíΛ(X −1i) = 1 + λ 1 X −1i+ λ 2 X −2i+ · · · + λ ν X −νi= 0, i = 1, . . . , ν (10.10)Zbavme sa záporných mocnín lokátorov chýb tým, že vynásobíme rovnice sústavy 10.10členmi Y i X j+νi, kde 1 ≤ j ≤ ν:

10.4. PETERSON-GORENSTEIN-ZIERLEROV ALGORITMUS DEKÓDOVANIA BCH KÓDOV139Y i X j+νi+ λ 1 Y i X j+ν−1i+ λ 2 Y i X j+ν−2i+ · · · + λ ν Y i X j i= 0, i = 1, . . . , ν (10.11)Teraz sčítame 10.12 cez iν∑ν∑ν∑ν∑Y i X j+νi+ λ 1 Y i X j+ν−1i+ λ 2 Y i X j+ν−2i+ · · · + λ ν Y i X j i = 0 (10.12)i=1i=1i=1Ale (pozri 10.8) posledná rovnost’ predstavujei=1S j+ν + λ 1 S j+ν−1 + λ 2 S j+ν−2 + · · · + λ ν S j = 0,resp. po presunutí člena S j+ν na pravú stranu a preusporiadaní ostatných členov nal’avej strane rovnice dostávameS j λ ν + S j+1 λ ν−1 + · · · + λ 1 S j+ν−1 = −S j+v . (10.13)ked’že λ ≤ ν, pre 1 ≤ j ≤ ν, indexy zložiek syndrómu zo sústavy (10.13) sú z intervalu〈1, 2t〉 a teda v sústave (10.13) sa vyskytujú len známe hodnoty syndrómu S 1 , . . . , S 2t .Sústavu (10.13) možno prehl’adnejšie zapísat’ v maticovej forme:⎡⎢⎣⎤S 1 S 2 . . . S ν−1 S νS 2 S 3 . . . S ν S ν+1S 3 S 4 . . . S ν+1 S ν+2⎥.. ⎦S ν S ν+1 . . . S 2ν−2 S 2ν−1⎡·⎢⎣λ νλ ν−1λ ν−2.λ 1⎤⎡=⎥ ⎢⎦ ⎣−S ν+1−S ν+2−S ν+3.−S 2ν⎤. (10.14)⎥⎦Kvôli zjednodušeniu zápisu v d’alšom texte zavedieme nasledujúce označenie⎡⎤S 1 S 2 . . . S ν−1 S νS 2 S 3 . . . S ν S ν+1S 3 S 4 . . . S ν+1 S ν+2= M⎢⎥ ν . (10.15)⎣ .. ⎦S ν S ν+1 . . . S 2ν−2 S 2ν−1Ak by matica M ν bola regulárna, tak by bolo možné riešit’ sústavu 10.14. V nasledujúcejleme dokážeme, za akých podmienok je M ν regulárna.Lema 6. Nech pri prenose kódového slova došlo k chybe váhy ν ≤ t. Potom je matica M νregulárna a matica M µ , kde µ > ν singulárna.DôkazMaticu M µ , 0 ≤ ν ≤ µ ≤ t močno rozložit’ na súčin troch matíc;M µ = A · B · A ⊤ ,kde⎡A =⎢⎣ .1 1 1 . . . 1X 1 X 2 X 3 . . . x µX 2 1X 2 2X 2 3. . . x 2 µ.X µ−11X µ−12X µ−13. . . x µ−1µ⎤⎥⎦

140 KAPITOLA 10. BOSE-CHANDHURY-HOCQUENGHEMOVE KÓDYa B je diagonálna maticaZrejme⎡B =⎢⎣⎤X 1 Y 1 0 0 . . . 00 X 2 Y 2 0 . . . 00 0 X 3 Y 3 . . . 0⎥.. ⎦0 0 0 . . . X ν Y νdet(M µ ) = det(A) · det(B) · det(A ⊤ ).Ak µ > ν, medzi hodnotami chýb Y 1 , . . . , Y µ je aspoň jedna nulová. To znamená, že vmatici B sa na diagonále vyskytuje aspoň jedna nulová hodnota a jej determinant jenulový. Na druhej strane, ak µ = ν, det(B) ≠ 0 a ked’že A je Vandermondova matica alokátory chýb X 1 , . . . , X µ sú rôzne, det(A) = det(A ⊤ ) ≠ 0.Získané poznatky využijeme pri návrhu dekódera BCH kódov.Peterson-Gorenstein-Zierlerov dekóder1. Na základe prijatého slova v(x) vypočítaj syndróm S 1 , . . . , S 2t ; S j = v(β j ).2. Nájdi najväčšie prirodzené ν také, že matica M ν je regulárna.3. Vyrieš systém lineárnych rovníc 10.14 a urči koeficienty λ 1 , . . . , λ ν . Zostroj polynómlokátorov chýb Λ(x).4. Nájdi korene polynómu lokátorov chýb Λ(x) (úplným preberaním, alebo faktorizáciou)a urči pozície chýb. Ak je daný BCH kód binárny, tak invertuj bity na pozíciáchurčených lokátormi chýb a skonči, ináč pokračuj krokom 5.5. Vyrieš systém lineárnych rovníc pre hodnoty chýbY 1 X 1 + Y 2 X 2 + . . . + Y ν X ν = S 1Y 1 X 2 1+ Y 2 X 2 2+ . . . + Y ν X 2 ν = S 2(10.16)..Y 1 X ν 1+ Y 2 X ν 2+ . . . + Y ν X ν ν = S νK úplnosti popísanej metódy zostáva ešte ukázat’, že systém (10.16) má jediné riešenie.Lema 7. Ak sú X 1 , . . . , X ν rozličné lokátory chýb, tak potom má systém (10.16) jedinériešenie.DôkazDeterminant sústavy (10.16) sa dá upravit’ na Vandermondov determinant⎡⎤⎡⎤X 1 X 2 . . . X ν1 1 . . . 1X 2 1X 2 2. . . X 2 νdet ⎢⎥⎣ .. ⎦ = (X X 1 X 2 . . . X ν1X 2 . . . X ν ) det ⎢⎥⎣ .. ⎦X ν 1X ν 2. . . X ν νX ν−11X ν−12. . . X ν−1ν

10.4. PETERSON-GORENSTEIN-ZIERLEROV ALGORITMUS DEKÓDOVANIA BCH KÓDOV141Ked’že lokátory chýb sú nenulové a rôzne, determinant sústavy (10.16) je nenulový, ateda sústava (10.16) má riešenie.Ilustrujeme použitie PGZ dekódera na niekol’kých príkladoch.Príklad. Uvažujeme binárny (15,5) BCH kód z predchádzajúceho príkladu. Nech boloodvysielané kódové slovou(x) = 1 + x 3 + x 5 + x 10 + x 11 + x 12 + x 14a pri prenose vznikla chyba e(x) v dôsledku čoho bolo prijaté slovo v(x) = u(x) + e(x).1. Chyba váhy 0. Syndróm chyby jeS 1 = S 2 = S 3 = S 4 = S 5 = S 6 = 0.Ked’že syndróm chyby je rovný nule, predpokladáme, že pri prenose nedošlo kchybe a prijaté kódové slovo je zhodné s odvysielaným.2. Chyba váhy 1; napr. e(x) = x 14 , bolo prijaté slovo v(x) = 1 + x 3 + x 5 + x 10 + x 11 + x 12 .Určíme počet chýb, ν.S 1 = α 14 S 2 = α 13 S 3 = α 12 S 4 = α 11 S 5 = α 10 S 6 = α 9⎡M 3 = ⎣α 14 α 13 α 12 ⎤α 13 α 12 α 11 ⎦ .α 12 α 11 α 10Ale det M 3 = 0. Vytvoríme maticu M 2 a vypočítame determinant tejto matice:[ α14αM 2 =13 ]α 13 α 12 .Ked’že det M 2 = 0 v prijatom slove je najviac jedna chyba. Ale M 1 = α 14 ≠ 0, ateda predpokladáme, že v prijatom slove je chyba váhy 1, S 1 = X 14 , t.j. e(x) = x 14 aodvysielané slovo bolo u(x) = 1 + x 3 + x 5 + x 10 + x 11 + x 12 + x 14 .3. Chyba váhy 2. Chybový polynóm je (napr.) e(x) = x 3 + x 7 ; bolo prijaté slovoSyndróm chyby jeUrčíme počet chýb, ν.v(x) = 1 + x 5 + x 7 + x 10 + x 11 + x 12 + x 14 .S 1 = α 4 S 2 = α 8 S 3 = α 5 S 4 = α S 5 = α 10 S 6 = α 10⎡M 3 = ⎣α 4 α 8 α 5 ⎤α 8 α 5 α ⎦ .α 5 α α 10Ked’že det M 3 = 0, vytvoríme maticu M 2 a vypočítame jej determinant:[ α4αM 2 =8 ]α 8 α 5 ; det M 2 = α 3 ≠ 0.

142 KAPITOLA 10. BOSE-CHANDHURY-HOCQUENGHEMOVE KÓDYV prijatom slove je pravdepodobne chyba váhy 2. Určíme koeficienty polynómulokátorov chýb:[ α4αdet8 ]α 8 α 5λ 2 = [ α5αdet8 ] = α13α 3 = α10 .α α 5Podobne[ α4αdet5 ]α 8 αλ 1 = [ α5αdet8 ] = α7α 3 = α4 .α α 5Vyjadríme polynóm lokátorov chýb a nájdeme jeho korene:Λ(x) = 1 + α 4 x + α 10 x 2 .Korene polynómu Λ(x) sme našli úplným preberaním (a faktorizáciou polynómu);na tomto mieste uvedieme len jeho výsledok:Λ(α 12 ) = 1 + α + α 4 = 0, Λ(α 8 ) = 1 + α 12 + α 4 11 = 0;t.j. hl’adané korene sú α 12 , α 8 a chyby vznikli na pozíciách 3 (α 12 = α −3 ) a 7 (α 7 =α −8 ).4. Chyba váhy 3. Predpokladajme kvôli jednoduchosti, že e(x) = x 5 + x 10 + x 13 a boloprijaté slovov(x) = 1 + x 3 + x 11 + x 12 + x 13 + x 14 .Syndróm chyby jeS 1 = α 6 S 2 = α 12 S 3 = α 9 S 4 = α 9 S 5 = α 10 S 6 = α 3 .Ked’že det M 3 = 1, predpokladáme, že počas prenosu vznikla chyba váhy 3. Vypočítamekoeficienty polynómu lokátorov chýb a zostavíme Λ(x):Λ(x) = 1 + α 6 x + α 6 x 2 + α 13 x 3 .Koreňmi polynómu Λ(x) sú α 10 , α 5 , α 2 , ktoré určujú polynóm chýb e(x) = x 5 + x 10 +x 13 . Odčítame chybový polynóm od prijatého slova a dostaneme kódové slovo, oktorom predpokladáme, že sa zhoduje s odvysielaným kódovým slovom.Na záver uvedieme ešte príklad konštrukcie a dekódovania ternárneho BCH kódu.Príklad. 4 Skonštruujeme ternárny BCH kód dĺžky 26 opravujúci tri chyby. Najprvzostrojíme pole GF(3 3 ) tak,že faktorizujeme okruh polynómov nad pol’om GF(3) ireducibilnýmpolynómom tretieho stupňa x 3 + 2x + 1. Tento polynóm je zároveň primitívnympolynómom a jeho koreň, ktorý označíme symbolom α, je primitívnym prvkom pol’aGF(3 3 ) = GF(3)[x]/x 3 + 2x + 1. Na získanie lepšej predstavy o poli GF(3 3 ) vyjadrímevšetky jeho nenulové prvky pomocou mocnín primitívneho prvku, lídra triedy rozkladu

10.4. PETERSON-GORENSTEIN-ZIERLEROV ALGORITMUS DEKÓDOVANIA BCH KÓDOV1430 0 0 000α 0 1 1 001α 1 x α 010α 2 x 2 α 2 100α 3 x +2 α +2 012α 4 x 2 +2x α 2 +2α 120α 5 2x 2 +x +2 2α 2 +α +2 212α 6 x 2 +x +1 α 2 +α +1 111α 7 x 2 +2x +2 α 2 +2α +2 122α 8 2x 2 +2 2α 2 +2 202α 9 +x +1 +α +1 011α 10 x 2 +x α 2 +α 110α 11 x 2 +x +2 α 2 +α +2 112α 12 x 2 +2 α 2 +2 102α 13 2 2 002α 14 2x 2α 020α 15 2x 2 2α 2 200α 16 2x +1 2α +1 021α 17 2x 2 +x 2α 2 +α 210α 18 x 2 +2x +1 α 2 +2α +1 121α 19 2x 2 +2x +2 2α 2 +2α +2 222α 20 2x 2 +x +1 2α 2 +α +1 211α 21 x 2 +1 α 2 +1 101α 22 2x +2 2α +2 022α 23 2x 2 +x 2α 2 +α 210α 24 2x 2 +2x +2 1α 2 +2α +1 221α 25 2x 2 +2 1α 2 +1 201α 26 1 1 001Tabul’ka 10.1: Pole GF(3 3 ).

144 KAPITOLA 10. BOSE-CHANDHURY-HOCQUENGHEMOVE KÓDYfaktorového okruhu-pol’a GF(3)[x]/x 3 + 2x + 1, lineárnej kombinácie mocnín primitívnehoprvku a vektora koeficientov tejto lineárnej kombinácie. (Vo výpočtoch budeme všakvyužívat’ prvú a poslednú reprezentáciu prvkov pol’a.)Nájdeme vhodný generujúci polynóm BCH kódu. V tabul’ke sú uvedené minimálnepolynómy jednotlivých prvkov konečného pol’a GF(3 3 ) (vrátane nulového):0 xα 0 x + 2α 1 α 3 α 9 x 3 + 2x + 1α 2 α 6 α 18 x 3 + x 2 + x + 2α 4 α 12 α 10 x 3 + x 2 + 2α 5 α 15 α 19 x 3 + 2x 2 + x + 1α 7 α 21 α 11 x 3 + x 2 + 2x + 1α 8 α 24 α 20 2x 3 + x 2 + x + 1α 13 x + 1α 14 α 16 α 22 2x 3 + x + 1α 17 α 25 α 23 x 3 + 2x 2 + 1Ked’že kód, ktorý konštruujeme, má opravovat’ 3 chyby, koreňmi generujúceho polynómumusí byt’ postupnost’ šiestich za sebou nasledujúcich mocnín primitívneho prvku α.Nech sú to napríklad prvky α, α 2 , . . . , α 6 . Potom je podl’a definície BCH kódu generujúcimpolynómom kódu polynómg(x) = lcm (m α (x), . . . , m α 6(x)) = (x+2)(x 3 +2x+1)(x 3 +x 2 +x+2)(x 3 +x 2 +2)(x 3 +2x 2 +x+1).Koreňom generujúceho polynómu je však aj prvok α 0 , a teda minimálna vzdialenost’konštruovaného BCH kódu je 8. Kód zadaný generujúcim polynómom g(x) je ternárny(26,13) BCH kód v úzkom zmysle opravujúci chyby do váhy 3 a odhal’ujúci chyby váhy 4.Teraz ukážeme ako vyzerá kódovanie a dekódovanie ternárnej informácie pomocouternárneho (26,13) BCH kódu. Nech je i(x) = x 11 + 2x 10 + 2x 9 + x 8 + x 5 + 2x 4 + 2x 3 + x 2informačný polynóm. Pri systematickom kódovaní najprv vypočítame polynóm r(x):r(x) = (x 11 + 2x 10 + 2x 9 + x 8 + x 5 + 2x 4 + 2x 3 + x 2 ) ∗ x 13 ) mod g(x) == x 24 + 2x 23 + 2x 22 + x 21 + x 18 + 2x 17 + 2x 16 + x 15 mod g(x) == 2x 12 + 2x 11 + x 10 + 2x 9 + 2x 6 + 2x 4 + x 3 + 2x 2 + 1a potom kódové slovo c(x) vyjadríme akoc(x) = i(x) ∗ x 13 − r(x) = x 24 + 2x 23 + 2x 22 + x 21 + x 18 + 2x 17 + 2x 16 + x 15 ++ x 12 + x 11 + 2x 10 + x 9 + x 6 + x 4 + 2x 3 + x 2 + 2Nech pri prenose vznikla chyba váhy 3 zadaná chybovým polynómom e(x) = x 14 +2x 12 +x 9a bol prijatý polynómv(x) = x 24 +2x 23 +2x 22 +x 21 +x 18 +2x 17 +2x 16 +x 15 +2x 14 +x 11 +2x 10 +2x 9 +x 6 +x 4 +2x 3 +x 2 +2.4 Tento príklad je upravenou verziou domácej úlohy, ktorú vypracovala Monika

10.4. PETERSON-GORENSTEIN-ZIERLEROV ALGORITMUS DEKÓDOVANIA BCH KÓDOV145Zistíme či nastala chyba a ak áno, opravime ju.S 1 , . . . S 6 ; S i = v(α i ), i = 1, . . . , 6.Vypočítame hodnoty syndrómuS 1 = α 19 S 2 = α 2 S 3 = α 5S 4 = α 0 S 5 = α 8 S 6 = α 6Teraz zostrojíme maticu M 3 a vypočítame jej determinant:⎡⎤ ⎡S 1 S 2 S 3α 19 α 2 α 5 ⎤det M 3 = det ⎣ S 2 S 3 S 4⎦ = det ⎣ α 2 α 5 α 0 ⎦ = α 11S 3 S 4 S 5 α 5 α 0 α 8Determinant matice M 3 nie je nulový a na základe toho predpokladáme, že pri prenosevznikli tri chyby. Hladáme teraz kubický polynóm lokátorov chybΛ(z) = 1 + λ 1 z + λ 2 z 2 + λ 3 z 3 = (1 − x 1 z)(1 − x 2 z)(1 − x 3 z)Pre hladané koeficienty platí nasledujúca sústava rovníc:S 1 λ 3 + S 2 λ 2 + S 3 λ 1 + S 4 λ 0 = 0S 2 λ 3 + S 3 λ 2 + S 4 λ 1 + S 5 λ 0 = 0S 3 λ 3 + S 4 λ 2 + S 5 λ 1 + S 6 λ 0 = 0resp.α 19 λ 3 + α 2 λ 2 + α 5 λ 1 + α 0 = 0α 2 λ 3 + α 5 λ 2 + α 0 λ 1 + α 8 = 0α 5 λ 3 + α 0 λ 2 + α 8 λ 1 + α 6 = 0Riešením tejto sústavy dostávame:λ 3 = α 22 λ 2 = α 22 λ 1 = α 15 λ 0 = α 0a polynóm lokátorov chýb budeΛ(z) = 1 + α 15 z + α 22 z 2 + α 22 z 3 .Koreňmi polynómu Λ(z) sú prvky α 12 , α 14 , α 17 a teda chyby vznikli pri x 26−12 , x 26−14 , ax 26−17 . Pri binárnom kóde by sme v tomto momente skončili, pretože odhalenie pozíciechyby stačí aj na opravenie tejto chyby. V ternárnom prípade však ešte treba zistit’, akáchyba nastala. Označme si teda Y 1 , Y 2 , Y 3 koeficienty, ktoré boli v chybovom polynómepostupne pri členoch X 1 , X 2 , X 3 . Tieto sú viazané vzt’ahmi, vyjadrenými v nasledujúcejsústave (10.16):α 12 Y 1 + α 14 Y 2 + α 9 Y 3 = α 19α 24 Y 1 + α 2 Y 2 + α 18 Y 3 = α 2α 10 Y 1 + α 16 Y 2 + α 1 Y 3 = α 5Riešením tejto sústavy rovníc je: Y 1 = 2, Y 2 = 2 a Y 3 = 1 a teda chyba, ktorá nastalaje e(x) = X 1 Y 1 + X 2 Y 2 + X 3 Y 3 = 2x 14 + 2x 12 + x 9 .

146 KAPITOLA 10. BOSE-CHANDHURY-HOCQUENGHEMOVE KÓDYPrijatý polynóm v(x) upravíme na kódový polynóm u(x) = v(x) − e(x) a vypočítameinformačný polynóm u(x) div x (26−13) = i(x) = x 11 + 2x 10 + 2x 9 + x 8 + x 5 + 2x 4 + 2x 3 + x 2 .Informačný polynóm i(x) = x 11 + 2x 10 + 2x 9 + x 8 + x 5 + 2x 4 + 2x 3 + x 2 budeme tentorazkódovat’ nesystematicky, vynásobením generujúcim polynómom: c(x) = g(x) · i(x). Vnašom prípade dostávame kódové slovoc(x) = x 24 + 2x 23 + x 22 + 2x 21 + x 20 + 2x 19 + x 17 + x 16 + x 15 + 2x 14 + x 12 ++ 2x 10 + 2x 9 + x 7 + 2x 6 + x 5 + 2x 4 + 2x 2 .Nech pri prenose vznikla chyba e(x) = 2x 7 + x. Potom bolo prijaté slovov(x) = x 24 + 2x 23 + x 22 + 2x 21 + x 20 + 2x 19 + x 17 + x 16 + x 15 + 2x 14 ++ x 12 + 2x 10 + 2x 9 + 2x 6 + x 5 + 2x 4 + 2x 2 + x.Zistíme či v prijatom slove nastala chyba. Syndróm chyby slova v(x) jeS 1 = α 24 , S 2 = α 10 , S 3 = α 20 , S 4 = α 14 , S 5 = α 25 , S 6 = α 4 .Ked’že syndróm je nenulový, prijaté slovo je zat’ažené nejakou chybou. Určíme váhuchyby, ν. Zostavíme maticu M 3 a vypočítame jej determinant:⎡det M 3 = det ⎣α 24 α 10 α 20 ⎤α 10 α 20 α 14 ⎦ = 0.α 20 α 14 α 25Yo znamená, že váha chyby je menšia než 3. Zostavíme teda maticu M 2 a vypočítame jejdeterminant:[ α24αdet M 2 ==10 ]α 10 α 20 = α 17 ≠ 0.Z toho, že je matica M 3 singulárna a matica M 2 regulárna, vyplýva, že pri prenosevznikli pravdepodobne dve chyby. Na ich určenie potrebujeme zostrojit’ polynóm lokátorovchýbRiešením sústavy rovnícurčíme koeficienty polynómu Λ(x)Λ(x) = 1 + λ 1 x + λ 2 x 2 .α 24 λ 2 + α 10 λ 1 + α 20 = 0α 10 λ 2 + α 20 λ 1 + α 14 = 0λ 2 = α 8 , λ 1 = α 25 , λ 0 = 1.Dostávame polynómλ(x) = 1 + α 25 x + α 8 x 2

10.5. INÉ METÓDY DEKÓDOVANIA BCH KÓDOV 147ktorého korene sú X 1 = α 1 a X 2 = α 7 .Potrebujeme už len zistit’ aké chyby nastali. Znova budeme riešit’ sústavu rovníc(10.16)α 1 Y 1 + α 7 Y 2 = α 24α 7 Y 1 + α 14 Y 2 = α 10Riešením tejto sústavy rovníc je Y 1 = 1 a Y 2 = 2. Chybový polynóm je e(x) = 2x 7 +1x a kódové slovo c(x) = v(x) − e(x). Nakoniec určíme informačné slovo. Kedže bolopoužité nesystematické kódovanie informačné slovo (polynóm) dostaneme vynásobenímkódového slova c(x) kontrolným polynómom h(x). V našom prípade h(x) = x 13 + x 11 +x 9 + 2x 7 + 2x 6 + x 2 + 2x + 1 a informačný polynóm jeh(x)u(x) = x 11 + 2x 10 + 2x 9 + x 8 + x 5 + 2x 4 + 2x 3 + x 2 .10.5 Iné metódy dekódovania BCH kódovVýpočtovo najnáročnejšou čast’ou Peterson-Gorenstein-Zierlerovho algoritmu je riešeniesústavy lineárnych rovníc 10.14. Ak túto sústavu riešime výpočtom inverznej maticesyndrómov, zložitost’ výpočtu je O(ν 3 ), čo pre vel’ké hodnoty ν môže byt’ príliš vel’a.Všimnime si však štruktúru matice syndrómov zo sústavy 10.14. Nech S 1 , S 2 , . . . , S 2νje postupnost’ hodnôt syndrómov aΛ(x) = 1 + λ 1 x + λ 2 x 2 + · · · + λ ν x νje polynóm lokátorov chýb. Riadky matice syndrómov tvoria súvislé podpostupnostidĺžky ν postupnosti hodnôt syndrómu: prvý riadok matice syndrómov tvorí podpostupnost’S 1 , . . . , S ν , druhý podpostupnost’ S 2 , . . . , S ν+1 , až napokon posledný riadok maticesyndrómov tvorí podpostupnost’ S ν , . . . , S 2ν−1 . Naviac, hodnoty S ν+1 , . . . , S 2ν možno vyjadrit’pomocou predchádzajúcich ν hodnôt syndrómu jednotným spôsobom:S j = −ν∑λ i S j−i ; j = ν + 1, . . . , 2ν. (10.17)i=1Berlekamp využil štruktúru matice syndrómov a navrhol efektívny algoritmus na riešeniesústavy 10.14. Massey preformuloval pôvodné Berlekampove riešenie do zrozumitel’nejšejpodoby, v ktorej ho budeme prezentovat’ aj my. Budeme postupovat’ nasledovne:najprv uvedieme princíp algoritmu, potom ilustrujeme na príklade aké problémyalgoritmus rieši. Napokon popíšeme algoritmus formálne a dokážeme jeho korektnost’ aoptimálnost’.Ak zrušíme obmedzenie na j, rekurentný vzt’ah 10.17 popisuje nekonečnú postupnost’S 1 , S 2 , . . . generovanú posuvným registrom s lineárnou spätnou väzbou (linear feedbackshift register, LFSR), ktorá je zadaná polynómom lokátorov chýb Λ(x), obr. 10.1 Na to,aby sme určili polynóm lokátorov chýb Λ(x), potrebujeme nájst’ najkratší LFSR, ktorýgeneruje postupnost’ S 1 , S 2 , . . . , S 2ν .

148 KAPITOLA 10. BOSE-CHANDHURY-HOCQUENGHEMOVE KÓDY✓✏ ✓✏✛ + ✛ + ✛✒✑✤✜✻✒✑✤✜✻−λ 1 −λ 2✣✢ ✣✢✻ ✻❄✲ S j−1 S j−2✓✏✛ + ✛✒✑✤✜✻✻✤✜−λ ν−1 −λ ν✣✢ ✣✢✻ ✻S j−ν+1S j−ν ✲ S j−ν−1 . . . S 2 S 1Obrázok 10.1: LFSR so spätnou väzbou zadanou Λ(x)✲ 0 ✲ Λ (1) (x) = 1 + xObrázok 10.2: LFSR R (1)Podstata Barlekamp-Masseyovho algoritmu spočíva v iteratívnej konštrukcii registra(LFSR) generujúceho postupnost’ hodnôt syndrómov S 1 , S 2 , . . . , S 2ν ; S j ∈ GF(q). Ak súznáme registre R (j) generujúce počiatočné podpostupnosti S 1 , S 2 , . . . , S j ; j = 1, . . . ,r − 1,tak register R (r) generujúci podpostupnost’ S 1 , S 2 , . . . , S r−1 , S r sa bud’ zhoduje s registromR (r−1) , alebo sa dá zostrojit’ úpravou registra R (r−1) pomocou niektorého z predchádzajúcichregistrov. Modifikácia registra R (r−1) musí zaručit’, aby nový register, R(r)spĺňalnasledujúce dve požiadavky:1. aby správne generoval prvých r členov postupnosti,2. aby sa dĺžka registra R(r) zväčšila oproti registru R (r−1) minimálne.Tento postup budeme opakovat’ dovtedy, kým nezostrojíme register R (2ν) minimálnejdĺžky, ktorý generuje postupnost’ S 1, S 2 , . . . , S 2ν .Skôr ako formálne popíšeme Berlekamp-Masseyov algoritmus a dokážeme jeho korektnost’,ilustrujeme jeho činnost’ na príklade. Kvôli jednoduchosti budeme pracovat’ spol’om GF(2).Príklad. Nech je daná postupnost’ 0, 0, 1, 0, 1, 1, 0, 1, 0, 1. Nájdeme register R (10) , ktorýju bude generovat’. Register R(1)dĺžky 1 so spätnou väzbou 1 + x a počiatočným stavom0, obr. 10.2 generuje postupnost’ {0} k≥1 . (Ten istý register by z počiatočného stavu 1generoval postupnost’ {1} k≥1 .) To znamená, že R (1) generuje správne prvé dva členy postupnosti,ale chybne generuje tretí (R (2) = R (1) ). Musíme zväčšit’ dĺžku registra R(2) aprípadne modifikovat’ jeho spätnú väzbu tak, aby sme zostrojili register R (3) . Najprvukážeme, že žiaden register dĺžky 2 nemôže generovat’ podpostupnopst’ 001. Predpokladajmeopak. Nech je R LFSR dĺžky 2 so spätnou väzbou Λ(x) = 1 + λ 1x + λ 2 x 2 . Aby

10.5. INÉ METÓDY DEKÓDOVANIA BCH KÓDOV 149R správne generoval prvé dva členy postupnosti, jeho počiatočný stav musí byt’ 00, alepotom tretí prvok postupnosti má hodnotu 0λ 1 + 0λ 2 a to je pri l’ubovol’nom výbere hodnôtλ 1 , λ 2 vždy 0. To znamená, že register R (3) musí mat’ dĺžku aspoň 3 a na to, abyúspešne generoval postupnost’ 0, 0, 1, musí mat’ počiatočný stav (zapísané sprava dol’ava)100. Spätná väzba v prvých troch taktoch neovplyvní výstup registra R (3) , a teda prel’ubovol’ný polynóm spätnej väzbyΛ(x) = 1 + λ 1 x + λ 2 x 2 + λ 3 x 3bude register R (3) s počiatočným stavom 100 generovat’ postupnost’ 001. 5 Vyberieme R (3)so spätnou väzbou zadanou plynómom 1 + x 3 . Tento register bude správne generovat’aj štvrtý prvok postupnosti, 0, ale v piatom takte dôjde ku chybe a je potrebná korekciaspätnej väzby a možno aj predĺženie registra. Ukážeme, čo znamená modifikácia spätnejväzby registra. Register R (3) , obr. 10.3 generuje postupnost’ 0, 0, 1, 0, 0, 1, 0, 0, 1, ....Jedným z možných riešení je predĺžit’ register na dĺžku 5 a nastavit’ ako jeho počiatočný✲✲1 0 0 0, 0, 1, 0, 0, . . .Obrázok 10.3: LFSR R (3)stav postupnost’, ktorú má generovat’. Tento register by (bez ohl’adu na to, ako by smezvolili spätnú väzbu) generoval požadovanú postupnost’. Skúsime teraz nájst’ kratšíregister, generujúci postupnost’ 0, 0, 1, 0, 1. Výstup registra R (4) = R(3)spĺňa nasledujúcirekurentný vzt’ah:S j+3 = S j , j = 1, 2, . . . .V prvých 3 taktoch sa na výstupe registra R (4) objavujú jednotlivé bity jeho počiatočnéhostavu, v 4. takte je výstupom (správna) hodnota, ktorá bola vypočítaná v 1. takte(S 4 = S 1 ), problematická hodnota 0, ktorá sa na výstupe registra objaví v 5. takte,bola vypočítaná v 2. takte. Ak nejako zmeníme spätnú väzbu registra a zachováme jehodĺžku a počiatočný stav, výstup registra v prvých troch taktoch sa nezmení ale môže sazmenit’ aj výstup v 4. a 5. takte (výstup registra v d’alších taktoch nás v tomto momentenezaujíma). K spätnej väzbe registra môžeme pridat’ členy x, x 2 , x 3 alebo nejakúich kombináciu. Potrebujeme dosiahnut’, aby príspevok pridaných členov spätnej väzbybol v prvých 2 taktoch 0, 1. Pozrieme sa na to, aké hodnoty budú generovat’ možné členyspätnej väzby v prvých 2 taktoch, ak bol počiatočný stav registra R (4) 001.x 1, 0x 2 0, 1x 3 0, 0Požadovanú postupnost’ nachádzame v druhom riadku; ak pridáme do polynómu spätnejväzby člen x 2 , hodnota generovaná spätnou väzbou v prvých dvoch taktoch bude S 1 +S 2 , S 2 +S 3 , resp. 0, 1 čo zabezpečí správne generovanie 4. a 5. člena postupnosti. Výslednýregister R (5) je na obrázku 10.4. Register R (5) správne generuje aj 6. prvok postupnosti,5 Ešte raz pripomenieme, že stav registra sa zapisuje sprava dol’ava a postupnost’ ktorú generuje vopačnom poradí, t.j. zl’ava doprava.

150 KAPITOLA 10. BOSE-CHANDHURY-HOCQUENGHEMOVE KÓDY✓✏+✒✑✲1 0 0✲0, 0, 1, 0, 1, 1, 1, . . .Obrázok 10.4: LFSR R (5)ale chyba nastáva v 7. takte. Opät’ je potrebná korekcia spätnej väzby. Problém však jev tom, že žiaden LFSR dĺžky 3 postupnost’ 0010110 nedokáže generovat’. Ak by existovalregister R dĺžky 3 s polynómom spätnej väzbyΛ(x) = 1 + λ 1 x + λ 2 x 2 + λ 3 x 3a počiatočným stavom 1, 0, 0 a generoval správne 4., 5., 6. a 7, prvok postupnosti, jehospätná väzba by musela spĺňat’ nasledujúce podmienkyλ 1 = 0,λ 2 = 1,λ 1 + λ 3 = 1,λ 1 + λ 2 = 0Z prvej, druhej a štvrtej podmienky vyplýva spor. Skúsme teraz predĺžit’ register o 1;nech je R LFSR dĺžky 4, so spätnou väzbou 1 + x2 + x 3 a počiatočným stavom 0100.Register R generuje postupnost’ 0, 0, 1, 0, 1, 1, 1, . . . ; chyba, ktorá sa objavila na výstupev 7. takte vznikla v 3. takte. Aby sme ju opravili, potrebujeme k spätnej väzbe pridat’členy, ktoré by z počiatočného stavu 0100 generovali postupnost’ 0, 0, 1. V nasledujúcejtabul’ke sú uvedené postupnosti generované potenciálnymi členmi spätnej väzby:x 0, 1, 1x 2 1, 0, 1x 3 0, 1, 0x 4 0, 0, 1Do úvahy prichádza bud’ člen x 4 , alebo kombinácia x + x 3 + x 4 - obe riešenia zabezpečujúkorekciu 7. generovaného prvku postupnosti. Vyberieme „opticky“ jednoduchšie riešeniea ako polynóm spätnej väzby registra R (5) vyberieme Λ(x) = 1 + x 2 + x 3 + x 4 , obr. 10.5.✓✏ ✓✏+ +✒✑ ✒✑✻✻ ✻✲0 1 0 0✲ 0, 0, 1, 0, 1, 1, 0 . . .Obrázok 10.5: LFSR R (7)Register R (7) sa v 8. takte dopúšt’a chyby. Chybná hodnota bola vytvorená v 4. takte.Do spätnej väzby registra R (7) potrebujeme doplnit’ členy, ktoré by z počiatočného

10.5. INÉ METÓDY DEKÓDOVANIA BCH KÓDOV 151stavu 0100 generovali postupnost’ 0, 0, 0, 1. Príspevky potenciálnych prvkov spätnej väzbyuvádzame v nasledujúcej tabul’kex 0, 1, 1, 0x 2 1, 0, 1, 1x 3 0, 1, 0, 1x 4 0, 0, 1, 0Požadovanú korekciu 0, 0, 0, 1 generuje kombinácia x + x 3 + x 4 . Register R (8) má dĺžku4, spätnú väzbu Λ(x) = 1 + x + x 2 a z počiatočného stavu 0100 generuje postupnost’0, 0, 1, 0, 1, 1, 0, 1. Chyba však nastáva už v nasledujúcom 9. takte. Žiaden register dĺžky4 nebude generovat’ postupnost’ 0, 0, 1, 0, 1, 1, 0, 1, 0. Zoberieme register R dĺžky 5 so spätnouväzbou Λ(x) = 1+x+x 2 , ktorý bude z počiatočného stavu 10100 generovat’ postupnost’0, 0, 1, 0, 1, 1, 0, 1, 1. Hodnota, ktorá sa na výstupe registra R objavila v 9. takte, bola generovanáv 4. takte. Na jej korigovanie potrebujeme do spätnej väzby pridat’ členy, ktoréby generovali postupnost’ 0, 0, 0, 1. Pomocou nasledujúcej tabul’kyx 1, 1, 0, 1x 2 0, 1, 1, 0x 3 1, 0, 1, 1x 4 0, 1, 0, 1x 5 0, 0, 1, 0nájdeme potrebnú korekciu: x 2 + x 4 + x 5 . Register R(9)dĺžky 5 so spätnou väzbouΛ(x) = 1 + x + x 4 + x 5 generuje prvých 9 prvkov postupnosti, ale chyba nastáva v poslednom,10 prvku postupnosti. Chybná hodnota bola vytvorená v 5. kroku, a to znamená,že potrebujeme korigovat’ spätnú väzbu registra R (9) tak, aby korekcia generovala postupnost’0, 0, 0, 0, 1. Z tabul’kyx 1, 1, 0, 1, 0x 2 0, 1, 1, 0, 1x 3 1, 0, 1, 1, 0x 4 0, 1, 0, 1, 1x 5 0, 0, 1, 0, 1vyplýva, že požadovaná korekcia pozostáva z členov x + x 2 + x 3 . Register (obr. 10.6) ämá dĺžku 5, spätnú väzbu Λ(x) = 1 + x + x2 + x 3 + x 4 + x 5 a z počiatočného stavu 10100generuje postupnost’ 0, 0, 1, 0, 1, 1, 0, 1, 0, 1.✓✏ ✓✏ ✓✏ ✓✏+ + + +✒✑ ✒✑ ✒✑ ✒✑✻✻ ✻ ✻ ✻✲1 0 1 0 0✲ . . . 1010110100Obrázok 10.6: LFSR R (10)Ako sme videli v predchádzajúcom príklade, najväčším problémom pri konštrukciiregistra bolo jednak rozhodnút’, či je potrebné a ak, tak o kol’ko predĺžit’ register a

152 KAPITOLA 10. BOSE-CHANDHURY-HOCQUENGHEMOVE KÓDYnájst’ vhodnú modifikáciu spätnej väzby. V príklade sme tento problém zakaždým nejakovyriešili, ale jednak to nebolo systematické riešenie a jednak sme nemali záruku,či získané riešenie (LFSR) bolo optimálne. Berlekamp-Masseyov algoritmus umožňujejednoznačne stanovit’ či treba, a ak áno, tak ako je potrebné v jednotlivých taktoch modifikovat’aktuálnu spätnú väzbu registra, aby sme našli optimálne riešenie. Zavediemeniekol’ko formálnych označení a popíšeme kl’účový krok Berlekamp-Masseyovho algoritmupresnejšie. LFSR R dĺžky L so spätnou väzbou zadanou polynómom Λ(x) budemeoznačovat’ R : (L, Λ(x)) a skutočnot’, že LFSR R generuje postupnost’ S 1 , . . . S k označímeR : (L, Λ(x)) gen↔ S 1 , . . . , S k Nech je daná postupnost’ S 1 , . . . prvkov pol’a GF(q). Predpokladáme,že pre k = 1, . . . , r − 1 sú už známe registre (LFSR)R (1) : (L 1 , Λ (1) (x))R (2) : (L 2 , Λ (2) (x))R (r−1) : (L r−1 , Λ (r−1) (x))gen↔ S 1gen↔ S 1 , S 2. . .gen↔S 1 , S 2 , . . . S r−1a pomocou nich zostrojíme registerR (r) : (L r , Λ (r) (x)) gen↔ S 1 , S 2 , . . . , S r .Necháme najprv register R (r−1) vypočítat’ ešte jeden (r-tý) prvok. Jeho hodnota bude∑r−1S ′ r = − λ (r−1)iS r−i .i=1Teraz porovnáme vypočítanú hodnotu S ′ r so skutočnou hodnotou S r . Rozdiel medzi týmitohodnotami označíme symbolom ∆ r :∑r−1∆ r = S r − S ′ r = S r +i=1λ (r−1) ∑r−1iS r−i =i=0λ (r−1)iS r−i ,pri poslednej úprave sme využili to, že λ 0 = 1. Ak ∆ r = 0, register R (r−1) správne generovalaj r-tý prvok postupnosti, a tedaR (r) = R (r−1) : (L r−1 , Λ (r−1) (x)) gen↔ S 1 , S 2 , . . . S r .Ak ∆ r ≠ 0, musíme spravit’ korekciu spätnej väzby registra R (r−1) a prípadne zväčšit’jeho dĺžku. Nová spätná väzba je zadaná polynómomΛ (r) (x)) = Λ (r−1) (x)) + A · x l · Λ (m−1) (x)). (10.18)V definícii polynómu Λ (r) (x)) v (10.18) vystupuje niekol’ko záhadných parametrov, ktorýchvýznam a hodnoty zakrátko určíme. Zatial’ prezradíme, že A ∈ GF(q), l je prirodzené

10.5. INÉ METÓDY DEKÓDOVANIA BCH KÓDOV 153číslo a Λ (m−1) (x)) je jeden z polynómov spätnej väzby, ktorý bol zostrojený pri predchádzajúcichiteráciách. Vypočítame rozdiel medzi hodnotou S r a hodnotou r-tého prvkugenerovaného registrom so spätnou väzbou zadanou polynómom (10.18):∑r−1∑r−1∑r−1∆ ′ r = λ (r) S r−i = λ (r−1) S r−i + A · λ (m−1) S r−i−l (10.19)i=0i=0Teraz potrebuje zvolit’ parametre m, A, l tak, aby ∆ ′ r = 0. Vyberieme m < r také, že∆ m ≠ 0. Položíme l = r − m a nakoniec A = −∆ r /∆ m . Upravíme 10.19 a dostávame∆ ′ r = ∆ r − ∆ r∆ m· ∆ m = 0.Zostrojený register R (r) : (L r , Λ (r) (x)) je teda generátorom postupnosti S 1 , S 2 , . . . , S r . Ostalaešte otvorená jedna otázka, a to výber m, na ktorý sme zatial’ nekládli žiadne podmienky.Ako dokážeme neskôr, ak vyberieme najväčšie m také, že r > m a L m > L m−1 ,dostávame generátor R (r) minimálnej dĺžky.Teraz, ked’ už máme dostatočnú predstavu o činnosti Berlekamp-Masseyovho algoritmu,môžeme ho popísat’ formálne a dokázat’ jeho korektnost’ a optimálnost’. Formuláciavety a jej dôkazu je s malými modifikáciami prebratá z [2].Veta 10.5.1. (Berlekamp-Massey) Nech je daná postupnost’ S 1 , . . . , S 2t prvkov pol’a GF(q),nech pre počiatočné podmienky λ (0) (x) = 1, B (0) (x) = 1 a L 0 = 0 pre r = 1, . . . , 2t∆ r =i=0i=0∑r−1λ (r−1)iS r−i ; (10.20)L r = δ r (r − L r−1 ) + (1 − δ r )L r−1 ; (10.21)Λ (r) (x) = Λ (r−1) (x) − ∆ r · x · B (r−1) (x); (10.22)B (r) (x) = ∆ −1r · δ r · Λ (r−1) (x) + (1 − δ r ) · x · B (r−1) (x); (10.23)pričomδ r ={1 ak ∆ r ≠ 0&2L r−1 ≤ r − 1,0 ináč.Potom Λ (2t) (x) je polynóm minimálneho stupňa, ktorého koeficienty spĺňajú nasledujúcepodmienkyλ (2t)∑r−10= 1, S r + λ (2t)iS r−i , r = L 2t + 1, . . . , 2t.i=1Formulácia vety je na prvý pohl’ad zložitá. V podstate však ide o iteratívnu konštrukciupolynómu spätnej väzby generátora postupnosti S 1 , . . . , S 2t popísanú vzt’ahom 10.18.Veličina δ r indikuje, kedy dochádza k predĺženiu registra a zložito vyzerajúci polynómB (r) (x) vyjadruje aktuálnu korekciu polynómu spätnej väzby (ak je korekcia potrebná).Pripomíname, že ∆ r = 0 len v tom prípade, ked’ δ r = 0. To nám umožňuje definovat’hodnotu δ r /∆ r = 0 v prípade, ked’ δ r = 0.

154 KAPITOLA 10. BOSE-CHANDHURY-HOCQUENGHEMOVE KÓDYSamotný dôkaz vety rozdelíme na dôkazy dvoch pomocných tvrdení. V prvej lemeodhadneme zdola dĺžku L r registra R (r) pomocou dĺžky L r−1 jeho bezprostredného predchodcu,registra R (r−1) . V druhej leme zostrojíme pomocou Berlekamp-Masseyovho algoritmugenerátor postupnosti S 1 , . . . , S r , a dokážeme, že jeho dĺžka L r bude dosahovat’dolný odhad z prvej lemy, čím zavŕšime dôkaz optimálnosti Berlekamp-Masseyovho algoritmu.Lema 8. Nech R (r−1) : (L r−1 , Λ (r−1) (x)) je LFSR minimálnej dĺžky, ktorý generuje postupnost’S 1 , . . . , S r−1 a nech R (r) : (L r , Λ (r) (x)) je LFSR minimálnej dĺžky, ktorý generujepostupnost’ S 1 , . . . , S r , pričom Λ (r−1) (x)) ≠ Λ (r) (x)). PotomL r ≥ max (L r−1 , r − L r−1 ) . (10.24)Dôkaz.Musíme dokázat’ dve nerovnosti1. L r ≥ (L r−1 ,2. L r ≥ r − L r−1 .Prvá nerovnost’ je zrejmá, pretože ak register generuje nejakú postupnost’, tak potomgeneruje aj jej počiatočnú podpostupnost’. Ostáva dokázat’ druhú nerovnost’. Ak byL r−1 ≥ r,potom by L r ≥ r − r = 0, čo je triviálne. Preto budeme predpokladat’, žeL r−1 < r.Druhú nerovnost’ teraz dokážeme sporom; budeme predpokladat’, že druhá nerovnost’neplatí; t.j. žeL r < r − L r−1 ,resp.L r ≤ r − 1 − L r−1 .Pozrieme sa teraz na postupnost’ generovanú registrom R (r−1) . Z predpokladov lemyvyplýva, že register R (r−1) generuje prvých r − 1 prvkov postupnostiale negeneruje r-tý:L∑r−1S j = − λ (r−1)iS j−i , j = L r−1 + 1, . . . , r − 1; (10.25)i=1L∑r−1S r ≠ − λ (r−1)iS r−i . (10.26)i=1Register R (r) generuje prvých r členov postupnosti:∑L rS j = − λ (r)iS j−i , j = L r + 1, . . . , r.i=1

10.5. INÉ METÓDY DEKÓDOVANIA BCH KÓDOV 155Vyjadríme S r∑L rS r = − λ (r)iS r−i (10.27)V sume 10.27 vystupujú členy S r−Lr , . . . , S r−1 . Ale podl’a predpokladui=1r − L r ≥ r − (r − 1 − L r−1 ) = L r−1 + 1,a to znamená, že každý z členov S r−Lr , . . . , S r−1 môžeme vyjadrit’ pomocou 10.25. Dostávame∑L rS r = − λ (r)L r Lk S ∑r−k = λ (r) ∑ r−1kλ (r−1)iS r−k−i .k=1Zmeníme poradie sumácie a dostávameS r =L r−1∑i=1λ (r−1)i∑L rk=1k=1i=1Lλ (r)k S ∑ r−1r−k−i = −Dostali sme spor s (10.26), čím je tvrdenie lemy dokázané.i=1λ (r−1)iS r−i .Z predchádzajúcej lemy vyplýva, že ak pri konštrukcii LFSR generujúceho postupnost’S 1 , . . . , S r zostrojíme v r-tom kroku register dĺžky L r = max(L r−1 , r − L r−1 ), r =1, 2, . . . , tak je tento register optimálny. Ostáva dokázat’, že LFSR konštruované pomocouBerlekamp-Masseyovho algoritmu túto podmienku spĺňajú.Lema 9. Nech: (L j , Λ (j) (x)) gen↔ S 1 , S 2 , . . . , S j , j = 1, 2 . . .je postupnost’ registrov generujúcich počiatočné podpostupnosti postupnosti {S k } k≥1 . Akv registri R (r) tejto postupnosti došlo k zmene spätnej väzby v porovnaní s predchádzajúcimregistrom;Λ (r) (x) ≠ Λ (r−1) (x),tak pre dĺžku registra R(r) platíL r = max(L r−1 , r − L r−1 )a l’ubovol’ný LFSR dĺžky L r generujúci postupnost’ S 1 , S 2 , . . . , S r je registrom-generátoromminimálnej dĺžky.LFSR R (r) zostrojený podl’a Berlekamp-Masseyovho algoritmu je generátorom minimálnejdĺžky postupnosti S 1, S 2 , . . . , S r .Dôkaz. Z predchádzajúcej lemy vyplýva, že dĺžka registra R(r) nemôže byt’ menšia nežmax(L r−1 , r − L r−1 ). Ak sa preto podarí ukázat’, že L r = max(L r−1 , r − L r−1 ), bude toznamenat’, že register R (r) je generátorom (postupnosti S 1 , S 2 , . . . , S r ) minimálnej dĺžky.Ukážeme, že pre r = 1, 2, . . . sa dá zostrojit’ generátor minimálnej dĺžky. Dôkaz budemeviest’ matematickou indukciou vzhl’adom na dĺžku generovanej postupnosti.Pre k = 1 tvrdenie platí, lebo L 0 = 0, L 1 = 1.

156 KAPITOLA 10. BOSE-CHANDHURY-HOCQUENGHEMOVE KÓDYPredpokladajme, že pre k = 1, . . . , r − 1 sú už zostrojené registreR (k) : (L k , Λ (jk) (x)) gen↔ S 1 , S 2 , . . . , S ka zakaždým, ked’ došlo k zmene spätnej väzby; t.j. ak Λ (k) (x) ≠ Λ (k−1) (x) platíL∑r−1S j +i=1Lλ (r−1) ∑ r−1iS j−i =L k = max(L k−1 , k − L k−1 ).Teraz vyjadríme rozdiel medzi hodnotami, ktoré generuje register R (r−1) v jednotlivýchtaktoch a príslušnými členmi postupnosti {S j } j≥1 .{0 j = L r−1 + 1, . . . , r − 1i=0λ (r−1)iS j−i =∆ r j = r.Register R (r−1) správne generuje prvých r − 1 členov postupnosti {S j } j≥1 . Ak ∆ r = 0, takR (r−1) správne generuje aj r-tý člen postupnosti aL∑m−1S j +i=1L r = L r−1 ; Λ (r) = Λ (r−1) .Ak ∆ r =≠ 0 musíme spravit’ korekciu spätnej väzby a zostrojit’ nový register. Poslednázmena dĺžky registra nastala v kroku m. Potom{0 j = L m−1 + 1, . . . , m − 1λ (m−1)iS j−i =∆ m ≠ 0 j = m.Využijeme indukčný predpoklad a vyjadríme L r−1 pomocou L m−1 :Zostrojíme nový polynóm spätnej väzbyL r−1 = L m = max(L m−1 , m − L m−1 ) = m − L m−1 .Džka registra R (r) je L r = deg Λ (r) (x). Ked’žeaΛ (r) (x) = Λ (r−1) (x) − ∆ r∆ m· x r−m Λ (m−1) (x).deg Λ (r−1) (x) ≤ L r−1deg(x r−m Λ (m−1) (x)) ≤ r − m + L m−1 ,pre dĺžku registra R(r) dostávame nasledujúci horný odhadL r ≤ max(L r−1 , r − m + L m−1 ) ≤ max(L r−1 , r − L r−1 ).Ukážeme, že register R (r) generuje postupnost’ S 1 , S 2 , . . . , S r . Vyjadríme rozdiel medzihodnotami generovanými registrom R (r) v jednotlivých taktoch a príslušnými členmi postupnostiS 1 , S 2 , . . . , S r .()⎡⎤∑L rS j − − λ (r)∑L riS j−i = S j + λ (r−1)iS j−i − ∆ L∑m−1r⎣S j−r+m + λ (m−1)∆iS j−r+m−i⎦ =mi=1i=1i=1{0 j = L r−1 + 1, . . . , r − 1=∆ r − ∆ r∆ m · ∆ m = 0 j = r.

10.6. ZVLÁŠTNOSTI DEKÓDOVANIA BINÁRNYCH BCH KÓDOV 157Ked’že register R (r) generuje postupnost’ S 1 , S 2 , . . . , S r , podl’a predchádzajúcej lemyTo znamená, žeL r ≥ max (L r−1 , r − L r−1 ) .L r = max (L r−1 , r − L r−1 )a register R (r) : (L r , Λ (r) (x)) je optimálny LFSR generujúci postupnost’ S 1 , S 2 , . . . , S r ; resp.R (2t) : (L 2t , Λ (2t) (x)) je optimálny LFSR generujúci postupnost’ S 1 , S 2 , . . . , S 2t .Vrátime sa k príkladu zo začiatku paragrafu a zostrojíme LFSR pomocou BerlekampMasseovho algoritmu.Príklad. Nech je daná binárna postupnost’ 0, 0, 1, 0, 1, 1, 0, 1, 0, 1. V tabul’ke 10.2 súuvedené hodnoty parametrov Berlekamp-Masseyovho algoritmu v jednotlivých krokochvýpočtu.r ∆ r δ r L r Λ (r) (x) B (r) (x)0 0 0 0 1 11 0 0 0 1 x2 0 0 0 1 x 23 1 1 3 1 + x 3 14 0 0 3 1 + x 3 x5 1 0 3 1 + x 2 + x 3 x 26 0 0 3 1 + x 2 + x 3 x 37 1 1 4 1 + x 2 + x 3 + x 4 1 + x 2 + x 38 1 0 4 1 + x + x 2 x + x 3 + x 49 1 1 5 1 + x + x 4 + x 5 1 + x 2 + x 310 1 0 5 1 + x 2 + x 3 + x 4 + x 5 x + x 3 + x 4Tabul’ka 10.2: Berlekamp-Massey10.6 Zvláštnosti dekódovania binárnych BCH kódov10.7 Reed-Solomonove kódyŠpeciálnym prípadom BCH kódov sú Reed-Solomonove kódy, ktoré, ako zakrátko ukážeme,sú z istého hl’adiska optimálne.Definícia 10.7.1. Reed-Solomonov kód (RS kód) je primitívny BCH kód dĺžky n = q − 1nad pol’om GF(q).Ked’že RS kódy tvoria podtriedu BCH kódov, RS kód opravujúci t chýb možno zadat’generujúcim polynómom g(x) s koreňmi α j0+1 , α j0+2 , . . . , α j0+2t , kde α je primitívny prvokpol’a GF(q). Kvôli zjednodušeniu položíme j 0 = 0 a nájdeme explicitné vyjadreniegenerujúceho polynómu. Generujúci polynóm BCH kódu je definovaný ako najmenšíspoločný násobok minimálnych polynómov svojich koreňov. Minimálnym polynómom

158 KAPITOLA 10. BOSE-CHANDHURY-HOCQUENGHEMOVE KÓDYprvku α i pol’a GF(q) je polynóm m α i(x) = x − α i nad pol’om GF(q). To však znamená, žegenerujúci polynóm g(x) bude súčinom minimálnych polynómov svojich koreňov:g(x) = (x − α)(x − α 2 ) . . . (x − α 2t ).Určíme opravné schopnosti RS kódu. Konštrukčná vzdialenost’ RS-kódu ako špeciálnehoprípadu BCH kódu je d ≥ 2t + 1. Na druhej strane, g(x) je kódovým slovom a jeho váhaneprevyšuje 2t + 1 (túto hodnotu by polynóm g(x) dosiahol v prípade, ak by boli všetkyjeho koeficienty nenulové). Stupeň generujúceho polynómu cyklického kódu zodpovedápočtu kontrolných symbolov. To znamená, žedeg(g(x)) = 2t = n − k,resp. n − k + 1 = 2t + 1. RS kód je zároveň lineárnym kódom a pre lineárne kódy platíSingeltonova hranica d ≤ n − k + 1. To znamená, že minimálna vzdialenost’ RS kódu jed = n − k + 1. Tým sme dokázali nasledujúcu vetu.Veta 10.7.1. RS kód má minimálnu vzdialenost’ n − k + 1 a je kódom s maximálnou(minimálnou) vzdialenost’ou.Z uvedenej vety vyplýva, že pre dané n, k neexistuje kód, ktorého minimálna vzdialenost’by bola väčšia ako minimálna vzdialenost’ RS kódu. Túto skutočnost’ všaknemožno preceňovat’, pretože často potrebujeme zostrojit’ kód s parametrami n ′ , k ′ prektoré neexistuje RS kód, ale existujú iné, dostatočne dobré samoopravné kódy.RS kódy nie sú binárne, ale ked’ zvolíme q = 2 m , symboly kódovej abecedy možnopriamo nahrádzat’ binárnymi vektormi dĺžky m. Uvedieme niekol’ko príkladov RS kódova potom sa budeme zaoberat’ ich praktickým použitím pri opravovaní zhlukov chýb.Príklad. Začneme krátkym RS kódom. Nech q = 8. Pole GF(2 3 ) zostrojíme faktorizáciouokruhu polynómov GF(2) ireducibilným polynómom x 3 + x + 1. Prvky pol’a GF(2 3 )vyjadrené pomocou mocnín primitívneho prvku α a lineárnych kombinácií mocnín primitívnehoprvku α sú uvedené v nasledujúcej tabul’ke:α i α 2 α 1 α 0 α i α 2 α 1 α 0α 0 0 0 1 α 4 1 1 0α 1 0 1 0 α 5 1 1 1α 2 1 0 0 α 6 1 0 1α 3 0 1 1 α 7 0 0 11. RS kód opravujúci chybu váhy 1 je zadaný generujúcim polynómom s koreňmiα, α 2 ;g(x) = (x − α)(x − α 2 ) = x 2 + α 4 · x + α 3 .2. RS kód opravujúci chybu váhy 2 je zadaný generujúcim polynómom s koreňmiα, α 2 , α 3 , α 4 ;g(x) = (x − α)(x − α 2 )(x − α 3 )(x − α 4 ) = x 4 + α 3 x 3 + x 2 + αx + α 3 .

10.7. REED-SOLOMONOVE KÓDY 159Ked’že generujúci polynóm má stupeň 4, informačný polynóm bude mat’ stupeň 2.Nech i(x) = α 4 x 2 + α 2 x + α 6 . Kódovým polynómom budei(x) · g(x) = x 6 α 4 + x 5 α 6 + x 4 α 2 + x 3 α 5 + x 2 α 5 + xα 4 + α 2 .Ak vyjadríme kódové slovo v tvare vektora a nahradíme prvky pol’a GF(2 3 ) binárnymivektormi dĺžky 3, dostávame binárny vektor dĺžky 21:110 101 100 111 111 110 100.Pozrieme sa ešte na RS kód dĺžky 15 nad pol’om GF(24 ), opravujúci 3 chyby. Tento kódbude zadaný generujúcim polynómom g(x) s koreňmi α, α 2 , . . . , α 6 ;g(x) = (x − α)(x − α 2 )(x − α 3 )(x − α 4 )(x − α 5 )(x − α 6 ).a bude opravovat’ chyby váhy ≤ 3. Pri binárnom zápise kódových slov dostávame zRS 15, 9) kódu (60, 36) kód. Ak by sme RS kód chceli použit’ na kódovanie informácieprenášanej kanálom, na ktorý pôsobí biely šum, binárny zápis kódových slov je skôrnevýhodou. Ak totiž v kódovom slove (dĺžky 60) vznikne chyba váhy 4 alebo väčšej,zmení pravdepodobne viac než 3 hexadecimálne symboly kódového slova, čo prevýšiopravnú schopnost’ daného RS kódu. V mnohých aplikáciách je však predpoklad onezávislosti chýb neopodstatnený: ak dôjde k poškodeniu CD, elektrickému výboju aleboporuche, tieto udalosti ovplyvnia pravdepodobne niekol’ko susedných znakov kódovéhoslova. Takýmto chybám sa hovorí zhluky chýb (burst errors), a RS kódy sa dajú výhodnepoužit’ práve na ochranu informácie prenášanej kanálom, v ktorom dochádza k zhlukomchýb.Definícia 10.7.2. (Cyklickým) zhlukom chýb dĺžky t

160 KAPITOLA 10. BOSE-CHANDHURY-HOCQUENGHEMOVE KÓDY

Kapitola 11Modifikácie samoopravnýchkódovNiekedy sa stane, že nevieme nájst’ dobrý samoopravný kód, ktorý vyhovuje presnenaším potrebám, ale vieme o existencii dobrého samoopravného kódu, ktorého parametresa od nami požadovaných hodnôt vel’mi neodlišujú. Vzniká prirodzená otázka, či saznámy kód nedá upravit’ tak, aby si zachoval svoje dobré vlastnosti a zároveň splnil našepožiadavky. Ako zakrátko uvidíme, metódy umožňujúce transformácie samoopravnýchkódov skutočne existujú. V tejto krátkej kapitole stručne popíšeme šest’ základnéýchmetódy úprav samoopravných kódov. Budeme pracovat’ prevažne s lineárnymi kódmi;nie však preto, že by sa dané metódy nedali použit’ na úpravy nelineárnych kódov, alepreto, že v prípade lineárnych kódov majú modifikácie, ktoré budeme uvádzat’, vel’mijednoduchú interpretáciu. Metódy modifikácie samoopravných kódov možno nájst’ praktickyv l’ubovol’nej monografii venovanej kódovaniu; čitatel’ovi pre podrobnejšie štúdiumproblematiky odporúčame vynikajúco spracovanú kapitolu v [7], resp. prednášky [?], zktorých sme prebrali niektoré príklady.Lineárny kód C má tri základné parametre: dĺžku n, počet informačných symbolov(= dimenzia lineárneho podpriestoru) k a počet kontrolných symbolov n − k. Podstatazákladných metód modifikácie spočíva v tom, že sa jeden z troch uvedených parametrovfixuje a ostatné dva sa menia. Celkovo teda máme 6 základných možností ktoré kvôliprehl’adnosti uvádzame v nasledujúcej tabul’ke (ked’že slovenská terminológia zatial’ neexistuje,budeme sa pridržiavat’ aglického označenia):No. Názov metódy n k n − k1. augmenting zväčšenie - ↑ ↓2. expurgating zmenšenie - ↓ ↑3. extending rozšírenie ↑ - ↑4. puncturing zúženie ↓ - ↓5. lengthening predĺženie ↑ ↑ -6. shortening skrátenie ↓ ↓ -Pripomenieme, že lineárne (n, k) kódy je možné zadat’ generujúcou maticou G typu k × nalebo kontrolnou maticou H typu n − k × n. Vo všeobecnosti sa pri zmenách počtov161

162 KAPITOLA 11. MODIFIKÁCIE SAMOOPRAVNÝCH KÓDOVinformačných a kontrolných symbolov a nemennej dĺžke kódových slov pridávajú alebovynechávajú riadky v generujúcej/kontrolnej matici; pri zmenách dĺžky kódového slovasa pridávajú alebo vynechávajú stĺpce generujúcej/kontrolnej matice. Pozrieme sa terazna jednotlivé metódy modifikácie kódov podrobnejšie.Metódy Lengthening a ShorteningPri predlžovaní a skracovaní kódu sa mení celková dĺžka kódu a počet informačnýchsymbolov, zostáva zachovaný počet kontrolných symbolov. Pri predlžovaní (lengthening)zväčšujeme dĺžku kódu (a počet informačných symbolov) a ku kódu pridávame nové kódovéslová; pri skracovaní (shortening) kódu naopak odstraňujeme informačné symbolya tak z pôvodného kódu odstraňujeme kódové slová.Predlžovanie lineárnych kódov sa robí pridávaním rovnakého počtu riadkov a stĺpcovku generujúcej matici. Štandardný spôsob predlžovania lineárnych kódov spočíva vpridaní nulového stĺpca ku generujúcej matici a následne v doplnení nulového riadka,ktorý však má nenulovú hodnotu v poslednom (pridanom) stĺpci. Skracovanie lineárnehokódu je predstavuje inverzný postup k predlžovaniu kódu. Najprv upravíme generujúcumaticu kódu tak, aby obsahovala jeden riadok, ktorý má nulové hodnoty na všetkých miestachs výnimkou posledného. Odstránením tohto riadku a posledného stĺpca z generujúcejmatice dostaneme generujúcu maticu skráteného kódu. Iná možnost’ skracovania apredlžovania kódu spočíva vo vynechávaní resp. pridávaní vybraných stĺcov kontrolnejmatice.Príklad (skrátenie kódu). Uvažujme Hammingov (15,11) binárny kód zadaný kontrolnoumaticouH =⎡⎢⎣1 0 0 0 1 0 0 1 1 0 1 0 1 1 10 1 0 0 1 1 0 1 0 1 1 1 1 0 00 0 1 0 0 1 1 0 1 0 1 1 1 1 00 0 0 1 0 0 1 1 0 1 0 1 1 1 1⎤⎥⎦ . (11.1)Odstránením stĺpcov 12,13 a 14 dostávame (12,8) kód opravujúci 1 chybu, zadanýkontrolnou maticou⎡⎤1 0 0 0 1 0 0 1 1 0 1 1H ′ = ⎢ 0 1 0 0 1 1 0 1 0 1 1 0⎥⎣ 0 0 1 0 0 1 1 0 1 0 1 0 ⎦ .0 0 0 1 0 0 1 1 0 1 0 1Zostrojený kód má dve prednosti: informačný vektor má dĺžku 8 a ked’že sme z pôvodnejkontrolnej matice odstránili stĺpce maximálnej váhy, zjednodušili sa kontrolné sumy(namiesto pôvodných 8 členov obsahujú teraz 5 a 6 členov). Na druhej strane, početkódových slov klesol z pôvodných 2048 na 256.Príklad (predĺženie kódu). (n − 1, k) Reed-Solomonov kód predĺžime pridaním dvochnových informačných symbolov a zostrojíme Reed-Solomonov kód s parametrami (n +1, k + 2). Aby sme zaistili opravovanie chýb v doplnených symboloch kódových slov, novéinformačné symboly musíme zaradit’ aj do kontrolných súm. To dosiahneme doplnením

163kontrolnej matice o také dva nové stĺpce, aby sme neznížili rang kontrolnej matice:⎡1 α α 2 . . . α n−2 ⎤ ⎡1 0 1 α α 2 . . . α n−2 ⎤1 α 2 α 4 . . . α 2(n−2)H = ⎢⎥⎣ .. ⎦ ⇒ 0 0 1 α 2 α 4 . . . α 2(n−2)⎢⎥⎣ .. ⎦ .1 α 2t α 4t . . . α 2t(n−2) 0 1 1 α 2t α 4t . . . α 2t(n−2)Metódy Augmenting a ExpurgatingPri týchto modifikáciách si kód zachováva nemennú dĺžku kódového slova, ale menísa počet kontrolných a informačných symbolov. Ked’ sa zväčšuje počet informačnýchsymbolov (augmenting), rastie aj počet kódových slov, ale zmenšuje sa počet kontrolnýchsymbolov a môže sa zmenšit’ (a spravidla sa aj zmenšuje) minimálna vzdialenost’ a týmaj opravná schopnost’ kódu. Naopak, pri zväčšovaní počtu kontrolných symbolov (expurgating)v slove sa zmenšuje počet informačných symbolov, klesá počet kódových slov amôže sa zväčšit’ minimálna vzdialenost’ kódu.V prípade lineárneho kódu sa metódy Augmenting a Expurgating realizujú jednoducho:ak chceme kód zväčšit’, pridáme do generujúcej matice nový riadok (často sa pridávajednotkový riadok); ak potrebujeme kód zmenšit’, z generujúcej matice odstraňujemeriadky, resp. pridávame riadky do kontrolnej matice kódu. Metódu Augmenting smepoužili pri konštrukcii Reed-Mullerových kódov; ku generujúcej matici kódu R(r − 1, m)sme pridali maticu G r a dostali generujúcu maticu kódu R(r, m):⎡ ⎤⎡ ⎤ GG 00G 1G 1G = ⎢ ⎥⎣ . ⎦ ⇒ ⎢ ..⎥⎣ GG r−1⎦r−1G rPôvodný R(r − 1, m) kód mal dĺžku 2m a mal ∑ ( m)0≤j

164 KAPITOLA 11. MODIFIKÁCIE SAMOOPRAVNÝCH KÓDOVDôležitá metóda zmenšenia kódu sa zakladá na výbere podmnožiny kódovej abecedya vylúčení všetkých slov pôvodného kódu, ktoré obsahujú aj iné symboly. Presnejšie,nech je dané konečné pole F a nech je C kód nad pol’om F. Nech je G podpole pol’a F. Podkódomkódu C nad podpol’om G nazveme množinu kódových slov kódu C, ktorých všetkyzložky patria do podpol’a G. Takýto podkód „zdedil“ mnohé dobré vlastnosti pôvodnéhokódu a mohol nadobudnút’ aj d’alšie dobré vlastnosti. Túto metódu sme využilipri konštrukcii Reed-Solomonových kódov.Metódy Extending a PuncturingV obidvoch prípadoch si kód zachováva počet informačných symbolov (a zároveň ajpočet kódových slov). Mení sa dĺžka kódového slova a počet kontrolných symbolov.Ked’ sa kód rozširuje (extension), pridávajú sa nové kontrolné symboly. Pri redukciisa naopak počet kontrolných symbolov v kódových slovách zmenšuje. Pri znižovaní počtukontrolných symbolov môže dôjst’ k zníženiu minimálnej vzdialenosti a pri pridávaníkontrolných symbolov sa minimálna vzdialenost’ kódu môže zväčšit’. Rozšírenielineárneho kódu sa dá realizovat’ doplnením nového stĺpca generujúcej matice, naopakredukcia lineárneho kódu sa realizuje odstránením stĺpca generujúcej matice. Lineárny(n,k)-kód C možno rozšírit’ tak, že sa ku každému kódovému slovu v = (v 1 , . . . , v n ) pridánový kontrolný symbol v n+1 , ktorý je lineárnou kombináciou symbolov pôvodného slova;v n+1 = a 1 v 1 + a 2 v 2 + · · · + a n v n .Vektor a 1 , . . . , a n by nemal patrit’ do duálneho kódu C ⊥ , pretože v tom prípade by v n+1 =0. Požiadavky na výber vektora a sa analyzujú v [7], my sa nimi zaoberat’ nebudeme.Pri rozširovaní lineárnych kódov sa najčastejšie ku kódovým slovám pridáva paritnýsymbol; t.j. kódové slovo v = (v − 1, . . . , v n , v n+1 ) potom spĺňa nasledujúcu rovnost’n+1∑v 1 = 0.i=1(V tomto prípade vektor a = (−1, . . . , −1).)

Kapitola 12Prínos kódovaniaKed’ na prenos správ použávame komunikačný kanál na ktorý vplýva nejaký zdroj šumu,hrozí že šum modifikuje prenášanú správu do takej miery, že príjemca nebude schopnýzrekonštruovat’ pôvodne odvysielanú správu. Existujú principiálne dva spôsoby, akoeliminovat’ alebo aspoň znížit’ riziko modifikácie, ktoré by spôsobilo nesprávnu interpretáciuprijatej správy;• zvýšenie odolnosti signálov voči šumu a• použitie samoopravných kódov.Doteraz sme sa zaoberali takmer výlučne riešeniami založenými na použití samoopravnýchkódov. Sú však situácie, kedy samoopravný kód nedokáže zaistit’ potrebnú úroveň spol’ahlivostikomunikácie, inokedy je jednoduchšie zvýšit’ robustnost’ vysielaného signálu (napríkladzvýšit’ hlasitost’ vysielania v hlučnom prostredí) alebo je výhodné kombinovat’ technické(použitie robustnejších signálov na prenos správ) a matematické riešenie (samoopravnýkód). Predpokladajme, že našou úlohou je pre daný komunikačný systém nájst’ optimálneriešenie, ktoré by zaistilo požadovanú úroveň bezpečnosti komunikácie (vyjadrenúnapríklad pravdepodobnost’ou nesprávneho dekódovania alebo interpretácie prijatéhoslova), pričom máme možnost’ ovplyvňovat’ robustnost’ signálov prostredníctvomzmien výkonu vysielača a použit’ nejaký samoopravný kód. Aby sme dokázali posúdit’príspevok použitia samoopravného kódu k zmene 1 spol’ahlivosti komunikácie, budemev tejto kapitole študovat’ vzt’ah medzi energiou signálu pripadajúceho na jeden symbolprenášanej správy (kódovanej alebo nekódovanej) a pravdepodobnost’ou nesprávnehodekódovania prijatého slova. 2Na zjednodušenie výkladu prijmeme nasledujúce predpoklady:• kódová abeceda je binárna,• vysielač má ohraničený (konštantný výkon) a na prenos jedného bitu pripadá energiaE b joulov,1 zýšeniu alebo zníženiu2 Výklad vychádza z práce [15] a využíva matematický aparát teórie signálov z práce [5]165

166 KAPITOLA 12. PRÍNOS KÓDOVANIA• na prenos správ sa používajú amplitúdovo modulované signály; 1 je reprezentovanásignálom S hodnotou √ E b a 0 je reprezentovaná signálom s hodnotou − √ E b .Poznámka. Signál reprezentujúci 1 môžeme popísat’ funkciou S(t) (impulzom) s obdĺžnikovýmpriebehom:{√Eb −1/2 < t < 1/2,S(t) =0 ináč.Množstvo energie pripadajúcej na impulz je [5] tak, ako sme predpokladali E b :∫ ∞−∞S(t) 2 dt = E b∫ 1/2−1/2dt = E b .Predpokladáme d’alej, že na prenosový kanál pôsobí zdroj bieleho Gaussovského aditívnehošumu 3 . Výsledkom jeho pôsobenia je náhodný signál N(t) (noise), ktorý sa pripočítavak signálu prenášajúcemu správu. Aby sme sa nemuseli zaoberat’ časovou alebo spektrálnoureprezentáciou signálu S(t) a šumu N(t), signálu (aj šumu) na intervale jednotkovejdĺžky priradíme číselné hodnoty S resp. N (dané napríklad priemernou hodnotou príslušnéhosignálu na intervale, alebo hodnotou ktorú nadobúda v strede intervalu). Šumpotom môžeme chápat’ ako náhodnú premennú s normálnym rozdelením so strednouhodnotou 0 a disperziou σ 2 . Hodnoty signálu a šumu sa sčítavajú a výsledná hodnotaS + N sa interpetuje (demodulátorom) nasledovne{1 S + N > 0,S + N →0 ináč.Je zrejmé, že demodulátor chybne interpretuje prijatý signál vtedy, ak sa v dôsledkušumu mení znamienko signálu, t.j. pôvodne kladná hodnota signálu reprezentujúceho1 sa pripočítaním hodnoty šumu zmenila na zápornú, ktorá reprezentuje 0 a vice versa.To znamená, že, napríklad pri prenose 0 hodnota šumu musela prevýšit’ √ E b a priprenose 1 dôjde ku chybe, ak N < − √ E b . Využijeme to, že náhodná premenná N popisujúcapôsobenie šumu má normálne rozdelenie a vyčíslime pravdepodobnost’ toho, že šumnadobúda vyššie uvedené hodnoty.P(N > √ E b ) =P(N < − √ E b ) =1√2πσ∫ ∞√ Ebe −t2 2σ 2 dt = 1 − Φ1√2πσ∫ √ E b−∞e −t2 2σ 2 dt = Φ(−(√Eb√Ebσ 2 )σ 2 ), (12.1), (12.2)kde Φ(x) je distribučná funkcia normálneho rozdelenia. Zo symetrie hustoty normálnehorozdelenia vyplýva, že P(N > √ E b ) = P(N < − √ (√ )EE b ) = 1 − Φ b. Zaujímavý jeσ 2argument funkcie Φ; pomer E b /σ 2 sa nazýva pomer signálu k šumu (signal to noise3 presnú charakteristiku takého šumu možno nájst’ v [5]

167ratio), SRN a ako sa ukáže neskôr, pomocou neho sa dá kvantitatívne vyjadrit’ odolnost’signálu voči šumu.Vyjadrili sme pravdepodobnost’ vzniku chyby pri prenose jedného bitu. Aby smemohli určit’ efekt kódovania, predpokladajme, že nekódovaná správa pozostáva zo slovdĺžky k bitov. Na kódovanie použijeme (n, k) kód, takže pri prenesení n-bitového kódovéhoslova prenesieme v skutočnosti len k informačných bitov; ak by sme nezmenilimodulátor ani vysielač, prenosová rýchlost’ by po kódovaní nadobudla hodnotu R = k/n.Aby sme toto zníženie prenosovej rýchlosti kompenzovali, musíme za jednotku času preniest’1/R = n/k bitov kódového slova. Ked’že vysielač má konštantný výkon, znamenáto, že po takejto úprave bude množstvo energie pripadajúce na jednotkový signál (signálreprezentujúci jeden bit prenášanej správy) RE b , t.j. menšie. Tým sa zníži aj robustnost’signálu a pravdepodobnost’ toho, že pri prenose jedného bitu dôjde vplyvom šumuk chybe stúpne na(√ )p ′ REbe = 1 − Φσ 2 . (12.3)Na prvý pohl’ad to nevyzerá dobre, pretože zjavne p e dovaniasa však prejaví až pri dekódovaní slov. Porovnáme pravdepodobnosti chybného dekódovania/interpretácieprijatého slova v prípade ked’ na jeho zápis pri prenose nebol/bolpoužitý samoopravný kód. V prvom prípade prenášame slovo dĺžky k a interpretujemeho správne, ak pri prenose nevznikla žiadna chyba. V druhom prípade prenášame slovodĺžky n a chyba dekódovania nastane vtedy, ak počas prenosu v slove vzniklo viac chýb,ako dekóder dokázal opravit’. Ilustrujeme tieto skutočnosti na dvoch príkladoch.Príklad. [15] Kozmická sonda Mariner, vypustená v roku 1969 používala na kódovanieobrazov (32, 6)-kód opravujúci chyby váhy 7 a menšej. Predpokladajme, že tolerovatel’nápravdepodobnost’ nesprávneho dekódovania slova je 10 −4 . Bez použitia samoopravnýchkódov bude mat’ prenášané slovo dĺžku 6 bitov a ak je pravdepodobnost’ chyby v jednombite p e , pravdepodobnost’ chyby v slove budeP e = 1 − (1 − p e ) 6 ≤ 10 −4 (12.4)Z nerovnosti 12.4 vyjadríme p e : 1−10 −4 ≤ (1−p e ) 6 ; potom (1−10 −4 ) 1/6 ≤ 1−p e a napokonp e ≤ 1−(1−10 −4 ) 1/6 = 1.66674·10 −5 . Aby sme dosiahli požadovanú spol’ahlivost’ prenosu,hl’adáme takú hodnotu pomeru signál/šum E b /σ 2 , abyp e ≈ 10−46= 1 − Φ(√Ebσ 2 ); t.j. Φ(√Ebσ 2 )= 1 − 10−46= 0.999983;Platí Φ(4.15) = .9999833763, a teda E b /σ 2 ≈ 4.15 2 = 17.22. Pravdepodobnost’ chyby vjednom bite sa pri použití 32 bitového samoopravného kódu výrazne zvýši (lebo R = 6/32)a dosiahnep ′ e = 1 − Φ( √ 17.22 ∗ 6/32) = 1 − Φ(1.79687) = 0.0361757483.Kód však má opravnú schopnost’ 7 a to znamená, že ak v prenášanom slove nevznikneviac ako 7 chýb, dekóder dokáže prijaté slovo dekódovat’ správne. Pravdepodobnost’

168 KAPITOLA 12. PRÍNOS KÓDOVANIAvzniku aspoň 8 chýb v slove jeP ′ E = 32∑i=8( ) 32(p ′ie) i (1 − p ′ e) 32−i = 0.00001413616427,čo je podstatne lepšie ako požadovaná hodnota 10 −4 . (Pri použití „mäkkých“ metód demoduláciea dekódovania sa dá dosiahnut’ dokonca až hodnota PE ′ = 2 · 10−11 [15]).Uvedieme ešte jeden príklad. Binárny BCH (15,5) kód opravujúci tri chyby námdobre poslúžil napríklad pri výklade metód dekódovania BCH kódov. Ale pomohol bynám zvýšit’ spol’ahlivost’ prenosu údajov z Marinera?Príklad. Aby sme mohli porovnat’ „kvality“ BCH (15,5) kódu s kódom použitým nakódovanie údajov Marinera, zachovajme úroveň spol’ahlivosti P E = 10 −4 . Pri prenosebez použitia samoopravného kódu budeme prenášat’ 5 bitové slová a pravdepodobnost’chybného prenosu 1 bitu dosiahne p e = 2 · 10 −5 = 1 − Φ(4.107479655) a pomer signál/šumbude E b /σ 2 = 16.87138910. Pri použití uvedeného binárneho (15,5) kódu sa prenosovárýchlost’ zníži na tretinu (R = 5/15). Vyjadríme pravdepodobnosti p ′ e a PE ′ :ap ′ e = 1 − Φ(2, 37145448) = 0.0088591145P ′ E = 0.7776185512 · 10−5 .Pravdepodobnost’ chybného dekódovania prijatého slova bude teda pri použití binárnehoBCH (15,5) kódu 12 krát nižšia v porovnaní s pravdepodobnost’ou chybnej interpretácieprijatej pätice (nekódovaných) informačných bitov.Napriek optimistickým výsledkom predchádzajúcich príkladov, oužitie samoopravnýchkódov nemusí zaistit’ zvýšenie spol’ahlivosti komunikácie; resp. presnejšie povedané, žekaždý samoopravný kód má svoj rozsah použitia a jeho použitie mimo tohto rozsahumôže dokonca znížit’ 4 spol’ahlivost’ komunikácie.Čo sa dá spravit’ v prípade, ak pomocou samoopravného kódu zvýšime spol’ahlivost’prenosu nad stanovenú hodnotu (vyjadrenú pravdepodobnost’ou nesprávneho dekódovaniaprijatého slova, P E )? Ak nám stanovená hranica spol’ahlivosti prenosu postačuje,môžeme znížit’ množstvo energie použité na prenos jedného bitu• znížením výkonu vysielača,• zvýšením počtu bitov prenesených za časovú jednotku.Ked’že v obidvoch prípadoch ide o stanovenia množstva energie/signál prenášajúci 1 bit,ktoré postačuje na dosiahnutie želanej hodnoty P E , stačí sa zaoberat’ prvým prípadom. Vprípade sondy Mariner na dosiahnutie požadovanej úrovne P E = 10 −4 postačuje hodnotaSRN 14.83. Použitie samoopravného kódu v tomto prípade malo pozitívny efekt, ktorý sadokonca dá vyjadrit’ aj kvantitatívne - pomerom SRN(bez kódovania):SRN(s kódovaním);4 použitie samoopravného kódu možno kombinovat’ aj so zmenou iných parametrov komunikačného systému,čo môže ovplyvnit’ rozsah použitel’nosti kódu

169kód t coding gainHammingov(7, 4) 1 3.066127697Hammingov(15, 11) 1 2.824701569Hammingov(31, 26) 1 2.615760124BCH(15, 5) 3 5.750883407Golayov(23, 12) 3 5.447658460RM(2, 4)∗ 1 −2.398093804Mariner(32, 6) 7 0.6489199602Tabul’ka 12.1: Efektívnost’ vybraných samoopravných kódovv našom prípade je hodnota pomeru 1.1611. Na dosiahnutie požadovanej spol’ahlivostiprenosu by teda bolo možné znížit’ výkon vysielača asi o 15%. „Pomer pomerov“, ktorýsme pred chvíl’ou zaviedli sa skutočne používa na meranie efektu kódovania.Pomer SRN(nekódovaného)/SRN(kódovaného) prenosu pre rovnakú pravdepodobnost’chyby dekódovania prijatého slova 5 sa nazýva prínos kódovania (coding gain) .Prínos kódovania sa vyjadruje v decibeloch (dB) a vypočítava sa ako desat’násobokhodnoty dekadického logaritmu z pomeru SRN(nekódovaného)/SRN(kódovaného). V prípadekódobania prenosu Marinera je prínos kódovania 0.65 dB. Pre BCH (15, 5) kód jeprínos kódovania ešte väčší (5.75 dB. V tabul’ke 12.1 sú pre porovnanie uvedené niektorézo samoopravných kódov, ktorými sme sa doteraz zaoberali a hodnoty code gain preP E = 10 − 4. Pri Reed Mullerovém kóde je minimálna vzdialenost’ 4, ale opravná schopnost’kódu je len 1.Na záver tejto kapitoly ešte pripomenieme, že to, že prínos kódovania je kladný 6 nemusísamo o sebe byt’ dostatočným dôvodom na použitie samoopravného kódu. Samoopravnékódy si o.i. vyžadujú (softvérovo alebo hardvérovo realizovaný)kóder a dekóder, čo sa prejavujetak na cene komunikačného systému, ako aj na čase spracovania správ. Ten istýefekt, ako zavedenie samoopravných kódov môžeme dosiahnut’ použitím iného komunikačnéhokanála alebo iných signálov, ktoré sú odolnejšie voči šumu. Pri hl’adaní optimálnehoriešenia na zaistenie požadovanej úrovne spol’ahlivosti komunikácie je potrebnézvažovat’ tak technické možnosti a ohraničenia, ako aj možnosti samoopravných kódov.5 ak nebolo použité kódovanie, tak chyba dekódovania znamená, že nastala chyba v l’ubovol’nom biteprenášaného slova6 SRN(nekódovaného)>SRN(kódovaného) prenosu

170 KAPITOLA 12. PRÍNOS KÓDOVANIA

Kapitola 13Shannonova teorémaSamoopravné kódy umožňujú zvýšit’ pravdepodobnost’ správneho dekódovania prijatejinformácie. Cena, ktorú za to treba zaplatit’, je doplnenie informačných symbolov okontrolné. V malých kódoch, ktoré sme konštruovali v predchádzajúcich kapitolách bolpodiel kontrolných symbolov na celkovej dĺžke slova pomerne značný. Zdalo by sa, žeopravná schopnost’ a rýchlost’ prenosu sú v nepriamej úmere; t.j. že podiel počtu informačnýchsymbolov na celkovej dĺžke kódového slova sa bude nutne zmenšovat’ sovzrastajúcou minimálnou vzdialenost’ou kódu. Prekvapujúci výsledok prináša klasickáShannonova veta. Ukazuje sa, že pre mnohé prenosové kanály je možné• prenášat’ informáciu rýchlost’ou blízkou prenosovej rýchlosti kanála;• pravdepodobnost’ chybného dekódovania prijatej informácie možno stlačit’ pod l’ubovol’nemalú, dopredu zadanú hodnotu.V tejto časti vyslovíme a dokážeme Shannonovu vetu. Najprv uvedieme a vysvetlímepredpoklady Shannonovej vety a pripomenieme pojmy, ktoré budeme pri jej dôkaze potrebovat’.Budeme predpokladat’, že prenosový kanál, ktorý sa používa na prenos správ (kódovanejinformácie) je binárny symetrický kanál bez pamäte; t.j. na kódovanie správ sapoužíva binárna abeceda a prenosy jednotlivých binárnych symbolov sa uskutočňujú snasledujúcimi pravdepodobnost’ami:p : 0 → 0, 1 → 11 − p = q : 0 → 1, 1 → 0Budeme pracovat’ s kódom C = {x 1 , . . . , x M }, ktorý má M kódových slov dĺžky n. Predpokladáme,že kódové slová kódu C sa na výstupe zdroja informácie vyskytujú rovnakočasto; t.j., že∀x i ∈ C; P(x i ) = 1/M.Predpokladajme, že bolo odvysielané kódové slovo x i a prijaté slovo y. Prijaté slovo y sadekóduje ako kódové slovo x j také, žeP(y|x j ) = maxx k ∈C {P(y|x k)}.171

172 KAPITOLA 13. SHANNONOVA TEORÉMAPrijaté slovo sa teda dekóduje na základe maximálnej pravdepodobnosti; ak vzniknechyba malej váhy, prijaté slovo sa dekóduje správne, ak vznikne chyba väčšej váhy,ako je opravná schopnost’ použitého kódu, prijaté slovo sa dekóduje nesprávne. Odhadnemepravdepodobnost’ nesprávneho dekódovania prijatého slova. Pravdepodobnost’ nesprávnehodekódovania odvysielaného (a šumom pri prenose modifikovaného kódovéhoslova) x i označíme symbolom P i . Pravdepodobnost’ nesprávneho dekódovania prijatéhoslova pri použití kódu C jeP C = 1 M∑P i .MUvažujme teraz množinu C, množinu všetkých binárnych kódov, ktoré majú M slov dĺžkyn a zavedieme:P ∗ (M, n, q) = minC∈C {P C}.Pre konkrétny kód C je dĺžka kódu nemenná. V Shannonovej knštrukcii budeme potrebovat’parameter n menit’. Predpokladáme, že v závislosti od n sa bude menit’ aj početkódových slov; t.j., M = M(n). Kvôli stručnosti budeme namiesto M(n) písat’ len M n ;i=1P ∗ (M n , n, q) = minC∈C {P C}.Pripomenieme ešte, že Hammingova vzdialenost’ dvoch vektorov u, v, ktorú označujemesymbolom d(u, v) je daná počtom zločiek, v ktorých sa oba vektory líšia. Gul’ou so stredomv bode (vektore) x a polomerom r označíme množinu vektorovB r (x) = {y ∈ {0, 1} n ;d(x, y) ≤ r}.Napokon, rýchlost’ prenosu R kódu C definujeme ako podiel |C|/2 n .Veta 13.0.2 (Shannonova teoréma). Nech je prenosová rýchlost’ kódu 0 ≤ R ≤ 1 + p lg p +q lg q a mohutnost’ kódu M = 2 ⌊R·n⌋ , potompre n → ∞.P ∗ (M n , n, q) → 0Dôkaz.(Pravdepodobnost’ toho, že v kódovom slove x i vznikne pri prenose k chýb, jen)k · p n−k (1 − p) k . Táto hodnota závisí len od parametrov p, n a nezávisí od toho, akéslovo bolo odvysielané. Zavedieme náhodnú premennú ξ p,n , vyjadrujúcu počty chýb vodvysielaných slovách;( nP(ξ p,n = k) = · pk)n−k (1 − p) k .Je zrejmé, že náhodná premenná ξ p,n má binomické rozdelenie pravdepodobností sostrednou hodnotou E(ξ p,n ) = nq a disperziou Var(ξ p,n ) = npq. Pre l’ubovol’nú náhodnúpremennú ζ so strednou hodnotou E(ζ), disperziou Var(ζ) a l’ubovol’né reálne čísloα > 0 platí (Čebyševova nerovnost’)P(|ζ − E(ζ)| > α) < Var(ζ)α 2 .

173Položíme v Čebyševovej nerovnosti α = √ 2npq/ε, ζ = ξ p,n a upravíme:P(|ξ p,n − nq| > √ 2npq/ε) nq + √ 2npq/ε) < ε 2 .Všimneme si, že ak n → ∞, 0 < p, q < 1 a ε > 0 sú konštanty,ξ p,n = nq + O( √ (n)),t.j. dá sa očakávat’, že v prenášanom slove vznikne asi nq chýb. Položímet = ⌊nq + √ 2npq/ε⌋a zistíme, aká je pravdepodobnost’ toho, že pri prenose vznikne v slove viac chýb ako t.Zavedieme dve funkcie. Prvá je indikátor, ktorý pre dvojicu vektorov u, v určí, či súvo vzdialenosti ≤ t alebo nie:{0 d(u, v) > tf(u, v) =1 d(u, v) ≤ tPre l’ubovol’né kódové slovo x i ∈ C a l’ubovol’ný binárny vektorzavedieme nasledujúcu funkciu:dĺžky n, y ∈ {0, 1}ng i (y) = 1 − f(y, x i ) + ∑ j≠if(y, x j ).Posledná funkcia si zaslúži podrobnejšie vysvetlenie: ak je x i odvysielané a y prijatéslovo, tak môžu nastat’ tri možnosti:1. x i je jediné kódové slovo také, že d(x i , y) ≤ t. Potom f(x i , y) = 1, ale ∀j ≠i f(x j , y) = 0. To znamená, že v tomto prípadeg i (y) = 1 − 1 + 0 = 02. d(x i , y) ≤ t a existuje ešte aspoň jedno kódové slovo x j ; j ≠ i také, že d(x j , y) ≤ t.Potomg i (y) = 1 − 1 + 1 + ∑ f(y, x k ) = 1 + ∑ f(y, x k ).k≠i,jk≠i,jSuma ∑ k≠i,j f(y, x k) je nezáporná, a teda v tomto prípadeg i (y) ≥ 1.

174 KAPITOLA 13. SHANNONOVA TEORÉMA3. d(x i , y) > t; t.j. f(x i , y) = 0 ag i (y) = 1 − 0 + ∑ f(y, x j ) = 1 + ∑ f(y, x j ).j≠ij≠iSuma ∑ j≠i f(y, x j) je nezáporná, a teda aj v tomto prípade g i (y) ≥ 1.Funkcia g i (y) teda nadobúda hodnotu 0 v prípade, ak prijaté slovo y leží vo vzdialenostimenšej alebo rovnej t od kódového slova x i a leží vo vzdialenosti väčšej ako t od ostatnýchkódových slov. V opačnom prípade nadobúda hodnotu väčšiu alebo rovnú jednej.Pristúpime teraz k dôkazu Shannonovej vety. Vyberieme kódové slová kódu C náhodnea nezávisle na sebe:C = {x 1 , . . . , x M }.Predpokladáme, že sme odvysielali kódové slovo x i a prijali slovo y. Prijaté slovo dekódujemenasledovne:• Ak existuje jediné kódové slovo x j také, že d(x j , y) ≤ t dekódujeme prijaté slovo akox j . Ak i = j, dekódovali sme správne, v opačnom prípade sme sa dopustili chybydekódovania.• Ak existuje niekol’ko kódových slov ležiacich vo vzdialenosti ≤ t od prijatého slovay; resp neexistuje žiadne kódové slovo, ktoré by ležalo vo vzdialenosti ≤ t odprijatého slova y 1 ) vyhlásime chybu.Aká je pravdepodobnost’ chybného dekódovania?P i≤==∑P(y|x i ) · g i (y) =y∈{0,1} n ⎡⎤∑P(y|x i ) · ⎣1 − f(y, x i ) + ∑ f(y, x j ) ⎦ =y∈{0,1} n j≠i∑P(y|x i ) · [1 − f(y, x i )] +∑P(y|x i ) · f(y, x j )y∈{0,1} n j≠iPrvá suma z výrazu *** sa dá zapísat’ takto∑y∈{0,1} n ∑y∈{0,1} n P(y|x i ) · [d(x i , y) > t] = P(d(x i , y) > t).Posledný výraz vyjadruje pravdepodobnost’ toho, že prijaté slovo nepatrí do gule B t (x i )a dá sa odhadnút’ zhora nasledovneP(d(x i , y) > t) < 1 2 ε,1 kód C sme vytvárali náhodne

175pretože to, že d(x i , y) > t znamená, že pri prenose (slova x i ) vznikla chyba váhy väčšejako t. Spočítame pravdepodobnost’ nesprávneho dekódovania prijatého slova, ak boloodvysielané niektoré kódové slovo.P C = 1 M ·M∑P i ≤ 1 2 ε + 1 Mi=1M∑∑ ∑i=1 y∈{0,1} n j≠iP(y|x i ) · f(y, x j )Hlavná myšlienka dôkazu spočíva v tom, žeP ∗ (M n , n, q) ≤ E(P C ),t.j. minimálnu hodnotu chyby dekódovania možno odhadnút’ zhora strednou hodnotouchyby dekódovania, ktorú berieme cez všetky možné kódy C:⎡⎤P ∗ (M n , n, q) ≤ E ⎣ 1 2 ε + 1 M∑ ∑P(y|x i ) · f(y, x j ) ⎦ .M∑i=1 y∈{0,1} n j≠iUpravíme *** pomocou nasledujúcich pravidiel pre strednú hodnotu:• pre l’ubovol’nú konštantu c, E(c) = c;• pre l’ubovol’né dve náhodné premenné ϕ, ψ, E(ϕ + ψ) = E(ϕ) + E(ψ).DostávameP ∗ (M n , n, q) ≤ 1 2 ε + 1 M∑M∑∑i=1 y∈{0,1} n j≠iE [P(y|x i ) · f(y, x j )] .Zmeníme poradie sumácie tak, aby sme najprv počítali sumu vzhl’adom na y ∈ {0, 1} n :P ∗ (M n , n, q) ≤ 1 2 ε + 1 MM∑ ∑ ∑i=1 j≠iy∈{0,1} n E [P(y|x i ) · f(y, x j )] .Vnútornú sumurozdelíme na dve časti∑y∈{0,1} n E [P(y|x i ) · f(y, x j )] =∑y∈{0,1} n E [P(y|x i ) · f(y, x j )]∑y∈{0,1} n ∩B t (x j )E [P(y|x i ) · f(y, x j )]+∑y∉{0,1} n ∩B t (x j )Ked’že f(y, x j ) = 0 pre y ∉ {0, 1} n ∩ B t (x j ), a f(y, x j ) = 1 pre y ∈ {0, 1} n ∩ B t (x j )∑∑E [P(y|x i ) · f(y, x j )] =E [P(y|x i )] .y∈{0,1} n y∈{0,1} n ∩B t (x j )Podmienenú pravdepodobnost’ P(y|x i ) vyjadríme nasledovne:P(y|x i ) = P(y, x i)P(x i ) .E [P(y|x i ) · f(y, x j )]

176 KAPITOLA 13. SHANNONOVA TEORÉMAAle P(x i ) = 1/M, a teda∑Dosadíme *** do vzt’ahu ***:y∈{0,1} n E [P(y|x i ) · f(y, x j )] = M ·∑y∈{0,1} n ∩B t (x j )E(P(y, x i )).P ∗ (M n , n, q) ≤ 1 M 2 ε + ∑ ∑i=1a upravíme trojitú sumu. Postupne dostávameM∑(M − 1)∑i=1 y∈{0,1} n ∩B t (x j ) j≠i∑y∈{0,1} n ∩B t (x j ) i=1(M − 1)∑j≠i y∈{0,1} n ∩B t (x j )∑M∑E(P(y, x i )) = (M − 1)M∑E(P(y, x i )) = (M − 1)∑y∈{0,1} n ∩B t (x j )E(2 −n ) = (M − 1) · |B t|2 n .E(P(y, x i ))∑i=1 y∈{0,1} n ∩B t (x j )∑y∈{0,1} n ∩B t (x j )E(P(y, x i )) =E(P(y)) =Pre pravdepodobnost’ P ∗ (M n , n, q) sme zatial’ odvodili nasledujúci horný odhadP ∗ (M n , n, q) ≤ 1 2 ε + (M − 1) · |B t|2 n .Upravíme *** (najprv logaritmujeme, potom vydelíme n):P ∗ (M n , n, q) − 1 2 ε ≤ (M − 1) · |B t|2 nlg(P ∗ (M n , n, q) − 1 2 ε) ≤ lg(M − 1) + lg(|B t|) − nlg(P ∗ (M n , n, q) − 1 2 ε)n≤ lg M n + lg(|B t|)n− 1Ostáva odhadnút’ výraz lg |B t|n. Odhadneme najprv mohutnost’ gule s polomerom t (vbinárnom vektorovom priestore dimenzie n) zhora (pripomíname, že t < n/2)|B t | =t∑( nk)k=0( n≤ t ≤t)1 2 n · n!t!(n − t)! < 1 2 n ·Teraz na základe *** zostrojíme horný odhad pre lg |B t|lg |B t |nn nt t (n − t) n−t = 1 2 n 1) t ( )1 −t (n−t).n :( tn≤1 [lg 1 n 2 n − t lg t (n − (n − t) lg 1 − t )]=n= − 1 n + lg nn − t n lg t (1n − − t ) (lg 1 − t )n nn

177Pripomíname, že t = ⌊nq + √ 2npq/ε⌋. Odhadneme výrazy t n lg t n a ( 1 − t n)lg(1 −tn):tn = ⌊nq + √ 2npq/ε⌋ntn lg t [n = q + O( 1 √n)]lgPodobne odhadneme výraz ( 1 − n) t ( )lg 1 −tn)(1 − t ) (lg 1 − t n n= nq + √ 2npq/ε + O(1)n[ ( )] 1q + O √n = q lg q + O( ) 1= p lg p + O √n .( ) 1= q + O √n( ) 1 √n .Pripomenieme ešte, že prenosová rýchlost’ kódu je 0 ≤ R ≤ 1 + p lg p + q lg q a mohutnost’kódu je M = 2 ⌊R·n⌋ , t.j. existuje kladná konštanta β > 0 taká, že R = 1+p lg p+q lg q−β.Potomlg M nn=lg 2⌊n(1+plg p+q lg q−β)⌋n=⌊n(1 + p lg p + q lg q − β)⌋n≤ (1 + p lg p + q lg q − β)Teraz dosadíme odhady *** do ***lg(P ∗ (M n , n, q) − 1 2 ε)n≤ (1 + p lg p + q lg q − β) −≤ lg M [( )]n1n − 1 + p lg p + q lg q + O √n ≤[( )] ( )111 + p lg p + q lg q + O √n = −β + O √n .Nakoniec odhadneme zhora samotnú pravdepodobnost’ P ∗ (M n , n, q):lg(P ∗ (M n , n, q) − 1 2 ε) ≤ −βn + O (√ n ) = −β ′ nP ∗ (M n , n, q) ≤ 1 2 ε + 2−β′n .kde β ′ > 0 je konštanta. Veta je dokázaná.

178 KAPITOLA 13. SHANNONOVA TEORÉMA

Kapitola 14Hranice parametrovsamoopravných kódovPozrieme sa najmä na dolné odhady minimálnej vzdialenosti kódov.179

180 KAPITOLA 14. HRANICE PARAMETROV SAMOOPRAVNÝCH KÓDOV

Čast’ IIIMatematické základy teóriekódovania181

183Konštrukcia kódov, skúmanie ich vlastností a návrh efektívnych metód kódovaniaa dekódovania si vyžadujú pomerne rozsiahle vedomosti z matematiky, informatiky aniektorých technických vied. Predpokladáme, že čitatel’ absolvoval základné kurzy zmatematiky (najmä z algebry a lineárnej algebry) a má aspoň základné poznatky zteórie pravdepodobnosti. V tejto časti uvedieme prehl’ad tých poznatkov z matematiky,ktoré čitatel’ potrebuje na štúdium našej knihy. Prehl’ad matematiky má slúžit’ na rýchlepripomenutie si zabudnutých poznatkov, prípadne doplnenie chýbajúcich fragmentovznalostí, ale v žiadnom prípade nemá ambíciu nahradit’ systematický výklad uvedenejproblematiky ako je napríklad [8, 9]. Čitatel’ovi, ktorý má záujem o hlbšie štúdium problematikyuvedenje v tejto kapitole, resp. objavil vo svojich vedomostiach hlbšie medzery,odporučíme práce, v ktorých nájde potrebné informácie spracované v dostupnej forme.

184

Kapitola 15AlgebraKonštrukcie viacerých kódov vychádzajú z takých algebraických štruktúr, ako sú grupy,vektorové priestory, konečné polia, konečné geometrie a iné. Zavedieme tieto algebraickéštrukúry a popíšeme ich najdôležitejšie vlastnosti.Budeme predpokladat’, že čitatel’ovi sú známe pojmy množiny, podmnožiny, usporiadanejdvojice, kartézskeho súčinu množín, relácie a zobrazenia, pozri napr. ??.15.1 GrupyNech je M nejaká množina. Zobrazenie f : M × M → M budeme nazývat’ binárnouoperáciou na množine M. Často budeme pracovat’ s nejakými podmnožinami základnejmnožiny a vtedy môže dôjst’ k prípadu, ked’ výsledok operácie nad prvkami z podmnožinyuž nebude prvkom danej podmnožiny. Ak pre l’ubovol’né dva prvky x, y ∈ M ′ a binárnuoperáciu f platí f(x, y) ∈ M ′ , budeme hovorit’, že množina M ′ je uzavretá vzhl’adomna binárnu operáciu f. Algebraickou štruktúrou alebo algebraickým systémom budemenazývat’ množinu M s jednou alebo viacerými operáciami na M.V d’alšom nebudeme skúmat’ nejaké abstraktné binárne operácie, ale takmer výlučnesa budeme zaoberat’ aditívnymi a multiplikatívnymi operáciami. Preto budeme namiestozápisu f(x, y) používat’ pre binárnu operáciu tradičné označenie x ◦ y, kde ◦ označujeoperátor "+"v prípade aditívnej operácie a "*"v prípade multiplikatívnej operácie.Príklad. Symbolmi N, Z, Q, R budeme (aj v d’alších častiach knihy, ak nebude povedanéinak) označovat’ množiny prirodzených, celých, racionálnych a reálnych čísel. Pripomíname,že nula (0) je prirodzené číslo. Na množine R definujeme štandardným spôsobomoperácie sčítania ("+"), odčítania ("), násobenia ("*") a na množine R − {0} aj operáciudelenia ("/"). Potom1. množiny N, Z, Q, R sú uzavreté vzhl’adom na operácie + a *;2. množiny Z, Q, R sú uzavreté vzhl’adom na operáciu -;3. množiny Q − {0}, R − {0} sú uzavreté vzhl’adom na operáciu /.185

186 KAPITOLA 15. ALGEBRAOperácia ◦ na množine M sa nazýva• asociatívnou, ak pre l’ubovol’né prvky a, b, c ∈ M platí:a ◦ (b ◦ c) = (a ◦ b) ◦ c• komutatívnou, ak pre l’ubovol’né prvky a, b ∈ M platí:a ◦ b = b ◦ a.Množina M s operáciou ◦ (v d’alšom budeme takúto algebraickú štruktúru označovat’(M, ◦)) sa nazýva pologrupou, ak je M uzavretá vzhl’adom na operáciu ◦ a operácia ◦ je(na M) asociatívna.Prvok u ∈ (M, ◦) nazýva neutrálnym prvkom množiny M vzhl’adom na operáciu ◦,ak pre l’ubovol’ný prvok a ∈ M platí a ◦ u = u ◦ a = a. Pologrupa (M, ◦) s neutrálnymprvkom u sa nazýva monoidom.Nech je a l’ubovol’ný prvok monoidu (M, ◦), potom prvok b ∈ (M, ◦), pre ktorý platía ◦ b = b ◦ a = u,sa nazýva opačným alebo inverzným prvkom prvku a 1Príklad. Uvažujme množinu Q racionálnych čísel s operáciami sčítania a násobenia.Neutrálnym prvkom pre operáciu sčítania je číslo 0, pre operáciu násobenia je neutrálnymprvkom číslo 1. Pre l’ubovol’né racionálne číslo a existuje opačné číslo −a ∈ Q. Aka ≠ 0, tak pre a existuje inverzné číslo 1/a.Ďalší pojem je natol’ko dôležitý, že si zasluhuje explicitnú definíciu.Definícia 15.1.1. Množina G s operáciou ◦, ktorá spĺňa nasledujúce podmienky1. G je uzavretá vzhl’adom na operáciu ◦,2. operácia ◦ je asociatívna,3. G obsahuje neutrálny prvok vzhl’adom na operáciu ◦,4. ku každému prvku množiny G existuje opačný prvok vzhl’adom na operáciu ◦sa nazýva grupou.1 pojem opačný prvok sa zvykle používat’ v súvislosti s aditívnou operáciou a pojem inverzný prvok zasav súvislosti s multiplikatívnou operáciou.

15.1. GRUPY 187Poznámka. Je zrejmé, že pologrupa, v ktorej ku každému prvku existuje opačný prvok,je grupou.Ak je operácia ◦ grupy (G, ◦) komutatívna, grupa (G, ◦) sa nazýva komutatívnou aleboabelovskou grupou.Príklad. (Komutatívnymi) grupami sú napríklad nasledujúce algebraické štruktúry:(Z, +), (Q, +), (R, +), (Q − {0}, ∗), (R − {0}, ∗). Uvedieme ešte jednu, menej obvyklú grupu.Množina Z 3 = {0, 1, 2} s operáciou modulárneho sčítania ⊕ definovaného nasledujúcoutabul’kou je komutatívna grupa:⊕ 0 1 20 0 1 21 1 2 02 2 0 1Grupa, ktorá má konečný počet prvkov, sa nazýva konečnou grupou. Počet prvkovkonečnej grupy G budeme označovat’ symbolom |G| a nazývat’ rádom grupy. V grupemôže existovat’ podmnožina prvkov, ktoré spolu s operáciou defiinovanou na nadmnožinetvoria grupu. Takáto podmnožina s operáciou prevzatou s grupy (nadmnožiny) sa budenazývat’ podgrupou. Zrejme najmenšou podgrupou grupy je jednoprvková množina obsahujúcaneutrálny prvok grupy. Definujeme teraz pojem podgrupy exaktne.Nech je (G, ◦) grupa. Podmnožina G 1 ⊂ G, taká, že G 1 , ◦ je grupa, sa nazýva podgrupougrupy G. Podgrupu možno charakterizovat’ aj nasledujúcim spôsobom (predpokladajme,že operácia ◦ je aditívna):Veta 15.1.1. Podmnožina G 1 grupy (G, +) s operáciou + je podgrupou (grupy G) právevtedy, ak pre l’ubovol’né prvky a, b ∈ G 1 platí a − b ∈ G 1 .Dôkaz. Ak je (G 1 , +) podgrupou, tak spĺňa všetky štyri axiómy grupy. To znamená. žepre l’ubovol’ný prvok b ∈ G 1 je aj −b ∈ G 1 ; a pre l’ubovol’né dva prvky z G 1 je prvkom G 1aj ich súčet.Nech na druhej strane platí, že ak a, b ∈ G 1 tak potom aj a − b ∈ G 1 . Zoberiemel’ubovol’ný prvok a ∈ G 1 , podl’a predpokladu je aj a−a = 0 prvkom G 1 . To však znamená,že pre l’ubovol’ný prvok c ∈ G 1 je aj k nemu opačný prvok c = 0 − c ∈ G 1 ; resp. prel’ubovol’né prvky a, b ∈ G 1 je aj a + b = a − (−b) ∈ G 1 . To znamená, že G 1 je uzavretávzhl’adom na asociatívnu operáciu +, obsahuje neutrálny prvok a ku každému prvkuobsahuje opačný prvok. T.j. (G 1 , +) je grupa.Poznámka. Tvrdenie predchádzajúcej vety možno zovšeobecnit’ nasledovne: PodmnožinaG 1 grupy (G, ◦) s operáciou ◦ je podgrupou (grupy G) práve vtedy, ak pre l’ubovol’néprvky a, b ∈ G 1 platí a ◦ b ′ ∈ G 1 , kde b ′ je opačný/inverzný prvok k prvku b.Príklad. 1. Uvažujme množinu Z 6 = {0, 1, 2, 3, 4, 5} s operáciou + definovanou nasle-

188 KAPITOLA 15. ALGEBRAdovne:+ 0 1 2 3 4 50 0 1 2 3 4 51 1 2 3 4 5 02 2 3 4 5 0 13 3 4 5 0 1 24 4 5 0 1 2 35 5 0 1 2 3 4Je zrejmé, že (Z 6 , +) je grupa. Jej podgrupami sú nasledujúce množiny {0}, {0, 3}, {0, 2, 4}s operáciou +.2. Nech je m l’ubovol’né celé číslo. Dá sa l’ahko ukázat’, že množnina mZ = {0, m, −m,2m, −2m, . . . } všetkých celočíselných násobkov čísla m tvorí s operáciou + aditívnu grupu,ktorá je podgrupou aditívnej grupy celých čísel (Z, +). (Stačí dokázat’, že rozdiel l’ubovol’-ných dvoch celočíselných násobkov čísla m je opät’ celočíselným násobkom čísla m.)Uvažujme teraz grupu (G, ∗) s multiplikatívnou operáciou, nech je a ∈ G l’ubovol’nýprvok, a m ∈ N. Definujeme mocniny prvku a nasledovne:1. a 0 = 1, kde 1 je neutrálny prvok grupy G vzhl’adom na multiplikatívnu operáciu,2. a m+1 = a m ∗ a = a} ∗ a ∗ {{· · · ∗ a},m+13. a −m = (a −1 ) m = a} −1 ∗ ·{{ · · ∗ a −1} .mKvôli zjednodušeniu označenia budeme namiesto a 1 písat’ len a. Podobnm spôsobommožno zaviest’ "mocniny"prvku a v prípade aditívnej operácie:1. a 0 = 0, kde 0 je neutrálny prvok grupy G vzhl’adom na aditívnu operáciu,2. a m+1 = a m + a =}a + a +{{· · · + a},m+13. a −m = (−a) m = −a − a − · · · − a} {{ }mTam kde nebude potrebné odlišovat’ multiplikatívne a aditívne grupy, budeme používat’terminológiu multiplikatívnych grúp (inverzný prvok, jednotkový prvok, mocninaprvku a pod.)Definícia 15.1.2. Nech je (G, ∗) grupa s multiplikatívnou operáciou, potom sa grupa Gnazýva cyklickou grupou, ak existuje taký prvok g ∈ G, že pre l’ubovol’né a ∈ G existujeprirodzené číslo j ∈ N také, že a = g j ; t.j., že všetky prvky grupy G možno vyjadrit’ vpodobe mocnín prvku g. Prvok g sa nazýva generátorom cyklickej grupy G a cyklickágrupa generovaná prvkom a sa označuje symbolom (a).

15.1. GRUPY 189Príklad. 1. Uvažujeme množinu Z 5 = {0, 1, 2, 3, 4} s multiplikatívnou operáciou ∗ definovanoutabul’kou∗ 0 1 2 3 40 0 0 0 0 01 0 2 3 4 52 0 2 4 1 33 0 3 1 4 24 0 4 3 2 1(Z 5 , ∗) je síce len monoid, ale ak z neho odstránime problematický prvok 0, pre ktorý v(Z 5 , ∗) neexistuje inverzný prvok, dostávame multiplikatívnu grupu (Z 5 − {0}, +). Tátogrupa je cyklická a prvky 2, 3, 4 sú jej generátormi.2. Grupa (Z 6 , +) z príkladu 15.1 je cyklická. jej generátorom sú prvky 1, 5.3. Aditvna grupa celých čísel (Z, +) je cyklická, jej generátormi sú čísla 1, −1.Uvažujme konečnú grupu (G, ∗) a prvok a ∈ G. Množina mocnín {a, a 2 , . . . } je vdôsledku konečnosti G a uzavretosti G vzhl’adom na operáciu ∗ konečná a s operáciou∗ tvorí podgrupu nazývanú podgrupou generovanou prvkom a. Pre l’ubovol’né a ∈ Gexistuje prirodzené číslo k také, že a k = 1, kde 1 je neutrálny prvok gupy G. Je zrejmé,že podgrupa generovaná prvkom a má prvky a, a 2 , . . . , a k = 1. Rádom prvku a ∈ Gbudeme nazývat’ rád podgrupy generovanej prvkom a. Množinu mocnín a, a 2 , . . . , a k = 1budeme nazývat’ cyklom.Budeme skúmat’ niektoré vzt’ahy medzi grupami a ich pologrupami. Na to potrebujemezaviest’ pojem rozkladu alebo faktorizácie grupy.Nech je M l’ubovol’ná množina. Potom M = {M 1 , . . . M i ⊆ M} systém podmožínmnožiny M sa nazýva rozkladom množiny M, ak spĺňa nasledujúce tri podmienky:1. ∀i M i ≠ ∅,2. ⋃ i M i = M,3. M i⋂Mj = ∅; i ≠ j.Prvky systému M budeme nazývat’ triedami rozkladu.Existujú zvláštne relácie na množine, ktoré definujú rozklady tejto množiny.Nech je M l’ubovol’ná množina. Potom relácia R ⊆ M × M na množine M nazývareláciou ekvivalencie (ekvivalenciou) , ak1. pre l’ubovol’né x ∈ M, (x, x) ∈ R (reflexívnost’),2. pre l’ubovol’né x, y ∈ M platí, ak (x, y) ∈ R, tak potom aj (y, x) ∈ R (symetria),3. pre l’ubovol’né x, y, z ∈ M platí, ak (x, y) ∈ R a (y, z) ∈ R tak potom aj (x, z) ∈ R(tranzitívnost’).

190 KAPITOLA 15. ALGEBRAPoznámka. Relácia ekvivalencie sa zvykne označovat’ symbolom ∼ alebo ≡. Namiesto≡ (x, y) budeme písat’ x ≡ y.Príkladom ekvivalencie je rovnost’. Relácia ekvivalencie určuje rozklad množiny.Triedy rozkladu množiny M určené reláciou ekvivalencie ≡ na množine M sa nazývajútriedami ekvivalencie a sú definované nasledovne:[a] = {x ∈ M; x ≡ a};t.j. jednu triedu rozkladu/ekvivalencie tvoria všetky tie prvky množiny M, ktoré súnavzájom ekvivalentné. Trieda rozkladu je jednoznačne určená l’ubovol’ným svojím prvkom,a preto sa z každej triedy rozkladu vyberie nejaký prvok, ktorý reprezentuje danútriedu, nazývaný reprezentantom alebo predstavitel’om triedy.Príklad. Nech je m ∈ N prirodzené číslo, m > 1. Relácia ≡ definovaná na množinecelých čísel nasledujúcim spôsoboma ≡ b ⇔ m|(a − b)je ekvivalencia. Rozklad množiny celých čísel definovaný touto ekvivalenciou pozostávaz tried [0], ...[m − 1]. Prvkami triedy ekvivalencie [t] sú všetky celé čísla, ktoré majúrovnaký zvyšok po delení číslom m ako reprezentant triedy. Túto ekvivalenciu budemeešte potrebovat’, a preto pre ňu zavedieme špeciálne označenie; to že pre celé čísla a, bplatí m|(a − b), budeme označovat’ nasledovnea ≡ b mod m.Uvažujme grupu (G, ∗) a nejakú jej podgrupu (H, ∗); H = {h 1 . . . h k }. Zostrojíme terazrozklad grupy G nasledujúcim spôsobom:1. prvou triedou rozkladu je podgrupa H; reprezentantom tejto triedy rozkladu je prvok1;2. predpokladáme, že sme zostrojili i−1 tried rozkladu; ak existuje prvok a i ∈ G, torýnepatrí do žiadnej z prvých i − 1 tried rozkladu, vyberieme ho ako reprezentantai-tej triedy, ktorú zostrojíme nasledujúcim spôsobom:[a i ] = a i ∗ h 1 , . . . , a i ∗ h k3. krok (2) opakujeme dovtedy, kým budú existovat’ prvky množiny G, ktoré nepatriado žiadnej triedy rozkladu.Je zrejmé, že triedy [a i ] sú neprázdne a že každý prvok množiny G patrí do niektorejtriedy. Ukážeme ešte, že [a i ] ⋂ [a j ] = ∅ i ≠ j. Predpokladajme opak, t.j. že existuje prvokx ∈ [a i ] ⋂ [a j ]. To však znamená, že existujú prvky h r , h s ∈ H také, žex = a i ∗ h r = a j ∗ h s .Ked’že G je grupa, obsahuje prvok a −1i, inverzný k prvku a i . To znamená, žea −1i∗ (a i ∗ h r ) = (a −1i∗ a i ) ∗ h r = h r = a −1i∗ (a j ∗ h s ) = (a −1i∗ a j ) ∗ h s ;

15.1. GRUPY 191t.j. (a −1i∗ a j ) ∈ H, a teda a i ∈ a j ∗ H, z čoho vyplýva, že [a i ] = [a j ]. Systém {[a i ]} i tedanaozaj predstavuje rozklad grupy G, ktorý budeme nazývat’ rozkladom grupy G podl’apodgrupy H. Rozklad grupy podl’a podgrupy je uvedený v nasledujúcej tabul’ke.h 1 h 2 . . . h ka 2 a 2 ∗ h 1 a 2 ∗ h 2 . . . a 2 ∗ h k. . . . . . .a i a i ∗ h 1 a i ∗ h 2 . . . a i ∗ h k. . . . . . .a m a m ∗ h 1 a m ∗ h 2 . . . a m ∗ h kPoznámka. V prípade ak multiplikatívna operácia ∗ nie je komutatívna, bude potrebnérozlišovat’ násobenie sprava a zl’ava, pretože vo všeobecnosti a ∗ H ≠ H ∗ a. Triedya∗H (H∗a) budeme nazývat’ l’avými, resp.pravými triedami rozkladu. Podgrupa H grupy(G, ∗) sa nazýva normálna, ak pre každý prvok a ∈ G platí a ∗ H = H ∗ a; t.j. ak sa pravéa l’avé triedy rozkladu grupy G podl’a H rovnajú. My budeme pracovat’ s abelovskýmigrupami, ktorých podgrupy sú normálne podgrupy.Z konštrukcie rozkladu konečnej grupy podl’a jej podgrupy vyplýva nasledujúci klasickývýsledok.Veta 15.1.2 (Lagrange). Rád konečnej grupy je celočíselným násobkom rádu každej jejpodgrupy.Pripomíname, že rád prvku bol definovaný ako rád podgrupy, ktorú daný prvok generoval.Z Lagrangeovej vety potom vyplýva nasledujúciDôsledok. Rád každého prvku konečnej grupy G je delitel’om rádu grupy G.Vrát’me sa ešte k systému tried, vytvorených pri rozklade grupy G podl’a normálnejpodgrupy H; ktorý budeme označovat’ symbolom G/H;G/H = {[a i ] = a i ∗ H} i .Definujeme na systéme G/H binárnu operáciu ∗ nasledovne:[a i ] ∗ [a j ] = [a i ∗ a j ].Dá sa l’ahko overit’, že (G/H, ∗) tvorí grupu, ktorú budeme nazývat’ faktorovou grupou(grupy G podl’a (normálnej) podgrupy H).Príklad. Faktorizujeme grupu (Z, +) podl’a podgrupy (2Z, +), kde 2Z je množina všetkýchpárnych celých čísel. Rozklad Z/2Z bude mat’ dve triedy, 2Z, Z − 2Z, pričom trieda Z − 2Zpozostáva zo všetkých nepárnych celých čísel. Vyberme ako reprezentantov tried rozkladučísla 0, 1. Potom 2Z = [0] a Z − 2Z = [1]. Operácia sčítania na Z/H je definovanánasledujúcou tabul’kou:+ [0] [1][0] [0] [1][1] [1] [0]

192 KAPITOLA 15. ALGEBRAFaktorová grupa (Z/2Z, +) zodpovedá (až na označenie prvkov) grupe (Z 2 , ⊕), kde Z 2 ={0, 1} a ⊕ označuje sčítanie mod 2.Zovšeobecníme predchádzajúci príklad. Pre l’ubovol’né prirodzené číslo m ≥ 2 2označíme symbolom (Z m , +) faktorovú grupu (Z/mZ, +) s operáciou sčítania mod m.Kvôli zjednodušeniu zápisu budeme prvky množiny Z m označovat’ symbolmi 0, . . . , m−1.Grupy Z m budeme v d’alšom často používat’.15.2 OkruhyDoteraz sme sa zaoberali algebraickými štruktúrami s jednou binárnou operáciou. Vtejto časti zavedieme agebraické štruktúry s dvoma binárnymi operáciami - sčítaním anásobením.Definícia 15.2.1. Okruh (A, +, ·) je množina A spolu s dvoma binárnymi operáciami,označenými ako + a ·, ktorá spĺňa nasledujúce podmienky:1. A je abelovská grupa vzhl’adom na aditívnu operáciu +,2. multiplikatívna operácia · je asociatívna, t.j. pre l’ubovol’né a, b, c ∈ A platí (a · b) ·c = a(·b · c);3. platí distributívny zákon; t.j. pre l’ubovol’né a, b, c ∈ A platí a · (b + c) = a · b + a · ca (b + c) · a = b · a + c · a.Okruh (A, +.·) budeme kvôli zjednodušeniu zápisu označovat’ symbolom A, symbolom0 budeme označovat’ neutrálny prvok vzhl’adom na aditívnu operáciu a symbolom 1neutrálny prvok vzhl’adom na multiplikatívnu operáciu (ak okruh taký prvok obsahuje);opačný prvok k prvku a vzhl’adom na aditívnu operáciu budeme označovat’ symbolom−a. Namiesto a+(−b) budeme písat’ a−b a súčin a·b budeme stručnejšie zapisovat’ akoab. Dá sa l’ahko odvodit’, že pre l’ubovol’né a, b ∈ A platí a·0 = 0 a (−a)b = a(−b) = −ab.Ak ab = c, budeme hovorit’, že prvky a, b sú delitel’mi prvku c. Je zrejmé, že 1 · c = c;t.j. prvky 1 a c sú delitel’mi c. Ak sú delitele a, b, rôzne od prvkov c, 1 tak sa nazývajúvlastnými delitel’mi prvku c.Teraz zavedieme niektoré algebraické štruktúry, ktoré majú okrem vlastností okruhuaj d’alšie vlastnosti.Definícia 15.2.2. Okruh A sa nazýva1. unitárnym, ak v A existuje prvok 1, neutrálny prvok vzhl’adom na multiplikatívnuoperáciu;2. komutatívnym okruhom, ak je operácia · komutatívna;3. oborom integrity, ak je komutatívnym unitárnym okruhom, 1 ≠ 0 a z rovnosti ab = 0vyplýva a = 0 alebo b = 0,2 Posúdenie prípadov m ≤ 1 ponechávame na čitatel’a

15.2. OKRUHY 1934. telesom, ak je (A − {0}, ·) multiplikatívna grupa,5. pol’om, ak je komutatívnym telesom.Kl’účovým pojmom, s ktorým budeme v teórii samoopravných kódov neustále pracovat’,je pojem (konečného) pol’a. Konečným poliam sa budeme v tejto kapitole venovat’podrobnejšie, a preto si len stručne zrekapitulujeme vlastnosti pol’a. Pole je algebraickáštruktúra s aditívnou a multiplikatívnou operáciou. Tvorí abelovskú grupu vzhl’adomna aditívnu operáciu a jeho nenulové prvky tvoria abelovskú grupu vzhl’adom na multiplikatívnuoperáciu. Obe operácie sú navzájom zviazané distributívnym zákonom:a(b + c) = ab + ac. Pole je aj oborom integrity, to znamená, že nemá vlastných delitel’ovnuly; resp. z toho, že ab = 0 vyplýva a −1 ab = b = 0; resp. abb −1 = a = 0.Vrátime sa ešte k pojmu okruhu. Podobne ako sme pre grupu definovali pojem podgrupy,zavedieme pre okruh najprv pojem podokruhu a potom definujeme podokruhy sošpeciálnymi vlastnost’ami.Definícia 15.2.3. Podmnožina S okruhu A sa nazýva podokruhom okruhu A, ak je uzavretávzhl’adom na operácie + a · a tvorí vzhl’adom na tieto operácie okruh.Pri konštrukcii polynómov budeme potrebovat’ k podokruhu pridávat’ nové prvky.Nasledujúca veta [8] hovorí, ako to možno urobit’ tak, aby výsledná algebraická štruktúrazostala okruhom.Veta 15.2.1. Nech A je podokruh unitárneho komutatívneho okruhu (B, +, ·) a nech 1 ∈A. Potom pre l’ubovol’ný prvok b ∈ B je najmenší podokruh generovaný množinou A ∪ {b}okruh C, +·), kdeC = {a 0 + a 1 b + · · · + a n b n ; n ∈ N, a 0 , a 1 , . . . , a n ∈ A}.Dôkaz. Dá sa l’ahko overit’, že (C, +, ·) je okruh. Ked’že A∪{b} ⊆ B, (C, +, ·) je podokruhokruhu (B, +, ·). Ukážeme, že (C, +, ·) je najmenší podokruh okruhu (B, +, ·) obsahujúcimnožinu A ∪ {b}. Predpokladajme, že existuje okruh (C ′ , +, ·) taký, že A ∪ {b} ⊆ C ′ ⊂ C ⊆B. Nech d ∈ C − C ′ , potom existuje m ∈ N a prvky a i ∈ A, i = 0 . . . m také, žed = a 0 + a 1 b + · · · + a m b m .Kedže b ∈ C ′ a (C ′ , +, ·) je okruh, potom pre l’ubovol’né k ∈ N aj b k ∈ C ′ a teda aja k b k ∈ C ′ pre a k ∈ A ⊆ C ′ . To znamená, že d ∈ C ′ . Dostávame spor s predpokladom, čodokazuje platnost’ vety.Poznámka. Podokruh (C, +, ·) generovaný množinou A ∪ {b} budeme označovat’ symbolom(A[b], +, ·).Definícia 15.2.4. Podokruh J okruhu A sa nazýva ideálom ak pre každé a ∈ J a r ∈ Aplatí ar ∈ J a ra ∈ J.

194 KAPITOLA 15. ALGEBRAPríklad. Uvažujme okruh (Z, +, ·). Množina všetkých párnych čísel tvorí podokruh(Z 2 , +, ·) okruhu Z. Ked’že súčin l’ubovol’ného celého čísla a párneho čísla je párne číslo,(Z 2 , +, ·) je ideálom okruhu Z.Pri štúdiu vlastností tzv. cyklických kódov budeme pracovat’ s algebraickou štruktúrounazvanou okruhom hlavných ideálov.Definícia 15.2.5. Nech je A komutatívny okruh. Ideál J okruhu A sa nazýva hlavnýmideálom, ak v okruhu A existuje prvok a, ktorý je generátorom cyklickej grupy ideálu J.Ideál J sa nazýva hlavným ideálom generovaným prvkom a.Definícia 15.2.6. Komutatvny okruh A nazývame okruhom hlavných ideálov, ak je každýideál okruhu A hlavný.Grupy bolo možné faktorizovat’ podl’a ich normálnych podgrúp a vytvárat’ faktorovégrupy. Podobne je možné faktorizovat’ okruhy. Úlohu normálnej podgrupy pri faktorizáciiokruhov zohráva ideál.Veta 15.2.2. Nech je I ideál okruhu A, +, ·); nech [a] = {a+I, a ∈ A} je trieda rozkladu A/Iaditívnej grupy (A, +) podl’a normálnej podgrupy (I, +) obsahujúca prvok (reprezentanta)a. Potom množina A/I tried rozkladu s operáciami +, · definovanými nasledovne[a] + [b] = [a + b],[a] · [b] = [a · b],kde a, b ∈ A, tvorí okruh. Ak je okruh A komutatívny, tak je aj okruh (A/I, +, ·) komutatívny.Dôkaz. Je priamočiary; stačí overit’ platnost’ axióm okruhu pre (A/I, +, ·). Prenechámepreto túto úlohu čitatel’ovi.Poznámka. Okruh (A/I, +, ·) nazýva faktorovým okruhom okruhu A podl’a I.Príklad. Uvažujme aditívnu faktorovú grupu (Z/Z q , +) Táto grupa má q prvkov: [0], . . . [q−1]; [j] = {m ∈ Z; m mod q = j; j = 0, . . . q − 1}. Operácia násobenia prvkov faktorovejgrupy (Z/Z q , +) je asociatívnaa platí distributívny zákon∀[a], [b], [c] ∈ Z/Z q ; [a] · ([b] · [c]) = ([a] · [b]) · [c]∀[a], [b], [c] ∈ Z/Z q ; [a] · ([b] + [c]) = ([a] · [b]) + [a] · [c],([b] + [c]) · [a] = [b] · [a] + [c] · [a].To znamená, že Z/Z q s uvedenou aditívnou a multiplikatívnou operáciou tvorí faktorovýokruh (Z/Z q , +, ·).Nie všetky okruhu celých čísel sa prenášajú automaticky do faktorového okruhu(Z/Z q , +, ·). Okruh celých čísel je oborom integrity, t.j. z rovnosti a · b = 0 vyplýva,že aspoň jeden z prvkov a, b je nulový. Uvažujme teraz faktorový okruh (Z/Z 6 , +, ·). Jezrejmé, že [2][3] = [2 · 3] = [6] = [0], pričom [2] ≠ [0], [3] ≠ [0].Na záver tejto časti zavedieme ešte jeden dôležitý pojem.

15.3. POLYNÓMY A OKRUHY POLYNÓMOV 195Definícia 15.2.7. Nech je R l’ubovol’ný okruh a existuje také kladné celé číslo n, že prel’ubovol’né r ∈ R platí nr = 0. Potom najmenšie také číslo n sa nazýva charakteristikouokruhu R. O okruhu R v takom prípade hovoríme, že má kladnú charakteristiku. Akkladné celé číslo n s požadovanými vlastnost’ami neexistuje, hovoríme, že okruh R mácharakteristiku 0.Príklad. Okruhy komplexných, reálnych, racionálnych, celých, prirodzených čísel majúcharakteristiku 0, okruh (Z/Z 6 , +, ·) má charakteristiku 6.Charakteristika okruhu nie je nezávislá od ostatných vlastností okruhu.Veta 15.2.3. Nech je R ≠ {0} obor integrity s jednotkou a kladnou charakteristikou. Potomje charakteristika R prvočíslo.Dôkaz. Ked’že R obsahuje nenulové prvky, R má charakteristiku n ≥ 2. Ak by n neboloprvočíslo, dalo by sa zapísat’ v podobe súčinu celých čísel, n = km, kde k, m ∈ Z, 1 k 2 , že k 1 e = k 2 e. Potom(k 1 − k 2 )e = 0, a teda dané pole má kladnú charakteristiku.15.3 Polynómy a okruhy polynómovĎalším dôležitým pojmom teórie samoopravných kódov je pojem polynómu. Kódové slovása dajú reprezentovat’ pomocou polynómov, syndrómy chýb sa dajú vypočítat’ dosadzovanímistých hodnôt do plynómov reprezentujcich prijaté slová a pozície chýb v kódovýchslovách sa dajú určit’ pomocou koreňov polynómu nazývaného lokátorom chýb.Zavedieme preto pojem polynómu a popíšeme najdôležitejšie vlastnosti polynómov.Nech je A unitárny komutatívny okruh 3 a nech je B jeho podokruh, obsahujúci jednotkovýprvok. Nech x ∈ A − B je l’ubovol’ný prvok. Prvky podokruhu B[x] sa podl’a vety3 v d’alšom budeme najčastejšie predpokladat’, že A je pole

196 KAPITOLA 15. ALGEBRA15.2.1 dajú vyjadrit’ v tvarea 0 + a 1 x + a 2 x 2 · · · + a n x n ; a k ∈ B, n ∈ N; (15.1)pričom pre n > 0 predpokladáme, že a n ≠ 0. V niektorých prípadoch by výber prvkux mohol viest’ k nejednoznačnosti vyjadrenia prvkov z okruhu B[x]. Predpokladajme, žeexistuje prvok, označme ho symbolom a(x), ktorý je možné vyjadrit’ v tvare 15.1 dvomarozličnými spôsobmia(x) = a 0 + a 1 x + a 2 x 2 · · · + a n x n = b 0 + b 1 x + b 2 x 2 · · · + b m x m .Bez ujmy na všeobecnosti budeme predpokladat’, že n ≥ m. Ukážeme, že jednoznačnost’vyjadrenia prvku a(x) je ekvivalentná jednoznačnosti vyjadrenia nulového prvku okruhuB[x] v tvare 15.1. Vypočítame rozdiel dvoch rozličných reprezentácií prvku a(x):0 = a(x) − a(x) = a 0 + a 1 x + a 2 x 2 · · · + a n x n − (b 0 + b 1 x + b 2 x 2 · · · + b m x m ) == (a 0 − b 0 ) + (a 1 − b 1 )x + (a 2 − b 2 )x 2 · · · + (a m − b m )x m + a m+1 x m+1 +· · · + a n x n . (15.2)Z rovnosti 15.2 vyplýva, že l’ubovol’ný prvok okruhu B[x] je možné vyjadrit’ jednoznačnev tvare 15.1 práve vtedy, ak rovnost’platí práve vtedy, ak0 = c 0 + c 1 x + · · · c n x nc 0 = c 1 · · · = c n = 0. (15.3)Ak totiž platí 15.3, pre vyjadrenie a(x) platí n = m a a k = b k k = 0, . . . , n. Prvokx ∈ A, pre ktorý je možné nulový prvok okruhu B[x] vyjadrit’ jednoznačne, t.j. platí15.3, sa nazýva transcendentým prvkom nad B; v opačnom prípade sa x nazýva algebraickýmprvkom nad B. Ak je prvok x transcendentný nad okruhom B, budemeokruh B[x] nazývat’ okruhom polynómov neurčitej x nad B. Prvky okruhu B[x] budemenazývat’ polynómami v neurčitej/premennej x, alebo len stručne, polynómami. Nech jea(x) ∈ B[x] polynóm, a(x) = a 0 + a 1 x + a 2 x 2 · · · + a n x n . Prvky a 0 , . . . , a n ∈ B nazývamekoeficientami a sčítance a k x k členmi polynómu. Ak n ≠ 0, číslo n nazývamestupňom polynómu, koeficient a n vedúcim koeficientom a člen a n x n vedúcim členompolynómu a(x). Stupeň polynómu f(x) budeme označovat’ symbolom deg(f(x)). Polynómf(x) = 0 nazvame nulovým polynómom a stupeň nulového polynómu definujeme akodeg(0) = −∞. Ak je vedúci člen polynómu a(x), a n = 1, polynóm a(x) nazývamenormovaným polynómom. Uvedieme ešte, že ak sú a(x), b(x) dva polynómy, a(x) =a 0 + a 1 x + · · · + a n x n ; b(x) = b 0 +b 1 x + · · · + b m x m , tak ich súčinom je polynóm a(x)b(x) =a 0 b 0 + (a 1 b 0 + a 0 b 1 )x + · · · + (a 0 b k + a 1 b k−1 + · · · + a k b 0 )x k + · · · + a n b m x m+n .Príklad. Množiny reálnych R a racionálnych Q čísel s operáciami sčítania a násobeniatvoria okruhy. Je zrejmé, že okruh racionálnych čísel je podokruhom reálnych čísel.Vyberieme rôzne reálne čísla x a vytvoríme okruhy Q[x].1. Vyberme najprv ako neurčitú racionálne číslo; x ∈ Q. Potom však Q[x] = Q, leboa 0 + a 1 x + · · · + a n x n ∈ Q pre x, a k ∈ Q.

15.3. POLYNÓMY A OKRUHY POLYNÓMOV 1972. Položíme teraz x = √ ( √2 ) 2k2; je zrejmé, že x ∉ Q. Nakol’ko však = 2 k ∈ Q,Q[x] = {a 0 + a 1√2; a0 , a 1 ∈ Q}. Naviac, napríklad prvok 4 sa dá vyjadrit’ v tvare15.2.1 viacerými spôsobmi: 4 = 4 + 0x + 0x 2 + · · · = 2 + 0x + 1x 2 = 2x 2 = x 4 , atd’.3. Napokon, položme x = e. Prvok e je transcendentný a okruh Q[e] tvoria prvky,ktoré sa dajú jednoznačne vyjadrit’ v tvarea 0 + a 1 e + · · · + e n e n ; n ∈ N, a k ∈ Q.V d’alšom sa budeme zaoberat’ delitel’nost’ou polynómov, a preto budeme skúmat’polynómy nad nejakým pol’om F. Okruh polynómov nad pol’om F budeme označovat’symbolom F[x].Definícia 15.3.1. Nech je F[x] okruh polynómov nad pol’om F a nech sú f(x), g(x) polynómyz okruhu F[x]. Budeme hovorit’, že polynóm g(x) delí polynóm (je delitel’om polynómu)f(x), ak v okruhu F[x] existuje taký polynóm q(x), že f(x) = g(x) · q(x).Je zrejmé, že každý polynóm je delitel’ný sebou samým, resp. (vzhl’adom na to, že Fje pole) prvkami pol’a F, ktoré predstavujú v okruhu F[x] polynómy nultého stupňa, resp.konštanty. Tieto delitele sú triviálne delitele polynómu. Ak polynóm f(x) nemá v okruhuF[x] iných delitel’ov okrem triviálnych, budeme ho nazývat’ ireducibilným polynómom vokruhu F[x]. Polynóm, ktorý nie je ireducibilný, budeme nazývat’ reducibilným polynómom.Pripomíname, že ireducibilita polynómu sa vzt’ahuje na istý okruh polynómov.Napríklad, polynóm f(x) = x 2 − 2 je ireducibilný v okruhu polynómov Q[x], ale v okruhuR[x] 4 má netriviálne delitele x − √ 2 a x + √ 2. Nech je f(x) = f 0 + f 1 x + · · · + f n x nje l’ubovol’ný polynóm okruhu F[x]. Pre l’ubovol’ný prvok a ∈ F definujeme hodnotuf(a) = f 0 + f 1 a + · · · + f n a n . Potom polynóm f(x) predstavuje zobrazenie (polynomickúfunkciu) f : F → F. Hodnotu f(a) budeme nazvat’ hodnotou polynómu f(x) pre prvok a.Dôležité sú tie prvky pol’a F, ktoré sa polynomickou funkciou zobrazujú na nulový prvokpol’a F.Definícia 15.3.2. Nech je f[x] okruh polynómov nad pol’om F a nech f(x) ∈ F[x] je polynóm.Prvok a ∈ F budeme nazývat’ koreňom polynómu f(x), ak f(a) = 0.V okruhu polynómov nemôžeme vo všeobecnosti zaviest’ delenie polynónov, ale podobneako pre okruh celých čísel môžeme aj v okruhu polynómov F[x] zaviest’ delenie sozvyškom.Veta 15.3.1 (O delitel’nosti polynómov). Nech sú f(x), g(x) l’ubovol’né polynómy nad pol’omF a nech g(x) ≠ 0. Potom v okruhu F[x] existujú polynómy q(x), r(x) také, žef(x) = q(x)g(x) + r(x), (15.4)kde deg(r(x)) < deg(g(x)) a polynómy q(x), r(x) sú určené jednoznačne.4 stačil by aj okruh polynómov Q[ √ 2][x]

198 KAPITOLA 15. ALGEBRADôkaz.Budeme robit’ indukciou vzhl’adom na stupeň polynómu f(x).1. Nech deg(f(x)) < deg(g(x)). Potom q(x) = 0 a r(x) = f(x).2. Predpokladajme, že tvrdenie vety platí pre deg(f(x)) ≥ deg(g(x)); deg(f(x)) < n.3. Dokážeme platnost’ tvrdenia vety pre deg(f(x)) = n, deg(f(x)) ≥ deg(g(x)). Nechf(x) = f n x n + · · · + f 1 x + f 0 ; g(x) = g m x m + · · · + g 1 x + g 0 , n > m. Odčítameod polynómu f(x) polynóm f n g −1m x n−m · g(x), kde g −1m je prvok pol’a F inverzný kvedúcemu koeficientu polynómu g(x) a dostaneme polynóm f 1 (x). Tento polynómmá stupeň deg(f 1 (x)) < n, a teda podl’a indukčného predpokladu existujú taképolynómy q 1 (x), r 1 (x) nad pol’om F, žef 1 (x) = q 1 (x)g(x) + r 1 (x).Potom však možno v tvare 15.4 vyjadrit’ aj polynóm f(x):f(x) = f 1 (x) + f n g −1m x n−m · g(x) = (f n g −1m x n−m + q i (x)) · g(x) + r 1 (x);t.j. r(x) = r 1 (x) a q(x) = f n g −1m x n−m + q i (x).Predpokladajme ešte, že existujú polynómy q ′ (x) ≠ q(x) a r ′ (x) ≠ r(x), také, žePotom všakq ′ (x)g(x) + r ′ (x) = f(x) = q(x)g(x) + r(x).0 = q(x)g(x) + r(x) − q(x) ′ g(x) − r ′ (x) = (q(x) − q ′ (x))g(x) + (r(x) − r ′ (x)).Predpokladajme, ža polynóm (r(x) − r ′ (x)) je nenulový. Ked’že polynóm (q(x) − q ′ (x))g(x)je bud’ nulový, alebo má stupeňdeg((q(x) − q ′ (x))g(x)) ≥ deg(g(x)) > max{deg(r(x)), deg(r ′ (x))} ≥ deg(r(x) − r ′ (x)),dostávame, že (q(x)−q ′ (x))g(x)+(r(x)−r ′ (x)) ≠ 0. Spor. To znamená, že (r(x)−r ′ (x)) = 0a (q(x) − q ′ (x))g(x) = 0. Ked’že g(x) ≠ 0, musí byt’ (q(x) − q ′ (x) = 0, a teda polynómy q(x)(podiel) a r(x) (zvyšok) sú určené jednoznačne.Vrátime sa ku skúmaniu vlastností okruhu polynómov F[x]. Zo skutočnosti, že vokruhu F[x] je definované delenie so zvyškom (veta 15.3.1), vyplýva známy fakt, že každýideál okruhu F[x] je hlavný; t.j. že okruh F[x] je okruhom hlavných ideálov.Veta 15.3.2. Nech je F[x] okruh polynómov nad pol’om F. Potom je F[x] okruhom hlavnýchideálov.Dôkaz. Ukážeme, že pre každý ideál J ≠ (0) okruhu F[x] existuje jednoznačne určenýnormovaný polynóm g(x) ∈ F[x] taký, že J = (g(x)). Ked’že F je pole, okruh F[x] jeoborom integrity. Nech je J =≠ (0) ideál okruhu F[x] a nech je h(x) polynóm najmenšiehostupňa, ktorý sa v J nachádza; nech je b vedúci koeficient polynómu h(x). Položímeg(x) = b −1 h(x). Je zrejmé, že g(x) ∈ J a g(x) je normovaný polynóm. Zoberieme teraz

15.3. POLYNÓMY A OKRUHY POLYNÓMOV 199l’ubovol’ný polynóm f(x) ∈ J a vyjadríme ho v tvare 15.4: f(x) = q(x)g(x) + r(x), pričomdeg(r(x)) < deg(g(x)) = deg(h(x)). Ked’že J je ideál, polynóm f(x) − q(x)g(x) = r(x) ∈ J.Nakol’ko h(x) bol polynóm najmenšieho stupňa v J, polynóm r(x) je nulový. To znamená,že (l’ubovol’ný polynóm z ideálu J) f(x) je násobkom polynómu g(x) a teda, J = (g(x).Ostáva ešte ukázat’ jednoznačnost’ výberu polynómu g(x). Predpokladajme, že existujeiný normovaný polynóm g 1 (x) ∈ F[x], ktorý je generátorom ideálu J. Potom však g(x) =c 1 (x)g 1 (x) a g 1 (x) = c 2 (x)g(x). Z uvedených rovností vyplýva, že g(x) = c 1 (x)c 2 (x)g(x),a teda polynómy c 1 (x), c 2 (x) sú konštantné. Ked’že obidva polynómy g(x), g 1 (x) sú normované,c 1 c 2 = 1, a teda g(x) = g 1 (x). Tým je dokázaná jednoznačnost’ určenia generátoraideálu J.Každý nenulový polynóm f(x) okruhu F[x] definuje (hlavný) ideál, (f(x)). Rozložímeteraz okruh F[x] podl’a ideálu (f(x)); triedy rozkladu budú množiny polynómov g(x) +(f(x)), kde g(x) ∈ F[x]. (Triedu rozkladu g(x)+(f(x)) budeme označovat’ symbolom [g(x)].)Dve triedy rozkladu, [a(x)], [b(x)] sa budú zhodovat’ práve vtedy, ak a(x) − b(x) ∈ (f(x));t.j. ak f(x)|(a(x)(¯x). Táto podmienka sa dá vyjadrit’ aj tak, že polynómy a(x), b(x) dávajúpo delení polynómom f(x) rovnaký zvyšok. Každá z tried rozkladu [g(x)] obsahujejediný polynóm r(x) ∈ F[x], stupňa deg(r(x)) < deg(f(x)). Tento polynóm sa dá vypočítat’ako zvyšok po delení polynómu g(x) polynómom f(x) a nazýva sa reprezentantomtriedy [g(x)]. Ukžeme ešte, že v každej triede rozkladu sa nachádza jediný polynómstupňa < deg(f(x)). Predpokladajme opak, t.j. nech r 1 (x), r(x) ∈ [g(x)] sú dva polynómystupňa < deg(f(x)), ktoré patria do tej istej triedy. Ale potom platí f(x)|r(x) − r 1 (x) adeg(r(x) − r 1 (x)) < deg(f(x)). To znamená, že r(x) − r 1 (x) = 0 a r(x) = r 1 (x). Ked’že každátrieda rozkladu obsahuje jediný polynóm stupňa < deg(f(x)), môžeme explicitne charakterizovat’triedy rozkladu F[x]/(f(x)): sú to množiny polynómov r(x) + (f(x)), kde r(x) ∈F[x] a deg(r(x)) < deg(f(x)). Ak na triedach z rozkladu F[x]/(f(x)) definujeme operáciesčítania a násobenia tradičným spôsobom; t.j. pre l’ubovol’né [a(x)], [b(x)] ∈ F[x]/(f(x))položíme[a(x)] + [b(x)] = [a(x) + b(x)], [a(x)] · [b(x)] = [a(x) · b(x)],dostávame okruh, ktorý budeme nazývat’ faktorovým okruhom polynómov nad pol’omF podl’a polynómu f(x). Faktorové okruhy polynómov budeme v d’alšom využívat’ prikonštrukcii konečných polí.Podobne ako v okruhu celých čísel, môžeme aj v okruhu polynómov nad pol’om F zaviest’pojem najväčšieho spoločného delitel’a a najmenšieho spoločného násobku polynómov.Definícia 15.3.3. Nech je F[x] okruh polynómov nad pol’om F a nech sú f(x), g(x) polynómyz okruhu F[x].1. Normovaný polynóm d(x) ∈ F[x] nazveme najväčším spoločným delitel’om polynómovf(x), g(x), ak d(x)|f(x), d(x)|g(x) a pre l’ubovol’ný polynóm h(x) ∈ F[x], ktorý delípolynómy f(x), g(x) platí h(x)|d(x). Najväčší spoločný delitel’ polynómov f(x), g(x)budeme označovat’ symbolom gcd(f(x), g(x))2. Normovaný polynóm a(x) ∈ F[x] nazveme najmenším spoločným násobkom polynómovf(x), g(x) (označenie lcm(f(x), g(x))), ak f(x)|a(x), g(x)|a(x) a pre l’ubovol’nýpolynóm b(x) ∈ F[x], ktorý je delitel’ný polynómami f(x), g(x) platí, že a(x)|b(x).

200 KAPITOLA 15. ALGEBRAVeta 15.3.3. Nech sú f(x), g(x) dva nenulové polynómy okruhu F[x]. Potom existujú taképolynómy a(x), b(x), žegcd(f(x), g(x)) = a(x)f(x) + b(x)g(x).Dôkaz. Uvažujme množinu polynómov J = {c 1 (x)f(x) + c 2 (x)g(x)} c 1 (x), c 2 (x) ∈ F[x].Je zrejmé, že J je ideál a že J ≠ (0). Okruh F[x] je okruhom hlavných ideálov, a pretoexistuje d(x) ∈ F[x], ktorý generuje ideál J. Vzhl’adom na to, ako sú vyjadrené prvkyideálu J z toho, že d(x) ∈ J vyplýva existencia polynómov a(x), b(x) takých, že d(x) =a(x)f(x)+b(x)g(x). Ukážeme ešte, že d(x) = gcd(f(x), g(x)). Oba polynómy f(x),g(x) patriado J, a preto d(x)|f(x) a d(x)|g(x). Ak by existoval iný (normovaný) polynóm, d 1 (x) taký,že (d 1 (x)) = J, d 1 (x)|d(x) a d(x)|d 1 (x), t.j. d(x) = d 1 (x).Najväčší spoločný delitel’ dvoch polynómov f(x), g(x) ∈ F[x] možno vypočítat’ pomocouEuklidovho algoritmu. Predpokladajme kvôli jednoduchosti, že g(x) ≠ 0 a že g(x) nie jedelitel’om polynómu f(x), potom budeme postupne delit’:f(x) = q 1 (x)g(x) + r 1 (x) 0 ≤ deg(r 1 (x)) < deg(g(x))g(x) = q 2 (x)r 1 (x) + r 2 (x) 0 ≤ deg(r 2 (x)) < deg(r 1 (x))r 1 (x) = q 3 (x)r 2 (x) + r 3 (x) 0 ≤ deg(r 3 (x)) < deg(r 2 (x))..r s−2 = q s (x)r s−1 (x) + r s (x) 0 ≤ deg(r s (x)) < deg(r s−1 (x))r s−1 = q s+1 (x)r s (x).V tejto postupnosti sú q 1 (x), . . . , q s+1 (x); r 1 (x) . . . , r s (x) polynómy okruhu F[x]. Kedžedeg(g(x)) je konečný a v každom kroku sa stupeň polynómu r i (x) zmenšuje, procedúrapo konečnom počte krokov skončí. Nech má polynóm r s (x) vedúci koeficient a, potomnajväčší spoločný delitel’ polynómov f(x), g(x) vyjadríme nasledovne: gcd(f(x), g(x)) =a −1 r s (x). Normované polynómy f(x), g(x) ∈ F[x] nazveme nesúdelitel’nými (relativelyprime), ak gcd(f(x), g(x) = 1.Dôležitú úlohu pri štúdiu vlastností okruhu polynómov F[x] zohrávajú ireducibilnépolynómy. Každý polynóm z F[x] sa dá totiž jednoznačne vyjadrit’ ako súčin ireducibilnýchpolynómov. Skôr ako formulujeme a dokážeme tento poznatok, využijeme vetu odelitel’nosti polynómov na ustanovenie vzt’ahu medzi koreňmi polynómu a delitel’nost’oupolynómu.Veta 15.3.4. Nech je f(x) l’ubovol’ný polynóm nad pol’om F a nech je c l’ubovol’ný prvokpol’a F. Potom polynóm (x − c) delí polynóm f(x) práve vtedy, ak je c koreňom polynómuf(x).Dôkaz. Nech polynóm (x − c) delí polynóm f(x), potom existuje taký polynóm f 1 (x), žef(x) = (x − c)f 1 (x). Potom však f(c) = (c − c)f 1 (c) = 0, a teda c je koreňom polynómu f(x).Nech na druhej strane f(c) = 0; t.j. prvok c je koreňom polynómu f(x). Podl’a vety 15.3.1sa polynóm f(x) dá vyjadrit’ nasledovne:f(x) = (x − c)q(x) + r(x),

15.4. KONEČNÉ POLIA 201pričom deg(r(x)) < deg(x − c) = 1. To však znamená, že r(x) musí byt’ konštantnýpolynóm. Ale f(c) = (c − c)q(c) + r(c) = r(c) = 0, a teda r(x) = 0.Veta 15.3.5. Nech sú f 1 (x), . . . , f m (x) ∈ F[x], nech je g(x) ∈ F[x] ireducibilný polynóm.Potom platí: ak g(x) delí súčin f 1 (x) · f 2 (x) . . . f m (x), tak potom g(x) delí aspoň jeden zpolynómov f 1 (x), . . . , f m (x).Dôkaz.Veta 15.3.6 (O jednoznačnej faktorizácii polynómov). Nech je f(x) ∈ F[x] l’ubovol’nýpolynóm stupňa deg(f(x)) ≥ 0. Potom sa f(x) dá zapísat’ v tvare súčinuf(x) = af 1 (x) e1 · · · f m (x) e m, (15.5)kde a ∈ F, e 1 , . . . , e m ∈ N a f 1 (x), . . . , f m (x) sú navzájom rôzne normované ireducibilnépolynómy z F[x]. Naviac, odhliadnuc od poradia činitel’ov v rozklade 15.5, je rozkladpolynómu f(x) určený jednoznačne.Dôkaz budeme viest’ matematickou indukciou vzhl’adom na stupeň polynómu. Prípadn = 1 je triviálny, nakol’ko polynómy stupňa 1 sú ireducibilné nad F[x]. Predpokladajme,že sa l’ubovol’ný polynóm stupňa menšieho ako n dá zapísat’ v tvare 15.5. Ukážeme, žeaj polynóm stupňa n možno rozložit’ na súčin ireducibilných polynómov v tvare 15.5. Akje f(x) ireducibilný polynóm, stačí ho normovat’, t.j. vyjadrit’ v tvare a −1 f(x), kde a jevedúci koeficient polynómu f(x). Ak polynóm f(x) nie je ireducibilný, možno ho vyjadrit’v tvare súčinu aspoň dvoch polynómov; f(x) = g 1 (x)g 2 (x). Oba polynómy g 1 (x), g 2 (x)majú stupeň 1 ≤ deg(g 1 (x)), deg(g 2 (x)) < n, a preto ich podl’a indukčného predpokladumožno vyjadrit’ v tvare 15.5.Ostáva ukázat’ jednoznačnost’ rozkladu 15.5. Predpokladajme, že existujú dva rozličnérozklady polynómu f(x); t.j.f(x) = af 1 (x) e1 · · · f m (x) em = bg 1 (x) d1 · · · g s (x) ds . (15.6)Vedúce koeficienty v rozličných vyjadreniach toho istého polynómu sa musia zhodovat’,preto a = b. Zoberieme teraz napríklad polynóm f 1 (x). Ked’že f 1 (x) delí polynóm f(x),musí delit’ aj g 1 (x) d 1· · · g s (x) d s. Ale f(x) je ireducibilný polynóm, a potom podl’a predchádzajúcejvety musí delit’ niektorý z polynómov g j (x), napríklad g k (x). Ale aj g k (x)je ireducibilný nad F[x], a teda f 1 (x) = cg k (x), kde c ∈ F. Oba polynómy f 1 (x), g k (x) súnormované, a teda f 1 (x) = g k (x). Vydelíme rovnost’ 15.6 polynómom f 1 (x)(= g k (x)) aanalogickým spôsobom budeme riešit’ novú identitu. Nakol’ko v každom kroku sa znížistupeň polynómov v identite, po konečnom počte iterácií dostaneme identitu 1 = 1. Týmsme dokázali, že obe faktorizácie polynómu f(x) sú, až na poradie činitel’ov v súčine,identické.15.4 Konečné poliaPole, ako sme uviedli v definícii 15.2.2, je okruh, ktorého množina nenulových prvkovtvorí komutatívnu grupu vzhl’adom na multiplikatívnu operáciu. Príkladmi polí sú

202 KAPITOLA 15. ALGEBRAmnožiny komplexných, reálnych a racionálnych čísel s operáciami sčítania a násobenia.Na druhej strane, celé čísla tvoria okruh (dokonca obor integrity), ale nie pole. Spomínanépolia sú nekonečné. V teórii kódovania pracujeme a konečnými množinami, a pretobudeme využívat’ polia s konečným počtom prvkov — konečné polia. Uvedieme najprvkonečné polia založené na okruhu celých čísel a potom sa budeme zaoberat’ konečnýmipol’ami vychádzajúcimi z okruhu polynómov.Pripomenieme, že (Z, +, ·) je okruh (obor integrity) a (Z/Z q , +, ·) je faktorový okruh,ktorého prvkami sú triedy rozkladu [0], . . . , [q − 1]. Kým okruh (Z, +, ·) nemohol byt’pol’om (s výnimkou 1 a -1 inverzné prvky k celým číslam nie sú celé čísla), faktorovýokruh (Z/Z q , +, ·) za istých podmienok môže byt’ pol’om .Veta 15.4.1. Faktorový okruh (Z, +, ·) je pol’om práve vtedy, ak je q prvočíslo.Dôkaz. Nech je q prvočíslo. Potrebujeme ukázat’, že ku každému nenulovému prvkuokruhu (Z/Z q , +, ·) existuje v tomto okruhu inverzný prvok. Pripomenieme najprv, ženulovým prvkom okruhu (Z/Z q , +, ·) je [0] a jednotkovým trieda [1]. Nech je s celé číslo,s ∈ {1, . . . , q − 1}. Ked’že q je prvočíslo, platí gcd(s, q) = 1 a teda existujú také dve celéčísla a, b, žeaq + bs = gcd(s, q) = 1.To znamená, že[1] = [aq + bs] = [aq] + [bs] = [0] + [bs] = [bs] = [b][s],a teda [b] je inverzným prvkom k prvku [s] a faktorový okruh (Z/Z q , +, ·) je pol’om.Na druhej strane, predpokladajme, že okruh (Z/Z q , +, ·) je pole, ale q nie je prvočíslo,t.j. q je zložené číslo a dá sa zapísat’ ako súčin čísel q = q 1 q 2 , kde 1 < q 1 , q 2 < q. Kedže(Z/Z q , +, ·) je pole, k nenulovému prvku [q 1 ] existuje v poli inverzný prvok, [q −11]. Potomplatíspor.[0] ≠ [q 2 ] = [q 1 ][q −11 ][q 2] = [(q 1 · q −11 ) · q 2] = [q 1 · (q −11· q 2 )] = [q 1 · q] = [0],Zjednodušíme trocha výpočty v poli (Z/Z q , +, ·) zavedením vhodnejšej reprezentácie.Uvažujme množinu celých čísel F q = {0, . . . , q − 1} a definujeme operácie sčítania ⊕ anásobenia ⊗ prvkov z F q nasledovne (a, b ∈ F q ):a ⊕ b = (a + b) mod q, a ⊗ b = ab mod q.Definujeme teraz zobrazenie ϕ : Z/Z q → F q ;bijekcia. Ukážeme, že je aj homomorfizmus:ϕ([a]) = a mod q. Je zrejmé, že ϕ jeϕ([a] + [b]) = ϕ([a + b]) = a + b mod q = a ⊕ b = ϕ([a]) ⊕ ϕ([b])ϕ([a][b]) = ϕ([a · b]) = a · b mod q = a ⊗ b = ϕ([a]) ⊗ ϕ([b]).Z vyššie uvedeného vyplýva, že ϕ je izomorfizmus, (F q , ⊕, ⊗) je konečné pole a polia(Z/Z q , +, ·) a (F q , ⊕, otimes) sú izomorfné. Pole (F q , ⊕, ⊗) budeme nazývat’ Galoisovým

15.4. KONEČNÉ POLIA 203pol’om a označovat’ symbolom GF(q). Tam, kde to nepovedie k nedorozumeniu, budemeoperácie pol’a GF(q) označovat’ štandardným spôsobom — ako + a ·.Podobne ako sme zaviedli konečné polia GF(q) pomocou okruhu celých čísel, zavediemeteraz rozšírenia konečných polí pomocou okruhu polynómov.Veta 15.4.2. Nech je F[x] okruh polynómov nad pol’om F, f(x) ∈ F[x] a F[x]/(f(x)) je faktorovýokruh polynómov nad pol’om F. Potom F[x]/(f(x)) je pol’om práve vtedy, ak jepolynóm f(x) ireducibilný polynóm okruhu F[x].Dôkaz. Predpokladajme, že polynóm f(x) je ireducibilný polynóm okruhu F[x]. Ukážeme,že k l’ubovol’nému nenulovému prvku faktorového okruhu F[x]/(f(x)) existuje v tomtookruhu inverzný prvok; t.j.∀(g(x)) ∈ F[x]/(f(x)); (g(x)) ≠ (0)∃(h(x)) ∈ F[x]/(f(x)); (f(x))(h(x)) = (1)Nech (g(x)) ∈ F[x]/(f(x)) je l’ubovol’ný nenulový prvok faktorového okruhu. Bez ujmyna všeobecnosti môžeme predpokladat’, že deg(g(x)) < deg(f(x)). Ked’že polynóm f(x)je ireducibilný polynóm nad pol’om F, gcd(f(x), g(x)) = 1 a existujú také dva polynómya(x), b(x) ∈ F[x], žea(x)f(x) + b(x)g(x) = gcd(f(x), g(x)) = 1.To znamená, že(a(x)f(x) + b(x)g(x)) = (a(x)f(x)) + (b(x)g(x)) = (0) + (b(x))(g(x)) = (b(x))(g(x)) = (1)a prvok (b(x)) je inverzným prvkom prvku (g(x)) faktorového okruhu F[x]/(f(x)).Opačne, nech faktorový okruhu F[x]/(f(x)) je pole a nech polynóm f(x) je reducibilnýpolynóm okruhu F[x].To znamená, že v okruhu F[x] existujú polynómy f 1 (x) a f 2 (x) také,že f(x) = f 1 (x)f 2 (x) a 0 < deg(f 1 (x)), deg(f 2 (x)) < deg(f(x)). Ked’že F[x]/(f(x)) je pole kprvku (f 1 (x)) ∈ F[x]/(f(x)) existuje v tomto poli inverzný prvok, trieda (f 1 (x) −1 ). Potomplatíspor.(0) ≠ (f 2 (x)) = (1)(f 2 (x)) = (f 1 (x) −1 )(f 1 (x))(f 2 (x)) = (f 1 (x) −1 f 1 (x)f 2 (x)) == (f 1 (x) −1 f(x)) = (f 1 (x) −1 )(0) = (0)Z predchádzjúcej vety vyplýva, že ak je dané konečné pole GF(q) a polynóm f(x) ∈GF(q)[x] ireducibilný v okruhu polynómov GF(q)[x], tak môžeme skonštruovat’ konečnépole GF(q)[x]/(f(x)), ktoré bude mat’ rád q deg(f(x)) . Otvorenou zostáva otázka, či existujúireducibilné polynómy potrebných stupňov. Skôr, ako sa budeme zaoberat’ týmitoproblémami, ilustrujeme na príklade konštrukciu konečného pol’a pomocou faktorovéhookruhu polynómov.Príklad. Pri konštrukcii tzv. BCH kódov budeme využívat’ konečné pole GF(2 4 ). Prijeho konštrukcii budeme vychádzt’ z binárneho konečného pol’a GF(2). Potrebujeme

204 KAPITOLA 15. ALGEBRANo stupeň polynóm rozklad poznámka1 0 0 0 prvok pol’a2 0 1 1 prvok pol’a3 1 x x ireducibilný4 1 x + 1 x + 1 ireducibilný5 2 x 2 x · x reducibilný6 2 x 2 + 1 (x + 1) 2 reducibilný7 2 x 2 + x x · (x + 1) reducibilný8 2 x 2 + x + 1 x 2 + x + 1 ireducibilný9 3 x 3 x · x · x reducibilný10 3 x 3 + 1 (x + 1)(x 2 + x + 1) reducibilný11 3 x 3 + x x(x + 1) 2 reducibilný12 3 x 3 + x 2 x 2 (x + 1) reducibilný13 3 x 3 + x + 1 x 3 + x + 1 ireducibilný14 3 x 3 + x 2 + 1 x 3 + x 2 + 1 ireducibilný15 3 x 3 + x 2 + x x · (x 2 + x + 1) reducibilný16 3 x 3 + x 2 + x + 1 (x + 1) 3 reducibilnýTabul’ka 15.1: Polynómy stupňa 0, 1, 2, 3 nad pol’om GF(2)nájst’ ireducibilný polynóm stupňa 4 nad pol’om GF(2). Polynóm stupňa 4 nad binárnympol’om má tvara 0 + a 1 x + a 2 x 2 + a 3 x 3 + a 4 x 4 , a i ∈ {0, 1}, i = 0, . . . , 4.Aby mal polynóm požadovaný stupeň (4), a 4 = 1 a na výber ostatných 4 koeficientovzostáva 2 4 = 16 možností. Aby bol hl’adaný polynóm ireducibilný, nesmie byt’ delitel’nýiným polynómom nižšieho stupňa. To znamená, že stačí overit’, či je daný polynómdelitel’ný ireducibilnými polynómami stupňa 1 a 2. V tabul’ke 15.1 uvádzame polynómystupňa 3 a menšieho nad pol’om GF(2).Preveríme teraz 16 polynómov stupňa 4 nad pol’om GF(2) na delitel’nost’ ireducibilnýmipolynómami stupňa 0, 1, 2, 3. Výsledky sú uvedené v tabul’ke 15.2.Okruh polynómov GF(2)[x] budeme faktorizovat’ pomocou ireducibilného polynómuf(x) = x 4 + x + 1. Prvkami pol’a GF(2)[x]/x 4 + x + 1 sú triedy rozkladu okruhu polynómovGF(2)[x] podl’a ireducibilného polynómu f(x). V jednej triede rozkladu sú tie polynómyokruhu polynómov GF(2)[x], ktorých rozdiel je delitel’ný polynómom f(x). Je zrejmé, žev každej triede rozkladu existuje práve jeden polynóm stupňa 3 alebo menšieho, ktorýbudeme nazývat’ predstavitel’om triedy. Ked’že polynómov okruhu GF(2)[x] stupňa 3 amenšieho je 16, pole GF(2)[x]/x 4 + x + 1 obsahuje 16 prvkov. V tabul’ke 15.3 uvádzameprvky pol’a GF(2)[x]/x 4 +x+1; prvok (trieda rozkladu) je reprezentovaný predstavitel’omtriedy.Kvôli lepšiemu prehl’adu zhrnieme najdôležitejšie poznatky o konečných poliach vnasledujúcej tabul’ke [2]. Čast’ z nich sme už dokázali, dokazovaním ostatných poznatkovsa budeme zaoberat’.

15.4. KONEČNÉ POLIA 205No stupeň polynóm rozklad poznámka1 4 x 4 x 4 R2 4 x 4 + 1 (x + 1) 4 R3 4 x 4 + x x · (x + 1)(x 2 + x + 1) R4 4 x 4 + x + 1 x 4 + x + 1 I5 4 x 4 + x 2 x 2 · (x + 1) 2 R6 4 x 4 + x 2 + 1 (x 2 + x + 1) 2 R7 4 x 4 + x 2 + x x · (x 3 + x + 1) R8 4 x 4 + x 2 + x + 1 (x + 1) · (x 3 + x 2 + 1) R9 4 x 4 + x 3 x · (x 3 + x 2 + 1) R10 4 x 4 + x 3 + 1 x 4 + x 3 + 1 I11 4 x 4 + x 3 + x x · (x 3 + x 2 + 1) R12 4 x 4 + x 3 + x 2 x 2 (x 2 + x + 1) R13 4 x 4 + x 3 + x + 1 (x + 1) 2 · (x 2 + x + 1) R14 4 x 4 + x 3 + x 2 + 1 (x + 1) · (x 3 + x + 1) R15 4 x 4 + x 3 + x 2 + x x · (x + 1) 3 R16 4 x 4 + x 3 + x 2 + x + 1 x 4 + x 3 + x 2 + x + 1 ITabul’ka 15.2: Polynómy stupňa 4 nad pol’om GF(2)1 (x)2 (x 2 )3 (x 3 )4 (x + 1)5 (x 2 + x)6 (x 3 + x 2 )7 (x 3 + x + 1)8 (x 2 + 1)9 (x 3 + x)10 (x 2 + x + 1)11 (x 3 + x 2 + x)12 (x 3 + x 2 + x + 1)13 (x 3 + x 2 + 1)14 (x 3 + 1)15 (1)16 (0)Tabul’ka 15.3: Prvky pol’a GF(2)[x]/x 4 + x + 1

206 KAPITOLA 15. ALGEBRA1. Rád (počet prvkov) l’ubovol’ného konečného pol’a je mocninou prvočísla.2. Pre l’ubovol’né prvočíslo p a celé kladné číslo m je najmenším podpol’om pol’a GF(p m )pole GF(p). Prvky pol’a GF(p) sa nazývajú celými číslami pol’a GF(p m ) a číslo pjeho charakteristikou3. V konečnom poli charakteristiky 2 pre l’ubovol’ný prvok pol’a β platí β = −β.4. Pre l’ubovol’né prvočíslo p a celé kladné číslo m existuje konečné pole s p m prvkami.5. Každé konečné pole GF(q) obsahuje aspoň jeden primitívny prvok.6. Kad každým konečným pol’om existuje pre l’ubovol’né kladné celé číslo m primitívnypolynóm stupňa m.7. Každý primitívny prvok pol’a GF(q) má nad l’ubovol’ným podpol’om pol’a GF(q)ireducibilný minimálny polynóm.8. Dve konečné polia s tým istým počtom prvkov sú izomorfné.9. Pre l’ubovol’né q, ktoré je mocninou prvočísla a l’ubovol’né celé kladné číslo m jepole GF(q) podpol’om pol’a GF(q m ) a pole GF(q m ) je rozšírením pol’a GF(q).10. Ak číslo n nie je delitel’om čísla m, tak pole GF(q n ) nie je podpol’om pol’a GF(q m ).11. Pre l’ubovol’ný prvok pol’a GF(q m ) stupeň jeho minimálneho polynómu nad GF(q)delí m.Konečné pole predstavuje aditívnu abelovskú grupu a množina jeho nenulových prvkovje multiplikatívna abelovská grupa. V d’alšom budeme pracovat’ s multiplikatívnougrupou konečného pol’a.Veta 15.4.3. Nech je GF(q) konečné pole a β 1 , . . . , β q−1 sú jeho nenulové prvky. Potomplatíx q−1 − 1 = (x − β 1 )(x − β 2 ) . . . (x − β q−1 ).Dôkaz. Stačí ukázat’, že l’ubovol’ný nenulový prvok pol’a GF(q) je koreňom polynómux q−1 − 1. Uvažujme prvok β. Jeho mocniny β, β 2 , . . . , β h = 1 tvoria podgrupu multiplikatívnejgrupy pol’a GF(q). Rád podgrupy, generovanej prvkom β delí rád multiplikatívnejgrupy pol’a GF(q); h|(q − 1). To znamená, že existuje kladné celé číslo k také,že hk = (q − 1). Potom však β q = β hk = (β h ) k = 1 k = 1, a teda β je koreňom polynómux q−1 − 1.Reprezentácia konečných polí pomocou tried polynómov bola trocha neprehl’adná.Ukážeme, že multiplikatívna grupa konečného pol’a je cyklická a budeme reprezentovat’(nenulové) prvky konečného pol’a mocninami generátora jeho cyklickej multiplikatívnejgrupy.Veta 15.4.4. Multiplikatívna grupa konečného pol’a GF(q) je cyklická.

15.4. KONEČNÉ POLIA 207Dôkaz. Budeme postupovat’ podl’a [2]. Multiplikatívna grupa konečného pol’a GF(q)má rád q − 1. Ak by bolo číslo q − 1 prvočíslo (napr. 3, 7, 31, 127, . . . ), tvrdenie vety by bolotriviálne. Podl’a predchádzajúcej vety musí rád každého nenulového prvku delit’ q − 1.To znamená, že nenulové prvky majú bud’ rád 1 alebo rád q − 1. Jednotkový prvok pol’aGF(q) má rád 1 a všetky ostatné nenulové prvky majú rád q − 1 a teda sú generátormimultiplikatívnej grupy konečného pol’a GF(q).Nech je číslo q − 1 zložené. Potom ho možno jednoznačne rozložit’ na súčin prvočísel:q − 1 = p ν 11 · · · pν ssPolynóm x (q−1)/p i− 1 môže mat’ najviac (q − 1)/p i koreňov, to znamená, že v poli GF(q)existuje nenulový prvok, ktorý nie je koreňom polynómu x (q−1)/p i− 1. Označíme tentoprvok symbolom a i . Je zrejmé, že pre l’ubovol’né i, i = 1, . . . , s existuje nenulový prvoka i pol’a GF(q) taký, že a (q−1)/p ii≠ 1. Na základe prvkov a i zostrojíme teraz prvky b i a bpol’a GF(q):b i = a (q−1)/pν iiia b = b 1 b 2 . . . b sa ukážeme, že rád prvku b je q − 1; t.j. že b je generátor multiplikatívnej grupy pol’aGF(q) a tým aj to, že táto grupa je cyklická.Najprv ukážeme, že rád prvku b i je p ν ii. Platí(b pν iii=a (q−1)/pν iii) pν ii= a (q−1)i= 1.To znamená, že rád prvku b i delí p ν ii, t.j. má tvar pn ii, pričom n i ≤ ν i . Predpokladajme,že n i < ν i . Potom by ajb pν i −1ii= b pn ii·p ν i −n iii=(b pn iii) pν i −n ii= (1) pν i −n ii = 1.Ale(b pν i −1ii=a (q−1)/pν iii) pν i −1i= a (q−1)/p ii≠ 1.To znamená, že n i = ν i . Teraz ukážeme, že rád prvku b sa rovná q − 1. Predpokladajme,že rád prvku b je n; t.j. b n = 1. Pre l’ubovol’né i = 1, . . . , s platíb n·pν 11 ···pν ss/p ν ii = 1.Vyjadríme teraz prvok b pomocou prvkov b i a využijeme to, že b pν iii= 1:(b 1 b 2 . . . b s ) n·pν 1· (b i ) n·pν 1= (1) n·pν 21 ···pν ss2 ···pν ss. . . (1) n·pν 11 ···pνs s/p ν ii = (b 1 ) n·pν 11 ···pνs s/p ν ii/p ν ii (b i+1 ) pν i+1i+1 n·pν 11 ···pν ss /(p ν i+1/p ν ii . . . (1) n·pν 11 ···pν s−1s−11 ···pν ss/(pν ii ) = (b i ) n·pν 1i+1 ·pν ii/p ν iipν i−1i−1 · (b i ) n·pν 11 ···pν ss/(p ν ii ) = 1.. . . (b i−1 ) pν i−1i−1 n·pν 1) . . . (b s ) pν ss n·p ν 11 ···pν ss1 ···pνs s1 ···pν s−1s−1/(p ν i−1i−1 ·pν ii ) ·/pν ii =/p ν ii (1) n·pν 11 ···pν ss /(p ν i+1i+1 ·pν ii ) . . .

208 KAPITOLA 15. ALGEBRAZ toho, že rád prvku b i je p ν iia z poslednej rovnosti vyplýva, že, že p ν iidelí n pre i, . . . , s.Čísla p ν iisú však navzájom nesúdelitel’né, a to znamená, žen = p ν 11 · · · pν ss = q − 1.Prvok b rádu q − 1, ktorého existenciu sme dokázali v predchádzajúcej vete, je primitívnymprvkom pol’a GF(q). Tým sme zároveň dokázali nasledujúce dôležité tvrdenie.Dôsledok 2. V každom konečnom poli existuje primitívny prvok.Vrátime sa k pol’u GF(2 4 ) = GF(2)[x]/x 4 + x + 1 z príkladu 15.4 a nájdeme jeho primitívnyprvok. Pole GF(2 4 ) sme zostrojili faktorizáciou okruhu polynómov GF(2)[x] pomocoupolynómu f(x) = x 4 + x + 1. Uvažujme teraz prvok (x) pol’a GF(2 4 ); (x) predstavujetriedu polynómov z okruhu GF(2)[x], ktoré po delení polynómom f(x) dávajú zvyšok x.Dosadíme prvok (x) do polynómu f(x). Vzhl’adom na uzavretost’ pol’a GF(2 4 ) na sčítaniea násobenie dostaneme opät’ prvok pol’a GF(2 4 ). Pripomenieme ešte, že pre l’ubovol’néa(x), b(x) ∈ GF(2)[x] platí(a(x)) + (b(x)) = (a(x) + b(x)),(a(x))(b(x)) = (a(x)b(x)).Postupne dostávamef((x)) = (x) 4 + (x) + 1 = (x 4 ) + (x + 1) = (x 4 + x + 1) = (0).To znamená, že prvok (x) je koreňom polynómu x 4 +x+1. Označíme prvok (x) symbolomα a ukážeme, že (zhodou okolností) je α primitívnym prvkom pol’a GF(2 4 ). Vyjadrenieprvkov pol’a GF(2 4 ) v podobe mocnín primitívneho prvku α je uvedené v tabul’ke 15.6V prvom stĺpci tabul’ky 15.6 je exponent mocniny primitívneho prvku α, v druhom jeuvedená mocnina α i , v tret’om je binárny kód príslušného prvku a vo štvrtom je prvok α ivyjadrený v podobe lineárnej kombinácie mocnín prvkov α 3 , α 2 , α 1 , α 0 . Posledný stĺpecsi zasluhuje vysvetlenie. Zápis prvkov konečného pol’a pomocou mocnín primitívnehoprvku umožňuje jednoducho realizovat’ násobenie prvkov pol’a. Pre l’ubovol’né dva prvkypol’a α i , α j ∈ GF(2 4 ) platí α i α j = α i+j = α (i+j) mod 15 . Na druhej strane, aj ked’ je poleGF(2 4 ) aditívna abelovská grupa, určit’ prvok, ktorý predstavuje súčet α i + α j nie je pritejto reprezentácii prvkov pol’a GF(2 4 )jednoduché.Ukážeme, že sa každý prvok pol’a GF(2 4 ) dá zapísat’ pomocou lineárnej kombinácieprvkov α 3 , α 2 , α 1 , α 0 jednoznačným spôsobom. Nulový prvok pol’a sa dá zapísat’ v podobelineárnej kombinácia s nulovými koeficientami. Vieme, že 1 = α 0 a predpokladajme, žesa všetky mocniny α i , 0 ≤ i ≤ n dajú vyjadrit’ v tvare lineárnej kombinácie prvkovα 3 , α 2 , α 1 , α 0 . Ukážeme, že potom takto dá vyjadrit’ aj prvok α n+1 . Nech α n = a 3 α 3 +a 2 α 2 + a 1 α 1 + a 0 . Potomα n+1 = α n · α = a 3 α 4 + a 2 α 3 + a 1 α 2 + a 0 α.Ked’že α je koreňom polynómu x 4 + x + 1, platí α 4 + α + 1 = 0 a (ked’že pole GF(2 4 ) mácharakteristiku 2, a teda −α 4 = α 4 )platí α 4 = α + 1. Využijeme tento vzt’ah a upravímelineárnu kombináciu pre α n+1 :α n+1 = a 2 α 3 + a 1 α 2 + a 0 α + a 3 (α + 1) = a 2 α 3 + a 1 α 2 + (a 0 + a 3 )α + a 3 .

15.4. KONEČNÉ POLIA 2090 α 0 0001 11 α 1 0010 α2 α 2 0100 α 23 α 3 1000 α 34 α 4 0011 +α +15 α 5 0110 α 2 +α6 α 6 1100 α 3 +α 27 α 7 1011 α 3 +α +18 α 8 0101 α 2 +19 α 9 1010 α 3 +α10 α 10 0111 α 2 +α +111 α 11 1110 α 3 +α 2 +α12 α 12 1111 α 3 +α 2 +α +113 α 13 1101 α 3 +α 2 +114 α 14 1001 α 3 +115 α 15 0001 1Tabul’ka 15.4: Reprezentácia nenulových prvkov GF(2 4 )Ostáva ešte ukázat’, že vyjadrenie α i je jednoznačné. Predpokladajme opak, t.j.Potom všakα i = a 3 α 3 + a 2 α 2 + a 1 α 1 + a 0 = b 3 α 3 + b 2 α 2 + b 1 α 1 + b 0 .0 = a 3 α 3 + a 2 α 2 + a 1 α 1 + a 0 − b 3 α 3 + b 2 α 2 + b 1 α 1 + b 0 == (a 3 − b 3 )α 3 + (a 2 − b 2 )α 2 + (a 1 − b 1 )α 1 + (a 0 − b 0 ).Z poslednej rovnosti vyplýva, že a 3 = b 3 , a 2 = b 2 , a 1 = b 1 , a 0 = b 0 , a teda vyjadrenieprvku pol’a v podobe lineárnej kombinácie mocnín primitívneho prvku je jednoznačné.Poznámka. Ak budeme reprezentovat’ prvky pol’a GF(2 4 ) pomocou 4-bitových celýchčísel, výpočet α i+1 možno realizovat’ nasledovne:if (a > 7) then : a 3 = 1a = (a

210 KAPITOLA 15. ALGEBRANa konštrukciu konečného pol’a nám stačil l’ubovol’ný ireducibilný polynóm. V príklade,ktorý sme uviedli, bol koreň ireducibilného polynómu použitého na vytvorenie pol’azároveň aj primitívnym prvkom zostrojeného pol’a. Takýto polynóm sa nazýva primitívnympolynómom.Definícia 15.4.1. Nech je dané konečné pole GF(q) a ireducibilný polynóm f(x) nad týmtopol’om. Polynóm f(x) sa nazýva primitívnym polynómom nad pol’om GF(q), ak koreňomjpolynómu f(x) v rozšírení pol’a GF(q), poli GF(q)[x]/f(x) je primitívny prvok pol’aGF(q)[x]/f(x).Pripomíname, že nie každý ireducibilný polynóm f(x) nad pol’om GF(q) je zároveňprimitívnym polynómom. Na druhej strane, pre l’ubovol’né konečné pole GF(q) existujúprimitívne polynómy (nad pol’om GF(q)) l’ubovol’ného stupňa.Príklad. Uvažujme ireducibilný polynóm f(x) = x 4 + x 3 + x 2 + x + 1 nad pol’om GF(2).Tento polynóm má v poli GF(2)[x]/x 4 +x 3 +x 2 +x+1 korene (x) = β; β 2 , β 3 , β 4 . Využijemevzt’ah β 4 + β 3 + β 2 + β + 1 = 0 a vyjadríme β 4 pomocou lineárnej kombinácie nižšíchmocnín prvku β: β 4 = β 3 + β 2 + β + 1. Jednotlivé mocniny sú uvedené v tabul’ke 15.5.0 β 0 0001 11 β 1 0010 β2 β 2 0100 β 23 β 3 1000 β 34 β 4 1111 β 3 +β 2 +β +15 β 5 0001 1Tabul’ka 15.5: Mocniny prvku β pol’a GF(2 4 )Prvok β má teda rád 5. (Pomocou tabul’ky 15.5 l’ahko dokážeme, že rád 5 majú ajostatné korene polynómu f(x), prvky β 2 , β 3 , β 4 ). Ireducibilný polynóm x 4 + x 3 + x 2 + x + 1nad pol’om GF(2) teda nie je primitívny.V d’alšej časti budeme pokračovat’ v skúmaní základných vlastností konečných polí.Vieme, že charakteristika konečného pol’a je prvočíslo. V akom vzt’ahu je pole GF(p m ) scharakteristikou p s konečným pol’om GF(p)?Veta 15.4.6. Nech je GF(q) l’ubovol’né konečné pole, potom GF(q) obsahuje jediné konečnépole, ktorého rád je charakteristikou pol’a GF(q).Dôkaz. Nech je 1 jednotka konečného pol’a GF(q). Sumu 1 + 1 + · · · + 1} {{ }označíme symbolomn a zostrojíme postupnost’0, 1, 2, 3 . . . , p − 1, p = 0.nTáto postupnost’ je konečná (lebo GF(q) je konečné pole) jej prvky tvoria aditívnu cyklickúgrupu G. Sčítanie prvkov je v grupe G definované ako súčet celých čísel mod p.Využijeme to, že v poli GF(q) platí distributívny zákon a zavedieme násobenie v grupe Gpomocou sčítania mod p nasledovne (α, β ∈ G):

15.5. VEKTOROVÉ PRIESTORY 2111. α · 1 = α,2. α · (β + 1) = α · β + α.dokončit’ podl’a NiederreiteraV tabul’kách 15.1 a 15.2 sme uviedli ireducibilné polynómy stupňa 2, 3, 4 nad pol’omGF(2). V poli GF(2 4 ) sa však tieto ireducibiné polynómy dali rozložit’ na súčin lineárnychčinitel’ov ??. Tento príklad ilustruje skutočnost’, že ireducibilné polynómy nad pol’omGF(q) môžu byt’ reducibilné nad vhodným rozšírením pol’a GF(q). Pri konštrukcii cyklickýchkódov budeme potrebovat’ zostrojit’ polynóm nad nejakým konečným pol’om spredpísanými koreňmi; pozrieme sa preto na takéto polynómy podrobnejšie. Zavediemenejprv jeden dôležitý pojem.Definícia 15.4.2. Nech je GF(q) konečné pole a GF(Q) je jeho rozšírenie; nech α ∈ GF(Q).Normovaný polynóm m α (x) nad GF(q) budeme nazývat’ minimálnym polynómom prvkuα nad pol’om GF(q), ak platí1. m α (α) = 0,2. ak existuje polynóm a(x) nad GF(q) taký, že a(α) = 0, tak potom m α (x)|a(x).Minimálny polynóm prvku α nad pol’om GF(q) je teda normovaný polynóm najmenšiehostupňa nad pol’om GF(q), ktorého koreňom je prvok α. Minimálny polynóm prvku α vždyexistuje a je daný jednoznačne.Príklad. Minimálne polynómy prvkov pol’a GF(2 4 ) nad pol’om GF(2) sú uvedené v tabul’ke??Poznámka. Čast’ venovaná konečným poliam bola spracovaná na základe [2] a [10].Čitatel’ovi, zaujímajúcemu sa o teóriu konečných polí odporúčame do pozornosti najmäprácu [10]. Zaujímavý pohl’ad na konečné polia a ich aplikácie v kryptológii ponúka ajpráca [?].15.5 Vektorové priestoryZrejme najznámym príkladom vektorového priestoru je trojrozmerný Euklidovský priestor,ktorý vystupuje v mnohých úlohách stredoškolskej matematiky a fyziky. Euklidovskýpriestor možno zovšeobecnit’ na n-rozmerný vektorový priestor nad pol’om reálnych čísel,ktorý taktiež nachádza uplatnenie v mnohých aplikáciách. V teórii kódovania nebudemepracovat’ s vektorovými priestormi nad reálnymi číslami, ale budeme využívat’ trochaabstraktnejšie vektorové priestory nad konečnými pol’ami. Tieto vektorové priestorysú základom pre konštrukciu vel’mi dôležitých samoopravných kódov, pre tzv. lineárnekódy. Zavedieme najprv základné pojmy a potom preskúmame vlastnosti vektorovýchpriestorov, ktoré budeme potrebovat’ (napríklad) pre konštrukciu, kódovanie a dekódovanielineárnych kódov.

212 KAPITOLA 15. ALGEBRAprvok minimálny polynóm0 xα 0 x + 1α 1 x 4 + x + 1α 2 x 4 + x + 1α 3 x 4 + x 3 + x 2 + x + 1α 4 x 4 + x + 1α 5 x 2 + x + 1α 6 x 4 + x 3 + x 2 + x + 1α 7 x 4 + x 3 + 1α 8 x 4 + x + 1α 9 x 4 + x 3 + x 2 + x + 1α 10 x 2 + x + 1α 11 x 4 + x 3 + 1α 12 x 4 + x 3 + x 2 + x + 1α 13 x 4 + x 3 + 1α 14 x 4 + x 3 + 1Tabul’ka 15.6: Minimálne polynómy prvkov pol’a GF(2 4 )Definícia 15.5.1. Nech je F l’ubovol’né pole. Nech V je množina, na ktorej je definovanábinárna operácia +, a nech pre každé a ∈ F a v ∈ V existuje prvok a · v ∈ V, pričom preaditívne a multiplikatívne operácie platia nasledujúce podmienky:1. (V, +) je abelovská grupa; pre l’ubovol’né u, v ∈ V a l’ubovol’né a, b ∈ F2. a · (u + v) = a · u + a · v;3. (a + b) · v = a · v + b · v;4. (a · b) · u = a(b · u);5. 1 · u = u,kde 1 je jednotkový prvok pol’a F. Potom V je vektorový priestor nad pol’om F. Prvkymnožiny V sa nazývajú vektory a prvky pol’a F skaláry.Poznámka. Všimnite si, že v definícii vektorového priestoru nad pol’om F vystupujúdve rôzne aditívne operácie (sčítanie v poli F a sčítanie v grupe (V, +)) a dve takisto rozličnémultiplikatívne operácie ("vnútorné násobenie prvkov pol’a a "vonkajšie násobenievektora skalárom.) Z kontextu bude spravidla jasné, o akú operáciu sa jedná, apreto na označenie oboch aditívnych operácií budeme používat’ symbol "+". Budeme sapridŕžat’ zaužívaného označenia a operátor "·"budeme vynechávat’ tak pri označovaní"vonkajšiehoäko aj "vnútorného"násobenia. Aby sme odlíšili vektory a skaláry, budemevektory sádzat’ boldom.Príklad. 1. Nech je F l’ubovol’né pole a n > 1 je l’ubovol’né prirodzené číslo. Potom symbolomF n označíme množinu všetkých usporiadaných n-tíc prvkov pol’a F. Definujeme

15.5. VEKTOROVÉ PRIESTORY 213operácie sčítania n-tíc a násobenia n-tíc prvkom pol’a nasledovne: pre l’ubovol’né prvky(n-tice) u, v ∈ F n ; u = (u 1 , . . . , u n ), v = (v 1 , . . . , v n ) a l’ubovol’ný prvok c ∈ F platíu + v = (u 1 + v 1 , . . . , u n + v n ), cu = (cu 1 , . . . , cu n ).Dá sa l’ahko overit’, že F n s takto definovanými operáciami je vektorový priestor.2. Trocha netradičným príkladom vektorového priestoru je faktorový okruh polynómovF[x]/(x n − 1), pozostávajúci z tried reprezentovaných polynómami nad pol’om Fstupňa menšieho než n.Nech je daný vektorový priestor V nad pol’om F, nech sú u 1 , . . . , u m ∈ V l’ubovol’névektory a nech sú a 1 , . . . , a m ∈ F l’ubovol’né skaláry. Vektorv = a 1 u 1 + · · · + a m u mbudeme nazývat’ lineárnou kombináciou vektorov u 1 , . . . , u m . Množina vektorov u 1 , . . . , u msa nazýva lineárne závislou, ak existuje množina skalárov a 1 , . . . , a m ∈ F, z ktorých jeaspoň jeden nenulový a0 = a 1 u 1 + · · · + a m u m .Ak množina vektorov u 1 , . . . , u m ∈ V nie je lineárne závislá, budeme o nej hovorit’, že jelineárne nezávislá. Je zrejmé, že ak má byt’ nejaká množina vektorov lineárne nezávislá,nesmie obsahovat’ nulový vektor a žiaden z jej vektorov sa nesmie dat’ vyjadrit’ vpodobe lineárnej kombinácie ostatných vektorov. Množinu všetkých lineárnych kombináciívektorov u 1 , . . . , u m ∈ V {a 1 u 1 + · · · + a m u m , a 1 . . . , a m ∈ F} budeme označovat’symbolom [u 1 , . . . , u m ]. Budeme hovorit’, že množina vektorov u 1 , . . . , u m generuje vektorovýpriestor W, ak sa každý vektor z W dá vyjadrit’ v podobe lineárnej kombinácievektorov u 1 , . . . , u m ; t.j.∀v(v ∈ W → v ∈ [u 1 , . . . , u m ]).Je zrejmé, že ten istý vektorový priestor možno generovat’ pomocou viacerých generujúcichmnožín vektorov. Budú nás zaujímat’ mohutnosti generujúcich množín vektorovvektorového priestoru.Veta 15.5.1 (Steinitzova veta.). Nech je vektorový priestor V nad pol’om F generovanýmnožinou lineárne nezávislých vektorov u 1 , . . . , u n a nech sú vektory v 1 , . . . , v k ∈ V lineárnenezávislé. Potom k ≤ n a existuje n−k vektorov u i takých, že [v 1 , . . . , v k , u i1 , . . . , u in−k ] =V.Dôkaz. Budeme postupne nahrádzat’ vektory u i vektormi v j v množine generujúcejvektorový priestor V. Dôkaz budeme potom robit’ matematickou indukciou vzhl’adom napočet vektorov v i v množine vektorov generujúcich vektorový priestor V.Množina u 1 , . . . , u n generuje V; t.j. [u 1 , . . . , u n ] = V. Pridajme do generujúcej množinyvektor v 1 . Ked’že v 1 ∈ V a v 1 ≠ 0 existuje lineárna kombináciav 1 = a 1 u 1 + · · · + a n u n ,taká, že medzi koeficientami a 1 . . . , a n je aspoň jeden nenulový. Bez ujmy na všeobecnostimôžeme predpokladat’, že a 1 ≠ 0. Potom môžeme vyjadrit’ vektor u 1 pomocoulineárnej kombinácieu 1 = v 1 + a −11 a 2u 2 · · · + a −11 a nu n .

214 KAPITOLA 15. ALGEBRAZ toho vyplýva, že množina v 1 , u 2 , . . . , u n generuje vektorový priestor V.Predpokladajme, že množina vektorov v 1 , . . . , v s−1 , u s , . . . , u n generuje vektorový priestorV,Definícia 15.5.2. Vektorový priestor V nad pol’om F sa nazýva konečnorozmerný, akexistujú vektory u 1 , . . . , u n ∈ V také, že [u 1 , . . . , u n ] = V. Ak vektorový priestor nie jekonečnorozmerný, nazývame ho nekonečnorozmerným vektorovým priestorom.Definícia 15.5.3. Nech je vektorový priestor V nad pol’om F konečnorozmerný. Vektoryu 1 , . . . , u n ∈ V nazývame bázou vektorového priestoru V, ak1. [u 1 , . . . , u n ] = V,2. vektory u 1 , . . . , u n sú lineárne nezávislé.Jeden a ten istý (konečnorozmerný) vektorový priestor môže mat’ viacero rozličnýchbáz. Podstatné je, že všetky budú mat’ rovnaký počet prvkov.Veta 15.5.2. Nech je V konečnorozmerný vektorový priestor nad pol’om F. Potom všetkybázy vektorového priestoru V majú rovnaký počet prvkov.Počet prvkov bázy (konečnorozmerného) vektorového priestoru teda nezávisí od výberubázy. Zavedieme na jeho označenie špeciálny pojem.Definícia 15.5.4. Dimenzia konečnorozmerného vektorového priestoru je počet prvkovniektorej z jeho báz. Dimenzia nulového vektorového priestoru je 0. Dimenzia nekonečnorozmernéhovektorového priestoru je ∞.15.6 Lineárna algebra

Kapitola 16Entropia a množstvo informáciePri riešení niektorých problémov potrebujeme určit’ množstvo informácie obsiahnuté vúdajoch. Predpokladajme, že na začiatku nemáme o údajoch žiadnu informáciu, t.j. údajemôžu byt’ ktorýmkol’vek prvkom nejakej množiny textov (údaje môžu byt’ napríklad všifrovej podobe a my nepoznáme ani použitý šifrovací algoritmus a nemáme k dispozíciidešifrovací kl’úč). Môžeme nanajvýš odhadnút’ potenciálnu množinu otvorených textov,ktorých zašifrovaním vznikli naše údaje. Potom získame nejakú informáciu (napr. odĺžke a formáte údajov). Táto informácia redukuje počiatočnú neurčitost’ - množinamožných textov vyhovujúcich získanej informácii je menšia ako pôvodná množina textov.Takto budeme postupovat’ až do okamihu, ked’ jednoznačne určíme údaje a neredukujemeneurčitost’ na nulovú hodnotu. Kvantitatívna miera informácie obsiahnutej v údajochsa teda dala určit’ pomocou miery neurčitosti. Na meranie neurčitosti sa používaentropia. Zavedieme najprv entropiu a pomocou nej aj kvantitatívnu mieru informácie.Nech je daný zdroj S, s abecedou Σ S = {s 0 , . . . , s m−1 } a rozdelením pravdepodobnostíP = {p 0 , . . . , p m−1 }. Na začiatku budeme predpokladat’, že je rozdelenie pravdepodobnostírovnomerné, t.j. že sa všetky symboly zdrojovej abecedy vyskytujú v textoch rovnakočasto. Funkcia, označme ju pracovne symbolom f, ktorá má merat’ neurčitost’ zdroja,musí spĺňat’ nasledujúce prirodzené podmienky:1. jej hodnota nesmie závisiet’ od symbolov 1 ale len od rozdelenia pravdepodobnostíP,2. funkcia je monotónne rastúca vzhl’adom na počet symbolov zdrojovej abecedy 23. aditívnost’: ak sú S 1 , S 2 dva nezávislé zdroje, tak potomf(S 1 , S 2 ) = f(S 1 ) + f(S 2 ).Vyššie uvedené požiadavky spĺňa logaritmická funkcia. R.V.L. Hartley (1928) definovallogaritmickú mieru informácie (mieru neurčitosti) zdroja S s m-prvkovou abecedou a1 symboly môžu byt’ reprezentované číslami2 pripomíname, že rozdelenie pravdepodobností je rovnomerné215

216 KAPITOLA 16. ENTROPIA A MNOŽSTVO INFORMÁCIErovnomerným rozdelením pravdepodobnosti nasledovne:H(S) = log(m).Základ logaritmov neovplyvňuje podstatne hodnotu entropie, vzhl’adom na to, že prelogaritmy o základoch a, b platílog a x = (log a b) log b x.Jednotkou miery informácie (neurčitosti) je v závislosti od použitého základu logaritmovbit (binárne logaritmy) nat (prirodzené logaritmy) a Hartley (dekadické logaritmy).Množstvo informácie sa najčastejšie vyjadruje v bitoch alebo jednotkách od nich dovedených.Akú informáciu nesie jeden symbol v prípade, ked’ rozdelenie pravdepodobností zdrojanie je rovnomerné? Informačný obsah budeme tak ako v predchádzajúcom prípademerat’ znížením neurčitosti, ktorá závisí od pravdepodobnosti výskytu symbolu. Predpokladajmenapríklad, že zdroj má generovat’ jednu z množiny možných správ, možnésprávy máme usporiadané lexikograficky. Na výstupe zdroja sa objaví symbol s i0 . Pozriemesa na dve krajné možnosti: ak sa všetky správy začínajú symbolom s i0 , jeho objavenieneredukovalo množinu možných správ a teda symbol s i0 nenesie žiadnu informáciu.Druhá krajná možnost’ - existuje jediná správa, začínajúca symbolom s i0 ; t.j. v tomtoprípade je množstvo informácie obsiahnuté v s i0 maximálne (rovné logaritmu počtumožných správ). Definujeme množstvo informácie v s i0 akolog 1/p i0 ,kde p i0 = p(s i0 ). V prípade rovnomerného rozdelenia pravdepodobností niesol každýsymbol rovnaké množstvo informácie. V prípade nerovnomerného rozdelenia pravdepodobnostísymbolov tomu tak nie je a má zmysel sa zaoberat’ strednou hodnotou množstvainformácie, t.j. hodnotouH r (S) =m−1∑i=0p i log r 1/p i .Funkcia H r (S) sa nazýva entropiou zdroja S. Entropiu zdroja ako prvý definoval C. Shannon.Pozrieme sa teraz na vlastnosti entropie. Začneme skúmaním funkcie p lg 1/p.Vypočítame deriváciu funkcie p lg 1/p a určíme jej extrémy (obr. 1):d(p lg 1/p)dp= lg 1/p − lg e = 0,ked’že funkcia p lg 1/p je rastúca na intervale 〈0, 1/e) a klesajúca na intervale (1/e, 1〉,nadobúda v bode p = 1/e maximum (≈ 0.5307378454). V bode 0 nadobúda funkcia p lg 1/pnadobúda hodnotu 0 (L´Hospitalovo pravidlo). Často budeme pracovat’ so zdrojom, ktorýmá binárnu abecedu a rozdelenie pravdepodobností p, 1 − p. Entropia sa v tomto prípadedá vyjadrit’ formulou:H 2 (p) = p lg 1/p + (1 − p) lg 1/(1 − p).Funkcia H 2 (p) (obr. 2) dosahuje maximálnu hodnotu (=1) pre p = (1 − p) = 1/2.Zhrnieme stručne podstatné vlastnosti entropie.

2170.50.40.30.20.100.2 0.4 0.6 0.8 1pObrázok 16.1: Graf funkcie p · lg1/p10.80.60.40.20 0.2 0.4 0.6 0.8 1pObrázok 16.2: Graf funkcie H 2 (p)

218 KAPITOLA 16. ENTROPIA A MNOŽSTVO INFORMÁCIEVeta 16.0.1. Nech je daný zdroj S, s abecedou Σ S = {s 0 , . . . , s m−1 } a rozdelením pravdepodobnostíP = {p 0 , . . . , p m−1 }, m ≥ 1; entropia zdroja H 2 (S) je definovaná formulouPotom pre H 2 (S) platí:H 2 (S) =m−1∑i=0p i lg 1/p i .1. H 2 (S) je reálna nezáporná funkcia,2. H 2 (S) = 0 práve vtedy, ak existuje také i, že p i = 1 a p j = 0 pre i ≠ j,3. H 2 (S) ≤ m.Dôkaz. Prvé dve tvrdenia sú očividné a ich dôkazy prenechávame čitatel’ovi. Dokážemetretie tvrdenie. Použijeme Lagrangeovu metódu neurčitých koeficientov. Nechf(p 0 , p 1 , . . . , p m−1 ) = 1 m−1ln 2 ·∑i=0p i ln(1/p i ) + λ ·( m−1)∑p i − 1i=0Vypočítame parciálne derivácie funkcie f(p 0 , p 1 , . . . , p m−1 ) a položíme ich rovné nule:Z poslednej rovnosti vyplýva∂f= 1∂p i ln 2 [ln(1/p i) − 1] + λ = 0, i = 0, . . . m − 1.λ = 1ln 2 [1 − ln(1/p i)] i = 0, . . . m − 1.Ked’že λ je konštanta, to znamená, že pre l’ubovol’né i, j platí p i = p j a teda p i = 1/m prei = 0, . . . , m − 1. To znamená, že entropia dosahuje maximálnu hodnotu H 2 (S) = m prerovnomerné rozdelenie pravdepodobností.

Zoznam obrázkov2.1 Shannonov model komunikačného systému . . . . . . . . . . . . . . . . . . 112.2 Zovšeobecnený model komunikačného systému . . . . . . . . . . . . . . . . 122.3 Signál . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.4 Šum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.5 Prijatý signál . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163.1 Ohodnotený binárny strom . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333.2 Konečný automat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353.3 Kódovanie s predpoved’ou . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527.1 Binárny symetrický kanál bez pamäte . . . . . . . . . . . . . . . . . . . . . 768.1 Kódovanie správy pomocou lineárneho kódu s generujúcou maticou G . . 909.1 Kódové slovo systematického cyklického kódu . . . . . . . . . . . . . . . . . 11210.1 LFSR so spätnou väzbou zadanou Λ(x) . . . . . . . . . . . . . . . . . . . . . 15010.2 LFSR R (1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15010.3 LFSR R (3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15110.4 LFSR R (5) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15210.5 LFSR R (7) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15210.6 LFSR R (10) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15316.1 Graf funkcie p · lg1/p . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21916.2 Graf funkcie H 2 (p) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219219

220 ZOZNAM OBRÁZKOV

Zoznam tabuliek9.1 Polynómy cyklických kódov . . . . . . . . . . . . . . . . . . . . . . . . . . . 1139.2 Váhy slov Golayovho (23,12)-kódu . . . . . . . . . . . . . . . . . . . . . . . 12710.1 Pole GF(3 3 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14510.2 Berlekamp-Massey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15912.1 Efektívnost’ vybraných samoopravných kódov . . . . . . . . . . . . . . . . . 17115.1 Polynómy stupňa 0, 1, 2, 3 nad pol’om GF(2) . . . . . . . . . . . . . . . . . . 20615.2 Polynómy stupňa 4 nad pol’om GF(2) . . . . . . . . . . . . . . . . . . . . . . 20715.3 Prvky pol’a GF(2)[x]/x 4 + x + 1 . . . . . . . . . . . . . . . . . . . . . . . . . 20715.4 Reprezentácia nenulových prvkov GF(2 4 ) . . . . . . . . . . . . . . . . . . . 21115.5 Mocniny prvku β pol’a GF(2 4 ) . . . . . . . . . . . . . . . . . . . . . . . . . . 21215.6 Minimálne polynómy prvkov pol’a GF(2 4 ) . . . . . . . . . . . . . . . . . . . 214221

Indexabeceda, 5zdroja, 9zdrojová, 9chyba dekódera, 15dĺžka slova, 5dekódovanieúplné, 15na základe maximálnej pravdepodobnosti,14neúplné, 15dekódovanie error trapping, 116demodulátor, 12error trapping, 116informácia, 9iterácia jazyka, 6kladná, 6nezáporná, 6jazyk nad abecedou, 6kódblokový, 17nerovnomerný, 17prefixový, 22rovnomerný, 17rozdelitel’ný, 17Shannonov, 26sufixový, 23kód s opakovaním, 107kódovaniezdroja, 10zdrojovej informácie, 10kompresia, 10bezstratová, 10so stratou informácie, 10komunikácia, 9222komunikačný systém, 9Shannonov model, 9MLD, 14nerovnost’ Kraftova - McMillanova , 23podslovo, 6koncové, 6počiatočné, 6vlastné, 6polynóm generujúci, 105polynóm kontrolný, 106prefix, 6prenosový kanál, 11prijímač, 12redundancia, 10rozdelitel’nost’ kódu, 17slovo, 5prázdne, 5zrkadlový obraz, 6správa, 9sufix, 6šum, 12údaje, 9zdrojšumu, 12informácie, 9zlyhaniedekódera, 15zret’azenie slov, 5

Literatúra[1] Adamek J. Foundation of Coding. John Wiley, Chichester, 1991.[2] Blahut R.E. Theory and practice of error control codes. Addison Wesley, 1984. ruskýpreklad, Moskva, Mir 1986.[3] Hamming R.W. Coding and Information Theory. Prentice Hall, New Jersey, 1980.[4] Havel V. and Holenda J. Lineární algebra. SNTL, Praha, 1-st edition, 1984.[5] Hoffner V. Úvod do teorie signálú. SNTL, Praha, 1-st edition, 1979.[6] Jablonskij S.V. and Lupanov O.B. Diskrétna matematika a matematické otázky kybernetiky.Mir, 1974, Moskva. (V ruštine).[7] Hall J.I. Notes on coding theory. www.math.msu.edu˜jhall, 2003. prednášky.[8] Katriňák T. et al. Algebra a teoretická aritmetika, volume 1. SNTL a Alfa, Praha,Bratislava, 1-st edition, 1985.[9] Katriňák T. et al. Algebra a teoretická aritmetika, volume 2. SNTL a Alfa, Praha,Bratislava, 1-st edition, 1986.[10] Lidl R. and Niederreiter H. Introduction to finite fields and their applications. CambridgeUniversity Press, Cambridge, revised edition, 1994.[11] MacKay D.J.C. Information Theory, Inference and Learning Algorithms. CambridgeUniversity Press, Cambridge, 4-th edition, 2005.[12] Peterson W.W. and Weldon E.J. Error Correctin Codes. MIT Press, Cambridge, 2-ndedition, 1972.[13] Rektorys K. et al. Přehled užité matematiky. SNTL, Praha, 4-th edition, 1981.[14] Rényi A. Teorie pravděpodobnosti. Academie, Praha, 1972.[15] van Lint J.H. Introduction to Coding Theory. Springer Verlag, Berlin, 3-rd edition,1999.[16] X.Xxx. Error-correcting codes. www.xxx.edu, 2002. rukopis prenášok.223

Daniel OlejÃ¡r, Martin Stanek: Ãvod do teÃ³rie kÃ³dovania

Create successful ePaper yourself

Delete template?

Save as template?

Daniel OlejÃ¡r, Martin Stanek: Ãvod do teÃ³rie kÃ³dovania