3 Teori för symmetriska system

More documents

Recommendations

Info

66 Teori för symmetriska system Denna sats visar att informationsbehandling aldrig kan öka informationen: I modus ponens innehåller C ⇒ A och C ⇒ A ⊃ B inte mindre information än C ⇒ B. I additionen x = a + b innehåller högerledet minst lika mycket information som vänsterledet. xix. Sats. a. H(X, Y) = H(X) + H(Y | X) b. H(X, Y) ≤ H(X) + H(Y). Likhet gäller precis då X och Y är oberoende. Ovissheten i den samtidiga händelsen (X, Y) är samma som ovissheten i X plus ovissheten i Y då X är given och den är inte större än summan av ovissheterna i X och Y var för sig. xx. Redundansen för ett språk M med alfabetsstorlek L definieras som D = R - r = log | M | - r. R = log L = "maximala antalet bitar per bokstav" = alfabetshastigheten = absoluta hastigheten. I engelskan är L = 26 och alltså R ≈ 4.7. En 0:te ordningens approximation av språket ger H(X) / N = H(X) = log L. Genom att beakta att bokstäverna i ett N-gram är beroende erhålls bättre approximationer för ökande N. Kvantiteten r = lim N→∞ H(X)/N = språkhastigheten (språkentropin) = medelvärdet av antalet effektiva informationsbitar per bokstav för språket är central. I engelska språket uppskattas r till intervallet [1, 1.5] (som uppnås vid N = 100, ca.). Ibland definieras redundansen som D / R = 1 - r / R; t ex i så fall ≈ 75% för engelska. För att beräkna H(X) för ökande N används frekvenstabeller för N-gram med N = 0, 1, 2, ... . N = 0 ger H = 4.7, N = 1 ger H / 1 ≈ 4.17 (tabell 2.1), N = 2 ger H / 2 ≈ 3.62 &c. Jämför sats xvii.c ovan. xxi. Rényientropi. Detta mått är en generalisering av Shannons entropi och definieras för α ≥ 0 och α ≠ 1 enligt H α (X) = (1 - α) -1 log Σ p(x) α . Med gränsprocessen α → 1 erhålls H 1 (X) = H(X). Med gränsprocessen a → ∞ erhålls H ∞ (X) = - log max p(x). Vidare gäller för 0 < α < β att H α (X) ≥ H β (X), med likhet om och endast om X är likformigt fördelad. Speciellt gäller att log | X | ≥ H α (X), för α ≥ 0 och att H(X) ≥ H α (X), för α > 1.
67 Teori för symmetriska system 3.3 Kodningssatser och 'one time pad' 3.3.1 Shannons satser Följande satser bevisades av Shannon i mitten av 40-talet och de utgör startpunkten för vetenskapsgrenen informationsteori. Satserna ges här utan bevis. En minnesregel för dessa satser är följande. H < κ < C Den första satsen karakteriserar källan och säger att entropin är det mått som är mest relevant för att beskriva det verkliga informationsinnehållet: i. Kodhastighet. Om blocklängden för ord som produceras är n och om dess ord kodas med kodord av längd ρ så kallas kvantiteten κ = ρ / n för kodhastigheten. ii. Sats. (Källkodningssatsen) Antag att källans ord av blocklängd n produceras av en diskret minnesfri källa med entropi H(p) och kodas med kodord av längd ρ ur ett alfabet av storlek K. Då gäller för alla ε > 0 att sannolikheten för avkodningsfel p e ≤ ε förutsatt att κ log K > H(p). Omvänt gäller att om olikheten inte är uppfyllt så är sannolikheten för avkodningsfel större än 1 - ε. För binära koder, K = 2, kan alltså källans ord återskapas precis då κ > H(p). Villkoret sätter alltså en undre gräns för hur mycket ett meddelande kan kompakteras utan att informationen förloras. Den andra satsen visar att kanalkapaciteten är det avgörande måttet för att utvisa hur mycket en kanal accepterar. iii. Kanalkapaciteten C för en minnesfri kanal beskriven av övergångssannolikheterna p(y | x) definieras som C = max p(x) I(X, Y) = max p(x) (H(Y) - H(Y | X)), där maximum tas över alla sannolikhetsfördelningar för invärdena x till kanalen. Observera att H(Y | X) = 0 om kanalen är störningsfri, ty då är den mottagna signalen identisk med den sända. Ibland kan det vara enklare (eller naturligare) att använda maximum över I(Y, X) i stället; funktionen I är ju symmetrisk i X och Y. iv. Sats. (Kanalkodningssatsen) Antag att kodhastigheten κ för en minnesfri kanal uppfyller κ < C. Då gäller för alla ε > 0 att det finns en blocklängd n och en kod med denna längd och hastighet κ vars sannolikhet p e för avkodningsfel uppfyller p e ≤ ε. Observera att signal/brus-förhållandet inte ingår (explicit). Även denna sats har en omvändning. Om κ > C så finns ingen blockkod vars sannolikhet för avkodningsfel understiger ε.
Page 1 and 2: 55 Teori för symmetriska system 3
Page 3 and 4: 57 Teori för symmetriska system 3.
Page 5 and 6: 59 Teori för symmetriska system En
Page 7 and 8: 61 Teori för symmetriska system Ob
Page 9 and 10: 63 Teori för symmetriska system vi
Page 11: 65 Teori för symmetriska system xi
Page 15 and 16: 69 Teori för symmetriska system Om
Page 17 and 18: 71 Teori för symmetriska system g
Page 19 and 20: 73 Teori för symmetriska system Vi
Page 21 and 22: 75 Teori för symmetriska system Vi
Page 23 and 24: 77 Teori för symmetriska system ii
Page 25 and 26: 79 Teori för symmetriska system Om
Page 27 and 28: 81 Teori för symmetriska system 3.

3 Teori för symmetriska system

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?