07.12.2012 Aufrufe

Erdfernerkundung - Numerische Physik: Modellierung

Erdfernerkundung - Numerische Physik: Modellierung

Erdfernerkundung - Numerische Physik: Modellierung

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

6.2. KOMMUNIKATION UND INFORMATION 291<br />

Buchstabe p [%] Bacon 1623 Morse 1844 Huffmann 1952<br />

14.42 00100 00 000<br />

E 14.40 10000 100 001<br />

N 8.65 00110 01100 010<br />

S 6.46 10100 11100 0110<br />

I 6.28 01100 1100 0111<br />

R 6.22 01010 101100 1000<br />

.<br />

M 1.72 00111 010100 11010<br />

.<br />

X 0.08 10111 01110100 1111111110<br />

Q 0.05 11101 010110100 11111111110<br />

Hc 5 4.79 4.13<br />

Verständnisfrage 39 Sind Bacons fünf Binärzeichen eigentlich erforderlich?<br />

Einschub: Künstliche Sprachen<br />

Abbildung 6.8: Binärcodes<br />

für alphabetischen<br />

Text, basierend auf [157]<br />

§ 968 Am Beispiel der Sprache kann man sich sehr viele Eigenschaften von Information<br />

und diskreten Quellen klar machen, wie wir es ja auch schon im Zusammenhang mit der<br />

Redundanz gesehen haben. Insbesondere lässt sich der stochastische Aspekt verdeutlichen.<br />

Shannon und Weaver [224] folgend sei hier als ein Beispiel eine künstliche Sprache eingeführt.<br />

Diese Annäherung an eine Sprache umfasst drei Stufen:<br />

(A) Angenommen, wir haben 5 Buchstaben A, B, C, D und E, die jeweils mit einer Wahrscheinlichkeit<br />

von 0.2 gewählt sind, wobei aufeinander folgende Auswahlen unabhängig<br />

voneinander sind (diskrete Quelle mit gleich wahrscheinlichen, unabhängigen Symbolen).<br />

Das würde z.B. zu einer Folge führen wie<br />

BDCBCECCCADCBDDAAECEEAABBDAEECACEEBAEECBCEAD<br />

(B) Nun werden dieselben 5 Buchstaben benutzt mit den Wahrscheinlichkeiten 0.4, 0.1,<br />

0.2, 0.2, und 0.1, wobei aufeinander folgende Auswahlen ebenfalls wieder unabhängig<br />

sind (diskrete Quelle mit unabhängigen, nicht gleich wahrscheinlichen Symbolen). Eine<br />

typische Folge wäre dann:<br />

AAACDCBDCEAADADACEDAEADCABEDADDCECAAAAAD.<br />

(C) Eine kompliziertere Struktur ergibt sich, wenn, wie in der gewöhnlichen Sprache, die<br />

Zeichen nicht mehr voneinander unabhängig sind, sondern ihre Wahrscheinlichkeiten von<br />

dem vorangegangenen Zeichen abhängen. Im einfachsten Fall hängt eine Auswahl nur<br />

vom direkt vorangegangenen Zeichen ab, nicht jedoch auch von früheren Zeichen. Der<br />

statistische Aufbau kann dann durch einen Satz von Übergangswahrscheinlichkeiten pi(j)<br />

beschrieben werden. Dabei ist pi(j) die Wahrscheinlichkeit, das dem Buchstaben i der<br />

Buchstabe j folgt. Ein alternativer Weg wäre die Angabe der Digramm-Wahrscheinlichkeiten<br />

(zweidimensionale Verbundwahrscheinlichkeit) p(i, j), d.h. die relative Häufigkeit<br />

des Digramms ij. Die Buchstabenhäufigkeiten p(i) (die Wahrscheinlichkeit des Buchstabens<br />

i), die Übergangswahrscheinlichkeiten pi(j), und die Verbundwahrscheinlichkeiten<br />

p(i, j) hängen zusammen über<br />

p(i) = �<br />

p(i, j) = �<br />

p(j, i) = �<br />

p(j)pj(i) ,<br />

i<br />

p(i, j) = p(i)pi(j)<br />

und<br />

�<br />

pi(j) = �<br />

p(i) = �<br />

p(i, j) = 1 .<br />

i<br />

i<br />

i<br />

i,j<br />

i<br />

c○ M.-B. Kallenrode 2. Juli 2008

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!