09.11.2012 Aufrufe

Von den Zufallszahlen und ihrem Gebrauch - Institut für Mathematik ...

Von den Zufallszahlen und ihrem Gebrauch - Institut für Mathematik ...

Von den Zufallszahlen und ihrem Gebrauch - Institut für Mathematik ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>Von</strong> <strong>den</strong> <strong>Zufallszahlen</strong> <strong>und</strong> <strong>ihrem</strong> <strong>Gebrauch</strong><br />

Johann Baumeister ∗ <strong>und</strong> Tania Garfias Macedo †<br />

(Kursleiter)<br />

unter Mitwirkung von<br />

Paul Dietze, Pauline Eberts, Lara Felten, Miriam Gerharz<br />

Tim Hahn, Kim Hellriegel, Alexander Hoffmann, Anton Kohrt<br />

Philipp Kretz, Rozan Rosandi, Jan Rühl, Julia Schneider<br />

Clara Schüttler, Julia Weber, Saskia Wirfs, David Zimnol<br />

(Teilnehmer der Juniorakademie in Meisenheim 2011)<br />

Im August 2011<br />

Zusammenfassung<br />

Dies sind Aufzeichnungen, die im Rahmen eines Kurses einer Juniorakademie<br />

zum Thema ” <strong>Von</strong> <strong>den</strong> <strong>Zufallszahlen</strong> <strong>und</strong> <strong>ihrem</strong> <strong>Gebrauch</strong>“ in Meisenheim 2011 entstan<strong>den</strong><br />

sind. Eine Juniorakademie ist eine Fördermaßnahme auf B<strong>und</strong>esländerebene<br />

<strong>für</strong> begabte Schülerinnen <strong>und</strong> Schüler der 7. <strong>und</strong> 8. Klassen.<br />

Im Kurs wur<strong>den</strong> Erzeugungsmetho<strong>den</strong> <strong>für</strong> <strong>Zufallszahlen</strong> untersucht <strong>und</strong> Beispiele<br />

<strong>für</strong> die Verwendung kennengelernt. Die behandelten Themen waren: Zufallsexperimente,<br />

unfaire Würfel, Monte Carlo–Simulation, Benford-Zahlen, modulares<br />

Rechnen, euklidischer Algorithmus, Kongruenzgeneratoren, geometrische Tests,<br />

Sierpinski-Figuren, Simulation von Aktienkursen.<br />

Dieser Artikel ist eine Erweiterung der Dokumentation zum Kurs, in der insbesondere<br />

über Tests <strong>und</strong> Überlegungen, die die Teilnehmer zu Zufallsexperimenten<br />

angestellt haben, berichtet wird. Manches von dem, was hier angeführt wird, wurde<br />

im Kurs nur kursorisch behandelt, manches wurde ergänzt um mathematische Begründungen,<br />

die so bei der Kenntnislage der Kursteilnehmer nicht erbracht wer<strong>den</strong><br />

konnten. Ein weiteres Ziel dieses Artikels ist eine möglichst komplette Darlegung der<br />

wichtigsten Literaturstellen zur Thematik der <strong>Zufallszahlen</strong> <strong>und</strong> ihrer Einordnung.<br />

Aus dieser Zielsetzung ergibt sich ein ziemlich buntes Bild von Themen.<br />

∗ Prof. Dr. Baumeister, Fachbereich Informatik <strong>und</strong> <strong>Mathematik</strong>, Goethe-Universität, Robert Mayer–<br />

Str. 6–10, 60054 Frankfurt am Main, Germany, baumeist@math.uni-frankfurt.de.<br />

† Tania Garfias Macedo, Mathematisches <strong>Institut</strong>, Georg-August-Universität Göttingen, Bunsenstr.<br />

3-5, 37073 Göttingen<br />

1


Inhaltsverzeichnis<br />

Vorwort 1<br />

1 Einführung 3<br />

1.1 Aus der Bibel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />

1.2 Zufall auf dem Jahrmarkt . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />

1.3 Zufall: eine vorläufige Einschätzung . . . . . . . . . . . . . . . . . . . . . . 4<br />

1.4 <strong>Zufallszahlen</strong> <strong>und</strong> deren Ersatz . . . . . . . . . . . . . . . . . . . . . . . . 6<br />

1.5 Die middle square-Methode von J. von Neumann . . . . . . . . . . . . . . 9<br />

2 (Mathematische) Wahrscheinlichkeit 11<br />

2.1 Zufall, Ereignismenge <strong>und</strong> Wahrscheinlichkeit . . . . . . . . . . . . . . . . 11<br />

2.2 Mehrstufige Zufallsexperimente <strong>und</strong> Baumdiagramme . . . . . . . . . . . . 12<br />

2.3 Hilfsmittel zur Realisierung von Laplace-Experimenten . . . . . . . . . . . 14<br />

2.4 Zufallsvariable, Erwartungswert <strong>und</strong> Verteilung . . . . . . . . . . . . . . . 16<br />

2.5 Determinismus, Kausalität, Berechenbarkeit <strong>und</strong> Zufall . . . . . . . . . . . 18<br />

3 Elementare Zufallsexperimente 20<br />

3.1 Reißzweckexperiment . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20<br />

3.2 (Unfaire) Würfel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21<br />

3.3 <strong>Zufallszahlen</strong> der Natur entnommen . . . . . . . . . . . . . . . . . . . . . . 22<br />

3.4 Flächenberechnung mit <strong>Zufallszahlen</strong> . . . . . . . . . . . . . . . . . . . . . 24<br />

3.5 Uabhängigkeit bei Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . 25<br />

4 Exponential- <strong>und</strong> Logarithmusfunktion 28<br />

4.1 Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28<br />

4.2 Exponenten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />

4.3 Logarithmen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />

4.4 Exponential– <strong>und</strong> Logarithmusfunktion . . . . . . . . . . . . . . . . . . . . 35<br />

4.5 Logarithmentafel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36<br />

5 Benford–Zahlen 38<br />

5.1 Die Beobachtung von Newcomb <strong>und</strong> Benford . . . . . . . . . . . . . . . . . 38<br />

5.2 Neuere Beobachtungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40<br />

5.3 Das Mantissengesetz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41<br />

5.4 Anwendung: Benford <strong>und</strong> Betrüger . . . . . . . . . . . . . . . . . . . . . . 45<br />

5.5 Benford bei dynamischen Systemen . . . . . . . . . . . . . . . . . . . . . . 47<br />

6 Elementare Arithmetik 53<br />

6.1 Ganze Zahlen, Teilbarkeit, Primzahlen . . . . . . . . . . . . . . . . . . . . 53<br />

6.2 Fibonacci-Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55<br />

6.3 Division mit Rest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57<br />

6.4 Euklidischer Algorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59<br />

6.5 Modulares Rechnen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63<br />

7 Kongruenzgeneratoren 67<br />

7.1 Lineare Kongruenzgeneratoren . . . . . . . . . . . . . . . . . . . . . . . . . 67<br />

7.2 Einige verwendete Generatoren . . . . . . . . . . . . . . . . . . . . . . . . 69<br />

7.3 Geometrische Beobachtungen . . . . . . . . . . . . . . . . . . . . . . . . . 69<br />

7.4 Statistische Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71<br />

7.5 Anwendung von <strong>Zufallszahlen</strong>: One-Time-Pad . . . . . . . . . . . . . . . . 73


8 Monte Carlo-Methode 75<br />

8.1 Gr<strong>und</strong>idee der Monte Carlo-Methode . . . . . . . . . . . . . . . . . . . . . 75<br />

8.2 Simulation der Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . 77<br />

8.3 Simulation der Aktienkurse . . . . . . . . . . . . . . . . . . . . . . . . . . 79<br />

8.4 Simulation von Optionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82<br />

8.5 Simulationen von Optionen . . . . . . . . . . . . . . . . . . . . . . . . . . 87<br />

9 Sierpinski-Mengen 88<br />

9.1 Sierpinski-Dreieck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88<br />

9.2 Fraktale <strong>und</strong> ihre Dimension . . . . . . . . . . . . . . . . . . . . . . . . . . 89<br />

9.3 Konstruktion mit Hilfe des ” Chaos-Spiel-Verfahrens“ . . . . . . . . . . . . 90<br />

9.4 Konstruktion mit Hilfe eines iterierten Funktionssystems . . . . . . . . . . 91<br />

9.5 Variationen des Sierpinski-Dreiecks . . . . . . . . . . . . . . . . . . . . . . 91<br />

Literatur 93<br />

Weitere Quellen 97<br />

Stand: 21. November 2011 1 ○c J. Baumeister, T.G. Macedo


Vorwort<br />

Die Beschäftigung mit dem Zufall <strong>und</strong> Zufallsexperimenten hat eine lange Geschichte. Sie<br />

beginnt mit dem Werfen von Losen in der Antike, fndet seine Fortsetzung bei Jahrmarkttricks<br />

beim Würfelspiel, endet in einer theoretischen Behandlung des Zufalls nicht zuletzt<br />

in der Konsequenz der Entwicklungen in der Quantenmechanik <strong>und</strong> ist nun präsent in<br />

fast jeder Disziplin der <strong>Mathematik</strong>. In der Finanzmathematik, wie sie sich in <strong>den</strong> letzten<br />

bei<strong>den</strong> Jahrzehnten entwickelt hat, ist der Zufall <strong>und</strong> seine Realisierung zentral. Eine<br />

Methode, <strong>für</strong> die die Bereitstellung von <strong>Zufallszahlen</strong> essentiell <strong>und</strong> in <strong>den</strong> Naturwissenschaften<br />

von Bedeutung ist, ist die Monte Carlo–Methode.<br />

<strong>Zufallszahlen</strong> sind aus vielen Anwendungsgebieten heute nicht mehr wegzu<strong>den</strong>ken:<br />

Computerspiele wären schnell langweilig, wenn nicht durch eingebauten Zufall der Ablauf<br />

innerhalb des Spiels bzw. von Spiel zu Spiel variiert würde. Um die Sicherheit bei der<br />

Übertragung von Daten im Internet zu gewährleisten, wer<strong>den</strong> kryptografische Programme<br />

verwendet, die sichere <strong>Zufallszahlen</strong> verwen<strong>den</strong>. Das Binomialmodell zur Ermittlung<br />

von fairen Optionspreisen bedient sich des Zufalls in der Simulation des Auf <strong>und</strong> Ab von<br />

Aktienkursen.<br />

Viele Einträge im Internet zum Thema ” <strong>Zufallszahlen</strong>“ sind aufgelistet unter dem<br />

Stichwort echte <strong>Zufallszahlen</strong>. Doch kann es echte <strong>Zufallszahlen</strong> geben? Oder anders gefragt,<br />

wie soll man solche Zahlen in ihrer Echtheit/Verwendbarkeit bewerten, <strong>und</strong> wie<br />

kann man brauchbare <strong>Zufallszahlen</strong> erzeugen? Bereits vom Pionier der Computertechnik,<br />

John von Neumann, gab es ein erstes Verfahren zur Konstruktion von <strong>Zufallszahlen</strong> auf<br />

einem Rechner. Aber er schreibt auch: Any one who considers arithmetical methods of<br />

producing random digits is of course in a state of sin.<br />

Die ersten aufklären<strong>den</strong> Überlegungen sollten einer ganz einfachen Fragestellung gelten:<br />

was ist ein Zufallsexperiment? Dies sind Experimente, die unterschiedliche Ergebnisse<br />

haben können, deren Ausgang vor der Ausführung aber nicht vorausgesagt wer<strong>den</strong> kann.<br />

Als Beispiele <strong>für</strong> Zufallsexperimente sehr unterschiedlicher Natur können zur Veranschaulichung<br />

etwa herangezogen: Münzwurf, Werfen von Reißzwecken, Würfeln, Ziehen einer<br />

Kugel aus einer Urne, Zeitpunkt des Zerfalls eines radioaktiven Materials, 2. Stelle nach<br />

dem Komma der Laufzeit eines Programms auf dem Rechner. Man kann sich unschwer<br />

vorstellen, dass jedes dieser angeführten Experimente zu einem Zufallsgenerator umdefiniert<br />

wer<strong>den</strong> kann. Einen komplizierteren Zufallsmechanismus erhält man, wenn man ein<br />

Zufallsexperiment mehrmals unabhängig voneinander wiederholt. Nun steht die Frage im<br />

Raum, was ” unabhängig“ heißen soll. Alle diese Umstände <strong>und</strong> Fragen wer<strong>den</strong> wir im<br />

Folgen<strong>den</strong> vertiefen.<br />

Zentral <strong>für</strong> das Verständnis der ” algebraischen Erzeugung“ von (Pseudo-)<strong>Zufallszahlen</strong><br />

ist die Arithmetik in <strong>den</strong> ganzen Zahlen. Die Tatsache, dass die Division in <strong>den</strong> ganzen<br />

Zahlen nicht uneingeschränkt möglich ist, kann erfolgreich dabei verwendet wer<strong>den</strong>. Die<br />

Hilfsmittel <strong>für</strong> die algebraischen Überlegungen, die bereitgestellt wer<strong>den</strong> müssen, sind<br />

Teilbarkeit, Division mit Rest <strong>und</strong> euklidischer Algorithmus. Die Möglichkeiten der Erzeugung<br />

von <strong>Zufallszahlen</strong> berühren auch das Thema ” Benfordzahlen“, das einige besonders<br />

reizvolle Facetten bereithält.<br />

Die Frage der Bewertung von <strong>Zufallszahlen</strong> kann auf unterschiedliche Weise erfolgen:<br />

statistisch, geometrisch, indirekt durch Beobachtung von Experimenten. Ein Beispiel, das<br />

dabei Verwendung fin<strong>den</strong> kann, stellt das Sierpinski-Dreieck dar, dem wir einen Abschnitt<br />

widmen. Als Gr<strong>und</strong>lagen <strong>für</strong> die Zufälligkeitstest benötigen wir <strong>den</strong> Wahrscheinlichkeitsbegriff<br />

<strong>für</strong> endliche Ereignisräume <strong>und</strong> Verteilungsstests.<br />

Stand: 21. November 2011 2 ○c J. Baumeister, T.G. Macedo


1 Einführung<br />

1.1 Aus der Bibel<br />

Gott würfelt nicht !<br />

Albert Einstein<br />

Und da sie ihn gekreuziget hatten, teileten sie seine Kleider, <strong>und</strong> warfen das<br />

Los drum, welcher was überkäme.<br />

(Markus-Evangelium 15,24; siehe Abbildung 1 1 )<br />

Was heißt ” das Los werfen“, um eine Zufallsentscheidung herbeizuführen? In einer alttestamentarischen<br />

Losentscheidung wer<strong>den</strong> die zur Wahl stehen<strong>den</strong> verschie<strong>den</strong>en Kleidungsstücke,<br />

Namen, Zeitpunkte . . . auf ein Stück Holz, eine Tonscherbe oder etwas ähnliches<br />

geschrieben. Diese ” Lose“ wer<strong>den</strong> dann in einem Gefäß oder einem Kleidungsstück zusammen<br />

durchgeschüttelt, bis eines herausfällt, das dann die Entscheidung herbeiführt.<br />

Jesus hatte zwölf engste“ Jünger. Ei-<br />

”<br />

ner davon (Judas Ischariot) hatte Jesus<br />

verraten <strong>und</strong> sich dann erhängt. Die anderen<br />

elf Jünger wollten ein altes Wort aus<br />

<strong>den</strong> Psalmen erfüllen <strong>und</strong> ihre Zahl wieder<br />

auf zwölf erhöhen. Dazu machten sie<br />

nach Christi Himmelfahrt eine Versammlung.<br />

Zwei Anhänger wur<strong>den</strong> als Kandidaten<br />

ausgewählt – Barsabbas <strong>und</strong> Matthias<br />

– <strong>und</strong> das Gottes-Los über sie geworfen. So<br />

wurde Matthias zwölfter Jünger.<br />

Abbildung 1: Würfeln um die Kleider<br />

Aus dem Alten Testament gibt es folgende<br />

Aufzeichnung einer Zufallsentscheidung:<br />

Mose hatte <strong>den</strong> Rat der ältesten aus 70 Mitgliedern zu bestimmen: Aus jedem der 12<br />

Stämme wur<strong>den</strong> zunächst 6 Kandidaten ausgewählt. Aus der Schar dieser 72 Kandidaten<br />

waren nun zwei zu eliminieren. Dazu wur<strong>den</strong> 72 Kugeln vorbereitet; 70 davon wur<strong>den</strong><br />

markiert, zwei blieben unmarkiert. Die Kugeln wur<strong>den</strong> in eine Urne gelegt <strong>und</strong> gemischt.<br />

Jeder Kandidat hatte ein Kugel zu ziehen; jene bei<strong>den</strong>, die die unmarkierten zogen, wur<strong>den</strong><br />

eliminiert.<br />

1.2 Zufall auf dem Jahrmarkt<br />

” Glücksspiel“ ist ein Begriff, der viele Bereiche der Spielkultur beinhaltet. Darunter fallen<br />

vor allem Würfelspiele <strong>und</strong> einige Kartenspiele, das Roulette, Lotto <strong>und</strong> Lotterien. Manche<br />

Brett- oder Würfelbrettspiele können unter Vorbehalt ebenso dazugezählt wer<strong>den</strong>. Beim<br />

Glücksspiel ist der Einsatz von Geld oder Belohnungen anderer Art im Allgemeinen begleitend.<br />

Zum einen wird um Geld gespielt, zum anderen müssen Lose gekauft wer<strong>den</strong>, um an<br />

<strong>den</strong> großen Gewinn, sei es Bargeld oder Sachwerte, zu gelangen. Beim Glücksspiel steht die<br />

Zufallskomponente im Vordergr<strong>und</strong>. Der Ausgang des Spiels ist nicht vom Können oder<br />

einer bestimmten Spielstrategie abhängig, sondern vom Fall der Würfel, dem Drehen der<br />

1 Bild von U. Leive<br />

Stand: 21. November 2011 3 ○c J. Baumeister, T.G. Macedo


1.3 Zufall: eine vorläufige Einschätzung<br />

Lostrommel, dem Kauf eines Loses, dem Lauf einer Roulettekugel oder dem Mischen <strong>und</strong><br />

Verteilen von Karten. Über Gewinn oder Verlust entscheidet also das ” Glück“ <strong>und</strong> nicht<br />

der ” Verstand“.<br />

Im Mittelalter gehörten Jahrmärkte zu <strong>den</strong> wichtigsten Ereignissen in <strong>den</strong> sich politisch<br />

verselbständigen<strong>den</strong> Städten. Das dazu notwendige Recht, einen Jahrmarkt zu halten wurde<br />

meistens vom Kaiser, König, Grafen oder sonstigen Landesherrn an einen Ort - oft im<br />

Rahmen des Stadtrechts - verliehen. Zu <strong>den</strong> Jahrmärkten reisten häufig auch Schausteller<br />

des Fahren<strong>den</strong> Volkes an: Bärenführer, Gaukler, Wahrsager, Quacksalber, Musikanten.<br />

Amts-Blatt der Königlichen Regierung zu Potsdam <strong>und</strong> der Stadt Berlin/Den 21. November<br />

1851, Seite 364, No. 48.<br />

Polizei-Verordnung betreffend <strong>den</strong> Verkehr auf <strong>den</strong> Berliner Jahr- <strong>und</strong> Weihnachtsmärkten<br />

.<br />

§ 3. Glücks- <strong>und</strong> Würfelbu<strong>den</strong> sind verboten.<br />

.<br />

Selbst großen <strong>Mathematik</strong>ern sind bei Jahrmarktspielen Fehler unterlaufen. Bei G.W.<br />

Leibniz 2 handelt es sich um das Augensummenparadoxon. Er hat sich bei der Analyse<br />

dieses Spiels einen kleinen Schnitzer erlaubt:<br />

” Es sei ihm unbegreiflich, wie ihm erfahrene Würfelspieler versicherten, warum bei zwei Würfeln<br />

die Augensumme 9 wahrscheinlicher sei als die Augensumme 10, aber bei drei Würfeln die Augensumme<br />

10 wahrscheinlicher als die Augensumme 9. Denn schließlich könne die Summe 9 wie<br />

die Summe 10 in bei<strong>den</strong> Fällen auf gleich viele Arten anfallen, also müssten die Augensummen<br />

in bei<strong>den</strong> Fällen gleich wahrscheinlich sein.“ . Leibniz hat übersehen, dass die Reihenfolge<br />

der Summan<strong>den</strong> hier wichtig ist. Wir analysieren das Spiel später.<br />

Ein Jahrmarktspiel, das nach J. Bertrand Bertrandsches Schachtelparadoxon 3<br />

genannt wird, ist folgendes:<br />

Drei nicht unterscheidbare Schachteln enthalten zwei Goldmünzen (1. Schachtel),<br />

zwei Silbermünzen (2. Schachtel) <strong>und</strong> eine je eine Gold- <strong>und</strong> eine Silbermünze<br />

(3. Schachtel). Jetzt entnimmt man einer Schachtel eine Münze. Der<br />

Veranstalter des Spiels bietet nun eine Wette an: Die zweite Münze in der<br />

Schachtel ist aus demselben Metall!<br />

Man ist versucht, zu vermuten, dass die Wette fair ist, da man geneigt ist, zu vermuten,<br />

dass die Beschaffenheit der zweiten Münze gleichwahrscheinlich ist. Dies ist nicht der Fall.<br />

Analysieren wir die Situation, dass Gold gezogen wurde. Wir vermuten richtig, dass nicht<br />

aus der Schachtel mit <strong>den</strong> zwei Silbermünzen gezogen wurde <strong>und</strong> schließen daraus irrig,<br />

dass mit Wahrscheinlichkeit 1 beide Münzen in der Schachtel, aus der gezogen wurde, aus<br />

2<br />

Gold sind. In Wahrheit sind mit einer Wahrscheinlichkeit von 2 beide Münzen aus Gold,<br />

3<br />

weil in zwei von 3 Fällen die bei<strong>den</strong> Münzen in der Schachtel aus Gold sind.<br />

1.3 Zufall: eine vorläufige Einschätzung<br />

Hier re<strong>den</strong> wir über <strong>den</strong> Zufall eher aus einer historischen Betrachtungsweise heraus. Im<br />

Abschnitt 2 stellen wir die Begriffe bereit, die wir im Folgen<strong>den</strong> benötigen.<br />

2 G.W. Leibniz, 1646-1716<br />

3 Joseph Bertrand, 1822-1900<br />

Stand: 21. November 2011 4 ○c J. Baumeister, T.G. Macedo


1.3 Zufall: eine vorläufige Einschätzung<br />

Zufall, Ungewißheit, Glück, Pech – sind das nicht ziemlich diffuse Begriffe? Eher<br />

aus dem Bereich der Wahrsager als dem der Wissenschaftler? Eine wissenschaftliche Untersuchung<br />

des Zufalls ist möglich, <strong>und</strong> sie begann mit der Analyse von Glücksspielen<br />

durch B. Pascal, C. Huygens, Jakob Bernoulli <strong>und</strong> P. Fermat 4 . Diese Analyse hat <strong>den</strong><br />

Wahrscheinlichkeitskalkül hervorgebracht, der lange <strong>für</strong> einen unbedeuten<strong>den</strong> Zweig der<br />

<strong>Mathematik</strong> gehalten wurde. Einen ersten Erfolg erzielte der Kalkül in der statistischen<br />

Mechanik durch Untersuchungen von L. Boltzmann <strong>und</strong> J.W. Gibbs 5 : Die ” Menge von<br />

Zufall“, die in einem Liter Luft ist, wird durch <strong>den</strong> Begriff der Entropie gemessen. Der<br />

nächste große Erfolg ist mit der Entwicklung der Quantentheorie verknüpft. Heutzutage<br />

ist der Zufall in wissenschaftlichen Theorien fast überall präsent: Rauschen in der<br />

Signalübertragung, Ausbreitung von Epidemien, Entwicklung von Börsenkursen, chaotisches<br />

Verhalten von nichtlinearen Systemen, Spieltheorie, Wetterprognosen, . . . .<br />

Wenn man von Wahrscheinlichkeiten spricht, so tut man dies immer im Zusammenhang<br />

mit irgendwelchen Ereignissen, deren gemeinsames Kennzeichen darin besteht, dass sie –<br />

unter gegebenen Umstän<strong>den</strong> – eintreten können, aber nicht eintreten müssen.<br />

Zufällige Ereignisse begegnen uns als Ergebnisse von Versuchen, wobei ” Versuch“<br />

als Realisierung einer Gesamtheit von wohldefinierten Bedingungen (Versuchsanordnungen)<br />

verstan<strong>den</strong> wer<strong>den</strong> kann. Da wir unter ” Versuch“ so unterschiedliche Objekte wie<br />

medizinische Untersuchung, physikalischer Versuch, Intelligenztest, ” Gedankenspielerei“,<br />

Glückspielr<strong>und</strong>e, . . . verstehen wollen, wollen wir bei dieser verbalen Beschreibung bleiben.<br />

Statt Versuch sagen wir häufig auch Experiment <strong>und</strong> sehen darin oft eine reale<br />

Untersuchung, einen Test, eine Probe, ein Gedankenexperiment, eine Beobachtung.<br />

Wichtig ist nun, dass wir annehmen wollen, dass ein Versuch/Experiment – wenigstens<br />

gedanklich – bei gleichbleibender Versuchsanordnung wiederholbar ist. Ist dann die Versuchsanordnung<br />

so, daß sie <strong>den</strong> Ausgang eines Versuchs nicht eindeutig festlegt, so sind<br />

bei Wiederholung des Versuchs unterschiedliche Ausgänge möglich. Da wir die <strong>den</strong> Ausgang<br />

determinieren<strong>den</strong> Bedingungen nicht kennen oder nicht nennen können, können wir<br />

nicht vorhersagen, welches der Ausgang bei der nächsten Durchführung des Versuchs sein<br />

wird. Wir nennen daher solche Versuche Zufallsexperimente oder zufällige Ereignisse,<br />

ihren Ausgang zufällig. ” Zufall“ dient also hier zur Beschreibung einer Situation, in<br />

der wir auf Gr<strong>und</strong> fehlender Information <strong>den</strong> Ausgang eines Versuchs nicht vorhersagen,<br />

nicht wissen können. Der Begriff der ” Wahrscheinlichkeit“, der noch einzuführen ist, dient<br />

dazu, dieses Nichtwissen bzw. Nichtwissenkönnen theoretisch in <strong>den</strong> Griff zu bekommen<br />

<strong>und</strong> zu quantifizieren.<br />

” Der Titel dieses Essays ist eine Frage: Ist alles vorherbestimmt? Die Antwort lautet<br />

ja. Doch sie könnte genausogut nein lauten, weil wir niemals wissen können, was<br />

vorherbestimmt ist.“ 6<br />

Das ” Ja“ soll heißen, dass wir in fast allen Fragestellungen, wo<strong>für</strong> wir ein mathematisches<br />

Modell haben, in der Lage sind, Gleichungen hinzuschreiben, in <strong>den</strong>en komplizierte<br />

Phänomene codifiziert sind <strong>und</strong> deren Lösung uns Vorhersagen erlauben (Hirntätigkeit,<br />

Wetter, . . . ). Das ” Nein“ bedeutet, dass wir meist nicht in der Lage sind, diese (vielen)<br />

Gleichungen zu lösen oder in ihnen eingearbeitete Anfangsbedingungen zu bestimmen.<br />

Was Wahrscheinlichkeit ist, glaubt jeder zu wissen, es aber zu formulieren, fällt auch<br />

jedem schwer, erst recht schwer ist es im Allgemeinen, die Wahrscheinlichkeit <strong>für</strong> das<br />

4 Blaise Pascal, 1623-1662, Christian Huygens, 1629-1695, Jakob Bernoulli, 1654-1705, Pierre de Fer-<br />

mat, 1607-1665<br />

5 Ludwig Boltzmann, 1844-1906, Josiah Willard Gibbs, 1839-1903<br />

6 Aus: Stephen W. Hawking, Einsteins Traum, Rowohlt, 1993<br />

Stand: 21. November 2011 5 ○c J. Baumeister, T.G. Macedo


1.4 <strong>Zufallszahlen</strong> <strong>und</strong> deren Ersatz<br />

Eintreten eines Ereignisses anzugeben oder auszurechnen. Eine zentrale Tatsache der<br />

Wahrscheinlichkeitsrechnung ist, dass wir ein Experiment kennen, das uns diesen Zufall so<br />

klar vor Augen führt: der Münzwurf. Bei einer großen Anzahl von Münzwürfen mit einer<br />

fairen (symmetrischen) Münze wird die Anzahl von Kopf (der Zahl) etwa bei 50 % liegen.<br />

Auf diese Weise ergibt eine lange Reihe von Münzwürfen ein nahezu sicheres Ergebnis,<br />

obwohl der Ausgang eines einzelnen Wurfes vollständig ungewiss ist. Dieser Übergang von<br />

Ungewissheit zu einer Fastgewissheit, wenn wir eine lange Reihe von Ereignissen (oder<br />

große Systeme) beobachten, ist ein wesentliches Thema beim Studium des Zufalls.<br />

Als Zufallsexperimente können wir betrachten:<br />

Münzwurf Ausgänge: Kopf oder Zahl.<br />

Würfelwurf Ausgänge: Zahlen (Augen) 1, . . . , 6.<br />

Hier könnte eine Beschreibung der Versuchsanordnung so aussehen: Der Würfel ist<br />

ein regelmäßiger Körper mit 6 i<strong>den</strong>tischen <strong>und</strong> glatten Seitenflächen, beschriftet mit<br />

<strong>den</strong> Zahlen 1, 2, 3, 4, 5, 6. Ein Versuch bestehe aus einem Wurf (Fallenlassen aus der<br />

geschlossenen Hand) aus einer Höhe von 10 cm auf einen ebenen Tisch. Der Versuch<br />

ist beendet, sobald der Würfel zur Ruhe gekommen ist. Seine obenliegende Fläche<br />

legt mit der dort abzulesen<strong>den</strong> Zahl das Versuchsergebnis fest.<br />

Urnenexperiment Ziehen von numerierten Kugeln (auf gut Glück) aus einer Urne. Ausgänge:<br />

Nummern der gezogenen Kugeln.<br />

Kartenspiele Ausgänge: Kartenverteilung oder Spielpunkte.<br />

Kegeln Ausgänge: Anzahl der gefallenen Kegel.<br />

Telefonstatistik Erfassung der Anzahl der Anrufe bei der Telefonvermittlung von 12.00<br />

– 12.59 Uhr. Ausgänge: Zahlen 0, 1, 2, . . . .<br />

Die drei Experimente Münzwurf, Würfelwurf, Urnenexperiment dienen häufig als Beispiel<br />

<strong>für</strong> ein Zufallsexperiment. Damit können wir reale Situationen erfassen <strong>und</strong> wesentliche<br />

Merkmale von zufälligen Ereignissen verdeutlichen.<br />

1.4 <strong>Zufallszahlen</strong> <strong>und</strong> deren Ersatz<br />

Das Thema dieser Ausarbeitung sind Zahlen, die als ” echte“ <strong>Zufallszahlen</strong>, als Pseudooder<br />

Quasi-<strong>Zufallszahlen</strong> betrachtet wer<strong>den</strong> können. Die zugehörigen Erzeugungsmechanismen<br />

nenen wir (Pseudo-)<strong>Zufallszahlen</strong>-Generatoren (random number generator<br />

(RNG)). Was ist die Motivation <strong>für</strong> das Bestreben, (Pseudo-)<strong>Zufallszahlen</strong> zu<br />

erzeugen? Warum zu Generatoren von Pseudozufallszahlen greifen, also zu Generatoren,<br />

die nicht <strong>den</strong> ” echten Zufall“ verwen<strong>den</strong>? Es sind die vielfältigen Anwendungsbereiche,<br />

die nach <strong>Zufallszahlen</strong> fragen (siehe [Wei04]):<br />

Experimente, die Gerechtigkeit produzieren, Erzeugung zufälliger Ereignisse<br />

entsprechend statistischer Vorgaben, Verfahren, die die Echtheit von Meßdaten<br />

überprüfen, kryptographische Anwendungen (Erzeugung von Schlüsselzahlen,.<br />

. . ), Monte Carlo Simulation (insbesondere in Computational Finance),<br />

Simulation von Abläufen der realen Welt (Ampelschaltungen), Globale Optimierung,<br />

Spiele (wo taucht der Bösewicht auf?),. . . .<br />

Der Wunsch, zufällige Ereignisse zu generieren, ist zwar keine ausschließliche Erscheinung<br />

des Computerzeitalters, er wurde aber durch die Rechenmöglichkeiten doch stark in <strong>den</strong><br />

Vordergr<strong>und</strong> gerückt. Zur Geschichte:<br />

Stand: 21. November 2011 6 ○c J. Baumeister, T.G. Macedo


1.4 <strong>Zufallszahlen</strong> <strong>und</strong> deren Ersatz<br />

• 1938: Kendall <strong>und</strong> Babington-Smith erzeugen mit einer schnell drehen<strong>den</strong> Scheibe<br />

100 000 zufällige Ziffern.<br />

• Seit 1940/50 wer<strong>den</strong> numerische <strong>und</strong> arithmetische Verfahren verwendet, um <strong>Zufallszahlen</strong><br />

zu generieren.<br />

• 1957: Das 1. ERNIE-Projekt (Electronic Random Number Indicator Equipment)<br />

wurde durch Sidney Broadhurst, Tommy Flowers and Harry Fensom realisiert. Es<br />

wur<strong>den</strong> mit Hilfe von Vakuumröhren bis zu 50 Zufallsziffern pro Sek<strong>und</strong>e erzeugt.<br />

• 1955: Die Rand-Corporation veröffentlicht ein Buch mit ca. 1 Million Zufallsziffern.<br />

• 1983: Miyatake baut eine Vorrichtung, um durch das Zählen von Gammastahlen<br />

zufällige Ergebnisse zu generieren.<br />

• 1995 Marsaglia produziert eine CD-ROM, auf der ca. 4.8 Milliar<strong>den</strong> <strong>Zufallszahlen</strong><br />

gespeichert sind. 7<br />

Pseudozufallszahlen sollen Zahlenfolgen sein, die ” zufällig“ sind, d.h. die Eigenschaften<br />

besitzen, die dem echten Zufall nahe kommen. Also ist man gezwungen, <strong>den</strong> Zufall<br />

deterministisch möglichst gut nachzustellen. In der Umsetzung tun wir es mit Verfahren,<br />

die gewissen Forderungen unterliegen; wir wollen sie Algorithmen nennen.<br />

Ein Algorithmus 8 <strong>für</strong> eine vorgegebene bestimmte Art von Aufgaben ist eine<br />

endliche Abfolge von wohldefinierten, ausführbaren Vorschriften, die bei Abarbeitung,<br />

ausgehend von einem Eingangszustand (Input) nach einer endlichen<br />

Anzahl von Verarbeitungsschritten einen Ausgangszustand (Output) bestimmen,<br />

der als Lösung der durch <strong>den</strong> Eingangszustand charakterisierten Aufgabe<br />

angesehen wer<strong>den</strong> kann.<br />

Algorithmen sind unabhängig von einer konkreten Programmiersprache <strong>und</strong> einem konkreten<br />

Computertyp, auf <strong>den</strong>en sie ausgeführt wer<strong>den</strong>. Die ältesten Rechenvorschriften,<br />

die sich Algorithmen nennen dürfen, gehen auf Theon <strong>und</strong> Euklid zurück9 ; siehe Abschnitte<br />

4.3 <strong>und</strong> 6.4.<br />

Das Problem je<strong>den</strong> Vorgehens, <strong>Zufallszahlen</strong> (auf dem Computer) mittels eines Algorithmus<br />

zu erzeugen, ist offenbar, dass Erzeugen“ <strong>und</strong> Zufall“ ein Widerspruch in<br />

” ”<br />

sich ist. Da der Determinismus schon per Definition eine Eigenschaft eines Algorithmus<br />

ist, steht jeder Nachfolger einer Zufallszahl deterministisch fest. Für die oben genannten<br />

Anwendungsgebiete genügen jedoch diese Pseudozufallszahlen“. Wir lassen das Präfix<br />

”<br />

” Pseudo“ meist weg.<br />

Was soll man unter einer Folge von <strong>Zufallszahlen</strong> verstehen? Der österreichische <strong>Mathematik</strong>er<br />

von Mises 10 versuchte es in der ersten Hälfte des 20. Jahrh<strong>und</strong>erts mit fehlender<br />

Vorhersehbarkeit: Eine 0-1-Sequenz sollte als zufällig gelten, wenn es keine Regel gibt, die<br />

an irgendeiner Stelle das nächste Glied aus <strong>den</strong> vorhergehen<strong>den</strong> mit einer Wahrscheinlichkeit<br />

größer als 50 Prozent prognostiziert. Für <strong>den</strong> Münzwurf bedeutet das: Systeme,<br />

die dem Spieler einen Vorteil versprechen, existieren nicht. So einleuchtend die Definition<br />

klingt, hat sie doch einen Haken. <strong>Von</strong> Mises konnte mathematisch nicht präzisieren, was<br />

er unter einer Regel verstand. Sein Ansatz blieb Stückwerk.<br />

7 random.org brüstet sich, seit 1998 857 Milliar<strong>den</strong> Zufallsbits, also zufällige Nullen <strong>und</strong> Einsen, erzeugt<br />

zu haben.<br />

8 Die Bezeichnung leitet sich aus dem Namen Al–Khwarizmi (Al–Khwarizmi,780?-850?), einem der<br />

bedeutensten <strong>Mathematik</strong>er des anfangen<strong>den</strong> Mittelalters, ab.<br />

9 Theon, um 350 v.Chr., Euklid, um 300 v.Chr.<br />

10 Richard von Mises, 1883-1953<br />

Stand: 21. November 2011 7 ○c J. Baumeister, T.G. Macedo


1.4 <strong>Zufallszahlen</strong> <strong>und</strong> deren Ersatz<br />

Erst in <strong>den</strong> sechziger Jahren des letzten Jahrh<strong>und</strong>erts fan<strong>den</strong> Kolmogorow 11 <strong>und</strong> Chaitin<br />

unabhängig voneinander mit einer speziellen Komplexitätstheorie einen Ausweg: Eine<br />

Zahlenfolge ist ihrer Meinung nach zufällig, wenn sie sich nicht mit einer kürzeren Zeichensequenz<br />

beschreiben lässt. Die Folge 11111. . . etwa kann man knapp ausdrücken mithilfe<br />

des mit Nullen <strong>und</strong> Einsen geschriebenen Computerbefehls <strong>für</strong> Schreibe lauter Einsen,<br />

die Folge 01010101. . . mit einem entsprechen<strong>den</strong> wiederhole 01 . Bei Zufallsfolgen darf es<br />

keine solche Umschreibung in Kurzform geben. Wir verfolgen dies nicht weiter, sondern<br />

geben uns zunächst mit einer ” naiven“ Vorstellung von Zufälligkeit zufrie<strong>den</strong>.<br />

Um die umständliche Verwendung von Tabellen<br />

(siehe Tabelle 2) zu vermei<strong>den</strong>, wer<strong>den</strong> <strong>Zufallszahlen</strong><br />

verwendet, die im Allgemeinen durch<br />

Iterationen nach einer Formel ad hoc hergestellt<br />

wer<strong>den</strong>. Die so erzeugten <strong>Zufallszahlen</strong> haben<br />

<strong>den</strong> Vorteil, dass sie konstruierbar sind, <strong>und</strong> haben<br />

<strong>den</strong> Nachteil, dass sie vollkommen deterministischen<br />

Charakter besitzen. Alles, was wir<br />

hier zunächst zur Sprechweise ” Zufallszahl“ sagen<br />

können, ist, dass je<strong>den</strong>falls kein Muster, keine<br />

Struktur in der Folge erkennbar sein soll. Die<br />

Wahrscheinlichkeitstheorie <strong>und</strong> Statistik stellt<br />

Hilfsmittel bereit, solche Folgen auf ihre Zufälligkeit<br />

zu testen.<br />

Im Lichte dieser Begriffsbildungen können<br />

wir nun Forderungen formulieren, die an einen<br />

<strong>Zufallszahlen</strong>-Generator zu stellen sind. Er soll<br />

Zahlen erzeugen, die folgende Eigenschaften haben:<br />

Abbildung 2: RAND-Tabelle<br />

Gleichverteilung Die Zufallsfolge genügt der Gleichverteilung in [0, 1] . Diese Einschränkung<br />

kann man überwin<strong>den</strong>, wir wer<strong>den</strong> später darauf zurückkommen.<br />

Unvorhersagbarkeit Kennt man eine Zufallszahl (Vorgänger), sollte die nächste konstruierte<br />

Zufallszahl (Nachfolger) nicht vorhersagbar sein. Dies bedeutet, dass der<br />

Konstruktionsmechanismus komplex genug ist, um zu vermei<strong>den</strong>, dass das Konstruktionsprinzip<br />

abgelesen wer<strong>den</strong> kann.<br />

Reproduzierbarkeit Um die Fehlersuche zu erleichtern <strong>und</strong> verschie<strong>den</strong>e Simulationen<br />

einfacher miteinander vergleichen zu können, ist es wichtig, dass eine einmal erzeugte<br />

Zufallsfolge immer wieder reproduziert wer<strong>den</strong> kann.<br />

Bei Spielen (der Bösewicht soll nicht immer zur selben Zeit auf der Bildfläche erscheinen)<br />

<strong>und</strong> in der Kryptologie steht dem gegenüber die Forderung nach Irreproduzierbarkeit.<br />

In der Kryptographie ist diese Forderung ” unverzichtbar“.<br />

Effizienz Dazu kommen die Forderungen, dass der Generator schnell ist <strong>und</strong> möglichst<br />

wenig Speicherplatz auf dem Computer belegt.<br />

Wie soll man nun gute <strong>und</strong> weniger gute Generatoren auseinanderhalten? Klar, indem<br />

man neben der ” Ausschöpfung“ des zur Verfügung stehen<strong>den</strong> Zahlraumes [0, 1] die<br />

obigen Forderungen abprüft. Dies geschieht im Allgemeinen mit theoretischen <strong>und</strong> empirischen<br />

Tests <strong>für</strong> die Güte von Generatoren. Theoretische Tests setzen am Generator<br />

11 A.N. Kolmogorow, 1903-1987<br />

Stand: 21. November 2011 8 ○c J. Baumeister, T.G. Macedo


1.5 Die middle square-Methode von J. von Neumann<br />

selbst an, empirische Tests nehmen sich die erzeugten Zahlenfolgen vor. Wir gehen auf<br />

die Kriterien Gleichverteiltheit, Unkorreliertheit später ein, die Effizienz übergehen wir<br />

weitgehend.<br />

Bereits 1955, als Computer noch ” neu“ waren, veröffentlichte die RAND-Corporation<br />

ein Buch mit einer Million Zufallsziffern. Darin wird die Vorgehensweise beschrieben, wie<br />

man zu diesen <strong>Zufallszahlen</strong> kam: Die <strong>Zufallszahlen</strong> wur<strong>den</strong> durch ” Randomisierung“ einer<br />

Gr<strong>und</strong>tabelle erzeugt, die mit einer elektronischen Roulettscheibe generiert wurde.<br />

Eine Pulsquelle mit zufälliger Frequenz wurde etwa einmal pro Sek<strong>und</strong>e von einem Puls<br />

konstanter Frequenz durchlaufen. Schaltkreise leiteten <strong>den</strong> Puls durch einen fünfstelligen<br />

Binärzähler. Die Anordnung entsprach im Prinzip einer Roulettscheibe mit 32 Plätzen,<br />

die pro Versuch durchschnittlich 3000 Umdrehungen machte <strong>und</strong> eine Zahl pro Sek<strong>und</strong>e<br />

produzierte. Ein Binär/Dezimal-Konverter wandelte 20 der 32 Zahlen um, der Rest<br />

wurde verworfen <strong>und</strong> behielt nur die letzte Stelle der zweistelligen Zahlen. Diese letzte<br />

Stelle steuerte einen IBM-Lochkartenstanzer, der schließlich eine Lochkartentabelle mit<br />

Zufallsziffern ausgab. Der Hauptteil des Buches umfasst die ” Tabelle der Zufallsziffern“.<br />

Sie wer<strong>den</strong> in Gruppen zu je fünf Ziffern aufgelistet.<br />

Wir erwarten, dass die erste Ziffer jedes Blockes ebenfalls zufällig ist. Diese ” Zufälligkeit“<br />

der ersten Ziffer – in Anbetracht des kleinen Ausschnitts der Zufallstabelle – ist nicht sehr<br />

ausgeprägt ist. Wir erwähnen diese Fragestellung, da wir uns noch ausführlich damit<br />

beschäftigen wollen.<br />

1.5 Die middle square-Methode von J. von Neumann<br />

Eine erste Realisierung der Pseudozufallserzeugung<br />

bestand in der Nutzung der Dezimalziffern<br />

transzen<strong>den</strong>ter Zahlen. Die Zahl π wurde<br />

1873 mit 703, 1960 mit 100 000 <strong>und</strong> 1986 mit<br />

10 7 Dezimalstellen berechnet. Die Analyse ergab,<br />

dass kein signifikanter Mangel zu erkennen<br />

war, was die Zufälligkeit der Dezimalstellen hinsichtlich<br />

Gleichverteilung in 0, 1, . . . , 9 betrifft.<br />

Da die Algorithmen zur Berechnung transzen<strong>den</strong>ter<br />

Zahlen in der Regel sehr kompliziert sind,<br />

wer<strong>den</strong> in der Praxis meist andere Algorithmen<br />

benutzt.<br />

i zi ui := 0.zi z 2 i<br />

0 7182 − − − 51 5811 24<br />

1 5811 0.5811 33 7677 21<br />

2 7677 0.7677 58 9363 29<br />

3 9363 0.9363 87 6657 69<br />

. . . . . . . . . . . .<br />

12 0012 0.0012 00 0001 44<br />

13 0001 0.0001 00 0000 01<br />

14 0000 0.0000 00 0000 00<br />

. . . . . . . . . . . .<br />

Einer der ältesten Generatoren ist die Abbildung 3: Middle-Square<br />

Middle-Square-Methode, die um 1940 von<br />

von J. von Neumann <strong>und</strong> S.M. Ulam im Rahmen<br />

des Los-Alamos-Projekts zur Entwicklung der Wasserstoffbombe <strong>für</strong> Computer-<br />

Simulationen eingesetzt wurde12 ; wir kommen im Rahmen der Monte Carlo-Simulation<br />

auf dieses Projekt zurück. Die middle square-Methode wird wie folgt durchgeführt wird:<br />

Wähle eine 4-stellige Zahl (Startwert), quadriere sie, man erhält eine höchstens<br />

8-stellige Zahl. Ist das Ergebnis nicht 8-stellig, füllt man sie links mit Nullen<br />

auf 8 Stellen auf. Die mittleren 4 Ziffern wählt man nun als erste Zufallszahl<br />

<strong>und</strong> als neuen Startwert <strong>für</strong> das Vorgehen.<br />

12 John von Neumann, 1903-1957, S.M. Ulam, 1909-1984<br />

Stand: 21. November 2011 9 ○c J. Baumeister, T.G. Macedo


1.5 Die middle square-Methode von J. von Neumann<br />

Ist man ” unvorsichtigt“ bei der Wahl des Startwertes, bekommt man eine nicht sehr<br />

brauchbare Folge. Etwa erhält man mit dem Startwert 8441:<br />

8441, 2504, 2700, 2900, 4100, 8100, 6100, 2100, 4100, 8100, . . . .<br />

Es ist sogar noch ” schlimmer“, wie das Beispiel in der Abbildung 3 andeutet: die ersten<br />

Schritte des Middle-square-Algorithmus scheinen brauchbare <strong>Zufallszahlen</strong> zu liefern,<br />

die Fortsetzung bei i = 12 zeigt aber, dass die Iteration bei der ” Zufallszahl“ Null endet.<br />

In der Tat tendiert der Algorithmus in vielen Fällen dazu, bei Null zu en<strong>den</strong>. Also<br />

scheint der Algorithmus unbrauchbar zu sein, <strong>Zufallszahlen</strong> zu erzeugen. Anderenfalls ist<br />

das obige kurze Stück 8100, 6100, . . . , 8100 das periodische Stück einer doch recht langen<br />

nichtperiodischen Zahlensequenz, die mit dem Startwert 6239 beginnt; man rechne dies<br />

nach.<br />

Bibliographische Anmerkungen<br />

Die hier vorgestellten Überlegungen sind so allgemeiner Natur, dass Verweise nahezu<br />

unnötig sind. Algorithmen sind das Werkzeug der <strong>Mathematik</strong> <strong>und</strong> Informatik. Eine schon<br />

etwas in die Jahre gekommene, aber immer noch topaktuelle dreibändige Monographie<br />

dazu ist das Werk von D.E. Knuth [49].<br />

Zu einer populärwissenschaftlichen Diskusion der Frage des Zufalls <strong>und</strong> der Zufallsfolgen<br />

siehe etwa [Zei00].<br />

<strong>Von</strong> der Verwendung des middle square–Generators ist abzuraten, weil seine Perio<strong>den</strong>länge<br />

im Allgemeinen sehr klein ist. Interessanterweise gibt es Modifikationen hiervon,<br />

die Knuth als muddle square–Generator bezeichnet. In Bemerkung 7.10 kommen mit dem<br />

Twister-Generator auf eine solche Modifikation zurück.<br />

Stand: 21. November 2011 10 ○c J. Baumeister, T.G. Macedo


2 (Mathematische) Wahrscheinlichkeit<br />

Eine sehr kleine Ursache, die uns entgehen mag, bewirkt<br />

einen beachtlichen Effekt, <strong>den</strong> wir nicht ignorieren können,<br />

<strong>und</strong> wir sagen dann, dass dieser Effekt auf Zufall beruht<br />

Henri Poincaré, 1903<br />

Hier skizzieren wir die Begriffe, die wir aus dem Bereich der Wahrscheinlichkeitstheorie<br />

<strong>für</strong> die Diskussion unserer Ergebnisse benötigen. Beispiele <strong>für</strong> die Begriffe führen wir hier<br />

im Allgemeinen nicht an, sie folgen in ausreichender Auswahl in <strong>den</strong> nächsten Abschnitten.<br />

2.1 Zufall, Ereignismenge <strong>und</strong> Wahrscheinlichkeit<br />

Wie re<strong>den</strong> wir über <strong>den</strong> Zufall? Wir wollen uns nicht lange dabei aufhalten. Mögliche<br />

” Definitionsschnipsel“ sind:<br />

• Wenn im Bereich der Geschehnisse, die im strengen Sinn wegen etwas eintreten <strong>und</strong><br />

deren Ursache außer ihnen liegt, etwas geschieht, das mit dem Ergebnis nicht in eine<br />

Deswegen-Beziehung zu bringen ist, dann nennen wir das zufällig (Aristoteles) 13<br />

• Zufall ist das Eintreten unvorhergesehener <strong>und</strong> unbeabsichtigter Ereignisse.<br />

• Das, wobei unsere Rechnungen versagen, nennen wir Zufall (Albert Einstein).<br />

• Jemandem fällt etwas (unverdientermaßen) zu.<br />

Die Spannung bei der Verwendung des Zufalls resultiert wesentlich aus der naturwissenschaftlichen<br />

Sicht vom Eintreten von Ereignissen: das Kausalitätsprinzip lässt ” Nicht–<br />

Determiniertes“ nicht zu; siehe unten. Ein Ausweg ist, dass wir unterstellen, die Umstände<br />

(Anfangsbedingungen) des Greifens von naturwissenschaftlichen Gesetzen nicht vollständig<br />

kennen zu können. Beispiele <strong>für</strong> das ” Wirken von Zufall“ sind etwa:<br />

• Ergebnis beim Münzwurf<br />

• Eintreten von Augenzahlen beim Würfeln<br />

• Radioaktiver Zerfall<br />

• Ges<strong>und</strong> trifft auf krank in der U-Bahn<br />

• Ein Blatt fällt von einem Baum zu Bo<strong>den</strong>, landet es auf der Voderseite oder Rückseite?<br />

• Männlicher oder weiblicher Nachwuchs<br />

In der Wahrscheinlichkeitsrechnung betrachtet man so genannte Zufallsexperimente<br />

(Lottoziehung, Würfeln, Ergebnis einer Befragung); im ersten Kapitel haben wir schon<br />

darüber geredet. Bei all diesen Experimenten gibt es eine Menge möglicher Ereignisse,<br />

üblicherweise mit dem griechischen Großbuchstaben Omega bezeichnet:<br />

Ω = {ω1, ω2, . . . , ωn} .<br />

Ω ist die Ereignismenge, jedes ωi heißt ein Elementarereignis. Eine Teilmenge von Ω<br />

heißt ein zusammengesetztes Ereignis.<br />

13 <strong>Von</strong> Aristoteles (384-322 v. Chr.) ist auch überliefert (Quelle: [72], S. 183): ” . . . Alle Gebilde, bei deren<br />

Entstehen sich alle gerade so ergeben habe, wie es auch ein zweckbestimmtes Wer<strong>den</strong> hervorgebracht<br />

haben würde, hätten sich nun am Leben erhalten können, da sie dank dem blin<strong>den</strong> Zufall einen lebensdienlichen<br />

Aufbau besessen hätten. Das Übrige aber sei zugr<strong>und</strong>e gegangen <strong>und</strong> gehe stets zugr<strong>und</strong>e.“<br />

Stand: 21. November 2011 11 ○c J. Baumeister, T.G. Macedo


2.2 Mehrstufige Zufallsexperimente <strong>und</strong> Baumdiagramme<br />

Nun gehen wir daran, das Nichtwissenkönnen des Ausgangs eines Zufallsexperiments<br />

zu quantifizieren. Jedem Ereignis soll eine Zahl aus [0, 1] zugeordnet wer<strong>den</strong>, die uns gestattet,<br />

die Unsicherheit über <strong>den</strong> Ausgang anzugeben: 1 sollte <strong>für</strong> absolute Sicherheit, 0<br />

<strong>für</strong> vollständige Unsicherheit stehen.<br />

Als Maßzahl <strong>für</strong> die Chance <strong>für</strong> das Eintreten eines Elementarereignisses ωi sehen wir<br />

eine nichtnegative (reelle) Zahl pi an. Diese Maßzahl pi nennen wir die Wahrscheinlichkeit<br />

<strong>für</strong> das Eintreten des Elementarereignisses ωi . Als Normierung betrachtet man die<br />

Bedingung, dass sich diese Elementarwahrscheinlichkeiten zu Eins aufsummieren. Dies ist<br />

in Übereinstimmung mit der Sichtweise, dass ein sicheres Eintreten eines Ereignisses mit<br />

der Chance Eins bewertet wird. Damit ergibt sich die so genannte Wahrscheinlichkeitsabbildung<br />

auf der Potenzmenge 14 POT(Ω):<br />

P : POT(Ω) ∋ A ↦−→ P (A) := #A<br />

#Ω<br />

∈ [0, 1] . (1)<br />

Wir führen ein bißchen ” Algebra“ <strong>für</strong> das Rechnen mit Wahrscheinlichkeiten an.<br />

Wenn das Ereignis E ⊂ Ω das zusammengesetzte Ereignis A ∪ B ist, verbin<strong>den</strong> wir<br />

damit folgende Sprechweise: E ist das Ereigneis, dass A oder B eintritt. Was ist die<br />

Wahrscheinlichkeit von E? Ist die Vereinigung A ∪ B disjunkt, d.h. ist A ∩ B = ∅, dann<br />

gilt P (A ∪ B) = P (A) + P (B) . Ist die Vereinigung nicht disjunkt, dann gilt<br />

P (A ∪ B) = P (A) + P (B) − P (A ∩ B) .<br />

Dies zeigt man leicht durch Abzählen der Elementarereignisse, der Term −P (A ∩ B)<br />

berücksichtigt die Tatsache, dass die Elementarereignisse in A ∩ B durch P (A) + P (B)<br />

doppelt gezählt wer<strong>den</strong>.<br />

Manchmal sind alle n Elementarereignisse gleichwahrscheinlich, d.h. als Ausgang des<br />

Experiments kann jedes Elementarereignis mit der gleichen Chance eintreten. Dann ist<br />

die Wahrscheinlichkeit pi <strong>für</strong> jedes Elementarereignis natürlich der n-te Teil der Gesamtwahrscheinlichkeit<br />

Eins, also<br />

pi = 1<br />

n<br />

<strong>für</strong> alle i = 1, . . . , n .<br />

Man spricht dann von einem Laplace-Experiment. 15<br />

Bemerkung 2.1 Hier haben wir nur die Wahrscheinlichkeitsrechnung mit endlicher Ereignismenge<br />

angerissen. <strong>Von</strong> sehr viel größerer Komplexität ist die Theorie bei unendlicher<br />

Ereignismenge. Hier tritt schon die Frage auf, welche zusammengesetzte Ereignisse eine<br />

Wahrscheinlichkeit haben sollen. Beleuchtet wird diese Frage durch die Tatsache, dass in<br />

diesem Kontext Elementarereignisse im Allgemeinen die Wahrscheinlichkeit Null besitzen;<br />

eine Additivität von Wahrscheinlichkeiten ist daher problematisch. Wir kommen im<br />

Kapitel 8 darauf zurück. �<br />

2.2 Mehrstufige Zufallsexperimente <strong>und</strong> Baumdiagramme<br />

Etwas komplexer wird eine Experimentsituation, wenn man sich mehrstufige Zufallsexperimente<br />

anschaut, wie etwa die N-malige Wiederholung eines Experiments. Die Wahrscheinlichkeiten<br />

<strong>für</strong> das mehrstufige Experiment soll ermittelt wer<strong>den</strong> aus <strong>den</strong> Wahrscheinlichkeiten,<br />

die auf jeder Stufe bekannt seien. Eine Möglichkeit, eine solche Situation zu<br />

14 Die Potenzmenge einer Menge M ist die Menge aller Teilmengen von M . Mit dem Symbol #M<br />

schreiben wir die Anzahl der Elemente der Menge M auf. #M = ∞ bedeutet, dass M eine Menge mit<br />

unendlich vielen Elementen ist.<br />

15 P.-S. Laplace, 1749-1827<br />

Stand: 21. November 2011 12 ○c J. Baumeister, T.G. Macedo


2.2 Mehrstufige Zufallsexperimente <strong>und</strong> Baumdiagramme<br />

veranschaulichen, besteht darin, ein Baumdiagramm zu zeichnen. Ein Baumdiagramm<br />

ist ein verzweigtes Diagramm, bei dem jeder Stufe des Zufallsexperimentes eine ” Ebene“<br />

entspricht. Man zeichnet Blasen, die mit <strong>den</strong> jeweiligen Stufen–Ereignissen gekennzeichnet<br />

sind <strong>und</strong> schreibt die Wahrscheinlichkeiten <strong>für</strong> ihr Eintreten an die Verbindungslinien<br />

(siehe Abbildung 4 in Verbindung mit Beispiel 2.2). Dieses Diagramm wird von links nach<br />

rechts gelesen.<br />

Zwei Regeln wer<strong>den</strong> zur Berechnung der Wahrscheinlichkeit<br />

des mehrstufigen Experiments herangezogen.<br />

1. Pfadregel: Multiplikationsregel<br />

Die Wahrscheinlichkeit eines Ereignisses bei einem<br />

mehrstufigen Zufallsexperiment, die sich aus einem<br />

Pfad des Diagramms ergibt, ist gleich dem<br />

Produkt der Wahrscheinlichkeiten längs des Pfades,<br />

der zu diesem Ergebnis führt! Begründung:<br />

Diese Regel ist einsichtig, etwa wenn man an die<br />

Häufigkeitsinterpretation (siehe unten) <strong>den</strong>kt.<br />

2. Pfadregel: Additionsregel<br />

Setzt sich ein mehrstufiges Ereignis aus verschie<strong>den</strong>en<br />

Pfa<strong>den</strong> eines Baumdiagramms zusammen, so<br />

erhält man seine Wahrscheinlichkeit durch Addition<br />

der einzelnen Pfadwahrscheinlichkeiten.<br />

4/6<br />

2/6<br />

6<br />

2<br />

1. Stufe<br />

4/6<br />

4/6<br />

2/6<br />

2/6<br />

6<br />

2<br />

6<br />

2. Stufe<br />

2<br />

(1. Wurf) (2. Wurf)<br />

p= 16/36<br />

p=8/36<br />

p=8/36<br />

p=4/36<br />

Abbildung 4: Würfelexperiment<br />

Beispiel 2.2 Wir würfeln mit einem Würfel, der<br />

auf 4 Seiten die Zahl 2 <strong>und</strong> auf <strong>den</strong> übrigen 2 Seiten die Zahl 6 zeigt. Er wird 2-mal<br />

geworfen. Wir machen dazu ein Pfaddiagramm; siehe Abbildung 4. An <strong>den</strong> Pfa<strong>den</strong><strong>den</strong><br />

können wir Wahrscheinlichkeiten ablesen. Die Wahrscheinlichkeit, dass zweimal eine<br />

Sechs gewürfelt wird, ergibt sich nach der ersten Pfadregel zu 4/36, die Wahrscheinlichkeit,<br />

dass nach zwei Würfen die Augensumme 8 vorliegt, ergibt sich nach der zweiten<br />

Pfadregel zu 8/36 + 8/36 = 16/36. �<br />

Jetzt haben wir schon viel von Wahrscheinlichkeit gesprochen, aber was soll man sich<br />

darunter vorstellen? Eine Möglichkeit bietet die Häufigkeitsinterpretation. Sie fasst<br />

Wahrscheinlichkeit etwa so:<br />

Wenn man ein Zufallsexperiment N-mal wiederholt, möge das Elementarereignis<br />

ωi etwa mi-mal eintreten. Ist nun pi die (theoretische) Wahrscheinlichkeit<br />

<strong>für</strong> das Eintreten von ωi, so sollte die Häufigkeit mi etwa gleich N · pi sein; je<br />

größer die Zahl der Wiederholungen N ist, desto genauer sollte das Ergebnis<br />

mi an die erwartete Anzahl N · pi herankommen (Gesetz der großen Zahl;<br />

siehe 8.1).<br />

Es gibt also <strong>für</strong> das Eintreffen eines Ereignisses bei einem Zufallsexperiment nicht nur die<br />

theoretische Wahrscheinlichkeit, sondern auch eine empirische Wahrscheinlichkeit. Das<br />

Empirische Gesetz der Großen Zahlen besagt, dass je öfter man ein ” echtes“ Zufallsexperiment<br />

durchführt, desto mehr stabilisiert sich die relative Häufigkeit eines Ereignisses<br />

um einen festen Wert, <strong>den</strong> der theoretischen Wahrscheinlichkeit. Für eine Zufallsvariable<br />

bedeutet dies, dass sich der Erwartungswert der Zufallsvariablen einstellt.<br />

Die Wahrscheinlichkeit p, dass eine Reißzwecke so fällt, dass die Spitze nach oben<br />

zeigt, oder ein Butterbrot beim Herunterfallen so fällt, dass die Butterseite unten ist,<br />

kann nur empirisch festgestellt wer<strong>den</strong>. Man möchte dabei die theoretische Wahrscheinlichkeit<br />

p mittels einer Versuchsserie so abschätzen, dass sich die relative Häufigkeit <strong>und</strong><br />

p angleichen.<br />

Stand: 21. November 2011 13 ○c J. Baumeister, T.G. Macedo


2.3 Hilfsmittel zur Realisierung von Laplace-Experimenten<br />

2.3 Hilfsmittel zur Realisierung von Laplace-Experimenten<br />

Ein Mechanismus, der eine Zufallswahl bewerkstelligt, die zwei Ergebnisse mit der Wahrscheinlichkeit<br />

1 als Ausgang hat, ist der Münzwurf. Wir unterstellen also, dass wir es mit<br />

2<br />

einer fairen“ Münze zu tun haben, bei der jede der bei<strong>den</strong> Seiten – wir bezeichnen sie mit<br />

”<br />

Kopf <strong>und</strong> Zahl – die gleiche Chance hat, oben zu liegen. Wenn wir Kopf die Zahl Eins (1)<br />

<strong>und</strong> Zahl die Zahl Null (0) zuordnen, erzeugen wir also bei mehrmaliger Wiederholung<br />

des Münzwurfes eine Folge von Nullen <strong>und</strong> Einsen. Man nennt eine solche Folge auch<br />

ein Wort über dem (einfachen) Alphabet {0, 1} . Für eine solches Wort haben wir die<br />

Interpretation als Dualzahlen.<br />

Betrachten wir etwa <strong>den</strong> Ausgang 00101011. Dieses Wort entspricht dann der Dualzahl,<br />

die die Zahl 43 im Dezimalsystem darstellt:<br />

0 · 2 7 + 0 · 2 6 + 1 · 2 5 + 0 · 2 4 + 1 · 2 3 + 0 · 2 2 + 1 · 2 1 + 1 · 2 0 = 43<br />

Jede dieser achtstelligen Dualzahlen hat als Wahrscheinlichkeit, geworfen zu wer<strong>den</strong>, <strong>den</strong><br />

Wert ( 1<br />

2 )8 = 1/256, wie man sich über ein Baumdiagramm mit 8 Stufen mittels der 1.<br />

Pfadregel überzeugt. 16<br />

Unter ” Würfeln“ verstehen wir die zufällige Auswahl einer Zahl aus 1,2,. . . ,6. Natürlich<br />

stellt diese Darstellung die historische Wahrheit auf <strong>den</strong> Kopf: ein Würfel mit seinen<br />

gleichen sechs Seiten stellt die einfache Realisierung der zufälligen Auswahl von Zahlen<br />

dar, die Gleichverteilung der Auswahl der Zahlen ist eine Konsequenz der unterstellten<br />

geometrischen Gestalt des Würfels. 17 Heutzutage besitzt fast jedes Handy die Möglichkeit,<br />

<strong>den</strong> Würfel zu simulieren <strong>und</strong> damit <strong>Zufallszahlen</strong> im Bereich 1, 2, . . . , 6 nachzustellen.<br />

Beim Würfelexperiment (mit einem fairen Würfel), betrachtet als Laplace–Experiment,<br />

haben wir als Ereignismenge<br />

Ω = {1, . . . , 6}<br />

<strong>und</strong> jedes Elementarereignis ωi hat die Wahrscheinlichkeit<br />

pi = 1<br />

6<br />

, i = 1, 2, . . . , 6<br />

Für das zusammengesetzte“ Ereignis, eine Eins, Zwei oder Drei zu würfeln, errechnen wir<br />

”<br />

eine Wahrscheinlichkeit 1 mit der zweiten Pfadregel; anschaulich ist das Ergebnis natürlich<br />

2<br />

klar, <strong>den</strong>n die erste Hälfte“ der Augen ist gleichwahrscheinlich mit der zweiten Hälfte“<br />

” ”<br />

der Augen.<br />

Beim Würfeln mit zwei (fairen) Würfeln, betrachtet als Laplace–Experiment, haben<br />

wir:<br />

Ω = {(i, j) ∈ N × N|1 ≤ i, j ≤ 6} ; pij = 1<br />

, 1 ≤ i, j ≤ 6 .<br />

36<br />

Kommen wir zum Augensummenparadoxon zurück, das wir im ersten Kapitel betrachtet<br />

haben. Wir betrachten das Würfeln mit zwei Würfeln als Laplace–Experiment. Wir<br />

unterstellen damit, dass die Würfel unterscheidbar sind <strong>und</strong> es daher einen ersten <strong>und</strong><br />

einen zweiten Würfel gibt. Wir haben<br />

Ω = {(i, j) ∈ N × N|1 ≤ i, j ≤ 6},<br />

16 Diese kleine Zahl entspricht der Wahrscheinlichkeit, dass der Kracke Paul <strong>für</strong> acht Spiele der Welt-<br />

meisterschaft <strong>den</strong> Ausgang richtig voraussagt, wenn man eine Irrtumswahrscheinlichkeit von 1<br />

2 unterstellt.<br />

17 Siehe http://de.wikipedia.org/wiki/Spielwürfel<br />

Stand: 21. November 2011 14 ○c J. Baumeister, T.G. Macedo


2.3 Hilfsmittel zur Realisierung von Laplace-Experimenten<br />

<strong>und</strong> interessieren uns also <strong>für</strong> die Laplace–Wahrscheinlichkeiten der Ereignisse<br />

A9 := {(i, j) ∈ Ω|i + j = 9} , A10 := {(i, j) ∈ Ω|i + j = 10} .<br />

Wir haben dazu A9, A10 abzuzählen. Es gilt<br />

A9 = {(3, 6), (6, 3), (4, 5), (5, 4)} , A10 = {(4, 6), (6, 4), (5, 5)} .<br />

<strong>und</strong> daher<br />

P (A9) = 4 1<br />

=<br />

36 9 , P (A10) = 3 1<br />

=<br />

36 12<br />

Bei drei Würfeln zeigt eine einfache Aufzählung (bei entsprechender Bezeichnung)<br />

P (A9) = 19<br />

216 , P (A10) = 24<br />

216 .<br />

Modelliert man das Experiment mit zwei ununterscheidbaren Würfeln, dann hat man statt<br />

36 Möglichkeiten nur noch 21 mögliche Ausgänge, aber kein Laplace–Experiment mehr,<br />

da etwa die Ausgänge 1–1 <strong>und</strong> 1–2 verschie<strong>den</strong>e Wahrscheinlichkeiten haben. Damit ist<br />

der Leibnizsche Fehler nun offensichtlich.<br />

Bei der Beschriftung eines Würfels mit <strong>den</strong> ” Augenzahlen“ 1,2,3,4,5,6 gibt es viele<br />

Möglichkeiten. Unter diesen Möglichkeiten wer<strong>den</strong> aber in der Praxis nur die so genannten<br />

7er-Beschriftungen realisiert. Sie sind dadurch ausgezeichnet, dass die Beschriftung<br />

zweier gegenüberliegender Seiten so gewählt wird, dass die Augensumme 7 ergibt. Darunter<br />

haben sich genau 2 Möglichkeiten durchgesetzt. Sie sind dargestellt durch folgende<br />

” Würfelnetze“: ⎛<br />

3<br />

⎝6<br />

5<br />

4<br />

1 2<br />

⎞<br />

⎠<br />

⎛<br />

4<br />

⎝6<br />

5<br />

3<br />

1 2<br />

Wie kann man mit Hilfe eines Münzwurfes einen Würfel simulieren? Hier kommen uns<br />

die Dualzahlen zu Hilfe, <strong>den</strong>n mit einem dreifachen Münzwurf können wir die Dualzahlen<br />

000, 001, 010, 100, 011, 110, 101, 111 (0 entspricht Kopf, 1 entspricht Zahl) ” auswürfeln“.<br />

Aus diesen 8 Möglichkeiten müssen wir nun 6 machen, also 2 ” streichen“; wir sollten 000<br />

(entspricht 0) <strong>und</strong> 111 (entspricht 7) streichen Dies kann so geschehen:<br />

S1 Werfe dreimal die Münze.<br />

S2 Ist das Ergebnis 000 oder 111, gehe zu S1, sonst<br />

S3 notiere das Ergebnis als Würfelwurfergebnis.<br />

Ein beliebtes Bild von einem Zufalls–Mechanismus ist das Urnenmodell. Eine Urne<br />

ist ein Gefäß, in dem Gegenstände ” versteckt“ wer<strong>den</strong>, die man dann wieder – nach ausreichendem<br />

Mischen – herausholen kann.<br />

Beispiel 2.3 In einer Urne liegen drei schwarze Kugeln <strong>und</strong> eine weiße Kugel. Auf gut<br />

Glück wer<strong>den</strong> zwei Kugeln der Urne entnommen. Welche Wahrscheinlichkeit ist größer,<br />

zwei schwarze Kugeln oder eine weiße <strong>und</strong> eine schwarze Kugel herauszunehmen? Man<br />

ist auf Gr<strong>und</strong> der Tatsache, dass dreimal soviele schwarze wie weiße Kugeln in der Urne<br />

liegen zu vermuten, dass die erste Möglichkeit wahrscheinlicher ist. Dem ist aber nicht<br />

so, <strong>den</strong>n es gibt drei Möglichkeiten, zwei schwarze Kugeln herauszunehmen <strong>und</strong> drei<br />

Möglichkeiten eine schwarze <strong>und</strong> eine weiße Kugel herauszunehmen. Es lässt sich dies<br />

auch rechnerisch begrün<strong>den</strong>:<br />

Wahrscheinlichkeit <strong>für</strong> das Ziehen zweier schwarzer Kugeln<br />

3<br />

4<br />

· 2 3 = 1 2<br />

Wahrscheinlichkeit <strong>für</strong> das Ziehen einer weißen <strong>und</strong> einer schwarzer Kugel 1<br />

4<br />

· 1 + 3 4 · 1 3 .<br />

Man fertige dazu ein Baumdiagramm! �<br />

Stand: 21. November 2011 15 ○c J. Baumeister, T.G. Macedo<br />

⎞<br />


2.4 Zufallsvariable, Erwartungswert <strong>und</strong> Verteilung<br />

2.4 Zufallsvariable, Erwartungswert <strong>und</strong> Verteilung<br />

Eine Funktion, die <strong>den</strong> Ergebnissen eines Zufallsexperiments numerische Werte zuordnet,<br />

nennt man eine Zufallsvariable. Die Bedeutung der Zufallsvariable liegt darin, dass<br />

durch sie die Verbindung zwischen dem Resultat eines Zufallsexperiments <strong>und</strong> seiner mathematischen<br />

Darstellung/Realisation hergestellt wird. Bei einer diskreten Zufallsvariablen<br />

– <strong>und</strong> nur solche betrachten wir hier in erster Linie – sind nur endlich viele Realisierungen<br />

möglich.<br />

Zum Beispiel kann das Zufallsexperiment des Münzwurfs als Zufallsvariable X modelliert<br />

wer<strong>den</strong>: X bildet die Menge der Wurfergebnisse Kopf, Zahl auf die Menge der<br />

Realisationen {0, 1} ab:<br />

X(ω) =<br />

�<br />

0, wenn ω = Kopf,<br />

1, wenn ω = Zahl.<br />

Das Zufallsexperiment ” Wurf mit drei (fairen) Würfeln“ <strong>und</strong> die Frage nach der Augensumme<br />

kann mit Hilfe einer Zufallsvariablen Z so modelliert wer<strong>den</strong>:<br />

Z((ω1, ω2, ω3)) := ω1 + ω2 + ω3 , ωi ∈ {1, 2, . . . , 6} .<br />

Sei X eine Zufallsvariable mit reellen Werten 18 . Die Wahrscheinlichkeiten<br />

Ws(X = x) , x Realisierung<br />

gibt die Wahrscheinlichkeit der unterschiedlichen Realisierungen x an; man nennt diese<br />

Gesamtheit Verteilung von X . Die Verteilungsfunktion von X ist definiert durch<br />

F (x) := Ws(X ≤ x) .<br />

Der Erwartungswert der Zufallsvariablen X – wir schreiben <strong>für</strong> dies Maßzahl E(X) –<br />

ist jener Wert, der sich (in der Regel) bei oftmaligem Wiederholen des zugr<strong>und</strong>e liegen<strong>den</strong><br />

Experiments als Mittelwert der Ergebnisse einstellt. In der Situation<br />

erhalten wir<br />

Ω = {ω1, . . . , ωn} , pi = P ({ωi}), i = 1, . . . , n,<br />

E(X) =<br />

n�<br />

piX(ωi) .<br />

i=1<br />

Ein Erwartungswert muss kein mögliches Ergebnis des zugr<strong>und</strong>e liegen<strong>den</strong> Zufallsexperiments<br />

sein. Beispielsweise ist der Erwartungswert der Augen beim Würfelwurf gegeben<br />

durch<br />

1 · 1 1 1 7<br />

+ 2 · + · · · + 6 · =<br />

6 6 6 2 .<br />

Eine weitere wichtige Maßzahl der Zufallsvariablen X ist die Varianz. Wir schreiben<br />

da<strong>für</strong> V(X) . Sie ist definiert durch<br />

V(X) := E((X − E(X)) 2 )<br />

Die ” physikalische“ Einheit der Varianz ist das Quadrat der Einheit der Zufallsvariablen<br />

X . Dies ist birgt gewisse Nachteile. Daher wird die abgeleitete Größe Standardabweichung<br />

19 eingeführt. Sie ist <strong>für</strong> eine Zufallsvariable X definiert als die positive Quadratwurzel<br />

aus deren Varianz <strong>und</strong> wird als σ(X) := � V(X) notiert. Sie beschreibt also, wie<br />

18Wir verwen<strong>den</strong> hier die reellen Zahlen ohne auf die inneren Eigenschaften einzugehen. Im Kapitel 4<br />

schauen wir etwas genauer hin.<br />

19Die Standardabweichung wurde um 1860 von Sir Francis Galton, 1822-1911, Cousin von C.R. Darwin,<br />

eingeführt<br />

Stand: 21. November 2011 16 ○c J. Baumeister, T.G. Macedo


2.4 Zufallsvariable, Erwartungswert <strong>und</strong> Verteilung<br />

im Mittel die abgeleitete Zufallsvariable X−E(X) um <strong>den</strong> Erwartungswert E(X) streut“.<br />

”<br />

Beispielsweise ist die Standardabweichung der Augen beim Würfelwurf gegeben durch<br />

�<br />

70 7<br />

σ(X) = , da (1 −<br />

4 2 )2 + (2 − 7<br />

2 )2 + · + (6 − 7<br />

2 )2 = 70<br />

4 .<br />

Das Galtonbrett besteht aus einer regelmäßigen<br />

Anordnung von Hindernissen, an <strong>den</strong>en eine von<br />

oben eingeworfene Kugel jeweils nach links oder<br />

rechts abprallen kann; vergleiche mit einem Flipperspiel.<br />

Nach dem Passieren der Hindernisse wer<strong>den</strong><br />

die Kugeln in Fächern aufgefangen, um dort<br />

gezählt zu wer<strong>den</strong>; siehe Abbildung 5. Jedes Aufprallen<br />

einer Kugel auf eines der Hindernisse ist<br />

ein Bernoulli-Versuch. Die bei<strong>den</strong> möglichen<br />

Ausgänge sind: Kugel fällt nach rechts, Kugel fällt<br />

nach links.<br />

Bei symmetrischem Aufbau ist die Wahrschein-<br />

lichkeit, nach rechts zu fallen, p = 1<br />

2<br />

<strong>und</strong> die Wahr-<br />

scheinlichkeit, nach links zu fallen, q = 1 − p =<br />

Abbildung 5: Das Galtonbrett<br />

1<br />

2 .<br />

Durch unsymmetrischen Aufbau oder durch Schiefstellen<br />

des Brettes kann man auch einen anderen<br />

Wert <strong>für</strong> p erreichen, wobei aber natürlich weiterhin<br />

q = 1−p ist, <strong>den</strong>n die Kugeln, die nicht nach rechts<br />

fallen, fallen nach links. Indem die Kugel nach Passieren<br />

des ersten Hindernisses auf ein neues trifft,<br />

bei dem die gleichen Voraussetzungen gelten, wird<br />

hier ein weiterer Bernoulli-Versuch durchgeführt; das Durchlaufen des ganzen Gerätes ist<br />

also eine mehrstufige Bernoulli-Kette, wobei die Zahl der waagrechten Reihen von Hindernissen<br />

die Anzahl der Ebenen, die Länge dieser Kette ist. In der Abbildung 5 handelt<br />

es sich demnach um ein Galtonbrett mit 6 Ebenen <strong>und</strong> um eine 6-malige Wiederholung<br />

eines Bernoulli-Versuchs, d.h. eine Bernoulli-Kette der Länge 6.<br />

Sei n die Anzahl der Ebenen eines Galtonbretts. Die Anzahl der Fächer, in die die<br />

Kugeln fallen können, ist dann n + 1 . Je<strong>den</strong> Durchlauf einer Kugel kann man mit einem<br />

Wort der Länge n über dem Alphabet {L, R} in Verbindung bringen, wobei wir festlegen,<br />

dass L (links) bzw. R (rechts) mit der Draufsicht gemeint ist. Beispielsweise ist der in der<br />

Abbildung 5 eingezeichnete Durchlauf beschrieben durch das Wort RLLRRR .<br />

Sei nun ein Wort der Länge n betrachtet, in dem l-mal der Buchstabe L vorkommt.<br />

Dann ist die Wahrscheinlichkeit <strong>für</strong> dieses Wort ( 1<br />

2 )l ( 1<br />

2 )n−l = ( 1<br />

2 )n . Wenn wir die Fächer<br />

von links nach rechts durchnummerieren mit <strong>den</strong> Nummern 0, 1, . . . , n, dann haben wir<br />

nach der Pfadregel <strong>für</strong> die Wahrscheinlichkeit, dass eine Kugel in das Fach mit der Nummer<br />

m fällt, die Wahrscheinlichkeiten aller Pfade, die zum Fach m führen, aufzusummieren.<br />

Das Fach mit der Nummer m kann erreicht wer<strong>den</strong> durch einen Durchlauf, der durch<br />

die Worte beschrieben wird, die m-mal <strong>den</strong> Buchstaben R enthalten. Um diese Worte<br />

abzuzählen, hat man die Möglichkeiten zu zählen, die bei der Verteilung von m Buchstaben<br />

R auf n Plätze bestehen. Dies sind<br />

� �<br />

n<br />

m<br />

:=<br />

n!<br />

(n − m)!m!<br />

Stand: 21. November 2011 17 ○c J. Baumeister, T.G. Macedo


2.5 Determinismus, Kausalität, Berechenbarkeit <strong>und</strong> Zufall<br />

viele. Damit ergibt sich <strong>für</strong> die Wahrscheinlichkeit b(m, n), dass eine Kugel in das Fach<br />

m fällt als<br />

� � � �n n 1<br />

b(m, n) =<br />

m 2<br />

(2)<br />

An der Abbildung 5 erkennen wir, dass die Füllung der Fächer <strong>für</strong> großes n sehr schön die<br />

Gaußsche Glockenkurve (siehe <strong>den</strong> ehemaligen 10 DM-Schein) annähert. Diese Approximationsgüte<br />

lässt sich mit Hilfe der Normalverteilung analytisch erklären; siehe Abschnitt<br />

8.1.<br />

2.5 Determinismus, Kausalität, Berechenbarkeit <strong>und</strong> Zufall<br />

Determinismus 20 ist die Auffassung, dass zukünftige Ereignisse durch Vorbedingungen<br />

eindeutig festgelegt sind. Als Determiniertheit bezeichnet man etwa in <strong>den</strong> Naturwissenschaften<br />

die a-priori-Festlegung der Reaktion eines Systems, in der Theoretischen<br />

Informatik eine Eigenschaft eines Algorithmus; siehe Abschnitt 1.4.<br />

Kausalität 21 bezeichnet die Beziehung zwischen Ursache <strong>und</strong> Wirkung, betrifft also<br />

die Abfolge aufeinander bezogener Ereignisse <strong>und</strong> Zustände. Die Kausalität hat eine feste<br />

zeitliche Richtung, die immer von der Ursache ausgeht, auf die die Wirkung folgt.<br />

Laplace formuliert:<br />

Eine Intelligenz, welche <strong>für</strong> einen gegebenen Augenblick alle in der Natur wirken<strong>den</strong><br />

Kräfte sowie die gegenseitige Lage der sie zusammensetzen<strong>den</strong> Elemente<br />

kennt <strong>und</strong> überdies umfassend genug wäre, um diese gegebenen Größen der<br />

Analysis zu unterwerfen, würde in derselben Formel die Bewegung der größten<br />

Weltkörper wie des leichtesten Atoms umschließen; nichts würde ihr ungewiss<br />

sein, <strong>und</strong> Zukunft wie Vergangenheit wür<strong>den</strong> ihr offen vor Augen liegen.<br />

Also nach Laplace: Gleiche Ursachen haben gleiche Wirkungen. Ein Experiment, das immer<br />

mit <strong>den</strong>selben Anfangsbedingungen gestartet wird, muss nach menschlichem Selbstverständnis<br />

auch immer dasselbe Ergebnis zeigen. Mehr noch, Laplace unterstellt (ausgehend<br />

von <strong>den</strong> Erfolgen Isaac Newtons) die grenzenlose Berechenbarkeit der Natur <strong>und</strong><br />

damit an das Existieren einer Weltformel, die alle Zusammenhänge beschreibt. Diese<br />

Berechenbarkeit in <strong>den</strong> Naturwissenschaften wurde nicht zuletzt durch die Quantenmechanik<br />

auf eine harte Probe gestellt.<br />

Determinismus <strong>und</strong> Kausalität treffen sich etwa in folgen<strong>den</strong> Fragen:<br />

• Kann der Flügelschlag eines Schmetterlings in Brasilien einen Tornado in Texas hervorrufen?<br />

• Was bewirkt die Tatsache, dass in China ein Sack Reis umfällt?<br />

Das schwache Kausalitätsprinzip besagt, dass gleiche Ursachen gleiche Wirkungen<br />

nach sich ziehen. Bei realen Experimenten ist diese Begriffsbildung nicht hilfreich,<br />

da niemals die absolut gleichen Bedingungen vorliegen. Das starke Kausalitätsprinzip<br />

besagt, dass ähnliche Ursachen ähnliche Wirkungen erzeugen. Wie wir nun aber nach<br />

ca. 3 Jahrzehnten ” Chaosforschung“ wissen, ist auch dieses Prinzip <strong>für</strong> viele physikalische<br />

Vorgänge im Zweifel, wenn man ” ähnlich“ angemessen verwendet. Der Gr<strong>und</strong> da<strong>für</strong><br />

ist, dass viele physikalische Vorgänge <strong>und</strong> ihre (mathematischen) Modelle eine sensitive<br />

Abhängigkeit von <strong>den</strong> Bedingungen des Experiments besitzen. Man sieht dies besonders<br />

20 determinare (lat.): abgrenzen, bestimmen<br />

21 causa (lat.): Ursache<br />

Stand: 21. November 2011 18 ○c J. Baumeister, T.G. Macedo


2.5 Determinismus, Kausalität, Berechenbarkeit <strong>und</strong> Zufall<br />

gut bei dynamischen Vorgängen, wie etwa in der Wetterentwicklung, bei der Entstehung<br />

von Turbulenzen in Strömungen, im Allgemeinen bei nichtlinear rückgekoppelteten Systemen.<br />

Modellbeispiele sind das logistische Modell <strong>und</strong> das Doppelpendel. Beim Würfeln<br />

<strong>und</strong> Werfen von Reißzwecken etwa ist die Situation besonders <strong>und</strong>urchschaubar: welche<br />

Handhaltung beim Werfen hat welche Konsequenz?<br />

Wir wer<strong>den</strong> bei der Konstruktion des Sierpinski-Dreiecks das sogenannte ” Chaos-Spiel“<br />

kennenlernen. Dort kommen wir auf einige Details von Sensitivität zurück.<br />

Bibliographische Anmerkungen<br />

Für die elementare Einführung in die Wahrscheinlichkeitsrechnung verweisen wir auf [17,<br />

21, 38, 82]. Dort findet man auch Anmerkungen zum Determinismus <strong>und</strong> zur Kausalität.<br />

Nichtlinear rückgekoppelte Systeme findet man meist modelliert durch Differentialgleichungen.<br />

Etwas Populärwissenschaftliches, geschrieben von einem renomierten Experten<br />

der mathematischen Chaostheorie, findet man in [71]. Zu Beispielen von nichtlinearen<br />

Systemen siehe [56, 77]. Wir kommen bei der Betrachtung von dynamischen Systemen<br />

auf <strong>den</strong> diskreten Fall zurück; siehe Abschnitt 5.5.<br />

Stand: 21. November 2011 19 ○c J. Baumeister, T.G. Macedo


3 Elementare Zufallsexperimente<br />

Zufall ist nur der Ausdruck unserer Unfähigkeit, <strong>den</strong><br />

Dingen auf <strong>den</strong> Gr<strong>und</strong> zu kommen<br />

A. Einstein (Ein großer Skeptiker in Sachen Zufall)<br />

In diesem Abschnitt dokumentieren wir einfache Zufallsexperimente. Gr<strong>und</strong>legende<br />

Fragen zur Erzeugung von <strong>Zufallszahlen</strong> <strong>und</strong> <strong>ihrem</strong> <strong>Gebrauch</strong> wer<strong>den</strong> damit schon deutlich.<br />

3.1 Reißzweckexperiment<br />

Der Wurf eines Reißnagels kommt dem Münzwurf zwar als Experiment mit zwei Ausgängen<br />

sehr nahe, er ist aber ein Beispiel eines Zufallsexperiments mit ungleicher Wahrscheinlichkeitsverteilung:<br />

die Ausgänge sind: Lage auf der Kappe, Spitze nach oben (Kopf);<br />

Lage auf der Spitze <strong>und</strong> der Kante der Kappe (Seite). Nicht beide Lagen stellen sich mit<br />

gleicher Wahrscheinlichkeit ein; siehe unten.<br />

In Schulbüchern kann man das Werfen von Reißzwecken als Beispiel <strong>für</strong> ein Zufallsexperiment<br />

aufgeführt sehen, das keine Gleichverteilung der Ergebnisse bringt. Es wird –<br />

ohne eine Versuchsanleitung zu geben – berichtet von einer Verteilung ” 60% Kopf, 40%<br />

Seite. Versucht man diese Verteilung zu überprüfen, dann ist man schon vor dem ersten<br />

Wurf in der Situation, erst die Versuchsbedingungen zu klären <strong>und</strong> festzulegen; in jedem<br />

Falle: Art der Reißzwecke, Fallhöhe, Untergr<strong>und</strong>, anfangs Spitze nach oben oder nach<br />

unten. Zunächst zur Art der Reißzwecke:<br />

1. Wahl Handelsübliche Reißzwecke: Durchmesser 0.8 cm, Spitzenlänge 0.9 cm,<br />

2. Wahl Pin-Reißzwecke: Durchmesser 2.4 cm, Spitzenlänge 2.5 cm<br />

Als Versuchsumfang wurde die die Reißzwecke mit der Spitze nach oben 100-mal aus<br />

bestimmten Höhen fallen gelassen. Die Ergebnisse waren stark höhenabhängig. Während<br />

sich bei Fallhöhen um etwa 50 cm das Verhältnis 60% Kopf, 40% Seite ” reproduzieren“<br />

ließ, zeigten sich bei Fallhöhen um etwa einen Meter andere Ergebnisse, nämlich gerade<br />

entgegengesetzte Verhältnisse. Die Vermutung ist, dass man die Höhe <strong>für</strong> eine 50:50–<br />

Verteilung herausfin<strong>den</strong> könnte, wenn man die Fallhöhe nur geeignet wählen würde. Hierzu<br />

sind viele Experimentiermöglichkeiten offen.<br />

Man kann mit einer handelsüblichen Reißzwecke eine (quasi) 50-zu-50-Entscheidung<br />

herbeiführen, d.h. einen fairen Münzwurf nachstellen, ohne das Verhältnis Kopf/Seite zu<br />

kennen. Nehmen wir an, dass bei einer bestimmten Versuchsanordnung die Wahrscheinlichkeit<br />

<strong>für</strong> Kopf p <strong>und</strong> die Wahrscheinlichkeit <strong>für</strong> Seite q := 1 − p sei. Wir werfen nun die<br />

Reißzwecke bei dieser Versuchsanordnung mehrmals <strong>und</strong> zählen, wie oft Kopf gefallen ist.<br />

Die 50-zu-50 Entscheidung stellt sich (nahezu) ein mit dem Ergebnis Kopf ist gerade-mal<br />

gefallen, Kopf ist ungerade-mal gefallen. Analysieren wir zunächst <strong>den</strong> zweimaligen Wurf:<br />

• Häufigkeit von Kopf ist gerade (2-mal Kopf, 0-mal Kopf (2-mal Seite))<br />

Als Wahrscheinlichkeit da<strong>für</strong> ergibt sich nach der Pfadregel:<br />

0.6 · 0.6 + 0.4 · 0.4 = 0.36 + 0.16 = 0.52<br />

• Häufigkeit von Kopf ist ungerade (Kopf/Seite oder Seite/Kopf, also genau einmal<br />

Kopf)<br />

Als Wahrscheinlichkeit da<strong>für</strong> ergibt sich nach der Pfadregel:<br />

2 · 0.6 · 0.4 = 2 ∗ 0.24 = 0.48<br />

Stand: 21. November 2011 20 ○c J. Baumeister, T.G. Macedo


3.2 (Unfaire) Würfel<br />

Dies kann man auch mit 3 Würfen, mit 4 Würfen usw. durchführen. Die Situation ist<br />

dann bei drei Würfen:<br />

• Häufigkeit von Kopf ist gerade: als Wahrscheinlichkeit da<strong>für</strong> ergibt sich nach der<br />

Pfadregel 0.504<br />

• Häufigkeit von Kopf ist ungerade: als Wahrscheinlichkeit da<strong>für</strong> ergibt sich nach der<br />

Pfadregel 0.496<br />

Bei 4 Würfen ist das Wahrscheinlichkeitsverhältnis 0.5008 zu 0.4992 . Die Verhältnisszahlen<br />

rücken mit wachsender Wurfanzahl schließlich immer mehr an ein Verhältnis 50-zu-50 heran.<br />

Dieses Vorgehen kann man auf <strong>den</strong> Münzwurf anwen<strong>den</strong>, wenn man Zweifel hat, ob<br />

die Münze fair ist. Der Gr<strong>und</strong> <strong>für</strong> eine ungleiche Wahrscheinlichkeit <strong>für</strong> Kopf <strong>und</strong> Zahl<br />

bei einer Münze kann eine Krümmung oder eine veränderte Gewichtsverteilung sein.<br />

Abschließend zu diesen Überlegungen sei festgehalten, dass bei allen diesen Experimenten<br />

ohne eine exakte Beschreibung des Versuchsaufbaus <strong>und</strong> seiner Dokumentation<br />

die Reproduzierbarkeit der Ergebnisse nicht gegeben ist. Ein Mathearbeitsheft <strong>für</strong> Schüler<br />

darf also eigentlich nicht einfach nur die Wahrscheinlichkeitsverteilung aufschreiben, sondern<br />

müsste auch Versuchsaufbau <strong>und</strong> Versuchsdokumentation detailiert darlegen.<br />

3.2 (Unfaire) Würfel<br />

Das Würfeln mit einem fairen Würfel ist vielerorts<br />

wohlbeschrieben. Wir benötigen diesen<br />

Würfel um aus sechs Zahlen eine zu wählen,<br />

ohne die anderen zu benachteiligen“.<br />

”<br />

Unfaire Würfel sind Würfel, die unregelmäßige<br />

Formen aufweisen. Sie wer<strong>den</strong><br />

umgangssprachlich als gezinkt“ <strong>und</strong>/oder als<br />

”<br />

gefälscht bezeichnet. Sie haben unterschiedlich<br />

lange Kanten, eine zusätzliche Gewichteinlagerung,<br />

oder Ähnliches. Es gibt sehr viele<br />

Möglichkeiten einen Würfel zu manipulieren.<br />

Meistens jedoch wer<strong>den</strong> Würfel manipuliert,<br />

um in sogenannten Würfel- bzw.<br />

Glücksspielen sicher“ zu gewinnen. Bei die-<br />

”<br />

sen Würfeln sind die Wahrscheinlichkeiten,<br />

dass die verschie<strong>den</strong>en Seiten gewürfelt wer<strong>den</strong>,<br />

nicht i<strong>den</strong>tisch.<br />

Um eine Statistik über unfaire Würfel entwerfen<br />

zu können, wirft man <strong>den</strong> Würfel<br />

Abbildung 6: Unfairer Würfel<br />

mehrmals (100-mal, 1000-mal,. . . ) <strong>und</strong> notiert sich die Würfelaugen. Dabei ist darauf zu<br />

achten, dass die Würfel-Bedingungen“ (Untergr<strong>und</strong>, Würfelhand, Würfelhöhe, ...) stets<br />

”<br />

gleich sind. Für die Reproduzierbarkeit der Ergebnisse ist eine genaue Dokumentation der<br />

Würfel-Bedingungen wesentlich.<br />

Der unfaire Würfel“ aus Abbildung 6 hat die Ausmaße 1x1x2 in der Maßeinheit<br />

”<br />

Zentimeter <strong>und</strong> eine Siebenerbeschriftung (übliche Beschriftung bei normalen“ Würfeln).<br />

”<br />

Wir haben auf verschie<strong>den</strong>en Untergrün<strong>den</strong> (Wiese, Fliesen) jeweils 100-mal gewürfelt,<br />

Stand: 21. November 2011 21 ○c J. Baumeister, T.G. Macedo


3.3 <strong>Zufallszahlen</strong> der Natur entnommen<br />

wobei wir darauf geachtet haben, dass die Versuchsdurchführung immer dieselbe war:<br />

mit der rechten Hand aus 42 cm Höhe. In der Abbildung 7 fin<strong>den</strong> wir die Resultate. Die<br />

Ergebnisse sind einigermaßen verwirrend <strong>und</strong> bedürfen einer weiteren Untersuchung.<br />

(a) (b)<br />

Abbildung 7: Würfeln mit einem unfairen Würfel<br />

3.3 <strong>Zufallszahlen</strong> der Natur entnommen<br />

<strong>Zufallszahlen</strong>, die mit Vorgängen der Natur gewonnen wer<strong>den</strong>, verwen<strong>den</strong> im Allgemeinen<br />

nicht-deterministische physikalische Prozesse als <strong>Zufallszahlen</strong>quelle. Beispiele <strong>für</strong> solche<br />

physikalische Generatoren sind:<br />

• Die Beobachtung der Zeit zwischen der Emission von Partikeln beim radioaktiven<br />

Zerfall<br />

• Die Messung thermischen Rauschen<br />

• Die Messung der Ladungsdifferenz zweier eng benachbarter Halbleiter<br />

• Die Beobachtung von Frequenzschwankungen aufgr<strong>und</strong> der Instabilität eines frei<br />

laufen<strong>den</strong> Oszillators<br />

• Die Messung des Betrags, um <strong>den</strong> ein Halbleiter während einer festen Zeitspanne<br />

gela<strong>den</strong> wer<strong>den</strong> kann<br />

• Die Aufzeichnung von Klang mit einem Mikrofon oder von Bildern mit einer Videokamera.<br />

• Laufzähler mit Stoppereignissen. Dabei kommt ein ” modulo n-Zähler“ zum Einsatz,<br />

der laufend von 0 bis (n−1) zählt. Beim Auftreten eines zufälligen zählerunabhängigen<br />

Stoppereignisses wird der Zählerstand ausgelesen.<br />

Man nennt solche physikalische Effekte nutzende Generatoren Hardware-Generatoren 22 .<br />

Hier steht natürlich die Frage im Raume, ob das physikalische Phänomen wirklich <strong>den</strong><br />

Zufall simuliert, wie es etwa beispielsweise die Quantenmechanik voraussagt. Die Vorteile<br />

solcher Hardware-Generatoren sind:<br />

• Keine Periodizität (siehe Kongruenzgeneratoren)<br />

• Generation basiert nicht auf einem Algorithmus<br />

• Keine Reproduzierbarkeit der Zahlen<br />

22 http://www.westphal-electronic.com/ZrandomUSB−Manual.pdf<br />

Stand: 21. November 2011 22 ○c J. Baumeister, T.G. Macedo


3.3 <strong>Zufallszahlen</strong> der Natur entnommen<br />

• Im Allgemeinen sehr gute statistische Eigenschaften der <strong>Zufallszahlen</strong>.<br />

Wir wollen auf die Zufälligkeit des radioaktiven Zerfalls näher eingehen. Es wird auf<br />

Gr<strong>und</strong> von physikalischen Gesetzmäßigkeiten angenommen, dass die Anzahl der durch ein<br />

homogenes Isotop ausgestrahlten Teilchen einen zufälligen Prozess darstellt. Um der Gesetzmäßigkeit<br />

dieses Prozesses auf die Spur zu kommen, beobachtet man die Zerfallsrate<br />

(mit einem Geigerzähler). Man stellt fest, dass die Anzahl der Teilchen, die in einem Zeitintervall<br />

der Länge ∆t zerfallen, in ziemlich einfacher Weise materialabhängig beschrieben<br />

wer<strong>den</strong> kann, <strong>und</strong> zwar als Poisson-Verteilung 23 der Zufallsvariablen X, die <strong>den</strong> Zerfall<br />

im Intervall ∆t angibt:<br />

Ws(X = k) = λk<br />

k! e−λ mit λ = c∆t , k = 0, 1, 2, . . . . (3)<br />

Dabei stellt die positive Konstante c die Intensität der Strahlungsquelle dar. Für kleine<br />

Werte von λ ist p0 := Ws(X = 0) nahe dem maximalen Wert eins.<br />

Rutherford <strong>und</strong> Geiger haben 1910 <strong>den</strong><br />

Zerfall einer Polonium-Quelle in 2608<br />

8-Minuten Intervallen beobachtet; siehe<br />

Tabelle 8. Die dritte Spalte geht vom<br />

Parameter λ = 3.87 in der Poissonverteilung<br />

aus. Die Übereinstimmung von<br />

beobachteten Werten <strong>und</strong> Werten aus<br />

dem Modell ist ziemlich gut.<br />

Die Poissonverteilung ist eine auch<br />

in anderem Zusammenhang anzutreffende<br />

Verteilung, etwa: Personen, die in einem<br />

Zeittakt an der Bushaltestelle eintreffen,<br />

Personen, die in einem Zeittakt<br />

ein Kaufhaus betreten, Telefongespräche,<br />

die in einem Zeittakt bei der<br />

Vermittlung auflaufen. Will man solche<br />

Gegebenheiten simulieren, braucht man<br />

Poisson-verteilte <strong>Zufallszahlen</strong>. Der obige<br />

Zerfallsprozess stellt einen passen<strong>den</strong><br />

Generator bereit.<br />

Anzahl Gemessene Erwartete<br />

gemessener Häufigkeit Häufigkeit<br />

Zerfallsteilchen<br />

0 57 54<br />

1 203 211<br />

2 383 407<br />

3 525 526<br />

4 532 508<br />

5 408 394<br />

6 273 254<br />

7 139 140<br />

8 45 68<br />

9 27 29<br />

10 10 11<br />

≥ 11 6 6<br />

Abbildung 8: Poisson-Zerfall<br />

Wir sind aber an der Frage interessiert, ob es möglich ist, aus <strong>den</strong> Poisson-verteilten<br />

<strong>Zufallszahlen</strong> gleichverteilte <strong>Zufallszahlen</strong> (auf [0, 1)) zu extrahieren. Dies ist in der Tat<br />

möglich. Dies geschieht in zwei Schritten. Zunächst verschaffen wir uns aus X eine Zufallsvariable,<br />

die nahezu einen Münzwurf nachstellt. Dazu betrachten wir die Zufallsvariable<br />

Z, die folgende Tatsache zählt“: ist in einem Intervall [0, t] die Anzahl der zerfallen<strong>den</strong><br />

”<br />

Teilchen gerade, setzen wir Z auf <strong>den</strong> Wert 0, anderenfalls auf 1. Dann erhalten wir als<br />

Wahrscheinlichkeit <strong>für</strong> das Eintreten der Ereignisse<br />

∞�<br />

∞�<br />

Ws(Z = 0) =<br />

Ws(Z = 1) =<br />

j=0<br />

Ws(X = 2j) = e −λ<br />

j=0<br />

∞�<br />

Ws(X = 2j + 1) = e −λ<br />

j=0<br />

23 S.D. Poisson, 1781-1840<br />

λ 2j<br />

(2j)! = e−λ eλ + e −λ<br />

2<br />

∞�<br />

j=0<br />

= 1 + e−2λ<br />

λ 2j+1<br />

(2j + 1)! = e−λ eλ − e −λ<br />

2<br />

2<br />

= 1 − e−2λ<br />

2<br />

Stand: 21. November 2011 23 ○c J. Baumeister, T.G. Macedo


3.4 Flächenberechnung mit <strong>Zufallszahlen</strong><br />

Hier sind wir mit der Tatsache konfrontiert, dass wir erstmals unendlich viele Ereignisse<br />

haben, die ” unendliche Summation“ entspricht diesem Sachverhalt. Für das Nachvollziehen<br />

der folgen<strong>den</strong> Rechnungen sollte man zunächst Kapitel 4 durchlesen. Mit ε(t) :=<br />

e −2λ = e −ct erhalten wir die Darstellung<br />

Ws(Z = 0) =<br />

1 + ε(t)<br />

2<br />

Im Grenzwert <strong>für</strong> t gegen unendlich ergibt sich<br />

, Ws(Z = 1) =<br />

1 − ε(t)<br />

2<br />

1<br />

lim Ws(Z = 0) = lim Ws(Z = 1) =<br />

t→∞ t→∞ 2<br />

Dies bedeutet, dass man auf diese Weise (durch die Intensität der Strahlungsquelle bzw.<br />

die Länge des gewählten Zeitintervalls) einen Münzwurf nachstellen kann durch Nachzählen<br />

der Zerfallsereignisse.<br />

Es ist nun klar, dass wir mit Hilfe eines Poisson-Generators ein Zufallsbit erzeugen<br />

können, wobei 1 bzw. 0 mit Wahrscheinlichkeit (nahezu) 1 eintritt. Durch Wiederholung<br />

2<br />

erzeugen wir ein Zufallwort a1a2 . . . aN etwa der Länge N, wobei die Buchstaben ai die<br />

erzeugten Zufallsbits sind. Damit können wir nun eine Dezimalzahl z in [0, 1) erzeugen<br />

durch<br />

N�<br />

z = ai2 −i<br />

i=1<br />

Offensichtlich hat jede dieser möglichen <strong>Zufallszahlen</strong> die Wahrscheinlichkeit ( 1<br />

2 )−N <strong>und</strong><br />

die Zahlen sind in [0, 1) gleichverteilt.<br />

3.4 Flächenberechnung mit <strong>Zufallszahlen</strong><br />

Man kann <strong>Zufallszahlen</strong> nutzen, um <strong>den</strong> Inhalt<br />

von Körpern <strong>und</strong> Flächen mit unregelmäßiger<br />

Begrenzung <strong>und</strong>/oder in großen<br />

Raumdimensionen zu berechnen. Hier ist<br />

diese Vorgehen das Verfahren der Wahl.<br />

Dazu wird eine Begrenzungsfläche um <strong>den</strong><br />

Körper gelegt, von der man leicht <strong>den</strong><br />

Flächeninhalt ausrechnen kann (z.B. Quadrat,<br />

Würfel). Nun wird ein Punkt mit<br />

zufälligen Koordinaten ermittelt <strong>und</strong> in<br />

<strong>den</strong> Raum, <strong>den</strong> die Begrenzungsfläche einschließt,<br />

gesetzt. Danach wird anhand einer<br />

Formel ermittelt, ob dieser Punkt im<br />

Körper oder nur im Raum innerhalb der<br />

Begrenzungsfläche liegt. Diesen Vorgang<br />

wiederholt man sehr oft, so dass am Ende<br />

viele Punkte vorhan<strong>den</strong> sind. Dank Abbildung 9: Berechnung von π<br />

eines Spielcasinos in der gleichnamigen<br />

Stadt trägt das obige Vorgehen <strong>den</strong> Namen<br />

Monte-Carlo Simulation. In Kapitel 8 betrachten wir die Methode in allgemeinerem<br />

Kontext.<br />

Wir beschreiben hier die Anwendung auf die Berechnung von Flächen, insbesondere<br />

von krummlinig berandeten Flächen. Man benötigt dazu ein Einheitsquadrat mit der<br />

Stand: 21. November 2011 24 ○c J. Baumeister, T.G. Macedo


3.5 Uabhängigkeit bei Zufallsvariablen<br />

Fläche 1, das die Figur umgibt. Mit geeigneter Skalierung kann man dies immer erreichen.<br />

Danach startet man <strong>den</strong> ” Zufallsregen“, indem man etwa 1 000 000 <strong>Zufallszahlen</strong><br />

auswürfelt, notgedrungen mit einem Zufallgenerator. Man bezeichnet dieses Geschehen<br />

als ” Zufallsregen“, da alle Punkte zeitnah auf die Figur im Einheitsquadrat treffen.<br />

Damit das Vorhaben gelingt, müssen die Punkte im Einheitsquadrat liegen <strong>und</strong> dort<br />

gleichmäßig verteilt sein. Nach dem Abschluss des Zufallsregens ermittelt man die Anzahl<br />

T der Treffer, d.h. der Zufallspunkte, die in der Figur liegen. Besteht der Zufallsregen aus<br />

N Punkten, dann ist in<br />

F := T<br />

N<br />

nun eine Näherung <strong>für</strong> <strong>den</strong> gesuchten Flächeninhalt gegeben.<br />

Demonstrieren wir das Vorgehen <strong>für</strong> <strong>den</strong> Kreis mit Radius r = 1 . Wir umschließen<br />

<strong>den</strong> Viertelkreis - die Fläche des Vollkreises lässt sich leicht daraus ableiten - mit dem<br />

Einheitswürfel. Dann ist es einfach (mit dem Satz von Pythagoras) zu entschei<strong>den</strong>, ob ein<br />

Zufallspunkt (x, y) im Kreis oder außerhalb liegt:<br />

x 2 + y 2 ≤ 1 : innerhalb x 2 + y 2 > 1 : außerhalb<br />

Hier brauchen wir dann eine Folge von Zufallspunkten, die im Einheitswürfel liegen; wir<br />

bezeichnen sie mit (xn, yn), n = 1, 2, . . . , N . Wir zählen nun die Anzahl der Punkte, die<br />

innerhalb des Kreises liegen; wir nehmen an, es seien mN Stück. Dann approximieren wir<br />

die Fläche des Viertelkreises durch <strong>den</strong> Bruch<br />

b(N) := m N /N .<br />

Für größer wer<strong>den</strong>des N nähert b(N) die Kreiszahl π/4 immer besser an. In der Abbildung<br />

9 sehen wir <strong>den</strong> ” Zufallsregen“. Ein typisches Ergebnis ist etwa b(1000) = 3.1442 .<br />

3.5 Uabhängigkeit bei Zufallsvariablen<br />

Definition 3.1 Sei (Ω, POT(Ω), P ) ein endlicher Wahrscheinlichkeitsraum. Zwei Ereignisse<br />

A, B ⊂ Ω heißen unabhängig, wenn P (A ∩ B) = P (A)P (B) gilt, anderenfalls<br />

abhängig. �<br />

Zahlreiche Fehlvorstellungen zur Wahrscheinlichkeitsrechnung beruhen auf der Nichtberücksichtigung<br />

der Abhängigkeit bzw. Unabhängigkeit von Ereignissen. Machen wir uns<br />

die Fehlerquellen z.B. beim Skatspiel“ klar. Ein Skatspieler berechnet die Wahrschein-<br />

”<br />

lichkeit, in seinem Blatt von 10 Karten 4 Asse zu haben als<br />

�28 6 �32 10<br />

�<br />

� =<br />

10 · 9 · 8 · 7<br />

32 · 31 · 30 · 29<br />

≈ 0.00584 .<br />

Die Wahrscheinlichkeit, alle 4 Buben zu bekommen, ist ebenso groß. Daraus schließt er,<br />

dass die Wahrscheinlichkeit, alle 4 Asse <strong>und</strong> alle 4 Buben zu bekommen etwa<br />

0.00584 2 ≈ 0.000034<br />

beträgt. Die Überlegung ist natürlich falsch, da sie die Abhängigkeit der Ereignisse<br />

A : 4 Asse , B : 4 Buben<br />

Stand: 21. November 2011 25 ○c J. Baumeister, T.G. Macedo


3.5 Uabhängigkeit bei Zufallsvariablen<br />

nicht berücksichtigt. Die Wahrscheinlichkeit, alle 4 Buben zu bekommen, wenn man schon<br />

4 Asse hat, ist kleiner als die Wahrscheinlichkeit, ohne die Bedingung alle 4 Buben zu<br />

bekommen:<br />

�<br />

P (A ∩ B) = P (B|A) · P (A) =<br />

�24 2 �32 10<br />

� = 0.0000042 .<br />

Unabhängigkeit ist ein in A, B symmetrischer Begriff. Sind A, B ⊂ Ω unabhängig,<br />

dann sind es auch A, Ω\B <strong>und</strong> Ω\A, B <strong>und</strong> Ω\A, Ω\B. 24 Die Verallgemeinerung der<br />

Unabhängigkeit auf mehr als zwei Ereignisse liegt auf der Hand; wir führen sie zur<br />

Erläuterung an.<br />

Definition 3.2 Sei (Ω, POT(Ω), P ) ein endlicher Wahrscheinlichkeitsraum <strong>und</strong> seien<br />

A1, . . . , Ak Ereignisse. Diese Ereignisse heißen unabhängig, wenn <strong>für</strong> jede Wahl<br />

1 ≤ i1 < · · · < il ≤ k gilt:<br />

P (Ai1 ∩ · · · ∩ Ail ) = P (Ail ) · · · P (Ail ).<br />

Beispiel 3.3 Betrachte im Wahrscheinlichkeitsraum (Ω, P OT (Ω), P ) mit<br />

die Ereignisse<br />

Wir haben<br />

Ω = {ω1, ω2, ω3, ω4}, P ({ωi}) = 1<br />

, i = 1, . . . , 4,<br />

4<br />

A = {ω1, ω2}, B = {ω2, ω3}, C = {ω1, ω3}.<br />

P (A ∩ B) = P (A)P (B) , P (A ∩ C) = P (A)P (C) , P (B ∩ C) = P (B)P (C),<br />

aber<br />

P (A ∩ B ∩ C) = 0, P (A) · P (B) · P (C) = 1<br />

8 .<br />

Dieses Beispiel beleuchtet die Definition 3.2. �<br />

Häufig steht, bevor der Ausgang eines Zufalls–Experiments bekannt ist, schon die Information<br />

zur Verfügung, dass der Ausgang zu einer bestimmten (möglicherweise eingeforderten)<br />

Teilmenge des Ereignisraumes gehört. Was lässt sich dann über Wahrscheinlichkeiten<br />

sagen? Diese Fragestellung wollen wir nun skizzieren. Zur Motivation des Folgen<strong>den</strong> greifen<br />

wir auf <strong>den</strong> Begriff der relativen Häufigkeiten zurück. Sei V ein Zufallsexperiment mit<br />

zugehörigem Wahrscheinlichkeitsraum (Ω, P OT (Ω), P ). Seien A, B Ereignisse in (Ω, P ).<br />

Der Versuch V werde nun n–mal (unabhängig) wiederholt. Die relativen Häufigkeiten von<br />

A unter der Bedingung B sind dann definiert durch<br />

hn(A|B) :=<br />

#{ Es tritt A ∩ B ein }<br />

#{ Es tritt B ein }<br />

n#{ Es tritt A ∩ B ein }<br />

=<br />

n#{ Es tritt B ein } = hn(A ∩ B)<br />

, n ∈ N .<br />

hn(B)<br />

Dabei haben wir hn(B) > 0, n ∈ N, unterstellt.<br />

Analog zu dieser Formel kommen wir nun zu einer entsprechen<strong>den</strong> Begriffsbildung im<br />

Wahrscheinlichkeitsraum (Ω, P ) .<br />

24 Mit A\B bezeichnen wir das Komplement der Menge B in A.<br />

Stand: 21. November 2011 26 ○c J. Baumeister, T.G. Macedo<br />


3.5 Uabhängigkeit bei Zufallsvariablen<br />

Definition 3.4 Sei (Ω, P OT (Ω), P ) ein endlicher Wahrscheinlichkeitsraum. Seien A, B ⊂<br />

Ω mit P (B) > 0. Dann heißt<br />

P (A|B) :=<br />

P (A ∩ B)<br />

P (B)<br />

die bedingte Wahrscheinlichkeit des Ereignisses A unter der Bedingung B. �<br />

Wichtige Resultate im Zusammenhang mit bedingten Wahrscheinlichkeiten sind der Satz<br />

von der totalen Wahrscheinlichkeit <strong>und</strong> der Satz von Bayes.<br />

Kommen wir nun zur Unabhängigkeit von Zufallsvariablen. Sie wird mit dem Begriff<br />

der Unabhängigkeit von Ereignissen eingeführt.<br />

Definition 3.5 Zwei Zufallsvariablen X1, X2 heißen unabhängig, wenn die Ereignisse<br />

{X1 ≤ x1} <strong>und</strong> {X2 ≤ x2} <strong>für</strong> beliebige x1, x2 ∈ R unabhängig sind.<br />

Die Fortschreibung der Definition 3.5 auf n Zufallsvariablen X1, . . . , Xn ist offensichtlich:<br />

Definition 3.6 Die Zufallsvariablen X1, . . . , Xn heißen unabhängig genau dann, wenn<br />

mit der zugr<strong>und</strong>eliegen<strong>den</strong> Wahrscheinlichkeit P gilt:<br />

P (X1 ≤ x1, . . . , Xn ≤ xn) = P (X1 ≤ x1) · · · · · P (Xn ≤ xn) <strong>für</strong> alle x1, . . . , xn ∈ R .<br />

Bibliographische Anmerkungen<br />

Laplaceexperimente mit Würfeln <strong>und</strong> Urnen wer<strong>den</strong> in allen Büchern über Wahrscheinlichkeitsrechnung<br />

angeführt.; siehe etwa [21, 38, 51, 82]. Dort findet man auch eine Diskussion<br />

der Unabhängigkeit von Zufallsvariablen.<br />

Zu Würfelexperimenten verweisen wir auf <strong>den</strong> Aufsatz [RiS10] von Riemer <strong>und</strong> Stoyan,<br />

in dem der Versuch einer Berechnung der Wahrscheinlichkeiten der Augen mittels einer<br />

speziellen Verteilung gemacht wird. In [44] betrachtet Ineichen <strong>den</strong> Spezialfall prismatischer<br />

Würfel <strong>und</strong> diskutiert eine physikalische Modellierung zur Berechnung der Wahrscheinlichkeiten<br />

der Augen.<br />

Die Literatur zur Berechnung der Kreiszahl π ist umfangreich; nahezu jedes Buch zur<br />

Statistik erwähnt Berechnungsmöglichkeiten; siehe etwa [2, 21].<br />

Stand: 21. November 2011 27 ○c J. Baumeister, T.G. Macedo<br />


4 Exponential- <strong>und</strong> Logarithmusfunktion<br />

Da nichts, meine hochverehrten Stu<strong>den</strong>ten der<br />

<strong>Mathematik</strong>, in der praktischen <strong>Mathematik</strong> so<br />

beschwerlich ist <strong>und</strong> <strong>den</strong> Rechner mehr aufhält <strong>und</strong> hemmt<br />

als Multiplikationen <strong>und</strong> Divisionen großer Zahlen sowie<br />

Quadrat- <strong>und</strong> Kubikwurzelziehen aus ihnen, gegen die man<br />

wegen ihrer Umständlichkeit eine starke Abneigung hat<br />

<strong>und</strong> bei <strong>den</strong>en sich sehr leicht Rechenfehler einschleichen,<br />

so begann ich zu überlegen, durch welchen zuverlässigen<br />

Kunstgriff man diese Hindernisse umgehen könne.<br />

Nachdem ich hierüber verschie<strong>den</strong>tlich hin- <strong>und</strong> hergedacht,<br />

habe ich endlich einige besonders einfache Abkürzungen<br />

gefun<strong>den</strong>, über die ich (vielleicht) später berichten werde.<br />

J. Napier im Vorwort seiner Logarithmentafel Descriptio<br />

(1614)<br />

Hier skizzieren wir die Exponentialrechnung <strong>und</strong> ihre Umkehrung. Bei der Begründung<br />

müssen wir etwas oberflächlich agieren, <strong>den</strong>n das F<strong>und</strong>ament der ” reellen Zahlen“ steht<br />

uns nicht ausreichend zur Verfügung, die wesentlichen Begriffe stellen wir aber bereit.<br />

Im nachfolgen<strong>den</strong> Kapitel benötigen wir die Logarithmen, um die Benford-Verteilung zu<br />

erläutern.<br />

4.1 Zahlen<br />

Im Abschnitt 2 haben wir die natürlichen Zahlen zum Abzählen von Möglichkeiten verwendet.<br />

Hier benötigen wir auch die reellen Zahlen. Wir verwen<strong>den</strong> darüberhinaus folgende<br />

Bezeichnungen:<br />

Natürliche Zahlen–die Erste: Mit N bezeichnen wir die natürliche Zahlen<br />

1, 2, . . . , n, . . . .<br />

Natürliche Zahlen–die Zweite: Mit N0 bezeichnen wir die natürliche Zahlen<br />

0, 1, 2, . . . , n, . . . .<br />

Ganze Zahlen: Mit Z bezeichnen wir die ganzen Zahlen<br />

0, ±1, ±2, . . . , ±n, . . . .<br />

Rationale Zahlen: Mit Q bezeichnen wir die rationalen Zahlen<br />

q = m<br />

n<br />

mit m ∈ Z, n ∈ N .<br />

Reele Zahlen: Mit R bezeichnen wir die reellen Zahlen x ; wir <strong>den</strong>ken dabei an die<br />

Dezimalzahlen. Damit ist der Zahlenstrahl ” R := −∞ < x < ∞ “vollständig <strong>und</strong><br />

hat keine ” Lücken“ mehr.<br />

Stand: 21. November 2011 28 ○c J. Baumeister, T.G. Macedo


Wir verwen<strong>den</strong> in R mitunter die Intervall-Schreibweise:<br />

(a, b) := {x ∈ R|a < x < b}<br />

[a, b) := {x ∈ R|a ≤ x < b}<br />

(a, b] := {x ∈ R|a < x ≤ b}<br />

[a, b] := {x ∈ R|a ≤ x ≤ b}<br />

Als weitere Kurzschreibweisen halten wir fest:<br />

⎧<br />

⎪⎨ +1 falls x > 0<br />

sign(x) := 0<br />

⎪⎩<br />

−1<br />

falls x = 0<br />

falls x < 0<br />

, |x| :=<br />

�<br />

x falls x > 0<br />

−x falls x < 0 .<br />

4.1 Zahlen<br />

Die rationalen Zahlen reichen <strong>für</strong> die Betrachtungen von Funktionen nicht aus, da sie<br />

” Lücken“ aufweisen. Deutlich wird die Lücke, wenn wir die Quadratwurzel aus 2 berechnen<br />

wollen, d.h. eine Zahl x := √ 2 bestimmen wollen, die der Gleichung<br />

x 2 = 2 (4)<br />

genügt. Die Zahl √ 2 steht – dank des Satzes von Pythagoras 25 – <strong>für</strong> die Länge der Diagonale<br />

in einem Quadrat mit der Seitenlänge eins. Man kann beweisen, dass eine rationale<br />

Zahl x, die der Gleichung (4) genügt nicht existiert. Ein Beweisschnipsel, angefertigt von<br />

einer Teilnehmerin der Akademie, zeigt Abbildung 10. Wir schreiben einen anderen Beweis<br />

auf, der der euklidischen Idee der Kommensurabilität folgt.<br />

Der Beweis geht so: Sei x eine rationa-<br />

le Zahl mit x 2 = 2, d.h. x = b<br />

a mit<br />

b 2 = 2a 2 .<br />

Annahme: b <strong>und</strong> a sind kommensurabel.<br />

Dann gibt es ganze Zahlen p, q <strong>und</strong> ein<br />

gemeinsames Maß e mit d = pe, a = qe .<br />

Es kann vorausgesetzt wer<strong>den</strong>, dass p<br />

<strong>und</strong> q nicht beide gerade Zahlen sind,<br />

da wir sonst das gemeinsame Maß verdoppeln<br />

könnten. Aus b 2 = 2a 2 folgt<br />

p 2 = 2q 2 . Daraus folgt nach der Lehre<br />

von gera<strong>den</strong> <strong>und</strong> ungera<strong>den</strong> Zahlen,<br />

dass p nicht ungerade sein kann; es ist<br />

also p gerade <strong>und</strong> daher p = 2p ′ .<br />

Dann ist aber q 2 = 2p ′2 , also auch q<br />

eine gerade Zahl. Damit ist ein Widerspruch<br />

zur Eingangsvoraussetzung, dass<br />

von <strong>den</strong> Zahlen p, q nicht beide Zahlen<br />

p, q gerade sind, hergeleitet <strong>und</strong> die Annahme<br />

ist nicht haltbar.<br />

Abbildung 10: √ 2 ist irrational<br />

Wie die Lücken in <strong>den</strong> rationalen Zahlen beseitigen? Der Ausweg sind unendliche<br />

Dezimalbrüche, <strong>den</strong>n wir wissen ja, dass rationale Zahlen entweder durch endliche Dezimalbrüche<br />

oder periodische Dezimalbrüche beschrieben wer<strong>den</strong>. Aber der Ausweg ist auch<br />

25 E.W. Dijkstra fand einen ziemlich überraschende Verallgemeinerung des Satzes von Pythagoras:<br />

wenn in einem Dreieck die Winkel α, β, γ gegenüber <strong>den</strong> Seiten a, b, c liegen, dann<br />

gilt sign(α + β − γ) = sign(a 2 + b 2 − c 2 ) . Ein sehr einsichtiger Beweis findet sich in<br />

http://www.cut-the-knot.org/pythagoras/Dijkstra.shtml<br />

Stand: 21. November 2011 29 ○c J. Baumeister, T.G. Macedo


4.1 Zahlen<br />

mit Problemen geflastert, <strong>den</strong>n wir haben mit dem Problem der Summation unendlich<br />

vieler Summan<strong>den</strong> fertig zu wer<strong>den</strong>, etwa<br />

0.101001000100001 · · · = 10 −1 + 10 −3 + 10 −6 + 10 −10 + 10 −15 + · · · = ??? (5)<br />

Abhilfe schafft ein exakter Konvergenzbegriff <strong>für</strong> Zahlenfolgen in Verbindung mit einem<br />

Axiom, das die rellen Zahlen als Vervollständigung der rationalen Zahlen ” erschafft“. Dazu<br />

die folgende<br />

Definition 4.1 Eine Folge (xn)n∈N rationaler Zahlen heißt eine Cauchyfolge, falls gilt:<br />

Für alle ε > 0 gibt es ein N ∈ N so dass <strong>für</strong> alle m, n > N gilt: |xn − xm| < ε . (6)<br />

Das Axiom, das nun die reellen Zahlen ins Leben ruft, ist die Forderung, dass jede Cauchyfolge<br />

in <strong>den</strong> rationalen Zahlen eine eindeutige reelle Zahl definiert, nämlich <strong>den</strong> Grenzwert<br />

– wir schreiben die Definition gleich <strong>für</strong> die rellen Zahlen auf – in folgendem Sinne:<br />

Definition 4.2 Eine Folge (xn)n∈N reeller Zahlen heißt konvergent gegen x, falls gilt;<br />

wir schreiben die Definition sofort <strong>für</strong> reelle Zahlen auf.<br />

Für alle ε > 0 gibt es ein N ∈ N so dass <strong>für</strong> alle n > N gilt: |xn − x| < ε . (7)<br />

x heißt dann Grenzwert der Folge. Wir schreiben: x = limn xn .<br />

Die entschei<strong>den</strong>de Annahme über die reellen Zahlen, die die Lücken von Q schließt, ist<br />

das<br />

Vollständigkeitsaxiom:<br />

Jede Cauchyfolge rationaler Zahlen besitzt in <strong>den</strong> reellen Zahlen einen (eindeutig<br />

bestimmten) Grenzwert.<br />

Folgende Aussagen im Zusammenhang mit <strong>den</strong> Definitionen 4.1, 4.2 sind nun besonders<br />

von Interesse:<br />

1. Die Menge der reellen Zahlen ist eine Obermenge der rationalen Zahlen, da jede<br />

konstante Folge rationaler Zahlen eine Cauchyfolge ist.<br />

2. Jede reelle Zahl kann als Grenzwert einer Folge rationaler Zahlen angesehen wer<strong>den</strong>.<br />

3. Positive, negative reelle Zahlen sind nun wohldefiniert, ebenso der Betrag einer reellen<br />

Zahl.<br />

4. Cauchyfolgen reeller Zahlen sind nun definiert analog Definition 4.1.<br />

5. Jede Cauchyfolge reeller Zahlen ist konvergent.<br />

Kehren wir zur Zahl x := √ 2 zurück. Aus der Babylonischen Kultur (∼ 1000 v. Chr.)<br />

gibt es eine Kleietafel, die belegt, dass derjenige, der sie beschriftet hat, wusste, dass das<br />

Verhältnis von Diagonale <strong>und</strong> Seite im Quadrat ” gleich“<br />

1 + 24 51<br />

+<br />

60 60 · 60 +<br />

10<br />

60 · 60 · 60<br />

Stand: 21. November 2011 30 ○c J. Baumeister, T.G. Macedo


4.1 Zahlen<br />

ist; eine erstaunlich gute Näherung <strong>für</strong> √ 2. 26 Die übliche Näherung zu dieser Zeit war<br />

1 + 25<br />

60<br />

= 17<br />

12<br />

, eine Näherung, die wir nun entlang von Überlegungen der Babylonier<br />

ableiten. Sie geben <strong>für</strong> z := √ a2 + b2 die Näherung ˜z gemäß<br />

˜z = a + b2<br />

2a<br />

an. Man kann diese Formel so fin<strong>den</strong>: Wenn b relativ zu a klein ist, betrachte man a als<br />

guten Näherungswert <strong>für</strong> z <strong>und</strong> verbessere ihn mit dem Korrekturterm d gemäß<br />

a 2 + b 2 = z 2 ! = (a + d) 2 = a 2 + 2ad + d 2 .<br />

Bei Vernachlässigung von d 2 ergibt sich d = b2<br />

2a<br />

˜z = a + d = a + b2<br />

2a<br />

<strong>und</strong> daher<br />

(8)<br />

1 z2<br />

= (a + ) (9)<br />

2 a<br />

als neue Näherung. Etwa ergibt dies <strong>für</strong> z := x mit x 2 = 2 mit der Ausgangsnäherung<br />

a = 1 sukzessive<br />

˜z = 1 + 1<br />

2<br />

3 17 577<br />

= , ˜z = , ˜z =<br />

2 12 408<br />

= 1.4142156 . . . .<br />

(Man vergleiche mit dem Wert 1.4142136 . . . <strong>für</strong> √ 2 , die ein Taschenrechner liefert.)<br />

Auf Theon 27 geht ein Verfahren zur Bestimmung eines Näherungswertes <strong>für</strong> die gesuchte<br />

Zahl x zurück; es wird auch von Euklid beschrieben. Wir wählen eine schon ziemlich<br />

moderne Darstellung der Vorgehensweise von Theon, nämlich die Form eines Algorithmus.<br />

Sie erklärt sich zumindest von der Form her von selbst.<br />

Algorithm 1 Iteration von Theon<br />

EIN ” Einheitsstrecke“ a := 1 .<br />

Schritt 0 s0 := a, x0 := a; n := 0.<br />

Schritt 1 an := xn<br />

sn , bn := a 2 n − 2.<br />

Schritt 2 sn+1 := sn + xn, xn+1 := 2sn + xn.<br />

AUS Für jedes n = 0, 1, . . . Zahlen an , bn mit folgender Eigenschaft:<br />

Jedes an ist eine Näherung <strong>für</strong> x <strong>und</strong> jedes bn gibt <strong>den</strong> Fehler von xn in der Gleichung<br />

x 2 = 2 an.<br />

In unserer etwas vagen Betrachtung der reellen Zahlen macht es wenig Sinn, nach dem<br />

Fehler der Approximation an <strong>für</strong> √ 2 zu fragen, da √ 2 ja als Zahl gar nicht so recht vorliegt.<br />

Theon konnte <strong>den</strong> Wert, dem das Verhältnis der Zahlen xn, sn ” zustrebt“, nicht beschreiben/ausrechnen,<br />

aber er konnte schließen, dass das Verhältnis von xn <strong>und</strong> sn schließlich<br />

immer genauer dem Verhältnis der Diagonale zur Seite des Quadrats wird. Man erhält<br />

die folgen<strong>den</strong> Näherungen <strong>für</strong> x :<br />

1 = 1 3 7 17 41 99<br />

; ; ; ; ;<br />

1 2 5 12 29 70<br />

26 Beachte, dass hier das 60-Zahlsystem Verwendung findet.<br />

27 Theon, um 350 v.Chr.<br />

= 1.414285 . . . .<br />

Stand: 21. November 2011 31 ○c J. Baumeister, T.G. Macedo


4.2 Exponenten<br />

Abschließend halten wir fest, dass wir in <strong>den</strong> reellen Zahlen die algebraischen Rechenarten<br />

+, −, ·, / wie in <strong>den</strong> rationalen Zahlen zur Verfügung haben. Daneben haben wir<br />

nun auch die Rechenart Radizieren zur Verfügung. Darüberhinaus können wir nun auch<br />

Funktionen mit Definitionsbereich in <strong>den</strong> reellen Zahlen betrachten.<br />

Drei herausgehobene Zahlen kann man unter <strong>den</strong> reellen Zahlen ausmachen, die nicht<br />

dargestellt wer<strong>den</strong> können:<br />

als Bruch m<br />

n<br />

Quadratwurzel x = 2√ 2 = √ 2 = 1.414 213 . . .<br />

Kreiszahl π = 3.141 592 . . .<br />

Eulersche Zahl e = 2.718 281 . . .<br />

<strong>Von</strong> diesen drei Zahlen haben wir die Zahl e noch nicht eigentlich kennengelernt. Sie kann<br />

auf mehrfache Weise eingeführt wer<strong>den</strong>:<br />

e = lim n (1 + 1<br />

n )n , e =<br />

Je<strong>den</strong>falls ist immer ein infinitesimaler Prozess beteiligt. Als Nähereung haben wir<br />

4.2 Exponenten<br />

∞�<br />

k=0<br />

e ≈ 2.718 281 828 459...<br />

Exponentialterme haben in <strong>den</strong> Naturwissenschaften, z.B. bei der mathematischen Beschreibung<br />

von Wachstumsvorgängen, eine herausragende Bedeutung. Wir führen ein<br />

erläuterndes Beispiel an, das Wachstum mit Exponenten verbindet.<br />

Sissa ibn Dahir lebte angeblich im dritten oder vierten Jahrh<strong>und</strong>ert n. Chr. in Indien<br />

<strong>und</strong> gilt Legen<strong>den</strong> zufolge als der Erfinder des Schachspiels. Sein Name ist ferner mit<br />

der Weizenkornlegende verbun<strong>den</strong>. Diese Anekdote findet häufig im Zusammenhang mit<br />

exponentiellen Funktionen Erwähnung <strong>und</strong> lautet folgendermaßen: Der indische Herrscher<br />

gewährte dem Brahmanen, der das Schachspiel erfun<strong>den</strong> hat, einen freien Wunsch. Dieser<br />

wünschte sich Weizenkörner: auf das erste Feld eines Schachbretts wollte er ein Korn, auf<br />

das zweite Feld die doppelte Menge, also zwei, auf das dritte wiederum doppelt so viele,<br />

also vier <strong>und</strong> so weiter. Der König lachte <strong>und</strong> war gleichzeitig erbost ob der vermeintlichen<br />

Beschei<strong>den</strong>heit des Brahmanen. Als die Rechenweister aber nachrechneten, stellten sie<br />

fest, dass das Reich die Menge der Weizenkörner nicht aufbringen konnte. Es sind nämlich<br />

1<br />

k! .<br />

2 0 + 2 1 + 2 2 + · · · + 2 63 = 2 64 − 1 = 18446744073709551615<br />

Weizenkörner von Nöten. 10 000 Weizenkörner wiegen etwa 3 kg, also wären ca. 600<br />

Milliar<strong>den</strong> Tonnen Weizen nötig.<br />

Man nennt ein Wachstum der Form an := q n , n ∈ N, (mit q > 1) ein geometrisches<br />

(im Gegensatz zu einem arithmetischen wie an := na + b, n ∈ N; a, b gegeben).<br />

Die Definition der Exponentialterme a x kann man in drei Stufen erarbeiten. Ist x eine<br />

natürliche Zahl m ∈ N0, so ist a x mittels der Multiplikation so erklärt:<br />

a x = a m := a · · · · · a<br />

� �� �<br />

m-mal<br />

Stand: 21. November 2011 32 ○c J. Baumeister, T.G. Macedo


4.3 Logarithmen<br />

Im Sonderfall m = 0 ist a m als 1 definiert. Ist m = −k ∈ Z mit k ∈ N, so setzen wir<br />

a m := 1<br />

.<br />

ak Dabei unterstellen wir, dass der ” Kehrwert“ der reellen Zahl a k als bekannt vorausgesetzt<br />

wer<strong>den</strong> kann. Für eine rationale Zahl a stellt dies kein Problem dar, weil dann ja a k selbst<br />

wieder eine rationale Zahl ist.<br />

Ist x ein Stammbruch, d.h. ist x = 1 mit k ∈ N, so stehen wir vor dem Problem, dass<br />

k<br />

wir die k-te Wurzel aus a zu erklären haben, d.h. eine Zahl z mit zk = a . Eine solche<br />

Zahl existiert <strong>und</strong> sie ist auch eindeutig bestimmt; wir schreiben z = k√ a . Also setzen wir<br />

a 1<br />

k := k√ a <strong>für</strong> k ∈ N .<br />

Damit haben wir nun eine Definition <strong>für</strong> ax parat <strong>für</strong> alle x = m,<br />

m ∈ Z, n ∈ N:<br />

n<br />

a m<br />

n := n√ a m , m ∈ Z, n ∈ N .<br />

Aber was soll eine Potenz a x bedeuten <strong>für</strong> eine Dezimalzahl, die nicht als Bruch dargestellt<br />

wer<strong>den</strong> kann? Man geht approximativ vor: man nähert x an durch eine Folge von<br />

rationalen Zahlen q1, q2, . . . , ql, . . . , die die Zahl x ” als Grenzwert“ besitzen, <strong>und</strong> definiert<br />

a x als Grenzwert der Zahlenfolge a q1 , a q2 , . . . , a ql, . . . . Diese Grenzwertbetrachtung ist im<br />

Zentrum der Analysis, also der Beschäftigung mit reellen Zahlen <strong>und</strong>, darauf aufgebaut,<br />

mit <strong>den</strong> reellen Funktionen. Beachte a 0 = 1 <strong>für</strong> alle a > 0 .<br />

Damit können wir sagen, dass z.B. 2 π gleich dem Grenzwert der Folge 2 3 , 2 3,1 , 2 3,14 , . . .<br />

ist.<br />

Was ist der Vorteil einer Exponentialdarstellung? Folgende Beobachtung ist hier richtungsweisend:<br />

überstreicht die Variable x das Intervall [0, 1] bzw. [100, 101], so überstreicht<br />

die Potenzfunktion x ↦−→ a x das Intervall [1, a] bzw. [a 100 , a 101 ] . Man sieht, Intervalle<br />

der Länge 1 wer<strong>den</strong> unterschiedlich gestreckt, im ersten Fall ist der Streckungsfaktor 1, im<br />

zweiten Fall a 100 (a−1) . Diese Tatsache kann man nutzen, um etwa physikalische Größen,<br />

die über einen weiten Bereich der Zahlskala streuen, geeignet zu skalieren.<br />

4.3 Logarithmen<br />

Logarithmen, wie wir sie nun besprechen wollen, sind geeignet, die obige Beobachtung<br />

der Streckung rückgängig zu machen <strong>und</strong> Skalen zu stauchen.<br />

Die Verwendung des Logarithmus lässt sich bis in die Frühzeit der indischen Kultur<br />

zurückverfolgen, Bezüge fin<strong>den</strong> sich auch bei Archimedes. Mit dem Fortschritt der Astronomie<br />

im 15., 16. Jahrh<strong>und</strong>ert 28 <strong>und</strong> dem aufstreben<strong>den</strong> Bankwesen im Europa des 17.<br />

Jahrh<strong>und</strong>erts erlangte der Logarithmus dann immer mehr an Bedeutung. Seine Funktionswerte<br />

wur<strong>den</strong> in Tabellenwerken, <strong>den</strong> Logarithmentafeln, erfasst, um sie nachschlagen<br />

zu können <strong>und</strong> nicht immer neu berechnen zu müssen. Diese Tabellen wur<strong>den</strong> schließlich<br />

durch Rechenschieber <strong>und</strong> später durch Taschenrechner verdrängt.<br />

Eine Funktion der Form x ↦→ a x mit der Basis a > 0 heißt Exponentialfunktion.<br />

In der ” gebräuchlichsten“ Form sind dabei <strong>für</strong> <strong>den</strong> Exponenten x die reellen Zahlen zugelassen.<br />

Im Gegensatz zu <strong>den</strong> Potenzfunktionen (Polynome ersten, zweiten,. . . Grades), bei<br />

<strong>den</strong>en die Basis die unabhängige Größe (Variable) ist, ist bei Exponentialfunktionen die<br />

Variable der Exponent (auch Hochzahl) des Potenzausdrucks. Darauf bezieht sich auch die<br />

28 J. Napier, 1550-1617, fertigte eine erste Logarithmentafel.<br />

Stand: 21. November 2011 33 ○c J. Baumeister, T.G. Macedo


4.3 Logarithmen<br />

Namensgebung. Exponentialfunktionen haben in <strong>den</strong> Naturwissenschaften, z.B. bei der<br />

mathematischen Beschreibung von Wachstumsvorgängen, eine herausragende Bedeutung;<br />

siehe unten.<br />

Zentrale Aspekte des Lebens lassen sich mit Hilfe von Logarithmen erklären. So nimmt<br />

zum Beispiel die Stärke eines Sinneseindrucks in Abhängigkeit von einer physikalischen<br />

Größe wie Helligkeit oder Lautstärke entsprechend dem Verlauf einer Logarithmusfunktion<br />

zu. Gleiches gilt <strong>für</strong> die wahrgenommene Tonhöhe in Abhängigkeit von der Frequenz eines<br />

Tones.<br />

Formal sind Logarithmen Lösungen x der Gleichung<br />

a = b x<br />

zu vorgegebenen Größen a <strong>und</strong> b. Das Logarithmieren ist also eine Umkehroperation<br />

des Potenzierens. Je nachdem, über welchem Zahlenbereich <strong>und</strong> <strong>für</strong> welche Größen diese<br />

Gleichung betrachtet wird, hat sie keine, mehrere oder genau eine Lösung. Ist die Lösung<br />

eindeutig, dann wird sie als der Logarithmus von a zur Basis b bezeichnet <strong>und</strong> man<br />

schreibt<br />

x = log b(a) .<br />

Beispielsweise ist 3 der Logarithmus von 8 zur Basis 2, geschrieben log 2(8) = 3, <strong>den</strong>n es<br />

ist 2 3 = 8.<br />

Beachte: log b 1 := 0 <strong>für</strong> alle b .<br />

Logarithmen erlangten ihre historische Bedeutung in erster Linie durch <strong>den</strong> Zusammenhang<br />

log b(xy) = log b(x) + log b(y) (10)<br />

der es erlaubt, eine Multiplikation <strong>und</strong> damit auch eine Potenzierung durch eine Addition<br />

auszudrücken. Sie ergibt sich aus dem Gegenstück <strong>für</strong> die Exponentialfunktion, das<br />

unmittelbar einsichtig ist:<br />

a x+y = a x · a y <strong>für</strong> alle x, y (11)<br />

Die Funktionalgleichung (10) ist die Gr<strong>und</strong>lage <strong>für</strong> die Verwendung <strong>und</strong> <strong>den</strong> Nutzen<br />

der Logarithmentafeln (Aufstellung von Logarithmen); siehe Abschnitt 4.5.<br />

Drei Basen <strong>für</strong> die Logarithmen spielen eine Sonderrolle, alle drei zugehörigen Logarithmen<br />

fin<strong>den</strong> sich im Allgemeinen in Logarithmentafeln.<br />

Zehner-Logarithmus/dekadischer Logarithmus Hier ist die Basis b = 10 . Sie ist die<br />

angemessene Basis <strong>für</strong> das Rechnen im Zehner-System. Beispielsweise gilt: log 10(2) ≈<br />

0.30103 . Dies korrespondiert mit 2 10 ≈ 10 3 . Im Allgemeinen schreibt man <strong>für</strong> log 10<br />

kurz log .<br />

Dualer Logarithmus Die Basis ist 2 <strong>und</strong> sie ist die angemessene Basis, wenn wir über<br />

Dualzahlen re<strong>den</strong> wollen. Zum Beispiel können wir mit log 2(a) die Länge der Dualdarstellung<br />

von a ermitteln.<br />

Natürlicher Algorithmus Die Basis ist die eulersche Zahl b := e . Im Allgemeinen<br />

schreibt man <strong>für</strong> log e kurz ln; ln heißt logarithmus naturalis.<br />

Unter Verwendung des natürlichen Logarithmus lässt sich mit der Gleichung<br />

a x x·ln a<br />

= e<br />

jede Exponentialfunktion auf eine solche zur Basis e zurückführen.<br />

Zusammenhänge mit angewandten Fragestellungen sind:<br />

Stand: 21. November 2011 34 ○c J. Baumeister, T.G. Macedo


4.4 Exponential– <strong>und</strong> Logarithmusfunktion<br />

Rechenschieber Weil der Logarithmus selbst nicht so leicht zu berechnen ist, waren Rechenschieber<br />

mit ihren logarithmischen Skaleneinteilungen <strong>und</strong> Logarithmentafeln<br />

weit verbreitete Hilfsmittel. Durch die bewegliche Zunge <strong>und</strong> unterschiedliche Skalen<br />

auf dem festen Teil <strong>und</strong> der Zunge konnte die Funktionalgleichung (10) genutzt<br />

wer<strong>den</strong>.<br />

Evolution Zum Zusammenhang von Evolution <strong>und</strong> Logarithmus siehe<br />

http://www.spiegel.de/wissenschaft/mensch/0,1518,556493,00.html<br />

Halbwertszeit Wie lange dauert es, bis radioaktive Atome zerfallen? Für ein einzelnes,<br />

ausgewähltes Atom kann man nicht sagen, ob es in der nächsten Millisek<strong>und</strong>e zerfallen<br />

wird oder noch eine Woche oder gar ein Jahrh<strong>und</strong>ert ” lebt“. Für eine große<br />

Anzahl von Atomen kann man dagegen mit Hilfe des Zerfallsgesetzes, das ein exponentielles<br />

ist, sehr wohl statistische Aussagen machen; siehe Abschnitt 3.3. Mit<br />

Hilfe des Logarithmus kann man die Zeitdauer ermitteln, in der die Hälfte der Atome<br />

zerfällt.<br />

4.4 Exponential– <strong>und</strong> Logarithmusfunktion<br />

Eine Funktion der Form x ↦→ a x mit der Basis a > 0 heißt Exponentialfunktion.<br />

Im Gegensatz zu <strong>den</strong> Potenzfunktionen (Polynome ersten, zweiten,. . . Grades), bei <strong>den</strong>en<br />

die Basis die unabhängige Größe (Variable) ist, ist bei Exponentialfunktionen die Variable<br />

der Exponent (auch Hochzahl) des Potenzausdrucks. Darauf bezieht sich auch die<br />

Namensgebung.<br />

Als die Exponentialfunktion im engeren Sinne (präziser eigentlich: natürliche Exponentialfunktion)<br />

bezeichnet man die Exponentialfunktion x ↦→ e x mit der eulerschen Zahl<br />

e . als Basis; gebräuchlich hier<strong>für</strong> ist auch die Schreibweise x ↦→ exp(x). Hier ist die Basis<br />

schon eine Zahl, die nicht als endlicher oder periodischer Deziamalbruch dargestellt<br />

wer<strong>den</strong> kann, die Berechnung von exp(x) gelingt wiederum nur über einen Approximationsprozess.<br />

Auf (Taschen-)Rechnern ist die Exponentialfunktion abrufbar.<br />

Die allgemeine Exponentialfunktion ist definiert als f(x) = a x , x ∈ Q, mit der Basis<br />

a > 0, a �= 1. Einige Eigenschaften davon sind<br />

1. Die Funktion ist <strong>für</strong> a > 1 streng monoton steigend <strong>und</strong> <strong>für</strong> a < 1 streng monoton<br />

fallend.<br />

2. Die Wertemenge beinhaltet alle positiven reellen Zahlen.<br />

3. Die x-Achse ist die Asymptote des Graphen, <strong>den</strong>n f(x) strebt gegen 0, falls x gegen<br />

−∞ strebt <strong>für</strong> a > 1 <strong>und</strong> f(x) strebt gegen 0, falls x gegen ∞ strebt <strong>für</strong> a > 1 .<br />

4. Alle Graphen haben in der Ebene <strong>den</strong> Punkt P (0; 1) gemeinsam.<br />

5. Die Graphen der Exponentialfunktionen mit f(x) = ax := expa(x) <strong>und</strong> f(x) =<br />

1 (x) gehen durch Spiegelung an der y-Achse hervor.<br />

a x := exp 1<br />

a<br />

Die eulersche Zahl hat (neben vielen anderen Eigenschaften) die vorzügliche Eigenschaft,<br />

dass sie als Potenzfunktion ein Wachstum als einzige Funktion so beschreibt, dass die<br />

Wachstumsrate (Ableitung) durch dieselbe Potenzfunktion beschrieben wird.<br />

Die Logarithmusfunktion ist die Umkehrung zur Exponentialfunktion:<br />

falls a x = b, dann gilt log a(b) = x <strong>für</strong> alle a > 0. (12)<br />

Stand: 21. November 2011 35 ○c J. Baumeister, T.G. Macedo


4.5 Logarithmentafel<br />

In anderen Worten, der Logarithmus von b zur Basis a ist die Zahl, mit der die Basis a<br />

potenziert wer<strong>den</strong> muss, um b zu erhalten. Diese Funktion besitzt folgende Eigenschaften<br />

1. Die Funktion ist <strong>für</strong> a > 1 streng monoton steigend <strong>und</strong> <strong>für</strong> a < 1 streng monoton<br />

fallend.<br />

2. Die Wertemenge beinhaltet alle reelle Zahlen.<br />

3. Die y-Achse ist die Asymptote des Graphen, <strong>den</strong>n f(x) strebt gegen 0, falls x gegen<br />

0 strebt.<br />

4. Alle Graphen haben in der Ebene <strong>den</strong> Punkt P (0; 1) gemeinsam.<br />

5. Die Graphen der Logarithmusfunktion f(x) := loga x <strong>und</strong> f(x) := log 1 x gehen<br />

a<br />

durch Spiegelung an der x-Achse hervor.<br />

4.5 Logarithmentafel<br />

Logarithmentafel nennt man eine tabellarische<br />

Darstellung der Mantissen<br />

der Logarithmen (meist zur Basis 10, e)<br />

der Zahlen, in der Regel von 1.00<br />

bis 9.99. Logarithmentafeln waren über<br />

Jahrh<strong>und</strong>erte ein wichtiges Rechenhilfsmittel,<br />

besonders im natur- <strong>und</strong> ingenieurwissenschaftlichen<br />

Bereich. Als Erfinder<br />

der Logarithmentafeln gilt John<br />

Napier, der sie in seinem Werk Mirifici<br />

Logarithmorum Canonis Descriptio<br />

1614 veröffentlichte. Unabhängig von<br />

Napier entwickelte auch der Schweizer<br />

Jost Bürgi in Kassel eine Logarithmentafel.<br />

Als Mitarbeiter von Johannes<br />

Kepler verwendete er die selbst erstellten<br />

Logarithmentafeln <strong>für</strong> astronomische<br />

Berechnungen. Henry Briggs entwickelte<br />

die Logarithmentafeln dahingehend<br />

weiter, dass er sie zur Basis 10 erstellte.<br />

Hier waren die Logarithmen der<br />

Zahlen von 1 bis 20.000 <strong>und</strong> von 90.000<br />

bis 100.000 auf 14 Stellen genau aufgeführt.<br />

Abbildung 11: Ausschnitt aus einer Logarithmentafel<br />

Viele Berechnungen in der Schulmathematik, z. B. das Ziehen von schwierigen Wurzeln,<br />

konnten nur mit ihrer Hilfe durchgeführt wer<strong>den</strong>. Die Erfindung <strong>und</strong> weite Verbreitung von<br />

Taschenrechnern <strong>und</strong> Computern hat die Verwendung von Logarithmentafeln, ähnlich wie<br />

die von Rechenschiebern, innerhalb weniger Jahre praktisch völlig überflüssig gemacht.<br />

Logarithmentafeln erlauben es also, die Multiplikation <strong>und</strong> Division von Zahlen auf die<br />

einfachere Addition <strong>und</strong> Subtraktion zurückzuführen. Die Basis da<strong>für</strong> ist die Funktionalgleichung<br />

(10). Dies geht so:<br />

Aufgabe: Berechne xy<br />

Vorgehen:<br />

Stand: 21. November 2011 36 ○c J. Baumeister, T.G. Macedo


• Berechne q := log b(xy) gemäß (10) als q := log b(x) + log b(y)<br />

• Berechne xy aus der Gleichung log b(xy) = q (Delogarithmieren)<br />

4.5 Logarithmentafel<br />

In einer Logarithmentafel kann man die Logarithmen log b(x), log b(y) nachschlagen, damit<br />

kennt man q mittels einer Addition, nun kann man xy in der Logarithmentafel nachschlagen,<br />

indem man die Tafel in entgegengesetzter Richtung liest.<br />

Wie kamen aber die Zahlenaufstellungen in der Tafel ohne Rechenmaschinen zustande?<br />

Wir erläutern dies <strong>für</strong> <strong>den</strong> Zehnerlogarithmus von 2, <strong>und</strong> zwar in einer beschei<strong>den</strong>en<br />

Genauigkeit, nämlich 3 Stellen Genauigkeit. Dazu hätten wir die Gleichung<br />

10 x = 2<br />

zu lösen, ein ziemlich schwieriges Unterfangen. Wir gehen anders vor:<br />

Aufgabe: Gegeben y, berechne log(y) .<br />

Vorgehen:<br />

• Bestimme n ∈ N mit 1.01 n < y , 1.01 n+1 > y<br />

• Bestimme einen ” interpolieren<strong>den</strong> Wert“ u zwischen n, n+1 so, dass 1.01 u ≈<br />

y ist.<br />

• Klar: log(y) ≈ u log(1.01) .<br />

Das eben skizzierte Vorgehen hat noch eine entschei<strong>den</strong>de Schwäche: wir kennen ja<br />

log(1.01) nicht. Diese Zahl verschaffen wir uns zunächst nach dem obigen Vorgehen <strong>für</strong> y =<br />

10, wovon wir <strong>den</strong> Logarithmus ja kennen: log(10) = 1 . Bei diesem Vorgehen wird auch<br />

die Bedeutung der Wahl der Zahl 1.01 deutlich. Hiermit ist nämlich das obige Vorgehen,<br />

d.h. die Bestimmung von n ziemlich einfach: das Potenzieren hiermit ist einfach eine<br />

Verschiebung um zwei Stellen nach hinten <strong>und</strong> Run<strong>den</strong>, um die Stellen nicht anwachsen<br />

zu lassen.<br />

Führen wir dies nun vor <strong>für</strong> die Berechnung des Logarithmus von 2. Zunächst haben<br />

wir n zu bestimmen mit 1.01 n < 10, 1.01 n+1 > 10 . Ein solches n ist 231. Wir erhalten<br />

dies durch sukzessive Rechnung:<br />

1.01 2 = 1.01 + 0.0101 = 1.0201, 1.01 3 = 1.01 2 = 1.0201 + 0.0102 = 1.0303, . . . ,<br />

1.01 231 = 9.959, 1.01 232 = 10.059<br />

Also ist die interpolierende Wahl v = 231.4 <strong>für</strong> 1.01 v ≈ 10 vernünftig. Dies bedeutet<br />

log(1.01) ≈ v = 231.4 . In derselben Weise erhalten wir u = 69.7 mit 1.01 u ≈ 2, d.h.<br />

log(2) ≈ u log(1.01) . Daraus ergibt sich<br />

log(2) ≈ u<br />

= 0.3012 ,<br />

v<br />

ein Wert, der auf 3 Stellen genau ist.<br />

Natürlich verbergen sich dahinter auch Genauigkeitsfragen, aber sie sind abschlie-<br />

”<br />

ßend“ geklärt. Um höhere Genauigkeiten zu erzielen, ersetzt man 1.01 durch 1.000001 ;<br />

die Rechenschritte sind analog.<br />

Bibliographische Anmerkungen<br />

Die Geschichte der Entstehung der rigorosen Handhabung der rationalen <strong>und</strong> reellen<br />

Zahlen ist natürlich eng mit der Entwicklung des Konvergenzbegriffs bei Zahlenfolgen<br />

verknüpft; siehe etwa [5, 33, 52, 59, 65, 81]. Als Anmerkung: in [65] findet man eine<br />

” Bestenliste“ der <strong>Mathematik</strong>er.<br />

Die Behandlung der Exponential– <strong>und</strong> Logarithmenrechnung findet schon in der Schule<br />

statt. Sie ist nahezu unerlässlich <strong>für</strong> ein f<strong>und</strong>iertes Sachrechnen“; siehe etwa [20, 76]. Eine<br />

”<br />

” klassische“ Logarithmentafel ist die von P. Schulz, mit der viele Schüler ihre Erfahrungen<br />

gesammelt haben; siehe [75]. Zur Geschichte des Logarithmus siehe etwa [67].<br />

Stand: 21. November 2011 37 ○c J. Baumeister, T.G. Macedo


5 Benford–Zahlen<br />

Benford‘s Law gives auditors the expected frequencies of<br />

the digits in tabulated data. The premise is that we would<br />

expect authentic and unmanipulated data to exhibit these<br />

patterns. If a data set does not follow these patterns,<br />

however, a few possible reasons exist to explain this<br />

phenomenon: 1. The data set did not meet the three tests,<br />

and/or, 2. The data set includes invented numbers, biased<br />

numbers, or errors.<br />

Mark Nigrini<br />

Hier berichten wir über eine interessante Beobachtung im ” Zoo der Zahlen“, nämlich<br />

über die Tatsache, dass in gewissen Datensätzen die Eins als erste Ziffer häufiger vorkommt<br />

als andere Ziffern. Diese Beobachtung wurde erstmals gemacht von S. Newcomb 1861, aber<br />

dann wieder vergessen. Neu entdeckt wurde sie von F. Benford 1938, von dem nun diese<br />

Beobachtung ihren Namen hat. Zahlenfolgen aus Datenmaterial der Börsenseite etwa<br />

entnommen eignet sich daher nicht notwendigerweise als Generator <strong>für</strong> (gleichverteilte)<br />

<strong>Zufallszahlen</strong>.<br />

5.1 Die Beobachtung von Newcomb <strong>und</strong> Benford<br />

Die Geschichte zur Untersuchung der obigen ” unregelmäßigen Häufigkeitsverteilung“ begann<br />

beim Betrachten von Logarithmentafeln, <strong>und</strong> zwar berichtete der amerikanische<br />

<strong>Mathematik</strong>er <strong>und</strong> Astronom S. Newcomb 1881 ([61]), dass die vorderen Seiten deutlich<br />

stärker abgegriffen waren, als die hinteren. Dies wäre bei anderen Büchern als Logarithmentafeln<br />

in Bibliotheken durchaus erklärlich, <strong>den</strong>n viele Leute beginnen ein Buch zu<br />

lesen, hören aber vorzeitig damit wieder auf, weil sie keine Zeit mehr haben, weil es ihnen<br />

zu langweilig wird, weil es ihnen zu kompliziert wird u.ä.. Wenn viele die Lektüre unfertig<br />

unterbrechen – Kein Mensch liest ein langweiliges Buch bis zum Schluss“– ist es klar,<br />

dass der Anfang von Büchern abgenützter sein kann als der Schluss. Aber warum soll<br />

dies bei Logarithmentafeln der Fall sein? Diese wer<strong>den</strong> ja nach anderen Gesichtspunkten<br />

benützt. Die einzige Erklärung, die es da<strong>für</strong> gibt, ist, dass der Logarithmus von Zahlen<br />

mit niedrigen Anfangsziffern (1,2, ... ) häufiger gesucht wurde als von Zahlen mit hohen<br />

Anfangsziffern (9,8, ... ). Aber warum? Newcomb gibt eine heuristische Begründung,<br />

klärt aber <strong>den</strong> Zusammenhang mit <strong>den</strong> Zahlenmengen, deren Logarithmen in der Tafel<br />

aufgesucht wur<strong>den</strong>, nicht wirklich.<br />

1938 stieß der amerikanische Physiker<br />

F. Benford ([7]) auf dieselbe überraschende<br />

Beobachtung, allerdings auf einem etwas<br />

anderem Weg. Benford analysierte Datenmaterial,<br />

das u.a. ” Stadt, Land, Fluss“ <strong>und</strong><br />

physikalische Konstanten beinhaltete; siehe<br />

die Tabelle in Abbildung 12.<br />

Das Benford-Gesetz handelt von <strong>den</strong><br />

ersten Ziffern einer Zahl. Dabei sind auch<br />

Dezimalzahlen zugelassen. Wir bezeichnen<br />

mit D1 die erste signifikante Ziffer einer<br />

Zahl, also<br />

Abbildung 12: Aus der Benford-Tabelle<br />

D1(314) = 3, D1(0.0314) = 3, D1( √ 2) = D1(1.414 . . . ) = 1, D1(π) = 3 .<br />

Stand: 21. November 2011 38 ○c J. Baumeister, T.G. Macedo


5.1 Die Beobachtung von Newcomb <strong>und</strong> Benford<br />

Analog sind D2, D3, . . . erklärt. Allerdings ist nun als signifikante Ziffer auch die Null<br />

erlaubt. Dazu später.<br />

Das Benfordsche Gesetz sagt also einem Zahlenmaterial die Eigenschaft zu, dass die<br />

Wahrscheinlichkeit pi, darunter eine Zahl x mit D1(x) = di (di = 1, i = 1, 2, . . . , 9) zu<br />

fin<strong>den</strong>, folgen<strong>den</strong> Wert besitzt:<br />

pi = log(1 + 1<br />

) .<br />

Natürlich ist dies nur eine vage Definition, <strong>den</strong>n es sind dabei Besonderheiten des Zahlenmaterials<br />

zu be<strong>den</strong>ken: endlich, unendlich, . . . .<br />

Kommen Zahlen mit niedrigen Anfangsziffern ” in der Welt“ häufiger vor? Warum sollte<br />

die Natur eine Präferenz <strong>für</strong> die 1 als Anfangsziffer haben? Es gibt solches Datenmaterial<br />

<strong>und</strong> das Gesetz, das die Häufigkeit der Ziffern numerisch fasst, heißt Benfordsches<br />

Gesetz. Anders gefasst wird dieser Sachverhalt auch als Newcombsches Mantissengesetz<br />

bezeichnet. Ein wichtiges Kriterium fur die Anwendbarkeit des Benfordschen Gesetzes<br />

ist die Skaleninvarianz einer Datenverteilung. Dies bedeutet, dass sich die Verteilung<br />

der Anfangsziffern in einem Datensatz durch Multiplikation mit einer Konstanten nicht<br />

verändert. Diese Eigenschaft erklärt unmittelbar, warum in Steuererklärungen, Bilanzen,<br />

etc., oder allgemein bei Datensätzen, deren Zahlen Geldbeträge darstellen, das Benfordsche<br />

Gesetz gilt. Wenn es überhaupt eine universell gültige Verteilung der Anfangsziffern<br />

in solchen Datensätzen gibt, dann muss diese Verteilung unabhängig davon sein, in welcher<br />

Währung die Daten angegeben wer<strong>den</strong>, <strong>und</strong> die universelle Verteilung darf sich auch durch<br />

Inflation nicht verändern. Beides bedeutet, dass die Verteilung skaleninvariant sein muss.<br />

1961 gelang dem <strong>Mathematik</strong>er Roger Pinkham der Beweis, dass die einzige zulässige<br />

Verteilung <strong>für</strong> einen skaleninvarianten Datensatz die Benford-Verteilung ist.<br />

Machen wir <strong>den</strong> Versuch einer heuristischen<br />

Erklärung des Benfordschen Gesetzes.<br />

Die Eins ist von Null auf der<br />

Zahlenskala nicht weiter entfernt als die<br />

Fünf von der Sechs. Für die wirklichen<br />

Dinge allerdings, die gezählt, gemessen<br />

oder gewogen wer<strong>den</strong>, kann der Weg der<br />

Ergebnisse von der Eins zur Zwei sehr<br />

lang sein: um ihn zurückzulegen, müssen<br />

sie auf das Doppelte wachsen. Einer<br />

Fünf fehlt dagegen nur ein Fünftel, um<br />

zur Sechs zu wer<strong>den</strong>.<br />

Abbildung 13: Erste Ziffer bei NASDAQ-Kursen<br />

Anhand des DAX ist dies leicht<br />

verständlich. Stände der DAX gerade<br />

bei 1000 Punkte, dann müssten sich die<br />

Aktienkurse im Schnitt verdoppeln, ehe der DAX die 2000 erreicht. Solange bliebe die<br />

Eins als führende Ziffer auf allen Listen. Stünde der DAX aber bei 5000 Punkten, so<br />

müsste der Wert nur noch um 20 Prozent steigen, ehe mit 6000 die Fünf als erste Ziffer<br />

abgelöst wird. Noch kleiner ist im Verhältnis der Schritt von 9000 auf 10000. Dann aber<br />

erscheint wieder die Eins an erster Stelle, <strong>und</strong> sie bleibt so lange, bis der Index sich auf<br />

20 000 abermals verdoppelt. Was wächst oder schrumpft, verharrt deshalb relativ lang im<br />

Bereich der führen<strong>den</strong> Ziffer, besonders ausgeprägt ist dies bei der Eins.<br />

Das Benford-Gesetz gilt auch <strong>für</strong> viele Größen, die sich nicht wesentlich ändern im<br />

Lauf der Zeit, zum Beispiel <strong>für</strong> die Fläche von Gewässern. Ob man sie in Quadratmetern<br />

mißt, in Quadratmeilen oder in Hektar, immer tritt die Eins vorneweg gehäuft auf. Die<br />

Stand: 21. November 2011 39 ○c J. Baumeister, T.G. Macedo<br />

di


5.2 Neuere Beobachtungen<br />

Wachstumsbegründung sticht hier nicht, vielmehr hat es wohl mit der Häufigkeit der<br />

Gewässer kleiner, mittlerer <strong>und</strong> großer Größe zu tun.<br />

5.2 Neuere Beobachtungen<br />

Kurse der NASDAQ<br />

Man kann die berechtigte Vermutung haben,<br />

dass auf einer Zeitungsseite, auf der<br />

Zahlen zu unterschiedlichen Themen aufgelistet<br />

sind, die Ziffern 0, 1, 2, . . . , 9 in nahezu<br />

gleicher Häufigkeit zu fin<strong>den</strong> sind.<br />

Abbildung 14: 100 Fibonacci-Zahlen<br />

29<br />

Warum daraus nicht eine Tabelle von <strong>Zufallszahlen</strong><br />

fertigen, indem wir etwa eine<br />

Tabelle der Ziffernfolge in Fünfer-Blöcken<br />

erstellen; siehe die RAND-Tabelle in Abschnitt<br />

2.5. Dabei spielt offenbar die Ziffer<br />

Null eine Sonderrolle, da sie als führende<br />

Ziffer im Allgemeinen nicht vorkommt. Wie<br />

wir zur Kenntnis nehmen müssen, sind<br />

die Ziffern auf solchen Zeitungsseiten keine<br />

guten <strong>Zufallszahlen</strong>, da sie z.B. auch<br />

Börsendaten enthalten mögen. Hier sind<br />

die Ziffern im Allgemeinen Benford-verteilt. Dazu kommen wir nun.<br />

Die NASDAQ ist die größte Börse der<br />

USA. Sie umfasst ca. 900 Arbeitsplätze<br />

<strong>und</strong> wurde 1971 gegründet. Heute wird sie<br />

von Robert Greifeld geleitet <strong>und</strong> macht<br />

jährlich r<strong>und</strong> 1600 Mio. USD Umsatz. 30<br />

Sie sitzt in New York <strong>und</strong> ist weltweit bekannt.<br />

Das Diagramm 13 zeigt im Vergleich<br />

mit der Benford-Verteilung die Kurse der<br />

NASDAQ am 16. Juli 2011. Die Auswertung<br />

zeigt ganz deutlich, dass die Kurse<br />

der NASDAQ (im Diagramm mit Blau gekennzeichnet)<br />

fast die die gleiche Verteilung<br />

haben wie die Benford-Verteilung vorgibt;<br />

kleine Ausreisser sind allerdings zu sehen.<br />

Auffallend ist die signifikante Abweichungen<br />

bei der Ziffer 5 gibt. Wenn man<br />

Ziffer Häufigkeit in % Benford<br />

1 0.301 0.30103<br />

2 0.176 0.17609<br />

3 0.126 0.12493<br />

4 0.096 0.09691<br />

5 0.079 0.07918<br />

6 0.067 0.06694<br />

7 0.057 0.05799<br />

8 0.053 0.05115<br />

9 0.045 0.04575<br />

Abbildung 15: 1000 Fibonacci-Zahlen<br />

noch mehr Kurse-Zahlenmaterial zur Verfügung hätte, würde – nach dem Gesetz der<br />

großen Zahl (siehe vorheriges Kapitel) – das Ergebniss wohl noch genauer die Benfordschen<br />

Verteilung widerspiegeln.<br />

Fibonaccizahlen <strong>und</strong> Benford-Verteilung<br />

Im Abschnitt 6.2 wer<strong>den</strong> wir die Fibonacci-Zahlen als interessante Folge von ganzen Zahlen<br />

etwas genauer kennengelernen. Hier bringen wir sie in Verbindung mit der Benford-<br />

29 Klar, eine Tabelle von Jahreszahlen allein kann offenbar nicht in Betracht kommen.<br />

30 Stand Juli 2011<br />

Stand: 21. November 2011 40 ○c J. Baumeister, T.G. Macedo


Verteilung. Die Fibonacci-Zahlen wer<strong>den</strong> rekursiv definiert durch<br />

f0 := f1 := 1 , fn+1 := fn + fn−1 , n ∈ N .<br />

Damit ergibt sich eine (schnell) wachsende Folge (fn)n∈N0 :<br />

1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233 . . . .<br />

5.3 Das Mantissengesetz<br />

Die führen<strong>den</strong> Ziffern dieser Zahlen zeigen natürlich noch keine Auffälligkeit, der betrachtete<br />

Abschnitt ist viel zu kurz. Betrachten wir jedoch die ersten 100 bzw. 1000<br />

Fibonacci-Zahlen, so ergeben sich die in <strong>den</strong> Abbildungen 14 bzw. 15 notierten Häufigkeiten.<br />

Sie deuten an, dass die Zahlen Benford-verteilt sein könnten. Sie sind es in der Tat! Dies<br />

hängt mit der Tatsache zusammen, dass sie einem potentiellen Wachstumsgesetz gehorchen.<br />

Aufschluss über das Wachstum erhält man, wenn man die Formel von Binet<br />

heranzieht, die wir im Abschnitt 6.2 etwas genauer vorstellen wer<strong>den</strong>. Sie lautet:<br />

fn = 1<br />

√ 5<br />

�<br />

g n + 1<br />

g n<br />

�<br />

, n ∈ N . (13)<br />

Hierbei ist g := 1<br />

2 (1 + √ 5) die gol<strong>den</strong>e Schnittzahl. Man stellt nämlich wegen g > 1 fest,<br />

dass<br />

fn ≈ 1<br />

√ 5 g n , n ∈ N , (14)<br />

gilt. Die Fibonaccizahlen sind also näherungsweise skalierte Wachstumszahlen. Damit<br />

bleibt wegen der behaupteten Skaleninvarianz der Benford-Verteilung nun nur noch die<br />

Frage, ob die Zahlenfolge<br />

an := g n , n ∈ N,<br />

nach Benford verteilt ist. Ist möglicherweise jede geometrische Folge Benford-verteilt?<br />

Nein, <strong>den</strong>n offenbar ist die Folge (10 n )n∈N nicht Benford-verteilt. Den Nachweis, dass die<br />

Fibonacci-Folge Benford-verteilt ist, erbringen wir später.<br />

5.3 Das Mantissengesetz<br />

Zur Formulierung <strong>und</strong> Analyse des nun folgen<strong>den</strong> Benford-Gesetzes <strong>und</strong> Mantissengesetzes<br />

benötigen wir etwas Vertrautheit mit <strong>den</strong> Logarithmen.<br />

Newcomb schreibt einer Menge von<br />

natürlichen Zahlen – wir beziehen uns<br />

nur auf die in der Dezimaldarstellung –<br />

die Eigenschaft zu, dass sie dem Mantissengesetz<br />

gehorcht, wenn folgende<br />

Aussage zutrifft:<br />

Die Häufigkeit von Zahlen<br />

der Menge ist so, dass die<br />

Mantissen ihrer Logarithmen<br />

gleichverteilt sind.<br />

Newcomb gibt zwar eine heuristische<br />

Begründung, spezifiziert jedoch nicht<br />

wirklich, <strong>für</strong> welche Zahlmengen dieses<br />

Mantissengesetz gelten sollte. Newcomb<br />

Ziffer i Häufigkeit/% Ws(z ∈ Ei)<br />

1 30.1 log(2)<br />

2 17.6 log( 3<br />

2 )<br />

3 1.5 log( 4<br />

3 )<br />

4 9.7 log( 5<br />

4 )<br />

5 7.9 log( 6<br />

5 )<br />

6 6.7 log( 7<br />

6 )<br />

7 5.8 log( 8<br />

7 )<br />

8 5.1 log( 9<br />

8 )<br />

9 4.6 log( 10<br />

9 )<br />

Abbildung 16: Benford-Häufigkeiten<br />

Stand: 21. November 2011 41 ○c J. Baumeister, T.G. Macedo


5.3 Das Mantissengesetz<br />

betrachtet also nur natürliche Zahlen <strong>und</strong> betrachtet die Häufigkeit, mit der die erste<br />

Ziffer eine Eins, eine Zwei, . . . , eine Neun ist.<br />

Verabredungsgemäß ist die Mantisse 31 eines (dekadischen) Logarithmus nur die Zahl<br />

der Nachkommastellen. Da Newcomb nur die Mantissen der Logarithmen betrachtet, liegt<br />

folgende Darstellung beliebiger positiver Zahlen x zugr<strong>und</strong>e:<br />

x = a · 10 e mit 1 ≤ a < 10, e ∈ Z .<br />

Die Mantisse des dekadischen Logarithmus ist dann wegen<br />

log(a) da log(x) = log(a) + e .<br />

Definition 5.1 Die (dezimale) Signifikanz-Funktion S : (0, ∞) −→ [1, 10) ist definiert<br />

wie folgt:<br />

S(x) = t falls x = t · 10 e mit einem t ∈ [1, 10) <strong>für</strong> ein e ∈ Z .<br />

Beachte <strong>für</strong> x ∈ (0, ∞) : S(S(x)) = x , S(10 k x) = S(x) <strong>für</strong> alle k ∈ Z .<br />

Definition 5.2 Ist x eine reelle Zahl, so ist<br />

〈x〉 := x − ⌊x⌋<br />

der Bruchteil von x . �<br />

Dabei ist ⌊x⌋ die größte ganze Zahl, die kleiner gleich x ist. Beispielsweise:<br />

〈33.04〉 = 0.04 , 〈−33.04〉 = 0.96 , 〈 √ 2〉 = 0.4142 . . . , 〈π〉 = .1415 . . . .<br />

Der Zusammenhang dieser Begriffe (erste Ziffer, Signifikanz-Funktion, Bruchteil) ergibt<br />

sich aus folgendem Sachverhalt.<br />

S(x) = �<br />

m∈N 101−m Dm(x) ;<br />

Dm(x) = ⌊10 m−1 S(x)⌋ − 10⌊10 m−2 S(x)⌋ <strong>für</strong> alle m ∈ N ;<br />

S(x) = 10 log(x) − ⌊log(x)⌋ .<br />

Beachte auch folgende Eigenschaft<br />

〈log(x)〉 = 〈log(10 s x)〉 <strong>für</strong> alle x ∈ (0, ∞), s ∈ N , (15)<br />

die sich aus der Funktionalgleichung (10) ableitet.<br />

Nun können wir das Benfordsche Gesetz <strong>und</strong> das Mantissengesetz neu formulieren; wir<br />

tun dies (nur) <strong>für</strong> Zahlenfolgen.<br />

Definition 5.3 Ist (an)n∈N eine Folge positiver Zahlen, so sagen wir, dass diese Folge<br />

dem Mantissengesetz genügt, wenn gilt:<br />

1<br />

b − a = lim<br />

N→∞ N #{n ∈ N|a ≤ 〈log10(an)〉 ≤ b} , 0 ≤ a < b ≤ 1 . (16)<br />

31 mantissa (lat.) = Zugabe, Anhängsel<br />

Stand: 21. November 2011 42 ○c J. Baumeister, T.G. Macedo<br />

�<br />


5.3 Das Mantissengesetz<br />

Definition 5.4 Ist (an)n∈N eine Folge positiver Zahlen, so sagen wir, dass diese Folge<br />

dem starken Benford-Gesetz folgt oder stark Benford-verteilt ist, wenn gilt:<br />

1<br />

log10(x) = lim<br />

N→∞ N #{n ∈ N|0 ≤ 〈an〉 ≤ x} , x ∈ (0, 1] . (17)<br />

Es sollte nun keine Überraschung sein, dass folgender Sachverhalt richig ist:<br />

Satz 5.5 Eine Folge (an)n∈N positiver Zahlen genügt dem Mantissengesetz genau dann,<br />

wenn sie stark Benford-verteilt ist. �<br />

Nun bleibt immer noch das Problem, bei konkreten Folgen zu erkennen, ob sie Benfordverteilt<br />

ist. Dazu hat Hermann Weyl 1916 einen wichtigen Beitrag – beachte, zeitlich vor<br />

Benford <strong>und</strong> unabhängig von der Entdeckung von Newcomb – geleistet. Er hat nämlich<br />

Folgen charakterisiert, die gleichverteilt sind modulo 1.<br />

Definition 5.6 Ist (an)n∈N eine Folge positiver Zahlen, so sagen wir, dass diese Folge<br />

gleichverteilt modulo 1 ist, wenn gilt:<br />

1<br />

b − a = lim<br />

N→∞ N #{n ∈ N|a ≤ 〈an〉 ≤ b} , 0 ≤ a < b ≤ 1 . (18)<br />

Satz 5.7 (Gleichverteilungssatz) Sei a eine positive reelle Zahl. Dann ist die arithemtische<br />

Folge (na)n∈N gleichverteilt modulo 1, falls a nicht rational ist.<br />

Den Beweis dieses Satzes haben H. Weyl, W. Sierpinski, P. Bohl um 1910 unabhängig<br />

voneinander bewiesen; siehe [54] <strong>und</strong> [85].<br />

Der Satz 5.7 hilft uns nun zusammen mit Satz 5.5 weiter bei der Frage, wann eine<br />

Folge Benford-verteilt ist. Wir können nun auflisten:<br />

• (a n )n∈N ist Benford-verteilt, falls log 10(a) nicht rational ist.<br />

• (10 n )n∈N ist nicht Benford-verteilt. Klar, <strong>den</strong>n sie genügt nicht dem Weylschen Kriterium,<br />

aber es ist ja auch die ” ärmliche“ Folge 10, 100, 1000, . . . <strong>und</strong> modulo 1<br />

0, 0, 0, . . . .<br />

• (fn)n∈N ist Benford-verteilt. Dies folgt aus der Betrachtung, die die Formel von Binet<br />

erläutert; siehe (27).<br />

Gr<strong>und</strong>legend <strong>für</strong> die Gültigkeit des Mantissengesetzes in einem Datensatz ist die Tatsache,<br />

dass der Datensatz skaleninvariant ist. Die Voraussetzung von Skaleninvarianz erscheint<br />

schon deshalb plausibel, weil das Mantissengesetz unabhängig von <strong>den</strong> gewählten<br />

Einheiten gelten sollte. Wenn beispielsweise die Anfangsziffern von Aktienkursen ausgedrückt<br />

in Euro Benford-verteilt sind, dann sollten sie das auch sein, wenn man die Kurse<br />

in mexikanische Pesos umrechnet. Diese Skaleninvarianz folgt aus folgender Betrachtung.<br />

Ist die Folge (an)n∈N positiver Zahlen Benford-verteilt, dann ist es auch die Folge<br />

(can)n∈N, wenn c eine positive Zahl ist, <strong>den</strong>n es gilt ja<br />

#{n ∈ N|a ≤ 〈log 10(can)〉 ≤ b} ⇐⇒ #{n ∈ N|a ≤ 〈log 10(c) + log 10(an)〉 ≤ b}<br />

⇐⇒ #{n ∈ N|〉a ≤ 〈log 10(an)〉 ≤ b〉}<br />

Stand: 21. November 2011 43 ○c J. Baumeister, T.G. Macedo<br />

�<br />


woraus<br />

folgt.<br />

1<br />

b − a = lim<br />

N→∞ N #{n ∈ N|a ≤ 〈log10(can)〉 ≤ b} , 0 ≤ a < b ≤ 1 ,<br />

5.3 Das Mantissengesetz<br />

Wie konnte nun Newcomb mit Hilfe seines Mantissengesetzes das Phänomen der abgenutzten<br />

Seiten seiner Logarithmentafel erklären? Dazu nehmen wir an, eine Menge von<br />

zufälligen Zahlen sei so verteilt, dass sie dem Mantissengesetz gehorcht. Dann definieren<br />

wir <strong>für</strong> die Ziffern i ∈ {1, 2, . . . , 9} die Mengen<br />

Ei := {x ∈ R|x ≥ 0, führende Ziffer von x ist i} = �<br />

k∈Z<br />

[i10 k , (i + 1)10 k ) (19)<br />

Ei steht <strong>für</strong> die Zahlen, die mit der Ziffer i beginnen. Offenbar ist nun [0, ∞) = �<br />

i=1,...,9 Ei .<br />

Sei nun z eine Zahl in [0, ∞), betrachtet als Zufallszahl. Was ist die Wahrscheinlichkeit,<br />

dass z zu einer der Mengen Ei gehört?<br />

z ∈ Ei ⇐⇒ es gibt ein k ∈ Z mit z ∈ [i10 k , (i + 1)10 k )<br />

⇐⇒ es gibt ein k ∈ Z mit log(z) ∈ [log(i10 k ), log((i + 1)10 k ))<br />

⇐⇒ es gibt ein k ∈ Z mit 〈log(z)〉 ∈ [〈log(i10 k )〉, 〈log((i + 1)10 k ))〉<br />

⇐⇒ es gibt ein k ∈ Z mit 〈log(z)〉 ∈ [log(i10 k ), log((i + 1)10 k ))<br />

Mit Hilfe der Gleichverteilung der Mantissen der Logarithmen (siehe Mantissengesetz)<br />

erhalten wir:<br />

Ws(z ∈ Ei) = Ws(log(z) ∈ [log(i), log(i + 1)))<br />

� �<br />

1 + i<br />

= log(i + 1) − log(i) = log<br />

i<br />

�<br />

= log 1 + 1<br />

�<br />

i<br />

Bei dieser Formel steht “Ws(z ∈ Ei)“ <strong>für</strong> die Wahrscheinlichkeit, mit welcher das Ereignis<br />

“z ∈ Ei“ eintritt. Damit lässt sich die Verteilung nach Benford errechnen. Mit Hilfe der<br />

Funktionalgleichung des Logarithmus (10) erhalten wir<br />

9�<br />

log<br />

i=1<br />

�<br />

1 + 1<br />

�<br />

i<br />

<strong>und</strong> es ist klar, dass die Zahlen<br />

�<br />

2 3 4 5 6 7 8 9<br />

= log<br />

1 2 3 4 5 6 7 8<br />

pi := log<br />

10<br />

9<br />

�<br />

= log<br />

�<br />

1 + 1<br />

�<br />

, i = 1, . . . , 9,<br />

i<br />

� �<br />

10<br />

= 1<br />

1<br />

als Wahrscheinlichkeiten betrachtet wer<strong>den</strong> können, <strong>den</strong>n offenbar sind alle Zahlen pi auch<br />

positiv.<br />

Die Formel<br />

�<br />

Ws(z ∈ Ei) = log 1 + 1<br />

�<br />

i<br />

heißt Benfordsches Gesetz über die erste Ziffer. In der Abbildung 16 sind die Häufigkeiten<br />

<strong>und</strong> die Wahrscheinlichkeiten <strong>für</strong> die Ziffern aufgelistet.<br />

Um zu verifizieren, dass eine bestimmte Folge nicht Benford-verteilt ist, ist folgender<br />

Satz nützlich. 32<br />

32 Mit dem Symbol lim supn bezeichnen wir <strong>den</strong> größten Häufungspunkt einer Zahlenfolge. Dazu schaut<br />

man sich alle konvergenten Teilfolgen der betreffen<strong>den</strong> Zahlenfolge an <strong>und</strong> wählt die konvergente Teilfolge<br />

mit dem größten Grenzwert aus; dieser Grenzwert ist dann lim sup n.<br />

Stand: 21. November 2011 44 ○c J. Baumeister, T.G. Macedo<br />

(20)


Satz 5.8 Ist die Zahlenfolge (an)n∈N Benford-verteilt, so gilt<br />

� � ��<br />

an+1<br />

lim sup n log = ∞<br />

n<br />

Den Beweis findet man in [26].<br />

an<br />

5.4 Anwendung: Benford <strong>und</strong> Betrüger<br />

Mit Satz 5.8 lässt sich ableiten, dass folgende Folgen nicht Benford-verteilt sind:<br />

• n b <strong>für</strong> beliebiges reelles b<br />

• Arithmetische Folgen beliebiger Ordnung<br />

• log b n <strong>für</strong> beliebiges reelles b > 1<br />

• Primzahlfolge (pn)n∈N<br />

• (log b pn)n∈N <strong>für</strong> beliebiges reelles b > 1<br />

Beispielsweise lässt sich dies <strong>für</strong> die Folge an := n leicht überprüfen:<br />

� � ��<br />

an+1<br />

lim sup n log<br />

n<br />

an<br />

=<br />

� � ��<br />

n + 1<br />

lim sup n log<br />

n<br />

n<br />

= lim sup (n(log(n + 1) − log(n)))<br />

n<br />

= lim sup (n log(n + 1) − n log(n))<br />

n<br />

Da n log(n + 1) <strong>und</strong> n log(n) <strong>für</strong> genügend großes n ” fast <strong>den</strong> selben Wert“ annehmen,<br />

wird der Grenzwert Null; siehe nun Satz 5.8.<br />

Für die Folge (n 2 )n∈N lässt sich ähnlich schnell zeigen, dass<br />

lim sup<br />

n<br />

�<br />

n log<br />

� �� 2 (n + 1)<br />

= 0<br />

gilt, womit auch diese Folge nicht Benford-verteilt ist.<br />

Als weiteres Beispiel betrachten wir die Folge an := log(n) := log10(n) . Sie ist nicht<br />

Benford-verteilt wegen<br />

lim sup<br />

n<br />

�<br />

n log<br />

� an+1<br />

an<br />

��<br />

5.4 Anwendung: Benford <strong>und</strong> Betrüger<br />

n 2<br />

� � ��<br />

log(n + 1)<br />

= lim sup n log<br />

n<br />

log(n)<br />

= lim sup (n(log(log(n + 1)) − log(log(n))))<br />

n<br />

�= ∞<br />

Hier wollen wir einige Anwendungen der Benford-Verteilung anführen. Der Ansatz bei <strong>den</strong><br />

Anwendungen ist, in Zahlenmaterial, dem unterstellt wird, dass es der Benford-Verteilung<br />

folgt, Abweichungen von der Benford-Verteilung zu erkennen <strong>und</strong> diese als (bewusste)<br />

Fälschung des Zahlenmaterials auszuweisen. Man hüte sich aber vor Schnellschüssen! Starke<br />

Abweichungen fallen schnell auf, geringere können auch auf <strong>den</strong> Zufall zurückzuführen<br />

sein; man spricht von Fehlern erster (echte Daten wirken manipuliert) <strong>und</strong> zweiter Art<br />

(manipulierte Daten wirken echt).<br />

Stand: 21. November 2011 45 ○c J. Baumeister, T.G. Macedo


Gefälschte Steuererklärungen<br />

5.4 Anwendung: Benford <strong>und</strong> Betrüger<br />

Es gibt Hinweise, dass Teile des Zahlenmaterials in einer Steuererklärung nach Benford<br />

verteilt sein sollte; siehe [WeG10]. Die Spiegel-Schlagzeile<br />

Ein kurioses Gesetz der Wahrscheinlichkeitstheorie kann Finanzbeamten helfen,<br />

Steuersünder aufzuspüren<br />

aus dem Jahre 1998 33 befasst sich mit dem Benford-Gesetz hinsichtlich der Möglichkeit,<br />

Fälschern von Steuererklärungen auf die Schliche zu kommen.<br />

M.J. Nigrini in [63] setzte diesen Ansatz in die Tat um. Er schrieb ein (einfaches)<br />

Computer-Programm, mit dem man große Zahlenmengen auf die Gültigkeit des Benfordschen<br />

Gesetzes analysieren kann. Seine Idee war: wenn Zahlen in der Buchhaltung eines<br />

Betriebs oder in einer Steuererklärung von der Benford-Verteilung (statistisch) signifikant<br />

abweichen, könnten dahinter eventuell betrügerische Absichten stecken. Erste Untersuchungen<br />

seinerseits bestätigten die Vermutung: korrekte Steuererklärungen genügen der<br />

Benford-Verteilung während betrügerische deutlich davon abweichen. Das von Nigrini entwickelte<br />

Verfahren wird mittlerweile von mehreren Steuerbehör<strong>den</strong> erfolgreich eingesetzt.<br />

Gefälschte wissenschaftliche Publikationen<br />

Benford’s Beobachtung kann man sich auch im Kleinen nutzbar machen, nämlich bei einer<br />

Methode in der Medizin/Mikrobiologie, die mit der Darstellung von Forschungsergebnisse<br />

mit Hilfe von graphischen ” Klecksen“, so genannten Protein-Klecksen arbeitet. Diese<br />

Methode wird ” Blotting“(Southern-, Western-, Northern-) genannt.<br />

Ein Fälschungsskandal in der Medizingeschichte ist verbun<strong>den</strong> mit dem Krebsforscher<br />

Friedhelm Herrmann. Eine unabhängige Untersuchungskomission untersuchte 347 Publikationen,<br />

in <strong>den</strong>en er Co-Autor war <strong>und</strong> stellte fest, dass 94 davon manipulierte Daten<br />

enthielten. In Laborversuchen ermittelte Protein-Klecksen sind in ihrer Größe Benfordverteilt.<br />

Stellt man also in Publikationen fest, dass die veröffentlichten Protein-Kleckse<br />

nicht nach Benford verteilt sind, geht man von gefälschten Daten aus. Diese Untersuchung<br />

wurde angestellt <strong>und</strong> nach der Untersuchung der Verteilungen aus der Herrmann<strong>und</strong><br />

einer Kontrollgruppe konnte man behaupten, dass der Verdacht groß ist, dass die<br />

Flächen von Northern Blots Benford-verteilt sind. Die Verteilung der Hermann-Gruppe<br />

hat eine etwas geringere Übereinstimmung mit der Benfordverteilung. Der Unterschied<br />

ist jedoch nicht so bedeutend, dass man nur anhand dieser Unstimmigkeit <strong>den</strong> Verdacht<br />

von Manipulation erheben könnte. Es ist auch zu bemerken, dass man keine Rückschlüsse<br />

auf einzelne Publikationen machen kann, da man <strong>für</strong> das Aufstellen einer Verteilung eine<br />

größere Datenmenge braucht; siehe [28] <strong>und</strong> [79]. Im übrigen ist man dabei frei, welche<br />

Ziffernhäufigkeit man verwen<strong>den</strong> will. Es gibt Indizien, dass die Analyse der Verteilung<br />

der zweiten Ziffer erfolgversprechender ist, als die der ersten Ziffer; siehe [28].<br />

Gefälschte Wahlergebnisse<br />

Es sind seit <strong>den</strong> Präsi<strong>den</strong>tschaftswahlen im Iran 2009 Analysen angestellt wor<strong>den</strong>, ob<br />

es Hinweise gibt, dass die Ergebnisse gefälscht sind. Als Ansatz <strong>für</strong> die Untersuchungen<br />

wurde auch das Benfordsche Gesetz herangezogen.<br />

Zur Wahl stan<strong>den</strong> vier Kandidaten: Ahmadinedschad, Moussawi, Karroubi, Rezai. Insgesamt<br />

beteiligten sich knapp 40 Mio. Wähler, die sich auf 366 verschie<strong>den</strong>e Wahlbezirke<br />

aufteilten. Die Anzahl der abgegebenen Stimmen in <strong>den</strong> einzelnen Wahlbezirken schwankt<br />

zwischen <strong>den</strong> Größenordnungen 10 3 <strong>und</strong> 10 6 . Auch die Stimmzahlen <strong>für</strong> die einzelnen<br />

33 16. 11. 1998, siehe http://www.spiegel.de/spiegel/print/d-8032391.html<br />

Stand: 21. November 2011 46 ○c J. Baumeister, T.G. Macedo


5.5 Benford bei dynamischen Systemen<br />

Kandidaten sind ungefähr über drei Größenordnungen verteilt. Es kann daher davon ausgegangen<br />

wer<strong>den</strong>, dass alle Daten, die untersucht wer<strong>den</strong> sollen, über einen genügend<br />

großen Bereich streuen, so dass eine aussagekräftige Benford-Analyse durchgeführt wer<strong>den</strong><br />

kann. In [70] <strong>und</strong> [WeG10] kommt die Benford-Analyse der Daten zum Schluss, dass<br />

eine Manipulation der Wahlergebnisse sehr naheliegend ist.<br />

In [22] wer<strong>den</strong> Überlegungen angestellt, inwieweit die Wahlen zum Deutschen B<strong>und</strong>estag<br />

unter der Annahme, dass Wahlergebnisse, genauer die Voten <strong>für</strong> die Parteien bzw.<br />

Kandidaten, dem Benford-Gesetz folgen sollten, Auffälligkeiten zeigen.<br />

Gefälschte Statistiken<br />

Über eine weitere Wahrnehmung der Benford-Verteilung wird in der Frankfurter Allgemeinen<br />

Sonntagszeitung am 18. 9. 2011 unter dem Titel ” Zahlen mit Frisur“ berichtet. Hier<br />

steht die Untersuchung der Piigs–Staaten (Portugal, Italien, Irland, Griechenland, Spanien)<br />

hinsichtlich der Haushaltsdaten, die 1999 bis 2009 an die EU übermittelt wur<strong>den</strong>, mit<br />

Hilfe der Benford-Analyse im Vordergr<strong>und</strong>. Die neue Veröffentlichung dieser Daten der 27<br />

EU-Staaten hat nach einer Analyse, inwieweit die Zahlen dem Benford-Gesetz genügen,<br />

zu einem Ranking geführt, mit teilweise überraschen<strong>den</strong> Ergebnissen. In das Bild der<br />

aktuellen Diskussion passt, dass Griechenland hier <strong>den</strong> letzten Platz einnimmt bei allen<br />

unterschiedlichen Aufbereitungen der Daten. Man sollte aber vorsichtig sein: das Ranking<br />

kann nur der Ausgangspunkt <strong>für</strong> weitere Untersuchungen sein.<br />

5.5 Benford bei dynamischen Systemen<br />

Da das Konzept ” Dynamische Systeme“ viele Fragen in diesem Aufsatz berührt, wollen<br />

wir die Benford-Analyse bei dynamischen Systemen skizzieren. Da wir mit dynamischen<br />

Systemen u.a. das Wachsen/Schrumpfen von Population beschreiben können, ist es nicht<br />

verw<strong>und</strong>erlich, dass es hier auch positive Bef<strong>und</strong>e <strong>für</strong> das Vorliegen der Benford-Verteilung<br />

gibt.<br />

Unter einem (deterministischen) dynamischen System versteht man das mathematische<br />

Modell eines zeitabhängigen Prozesses. 34 Sie fin<strong>den</strong> vielfältige Anwendungen auf<br />

Prozesse im Alltag <strong>und</strong> erlauben Einblicke in viele Bereiche nicht nur der <strong>Mathematik</strong>,<br />

sondern auch der Physik oder der theoretischen Biologie. Man unterscheidet zwischen<br />

diskreter <strong>und</strong> kontinuierlicher Zeitentwicklung. Bei einem diskreten dynamischen System<br />

ändern sich die Zustände in äquidistanten Zeitsprüngen, d.h. in auf einander folgen<strong>den</strong>,<br />

stets gleich großen zeitlichen Abstän<strong>den</strong>, während die Zustandsänderungen eines kontinuierlichen<br />

dynamischen Systems in infinitesimal kleinen Zeitschritten stattfin<strong>den</strong>. Wichtigste<br />

Beispiele <strong>für</strong> kontinuierliche dynamische Systeme ergeben sich im Zusammenhang<br />

mit gewöhnlichen Differentialgleichungen.<br />

Starten wir mit einer konkreten Situation. Die Entwicklung einer Spareinlage von Jahr<br />

zu Jahr bei Verzinsung jeweils am Jahresende zu einem festen Zinssatz r > 0 lässt sich<br />

einfach verfolgen: Ist x das Kapital am Beginn des Jahres n, so ist y := x+x·r das Kapital<br />

am Beginn des Jahres n + 1. Also haben wir <strong>für</strong> die Kapitalentwicklung vom Jahre n = 0<br />

an folgende Iterationsvorschrift<br />

xn+1 = (1 + r)xn , n ∈ N0 , d.h. xn = (1 + r) n x0 , n ∈ N.<br />

34 Der Begriff des dynamischen Systems geht in seiner heutigen Form auf <strong>den</strong> <strong>Mathematik</strong>er George<br />

David Birkhoff, 1884-1944, zurück.<br />

Stand: 21. November 2011 47 ○c J. Baumeister, T.G. Macedo


Eine Verdopplung des Kapitals beobachtet man nach etwa<br />

n := ln(2)<br />

ln(1 + r)<br />

5.5 Benford bei dynamischen Systemen<br />

Jahren. Nun könnte man auf die ” sozialistische“ Idee kommen, <strong>den</strong> Zinssatz abhängig von<br />

der Kapitalhöhe zu gestalten, um das unbegrenzte Wachstum zu unterbin<strong>den</strong>. Ein Ansatz<br />

<strong>für</strong> einen kapitalabhängigen Zinssatz ist<br />

r = r(x) := (1 − x<br />

K )r0.<br />

Hier ist r0 der Zinssatz, mit dem kleine Guthaben verzinst wer<strong>den</strong> <strong>und</strong> K das Guthaben,<br />

bei dem der Zinssatz auf Null gesunken ist; <strong>für</strong> Guthaben oberhalb von K wür<strong>den</strong> negative<br />

Zinsen erhoben. Mit diesem Ansatz erhalten wir folgende Iterationsvorschrift<br />

xn+1 = xn + (1 − xn<br />

K )r0xn , d.h. xn+1 = (1 + r0)xn − r0<br />

K x2 n , n ∈ N0. (21)<br />

Der Zinssatz r0 <strong>für</strong> Kleinguthaben ist nun noch (frei) zu wählen.<br />

Die Iterationsvorschrift (21) fin<strong>den</strong> wir auch in der Populationskinetik. Dort steht<br />

xn <strong>für</strong> die Populationsgröße einer Spezies in Biomasse (Hase, Fisch, . . . ) zu Beginn eines<br />

Zeitabschnitts n (Jahr, Monat, . . . ); wir normieren eine solchen Zeitabschnitt auf 1. Dann<br />

läßt sich die Vorschrift (21) so interpretieren: Die relative Zuwachsrate<br />

xn+1 − xn<br />

xn<br />

= r0 − r0<br />

K xn<br />

ist abhängig von der Populationsgröße: sie ist nahezu konstant <strong>für</strong> kleine Populationsgrößen,<br />

sie nimmt ab <strong>für</strong> wachsende Populationsgrößen. Diese Abnahme der Zuwachsrate<br />

wird motiviert durch ” sozialen Druck“, dem eine Überpopulation ausgesetzt ist.<br />

Die Iteration (21) verrät schon (fast) alles, was bei allgemeinen Iterationen passieren<br />

kann. Wir betrachten die Iterationsvorschrift<br />

xn+1 := ga(xn) , n ∈ N0, wobei ga(x) := ax(1 − x) , x ∈ [0, 1],<br />

die sogenannte logistische Funktion ist. Die Umrechnung der obigen konkreten Situation<br />

in unsere nun schlankere Form ist so möglich, dass ein Rückschluss auf unser Verzinsungsproblem<br />

möglich ist. Nun haben wir zwei Größen in unserer Iteration, die noch<br />

offen sind: der Parameter a ≥ 0 <strong>und</strong> der Startwert x0 ∈ [0, 1] . Das Intervall [0, 1] ist in<br />

Korrespon<strong>den</strong>z zum Guthabenintervall [0, K] . Da ga nur dann [0, 1] nach [0, 1] abbildet,<br />

wenn a ≤ 4 ist, betrachten wir also nur das Parameterintervall [0, 4].<br />

Für die Betrachtung allgemeiner Iterationen benötigen wir einen Betrachtungsrahmen,<br />

Begriffe <strong>und</strong> Resultate. Dies gelingt durch die Einbeziehung des metrischen Raums.<br />

Rahmen: Sei (X, d) ein vollständiger metrischer Raum 35 <strong>und</strong> sei f : X −→<br />

X die Abbildung, deren Iterierte wir betrachten wollen.<br />

Bezeichnung: Wir verwen<strong>den</strong> die Schreibweise 36<br />

Vereinbarung: f ist stetig.<br />

f ◦0 := id , f ◦1 := f ; f ◦(n+1) := f ◦ f ◦n , n ∈ N .<br />

35 Ein metrischer Raum ist eine Menge von Punkten, in der der Abstand der Punkte untereinander mit<br />

einer so genannten Metrik gemessen wer<strong>den</strong> kann. Damit sind dann Cauchyfolgen, Konvergenz, Grenzwert<br />

in einer zu <strong>den</strong> reellen Zahlen analogen Weise erklärt. Vollständigkeit stellt sicher, dass Cauchyfolgen<br />

konvergieren.<br />

36 Mit f ◦ g bezeichnen wir die Abbildung, die die Hintereinanderausführung von f, g beschreibt: zuerst<br />

g dann f.<br />

Stand: 21. November 2011 48 ○c J. Baumeister, T.G. Macedo


5.5 Benford bei dynamischen Systemen<br />

Definition 5.9 Eine Folge (f ◦n (x 0 ))n∈N0 heisst Orbit mit Startpunkt x0 ∈ X . �<br />

Um die ” Konvergenzeigenschaften“ eines Orbits geht es nun. Interessante Punkte x ∗<br />

sind:<br />

• Fixpunkte: der Orbit (f ◦n (x ∗ ))n∈N0 ist konstant, d.h. x ∗ bleibt fix.<br />

• Periodische Punkte; siehe unten.<br />

• Anziehende Punkte. Dies sind Punkte xâ o , die alle Punkte x 0 aus einer Umgebung<br />

von x ∗ anziehen: lim n f ◦n (x 0 ) = x ∗ . Ist f hinreichend gutartig (stetig!), dann ist<br />

jeder anziehende Punkt ein Fixpunkt.<br />

Definition 5.10<br />

a) x ∗ ∈ X heisst periodischer Punkt genau dann, wenn es N ∈ N gibt mit<br />

N heisst Periode von x ∗ .<br />

f ◦n (x ∗ ) �= x ∗ , 1 ≤ n ≤ N − 1 , f ◦N (x ∗ ) = x ∗ .<br />

b) Ein Orbit (f ◦n (x0))n∈N0 heisst periodisch mit Periode N, wenn es k ∈ N gibt, so<br />

dass x ∗ := f ◦k (x0) ein periodischer Punkt mit Periode N ist.<br />

Wir betrachten als erstes die Iteration<br />

der Modulo–Abbildung<br />

xn+1 := M(xn) , n ∈ N0 ,<br />

M : [0, 1] −→ [0, 1] , M(x) :=<br />

� 2x, x ∈ [0, 1/2),<br />

2x − 1, x ∈ [1/2, 1],<br />

�<br />

; (22)<br />

siehe Abbildung 17. Diese Abbildung ist nicht injektiv <strong>und</strong> bei x = 0.5 ” unstetig“. Ferner<br />

sind folgende Eigenschaften unmittelbar klar:<br />

(a) M hat genau zwei Fixpunkte, nämlich x ∗ = 0 <strong>und</strong> x ∗ = 1.<br />

(b) M ◦N hat genau 2 N Fixpunkte. Davon bil<strong>den</strong> einige echte Orbits der Period N, die<br />

anderen gehören zu niedrigeren Perio<strong>den</strong>.<br />

(c) Da M die Ableitung 2 <strong>für</strong> alle x ∈ [0, 1]\{ 1}<br />

hat, ist kein Fixpunkt anziehend.<br />

2<br />

Die Wirkung der Abbildung lässt sich besser verstehen, wenn wir ein x ∈ [0, 1] in Dualdarstellung<br />

schreiben:<br />

∞�<br />

x = 0, a1a2a3 . . . oder x = ai2 −i , ai ∈ {0, 1}.<br />

Die Iteration bewirkt dann ein Streichen der ersten Ziffer <strong>und</strong> anschließende Linksverschiebung<br />

um eine Stelle; die Modulo–Abbildung wird daher auch Bernoulli–Verschiebung<br />

(Bernoulli–shift) genannt. Wir können sofort erkennen: Zahlen x, deren Dualdarstellung<br />

periodisch ist mit der Periode N gehören zu Orbits der Periode N . Startpunkte,<br />

deren Dualdarstellung ab einer gewissen Stelle periodisch ist, wer<strong>den</strong> von periodischen<br />

Orbits ” angezogen“. Damit ist uns erst das Schicksal der rationalen Punkte bekannt. So<br />

gibt es genau einen Orbit der Periode 2, der aus <strong>den</strong> Punkten<br />

i=1<br />

x1 = 0, 0101 · · · = 1<br />

3 , x2 = 0, 1010 · · · = 2<br />

3<br />

Stand: 21. November 2011 49 ○c J. Baumeister, T.G. Macedo


esteht <strong>und</strong> z.B. von x = 0, 011101010 . . .<br />

nach drei Iterationen erreicht wird. Was geschieht<br />

aber mit der überwiegen<strong>den</strong> Mehrheit<br />

aller Punkte, nämlich <strong>den</strong> irrationalen Zahlen,<br />

die durch nichtperiodische Dualbrüche<br />

dargestellt wer<strong>den</strong>? Es lässt sich zeigen, dass<br />

fast alle – ” fast“ wollen wir hier nicht<br />

näher erläutern – irrationalen Zahlen in ihrer<br />

Dualdarstellung jede endliche Folge von<br />

Ziffern unendlich oft enthalten. Jede ” typische“<br />

Trajektorie irrt also fortwährend durch<br />

das gesamte Intervall [0, 1] mit einer relativen<br />

Häufigkeit, die asymptotisch zur Gleichverteilung<br />

wird. Dies bedeutet, dass<br />

lim k<br />

1<br />

k<br />

k�<br />

χ[a,b](M ◦i (x0)) = b − a<br />

i=1<br />

5.5 Benford bei dynamischen Systemen<br />

1<br />

Abbildung 17: Die Modulo–Abbildung<br />

ist <strong>für</strong> jedes Intervall [a, b] ⊂ [0, 1] <strong>und</strong> es besagt, dass ein Orbit sich im Intervall [a, b] im<br />

Mittel so oft aufhält, wie die Länge b − a uns nahelegt.<br />

Die obige Iteration wird von einer Funktion ” gesteuert“, die nicht stetig ist. Das seltsame<br />

Verhalten der Iteration hängt aber nicht von dieser Tatsache ab, wie die Iteration<br />

xn+1 := Z(xn) , n ∈ N0 ,<br />

mit der sogenannten Zeltdach–Abbildung<br />

�<br />

2x , falls x ∈ [0, 1/2),<br />

Z : [0, 1] −→ [0, 1] , Z(x) :=<br />

2 − 2x , falls x ∈ [1/2, 1],<br />

zeigen kann; siehe Abbildung 18. Hier folgt aus der Dualdarstellung x = 0, a0a1a3 . . . von<br />

x offenbar<br />

�<br />

0, a2a3a4 . . .<br />

Z(x) =<br />

0, a2a3a4 . . .<br />

<strong>für</strong><br />

<strong>für</strong><br />

a1 = 0,<br />

a1 = 1,<br />

, (23)<br />

so dass Z eine Bernoulli–Verschiebung <strong>und</strong> <strong>für</strong> a1 = 1 eine anschließende Komplementierung<br />

aller Ziffern bewirkt. Die Komplementierung sieht so aus: 0 := 1, 1 := 0 .<br />

Die <strong>für</strong> die Modulo–Abbildung getroffenen Aussagen bleiben fast wörtlich bestehen: Es<br />

gibt zwei Fixpunkte (hier: x∗ = 0 <strong>und</strong> x∗ = 2 3<br />

) <strong>und</strong> endlich viele Orbits der Periode N .<br />

Alle rationalen Zahlen gehören zu Orbits der Periode N = 1, 2, . . . oder wer<strong>den</strong> von diesen<br />

angezogen. Jeder typische Orbit, d.h. ein Orbit mit irrationalem Anfangswert, besucht in<br />

unregelmäßiger Folge das gesamte Intervall [0, 1] gleichmäßig.<br />

Eine wichtige Begriffsbildung bei dynamischen Systemen ist die der Sensitivität. Poncaré<br />

formuliert:<br />

Eine sehr kleine Ursache, die wir nicht bemerken, bewirkt einen beachtlichen<br />

Effekt, <strong>den</strong> wir nicht übersehen können, <strong>und</strong> dann sagen wir, der Effekt sei<br />

zufällig. Wenn die Naturgesetze <strong>und</strong> der Zustand des Universums zum Anfangszeitpunkt<br />

exakt bekannt wären, könnten wir <strong>den</strong> Zustand dieses Universums<br />

zu einem späteren Moment exakt bestimmen. Aber selbst wenn es kein<br />

Geheimnis in <strong>den</strong> Naturgesetzen mehr gäbe, so könnten wir die Anfangsbedingungen<br />

doch nur annähernd bestimmen. Wenn uns dies ermöglichen würde,<br />

Stand: 21. November 2011 50 ○c J. Baumeister, T.G. Macedo<br />

1


5.5 Benford bei dynamischen Systemen<br />

die spätere Situation in der gleichen Näherung vorherzusagen, so wür<strong>den</strong> wir<br />

sagen, dass das Phänomen vorhergesagt wor<strong>den</strong> ist, <strong>und</strong> dass es Gesetzmäßigkeiten<br />

folgt. Aber es ist nicht immer so; es kann vorkommen, dass kleine Abweichungen<br />

in <strong>den</strong> Anfangsbedingungen schließlich große Unterschiede in <strong>den</strong><br />

Phänomenen erzeugen. Ein kleiner Fehler zu Anfang wird später einen großen<br />

Fehler zur Folge haben. Vorhersagen wer<strong>den</strong> unmöglich, <strong>und</strong> wir haben ein<br />

zufälliges Ereignis.<br />

In dieser Aussage geht es um die Sensitivität eines Systems <strong>und</strong> damit um die Unmöglichkeit<br />

einer Vorhersage. Unter Sensitivität versteht man kurzum inwiefern kleine Änderungen<br />

bei <strong>den</strong> Anfangsbedingungen das Endergebnis beeinflussen: je stärker dies der Fall ist, desto<br />

höher ist die Sensitivität. Das Prinzip der starken Kausalität ist nicht mehr anwendbar.<br />

Schon bei einfachen Systemen, z.B. dem Werfen eines Würfels kann dies beobachtet<br />

wer<strong>den</strong>: die gewürfelte Augenzahl ist trotz der theoretisch möglichen Vorhersagbarkeit<br />

chaotisch, d.h. zufällig. Siehe hierzu auch Abschnitt 2.5.<br />

Kommen wir nun zur Benford-Aanalysis.<br />

Aus der doch beträchtlichen Anzahl von Ergebnissen<br />

stellen wir ein Ergebnis aus [14] vor.<br />

Es handelt von einem Spezialfall eines dynamischen<br />

Systems, nämlich von der Iteration<br />

x n+1 := αx n (1 − f(x n )) , n ∈ N, (24)<br />

mit einem Startwert x 0 . Hierbei ist α > 0<br />

ein reeller Parameter <strong>und</strong> f eine Abbildung<br />

der reellen Zahlen in sich mit f(0) = 0 . Die<br />

Grö¨se des Parameters α spielt offenbar eine<br />

Rolle <strong>für</strong> das Verhalten des entstehen<strong>den</strong> Orbits<br />

(x n )n∈N . Welche Punkte x ∗ kommen als<br />

(anziehende) Fixpunkte in Frage? Sicherlich<br />

folgende drei Punkte:<br />

x ∗ = 0 , x ∗ mit 1 = f(x ∗ ) , x ∗ = ∞ .<br />

1<br />

Abbildung 18: Die Zeltdach–Abbildung<br />

Wir betrachten <strong>den</strong> Fall, dass x ∗ = 0 ein anziehender Fixpunkt des Orbits ist.<br />

Satz 5.11 Sei die Abbildung f in (24) hinreichend gutartig. 37 Ist dann 0 ein anziehender<br />

Fixpunkt, so ist der durch (24) beschriebene Orbit Benford-verteilt <strong>für</strong> alle Startwerte x 0 ,<br />

die nahe dem Fixpunkt 0 sind, genau dann wenn log(α) irrational ist.<br />

Bibliographische Anmerkungen<br />

Die Zahlenkuriosität wurde erstmals entdeckt von S. Newcomb [61]. Neu entdeckt wurde<br />

sie von F. Benford [7], von dem nun diese Beobachtung ihren Namen hat. Nahe am Thema<br />

ist ein Artikel von Poincaré; siehe [69].<br />

Eine sehr schöne Darstellung stellt die Ausarbeitung [43] von H. Hungerbühler zum<br />

Thema der Benford-Zahlen dar. Eine Erläuterung zur Erklärung des Zahlenphänomens<br />

findet man in [13, 31]. Der Artikel [12] arbeitet das Thema mathematisch systematisch auf.<br />

Eine vollständige Bibliographie findet man unter [Ber11]. Hervorzuheben sind [42, 45, 68]<br />

37 Dies bedeutet, etwas vage ausgedrückt, dass f eine Abbildung ist, die hinreichend gut durch einfache<br />

Polynome approximiert wer<strong>den</strong> kann.<br />

Stand: 21. November 2011 51 ○c J. Baumeister, T.G. Macedo<br />

1


5.5 Benford bei dynamischen Systemen<br />

<strong>und</strong> [Ric10,Sch03]. Kernpunkt einer Analyse ist es, einen geeigneten wahscheinlichkeitstheoretischen<br />

Rahmen aufzubauen. Der Zusammenhang mit der Gleichverteilung mod 1<br />

wird in [26] diskutiert; siehe auch [50, 54, 85].<br />

Fellers klassische Monographie An Introduction to Probability Theory and its Applications<br />

(siehe [30]) enthält auch eine ” Ableitung“ des Benford-Gesetzes. Darin wird eine<br />

hinreichende Bedingung da<strong>für</strong> gegeben, dass eine Zufallsvariable X approximativ verteilt<br />

nach Benford ist. In [11] findet sich eine ausführliche Diskussion über die zweifelhafte<br />

Argumentation <strong>und</strong> eine Richtigstellung.<br />

Die Benford-Verteilung ist die einzige Verteilung der Mantissen, die Basis-unabhängig<br />

ist; siehe [40]. Dies bedeutet, dass ein Datensatz, der dem Benfordschen Gesetz genügt,<br />

wenn er dargestellt ist mit einer Basis b1, auch dem Benfordschen Gesetz genügt, wenn<br />

er zur Basis b2 dargestellt wird.<br />

Dynamische Systeme wer<strong>den</strong> untersucht etwa in [56, 83]. Eine Analyse der Orbits von<br />

dynamischen Systemen hinsichtlich der Benford-Verteilung findet sich in [14, 9, 8, 84].<br />

Das Newtonverfahren wird auf die Gültigkeit des Benford-Gesetzes untersucht in [10].<br />

Die Benford-Verteilung bei Markov-Ketten wird in [46] diskutiert.<br />

Zu Anwendungen des Benford-Gesetzes siehe [FAZ11],[22, 27, 57, 63, 70, 73, 78].<br />

Stand: 21. November 2011 52 ○c J. Baumeister, T.G. Macedo


6 Elementare Arithmetik<br />

A lady of 80 named Gertie<br />

Had a boyfriend of 60 named Bertie<br />

She told him emphatically<br />

That viewed mathematically<br />

By modulus 50 she’s 30<br />

Limerik of J.W. McClellan<br />

Arithmetik ist das Teilgebiet der <strong>Mathematik</strong>, welches auch als Synonym zum Begriff<br />

Zahlentheorie verstan<strong>den</strong> wer<strong>den</strong> kann. Elementare Arithmetik bezeichnet allgemein das<br />

Rechnen mit natürlichen Zahlen <strong>und</strong> ganzen Zahlen <strong>und</strong> die Untersuchung der Konsequenzen,<br />

die sich daraus ergeben, dass die Division in <strong>den</strong> ganzen Zahlen nur eingeschränkt<br />

möglich ist. Weiterhin wird eine Einführung zu Primzahlen, Teilbarkeit <strong>und</strong> modularem<br />

Rechnen gegeben, Hilfsmittel, die <strong>für</strong> die linearen Kongruenzgeneratoren benötigt wer<strong>den</strong>.<br />

Diese Kapitel ist mathematisch am weitesten ausgeführt.<br />

6.1 Ganze Zahlen, Teilbarkeit, Primzahlen<br />

Hier deuten wir die Begriffe an, in <strong>den</strong>en Arithmetik betrieben wird. Die ganzen Zahlen<br />

(Z) <strong>und</strong> natürlichen Zahlen (N bzw. N0 := N\{0}) rufen wir ins ” Leben“ durch<br />

Es gibt Mengen N, Z , ein Element 0 ∈ Z, Abbildungen<br />

Z × Z ∋ (a, b) ↦−→ a + b ∈ Z, (Addition)<br />

Z × Z ∋ (a, b) ↦−→ a · b ∈ Z, (Multiplikation)<br />

<strong>und</strong> eine Vergleichsoperation ≤ mit folgen<strong>den</strong> Eigenschaften:<br />

1. (a + b) + c = a + (b + c) <strong>für</strong> alle a, b, c ∈ Z . (Assoziativgesetz)<br />

2. a + 0 = 0 + a <strong>für</strong> alle a ∈ Z . (0 ist neutrales Element)<br />

3. Zu a ∈ Z gibt es genau ein (−a) ∈ Z mit<br />

(a + (−a)) = 0 = ((−a) + a) . ((−a) ist Negatives von a)<br />

4. a + b = b + a <strong>für</strong> alle a, b ∈ Z . (Kommutativgesetz)<br />

5. (a · b) · c = a · (b · c) <strong>für</strong> alle a, b, c ∈ Z . (Assoziativgesetz)<br />

6. a · b = b · a <strong>für</strong> alle a, b ∈ Z . (Kommutativgesetz)<br />

7. a · (b + c) = a · b + a · c <strong>für</strong> alle a, b, c ∈ Z . (Distributivgesetz)<br />

8. N ⊂ Z , 1 �= 0 , Z = N ∪ {0} ∪ −N .<br />

9. 1 · a = a , 0 · a = 0 <strong>für</strong> alle a ∈ Z . (1 ist neutrales Element)<br />

10. a ≤ b ⇐⇒ b + (−a) ∈ N ∪ {0} .<br />

Zur Abkürzung führen wir noch die Subtraktion durch<br />

ein, schreiben meist kurz<br />

<strong>und</strong> vereinbaren die Schreibweise<br />

Z × Z ∋ (a, b) ↦−→ a − b := a + (−b) ∈ Z<br />

ab <strong>für</strong> a · b<br />

a < b <strong>für</strong> a ≤ b, a �= b .<br />

Damit können wir nun in Z <strong>und</strong> N genauso rechnen, wie wir es gewohnt sind.<br />

Stand: 21. November 2011 53 ○c J. Baumeister, T.G. Macedo


6.1 Ganze Zahlen, Teilbarkeit, Primzahlen<br />

Wo bleibt die Division in <strong>den</strong> ganzen Zahlen? Offenbar sind ±1 die einzigen Zahlen<br />

a in Z, <strong>für</strong> die 1/a, was wir meist als a −1 schreiben, in Z existiert. Wenn man <strong>für</strong> die<br />

anderen Fälle nicht <strong>den</strong> Weg zu <strong>den</strong> rationalen Zahlen weitergehen will, muss man eine<br />

Division mit Rest einführen, was eine Beschreibung der Tatsache gleichkommt, dass<br />

die Division ganzer Zahlen nicht ” aufgeht“. Zunächst zur Teilbarkeit.<br />

Definition 6.1 Seien a, b ∈ Z. Wir sagen, dass a die Zahl b teilt, wenn es k ∈ Z gibt<br />

mit b = ka. Wir schreiben da<strong>für</strong> a|b . Ist b nicht durch a teilbar, so schreiben wir a� | b. �<br />

Srechweisen:<br />

Für a|b: a teilt b, b ist Teiler von a, a ist durch b teilbar.<br />

Für a� | b: a teilt b nicht, b ist kein Teiler von a, a ist nicht durch b teilbar.<br />

Bei Teilbarkeitsfragen in Z können wir uns in der Regel immer auf positive Teiler, d.h.<br />

auf Teiler in N, zurückziehen, da von <strong>den</strong> zwei Zahlen a, −a stets eine in N liegt, falls<br />

a �= 0 ist; der Fall a = 0 ist uninteressant. Ohne Beweis führen wir an:<br />

Folgerung 6.2 Seien a, b, c, d ∈ Z. Dann gilt:<br />

(1) a|a; a|b <strong>und</strong> b|a =⇒ a = ±b; a|b <strong>und</strong> b|c =⇒ a|c.<br />

(2) d|a <strong>und</strong> d|b =⇒ d|(ax + by) <strong>für</strong> alle x, y ∈ Z.<br />

(3) a|b <strong>und</strong> a|(b + c) =⇒ a|c.<br />

Fragt man nach gemeinsamen Teilern zweier ganzer Zahlen a, b, so interessiert insbesondere<br />

der größte dieser gemeinsamen Teiler. Dabei können wir uns dann auf positive<br />

Teiler beschränken, <strong>den</strong>n 1 ist stets ein gemeinsamer Teiler von a <strong>und</strong> b.<br />

Definition 6.3 Seien a, b ∈ Z, die nicht beide 0 sind. Eine Zahl d ∈ N heißt größter<br />

gemeinsamer Teiler von a, b genau dann, wenn<br />

(1) d|a <strong>und</strong> d|b<br />

(2) Ist d ′ ∈ N ein Teiler von a <strong>und</strong> b, so teilt d ′ auch d<br />

gilt. Wir schreiben d = ggT(a, b) . �<br />

Der größte gemeinsame Teiler d gemäß Definition 6.3 ist eindeutig bestimmt dank der<br />

Tatsache, dass wir d ∈ N gefordert haben.<br />

Es sollte klar sein, wie nun der größte gemeinsame Teiler von endlich vielen ganzen<br />

Zahlen erklärt ist. Beispiel:<br />

ggT(6, 10) = 2, ggT(ggT(6, 10), 30) = 2, ggT(6, 10, 15) = 1 .<br />

Definition 6.4 Eine Zahl p ∈ N, p �= 1, heißt Primzahl, wenn 1 <strong>und</strong> p die einzigen<br />

Teiler von p sind. �<br />

Spätestens seit Euklid kennt man die Primzahlen, die Tatsache, dass es unendlich viele<br />

Primzahlen gibt <strong>und</strong> auch die Aussage, dass eine natürliche Zahl, bis auf die Reihenfolge,<br />

eindeutig in ein Produkt von Primzahlen zerlegt wer<strong>den</strong> kann. Diese Zerlegung nennt man<br />

Primfaktorzerlegung <strong>und</strong> das Aufsuchen dieser Zerlegung eine Faktorisierung; siehe<br />

unten. Die obige Definition des größten gemeinsamen Teilers hätten wir – wie dies in der<br />

Schule meist geschieht – auch auf die Primfaktorzerlegung stützen können.<br />

Stand: 21. November 2011 54 ○c J. Baumeister, T.G. Macedo


6.2 Fibonacci-Zahlen<br />

Satz 6.5 (Primfaktorzerlegung) Jede natürliche Zahl n ≥ 2 lässt sich bis auf die<br />

Reihenfolge der Faktoren eindeutig als Produkt von Primzahlen darstellen.<br />

Den Beweis lassen wir weg, die Vorbereitungen da<strong>für</strong>, insbesondere <strong>für</strong> <strong>den</strong> Nachweis der<br />

Eindeutigkeit, liegen hier nicht vor. Die Eindeutigkeit der Primfaktorzerlegung ist ein<br />

Resultat, das wesentlich auf einer ” Kürzungsregel“ basiert. Man sollte sich hüten, die<br />

Eindeutigkeit der Primfaktorzerlegung als Selbstverständlichkeit hinzunehmen, die keines<br />

Beweises bedarf.<br />

Mitunter ist nun eine kanonische Produktschreibweise <strong>für</strong> die Primfaktorzerlegung<br />

nützlich. Wir <strong>den</strong>ken uns die Primzahlen durchnumeriert, also p1 = 1, p2 = 3, p3 = 5, . . .<br />

<strong>und</strong> schreiben jede Zahl n ∈ N so hin:<br />

n = �<br />

i∈N<br />

dabei ist αi die Vielfachheit, mit der der Primfaktor pi in der Primfaktorzerlegung vorkommt,<br />

also αi = 0, falls die Primzahl pi kein Primfaktor von n ist.<br />

Die Herstellung der Primfaktorzerlegung einer (großen) Zahl ist kein leichtes Unterfangen.<br />

Die Schwierigkeit wird u.a. dadurch beleuchtet, dass nahezu gleiche Zahlen eine<br />

sehr verschie<strong>den</strong>e Primfaktorzerlegung besitzen können:<br />

p αi<br />

i ;<br />

370273 = 43 · 79 · 109 , 370277 = 17 · 23 · 947 , 370279 = 7 · 13 · 13 · 313 .<br />

Die Aufzählung p1, p2, . . . suggeriert, dass es unendlich viele Primzahlen gibt. Hier ist<br />

der Beweis <strong>für</strong> die Tatsache, dass es unendlich viele Primzahlen gibt. 38<br />

Satz 6.6 (Unendlichkeit der Primzahlen/Euklid) Es gibt unendlich viele Primzahlen.<br />

Beweis:<br />

Annahme: Es gibt nur endlich viele Primzahlen.<br />

Seien p1, . . . , pr diese Primzahlen. Setze N := 1 + p1 · · · pr . Dann ist N ∈ N <strong>und</strong> N ≥ 2.<br />

Da N > pi <strong>für</strong> jedes i = 1, . . . , r ist, ist N keine Primzahl. Also ist N zerlegbar: N =<br />

kp, p, k ∈ N mit 1 < p < N . O.E. kann man nun annehmen, dass eine der Zahlen k, p<br />

eine Primzahl ist; sonst zerlege erneut. Sei also etwa p die Primzahl. Also kommt p unter<br />

p1, . . . , pr vor; o.E. p = p1 . Dann folgt:<br />

1 + p1p2 . . . pr = p1k .<br />

Daraus liest man nun p = p1 = 1 ab, was ein Widerspruch ist. �<br />

Das kleinste gemeinsame Vielfache von Zahlen a, b ∈ N ist die kleinste Zahl m ∈ N,<br />

<strong>für</strong> die a|m , b|m gilt. Kennt man die Primfaktorzerlegung von a <strong>und</strong> b, so kann man es<br />

sehr einfach ablesen.<br />

6.2 Fibonacci-Zahlen<br />

Wir kommen nun zu einer speziellen Menge von Zahlen, <strong>den</strong> so genannten Fibonacci-<br />

Zahlen. Sie wer<strong>den</strong> noch eine zweifache Rolle spielen.<br />

38 In [2] – ein Buch, dass in jedem Falle zur Lektüre eines (angehen<strong>den</strong>) <strong>Mathematik</strong>ers gehören sollte<br />

– wer<strong>den</strong> 6 Beweise <strong>für</strong> die Unendlichkeit der Primzahlen gegeben.<br />

Stand: 21. November 2011 55 ○c J. Baumeister, T.G. Macedo


6.2 Fibonacci-Zahlen<br />

Im Buch ” liber abacci“ von Leonardo von Pisa (genannt Fibonacci) 39 wird die Vermehrung<br />

eines Kaninchenpaares in folgender Weise in Abhängigkeit von der Zeit beschrieben:<br />

Ein zur Zeit t = 0 geborenes Kaninchenpaar wirft vom 2. Monat an in jedem<br />

Monat ein weiteres Paar. Die Nachkommen folgen dem Vorbild der Eltern.<br />

Alle Kaninchen überleben. Damit ergibt sich rekursiv folgende Vorschrift<br />

f0 := f1 := 1 , fn+1 := fn + fn−1 , n ∈ N .<br />

Die Zahlen fn, n ∈ N, nennt man Fibonacci–Zahlen.<br />

Sieht man ein Stück der Fibonacci-Folge an, so stellt man fest, dass sie schnell wächst:<br />

1,1,2,3,5,8,13,21,34,. . . . Es ist offensichtlich, dass die Folge monoton wachsend ist, <strong>und</strong><br />

man überzeugt sich leicht, dass sie exponentiell wächst, <strong>den</strong>n durch die Monotonie ergibt<br />

sich:<br />

fn = fn−1 + fn−2 ≤ 2fn−1 <strong>und</strong> folglich fn ≤ 2 n .<br />

fn = fn−1 + fn−2 ≥ 2fn−2 <strong>und</strong> folglich f2n ≥ 2 n−1 , fn ≥ ( √ 2) n−1 .<br />

Also wird das Wachstum beschrieben mit einer Zahl zwischen √ 2 <strong>und</strong> 2 . Man kann dieses<br />

noch viel genauer analysieren.<br />

Die Fibonacci-Zahlen haben viele schöne, interessante Eigenschaften. Darunter fügen<br />

wir die folgende an, da sie im Zusammenhang mit dem euklidischen Algorithmus von<br />

Interesse ist:<br />

ggT(fn+1, fn) = 1 <strong>für</strong> alle n ∈ N0<br />

(25)<br />

Wir beweisen diese Aussage induktiv.<br />

Für n = 1 ist die Aussage klar. Ist die Aussage richtig <strong>für</strong> die Zahl n, dann ist sie auch<br />

richtig <strong>für</strong> n + 1, <strong>den</strong>n wir haben<br />

ggT(fn+2, fn+1) = ggT(fn+1 + fn, fn+1) = ggT(fn+1, fn) = 1 .<br />

Die Fibonacci-Zahlen sind eng mit dem gol<strong>den</strong>en Schnitt verknüpft. Aus der Darstellung<br />

fn+1<br />

fn<br />

folgt, die Existenz von g := limn<br />

= fn + fn−1<br />

fn<br />

fn+1<br />

Klar, die Lösungen dieser Gleichungen sind<br />

fn<br />

= 1 + fn−1<br />

fn<br />

= 1 + 1<br />

fn<br />

fn−1<br />

vorausgesetzt, die I<strong>den</strong>tität<br />

g = 1 + 1<br />

. (26)<br />

g<br />

g± = 1<br />

2 (1 ± √ 5) .<br />

Die positive Lösung g = 1<br />

2 (1 + √ 5) heißt gol<strong>den</strong>e Schnittzahl. Sie beschreibt eine<br />

harmonische Teilung einer Strecke durch <strong>den</strong> gol<strong>den</strong>en Schnitt. Der Gol<strong>den</strong>e Schnitt findet<br />

sich in der Natur, z.B. auch in der Anatomie des Menschen. Wir betrachten das Verhältnis,<br />

39 Fibonacci, Leonardo, 1180? – 1250?<br />

Stand: 21. November 2011 56 ○c J. Baumeister, T.G. Macedo


6.3 Division mit Rest<br />

das im Arm entsteht durch die Teilung durch das Ellenbogengelenk. Ist die Länge des<br />

Unterarmes die Längeneinheit Eins <strong>und</strong> ist x die Länge des Oberarmes, so gilt:<br />

1<br />

1 + x<br />

= x<br />

1<br />

d.h. x = 1<br />

1 + x .<br />

Damit ist x die Lösung der quadratischen Gleichung<br />

Die positive Lösung davon ist<br />

x 2 + x − 1 = 0 .<br />

x = 1<br />

2 (√ 5 − 1) ≈ 0.618 .<br />

Für x + 1 ergibt sich die Schnittzahl g von oben.<br />

Ein weiteres Beispiel in der Anatomie wird von Leonardo da Vinci im Verhältnis,<br />

das der Nabel erzeugt, illustriert. Der Gol<strong>den</strong>e Schnitt findet sich auch vielfach in Gegenstän<strong>den</strong><br />

unseres Lebens (Buchformat, Verhältnisse an Bauwerken, . . . ).<br />

Eine nicht rekursive Darstellung der Fibonacci-Zahlen ist gegeben durch die Formel<br />

von Binet:<br />

fn = 1<br />

�<br />

√ g<br />

5<br />

n + 1<br />

gn �<br />

, n ∈ N . (27)<br />

Hierbei ist g := 1<br />

2 (1 + √ 5) die gol<strong>den</strong>e Schnittzahl. Den Beweis der Formel von Binet<br />

erbringt man mit vollständiger Induktion. Wie man auf die Formel von Binet kommt?<br />

Dies kann man auf dem Umweg über die Darstellung der Paare (fn+1, fn) mit Hilfe einer<br />

Matrix-Multiplikation sehen:<br />

� � � � � � � �<br />

fn+1 1 · fn + 1 · fn−1 1 1 fn<br />

=<br />

=<br />

, n ∈ N ,<br />

fn 1 · fn + 0 · fn−1 1 0 fn−1<br />

� �� �<br />

A<br />

Daraus ergibt sich mit dem n-fachen Produkt An der Matrix A<br />

� �<br />

fn+1<br />

= A n<br />

� �<br />

1<br />

, n ∈ N , (28)<br />

0<br />

fn<br />

<strong>und</strong> wir haben eine Formel <strong>für</strong> die Fibonacci-Zahlen gefun<strong>den</strong>, wenn wir das n-fache<br />

Produkt A n geschickt/geeignet/schnell ausrechnen können. Dies gelingt sogar formelmäßig<br />

über die ” Diagonalisierung“ von A . Wir müssen hier auf <strong>den</strong> Beweis verzichten; siehe [32].<br />

Je<strong>den</strong>falls lesen wir dann die Formel von Binet ab.<br />

6.3 Division mit Rest<br />

Der Division mit Rest, die wir nun vorstellen wollen, tritt uns im Alltag entgegen bei der<br />

Umrechnung von Tageszeiten in unterschiedliche Zeitskalen (Minuten, Sekun<strong>den</strong>,. . . ), bei<br />

der Berechnung von Wochentagen im Kalender, bei . . . .<br />

Satz 6.7 (Division mit Rest) Für alle a ∈ Z, b ∈ N gibt es eindeutig bestimmte Zahlen<br />

q, r ∈ Z mit<br />

a = bq + r <strong>und</strong> 0 ≤ r < b.<br />

Stand: 21. November 2011 57 ○c J. Baumeister, T.G. Macedo


6.3 Division mit Rest<br />

Beweis:<br />

Wir beweisen zunächst die Existenz von q, r <strong>für</strong> a ≥ 0 durch vollständige Induktion:<br />

a = 0 : Setze q := r := 0 .<br />

a + 1 : Ist a + 1 < b, so gilt a + 1 = 0 · b + (a + 1) <strong>und</strong> wir sind fertig. Ist a + 1 ≥ b,<br />

so folgt aus der Induktionsvoraussetzung a + 1 − b = qb + r mit q ∈ Z, 0 ≤ r < b. Also<br />

a + 1 = (q + 1)b + r.<br />

Die Existenz folgt <strong>für</strong> a < 0 aus der Anwendung der eben bewiesenen Aussage auf −a<br />

gemäß<br />

−a = q ′ b + r ′ , 0 ≤ r ′ < b<br />

durch<br />

a =<br />

� (−q ′ − 1)b + (b − r ′ ) , falls r ′ �= 0<br />

(−q ′ )b , falls r ′ = 0<br />

Um die Eindeutigkeit zu beweisen, nehmen wir ein zweites Zahlenpaar q ′ , r ′ mit<br />

a = q ′ b + r ′ , 0 ≤ r ′ < b ,<br />

wobei o. E. r ≥ r ′ sei. Dann ist offenbar 0 ≤ r − r ′ < b <strong>und</strong> r − r ′ = −(q − q ′ )b . Aus<br />

r − r ′ < b folgt −(q − q ′ ) ≤ 0, aus r − r ′ ≥ 0, folgt −(q − q ′ ) ≥ 0 . Zusammengefasst: q = q ′<br />

<strong>und</strong> daher auch r = r ′ . �<br />

Die Umrechnung von Zahlen in unterschiedlichen Stellensystemen kann mit Division<br />

mit Rest erfolgen. Sei etwa die Zahl 1234 als Zahl im Zehnersystem vorgelegt, also<br />

(1234)10 = 1 · 10 3 + 2 · 10 2 + 3 · 10 1 + 4 · 10 0 .<br />

Wir rechnen sie in das Dualsystem um gemäß<br />

1234 = 1 · 2 10 + 210<br />

= 1 · 2 10 + 0 · 2 9 + 0 · 2 8 + 1 · 2 7 + 82<br />

= 1 · 2 10 + 0 · 2 9 + 0 · 2 8 + 1 · 2 7 + 1 · 2 6 + 18<br />

= 1 · 2 10 + 0 · 2 9 + 0 · 2 8 + 1 · 2 7 + 1 · 2 6 + 0 · 2 5 + 1 · 2 4 + 0 · 2 3 + 0 · 2 2 + 1 · 2 1 + 0 · 2 0<br />

Dies bedeutet<br />

(1234)2 = 10011010010 .<br />

Van-der-Corput Folgen, wer<strong>den</strong> mit der Dualentwicklung natürlicher Zahlen erzeugt,<br />

<strong>und</strong> zwar durch Bit-Umkehr. Sei also<br />

i = (dj . . . d0)2 =<br />

die Dualdarstellung von i ∈ N . Dann heißt<br />

j�<br />

dk2 k<br />

k=0<br />

Φ2(i) := xi := (.d0 . . . dj)2 =<br />

die i-te van der Corput-Zahl. Beispielsweise sind<br />

1<br />

2<br />

, 1<br />

4<br />

, 3<br />

4<br />

, 1<br />

8<br />

5 3<br />

, ,<br />

8 8<br />

j�<br />

dk2 −k−1<br />

Stand: 21. November 2011 58 ○c J. Baumeister, T.G. Macedo<br />

k=0


6.4 Euklidischer Algorithmus<br />

die ersten 6 van der Corput-Zahlen. Klar, die Basis b = 2 lässt sich gegen jede beliebige<br />

Basiszahl b ∈ N, b ≥ 2, austauschen. 40 Alle diese van der Corput-Zahlen lassen sich algorithmisch<br />

einfach durch Division mit Rest bestimmen. Sie entsprechen also einer Liste von<br />

Zahlen, die total <strong>den</strong> Anspruch der Zufälligkeit verloren haben. Was sie aber auszeichnet,<br />

ist die Tatsache, dass sie gute Verteilungseigenschaften haben; siehe [62].<br />

Die Konstruktion der van der Corput-Zahlen kann man nun nutzen, um Folgen in<br />

[0, 1] d zu erzeugen. Dazu wähle man <strong>für</strong> jede Dimension j eine Basis bj, erzeuge damit die<br />

van der Corput-Folge (xi,j)i∈N . Damit bilde man dann die Vektoren<br />

x i := (xi,1, . . . , xi,d) ∈ [0, 1] d .<br />

Im Allgemeinen nimmt man als Basen die ersten d Primzahlen. Diese so konstruierte Folge<br />

von Punkten nennt man eine Folge von Halton-Punkten. Die guten Verteilungseigenschaften<br />

der van der Corput-Zahlen übertragen sich auf die Halton-Punkte.<br />

Van der Corput-Zahlen, die als Ersatz <strong>für</strong> <strong>Zufallszahlen</strong> dienen können, wer<strong>den</strong> eingeordnet<br />

unter Quasizufallszahlen.<br />

6.4 Euklidischer Algorithmus<br />

Der nun zu besprechende ” euklidische Algorithmus“ hat seine historische Wurzel in dem<br />

Bestreben in der Antike, die Verhältnisrechnung mit geometrischen Größen zu begrün<strong>den</strong><br />

(Kommensurabilitätsbetrachtungen; siehe [72], S. 41-44). Bei Euklid sollen zwei Strecken<br />

mit einem Maßstab ausgemessen wer<strong>den</strong>; dies gelingt gerade mit einem Maßstab, der die<br />

Länge des größten gemeinsamen Teilers besitzt; siehe Abbildung 19.<br />

Der euklidische Algorithmus gestattet es, <strong>den</strong> größten gemeinsamen Teiler zweier Zahlen<br />

(siehe unten) effizient zu berechnen. Er basiert auf folgender Beobachtung:<br />

Lemma 6.8 Sei a ∈ Z <strong>und</strong> b ∈ N. Dann folgt aus der Darstellung a = qb + r , q, r ∈ Z,<br />

die Aussage ggT(a, b) = ggT(b, r) .<br />

Beweis:<br />

Ist d ein Teiler von a, b, dann ist d ein Teiler von b <strong>und</strong> r <strong>und</strong> umgekehrt (siehe Folgerung<br />

6.2). �<br />

Die Interpretation von Lemma 6.8 ist, dass durch fortschreitende Division mit Rest<br />

aus dem Ausgangspaar (a, b) Paare (a ′ , b ′ ) gebildet wer<strong>den</strong> können, die <strong>den</strong>selben größten<br />

gemeinsamen Teiler besitzen. Der euklidische Algorithmus realisiert dies:<br />

Algorithm 2 Der euklidische Algorithmus<br />

EIN a, b ∈ Z ; o.E. a ≥ b > 0 .<br />

Schritt 0 a ′ := a, b ′ := b .<br />

Schritt 1 (a ′ , b ′ ) := (b ′ , r), wobei a ′ = qb ′ + r mit 0 ≤ r < b ′ ist.<br />

Schritt 2 Ist r = 0, gehe zu AUS. Ist r �= 0, setze a ′ := b ′ , b ′ := r, gehe zu Schritt 1.<br />

AUS d := b ′ = ggT(a, b) .<br />

40 Van der Corput (1935) hat sie <strong>für</strong> die Basis 2 als erster betrachtet.<br />

Stand: 21. November 2011 59 ○c J. Baumeister, T.G. Macedo


6.4 Euklidischer Algorithmus<br />

Die Aussage, dass d der größte gemeinsame Teiler von a, b ist, falls die Situation r = 0<br />

erreicht wird, folgt aus dem Lemma 6.8 unter der Beobachtung, dass ggT(b ′ , 0) = b ′ ist.<br />

Bleibt noch zu klären, dass die Situation r = 0 in endlich vielen Schritten wirklich erreicht<br />

wird. Dies folgt aber aus der Tatsache, dass <strong>für</strong> zwei aufeinanderfolgende Durchläufe von<br />

Schritt 1 mit (a ′ , b ′ ) , (a ′′ , b ′′ ) sicherlich 0 ≤ b ′′ < b ′ , b ′ , b ′′ ∈ N0 gilt. Also muss schließlich<br />

das Verfahren bei r = 0 abbrechen.<br />

Wir geben dem euklidischen Algorithmus, wohlwissend, dass der Schritt 1 nur endlich<br />

oft durchlaufen wird, eine explizite Fassung:<br />

Euklidischer Algorithmus Kettenbruchentwicklung<br />

r0 := a , r1 := b, a b = r0<br />

r1<br />

r0 = q1r1 + r2 , 0 < r2 < r1,<br />

r1 = q2r2 + r3 , 0 < r3 < r2,<br />

.<br />

.<br />

rk−1 = qkrk + rk+1 , 0 < rk+1 < rk,<br />

rk = qk+1rk+1,<br />

r0<br />

r1 = q1 + r2<br />

r1<br />

r1<br />

r2 = q2 + r3<br />

r2<br />

.<br />

rk−2<br />

rk−1 = qk + rk<br />

rk−1<br />

rk<br />

rk+1<br />

.<br />

= qk+1<br />

In dieser Darstellung ist rk+1 = ggT(rk−1, rk) = · · · = ggT(r0, r1) = ggT(a, b) nach<br />

Lemma 6.8.<br />

Beispiel 6.9 Sei a = 48 , b = 18 . Wir erhalten<br />

48 = 2 · 18 + 12<br />

18 = 1 · 12 + 6<br />

12 = 2 · 6<br />

Also gilt: ggT(48, 18) = 6 . Die geometrische Interpretation als ” wechselseitige Wegnahme“,<br />

wie sie schon bei Euklid bei Kommensurabilitätsbetrachtungen zu fin<strong>den</strong> ist, findet<br />

sich in Abbildung 19: kleinere Strecken wer<strong>den</strong> mehrfach auf einer größeren Strecke abgetragen.<br />

Da das Vorgehen im obigen Beispiel abbricht, sagt man, dass a = 48 <strong>und</strong> b = 18<br />

ein gemeinsames Maß haben, nämlich 6. (Bricht ein solches Verfahren nicht ab, dann<br />

heißen a, b inkommensurabel, wie dies etwa bei der Diagonalen im Einheitsquadrat der<br />

Fall ist, da ja √ 2 irrational ist.) �<br />

Aus der obigen Darstellung des euklidischen Algorithmus lesen wir ab:<br />

a<br />

b<br />

= r0<br />

r1<br />

= q1 + r2<br />

r1<br />

= q1 + 1 r1<br />

r2<br />

= q1 +<br />

1<br />

q2 + r3<br />

r2<br />

= q1 +<br />

q2 +<br />

1<br />

1<br />

q3 + r4<br />

r3<br />

= . . . (29)<br />

Wir wissen dabei, dass stets 0 < rk+1 < 1 gilt <strong>und</strong> dass das Schema nach k Schritten<br />

rk<br />

abbricht, <strong>den</strong>n in formaler Interpretation haben wir rk+2 = 0 . Die berechneten Größen<br />

q1, . . . , qk+1 schreiben wir als<br />

[q1, . . . , qk+1] oder a<br />

b = [q1, . . . , qk+1]<br />

Stand: 21. November 2011 60 ○c J. Baumeister, T.G. Macedo


6.4 Euklidischer Algorithmus<br />

auf <strong>und</strong> bezeichnen dies als Kettenbruch. Der Kettenbruch kann mitunter auch ” sehr<br />

lang“ sein. In vielen Fällen ist man schon mit einer Näherung [q1, . . . , ql] , 1 ≤ l < k + 1 ,<br />

zufrie<strong>den</strong>, d.h. mit der Näherung, die entsteht, wenn man rl<br />

rl+1 ersetzt.<br />

Wir wissen, genügt die gol<strong>den</strong>e Schnittzahl g der Gleichung<br />

g = 1<br />

1 + g .<br />

Daraus lesen wir durch sukzessives Einsetzen <strong>den</strong> unendlichen Kettenbruch – g ist ja<br />

irrational – <strong>für</strong> die gol<strong>den</strong>e Schnittzahl g ab:<br />

g = [1; 1, 1, 1, 1, . . . ] .<br />

Betrachtet man davon nur endliche Abschnitte<br />

als Näherung <strong>für</strong> g, dann erhält man<br />

” schlechte“ Approximationen von g ; man<br />

nennt g deshalb die irrationalste Zahl“<br />

” 41 .<br />

Der Gr<strong>und</strong> da<strong>für</strong> ist, dass jeder Eintrag im<br />

Kettenbruch die kleinste Einheit ist, die ein<br />

Abbrechen gerade noch verhindert, nämlich<br />

1. Es deckt sich mit der Tatsache, dass der<br />

euklidische Algorithmus <strong>für</strong> die Brüche der<br />

Fibonacci-Zahlen besonders langsam ist. Dies<br />

steht im Gegensatz zu einer anderen irrationalen<br />

Zahl, der Kreiszahl π . Ihre Kettenbruchentwicklung<br />

ist<br />

π = [3; 7, 15, 1, . . . ] .<br />

48<br />

18 18 12<br />

12 6<br />

6 6<br />

6<br />

Abbildung 19: Wechselwegnahme<br />

Schon der endliche Kettenbruch [3; 7] = 22<br />

7<br />

ist eine sehr gute Approximation von π. 42 Der Gr<strong>und</strong> ist, dass der nächste Eintrag im<br />

Kettenbruch von π die Zahl 15 ist.<br />

Satz 6.10 (Lemma von Bachet/Lemma von Bezout) Seien a, b ∈ Z . Dann gibt es<br />

Zahlen s, t ∈ Z mit ggT(a, b) = sa + tb .<br />

Beweis:<br />

O.E. a ≥ b > 0 .<br />

Die Aussage folgt dadurch, dass wir <strong>den</strong> euklidischen Algorithmus in der expliziten Fassung<br />

rückwärts lesen. Wir strukturieren dies, indem wir nachrechnen, dass <strong>für</strong> 0 ≤ i ≤ k+1<br />

gilt<br />

ri = sia + tib , mit si, ti ∈ Z. (30)<br />

Dies ergibt sich so: Für i = 0 setze s0 := 1, t0 := 0 <strong>und</strong> <strong>für</strong> i = 1 setzte s1 := 0, t1 := 1 .<br />

Nun setzen wir<br />

si+1 := si−1 − qisi , ti+1 := ti−1 − qiti , 1 ≤ i ≤ k. (31)<br />

Dann gilt offenbar die obige Aussage. �<br />

41Diese Tatsache spielt sogar eine Rolle in der so genannten Chaostheorie.<br />

42 22<br />

In <strong>den</strong> DMV-Mitteilungen vom Herbst 2011 lesen wir, dass 7 der Lieblingsbruch von G.M. Ziegler<br />

(ein Star der Vermittlung von <strong>Mathematik</strong> in der Öffentlichkeit, siehe [2]) ist.<br />

Stand: 21. November 2011 61 ○c J. Baumeister, T.G. Macedo


6.4 Euklidischer Algorithmus<br />

Beispiel 6.11 Wir können nachrechnen, dass 37 der größte gemeinsame Teiler von 36667<br />

<strong>und</strong> 12247 ist. Mit der Analyse gemäß Satz 6.10 erhalten wir<br />

37 = ggT(36667, 12247) = 165 · 36667 − 494 · 12247 .<br />

Folgerung 6.12 Seien a, m ∈ Z, die nicht beide Null sind, mit ggT(a, m) = 1 . Dann<br />

gibt es b ∈ Z mit m|(ab − 1) .<br />

Beweis:<br />

Wir wissen aus dem Lemma von Bezout 1 = ax + my mit x, y ∈ Z . Setze b := x . Dann<br />

ist ab − 1 = −my = m(−y) . �<br />

Die obige Folgerung können wir so lesen, dass bei Teilerfremdheit von a <strong>und</strong> m zu a<br />

eine Zahl b existiert, die die Gleichung<br />

löst; wir kommen darauf zurück.<br />

a · b ≡ 1 mod m<br />

C. Huygens entwickelte Kettenbruchentwicklungen, als er ein Zahnradmodell (siehe die<br />

illustrierende Abbildung 20) des Sonnensystems bauen wollte. Gesucht wur<strong>den</strong> möglichst<br />

” einfache Brüche“ <strong>für</strong> die gelten sollte:<br />

Zahnzahl von Zahnrad 1 Umlaufzeit von Planet 1<br />

=<br />

Zahnzahl von Zahnrad 2 Umlaufzeit von Planet 2 .<br />

Wer<strong>den</strong> die Umlaufzeiten der Planeten sehr genau gemessen, dann kann rechts ein Bruch<br />

mit sehr großem Zähler <strong>und</strong> Nenner entstehen.<br />

Der euklidische Algorithmus gilt als ” Musterbeispiel“<br />

eines effizienten Algorithmus mit<br />

vielfältigen Anwendungen. Eigentlich müssten<br />

wir nun eine Analyse der Komplexität des euklidischen<br />

Algorithmus durchführen, wenn wir die<br />

Behauptung, dass dieser Algorithmus sehr effizient<br />

ist, belegen wollten. Wir verzichten darauf,<br />

ohne zu vergessen, auf ein Beispiel hinzuweisen,<br />

das <strong>den</strong> worst case des Algorithmus beschreibt:<br />

die Berechnung des größten gemeinsamen Teiler<br />

zweier aufeinanderfolgender Fibbonacci-Zahlen,<br />

die wir nun einführen wollen.<br />

Abbildung 20: Zahnräder<br />

Hier sind sie von Interesse bei der Untersuchung<br />

der Schnelligkeit des euklidischen Algorithmus. Im euklidischen Algorithmus wer<strong>den</strong><br />

die Reste rk+1 umso schneller klein, je größer die Quotienten qk sind.<br />

Betrachten wir <strong>den</strong> euklidischen Algorithmus <strong>für</strong> das Paar zweier aufeinanderfolgen<strong>den</strong><br />

Fibonacci–Zahlen, also a = fn+1, b = fn <strong>für</strong> ein n ∈ N . Aus der Rekursionsgleichung der<br />

Fibonacci–Zahlen folgt unmittelbar<br />

fn+1 = 1 · fn + fn−1<br />

fn = 1 · fn−1 + fn−2<br />

.<br />

f3 = 1 · f2 + f1<br />

f2 = 1 · f1<br />

Stand: 21. November 2011 62 ○c J. Baumeister, T.G. Macedo<br />


6.5 Modulares Rechnen<br />

Da f1 = 1 gilt, folgt: je zwei aufeinanderfolgende Fibonacci-Zahlen sind teilerfremd <strong>und</strong><br />

jeder Quotient qk ist gleich 1. Dies ist der ungünstigste Fall, was die Anzahl der Schritte in<br />

Abhängigkeit von der Größe der Ausgangszahlen betrifft. Beim euklidischen Algorithmus<br />

<strong>für</strong> fn+1, fn sind, wie gesehen, n Schritte nötig. Da fn in Abhängigkeit von n exponentiell<br />

wächst, folgt, dass die Anzahl der Schritte beim euklidischen Algorithmus zur Berechnung<br />

eines größten gemeinsamen Teilers ggT(a, b) höchstens logarithmisch in der Stellenanzahl<br />

der Eingabedaten a, b, d.h. linear mit der Stellenzahl von a, b wächst: der Aufwand ist also<br />

vergleichbar mit dem Aufwand, der bei der Multiplikation von a <strong>und</strong> b anfällt. Der euklidische<br />

Algorithmus ist damit eine sehr effiziente Methode zur Berechnung des größten<br />

gemeinsamen Teilers großer Zahlen. Er benötigt insbesondere nicht die Primfaktorzerlegung<br />

der Zahlen a, b .<br />

6.5 Modulares Rechnen<br />

Die modulare Arithmetik geht auf Gauß zurück. Sie beschreibt das Rechnen mit Resten:<br />

man gibt sich eine natürliche Zahl m vor – diese Zahl nennen wir Modul – <strong>und</strong> ” ersetzt“<br />

jede ganze Zahl a durch ihren Rest r, der bei Division von a durch m entsteht; siehe Satz<br />

6.7. Die Zahlen a, die bei Division mit Rest <strong>den</strong> gleichen Rest ergeben, fasst man zu einer<br />

Klasse, <strong>den</strong> Restklassen zusammen.<br />

Die Restklassen sind nun so definiert:<br />

Zm := {[0], [1], . . . , [m − 1]} wobei [i] := {z ∈ Z|z = qm + i <strong>für</strong> ein q ∈ Z} ,<br />

Dass die Menge Zm m Elemente hat, ergibt sich aus der Tatsache, dass m Reste gemäß<br />

Satz 6.7 auftreten können. Beachte, dass etwa die Restklasse [1] auch als die Restklasse<br />

[m + 1] beschrieben wer<strong>den</strong> kann: wir haben in der Definition von Zm ein naheliegendes<br />

” Representantensystem“ gewählt. Für m = 11 haben wir etwa<br />

[3] = [25] = [−8] = [91] .<br />

Beispiel 6.13 Für m = 2 erhalten wir gerade die Einteilung der natürlichen Zahlen in<br />

die Klassen gerade Zahlen (Restklasse [0]) <strong>und</strong> ungerade Zahlen (Restklasse [1]). Für diese<br />

Klassen hat man in natürlicher Weise eine Addition <strong>und</strong> eine Multiplikation:<br />

gerade + gerade = gerade , ungerade + gerade = ungerade<br />

gerade · gerade = gerade , ungerade · gerade = gerade<br />

Die Beobachtung aus Beispiel 6.13 bezüglich Addition, Multiplikation schreiben wir<br />

nun fort auf Zm:<br />

Addition: [i] + [j] := [i + j] , i, j ∈ {0, 1, . . . , m − 1} ;<br />

Multiplikation: [i] · [j] := [i · j] , i, j ∈ {0, 1, . . . , m − 1} .<br />

Beachte, dass die Verknüpfungssymbole +, · in zweifacher Bedeutung auftreten: als Addition,<br />

Multiplikation in Zm <strong>und</strong> in Z .<br />

Damit dies wohldefiniert ist, muss noch gezeigt wer<strong>den</strong>: aus [i] = [i ′ ], [j] = [j ′ ] folgt<br />

[i + j] = [i ′ + j ′ ] <strong>und</strong> [ij] = [i ′ j ′ ] (Unabhängigkeit von <strong>den</strong> Repräsentanten). Wir beweisen<br />

dies am Beispiel der Multiplikation. [i] = [i ′ ], [j] = [j ′ ] bedeutet i ′ = pm + i, j ′ = qm + j<br />

<strong>für</strong> p, q ∈ Z . Daraus folgt<br />

i ′ j ′ = (pm + i)(qm + j) = (iqm + jpm + pqm)m + ij also [ij] = [i ′ j ′ ] .<br />

Stand: 21. November 2011 63 ○c J. Baumeister, T.G. Macedo<br />


6.5 Modulares Rechnen<br />

Assoziativgesetz Klammern <strong>für</strong>fen bei der Addition beliebig gesetzt wer<strong>den</strong>:<br />

([i] + [j]) + [k] = [i] + ([j] + [k]) , i, j, k ∈ {0, 1, . . . , m − 1} .<br />

Neutrales Element [0] ist das neutrale Element <strong>für</strong> die Addition:<br />

[i] + [0] := [i] , i, j ∈ {0, 1, . . . , m − 1} .<br />

Inverses [m − i] ist das Inverse von [i] bezüglich der Addition:<br />

[m − i] + [i] = [m − i + i] = [m] = [0] .<br />

Kommutativgesetz Die Summan<strong>den</strong> dürfen bei der Addition vertauscht wer<strong>den</strong>:<br />

[i] + [j] = [j] + [i] , i, j ∈ {0, 1, . . . , m − 1} .<br />

Die angeführten Eigenschaft fasst man zusammmen in der Aussage: (Zm, +) ist eine kommutative<br />

Gruppe. Beachte, dass diese Eigenschaften auch <strong>für</strong> die ganzen Zahlen gelten,<br />

also dass auch (Z, +) eine kommutative Gruppe ist.<br />

Für die Multiplikation ist die Situation nicht ganz so komfortabel. Zwar gelten die<br />

Aussagen<br />

Assoziativgesetz Klammern <strong>für</strong>fen bei der Multiplikation beliebig gesetzt wer<strong>den</strong>:<br />

([i] · [j]) · [k] = [i] · ([j] · [k]) , i, j, k ∈ {0, 1, . . . , m − 1}<br />

Neutrales Element [1] ist das neutrale Element <strong>für</strong> die Multiplikation:<br />

[i] · [1] := [i] , i, j ∈ {0, 1, . . . , m − 1}<br />

Kommutativgesetz Die Faktoren dürfen bei der Multiplikation vertauscht wer<strong>den</strong>:<br />

[i] · [j] = [j] · [i] , i, j ∈ {0, 1, . . . , m − 1}<br />

aber die Eigenschaft über das Inverse gilt nicht allgemein. Ein Gegenbeispiel folgt aus<br />

[2] · [2] = [2 · 2] = [0] in Zm <strong>für</strong> m = 4 ,<br />

<strong>den</strong>n hier kann [2] kein Inverses bezüglich der Multiplikation haben, da stets [i] · [0] =<br />

[i · 0] = [0] ist. Aber man kann die Vermutung haben, dass diese Schwierigkeit im Fall,<br />

dass m eine Primzahl ist, nicht auftritt. Dies trifft zu <strong>und</strong> wir halten fest: (Zm, ·) ist eine<br />

kommutative Gruppe bezüglich der Multiplikation, falls m eine Primzahl ist, wobei wir<br />

<strong>den</strong> Beweis noch nicht eigentlich erbracht haben, aber die Vorarbeit ist in Lemma 6.12<br />

geleistet: jedes Element [a] hat ein Inverses bezüglich der Multiplikation.<br />

Hier sind die Gruppentafeln – so nennt man die vollständige Auflistung der Verknüpfungen<br />

der Gruppenelemente innerhalb einer Gruppe – <strong>für</strong> m = 5 . Man beachte, dass<br />

sowohl in der Gruppentafel zur Addition als auch in der Gruppentafel zur Multiplikation<br />

in jeder Zeile <strong>und</strong> Spalte jede Klasse genau einmal vertreten ist. Beachte ferner, dass die<br />

Potenzen des Elements [2] alle Elemente von Z ∗ 5 := Z5\{[0]} durchlaufen:<br />

[2] 0 = [1] , [2] 1 = [2] , [2] 2 = [4] , [2] 3 = [3] , [2] 4 = [1] .<br />

Man nennt eine Gruppe, die ein solches zyklisches Element besitzt, eine zyklische<br />

Gruppe.<br />

Wir führen noch eine andere Schreibweise ein. Mit u, v ∈ Z schreiben wir:<br />

u ≡ v mod m : ⇐⇒ [u] = [v] ⇐⇒ m|(u − v) .<br />

Stand: 21. November 2011 64 ○c J. Baumeister, T.G. Macedo


+ [0] [1] [2] [3] [4]<br />

[0] [0] [1] [2] [3] [4]<br />

[1] [1] [2] [3] [4] [0]<br />

[2] [2] [3] [4] [0] [1]<br />

[3] [3] [4] [0] [1] [2]<br />

[4] [4] [0] [1] [2] [3]<br />

(a)<br />

Abbildung 21: Gruppentafeln zu Z5<br />

· [1] [2] [3] [4]<br />

[1] [1] [2] [3] [4]<br />

[2] [2] [4] [1] [3]<br />

[3] [3] [1] [4] [2]<br />

[4] [4] [3] [2] [1]<br />

(b)<br />

6.5 Modulares Rechnen<br />

Beispiel 6.14 Wie sehen die bei<strong>den</strong> letzten Dezimalstellen von 24 2008 aus? Dies ist die<br />

Frage nach dem Rest von 24 2008 modulo 100 . Wir rechnen induktiv nach:<br />

Induktionsbegin k = 1: Klar<br />

Induktionsschluss k → k + 1:<br />

24 k ≡ (−1) k+1 · 24 mod 100 , k = 1, 2, . . . .<br />

24 k+1 ≡ (24 k ·24) ≡ (−1) k+1 ·24·24 ≡ (−1) k+1 (600−24) mod 100 ≡ (−1) k+2 ·24 mod 100<br />

Daraus folgt also<br />

24 2008 ≡ −24 mod 100 ≡ 76 mod 100 ,<br />

was bedeutet, dass die Zahl 2 2008 mit 76 endet. �<br />

Beispiel 6.15 Jede Zahl 10 k hat wegen<br />

10 k = 9 · 10k − 1<br />

10 − 1 + 1 = 9 · (10k−1 + · · · + 10 0 ) + 1<br />

<strong>den</strong> Rest 1 modulo 9. Dies hat die Konsequenz, dass jede Dezimalzahl<br />

z = anan−1 · · · a0 = an10 n + an−110 n−1 + · · · + a010 0<br />

modulo 9 <strong>den</strong> Rest an + · · · + a0 hat. Dies ist die so genannte Quersummenprobe auf<br />

Teilbarkeit durch Neun: eine Zahl z hat bei Teilung durch Neun genau dann <strong>den</strong> Rest<br />

r, wenn ihre Quersumme bei Teilung durch Neun <strong>den</strong> Rest r hat.<br />

Daraus resultiert die Neunerprobe, eine Methode, die es gestattet, <strong>den</strong> Nachweis<br />

einer fehlerhaften Addition, Subtraktion oder Multiplikation ohne lange Rechenoperationen<br />

zu erbringen: man berechnet die Neunerreste der bei<strong>den</strong> Operan<strong>den</strong> <strong>und</strong> des Ergebnisses,<br />

was man durch sukzessives Bil<strong>den</strong> von Quersummen tun kann. Hier ist ein Beispiel <strong>für</strong><br />

die Anwendung. Ist die Behauptung<br />

40752 · 32111 = 1308587572<br />

richtig? Nein, <strong>den</strong>n die Neunerreste erfüllen die Gleichung nicht:<br />

Neunerrest von 40752 ist 0, <strong>den</strong>n: 4 + 0 + 7 + 5 + 2 = 18, 1 + 8 = 9<br />

Neunerrest von 32111 ist 8, <strong>den</strong>n: 3 + 2 + 1 + 1 + 1 = 8<br />

Neunerrest von 1308587572 ist 1, <strong>den</strong>n: 1 + 3 + 0 + 8 + 5 + 8 + 7 + 5 + 7 + 2 = 46, 4 + 6 =<br />

10, 1+0 = 1 Beachte, eine umgekehrte Anwendung ist nicht erlaubt: wenn die Neunerprobe<br />

keinen Widerspruch aufweist, muss das Ergebnis nicht korrekt sein.<br />

Kombiniert man die Neunerprobe etwa mit der Elferprobe – wir gehen hier nicht darauf<br />

ein – dann erhält man aus der Korrektheit der Proben schon eine ziemliche Sicherheit <strong>für</strong><br />

die Korrektheit der Rechnung. �<br />

Stand: 21. November 2011 65 ○c J. Baumeister, T.G. Macedo


6.5 Modulares Rechnen<br />

Modulares Rechnen wird <strong>für</strong> Berechnungen mit dem Computer wichtig, wenn mit sehr<br />

großen ganzen Zahlen exakt gerechnet wer<strong>den</strong> soll.<br />

Sei a ∈ N . Man wählt verschie<strong>den</strong>e Moduln m1, . . . , ml <strong>und</strong> berechnet die Reste<br />

r1, . . . , rl von a bezüglich dieser Moduln. Der Rest r von a bezüglich des Moduls m :=<br />

m1 · · · ml ist dann gleich r1 · · · rl <strong>und</strong> er legt a eindeutig fest, wenn a zwischen 0 <strong>und</strong> m−1<br />

liegt. Ist a ≥ m, dann liegt a immerhin noch in der Restklasse [r] bezüglich des Moduls<br />

m .<br />

Beispiel 6.16 Betrachte die Multiplikation der Zahlen 102, 99: 102 · 99 =????? .<br />

Wir wählen (geschickt) die Moduln m1 = 9, m2 = 10, m3 = 11 <strong>und</strong> erhalten folgende Reste<br />

<strong>für</strong> das Produkt:<br />

102 · 99 ≡ (99 + 3) · (99 + 0) ≡ 3 · 0 ≡ 0 mod 9 ;<br />

102 · 99 ≡ (100 + 2) · (100 − 1) ≡ 2 · (−1) ≡ −2 mod 10 ;<br />

102 · 99 ≡ (99 + 3) · (99 + 0) ≡ 3 · 0 ≡ 0 mod 11 .<br />

Eine Lösung der Gleichungen ist x = 198 . Alle weiteren Lösungen sind x = 198 +<br />

km1m2m3, k ∈ Z . Aus einer Größenordnungsbetrachtung folgt: 102 · 99 = 198 + 10 · 990<br />

ist die Lösung der Multiplikation. �<br />

Das Ergebnis, das die Rechnung in Beispiel 6.16 rigoros macht, ist der Chinesische<br />

Restesatz; siehe [32] <strong>und</strong> [34].<br />

Bibliographische Anmerkungen<br />

Die Idee des euklidischen Algorithmus ist nicht nur auf Zahlbereiche begrenzt; siehe [1].<br />

In der Informatik ist er ein bedeutendes Hilfsmittel.<br />

Kettenbrüche sind ein wichtiges Hilfsmittel beim Studium der irrationalen Zahlen <strong>und</strong><br />

ihrer Approximation durch rationale Zahlen; siehe [52].<br />

Gruppentheorie ist in der <strong>Mathematik</strong> ein zentrales Thema mit Ausstrahlung in nahezu<br />

jede Teildisziplin. Einführendes kann nach gelesen wer<strong>den</strong> etwa bei [1, 32, 86]. Zum<br />

modularen Rechnen siehe etwa [Sei07].<br />

Zu Quasizufallszahlen siehe [36].<br />

Stand: 21. November 2011 66 ○c J. Baumeister, T.G. Macedo


7 Kongruenzgeneratoren<br />

Random numbers should not be generated with a method<br />

chosen at random<br />

Donald E. Knuth<br />

Die Klasse der Kongruenzgeneratoren, die wir nun besprechen wollen, nutzen die modulare<br />

Rechnung. Sie lassen sich in ihrer Qualität bzw. in ihrer Schwäche gut beurteilen<br />

<strong>und</strong> sie sind <strong>für</strong> Anwendungen sehr interessant, da sie sich einfach realisieren lassen.<br />

7.1 Lineare Kongruenzgeneratoren<br />

Um die umständliche Verwendung von Tabellen zu vermei<strong>den</strong>, wer<strong>den</strong> im Allgemeinen<br />

Folgen von <strong>Zufallszahlen</strong> verwendet, die durch Iterationen, also rekursives Rechnen, hergestellt<br />

wer<strong>den</strong>. Diese <strong>Zufallszahlen</strong> – wir nennen sie meist Pseudozufallszahlen – haben<br />

<strong>den</strong> Vorteil, dass sie reproduzierbar sind, <strong>und</strong> haben <strong>den</strong> Nachteil, dass sie deterministischen<br />

Charakter besitzen. Zunächst einige allgemeine Bemerkungen; sie schließen an an<br />

die Betrachtungen zu dynamischen Systemen.<br />

Sei M eine endliche Menge <strong>und</strong> f eine Abbildung von M nach M, also f : M −→ M .<br />

Die Iteration dieser Abbildung sieht so aus:<br />

x n+1 := f(x n ) , n ∈ N0 , (32)<br />

Die Folge ist durch die Wahl von x 0 vollständig bestimmt. Es entsteht ein Orbit x 1 , x 2 ,<br />

x 3 , . . . ; wir schreiben ihn als Folge (x n )n∈N . Da die Menge M endlich ist, können nicht alle<br />

Folgenglieder x n verschie<strong>den</strong> sein. Es gibt also Indizes k, l mit x k = x l ; o. E. k > l . Seien<br />

k, l die ersten Indizes, <strong>für</strong> die dies eintritt, <strong>und</strong> sei damit r := k − l . Da x k = x l gilt, folgt<br />

x n+r = x n <strong>für</strong> alle n ≥ l . Also wird der Orbit (x n )n∈N periodisch mit Periode r ; wir<br />

sagen, dass wir einen Zyklus der Länge r haben. Verlangt man, dass jedes Element der<br />

Menge M die Chance hat im Orbit aufzutauchen, muss der Zyklus ganz M umfassen. Aus<br />

dieser Forderung folgt, dass die Abbildung f surjektiv sein muss, d.h. dass jedes Element<br />

y in M als Bild unter f geschrieben wer<strong>den</strong> kann, also y = f(x) mit einem x ∈ M . Da M<br />

endlich ist, hat dies zur Konsequenz, dass dann dieses x eindeutig bestimmt sein muss,<br />

d.h. dass f auch injektiv sein muss. Also hat die Forderung, dass <strong>für</strong> <strong>den</strong> Zyklus r = #M<br />

gilt, zur Folge, dass f surjektiv <strong>und</strong> injektiv, also bijektiv ist.<br />

Die Iteration der Form (32) umfasst die Situation der diskreten dynamischen Systeme<br />

<strong>und</strong> damit auch der chaotischen diskreten dynamischen Systeme, allerdings<br />

dann unter Verzicht auf die Endlichkeit der Menge M . Wir wer<strong>den</strong> in Kapitel 9 ein<br />

Beispiel dieser Art kennenlernen.<br />

Kommen wir nun zur Realisierung von (32) <strong>für</strong> die Zwecke der Erzeugung von Pseudo-<br />

<strong>Zufallszahlen</strong>. Wir wählen dazu<br />

M := Zm ; f : Zm ∋ [x] ↦−→ [ax + b] ∈ Zm , (33)<br />

mit einem Modul m . Hier sind a, b ∈ Z . Damit lautet die Rechenvorschrift (32)<br />

x n+1 := ax n + b mod m , n ∈ N . (34)<br />

Wir bezeichnen (34) auch als affinen Kongruenz–Generator.<br />

Stand: 21. November 2011 67 ○c J. Baumeister, T.G. Macedo


7.1 Lineare Kongruenzgeneratoren<br />

Bemerkung 7.1 Durch die Generatoren in (34) wer<strong>den</strong> Zahlen in M := {0, 1, . . . , m−1}<br />

erzeugt. Aus einer Zahl y ∈ {0, . . . , m − 1} ergibt sich dann eine Zahl z in [0, 1] ganz<br />

einfach so: z := y m . Damit können wir sagen, dass in (34) ein Generator <strong>für</strong> Pseudozufallszahlen<br />

in [0, 1] beschrieben ist. �<br />

Ein guter Generator sollte Zykluslänge r := m haben. Wie wir oben gesehen haben,<br />

ist dann <strong>für</strong> f die Bijektivität sicherzustellen. Die Forderung der Bijektivität von f hat<br />

Konsequenzen <strong>für</strong> die Wahl der Zahlen m, a, b . Für die Klärung der Frage, unter welchen<br />

Bedingungen dieser Typ von Generatoren einen Zyklus maximaler Länge erzeugt, dient<br />

folgender Satz:<br />

Satz 7.2 Mit m, a, b ∈ Z, m ≥ 2 , betrachte die Abbildung<br />

f : {0, . . . , m − 1} ∋ x ↦−→ ax + b mod m ∈ {0, . . . , m − 1} . (35)<br />

Für beliebiges x 0 ∈ {0, . . . , m − 1} sei die Folge (x n )n∈N definiert durch<br />

x n+1 := f(x n ) , n ∈ N 0 .<br />

Genau dann ist diese Folge periodisch mit der maximalen Perio<strong>den</strong>länge m <strong>für</strong> alle Startwerte<br />

x 0 , wenn folgende Bedingungen erfüllt sind:<br />

a) p|(a − 1) <strong>für</strong> alle Primteiler p von m ;<br />

b) 4|(a − 1) falls 4|m ;<br />

c) b <strong>und</strong> m sind teilerfremd.<br />

Den Beweis dieses Satzes findet man in [32].<br />

Satz 7.2 nennt uns die Bedingungen <strong>für</strong> einen affinen Kongruenz–Generator, damit er<br />

der Minimalforderung, einen Zyklus maximaler Länge zu erzeugen, genügt. Jedoch garantieren<br />

diese Bedingungen noch lange keinen guten Zufallsgenerator, wie nachfolgendes<br />

Beispiel zeigt; damit der erzeugte Orbit als eine Folge von <strong>Zufallszahlen</strong> angesehen wer<strong>den</strong><br />

kann, sollten die Elemente von M darin in einer ” guten Durchmischung“ vorkommen.<br />

Beispiel 7.3 Betrachte <strong>für</strong> einen beliebigen Modul m <strong>den</strong> Generator f(x) :≡ x + 1<br />

mod m . Kein Zweifel, die Zykluslänge ist maximal <strong>für</strong> je<strong>den</strong> Startwert, nämlich m, aber<br />

die erzeugte Folge 0, 1, 2, . . . , m − 1, 0, 1 . . . kann sicherlich nicht <strong>den</strong> Anspruch einer Zufallsfolge<br />

erheben. �<br />

Beispiel 7.4 Betrachte die spezielle Wahl m = 10, a = b = 7 . Hier ist der erzeugte<br />

Zyklus<br />

7, 6, 9, 0, 7, 6, 9, 0, . . .<br />

ziemlich kurz. Beachte, Voraussetzung a) in Satz 7.2 ist nicht erfüllt. �<br />

In der Praxis wird häufig ein Modul der Form m = 2 k verwendet (<strong>und</strong> dazu in der<br />

Regel der Multiplikator a im Bereich √ m < a < m − √ m). In diesem Fall bedeuten die<br />

Bedingungen des Satzes 7.2 einfach<br />

a ≡ 1 mod 4 <strong>und</strong> b ungerade . (36)<br />

Stand: 21. November 2011 68 ○c J. Baumeister, T.G. Macedo


7.2 Einige verwendete Generatoren<br />

Wir listen hier ein paar ” gebräuchliche“ Generatoren auf.<br />

Beispiel 7.5 <strong>Von</strong> D. Knuth wurde der Generator<br />

Modul = 2 16 , a = 137 , b = 187<br />

7.2 Einige verwendete Generatoren<br />

vorgeschlagen. Die Zykluslänge ist maximal, da die Bedingungen (36) erfüllt sind. �<br />

Beispiel 7.6 In der Programmiersprache C++ gibt es einen Generator namens drand48:<br />

Modul = 2 48 , a = 25214903917 , b = 11 .<br />

Die Zykluslänge ist maximal, da die Bedingungen (36) erfült sind. �<br />

Beispiel 7.7 Betrachte die spezielle Wahl m = 2 31 , a = 65539, b = 0 . Dies ist der Zufallsgenerator<br />

RANDU, wie er von IBM in <strong>den</strong> Computern in <strong>den</strong> 60er Jahren verwendet<br />

wurde. Die maximal erreichbare Zykluslänge r ist hier nicht ganz maximal, aber mit<br />

r = 2 29 nahezu maximal. �<br />

Beispiel 7.8 Der Lewis-Goodman-Miller-Generator wird beschrieben durch<br />

x n = 16807 x n−1 mod 2 31 − 1 .<br />

Hier ist also m = 2 31 − 1, a = 16807, b = 0 . Bedingung (36) ist hier verletzt. �<br />

Beispiel 7.9 Ein weiterer Generator:<br />

Modul = 2 16 , a = 193 , b = 73 .<br />

Die Zykluslänge ist maximal, da die Bedingungen (36) erfüllt sind. �<br />

Als Erläuterung sei hier noch ein Kongruenzgenerator erwähnt, der der Erzeugung der<br />

Fibonacci-Zahlen nachgebaut ist. Hier lautet die Iteration<br />

x n+2 := x n+1 + x n mod m , n ∈ N0 . (37)<br />

Offensichtlich wer<strong>den</strong> hier zwei Startzahlen x 0 <strong>und</strong> x 1 benötigt. Als Beispiel sei m = 13<br />

als Modul des Fibonacci-Generators <strong>und</strong> x 0 = 1 <strong>und</strong> x 1 = 1 als Startwerte festgelegt.<br />

Die Berechnung des Orbits zeigt, dass sich ein Zyklus von 28 Zahlen einstellt, also eine<br />

Perio<strong>den</strong>länge größer als der Modul m = 13 . Es gibt Sätze über die Perio<strong>den</strong>länge von Zufallsgeneratoren.<br />

Für m = 2 k beträgt die Periode eines Fibonacci-Generators unabhängig<br />

von der Wahl der Startwerte x 0 <strong>und</strong> x 1 stets 3 · 2n − 1, falls mindestens ein Startwert von<br />

Null verschie<strong>den</strong> ist. Ein Beispiel <strong>für</strong> einen guten Fibonacci-Generator ist gegeben <strong>für</strong> <strong>den</strong><br />

Modul m = 2 35 .<br />

7.3 Geometrische Beobachtungen<br />

Da die Abfolge der Pseudozufallszahlen durch <strong>den</strong> Generator festgelegt ist, besteht eine<br />

Korrelation zwischen aufeinander folgen<strong>den</strong> <strong>Zufallszahlen</strong>. Um Aufschluss über die Korreliertheit/Unkorreliertheit<br />

zu erhalten, sollte man daher Paare, Trippel,. . . von <strong>Zufallszahlen</strong><br />

betrachten <strong>und</strong> deren ” geometrische Verteilung“ untersuchen. 43 Wir ” skalieren“ dazu<br />

die <strong>Zufallszahlen</strong> mit Modul m gemäß<br />

u i := xi<br />

m ∈ [0, 1] , i ∈ N0 .<br />

43 Eine ” Anwendung“ der folgen<strong>den</strong> Pärchenbildung ist die Abtastung eines Schachbretts: will man<br />

jedes Feld zufällig besuchen, so braucht man zufällige Koordinaten.<br />

Stand: 21. November 2011 69 ○c J. Baumeister, T.G. Macedo


(a) (b)<br />

Abbildung 22: Geometrische Einsichten<br />

7.3 Geometrische Beobachtungen<br />

In (a) von Abbildung 22 haben wir dies <strong>für</strong> <strong>den</strong> Generator mit a =, b =, c = getan. Die<br />

Korrelation wird sehr deutlich, insbesondere im Vergleich mit der Graphik (b), in der ein<br />

perfekter ” Zufallsregen“ dargestellt ist.<br />

Betrachten wir <strong>den</strong> Generator RANDU genauer. Wir haben hier<br />

<strong>und</strong> daher<br />

x i+1 ≡ (65539) 2 x i−1 mod 2 31<br />

≡ (2 16 + 3) 2 x i−1 mod 2 31<br />

≡ (6x i − 9x i−1 ) mod 2 31<br />

x i+1 − 6x i + 9x i−1 = k · 2 31 mit k ∈ Z .<br />

Dies bedeutet <strong>für</strong> die ” normalisierten“ <strong>Zufallszahlen</strong> u i := x i 2 −31<br />

u i+1 − 6u i + 9u i−1 = k mit k ∈ Z . (38)<br />

Da 0 < u i+1 < 1 gilt – beachte, dass daher u i+1 − 6u i + 9u i−1 nur die Werte −5, −4, . . . , 9<br />

annehmen kann – müssen die Tripel (u i+1 , u i , u i−1 ) auf Ebenen im Einheitswürfel [0, 1] 3<br />

liegen, <strong>und</strong> zwar auf nicht mehr als 15 Stück, die jeweils einen gleichen Abstand 1/ √ 118<br />

haben. Neben der mangeln<strong>den</strong> Maximalität der Zykluslänge ein weiterer Nachteil dieses<br />

Generators. <strong>Von</strong> vielen wird er daher <strong>für</strong> <strong>den</strong> Müllhaufen der Informatik-Geschichte freigegeben.<br />

Vergleichen wir die geometrische Verteilung der Paare (u i+1 , u i ) in [0, 1] × [0, 1] <strong>für</strong> die<br />

Generatoren aus Beispiel 7.5 <strong>und</strong> Beispiel 7.9. Man kann Gera<strong>den</strong> entdecken, worauf alle<br />

<strong>Zufallszahlen</strong> liegen, 21 im ersten Fall, 8 im zweiten Fall; die Streifen dazwischen sind<br />

frei von <strong>den</strong> erzeugten Zufallspaaren. Der maximale Abstand von solchen Streifen ist bei<br />

bei<strong>den</strong> Generatoren dementsprechend ziemlich verschie<strong>den</strong>: 1<br />

√274 bei Beispiel 7.5, 1<br />

√32 bei<br />

Beispiel 7.9. Dies bedeutet, dass der Generator 7.5 größeres Vertrauen genießen sollte.<br />

Bemerkung 7.10 Der Blum-Blum-Shub-Generators nutzt ebenfalls die Modulo-Rechnung,<br />

wobei der Modul m als Produkt zweier sehr großer Primzahlen ist. Die Iteration<br />

erfolgt nach<br />

x n+1 = x 2 mod m .<br />

Stand: 21. November 2011 70 ○c J. Baumeister, T.G. Macedo


7.4 Statistische Tests<br />

Die Iterationszufallszahlenfolge des Blum-Blum-Shub-Generators wird weniger zu Simulationszwecken<br />

als zu modernen Codierungsverfahren benutzt.<br />

Der derzeit ” beste“ Generator ist wohl der Mersenne-Twister-19937-Generator, liefert<br />

er doch <strong>Zufallszahlen</strong>, die als Tupel selbst im 623-dimensionalen Einheitswürfel noch<br />

gleichverteilt sind, die geometrische Korreliertheit ist also sehr gering, <strong>und</strong> der eine Perio<strong>den</strong>länge<br />

von 2 19937 − 1(≈ 4, 3 · 10 6001 ) besitzt. Diese Perio<strong>den</strong>länge erklärt auch <strong>den</strong><br />

Namen des Algorithmus: Sie ist eine Mersenne-Primzahl <strong>und</strong> einige Eigenschaften des<br />

Algorithmus resultieren aus dieser Eigenschaft. �<br />

In Abschnitt 7.2 haben wir einen Generator angeführt, der mit Fibonacci-Zahlen arbeitet.<br />

Ein oberflächliche Analyse könnte vortäuschen, dass er wesentlich bessere ” geometrische“<br />

Eigenschaften besitzt. Dem ist aber nicht so. Die geometrischen Unzulänglichkeiten<br />

zeigen sich bei der Darstellung von Tripeln im dreidimensionalen Raum sehr deutlich;<br />

siehe etwa [3].<br />

7.4 Statistische Tests<br />

Die erzeugten Zahlen können durch Tests auf ihre Gleichverteilung untersucht wer<strong>den</strong>.<br />

Ergenbisse solcher Tests sind üblichreweise Maßzahlen, die in naheliegender Weise als<br />

Qualitätsangabe interpretiert wer<strong>den</strong> können. Manchmal ist es möglich, solche Maßzahlen<br />

mathematisch herzuleiten. Man spricht dann von theoretischen Tests (im Gegensatz<br />

zu empirischen Tests). Tests, die in <strong>Gebrauch</strong> sind:<br />

• Chi-Quadrat-Test<br />

• Kolmogorov-Smirnov-Test<br />

• Poker-Test<br />

• Run-Test<br />

Im Allgemeinen führen erst Kombinationen von Tests zu aussagekräftigen Ergebnissen.<br />

Wir besprechen <strong>den</strong> Chi-Quadrat-Test etwas genauer, zu <strong>den</strong> übrigen machen wir ein<br />

paar Anmerkungen.<br />

Der von Karl Pearson um 1900 herum entwickelte Chi-Quadrat-Test (χ 2 -Test) ist<br />

eines der ältesten <strong>und</strong> mächtigsten Testverfahren der Statistik. In der einfachsten Form<br />

dient es der Prüfung der Verträglichkeit von beobachteten relativen Häufigkeiten – hier<br />

in einer Zufallsfolge – mit hypothetischen Wahrscheinlichkeiten. Er testet nach Zuordnung<br />

der erzeugten <strong>Zufallszahlen</strong> zu Kategorien, ob die Kategorie der einer gegebenen<br />

Verteilung, hier die Gleichverteilung, entsprechende Anzahl enthält.<br />

Bei dem Problem der Zufallsfolgen sind wir in der Praxis genötigt, einen endlichen<br />

Abschnitt zu testen. Wir teilen dazu die vorliegen<strong>den</strong> <strong>Zufallszahlen</strong> x i , i = 1, . . . , n ,<br />

in disjunkte Kategorien Kj, j = 1, . . . , l, die <strong>den</strong> Raum der möglichen <strong>Zufallszahlen</strong><br />

ausschöpfen, ein. Das Eintreten der Kategorie Kj unter der Annahme der Gleichverteilung<br />

sei durch die Wahrscheinlichkeit pj gegeben; kj sei die Anzahl der <strong>Zufallszahlen</strong>, die der<br />

Kategorie Kj angehören. Damit ist auch klar, dass<br />

k1 + · · · + kl = n<br />

gilt. Diese I<strong>den</strong>tität begründet auch, dass man (nur) von l − 1 Freiheitsgra<strong>den</strong> in der<br />

” Testanordnung“ spricht. Das Ziel ist ein Test der einfachen Hypothese<br />

H0 : pj = kj<br />

n<br />

gegen die Alternative<br />

<strong>für</strong> jedes j = 1, . . . , l<br />

Stand: 21. November 2011 71 ○c J. Baumeister, T.G. Macedo


H1 : pj �= kj<br />

n<br />

<strong>für</strong> ein j ∈ {1, . . . , l} .<br />

7.4 Statistische Tests<br />

Die auf Pearson zurückgehende Idee besteht nun darin, eine handhabare Testgröße anzugeben,<br />

die es gestattet, bei einer kritischen Größe die Hypothese H0 (mit Recht) abzulehnen.<br />

Diese Testgröße ist<br />

χ 2 l� (kj − npj)<br />

:=<br />

2<br />

;<br />

npj<br />

j=1<br />

man nennt sie die χ 2 -Statistik mit l − 1 Freiheitsgra<strong>den</strong>. Wie aus der Darstellung ersichtlich,<br />

erhalten ” seltene Kategorien“ eine hohe Gewichtung <strong>und</strong> der χ 2 -Wert ist umso<br />

größer, je stärker die Abweichung zwischen beobachteter <strong>und</strong> theoretischer Verteilung<br />

ist. Wenn er eine bestimmte Schranke c überschreitet, so verwirft man die Hypothese<br />

der Übereinstimmung beider Verteilungen. Wie üblich, gibt man sich ein Testniveau<br />

α > 0 (zugelassene Wahrscheinlichkeit <strong>für</strong> einen Fehler erster Art) vor <strong>und</strong> passt dann<br />

die kritische Größe c an. Es ist nun der Vorteil des χ 2 -Tests, dass c aus einer Tabelle in<br />

Abhängigkeit von der Anzahl der Freiheitsgrade (<strong>für</strong> große n) <strong>und</strong> α abgelesen wer<strong>den</strong><br />

kann; siehe etwa [38], Seite 259. Zum Beispiel findet man <strong>den</strong> Tabellenausschnitt<br />

α 0.01 0.05 0.25 0.5 0.75 0.95 0.99<br />

n = 11 3.053 4.575 7.584 10.34 13.70 19.68 24.72<br />

Beispiel 7.11 Betrachte die Bitkette der Länge 50:<br />

10101 00000 01111 01000 10001 01011 00110 01000 10001 00010 .<br />

Wir fin<strong>den</strong> 19 1-Bits <strong>und</strong> 31 0-Bits. Da bei einer unterstellten Gleichverteilung <strong>für</strong> das<br />

Auftreten eines 1-Bits mit der Wahrscheinlichkeit 1 zu rechnen ist, erhalten wir <strong>für</strong> <strong>den</strong><br />

2<br />

χ2-Wert: χ 2 (19 − 25)2<br />

= +<br />

25<br />

(31 − 25)2<br />

=<br />

25<br />

36 36<br />

+ = 2.88 .<br />

25 25<br />

Die Tabelle in [38] weist als kritischen Wert c = 2.71 <strong>für</strong> α := 0.1 <strong>und</strong> c = 3.84 <strong>für</strong><br />

α = 0.05 aus (Freiheitsgrad =1). Damit lehnen wir die Hypothese zu H0 im Fall α := 0.1<br />

ab <strong>und</strong> verwerfen H0 im Fall α := 0.05 nicht. �<br />

Eine gewisse Verfeinerung des Chi-Quadrat-Tests stellt der Kolmogorov-Smirnov-<br />

Test dar; er ist ein statistischer Test auf Übereinstimmung zweier Wahrscheinlichkeitsverteilungen.<br />

Ein weiteres Hilfsmittel der Statistik, Verteilungseigenschaften nachzuprüfen, sind so<br />

genannte Run-Tests. Hier wird etwa untersucht, ob die Anzahl <strong>und</strong> Länge gleichbleibender/aufsteigender<br />

Zahlenfolgen in Übereinstimmung mit der Gleichverteilung sind.<br />

Der Poker-Test betrachtet Gruppen zu je 5 aufeinanderfolgen<strong>den</strong> Zahlen <strong>und</strong> beobachtet,<br />

welches der folgen<strong>den</strong> 7 Muster – manchmal betrachtet man nur 5 Fälle – mit<br />

dem Quintupel übereinstimmt. Wir machen dies deutlich mit dem Alphabet {a,b,c,d,e} .<br />

Die Muster sind:<br />

Poker-Kombination Wort-Kombination Erwartete Häufigkeit<br />

Alle verschie<strong>den</strong> abcde 0.302<br />

Ein Paar aabcd 0.504<br />

Zwei Paare aabbc 0.108<br />

Drei Gleiche aaabc 0.072<br />

Full house aaabb 0.009<br />

Vier gleiche aaaab 0.0045<br />

Fünf gleiche aaaaa 0.0001<br />

Stand: 21. November 2011 72 ○c J. Baumeister, T.G. Macedo


7.5 Anwendung von <strong>Zufallszahlen</strong>: One-Time-Pad<br />

Auf diese Anzahlen wird ein Chi-Quadrat-Test angewendet, um herauszufin<strong>den</strong>, ob die<br />

empirische Verteilung in Übereinstimmung mit der Gleichverteilung ist.<br />

7.5 Anwendung von <strong>Zufallszahlen</strong>: One-Time-Pad<br />

Auf Gilbert Sandford Vernam (1890-1960) geht ein (symmetrisches) Verschlüsselungsverfahren<br />

zurück, das nachweislich nicht geknackt wer<strong>den</strong> kann, wenn es fehlerfrei eingesetzt<br />

wird, das One Time Pad oder Einmal-Block-Verfahren oder Einmalschlüssel-Verfahren.<br />

Der Amerikaner Joseph O. Mauborgne (1881-1971) setzte diese Idee um <strong>und</strong><br />

nannte das Verfahren ” One-Time Pad“. Kurz darauf arbeiteten auch die Deutschen Werner<br />

Kunze, Rudolf Schauffler <strong>und</strong> Erich Langlotz an dieser Methode. Sie schlugen im Jahr<br />

1921 vor, Blöcke, die mit zufällig erstellten Ziffern bedruckt waren, zur Verschlüsselung<br />

der damaligen diplomatischen Codes zu verwen<strong>den</strong>. Seit dieser Zeit bis zum heutigen<br />

Tag, speziell auch während der Zeit des Kalten Krieges, wird dieses Verfahren verwendet.<br />

Beispielsweise war der Heiße Draht (auch als das ” Rote Telefon“ bekannt), also die hochsichere<br />

direkte Fernschreibverbindung zwischen dem amerikanischen Präsi<strong>den</strong>ten <strong>und</strong> dem<br />

sowjetischen Generalsekretär, durch ein Einmalschlüssel-Verfahren geschützt. Was hat<br />

diese Tatsache mit dem Thema <strong>Zufallszahlen</strong> zu tun?<br />

Das One-Time-Pad ist ein sicheres Verfahren zum Verschlüsseln von Daten mit Hilfe<br />

eines Schlüssels, der <strong>Zufallszahlen</strong> benötigt. Ein Schlüssel besteht aus mehreren zufällig<br />

ausgewählten Zahlen zum Verschlüsseln von kleinen Datenmengen. Bei der Realisierung<br />

muss der Schlüssel mindestens so lang sein wie die Nachricht selbst <strong>und</strong> er muss zufällig<br />

sein. Außerdem darf er nur ein einziges Mal verwendet wer<strong>den</strong>, da er sonst geknackt<br />

wer<strong>den</strong> kann <strong>und</strong> er muss genauso lang sein wie der Klartext.<br />

Der Ursprungstext, oder auch Klartext genannt, der meist aus Buchstaben besteht,<br />

wird in Zahlen umgewandelt. Dazu gibt man jedem Buchstaben des Alphabets die Nummer<br />

(aus 1, 2, . . . , 26), gezählt vom Anfang A zum Ende Z: A entspricht 1, B entspricht<br />

2, . . . , Z entspricht 26. Um eine Botschaft der Länge n zu verschlüsseln, schreibt man zuerst<br />

die in n Zahlen umgewandelten Buchstaben nebeneinander <strong>und</strong> addiert danach <strong>den</strong><br />

Schlüssel, bestehend aus n zufällig ausgewählten Zahlen. Das Ergebnis ist der Chiffretext,<br />

der zufällige, verschlüsselte Text. Wenn das Ergebnius bei einer Addition größer als 26<br />

ist, errechnet man <strong>den</strong> Rest mod 26. Die neu erhaltenen Zahlen sind neue Buchstaben,<br />

die verschlüsselte Botschaft. Hier ist ein Beispiel:<br />

H A L L O<br />

8 1 12 12 15 Ursprungstext/Klartext<br />

+ 6 15 10 8 18 Schlüssel<br />

14 16 22 20 33 mod 26<br />

14 16 22 20 7 Chiffretext<br />

Beim Entschlüsseln benötigt man <strong>den</strong> Chiffretext <strong>und</strong> <strong>den</strong> Schlüssel. Man addiert zuerst<br />

zu 26 <strong>den</strong> Chiffretext <strong>und</strong> subtrahiert dann <strong>den</strong> Schlüssel vom Ergebnis. Danach rechnet<br />

man das Ergebnis mod 26. Dieses Verfahren muss man mit jedem einzelnen Buchstaben<br />

des Klartextes machen.<br />

(26-Chiffretext-Schlüssel) mod 26 = Klartext<br />

In obigem Beispiel bedeutet dies:<br />

Stand: 21. November 2011 73 ○c J. Baumeister, T.G. Macedo


7.5 Anwendung von <strong>Zufallszahlen</strong>: One-Time-Pad<br />

(26 + 14 − 6) mod 26 = 8 H<br />

(26 + 16 − 15) mod 26 = 1 A<br />

(26 + 22 − 10) mod 26 = 12 L<br />

(26 + 20 − 8) mod 26 = 12 L<br />

(26 + 33 − 18) mod 26 = 15 O<br />

Abschließend noch die Bemerkung, dass <strong>Zufallszahlen</strong> nicht nur beim Verschlüsselungsverfahren<br />

” One time pad“ eine Rolle spielen. Sie sind präsent in nahezu jeder Realisierung<br />

von Verschlüsselungsverfahren.<br />

Bibliographische Anmerkungen<br />

Die Generation von <strong>Zufallszahlen</strong> mit Hilfe von Kongruenzgeneratoren geht auf D.H.<br />

Lehmer zurück; siehe [55]. Detailierte Darstellungen findet man u.a. in [32, 36, 49] <strong>und</strong><br />

[Wor11]. Die Modifikation ” Inverse Kongruenzgenerator“ wird in [29] untersucht. Die Beurteilung<br />

von Generatoren wird beleuchtet in [35].<br />

Das One-Time-Pad ist ein sicheres Verfahren zum Verschlüsseln von kleinen Datenmengen;<br />

als Referenz siehe etwa [15] <strong>und</strong> [Ber06]. Weitere Literatur zu Themen der Kryptographie<br />

sind [6, 16, 23, 47, 80].<br />

Stand: 21. November 2011 74 ○c J. Baumeister, T.G. Macedo


8 Monte Carlo-Methode<br />

Monte Carlo Metho<strong>den</strong> sind extrem schlecht; sie sollten<br />

nur dann verwendet wer<strong>den</strong>, wenn sämtliche Alternativen<br />

noch schlechter sind<br />

Alan Sokal, 1997<br />

In diesem Kapitel stellen wir die Monte Carlo-Methode, die wir in einer speziellen<br />

Situation bei der Berechnung von Flächen im Abschnitt 3.4 schon vorgestellt haben,<br />

in allgemeinerem Rahmen dar. Der Begriff ” Monte Carlo Methode“ kennzeichnet nicht<br />

einen Algorithmus, sondern eine Gruppe von numerischen Metho<strong>den</strong>, die <strong>Zufallszahlen</strong> zur<br />

approximativen Lösung oder zur Simulation verschie<strong>den</strong>er Prozesse einsetzen. Der Einsatz<br />

erfordert auch, dass wir auch Erzeugungsmetho<strong>den</strong> <strong>für</strong> <strong>Zufallszahlen</strong> mit allgemeinerer<br />

Verteilung kennenlernen. Damit ist eine Begründung da<strong>für</strong> geliefert, das Thema der Monte<br />

Carlo-Metho<strong>den</strong> <strong>und</strong> Fragestellungen der Finanzmathematik hier anzuführen.<br />

8.1 Gr<strong>und</strong>idee der Monte Carlo-Methode<br />

Monte-Carlo-Simulation ist ein Verfahren aus der Stochastik/Statistik, bei dem sehr<br />

häufig durchgeführte Zufallsexperimente die Basis darstellen. Es wird dabei versucht,<br />

mit Hilfe der Wahrscheinlichkeitstheorie analytisch nicht oder nur aufwändig lösbare Probleme<br />

numerisch zu lösen. Als Gr<strong>und</strong>lage ist vor allem das Gesetz der großen Zahlen zu<br />

sehen.<br />

Monte Carlo-Metho<strong>den</strong> benutzen zur Simulation von realen Vorgängen <strong>Zufallszahlen</strong>.<br />

Die <strong>Zufallszahlen</strong> können entweder durch Würfeln real oder durch <strong>Zufallszahlen</strong>generatoren<br />

erzeugt wer<strong>den</strong>. Im Allgemeinen ist der Aufwand, zu guten Ergebnissen zu gelangen,<br />

groß. Wir wer<strong>den</strong> sehen, dass sie sich gerade in der Berechnung von Optionspreisen die<br />

Monte Carlo-Simulation auf Gr<strong>und</strong> ihrer großen Flexibilität bewähren; siehe unten.<br />

Hier geben wir einen allgemeinen Überblick über Monte Carlo-Verfahren. Als Entdecker<br />

der Monte Carlo–Simulation gilt de Buffon 44 , der als erster die Kreiszahl π durch <strong>den</strong><br />

Wurf einer Nähnadel auf eine karierte Tischdecke berechnete. Seine Idee war, dass über<br />

<strong>den</strong> zufälligen Winkel zwischen Nadel <strong>und</strong> parallelem Karomuster der Tischdecke die Zahl<br />

π steckt. Mit dem 10 000-maligen Wurf der Nadel konnte er so die Zahl π auf mehrere<br />

Stellen genau berechnen.<br />

Die genaue Herkunft der Bezeichnung <strong>für</strong> dieses Verfahren ist umstritten. Enrico Fermi<br />

hatte in <strong>den</strong> 1930er Jahren die ersten Ideen zu Monte-Carlo-Simulationen. Fest steht,<br />

dass der Begriff ” Monte Carlo“ wohl das erste Mal im zweiten Weltkrieg als Deckname<br />

<strong>für</strong> eine geheime Forschung im Bereich des amerikanischen Atomwaffenprogramms<br />

(Manhattan-Projekt/Neutronendiffusion), an dem J. v. Neumann <strong>und</strong> S. Ulam beteiligt<br />

waren, verwendet wurde. Vermutlich wurde der Name von einem 1862 in Monaco gegründeten<br />

Spielcasino abgeleitet.<br />

Die Verfahren nach der Monte Carlo-Methode weisen in der Regel folgende Charakteristik<br />

auf:<br />

• Sie sind häufig die einzige Simulationsmethode, die in vernünftiger Rechenzeit brauchbare<br />

Resultate liefert.<br />

• Unter Einsatz von mehr Rechenzeit ist Approximationsgüte <strong>für</strong> die Lösung systematisch<br />

verbesserbar.<br />

44 G.L.L. de Buffon, 1707-1788<br />

Stand: 21. November 2011 75 ○c J. Baumeister, T.G. Macedo


8.1 Gr<strong>und</strong>idee der Monte Carlo-Methode<br />

Sie dienen als Näherungsmetho<strong>den</strong> u.a. bei folgen<strong>den</strong> Problemgruppen:<br />

• Analytische Lösung von Problemen rein mathematischer Herkunft, wie z.B. die Approximation<br />

der Kreiszahl π mit Hilfe des Buffonschen Nadelproblems oder der<br />

zufälligen ” Beregnung“ eines Quadrats mit Zufallspunkten, um die Fläche des Einheitskreises<br />

zu berechnen (siehe Abschnitt 3.4).<br />

• Simulation von Modellen wie etwa zur Optionspreisberechnung; siehe unten.<br />

• Nachbildung von komplexen Prozessen, die nicht direkt analysiert wer<strong>den</strong> können,<br />

wie etwa von Wetter/Klima <strong>und</strong> soziologischen Phänomenen.<br />

• Aufgaben der statistischen Physik.<br />

Als Gr<strong>und</strong>lage ist vor allem das Gesetz der großen Zahlen zu sehen. Die Zufallsexperimente<br />

können entweder etwa durch ” Würfeln“ real durchgeführt wer<strong>den</strong> oder durch Erzeugung<br />

von geeigneten <strong>Zufallszahlen</strong>. Computergenerierte Vorgänge können <strong>den</strong> Prozess in ausreichend<br />

hoher Anzahl von Zufallsereignissen simulieren.<br />

Als Gesetze der großen Zahlen wer<strong>den</strong> bestimmte mathematische Sätze aus der Stochastik<br />

bezeichnet. In ihrer einfachsten Form besagen diese Sätze, dass sich die relative<br />

Häufigkeit eines Zufallsergebnisses in der Regel der Wahrscheinlichkeit dieses Zufallsergebnisses<br />

annähert, wenn das zu Gr<strong>und</strong>e liegende Zufallsexperiment immer wieder durchgeführt<br />

wird. Formal handelt es sich also um Konvergenzsätze <strong>für</strong> Zufallsvariablen, zumeist<br />

unterteilt in unterschiedliche Qualitäten der Konvergenz (stark (fast sichere Konvergenz)<br />

<strong>und</strong> schwach (Konvergenz in Wahrscheinlichkeit)).<br />

Diese (unterstellte) Gesetzmäßigkeit haben wir schon in vielen Variationen genutzt:<br />

beim Münz- <strong>und</strong> Reißzweckenwurf, bei der Approximation der Kreiszahl π . Die Wahrscheinlichkeit,<br />

dass eine Münze beim Werfen Kopf zeigt, betrage 1 . Je häufiger die Münze<br />

2<br />

geworfen wird, desto unwahrscheinlicher wird es, dass der Anteil der Würfe, bei <strong>den</strong>en<br />

Kopf erscheint (also die relative Häufigkeit des Ereignisses Kopf“), um mehr als einen<br />

”<br />

beliebigen vorgegebenen Wert von der theoretischen Wahrscheinlichkeit 1<br />

2<br />

abweicht. Da-<br />

gegen ist es durchaus wahrscheinlich, dass die absolute Differenz zwischen der Anzahl<br />

der Kopf-Würfe <strong>und</strong> der halben Gesamtzahl der Würfe anwächst. Insbesondere besagen<br />

diese Gesetze der großen Zahlen nicht, dass ein Ereignis, welches bislang nicht so häufig<br />

eintrat wie erwartet, seinen Rückstand“ irgendwann ausgleichen <strong>und</strong> folglich in Zukunft<br />

”<br />

häufiger eintreten muss. Beispielsweise bedeutet bei fünf Würfen ein Verhältnis von 3:1<br />

<strong>für</strong> Kopf <strong>und</strong> Zahl – Kopf hat gewissermaßen einen Vorsprung von 2 – sind die relativen<br />

Häufigkeiten 3<br />

4<br />

bzw. 1<br />

4<br />

gegeben. Nach 96 weiteren Würfen stellt sich ein Verhältnis von 51<br />

Mal Kopf zu 49 Mal Zahl ein. Der Vorsprung von Kopf ist also nach 100 Würfen genauso<br />

groß wie nach vier Würfen, jedoch hat sich der relative Abstand von Kopf <strong>und</strong> Zahl stark<br />

verringert, beziehungsweise – <strong>und</strong> das ist die Aussage des Gesetzes der großen Zahlen –<br />

der Unterschied der relativen Häufigkeit von Kopf zum Erwartungswert von Kopf. Der<br />

= 0.75 .<br />

Wert 51<br />

100<br />

= 0.51 liegt sehr viel näher beim Erwartungswert 0.5 als 3<br />

4<br />

Kommen wir zu einer Formulierung des Gesetzes der großen Zahlen. Es handelt von<br />

einer Folge von Zufallsvariablen (Zn)n∈N auf einem gemeinsamen Wahrscheinlichkeitsraum<br />

Ω mit Wahrscheinlichkeitsmaß P ; über die Fragen Ereignisraum Σ, Messbarkeit setzen wir<br />

uns hinweg. Die n-te Partialsumme dieser Folge von Zufallsvariablen ist die Zufallsvariable<br />

Sn := 1<br />

n<br />

Stand: 21. November 2011 76 ○c J. Baumeister, T.G. Macedo<br />

n�<br />

k=1<br />

Zk


8.2 Simulation der Normalverteilung<br />

<strong>und</strong> wir interessieren uns <strong>für</strong> das asymptotische Verhalten dieses arithmetischen Mittels,<br />

also <strong>für</strong><br />

S := lim<br />

n∈N Sn .<br />

In <strong>den</strong> geforderten Voraussetzungen bezüglich der Zufallsfolge (Zn)n∈N <strong>und</strong> der Qualität<br />

der Konvergenz unterschei<strong>den</strong> sich die verschie<strong>den</strong>en Varianten des Gesetzes der großen<br />

Zahlen. Wir geben ein Resultat an<br />

Satz 8.1 (Starkes Gestz der großen Zahlen) Die Zufallsvariablen Zn mögen alle <strong>den</strong><br />

Erwartungswert µ besitzen. Unter geeigneten Voraussetzungen gilt:<br />

P (lim n Sn = µ) = 1 (39)<br />

Die Konvergenz in (39) nennt man die fast sichere Konvergenz. Was unter ” geeignete<br />

Voraussetzungen“ gemeint ist, lassen wir hier offen <strong>und</strong> verweisen dazu auf die Literatur.<br />

Im Kapitel 2 haben wir das Galtonbrett kennengelernt. Aus der Art, wie sich die Fächer<br />

füllen, stellt einen Zusammenhang her zur Gaußschen Glockenkurve. Dies lässt sich auch<br />

analytisch bestätigen mit dem Ergebnis, dass die so genannte Binomialverteilung als<br />

eine gute Approximation der Normalverteilung angesehen wer<strong>den</strong> kann.<br />

8.2 Simulation der Normalverteilung<br />

Die Normalverteilung ist ein Verteilungsmodell <strong>für</strong> kontinuierliche Zufallsvariablen. Sie<br />

wurde ursprünglich von C.F. Gauß 45 zum Umgang mit Meßfehlern entwickelt mit deqq<br />

m der so genannten Gaußschen Fehlerkurve“. Die Normalverteilung unterstellt eine<br />

symmetrische Verteilungsform in Form einer Glocke, bei der sich die Werte der Zufallsvariablen<br />

in der Mitte der Verteilung konzentrieren <strong>und</strong> mit größerem Abstand zur Mitte<br />

immer seltener auftreten.<br />

Die Normalverteilung ist das wichtigste Verteilungsmodell der Statistik <strong>und</strong> wird <strong>für</strong><br />

unterschiedlichste Zwecke verwendet: u.a. als deskriptives Modell zur Beschreibung empirischer<br />

Variablen, als Stichprobenverteilung des arithmetischen Mittels oder als Näherungslösung<br />

<strong>für</strong> viele andere Verteilungsmodelle. Die Normalverteilung nimmt eine Sonderstellung<br />

unter <strong>den</strong> Verteilungen ein. Dies hängt mit <strong>den</strong> vielfältigen Anwendungen <strong>und</strong>,<br />

damit einhergehend, der Gültigkeit des Zentralen Grenzwertsatzes zusammen.<br />

Zur (numerischen) Beschreibung der Normalverteilung benötigen wir die Dichtefunktion.<br />

Sie ist gegeben durch<br />

f(x) := fµ,σ(x) := 1<br />

√ 2πσ e −(x−µ)2 /(2σ 2 ) , x ∈ R . (40)<br />

Wie ergeben sich nun daraus die Verteilungsfunktion einer Zufallsvariablen, die normalverteilt<br />

ist? Hier ist der Zusammenhang in Worten:<br />

Die Wahrscheinlichkeit, dass ein Experiment <strong>den</strong> Ausgang x zwischen a, b mit<br />

a < b hat, wird durch die Fläche unter dem Graphen der Dichtefunktion<br />

beschrieben.<br />

In mathematischen Termen lautet diese Formulierung etwa so: Ist Z eine Zufallsvariable,<br />

die normalverteilt ist mit Erwartungswert µ <strong>und</strong> Standardabweichung σ, so ergibt sich<br />

die Wahrscheinlichkeit, dass Z Werte zwischen a, b mit a < b annimmt durch<br />

P (a < Z ≤ b) =<br />

� z<br />

−∞<br />

fµ,σ(x)dx =<br />

45 Carl Friedrich Gauß, 1777-1855<br />

� z<br />

−∞<br />

1<br />

√ 2πσ e −(x−µ)2 /(2σ 2 ) dx = N (µ, σ)(−∞, b) . (41)<br />

Stand: 21. November 2011 77 ○c J. Baumeister, T.G. Macedo


Hierbei haben wir N (µ, σ) als Abbildung auf R × R zu verstehen.<br />

Wir müssen hier <strong>den</strong> Integralbegriff<br />

unterstellen,<br />

�<br />

nur soviel: das Integral<br />

z<br />

− fµ,σ(x)dx berechnet die Fläche unterhalb<br />

des Graphen von fµ,σ zwischen <strong>den</strong><br />

Grenzen −∞ <strong>und</strong> z .<br />

Man nennt <strong>den</strong> Spezialfall µ = 0, σ =<br />

1 die Standard-Normalverteilung.<br />

Da aus jeder Normalverteilung durch<br />

Verschiebung <strong>und</strong> Skalierung eine Standard-Normalverteilung<br />

gemacht wer<strong>den</strong><br />

kann, reicht es, die Standard-<br />

Normalverteilung zu untersuchen.<br />

In der Abbildung 23 liegt der Fall<br />

a = µ − σ, b = µ + σ<br />

8.2 Simulation der Normalverteilung<br />

Abbildung 23: Normalverteilung<br />

vor. Die Prozentzahl 68.3 besagt, dass<br />

die Wahrscheinlichkeit, dass der Ausgang eines Experiments mit einer Wahrscheinlichkeit<br />

von 0.683 im Intervall (µ − σ, µ + σ) liegt. Verbreitert man das Fenster um <strong>den</strong> Erwartungswert<br />

µ zu (µ − 2σ, µ + 2σ), so erhöht sich die Wahrscheinlichkeit auf 0.954 . Man<br />

kann <strong>den</strong> Spieß auch umdrehen <strong>und</strong> fragen, welche Umgebung (µ − zσ, µ + zσ) etwa zu<br />

einer Wahrscheinlichkeit von 0.95 führt; sie wird realisiert mit z ≈ 1.96 . In der Literatur<br />

findet man Tabellen, die diesen Zusammenhang zum Inhalt haben; siehe [38].<br />

Es gibt ein einfaches Verfahren, aus gleichverteilten <strong>Zufallszahlen</strong> Zahlen zu konstruieren,<br />

die nach einer Standard-Normalverteilung verteilt sind. Dies geht so:<br />

Seien x1, . . . , xn, . . . gleichverteilte, unabhängig voneinander erzeugter <strong>Zufallszahlen</strong> im<br />

Intervall [0, 1] . Wir setzen<br />

�<br />

12<br />

y :=<br />

n (x1 + · · · + xn − n<br />

) .<br />

2<br />

konstruiert man auf diese Weise <strong>Zufallszahlen</strong> y1, . . . , yl, . . . , so sind diese <strong>Zufallszahlen</strong><br />

standard-normalverteilt; der zentrale Grenzwertsatz liefert <strong>den</strong> Beweis dazu. In der<br />

Praxis arbeitet man mit n = 12 . Diese Methode hat u.a. <strong>den</strong> Nachteil, dass <strong>für</strong> eine<br />

” normalverteilte Zufallszahl“ 12 gleichmäßig verteilte <strong>Zufallszahlen</strong> benötigt wer<strong>den</strong>.<br />

Seien X1, . . . , Xn gleichverteilte, unabhängige Zufallsgrößen auf dem Intervall [0, 1] .<br />

Wir wissen, dass der Erwartungswert einer gleichmäßig verteilten Zufallsgröße gleich 1/2<br />

<strong>und</strong> die Varianz gleich 1 ist. Wir setzen<br />

12<br />

�<br />

12<br />

Y :=<br />

n (X1 + · · · + Xn − n/2)<br />

<strong>und</strong> damit gilt<br />

E(Y ) =<br />

<strong>und</strong> in analoger Rechnung<br />

� 12<br />

n (<br />

n�<br />

E(Xi) − n/2) =<br />

i=1<br />

� 12<br />

n (<br />

n�<br />

i=1<br />

V(Y ) = 12<br />

n V<br />

�<br />

n�<br />

�<br />

Xi − n/2 = 1 .<br />

i=1<br />

1<br />

− n/2) = 0<br />

2<br />

Stand: 21. November 2011 78 ○c J. Baumeister, T.G. Macedo


8.3 Simulation der Aktienkurse<br />

Beachte V ( � n<br />

i=1 Xi) = � n<br />

i=1 V(Xi) auf Gr<strong>und</strong> der Tatsache, dass X1, . . . , Xn als unabhängig<br />

angenommen wur<strong>den</strong>. Der zentrale Grenzwertsatz besagt, dass Y eine Standard-<br />

Normalverteilung approximiert. In der Praxis wählt man n = 12 .<br />

Die eben beschriebene Methode hat u.a. <strong>den</strong> Nachteil, dass <strong>für</strong> eine ” normalverteilte<br />

Zufallszahl“ 12 gleichmäßig verteilte <strong>Zufallszahlen</strong> benötigt wer<strong>den</strong>. Ein besseres Verfahren<br />

ist das Box-Muller-Verfahren, das wir hier aber mathematisch nicht darstellen<br />

<strong>und</strong> begrün<strong>den</strong> können, da es tiefere Ergebnisse der Analysis schon in der Beschreibung<br />

erfordert. Wir geben es allerdings algorithmisch an. 46<br />

Algorithm 3 Box-Muller-Algorithmus<br />

EIN Zwei gleichverteilte Zufallsgrößen U1, U2 .<br />

Schritt 1 Setze θ := 2πU2 , ρ := � −2 ln(U1) .<br />

Schritt 2 Setze Z1 := ρ cos(θ) , Z2 := ρ sin(θ) .<br />

AUS Z1, Z2 sind unabhängige standard-normalverteilte Zufallsgrößen.<br />

Der Algorithmus ist numerisch recht aufwändig, da Wurzeln, trigonometrische Funktionen<br />

<strong>und</strong> der Logarithmus ausgewertet müssen. Die Polar-Methode von Marsaglia <strong>und</strong><br />

Bray ([60]) entledigt sich der trigonometrischen Funktionen.<br />

Algorithm 4 Marsaglia’s Polar-Methode<br />

EIN Zwei gleichverteilte Zufallsgrößen U1, U2 .<br />

Schritt 1 Setze Vi := 2Ui − 1 solange W := V 2<br />

1 + V 2<br />

2 < 1 .<br />

� �<br />

−2 ln(W )/W , Z2 := V2 −2 ln(W )/W .<br />

Schritt 2 Setze Z1 := V1<br />

AUS Z1, Z2 sind standard-normalverteilte Zufallsgrößen.<br />

Die Idee <strong>für</strong> die Approximation der Kreisfläche aus Abschnitt 3.4 ordnet sich hier<br />

ein. Wir legen über <strong>den</strong> Graphen der Dichte der Standard–Normalverteilung ein hinreichend<br />

breites Rechteck [−a, a] × [0, 1]; hinreichend meint, dass außerhalb des Intervalls<br />

[−a, a] die Werte der Dichte ” klein“ sind. Dann erzeugen wir N gleichverteilte Punkte<br />

(x1, y1), . . . , (xN, yN) ∈ [−a, a]×[0, 1] <strong>und</strong> akzeptieren davon die Punkte (˜x1, ˜y1), . . . , (˜xl, ˜yl),<br />

die innerhalb der Fläche des Graphens der Dichte zu liegen kommen. Die Punkte ˜x1, . . . , ˜xl<br />

sind dannn nahezu standard-normalverteilt. Diese so genannte Wegwerfmethode geht<br />

auf J. von Neumann (1951) zurück.<br />

8.3 Simulation der Aktienkurse<br />

Bevor wir über Optionen oder allgemein über Finanzderivate re<strong>den</strong> können, sollten wir<br />

über die ’ Zutaten“ re<strong>den</strong>, die hauptsächlich benötigt wer<strong>den</strong>: Aktien, Wertpapiere, Geldanlagen,<br />

Marktannahmen.<br />

46 Die trigonometrischen Funktionen sin, cos sollten hier zumindest ” tafelmäßig bekannt sein.<br />

Stand: 21. November 2011 79 ○c J. Baumeister, T.G. Macedo


Aktien<br />

8.3 Simulation der Aktienkurse<br />

Eine Aktie ist ein Anteil am Gr<strong>und</strong>kapital einer Gesellschaft <strong>und</strong> eine Urk<strong>und</strong>e, die dem<br />

Inhaber seine Rechte verbrieft. 47 Eine Aktiengesellschaft erhält durch <strong>den</strong> Verkauf von<br />

Anteilen des Unternehmens Kapital in Höhe des Aktienpreises, das im Gegensatz zum<br />

Kredit nicht zurückgezahlt wer<strong>den</strong> muss. Als Kompensation erhält der Aktionär/Aktienkäufer<br />

Anspruch auf Einbeziehung bei Divi<strong>den</strong><strong>den</strong>zahlungen, spezielle Bezugsrechte <strong>und</strong><br />

Mitbestimmungsrechte. Aktienausgaben stellen <strong>für</strong> Unternehmen alternative Quellen zur<br />

Fremdfinanzierung am Finanzmarkt dar.<br />

Die Erträge von Aktien sind in der Regel höher als risikolose Geldanlagen, sie sind<br />

aber auch mit höheren Risko behaftet. Das Risiko besteht darin, dass Aktien im Preis<br />

schwanken, an Wert verlieren können, ja sogar wertlos wer<strong>den</strong> können, wenn die Aktiengesellschaft<br />

ihre ” Existenz“ verliert. Die Risikoeinschätzung geht ein in die Einteilung<br />

nach ihrer Qualität:<br />

Blue Chips Aktien erstklassiger Unternehmen mit sehr guter Marktposition <strong>und</strong> Erfolg.<br />

Zyklische Aktien Aktien, die sehr stark konjunkturabhängig sind (Autowerte, Bauunternehmen,.<br />

. . ).<br />

Nebenwerte Aktien kleinerer <strong>und</strong> mittlerer Unternehmen mit heftigeren Kursbewegungen.<br />

Penny Stocks Extrem risikoreiche Aktien, deren Wert im ” Penny“–Bereich liegen.<br />

Aktien wer<strong>den</strong> hauptsächlich an <strong>den</strong> Börsen gehandelt. Ihre Kurswerte sind jedem<br />

” Kapitalinvestor“, insbesondere in Internetzeiten, zugänglich. Die Gründe <strong>für</strong> die Veränderung<br />

der Aktienkurse sind zum Teil objektiver Natur, zum Teil aber sehr schwer zu<br />

durchschauen. Beobachtet man die Kursentwicklung einer Aktie, so stellt man fest, dass<br />

sich meist zwei Effekte überlagern: langfristig bestimmender Trend <strong>und</strong> kurzfristige<br />

Einflüsse. Diese Erkenntnis wird im Allgemeinen durch je<strong>den</strong> Kursverlauf zumindest über<br />

bestimmte Zeiträume bestätigt.<br />

Festverzinsliche Wertpapiere<br />

Ein Wertpapier ist eine Urk<strong>und</strong>e, die ein Vermögensrecht verbrieft, etwa die Miteigentümerschaft<br />

an einem Unternehmen. Wertpapiere sind zum Beispiel Aktien, Anleihen,<br />

Schecks <strong>und</strong> Wechsel. Börsenfähige Wertpapiere wer<strong>den</strong> als Effekten bezeichnet.<br />

Unter festverzinslichen Wertpapieren (Kupon-Anleihen/Bonds) versteht man<br />

Kapitalanlagen, bei <strong>den</strong>en der Zinssatz über die gesamte Laufzeit völlig gleich bleibt <strong>und</strong><br />

schon im Vorhinein festgelegt wird, so dass der Anleger hiermit eine völlig risikofreie<br />

Geldanlage eingeht. Die Rendite, also das Verhältnis der Auszahlungen zu <strong>den</strong> Einzahlungen<br />

der Anlage, steht dabei also schon vor Ablauf der Vertragszeit genau fest. Der<br />

große Vorteil bei dieser Anlageform ist neben der Verlustsicherheit auch die Sicherheit bei<br />

der Planung. So weiß der Anleger stets ganz genau, welche Rendite er in welcher Zeit zu<br />

erwarten hat.<br />

Als festverzinsliche Wertpapiere wer<strong>den</strong> meistens Anleihen wie zum Beispiel Schuldverschreibungen<br />

ausgegeben. Sie dienen Staaten, <strong>Institut</strong>ionen <strong>und</strong> Unternehmen zur Fremdfinanzierung.<br />

Im Gegensatz zu Aktien, durch die der Investor Eigentümer wird, sind die<br />

Käufer festverzinslicher Wertpapiere Gläubiger <strong>und</strong> haben als solche nur Anspruch auf<br />

Zinsen <strong>und</strong> Tilgung des Anleihekapitals. Wir verwen<strong>den</strong> festverzinsliche Anleihe“ oder<br />

”<br />

” festverzinsliche Geldanlage“ synonym <strong>für</strong> festverzinsliches Wertpapier.<br />

47actio (lat.)= Handlung, übertragen einklagbarer Anspruch.<br />

”<br />

Stand: 21. November 2011 80 ○c J. Baumeister, T.G. Macedo


8.3 Simulation der Aktienkurse<br />

Regel 8.2 (Verzinsung) Der Wert B(t) eines festverzinslichen Wertpapiers vom Betrage<br />

B(0) mit einem jährlichen Zinssatz r beträgt nach t Jahren<br />

• bei einmaliger Verzinsung pro Jahr: B1(t) = B(0)(1 + r) t<br />

• bei m-maliger Verzinsung pro Jahr: Bm(t) = B(0)(1 + r<br />

m )tm<br />

• bei kontinuierlicher Verzinsung: B∞(t) = B(0)e rt<br />

Die Formel <strong>für</strong> B∞ folgt als Grenzwert: B∞(t) := limm→∞ Bm(t) .<br />

Unter Diskontierung (Abzinsung) versteht man <strong>den</strong> zur Verzinsung umgekehrten<br />

Vorgang.<br />

Regel 8.3 (Diskontierung) Der Wert B(0) eines festverzinslichen Wertpapiers vom<br />

Betrage B(t) zur Zeit t mit einem jährlichen Zinssatz r beträgt<br />

• bei m-maliger Verzinsung pro Jahr: B(0) = B(t)(1 + r<br />

m )−tm<br />

• bei kontinuierlicher Verzinsung: B(0) = B(t)e −rt<br />

Approximation der Aktienkurse<br />

Die Preisänderungen auf <strong>den</strong> Finanzmärkten sind eigentlich keine stetigen Prozesse: es<br />

gibt üblicherweise kleinste Geldeinheiten, um welche die Preisänderungen mindestens von<br />

Statten gehen müssen (also stückweise stetig). Zum anderen ändert sich der Preis nicht<br />

permanent, sondern bleibt während einer gewissen kurzen Zeit konstant. Man hat also<br />

in der Realität Prozesse, welche stückweise stetig sind <strong>und</strong> auf diesen stetigen Zwischenstücken<br />

sind sie erst noch konstant (Treppenfunktionen)! Andererseits sind diese<br />

Preisänderungen normalerweise derart häufig <strong>und</strong> die Änderungen im Vergleich zum ganzen<br />

Preis derart klein, dass je nach Problemstellung doch ein Prozess in stetiger Zeit <strong>und</strong><br />

mit stetigem Zustandsraum angebracht ist. Als weiterer Vorteil kommt noch dazu, dass<br />

wir in <strong>den</strong> Modellen stetiger Zeit explizitere Formeln erhalten als in <strong>den</strong> Modellen in<br />

diskreter Zeit. Trotz alledem, wir skizzieren im Folgen<strong>den</strong> die Approximation der Aktienkurse<br />

in diskreter Zeit, leiten diese allerdings aus einem kontinuierlichen Modell ab, dem<br />

so genannten Black–Scholes–Modell.<br />

Die Brownsche Bewegung, die zentral in der Modellierung der Aktienkurse ist,<br />

wird in der Physik zur Modellierung der Bewegung eines Teilchens (Molekül) in einer<br />

Flüssigkeit oder einem Gas eingesetzt; die Bewegung kommt dann durch Zusammenstöße<br />

von Molekülen zustande. Die Brownsche Bewegung nennt man auch Wiener-Prozess.<br />

Der Name ” Brownsche Bewegung“ stammt vom schottischen Botaniker Brown 48<br />

Aktienkurse haben die Ten<strong>den</strong>z zu steigen“. Dadurch wer<strong>den</strong> auch die Ausschläge<br />

”<br />

nach oben <strong>und</strong> nach unten immer größer. Deshalb macht es Sinn, die relativen Zuwächse<br />

zu betrachten. Es ist nun die Gr<strong>und</strong>annahme, dass sich die so genannten Log-returns<br />

� �<br />

St+∆t − St<br />

ln<br />

additiv aus einem deterministischen Term, der <strong>für</strong> die ” makroskopische Drift“ zuständig<br />

ist, <strong>und</strong> einen stochastischen Term, der <strong>für</strong> die ” unvorhersagbaren Ausschläge“ verantwortlich<br />

ist. 49 Dabei ist ∆t ein (kleiner) Zeitschritt.<br />

Unter <strong>den</strong> folgen<strong>den</strong> Annahmen (<strong>und</strong> weiteren stochastischen Gr<strong>und</strong>voraussetzungen)<br />

48 Brown, R., 1773-1858. Die Herkunft des Namens wird zwar korrekterweise meist mit<br />

Brown in Verbindung gebracht, die Geschichte der Herkunft des Namens findet sich auf<br />

http://www.sciences.demon.co.uk/wbbrowna.htm.<br />

49 Dieses Modell <strong>für</strong> die Bewertung von Optionen geht auf P. Samuelson (1915-2009) zurück; siehe [74].<br />

Er erhielt 1970 <strong>den</strong> Nobelpreis <strong>für</strong> Wirtschaftswissenschaften.<br />

Stand: 21. November 2011 81 ○c J. Baumeister, T.G. Macedo<br />

St


8.4 Simulation von Optionen<br />

• das Basisobjekt hat eine konstante Volatilität σ, d.h. die Varianz der Renditen<br />

wächst wie σ2O(∆t) . � �<br />

∆St<br />

V = σ 2 O(∆t) ;<br />

siehe unten.<br />

St<br />

• die Renditen sind normalverteilt, also<br />

∆St<br />

St<br />

∼ N (µ∆t, σ √ ∆) ,<br />

können wir das Modell so hinschreiben:<br />

� �<br />

St+∆t<br />

ln ∼ N ((µ − 1<br />

2 σ2 )∆t, σ √ ∆) .<br />

St<br />

Wir diskretisieren nach der expliziten Euler-Methode, welche im Zusammenhang<br />

mit stochastischen Differentialgleichungen das Verfahren von Euler-Maruyama heißt.<br />

Die auftreten<strong>den</strong> infinitesimalen Inkremente wer<strong>den</strong> dabei durch finite Zuwächse ersetzt.<br />

Dazu wählen wir ein Zeitgitter 0 = t0 < t1 < · · · < tN = T <strong>und</strong> führen die Bezeichnungen<br />

∆tj := tj+1 − tj, Sj := Stj<br />

ein. Damit stellt sich das Diskretisierungsverfahren so dar:<br />

Sj+1 = Sj + µ∆tj + σ 2 �<br />

zj ∆tj , j = 0, . . . , N − 1 . (42)<br />

Dabei ist zj jeweils eine Zufallszahl, die standard-normalverteilt ist.<br />

Algorithm 5 Simulation mit dem Euler–Maruyama-Verfahren<br />

EIN Zeitgitter 0 = t0 < t1 < · · · < tN = T . ∆j := tj+1 − tj , j = 0, . . . , N − 1 .<br />

Volatilitätskonstante σ, Driftterm µ, Basiskurs S0 zur Zeit t = 0 .<br />

Mechanismus zur Erzeugung von standard-normal-verteilten <strong>Zufallszahlen</strong>.<br />

Schritt 1 Für k = 0, . . . , N − 1:<br />

• erzeuge eine Zufallszahl u k ;<br />

• setze Sk+1 := Sk + µ∆j + ujσ 2� ∆j<br />

AUS Diskrete Approximation S0, . . . , SN des Aktienkurses in [0, T ] .<br />

8.4 Simulation von Optionen<br />

Optionen<br />

Eine europäische call option ermöglicht dem Besitzer einen Finanztitel zu einem bestimmten<br />

Zeitpunkt (maturity) zu einem bestimmten Preis (strike price) zu erwerben.<br />

Zu beachten ist, dass hier nur die Möglichkeit eingeräumt wird, jedoch muss der Besitzer<br />

dieser Option sie nicht wahrnehmen.<br />

Betrachten wir nun einen Investor der eine call option <strong>für</strong> IBM Aktien mit einem strike<br />

price von 100 $ kauft. Der aktuelle Aktienpreis liegt bei 98 $, die Laufzeit beträgt 2 Monate<br />

<strong>und</strong> der Preis der call Option ist 5 $. Falls die Aktie nach Ende der Laufzeit weniger als<br />

Stand: 21. November 2011 82 ○c J. Baumeister, T.G. Macedo


8.4 Simulation von Optionen<br />

100 $ wert ist, wird der Investor seine Option sicher nicht einlösen. (Es wäre wohl sinnlos<br />

eine Aktie welche weniger als 100 $ wert ist um 100 $ zu kaufen!). In diesem Fall verliert<br />

der Investor sein ursprüngliches Investitionskapital von 5 $. Falls der Aktienpreis nun<br />

z.B. bei 115 $ liegt, wird er von seinem Kaufrecht um 100 $ jedoch sicherlich <strong>Gebrauch</strong><br />

machen. Er macht somit 15 15 -5 $, also 10 $ Reingewinn (net profit).<br />

Eine Option ist ein Vertrag, der seinen Besitzer (Inhaber der Option) das<br />

Recht einräumt, eine bestimmte Menge eines bestimmten Gutes (Basisobjekt)<br />

zu einem festgelegten Preis, dem Ausübungspreis (strike) zu kaufen<br />

(Call, Kaufoption) bzw. zu veräußern (Put, Verkaufsoption). Für dieses<br />

Recht zahlt der Käufer der Option dem Verkäufer eine Prämie, <strong>den</strong> Optionspreis.<br />

Wer eine Kaufoption (Call Option) besitzt, hat das Recht (aber nicht die Pflicht!)<br />

einen in der Option beschriebenen Basiswert (Aktie, Währung, . . . ) zu einem im voraus<br />

bestimmten fixen Preis, dem Ausübungspreis zu kaufen. Wer eine Verkaufsoption<br />

(Put Option) besitzt, hat das Recht (aber nicht die Pflicht!) einen in der Option beschriebenen<br />

Basiswert (Aktie, Währung, . . . ) zu einem im voraus bestimmten fixen Preis,<br />

dem Ausübungspreis, verkaufen. Wer eine Option kauft, der hat eine Long-Position.<br />

Wer eine Option verkauft, der hat eine Short-Position. Es wer<strong>den</strong> vorwiegend amerikanische<br />

Optionen gehandelt!<br />

Bewertung von Optionen<br />

Wir betrachten ein Optionsgeschäft <strong>für</strong> Aktien. Es werde mit V der Optionspreis, mit<br />

St der Kurs des Basisobjekts zur Zeit t, mit T die Laufzeit, mit K der Ausübungspreis<br />

<strong>und</strong> mit ST der Kurs der Aktie (Basiswert) am Fälligkeitstag bezeichnet. Ist ST > K<br />

(die Option ist ” in the money“), so kann der Besitzer der Option die Aktie zum Preis<br />

K erwerben <strong>und</strong> sofort zum höheren Preis ST am Markt verkaufen. Er erzielt dann eine<br />

Auszahlung (payoff) in Höhe von ST − K (unter Vernachlässigung von Transaktionskosten).<br />

Ist ST < K (die Option ist ” out of the money“), so lässt der Besitzer der Option<br />

sein Recht verfallen, selbst wenn er Interesse am Kauf dieser Aktie hätte. Es ist nämlich<br />

dann günstiger, die Aktie am Markt zum Preis ST zu erwerben. In diesem Fall ist die<br />

Auszahlung <strong>für</strong> die Option gleich Null. Der Fall ST = K (die Option ist ” at the money“),<br />

ist eine Situation, die wie der Fall ST < K zu behandeln ist.<br />

Zusammengefasst ergibt sich <strong>für</strong> <strong>den</strong> Besitzer der Option eine ” Auszahlung“ zum Zeitpunkt<br />

T in Höhe von<br />

(ST − K) +<br />

wobei h + := h, falls h ≥ 0, h + := 0, falls h < 0 ist.<br />

Aus <strong>den</strong> obigen Ausführungen können wir schließen, dass eine Option <strong>ihrem</strong> Besitzer<br />

eine nichtnegative Auszahlung zusichert, die in ihrer Höhe allerdings unsicher ist. Daher ist<br />

es verständlich, dass man <strong>für</strong> <strong>den</strong> Erwerb einer Option eine Zahlung, die Optionsprämie,<br />

leisten muss. Die Auszahlung ist also um <strong>den</strong> Wert der Optionsprämie zu mindern, genauer<br />

um <strong>den</strong> verzinsten Wert der Optionsprämie, um <strong>den</strong> Gewinn/Verlust zu ermitteln.<br />

Hier haben wir ein Optionsgeschäft beschrieben, das man europäisch nennt. Bei einem<br />

amerikanischen Optionsgeschäft kann man zu jedem Zeitpunkt in [0, T ] entschei<strong>den</strong>,<br />

ob man das Recht ausüben will. Es ist offensichtlich, dass <strong>für</strong> eine amerikanische Option<br />

eine höhere Optionsprämie zu entrichten sein sollte, bietet sie doch mehr Rechte.<br />

Stand: 21. November 2011 83 ○c J. Baumeister, T.G. Macedo


Das Ein-Perio<strong>den</strong>-Modell<br />

8.4 Simulation von Optionen<br />

Das Problem im (seriösen) Optionshandel ist, die Optionsprämie zu berechnen, d.h. <strong>den</strong><br />

Preis der Option zum Zeitpunkt t = 0 festzusetzen, <strong>und</strong>, um <strong>den</strong> Handel mit der Option,<br />

solange sie noch nicht ausgeübt ist, zu ermöglichen, zu jedem Zeitpunkt t <strong>den</strong> Wert<br />

der Option zu bestimmen. Die Schwierigkeit besteht darin, dass man <strong>den</strong> Verlauf des<br />

Aktienkurses über <strong>den</strong> Laufzeitraum nicht kennt.<br />

Wir machen uns die Problematik an einem einfachen Modell klar, dem sogenannten<br />

Ein-Perio<strong>den</strong> -Binomialmodell. Zur Frage der Festsetzung des Optionspreises wird ein<br />

Wertpapierdepot, auch Portfolio genannt, gebildet, das folgendermaßen zusammenzusetzen<br />

ist:<br />

Aktiendepot der betreffen<strong>den</strong> Aktie, festverzinsliche Anleihe.<br />

Es ist nicht überraschend, dass nun Anleihen ins Spiel kommen, müssen doch die Aktien<br />

bzw. die Optionsprämie finanziert wer<strong>den</strong>.<br />

Wir kaufen also einen Bruchteil 50 ∆ der Aktie auf, <strong>und</strong> finanzieren die Geschäfte durch<br />

die Aufnahme eines Kredits B. Zum Zeitpunkt T = 1 verfalle die Option, deren Preis wir<br />

ermitteln wollen, d.h. T = 1 ist die Laufzeit. Diesen Preis setzen wir dann als Wert<br />

des Depots zum Zeitpunkt t = 0 fest, dessen quantitative Zusammensetzung wir noch<br />

nicht kennen, da ∆ <strong>und</strong> B noch unbekannt sind. Man spricht bei diesem Vorgehen von<br />

einer Duplikationsstrategie. Dabei ist es notwendig, neben <strong>den</strong> angegebenen Daten die<br />

Verzinsung <strong>für</strong> risikolose Geldaufnahmen <strong>und</strong> Geldanlagen zu kennen.<br />

Im weiteren wird angenommen, dass der konstante Zinssatz <strong>für</strong> risikofreie Anlagen <strong>für</strong><br />

eine Periode am Markt r ist, dass der Aufzinsungsfaktor bei einmaliger Verzinsung also<br />

gerade z := 1 + r ist. Offen ist die Kursentwicklung der Aktie. Das einstufige Binomialmodell<br />

besteht nun darin, anzunehmen, dass der Kurs der Aktie mit Wahrscheinlichkeit q<br />

auf <strong>den</strong> Wert uS0 steigt <strong>und</strong> mit Wahrscheinlichkeit 1 − q auf <strong>den</strong> Wert lS0 fällt; also<br />

u > 1, 0 < l ≤ 1 . Das Diagramm 24 gibt die Entwicklung des Portfolios wieder. Dabei<br />

gehen wir davon aus, dass lS0 ≤ K ≤ uS0 gilt (um hier anderen Annahmen über <strong>den</strong><br />

Markt aus dem Wege zu gehen). Die Optionsprämie wird nun so festgesetzt, dass<br />

Endwert des Duplikationsdepots = Auszahlungswert der Option<br />

erfüllt ist. Dies führt auf zwei Gleichungen <strong>für</strong> die Unbekannten ∆ <strong>und</strong> B :<br />

Hieraus folgt:<br />

l∆S0 − zB = 0 , u∆S0 − zB = uS0 − K .<br />

∆ = uS0 − K<br />

, B =<br />

(u − l)S0<br />

l(uS0 − K)<br />

.<br />

(u − l)z<br />

Nun ist die Zusammensetzung des äquivalenten Portfolios bekannt <strong>und</strong> die Optionsprämie<br />

C0 berechenbar:<br />

C0 = ∆S0 − B .<br />

Beachte: Die Wahrscheinlichkeit q geht gar nicht ein.<br />

Das obige einstufige Modell ist nur von theoretischem Wert. Ersetzt man nun die einmalige<br />

Preisänderung der Aktien durch eine endliche Anzahl n von Änderungen im Zeitraum<br />

[0, T ] kommt man einer kontinuierlicher Preisänderung schon nahe; die Analyse des<br />

50 In der Wirklichkeit erwirbt man ein Paket von Optionen, die Anzahl der aufzukaufenen<strong>den</strong> Aktien<br />

wird dann auch eine ganze Zahl.<br />

Stand: 21. November 2011 84 ○c J. Baumeister, T.G. Macedo


8.4 Simulation von Optionen<br />

Portfoliobewegung Wert des Portfolios Wert des Portfolios<br />

t = 0 T = 1<br />

Aktie kaufen, t = 0 ∆S0 l∆S0 u∆S0<br />

Anleihe aufnehmen, t = 0 −B −zB −zB<br />

Summe ∆S0 − B l∆S0 − zB u∆S0 − zB<br />

Beachte die Annahme S0 ≤ K ≤ uS0<br />

Abbildung 24: Duplikationsstrategie<br />

Auszahlung<br />

T = 1<br />

0 uS0 − K<br />

Modells birgt keine neuen Schwierigkeiten, nur der Aufwand wird größer. Dieses so entstehende<br />

so genannte n-Perio<strong>den</strong>-Modell wird Cox-Ross-Rubinstein-Modell (1979)<br />

genannt.<br />

Wir wollen nun Annahmen über <strong>den</strong> zugr<strong>und</strong>eliegen<strong>den</strong> Finanzmarkt anführen. Sie gilt<br />

es immer im Auge zu behalten, wenn man Diskrepanzen zwischen Modell <strong>und</strong> Wirklichkeit<br />

diskutieren will 51 .<br />

Marktannahmen <strong>und</strong> Marktbegriffe<br />

Regel 8.4 ( ” Geschäftsbedingungen“)<br />

• Alle Investoren haben <strong>den</strong> selben Informationsstand <strong>und</strong> können verzögerungsfrei<br />

handeln,<br />

• Investoren handeln rational <strong>und</strong> ziehen ein größeres Vermögen einem kleineren vor,<br />

• es wer<strong>den</strong> keine Transaktionskosten <strong>und</strong> Steuern berücksichtigt,<br />

• der Wertpapier– bzw. Optionshandel ist zu jedem Zeitpunkt möglich,<br />

• Leerverkäufe (Verkauf eines Basiswertes, <strong>den</strong> man noch nicht besitzt, aber später<br />

liefert) sind möglich,<br />

• gewünschte Transaktionen können in beliebigem Umfang ohne Rückwirkungen auf<br />

die Kursentwicklung durchgeführt wer<strong>den</strong>,<br />

• Wertpapiere sind beliebig teilbar,<br />

• Wertpapiere stehen in beliebiger Menge zur Verfügung (Liquidität),<br />

• die Verzinsung <strong>für</strong> festverzinsliche Anleihen <strong>und</strong> Geldanlagen erfolgt nach demselbem<br />

Zinssatz. Zusätzlich vereinbaren wir eine kontinuierliche Verzinsung (eine Vereinbarung,<br />

die nicht zwingend wäre, beachte aber, dass daraus quantitative Konsequenzen<br />

sich ergeben).<br />

Regel 8.5 (Arbitragefreiheit) Der Markt lässt keine Arbitragemöglichkeiten zu.<br />

Regel 8.6 (Modellierbarkeit) Der Markt, bestehend aus Wertpapieren, Anleihen, Optionen,<br />

. . . kann durch ein Modell abgebildet wer<strong>den</strong>.<br />

51 Der Zoologe Thomas Huxley schreibt: Die Tragödie der Wissenschaft - das Erschlagen einer schönen<br />

Hypothese durch eine hässliche Tatsache<br />

Stand: 21. November 2011 85 ○c J. Baumeister, T.G. Macedo


8.4 Simulation von Optionen<br />

Unter einem Leerverkauf (short selling) versteht man eine Handelsstrategie, bei<br />

der ein Teilnehmer am Finanzgeschehen (Investor) Objekte, die er nicht besitzt, verkauft<br />

<strong>und</strong> sie später zurückkauft. 52<br />

Eine Arbitragemöglichkeit ist eine Handelsstrategie, die keine Anfangsinvestitionen<br />

benötigt <strong>und</strong> mit positiver Wahrscheinlichkeit einen Gewinn ergibt, ohne das Risiko eines<br />

Verlustes zu beinhalten. Etwas formaler:<br />

Sei I(t) die Entwicklung des Vermögens eines Investors über <strong>den</strong> Zeitraum<br />

[0, T ] . Man sagt, dass eine Arbitragemöglichkeit <strong>für</strong> <strong>den</strong> Investor besteht,<br />

falls es möglich ist, dass er mit dem Vermögen I(0) startet <strong>und</strong> <strong>für</strong> sein Endvermögen<br />

I(T )<br />

I(T ) ≥ I(0) , Wahrscheinlichkeit({I(T ) > I(0)}) > 0<br />

gilt. Hierbei wird I(t), t ∈ [0, T ], als Zufallsgröße aufgefasst.<br />

Rendite, Risiko <strong>und</strong> Volatilität<br />

Rendite bezeichnet <strong>den</strong> Gesamterfolg einer Kapitalanlage, gemessen als tatsächliche Verzinsung<br />

des eingesetzten Kapitals. Sie beruht auf <strong>den</strong> Ertragseinnahmen (z.B. Zinsen,<br />

Divi<strong>den</strong><strong>den</strong>, realisierte Kursgewinne) <strong>und</strong> <strong>den</strong> Kursveränderungen. Die Rendite soll erkennbar<br />

machen, wie gut sich eine früher angelegte Kapitalanlage entwickelt hat. Rendite<br />

wird meist in Prozent <strong>und</strong> jährlich angegeben.<br />

Mit dem Begriff Risiko bezeichnet man<br />

in der Finanzwelt die Unsicherheit, mit<br />

der die erwarteten Renditen auch wirklich<br />

eintreten. Je stärker das Risiko einer<br />

Anlageform ist, um so stärker schwankt<br />

die Wertentwicklung im Zeitverlauf <strong>und</strong><br />

umgekehrt.<br />

Abbildung 25: DAX-Verlauf im April 2011<br />

53 Das Instrument um diese<br />

Unregelmäßigkeit oder Flatterhaftigkeit<br />

der Renditeentwicklungen zu messen,<br />

ist die sogenannte Volatilität54 . Sie<br />

misst die Schwankungsbreite des Kurses<br />

des Basiswertes <strong>für</strong> Kursbewegungen innerhalb<br />

eines bestimmten Zeitrahmens.<br />

Üblicherweise wird sie mit σ bezeichnet.<br />

Die Volatilitätsgröße ist keine direkt beobachtbare<br />

Größe. Sie ist daher aus Marktdaten<br />

zu schätzen“. Man unterscheidet zwi-<br />

”<br />

schen historischer <strong>und</strong> impliziter Volatilität<br />

unterschei<strong>den</strong>, solange wir die Volatilität als eine Konstante betrachten.<br />

Die Aufgabe eines Investment-Analysten ist nun die Zusammenstellung eines Portfolios<br />

aus Finanztiteln, welches einen möglichst guten Kompromiss zwischen Risiko <strong>und</strong><br />

52 Aus der FAS am 31. Juli 2011, S. 38: Dabei dürfte es solche hohen Preise eigentlich nicht geben. In<br />

einem effizienten Markt sollte jede Überschätzung des Kurses sofort professionelle Investoren auf <strong>den</strong> Plan<br />

rufen, die mit so genannten Leerverküfen auf fallende Kurse spekulieren <strong>und</strong> gleichzeitig <strong>den</strong> Aktienkurs<br />

zurückstutzen.<br />

53 Diese Binsenweisheit wollen nicht alle akzeptieren <strong>und</strong> reissen damit sich (o.k.) <strong>und</strong> andere, ja ganze<br />

Staaten ins Unglück. Man sollte sich an folgende Weisheit (Andrè Kostelany) halten: Man sollte wissen,<br />

dass hinter <strong>den</strong> Fassa<strong>den</strong> großer Finanzinstitute keine Musterknaben sitzen.<br />

54 lat. volare: fliegen; volatilis: fliegend, flüchtig<br />

Stand: 21. November 2011 86 ○c J. Baumeister, T.G. Macedo


8.5 Simulationen von Optionen<br />

möglichem Gewinn darstellt. Da<strong>für</strong> benötigt er eine Abschätzung des Wertes der Option,<br />

welche von der Preisentwicklung der ihr zugr<strong>und</strong>eliegen<strong>den</strong> Aktie abhängt.<br />

8.5 Simulationen von Optionen<br />

Mit dem oben skizzierten Rechenvorschriften können wir viele“ Approximationen SN <strong>für</strong><br />

”<br />

. Damit stehen uns auch die Auszahlungen<br />

<strong>den</strong> Basiskurs ST errechnen, etwa S1 N , . . . , SM N<br />

(S1 N − K)+ , . . . , (S1 N − K)+ zur Verfügung. Eine Approximation CN,M <strong>für</strong> <strong>den</strong> zu ermitteln<strong>den</strong><br />

Optionspreis besteht nun im Mittelwert dieser Auszahlungen, diskontiert auf <strong>den</strong><br />

Zeitpunkt t = 0:<br />

−rT 1<br />

C0 := e<br />

M<br />

M�<br />

j=1<br />

(S j<br />

N<br />

− K)+<br />

Die Qualität der Diskretisierung hängt von <strong>den</strong> Parametern N, M ab: N sollte groß sein,<br />

damit der ” Pfad“ der Aktienkurse gut approximiert wird, M sollte groß sein, damit die<br />

Qualität der Mittelwertsberechnung hoch ist. Bei Berücksichtigung dieser Forderungen<br />

entsteht ein hoher Rechenaufwand. Den Beweis, dass dieses Vorgehen realisiert <strong>und</strong> mathematisch<br />

abgesichert wer<strong>den</strong> kann, müssen wir übergehen.<br />

Bibliographische Anmerkungen<br />

Die Monte Carlo-Metho<strong>den</strong> sind beschrieben in ganz unterschiedlichen Disziplinen der<br />

Wissenschaften: im Kontext Physik siehe [18], in der <strong>Mathematik</strong> als Methode der Integration<br />

siehe etwa [64], als Werkzeug in der Finanzmathematik siehe [37].<br />

Zur Normalverteilung <strong>und</strong> ihrer Approximation durch die Normalverteilung siehe etwa<br />

[38, 21, 51]. Zur Simulation der Normalverteilung siehe [37, 36].<br />

Die Theorie zur approximativen Lösung von stochastischen Differentialgleichungen ist<br />

ein extrem schnell wachsendes Gebiet; siehe [25, 48].<br />

Als ” einfachster Zugang“ zur Modellierung von Bewertungsmodellen <strong>für</strong> Optionen kann<br />

[24] angesehen wer<strong>den</strong>. Die Bewertung von Optionen wird elementar beschrieben etwa in<br />

[19, 41, 53].<br />

Stand: 21. November 2011 87 ○c J. Baumeister, T.G. Macedo<br />

(43)


9 Sierpinski-Mengen<br />

Für einen Zufallsgenerator braucht man einen richtigen<br />

Samen ( ” Seed“). Wer kennt <strong>den</strong> weltweit zufälligsten ?<br />

Eintrag in einem Forum zum Thema Gutes Chaos ist<br />

verdammt teuer !<br />

Das Sierpinski-Dreieck 55 ist eine geometrische Figur, die die Eigenschaft des Fraktals 56<br />

besitzt. Es kann unter Zuhilfenahme von <strong>Zufallszahlen</strong> auf unterschiedliche Weise erzeugt<br />

wer<strong>den</strong>; der Zusammenhang mit dynamischen Systemen wird dabei offensichtlich.<br />

Da der Zufall benutzt wird, kann die Konstruktion als Test <strong>für</strong> Pseudozufallszahlen<br />

verwendet wer<strong>den</strong>; wir gehen diesem Ansatz aber nicht eigentlich nach.<br />

9.1 Sierpinski-Dreieck<br />

Viele Formen der Natur lassen sich nicht mit <strong>den</strong> klassischen geometrischen Körpern ausreichend<br />

beschreiben: eine Wolke ist keine Kugel, ein Baum kein Kegel, ein Blitz keine Linie,<br />

ein Farn kein Dreieck. Bei genauerem Hinsehen entdecken wir oft Selbstähnlichkeit<br />

<strong>und</strong> eine zerbrochene Struktur. Selbstähnlichkeit bedeutet, dass man die Form eines<br />

Objekt in sich selbst wieder auf kleinerer Skala wiederfindet, oder etwas mehr formal:<br />

Eine Struktur/Objekt heißt selbstähnlich genau dann, wenn sie in Teile zerlegt<br />

wer<strong>den</strong> kann, von <strong>den</strong>en jedes eine kleinere Kopie des Ausgangsobjekts<br />

ist.<br />

Das Sierpinski-Dreieck als geometrische Figur<br />

passt hier sehr gut her; siehe unten. Beispiele <strong>für</strong><br />

Selbstähnlichkeit fin<strong>den</strong> sich auch im Werk von<br />

M.C. Escher. Fraktale sind geometrische Objekte,<br />

<strong>den</strong>en keine im klassischen Sinne (ganzzahlige)<br />

Dimension zugeordnet wer<strong>den</strong> kann;<br />

daraus leitet sich die Namengebung Fraktal“<br />

”<br />

ab. Diese Begriffsbildung geht auf B. Mandelbrot<br />

Abbildung 26: Sierpinski-Dreieck<br />

57 zurück. Er griff dabei auf mathematische<br />

Gr<strong>und</strong>lagen zurück, die im 19. Jahrh<strong>und</strong>ert von<br />

Cantor, Peano <strong>und</strong> Hausdorff geschaffen wur<strong>den</strong>.<br />

Im Allgemeinen besitzen solche Objekte bestimmte<br />

Eigenschaften, wie zum Beispiel verschie<strong>den</strong>e<br />

Arten von Selbstähnlichkeit, eventuell<br />

unendlich großen Umfang, . . . . Das Sierpinski-<br />

Dreieck (siehe Abbildung 26), das als geometrische<br />

Figur schon vor Sierpinski bekannt war – es findet sich in itaienischen Kathedralen<br />

aus dem 12. Jahrh<strong>und</strong>ert als Fußbo<strong>den</strong>mosaik <strong>und</strong> an einer Kanzel – besitzt solche Eigenschaften.<br />

Das Konstruktionsverfahren <strong>für</strong> das Sierpinski-Dreieck ist einfach:<br />

• Man beginnt mit einem schwarzem gleichseitigem Dreieck, halbiert die Seiten <strong>und</strong><br />

nimmt das Dreieck ” heraus“, das durch die Seitenmittelpunkte gegeben ist.<br />

55 Wac̷law Sierpinski, <strong>Mathematik</strong>er <strong>und</strong> Physiker, 1882-1969<br />

56 Vom Lateinischen: frangere = brechen, fractus = gebrochen<br />

57 Benoit Mandelbrot, <strong>Mathematik</strong>er, 19??-2011<br />

Stand: 21. November 2011 88 ○c J. Baumeister, T.G. Macedo


• Es bleiben drei schwarze Teildreiecke übrig.<br />

9.2 Fraktale <strong>und</strong> ihre Dimension<br />

• Nehme bei <strong>den</strong> drei verbliebenen Dreiecken wieder das Mitteldreieck heraus <strong>und</strong><br />

fahre so fort.<br />

Das Sierpinski-Dreieck besteht offenbar aus Flächenstücken, die immer <strong>und</strong> immer wieder<br />

durchbrochen <strong>und</strong> zersplittert sind. Unten wer<strong>den</strong> wir zwei ” dynamische“ Konstruktionsverfahren<br />

kennenlernen.<br />

(a) Ausgangsdreieck (b) 1. Schritt (c) Weitere Schritte<br />

Abbildung 27: Konstruktion des Sierpinski-Dreiecks<br />

9.2 Fraktale <strong>und</strong> ihre Dimension<br />

Unser gewohnter Dimensionsbegriff in der Geometrie ist die euklidische Dimension: ein<br />

Punkt hat die Dimension null, eine Strecke die Dimension eins, eine Fläche die Dimension<br />

zwei, einer Pyramide die Dimension 3, . . . . In der Linearen Algebra/Analytischen<br />

Geometrie ordnen wir Vektorräumen als Dimension die Zahl zu, die die minimale Anzahl<br />

der zur Erzeugung aller Punkte des Raums erforderlichen Basisvektoren angibt; jeweils<br />

haben wir eine ganze Zahl als Dimension.<br />

Wie oben beschrieben, können selbstähnliche Objekte beliebig zerlegt wer<strong>den</strong> <strong>und</strong> die<br />

entstehen<strong>den</strong> Teilmengen ergäben vergrö¨sert wieder das Ausgangsobjekt. Für die Objekte<br />

der euklidischen Geometrie mit einer Dimension d gilt bei einem Verkleinerungsfaktor s<br />

<strong>für</strong> die Anzahl t der verkleinerten Objekte<br />

t = 1<br />

( 1<br />

s )d<br />

d.h. d = log(t)<br />

log(s)<br />

Dies lässt sich nun auf Fraktale übertragen. Beim Sierpinski-Dreieck haben wir <strong>für</strong> s = 2<br />

t = 3 <strong>und</strong> daher<br />

dSierpinski = log(3)<br />

≈ 1.585<br />

log(2)<br />

(45)<br />

Der Wert dSierpinski ≈ 1.585 macht <strong>den</strong> fraktalen Charakter des Sierpinski-Dreiecks messbar.<br />

Mit dem obigen Dimensionsbegriff können interessante <strong>und</strong> zumeist klassische Beispiele<br />

fraktaler Objekte bestimmt wer<strong>den</strong>. Etwa:<br />

• Koch-Kurve als Nachbildung einer ” Schneeflocke“. Die Dimension ist<br />

DKoch = log(4)<br />

log(3)<br />

Stand: 21. November 2011 89 ○c J. Baumeister, T.G. Macedo<br />

(44)


9.3 Konstruktion mit Hilfe des ” Chaos-Spiel-Verfahrens“<br />

• Dürer-Pentagon Dabei wird jedes regelmäßiges Fünfeck in sechs kleinere regelmäßige<br />

Fünfecke zerlegt. Keine Überraschung sollte sein, dass die gol<strong>den</strong>e Schnittzahl g hierbei<br />

ins Spiel kommt bei der Dimensionsformel:<br />

DDuerer = log(6)<br />

log(1 + g)<br />

≈ 1.863<br />

9.3 Konstruktion mit Hilfe des ” Chaos-Spiel-Verfahrens“<br />

Um das Sierpinski-Dreieck zu konstruieren, wendet man <strong>den</strong> ” Chaos-Spiel-Algorithmus“<br />

oder ein iteriertes Funktionssystem an. Dabei ist es unverzichtbar, gleichverteilte <strong>Zufallszahlen</strong><br />

<strong>für</strong> die Erzeugung von Koordinaten der Punkte zu benutzen; siehe unten.<br />

Unter einer Iteration 58 versteht man in der <strong>Mathematik</strong> eine wiederholte Durchführung<br />

einer Anweisung oder eines Anweisungsblocks. Ein iteriertes Funktionssystem ist damit<br />

die Wiederholung einer Folge von festdefinierten Funktionen. Wir haben diese Idee<br />

schon im Zusammenhang mit der Erzeugung von <strong>Zufallszahlen</strong> kennengelernt.<br />

Der Name des Spiels kommt daher, dass jedem, der sich das erste Mal mit diesem<br />

Verfahren beschäftigt, am Anfang das Ganze wie ein Chaos vorkommt. Die Regeln des<br />

Spiels sind folgendermaßen beschrieben:<br />

1. Man definiert 3 Eckpunkte eines (gleichseitigen) Dreiecks.<br />

2. Man legt einen Startpunkt in das Dreieck.<br />

3. Man wählt zufällig einen der drei Eckpunkte mit Wahrscheinlichkeit p = 1<br />

3 .<br />

4. Man bildet einen neuen Punkt, in dem man die Strecke zwischen dem Startpunkt<br />

bzw. dem zuletzt erzeugten Punkt <strong>und</strong> dem ausgewählten Eckpunkt halbiert <strong>und</strong><br />

<strong>den</strong> neuen Punkt dorthin legt.<br />

5. Man wiederholt Schritt 3 <strong>und</strong> 4.<br />

Da der Zufall ” blind“ ist, erwartet man, dass die ” Spielpunkte“ gleichmäßig im Dreieck<br />

verteilt sind. Die Überraschung ist aber groß, es bildet sich ein strukturiertes Bild heraus.<br />

Die Struktur ist nach ca. 500 Iterationen schon erkennbar <strong>und</strong> nach ca. 10.000 Iterationen<br />

ist das Sierpinski-Dreieck ” fertig“.<br />

Die Entstehung wird plausibel, wenn man eine Ecke des Ausgangsdreiecks als Startpunkt<br />

wählt. Man stellt fest, dass die dann erzeugten Punkte stets Eckpunkte eines Teildreiecks<br />

der jeweils nächsten Konstruktionsstufe gemäß sind.<br />

Abschließend noch eine Anmerkung zur Namensgebung des Konstruktionsverfahrens.<br />

In Abschnitt 2.5 haben wir Kausalität, sensitive Abhängigkeit <strong>und</strong> Chaos angesprochen.<br />

Wie ordnet sich dies hier ein? Haben wir zwei nahe benachbarte Startwerte gewählt,<br />

so ist ganz einfach einzusehen, dass die Punktfolge, die nun konstruiert wird, schon nach<br />

ganz wenigen Konstruktionsschritten sich im Allgemeinen weit voneinander entfernt. Aber<br />

auch das ” Gegenteil“ist zu beobachten, nämlich, dass sie sich auch wieder stark annähern.<br />

Dieses Verhalten ist Teil der Definition von Chaos in dynamischen Systemen. Man mag<br />

nun der Meinung sein, dass dies eine Folge des Zufalls ist, <strong>den</strong> wir eingebaut haben. Dies<br />

ist nicht der Fall, sensitive Abhängigkeit kann eintreten auch bei einer Nichtzufallsfolge<br />

der gewählten Eckpunkte; siehe nachfolgende Bemerkung.<br />

Überraschenderweise hängt aber das Ergebnis des ” Spiels“ nicht von diesen Sensitivitäten<br />

ab: bei jedem Startwert erhalten wir diesselbe Figur.<br />

58 Vom Lateinischen: iterare = wiederholen<br />

Stand: 21. November 2011 90 ○c J. Baumeister, T.G. Macedo


9.4 Konstruktion mit Hilfe eines iterierten Funktionssystems<br />

Bemerkung 9.1 Die Anwendung von Zufall ist <strong>für</strong> die Konstruktion eines Sierpinski-<br />

Dreiecks unverzichtbar. Wenn wir zum Beispiel eine periodische Zahlenfolge statt ein Zufallsexperiment<br />

<strong>für</strong> die Wahl des angewendeten Funktionsparameter oder <strong>für</strong> die Wahl des<br />

Eckpunktes im ” Chaos-Spiel-Algorithmus“ benutzen, wer<strong>den</strong> wir keine fertige Struktur erkennen.<br />

Im Allgemeinen entsteht dann eine periodische Punktfolge oder eine Punktfolge,<br />

die offenbar gegen Fixpunkte konvergiert. �<br />

9.4 Konstruktion mit Hilfe eines iterierten Funktionssystems<br />

In einem Koordinatensystem setzt man einen Startpunkt, dann wählt man zufällig eine<br />

Funktion aus eine Gruppe von drei Funktionen <strong>und</strong> setzt <strong>den</strong> Startpunkt ein, um die<br />

Koordinaten des neuen Punktes zu erzeugen. Dabei wiederholt man dieses Verfahren, bis<br />

die Struktur erkennbar ist.<br />

Die Funktionen, die dabei benutzt wer<strong>den</strong>, sind Funktionen auf R×R, also Funktionen<br />

mit <strong>den</strong> Variablen x, y ∈ R. Sie sind definiert als:<br />

f(x, y) := ax + by + e<br />

g(x, y) := cx + dy + f<br />

wobei die Parameter a, b, . . . , f Zahlen zwischen 0 <strong>und</strong> 1 sind; sie wer<strong>den</strong> <strong>den</strong> Zeilen der<br />

Tabelle in Abbildung 28 entnommen. Damit ergibt sich die Iteration<br />

xn+1 := axn + byn + e<br />

yn+1 := cxn + dyn + f<br />

mit einem noch zu wählen<strong>den</strong> Startwert (x0, y0) . Die Funktionen wer<strong>den</strong> entsprechend<br />

der gewählten Zufallszahl aus {1, 2, 3} gewählt. Wir können die Iteration als diskretes<br />

dynamisches System interpretieren.<br />

F a b c d e f<br />

1 0.5 0.0 0.0 0.5 0.00 0.0<br />

2 0.5 0.0 0.0 0.5 0.25 0.5<br />

3 0.5 0.0 0.0 0.5 0.50 0.0<br />

Abbildung 28: Parameter zum Sierpinski-Dreieck<br />

Die Aussage von Bemerkung 9.1 trifft auch hier zu.<br />

9.5 Variationen des Sierpinski-Dreiecks<br />

Es gibt verschie<strong>den</strong>e Möglichkeiten, mit <strong>den</strong>en man abgeänderte Sierpinski-Dreiecke konstruieren<br />

kann. Hier stellen wir ein paar Variationen mit anderen Anfangswerten <strong>und</strong> Gegebenheiten<br />

vor, die die fertige Struktur des Dreiecks anders gestalten. Zudem erklären<br />

wir, wie wichtig die Verwendung des Zufalls bei der Konstruktion des Fraktals ist.<br />

Verzerrung<br />

Die Form des Fraktals muss nicht gleichseitig sein. Als Gr<strong>und</strong>form könnte man zum Beispiel<br />

ein beliebiges Dreieck nehmen. Dadurch entsteht eine ” verzerrte“ Struktur, die die<br />

Eigenschaften eines Sierpinski-Dreiecks immer noch besitzt; siehe: Abbildung 29 (a).<br />

Stand: 21. November 2011 91 ○c J. Baumeister, T.G. Macedo


(a) (b) (c)<br />

Veränderte Wahrscheinlichkeiten<br />

Abbildung 29: Variationen des Themas<br />

9.5 Variationen des Sierpinski-Dreiecks<br />

Bei der Konstruktion eines normalen Sierpinski-Dreiecks nutzen wir <strong>für</strong> die Wahl des<br />

Eckpunktes im ” Chaos-Spiel-Verfahren“ ein Laplace-Experiment; siehe Kapitel ??. Jedes<br />

Elementareireignis tritt also mit der gleichen Wahrscheinlichkeit p ein. Wenn wir nun<br />

die Wahrscheinlichkeit der Wahl verändern, entsteht eine Struktur mit abgeschwächter<br />

Dichte der Punkte; siehe Abbildung 29 (b). Als Beispiel setzen wir beim ” Chaos-Spiel-<br />

Algorithmus“ die Wahrscheinlichkeiten <strong>für</strong> die Wahl der Eckpunkte folgendermaßen:<br />

• Eckpunkt 1: p = 5<br />

10<br />

• Eckpunkt 2: p = 1<br />

10<br />

• Eckpunkt 3: p = 4<br />

10<br />

Sierpinski-Teppich<br />

Der Sierpinski-Teppich ist ein Fraktal, welcher eine selbstähnliche Teilmenge eines Quadrats<br />

ist. Um das Fraktal zu konstruieren, überträgt man die Idee des ” Chaos-Spiel-<br />

Algorithmus“ auf diese Situation. Der Unterschied zu der Konstruktion eines Sierpinski-<br />

Dreiecks besteht darin, dass man beim Sierpinski-Teppich vier Eckpunkte <strong>und</strong> vier Mittelpunkte<br />

aller Kanten einsetzt, also insgesamt acht Punkte nutzt. Dadurch entstehen acht<br />

Teilquadrate. Außerdem teilt man, um einen neuen Punkt zu erzeugen, die Verbindungsstrecke<br />

zwischen dem aktuellen Punkt <strong>und</strong> dem gewählten Eckpunkt nicht in zwei sondern<br />

in drei Teile. Der neu konstruierte Punkt entsteht als Endpunkt der Drittelstrecke, die im<br />

gewählten Eckpunkt endet; siehe Abbildung 29 (c).<br />

Bibliographische Anmerkungen<br />

In Abschnitt haben wir die ” Selbstähnlichkeitsdimension“ kennengelernt. Es gibt eine<br />

Reihe weiterer Dimensionsbegriffe; siehe <strong>für</strong> einen Überblick [39, 87].<br />

Interessante Fraktale kommen als Attraktoren <strong>und</strong> daraus abgeleiteten Mengen von<br />

dynamischen Systemen zustande; siehe etwa [4, 58, 66].<br />

Stand: 21. November 2011 92 ○c J. Baumeister, T.G. Macedo


Literatur<br />

[1] M. Aigner. Diskrete <strong>Mathematik</strong>. Vieweg, 1996.<br />

[2] M. Aigner and G.M. Ziegler. Proofs from THE BOOK. Springer, 1998.<br />

[3] L. Afflerbach <strong>und</strong> J. Lehn. <strong>Zufallszahlen</strong> <strong>und</strong> Simulation. Teubner, 1986.<br />

[4] M.F. Barnsley. Fractals everywhere. Academic Press, 1993.<br />

[5] G.E. Bärwolf. Höhere <strong>Mathematik</strong>. Elsevier, 2004.<br />

LITERATUR<br />

[6] F.L. Bauer. Entzifferte Geheimnisse: Metho<strong>den</strong> <strong>und</strong> Maximen der Kryptographie.<br />

Springer, 2000.<br />

[7] F. Benford. The law of anomalous numbers. Proceedings of the American Philosophical<br />

Society, 78:551–572, 1938.<br />

[8] A. Berger. Multi-dimensional dynamical systems and Benford’s law. Discrete and<br />

Continuous Dynamical Systems, 13:219–237, 2005.<br />

[9] A. Berger. Benfordâs law in power-like dynamical systems. Stochastic Dynamics,<br />

5:587–607, 2007.<br />

[10] A. Berger and T. Hill. Newtons’method obeys Benford’s law. Amer. Math. Monthly,<br />

114:588–601, 2007.<br />

[11] A. Berger and T. Hill. F<strong>und</strong>amental flaws in Feller’s lassical derivation of Benford’s<br />

Law. Technical report, University of Alberta, 2010.<br />

[12] A. Berger and T. Hill. A basic theory of Benford’s law. Probability Surveys, 8:1–126,<br />

2011.<br />

[13] A. Berger and T. Hill. Benford’s law strikes back: no simple explanation in sight for<br />

mathematical gem. The mathematical intelligencer, 33:85–91, 2011.<br />

[14] A. Berger, A. Bunimovich and T. Hill. One-dimensional dynamical systems and benford’s<br />

law. Trans. Amer. Math. Soc., 357:197–219, 2004.<br />

[15] A. Beutelsbacher. Kryptologie. Vieweg, 1993.<br />

[16] A. Beutelsbacher, H. Neumann <strong>und</strong> T. Schwarzpaul. Kryptographie in Theorie <strong>und</strong><br />

Praxis. Vieweg, 2005.<br />

[17] J. Bewersdorff. Glück, Logik <strong>und</strong> Bluff. Vieweg, Braunschweig, 1998.<br />

[18] K. Binder. Applications of the Monte Carlo method in statistical physics. Springer,<br />

Berlin, 1984.<br />

[19] F. Black and M. Scholes. The pricing of options and corporate liabilities. J. of<br />

political economy, 81:637–659, 1973.<br />

[20] J. Blankenagel. Elemente der Angewandten <strong>Mathematik</strong>. Wissenschaftsverlag, 1994.<br />

[21] K. Bosch. Elementare Einführung in die Wahrscheinlichkeitsrechnung. Vieweg,<br />

Braunschweig, 1995.<br />

Stand: 21. November 2011 93 ○c J. Baumeister, T.G. Macedo


LITERATUR<br />

[22] C. Breuning and A. Goerres. Searching for electoral irregularities in an established<br />

democracy: applying Benford’s law tests to B<strong>und</strong>estag elections in Unified Germany.<br />

Electoral Studies, xxx:1–12, 2011.<br />

[23] J. Buchmann. Einführung in die Kryptographie. Springer, Berlin, 2009.<br />

[24] J.C. Cox and S.A. Ross. The valuation of option for alternative stochastic processes.<br />

Journal of Financial Economics, 3:145–166, 1976.<br />

[25] S. Cyganovski, P. Kloe<strong>den</strong> and J. Ombach. From Elementary Probability to Stochastic<br />

Differential Equations with MAPLE. Springer, Berlin, 2001.<br />

[26] P. Diaconis. The distribution of leading digits and uniform distribution mod 1. The<br />

Annals of Probability, pages 72–81, 1977.<br />

[27] A. Diekmann. Datenfälschung. Ergebnisse aus Experimenten mit der Benford-Verteilung.<br />

Manuscript, ETH Zürich, 2004.<br />

[28] A. Diekmann. Not the First Digit! Using Benford’s Law to Detect Fraudulent Scientific<br />

Data. Manuscript, ETH Zürich, 2004.<br />

[29] J. Eichenauer-Herrmann. Inversive congruential pseudorandom numbers: A tutorial.<br />

Int. Stat. Rev., 60:167–176, 1992.<br />

[30] W. Feller. An Introduction to Probability Theory and its Applications. Wiley, Provi<strong>den</strong>ce,<br />

1966.<br />

[31] R. Fewster. A simple explanation of Benford’s law. Amer. Stat., 63:26–32, 2009.<br />

[32] O. Forster. Algorithmische Zahlentheorie. Vieweg, Wiesba<strong>den</strong>, 1996.<br />

[33] O. Forster. Analysis 1,2. Vieweg, Wiesba<strong>den</strong>, 1996.<br />

[34] A.S. Fraenkel. New proof of the generalized chinese remainder theorem. Proc. of the<br />

american mathematical society, 14:790–791, 1963.<br />

[35] B. Gaertner. Ein Reinfall mit Computer-<strong>Zufallszahlen</strong>. DMV-Mitteilungen, Ausgabe<br />

2:55–60, 1999.<br />

[36] J.E. Gentle. Random number generation and Monte Carlo methods. Springer, 2001.<br />

[37] P. Glasserman. Monte Carlo Methods in Financial Engineering. Springer, Baltimore,<br />

2003.<br />

[38] N. Henze. Stochastik <strong>für</strong> Einsteiger. Vieweg, Braunschweig, 1997.<br />

[39] D. Herrmann. Algorithmen <strong>für</strong> Chaos <strong>und</strong> Fraktale. Addison-Wesley, Bonn, Paris,<br />

1994.<br />

[40] T. Hill. Base-invariance implies Benford’s law. Proc Amer. Math. Soc., 123:887–895,<br />

1995.<br />

[41] J.C. Hull. Options, Futures, and other Derivatives. Prentice Hall, 2003.<br />

[42] H. Humenberger. Das Benford Gesetz über die Verteilung der ersten Ziffer von Zahlen.<br />

Manuscript, 1996. Wien.<br />

Stand: 21. November 2011 94 ○c J. Baumeister, T.G. Macedo


LITERATUR<br />

[43] N. Hungerbühler. Benfords Gesetz über führende Ziffern: Wie die <strong>Mathematik</strong><br />

Steuersündern das Fürchten lehrt, 2007. Publication von www.educeth.ch.<br />

[44] R. Ineichen. Der schlechte Würfel – ein selten behandeltes Problem in der Geschichte<br />

der Stochastik. Historia Mathematica, 18:253–261, 1991.<br />

[45] T. Jech. The logarithmic distribution of leading digits and finitely additive measures.<br />

Discrete Mathematics, 108:53–57, 1992.<br />

[46] B. Kaynar, A. Berger, T. Hill and A. Ridder. Finite-state Markov chains obey<br />

Benford’s law, 2010.<br />

[47] R. Kippenhahn. Verschlüsselte Botschaften: Geheimschrift, Enigma <strong>und</strong> Chipkarte.<br />

Rowohlt, 1999.<br />

[48] P. Kloe<strong>den</strong> and E. Platen. Numerical Solution of SDE through Computer Experiments.<br />

Springer, Berlin, 1994.<br />

[49] D.E. Knuth. The Art of Computer Programming, Vol. 1,2,3. Addison-Wesley, Reading,<br />

1998.<br />

[50] J.F. Koksma. Ein mengentheoretischer Satz über die Gleichverteilung modulo Eins.<br />

Compositio, 2:250–258, 1935.<br />

[51] U. Krengel. Einführung in die Wahrscheinlichkeitstheorie <strong>und</strong> Statistik. Vieweg,<br />

Braunschweig, 1991.<br />

[52] G. Kropp. Geschichte der <strong>Mathematik</strong>. Sammlung Aula, Wiesba<strong>den</strong>, 1994.<br />

[53] R. Korn <strong>und</strong> E. Korn. Optionsbewertung <strong>und</strong> Portfolio–Optimierung. Vieweg, Braunschweig,<br />

1999.<br />

[54] L. Kuipers and H. Niederreiter. Uniform Distribution of sequences. Wiley, New York,<br />

1974.<br />

[55] D.H. Lehmer. Mathematical methods in large-scale computing units, 1949.<br />

[56] R.W. Leven, B.-P Koch and B. Pompe. Chaos in dissipativen Systemen. Vieweg<br />

Verlag, Wiesba<strong>den</strong>, 1989.<br />

[57] E. Ley. On the peculiar distribution of the u.s. stock indexes’ digits. Amer. Stat.,<br />

50:311–314, 1996.<br />

[58] B.B. Mandelbrot. Die fraktale Geometrie der Natur. Birkhäuser, Basel, 1987.<br />

[59] E. Maor. Dem Unendlichen auf der Spur. Birkhäuser, Basel, 1982.<br />

[60] G. Marsaglia and T.A. Bray. A convenient method for generating normal variables.<br />

SIAM Review, 6:260–264, 1964.<br />

[61] S. Newcomb. Note on the frequency of use of the different digits in natural numbers.<br />

American Journal of Mathematics, 4:39–40, 1981.<br />

[62] H. Niederreiter. Random Number Generation and Quasi-Monte-Carlo-Methods.<br />

SIAM, Philadelphia, 1992.<br />

[63] M.J. Nigrini. A taxpayer compliance application of Benford’s law. J. of the Amer.<br />

Taxation Assoc., 18:72–91, 1996.<br />

Stand: 21. November 2011 95 ○c J. Baumeister, T.G. Macedo


LITERATUR<br />

[64] E. Nowak and K. Ritter. High dimensional integration of smooth functions over<br />

cubes. Numerische <strong>Mathematik</strong>, 75:79–97, 1996.<br />

[65] J.A. Paulos. <strong>Von</strong> Algebra bis Zufall. Campus, Frankfurt, 1992.<br />

[66] H.-O. Peitgen, H. Jürgens and D. Saupe. Bausteine des Chaos – Fraktale. Springer-<br />

Klett-Cotta, Berlin, 1992.<br />

[67] R.C. Pierce. A brief history of logarithm. The two-year college mathematics journal,<br />

8:22–26, 1977.<br />

[68] R.S. Pinkham. On the distribution of first significant digits. The Annals of Statistics,<br />

32:1223–1230, 1961.<br />

[69] H. Poincaré. Répartition des décimales dans une table numérique. Calcul des probabilités,<br />

pages 313–320, 1912.<br />

[70] B.F. Roukema. Benford’s law anomalies in the 2009 iranian presi<strong>den</strong>tial election.<br />

Artikel-id: 0906.2789v2, 2009.<br />

[71] D. Ruelle. Zufall <strong>und</strong> Chaos. Springer, New York, 1992.<br />

[72] L. Russio. Die vergessene Revolution. Springer, New York, 2003.<br />

[73] M. Sambridge, H. Tkalcic and A. Jackson. Benford’s law in the natural sciences.<br />

Geophys. Res. Lett., 37:xx–xx, 2010.<br />

[74] P. Samuelson. Rational theory of warrant pricing. Industrial Management Review,<br />

6:13–32, 1965.<br />

[75] P. Schulz. Fünfstellige logarithmische <strong>und</strong> trigonometrische Tafeln; 32. Auflage.<br />

C.C. Buchners, Bamberg, 1956.<br />

[76] B. Schuppar. Elementare Numerische <strong>Mathematik</strong>. Vieweg, 1999.<br />

[77] H.-G. Schuster. Deterministisches Chaos: eine Einführung. VCH Verlagsgesellschaft,<br />

Weinheim, 1994.<br />

[78] A. Sen De and U. Sen. Benford’s law: a detection of quantum phase transitions<br />

similarly as earthquakes, 2011. arXiv:1103.5398v1[quant-ph].<br />

[79] S. Simonet, S. Monteleone and D. Adolf. Analyse von Bildflächen auf Benfordverteilung<br />

am Beispiel von Northern Blots. Manuscript, ETH Zürich, 2008.<br />

[80] S. Sing. Geheime Botschaften. Carl Hanser, München, 2000.<br />

[81] D.J. Struik. A concise history of mathematics. Dover Publications, 1987.<br />

[82] L. Tarassow. Wie der Zufall will? Vom Wesen der Wahrscheinlichkeit. Springer,<br />

Berlin, 1998.<br />

[83] G. Teschl. Dynamische Systeme, 2005.<br />

[84] C.R. Tolle, J.L. Budzien and R.A. LaViolette. Do dynamical systems follow<br />

Benford’s law? Chaos: An Interdisciplinary Journal of Nonlinear Science, 10:331,<br />

2000.<br />

Stand: 21. November 2011 96 ○c J. Baumeister, T.G. Macedo


LITERATUR<br />

[85] H. Weyl. über die Gleichverteilung von Zahlen mod 1. Mathematische Annalen,<br />

77:313–352, 1916.<br />

[86] J. Wolfart. Einführung in die Zahlentheorie <strong>und</strong> Algebra. Vieweg, 1996.<br />

[87] H. Zeitler <strong>und</strong> W. Neidhardt. Fraktale <strong>und</strong> Chaos. Wiss. Buchgesellschaft, 1994.<br />

Weitere Quellen<br />

[Ber06] http://www-i1.informatik.rwth-aachen.de/ algorithmus/algo26.php<br />

[Ber11] http://www.benfordonline.net/<br />

[FAZ11] Frankfurter Allgemeine Zeitung, 18.9.2011, Seite 67<br />

[Fib??] http://www.ijon.de/mathe/fibonacci/index.html<br />

[Hun10] http://www.educ.ethz.ch/unt/um/mathe/ana/benford/Benford−Fuehrende<br />

−Ziffern.pdf)<br />

[RiS10] http://www.mathematik.uni-erlangen.de/∼richard/vortrag.pdf<br />

[Sch03] http://www.schimmeck.de/Texte/benford.htm<br />

[Sei07] http://www.mathematik.uni-kassel.de/∼seiler/Courses/AGCA-0708/<br />

ModRechnen.pdf<br />

[Stu10] http://stubber.math-inf.uni-greifswald.de/∼bandt/statprak10/Benford/<br />

Benford−U−Horn.pdf<br />

[WeG10] https://www.physik.uni-marburg.de/fileadmin/user−upload/forschung/kosy/<br />

Lenz/Comp−phys−I/Benfords−Gesetz.pdf<br />

[Wei04] https://www.uni-koblenz.de/∼steigner/seminar-asym-krypt/weizel.pdf<br />

[Zei00] http://homepages.cwi.nl/ paulv/news/zeit00-plain<br />

Stand: 21. November 2011 97 ○c J. Baumeister, T.G. Macedo

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!