Von den Zufallszahlen und ihrem Gebrauch - Institut für Mathematik ...
Von den Zufallszahlen und ihrem Gebrauch - Institut für Mathematik ...
Von den Zufallszahlen und ihrem Gebrauch - Institut für Mathematik ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
<strong>Von</strong> <strong>den</strong> <strong>Zufallszahlen</strong> <strong>und</strong> <strong>ihrem</strong> <strong>Gebrauch</strong><br />
Johann Baumeister ∗ <strong>und</strong> Tania Garfias Macedo †<br />
(Kursleiter)<br />
unter Mitwirkung von<br />
Paul Dietze, Pauline Eberts, Lara Felten, Miriam Gerharz<br />
Tim Hahn, Kim Hellriegel, Alexander Hoffmann, Anton Kohrt<br />
Philipp Kretz, Rozan Rosandi, Jan Rühl, Julia Schneider<br />
Clara Schüttler, Julia Weber, Saskia Wirfs, David Zimnol<br />
(Teilnehmer der Juniorakademie in Meisenheim 2011)<br />
Im August 2011<br />
Zusammenfassung<br />
Dies sind Aufzeichnungen, die im Rahmen eines Kurses einer Juniorakademie<br />
zum Thema ” <strong>Von</strong> <strong>den</strong> <strong>Zufallszahlen</strong> <strong>und</strong> <strong>ihrem</strong> <strong>Gebrauch</strong>“ in Meisenheim 2011 entstan<strong>den</strong><br />
sind. Eine Juniorakademie ist eine Fördermaßnahme auf B<strong>und</strong>esländerebene<br />
<strong>für</strong> begabte Schülerinnen <strong>und</strong> Schüler der 7. <strong>und</strong> 8. Klassen.<br />
Im Kurs wur<strong>den</strong> Erzeugungsmetho<strong>den</strong> <strong>für</strong> <strong>Zufallszahlen</strong> untersucht <strong>und</strong> Beispiele<br />
<strong>für</strong> die Verwendung kennengelernt. Die behandelten Themen waren: Zufallsexperimente,<br />
unfaire Würfel, Monte Carlo–Simulation, Benford-Zahlen, modulares<br />
Rechnen, euklidischer Algorithmus, Kongruenzgeneratoren, geometrische Tests,<br />
Sierpinski-Figuren, Simulation von Aktienkursen.<br />
Dieser Artikel ist eine Erweiterung der Dokumentation zum Kurs, in der insbesondere<br />
über Tests <strong>und</strong> Überlegungen, die die Teilnehmer zu Zufallsexperimenten<br />
angestellt haben, berichtet wird. Manches von dem, was hier angeführt wird, wurde<br />
im Kurs nur kursorisch behandelt, manches wurde ergänzt um mathematische Begründungen,<br />
die so bei der Kenntnislage der Kursteilnehmer nicht erbracht wer<strong>den</strong><br />
konnten. Ein weiteres Ziel dieses Artikels ist eine möglichst komplette Darlegung der<br />
wichtigsten Literaturstellen zur Thematik der <strong>Zufallszahlen</strong> <strong>und</strong> ihrer Einordnung.<br />
Aus dieser Zielsetzung ergibt sich ein ziemlich buntes Bild von Themen.<br />
∗ Prof. Dr. Baumeister, Fachbereich Informatik <strong>und</strong> <strong>Mathematik</strong>, Goethe-Universität, Robert Mayer–<br />
Str. 6–10, 60054 Frankfurt am Main, Germany, baumeist@math.uni-frankfurt.de.<br />
† Tania Garfias Macedo, Mathematisches <strong>Institut</strong>, Georg-August-Universität Göttingen, Bunsenstr.<br />
3-5, 37073 Göttingen<br />
1
Inhaltsverzeichnis<br />
Vorwort 1<br />
1 Einführung 3<br />
1.1 Aus der Bibel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />
1.2 Zufall auf dem Jahrmarkt . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />
1.3 Zufall: eine vorläufige Einschätzung . . . . . . . . . . . . . . . . . . . . . . 4<br />
1.4 <strong>Zufallszahlen</strong> <strong>und</strong> deren Ersatz . . . . . . . . . . . . . . . . . . . . . . . . 6<br />
1.5 Die middle square-Methode von J. von Neumann . . . . . . . . . . . . . . 9<br />
2 (Mathematische) Wahrscheinlichkeit 11<br />
2.1 Zufall, Ereignismenge <strong>und</strong> Wahrscheinlichkeit . . . . . . . . . . . . . . . . 11<br />
2.2 Mehrstufige Zufallsexperimente <strong>und</strong> Baumdiagramme . . . . . . . . . . . . 12<br />
2.3 Hilfsmittel zur Realisierung von Laplace-Experimenten . . . . . . . . . . . 14<br />
2.4 Zufallsvariable, Erwartungswert <strong>und</strong> Verteilung . . . . . . . . . . . . . . . 16<br />
2.5 Determinismus, Kausalität, Berechenbarkeit <strong>und</strong> Zufall . . . . . . . . . . . 18<br />
3 Elementare Zufallsexperimente 20<br />
3.1 Reißzweckexperiment . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20<br />
3.2 (Unfaire) Würfel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21<br />
3.3 <strong>Zufallszahlen</strong> der Natur entnommen . . . . . . . . . . . . . . . . . . . . . . 22<br />
3.4 Flächenberechnung mit <strong>Zufallszahlen</strong> . . . . . . . . . . . . . . . . . . . . . 24<br />
3.5 Uabhängigkeit bei Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . 25<br />
4 Exponential- <strong>und</strong> Logarithmusfunktion 28<br />
4.1 Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28<br />
4.2 Exponenten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />
4.3 Logarithmen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />
4.4 Exponential– <strong>und</strong> Logarithmusfunktion . . . . . . . . . . . . . . . . . . . . 35<br />
4.5 Logarithmentafel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36<br />
5 Benford–Zahlen 38<br />
5.1 Die Beobachtung von Newcomb <strong>und</strong> Benford . . . . . . . . . . . . . . . . . 38<br />
5.2 Neuere Beobachtungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40<br />
5.3 Das Mantissengesetz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41<br />
5.4 Anwendung: Benford <strong>und</strong> Betrüger . . . . . . . . . . . . . . . . . . . . . . 45<br />
5.5 Benford bei dynamischen Systemen . . . . . . . . . . . . . . . . . . . . . . 47<br />
6 Elementare Arithmetik 53<br />
6.1 Ganze Zahlen, Teilbarkeit, Primzahlen . . . . . . . . . . . . . . . . . . . . 53<br />
6.2 Fibonacci-Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55<br />
6.3 Division mit Rest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57<br />
6.4 Euklidischer Algorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59<br />
6.5 Modulares Rechnen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63<br />
7 Kongruenzgeneratoren 67<br />
7.1 Lineare Kongruenzgeneratoren . . . . . . . . . . . . . . . . . . . . . . . . . 67<br />
7.2 Einige verwendete Generatoren . . . . . . . . . . . . . . . . . . . . . . . . 69<br />
7.3 Geometrische Beobachtungen . . . . . . . . . . . . . . . . . . . . . . . . . 69<br />
7.4 Statistische Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71<br />
7.5 Anwendung von <strong>Zufallszahlen</strong>: One-Time-Pad . . . . . . . . . . . . . . . . 73
8 Monte Carlo-Methode 75<br />
8.1 Gr<strong>und</strong>idee der Monte Carlo-Methode . . . . . . . . . . . . . . . . . . . . . 75<br />
8.2 Simulation der Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . 77<br />
8.3 Simulation der Aktienkurse . . . . . . . . . . . . . . . . . . . . . . . . . . 79<br />
8.4 Simulation von Optionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82<br />
8.5 Simulationen von Optionen . . . . . . . . . . . . . . . . . . . . . . . . . . 87<br />
9 Sierpinski-Mengen 88<br />
9.1 Sierpinski-Dreieck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88<br />
9.2 Fraktale <strong>und</strong> ihre Dimension . . . . . . . . . . . . . . . . . . . . . . . . . . 89<br />
9.3 Konstruktion mit Hilfe des ” Chaos-Spiel-Verfahrens“ . . . . . . . . . . . . 90<br />
9.4 Konstruktion mit Hilfe eines iterierten Funktionssystems . . . . . . . . . . 91<br />
9.5 Variationen des Sierpinski-Dreiecks . . . . . . . . . . . . . . . . . . . . . . 91<br />
Literatur 93<br />
Weitere Quellen 97<br />
Stand: 21. November 2011 1 ○c J. Baumeister, T.G. Macedo
Vorwort<br />
Die Beschäftigung mit dem Zufall <strong>und</strong> Zufallsexperimenten hat eine lange Geschichte. Sie<br />
beginnt mit dem Werfen von Losen in der Antike, fndet seine Fortsetzung bei Jahrmarkttricks<br />
beim Würfelspiel, endet in einer theoretischen Behandlung des Zufalls nicht zuletzt<br />
in der Konsequenz der Entwicklungen in der Quantenmechanik <strong>und</strong> ist nun präsent in<br />
fast jeder Disziplin der <strong>Mathematik</strong>. In der Finanzmathematik, wie sie sich in <strong>den</strong> letzten<br />
bei<strong>den</strong> Jahrzehnten entwickelt hat, ist der Zufall <strong>und</strong> seine Realisierung zentral. Eine<br />
Methode, <strong>für</strong> die die Bereitstellung von <strong>Zufallszahlen</strong> essentiell <strong>und</strong> in <strong>den</strong> Naturwissenschaften<br />
von Bedeutung ist, ist die Monte Carlo–Methode.<br />
<strong>Zufallszahlen</strong> sind aus vielen Anwendungsgebieten heute nicht mehr wegzu<strong>den</strong>ken:<br />
Computerspiele wären schnell langweilig, wenn nicht durch eingebauten Zufall der Ablauf<br />
innerhalb des Spiels bzw. von Spiel zu Spiel variiert würde. Um die Sicherheit bei der<br />
Übertragung von Daten im Internet zu gewährleisten, wer<strong>den</strong> kryptografische Programme<br />
verwendet, die sichere <strong>Zufallszahlen</strong> verwen<strong>den</strong>. Das Binomialmodell zur Ermittlung<br />
von fairen Optionspreisen bedient sich des Zufalls in der Simulation des Auf <strong>und</strong> Ab von<br />
Aktienkursen.<br />
Viele Einträge im Internet zum Thema ” <strong>Zufallszahlen</strong>“ sind aufgelistet unter dem<br />
Stichwort echte <strong>Zufallszahlen</strong>. Doch kann es echte <strong>Zufallszahlen</strong> geben? Oder anders gefragt,<br />
wie soll man solche Zahlen in ihrer Echtheit/Verwendbarkeit bewerten, <strong>und</strong> wie<br />
kann man brauchbare <strong>Zufallszahlen</strong> erzeugen? Bereits vom Pionier der Computertechnik,<br />
John von Neumann, gab es ein erstes Verfahren zur Konstruktion von <strong>Zufallszahlen</strong> auf<br />
einem Rechner. Aber er schreibt auch: Any one who considers arithmetical methods of<br />
producing random digits is of course in a state of sin.<br />
Die ersten aufklären<strong>den</strong> Überlegungen sollten einer ganz einfachen Fragestellung gelten:<br />
was ist ein Zufallsexperiment? Dies sind Experimente, die unterschiedliche Ergebnisse<br />
haben können, deren Ausgang vor der Ausführung aber nicht vorausgesagt wer<strong>den</strong> kann.<br />
Als Beispiele <strong>für</strong> Zufallsexperimente sehr unterschiedlicher Natur können zur Veranschaulichung<br />
etwa herangezogen: Münzwurf, Werfen von Reißzwecken, Würfeln, Ziehen einer<br />
Kugel aus einer Urne, Zeitpunkt des Zerfalls eines radioaktiven Materials, 2. Stelle nach<br />
dem Komma der Laufzeit eines Programms auf dem Rechner. Man kann sich unschwer<br />
vorstellen, dass jedes dieser angeführten Experimente zu einem Zufallsgenerator umdefiniert<br />
wer<strong>den</strong> kann. Einen komplizierteren Zufallsmechanismus erhält man, wenn man ein<br />
Zufallsexperiment mehrmals unabhängig voneinander wiederholt. Nun steht die Frage im<br />
Raum, was ” unabhängig“ heißen soll. Alle diese Umstände <strong>und</strong> Fragen wer<strong>den</strong> wir im<br />
Folgen<strong>den</strong> vertiefen.<br />
Zentral <strong>für</strong> das Verständnis der ” algebraischen Erzeugung“ von (Pseudo-)<strong>Zufallszahlen</strong><br />
ist die Arithmetik in <strong>den</strong> ganzen Zahlen. Die Tatsache, dass die Division in <strong>den</strong> ganzen<br />
Zahlen nicht uneingeschränkt möglich ist, kann erfolgreich dabei verwendet wer<strong>den</strong>. Die<br />
Hilfsmittel <strong>für</strong> die algebraischen Überlegungen, die bereitgestellt wer<strong>den</strong> müssen, sind<br />
Teilbarkeit, Division mit Rest <strong>und</strong> euklidischer Algorithmus. Die Möglichkeiten der Erzeugung<br />
von <strong>Zufallszahlen</strong> berühren auch das Thema ” Benfordzahlen“, das einige besonders<br />
reizvolle Facetten bereithält.<br />
Die Frage der Bewertung von <strong>Zufallszahlen</strong> kann auf unterschiedliche Weise erfolgen:<br />
statistisch, geometrisch, indirekt durch Beobachtung von Experimenten. Ein Beispiel, das<br />
dabei Verwendung fin<strong>den</strong> kann, stellt das Sierpinski-Dreieck dar, dem wir einen Abschnitt<br />
widmen. Als Gr<strong>und</strong>lagen <strong>für</strong> die Zufälligkeitstest benötigen wir <strong>den</strong> Wahrscheinlichkeitsbegriff<br />
<strong>für</strong> endliche Ereignisräume <strong>und</strong> Verteilungsstests.<br />
Stand: 21. November 2011 2 ○c J. Baumeister, T.G. Macedo
1 Einführung<br />
1.1 Aus der Bibel<br />
Gott würfelt nicht !<br />
Albert Einstein<br />
Und da sie ihn gekreuziget hatten, teileten sie seine Kleider, <strong>und</strong> warfen das<br />
Los drum, welcher was überkäme.<br />
(Markus-Evangelium 15,24; siehe Abbildung 1 1 )<br />
Was heißt ” das Los werfen“, um eine Zufallsentscheidung herbeizuführen? In einer alttestamentarischen<br />
Losentscheidung wer<strong>den</strong> die zur Wahl stehen<strong>den</strong> verschie<strong>den</strong>en Kleidungsstücke,<br />
Namen, Zeitpunkte . . . auf ein Stück Holz, eine Tonscherbe oder etwas ähnliches<br />
geschrieben. Diese ” Lose“ wer<strong>den</strong> dann in einem Gefäß oder einem Kleidungsstück zusammen<br />
durchgeschüttelt, bis eines herausfällt, das dann die Entscheidung herbeiführt.<br />
Jesus hatte zwölf engste“ Jünger. Ei-<br />
”<br />
ner davon (Judas Ischariot) hatte Jesus<br />
verraten <strong>und</strong> sich dann erhängt. Die anderen<br />
elf Jünger wollten ein altes Wort aus<br />
<strong>den</strong> Psalmen erfüllen <strong>und</strong> ihre Zahl wieder<br />
auf zwölf erhöhen. Dazu machten sie<br />
nach Christi Himmelfahrt eine Versammlung.<br />
Zwei Anhänger wur<strong>den</strong> als Kandidaten<br />
ausgewählt – Barsabbas <strong>und</strong> Matthias<br />
– <strong>und</strong> das Gottes-Los über sie geworfen. So<br />
wurde Matthias zwölfter Jünger.<br />
Abbildung 1: Würfeln um die Kleider<br />
Aus dem Alten Testament gibt es folgende<br />
Aufzeichnung einer Zufallsentscheidung:<br />
Mose hatte <strong>den</strong> Rat der ältesten aus 70 Mitgliedern zu bestimmen: Aus jedem der 12<br />
Stämme wur<strong>den</strong> zunächst 6 Kandidaten ausgewählt. Aus der Schar dieser 72 Kandidaten<br />
waren nun zwei zu eliminieren. Dazu wur<strong>den</strong> 72 Kugeln vorbereitet; 70 davon wur<strong>den</strong><br />
markiert, zwei blieben unmarkiert. Die Kugeln wur<strong>den</strong> in eine Urne gelegt <strong>und</strong> gemischt.<br />
Jeder Kandidat hatte ein Kugel zu ziehen; jene bei<strong>den</strong>, die die unmarkierten zogen, wur<strong>den</strong><br />
eliminiert.<br />
1.2 Zufall auf dem Jahrmarkt<br />
” Glücksspiel“ ist ein Begriff, der viele Bereiche der Spielkultur beinhaltet. Darunter fallen<br />
vor allem Würfelspiele <strong>und</strong> einige Kartenspiele, das Roulette, Lotto <strong>und</strong> Lotterien. Manche<br />
Brett- oder Würfelbrettspiele können unter Vorbehalt ebenso dazugezählt wer<strong>den</strong>. Beim<br />
Glücksspiel ist der Einsatz von Geld oder Belohnungen anderer Art im Allgemeinen begleitend.<br />
Zum einen wird um Geld gespielt, zum anderen müssen Lose gekauft wer<strong>den</strong>, um an<br />
<strong>den</strong> großen Gewinn, sei es Bargeld oder Sachwerte, zu gelangen. Beim Glücksspiel steht die<br />
Zufallskomponente im Vordergr<strong>und</strong>. Der Ausgang des Spiels ist nicht vom Können oder<br />
einer bestimmten Spielstrategie abhängig, sondern vom Fall der Würfel, dem Drehen der<br />
1 Bild von U. Leive<br />
Stand: 21. November 2011 3 ○c J. Baumeister, T.G. Macedo
1.3 Zufall: eine vorläufige Einschätzung<br />
Lostrommel, dem Kauf eines Loses, dem Lauf einer Roulettekugel oder dem Mischen <strong>und</strong><br />
Verteilen von Karten. Über Gewinn oder Verlust entscheidet also das ” Glück“ <strong>und</strong> nicht<br />
der ” Verstand“.<br />
Im Mittelalter gehörten Jahrmärkte zu <strong>den</strong> wichtigsten Ereignissen in <strong>den</strong> sich politisch<br />
verselbständigen<strong>den</strong> Städten. Das dazu notwendige Recht, einen Jahrmarkt zu halten wurde<br />
meistens vom Kaiser, König, Grafen oder sonstigen Landesherrn an einen Ort - oft im<br />
Rahmen des Stadtrechts - verliehen. Zu <strong>den</strong> Jahrmärkten reisten häufig auch Schausteller<br />
des Fahren<strong>den</strong> Volkes an: Bärenführer, Gaukler, Wahrsager, Quacksalber, Musikanten.<br />
Amts-Blatt der Königlichen Regierung zu Potsdam <strong>und</strong> der Stadt Berlin/Den 21. November<br />
1851, Seite 364, No. 48.<br />
Polizei-Verordnung betreffend <strong>den</strong> Verkehr auf <strong>den</strong> Berliner Jahr- <strong>und</strong> Weihnachtsmärkten<br />
.<br />
§ 3. Glücks- <strong>und</strong> Würfelbu<strong>den</strong> sind verboten.<br />
.<br />
Selbst großen <strong>Mathematik</strong>ern sind bei Jahrmarktspielen Fehler unterlaufen. Bei G.W.<br />
Leibniz 2 handelt es sich um das Augensummenparadoxon. Er hat sich bei der Analyse<br />
dieses Spiels einen kleinen Schnitzer erlaubt:<br />
” Es sei ihm unbegreiflich, wie ihm erfahrene Würfelspieler versicherten, warum bei zwei Würfeln<br />
die Augensumme 9 wahrscheinlicher sei als die Augensumme 10, aber bei drei Würfeln die Augensumme<br />
10 wahrscheinlicher als die Augensumme 9. Denn schließlich könne die Summe 9 wie<br />
die Summe 10 in bei<strong>den</strong> Fällen auf gleich viele Arten anfallen, also müssten die Augensummen<br />
in bei<strong>den</strong> Fällen gleich wahrscheinlich sein.“ . Leibniz hat übersehen, dass die Reihenfolge<br />
der Summan<strong>den</strong> hier wichtig ist. Wir analysieren das Spiel später.<br />
Ein Jahrmarktspiel, das nach J. Bertrand Bertrandsches Schachtelparadoxon 3<br />
genannt wird, ist folgendes:<br />
Drei nicht unterscheidbare Schachteln enthalten zwei Goldmünzen (1. Schachtel),<br />
zwei Silbermünzen (2. Schachtel) <strong>und</strong> eine je eine Gold- <strong>und</strong> eine Silbermünze<br />
(3. Schachtel). Jetzt entnimmt man einer Schachtel eine Münze. Der<br />
Veranstalter des Spiels bietet nun eine Wette an: Die zweite Münze in der<br />
Schachtel ist aus demselben Metall!<br />
Man ist versucht, zu vermuten, dass die Wette fair ist, da man geneigt ist, zu vermuten,<br />
dass die Beschaffenheit der zweiten Münze gleichwahrscheinlich ist. Dies ist nicht der Fall.<br />
Analysieren wir die Situation, dass Gold gezogen wurde. Wir vermuten richtig, dass nicht<br />
aus der Schachtel mit <strong>den</strong> zwei Silbermünzen gezogen wurde <strong>und</strong> schließen daraus irrig,<br />
dass mit Wahrscheinlichkeit 1 beide Münzen in der Schachtel, aus der gezogen wurde, aus<br />
2<br />
Gold sind. In Wahrheit sind mit einer Wahrscheinlichkeit von 2 beide Münzen aus Gold,<br />
3<br />
weil in zwei von 3 Fällen die bei<strong>den</strong> Münzen in der Schachtel aus Gold sind.<br />
1.3 Zufall: eine vorläufige Einschätzung<br />
Hier re<strong>den</strong> wir über <strong>den</strong> Zufall eher aus einer historischen Betrachtungsweise heraus. Im<br />
Abschnitt 2 stellen wir die Begriffe bereit, die wir im Folgen<strong>den</strong> benötigen.<br />
2 G.W. Leibniz, 1646-1716<br />
3 Joseph Bertrand, 1822-1900<br />
Stand: 21. November 2011 4 ○c J. Baumeister, T.G. Macedo
1.3 Zufall: eine vorläufige Einschätzung<br />
Zufall, Ungewißheit, Glück, Pech – sind das nicht ziemlich diffuse Begriffe? Eher<br />
aus dem Bereich der Wahrsager als dem der Wissenschaftler? Eine wissenschaftliche Untersuchung<br />
des Zufalls ist möglich, <strong>und</strong> sie begann mit der Analyse von Glücksspielen<br />
durch B. Pascal, C. Huygens, Jakob Bernoulli <strong>und</strong> P. Fermat 4 . Diese Analyse hat <strong>den</strong><br />
Wahrscheinlichkeitskalkül hervorgebracht, der lange <strong>für</strong> einen unbedeuten<strong>den</strong> Zweig der<br />
<strong>Mathematik</strong> gehalten wurde. Einen ersten Erfolg erzielte der Kalkül in der statistischen<br />
Mechanik durch Untersuchungen von L. Boltzmann <strong>und</strong> J.W. Gibbs 5 : Die ” Menge von<br />
Zufall“, die in einem Liter Luft ist, wird durch <strong>den</strong> Begriff der Entropie gemessen. Der<br />
nächste große Erfolg ist mit der Entwicklung der Quantentheorie verknüpft. Heutzutage<br />
ist der Zufall in wissenschaftlichen Theorien fast überall präsent: Rauschen in der<br />
Signalübertragung, Ausbreitung von Epidemien, Entwicklung von Börsenkursen, chaotisches<br />
Verhalten von nichtlinearen Systemen, Spieltheorie, Wetterprognosen, . . . .<br />
Wenn man von Wahrscheinlichkeiten spricht, so tut man dies immer im Zusammenhang<br />
mit irgendwelchen Ereignissen, deren gemeinsames Kennzeichen darin besteht, dass sie –<br />
unter gegebenen Umstän<strong>den</strong> – eintreten können, aber nicht eintreten müssen.<br />
Zufällige Ereignisse begegnen uns als Ergebnisse von Versuchen, wobei ” Versuch“<br />
als Realisierung einer Gesamtheit von wohldefinierten Bedingungen (Versuchsanordnungen)<br />
verstan<strong>den</strong> wer<strong>den</strong> kann. Da wir unter ” Versuch“ so unterschiedliche Objekte wie<br />
medizinische Untersuchung, physikalischer Versuch, Intelligenztest, ” Gedankenspielerei“,<br />
Glückspielr<strong>und</strong>e, . . . verstehen wollen, wollen wir bei dieser verbalen Beschreibung bleiben.<br />
Statt Versuch sagen wir häufig auch Experiment <strong>und</strong> sehen darin oft eine reale<br />
Untersuchung, einen Test, eine Probe, ein Gedankenexperiment, eine Beobachtung.<br />
Wichtig ist nun, dass wir annehmen wollen, dass ein Versuch/Experiment – wenigstens<br />
gedanklich – bei gleichbleibender Versuchsanordnung wiederholbar ist. Ist dann die Versuchsanordnung<br />
so, daß sie <strong>den</strong> Ausgang eines Versuchs nicht eindeutig festlegt, so sind<br />
bei Wiederholung des Versuchs unterschiedliche Ausgänge möglich. Da wir die <strong>den</strong> Ausgang<br />
determinieren<strong>den</strong> Bedingungen nicht kennen oder nicht nennen können, können wir<br />
nicht vorhersagen, welches der Ausgang bei der nächsten Durchführung des Versuchs sein<br />
wird. Wir nennen daher solche Versuche Zufallsexperimente oder zufällige Ereignisse,<br />
ihren Ausgang zufällig. ” Zufall“ dient also hier zur Beschreibung einer Situation, in<br />
der wir auf Gr<strong>und</strong> fehlender Information <strong>den</strong> Ausgang eines Versuchs nicht vorhersagen,<br />
nicht wissen können. Der Begriff der ” Wahrscheinlichkeit“, der noch einzuführen ist, dient<br />
dazu, dieses Nichtwissen bzw. Nichtwissenkönnen theoretisch in <strong>den</strong> Griff zu bekommen<br />
<strong>und</strong> zu quantifizieren.<br />
” Der Titel dieses Essays ist eine Frage: Ist alles vorherbestimmt? Die Antwort lautet<br />
ja. Doch sie könnte genausogut nein lauten, weil wir niemals wissen können, was<br />
vorherbestimmt ist.“ 6<br />
Das ” Ja“ soll heißen, dass wir in fast allen Fragestellungen, wo<strong>für</strong> wir ein mathematisches<br />
Modell haben, in der Lage sind, Gleichungen hinzuschreiben, in <strong>den</strong>en komplizierte<br />
Phänomene codifiziert sind <strong>und</strong> deren Lösung uns Vorhersagen erlauben (Hirntätigkeit,<br />
Wetter, . . . ). Das ” Nein“ bedeutet, dass wir meist nicht in der Lage sind, diese (vielen)<br />
Gleichungen zu lösen oder in ihnen eingearbeitete Anfangsbedingungen zu bestimmen.<br />
Was Wahrscheinlichkeit ist, glaubt jeder zu wissen, es aber zu formulieren, fällt auch<br />
jedem schwer, erst recht schwer ist es im Allgemeinen, die Wahrscheinlichkeit <strong>für</strong> das<br />
4 Blaise Pascal, 1623-1662, Christian Huygens, 1629-1695, Jakob Bernoulli, 1654-1705, Pierre de Fer-<br />
mat, 1607-1665<br />
5 Ludwig Boltzmann, 1844-1906, Josiah Willard Gibbs, 1839-1903<br />
6 Aus: Stephen W. Hawking, Einsteins Traum, Rowohlt, 1993<br />
Stand: 21. November 2011 5 ○c J. Baumeister, T.G. Macedo
1.4 <strong>Zufallszahlen</strong> <strong>und</strong> deren Ersatz<br />
Eintreten eines Ereignisses anzugeben oder auszurechnen. Eine zentrale Tatsache der<br />
Wahrscheinlichkeitsrechnung ist, dass wir ein Experiment kennen, das uns diesen Zufall so<br />
klar vor Augen führt: der Münzwurf. Bei einer großen Anzahl von Münzwürfen mit einer<br />
fairen (symmetrischen) Münze wird die Anzahl von Kopf (der Zahl) etwa bei 50 % liegen.<br />
Auf diese Weise ergibt eine lange Reihe von Münzwürfen ein nahezu sicheres Ergebnis,<br />
obwohl der Ausgang eines einzelnen Wurfes vollständig ungewiss ist. Dieser Übergang von<br />
Ungewissheit zu einer Fastgewissheit, wenn wir eine lange Reihe von Ereignissen (oder<br />
große Systeme) beobachten, ist ein wesentliches Thema beim Studium des Zufalls.<br />
Als Zufallsexperimente können wir betrachten:<br />
Münzwurf Ausgänge: Kopf oder Zahl.<br />
Würfelwurf Ausgänge: Zahlen (Augen) 1, . . . , 6.<br />
Hier könnte eine Beschreibung der Versuchsanordnung so aussehen: Der Würfel ist<br />
ein regelmäßiger Körper mit 6 i<strong>den</strong>tischen <strong>und</strong> glatten Seitenflächen, beschriftet mit<br />
<strong>den</strong> Zahlen 1, 2, 3, 4, 5, 6. Ein Versuch bestehe aus einem Wurf (Fallenlassen aus der<br />
geschlossenen Hand) aus einer Höhe von 10 cm auf einen ebenen Tisch. Der Versuch<br />
ist beendet, sobald der Würfel zur Ruhe gekommen ist. Seine obenliegende Fläche<br />
legt mit der dort abzulesen<strong>den</strong> Zahl das Versuchsergebnis fest.<br />
Urnenexperiment Ziehen von numerierten Kugeln (auf gut Glück) aus einer Urne. Ausgänge:<br />
Nummern der gezogenen Kugeln.<br />
Kartenspiele Ausgänge: Kartenverteilung oder Spielpunkte.<br />
Kegeln Ausgänge: Anzahl der gefallenen Kegel.<br />
Telefonstatistik Erfassung der Anzahl der Anrufe bei der Telefonvermittlung von 12.00<br />
– 12.59 Uhr. Ausgänge: Zahlen 0, 1, 2, . . . .<br />
Die drei Experimente Münzwurf, Würfelwurf, Urnenexperiment dienen häufig als Beispiel<br />
<strong>für</strong> ein Zufallsexperiment. Damit können wir reale Situationen erfassen <strong>und</strong> wesentliche<br />
Merkmale von zufälligen Ereignissen verdeutlichen.<br />
1.4 <strong>Zufallszahlen</strong> <strong>und</strong> deren Ersatz<br />
Das Thema dieser Ausarbeitung sind Zahlen, die als ” echte“ <strong>Zufallszahlen</strong>, als Pseudooder<br />
Quasi-<strong>Zufallszahlen</strong> betrachtet wer<strong>den</strong> können. Die zugehörigen Erzeugungsmechanismen<br />
nenen wir (Pseudo-)<strong>Zufallszahlen</strong>-Generatoren (random number generator<br />
(RNG)). Was ist die Motivation <strong>für</strong> das Bestreben, (Pseudo-)<strong>Zufallszahlen</strong> zu<br />
erzeugen? Warum zu Generatoren von Pseudozufallszahlen greifen, also zu Generatoren,<br />
die nicht <strong>den</strong> ” echten Zufall“ verwen<strong>den</strong>? Es sind die vielfältigen Anwendungsbereiche,<br />
die nach <strong>Zufallszahlen</strong> fragen (siehe [Wei04]):<br />
Experimente, die Gerechtigkeit produzieren, Erzeugung zufälliger Ereignisse<br />
entsprechend statistischer Vorgaben, Verfahren, die die Echtheit von Meßdaten<br />
überprüfen, kryptographische Anwendungen (Erzeugung von Schlüsselzahlen,.<br />
. . ), Monte Carlo Simulation (insbesondere in Computational Finance),<br />
Simulation von Abläufen der realen Welt (Ampelschaltungen), Globale Optimierung,<br />
Spiele (wo taucht der Bösewicht auf?),. . . .<br />
Der Wunsch, zufällige Ereignisse zu generieren, ist zwar keine ausschließliche Erscheinung<br />
des Computerzeitalters, er wurde aber durch die Rechenmöglichkeiten doch stark in <strong>den</strong><br />
Vordergr<strong>und</strong> gerückt. Zur Geschichte:<br />
Stand: 21. November 2011 6 ○c J. Baumeister, T.G. Macedo
1.4 <strong>Zufallszahlen</strong> <strong>und</strong> deren Ersatz<br />
• 1938: Kendall <strong>und</strong> Babington-Smith erzeugen mit einer schnell drehen<strong>den</strong> Scheibe<br />
100 000 zufällige Ziffern.<br />
• Seit 1940/50 wer<strong>den</strong> numerische <strong>und</strong> arithmetische Verfahren verwendet, um <strong>Zufallszahlen</strong><br />
zu generieren.<br />
• 1957: Das 1. ERNIE-Projekt (Electronic Random Number Indicator Equipment)<br />
wurde durch Sidney Broadhurst, Tommy Flowers and Harry Fensom realisiert. Es<br />
wur<strong>den</strong> mit Hilfe von Vakuumröhren bis zu 50 Zufallsziffern pro Sek<strong>und</strong>e erzeugt.<br />
• 1955: Die Rand-Corporation veröffentlicht ein Buch mit ca. 1 Million Zufallsziffern.<br />
• 1983: Miyatake baut eine Vorrichtung, um durch das Zählen von Gammastahlen<br />
zufällige Ergebnisse zu generieren.<br />
• 1995 Marsaglia produziert eine CD-ROM, auf der ca. 4.8 Milliar<strong>den</strong> <strong>Zufallszahlen</strong><br />
gespeichert sind. 7<br />
Pseudozufallszahlen sollen Zahlenfolgen sein, die ” zufällig“ sind, d.h. die Eigenschaften<br />
besitzen, die dem echten Zufall nahe kommen. Also ist man gezwungen, <strong>den</strong> Zufall<br />
deterministisch möglichst gut nachzustellen. In der Umsetzung tun wir es mit Verfahren,<br />
die gewissen Forderungen unterliegen; wir wollen sie Algorithmen nennen.<br />
Ein Algorithmus 8 <strong>für</strong> eine vorgegebene bestimmte Art von Aufgaben ist eine<br />
endliche Abfolge von wohldefinierten, ausführbaren Vorschriften, die bei Abarbeitung,<br />
ausgehend von einem Eingangszustand (Input) nach einer endlichen<br />
Anzahl von Verarbeitungsschritten einen Ausgangszustand (Output) bestimmen,<br />
der als Lösung der durch <strong>den</strong> Eingangszustand charakterisierten Aufgabe<br />
angesehen wer<strong>den</strong> kann.<br />
Algorithmen sind unabhängig von einer konkreten Programmiersprache <strong>und</strong> einem konkreten<br />
Computertyp, auf <strong>den</strong>en sie ausgeführt wer<strong>den</strong>. Die ältesten Rechenvorschriften,<br />
die sich Algorithmen nennen dürfen, gehen auf Theon <strong>und</strong> Euklid zurück9 ; siehe Abschnitte<br />
4.3 <strong>und</strong> 6.4.<br />
Das Problem je<strong>den</strong> Vorgehens, <strong>Zufallszahlen</strong> (auf dem Computer) mittels eines Algorithmus<br />
zu erzeugen, ist offenbar, dass Erzeugen“ <strong>und</strong> Zufall“ ein Widerspruch in<br />
” ”<br />
sich ist. Da der Determinismus schon per Definition eine Eigenschaft eines Algorithmus<br />
ist, steht jeder Nachfolger einer Zufallszahl deterministisch fest. Für die oben genannten<br />
Anwendungsgebiete genügen jedoch diese Pseudozufallszahlen“. Wir lassen das Präfix<br />
”<br />
” Pseudo“ meist weg.<br />
Was soll man unter einer Folge von <strong>Zufallszahlen</strong> verstehen? Der österreichische <strong>Mathematik</strong>er<br />
von Mises 10 versuchte es in der ersten Hälfte des 20. Jahrh<strong>und</strong>erts mit fehlender<br />
Vorhersehbarkeit: Eine 0-1-Sequenz sollte als zufällig gelten, wenn es keine Regel gibt, die<br />
an irgendeiner Stelle das nächste Glied aus <strong>den</strong> vorhergehen<strong>den</strong> mit einer Wahrscheinlichkeit<br />
größer als 50 Prozent prognostiziert. Für <strong>den</strong> Münzwurf bedeutet das: Systeme,<br />
die dem Spieler einen Vorteil versprechen, existieren nicht. So einleuchtend die Definition<br />
klingt, hat sie doch einen Haken. <strong>Von</strong> Mises konnte mathematisch nicht präzisieren, was<br />
er unter einer Regel verstand. Sein Ansatz blieb Stückwerk.<br />
7 random.org brüstet sich, seit 1998 857 Milliar<strong>den</strong> Zufallsbits, also zufällige Nullen <strong>und</strong> Einsen, erzeugt<br />
zu haben.<br />
8 Die Bezeichnung leitet sich aus dem Namen Al–Khwarizmi (Al–Khwarizmi,780?-850?), einem der<br />
bedeutensten <strong>Mathematik</strong>er des anfangen<strong>den</strong> Mittelalters, ab.<br />
9 Theon, um 350 v.Chr., Euklid, um 300 v.Chr.<br />
10 Richard von Mises, 1883-1953<br />
Stand: 21. November 2011 7 ○c J. Baumeister, T.G. Macedo
1.4 <strong>Zufallszahlen</strong> <strong>und</strong> deren Ersatz<br />
Erst in <strong>den</strong> sechziger Jahren des letzten Jahrh<strong>und</strong>erts fan<strong>den</strong> Kolmogorow 11 <strong>und</strong> Chaitin<br />
unabhängig voneinander mit einer speziellen Komplexitätstheorie einen Ausweg: Eine<br />
Zahlenfolge ist ihrer Meinung nach zufällig, wenn sie sich nicht mit einer kürzeren Zeichensequenz<br />
beschreiben lässt. Die Folge 11111. . . etwa kann man knapp ausdrücken mithilfe<br />
des mit Nullen <strong>und</strong> Einsen geschriebenen Computerbefehls <strong>für</strong> Schreibe lauter Einsen,<br />
die Folge 01010101. . . mit einem entsprechen<strong>den</strong> wiederhole 01 . Bei Zufallsfolgen darf es<br />
keine solche Umschreibung in Kurzform geben. Wir verfolgen dies nicht weiter, sondern<br />
geben uns zunächst mit einer ” naiven“ Vorstellung von Zufälligkeit zufrie<strong>den</strong>.<br />
Um die umständliche Verwendung von Tabellen<br />
(siehe Tabelle 2) zu vermei<strong>den</strong>, wer<strong>den</strong> <strong>Zufallszahlen</strong><br />
verwendet, die im Allgemeinen durch<br />
Iterationen nach einer Formel ad hoc hergestellt<br />
wer<strong>den</strong>. Die so erzeugten <strong>Zufallszahlen</strong> haben<br />
<strong>den</strong> Vorteil, dass sie konstruierbar sind, <strong>und</strong> haben<br />
<strong>den</strong> Nachteil, dass sie vollkommen deterministischen<br />
Charakter besitzen. Alles, was wir<br />
hier zunächst zur Sprechweise ” Zufallszahl“ sagen<br />
können, ist, dass je<strong>den</strong>falls kein Muster, keine<br />
Struktur in der Folge erkennbar sein soll. Die<br />
Wahrscheinlichkeitstheorie <strong>und</strong> Statistik stellt<br />
Hilfsmittel bereit, solche Folgen auf ihre Zufälligkeit<br />
zu testen.<br />
Im Lichte dieser Begriffsbildungen können<br />
wir nun Forderungen formulieren, die an einen<br />
<strong>Zufallszahlen</strong>-Generator zu stellen sind. Er soll<br />
Zahlen erzeugen, die folgende Eigenschaften haben:<br />
Abbildung 2: RAND-Tabelle<br />
Gleichverteilung Die Zufallsfolge genügt der Gleichverteilung in [0, 1] . Diese Einschränkung<br />
kann man überwin<strong>den</strong>, wir wer<strong>den</strong> später darauf zurückkommen.<br />
Unvorhersagbarkeit Kennt man eine Zufallszahl (Vorgänger), sollte die nächste konstruierte<br />
Zufallszahl (Nachfolger) nicht vorhersagbar sein. Dies bedeutet, dass der<br />
Konstruktionsmechanismus komplex genug ist, um zu vermei<strong>den</strong>, dass das Konstruktionsprinzip<br />
abgelesen wer<strong>den</strong> kann.<br />
Reproduzierbarkeit Um die Fehlersuche zu erleichtern <strong>und</strong> verschie<strong>den</strong>e Simulationen<br />
einfacher miteinander vergleichen zu können, ist es wichtig, dass eine einmal erzeugte<br />
Zufallsfolge immer wieder reproduziert wer<strong>den</strong> kann.<br />
Bei Spielen (der Bösewicht soll nicht immer zur selben Zeit auf der Bildfläche erscheinen)<br />
<strong>und</strong> in der Kryptologie steht dem gegenüber die Forderung nach Irreproduzierbarkeit.<br />
In der Kryptographie ist diese Forderung ” unverzichtbar“.<br />
Effizienz Dazu kommen die Forderungen, dass der Generator schnell ist <strong>und</strong> möglichst<br />
wenig Speicherplatz auf dem Computer belegt.<br />
Wie soll man nun gute <strong>und</strong> weniger gute Generatoren auseinanderhalten? Klar, indem<br />
man neben der ” Ausschöpfung“ des zur Verfügung stehen<strong>den</strong> Zahlraumes [0, 1] die<br />
obigen Forderungen abprüft. Dies geschieht im Allgemeinen mit theoretischen <strong>und</strong> empirischen<br />
Tests <strong>für</strong> die Güte von Generatoren. Theoretische Tests setzen am Generator<br />
11 A.N. Kolmogorow, 1903-1987<br />
Stand: 21. November 2011 8 ○c J. Baumeister, T.G. Macedo
1.5 Die middle square-Methode von J. von Neumann<br />
selbst an, empirische Tests nehmen sich die erzeugten Zahlenfolgen vor. Wir gehen auf<br />
die Kriterien Gleichverteiltheit, Unkorreliertheit später ein, die Effizienz übergehen wir<br />
weitgehend.<br />
Bereits 1955, als Computer noch ” neu“ waren, veröffentlichte die RAND-Corporation<br />
ein Buch mit einer Million Zufallsziffern. Darin wird die Vorgehensweise beschrieben, wie<br />
man zu diesen <strong>Zufallszahlen</strong> kam: Die <strong>Zufallszahlen</strong> wur<strong>den</strong> durch ” Randomisierung“ einer<br />
Gr<strong>und</strong>tabelle erzeugt, die mit einer elektronischen Roulettscheibe generiert wurde.<br />
Eine Pulsquelle mit zufälliger Frequenz wurde etwa einmal pro Sek<strong>und</strong>e von einem Puls<br />
konstanter Frequenz durchlaufen. Schaltkreise leiteten <strong>den</strong> Puls durch einen fünfstelligen<br />
Binärzähler. Die Anordnung entsprach im Prinzip einer Roulettscheibe mit 32 Plätzen,<br />
die pro Versuch durchschnittlich 3000 Umdrehungen machte <strong>und</strong> eine Zahl pro Sek<strong>und</strong>e<br />
produzierte. Ein Binär/Dezimal-Konverter wandelte 20 der 32 Zahlen um, der Rest<br />
wurde verworfen <strong>und</strong> behielt nur die letzte Stelle der zweistelligen Zahlen. Diese letzte<br />
Stelle steuerte einen IBM-Lochkartenstanzer, der schließlich eine Lochkartentabelle mit<br />
Zufallsziffern ausgab. Der Hauptteil des Buches umfasst die ” Tabelle der Zufallsziffern“.<br />
Sie wer<strong>den</strong> in Gruppen zu je fünf Ziffern aufgelistet.<br />
Wir erwarten, dass die erste Ziffer jedes Blockes ebenfalls zufällig ist. Diese ” Zufälligkeit“<br />
der ersten Ziffer – in Anbetracht des kleinen Ausschnitts der Zufallstabelle – ist nicht sehr<br />
ausgeprägt ist. Wir erwähnen diese Fragestellung, da wir uns noch ausführlich damit<br />
beschäftigen wollen.<br />
1.5 Die middle square-Methode von J. von Neumann<br />
Eine erste Realisierung der Pseudozufallserzeugung<br />
bestand in der Nutzung der Dezimalziffern<br />
transzen<strong>den</strong>ter Zahlen. Die Zahl π wurde<br />
1873 mit 703, 1960 mit 100 000 <strong>und</strong> 1986 mit<br />
10 7 Dezimalstellen berechnet. Die Analyse ergab,<br />
dass kein signifikanter Mangel zu erkennen<br />
war, was die Zufälligkeit der Dezimalstellen hinsichtlich<br />
Gleichverteilung in 0, 1, . . . , 9 betrifft.<br />
Da die Algorithmen zur Berechnung transzen<strong>den</strong>ter<br />
Zahlen in der Regel sehr kompliziert sind,<br />
wer<strong>den</strong> in der Praxis meist andere Algorithmen<br />
benutzt.<br />
i zi ui := 0.zi z 2 i<br />
0 7182 − − − 51 5811 24<br />
1 5811 0.5811 33 7677 21<br />
2 7677 0.7677 58 9363 29<br />
3 9363 0.9363 87 6657 69<br />
. . . . . . . . . . . .<br />
12 0012 0.0012 00 0001 44<br />
13 0001 0.0001 00 0000 01<br />
14 0000 0.0000 00 0000 00<br />
. . . . . . . . . . . .<br />
Einer der ältesten Generatoren ist die Abbildung 3: Middle-Square<br />
Middle-Square-Methode, die um 1940 von<br />
von J. von Neumann <strong>und</strong> S.M. Ulam im Rahmen<br />
des Los-Alamos-Projekts zur Entwicklung der Wasserstoffbombe <strong>für</strong> Computer-<br />
Simulationen eingesetzt wurde12 ; wir kommen im Rahmen der Monte Carlo-Simulation<br />
auf dieses Projekt zurück. Die middle square-Methode wird wie folgt durchgeführt wird:<br />
Wähle eine 4-stellige Zahl (Startwert), quadriere sie, man erhält eine höchstens<br />
8-stellige Zahl. Ist das Ergebnis nicht 8-stellig, füllt man sie links mit Nullen<br />
auf 8 Stellen auf. Die mittleren 4 Ziffern wählt man nun als erste Zufallszahl<br />
<strong>und</strong> als neuen Startwert <strong>für</strong> das Vorgehen.<br />
12 John von Neumann, 1903-1957, S.M. Ulam, 1909-1984<br />
Stand: 21. November 2011 9 ○c J. Baumeister, T.G. Macedo
1.5 Die middle square-Methode von J. von Neumann<br />
Ist man ” unvorsichtigt“ bei der Wahl des Startwertes, bekommt man eine nicht sehr<br />
brauchbare Folge. Etwa erhält man mit dem Startwert 8441:<br />
8441, 2504, 2700, 2900, 4100, 8100, 6100, 2100, 4100, 8100, . . . .<br />
Es ist sogar noch ” schlimmer“, wie das Beispiel in der Abbildung 3 andeutet: die ersten<br />
Schritte des Middle-square-Algorithmus scheinen brauchbare <strong>Zufallszahlen</strong> zu liefern,<br />
die Fortsetzung bei i = 12 zeigt aber, dass die Iteration bei der ” Zufallszahl“ Null endet.<br />
In der Tat tendiert der Algorithmus in vielen Fällen dazu, bei Null zu en<strong>den</strong>. Also<br />
scheint der Algorithmus unbrauchbar zu sein, <strong>Zufallszahlen</strong> zu erzeugen. Anderenfalls ist<br />
das obige kurze Stück 8100, 6100, . . . , 8100 das periodische Stück einer doch recht langen<br />
nichtperiodischen Zahlensequenz, die mit dem Startwert 6239 beginnt; man rechne dies<br />
nach.<br />
Bibliographische Anmerkungen<br />
Die hier vorgestellten Überlegungen sind so allgemeiner Natur, dass Verweise nahezu<br />
unnötig sind. Algorithmen sind das Werkzeug der <strong>Mathematik</strong> <strong>und</strong> Informatik. Eine schon<br />
etwas in die Jahre gekommene, aber immer noch topaktuelle dreibändige Monographie<br />
dazu ist das Werk von D.E. Knuth [49].<br />
Zu einer populärwissenschaftlichen Diskusion der Frage des Zufalls <strong>und</strong> der Zufallsfolgen<br />
siehe etwa [Zei00].<br />
<strong>Von</strong> der Verwendung des middle square–Generators ist abzuraten, weil seine Perio<strong>den</strong>länge<br />
im Allgemeinen sehr klein ist. Interessanterweise gibt es Modifikationen hiervon,<br />
die Knuth als muddle square–Generator bezeichnet. In Bemerkung 7.10 kommen mit dem<br />
Twister-Generator auf eine solche Modifikation zurück.<br />
Stand: 21. November 2011 10 ○c J. Baumeister, T.G. Macedo
2 (Mathematische) Wahrscheinlichkeit<br />
Eine sehr kleine Ursache, die uns entgehen mag, bewirkt<br />
einen beachtlichen Effekt, <strong>den</strong> wir nicht ignorieren können,<br />
<strong>und</strong> wir sagen dann, dass dieser Effekt auf Zufall beruht<br />
Henri Poincaré, 1903<br />
Hier skizzieren wir die Begriffe, die wir aus dem Bereich der Wahrscheinlichkeitstheorie<br />
<strong>für</strong> die Diskussion unserer Ergebnisse benötigen. Beispiele <strong>für</strong> die Begriffe führen wir hier<br />
im Allgemeinen nicht an, sie folgen in ausreichender Auswahl in <strong>den</strong> nächsten Abschnitten.<br />
2.1 Zufall, Ereignismenge <strong>und</strong> Wahrscheinlichkeit<br />
Wie re<strong>den</strong> wir über <strong>den</strong> Zufall? Wir wollen uns nicht lange dabei aufhalten. Mögliche<br />
” Definitionsschnipsel“ sind:<br />
• Wenn im Bereich der Geschehnisse, die im strengen Sinn wegen etwas eintreten <strong>und</strong><br />
deren Ursache außer ihnen liegt, etwas geschieht, das mit dem Ergebnis nicht in eine<br />
Deswegen-Beziehung zu bringen ist, dann nennen wir das zufällig (Aristoteles) 13<br />
• Zufall ist das Eintreten unvorhergesehener <strong>und</strong> unbeabsichtigter Ereignisse.<br />
• Das, wobei unsere Rechnungen versagen, nennen wir Zufall (Albert Einstein).<br />
• Jemandem fällt etwas (unverdientermaßen) zu.<br />
Die Spannung bei der Verwendung des Zufalls resultiert wesentlich aus der naturwissenschaftlichen<br />
Sicht vom Eintreten von Ereignissen: das Kausalitätsprinzip lässt ” Nicht–<br />
Determiniertes“ nicht zu; siehe unten. Ein Ausweg ist, dass wir unterstellen, die Umstände<br />
(Anfangsbedingungen) des Greifens von naturwissenschaftlichen Gesetzen nicht vollständig<br />
kennen zu können. Beispiele <strong>für</strong> das ” Wirken von Zufall“ sind etwa:<br />
• Ergebnis beim Münzwurf<br />
• Eintreten von Augenzahlen beim Würfeln<br />
• Radioaktiver Zerfall<br />
• Ges<strong>und</strong> trifft auf krank in der U-Bahn<br />
• Ein Blatt fällt von einem Baum zu Bo<strong>den</strong>, landet es auf der Voderseite oder Rückseite?<br />
• Männlicher oder weiblicher Nachwuchs<br />
In der Wahrscheinlichkeitsrechnung betrachtet man so genannte Zufallsexperimente<br />
(Lottoziehung, Würfeln, Ergebnis einer Befragung); im ersten Kapitel haben wir schon<br />
darüber geredet. Bei all diesen Experimenten gibt es eine Menge möglicher Ereignisse,<br />
üblicherweise mit dem griechischen Großbuchstaben Omega bezeichnet:<br />
Ω = {ω1, ω2, . . . , ωn} .<br />
Ω ist die Ereignismenge, jedes ωi heißt ein Elementarereignis. Eine Teilmenge von Ω<br />
heißt ein zusammengesetztes Ereignis.<br />
13 <strong>Von</strong> Aristoteles (384-322 v. Chr.) ist auch überliefert (Quelle: [72], S. 183): ” . . . Alle Gebilde, bei deren<br />
Entstehen sich alle gerade so ergeben habe, wie es auch ein zweckbestimmtes Wer<strong>den</strong> hervorgebracht<br />
haben würde, hätten sich nun am Leben erhalten können, da sie dank dem blin<strong>den</strong> Zufall einen lebensdienlichen<br />
Aufbau besessen hätten. Das Übrige aber sei zugr<strong>und</strong>e gegangen <strong>und</strong> gehe stets zugr<strong>und</strong>e.“<br />
Stand: 21. November 2011 11 ○c J. Baumeister, T.G. Macedo
2.2 Mehrstufige Zufallsexperimente <strong>und</strong> Baumdiagramme<br />
Nun gehen wir daran, das Nichtwissenkönnen des Ausgangs eines Zufallsexperiments<br />
zu quantifizieren. Jedem Ereignis soll eine Zahl aus [0, 1] zugeordnet wer<strong>den</strong>, die uns gestattet,<br />
die Unsicherheit über <strong>den</strong> Ausgang anzugeben: 1 sollte <strong>für</strong> absolute Sicherheit, 0<br />
<strong>für</strong> vollständige Unsicherheit stehen.<br />
Als Maßzahl <strong>für</strong> die Chance <strong>für</strong> das Eintreten eines Elementarereignisses ωi sehen wir<br />
eine nichtnegative (reelle) Zahl pi an. Diese Maßzahl pi nennen wir die Wahrscheinlichkeit<br />
<strong>für</strong> das Eintreten des Elementarereignisses ωi . Als Normierung betrachtet man die<br />
Bedingung, dass sich diese Elementarwahrscheinlichkeiten zu Eins aufsummieren. Dies ist<br />
in Übereinstimmung mit der Sichtweise, dass ein sicheres Eintreten eines Ereignisses mit<br />
der Chance Eins bewertet wird. Damit ergibt sich die so genannte Wahrscheinlichkeitsabbildung<br />
auf der Potenzmenge 14 POT(Ω):<br />
P : POT(Ω) ∋ A ↦−→ P (A) := #A<br />
#Ω<br />
∈ [0, 1] . (1)<br />
Wir führen ein bißchen ” Algebra“ <strong>für</strong> das Rechnen mit Wahrscheinlichkeiten an.<br />
Wenn das Ereignis E ⊂ Ω das zusammengesetzte Ereignis A ∪ B ist, verbin<strong>den</strong> wir<br />
damit folgende Sprechweise: E ist das Ereigneis, dass A oder B eintritt. Was ist die<br />
Wahrscheinlichkeit von E? Ist die Vereinigung A ∪ B disjunkt, d.h. ist A ∩ B = ∅, dann<br />
gilt P (A ∪ B) = P (A) + P (B) . Ist die Vereinigung nicht disjunkt, dann gilt<br />
P (A ∪ B) = P (A) + P (B) − P (A ∩ B) .<br />
Dies zeigt man leicht durch Abzählen der Elementarereignisse, der Term −P (A ∩ B)<br />
berücksichtigt die Tatsache, dass die Elementarereignisse in A ∩ B durch P (A) + P (B)<br />
doppelt gezählt wer<strong>den</strong>.<br />
Manchmal sind alle n Elementarereignisse gleichwahrscheinlich, d.h. als Ausgang des<br />
Experiments kann jedes Elementarereignis mit der gleichen Chance eintreten. Dann ist<br />
die Wahrscheinlichkeit pi <strong>für</strong> jedes Elementarereignis natürlich der n-te Teil der Gesamtwahrscheinlichkeit<br />
Eins, also<br />
pi = 1<br />
n<br />
<strong>für</strong> alle i = 1, . . . , n .<br />
Man spricht dann von einem Laplace-Experiment. 15<br />
Bemerkung 2.1 Hier haben wir nur die Wahrscheinlichkeitsrechnung mit endlicher Ereignismenge<br />
angerissen. <strong>Von</strong> sehr viel größerer Komplexität ist die Theorie bei unendlicher<br />
Ereignismenge. Hier tritt schon die Frage auf, welche zusammengesetzte Ereignisse eine<br />
Wahrscheinlichkeit haben sollen. Beleuchtet wird diese Frage durch die Tatsache, dass in<br />
diesem Kontext Elementarereignisse im Allgemeinen die Wahrscheinlichkeit Null besitzen;<br />
eine Additivität von Wahrscheinlichkeiten ist daher problematisch. Wir kommen im<br />
Kapitel 8 darauf zurück. �<br />
2.2 Mehrstufige Zufallsexperimente <strong>und</strong> Baumdiagramme<br />
Etwas komplexer wird eine Experimentsituation, wenn man sich mehrstufige Zufallsexperimente<br />
anschaut, wie etwa die N-malige Wiederholung eines Experiments. Die Wahrscheinlichkeiten<br />
<strong>für</strong> das mehrstufige Experiment soll ermittelt wer<strong>den</strong> aus <strong>den</strong> Wahrscheinlichkeiten,<br />
die auf jeder Stufe bekannt seien. Eine Möglichkeit, eine solche Situation zu<br />
14 Die Potenzmenge einer Menge M ist die Menge aller Teilmengen von M . Mit dem Symbol #M<br />
schreiben wir die Anzahl der Elemente der Menge M auf. #M = ∞ bedeutet, dass M eine Menge mit<br />
unendlich vielen Elementen ist.<br />
15 P.-S. Laplace, 1749-1827<br />
Stand: 21. November 2011 12 ○c J. Baumeister, T.G. Macedo
2.2 Mehrstufige Zufallsexperimente <strong>und</strong> Baumdiagramme<br />
veranschaulichen, besteht darin, ein Baumdiagramm zu zeichnen. Ein Baumdiagramm<br />
ist ein verzweigtes Diagramm, bei dem jeder Stufe des Zufallsexperimentes eine ” Ebene“<br />
entspricht. Man zeichnet Blasen, die mit <strong>den</strong> jeweiligen Stufen–Ereignissen gekennzeichnet<br />
sind <strong>und</strong> schreibt die Wahrscheinlichkeiten <strong>für</strong> ihr Eintreten an die Verbindungslinien<br />
(siehe Abbildung 4 in Verbindung mit Beispiel 2.2). Dieses Diagramm wird von links nach<br />
rechts gelesen.<br />
Zwei Regeln wer<strong>den</strong> zur Berechnung der Wahrscheinlichkeit<br />
des mehrstufigen Experiments herangezogen.<br />
1. Pfadregel: Multiplikationsregel<br />
Die Wahrscheinlichkeit eines Ereignisses bei einem<br />
mehrstufigen Zufallsexperiment, die sich aus einem<br />
Pfad des Diagramms ergibt, ist gleich dem<br />
Produkt der Wahrscheinlichkeiten längs des Pfades,<br />
der zu diesem Ergebnis führt! Begründung:<br />
Diese Regel ist einsichtig, etwa wenn man an die<br />
Häufigkeitsinterpretation (siehe unten) <strong>den</strong>kt.<br />
2. Pfadregel: Additionsregel<br />
Setzt sich ein mehrstufiges Ereignis aus verschie<strong>den</strong>en<br />
Pfa<strong>den</strong> eines Baumdiagramms zusammen, so<br />
erhält man seine Wahrscheinlichkeit durch Addition<br />
der einzelnen Pfadwahrscheinlichkeiten.<br />
4/6<br />
2/6<br />
6<br />
2<br />
1. Stufe<br />
4/6<br />
4/6<br />
2/6<br />
2/6<br />
6<br />
2<br />
6<br />
2. Stufe<br />
2<br />
(1. Wurf) (2. Wurf)<br />
p= 16/36<br />
p=8/36<br />
p=8/36<br />
p=4/36<br />
Abbildung 4: Würfelexperiment<br />
Beispiel 2.2 Wir würfeln mit einem Würfel, der<br />
auf 4 Seiten die Zahl 2 <strong>und</strong> auf <strong>den</strong> übrigen 2 Seiten die Zahl 6 zeigt. Er wird 2-mal<br />
geworfen. Wir machen dazu ein Pfaddiagramm; siehe Abbildung 4. An <strong>den</strong> Pfa<strong>den</strong><strong>den</strong><br />
können wir Wahrscheinlichkeiten ablesen. Die Wahrscheinlichkeit, dass zweimal eine<br />
Sechs gewürfelt wird, ergibt sich nach der ersten Pfadregel zu 4/36, die Wahrscheinlichkeit,<br />
dass nach zwei Würfen die Augensumme 8 vorliegt, ergibt sich nach der zweiten<br />
Pfadregel zu 8/36 + 8/36 = 16/36. �<br />
Jetzt haben wir schon viel von Wahrscheinlichkeit gesprochen, aber was soll man sich<br />
darunter vorstellen? Eine Möglichkeit bietet die Häufigkeitsinterpretation. Sie fasst<br />
Wahrscheinlichkeit etwa so:<br />
Wenn man ein Zufallsexperiment N-mal wiederholt, möge das Elementarereignis<br />
ωi etwa mi-mal eintreten. Ist nun pi die (theoretische) Wahrscheinlichkeit<br />
<strong>für</strong> das Eintreten von ωi, so sollte die Häufigkeit mi etwa gleich N · pi sein; je<br />
größer die Zahl der Wiederholungen N ist, desto genauer sollte das Ergebnis<br />
mi an die erwartete Anzahl N · pi herankommen (Gesetz der großen Zahl;<br />
siehe 8.1).<br />
Es gibt also <strong>für</strong> das Eintreffen eines Ereignisses bei einem Zufallsexperiment nicht nur die<br />
theoretische Wahrscheinlichkeit, sondern auch eine empirische Wahrscheinlichkeit. Das<br />
Empirische Gesetz der Großen Zahlen besagt, dass je öfter man ein ” echtes“ Zufallsexperiment<br />
durchführt, desto mehr stabilisiert sich die relative Häufigkeit eines Ereignisses<br />
um einen festen Wert, <strong>den</strong> der theoretischen Wahrscheinlichkeit. Für eine Zufallsvariable<br />
bedeutet dies, dass sich der Erwartungswert der Zufallsvariablen einstellt.<br />
Die Wahrscheinlichkeit p, dass eine Reißzwecke so fällt, dass die Spitze nach oben<br />
zeigt, oder ein Butterbrot beim Herunterfallen so fällt, dass die Butterseite unten ist,<br />
kann nur empirisch festgestellt wer<strong>den</strong>. Man möchte dabei die theoretische Wahrscheinlichkeit<br />
p mittels einer Versuchsserie so abschätzen, dass sich die relative Häufigkeit <strong>und</strong><br />
p angleichen.<br />
Stand: 21. November 2011 13 ○c J. Baumeister, T.G. Macedo
2.3 Hilfsmittel zur Realisierung von Laplace-Experimenten<br />
2.3 Hilfsmittel zur Realisierung von Laplace-Experimenten<br />
Ein Mechanismus, der eine Zufallswahl bewerkstelligt, die zwei Ergebnisse mit der Wahrscheinlichkeit<br />
1 als Ausgang hat, ist der Münzwurf. Wir unterstellen also, dass wir es mit<br />
2<br />
einer fairen“ Münze zu tun haben, bei der jede der bei<strong>den</strong> Seiten – wir bezeichnen sie mit<br />
”<br />
Kopf <strong>und</strong> Zahl – die gleiche Chance hat, oben zu liegen. Wenn wir Kopf die Zahl Eins (1)<br />
<strong>und</strong> Zahl die Zahl Null (0) zuordnen, erzeugen wir also bei mehrmaliger Wiederholung<br />
des Münzwurfes eine Folge von Nullen <strong>und</strong> Einsen. Man nennt eine solche Folge auch<br />
ein Wort über dem (einfachen) Alphabet {0, 1} . Für eine solches Wort haben wir die<br />
Interpretation als Dualzahlen.<br />
Betrachten wir etwa <strong>den</strong> Ausgang 00101011. Dieses Wort entspricht dann der Dualzahl,<br />
die die Zahl 43 im Dezimalsystem darstellt:<br />
0 · 2 7 + 0 · 2 6 + 1 · 2 5 + 0 · 2 4 + 1 · 2 3 + 0 · 2 2 + 1 · 2 1 + 1 · 2 0 = 43<br />
Jede dieser achtstelligen Dualzahlen hat als Wahrscheinlichkeit, geworfen zu wer<strong>den</strong>, <strong>den</strong><br />
Wert ( 1<br />
2 )8 = 1/256, wie man sich über ein Baumdiagramm mit 8 Stufen mittels der 1.<br />
Pfadregel überzeugt. 16<br />
Unter ” Würfeln“ verstehen wir die zufällige Auswahl einer Zahl aus 1,2,. . . ,6. Natürlich<br />
stellt diese Darstellung die historische Wahrheit auf <strong>den</strong> Kopf: ein Würfel mit seinen<br />
gleichen sechs Seiten stellt die einfache Realisierung der zufälligen Auswahl von Zahlen<br />
dar, die Gleichverteilung der Auswahl der Zahlen ist eine Konsequenz der unterstellten<br />
geometrischen Gestalt des Würfels. 17 Heutzutage besitzt fast jedes Handy die Möglichkeit,<br />
<strong>den</strong> Würfel zu simulieren <strong>und</strong> damit <strong>Zufallszahlen</strong> im Bereich 1, 2, . . . , 6 nachzustellen.<br />
Beim Würfelexperiment (mit einem fairen Würfel), betrachtet als Laplace–Experiment,<br />
haben wir als Ereignismenge<br />
Ω = {1, . . . , 6}<br />
<strong>und</strong> jedes Elementarereignis ωi hat die Wahrscheinlichkeit<br />
pi = 1<br />
6<br />
, i = 1, 2, . . . , 6<br />
Für das zusammengesetzte“ Ereignis, eine Eins, Zwei oder Drei zu würfeln, errechnen wir<br />
”<br />
eine Wahrscheinlichkeit 1 mit der zweiten Pfadregel; anschaulich ist das Ergebnis natürlich<br />
2<br />
klar, <strong>den</strong>n die erste Hälfte“ der Augen ist gleichwahrscheinlich mit der zweiten Hälfte“<br />
” ”<br />
der Augen.<br />
Beim Würfeln mit zwei (fairen) Würfeln, betrachtet als Laplace–Experiment, haben<br />
wir:<br />
Ω = {(i, j) ∈ N × N|1 ≤ i, j ≤ 6} ; pij = 1<br />
, 1 ≤ i, j ≤ 6 .<br />
36<br />
Kommen wir zum Augensummenparadoxon zurück, das wir im ersten Kapitel betrachtet<br />
haben. Wir betrachten das Würfeln mit zwei Würfeln als Laplace–Experiment. Wir<br />
unterstellen damit, dass die Würfel unterscheidbar sind <strong>und</strong> es daher einen ersten <strong>und</strong><br />
einen zweiten Würfel gibt. Wir haben<br />
Ω = {(i, j) ∈ N × N|1 ≤ i, j ≤ 6},<br />
16 Diese kleine Zahl entspricht der Wahrscheinlichkeit, dass der Kracke Paul <strong>für</strong> acht Spiele der Welt-<br />
meisterschaft <strong>den</strong> Ausgang richtig voraussagt, wenn man eine Irrtumswahrscheinlichkeit von 1<br />
2 unterstellt.<br />
17 Siehe http://de.wikipedia.org/wiki/Spielwürfel<br />
Stand: 21. November 2011 14 ○c J. Baumeister, T.G. Macedo
2.3 Hilfsmittel zur Realisierung von Laplace-Experimenten<br />
<strong>und</strong> interessieren uns also <strong>für</strong> die Laplace–Wahrscheinlichkeiten der Ereignisse<br />
A9 := {(i, j) ∈ Ω|i + j = 9} , A10 := {(i, j) ∈ Ω|i + j = 10} .<br />
Wir haben dazu A9, A10 abzuzählen. Es gilt<br />
A9 = {(3, 6), (6, 3), (4, 5), (5, 4)} , A10 = {(4, 6), (6, 4), (5, 5)} .<br />
<strong>und</strong> daher<br />
P (A9) = 4 1<br />
=<br />
36 9 , P (A10) = 3 1<br />
=<br />
36 12<br />
Bei drei Würfeln zeigt eine einfache Aufzählung (bei entsprechender Bezeichnung)<br />
P (A9) = 19<br />
216 , P (A10) = 24<br />
216 .<br />
Modelliert man das Experiment mit zwei ununterscheidbaren Würfeln, dann hat man statt<br />
36 Möglichkeiten nur noch 21 mögliche Ausgänge, aber kein Laplace–Experiment mehr,<br />
da etwa die Ausgänge 1–1 <strong>und</strong> 1–2 verschie<strong>den</strong>e Wahrscheinlichkeiten haben. Damit ist<br />
der Leibnizsche Fehler nun offensichtlich.<br />
Bei der Beschriftung eines Würfels mit <strong>den</strong> ” Augenzahlen“ 1,2,3,4,5,6 gibt es viele<br />
Möglichkeiten. Unter diesen Möglichkeiten wer<strong>den</strong> aber in der Praxis nur die so genannten<br />
7er-Beschriftungen realisiert. Sie sind dadurch ausgezeichnet, dass die Beschriftung<br />
zweier gegenüberliegender Seiten so gewählt wird, dass die Augensumme 7 ergibt. Darunter<br />
haben sich genau 2 Möglichkeiten durchgesetzt. Sie sind dargestellt durch folgende<br />
” Würfelnetze“: ⎛<br />
3<br />
⎝6<br />
5<br />
4<br />
1 2<br />
⎞<br />
⎠<br />
⎛<br />
4<br />
⎝6<br />
5<br />
3<br />
1 2<br />
Wie kann man mit Hilfe eines Münzwurfes einen Würfel simulieren? Hier kommen uns<br />
die Dualzahlen zu Hilfe, <strong>den</strong>n mit einem dreifachen Münzwurf können wir die Dualzahlen<br />
000, 001, 010, 100, 011, 110, 101, 111 (0 entspricht Kopf, 1 entspricht Zahl) ” auswürfeln“.<br />
Aus diesen 8 Möglichkeiten müssen wir nun 6 machen, also 2 ” streichen“; wir sollten 000<br />
(entspricht 0) <strong>und</strong> 111 (entspricht 7) streichen Dies kann so geschehen:<br />
S1 Werfe dreimal die Münze.<br />
S2 Ist das Ergebnis 000 oder 111, gehe zu S1, sonst<br />
S3 notiere das Ergebnis als Würfelwurfergebnis.<br />
Ein beliebtes Bild von einem Zufalls–Mechanismus ist das Urnenmodell. Eine Urne<br />
ist ein Gefäß, in dem Gegenstände ” versteckt“ wer<strong>den</strong>, die man dann wieder – nach ausreichendem<br />
Mischen – herausholen kann.<br />
Beispiel 2.3 In einer Urne liegen drei schwarze Kugeln <strong>und</strong> eine weiße Kugel. Auf gut<br />
Glück wer<strong>den</strong> zwei Kugeln der Urne entnommen. Welche Wahrscheinlichkeit ist größer,<br />
zwei schwarze Kugeln oder eine weiße <strong>und</strong> eine schwarze Kugel herauszunehmen? Man<br />
ist auf Gr<strong>und</strong> der Tatsache, dass dreimal soviele schwarze wie weiße Kugeln in der Urne<br />
liegen zu vermuten, dass die erste Möglichkeit wahrscheinlicher ist. Dem ist aber nicht<br />
so, <strong>den</strong>n es gibt drei Möglichkeiten, zwei schwarze Kugeln herauszunehmen <strong>und</strong> drei<br />
Möglichkeiten eine schwarze <strong>und</strong> eine weiße Kugel herauszunehmen. Es lässt sich dies<br />
auch rechnerisch begrün<strong>den</strong>:<br />
Wahrscheinlichkeit <strong>für</strong> das Ziehen zweier schwarzer Kugeln<br />
3<br />
4<br />
· 2 3 = 1 2<br />
Wahrscheinlichkeit <strong>für</strong> das Ziehen einer weißen <strong>und</strong> einer schwarzer Kugel 1<br />
4<br />
· 1 + 3 4 · 1 3 .<br />
Man fertige dazu ein Baumdiagramm! �<br />
Stand: 21. November 2011 15 ○c J. Baumeister, T.G. Macedo<br />
⎞<br />
⎠
2.4 Zufallsvariable, Erwartungswert <strong>und</strong> Verteilung<br />
2.4 Zufallsvariable, Erwartungswert <strong>und</strong> Verteilung<br />
Eine Funktion, die <strong>den</strong> Ergebnissen eines Zufallsexperiments numerische Werte zuordnet,<br />
nennt man eine Zufallsvariable. Die Bedeutung der Zufallsvariable liegt darin, dass<br />
durch sie die Verbindung zwischen dem Resultat eines Zufallsexperiments <strong>und</strong> seiner mathematischen<br />
Darstellung/Realisation hergestellt wird. Bei einer diskreten Zufallsvariablen<br />
– <strong>und</strong> nur solche betrachten wir hier in erster Linie – sind nur endlich viele Realisierungen<br />
möglich.<br />
Zum Beispiel kann das Zufallsexperiment des Münzwurfs als Zufallsvariable X modelliert<br />
wer<strong>den</strong>: X bildet die Menge der Wurfergebnisse Kopf, Zahl auf die Menge der<br />
Realisationen {0, 1} ab:<br />
X(ω) =<br />
�<br />
0, wenn ω = Kopf,<br />
1, wenn ω = Zahl.<br />
Das Zufallsexperiment ” Wurf mit drei (fairen) Würfeln“ <strong>und</strong> die Frage nach der Augensumme<br />
kann mit Hilfe einer Zufallsvariablen Z so modelliert wer<strong>den</strong>:<br />
Z((ω1, ω2, ω3)) := ω1 + ω2 + ω3 , ωi ∈ {1, 2, . . . , 6} .<br />
Sei X eine Zufallsvariable mit reellen Werten 18 . Die Wahrscheinlichkeiten<br />
Ws(X = x) , x Realisierung<br />
gibt die Wahrscheinlichkeit der unterschiedlichen Realisierungen x an; man nennt diese<br />
Gesamtheit Verteilung von X . Die Verteilungsfunktion von X ist definiert durch<br />
F (x) := Ws(X ≤ x) .<br />
Der Erwartungswert der Zufallsvariablen X – wir schreiben <strong>für</strong> dies Maßzahl E(X) –<br />
ist jener Wert, der sich (in der Regel) bei oftmaligem Wiederholen des zugr<strong>und</strong>e liegen<strong>den</strong><br />
Experiments als Mittelwert der Ergebnisse einstellt. In der Situation<br />
erhalten wir<br />
Ω = {ω1, . . . , ωn} , pi = P ({ωi}), i = 1, . . . , n,<br />
E(X) =<br />
n�<br />
piX(ωi) .<br />
i=1<br />
Ein Erwartungswert muss kein mögliches Ergebnis des zugr<strong>und</strong>e liegen<strong>den</strong> Zufallsexperiments<br />
sein. Beispielsweise ist der Erwartungswert der Augen beim Würfelwurf gegeben<br />
durch<br />
1 · 1 1 1 7<br />
+ 2 · + · · · + 6 · =<br />
6 6 6 2 .<br />
Eine weitere wichtige Maßzahl der Zufallsvariablen X ist die Varianz. Wir schreiben<br />
da<strong>für</strong> V(X) . Sie ist definiert durch<br />
V(X) := E((X − E(X)) 2 )<br />
Die ” physikalische“ Einheit der Varianz ist das Quadrat der Einheit der Zufallsvariablen<br />
X . Dies ist birgt gewisse Nachteile. Daher wird die abgeleitete Größe Standardabweichung<br />
19 eingeführt. Sie ist <strong>für</strong> eine Zufallsvariable X definiert als die positive Quadratwurzel<br />
aus deren Varianz <strong>und</strong> wird als σ(X) := � V(X) notiert. Sie beschreibt also, wie<br />
18Wir verwen<strong>den</strong> hier die reellen Zahlen ohne auf die inneren Eigenschaften einzugehen. Im Kapitel 4<br />
schauen wir etwas genauer hin.<br />
19Die Standardabweichung wurde um 1860 von Sir Francis Galton, 1822-1911, Cousin von C.R. Darwin,<br />
eingeführt<br />
Stand: 21. November 2011 16 ○c J. Baumeister, T.G. Macedo
2.4 Zufallsvariable, Erwartungswert <strong>und</strong> Verteilung<br />
im Mittel die abgeleitete Zufallsvariable X−E(X) um <strong>den</strong> Erwartungswert E(X) streut“.<br />
”<br />
Beispielsweise ist die Standardabweichung der Augen beim Würfelwurf gegeben durch<br />
�<br />
70 7<br />
σ(X) = , da (1 −<br />
4 2 )2 + (2 − 7<br />
2 )2 + · + (6 − 7<br />
2 )2 = 70<br />
4 .<br />
Das Galtonbrett besteht aus einer regelmäßigen<br />
Anordnung von Hindernissen, an <strong>den</strong>en eine von<br />
oben eingeworfene Kugel jeweils nach links oder<br />
rechts abprallen kann; vergleiche mit einem Flipperspiel.<br />
Nach dem Passieren der Hindernisse wer<strong>den</strong><br />
die Kugeln in Fächern aufgefangen, um dort<br />
gezählt zu wer<strong>den</strong>; siehe Abbildung 5. Jedes Aufprallen<br />
einer Kugel auf eines der Hindernisse ist<br />
ein Bernoulli-Versuch. Die bei<strong>den</strong> möglichen<br />
Ausgänge sind: Kugel fällt nach rechts, Kugel fällt<br />
nach links.<br />
Bei symmetrischem Aufbau ist die Wahrschein-<br />
lichkeit, nach rechts zu fallen, p = 1<br />
2<br />
<strong>und</strong> die Wahr-<br />
scheinlichkeit, nach links zu fallen, q = 1 − p =<br />
Abbildung 5: Das Galtonbrett<br />
1<br />
2 .<br />
Durch unsymmetrischen Aufbau oder durch Schiefstellen<br />
des Brettes kann man auch einen anderen<br />
Wert <strong>für</strong> p erreichen, wobei aber natürlich weiterhin<br />
q = 1−p ist, <strong>den</strong>n die Kugeln, die nicht nach rechts<br />
fallen, fallen nach links. Indem die Kugel nach Passieren<br />
des ersten Hindernisses auf ein neues trifft,<br />
bei dem die gleichen Voraussetzungen gelten, wird<br />
hier ein weiterer Bernoulli-Versuch durchgeführt; das Durchlaufen des ganzen Gerätes ist<br />
also eine mehrstufige Bernoulli-Kette, wobei die Zahl der waagrechten Reihen von Hindernissen<br />
die Anzahl der Ebenen, die Länge dieser Kette ist. In der Abbildung 5 handelt<br />
es sich demnach um ein Galtonbrett mit 6 Ebenen <strong>und</strong> um eine 6-malige Wiederholung<br />
eines Bernoulli-Versuchs, d.h. eine Bernoulli-Kette der Länge 6.<br />
Sei n die Anzahl der Ebenen eines Galtonbretts. Die Anzahl der Fächer, in die die<br />
Kugeln fallen können, ist dann n + 1 . Je<strong>den</strong> Durchlauf einer Kugel kann man mit einem<br />
Wort der Länge n über dem Alphabet {L, R} in Verbindung bringen, wobei wir festlegen,<br />
dass L (links) bzw. R (rechts) mit der Draufsicht gemeint ist. Beispielsweise ist der in der<br />
Abbildung 5 eingezeichnete Durchlauf beschrieben durch das Wort RLLRRR .<br />
Sei nun ein Wort der Länge n betrachtet, in dem l-mal der Buchstabe L vorkommt.<br />
Dann ist die Wahrscheinlichkeit <strong>für</strong> dieses Wort ( 1<br />
2 )l ( 1<br />
2 )n−l = ( 1<br />
2 )n . Wenn wir die Fächer<br />
von links nach rechts durchnummerieren mit <strong>den</strong> Nummern 0, 1, . . . , n, dann haben wir<br />
nach der Pfadregel <strong>für</strong> die Wahrscheinlichkeit, dass eine Kugel in das Fach mit der Nummer<br />
m fällt, die Wahrscheinlichkeiten aller Pfade, die zum Fach m führen, aufzusummieren.<br />
Das Fach mit der Nummer m kann erreicht wer<strong>den</strong> durch einen Durchlauf, der durch<br />
die Worte beschrieben wird, die m-mal <strong>den</strong> Buchstaben R enthalten. Um diese Worte<br />
abzuzählen, hat man die Möglichkeiten zu zählen, die bei der Verteilung von m Buchstaben<br />
R auf n Plätze bestehen. Dies sind<br />
� �<br />
n<br />
m<br />
:=<br />
n!<br />
(n − m)!m!<br />
Stand: 21. November 2011 17 ○c J. Baumeister, T.G. Macedo
2.5 Determinismus, Kausalität, Berechenbarkeit <strong>und</strong> Zufall<br />
viele. Damit ergibt sich <strong>für</strong> die Wahrscheinlichkeit b(m, n), dass eine Kugel in das Fach<br />
m fällt als<br />
� � � �n n 1<br />
b(m, n) =<br />
m 2<br />
(2)<br />
An der Abbildung 5 erkennen wir, dass die Füllung der Fächer <strong>für</strong> großes n sehr schön die<br />
Gaußsche Glockenkurve (siehe <strong>den</strong> ehemaligen 10 DM-Schein) annähert. Diese Approximationsgüte<br />
lässt sich mit Hilfe der Normalverteilung analytisch erklären; siehe Abschnitt<br />
8.1.<br />
2.5 Determinismus, Kausalität, Berechenbarkeit <strong>und</strong> Zufall<br />
Determinismus 20 ist die Auffassung, dass zukünftige Ereignisse durch Vorbedingungen<br />
eindeutig festgelegt sind. Als Determiniertheit bezeichnet man etwa in <strong>den</strong> Naturwissenschaften<br />
die a-priori-Festlegung der Reaktion eines Systems, in der Theoretischen<br />
Informatik eine Eigenschaft eines Algorithmus; siehe Abschnitt 1.4.<br />
Kausalität 21 bezeichnet die Beziehung zwischen Ursache <strong>und</strong> Wirkung, betrifft also<br />
die Abfolge aufeinander bezogener Ereignisse <strong>und</strong> Zustände. Die Kausalität hat eine feste<br />
zeitliche Richtung, die immer von der Ursache ausgeht, auf die die Wirkung folgt.<br />
Laplace formuliert:<br />
Eine Intelligenz, welche <strong>für</strong> einen gegebenen Augenblick alle in der Natur wirken<strong>den</strong><br />
Kräfte sowie die gegenseitige Lage der sie zusammensetzen<strong>den</strong> Elemente<br />
kennt <strong>und</strong> überdies umfassend genug wäre, um diese gegebenen Größen der<br />
Analysis zu unterwerfen, würde in derselben Formel die Bewegung der größten<br />
Weltkörper wie des leichtesten Atoms umschließen; nichts würde ihr ungewiss<br />
sein, <strong>und</strong> Zukunft wie Vergangenheit wür<strong>den</strong> ihr offen vor Augen liegen.<br />
Also nach Laplace: Gleiche Ursachen haben gleiche Wirkungen. Ein Experiment, das immer<br />
mit <strong>den</strong>selben Anfangsbedingungen gestartet wird, muss nach menschlichem Selbstverständnis<br />
auch immer dasselbe Ergebnis zeigen. Mehr noch, Laplace unterstellt (ausgehend<br />
von <strong>den</strong> Erfolgen Isaac Newtons) die grenzenlose Berechenbarkeit der Natur <strong>und</strong><br />
damit an das Existieren einer Weltformel, die alle Zusammenhänge beschreibt. Diese<br />
Berechenbarkeit in <strong>den</strong> Naturwissenschaften wurde nicht zuletzt durch die Quantenmechanik<br />
auf eine harte Probe gestellt.<br />
Determinismus <strong>und</strong> Kausalität treffen sich etwa in folgen<strong>den</strong> Fragen:<br />
• Kann der Flügelschlag eines Schmetterlings in Brasilien einen Tornado in Texas hervorrufen?<br />
• Was bewirkt die Tatsache, dass in China ein Sack Reis umfällt?<br />
Das schwache Kausalitätsprinzip besagt, dass gleiche Ursachen gleiche Wirkungen<br />
nach sich ziehen. Bei realen Experimenten ist diese Begriffsbildung nicht hilfreich,<br />
da niemals die absolut gleichen Bedingungen vorliegen. Das starke Kausalitätsprinzip<br />
besagt, dass ähnliche Ursachen ähnliche Wirkungen erzeugen. Wie wir nun aber nach<br />
ca. 3 Jahrzehnten ” Chaosforschung“ wissen, ist auch dieses Prinzip <strong>für</strong> viele physikalische<br />
Vorgänge im Zweifel, wenn man ” ähnlich“ angemessen verwendet. Der Gr<strong>und</strong> da<strong>für</strong><br />
ist, dass viele physikalische Vorgänge <strong>und</strong> ihre (mathematischen) Modelle eine sensitive<br />
Abhängigkeit von <strong>den</strong> Bedingungen des Experiments besitzen. Man sieht dies besonders<br />
20 determinare (lat.): abgrenzen, bestimmen<br />
21 causa (lat.): Ursache<br />
Stand: 21. November 2011 18 ○c J. Baumeister, T.G. Macedo
2.5 Determinismus, Kausalität, Berechenbarkeit <strong>und</strong> Zufall<br />
gut bei dynamischen Vorgängen, wie etwa in der Wetterentwicklung, bei der Entstehung<br />
von Turbulenzen in Strömungen, im Allgemeinen bei nichtlinear rückgekoppelteten Systemen.<br />
Modellbeispiele sind das logistische Modell <strong>und</strong> das Doppelpendel. Beim Würfeln<br />
<strong>und</strong> Werfen von Reißzwecken etwa ist die Situation besonders <strong>und</strong>urchschaubar: welche<br />
Handhaltung beim Werfen hat welche Konsequenz?<br />
Wir wer<strong>den</strong> bei der Konstruktion des Sierpinski-Dreiecks das sogenannte ” Chaos-Spiel“<br />
kennenlernen. Dort kommen wir auf einige Details von Sensitivität zurück.<br />
Bibliographische Anmerkungen<br />
Für die elementare Einführung in die Wahrscheinlichkeitsrechnung verweisen wir auf [17,<br />
21, 38, 82]. Dort findet man auch Anmerkungen zum Determinismus <strong>und</strong> zur Kausalität.<br />
Nichtlinear rückgekoppelte Systeme findet man meist modelliert durch Differentialgleichungen.<br />
Etwas Populärwissenschaftliches, geschrieben von einem renomierten Experten<br />
der mathematischen Chaostheorie, findet man in [71]. Zu Beispielen von nichtlinearen<br />
Systemen siehe [56, 77]. Wir kommen bei der Betrachtung von dynamischen Systemen<br />
auf <strong>den</strong> diskreten Fall zurück; siehe Abschnitt 5.5.<br />
Stand: 21. November 2011 19 ○c J. Baumeister, T.G. Macedo
3 Elementare Zufallsexperimente<br />
Zufall ist nur der Ausdruck unserer Unfähigkeit, <strong>den</strong><br />
Dingen auf <strong>den</strong> Gr<strong>und</strong> zu kommen<br />
A. Einstein (Ein großer Skeptiker in Sachen Zufall)<br />
In diesem Abschnitt dokumentieren wir einfache Zufallsexperimente. Gr<strong>und</strong>legende<br />
Fragen zur Erzeugung von <strong>Zufallszahlen</strong> <strong>und</strong> <strong>ihrem</strong> <strong>Gebrauch</strong> wer<strong>den</strong> damit schon deutlich.<br />
3.1 Reißzweckexperiment<br />
Der Wurf eines Reißnagels kommt dem Münzwurf zwar als Experiment mit zwei Ausgängen<br />
sehr nahe, er ist aber ein Beispiel eines Zufallsexperiments mit ungleicher Wahrscheinlichkeitsverteilung:<br />
die Ausgänge sind: Lage auf der Kappe, Spitze nach oben (Kopf);<br />
Lage auf der Spitze <strong>und</strong> der Kante der Kappe (Seite). Nicht beide Lagen stellen sich mit<br />
gleicher Wahrscheinlichkeit ein; siehe unten.<br />
In Schulbüchern kann man das Werfen von Reißzwecken als Beispiel <strong>für</strong> ein Zufallsexperiment<br />
aufgeführt sehen, das keine Gleichverteilung der Ergebnisse bringt. Es wird –<br />
ohne eine Versuchsanleitung zu geben – berichtet von einer Verteilung ” 60% Kopf, 40%<br />
Seite. Versucht man diese Verteilung zu überprüfen, dann ist man schon vor dem ersten<br />
Wurf in der Situation, erst die Versuchsbedingungen zu klären <strong>und</strong> festzulegen; in jedem<br />
Falle: Art der Reißzwecke, Fallhöhe, Untergr<strong>und</strong>, anfangs Spitze nach oben oder nach<br />
unten. Zunächst zur Art der Reißzwecke:<br />
1. Wahl Handelsübliche Reißzwecke: Durchmesser 0.8 cm, Spitzenlänge 0.9 cm,<br />
2. Wahl Pin-Reißzwecke: Durchmesser 2.4 cm, Spitzenlänge 2.5 cm<br />
Als Versuchsumfang wurde die die Reißzwecke mit der Spitze nach oben 100-mal aus<br />
bestimmten Höhen fallen gelassen. Die Ergebnisse waren stark höhenabhängig. Während<br />
sich bei Fallhöhen um etwa 50 cm das Verhältnis 60% Kopf, 40% Seite ” reproduzieren“<br />
ließ, zeigten sich bei Fallhöhen um etwa einen Meter andere Ergebnisse, nämlich gerade<br />
entgegengesetzte Verhältnisse. Die Vermutung ist, dass man die Höhe <strong>für</strong> eine 50:50–<br />
Verteilung herausfin<strong>den</strong> könnte, wenn man die Fallhöhe nur geeignet wählen würde. Hierzu<br />
sind viele Experimentiermöglichkeiten offen.<br />
Man kann mit einer handelsüblichen Reißzwecke eine (quasi) 50-zu-50-Entscheidung<br />
herbeiführen, d.h. einen fairen Münzwurf nachstellen, ohne das Verhältnis Kopf/Seite zu<br />
kennen. Nehmen wir an, dass bei einer bestimmten Versuchsanordnung die Wahrscheinlichkeit<br />
<strong>für</strong> Kopf p <strong>und</strong> die Wahrscheinlichkeit <strong>für</strong> Seite q := 1 − p sei. Wir werfen nun die<br />
Reißzwecke bei dieser Versuchsanordnung mehrmals <strong>und</strong> zählen, wie oft Kopf gefallen ist.<br />
Die 50-zu-50 Entscheidung stellt sich (nahezu) ein mit dem Ergebnis Kopf ist gerade-mal<br />
gefallen, Kopf ist ungerade-mal gefallen. Analysieren wir zunächst <strong>den</strong> zweimaligen Wurf:<br />
• Häufigkeit von Kopf ist gerade (2-mal Kopf, 0-mal Kopf (2-mal Seite))<br />
Als Wahrscheinlichkeit da<strong>für</strong> ergibt sich nach der Pfadregel:<br />
0.6 · 0.6 + 0.4 · 0.4 = 0.36 + 0.16 = 0.52<br />
• Häufigkeit von Kopf ist ungerade (Kopf/Seite oder Seite/Kopf, also genau einmal<br />
Kopf)<br />
Als Wahrscheinlichkeit da<strong>für</strong> ergibt sich nach der Pfadregel:<br />
2 · 0.6 · 0.4 = 2 ∗ 0.24 = 0.48<br />
Stand: 21. November 2011 20 ○c J. Baumeister, T.G. Macedo
3.2 (Unfaire) Würfel<br />
Dies kann man auch mit 3 Würfen, mit 4 Würfen usw. durchführen. Die Situation ist<br />
dann bei drei Würfen:<br />
• Häufigkeit von Kopf ist gerade: als Wahrscheinlichkeit da<strong>für</strong> ergibt sich nach der<br />
Pfadregel 0.504<br />
• Häufigkeit von Kopf ist ungerade: als Wahrscheinlichkeit da<strong>für</strong> ergibt sich nach der<br />
Pfadregel 0.496<br />
Bei 4 Würfen ist das Wahrscheinlichkeitsverhältnis 0.5008 zu 0.4992 . Die Verhältnisszahlen<br />
rücken mit wachsender Wurfanzahl schließlich immer mehr an ein Verhältnis 50-zu-50 heran.<br />
Dieses Vorgehen kann man auf <strong>den</strong> Münzwurf anwen<strong>den</strong>, wenn man Zweifel hat, ob<br />
die Münze fair ist. Der Gr<strong>und</strong> <strong>für</strong> eine ungleiche Wahrscheinlichkeit <strong>für</strong> Kopf <strong>und</strong> Zahl<br />
bei einer Münze kann eine Krümmung oder eine veränderte Gewichtsverteilung sein.<br />
Abschließend zu diesen Überlegungen sei festgehalten, dass bei allen diesen Experimenten<br />
ohne eine exakte Beschreibung des Versuchsaufbaus <strong>und</strong> seiner Dokumentation<br />
die Reproduzierbarkeit der Ergebnisse nicht gegeben ist. Ein Mathearbeitsheft <strong>für</strong> Schüler<br />
darf also eigentlich nicht einfach nur die Wahrscheinlichkeitsverteilung aufschreiben, sondern<br />
müsste auch Versuchsaufbau <strong>und</strong> Versuchsdokumentation detailiert darlegen.<br />
3.2 (Unfaire) Würfel<br />
Das Würfeln mit einem fairen Würfel ist vielerorts<br />
wohlbeschrieben. Wir benötigen diesen<br />
Würfel um aus sechs Zahlen eine zu wählen,<br />
ohne die anderen zu benachteiligen“.<br />
”<br />
Unfaire Würfel sind Würfel, die unregelmäßige<br />
Formen aufweisen. Sie wer<strong>den</strong><br />
umgangssprachlich als gezinkt“ <strong>und</strong>/oder als<br />
”<br />
gefälscht bezeichnet. Sie haben unterschiedlich<br />
lange Kanten, eine zusätzliche Gewichteinlagerung,<br />
oder Ähnliches. Es gibt sehr viele<br />
Möglichkeiten einen Würfel zu manipulieren.<br />
Meistens jedoch wer<strong>den</strong> Würfel manipuliert,<br />
um in sogenannten Würfel- bzw.<br />
Glücksspielen sicher“ zu gewinnen. Bei die-<br />
”<br />
sen Würfeln sind die Wahrscheinlichkeiten,<br />
dass die verschie<strong>den</strong>en Seiten gewürfelt wer<strong>den</strong>,<br />
nicht i<strong>den</strong>tisch.<br />
Um eine Statistik über unfaire Würfel entwerfen<br />
zu können, wirft man <strong>den</strong> Würfel<br />
Abbildung 6: Unfairer Würfel<br />
mehrmals (100-mal, 1000-mal,. . . ) <strong>und</strong> notiert sich die Würfelaugen. Dabei ist darauf zu<br />
achten, dass die Würfel-Bedingungen“ (Untergr<strong>und</strong>, Würfelhand, Würfelhöhe, ...) stets<br />
”<br />
gleich sind. Für die Reproduzierbarkeit der Ergebnisse ist eine genaue Dokumentation der<br />
Würfel-Bedingungen wesentlich.<br />
Der unfaire Würfel“ aus Abbildung 6 hat die Ausmaße 1x1x2 in der Maßeinheit<br />
”<br />
Zentimeter <strong>und</strong> eine Siebenerbeschriftung (übliche Beschriftung bei normalen“ Würfeln).<br />
”<br />
Wir haben auf verschie<strong>den</strong>en Untergrün<strong>den</strong> (Wiese, Fliesen) jeweils 100-mal gewürfelt,<br />
Stand: 21. November 2011 21 ○c J. Baumeister, T.G. Macedo
3.3 <strong>Zufallszahlen</strong> der Natur entnommen<br />
wobei wir darauf geachtet haben, dass die Versuchsdurchführung immer dieselbe war:<br />
mit der rechten Hand aus 42 cm Höhe. In der Abbildung 7 fin<strong>den</strong> wir die Resultate. Die<br />
Ergebnisse sind einigermaßen verwirrend <strong>und</strong> bedürfen einer weiteren Untersuchung.<br />
(a) (b)<br />
Abbildung 7: Würfeln mit einem unfairen Würfel<br />
3.3 <strong>Zufallszahlen</strong> der Natur entnommen<br />
<strong>Zufallszahlen</strong>, die mit Vorgängen der Natur gewonnen wer<strong>den</strong>, verwen<strong>den</strong> im Allgemeinen<br />
nicht-deterministische physikalische Prozesse als <strong>Zufallszahlen</strong>quelle. Beispiele <strong>für</strong> solche<br />
physikalische Generatoren sind:<br />
• Die Beobachtung der Zeit zwischen der Emission von Partikeln beim radioaktiven<br />
Zerfall<br />
• Die Messung thermischen Rauschen<br />
• Die Messung der Ladungsdifferenz zweier eng benachbarter Halbleiter<br />
• Die Beobachtung von Frequenzschwankungen aufgr<strong>und</strong> der Instabilität eines frei<br />
laufen<strong>den</strong> Oszillators<br />
• Die Messung des Betrags, um <strong>den</strong> ein Halbleiter während einer festen Zeitspanne<br />
gela<strong>den</strong> wer<strong>den</strong> kann<br />
• Die Aufzeichnung von Klang mit einem Mikrofon oder von Bildern mit einer Videokamera.<br />
• Laufzähler mit Stoppereignissen. Dabei kommt ein ” modulo n-Zähler“ zum Einsatz,<br />
der laufend von 0 bis (n−1) zählt. Beim Auftreten eines zufälligen zählerunabhängigen<br />
Stoppereignisses wird der Zählerstand ausgelesen.<br />
Man nennt solche physikalische Effekte nutzende Generatoren Hardware-Generatoren 22 .<br />
Hier steht natürlich die Frage im Raume, ob das physikalische Phänomen wirklich <strong>den</strong><br />
Zufall simuliert, wie es etwa beispielsweise die Quantenmechanik voraussagt. Die Vorteile<br />
solcher Hardware-Generatoren sind:<br />
• Keine Periodizität (siehe Kongruenzgeneratoren)<br />
• Generation basiert nicht auf einem Algorithmus<br />
• Keine Reproduzierbarkeit der Zahlen<br />
22 http://www.westphal-electronic.com/ZrandomUSB−Manual.pdf<br />
Stand: 21. November 2011 22 ○c J. Baumeister, T.G. Macedo
3.3 <strong>Zufallszahlen</strong> der Natur entnommen<br />
• Im Allgemeinen sehr gute statistische Eigenschaften der <strong>Zufallszahlen</strong>.<br />
Wir wollen auf die Zufälligkeit des radioaktiven Zerfalls näher eingehen. Es wird auf<br />
Gr<strong>und</strong> von physikalischen Gesetzmäßigkeiten angenommen, dass die Anzahl der durch ein<br />
homogenes Isotop ausgestrahlten Teilchen einen zufälligen Prozess darstellt. Um der Gesetzmäßigkeit<br />
dieses Prozesses auf die Spur zu kommen, beobachtet man die Zerfallsrate<br />
(mit einem Geigerzähler). Man stellt fest, dass die Anzahl der Teilchen, die in einem Zeitintervall<br />
der Länge ∆t zerfallen, in ziemlich einfacher Weise materialabhängig beschrieben<br />
wer<strong>den</strong> kann, <strong>und</strong> zwar als Poisson-Verteilung 23 der Zufallsvariablen X, die <strong>den</strong> Zerfall<br />
im Intervall ∆t angibt:<br />
Ws(X = k) = λk<br />
k! e−λ mit λ = c∆t , k = 0, 1, 2, . . . . (3)<br />
Dabei stellt die positive Konstante c die Intensität der Strahlungsquelle dar. Für kleine<br />
Werte von λ ist p0 := Ws(X = 0) nahe dem maximalen Wert eins.<br />
Rutherford <strong>und</strong> Geiger haben 1910 <strong>den</strong><br />
Zerfall einer Polonium-Quelle in 2608<br />
8-Minuten Intervallen beobachtet; siehe<br />
Tabelle 8. Die dritte Spalte geht vom<br />
Parameter λ = 3.87 in der Poissonverteilung<br />
aus. Die Übereinstimmung von<br />
beobachteten Werten <strong>und</strong> Werten aus<br />
dem Modell ist ziemlich gut.<br />
Die Poissonverteilung ist eine auch<br />
in anderem Zusammenhang anzutreffende<br />
Verteilung, etwa: Personen, die in einem<br />
Zeittakt an der Bushaltestelle eintreffen,<br />
Personen, die in einem Zeittakt<br />
ein Kaufhaus betreten, Telefongespräche,<br />
die in einem Zeittakt bei der<br />
Vermittlung auflaufen. Will man solche<br />
Gegebenheiten simulieren, braucht man<br />
Poisson-verteilte <strong>Zufallszahlen</strong>. Der obige<br />
Zerfallsprozess stellt einen passen<strong>den</strong><br />
Generator bereit.<br />
Anzahl Gemessene Erwartete<br />
gemessener Häufigkeit Häufigkeit<br />
Zerfallsteilchen<br />
0 57 54<br />
1 203 211<br />
2 383 407<br />
3 525 526<br />
4 532 508<br />
5 408 394<br />
6 273 254<br />
7 139 140<br />
8 45 68<br />
9 27 29<br />
10 10 11<br />
≥ 11 6 6<br />
Abbildung 8: Poisson-Zerfall<br />
Wir sind aber an der Frage interessiert, ob es möglich ist, aus <strong>den</strong> Poisson-verteilten<br />
<strong>Zufallszahlen</strong> gleichverteilte <strong>Zufallszahlen</strong> (auf [0, 1)) zu extrahieren. Dies ist in der Tat<br />
möglich. Dies geschieht in zwei Schritten. Zunächst verschaffen wir uns aus X eine Zufallsvariable,<br />
die nahezu einen Münzwurf nachstellt. Dazu betrachten wir die Zufallsvariable<br />
Z, die folgende Tatsache zählt“: ist in einem Intervall [0, t] die Anzahl der zerfallen<strong>den</strong><br />
”<br />
Teilchen gerade, setzen wir Z auf <strong>den</strong> Wert 0, anderenfalls auf 1. Dann erhalten wir als<br />
Wahrscheinlichkeit <strong>für</strong> das Eintreten der Ereignisse<br />
∞�<br />
∞�<br />
Ws(Z = 0) =<br />
Ws(Z = 1) =<br />
j=0<br />
Ws(X = 2j) = e −λ<br />
j=0<br />
∞�<br />
Ws(X = 2j + 1) = e −λ<br />
j=0<br />
23 S.D. Poisson, 1781-1840<br />
λ 2j<br />
(2j)! = e−λ eλ + e −λ<br />
2<br />
∞�<br />
j=0<br />
= 1 + e−2λ<br />
λ 2j+1<br />
(2j + 1)! = e−λ eλ − e −λ<br />
2<br />
2<br />
= 1 − e−2λ<br />
2<br />
Stand: 21. November 2011 23 ○c J. Baumeister, T.G. Macedo
3.4 Flächenberechnung mit <strong>Zufallszahlen</strong><br />
Hier sind wir mit der Tatsache konfrontiert, dass wir erstmals unendlich viele Ereignisse<br />
haben, die ” unendliche Summation“ entspricht diesem Sachverhalt. Für das Nachvollziehen<br />
der folgen<strong>den</strong> Rechnungen sollte man zunächst Kapitel 4 durchlesen. Mit ε(t) :=<br />
e −2λ = e −ct erhalten wir die Darstellung<br />
Ws(Z = 0) =<br />
1 + ε(t)<br />
2<br />
Im Grenzwert <strong>für</strong> t gegen unendlich ergibt sich<br />
, Ws(Z = 1) =<br />
1 − ε(t)<br />
2<br />
1<br />
lim Ws(Z = 0) = lim Ws(Z = 1) =<br />
t→∞ t→∞ 2<br />
Dies bedeutet, dass man auf diese Weise (durch die Intensität der Strahlungsquelle bzw.<br />
die Länge des gewählten Zeitintervalls) einen Münzwurf nachstellen kann durch Nachzählen<br />
der Zerfallsereignisse.<br />
Es ist nun klar, dass wir mit Hilfe eines Poisson-Generators ein Zufallsbit erzeugen<br />
können, wobei 1 bzw. 0 mit Wahrscheinlichkeit (nahezu) 1 eintritt. Durch Wiederholung<br />
2<br />
erzeugen wir ein Zufallwort a1a2 . . . aN etwa der Länge N, wobei die Buchstaben ai die<br />
erzeugten Zufallsbits sind. Damit können wir nun eine Dezimalzahl z in [0, 1) erzeugen<br />
durch<br />
N�<br />
z = ai2 −i<br />
i=1<br />
Offensichtlich hat jede dieser möglichen <strong>Zufallszahlen</strong> die Wahrscheinlichkeit ( 1<br />
2 )−N <strong>und</strong><br />
die Zahlen sind in [0, 1) gleichverteilt.<br />
3.4 Flächenberechnung mit <strong>Zufallszahlen</strong><br />
Man kann <strong>Zufallszahlen</strong> nutzen, um <strong>den</strong> Inhalt<br />
von Körpern <strong>und</strong> Flächen mit unregelmäßiger<br />
Begrenzung <strong>und</strong>/oder in großen<br />
Raumdimensionen zu berechnen. Hier ist<br />
diese Vorgehen das Verfahren der Wahl.<br />
Dazu wird eine Begrenzungsfläche um <strong>den</strong><br />
Körper gelegt, von der man leicht <strong>den</strong><br />
Flächeninhalt ausrechnen kann (z.B. Quadrat,<br />
Würfel). Nun wird ein Punkt mit<br />
zufälligen Koordinaten ermittelt <strong>und</strong> in<br />
<strong>den</strong> Raum, <strong>den</strong> die Begrenzungsfläche einschließt,<br />
gesetzt. Danach wird anhand einer<br />
Formel ermittelt, ob dieser Punkt im<br />
Körper oder nur im Raum innerhalb der<br />
Begrenzungsfläche liegt. Diesen Vorgang<br />
wiederholt man sehr oft, so dass am Ende<br />
viele Punkte vorhan<strong>den</strong> sind. Dank Abbildung 9: Berechnung von π<br />
eines Spielcasinos in der gleichnamigen<br />
Stadt trägt das obige Vorgehen <strong>den</strong> Namen<br />
Monte-Carlo Simulation. In Kapitel 8 betrachten wir die Methode in allgemeinerem<br />
Kontext.<br />
Wir beschreiben hier die Anwendung auf die Berechnung von Flächen, insbesondere<br />
von krummlinig berandeten Flächen. Man benötigt dazu ein Einheitsquadrat mit der<br />
Stand: 21. November 2011 24 ○c J. Baumeister, T.G. Macedo
3.5 Uabhängigkeit bei Zufallsvariablen<br />
Fläche 1, das die Figur umgibt. Mit geeigneter Skalierung kann man dies immer erreichen.<br />
Danach startet man <strong>den</strong> ” Zufallsregen“, indem man etwa 1 000 000 <strong>Zufallszahlen</strong><br />
auswürfelt, notgedrungen mit einem Zufallgenerator. Man bezeichnet dieses Geschehen<br />
als ” Zufallsregen“, da alle Punkte zeitnah auf die Figur im Einheitsquadrat treffen.<br />
Damit das Vorhaben gelingt, müssen die Punkte im Einheitsquadrat liegen <strong>und</strong> dort<br />
gleichmäßig verteilt sein. Nach dem Abschluss des Zufallsregens ermittelt man die Anzahl<br />
T der Treffer, d.h. der Zufallspunkte, die in der Figur liegen. Besteht der Zufallsregen aus<br />
N Punkten, dann ist in<br />
F := T<br />
N<br />
nun eine Näherung <strong>für</strong> <strong>den</strong> gesuchten Flächeninhalt gegeben.<br />
Demonstrieren wir das Vorgehen <strong>für</strong> <strong>den</strong> Kreis mit Radius r = 1 . Wir umschließen<br />
<strong>den</strong> Viertelkreis - die Fläche des Vollkreises lässt sich leicht daraus ableiten - mit dem<br />
Einheitswürfel. Dann ist es einfach (mit dem Satz von Pythagoras) zu entschei<strong>den</strong>, ob ein<br />
Zufallspunkt (x, y) im Kreis oder außerhalb liegt:<br />
x 2 + y 2 ≤ 1 : innerhalb x 2 + y 2 > 1 : außerhalb<br />
Hier brauchen wir dann eine Folge von Zufallspunkten, die im Einheitswürfel liegen; wir<br />
bezeichnen sie mit (xn, yn), n = 1, 2, . . . , N . Wir zählen nun die Anzahl der Punkte, die<br />
innerhalb des Kreises liegen; wir nehmen an, es seien mN Stück. Dann approximieren wir<br />
die Fläche des Viertelkreises durch <strong>den</strong> Bruch<br />
b(N) := m N /N .<br />
Für größer wer<strong>den</strong>des N nähert b(N) die Kreiszahl π/4 immer besser an. In der Abbildung<br />
9 sehen wir <strong>den</strong> ” Zufallsregen“. Ein typisches Ergebnis ist etwa b(1000) = 3.1442 .<br />
3.5 Uabhängigkeit bei Zufallsvariablen<br />
Definition 3.1 Sei (Ω, POT(Ω), P ) ein endlicher Wahrscheinlichkeitsraum. Zwei Ereignisse<br />
A, B ⊂ Ω heißen unabhängig, wenn P (A ∩ B) = P (A)P (B) gilt, anderenfalls<br />
abhängig. �<br />
Zahlreiche Fehlvorstellungen zur Wahrscheinlichkeitsrechnung beruhen auf der Nichtberücksichtigung<br />
der Abhängigkeit bzw. Unabhängigkeit von Ereignissen. Machen wir uns<br />
die Fehlerquellen z.B. beim Skatspiel“ klar. Ein Skatspieler berechnet die Wahrschein-<br />
”<br />
lichkeit, in seinem Blatt von 10 Karten 4 Asse zu haben als<br />
�28 6 �32 10<br />
�<br />
� =<br />
10 · 9 · 8 · 7<br />
32 · 31 · 30 · 29<br />
≈ 0.00584 .<br />
Die Wahrscheinlichkeit, alle 4 Buben zu bekommen, ist ebenso groß. Daraus schließt er,<br />
dass die Wahrscheinlichkeit, alle 4 Asse <strong>und</strong> alle 4 Buben zu bekommen etwa<br />
0.00584 2 ≈ 0.000034<br />
beträgt. Die Überlegung ist natürlich falsch, da sie die Abhängigkeit der Ereignisse<br />
A : 4 Asse , B : 4 Buben<br />
Stand: 21. November 2011 25 ○c J. Baumeister, T.G. Macedo
3.5 Uabhängigkeit bei Zufallsvariablen<br />
nicht berücksichtigt. Die Wahrscheinlichkeit, alle 4 Buben zu bekommen, wenn man schon<br />
4 Asse hat, ist kleiner als die Wahrscheinlichkeit, ohne die Bedingung alle 4 Buben zu<br />
bekommen:<br />
�<br />
P (A ∩ B) = P (B|A) · P (A) =<br />
�24 2 �32 10<br />
� = 0.0000042 .<br />
Unabhängigkeit ist ein in A, B symmetrischer Begriff. Sind A, B ⊂ Ω unabhängig,<br />
dann sind es auch A, Ω\B <strong>und</strong> Ω\A, B <strong>und</strong> Ω\A, Ω\B. 24 Die Verallgemeinerung der<br />
Unabhängigkeit auf mehr als zwei Ereignisse liegt auf der Hand; wir führen sie zur<br />
Erläuterung an.<br />
Definition 3.2 Sei (Ω, POT(Ω), P ) ein endlicher Wahrscheinlichkeitsraum <strong>und</strong> seien<br />
A1, . . . , Ak Ereignisse. Diese Ereignisse heißen unabhängig, wenn <strong>für</strong> jede Wahl<br />
1 ≤ i1 < · · · < il ≤ k gilt:<br />
P (Ai1 ∩ · · · ∩ Ail ) = P (Ail ) · · · P (Ail ).<br />
Beispiel 3.3 Betrachte im Wahrscheinlichkeitsraum (Ω, P OT (Ω), P ) mit<br />
die Ereignisse<br />
Wir haben<br />
Ω = {ω1, ω2, ω3, ω4}, P ({ωi}) = 1<br />
, i = 1, . . . , 4,<br />
4<br />
A = {ω1, ω2}, B = {ω2, ω3}, C = {ω1, ω3}.<br />
P (A ∩ B) = P (A)P (B) , P (A ∩ C) = P (A)P (C) , P (B ∩ C) = P (B)P (C),<br />
aber<br />
P (A ∩ B ∩ C) = 0, P (A) · P (B) · P (C) = 1<br />
8 .<br />
Dieses Beispiel beleuchtet die Definition 3.2. �<br />
Häufig steht, bevor der Ausgang eines Zufalls–Experiments bekannt ist, schon die Information<br />
zur Verfügung, dass der Ausgang zu einer bestimmten (möglicherweise eingeforderten)<br />
Teilmenge des Ereignisraumes gehört. Was lässt sich dann über Wahrscheinlichkeiten<br />
sagen? Diese Fragestellung wollen wir nun skizzieren. Zur Motivation des Folgen<strong>den</strong> greifen<br />
wir auf <strong>den</strong> Begriff der relativen Häufigkeiten zurück. Sei V ein Zufallsexperiment mit<br />
zugehörigem Wahrscheinlichkeitsraum (Ω, P OT (Ω), P ). Seien A, B Ereignisse in (Ω, P ).<br />
Der Versuch V werde nun n–mal (unabhängig) wiederholt. Die relativen Häufigkeiten von<br />
A unter der Bedingung B sind dann definiert durch<br />
hn(A|B) :=<br />
#{ Es tritt A ∩ B ein }<br />
#{ Es tritt B ein }<br />
n#{ Es tritt A ∩ B ein }<br />
=<br />
n#{ Es tritt B ein } = hn(A ∩ B)<br />
, n ∈ N .<br />
hn(B)<br />
Dabei haben wir hn(B) > 0, n ∈ N, unterstellt.<br />
Analog zu dieser Formel kommen wir nun zu einer entsprechen<strong>den</strong> Begriffsbildung im<br />
Wahrscheinlichkeitsraum (Ω, P ) .<br />
24 Mit A\B bezeichnen wir das Komplement der Menge B in A.<br />
Stand: 21. November 2011 26 ○c J. Baumeister, T.G. Macedo<br />
�
3.5 Uabhängigkeit bei Zufallsvariablen<br />
Definition 3.4 Sei (Ω, P OT (Ω), P ) ein endlicher Wahrscheinlichkeitsraum. Seien A, B ⊂<br />
Ω mit P (B) > 0. Dann heißt<br />
P (A|B) :=<br />
P (A ∩ B)<br />
P (B)<br />
die bedingte Wahrscheinlichkeit des Ereignisses A unter der Bedingung B. �<br />
Wichtige Resultate im Zusammenhang mit bedingten Wahrscheinlichkeiten sind der Satz<br />
von der totalen Wahrscheinlichkeit <strong>und</strong> der Satz von Bayes.<br />
Kommen wir nun zur Unabhängigkeit von Zufallsvariablen. Sie wird mit dem Begriff<br />
der Unabhängigkeit von Ereignissen eingeführt.<br />
Definition 3.5 Zwei Zufallsvariablen X1, X2 heißen unabhängig, wenn die Ereignisse<br />
{X1 ≤ x1} <strong>und</strong> {X2 ≤ x2} <strong>für</strong> beliebige x1, x2 ∈ R unabhängig sind.<br />
Die Fortschreibung der Definition 3.5 auf n Zufallsvariablen X1, . . . , Xn ist offensichtlich:<br />
Definition 3.6 Die Zufallsvariablen X1, . . . , Xn heißen unabhängig genau dann, wenn<br />
mit der zugr<strong>und</strong>eliegen<strong>den</strong> Wahrscheinlichkeit P gilt:<br />
P (X1 ≤ x1, . . . , Xn ≤ xn) = P (X1 ≤ x1) · · · · · P (Xn ≤ xn) <strong>für</strong> alle x1, . . . , xn ∈ R .<br />
Bibliographische Anmerkungen<br />
Laplaceexperimente mit Würfeln <strong>und</strong> Urnen wer<strong>den</strong> in allen Büchern über Wahrscheinlichkeitsrechnung<br />
angeführt.; siehe etwa [21, 38, 51, 82]. Dort findet man auch eine Diskussion<br />
der Unabhängigkeit von Zufallsvariablen.<br />
Zu Würfelexperimenten verweisen wir auf <strong>den</strong> Aufsatz [RiS10] von Riemer <strong>und</strong> Stoyan,<br />
in dem der Versuch einer Berechnung der Wahrscheinlichkeiten der Augen mittels einer<br />
speziellen Verteilung gemacht wird. In [44] betrachtet Ineichen <strong>den</strong> Spezialfall prismatischer<br />
Würfel <strong>und</strong> diskutiert eine physikalische Modellierung zur Berechnung der Wahrscheinlichkeiten<br />
der Augen.<br />
Die Literatur zur Berechnung der Kreiszahl π ist umfangreich; nahezu jedes Buch zur<br />
Statistik erwähnt Berechnungsmöglichkeiten; siehe etwa [2, 21].<br />
Stand: 21. November 2011 27 ○c J. Baumeister, T.G. Macedo<br />
�
4 Exponential- <strong>und</strong> Logarithmusfunktion<br />
Da nichts, meine hochverehrten Stu<strong>den</strong>ten der<br />
<strong>Mathematik</strong>, in der praktischen <strong>Mathematik</strong> so<br />
beschwerlich ist <strong>und</strong> <strong>den</strong> Rechner mehr aufhält <strong>und</strong> hemmt<br />
als Multiplikationen <strong>und</strong> Divisionen großer Zahlen sowie<br />
Quadrat- <strong>und</strong> Kubikwurzelziehen aus ihnen, gegen die man<br />
wegen ihrer Umständlichkeit eine starke Abneigung hat<br />
<strong>und</strong> bei <strong>den</strong>en sich sehr leicht Rechenfehler einschleichen,<br />
so begann ich zu überlegen, durch welchen zuverlässigen<br />
Kunstgriff man diese Hindernisse umgehen könne.<br />
Nachdem ich hierüber verschie<strong>den</strong>tlich hin- <strong>und</strong> hergedacht,<br />
habe ich endlich einige besonders einfache Abkürzungen<br />
gefun<strong>den</strong>, über die ich (vielleicht) später berichten werde.<br />
J. Napier im Vorwort seiner Logarithmentafel Descriptio<br />
(1614)<br />
Hier skizzieren wir die Exponentialrechnung <strong>und</strong> ihre Umkehrung. Bei der Begründung<br />
müssen wir etwas oberflächlich agieren, <strong>den</strong>n das F<strong>und</strong>ament der ” reellen Zahlen“ steht<br />
uns nicht ausreichend zur Verfügung, die wesentlichen Begriffe stellen wir aber bereit.<br />
Im nachfolgen<strong>den</strong> Kapitel benötigen wir die Logarithmen, um die Benford-Verteilung zu<br />
erläutern.<br />
4.1 Zahlen<br />
Im Abschnitt 2 haben wir die natürlichen Zahlen zum Abzählen von Möglichkeiten verwendet.<br />
Hier benötigen wir auch die reellen Zahlen. Wir verwen<strong>den</strong> darüberhinaus folgende<br />
Bezeichnungen:<br />
Natürliche Zahlen–die Erste: Mit N bezeichnen wir die natürliche Zahlen<br />
1, 2, . . . , n, . . . .<br />
Natürliche Zahlen–die Zweite: Mit N0 bezeichnen wir die natürliche Zahlen<br />
0, 1, 2, . . . , n, . . . .<br />
Ganze Zahlen: Mit Z bezeichnen wir die ganzen Zahlen<br />
0, ±1, ±2, . . . , ±n, . . . .<br />
Rationale Zahlen: Mit Q bezeichnen wir die rationalen Zahlen<br />
q = m<br />
n<br />
mit m ∈ Z, n ∈ N .<br />
Reele Zahlen: Mit R bezeichnen wir die reellen Zahlen x ; wir <strong>den</strong>ken dabei an die<br />
Dezimalzahlen. Damit ist der Zahlenstrahl ” R := −∞ < x < ∞ “vollständig <strong>und</strong><br />
hat keine ” Lücken“ mehr.<br />
Stand: 21. November 2011 28 ○c J. Baumeister, T.G. Macedo
Wir verwen<strong>den</strong> in R mitunter die Intervall-Schreibweise:<br />
(a, b) := {x ∈ R|a < x < b}<br />
[a, b) := {x ∈ R|a ≤ x < b}<br />
(a, b] := {x ∈ R|a < x ≤ b}<br />
[a, b] := {x ∈ R|a ≤ x ≤ b}<br />
Als weitere Kurzschreibweisen halten wir fest:<br />
⎧<br />
⎪⎨ +1 falls x > 0<br />
sign(x) := 0<br />
⎪⎩<br />
−1<br />
falls x = 0<br />
falls x < 0<br />
, |x| :=<br />
�<br />
x falls x > 0<br />
−x falls x < 0 .<br />
4.1 Zahlen<br />
Die rationalen Zahlen reichen <strong>für</strong> die Betrachtungen von Funktionen nicht aus, da sie<br />
” Lücken“ aufweisen. Deutlich wird die Lücke, wenn wir die Quadratwurzel aus 2 berechnen<br />
wollen, d.h. eine Zahl x := √ 2 bestimmen wollen, die der Gleichung<br />
x 2 = 2 (4)<br />
genügt. Die Zahl √ 2 steht – dank des Satzes von Pythagoras 25 – <strong>für</strong> die Länge der Diagonale<br />
in einem Quadrat mit der Seitenlänge eins. Man kann beweisen, dass eine rationale<br />
Zahl x, die der Gleichung (4) genügt nicht existiert. Ein Beweisschnipsel, angefertigt von<br />
einer Teilnehmerin der Akademie, zeigt Abbildung 10. Wir schreiben einen anderen Beweis<br />
auf, der der euklidischen Idee der Kommensurabilität folgt.<br />
Der Beweis geht so: Sei x eine rationa-<br />
le Zahl mit x 2 = 2, d.h. x = b<br />
a mit<br />
b 2 = 2a 2 .<br />
Annahme: b <strong>und</strong> a sind kommensurabel.<br />
Dann gibt es ganze Zahlen p, q <strong>und</strong> ein<br />
gemeinsames Maß e mit d = pe, a = qe .<br />
Es kann vorausgesetzt wer<strong>den</strong>, dass p<br />
<strong>und</strong> q nicht beide gerade Zahlen sind,<br />
da wir sonst das gemeinsame Maß verdoppeln<br />
könnten. Aus b 2 = 2a 2 folgt<br />
p 2 = 2q 2 . Daraus folgt nach der Lehre<br />
von gera<strong>den</strong> <strong>und</strong> ungera<strong>den</strong> Zahlen,<br />
dass p nicht ungerade sein kann; es ist<br />
also p gerade <strong>und</strong> daher p = 2p ′ .<br />
Dann ist aber q 2 = 2p ′2 , also auch q<br />
eine gerade Zahl. Damit ist ein Widerspruch<br />
zur Eingangsvoraussetzung, dass<br />
von <strong>den</strong> Zahlen p, q nicht beide Zahlen<br />
p, q gerade sind, hergeleitet <strong>und</strong> die Annahme<br />
ist nicht haltbar.<br />
Abbildung 10: √ 2 ist irrational<br />
Wie die Lücken in <strong>den</strong> rationalen Zahlen beseitigen? Der Ausweg sind unendliche<br />
Dezimalbrüche, <strong>den</strong>n wir wissen ja, dass rationale Zahlen entweder durch endliche Dezimalbrüche<br />
oder periodische Dezimalbrüche beschrieben wer<strong>den</strong>. Aber der Ausweg ist auch<br />
25 E.W. Dijkstra fand einen ziemlich überraschende Verallgemeinerung des Satzes von Pythagoras:<br />
wenn in einem Dreieck die Winkel α, β, γ gegenüber <strong>den</strong> Seiten a, b, c liegen, dann<br />
gilt sign(α + β − γ) = sign(a 2 + b 2 − c 2 ) . Ein sehr einsichtiger Beweis findet sich in<br />
http://www.cut-the-knot.org/pythagoras/Dijkstra.shtml<br />
Stand: 21. November 2011 29 ○c J. Baumeister, T.G. Macedo
4.1 Zahlen<br />
mit Problemen geflastert, <strong>den</strong>n wir haben mit dem Problem der Summation unendlich<br />
vieler Summan<strong>den</strong> fertig zu wer<strong>den</strong>, etwa<br />
0.101001000100001 · · · = 10 −1 + 10 −3 + 10 −6 + 10 −10 + 10 −15 + · · · = ??? (5)<br />
Abhilfe schafft ein exakter Konvergenzbegriff <strong>für</strong> Zahlenfolgen in Verbindung mit einem<br />
Axiom, das die rellen Zahlen als Vervollständigung der rationalen Zahlen ” erschafft“. Dazu<br />
die folgende<br />
Definition 4.1 Eine Folge (xn)n∈N rationaler Zahlen heißt eine Cauchyfolge, falls gilt:<br />
Für alle ε > 0 gibt es ein N ∈ N so dass <strong>für</strong> alle m, n > N gilt: |xn − xm| < ε . (6)<br />
Das Axiom, das nun die reellen Zahlen ins Leben ruft, ist die Forderung, dass jede Cauchyfolge<br />
in <strong>den</strong> rationalen Zahlen eine eindeutige reelle Zahl definiert, nämlich <strong>den</strong> Grenzwert<br />
– wir schreiben die Definition gleich <strong>für</strong> die rellen Zahlen auf – in folgendem Sinne:<br />
Definition 4.2 Eine Folge (xn)n∈N reeller Zahlen heißt konvergent gegen x, falls gilt;<br />
wir schreiben die Definition sofort <strong>für</strong> reelle Zahlen auf.<br />
Für alle ε > 0 gibt es ein N ∈ N so dass <strong>für</strong> alle n > N gilt: |xn − x| < ε . (7)<br />
x heißt dann Grenzwert der Folge. Wir schreiben: x = limn xn .<br />
Die entschei<strong>den</strong>de Annahme über die reellen Zahlen, die die Lücken von Q schließt, ist<br />
das<br />
Vollständigkeitsaxiom:<br />
Jede Cauchyfolge rationaler Zahlen besitzt in <strong>den</strong> reellen Zahlen einen (eindeutig<br />
bestimmten) Grenzwert.<br />
Folgende Aussagen im Zusammenhang mit <strong>den</strong> Definitionen 4.1, 4.2 sind nun besonders<br />
von Interesse:<br />
1. Die Menge der reellen Zahlen ist eine Obermenge der rationalen Zahlen, da jede<br />
konstante Folge rationaler Zahlen eine Cauchyfolge ist.<br />
2. Jede reelle Zahl kann als Grenzwert einer Folge rationaler Zahlen angesehen wer<strong>den</strong>.<br />
3. Positive, negative reelle Zahlen sind nun wohldefiniert, ebenso der Betrag einer reellen<br />
Zahl.<br />
4. Cauchyfolgen reeller Zahlen sind nun definiert analog Definition 4.1.<br />
5. Jede Cauchyfolge reeller Zahlen ist konvergent.<br />
Kehren wir zur Zahl x := √ 2 zurück. Aus der Babylonischen Kultur (∼ 1000 v. Chr.)<br />
gibt es eine Kleietafel, die belegt, dass derjenige, der sie beschriftet hat, wusste, dass das<br />
Verhältnis von Diagonale <strong>und</strong> Seite im Quadrat ” gleich“<br />
1 + 24 51<br />
+<br />
60 60 · 60 +<br />
10<br />
60 · 60 · 60<br />
Stand: 21. November 2011 30 ○c J. Baumeister, T.G. Macedo
4.1 Zahlen<br />
ist; eine erstaunlich gute Näherung <strong>für</strong> √ 2. 26 Die übliche Näherung zu dieser Zeit war<br />
1 + 25<br />
60<br />
= 17<br />
12<br />
, eine Näherung, die wir nun entlang von Überlegungen der Babylonier<br />
ableiten. Sie geben <strong>für</strong> z := √ a2 + b2 die Näherung ˜z gemäß<br />
˜z = a + b2<br />
2a<br />
an. Man kann diese Formel so fin<strong>den</strong>: Wenn b relativ zu a klein ist, betrachte man a als<br />
guten Näherungswert <strong>für</strong> z <strong>und</strong> verbessere ihn mit dem Korrekturterm d gemäß<br />
a 2 + b 2 = z 2 ! = (a + d) 2 = a 2 + 2ad + d 2 .<br />
Bei Vernachlässigung von d 2 ergibt sich d = b2<br />
2a<br />
˜z = a + d = a + b2<br />
2a<br />
<strong>und</strong> daher<br />
(8)<br />
1 z2<br />
= (a + ) (9)<br />
2 a<br />
als neue Näherung. Etwa ergibt dies <strong>für</strong> z := x mit x 2 = 2 mit der Ausgangsnäherung<br />
a = 1 sukzessive<br />
˜z = 1 + 1<br />
2<br />
3 17 577<br />
= , ˜z = , ˜z =<br />
2 12 408<br />
= 1.4142156 . . . .<br />
(Man vergleiche mit dem Wert 1.4142136 . . . <strong>für</strong> √ 2 , die ein Taschenrechner liefert.)<br />
Auf Theon 27 geht ein Verfahren zur Bestimmung eines Näherungswertes <strong>für</strong> die gesuchte<br />
Zahl x zurück; es wird auch von Euklid beschrieben. Wir wählen eine schon ziemlich<br />
moderne Darstellung der Vorgehensweise von Theon, nämlich die Form eines Algorithmus.<br />
Sie erklärt sich zumindest von der Form her von selbst.<br />
Algorithm 1 Iteration von Theon<br />
EIN ” Einheitsstrecke“ a := 1 .<br />
Schritt 0 s0 := a, x0 := a; n := 0.<br />
Schritt 1 an := xn<br />
sn , bn := a 2 n − 2.<br />
Schritt 2 sn+1 := sn + xn, xn+1 := 2sn + xn.<br />
AUS Für jedes n = 0, 1, . . . Zahlen an , bn mit folgender Eigenschaft:<br />
Jedes an ist eine Näherung <strong>für</strong> x <strong>und</strong> jedes bn gibt <strong>den</strong> Fehler von xn in der Gleichung<br />
x 2 = 2 an.<br />
In unserer etwas vagen Betrachtung der reellen Zahlen macht es wenig Sinn, nach dem<br />
Fehler der Approximation an <strong>für</strong> √ 2 zu fragen, da √ 2 ja als Zahl gar nicht so recht vorliegt.<br />
Theon konnte <strong>den</strong> Wert, dem das Verhältnis der Zahlen xn, sn ” zustrebt“, nicht beschreiben/ausrechnen,<br />
aber er konnte schließen, dass das Verhältnis von xn <strong>und</strong> sn schließlich<br />
immer genauer dem Verhältnis der Diagonale zur Seite des Quadrats wird. Man erhält<br />
die folgen<strong>den</strong> Näherungen <strong>für</strong> x :<br />
1 = 1 3 7 17 41 99<br />
; ; ; ; ;<br />
1 2 5 12 29 70<br />
26 Beachte, dass hier das 60-Zahlsystem Verwendung findet.<br />
27 Theon, um 350 v.Chr.<br />
= 1.414285 . . . .<br />
Stand: 21. November 2011 31 ○c J. Baumeister, T.G. Macedo
4.2 Exponenten<br />
Abschließend halten wir fest, dass wir in <strong>den</strong> reellen Zahlen die algebraischen Rechenarten<br />
+, −, ·, / wie in <strong>den</strong> rationalen Zahlen zur Verfügung haben. Daneben haben wir<br />
nun auch die Rechenart Radizieren zur Verfügung. Darüberhinaus können wir nun auch<br />
Funktionen mit Definitionsbereich in <strong>den</strong> reellen Zahlen betrachten.<br />
Drei herausgehobene Zahlen kann man unter <strong>den</strong> reellen Zahlen ausmachen, die nicht<br />
dargestellt wer<strong>den</strong> können:<br />
als Bruch m<br />
n<br />
Quadratwurzel x = 2√ 2 = √ 2 = 1.414 213 . . .<br />
Kreiszahl π = 3.141 592 . . .<br />
Eulersche Zahl e = 2.718 281 . . .<br />
<strong>Von</strong> diesen drei Zahlen haben wir die Zahl e noch nicht eigentlich kennengelernt. Sie kann<br />
auf mehrfache Weise eingeführt wer<strong>den</strong>:<br />
e = lim n (1 + 1<br />
n )n , e =<br />
Je<strong>den</strong>falls ist immer ein infinitesimaler Prozess beteiligt. Als Nähereung haben wir<br />
4.2 Exponenten<br />
∞�<br />
k=0<br />
e ≈ 2.718 281 828 459...<br />
Exponentialterme haben in <strong>den</strong> Naturwissenschaften, z.B. bei der mathematischen Beschreibung<br />
von Wachstumsvorgängen, eine herausragende Bedeutung. Wir führen ein<br />
erläuterndes Beispiel an, das Wachstum mit Exponenten verbindet.<br />
Sissa ibn Dahir lebte angeblich im dritten oder vierten Jahrh<strong>und</strong>ert n. Chr. in Indien<br />
<strong>und</strong> gilt Legen<strong>den</strong> zufolge als der Erfinder des Schachspiels. Sein Name ist ferner mit<br />
der Weizenkornlegende verbun<strong>den</strong>. Diese Anekdote findet häufig im Zusammenhang mit<br />
exponentiellen Funktionen Erwähnung <strong>und</strong> lautet folgendermaßen: Der indische Herrscher<br />
gewährte dem Brahmanen, der das Schachspiel erfun<strong>den</strong> hat, einen freien Wunsch. Dieser<br />
wünschte sich Weizenkörner: auf das erste Feld eines Schachbretts wollte er ein Korn, auf<br />
das zweite Feld die doppelte Menge, also zwei, auf das dritte wiederum doppelt so viele,<br />
also vier <strong>und</strong> so weiter. Der König lachte <strong>und</strong> war gleichzeitig erbost ob der vermeintlichen<br />
Beschei<strong>den</strong>heit des Brahmanen. Als die Rechenweister aber nachrechneten, stellten sie<br />
fest, dass das Reich die Menge der Weizenkörner nicht aufbringen konnte. Es sind nämlich<br />
1<br />
k! .<br />
2 0 + 2 1 + 2 2 + · · · + 2 63 = 2 64 − 1 = 18446744073709551615<br />
Weizenkörner von Nöten. 10 000 Weizenkörner wiegen etwa 3 kg, also wären ca. 600<br />
Milliar<strong>den</strong> Tonnen Weizen nötig.<br />
Man nennt ein Wachstum der Form an := q n , n ∈ N, (mit q > 1) ein geometrisches<br />
(im Gegensatz zu einem arithmetischen wie an := na + b, n ∈ N; a, b gegeben).<br />
Die Definition der Exponentialterme a x kann man in drei Stufen erarbeiten. Ist x eine<br />
natürliche Zahl m ∈ N0, so ist a x mittels der Multiplikation so erklärt:<br />
a x = a m := a · · · · · a<br />
� �� �<br />
m-mal<br />
Stand: 21. November 2011 32 ○c J. Baumeister, T.G. Macedo
4.3 Logarithmen<br />
Im Sonderfall m = 0 ist a m als 1 definiert. Ist m = −k ∈ Z mit k ∈ N, so setzen wir<br />
a m := 1<br />
.<br />
ak Dabei unterstellen wir, dass der ” Kehrwert“ der reellen Zahl a k als bekannt vorausgesetzt<br />
wer<strong>den</strong> kann. Für eine rationale Zahl a stellt dies kein Problem dar, weil dann ja a k selbst<br />
wieder eine rationale Zahl ist.<br />
Ist x ein Stammbruch, d.h. ist x = 1 mit k ∈ N, so stehen wir vor dem Problem, dass<br />
k<br />
wir die k-te Wurzel aus a zu erklären haben, d.h. eine Zahl z mit zk = a . Eine solche<br />
Zahl existiert <strong>und</strong> sie ist auch eindeutig bestimmt; wir schreiben z = k√ a . Also setzen wir<br />
a 1<br />
k := k√ a <strong>für</strong> k ∈ N .<br />
Damit haben wir nun eine Definition <strong>für</strong> ax parat <strong>für</strong> alle x = m,<br />
m ∈ Z, n ∈ N:<br />
n<br />
a m<br />
n := n√ a m , m ∈ Z, n ∈ N .<br />
Aber was soll eine Potenz a x bedeuten <strong>für</strong> eine Dezimalzahl, die nicht als Bruch dargestellt<br />
wer<strong>den</strong> kann? Man geht approximativ vor: man nähert x an durch eine Folge von<br />
rationalen Zahlen q1, q2, . . . , ql, . . . , die die Zahl x ” als Grenzwert“ besitzen, <strong>und</strong> definiert<br />
a x als Grenzwert der Zahlenfolge a q1 , a q2 , . . . , a ql, . . . . Diese Grenzwertbetrachtung ist im<br />
Zentrum der Analysis, also der Beschäftigung mit reellen Zahlen <strong>und</strong>, darauf aufgebaut,<br />
mit <strong>den</strong> reellen Funktionen. Beachte a 0 = 1 <strong>für</strong> alle a > 0 .<br />
Damit können wir sagen, dass z.B. 2 π gleich dem Grenzwert der Folge 2 3 , 2 3,1 , 2 3,14 , . . .<br />
ist.<br />
Was ist der Vorteil einer Exponentialdarstellung? Folgende Beobachtung ist hier richtungsweisend:<br />
überstreicht die Variable x das Intervall [0, 1] bzw. [100, 101], so überstreicht<br />
die Potenzfunktion x ↦−→ a x das Intervall [1, a] bzw. [a 100 , a 101 ] . Man sieht, Intervalle<br />
der Länge 1 wer<strong>den</strong> unterschiedlich gestreckt, im ersten Fall ist der Streckungsfaktor 1, im<br />
zweiten Fall a 100 (a−1) . Diese Tatsache kann man nutzen, um etwa physikalische Größen,<br />
die über einen weiten Bereich der Zahlskala streuen, geeignet zu skalieren.<br />
4.3 Logarithmen<br />
Logarithmen, wie wir sie nun besprechen wollen, sind geeignet, die obige Beobachtung<br />
der Streckung rückgängig zu machen <strong>und</strong> Skalen zu stauchen.<br />
Die Verwendung des Logarithmus lässt sich bis in die Frühzeit der indischen Kultur<br />
zurückverfolgen, Bezüge fin<strong>den</strong> sich auch bei Archimedes. Mit dem Fortschritt der Astronomie<br />
im 15., 16. Jahrh<strong>und</strong>ert 28 <strong>und</strong> dem aufstreben<strong>den</strong> Bankwesen im Europa des 17.<br />
Jahrh<strong>und</strong>erts erlangte der Logarithmus dann immer mehr an Bedeutung. Seine Funktionswerte<br />
wur<strong>den</strong> in Tabellenwerken, <strong>den</strong> Logarithmentafeln, erfasst, um sie nachschlagen<br />
zu können <strong>und</strong> nicht immer neu berechnen zu müssen. Diese Tabellen wur<strong>den</strong> schließlich<br />
durch Rechenschieber <strong>und</strong> später durch Taschenrechner verdrängt.<br />
Eine Funktion der Form x ↦→ a x mit der Basis a > 0 heißt Exponentialfunktion.<br />
In der ” gebräuchlichsten“ Form sind dabei <strong>für</strong> <strong>den</strong> Exponenten x die reellen Zahlen zugelassen.<br />
Im Gegensatz zu <strong>den</strong> Potenzfunktionen (Polynome ersten, zweiten,. . . Grades), bei<br />
<strong>den</strong>en die Basis die unabhängige Größe (Variable) ist, ist bei Exponentialfunktionen die<br />
Variable der Exponent (auch Hochzahl) des Potenzausdrucks. Darauf bezieht sich auch die<br />
28 J. Napier, 1550-1617, fertigte eine erste Logarithmentafel.<br />
Stand: 21. November 2011 33 ○c J. Baumeister, T.G. Macedo
4.3 Logarithmen<br />
Namensgebung. Exponentialfunktionen haben in <strong>den</strong> Naturwissenschaften, z.B. bei der<br />
mathematischen Beschreibung von Wachstumsvorgängen, eine herausragende Bedeutung;<br />
siehe unten.<br />
Zentrale Aspekte des Lebens lassen sich mit Hilfe von Logarithmen erklären. So nimmt<br />
zum Beispiel die Stärke eines Sinneseindrucks in Abhängigkeit von einer physikalischen<br />
Größe wie Helligkeit oder Lautstärke entsprechend dem Verlauf einer Logarithmusfunktion<br />
zu. Gleiches gilt <strong>für</strong> die wahrgenommene Tonhöhe in Abhängigkeit von der Frequenz eines<br />
Tones.<br />
Formal sind Logarithmen Lösungen x der Gleichung<br />
a = b x<br />
zu vorgegebenen Größen a <strong>und</strong> b. Das Logarithmieren ist also eine Umkehroperation<br />
des Potenzierens. Je nachdem, über welchem Zahlenbereich <strong>und</strong> <strong>für</strong> welche Größen diese<br />
Gleichung betrachtet wird, hat sie keine, mehrere oder genau eine Lösung. Ist die Lösung<br />
eindeutig, dann wird sie als der Logarithmus von a zur Basis b bezeichnet <strong>und</strong> man<br />
schreibt<br />
x = log b(a) .<br />
Beispielsweise ist 3 der Logarithmus von 8 zur Basis 2, geschrieben log 2(8) = 3, <strong>den</strong>n es<br />
ist 2 3 = 8.<br />
Beachte: log b 1 := 0 <strong>für</strong> alle b .<br />
Logarithmen erlangten ihre historische Bedeutung in erster Linie durch <strong>den</strong> Zusammenhang<br />
log b(xy) = log b(x) + log b(y) (10)<br />
der es erlaubt, eine Multiplikation <strong>und</strong> damit auch eine Potenzierung durch eine Addition<br />
auszudrücken. Sie ergibt sich aus dem Gegenstück <strong>für</strong> die Exponentialfunktion, das<br />
unmittelbar einsichtig ist:<br />
a x+y = a x · a y <strong>für</strong> alle x, y (11)<br />
Die Funktionalgleichung (10) ist die Gr<strong>und</strong>lage <strong>für</strong> die Verwendung <strong>und</strong> <strong>den</strong> Nutzen<br />
der Logarithmentafeln (Aufstellung von Logarithmen); siehe Abschnitt 4.5.<br />
Drei Basen <strong>für</strong> die Logarithmen spielen eine Sonderrolle, alle drei zugehörigen Logarithmen<br />
fin<strong>den</strong> sich im Allgemeinen in Logarithmentafeln.<br />
Zehner-Logarithmus/dekadischer Logarithmus Hier ist die Basis b = 10 . Sie ist die<br />
angemessene Basis <strong>für</strong> das Rechnen im Zehner-System. Beispielsweise gilt: log 10(2) ≈<br />
0.30103 . Dies korrespondiert mit 2 10 ≈ 10 3 . Im Allgemeinen schreibt man <strong>für</strong> log 10<br />
kurz log .<br />
Dualer Logarithmus Die Basis ist 2 <strong>und</strong> sie ist die angemessene Basis, wenn wir über<br />
Dualzahlen re<strong>den</strong> wollen. Zum Beispiel können wir mit log 2(a) die Länge der Dualdarstellung<br />
von a ermitteln.<br />
Natürlicher Algorithmus Die Basis ist die eulersche Zahl b := e . Im Allgemeinen<br />
schreibt man <strong>für</strong> log e kurz ln; ln heißt logarithmus naturalis.<br />
Unter Verwendung des natürlichen Logarithmus lässt sich mit der Gleichung<br />
a x x·ln a<br />
= e<br />
jede Exponentialfunktion auf eine solche zur Basis e zurückführen.<br />
Zusammenhänge mit angewandten Fragestellungen sind:<br />
Stand: 21. November 2011 34 ○c J. Baumeister, T.G. Macedo
4.4 Exponential– <strong>und</strong> Logarithmusfunktion<br />
Rechenschieber Weil der Logarithmus selbst nicht so leicht zu berechnen ist, waren Rechenschieber<br />
mit ihren logarithmischen Skaleneinteilungen <strong>und</strong> Logarithmentafeln<br />
weit verbreitete Hilfsmittel. Durch die bewegliche Zunge <strong>und</strong> unterschiedliche Skalen<br />
auf dem festen Teil <strong>und</strong> der Zunge konnte die Funktionalgleichung (10) genutzt<br />
wer<strong>den</strong>.<br />
Evolution Zum Zusammenhang von Evolution <strong>und</strong> Logarithmus siehe<br />
http://www.spiegel.de/wissenschaft/mensch/0,1518,556493,00.html<br />
Halbwertszeit Wie lange dauert es, bis radioaktive Atome zerfallen? Für ein einzelnes,<br />
ausgewähltes Atom kann man nicht sagen, ob es in der nächsten Millisek<strong>und</strong>e zerfallen<br />
wird oder noch eine Woche oder gar ein Jahrh<strong>und</strong>ert ” lebt“. Für eine große<br />
Anzahl von Atomen kann man dagegen mit Hilfe des Zerfallsgesetzes, das ein exponentielles<br />
ist, sehr wohl statistische Aussagen machen; siehe Abschnitt 3.3. Mit<br />
Hilfe des Logarithmus kann man die Zeitdauer ermitteln, in der die Hälfte der Atome<br />
zerfällt.<br />
4.4 Exponential– <strong>und</strong> Logarithmusfunktion<br />
Eine Funktion der Form x ↦→ a x mit der Basis a > 0 heißt Exponentialfunktion.<br />
Im Gegensatz zu <strong>den</strong> Potenzfunktionen (Polynome ersten, zweiten,. . . Grades), bei <strong>den</strong>en<br />
die Basis die unabhängige Größe (Variable) ist, ist bei Exponentialfunktionen die Variable<br />
der Exponent (auch Hochzahl) des Potenzausdrucks. Darauf bezieht sich auch die<br />
Namensgebung.<br />
Als die Exponentialfunktion im engeren Sinne (präziser eigentlich: natürliche Exponentialfunktion)<br />
bezeichnet man die Exponentialfunktion x ↦→ e x mit der eulerschen Zahl<br />
e . als Basis; gebräuchlich hier<strong>für</strong> ist auch die Schreibweise x ↦→ exp(x). Hier ist die Basis<br />
schon eine Zahl, die nicht als endlicher oder periodischer Deziamalbruch dargestellt<br />
wer<strong>den</strong> kann, die Berechnung von exp(x) gelingt wiederum nur über einen Approximationsprozess.<br />
Auf (Taschen-)Rechnern ist die Exponentialfunktion abrufbar.<br />
Die allgemeine Exponentialfunktion ist definiert als f(x) = a x , x ∈ Q, mit der Basis<br />
a > 0, a �= 1. Einige Eigenschaften davon sind<br />
1. Die Funktion ist <strong>für</strong> a > 1 streng monoton steigend <strong>und</strong> <strong>für</strong> a < 1 streng monoton<br />
fallend.<br />
2. Die Wertemenge beinhaltet alle positiven reellen Zahlen.<br />
3. Die x-Achse ist die Asymptote des Graphen, <strong>den</strong>n f(x) strebt gegen 0, falls x gegen<br />
−∞ strebt <strong>für</strong> a > 1 <strong>und</strong> f(x) strebt gegen 0, falls x gegen ∞ strebt <strong>für</strong> a > 1 .<br />
4. Alle Graphen haben in der Ebene <strong>den</strong> Punkt P (0; 1) gemeinsam.<br />
5. Die Graphen der Exponentialfunktionen mit f(x) = ax := expa(x) <strong>und</strong> f(x) =<br />
1 (x) gehen durch Spiegelung an der y-Achse hervor.<br />
a x := exp 1<br />
a<br />
Die eulersche Zahl hat (neben vielen anderen Eigenschaften) die vorzügliche Eigenschaft,<br />
dass sie als Potenzfunktion ein Wachstum als einzige Funktion so beschreibt, dass die<br />
Wachstumsrate (Ableitung) durch dieselbe Potenzfunktion beschrieben wird.<br />
Die Logarithmusfunktion ist die Umkehrung zur Exponentialfunktion:<br />
falls a x = b, dann gilt log a(b) = x <strong>für</strong> alle a > 0. (12)<br />
Stand: 21. November 2011 35 ○c J. Baumeister, T.G. Macedo
4.5 Logarithmentafel<br />
In anderen Worten, der Logarithmus von b zur Basis a ist die Zahl, mit der die Basis a<br />
potenziert wer<strong>den</strong> muss, um b zu erhalten. Diese Funktion besitzt folgende Eigenschaften<br />
1. Die Funktion ist <strong>für</strong> a > 1 streng monoton steigend <strong>und</strong> <strong>für</strong> a < 1 streng monoton<br />
fallend.<br />
2. Die Wertemenge beinhaltet alle reelle Zahlen.<br />
3. Die y-Achse ist die Asymptote des Graphen, <strong>den</strong>n f(x) strebt gegen 0, falls x gegen<br />
0 strebt.<br />
4. Alle Graphen haben in der Ebene <strong>den</strong> Punkt P (0; 1) gemeinsam.<br />
5. Die Graphen der Logarithmusfunktion f(x) := loga x <strong>und</strong> f(x) := log 1 x gehen<br />
a<br />
durch Spiegelung an der x-Achse hervor.<br />
4.5 Logarithmentafel<br />
Logarithmentafel nennt man eine tabellarische<br />
Darstellung der Mantissen<br />
der Logarithmen (meist zur Basis 10, e)<br />
der Zahlen, in der Regel von 1.00<br />
bis 9.99. Logarithmentafeln waren über<br />
Jahrh<strong>und</strong>erte ein wichtiges Rechenhilfsmittel,<br />
besonders im natur- <strong>und</strong> ingenieurwissenschaftlichen<br />
Bereich. Als Erfinder<br />
der Logarithmentafeln gilt John<br />
Napier, der sie in seinem Werk Mirifici<br />
Logarithmorum Canonis Descriptio<br />
1614 veröffentlichte. Unabhängig von<br />
Napier entwickelte auch der Schweizer<br />
Jost Bürgi in Kassel eine Logarithmentafel.<br />
Als Mitarbeiter von Johannes<br />
Kepler verwendete er die selbst erstellten<br />
Logarithmentafeln <strong>für</strong> astronomische<br />
Berechnungen. Henry Briggs entwickelte<br />
die Logarithmentafeln dahingehend<br />
weiter, dass er sie zur Basis 10 erstellte.<br />
Hier waren die Logarithmen der<br />
Zahlen von 1 bis 20.000 <strong>und</strong> von 90.000<br />
bis 100.000 auf 14 Stellen genau aufgeführt.<br />
Abbildung 11: Ausschnitt aus einer Logarithmentafel<br />
Viele Berechnungen in der Schulmathematik, z. B. das Ziehen von schwierigen Wurzeln,<br />
konnten nur mit ihrer Hilfe durchgeführt wer<strong>den</strong>. Die Erfindung <strong>und</strong> weite Verbreitung von<br />
Taschenrechnern <strong>und</strong> Computern hat die Verwendung von Logarithmentafeln, ähnlich wie<br />
die von Rechenschiebern, innerhalb weniger Jahre praktisch völlig überflüssig gemacht.<br />
Logarithmentafeln erlauben es also, die Multiplikation <strong>und</strong> Division von Zahlen auf die<br />
einfachere Addition <strong>und</strong> Subtraktion zurückzuführen. Die Basis da<strong>für</strong> ist die Funktionalgleichung<br />
(10). Dies geht so:<br />
Aufgabe: Berechne xy<br />
Vorgehen:<br />
Stand: 21. November 2011 36 ○c J. Baumeister, T.G. Macedo
• Berechne q := log b(xy) gemäß (10) als q := log b(x) + log b(y)<br />
• Berechne xy aus der Gleichung log b(xy) = q (Delogarithmieren)<br />
4.5 Logarithmentafel<br />
In einer Logarithmentafel kann man die Logarithmen log b(x), log b(y) nachschlagen, damit<br />
kennt man q mittels einer Addition, nun kann man xy in der Logarithmentafel nachschlagen,<br />
indem man die Tafel in entgegengesetzter Richtung liest.<br />
Wie kamen aber die Zahlenaufstellungen in der Tafel ohne Rechenmaschinen zustande?<br />
Wir erläutern dies <strong>für</strong> <strong>den</strong> Zehnerlogarithmus von 2, <strong>und</strong> zwar in einer beschei<strong>den</strong>en<br />
Genauigkeit, nämlich 3 Stellen Genauigkeit. Dazu hätten wir die Gleichung<br />
10 x = 2<br />
zu lösen, ein ziemlich schwieriges Unterfangen. Wir gehen anders vor:<br />
Aufgabe: Gegeben y, berechne log(y) .<br />
Vorgehen:<br />
• Bestimme n ∈ N mit 1.01 n < y , 1.01 n+1 > y<br />
• Bestimme einen ” interpolieren<strong>den</strong> Wert“ u zwischen n, n+1 so, dass 1.01 u ≈<br />
y ist.<br />
• Klar: log(y) ≈ u log(1.01) .<br />
Das eben skizzierte Vorgehen hat noch eine entschei<strong>den</strong>de Schwäche: wir kennen ja<br />
log(1.01) nicht. Diese Zahl verschaffen wir uns zunächst nach dem obigen Vorgehen <strong>für</strong> y =<br />
10, wovon wir <strong>den</strong> Logarithmus ja kennen: log(10) = 1 . Bei diesem Vorgehen wird auch<br />
die Bedeutung der Wahl der Zahl 1.01 deutlich. Hiermit ist nämlich das obige Vorgehen,<br />
d.h. die Bestimmung von n ziemlich einfach: das Potenzieren hiermit ist einfach eine<br />
Verschiebung um zwei Stellen nach hinten <strong>und</strong> Run<strong>den</strong>, um die Stellen nicht anwachsen<br />
zu lassen.<br />
Führen wir dies nun vor <strong>für</strong> die Berechnung des Logarithmus von 2. Zunächst haben<br />
wir n zu bestimmen mit 1.01 n < 10, 1.01 n+1 > 10 . Ein solches n ist 231. Wir erhalten<br />
dies durch sukzessive Rechnung:<br />
1.01 2 = 1.01 + 0.0101 = 1.0201, 1.01 3 = 1.01 2 = 1.0201 + 0.0102 = 1.0303, . . . ,<br />
1.01 231 = 9.959, 1.01 232 = 10.059<br />
Also ist die interpolierende Wahl v = 231.4 <strong>für</strong> 1.01 v ≈ 10 vernünftig. Dies bedeutet<br />
log(1.01) ≈ v = 231.4 . In derselben Weise erhalten wir u = 69.7 mit 1.01 u ≈ 2, d.h.<br />
log(2) ≈ u log(1.01) . Daraus ergibt sich<br />
log(2) ≈ u<br />
= 0.3012 ,<br />
v<br />
ein Wert, der auf 3 Stellen genau ist.<br />
Natürlich verbergen sich dahinter auch Genauigkeitsfragen, aber sie sind abschlie-<br />
”<br />
ßend“ geklärt. Um höhere Genauigkeiten zu erzielen, ersetzt man 1.01 durch 1.000001 ;<br />
die Rechenschritte sind analog.<br />
Bibliographische Anmerkungen<br />
Die Geschichte der Entstehung der rigorosen Handhabung der rationalen <strong>und</strong> reellen<br />
Zahlen ist natürlich eng mit der Entwicklung des Konvergenzbegriffs bei Zahlenfolgen<br />
verknüpft; siehe etwa [5, 33, 52, 59, 65, 81]. Als Anmerkung: in [65] findet man eine<br />
” Bestenliste“ der <strong>Mathematik</strong>er.<br />
Die Behandlung der Exponential– <strong>und</strong> Logarithmenrechnung findet schon in der Schule<br />
statt. Sie ist nahezu unerlässlich <strong>für</strong> ein f<strong>und</strong>iertes Sachrechnen“; siehe etwa [20, 76]. Eine<br />
”<br />
” klassische“ Logarithmentafel ist die von P. Schulz, mit der viele Schüler ihre Erfahrungen<br />
gesammelt haben; siehe [75]. Zur Geschichte des Logarithmus siehe etwa [67].<br />
Stand: 21. November 2011 37 ○c J. Baumeister, T.G. Macedo
5 Benford–Zahlen<br />
Benford‘s Law gives auditors the expected frequencies of<br />
the digits in tabulated data. The premise is that we would<br />
expect authentic and unmanipulated data to exhibit these<br />
patterns. If a data set does not follow these patterns,<br />
however, a few possible reasons exist to explain this<br />
phenomenon: 1. The data set did not meet the three tests,<br />
and/or, 2. The data set includes invented numbers, biased<br />
numbers, or errors.<br />
Mark Nigrini<br />
Hier berichten wir über eine interessante Beobachtung im ” Zoo der Zahlen“, nämlich<br />
über die Tatsache, dass in gewissen Datensätzen die Eins als erste Ziffer häufiger vorkommt<br />
als andere Ziffern. Diese Beobachtung wurde erstmals gemacht von S. Newcomb 1861, aber<br />
dann wieder vergessen. Neu entdeckt wurde sie von F. Benford 1938, von dem nun diese<br />
Beobachtung ihren Namen hat. Zahlenfolgen aus Datenmaterial der Börsenseite etwa<br />
entnommen eignet sich daher nicht notwendigerweise als Generator <strong>für</strong> (gleichverteilte)<br />
<strong>Zufallszahlen</strong>.<br />
5.1 Die Beobachtung von Newcomb <strong>und</strong> Benford<br />
Die Geschichte zur Untersuchung der obigen ” unregelmäßigen Häufigkeitsverteilung“ begann<br />
beim Betrachten von Logarithmentafeln, <strong>und</strong> zwar berichtete der amerikanische<br />
<strong>Mathematik</strong>er <strong>und</strong> Astronom S. Newcomb 1881 ([61]), dass die vorderen Seiten deutlich<br />
stärker abgegriffen waren, als die hinteren. Dies wäre bei anderen Büchern als Logarithmentafeln<br />
in Bibliotheken durchaus erklärlich, <strong>den</strong>n viele Leute beginnen ein Buch zu<br />
lesen, hören aber vorzeitig damit wieder auf, weil sie keine Zeit mehr haben, weil es ihnen<br />
zu langweilig wird, weil es ihnen zu kompliziert wird u.ä.. Wenn viele die Lektüre unfertig<br />
unterbrechen – Kein Mensch liest ein langweiliges Buch bis zum Schluss“– ist es klar,<br />
dass der Anfang von Büchern abgenützter sein kann als der Schluss. Aber warum soll<br />
dies bei Logarithmentafeln der Fall sein? Diese wer<strong>den</strong> ja nach anderen Gesichtspunkten<br />
benützt. Die einzige Erklärung, die es da<strong>für</strong> gibt, ist, dass der Logarithmus von Zahlen<br />
mit niedrigen Anfangsziffern (1,2, ... ) häufiger gesucht wurde als von Zahlen mit hohen<br />
Anfangsziffern (9,8, ... ). Aber warum? Newcomb gibt eine heuristische Begründung,<br />
klärt aber <strong>den</strong> Zusammenhang mit <strong>den</strong> Zahlenmengen, deren Logarithmen in der Tafel<br />
aufgesucht wur<strong>den</strong>, nicht wirklich.<br />
1938 stieß der amerikanische Physiker<br />
F. Benford ([7]) auf dieselbe überraschende<br />
Beobachtung, allerdings auf einem etwas<br />
anderem Weg. Benford analysierte Datenmaterial,<br />
das u.a. ” Stadt, Land, Fluss“ <strong>und</strong><br />
physikalische Konstanten beinhaltete; siehe<br />
die Tabelle in Abbildung 12.<br />
Das Benford-Gesetz handelt von <strong>den</strong><br />
ersten Ziffern einer Zahl. Dabei sind auch<br />
Dezimalzahlen zugelassen. Wir bezeichnen<br />
mit D1 die erste signifikante Ziffer einer<br />
Zahl, also<br />
Abbildung 12: Aus der Benford-Tabelle<br />
D1(314) = 3, D1(0.0314) = 3, D1( √ 2) = D1(1.414 . . . ) = 1, D1(π) = 3 .<br />
Stand: 21. November 2011 38 ○c J. Baumeister, T.G. Macedo
5.1 Die Beobachtung von Newcomb <strong>und</strong> Benford<br />
Analog sind D2, D3, . . . erklärt. Allerdings ist nun als signifikante Ziffer auch die Null<br />
erlaubt. Dazu später.<br />
Das Benfordsche Gesetz sagt also einem Zahlenmaterial die Eigenschaft zu, dass die<br />
Wahrscheinlichkeit pi, darunter eine Zahl x mit D1(x) = di (di = 1, i = 1, 2, . . . , 9) zu<br />
fin<strong>den</strong>, folgen<strong>den</strong> Wert besitzt:<br />
pi = log(1 + 1<br />
) .<br />
Natürlich ist dies nur eine vage Definition, <strong>den</strong>n es sind dabei Besonderheiten des Zahlenmaterials<br />
zu be<strong>den</strong>ken: endlich, unendlich, . . . .<br />
Kommen Zahlen mit niedrigen Anfangsziffern ” in der Welt“ häufiger vor? Warum sollte<br />
die Natur eine Präferenz <strong>für</strong> die 1 als Anfangsziffer haben? Es gibt solches Datenmaterial<br />
<strong>und</strong> das Gesetz, das die Häufigkeit der Ziffern numerisch fasst, heißt Benfordsches<br />
Gesetz. Anders gefasst wird dieser Sachverhalt auch als Newcombsches Mantissengesetz<br />
bezeichnet. Ein wichtiges Kriterium fur die Anwendbarkeit des Benfordschen Gesetzes<br />
ist die Skaleninvarianz einer Datenverteilung. Dies bedeutet, dass sich die Verteilung<br />
der Anfangsziffern in einem Datensatz durch Multiplikation mit einer Konstanten nicht<br />
verändert. Diese Eigenschaft erklärt unmittelbar, warum in Steuererklärungen, Bilanzen,<br />
etc., oder allgemein bei Datensätzen, deren Zahlen Geldbeträge darstellen, das Benfordsche<br />
Gesetz gilt. Wenn es überhaupt eine universell gültige Verteilung der Anfangsziffern<br />
in solchen Datensätzen gibt, dann muss diese Verteilung unabhängig davon sein, in welcher<br />
Währung die Daten angegeben wer<strong>den</strong>, <strong>und</strong> die universelle Verteilung darf sich auch durch<br />
Inflation nicht verändern. Beides bedeutet, dass die Verteilung skaleninvariant sein muss.<br />
1961 gelang dem <strong>Mathematik</strong>er Roger Pinkham der Beweis, dass die einzige zulässige<br />
Verteilung <strong>für</strong> einen skaleninvarianten Datensatz die Benford-Verteilung ist.<br />
Machen wir <strong>den</strong> Versuch einer heuristischen<br />
Erklärung des Benfordschen Gesetzes.<br />
Die Eins ist von Null auf der<br />
Zahlenskala nicht weiter entfernt als die<br />
Fünf von der Sechs. Für die wirklichen<br />
Dinge allerdings, die gezählt, gemessen<br />
oder gewogen wer<strong>den</strong>, kann der Weg der<br />
Ergebnisse von der Eins zur Zwei sehr<br />
lang sein: um ihn zurückzulegen, müssen<br />
sie auf das Doppelte wachsen. Einer<br />
Fünf fehlt dagegen nur ein Fünftel, um<br />
zur Sechs zu wer<strong>den</strong>.<br />
Abbildung 13: Erste Ziffer bei NASDAQ-Kursen<br />
Anhand des DAX ist dies leicht<br />
verständlich. Stände der DAX gerade<br />
bei 1000 Punkte, dann müssten sich die<br />
Aktienkurse im Schnitt verdoppeln, ehe der DAX die 2000 erreicht. Solange bliebe die<br />
Eins als führende Ziffer auf allen Listen. Stünde der DAX aber bei 5000 Punkten, so<br />
müsste der Wert nur noch um 20 Prozent steigen, ehe mit 6000 die Fünf als erste Ziffer<br />
abgelöst wird. Noch kleiner ist im Verhältnis der Schritt von 9000 auf 10000. Dann aber<br />
erscheint wieder die Eins an erster Stelle, <strong>und</strong> sie bleibt so lange, bis der Index sich auf<br />
20 000 abermals verdoppelt. Was wächst oder schrumpft, verharrt deshalb relativ lang im<br />
Bereich der führen<strong>den</strong> Ziffer, besonders ausgeprägt ist dies bei der Eins.<br />
Das Benford-Gesetz gilt auch <strong>für</strong> viele Größen, die sich nicht wesentlich ändern im<br />
Lauf der Zeit, zum Beispiel <strong>für</strong> die Fläche von Gewässern. Ob man sie in Quadratmetern<br />
mißt, in Quadratmeilen oder in Hektar, immer tritt die Eins vorneweg gehäuft auf. Die<br />
Stand: 21. November 2011 39 ○c J. Baumeister, T.G. Macedo<br />
di
5.2 Neuere Beobachtungen<br />
Wachstumsbegründung sticht hier nicht, vielmehr hat es wohl mit der Häufigkeit der<br />
Gewässer kleiner, mittlerer <strong>und</strong> großer Größe zu tun.<br />
5.2 Neuere Beobachtungen<br />
Kurse der NASDAQ<br />
Man kann die berechtigte Vermutung haben,<br />
dass auf einer Zeitungsseite, auf der<br />
Zahlen zu unterschiedlichen Themen aufgelistet<br />
sind, die Ziffern 0, 1, 2, . . . , 9 in nahezu<br />
gleicher Häufigkeit zu fin<strong>den</strong> sind.<br />
Abbildung 14: 100 Fibonacci-Zahlen<br />
29<br />
Warum daraus nicht eine Tabelle von <strong>Zufallszahlen</strong><br />
fertigen, indem wir etwa eine<br />
Tabelle der Ziffernfolge in Fünfer-Blöcken<br />
erstellen; siehe die RAND-Tabelle in Abschnitt<br />
2.5. Dabei spielt offenbar die Ziffer<br />
Null eine Sonderrolle, da sie als führende<br />
Ziffer im Allgemeinen nicht vorkommt. Wie<br />
wir zur Kenntnis nehmen müssen, sind<br />
die Ziffern auf solchen Zeitungsseiten keine<br />
guten <strong>Zufallszahlen</strong>, da sie z.B. auch<br />
Börsendaten enthalten mögen. Hier sind<br />
die Ziffern im Allgemeinen Benford-verteilt. Dazu kommen wir nun.<br />
Die NASDAQ ist die größte Börse der<br />
USA. Sie umfasst ca. 900 Arbeitsplätze<br />
<strong>und</strong> wurde 1971 gegründet. Heute wird sie<br />
von Robert Greifeld geleitet <strong>und</strong> macht<br />
jährlich r<strong>und</strong> 1600 Mio. USD Umsatz. 30<br />
Sie sitzt in New York <strong>und</strong> ist weltweit bekannt.<br />
Das Diagramm 13 zeigt im Vergleich<br />
mit der Benford-Verteilung die Kurse der<br />
NASDAQ am 16. Juli 2011. Die Auswertung<br />
zeigt ganz deutlich, dass die Kurse<br />
der NASDAQ (im Diagramm mit Blau gekennzeichnet)<br />
fast die die gleiche Verteilung<br />
haben wie die Benford-Verteilung vorgibt;<br />
kleine Ausreisser sind allerdings zu sehen.<br />
Auffallend ist die signifikante Abweichungen<br />
bei der Ziffer 5 gibt. Wenn man<br />
Ziffer Häufigkeit in % Benford<br />
1 0.301 0.30103<br />
2 0.176 0.17609<br />
3 0.126 0.12493<br />
4 0.096 0.09691<br />
5 0.079 0.07918<br />
6 0.067 0.06694<br />
7 0.057 0.05799<br />
8 0.053 0.05115<br />
9 0.045 0.04575<br />
Abbildung 15: 1000 Fibonacci-Zahlen<br />
noch mehr Kurse-Zahlenmaterial zur Verfügung hätte, würde – nach dem Gesetz der<br />
großen Zahl (siehe vorheriges Kapitel) – das Ergebniss wohl noch genauer die Benfordschen<br />
Verteilung widerspiegeln.<br />
Fibonaccizahlen <strong>und</strong> Benford-Verteilung<br />
Im Abschnitt 6.2 wer<strong>den</strong> wir die Fibonacci-Zahlen als interessante Folge von ganzen Zahlen<br />
etwas genauer kennengelernen. Hier bringen wir sie in Verbindung mit der Benford-<br />
29 Klar, eine Tabelle von Jahreszahlen allein kann offenbar nicht in Betracht kommen.<br />
30 Stand Juli 2011<br />
Stand: 21. November 2011 40 ○c J. Baumeister, T.G. Macedo
Verteilung. Die Fibonacci-Zahlen wer<strong>den</strong> rekursiv definiert durch<br />
f0 := f1 := 1 , fn+1 := fn + fn−1 , n ∈ N .<br />
Damit ergibt sich eine (schnell) wachsende Folge (fn)n∈N0 :<br />
1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233 . . . .<br />
5.3 Das Mantissengesetz<br />
Die führen<strong>den</strong> Ziffern dieser Zahlen zeigen natürlich noch keine Auffälligkeit, der betrachtete<br />
Abschnitt ist viel zu kurz. Betrachten wir jedoch die ersten 100 bzw. 1000<br />
Fibonacci-Zahlen, so ergeben sich die in <strong>den</strong> Abbildungen 14 bzw. 15 notierten Häufigkeiten.<br />
Sie deuten an, dass die Zahlen Benford-verteilt sein könnten. Sie sind es in der Tat! Dies<br />
hängt mit der Tatsache zusammen, dass sie einem potentiellen Wachstumsgesetz gehorchen.<br />
Aufschluss über das Wachstum erhält man, wenn man die Formel von Binet<br />
heranzieht, die wir im Abschnitt 6.2 etwas genauer vorstellen wer<strong>den</strong>. Sie lautet:<br />
fn = 1<br />
√ 5<br />
�<br />
g n + 1<br />
g n<br />
�<br />
, n ∈ N . (13)<br />
Hierbei ist g := 1<br />
2 (1 + √ 5) die gol<strong>den</strong>e Schnittzahl. Man stellt nämlich wegen g > 1 fest,<br />
dass<br />
fn ≈ 1<br />
√ 5 g n , n ∈ N , (14)<br />
gilt. Die Fibonaccizahlen sind also näherungsweise skalierte Wachstumszahlen. Damit<br />
bleibt wegen der behaupteten Skaleninvarianz der Benford-Verteilung nun nur noch die<br />
Frage, ob die Zahlenfolge<br />
an := g n , n ∈ N,<br />
nach Benford verteilt ist. Ist möglicherweise jede geometrische Folge Benford-verteilt?<br />
Nein, <strong>den</strong>n offenbar ist die Folge (10 n )n∈N nicht Benford-verteilt. Den Nachweis, dass die<br />
Fibonacci-Folge Benford-verteilt ist, erbringen wir später.<br />
5.3 Das Mantissengesetz<br />
Zur Formulierung <strong>und</strong> Analyse des nun folgen<strong>den</strong> Benford-Gesetzes <strong>und</strong> Mantissengesetzes<br />
benötigen wir etwas Vertrautheit mit <strong>den</strong> Logarithmen.<br />
Newcomb schreibt einer Menge von<br />
natürlichen Zahlen – wir beziehen uns<br />
nur auf die in der Dezimaldarstellung –<br />
die Eigenschaft zu, dass sie dem Mantissengesetz<br />
gehorcht, wenn folgende<br />
Aussage zutrifft:<br />
Die Häufigkeit von Zahlen<br />
der Menge ist so, dass die<br />
Mantissen ihrer Logarithmen<br />
gleichverteilt sind.<br />
Newcomb gibt zwar eine heuristische<br />
Begründung, spezifiziert jedoch nicht<br />
wirklich, <strong>für</strong> welche Zahlmengen dieses<br />
Mantissengesetz gelten sollte. Newcomb<br />
Ziffer i Häufigkeit/% Ws(z ∈ Ei)<br />
1 30.1 log(2)<br />
2 17.6 log( 3<br />
2 )<br />
3 1.5 log( 4<br />
3 )<br />
4 9.7 log( 5<br />
4 )<br />
5 7.9 log( 6<br />
5 )<br />
6 6.7 log( 7<br />
6 )<br />
7 5.8 log( 8<br />
7 )<br />
8 5.1 log( 9<br />
8 )<br />
9 4.6 log( 10<br />
9 )<br />
Abbildung 16: Benford-Häufigkeiten<br />
Stand: 21. November 2011 41 ○c J. Baumeister, T.G. Macedo
5.3 Das Mantissengesetz<br />
betrachtet also nur natürliche Zahlen <strong>und</strong> betrachtet die Häufigkeit, mit der die erste<br />
Ziffer eine Eins, eine Zwei, . . . , eine Neun ist.<br />
Verabredungsgemäß ist die Mantisse 31 eines (dekadischen) Logarithmus nur die Zahl<br />
der Nachkommastellen. Da Newcomb nur die Mantissen der Logarithmen betrachtet, liegt<br />
folgende Darstellung beliebiger positiver Zahlen x zugr<strong>und</strong>e:<br />
x = a · 10 e mit 1 ≤ a < 10, e ∈ Z .<br />
Die Mantisse des dekadischen Logarithmus ist dann wegen<br />
log(a) da log(x) = log(a) + e .<br />
Definition 5.1 Die (dezimale) Signifikanz-Funktion S : (0, ∞) −→ [1, 10) ist definiert<br />
wie folgt:<br />
S(x) = t falls x = t · 10 e mit einem t ∈ [1, 10) <strong>für</strong> ein e ∈ Z .<br />
Beachte <strong>für</strong> x ∈ (0, ∞) : S(S(x)) = x , S(10 k x) = S(x) <strong>für</strong> alle k ∈ Z .<br />
Definition 5.2 Ist x eine reelle Zahl, so ist<br />
〈x〉 := x − ⌊x⌋<br />
der Bruchteil von x . �<br />
Dabei ist ⌊x⌋ die größte ganze Zahl, die kleiner gleich x ist. Beispielsweise:<br />
〈33.04〉 = 0.04 , 〈−33.04〉 = 0.96 , 〈 √ 2〉 = 0.4142 . . . , 〈π〉 = .1415 . . . .<br />
Der Zusammenhang dieser Begriffe (erste Ziffer, Signifikanz-Funktion, Bruchteil) ergibt<br />
sich aus folgendem Sachverhalt.<br />
S(x) = �<br />
m∈N 101−m Dm(x) ;<br />
Dm(x) = ⌊10 m−1 S(x)⌋ − 10⌊10 m−2 S(x)⌋ <strong>für</strong> alle m ∈ N ;<br />
S(x) = 10 log(x) − ⌊log(x)⌋ .<br />
Beachte auch folgende Eigenschaft<br />
〈log(x)〉 = 〈log(10 s x)〉 <strong>für</strong> alle x ∈ (0, ∞), s ∈ N , (15)<br />
die sich aus der Funktionalgleichung (10) ableitet.<br />
Nun können wir das Benfordsche Gesetz <strong>und</strong> das Mantissengesetz neu formulieren; wir<br />
tun dies (nur) <strong>für</strong> Zahlenfolgen.<br />
Definition 5.3 Ist (an)n∈N eine Folge positiver Zahlen, so sagen wir, dass diese Folge<br />
dem Mantissengesetz genügt, wenn gilt:<br />
1<br />
b − a = lim<br />
N→∞ N #{n ∈ N|a ≤ 〈log10(an)〉 ≤ b} , 0 ≤ a < b ≤ 1 . (16)<br />
31 mantissa (lat.) = Zugabe, Anhängsel<br />
Stand: 21. November 2011 42 ○c J. Baumeister, T.G. Macedo<br />
�<br />
�
5.3 Das Mantissengesetz<br />
Definition 5.4 Ist (an)n∈N eine Folge positiver Zahlen, so sagen wir, dass diese Folge<br />
dem starken Benford-Gesetz folgt oder stark Benford-verteilt ist, wenn gilt:<br />
1<br />
log10(x) = lim<br />
N→∞ N #{n ∈ N|0 ≤ 〈an〉 ≤ x} , x ∈ (0, 1] . (17)<br />
Es sollte nun keine Überraschung sein, dass folgender Sachverhalt richig ist:<br />
Satz 5.5 Eine Folge (an)n∈N positiver Zahlen genügt dem Mantissengesetz genau dann,<br />
wenn sie stark Benford-verteilt ist. �<br />
Nun bleibt immer noch das Problem, bei konkreten Folgen zu erkennen, ob sie Benfordverteilt<br />
ist. Dazu hat Hermann Weyl 1916 einen wichtigen Beitrag – beachte, zeitlich vor<br />
Benford <strong>und</strong> unabhängig von der Entdeckung von Newcomb – geleistet. Er hat nämlich<br />
Folgen charakterisiert, die gleichverteilt sind modulo 1.<br />
Definition 5.6 Ist (an)n∈N eine Folge positiver Zahlen, so sagen wir, dass diese Folge<br />
gleichverteilt modulo 1 ist, wenn gilt:<br />
1<br />
b − a = lim<br />
N→∞ N #{n ∈ N|a ≤ 〈an〉 ≤ b} , 0 ≤ a < b ≤ 1 . (18)<br />
Satz 5.7 (Gleichverteilungssatz) Sei a eine positive reelle Zahl. Dann ist die arithemtische<br />
Folge (na)n∈N gleichverteilt modulo 1, falls a nicht rational ist.<br />
Den Beweis dieses Satzes haben H. Weyl, W. Sierpinski, P. Bohl um 1910 unabhängig<br />
voneinander bewiesen; siehe [54] <strong>und</strong> [85].<br />
Der Satz 5.7 hilft uns nun zusammen mit Satz 5.5 weiter bei der Frage, wann eine<br />
Folge Benford-verteilt ist. Wir können nun auflisten:<br />
• (a n )n∈N ist Benford-verteilt, falls log 10(a) nicht rational ist.<br />
• (10 n )n∈N ist nicht Benford-verteilt. Klar, <strong>den</strong>n sie genügt nicht dem Weylschen Kriterium,<br />
aber es ist ja auch die ” ärmliche“ Folge 10, 100, 1000, . . . <strong>und</strong> modulo 1<br />
0, 0, 0, . . . .<br />
• (fn)n∈N ist Benford-verteilt. Dies folgt aus der Betrachtung, die die Formel von Binet<br />
erläutert; siehe (27).<br />
Gr<strong>und</strong>legend <strong>für</strong> die Gültigkeit des Mantissengesetzes in einem Datensatz ist die Tatsache,<br />
dass der Datensatz skaleninvariant ist. Die Voraussetzung von Skaleninvarianz erscheint<br />
schon deshalb plausibel, weil das Mantissengesetz unabhängig von <strong>den</strong> gewählten<br />
Einheiten gelten sollte. Wenn beispielsweise die Anfangsziffern von Aktienkursen ausgedrückt<br />
in Euro Benford-verteilt sind, dann sollten sie das auch sein, wenn man die Kurse<br />
in mexikanische Pesos umrechnet. Diese Skaleninvarianz folgt aus folgender Betrachtung.<br />
Ist die Folge (an)n∈N positiver Zahlen Benford-verteilt, dann ist es auch die Folge<br />
(can)n∈N, wenn c eine positive Zahl ist, <strong>den</strong>n es gilt ja<br />
#{n ∈ N|a ≤ 〈log 10(can)〉 ≤ b} ⇐⇒ #{n ∈ N|a ≤ 〈log 10(c) + log 10(an)〉 ≤ b}<br />
⇐⇒ #{n ∈ N|〉a ≤ 〈log 10(an)〉 ≤ b〉}<br />
Stand: 21. November 2011 43 ○c J. Baumeister, T.G. Macedo<br />
�<br />
�
woraus<br />
folgt.<br />
1<br />
b − a = lim<br />
N→∞ N #{n ∈ N|a ≤ 〈log10(can)〉 ≤ b} , 0 ≤ a < b ≤ 1 ,<br />
5.3 Das Mantissengesetz<br />
Wie konnte nun Newcomb mit Hilfe seines Mantissengesetzes das Phänomen der abgenutzten<br />
Seiten seiner Logarithmentafel erklären? Dazu nehmen wir an, eine Menge von<br />
zufälligen Zahlen sei so verteilt, dass sie dem Mantissengesetz gehorcht. Dann definieren<br />
wir <strong>für</strong> die Ziffern i ∈ {1, 2, . . . , 9} die Mengen<br />
Ei := {x ∈ R|x ≥ 0, führende Ziffer von x ist i} = �<br />
k∈Z<br />
[i10 k , (i + 1)10 k ) (19)<br />
Ei steht <strong>für</strong> die Zahlen, die mit der Ziffer i beginnen. Offenbar ist nun [0, ∞) = �<br />
i=1,...,9 Ei .<br />
Sei nun z eine Zahl in [0, ∞), betrachtet als Zufallszahl. Was ist die Wahrscheinlichkeit,<br />
dass z zu einer der Mengen Ei gehört?<br />
z ∈ Ei ⇐⇒ es gibt ein k ∈ Z mit z ∈ [i10 k , (i + 1)10 k )<br />
⇐⇒ es gibt ein k ∈ Z mit log(z) ∈ [log(i10 k ), log((i + 1)10 k ))<br />
⇐⇒ es gibt ein k ∈ Z mit 〈log(z)〉 ∈ [〈log(i10 k )〉, 〈log((i + 1)10 k ))〉<br />
⇐⇒ es gibt ein k ∈ Z mit 〈log(z)〉 ∈ [log(i10 k ), log((i + 1)10 k ))<br />
Mit Hilfe der Gleichverteilung der Mantissen der Logarithmen (siehe Mantissengesetz)<br />
erhalten wir:<br />
Ws(z ∈ Ei) = Ws(log(z) ∈ [log(i), log(i + 1)))<br />
� �<br />
1 + i<br />
= log(i + 1) − log(i) = log<br />
i<br />
�<br />
= log 1 + 1<br />
�<br />
i<br />
Bei dieser Formel steht “Ws(z ∈ Ei)“ <strong>für</strong> die Wahrscheinlichkeit, mit welcher das Ereignis<br />
“z ∈ Ei“ eintritt. Damit lässt sich die Verteilung nach Benford errechnen. Mit Hilfe der<br />
Funktionalgleichung des Logarithmus (10) erhalten wir<br />
9�<br />
log<br />
i=1<br />
�<br />
1 + 1<br />
�<br />
i<br />
<strong>und</strong> es ist klar, dass die Zahlen<br />
�<br />
2 3 4 5 6 7 8 9<br />
= log<br />
1 2 3 4 5 6 7 8<br />
pi := log<br />
10<br />
9<br />
�<br />
= log<br />
�<br />
1 + 1<br />
�<br />
, i = 1, . . . , 9,<br />
i<br />
� �<br />
10<br />
= 1<br />
1<br />
als Wahrscheinlichkeiten betrachtet wer<strong>den</strong> können, <strong>den</strong>n offenbar sind alle Zahlen pi auch<br />
positiv.<br />
Die Formel<br />
�<br />
Ws(z ∈ Ei) = log 1 + 1<br />
�<br />
i<br />
heißt Benfordsches Gesetz über die erste Ziffer. In der Abbildung 16 sind die Häufigkeiten<br />
<strong>und</strong> die Wahrscheinlichkeiten <strong>für</strong> die Ziffern aufgelistet.<br />
Um zu verifizieren, dass eine bestimmte Folge nicht Benford-verteilt ist, ist folgender<br />
Satz nützlich. 32<br />
32 Mit dem Symbol lim supn bezeichnen wir <strong>den</strong> größten Häufungspunkt einer Zahlenfolge. Dazu schaut<br />
man sich alle konvergenten Teilfolgen der betreffen<strong>den</strong> Zahlenfolge an <strong>und</strong> wählt die konvergente Teilfolge<br />
mit dem größten Grenzwert aus; dieser Grenzwert ist dann lim sup n.<br />
Stand: 21. November 2011 44 ○c J. Baumeister, T.G. Macedo<br />
(20)
Satz 5.8 Ist die Zahlenfolge (an)n∈N Benford-verteilt, so gilt<br />
� � ��<br />
an+1<br />
lim sup n log = ∞<br />
n<br />
Den Beweis findet man in [26].<br />
an<br />
5.4 Anwendung: Benford <strong>und</strong> Betrüger<br />
Mit Satz 5.8 lässt sich ableiten, dass folgende Folgen nicht Benford-verteilt sind:<br />
• n b <strong>für</strong> beliebiges reelles b<br />
• Arithmetische Folgen beliebiger Ordnung<br />
• log b n <strong>für</strong> beliebiges reelles b > 1<br />
• Primzahlfolge (pn)n∈N<br />
• (log b pn)n∈N <strong>für</strong> beliebiges reelles b > 1<br />
Beispielsweise lässt sich dies <strong>für</strong> die Folge an := n leicht überprüfen:<br />
� � ��<br />
an+1<br />
lim sup n log<br />
n<br />
an<br />
=<br />
� � ��<br />
n + 1<br />
lim sup n log<br />
n<br />
n<br />
= lim sup (n(log(n + 1) − log(n)))<br />
n<br />
= lim sup (n log(n + 1) − n log(n))<br />
n<br />
Da n log(n + 1) <strong>und</strong> n log(n) <strong>für</strong> genügend großes n ” fast <strong>den</strong> selben Wert“ annehmen,<br />
wird der Grenzwert Null; siehe nun Satz 5.8.<br />
Für die Folge (n 2 )n∈N lässt sich ähnlich schnell zeigen, dass<br />
lim sup<br />
n<br />
�<br />
n log<br />
� �� 2 (n + 1)<br />
= 0<br />
gilt, womit auch diese Folge nicht Benford-verteilt ist.<br />
Als weiteres Beispiel betrachten wir die Folge an := log(n) := log10(n) . Sie ist nicht<br />
Benford-verteilt wegen<br />
lim sup<br />
n<br />
�<br />
n log<br />
� an+1<br />
an<br />
��<br />
5.4 Anwendung: Benford <strong>und</strong> Betrüger<br />
n 2<br />
� � ��<br />
log(n + 1)<br />
= lim sup n log<br />
n<br />
log(n)<br />
= lim sup (n(log(log(n + 1)) − log(log(n))))<br />
n<br />
�= ∞<br />
Hier wollen wir einige Anwendungen der Benford-Verteilung anführen. Der Ansatz bei <strong>den</strong><br />
Anwendungen ist, in Zahlenmaterial, dem unterstellt wird, dass es der Benford-Verteilung<br />
folgt, Abweichungen von der Benford-Verteilung zu erkennen <strong>und</strong> diese als (bewusste)<br />
Fälschung des Zahlenmaterials auszuweisen. Man hüte sich aber vor Schnellschüssen! Starke<br />
Abweichungen fallen schnell auf, geringere können auch auf <strong>den</strong> Zufall zurückzuführen<br />
sein; man spricht von Fehlern erster (echte Daten wirken manipuliert) <strong>und</strong> zweiter Art<br />
(manipulierte Daten wirken echt).<br />
Stand: 21. November 2011 45 ○c J. Baumeister, T.G. Macedo
Gefälschte Steuererklärungen<br />
5.4 Anwendung: Benford <strong>und</strong> Betrüger<br />
Es gibt Hinweise, dass Teile des Zahlenmaterials in einer Steuererklärung nach Benford<br />
verteilt sein sollte; siehe [WeG10]. Die Spiegel-Schlagzeile<br />
Ein kurioses Gesetz der Wahrscheinlichkeitstheorie kann Finanzbeamten helfen,<br />
Steuersünder aufzuspüren<br />
aus dem Jahre 1998 33 befasst sich mit dem Benford-Gesetz hinsichtlich der Möglichkeit,<br />
Fälschern von Steuererklärungen auf die Schliche zu kommen.<br />
M.J. Nigrini in [63] setzte diesen Ansatz in die Tat um. Er schrieb ein (einfaches)<br />
Computer-Programm, mit dem man große Zahlenmengen auf die Gültigkeit des Benfordschen<br />
Gesetzes analysieren kann. Seine Idee war: wenn Zahlen in der Buchhaltung eines<br />
Betriebs oder in einer Steuererklärung von der Benford-Verteilung (statistisch) signifikant<br />
abweichen, könnten dahinter eventuell betrügerische Absichten stecken. Erste Untersuchungen<br />
seinerseits bestätigten die Vermutung: korrekte Steuererklärungen genügen der<br />
Benford-Verteilung während betrügerische deutlich davon abweichen. Das von Nigrini entwickelte<br />
Verfahren wird mittlerweile von mehreren Steuerbehör<strong>den</strong> erfolgreich eingesetzt.<br />
Gefälschte wissenschaftliche Publikationen<br />
Benford’s Beobachtung kann man sich auch im Kleinen nutzbar machen, nämlich bei einer<br />
Methode in der Medizin/Mikrobiologie, die mit der Darstellung von Forschungsergebnisse<br />
mit Hilfe von graphischen ” Klecksen“, so genannten Protein-Klecksen arbeitet. Diese<br />
Methode wird ” Blotting“(Southern-, Western-, Northern-) genannt.<br />
Ein Fälschungsskandal in der Medizingeschichte ist verbun<strong>den</strong> mit dem Krebsforscher<br />
Friedhelm Herrmann. Eine unabhängige Untersuchungskomission untersuchte 347 Publikationen,<br />
in <strong>den</strong>en er Co-Autor war <strong>und</strong> stellte fest, dass 94 davon manipulierte Daten<br />
enthielten. In Laborversuchen ermittelte Protein-Klecksen sind in ihrer Größe Benfordverteilt.<br />
Stellt man also in Publikationen fest, dass die veröffentlichten Protein-Kleckse<br />
nicht nach Benford verteilt sind, geht man von gefälschten Daten aus. Diese Untersuchung<br />
wurde angestellt <strong>und</strong> nach der Untersuchung der Verteilungen aus der Herrmann<strong>und</strong><br />
einer Kontrollgruppe konnte man behaupten, dass der Verdacht groß ist, dass die<br />
Flächen von Northern Blots Benford-verteilt sind. Die Verteilung der Hermann-Gruppe<br />
hat eine etwas geringere Übereinstimmung mit der Benfordverteilung. Der Unterschied<br />
ist jedoch nicht so bedeutend, dass man nur anhand dieser Unstimmigkeit <strong>den</strong> Verdacht<br />
von Manipulation erheben könnte. Es ist auch zu bemerken, dass man keine Rückschlüsse<br />
auf einzelne Publikationen machen kann, da man <strong>für</strong> das Aufstellen einer Verteilung eine<br />
größere Datenmenge braucht; siehe [28] <strong>und</strong> [79]. Im übrigen ist man dabei frei, welche<br />
Ziffernhäufigkeit man verwen<strong>den</strong> will. Es gibt Indizien, dass die Analyse der Verteilung<br />
der zweiten Ziffer erfolgversprechender ist, als die der ersten Ziffer; siehe [28].<br />
Gefälschte Wahlergebnisse<br />
Es sind seit <strong>den</strong> Präsi<strong>den</strong>tschaftswahlen im Iran 2009 Analysen angestellt wor<strong>den</strong>, ob<br />
es Hinweise gibt, dass die Ergebnisse gefälscht sind. Als Ansatz <strong>für</strong> die Untersuchungen<br />
wurde auch das Benfordsche Gesetz herangezogen.<br />
Zur Wahl stan<strong>den</strong> vier Kandidaten: Ahmadinedschad, Moussawi, Karroubi, Rezai. Insgesamt<br />
beteiligten sich knapp 40 Mio. Wähler, die sich auf 366 verschie<strong>den</strong>e Wahlbezirke<br />
aufteilten. Die Anzahl der abgegebenen Stimmen in <strong>den</strong> einzelnen Wahlbezirken schwankt<br />
zwischen <strong>den</strong> Größenordnungen 10 3 <strong>und</strong> 10 6 . Auch die Stimmzahlen <strong>für</strong> die einzelnen<br />
33 16. 11. 1998, siehe http://www.spiegel.de/spiegel/print/d-8032391.html<br />
Stand: 21. November 2011 46 ○c J. Baumeister, T.G. Macedo
5.5 Benford bei dynamischen Systemen<br />
Kandidaten sind ungefähr über drei Größenordnungen verteilt. Es kann daher davon ausgegangen<br />
wer<strong>den</strong>, dass alle Daten, die untersucht wer<strong>den</strong> sollen, über einen genügend<br />
großen Bereich streuen, so dass eine aussagekräftige Benford-Analyse durchgeführt wer<strong>den</strong><br />
kann. In [70] <strong>und</strong> [WeG10] kommt die Benford-Analyse der Daten zum Schluss, dass<br />
eine Manipulation der Wahlergebnisse sehr naheliegend ist.<br />
In [22] wer<strong>den</strong> Überlegungen angestellt, inwieweit die Wahlen zum Deutschen B<strong>und</strong>estag<br />
unter der Annahme, dass Wahlergebnisse, genauer die Voten <strong>für</strong> die Parteien bzw.<br />
Kandidaten, dem Benford-Gesetz folgen sollten, Auffälligkeiten zeigen.<br />
Gefälschte Statistiken<br />
Über eine weitere Wahrnehmung der Benford-Verteilung wird in der Frankfurter Allgemeinen<br />
Sonntagszeitung am 18. 9. 2011 unter dem Titel ” Zahlen mit Frisur“ berichtet. Hier<br />
steht die Untersuchung der Piigs–Staaten (Portugal, Italien, Irland, Griechenland, Spanien)<br />
hinsichtlich der Haushaltsdaten, die 1999 bis 2009 an die EU übermittelt wur<strong>den</strong>, mit<br />
Hilfe der Benford-Analyse im Vordergr<strong>und</strong>. Die neue Veröffentlichung dieser Daten der 27<br />
EU-Staaten hat nach einer Analyse, inwieweit die Zahlen dem Benford-Gesetz genügen,<br />
zu einem Ranking geführt, mit teilweise überraschen<strong>den</strong> Ergebnissen. In das Bild der<br />
aktuellen Diskussion passt, dass Griechenland hier <strong>den</strong> letzten Platz einnimmt bei allen<br />
unterschiedlichen Aufbereitungen der Daten. Man sollte aber vorsichtig sein: das Ranking<br />
kann nur der Ausgangspunkt <strong>für</strong> weitere Untersuchungen sein.<br />
5.5 Benford bei dynamischen Systemen<br />
Da das Konzept ” Dynamische Systeme“ viele Fragen in diesem Aufsatz berührt, wollen<br />
wir die Benford-Analyse bei dynamischen Systemen skizzieren. Da wir mit dynamischen<br />
Systemen u.a. das Wachsen/Schrumpfen von Population beschreiben können, ist es nicht<br />
verw<strong>und</strong>erlich, dass es hier auch positive Bef<strong>und</strong>e <strong>für</strong> das Vorliegen der Benford-Verteilung<br />
gibt.<br />
Unter einem (deterministischen) dynamischen System versteht man das mathematische<br />
Modell eines zeitabhängigen Prozesses. 34 Sie fin<strong>den</strong> vielfältige Anwendungen auf<br />
Prozesse im Alltag <strong>und</strong> erlauben Einblicke in viele Bereiche nicht nur der <strong>Mathematik</strong>,<br />
sondern auch der Physik oder der theoretischen Biologie. Man unterscheidet zwischen<br />
diskreter <strong>und</strong> kontinuierlicher Zeitentwicklung. Bei einem diskreten dynamischen System<br />
ändern sich die Zustände in äquidistanten Zeitsprüngen, d.h. in auf einander folgen<strong>den</strong>,<br />
stets gleich großen zeitlichen Abstän<strong>den</strong>, während die Zustandsänderungen eines kontinuierlichen<br />
dynamischen Systems in infinitesimal kleinen Zeitschritten stattfin<strong>den</strong>. Wichtigste<br />
Beispiele <strong>für</strong> kontinuierliche dynamische Systeme ergeben sich im Zusammenhang<br />
mit gewöhnlichen Differentialgleichungen.<br />
Starten wir mit einer konkreten Situation. Die Entwicklung einer Spareinlage von Jahr<br />
zu Jahr bei Verzinsung jeweils am Jahresende zu einem festen Zinssatz r > 0 lässt sich<br />
einfach verfolgen: Ist x das Kapital am Beginn des Jahres n, so ist y := x+x·r das Kapital<br />
am Beginn des Jahres n + 1. Also haben wir <strong>für</strong> die Kapitalentwicklung vom Jahre n = 0<br />
an folgende Iterationsvorschrift<br />
xn+1 = (1 + r)xn , n ∈ N0 , d.h. xn = (1 + r) n x0 , n ∈ N.<br />
34 Der Begriff des dynamischen Systems geht in seiner heutigen Form auf <strong>den</strong> <strong>Mathematik</strong>er George<br />
David Birkhoff, 1884-1944, zurück.<br />
Stand: 21. November 2011 47 ○c J. Baumeister, T.G. Macedo
Eine Verdopplung des Kapitals beobachtet man nach etwa<br />
n := ln(2)<br />
ln(1 + r)<br />
5.5 Benford bei dynamischen Systemen<br />
Jahren. Nun könnte man auf die ” sozialistische“ Idee kommen, <strong>den</strong> Zinssatz abhängig von<br />
der Kapitalhöhe zu gestalten, um das unbegrenzte Wachstum zu unterbin<strong>den</strong>. Ein Ansatz<br />
<strong>für</strong> einen kapitalabhängigen Zinssatz ist<br />
r = r(x) := (1 − x<br />
K )r0.<br />
Hier ist r0 der Zinssatz, mit dem kleine Guthaben verzinst wer<strong>den</strong> <strong>und</strong> K das Guthaben,<br />
bei dem der Zinssatz auf Null gesunken ist; <strong>für</strong> Guthaben oberhalb von K wür<strong>den</strong> negative<br />
Zinsen erhoben. Mit diesem Ansatz erhalten wir folgende Iterationsvorschrift<br />
xn+1 = xn + (1 − xn<br />
K )r0xn , d.h. xn+1 = (1 + r0)xn − r0<br />
K x2 n , n ∈ N0. (21)<br />
Der Zinssatz r0 <strong>für</strong> Kleinguthaben ist nun noch (frei) zu wählen.<br />
Die Iterationsvorschrift (21) fin<strong>den</strong> wir auch in der Populationskinetik. Dort steht<br />
xn <strong>für</strong> die Populationsgröße einer Spezies in Biomasse (Hase, Fisch, . . . ) zu Beginn eines<br />
Zeitabschnitts n (Jahr, Monat, . . . ); wir normieren eine solchen Zeitabschnitt auf 1. Dann<br />
läßt sich die Vorschrift (21) so interpretieren: Die relative Zuwachsrate<br />
xn+1 − xn<br />
xn<br />
= r0 − r0<br />
K xn<br />
ist abhängig von der Populationsgröße: sie ist nahezu konstant <strong>für</strong> kleine Populationsgrößen,<br />
sie nimmt ab <strong>für</strong> wachsende Populationsgrößen. Diese Abnahme der Zuwachsrate<br />
wird motiviert durch ” sozialen Druck“, dem eine Überpopulation ausgesetzt ist.<br />
Die Iteration (21) verrät schon (fast) alles, was bei allgemeinen Iterationen passieren<br />
kann. Wir betrachten die Iterationsvorschrift<br />
xn+1 := ga(xn) , n ∈ N0, wobei ga(x) := ax(1 − x) , x ∈ [0, 1],<br />
die sogenannte logistische Funktion ist. Die Umrechnung der obigen konkreten Situation<br />
in unsere nun schlankere Form ist so möglich, dass ein Rückschluss auf unser Verzinsungsproblem<br />
möglich ist. Nun haben wir zwei Größen in unserer Iteration, die noch<br />
offen sind: der Parameter a ≥ 0 <strong>und</strong> der Startwert x0 ∈ [0, 1] . Das Intervall [0, 1] ist in<br />
Korrespon<strong>den</strong>z zum Guthabenintervall [0, K] . Da ga nur dann [0, 1] nach [0, 1] abbildet,<br />
wenn a ≤ 4 ist, betrachten wir also nur das Parameterintervall [0, 4].<br />
Für die Betrachtung allgemeiner Iterationen benötigen wir einen Betrachtungsrahmen,<br />
Begriffe <strong>und</strong> Resultate. Dies gelingt durch die Einbeziehung des metrischen Raums.<br />
Rahmen: Sei (X, d) ein vollständiger metrischer Raum 35 <strong>und</strong> sei f : X −→<br />
X die Abbildung, deren Iterierte wir betrachten wollen.<br />
Bezeichnung: Wir verwen<strong>den</strong> die Schreibweise 36<br />
Vereinbarung: f ist stetig.<br />
f ◦0 := id , f ◦1 := f ; f ◦(n+1) := f ◦ f ◦n , n ∈ N .<br />
35 Ein metrischer Raum ist eine Menge von Punkten, in der der Abstand der Punkte untereinander mit<br />
einer so genannten Metrik gemessen wer<strong>den</strong> kann. Damit sind dann Cauchyfolgen, Konvergenz, Grenzwert<br />
in einer zu <strong>den</strong> reellen Zahlen analogen Weise erklärt. Vollständigkeit stellt sicher, dass Cauchyfolgen<br />
konvergieren.<br />
36 Mit f ◦ g bezeichnen wir die Abbildung, die die Hintereinanderausführung von f, g beschreibt: zuerst<br />
g dann f.<br />
Stand: 21. November 2011 48 ○c J. Baumeister, T.G. Macedo
5.5 Benford bei dynamischen Systemen<br />
Definition 5.9 Eine Folge (f ◦n (x 0 ))n∈N0 heisst Orbit mit Startpunkt x0 ∈ X . �<br />
Um die ” Konvergenzeigenschaften“ eines Orbits geht es nun. Interessante Punkte x ∗<br />
sind:<br />
• Fixpunkte: der Orbit (f ◦n (x ∗ ))n∈N0 ist konstant, d.h. x ∗ bleibt fix.<br />
• Periodische Punkte; siehe unten.<br />
• Anziehende Punkte. Dies sind Punkte xâ o , die alle Punkte x 0 aus einer Umgebung<br />
von x ∗ anziehen: lim n f ◦n (x 0 ) = x ∗ . Ist f hinreichend gutartig (stetig!), dann ist<br />
jeder anziehende Punkt ein Fixpunkt.<br />
Definition 5.10<br />
a) x ∗ ∈ X heisst periodischer Punkt genau dann, wenn es N ∈ N gibt mit<br />
N heisst Periode von x ∗ .<br />
f ◦n (x ∗ ) �= x ∗ , 1 ≤ n ≤ N − 1 , f ◦N (x ∗ ) = x ∗ .<br />
b) Ein Orbit (f ◦n (x0))n∈N0 heisst periodisch mit Periode N, wenn es k ∈ N gibt, so<br />
dass x ∗ := f ◦k (x0) ein periodischer Punkt mit Periode N ist.<br />
Wir betrachten als erstes die Iteration<br />
der Modulo–Abbildung<br />
xn+1 := M(xn) , n ∈ N0 ,<br />
M : [0, 1] −→ [0, 1] , M(x) :=<br />
� 2x, x ∈ [0, 1/2),<br />
2x − 1, x ∈ [1/2, 1],<br />
�<br />
; (22)<br />
siehe Abbildung 17. Diese Abbildung ist nicht injektiv <strong>und</strong> bei x = 0.5 ” unstetig“. Ferner<br />
sind folgende Eigenschaften unmittelbar klar:<br />
(a) M hat genau zwei Fixpunkte, nämlich x ∗ = 0 <strong>und</strong> x ∗ = 1.<br />
(b) M ◦N hat genau 2 N Fixpunkte. Davon bil<strong>den</strong> einige echte Orbits der Period N, die<br />
anderen gehören zu niedrigeren Perio<strong>den</strong>.<br />
(c) Da M die Ableitung 2 <strong>für</strong> alle x ∈ [0, 1]\{ 1}<br />
hat, ist kein Fixpunkt anziehend.<br />
2<br />
Die Wirkung der Abbildung lässt sich besser verstehen, wenn wir ein x ∈ [0, 1] in Dualdarstellung<br />
schreiben:<br />
∞�<br />
x = 0, a1a2a3 . . . oder x = ai2 −i , ai ∈ {0, 1}.<br />
Die Iteration bewirkt dann ein Streichen der ersten Ziffer <strong>und</strong> anschließende Linksverschiebung<br />
um eine Stelle; die Modulo–Abbildung wird daher auch Bernoulli–Verschiebung<br />
(Bernoulli–shift) genannt. Wir können sofort erkennen: Zahlen x, deren Dualdarstellung<br />
periodisch ist mit der Periode N gehören zu Orbits der Periode N . Startpunkte,<br />
deren Dualdarstellung ab einer gewissen Stelle periodisch ist, wer<strong>den</strong> von periodischen<br />
Orbits ” angezogen“. Damit ist uns erst das Schicksal der rationalen Punkte bekannt. So<br />
gibt es genau einen Orbit der Periode 2, der aus <strong>den</strong> Punkten<br />
i=1<br />
x1 = 0, 0101 · · · = 1<br />
3 , x2 = 0, 1010 · · · = 2<br />
3<br />
Stand: 21. November 2011 49 ○c J. Baumeister, T.G. Macedo
esteht <strong>und</strong> z.B. von x = 0, 011101010 . . .<br />
nach drei Iterationen erreicht wird. Was geschieht<br />
aber mit der überwiegen<strong>den</strong> Mehrheit<br />
aller Punkte, nämlich <strong>den</strong> irrationalen Zahlen,<br />
die durch nichtperiodische Dualbrüche<br />
dargestellt wer<strong>den</strong>? Es lässt sich zeigen, dass<br />
fast alle – ” fast“ wollen wir hier nicht<br />
näher erläutern – irrationalen Zahlen in ihrer<br />
Dualdarstellung jede endliche Folge von<br />
Ziffern unendlich oft enthalten. Jede ” typische“<br />
Trajektorie irrt also fortwährend durch<br />
das gesamte Intervall [0, 1] mit einer relativen<br />
Häufigkeit, die asymptotisch zur Gleichverteilung<br />
wird. Dies bedeutet, dass<br />
lim k<br />
1<br />
k<br />
k�<br />
χ[a,b](M ◦i (x0)) = b − a<br />
i=1<br />
5.5 Benford bei dynamischen Systemen<br />
1<br />
Abbildung 17: Die Modulo–Abbildung<br />
ist <strong>für</strong> jedes Intervall [a, b] ⊂ [0, 1] <strong>und</strong> es besagt, dass ein Orbit sich im Intervall [a, b] im<br />
Mittel so oft aufhält, wie die Länge b − a uns nahelegt.<br />
Die obige Iteration wird von einer Funktion ” gesteuert“, die nicht stetig ist. Das seltsame<br />
Verhalten der Iteration hängt aber nicht von dieser Tatsache ab, wie die Iteration<br />
xn+1 := Z(xn) , n ∈ N0 ,<br />
mit der sogenannten Zeltdach–Abbildung<br />
�<br />
2x , falls x ∈ [0, 1/2),<br />
Z : [0, 1] −→ [0, 1] , Z(x) :=<br />
2 − 2x , falls x ∈ [1/2, 1],<br />
zeigen kann; siehe Abbildung 18. Hier folgt aus der Dualdarstellung x = 0, a0a1a3 . . . von<br />
x offenbar<br />
�<br />
0, a2a3a4 . . .<br />
Z(x) =<br />
0, a2a3a4 . . .<br />
<strong>für</strong><br />
<strong>für</strong><br />
a1 = 0,<br />
a1 = 1,<br />
, (23)<br />
so dass Z eine Bernoulli–Verschiebung <strong>und</strong> <strong>für</strong> a1 = 1 eine anschließende Komplementierung<br />
aller Ziffern bewirkt. Die Komplementierung sieht so aus: 0 := 1, 1 := 0 .<br />
Die <strong>für</strong> die Modulo–Abbildung getroffenen Aussagen bleiben fast wörtlich bestehen: Es<br />
gibt zwei Fixpunkte (hier: x∗ = 0 <strong>und</strong> x∗ = 2 3<br />
) <strong>und</strong> endlich viele Orbits der Periode N .<br />
Alle rationalen Zahlen gehören zu Orbits der Periode N = 1, 2, . . . oder wer<strong>den</strong> von diesen<br />
angezogen. Jeder typische Orbit, d.h. ein Orbit mit irrationalem Anfangswert, besucht in<br />
unregelmäßiger Folge das gesamte Intervall [0, 1] gleichmäßig.<br />
Eine wichtige Begriffsbildung bei dynamischen Systemen ist die der Sensitivität. Poncaré<br />
formuliert:<br />
Eine sehr kleine Ursache, die wir nicht bemerken, bewirkt einen beachtlichen<br />
Effekt, <strong>den</strong> wir nicht übersehen können, <strong>und</strong> dann sagen wir, der Effekt sei<br />
zufällig. Wenn die Naturgesetze <strong>und</strong> der Zustand des Universums zum Anfangszeitpunkt<br />
exakt bekannt wären, könnten wir <strong>den</strong> Zustand dieses Universums<br />
zu einem späteren Moment exakt bestimmen. Aber selbst wenn es kein<br />
Geheimnis in <strong>den</strong> Naturgesetzen mehr gäbe, so könnten wir die Anfangsbedingungen<br />
doch nur annähernd bestimmen. Wenn uns dies ermöglichen würde,<br />
Stand: 21. November 2011 50 ○c J. Baumeister, T.G. Macedo<br />
1
5.5 Benford bei dynamischen Systemen<br />
die spätere Situation in der gleichen Näherung vorherzusagen, so wür<strong>den</strong> wir<br />
sagen, dass das Phänomen vorhergesagt wor<strong>den</strong> ist, <strong>und</strong> dass es Gesetzmäßigkeiten<br />
folgt. Aber es ist nicht immer so; es kann vorkommen, dass kleine Abweichungen<br />
in <strong>den</strong> Anfangsbedingungen schließlich große Unterschiede in <strong>den</strong><br />
Phänomenen erzeugen. Ein kleiner Fehler zu Anfang wird später einen großen<br />
Fehler zur Folge haben. Vorhersagen wer<strong>den</strong> unmöglich, <strong>und</strong> wir haben ein<br />
zufälliges Ereignis.<br />
In dieser Aussage geht es um die Sensitivität eines Systems <strong>und</strong> damit um die Unmöglichkeit<br />
einer Vorhersage. Unter Sensitivität versteht man kurzum inwiefern kleine Änderungen<br />
bei <strong>den</strong> Anfangsbedingungen das Endergebnis beeinflussen: je stärker dies der Fall ist, desto<br />
höher ist die Sensitivität. Das Prinzip der starken Kausalität ist nicht mehr anwendbar.<br />
Schon bei einfachen Systemen, z.B. dem Werfen eines Würfels kann dies beobachtet<br />
wer<strong>den</strong>: die gewürfelte Augenzahl ist trotz der theoretisch möglichen Vorhersagbarkeit<br />
chaotisch, d.h. zufällig. Siehe hierzu auch Abschnitt 2.5.<br />
Kommen wir nun zur Benford-Aanalysis.<br />
Aus der doch beträchtlichen Anzahl von Ergebnissen<br />
stellen wir ein Ergebnis aus [14] vor.<br />
Es handelt von einem Spezialfall eines dynamischen<br />
Systems, nämlich von der Iteration<br />
x n+1 := αx n (1 − f(x n )) , n ∈ N, (24)<br />
mit einem Startwert x 0 . Hierbei ist α > 0<br />
ein reeller Parameter <strong>und</strong> f eine Abbildung<br />
der reellen Zahlen in sich mit f(0) = 0 . Die<br />
Grö¨se des Parameters α spielt offenbar eine<br />
Rolle <strong>für</strong> das Verhalten des entstehen<strong>den</strong> Orbits<br />
(x n )n∈N . Welche Punkte x ∗ kommen als<br />
(anziehende) Fixpunkte in Frage? Sicherlich<br />
folgende drei Punkte:<br />
x ∗ = 0 , x ∗ mit 1 = f(x ∗ ) , x ∗ = ∞ .<br />
1<br />
Abbildung 18: Die Zeltdach–Abbildung<br />
Wir betrachten <strong>den</strong> Fall, dass x ∗ = 0 ein anziehender Fixpunkt des Orbits ist.<br />
Satz 5.11 Sei die Abbildung f in (24) hinreichend gutartig. 37 Ist dann 0 ein anziehender<br />
Fixpunkt, so ist der durch (24) beschriebene Orbit Benford-verteilt <strong>für</strong> alle Startwerte x 0 ,<br />
die nahe dem Fixpunkt 0 sind, genau dann wenn log(α) irrational ist.<br />
Bibliographische Anmerkungen<br />
Die Zahlenkuriosität wurde erstmals entdeckt von S. Newcomb [61]. Neu entdeckt wurde<br />
sie von F. Benford [7], von dem nun diese Beobachtung ihren Namen hat. Nahe am Thema<br />
ist ein Artikel von Poincaré; siehe [69].<br />
Eine sehr schöne Darstellung stellt die Ausarbeitung [43] von H. Hungerbühler zum<br />
Thema der Benford-Zahlen dar. Eine Erläuterung zur Erklärung des Zahlenphänomens<br />
findet man in [13, 31]. Der Artikel [12] arbeitet das Thema mathematisch systematisch auf.<br />
Eine vollständige Bibliographie findet man unter [Ber11]. Hervorzuheben sind [42, 45, 68]<br />
37 Dies bedeutet, etwas vage ausgedrückt, dass f eine Abbildung ist, die hinreichend gut durch einfache<br />
Polynome approximiert wer<strong>den</strong> kann.<br />
Stand: 21. November 2011 51 ○c J. Baumeister, T.G. Macedo<br />
1
5.5 Benford bei dynamischen Systemen<br />
<strong>und</strong> [Ric10,Sch03]. Kernpunkt einer Analyse ist es, einen geeigneten wahscheinlichkeitstheoretischen<br />
Rahmen aufzubauen. Der Zusammenhang mit der Gleichverteilung mod 1<br />
wird in [26] diskutiert; siehe auch [50, 54, 85].<br />
Fellers klassische Monographie An Introduction to Probability Theory and its Applications<br />
(siehe [30]) enthält auch eine ” Ableitung“ des Benford-Gesetzes. Darin wird eine<br />
hinreichende Bedingung da<strong>für</strong> gegeben, dass eine Zufallsvariable X approximativ verteilt<br />
nach Benford ist. In [11] findet sich eine ausführliche Diskussion über die zweifelhafte<br />
Argumentation <strong>und</strong> eine Richtigstellung.<br />
Die Benford-Verteilung ist die einzige Verteilung der Mantissen, die Basis-unabhängig<br />
ist; siehe [40]. Dies bedeutet, dass ein Datensatz, der dem Benfordschen Gesetz genügt,<br />
wenn er dargestellt ist mit einer Basis b1, auch dem Benfordschen Gesetz genügt, wenn<br />
er zur Basis b2 dargestellt wird.<br />
Dynamische Systeme wer<strong>den</strong> untersucht etwa in [56, 83]. Eine Analyse der Orbits von<br />
dynamischen Systemen hinsichtlich der Benford-Verteilung findet sich in [14, 9, 8, 84].<br />
Das Newtonverfahren wird auf die Gültigkeit des Benford-Gesetzes untersucht in [10].<br />
Die Benford-Verteilung bei Markov-Ketten wird in [46] diskutiert.<br />
Zu Anwendungen des Benford-Gesetzes siehe [FAZ11],[22, 27, 57, 63, 70, 73, 78].<br />
Stand: 21. November 2011 52 ○c J. Baumeister, T.G. Macedo
6 Elementare Arithmetik<br />
A lady of 80 named Gertie<br />
Had a boyfriend of 60 named Bertie<br />
She told him emphatically<br />
That viewed mathematically<br />
By modulus 50 she’s 30<br />
Limerik of J.W. McClellan<br />
Arithmetik ist das Teilgebiet der <strong>Mathematik</strong>, welches auch als Synonym zum Begriff<br />
Zahlentheorie verstan<strong>den</strong> wer<strong>den</strong> kann. Elementare Arithmetik bezeichnet allgemein das<br />
Rechnen mit natürlichen Zahlen <strong>und</strong> ganzen Zahlen <strong>und</strong> die Untersuchung der Konsequenzen,<br />
die sich daraus ergeben, dass die Division in <strong>den</strong> ganzen Zahlen nur eingeschränkt<br />
möglich ist. Weiterhin wird eine Einführung zu Primzahlen, Teilbarkeit <strong>und</strong> modularem<br />
Rechnen gegeben, Hilfsmittel, die <strong>für</strong> die linearen Kongruenzgeneratoren benötigt wer<strong>den</strong>.<br />
Diese Kapitel ist mathematisch am weitesten ausgeführt.<br />
6.1 Ganze Zahlen, Teilbarkeit, Primzahlen<br />
Hier deuten wir die Begriffe an, in <strong>den</strong>en Arithmetik betrieben wird. Die ganzen Zahlen<br />
(Z) <strong>und</strong> natürlichen Zahlen (N bzw. N0 := N\{0}) rufen wir ins ” Leben“ durch<br />
Es gibt Mengen N, Z , ein Element 0 ∈ Z, Abbildungen<br />
Z × Z ∋ (a, b) ↦−→ a + b ∈ Z, (Addition)<br />
Z × Z ∋ (a, b) ↦−→ a · b ∈ Z, (Multiplikation)<br />
<strong>und</strong> eine Vergleichsoperation ≤ mit folgen<strong>den</strong> Eigenschaften:<br />
1. (a + b) + c = a + (b + c) <strong>für</strong> alle a, b, c ∈ Z . (Assoziativgesetz)<br />
2. a + 0 = 0 + a <strong>für</strong> alle a ∈ Z . (0 ist neutrales Element)<br />
3. Zu a ∈ Z gibt es genau ein (−a) ∈ Z mit<br />
(a + (−a)) = 0 = ((−a) + a) . ((−a) ist Negatives von a)<br />
4. a + b = b + a <strong>für</strong> alle a, b ∈ Z . (Kommutativgesetz)<br />
5. (a · b) · c = a · (b · c) <strong>für</strong> alle a, b, c ∈ Z . (Assoziativgesetz)<br />
6. a · b = b · a <strong>für</strong> alle a, b ∈ Z . (Kommutativgesetz)<br />
7. a · (b + c) = a · b + a · c <strong>für</strong> alle a, b, c ∈ Z . (Distributivgesetz)<br />
8. N ⊂ Z , 1 �= 0 , Z = N ∪ {0} ∪ −N .<br />
9. 1 · a = a , 0 · a = 0 <strong>für</strong> alle a ∈ Z . (1 ist neutrales Element)<br />
10. a ≤ b ⇐⇒ b + (−a) ∈ N ∪ {0} .<br />
Zur Abkürzung führen wir noch die Subtraktion durch<br />
ein, schreiben meist kurz<br />
<strong>und</strong> vereinbaren die Schreibweise<br />
Z × Z ∋ (a, b) ↦−→ a − b := a + (−b) ∈ Z<br />
ab <strong>für</strong> a · b<br />
a < b <strong>für</strong> a ≤ b, a �= b .<br />
Damit können wir nun in Z <strong>und</strong> N genauso rechnen, wie wir es gewohnt sind.<br />
Stand: 21. November 2011 53 ○c J. Baumeister, T.G. Macedo
6.1 Ganze Zahlen, Teilbarkeit, Primzahlen<br />
Wo bleibt die Division in <strong>den</strong> ganzen Zahlen? Offenbar sind ±1 die einzigen Zahlen<br />
a in Z, <strong>für</strong> die 1/a, was wir meist als a −1 schreiben, in Z existiert. Wenn man <strong>für</strong> die<br />
anderen Fälle nicht <strong>den</strong> Weg zu <strong>den</strong> rationalen Zahlen weitergehen will, muss man eine<br />
Division mit Rest einführen, was eine Beschreibung der Tatsache gleichkommt, dass<br />
die Division ganzer Zahlen nicht ” aufgeht“. Zunächst zur Teilbarkeit.<br />
Definition 6.1 Seien a, b ∈ Z. Wir sagen, dass a die Zahl b teilt, wenn es k ∈ Z gibt<br />
mit b = ka. Wir schreiben da<strong>für</strong> a|b . Ist b nicht durch a teilbar, so schreiben wir a� | b. �<br />
Srechweisen:<br />
Für a|b: a teilt b, b ist Teiler von a, a ist durch b teilbar.<br />
Für a� | b: a teilt b nicht, b ist kein Teiler von a, a ist nicht durch b teilbar.<br />
Bei Teilbarkeitsfragen in Z können wir uns in der Regel immer auf positive Teiler, d.h.<br />
auf Teiler in N, zurückziehen, da von <strong>den</strong> zwei Zahlen a, −a stets eine in N liegt, falls<br />
a �= 0 ist; der Fall a = 0 ist uninteressant. Ohne Beweis führen wir an:<br />
Folgerung 6.2 Seien a, b, c, d ∈ Z. Dann gilt:<br />
(1) a|a; a|b <strong>und</strong> b|a =⇒ a = ±b; a|b <strong>und</strong> b|c =⇒ a|c.<br />
(2) d|a <strong>und</strong> d|b =⇒ d|(ax + by) <strong>für</strong> alle x, y ∈ Z.<br />
(3) a|b <strong>und</strong> a|(b + c) =⇒ a|c.<br />
Fragt man nach gemeinsamen Teilern zweier ganzer Zahlen a, b, so interessiert insbesondere<br />
der größte dieser gemeinsamen Teiler. Dabei können wir uns dann auf positive<br />
Teiler beschränken, <strong>den</strong>n 1 ist stets ein gemeinsamer Teiler von a <strong>und</strong> b.<br />
Definition 6.3 Seien a, b ∈ Z, die nicht beide 0 sind. Eine Zahl d ∈ N heißt größter<br />
gemeinsamer Teiler von a, b genau dann, wenn<br />
(1) d|a <strong>und</strong> d|b<br />
(2) Ist d ′ ∈ N ein Teiler von a <strong>und</strong> b, so teilt d ′ auch d<br />
gilt. Wir schreiben d = ggT(a, b) . �<br />
Der größte gemeinsame Teiler d gemäß Definition 6.3 ist eindeutig bestimmt dank der<br />
Tatsache, dass wir d ∈ N gefordert haben.<br />
Es sollte klar sein, wie nun der größte gemeinsame Teiler von endlich vielen ganzen<br />
Zahlen erklärt ist. Beispiel:<br />
ggT(6, 10) = 2, ggT(ggT(6, 10), 30) = 2, ggT(6, 10, 15) = 1 .<br />
Definition 6.4 Eine Zahl p ∈ N, p �= 1, heißt Primzahl, wenn 1 <strong>und</strong> p die einzigen<br />
Teiler von p sind. �<br />
Spätestens seit Euklid kennt man die Primzahlen, die Tatsache, dass es unendlich viele<br />
Primzahlen gibt <strong>und</strong> auch die Aussage, dass eine natürliche Zahl, bis auf die Reihenfolge,<br />
eindeutig in ein Produkt von Primzahlen zerlegt wer<strong>den</strong> kann. Diese Zerlegung nennt man<br />
Primfaktorzerlegung <strong>und</strong> das Aufsuchen dieser Zerlegung eine Faktorisierung; siehe<br />
unten. Die obige Definition des größten gemeinsamen Teilers hätten wir – wie dies in der<br />
Schule meist geschieht – auch auf die Primfaktorzerlegung stützen können.<br />
Stand: 21. November 2011 54 ○c J. Baumeister, T.G. Macedo
6.2 Fibonacci-Zahlen<br />
Satz 6.5 (Primfaktorzerlegung) Jede natürliche Zahl n ≥ 2 lässt sich bis auf die<br />
Reihenfolge der Faktoren eindeutig als Produkt von Primzahlen darstellen.<br />
Den Beweis lassen wir weg, die Vorbereitungen da<strong>für</strong>, insbesondere <strong>für</strong> <strong>den</strong> Nachweis der<br />
Eindeutigkeit, liegen hier nicht vor. Die Eindeutigkeit der Primfaktorzerlegung ist ein<br />
Resultat, das wesentlich auf einer ” Kürzungsregel“ basiert. Man sollte sich hüten, die<br />
Eindeutigkeit der Primfaktorzerlegung als Selbstverständlichkeit hinzunehmen, die keines<br />
Beweises bedarf.<br />
Mitunter ist nun eine kanonische Produktschreibweise <strong>für</strong> die Primfaktorzerlegung<br />
nützlich. Wir <strong>den</strong>ken uns die Primzahlen durchnumeriert, also p1 = 1, p2 = 3, p3 = 5, . . .<br />
<strong>und</strong> schreiben jede Zahl n ∈ N so hin:<br />
n = �<br />
i∈N<br />
dabei ist αi die Vielfachheit, mit der der Primfaktor pi in der Primfaktorzerlegung vorkommt,<br />
also αi = 0, falls die Primzahl pi kein Primfaktor von n ist.<br />
Die Herstellung der Primfaktorzerlegung einer (großen) Zahl ist kein leichtes Unterfangen.<br />
Die Schwierigkeit wird u.a. dadurch beleuchtet, dass nahezu gleiche Zahlen eine<br />
sehr verschie<strong>den</strong>e Primfaktorzerlegung besitzen können:<br />
p αi<br />
i ;<br />
370273 = 43 · 79 · 109 , 370277 = 17 · 23 · 947 , 370279 = 7 · 13 · 13 · 313 .<br />
Die Aufzählung p1, p2, . . . suggeriert, dass es unendlich viele Primzahlen gibt. Hier ist<br />
der Beweis <strong>für</strong> die Tatsache, dass es unendlich viele Primzahlen gibt. 38<br />
Satz 6.6 (Unendlichkeit der Primzahlen/Euklid) Es gibt unendlich viele Primzahlen.<br />
Beweis:<br />
Annahme: Es gibt nur endlich viele Primzahlen.<br />
Seien p1, . . . , pr diese Primzahlen. Setze N := 1 + p1 · · · pr . Dann ist N ∈ N <strong>und</strong> N ≥ 2.<br />
Da N > pi <strong>für</strong> jedes i = 1, . . . , r ist, ist N keine Primzahl. Also ist N zerlegbar: N =<br />
kp, p, k ∈ N mit 1 < p < N . O.E. kann man nun annehmen, dass eine der Zahlen k, p<br />
eine Primzahl ist; sonst zerlege erneut. Sei also etwa p die Primzahl. Also kommt p unter<br />
p1, . . . , pr vor; o.E. p = p1 . Dann folgt:<br />
1 + p1p2 . . . pr = p1k .<br />
Daraus liest man nun p = p1 = 1 ab, was ein Widerspruch ist. �<br />
Das kleinste gemeinsame Vielfache von Zahlen a, b ∈ N ist die kleinste Zahl m ∈ N,<br />
<strong>für</strong> die a|m , b|m gilt. Kennt man die Primfaktorzerlegung von a <strong>und</strong> b, so kann man es<br />
sehr einfach ablesen.<br />
6.2 Fibonacci-Zahlen<br />
Wir kommen nun zu einer speziellen Menge von Zahlen, <strong>den</strong> so genannten Fibonacci-<br />
Zahlen. Sie wer<strong>den</strong> noch eine zweifache Rolle spielen.<br />
38 In [2] – ein Buch, dass in jedem Falle zur Lektüre eines (angehen<strong>den</strong>) <strong>Mathematik</strong>ers gehören sollte<br />
– wer<strong>den</strong> 6 Beweise <strong>für</strong> die Unendlichkeit der Primzahlen gegeben.<br />
Stand: 21. November 2011 55 ○c J. Baumeister, T.G. Macedo
6.2 Fibonacci-Zahlen<br />
Im Buch ” liber abacci“ von Leonardo von Pisa (genannt Fibonacci) 39 wird die Vermehrung<br />
eines Kaninchenpaares in folgender Weise in Abhängigkeit von der Zeit beschrieben:<br />
Ein zur Zeit t = 0 geborenes Kaninchenpaar wirft vom 2. Monat an in jedem<br />
Monat ein weiteres Paar. Die Nachkommen folgen dem Vorbild der Eltern.<br />
Alle Kaninchen überleben. Damit ergibt sich rekursiv folgende Vorschrift<br />
f0 := f1 := 1 , fn+1 := fn + fn−1 , n ∈ N .<br />
Die Zahlen fn, n ∈ N, nennt man Fibonacci–Zahlen.<br />
Sieht man ein Stück der Fibonacci-Folge an, so stellt man fest, dass sie schnell wächst:<br />
1,1,2,3,5,8,13,21,34,. . . . Es ist offensichtlich, dass die Folge monoton wachsend ist, <strong>und</strong><br />
man überzeugt sich leicht, dass sie exponentiell wächst, <strong>den</strong>n durch die Monotonie ergibt<br />
sich:<br />
fn = fn−1 + fn−2 ≤ 2fn−1 <strong>und</strong> folglich fn ≤ 2 n .<br />
fn = fn−1 + fn−2 ≥ 2fn−2 <strong>und</strong> folglich f2n ≥ 2 n−1 , fn ≥ ( √ 2) n−1 .<br />
Also wird das Wachstum beschrieben mit einer Zahl zwischen √ 2 <strong>und</strong> 2 . Man kann dieses<br />
noch viel genauer analysieren.<br />
Die Fibonacci-Zahlen haben viele schöne, interessante Eigenschaften. Darunter fügen<br />
wir die folgende an, da sie im Zusammenhang mit dem euklidischen Algorithmus von<br />
Interesse ist:<br />
ggT(fn+1, fn) = 1 <strong>für</strong> alle n ∈ N0<br />
(25)<br />
Wir beweisen diese Aussage induktiv.<br />
Für n = 1 ist die Aussage klar. Ist die Aussage richtig <strong>für</strong> die Zahl n, dann ist sie auch<br />
richtig <strong>für</strong> n + 1, <strong>den</strong>n wir haben<br />
ggT(fn+2, fn+1) = ggT(fn+1 + fn, fn+1) = ggT(fn+1, fn) = 1 .<br />
Die Fibonacci-Zahlen sind eng mit dem gol<strong>den</strong>en Schnitt verknüpft. Aus der Darstellung<br />
fn+1<br />
fn<br />
folgt, die Existenz von g := limn<br />
= fn + fn−1<br />
fn<br />
fn+1<br />
Klar, die Lösungen dieser Gleichungen sind<br />
fn<br />
= 1 + fn−1<br />
fn<br />
= 1 + 1<br />
fn<br />
fn−1<br />
vorausgesetzt, die I<strong>den</strong>tität<br />
g = 1 + 1<br />
. (26)<br />
g<br />
g± = 1<br />
2 (1 ± √ 5) .<br />
Die positive Lösung g = 1<br />
2 (1 + √ 5) heißt gol<strong>den</strong>e Schnittzahl. Sie beschreibt eine<br />
harmonische Teilung einer Strecke durch <strong>den</strong> gol<strong>den</strong>en Schnitt. Der Gol<strong>den</strong>e Schnitt findet<br />
sich in der Natur, z.B. auch in der Anatomie des Menschen. Wir betrachten das Verhältnis,<br />
39 Fibonacci, Leonardo, 1180? – 1250?<br />
Stand: 21. November 2011 56 ○c J. Baumeister, T.G. Macedo
6.3 Division mit Rest<br />
das im Arm entsteht durch die Teilung durch das Ellenbogengelenk. Ist die Länge des<br />
Unterarmes die Längeneinheit Eins <strong>und</strong> ist x die Länge des Oberarmes, so gilt:<br />
1<br />
1 + x<br />
= x<br />
1<br />
d.h. x = 1<br />
1 + x .<br />
Damit ist x die Lösung der quadratischen Gleichung<br />
Die positive Lösung davon ist<br />
x 2 + x − 1 = 0 .<br />
x = 1<br />
2 (√ 5 − 1) ≈ 0.618 .<br />
Für x + 1 ergibt sich die Schnittzahl g von oben.<br />
Ein weiteres Beispiel in der Anatomie wird von Leonardo da Vinci im Verhältnis,<br />
das der Nabel erzeugt, illustriert. Der Gol<strong>den</strong>e Schnitt findet sich auch vielfach in Gegenstän<strong>den</strong><br />
unseres Lebens (Buchformat, Verhältnisse an Bauwerken, . . . ).<br />
Eine nicht rekursive Darstellung der Fibonacci-Zahlen ist gegeben durch die Formel<br />
von Binet:<br />
fn = 1<br />
�<br />
√ g<br />
5<br />
n + 1<br />
gn �<br />
, n ∈ N . (27)<br />
Hierbei ist g := 1<br />
2 (1 + √ 5) die gol<strong>den</strong>e Schnittzahl. Den Beweis der Formel von Binet<br />
erbringt man mit vollständiger Induktion. Wie man auf die Formel von Binet kommt?<br />
Dies kann man auf dem Umweg über die Darstellung der Paare (fn+1, fn) mit Hilfe einer<br />
Matrix-Multiplikation sehen:<br />
� � � � � � � �<br />
fn+1 1 · fn + 1 · fn−1 1 1 fn<br />
=<br />
=<br />
, n ∈ N ,<br />
fn 1 · fn + 0 · fn−1 1 0 fn−1<br />
� �� �<br />
A<br />
Daraus ergibt sich mit dem n-fachen Produkt An der Matrix A<br />
� �<br />
fn+1<br />
= A n<br />
� �<br />
1<br />
, n ∈ N , (28)<br />
0<br />
fn<br />
<strong>und</strong> wir haben eine Formel <strong>für</strong> die Fibonacci-Zahlen gefun<strong>den</strong>, wenn wir das n-fache<br />
Produkt A n geschickt/geeignet/schnell ausrechnen können. Dies gelingt sogar formelmäßig<br />
über die ” Diagonalisierung“ von A . Wir müssen hier auf <strong>den</strong> Beweis verzichten; siehe [32].<br />
Je<strong>den</strong>falls lesen wir dann die Formel von Binet ab.<br />
6.3 Division mit Rest<br />
Der Division mit Rest, die wir nun vorstellen wollen, tritt uns im Alltag entgegen bei der<br />
Umrechnung von Tageszeiten in unterschiedliche Zeitskalen (Minuten, Sekun<strong>den</strong>,. . . ), bei<br />
der Berechnung von Wochentagen im Kalender, bei . . . .<br />
Satz 6.7 (Division mit Rest) Für alle a ∈ Z, b ∈ N gibt es eindeutig bestimmte Zahlen<br />
q, r ∈ Z mit<br />
a = bq + r <strong>und</strong> 0 ≤ r < b.<br />
Stand: 21. November 2011 57 ○c J. Baumeister, T.G. Macedo
6.3 Division mit Rest<br />
Beweis:<br />
Wir beweisen zunächst die Existenz von q, r <strong>für</strong> a ≥ 0 durch vollständige Induktion:<br />
a = 0 : Setze q := r := 0 .<br />
a + 1 : Ist a + 1 < b, so gilt a + 1 = 0 · b + (a + 1) <strong>und</strong> wir sind fertig. Ist a + 1 ≥ b,<br />
so folgt aus der Induktionsvoraussetzung a + 1 − b = qb + r mit q ∈ Z, 0 ≤ r < b. Also<br />
a + 1 = (q + 1)b + r.<br />
Die Existenz folgt <strong>für</strong> a < 0 aus der Anwendung der eben bewiesenen Aussage auf −a<br />
gemäß<br />
−a = q ′ b + r ′ , 0 ≤ r ′ < b<br />
durch<br />
a =<br />
� (−q ′ − 1)b + (b − r ′ ) , falls r ′ �= 0<br />
(−q ′ )b , falls r ′ = 0<br />
Um die Eindeutigkeit zu beweisen, nehmen wir ein zweites Zahlenpaar q ′ , r ′ mit<br />
a = q ′ b + r ′ , 0 ≤ r ′ < b ,<br />
wobei o. E. r ≥ r ′ sei. Dann ist offenbar 0 ≤ r − r ′ < b <strong>und</strong> r − r ′ = −(q − q ′ )b . Aus<br />
r − r ′ < b folgt −(q − q ′ ) ≤ 0, aus r − r ′ ≥ 0, folgt −(q − q ′ ) ≥ 0 . Zusammengefasst: q = q ′<br />
<strong>und</strong> daher auch r = r ′ . �<br />
Die Umrechnung von Zahlen in unterschiedlichen Stellensystemen kann mit Division<br />
mit Rest erfolgen. Sei etwa die Zahl 1234 als Zahl im Zehnersystem vorgelegt, also<br />
(1234)10 = 1 · 10 3 + 2 · 10 2 + 3 · 10 1 + 4 · 10 0 .<br />
Wir rechnen sie in das Dualsystem um gemäß<br />
1234 = 1 · 2 10 + 210<br />
= 1 · 2 10 + 0 · 2 9 + 0 · 2 8 + 1 · 2 7 + 82<br />
= 1 · 2 10 + 0 · 2 9 + 0 · 2 8 + 1 · 2 7 + 1 · 2 6 + 18<br />
= 1 · 2 10 + 0 · 2 9 + 0 · 2 8 + 1 · 2 7 + 1 · 2 6 + 0 · 2 5 + 1 · 2 4 + 0 · 2 3 + 0 · 2 2 + 1 · 2 1 + 0 · 2 0<br />
Dies bedeutet<br />
(1234)2 = 10011010010 .<br />
Van-der-Corput Folgen, wer<strong>den</strong> mit der Dualentwicklung natürlicher Zahlen erzeugt,<br />
<strong>und</strong> zwar durch Bit-Umkehr. Sei also<br />
i = (dj . . . d0)2 =<br />
die Dualdarstellung von i ∈ N . Dann heißt<br />
j�<br />
dk2 k<br />
k=0<br />
Φ2(i) := xi := (.d0 . . . dj)2 =<br />
die i-te van der Corput-Zahl. Beispielsweise sind<br />
1<br />
2<br />
, 1<br />
4<br />
, 3<br />
4<br />
, 1<br />
8<br />
5 3<br />
, ,<br />
8 8<br />
j�<br />
dk2 −k−1<br />
Stand: 21. November 2011 58 ○c J. Baumeister, T.G. Macedo<br />
k=0
6.4 Euklidischer Algorithmus<br />
die ersten 6 van der Corput-Zahlen. Klar, die Basis b = 2 lässt sich gegen jede beliebige<br />
Basiszahl b ∈ N, b ≥ 2, austauschen. 40 Alle diese van der Corput-Zahlen lassen sich algorithmisch<br />
einfach durch Division mit Rest bestimmen. Sie entsprechen also einer Liste von<br />
Zahlen, die total <strong>den</strong> Anspruch der Zufälligkeit verloren haben. Was sie aber auszeichnet,<br />
ist die Tatsache, dass sie gute Verteilungseigenschaften haben; siehe [62].<br />
Die Konstruktion der van der Corput-Zahlen kann man nun nutzen, um Folgen in<br />
[0, 1] d zu erzeugen. Dazu wähle man <strong>für</strong> jede Dimension j eine Basis bj, erzeuge damit die<br />
van der Corput-Folge (xi,j)i∈N . Damit bilde man dann die Vektoren<br />
x i := (xi,1, . . . , xi,d) ∈ [0, 1] d .<br />
Im Allgemeinen nimmt man als Basen die ersten d Primzahlen. Diese so konstruierte Folge<br />
von Punkten nennt man eine Folge von Halton-Punkten. Die guten Verteilungseigenschaften<br />
der van der Corput-Zahlen übertragen sich auf die Halton-Punkte.<br />
Van der Corput-Zahlen, die als Ersatz <strong>für</strong> <strong>Zufallszahlen</strong> dienen können, wer<strong>den</strong> eingeordnet<br />
unter Quasizufallszahlen.<br />
6.4 Euklidischer Algorithmus<br />
Der nun zu besprechende ” euklidische Algorithmus“ hat seine historische Wurzel in dem<br />
Bestreben in der Antike, die Verhältnisrechnung mit geometrischen Größen zu begrün<strong>den</strong><br />
(Kommensurabilitätsbetrachtungen; siehe [72], S. 41-44). Bei Euklid sollen zwei Strecken<br />
mit einem Maßstab ausgemessen wer<strong>den</strong>; dies gelingt gerade mit einem Maßstab, der die<br />
Länge des größten gemeinsamen Teilers besitzt; siehe Abbildung 19.<br />
Der euklidische Algorithmus gestattet es, <strong>den</strong> größten gemeinsamen Teiler zweier Zahlen<br />
(siehe unten) effizient zu berechnen. Er basiert auf folgender Beobachtung:<br />
Lemma 6.8 Sei a ∈ Z <strong>und</strong> b ∈ N. Dann folgt aus der Darstellung a = qb + r , q, r ∈ Z,<br />
die Aussage ggT(a, b) = ggT(b, r) .<br />
Beweis:<br />
Ist d ein Teiler von a, b, dann ist d ein Teiler von b <strong>und</strong> r <strong>und</strong> umgekehrt (siehe Folgerung<br />
6.2). �<br />
Die Interpretation von Lemma 6.8 ist, dass durch fortschreitende Division mit Rest<br />
aus dem Ausgangspaar (a, b) Paare (a ′ , b ′ ) gebildet wer<strong>den</strong> können, die <strong>den</strong>selben größten<br />
gemeinsamen Teiler besitzen. Der euklidische Algorithmus realisiert dies:<br />
Algorithm 2 Der euklidische Algorithmus<br />
EIN a, b ∈ Z ; o.E. a ≥ b > 0 .<br />
Schritt 0 a ′ := a, b ′ := b .<br />
Schritt 1 (a ′ , b ′ ) := (b ′ , r), wobei a ′ = qb ′ + r mit 0 ≤ r < b ′ ist.<br />
Schritt 2 Ist r = 0, gehe zu AUS. Ist r �= 0, setze a ′ := b ′ , b ′ := r, gehe zu Schritt 1.<br />
AUS d := b ′ = ggT(a, b) .<br />
40 Van der Corput (1935) hat sie <strong>für</strong> die Basis 2 als erster betrachtet.<br />
Stand: 21. November 2011 59 ○c J. Baumeister, T.G. Macedo
6.4 Euklidischer Algorithmus<br />
Die Aussage, dass d der größte gemeinsame Teiler von a, b ist, falls die Situation r = 0<br />
erreicht wird, folgt aus dem Lemma 6.8 unter der Beobachtung, dass ggT(b ′ , 0) = b ′ ist.<br />
Bleibt noch zu klären, dass die Situation r = 0 in endlich vielen Schritten wirklich erreicht<br />
wird. Dies folgt aber aus der Tatsache, dass <strong>für</strong> zwei aufeinanderfolgende Durchläufe von<br />
Schritt 1 mit (a ′ , b ′ ) , (a ′′ , b ′′ ) sicherlich 0 ≤ b ′′ < b ′ , b ′ , b ′′ ∈ N0 gilt. Also muss schließlich<br />
das Verfahren bei r = 0 abbrechen.<br />
Wir geben dem euklidischen Algorithmus, wohlwissend, dass der Schritt 1 nur endlich<br />
oft durchlaufen wird, eine explizite Fassung:<br />
Euklidischer Algorithmus Kettenbruchentwicklung<br />
r0 := a , r1 := b, a b = r0<br />
r1<br />
r0 = q1r1 + r2 , 0 < r2 < r1,<br />
r1 = q2r2 + r3 , 0 < r3 < r2,<br />
.<br />
.<br />
rk−1 = qkrk + rk+1 , 0 < rk+1 < rk,<br />
rk = qk+1rk+1,<br />
r0<br />
r1 = q1 + r2<br />
r1<br />
r1<br />
r2 = q2 + r3<br />
r2<br />
.<br />
rk−2<br />
rk−1 = qk + rk<br />
rk−1<br />
rk<br />
rk+1<br />
.<br />
= qk+1<br />
In dieser Darstellung ist rk+1 = ggT(rk−1, rk) = · · · = ggT(r0, r1) = ggT(a, b) nach<br />
Lemma 6.8.<br />
Beispiel 6.9 Sei a = 48 , b = 18 . Wir erhalten<br />
48 = 2 · 18 + 12<br />
18 = 1 · 12 + 6<br />
12 = 2 · 6<br />
Also gilt: ggT(48, 18) = 6 . Die geometrische Interpretation als ” wechselseitige Wegnahme“,<br />
wie sie schon bei Euklid bei Kommensurabilitätsbetrachtungen zu fin<strong>den</strong> ist, findet<br />
sich in Abbildung 19: kleinere Strecken wer<strong>den</strong> mehrfach auf einer größeren Strecke abgetragen.<br />
Da das Vorgehen im obigen Beispiel abbricht, sagt man, dass a = 48 <strong>und</strong> b = 18<br />
ein gemeinsames Maß haben, nämlich 6. (Bricht ein solches Verfahren nicht ab, dann<br />
heißen a, b inkommensurabel, wie dies etwa bei der Diagonalen im Einheitsquadrat der<br />
Fall ist, da ja √ 2 irrational ist.) �<br />
Aus der obigen Darstellung des euklidischen Algorithmus lesen wir ab:<br />
a<br />
b<br />
= r0<br />
r1<br />
= q1 + r2<br />
r1<br />
= q1 + 1 r1<br />
r2<br />
= q1 +<br />
1<br />
q2 + r3<br />
r2<br />
= q1 +<br />
q2 +<br />
1<br />
1<br />
q3 + r4<br />
r3<br />
= . . . (29)<br />
Wir wissen dabei, dass stets 0 < rk+1 < 1 gilt <strong>und</strong> dass das Schema nach k Schritten<br />
rk<br />
abbricht, <strong>den</strong>n in formaler Interpretation haben wir rk+2 = 0 . Die berechneten Größen<br />
q1, . . . , qk+1 schreiben wir als<br />
[q1, . . . , qk+1] oder a<br />
b = [q1, . . . , qk+1]<br />
Stand: 21. November 2011 60 ○c J. Baumeister, T.G. Macedo
6.4 Euklidischer Algorithmus<br />
auf <strong>und</strong> bezeichnen dies als Kettenbruch. Der Kettenbruch kann mitunter auch ” sehr<br />
lang“ sein. In vielen Fällen ist man schon mit einer Näherung [q1, . . . , ql] , 1 ≤ l < k + 1 ,<br />
zufrie<strong>den</strong>, d.h. mit der Näherung, die entsteht, wenn man rl<br />
rl+1 ersetzt.<br />
Wir wissen, genügt die gol<strong>den</strong>e Schnittzahl g der Gleichung<br />
g = 1<br />
1 + g .<br />
Daraus lesen wir durch sukzessives Einsetzen <strong>den</strong> unendlichen Kettenbruch – g ist ja<br />
irrational – <strong>für</strong> die gol<strong>den</strong>e Schnittzahl g ab:<br />
g = [1; 1, 1, 1, 1, . . . ] .<br />
Betrachtet man davon nur endliche Abschnitte<br />
als Näherung <strong>für</strong> g, dann erhält man<br />
” schlechte“ Approximationen von g ; man<br />
nennt g deshalb die irrationalste Zahl“<br />
” 41 .<br />
Der Gr<strong>und</strong> da<strong>für</strong> ist, dass jeder Eintrag im<br />
Kettenbruch die kleinste Einheit ist, die ein<br />
Abbrechen gerade noch verhindert, nämlich<br />
1. Es deckt sich mit der Tatsache, dass der<br />
euklidische Algorithmus <strong>für</strong> die Brüche der<br />
Fibonacci-Zahlen besonders langsam ist. Dies<br />
steht im Gegensatz zu einer anderen irrationalen<br />
Zahl, der Kreiszahl π . Ihre Kettenbruchentwicklung<br />
ist<br />
π = [3; 7, 15, 1, . . . ] .<br />
48<br />
18 18 12<br />
12 6<br />
6 6<br />
6<br />
Abbildung 19: Wechselwegnahme<br />
Schon der endliche Kettenbruch [3; 7] = 22<br />
7<br />
ist eine sehr gute Approximation von π. 42 Der Gr<strong>und</strong> ist, dass der nächste Eintrag im<br />
Kettenbruch von π die Zahl 15 ist.<br />
Satz 6.10 (Lemma von Bachet/Lemma von Bezout) Seien a, b ∈ Z . Dann gibt es<br />
Zahlen s, t ∈ Z mit ggT(a, b) = sa + tb .<br />
Beweis:<br />
O.E. a ≥ b > 0 .<br />
Die Aussage folgt dadurch, dass wir <strong>den</strong> euklidischen Algorithmus in der expliziten Fassung<br />
rückwärts lesen. Wir strukturieren dies, indem wir nachrechnen, dass <strong>für</strong> 0 ≤ i ≤ k+1<br />
gilt<br />
ri = sia + tib , mit si, ti ∈ Z. (30)<br />
Dies ergibt sich so: Für i = 0 setze s0 := 1, t0 := 0 <strong>und</strong> <strong>für</strong> i = 1 setzte s1 := 0, t1 := 1 .<br />
Nun setzen wir<br />
si+1 := si−1 − qisi , ti+1 := ti−1 − qiti , 1 ≤ i ≤ k. (31)<br />
Dann gilt offenbar die obige Aussage. �<br />
41Diese Tatsache spielt sogar eine Rolle in der so genannten Chaostheorie.<br />
42 22<br />
In <strong>den</strong> DMV-Mitteilungen vom Herbst 2011 lesen wir, dass 7 der Lieblingsbruch von G.M. Ziegler<br />
(ein Star der Vermittlung von <strong>Mathematik</strong> in der Öffentlichkeit, siehe [2]) ist.<br />
Stand: 21. November 2011 61 ○c J. Baumeister, T.G. Macedo
6.4 Euklidischer Algorithmus<br />
Beispiel 6.11 Wir können nachrechnen, dass 37 der größte gemeinsame Teiler von 36667<br />
<strong>und</strong> 12247 ist. Mit der Analyse gemäß Satz 6.10 erhalten wir<br />
37 = ggT(36667, 12247) = 165 · 36667 − 494 · 12247 .<br />
Folgerung 6.12 Seien a, m ∈ Z, die nicht beide Null sind, mit ggT(a, m) = 1 . Dann<br />
gibt es b ∈ Z mit m|(ab − 1) .<br />
Beweis:<br />
Wir wissen aus dem Lemma von Bezout 1 = ax + my mit x, y ∈ Z . Setze b := x . Dann<br />
ist ab − 1 = −my = m(−y) . �<br />
Die obige Folgerung können wir so lesen, dass bei Teilerfremdheit von a <strong>und</strong> m zu a<br />
eine Zahl b existiert, die die Gleichung<br />
löst; wir kommen darauf zurück.<br />
a · b ≡ 1 mod m<br />
C. Huygens entwickelte Kettenbruchentwicklungen, als er ein Zahnradmodell (siehe die<br />
illustrierende Abbildung 20) des Sonnensystems bauen wollte. Gesucht wur<strong>den</strong> möglichst<br />
” einfache Brüche“ <strong>für</strong> die gelten sollte:<br />
Zahnzahl von Zahnrad 1 Umlaufzeit von Planet 1<br />
=<br />
Zahnzahl von Zahnrad 2 Umlaufzeit von Planet 2 .<br />
Wer<strong>den</strong> die Umlaufzeiten der Planeten sehr genau gemessen, dann kann rechts ein Bruch<br />
mit sehr großem Zähler <strong>und</strong> Nenner entstehen.<br />
Der euklidische Algorithmus gilt als ” Musterbeispiel“<br />
eines effizienten Algorithmus mit<br />
vielfältigen Anwendungen. Eigentlich müssten<br />
wir nun eine Analyse der Komplexität des euklidischen<br />
Algorithmus durchführen, wenn wir die<br />
Behauptung, dass dieser Algorithmus sehr effizient<br />
ist, belegen wollten. Wir verzichten darauf,<br />
ohne zu vergessen, auf ein Beispiel hinzuweisen,<br />
das <strong>den</strong> worst case des Algorithmus beschreibt:<br />
die Berechnung des größten gemeinsamen Teiler<br />
zweier aufeinanderfolgender Fibbonacci-Zahlen,<br />
die wir nun einführen wollen.<br />
Abbildung 20: Zahnräder<br />
Hier sind sie von Interesse bei der Untersuchung<br />
der Schnelligkeit des euklidischen Algorithmus. Im euklidischen Algorithmus wer<strong>den</strong><br />
die Reste rk+1 umso schneller klein, je größer die Quotienten qk sind.<br />
Betrachten wir <strong>den</strong> euklidischen Algorithmus <strong>für</strong> das Paar zweier aufeinanderfolgen<strong>den</strong><br />
Fibonacci–Zahlen, also a = fn+1, b = fn <strong>für</strong> ein n ∈ N . Aus der Rekursionsgleichung der<br />
Fibonacci–Zahlen folgt unmittelbar<br />
fn+1 = 1 · fn + fn−1<br />
fn = 1 · fn−1 + fn−2<br />
.<br />
f3 = 1 · f2 + f1<br />
f2 = 1 · f1<br />
Stand: 21. November 2011 62 ○c J. Baumeister, T.G. Macedo<br />
�
6.5 Modulares Rechnen<br />
Da f1 = 1 gilt, folgt: je zwei aufeinanderfolgende Fibonacci-Zahlen sind teilerfremd <strong>und</strong><br />
jeder Quotient qk ist gleich 1. Dies ist der ungünstigste Fall, was die Anzahl der Schritte in<br />
Abhängigkeit von der Größe der Ausgangszahlen betrifft. Beim euklidischen Algorithmus<br />
<strong>für</strong> fn+1, fn sind, wie gesehen, n Schritte nötig. Da fn in Abhängigkeit von n exponentiell<br />
wächst, folgt, dass die Anzahl der Schritte beim euklidischen Algorithmus zur Berechnung<br />
eines größten gemeinsamen Teilers ggT(a, b) höchstens logarithmisch in der Stellenanzahl<br />
der Eingabedaten a, b, d.h. linear mit der Stellenzahl von a, b wächst: der Aufwand ist also<br />
vergleichbar mit dem Aufwand, der bei der Multiplikation von a <strong>und</strong> b anfällt. Der euklidische<br />
Algorithmus ist damit eine sehr effiziente Methode zur Berechnung des größten<br />
gemeinsamen Teilers großer Zahlen. Er benötigt insbesondere nicht die Primfaktorzerlegung<br />
der Zahlen a, b .<br />
6.5 Modulares Rechnen<br />
Die modulare Arithmetik geht auf Gauß zurück. Sie beschreibt das Rechnen mit Resten:<br />
man gibt sich eine natürliche Zahl m vor – diese Zahl nennen wir Modul – <strong>und</strong> ” ersetzt“<br />
jede ganze Zahl a durch ihren Rest r, der bei Division von a durch m entsteht; siehe Satz<br />
6.7. Die Zahlen a, die bei Division mit Rest <strong>den</strong> gleichen Rest ergeben, fasst man zu einer<br />
Klasse, <strong>den</strong> Restklassen zusammen.<br />
Die Restklassen sind nun so definiert:<br />
Zm := {[0], [1], . . . , [m − 1]} wobei [i] := {z ∈ Z|z = qm + i <strong>für</strong> ein q ∈ Z} ,<br />
Dass die Menge Zm m Elemente hat, ergibt sich aus der Tatsache, dass m Reste gemäß<br />
Satz 6.7 auftreten können. Beachte, dass etwa die Restklasse [1] auch als die Restklasse<br />
[m + 1] beschrieben wer<strong>den</strong> kann: wir haben in der Definition von Zm ein naheliegendes<br />
” Representantensystem“ gewählt. Für m = 11 haben wir etwa<br />
[3] = [25] = [−8] = [91] .<br />
Beispiel 6.13 Für m = 2 erhalten wir gerade die Einteilung der natürlichen Zahlen in<br />
die Klassen gerade Zahlen (Restklasse [0]) <strong>und</strong> ungerade Zahlen (Restklasse [1]). Für diese<br />
Klassen hat man in natürlicher Weise eine Addition <strong>und</strong> eine Multiplikation:<br />
gerade + gerade = gerade , ungerade + gerade = ungerade<br />
gerade · gerade = gerade , ungerade · gerade = gerade<br />
Die Beobachtung aus Beispiel 6.13 bezüglich Addition, Multiplikation schreiben wir<br />
nun fort auf Zm:<br />
Addition: [i] + [j] := [i + j] , i, j ∈ {0, 1, . . . , m − 1} ;<br />
Multiplikation: [i] · [j] := [i · j] , i, j ∈ {0, 1, . . . , m − 1} .<br />
Beachte, dass die Verknüpfungssymbole +, · in zweifacher Bedeutung auftreten: als Addition,<br />
Multiplikation in Zm <strong>und</strong> in Z .<br />
Damit dies wohldefiniert ist, muss noch gezeigt wer<strong>den</strong>: aus [i] = [i ′ ], [j] = [j ′ ] folgt<br />
[i + j] = [i ′ + j ′ ] <strong>und</strong> [ij] = [i ′ j ′ ] (Unabhängigkeit von <strong>den</strong> Repräsentanten). Wir beweisen<br />
dies am Beispiel der Multiplikation. [i] = [i ′ ], [j] = [j ′ ] bedeutet i ′ = pm + i, j ′ = qm + j<br />
<strong>für</strong> p, q ∈ Z . Daraus folgt<br />
i ′ j ′ = (pm + i)(qm + j) = (iqm + jpm + pqm)m + ij also [ij] = [i ′ j ′ ] .<br />
Stand: 21. November 2011 63 ○c J. Baumeister, T.G. Macedo<br />
�
6.5 Modulares Rechnen<br />
Assoziativgesetz Klammern <strong>für</strong>fen bei der Addition beliebig gesetzt wer<strong>den</strong>:<br />
([i] + [j]) + [k] = [i] + ([j] + [k]) , i, j, k ∈ {0, 1, . . . , m − 1} .<br />
Neutrales Element [0] ist das neutrale Element <strong>für</strong> die Addition:<br />
[i] + [0] := [i] , i, j ∈ {0, 1, . . . , m − 1} .<br />
Inverses [m − i] ist das Inverse von [i] bezüglich der Addition:<br />
[m − i] + [i] = [m − i + i] = [m] = [0] .<br />
Kommutativgesetz Die Summan<strong>den</strong> dürfen bei der Addition vertauscht wer<strong>den</strong>:<br />
[i] + [j] = [j] + [i] , i, j ∈ {0, 1, . . . , m − 1} .<br />
Die angeführten Eigenschaft fasst man zusammmen in der Aussage: (Zm, +) ist eine kommutative<br />
Gruppe. Beachte, dass diese Eigenschaften auch <strong>für</strong> die ganzen Zahlen gelten,<br />
also dass auch (Z, +) eine kommutative Gruppe ist.<br />
Für die Multiplikation ist die Situation nicht ganz so komfortabel. Zwar gelten die<br />
Aussagen<br />
Assoziativgesetz Klammern <strong>für</strong>fen bei der Multiplikation beliebig gesetzt wer<strong>den</strong>:<br />
([i] · [j]) · [k] = [i] · ([j] · [k]) , i, j, k ∈ {0, 1, . . . , m − 1}<br />
Neutrales Element [1] ist das neutrale Element <strong>für</strong> die Multiplikation:<br />
[i] · [1] := [i] , i, j ∈ {0, 1, . . . , m − 1}<br />
Kommutativgesetz Die Faktoren dürfen bei der Multiplikation vertauscht wer<strong>den</strong>:<br />
[i] · [j] = [j] · [i] , i, j ∈ {0, 1, . . . , m − 1}<br />
aber die Eigenschaft über das Inverse gilt nicht allgemein. Ein Gegenbeispiel folgt aus<br />
[2] · [2] = [2 · 2] = [0] in Zm <strong>für</strong> m = 4 ,<br />
<strong>den</strong>n hier kann [2] kein Inverses bezüglich der Multiplikation haben, da stets [i] · [0] =<br />
[i · 0] = [0] ist. Aber man kann die Vermutung haben, dass diese Schwierigkeit im Fall,<br />
dass m eine Primzahl ist, nicht auftritt. Dies trifft zu <strong>und</strong> wir halten fest: (Zm, ·) ist eine<br />
kommutative Gruppe bezüglich der Multiplikation, falls m eine Primzahl ist, wobei wir<br />
<strong>den</strong> Beweis noch nicht eigentlich erbracht haben, aber die Vorarbeit ist in Lemma 6.12<br />
geleistet: jedes Element [a] hat ein Inverses bezüglich der Multiplikation.<br />
Hier sind die Gruppentafeln – so nennt man die vollständige Auflistung der Verknüpfungen<br />
der Gruppenelemente innerhalb einer Gruppe – <strong>für</strong> m = 5 . Man beachte, dass<br />
sowohl in der Gruppentafel zur Addition als auch in der Gruppentafel zur Multiplikation<br />
in jeder Zeile <strong>und</strong> Spalte jede Klasse genau einmal vertreten ist. Beachte ferner, dass die<br />
Potenzen des Elements [2] alle Elemente von Z ∗ 5 := Z5\{[0]} durchlaufen:<br />
[2] 0 = [1] , [2] 1 = [2] , [2] 2 = [4] , [2] 3 = [3] , [2] 4 = [1] .<br />
Man nennt eine Gruppe, die ein solches zyklisches Element besitzt, eine zyklische<br />
Gruppe.<br />
Wir führen noch eine andere Schreibweise ein. Mit u, v ∈ Z schreiben wir:<br />
u ≡ v mod m : ⇐⇒ [u] = [v] ⇐⇒ m|(u − v) .<br />
Stand: 21. November 2011 64 ○c J. Baumeister, T.G. Macedo
+ [0] [1] [2] [3] [4]<br />
[0] [0] [1] [2] [3] [4]<br />
[1] [1] [2] [3] [4] [0]<br />
[2] [2] [3] [4] [0] [1]<br />
[3] [3] [4] [0] [1] [2]<br />
[4] [4] [0] [1] [2] [3]<br />
(a)<br />
Abbildung 21: Gruppentafeln zu Z5<br />
· [1] [2] [3] [4]<br />
[1] [1] [2] [3] [4]<br />
[2] [2] [4] [1] [3]<br />
[3] [3] [1] [4] [2]<br />
[4] [4] [3] [2] [1]<br />
(b)<br />
6.5 Modulares Rechnen<br />
Beispiel 6.14 Wie sehen die bei<strong>den</strong> letzten Dezimalstellen von 24 2008 aus? Dies ist die<br />
Frage nach dem Rest von 24 2008 modulo 100 . Wir rechnen induktiv nach:<br />
Induktionsbegin k = 1: Klar<br />
Induktionsschluss k → k + 1:<br />
24 k ≡ (−1) k+1 · 24 mod 100 , k = 1, 2, . . . .<br />
24 k+1 ≡ (24 k ·24) ≡ (−1) k+1 ·24·24 ≡ (−1) k+1 (600−24) mod 100 ≡ (−1) k+2 ·24 mod 100<br />
Daraus folgt also<br />
24 2008 ≡ −24 mod 100 ≡ 76 mod 100 ,<br />
was bedeutet, dass die Zahl 2 2008 mit 76 endet. �<br />
Beispiel 6.15 Jede Zahl 10 k hat wegen<br />
10 k = 9 · 10k − 1<br />
10 − 1 + 1 = 9 · (10k−1 + · · · + 10 0 ) + 1<br />
<strong>den</strong> Rest 1 modulo 9. Dies hat die Konsequenz, dass jede Dezimalzahl<br />
z = anan−1 · · · a0 = an10 n + an−110 n−1 + · · · + a010 0<br />
modulo 9 <strong>den</strong> Rest an + · · · + a0 hat. Dies ist die so genannte Quersummenprobe auf<br />
Teilbarkeit durch Neun: eine Zahl z hat bei Teilung durch Neun genau dann <strong>den</strong> Rest<br />
r, wenn ihre Quersumme bei Teilung durch Neun <strong>den</strong> Rest r hat.<br />
Daraus resultiert die Neunerprobe, eine Methode, die es gestattet, <strong>den</strong> Nachweis<br />
einer fehlerhaften Addition, Subtraktion oder Multiplikation ohne lange Rechenoperationen<br />
zu erbringen: man berechnet die Neunerreste der bei<strong>den</strong> Operan<strong>den</strong> <strong>und</strong> des Ergebnisses,<br />
was man durch sukzessives Bil<strong>den</strong> von Quersummen tun kann. Hier ist ein Beispiel <strong>für</strong><br />
die Anwendung. Ist die Behauptung<br />
40752 · 32111 = 1308587572<br />
richtig? Nein, <strong>den</strong>n die Neunerreste erfüllen die Gleichung nicht:<br />
Neunerrest von 40752 ist 0, <strong>den</strong>n: 4 + 0 + 7 + 5 + 2 = 18, 1 + 8 = 9<br />
Neunerrest von 32111 ist 8, <strong>den</strong>n: 3 + 2 + 1 + 1 + 1 = 8<br />
Neunerrest von 1308587572 ist 1, <strong>den</strong>n: 1 + 3 + 0 + 8 + 5 + 8 + 7 + 5 + 7 + 2 = 46, 4 + 6 =<br />
10, 1+0 = 1 Beachte, eine umgekehrte Anwendung ist nicht erlaubt: wenn die Neunerprobe<br />
keinen Widerspruch aufweist, muss das Ergebnis nicht korrekt sein.<br />
Kombiniert man die Neunerprobe etwa mit der Elferprobe – wir gehen hier nicht darauf<br />
ein – dann erhält man aus der Korrektheit der Proben schon eine ziemliche Sicherheit <strong>für</strong><br />
die Korrektheit der Rechnung. �<br />
Stand: 21. November 2011 65 ○c J. Baumeister, T.G. Macedo
6.5 Modulares Rechnen<br />
Modulares Rechnen wird <strong>für</strong> Berechnungen mit dem Computer wichtig, wenn mit sehr<br />
großen ganzen Zahlen exakt gerechnet wer<strong>den</strong> soll.<br />
Sei a ∈ N . Man wählt verschie<strong>den</strong>e Moduln m1, . . . , ml <strong>und</strong> berechnet die Reste<br />
r1, . . . , rl von a bezüglich dieser Moduln. Der Rest r von a bezüglich des Moduls m :=<br />
m1 · · · ml ist dann gleich r1 · · · rl <strong>und</strong> er legt a eindeutig fest, wenn a zwischen 0 <strong>und</strong> m−1<br />
liegt. Ist a ≥ m, dann liegt a immerhin noch in der Restklasse [r] bezüglich des Moduls<br />
m .<br />
Beispiel 6.16 Betrachte die Multiplikation der Zahlen 102, 99: 102 · 99 =????? .<br />
Wir wählen (geschickt) die Moduln m1 = 9, m2 = 10, m3 = 11 <strong>und</strong> erhalten folgende Reste<br />
<strong>für</strong> das Produkt:<br />
102 · 99 ≡ (99 + 3) · (99 + 0) ≡ 3 · 0 ≡ 0 mod 9 ;<br />
102 · 99 ≡ (100 + 2) · (100 − 1) ≡ 2 · (−1) ≡ −2 mod 10 ;<br />
102 · 99 ≡ (99 + 3) · (99 + 0) ≡ 3 · 0 ≡ 0 mod 11 .<br />
Eine Lösung der Gleichungen ist x = 198 . Alle weiteren Lösungen sind x = 198 +<br />
km1m2m3, k ∈ Z . Aus einer Größenordnungsbetrachtung folgt: 102 · 99 = 198 + 10 · 990<br />
ist die Lösung der Multiplikation. �<br />
Das Ergebnis, das die Rechnung in Beispiel 6.16 rigoros macht, ist der Chinesische<br />
Restesatz; siehe [32] <strong>und</strong> [34].<br />
Bibliographische Anmerkungen<br />
Die Idee des euklidischen Algorithmus ist nicht nur auf Zahlbereiche begrenzt; siehe [1].<br />
In der Informatik ist er ein bedeutendes Hilfsmittel.<br />
Kettenbrüche sind ein wichtiges Hilfsmittel beim Studium der irrationalen Zahlen <strong>und</strong><br />
ihrer Approximation durch rationale Zahlen; siehe [52].<br />
Gruppentheorie ist in der <strong>Mathematik</strong> ein zentrales Thema mit Ausstrahlung in nahezu<br />
jede Teildisziplin. Einführendes kann nach gelesen wer<strong>den</strong> etwa bei [1, 32, 86]. Zum<br />
modularen Rechnen siehe etwa [Sei07].<br />
Zu Quasizufallszahlen siehe [36].<br />
Stand: 21. November 2011 66 ○c J. Baumeister, T.G. Macedo
7 Kongruenzgeneratoren<br />
Random numbers should not be generated with a method<br />
chosen at random<br />
Donald E. Knuth<br />
Die Klasse der Kongruenzgeneratoren, die wir nun besprechen wollen, nutzen die modulare<br />
Rechnung. Sie lassen sich in ihrer Qualität bzw. in ihrer Schwäche gut beurteilen<br />
<strong>und</strong> sie sind <strong>für</strong> Anwendungen sehr interessant, da sie sich einfach realisieren lassen.<br />
7.1 Lineare Kongruenzgeneratoren<br />
Um die umständliche Verwendung von Tabellen zu vermei<strong>den</strong>, wer<strong>den</strong> im Allgemeinen<br />
Folgen von <strong>Zufallszahlen</strong> verwendet, die durch Iterationen, also rekursives Rechnen, hergestellt<br />
wer<strong>den</strong>. Diese <strong>Zufallszahlen</strong> – wir nennen sie meist Pseudozufallszahlen – haben<br />
<strong>den</strong> Vorteil, dass sie reproduzierbar sind, <strong>und</strong> haben <strong>den</strong> Nachteil, dass sie deterministischen<br />
Charakter besitzen. Zunächst einige allgemeine Bemerkungen; sie schließen an an<br />
die Betrachtungen zu dynamischen Systemen.<br />
Sei M eine endliche Menge <strong>und</strong> f eine Abbildung von M nach M, also f : M −→ M .<br />
Die Iteration dieser Abbildung sieht so aus:<br />
x n+1 := f(x n ) , n ∈ N0 , (32)<br />
Die Folge ist durch die Wahl von x 0 vollständig bestimmt. Es entsteht ein Orbit x 1 , x 2 ,<br />
x 3 , . . . ; wir schreiben ihn als Folge (x n )n∈N . Da die Menge M endlich ist, können nicht alle<br />
Folgenglieder x n verschie<strong>den</strong> sein. Es gibt also Indizes k, l mit x k = x l ; o. E. k > l . Seien<br />
k, l die ersten Indizes, <strong>für</strong> die dies eintritt, <strong>und</strong> sei damit r := k − l . Da x k = x l gilt, folgt<br />
x n+r = x n <strong>für</strong> alle n ≥ l . Also wird der Orbit (x n )n∈N periodisch mit Periode r ; wir<br />
sagen, dass wir einen Zyklus der Länge r haben. Verlangt man, dass jedes Element der<br />
Menge M die Chance hat im Orbit aufzutauchen, muss der Zyklus ganz M umfassen. Aus<br />
dieser Forderung folgt, dass die Abbildung f surjektiv sein muss, d.h. dass jedes Element<br />
y in M als Bild unter f geschrieben wer<strong>den</strong> kann, also y = f(x) mit einem x ∈ M . Da M<br />
endlich ist, hat dies zur Konsequenz, dass dann dieses x eindeutig bestimmt sein muss,<br />
d.h. dass f auch injektiv sein muss. Also hat die Forderung, dass <strong>für</strong> <strong>den</strong> Zyklus r = #M<br />
gilt, zur Folge, dass f surjektiv <strong>und</strong> injektiv, also bijektiv ist.<br />
Die Iteration der Form (32) umfasst die Situation der diskreten dynamischen Systeme<br />
<strong>und</strong> damit auch der chaotischen diskreten dynamischen Systeme, allerdings<br />
dann unter Verzicht auf die Endlichkeit der Menge M . Wir wer<strong>den</strong> in Kapitel 9 ein<br />
Beispiel dieser Art kennenlernen.<br />
Kommen wir nun zur Realisierung von (32) <strong>für</strong> die Zwecke der Erzeugung von Pseudo-<br />
<strong>Zufallszahlen</strong>. Wir wählen dazu<br />
M := Zm ; f : Zm ∋ [x] ↦−→ [ax + b] ∈ Zm , (33)<br />
mit einem Modul m . Hier sind a, b ∈ Z . Damit lautet die Rechenvorschrift (32)<br />
x n+1 := ax n + b mod m , n ∈ N . (34)<br />
Wir bezeichnen (34) auch als affinen Kongruenz–Generator.<br />
Stand: 21. November 2011 67 ○c J. Baumeister, T.G. Macedo
7.1 Lineare Kongruenzgeneratoren<br />
Bemerkung 7.1 Durch die Generatoren in (34) wer<strong>den</strong> Zahlen in M := {0, 1, . . . , m−1}<br />
erzeugt. Aus einer Zahl y ∈ {0, . . . , m − 1} ergibt sich dann eine Zahl z in [0, 1] ganz<br />
einfach so: z := y m . Damit können wir sagen, dass in (34) ein Generator <strong>für</strong> Pseudozufallszahlen<br />
in [0, 1] beschrieben ist. �<br />
Ein guter Generator sollte Zykluslänge r := m haben. Wie wir oben gesehen haben,<br />
ist dann <strong>für</strong> f die Bijektivität sicherzustellen. Die Forderung der Bijektivität von f hat<br />
Konsequenzen <strong>für</strong> die Wahl der Zahlen m, a, b . Für die Klärung der Frage, unter welchen<br />
Bedingungen dieser Typ von Generatoren einen Zyklus maximaler Länge erzeugt, dient<br />
folgender Satz:<br />
Satz 7.2 Mit m, a, b ∈ Z, m ≥ 2 , betrachte die Abbildung<br />
f : {0, . . . , m − 1} ∋ x ↦−→ ax + b mod m ∈ {0, . . . , m − 1} . (35)<br />
Für beliebiges x 0 ∈ {0, . . . , m − 1} sei die Folge (x n )n∈N definiert durch<br />
x n+1 := f(x n ) , n ∈ N 0 .<br />
Genau dann ist diese Folge periodisch mit der maximalen Perio<strong>den</strong>länge m <strong>für</strong> alle Startwerte<br />
x 0 , wenn folgende Bedingungen erfüllt sind:<br />
a) p|(a − 1) <strong>für</strong> alle Primteiler p von m ;<br />
b) 4|(a − 1) falls 4|m ;<br />
c) b <strong>und</strong> m sind teilerfremd.<br />
Den Beweis dieses Satzes findet man in [32].<br />
Satz 7.2 nennt uns die Bedingungen <strong>für</strong> einen affinen Kongruenz–Generator, damit er<br />
der Minimalforderung, einen Zyklus maximaler Länge zu erzeugen, genügt. Jedoch garantieren<br />
diese Bedingungen noch lange keinen guten Zufallsgenerator, wie nachfolgendes<br />
Beispiel zeigt; damit der erzeugte Orbit als eine Folge von <strong>Zufallszahlen</strong> angesehen wer<strong>den</strong><br />
kann, sollten die Elemente von M darin in einer ” guten Durchmischung“ vorkommen.<br />
Beispiel 7.3 Betrachte <strong>für</strong> einen beliebigen Modul m <strong>den</strong> Generator f(x) :≡ x + 1<br />
mod m . Kein Zweifel, die Zykluslänge ist maximal <strong>für</strong> je<strong>den</strong> Startwert, nämlich m, aber<br />
die erzeugte Folge 0, 1, 2, . . . , m − 1, 0, 1 . . . kann sicherlich nicht <strong>den</strong> Anspruch einer Zufallsfolge<br />
erheben. �<br />
Beispiel 7.4 Betrachte die spezielle Wahl m = 10, a = b = 7 . Hier ist der erzeugte<br />
Zyklus<br />
7, 6, 9, 0, 7, 6, 9, 0, . . .<br />
ziemlich kurz. Beachte, Voraussetzung a) in Satz 7.2 ist nicht erfüllt. �<br />
In der Praxis wird häufig ein Modul der Form m = 2 k verwendet (<strong>und</strong> dazu in der<br />
Regel der Multiplikator a im Bereich √ m < a < m − √ m). In diesem Fall bedeuten die<br />
Bedingungen des Satzes 7.2 einfach<br />
a ≡ 1 mod 4 <strong>und</strong> b ungerade . (36)<br />
Stand: 21. November 2011 68 ○c J. Baumeister, T.G. Macedo
7.2 Einige verwendete Generatoren<br />
Wir listen hier ein paar ” gebräuchliche“ Generatoren auf.<br />
Beispiel 7.5 <strong>Von</strong> D. Knuth wurde der Generator<br />
Modul = 2 16 , a = 137 , b = 187<br />
7.2 Einige verwendete Generatoren<br />
vorgeschlagen. Die Zykluslänge ist maximal, da die Bedingungen (36) erfüllt sind. �<br />
Beispiel 7.6 In der Programmiersprache C++ gibt es einen Generator namens drand48:<br />
Modul = 2 48 , a = 25214903917 , b = 11 .<br />
Die Zykluslänge ist maximal, da die Bedingungen (36) erfült sind. �<br />
Beispiel 7.7 Betrachte die spezielle Wahl m = 2 31 , a = 65539, b = 0 . Dies ist der Zufallsgenerator<br />
RANDU, wie er von IBM in <strong>den</strong> Computern in <strong>den</strong> 60er Jahren verwendet<br />
wurde. Die maximal erreichbare Zykluslänge r ist hier nicht ganz maximal, aber mit<br />
r = 2 29 nahezu maximal. �<br />
Beispiel 7.8 Der Lewis-Goodman-Miller-Generator wird beschrieben durch<br />
x n = 16807 x n−1 mod 2 31 − 1 .<br />
Hier ist also m = 2 31 − 1, a = 16807, b = 0 . Bedingung (36) ist hier verletzt. �<br />
Beispiel 7.9 Ein weiterer Generator:<br />
Modul = 2 16 , a = 193 , b = 73 .<br />
Die Zykluslänge ist maximal, da die Bedingungen (36) erfüllt sind. �<br />
Als Erläuterung sei hier noch ein Kongruenzgenerator erwähnt, der der Erzeugung der<br />
Fibonacci-Zahlen nachgebaut ist. Hier lautet die Iteration<br />
x n+2 := x n+1 + x n mod m , n ∈ N0 . (37)<br />
Offensichtlich wer<strong>den</strong> hier zwei Startzahlen x 0 <strong>und</strong> x 1 benötigt. Als Beispiel sei m = 13<br />
als Modul des Fibonacci-Generators <strong>und</strong> x 0 = 1 <strong>und</strong> x 1 = 1 als Startwerte festgelegt.<br />
Die Berechnung des Orbits zeigt, dass sich ein Zyklus von 28 Zahlen einstellt, also eine<br />
Perio<strong>den</strong>länge größer als der Modul m = 13 . Es gibt Sätze über die Perio<strong>den</strong>länge von Zufallsgeneratoren.<br />
Für m = 2 k beträgt die Periode eines Fibonacci-Generators unabhängig<br />
von der Wahl der Startwerte x 0 <strong>und</strong> x 1 stets 3 · 2n − 1, falls mindestens ein Startwert von<br />
Null verschie<strong>den</strong> ist. Ein Beispiel <strong>für</strong> einen guten Fibonacci-Generator ist gegeben <strong>für</strong> <strong>den</strong><br />
Modul m = 2 35 .<br />
7.3 Geometrische Beobachtungen<br />
Da die Abfolge der Pseudozufallszahlen durch <strong>den</strong> Generator festgelegt ist, besteht eine<br />
Korrelation zwischen aufeinander folgen<strong>den</strong> <strong>Zufallszahlen</strong>. Um Aufschluss über die Korreliertheit/Unkorreliertheit<br />
zu erhalten, sollte man daher Paare, Trippel,. . . von <strong>Zufallszahlen</strong><br />
betrachten <strong>und</strong> deren ” geometrische Verteilung“ untersuchen. 43 Wir ” skalieren“ dazu<br />
die <strong>Zufallszahlen</strong> mit Modul m gemäß<br />
u i := xi<br />
m ∈ [0, 1] , i ∈ N0 .<br />
43 Eine ” Anwendung“ der folgen<strong>den</strong> Pärchenbildung ist die Abtastung eines Schachbretts: will man<br />
jedes Feld zufällig besuchen, so braucht man zufällige Koordinaten.<br />
Stand: 21. November 2011 69 ○c J. Baumeister, T.G. Macedo
(a) (b)<br />
Abbildung 22: Geometrische Einsichten<br />
7.3 Geometrische Beobachtungen<br />
In (a) von Abbildung 22 haben wir dies <strong>für</strong> <strong>den</strong> Generator mit a =, b =, c = getan. Die<br />
Korrelation wird sehr deutlich, insbesondere im Vergleich mit der Graphik (b), in der ein<br />
perfekter ” Zufallsregen“ dargestellt ist.<br />
Betrachten wir <strong>den</strong> Generator RANDU genauer. Wir haben hier<br />
<strong>und</strong> daher<br />
x i+1 ≡ (65539) 2 x i−1 mod 2 31<br />
≡ (2 16 + 3) 2 x i−1 mod 2 31<br />
≡ (6x i − 9x i−1 ) mod 2 31<br />
x i+1 − 6x i + 9x i−1 = k · 2 31 mit k ∈ Z .<br />
Dies bedeutet <strong>für</strong> die ” normalisierten“ <strong>Zufallszahlen</strong> u i := x i 2 −31<br />
u i+1 − 6u i + 9u i−1 = k mit k ∈ Z . (38)<br />
Da 0 < u i+1 < 1 gilt – beachte, dass daher u i+1 − 6u i + 9u i−1 nur die Werte −5, −4, . . . , 9<br />
annehmen kann – müssen die Tripel (u i+1 , u i , u i−1 ) auf Ebenen im Einheitswürfel [0, 1] 3<br />
liegen, <strong>und</strong> zwar auf nicht mehr als 15 Stück, die jeweils einen gleichen Abstand 1/ √ 118<br />
haben. Neben der mangeln<strong>den</strong> Maximalität der Zykluslänge ein weiterer Nachteil dieses<br />
Generators. <strong>Von</strong> vielen wird er daher <strong>für</strong> <strong>den</strong> Müllhaufen der Informatik-Geschichte freigegeben.<br />
Vergleichen wir die geometrische Verteilung der Paare (u i+1 , u i ) in [0, 1] × [0, 1] <strong>für</strong> die<br />
Generatoren aus Beispiel 7.5 <strong>und</strong> Beispiel 7.9. Man kann Gera<strong>den</strong> entdecken, worauf alle<br />
<strong>Zufallszahlen</strong> liegen, 21 im ersten Fall, 8 im zweiten Fall; die Streifen dazwischen sind<br />
frei von <strong>den</strong> erzeugten Zufallspaaren. Der maximale Abstand von solchen Streifen ist bei<br />
bei<strong>den</strong> Generatoren dementsprechend ziemlich verschie<strong>den</strong>: 1<br />
√274 bei Beispiel 7.5, 1<br />
√32 bei<br />
Beispiel 7.9. Dies bedeutet, dass der Generator 7.5 größeres Vertrauen genießen sollte.<br />
Bemerkung 7.10 Der Blum-Blum-Shub-Generators nutzt ebenfalls die Modulo-Rechnung,<br />
wobei der Modul m als Produkt zweier sehr großer Primzahlen ist. Die Iteration<br />
erfolgt nach<br />
x n+1 = x 2 mod m .<br />
Stand: 21. November 2011 70 ○c J. Baumeister, T.G. Macedo
7.4 Statistische Tests<br />
Die Iterationszufallszahlenfolge des Blum-Blum-Shub-Generators wird weniger zu Simulationszwecken<br />
als zu modernen Codierungsverfahren benutzt.<br />
Der derzeit ” beste“ Generator ist wohl der Mersenne-Twister-19937-Generator, liefert<br />
er doch <strong>Zufallszahlen</strong>, die als Tupel selbst im 623-dimensionalen Einheitswürfel noch<br />
gleichverteilt sind, die geometrische Korreliertheit ist also sehr gering, <strong>und</strong> der eine Perio<strong>den</strong>länge<br />
von 2 19937 − 1(≈ 4, 3 · 10 6001 ) besitzt. Diese Perio<strong>den</strong>länge erklärt auch <strong>den</strong><br />
Namen des Algorithmus: Sie ist eine Mersenne-Primzahl <strong>und</strong> einige Eigenschaften des<br />
Algorithmus resultieren aus dieser Eigenschaft. �<br />
In Abschnitt 7.2 haben wir einen Generator angeführt, der mit Fibonacci-Zahlen arbeitet.<br />
Ein oberflächliche Analyse könnte vortäuschen, dass er wesentlich bessere ” geometrische“<br />
Eigenschaften besitzt. Dem ist aber nicht so. Die geometrischen Unzulänglichkeiten<br />
zeigen sich bei der Darstellung von Tripeln im dreidimensionalen Raum sehr deutlich;<br />
siehe etwa [3].<br />
7.4 Statistische Tests<br />
Die erzeugten Zahlen können durch Tests auf ihre Gleichverteilung untersucht wer<strong>den</strong>.<br />
Ergenbisse solcher Tests sind üblichreweise Maßzahlen, die in naheliegender Weise als<br />
Qualitätsangabe interpretiert wer<strong>den</strong> können. Manchmal ist es möglich, solche Maßzahlen<br />
mathematisch herzuleiten. Man spricht dann von theoretischen Tests (im Gegensatz<br />
zu empirischen Tests). Tests, die in <strong>Gebrauch</strong> sind:<br />
• Chi-Quadrat-Test<br />
• Kolmogorov-Smirnov-Test<br />
• Poker-Test<br />
• Run-Test<br />
Im Allgemeinen führen erst Kombinationen von Tests zu aussagekräftigen Ergebnissen.<br />
Wir besprechen <strong>den</strong> Chi-Quadrat-Test etwas genauer, zu <strong>den</strong> übrigen machen wir ein<br />
paar Anmerkungen.<br />
Der von Karl Pearson um 1900 herum entwickelte Chi-Quadrat-Test (χ 2 -Test) ist<br />
eines der ältesten <strong>und</strong> mächtigsten Testverfahren der Statistik. In der einfachsten Form<br />
dient es der Prüfung der Verträglichkeit von beobachteten relativen Häufigkeiten – hier<br />
in einer Zufallsfolge – mit hypothetischen Wahrscheinlichkeiten. Er testet nach Zuordnung<br />
der erzeugten <strong>Zufallszahlen</strong> zu Kategorien, ob die Kategorie der einer gegebenen<br />
Verteilung, hier die Gleichverteilung, entsprechende Anzahl enthält.<br />
Bei dem Problem der Zufallsfolgen sind wir in der Praxis genötigt, einen endlichen<br />
Abschnitt zu testen. Wir teilen dazu die vorliegen<strong>den</strong> <strong>Zufallszahlen</strong> x i , i = 1, . . . , n ,<br />
in disjunkte Kategorien Kj, j = 1, . . . , l, die <strong>den</strong> Raum der möglichen <strong>Zufallszahlen</strong><br />
ausschöpfen, ein. Das Eintreten der Kategorie Kj unter der Annahme der Gleichverteilung<br />
sei durch die Wahrscheinlichkeit pj gegeben; kj sei die Anzahl der <strong>Zufallszahlen</strong>, die der<br />
Kategorie Kj angehören. Damit ist auch klar, dass<br />
k1 + · · · + kl = n<br />
gilt. Diese I<strong>den</strong>tität begründet auch, dass man (nur) von l − 1 Freiheitsgra<strong>den</strong> in der<br />
” Testanordnung“ spricht. Das Ziel ist ein Test der einfachen Hypothese<br />
H0 : pj = kj<br />
n<br />
gegen die Alternative<br />
<strong>für</strong> jedes j = 1, . . . , l<br />
Stand: 21. November 2011 71 ○c J. Baumeister, T.G. Macedo
H1 : pj �= kj<br />
n<br />
<strong>für</strong> ein j ∈ {1, . . . , l} .<br />
7.4 Statistische Tests<br />
Die auf Pearson zurückgehende Idee besteht nun darin, eine handhabare Testgröße anzugeben,<br />
die es gestattet, bei einer kritischen Größe die Hypothese H0 (mit Recht) abzulehnen.<br />
Diese Testgröße ist<br />
χ 2 l� (kj − npj)<br />
:=<br />
2<br />
;<br />
npj<br />
j=1<br />
man nennt sie die χ 2 -Statistik mit l − 1 Freiheitsgra<strong>den</strong>. Wie aus der Darstellung ersichtlich,<br />
erhalten ” seltene Kategorien“ eine hohe Gewichtung <strong>und</strong> der χ 2 -Wert ist umso<br />
größer, je stärker die Abweichung zwischen beobachteter <strong>und</strong> theoretischer Verteilung<br />
ist. Wenn er eine bestimmte Schranke c überschreitet, so verwirft man die Hypothese<br />
der Übereinstimmung beider Verteilungen. Wie üblich, gibt man sich ein Testniveau<br />
α > 0 (zugelassene Wahrscheinlichkeit <strong>für</strong> einen Fehler erster Art) vor <strong>und</strong> passt dann<br />
die kritische Größe c an. Es ist nun der Vorteil des χ 2 -Tests, dass c aus einer Tabelle in<br />
Abhängigkeit von der Anzahl der Freiheitsgrade (<strong>für</strong> große n) <strong>und</strong> α abgelesen wer<strong>den</strong><br />
kann; siehe etwa [38], Seite 259. Zum Beispiel findet man <strong>den</strong> Tabellenausschnitt<br />
α 0.01 0.05 0.25 0.5 0.75 0.95 0.99<br />
n = 11 3.053 4.575 7.584 10.34 13.70 19.68 24.72<br />
Beispiel 7.11 Betrachte die Bitkette der Länge 50:<br />
10101 00000 01111 01000 10001 01011 00110 01000 10001 00010 .<br />
Wir fin<strong>den</strong> 19 1-Bits <strong>und</strong> 31 0-Bits. Da bei einer unterstellten Gleichverteilung <strong>für</strong> das<br />
Auftreten eines 1-Bits mit der Wahrscheinlichkeit 1 zu rechnen ist, erhalten wir <strong>für</strong> <strong>den</strong><br />
2<br />
χ2-Wert: χ 2 (19 − 25)2<br />
= +<br />
25<br />
(31 − 25)2<br />
=<br />
25<br />
36 36<br />
+ = 2.88 .<br />
25 25<br />
Die Tabelle in [38] weist als kritischen Wert c = 2.71 <strong>für</strong> α := 0.1 <strong>und</strong> c = 3.84 <strong>für</strong><br />
α = 0.05 aus (Freiheitsgrad =1). Damit lehnen wir die Hypothese zu H0 im Fall α := 0.1<br />
ab <strong>und</strong> verwerfen H0 im Fall α := 0.05 nicht. �<br />
Eine gewisse Verfeinerung des Chi-Quadrat-Tests stellt der Kolmogorov-Smirnov-<br />
Test dar; er ist ein statistischer Test auf Übereinstimmung zweier Wahrscheinlichkeitsverteilungen.<br />
Ein weiteres Hilfsmittel der Statistik, Verteilungseigenschaften nachzuprüfen, sind so<br />
genannte Run-Tests. Hier wird etwa untersucht, ob die Anzahl <strong>und</strong> Länge gleichbleibender/aufsteigender<br />
Zahlenfolgen in Übereinstimmung mit der Gleichverteilung sind.<br />
Der Poker-Test betrachtet Gruppen zu je 5 aufeinanderfolgen<strong>den</strong> Zahlen <strong>und</strong> beobachtet,<br />
welches der folgen<strong>den</strong> 7 Muster – manchmal betrachtet man nur 5 Fälle – mit<br />
dem Quintupel übereinstimmt. Wir machen dies deutlich mit dem Alphabet {a,b,c,d,e} .<br />
Die Muster sind:<br />
Poker-Kombination Wort-Kombination Erwartete Häufigkeit<br />
Alle verschie<strong>den</strong> abcde 0.302<br />
Ein Paar aabcd 0.504<br />
Zwei Paare aabbc 0.108<br />
Drei Gleiche aaabc 0.072<br />
Full house aaabb 0.009<br />
Vier gleiche aaaab 0.0045<br />
Fünf gleiche aaaaa 0.0001<br />
Stand: 21. November 2011 72 ○c J. Baumeister, T.G. Macedo
7.5 Anwendung von <strong>Zufallszahlen</strong>: One-Time-Pad<br />
Auf diese Anzahlen wird ein Chi-Quadrat-Test angewendet, um herauszufin<strong>den</strong>, ob die<br />
empirische Verteilung in Übereinstimmung mit der Gleichverteilung ist.<br />
7.5 Anwendung von <strong>Zufallszahlen</strong>: One-Time-Pad<br />
Auf Gilbert Sandford Vernam (1890-1960) geht ein (symmetrisches) Verschlüsselungsverfahren<br />
zurück, das nachweislich nicht geknackt wer<strong>den</strong> kann, wenn es fehlerfrei eingesetzt<br />
wird, das One Time Pad oder Einmal-Block-Verfahren oder Einmalschlüssel-Verfahren.<br />
Der Amerikaner Joseph O. Mauborgne (1881-1971) setzte diese Idee um <strong>und</strong><br />
nannte das Verfahren ” One-Time Pad“. Kurz darauf arbeiteten auch die Deutschen Werner<br />
Kunze, Rudolf Schauffler <strong>und</strong> Erich Langlotz an dieser Methode. Sie schlugen im Jahr<br />
1921 vor, Blöcke, die mit zufällig erstellten Ziffern bedruckt waren, zur Verschlüsselung<br />
der damaligen diplomatischen Codes zu verwen<strong>den</strong>. Seit dieser Zeit bis zum heutigen<br />
Tag, speziell auch während der Zeit des Kalten Krieges, wird dieses Verfahren verwendet.<br />
Beispielsweise war der Heiße Draht (auch als das ” Rote Telefon“ bekannt), also die hochsichere<br />
direkte Fernschreibverbindung zwischen dem amerikanischen Präsi<strong>den</strong>ten <strong>und</strong> dem<br />
sowjetischen Generalsekretär, durch ein Einmalschlüssel-Verfahren geschützt. Was hat<br />
diese Tatsache mit dem Thema <strong>Zufallszahlen</strong> zu tun?<br />
Das One-Time-Pad ist ein sicheres Verfahren zum Verschlüsseln von Daten mit Hilfe<br />
eines Schlüssels, der <strong>Zufallszahlen</strong> benötigt. Ein Schlüssel besteht aus mehreren zufällig<br />
ausgewählten Zahlen zum Verschlüsseln von kleinen Datenmengen. Bei der Realisierung<br />
muss der Schlüssel mindestens so lang sein wie die Nachricht selbst <strong>und</strong> er muss zufällig<br />
sein. Außerdem darf er nur ein einziges Mal verwendet wer<strong>den</strong>, da er sonst geknackt<br />
wer<strong>den</strong> kann <strong>und</strong> er muss genauso lang sein wie der Klartext.<br />
Der Ursprungstext, oder auch Klartext genannt, der meist aus Buchstaben besteht,<br />
wird in Zahlen umgewandelt. Dazu gibt man jedem Buchstaben des Alphabets die Nummer<br />
(aus 1, 2, . . . , 26), gezählt vom Anfang A zum Ende Z: A entspricht 1, B entspricht<br />
2, . . . , Z entspricht 26. Um eine Botschaft der Länge n zu verschlüsseln, schreibt man zuerst<br />
die in n Zahlen umgewandelten Buchstaben nebeneinander <strong>und</strong> addiert danach <strong>den</strong><br />
Schlüssel, bestehend aus n zufällig ausgewählten Zahlen. Das Ergebnis ist der Chiffretext,<br />
der zufällige, verschlüsselte Text. Wenn das Ergebnius bei einer Addition größer als 26<br />
ist, errechnet man <strong>den</strong> Rest mod 26. Die neu erhaltenen Zahlen sind neue Buchstaben,<br />
die verschlüsselte Botschaft. Hier ist ein Beispiel:<br />
H A L L O<br />
8 1 12 12 15 Ursprungstext/Klartext<br />
+ 6 15 10 8 18 Schlüssel<br />
14 16 22 20 33 mod 26<br />
14 16 22 20 7 Chiffretext<br />
Beim Entschlüsseln benötigt man <strong>den</strong> Chiffretext <strong>und</strong> <strong>den</strong> Schlüssel. Man addiert zuerst<br />
zu 26 <strong>den</strong> Chiffretext <strong>und</strong> subtrahiert dann <strong>den</strong> Schlüssel vom Ergebnis. Danach rechnet<br />
man das Ergebnis mod 26. Dieses Verfahren muss man mit jedem einzelnen Buchstaben<br />
des Klartextes machen.<br />
(26-Chiffretext-Schlüssel) mod 26 = Klartext<br />
In obigem Beispiel bedeutet dies:<br />
Stand: 21. November 2011 73 ○c J. Baumeister, T.G. Macedo
7.5 Anwendung von <strong>Zufallszahlen</strong>: One-Time-Pad<br />
(26 + 14 − 6) mod 26 = 8 H<br />
(26 + 16 − 15) mod 26 = 1 A<br />
(26 + 22 − 10) mod 26 = 12 L<br />
(26 + 20 − 8) mod 26 = 12 L<br />
(26 + 33 − 18) mod 26 = 15 O<br />
Abschließend noch die Bemerkung, dass <strong>Zufallszahlen</strong> nicht nur beim Verschlüsselungsverfahren<br />
” One time pad“ eine Rolle spielen. Sie sind präsent in nahezu jeder Realisierung<br />
von Verschlüsselungsverfahren.<br />
Bibliographische Anmerkungen<br />
Die Generation von <strong>Zufallszahlen</strong> mit Hilfe von Kongruenzgeneratoren geht auf D.H.<br />
Lehmer zurück; siehe [55]. Detailierte Darstellungen findet man u.a. in [32, 36, 49] <strong>und</strong><br />
[Wor11]. Die Modifikation ” Inverse Kongruenzgenerator“ wird in [29] untersucht. Die Beurteilung<br />
von Generatoren wird beleuchtet in [35].<br />
Das One-Time-Pad ist ein sicheres Verfahren zum Verschlüsseln von kleinen Datenmengen;<br />
als Referenz siehe etwa [15] <strong>und</strong> [Ber06]. Weitere Literatur zu Themen der Kryptographie<br />
sind [6, 16, 23, 47, 80].<br />
Stand: 21. November 2011 74 ○c J. Baumeister, T.G. Macedo
8 Monte Carlo-Methode<br />
Monte Carlo Metho<strong>den</strong> sind extrem schlecht; sie sollten<br />
nur dann verwendet wer<strong>den</strong>, wenn sämtliche Alternativen<br />
noch schlechter sind<br />
Alan Sokal, 1997<br />
In diesem Kapitel stellen wir die Monte Carlo-Methode, die wir in einer speziellen<br />
Situation bei der Berechnung von Flächen im Abschnitt 3.4 schon vorgestellt haben,<br />
in allgemeinerem Rahmen dar. Der Begriff ” Monte Carlo Methode“ kennzeichnet nicht<br />
einen Algorithmus, sondern eine Gruppe von numerischen Metho<strong>den</strong>, die <strong>Zufallszahlen</strong> zur<br />
approximativen Lösung oder zur Simulation verschie<strong>den</strong>er Prozesse einsetzen. Der Einsatz<br />
erfordert auch, dass wir auch Erzeugungsmetho<strong>den</strong> <strong>für</strong> <strong>Zufallszahlen</strong> mit allgemeinerer<br />
Verteilung kennenlernen. Damit ist eine Begründung da<strong>für</strong> geliefert, das Thema der Monte<br />
Carlo-Metho<strong>den</strong> <strong>und</strong> Fragestellungen der Finanzmathematik hier anzuführen.<br />
8.1 Gr<strong>und</strong>idee der Monte Carlo-Methode<br />
Monte-Carlo-Simulation ist ein Verfahren aus der Stochastik/Statistik, bei dem sehr<br />
häufig durchgeführte Zufallsexperimente die Basis darstellen. Es wird dabei versucht,<br />
mit Hilfe der Wahrscheinlichkeitstheorie analytisch nicht oder nur aufwändig lösbare Probleme<br />
numerisch zu lösen. Als Gr<strong>und</strong>lage ist vor allem das Gesetz der großen Zahlen zu<br />
sehen.<br />
Monte Carlo-Metho<strong>den</strong> benutzen zur Simulation von realen Vorgängen <strong>Zufallszahlen</strong>.<br />
Die <strong>Zufallszahlen</strong> können entweder durch Würfeln real oder durch <strong>Zufallszahlen</strong>generatoren<br />
erzeugt wer<strong>den</strong>. Im Allgemeinen ist der Aufwand, zu guten Ergebnissen zu gelangen,<br />
groß. Wir wer<strong>den</strong> sehen, dass sie sich gerade in der Berechnung von Optionspreisen die<br />
Monte Carlo-Simulation auf Gr<strong>und</strong> ihrer großen Flexibilität bewähren; siehe unten.<br />
Hier geben wir einen allgemeinen Überblick über Monte Carlo-Verfahren. Als Entdecker<br />
der Monte Carlo–Simulation gilt de Buffon 44 , der als erster die Kreiszahl π durch <strong>den</strong><br />
Wurf einer Nähnadel auf eine karierte Tischdecke berechnete. Seine Idee war, dass über<br />
<strong>den</strong> zufälligen Winkel zwischen Nadel <strong>und</strong> parallelem Karomuster der Tischdecke die Zahl<br />
π steckt. Mit dem 10 000-maligen Wurf der Nadel konnte er so die Zahl π auf mehrere<br />
Stellen genau berechnen.<br />
Die genaue Herkunft der Bezeichnung <strong>für</strong> dieses Verfahren ist umstritten. Enrico Fermi<br />
hatte in <strong>den</strong> 1930er Jahren die ersten Ideen zu Monte-Carlo-Simulationen. Fest steht,<br />
dass der Begriff ” Monte Carlo“ wohl das erste Mal im zweiten Weltkrieg als Deckname<br />
<strong>für</strong> eine geheime Forschung im Bereich des amerikanischen Atomwaffenprogramms<br />
(Manhattan-Projekt/Neutronendiffusion), an dem J. v. Neumann <strong>und</strong> S. Ulam beteiligt<br />
waren, verwendet wurde. Vermutlich wurde der Name von einem 1862 in Monaco gegründeten<br />
Spielcasino abgeleitet.<br />
Die Verfahren nach der Monte Carlo-Methode weisen in der Regel folgende Charakteristik<br />
auf:<br />
• Sie sind häufig die einzige Simulationsmethode, die in vernünftiger Rechenzeit brauchbare<br />
Resultate liefert.<br />
• Unter Einsatz von mehr Rechenzeit ist Approximationsgüte <strong>für</strong> die Lösung systematisch<br />
verbesserbar.<br />
44 G.L.L. de Buffon, 1707-1788<br />
Stand: 21. November 2011 75 ○c J. Baumeister, T.G. Macedo
8.1 Gr<strong>und</strong>idee der Monte Carlo-Methode<br />
Sie dienen als Näherungsmetho<strong>den</strong> u.a. bei folgen<strong>den</strong> Problemgruppen:<br />
• Analytische Lösung von Problemen rein mathematischer Herkunft, wie z.B. die Approximation<br />
der Kreiszahl π mit Hilfe des Buffonschen Nadelproblems oder der<br />
zufälligen ” Beregnung“ eines Quadrats mit Zufallspunkten, um die Fläche des Einheitskreises<br />
zu berechnen (siehe Abschnitt 3.4).<br />
• Simulation von Modellen wie etwa zur Optionspreisberechnung; siehe unten.<br />
• Nachbildung von komplexen Prozessen, die nicht direkt analysiert wer<strong>den</strong> können,<br />
wie etwa von Wetter/Klima <strong>und</strong> soziologischen Phänomenen.<br />
• Aufgaben der statistischen Physik.<br />
Als Gr<strong>und</strong>lage ist vor allem das Gesetz der großen Zahlen zu sehen. Die Zufallsexperimente<br />
können entweder etwa durch ” Würfeln“ real durchgeführt wer<strong>den</strong> oder durch Erzeugung<br />
von geeigneten <strong>Zufallszahlen</strong>. Computergenerierte Vorgänge können <strong>den</strong> Prozess in ausreichend<br />
hoher Anzahl von Zufallsereignissen simulieren.<br />
Als Gesetze der großen Zahlen wer<strong>den</strong> bestimmte mathematische Sätze aus der Stochastik<br />
bezeichnet. In ihrer einfachsten Form besagen diese Sätze, dass sich die relative<br />
Häufigkeit eines Zufallsergebnisses in der Regel der Wahrscheinlichkeit dieses Zufallsergebnisses<br />
annähert, wenn das zu Gr<strong>und</strong>e liegende Zufallsexperiment immer wieder durchgeführt<br />
wird. Formal handelt es sich also um Konvergenzsätze <strong>für</strong> Zufallsvariablen, zumeist<br />
unterteilt in unterschiedliche Qualitäten der Konvergenz (stark (fast sichere Konvergenz)<br />
<strong>und</strong> schwach (Konvergenz in Wahrscheinlichkeit)).<br />
Diese (unterstellte) Gesetzmäßigkeit haben wir schon in vielen Variationen genutzt:<br />
beim Münz- <strong>und</strong> Reißzweckenwurf, bei der Approximation der Kreiszahl π . Die Wahrscheinlichkeit,<br />
dass eine Münze beim Werfen Kopf zeigt, betrage 1 . Je häufiger die Münze<br />
2<br />
geworfen wird, desto unwahrscheinlicher wird es, dass der Anteil der Würfe, bei <strong>den</strong>en<br />
Kopf erscheint (also die relative Häufigkeit des Ereignisses Kopf“), um mehr als einen<br />
”<br />
beliebigen vorgegebenen Wert von der theoretischen Wahrscheinlichkeit 1<br />
2<br />
abweicht. Da-<br />
gegen ist es durchaus wahrscheinlich, dass die absolute Differenz zwischen der Anzahl<br />
der Kopf-Würfe <strong>und</strong> der halben Gesamtzahl der Würfe anwächst. Insbesondere besagen<br />
diese Gesetze der großen Zahlen nicht, dass ein Ereignis, welches bislang nicht so häufig<br />
eintrat wie erwartet, seinen Rückstand“ irgendwann ausgleichen <strong>und</strong> folglich in Zukunft<br />
”<br />
häufiger eintreten muss. Beispielsweise bedeutet bei fünf Würfen ein Verhältnis von 3:1<br />
<strong>für</strong> Kopf <strong>und</strong> Zahl – Kopf hat gewissermaßen einen Vorsprung von 2 – sind die relativen<br />
Häufigkeiten 3<br />
4<br />
bzw. 1<br />
4<br />
gegeben. Nach 96 weiteren Würfen stellt sich ein Verhältnis von 51<br />
Mal Kopf zu 49 Mal Zahl ein. Der Vorsprung von Kopf ist also nach 100 Würfen genauso<br />
groß wie nach vier Würfen, jedoch hat sich der relative Abstand von Kopf <strong>und</strong> Zahl stark<br />
verringert, beziehungsweise – <strong>und</strong> das ist die Aussage des Gesetzes der großen Zahlen –<br />
der Unterschied der relativen Häufigkeit von Kopf zum Erwartungswert von Kopf. Der<br />
= 0.75 .<br />
Wert 51<br />
100<br />
= 0.51 liegt sehr viel näher beim Erwartungswert 0.5 als 3<br />
4<br />
Kommen wir zu einer Formulierung des Gesetzes der großen Zahlen. Es handelt von<br />
einer Folge von Zufallsvariablen (Zn)n∈N auf einem gemeinsamen Wahrscheinlichkeitsraum<br />
Ω mit Wahrscheinlichkeitsmaß P ; über die Fragen Ereignisraum Σ, Messbarkeit setzen wir<br />
uns hinweg. Die n-te Partialsumme dieser Folge von Zufallsvariablen ist die Zufallsvariable<br />
Sn := 1<br />
n<br />
Stand: 21. November 2011 76 ○c J. Baumeister, T.G. Macedo<br />
n�<br />
k=1<br />
Zk
8.2 Simulation der Normalverteilung<br />
<strong>und</strong> wir interessieren uns <strong>für</strong> das asymptotische Verhalten dieses arithmetischen Mittels,<br />
also <strong>für</strong><br />
S := lim<br />
n∈N Sn .<br />
In <strong>den</strong> geforderten Voraussetzungen bezüglich der Zufallsfolge (Zn)n∈N <strong>und</strong> der Qualität<br />
der Konvergenz unterschei<strong>den</strong> sich die verschie<strong>den</strong>en Varianten des Gesetzes der großen<br />
Zahlen. Wir geben ein Resultat an<br />
Satz 8.1 (Starkes Gestz der großen Zahlen) Die Zufallsvariablen Zn mögen alle <strong>den</strong><br />
Erwartungswert µ besitzen. Unter geeigneten Voraussetzungen gilt:<br />
P (lim n Sn = µ) = 1 (39)<br />
Die Konvergenz in (39) nennt man die fast sichere Konvergenz. Was unter ” geeignete<br />
Voraussetzungen“ gemeint ist, lassen wir hier offen <strong>und</strong> verweisen dazu auf die Literatur.<br />
Im Kapitel 2 haben wir das Galtonbrett kennengelernt. Aus der Art, wie sich die Fächer<br />
füllen, stellt einen Zusammenhang her zur Gaußschen Glockenkurve. Dies lässt sich auch<br />
analytisch bestätigen mit dem Ergebnis, dass die so genannte Binomialverteilung als<br />
eine gute Approximation der Normalverteilung angesehen wer<strong>den</strong> kann.<br />
8.2 Simulation der Normalverteilung<br />
Die Normalverteilung ist ein Verteilungsmodell <strong>für</strong> kontinuierliche Zufallsvariablen. Sie<br />
wurde ursprünglich von C.F. Gauß 45 zum Umgang mit Meßfehlern entwickelt mit deqq<br />
m der so genannten Gaußschen Fehlerkurve“. Die Normalverteilung unterstellt eine<br />
symmetrische Verteilungsform in Form einer Glocke, bei der sich die Werte der Zufallsvariablen<br />
in der Mitte der Verteilung konzentrieren <strong>und</strong> mit größerem Abstand zur Mitte<br />
immer seltener auftreten.<br />
Die Normalverteilung ist das wichtigste Verteilungsmodell der Statistik <strong>und</strong> wird <strong>für</strong><br />
unterschiedlichste Zwecke verwendet: u.a. als deskriptives Modell zur Beschreibung empirischer<br />
Variablen, als Stichprobenverteilung des arithmetischen Mittels oder als Näherungslösung<br />
<strong>für</strong> viele andere Verteilungsmodelle. Die Normalverteilung nimmt eine Sonderstellung<br />
unter <strong>den</strong> Verteilungen ein. Dies hängt mit <strong>den</strong> vielfältigen Anwendungen <strong>und</strong>,<br />
damit einhergehend, der Gültigkeit des Zentralen Grenzwertsatzes zusammen.<br />
Zur (numerischen) Beschreibung der Normalverteilung benötigen wir die Dichtefunktion.<br />
Sie ist gegeben durch<br />
f(x) := fµ,σ(x) := 1<br />
√ 2πσ e −(x−µ)2 /(2σ 2 ) , x ∈ R . (40)<br />
Wie ergeben sich nun daraus die Verteilungsfunktion einer Zufallsvariablen, die normalverteilt<br />
ist? Hier ist der Zusammenhang in Worten:<br />
Die Wahrscheinlichkeit, dass ein Experiment <strong>den</strong> Ausgang x zwischen a, b mit<br />
a < b hat, wird durch die Fläche unter dem Graphen der Dichtefunktion<br />
beschrieben.<br />
In mathematischen Termen lautet diese Formulierung etwa so: Ist Z eine Zufallsvariable,<br />
die normalverteilt ist mit Erwartungswert µ <strong>und</strong> Standardabweichung σ, so ergibt sich<br />
die Wahrscheinlichkeit, dass Z Werte zwischen a, b mit a < b annimmt durch<br />
P (a < Z ≤ b) =<br />
� z<br />
−∞<br />
fµ,σ(x)dx =<br />
45 Carl Friedrich Gauß, 1777-1855<br />
� z<br />
−∞<br />
1<br />
√ 2πσ e −(x−µ)2 /(2σ 2 ) dx = N (µ, σ)(−∞, b) . (41)<br />
Stand: 21. November 2011 77 ○c J. Baumeister, T.G. Macedo
Hierbei haben wir N (µ, σ) als Abbildung auf R × R zu verstehen.<br />
Wir müssen hier <strong>den</strong> Integralbegriff<br />
unterstellen,<br />
�<br />
nur soviel: das Integral<br />
z<br />
− fµ,σ(x)dx berechnet die Fläche unterhalb<br />
des Graphen von fµ,σ zwischen <strong>den</strong><br />
Grenzen −∞ <strong>und</strong> z .<br />
Man nennt <strong>den</strong> Spezialfall µ = 0, σ =<br />
1 die Standard-Normalverteilung.<br />
Da aus jeder Normalverteilung durch<br />
Verschiebung <strong>und</strong> Skalierung eine Standard-Normalverteilung<br />
gemacht wer<strong>den</strong><br />
kann, reicht es, die Standard-<br />
Normalverteilung zu untersuchen.<br />
In der Abbildung 23 liegt der Fall<br />
a = µ − σ, b = µ + σ<br />
8.2 Simulation der Normalverteilung<br />
Abbildung 23: Normalverteilung<br />
vor. Die Prozentzahl 68.3 besagt, dass<br />
die Wahrscheinlichkeit, dass der Ausgang eines Experiments mit einer Wahrscheinlichkeit<br />
von 0.683 im Intervall (µ − σ, µ + σ) liegt. Verbreitert man das Fenster um <strong>den</strong> Erwartungswert<br />
µ zu (µ − 2σ, µ + 2σ), so erhöht sich die Wahrscheinlichkeit auf 0.954 . Man<br />
kann <strong>den</strong> Spieß auch umdrehen <strong>und</strong> fragen, welche Umgebung (µ − zσ, µ + zσ) etwa zu<br />
einer Wahrscheinlichkeit von 0.95 führt; sie wird realisiert mit z ≈ 1.96 . In der Literatur<br />
findet man Tabellen, die diesen Zusammenhang zum Inhalt haben; siehe [38].<br />
Es gibt ein einfaches Verfahren, aus gleichverteilten <strong>Zufallszahlen</strong> Zahlen zu konstruieren,<br />
die nach einer Standard-Normalverteilung verteilt sind. Dies geht so:<br />
Seien x1, . . . , xn, . . . gleichverteilte, unabhängig voneinander erzeugter <strong>Zufallszahlen</strong> im<br />
Intervall [0, 1] . Wir setzen<br />
�<br />
12<br />
y :=<br />
n (x1 + · · · + xn − n<br />
) .<br />
2<br />
konstruiert man auf diese Weise <strong>Zufallszahlen</strong> y1, . . . , yl, . . . , so sind diese <strong>Zufallszahlen</strong><br />
standard-normalverteilt; der zentrale Grenzwertsatz liefert <strong>den</strong> Beweis dazu. In der<br />
Praxis arbeitet man mit n = 12 . Diese Methode hat u.a. <strong>den</strong> Nachteil, dass <strong>für</strong> eine<br />
” normalverteilte Zufallszahl“ 12 gleichmäßig verteilte <strong>Zufallszahlen</strong> benötigt wer<strong>den</strong>.<br />
Seien X1, . . . , Xn gleichverteilte, unabhängige Zufallsgrößen auf dem Intervall [0, 1] .<br />
Wir wissen, dass der Erwartungswert einer gleichmäßig verteilten Zufallsgröße gleich 1/2<br />
<strong>und</strong> die Varianz gleich 1 ist. Wir setzen<br />
12<br />
�<br />
12<br />
Y :=<br />
n (X1 + · · · + Xn − n/2)<br />
<strong>und</strong> damit gilt<br />
E(Y ) =<br />
<strong>und</strong> in analoger Rechnung<br />
� 12<br />
n (<br />
n�<br />
E(Xi) − n/2) =<br />
i=1<br />
� 12<br />
n (<br />
n�<br />
i=1<br />
V(Y ) = 12<br />
n V<br />
�<br />
n�<br />
�<br />
Xi − n/2 = 1 .<br />
i=1<br />
1<br />
− n/2) = 0<br />
2<br />
Stand: 21. November 2011 78 ○c J. Baumeister, T.G. Macedo
8.3 Simulation der Aktienkurse<br />
Beachte V ( � n<br />
i=1 Xi) = � n<br />
i=1 V(Xi) auf Gr<strong>und</strong> der Tatsache, dass X1, . . . , Xn als unabhängig<br />
angenommen wur<strong>den</strong>. Der zentrale Grenzwertsatz besagt, dass Y eine Standard-<br />
Normalverteilung approximiert. In der Praxis wählt man n = 12 .<br />
Die eben beschriebene Methode hat u.a. <strong>den</strong> Nachteil, dass <strong>für</strong> eine ” normalverteilte<br />
Zufallszahl“ 12 gleichmäßig verteilte <strong>Zufallszahlen</strong> benötigt wer<strong>den</strong>. Ein besseres Verfahren<br />
ist das Box-Muller-Verfahren, das wir hier aber mathematisch nicht darstellen<br />
<strong>und</strong> begrün<strong>den</strong> können, da es tiefere Ergebnisse der Analysis schon in der Beschreibung<br />
erfordert. Wir geben es allerdings algorithmisch an. 46<br />
Algorithm 3 Box-Muller-Algorithmus<br />
EIN Zwei gleichverteilte Zufallsgrößen U1, U2 .<br />
Schritt 1 Setze θ := 2πU2 , ρ := � −2 ln(U1) .<br />
Schritt 2 Setze Z1 := ρ cos(θ) , Z2 := ρ sin(θ) .<br />
AUS Z1, Z2 sind unabhängige standard-normalverteilte Zufallsgrößen.<br />
Der Algorithmus ist numerisch recht aufwändig, da Wurzeln, trigonometrische Funktionen<br />
<strong>und</strong> der Logarithmus ausgewertet müssen. Die Polar-Methode von Marsaglia <strong>und</strong><br />
Bray ([60]) entledigt sich der trigonometrischen Funktionen.<br />
Algorithm 4 Marsaglia’s Polar-Methode<br />
EIN Zwei gleichverteilte Zufallsgrößen U1, U2 .<br />
Schritt 1 Setze Vi := 2Ui − 1 solange W := V 2<br />
1 + V 2<br />
2 < 1 .<br />
� �<br />
−2 ln(W )/W , Z2 := V2 −2 ln(W )/W .<br />
Schritt 2 Setze Z1 := V1<br />
AUS Z1, Z2 sind standard-normalverteilte Zufallsgrößen.<br />
Die Idee <strong>für</strong> die Approximation der Kreisfläche aus Abschnitt 3.4 ordnet sich hier<br />
ein. Wir legen über <strong>den</strong> Graphen der Dichte der Standard–Normalverteilung ein hinreichend<br />
breites Rechteck [−a, a] × [0, 1]; hinreichend meint, dass außerhalb des Intervalls<br />
[−a, a] die Werte der Dichte ” klein“ sind. Dann erzeugen wir N gleichverteilte Punkte<br />
(x1, y1), . . . , (xN, yN) ∈ [−a, a]×[0, 1] <strong>und</strong> akzeptieren davon die Punkte (˜x1, ˜y1), . . . , (˜xl, ˜yl),<br />
die innerhalb der Fläche des Graphens der Dichte zu liegen kommen. Die Punkte ˜x1, . . . , ˜xl<br />
sind dannn nahezu standard-normalverteilt. Diese so genannte Wegwerfmethode geht<br />
auf J. von Neumann (1951) zurück.<br />
8.3 Simulation der Aktienkurse<br />
Bevor wir über Optionen oder allgemein über Finanzderivate re<strong>den</strong> können, sollten wir<br />
über die ’ Zutaten“ re<strong>den</strong>, die hauptsächlich benötigt wer<strong>den</strong>: Aktien, Wertpapiere, Geldanlagen,<br />
Marktannahmen.<br />
46 Die trigonometrischen Funktionen sin, cos sollten hier zumindest ” tafelmäßig bekannt sein.<br />
Stand: 21. November 2011 79 ○c J. Baumeister, T.G. Macedo
Aktien<br />
8.3 Simulation der Aktienkurse<br />
Eine Aktie ist ein Anteil am Gr<strong>und</strong>kapital einer Gesellschaft <strong>und</strong> eine Urk<strong>und</strong>e, die dem<br />
Inhaber seine Rechte verbrieft. 47 Eine Aktiengesellschaft erhält durch <strong>den</strong> Verkauf von<br />
Anteilen des Unternehmens Kapital in Höhe des Aktienpreises, das im Gegensatz zum<br />
Kredit nicht zurückgezahlt wer<strong>den</strong> muss. Als Kompensation erhält der Aktionär/Aktienkäufer<br />
Anspruch auf Einbeziehung bei Divi<strong>den</strong><strong>den</strong>zahlungen, spezielle Bezugsrechte <strong>und</strong><br />
Mitbestimmungsrechte. Aktienausgaben stellen <strong>für</strong> Unternehmen alternative Quellen zur<br />
Fremdfinanzierung am Finanzmarkt dar.<br />
Die Erträge von Aktien sind in der Regel höher als risikolose Geldanlagen, sie sind<br />
aber auch mit höheren Risko behaftet. Das Risiko besteht darin, dass Aktien im Preis<br />
schwanken, an Wert verlieren können, ja sogar wertlos wer<strong>den</strong> können, wenn die Aktiengesellschaft<br />
ihre ” Existenz“ verliert. Die Risikoeinschätzung geht ein in die Einteilung<br />
nach ihrer Qualität:<br />
Blue Chips Aktien erstklassiger Unternehmen mit sehr guter Marktposition <strong>und</strong> Erfolg.<br />
Zyklische Aktien Aktien, die sehr stark konjunkturabhängig sind (Autowerte, Bauunternehmen,.<br />
. . ).<br />
Nebenwerte Aktien kleinerer <strong>und</strong> mittlerer Unternehmen mit heftigeren Kursbewegungen.<br />
Penny Stocks Extrem risikoreiche Aktien, deren Wert im ” Penny“–Bereich liegen.<br />
Aktien wer<strong>den</strong> hauptsächlich an <strong>den</strong> Börsen gehandelt. Ihre Kurswerte sind jedem<br />
” Kapitalinvestor“, insbesondere in Internetzeiten, zugänglich. Die Gründe <strong>für</strong> die Veränderung<br />
der Aktienkurse sind zum Teil objektiver Natur, zum Teil aber sehr schwer zu<br />
durchschauen. Beobachtet man die Kursentwicklung einer Aktie, so stellt man fest, dass<br />
sich meist zwei Effekte überlagern: langfristig bestimmender Trend <strong>und</strong> kurzfristige<br />
Einflüsse. Diese Erkenntnis wird im Allgemeinen durch je<strong>den</strong> Kursverlauf zumindest über<br />
bestimmte Zeiträume bestätigt.<br />
Festverzinsliche Wertpapiere<br />
Ein Wertpapier ist eine Urk<strong>und</strong>e, die ein Vermögensrecht verbrieft, etwa die Miteigentümerschaft<br />
an einem Unternehmen. Wertpapiere sind zum Beispiel Aktien, Anleihen,<br />
Schecks <strong>und</strong> Wechsel. Börsenfähige Wertpapiere wer<strong>den</strong> als Effekten bezeichnet.<br />
Unter festverzinslichen Wertpapieren (Kupon-Anleihen/Bonds) versteht man<br />
Kapitalanlagen, bei <strong>den</strong>en der Zinssatz über die gesamte Laufzeit völlig gleich bleibt <strong>und</strong><br />
schon im Vorhinein festgelegt wird, so dass der Anleger hiermit eine völlig risikofreie<br />
Geldanlage eingeht. Die Rendite, also das Verhältnis der Auszahlungen zu <strong>den</strong> Einzahlungen<br />
der Anlage, steht dabei also schon vor Ablauf der Vertragszeit genau fest. Der<br />
große Vorteil bei dieser Anlageform ist neben der Verlustsicherheit auch die Sicherheit bei<br />
der Planung. So weiß der Anleger stets ganz genau, welche Rendite er in welcher Zeit zu<br />
erwarten hat.<br />
Als festverzinsliche Wertpapiere wer<strong>den</strong> meistens Anleihen wie zum Beispiel Schuldverschreibungen<br />
ausgegeben. Sie dienen Staaten, <strong>Institut</strong>ionen <strong>und</strong> Unternehmen zur Fremdfinanzierung.<br />
Im Gegensatz zu Aktien, durch die der Investor Eigentümer wird, sind die<br />
Käufer festverzinslicher Wertpapiere Gläubiger <strong>und</strong> haben als solche nur Anspruch auf<br />
Zinsen <strong>und</strong> Tilgung des Anleihekapitals. Wir verwen<strong>den</strong> festverzinsliche Anleihe“ oder<br />
”<br />
” festverzinsliche Geldanlage“ synonym <strong>für</strong> festverzinsliches Wertpapier.<br />
47actio (lat.)= Handlung, übertragen einklagbarer Anspruch.<br />
”<br />
Stand: 21. November 2011 80 ○c J. Baumeister, T.G. Macedo
8.3 Simulation der Aktienkurse<br />
Regel 8.2 (Verzinsung) Der Wert B(t) eines festverzinslichen Wertpapiers vom Betrage<br />
B(0) mit einem jährlichen Zinssatz r beträgt nach t Jahren<br />
• bei einmaliger Verzinsung pro Jahr: B1(t) = B(0)(1 + r) t<br />
• bei m-maliger Verzinsung pro Jahr: Bm(t) = B(0)(1 + r<br />
m )tm<br />
• bei kontinuierlicher Verzinsung: B∞(t) = B(0)e rt<br />
Die Formel <strong>für</strong> B∞ folgt als Grenzwert: B∞(t) := limm→∞ Bm(t) .<br />
Unter Diskontierung (Abzinsung) versteht man <strong>den</strong> zur Verzinsung umgekehrten<br />
Vorgang.<br />
Regel 8.3 (Diskontierung) Der Wert B(0) eines festverzinslichen Wertpapiers vom<br />
Betrage B(t) zur Zeit t mit einem jährlichen Zinssatz r beträgt<br />
• bei m-maliger Verzinsung pro Jahr: B(0) = B(t)(1 + r<br />
m )−tm<br />
• bei kontinuierlicher Verzinsung: B(0) = B(t)e −rt<br />
Approximation der Aktienkurse<br />
Die Preisänderungen auf <strong>den</strong> Finanzmärkten sind eigentlich keine stetigen Prozesse: es<br />
gibt üblicherweise kleinste Geldeinheiten, um welche die Preisänderungen mindestens von<br />
Statten gehen müssen (also stückweise stetig). Zum anderen ändert sich der Preis nicht<br />
permanent, sondern bleibt während einer gewissen kurzen Zeit konstant. Man hat also<br />
in der Realität Prozesse, welche stückweise stetig sind <strong>und</strong> auf diesen stetigen Zwischenstücken<br />
sind sie erst noch konstant (Treppenfunktionen)! Andererseits sind diese<br />
Preisänderungen normalerweise derart häufig <strong>und</strong> die Änderungen im Vergleich zum ganzen<br />
Preis derart klein, dass je nach Problemstellung doch ein Prozess in stetiger Zeit <strong>und</strong><br />
mit stetigem Zustandsraum angebracht ist. Als weiterer Vorteil kommt noch dazu, dass<br />
wir in <strong>den</strong> Modellen stetiger Zeit explizitere Formeln erhalten als in <strong>den</strong> Modellen in<br />
diskreter Zeit. Trotz alledem, wir skizzieren im Folgen<strong>den</strong> die Approximation der Aktienkurse<br />
in diskreter Zeit, leiten diese allerdings aus einem kontinuierlichen Modell ab, dem<br />
so genannten Black–Scholes–Modell.<br />
Die Brownsche Bewegung, die zentral in der Modellierung der Aktienkurse ist,<br />
wird in der Physik zur Modellierung der Bewegung eines Teilchens (Molekül) in einer<br />
Flüssigkeit oder einem Gas eingesetzt; die Bewegung kommt dann durch Zusammenstöße<br />
von Molekülen zustande. Die Brownsche Bewegung nennt man auch Wiener-Prozess.<br />
Der Name ” Brownsche Bewegung“ stammt vom schottischen Botaniker Brown 48<br />
Aktienkurse haben die Ten<strong>den</strong>z zu steigen“. Dadurch wer<strong>den</strong> auch die Ausschläge<br />
”<br />
nach oben <strong>und</strong> nach unten immer größer. Deshalb macht es Sinn, die relativen Zuwächse<br />
zu betrachten. Es ist nun die Gr<strong>und</strong>annahme, dass sich die so genannten Log-returns<br />
� �<br />
St+∆t − St<br />
ln<br />
additiv aus einem deterministischen Term, der <strong>für</strong> die ” makroskopische Drift“ zuständig<br />
ist, <strong>und</strong> einen stochastischen Term, der <strong>für</strong> die ” unvorhersagbaren Ausschläge“ verantwortlich<br />
ist. 49 Dabei ist ∆t ein (kleiner) Zeitschritt.<br />
Unter <strong>den</strong> folgen<strong>den</strong> Annahmen (<strong>und</strong> weiteren stochastischen Gr<strong>und</strong>voraussetzungen)<br />
48 Brown, R., 1773-1858. Die Herkunft des Namens wird zwar korrekterweise meist mit<br />
Brown in Verbindung gebracht, die Geschichte der Herkunft des Namens findet sich auf<br />
http://www.sciences.demon.co.uk/wbbrowna.htm.<br />
49 Dieses Modell <strong>für</strong> die Bewertung von Optionen geht auf P. Samuelson (1915-2009) zurück; siehe [74].<br />
Er erhielt 1970 <strong>den</strong> Nobelpreis <strong>für</strong> Wirtschaftswissenschaften.<br />
Stand: 21. November 2011 81 ○c J. Baumeister, T.G. Macedo<br />
St
8.4 Simulation von Optionen<br />
• das Basisobjekt hat eine konstante Volatilität σ, d.h. die Varianz der Renditen<br />
wächst wie σ2O(∆t) . � �<br />
∆St<br />
V = σ 2 O(∆t) ;<br />
siehe unten.<br />
St<br />
• die Renditen sind normalverteilt, also<br />
∆St<br />
St<br />
∼ N (µ∆t, σ √ ∆) ,<br />
können wir das Modell so hinschreiben:<br />
� �<br />
St+∆t<br />
ln ∼ N ((µ − 1<br />
2 σ2 )∆t, σ √ ∆) .<br />
St<br />
Wir diskretisieren nach der expliziten Euler-Methode, welche im Zusammenhang<br />
mit stochastischen Differentialgleichungen das Verfahren von Euler-Maruyama heißt.<br />
Die auftreten<strong>den</strong> infinitesimalen Inkremente wer<strong>den</strong> dabei durch finite Zuwächse ersetzt.<br />
Dazu wählen wir ein Zeitgitter 0 = t0 < t1 < · · · < tN = T <strong>und</strong> führen die Bezeichnungen<br />
∆tj := tj+1 − tj, Sj := Stj<br />
ein. Damit stellt sich das Diskretisierungsverfahren so dar:<br />
Sj+1 = Sj + µ∆tj + σ 2 �<br />
zj ∆tj , j = 0, . . . , N − 1 . (42)<br />
Dabei ist zj jeweils eine Zufallszahl, die standard-normalverteilt ist.<br />
Algorithm 5 Simulation mit dem Euler–Maruyama-Verfahren<br />
EIN Zeitgitter 0 = t0 < t1 < · · · < tN = T . ∆j := tj+1 − tj , j = 0, . . . , N − 1 .<br />
Volatilitätskonstante σ, Driftterm µ, Basiskurs S0 zur Zeit t = 0 .<br />
Mechanismus zur Erzeugung von standard-normal-verteilten <strong>Zufallszahlen</strong>.<br />
Schritt 1 Für k = 0, . . . , N − 1:<br />
• erzeuge eine Zufallszahl u k ;<br />
• setze Sk+1 := Sk + µ∆j + ujσ 2� ∆j<br />
AUS Diskrete Approximation S0, . . . , SN des Aktienkurses in [0, T ] .<br />
8.4 Simulation von Optionen<br />
Optionen<br />
Eine europäische call option ermöglicht dem Besitzer einen Finanztitel zu einem bestimmten<br />
Zeitpunkt (maturity) zu einem bestimmten Preis (strike price) zu erwerben.<br />
Zu beachten ist, dass hier nur die Möglichkeit eingeräumt wird, jedoch muss der Besitzer<br />
dieser Option sie nicht wahrnehmen.<br />
Betrachten wir nun einen Investor der eine call option <strong>für</strong> IBM Aktien mit einem strike<br />
price von 100 $ kauft. Der aktuelle Aktienpreis liegt bei 98 $, die Laufzeit beträgt 2 Monate<br />
<strong>und</strong> der Preis der call Option ist 5 $. Falls die Aktie nach Ende der Laufzeit weniger als<br />
Stand: 21. November 2011 82 ○c J. Baumeister, T.G. Macedo
8.4 Simulation von Optionen<br />
100 $ wert ist, wird der Investor seine Option sicher nicht einlösen. (Es wäre wohl sinnlos<br />
eine Aktie welche weniger als 100 $ wert ist um 100 $ zu kaufen!). In diesem Fall verliert<br />
der Investor sein ursprüngliches Investitionskapital von 5 $. Falls der Aktienpreis nun<br />
z.B. bei 115 $ liegt, wird er von seinem Kaufrecht um 100 $ jedoch sicherlich <strong>Gebrauch</strong><br />
machen. Er macht somit 15 15 -5 $, also 10 $ Reingewinn (net profit).<br />
Eine Option ist ein Vertrag, der seinen Besitzer (Inhaber der Option) das<br />
Recht einräumt, eine bestimmte Menge eines bestimmten Gutes (Basisobjekt)<br />
zu einem festgelegten Preis, dem Ausübungspreis (strike) zu kaufen<br />
(Call, Kaufoption) bzw. zu veräußern (Put, Verkaufsoption). Für dieses<br />
Recht zahlt der Käufer der Option dem Verkäufer eine Prämie, <strong>den</strong> Optionspreis.<br />
Wer eine Kaufoption (Call Option) besitzt, hat das Recht (aber nicht die Pflicht!)<br />
einen in der Option beschriebenen Basiswert (Aktie, Währung, . . . ) zu einem im voraus<br />
bestimmten fixen Preis, dem Ausübungspreis zu kaufen. Wer eine Verkaufsoption<br />
(Put Option) besitzt, hat das Recht (aber nicht die Pflicht!) einen in der Option beschriebenen<br />
Basiswert (Aktie, Währung, . . . ) zu einem im voraus bestimmten fixen Preis,<br />
dem Ausübungspreis, verkaufen. Wer eine Option kauft, der hat eine Long-Position.<br />
Wer eine Option verkauft, der hat eine Short-Position. Es wer<strong>den</strong> vorwiegend amerikanische<br />
Optionen gehandelt!<br />
Bewertung von Optionen<br />
Wir betrachten ein Optionsgeschäft <strong>für</strong> Aktien. Es werde mit V der Optionspreis, mit<br />
St der Kurs des Basisobjekts zur Zeit t, mit T die Laufzeit, mit K der Ausübungspreis<br />
<strong>und</strong> mit ST der Kurs der Aktie (Basiswert) am Fälligkeitstag bezeichnet. Ist ST > K<br />
(die Option ist ” in the money“), so kann der Besitzer der Option die Aktie zum Preis<br />
K erwerben <strong>und</strong> sofort zum höheren Preis ST am Markt verkaufen. Er erzielt dann eine<br />
Auszahlung (payoff) in Höhe von ST − K (unter Vernachlässigung von Transaktionskosten).<br />
Ist ST < K (die Option ist ” out of the money“), so lässt der Besitzer der Option<br />
sein Recht verfallen, selbst wenn er Interesse am Kauf dieser Aktie hätte. Es ist nämlich<br />
dann günstiger, die Aktie am Markt zum Preis ST zu erwerben. In diesem Fall ist die<br />
Auszahlung <strong>für</strong> die Option gleich Null. Der Fall ST = K (die Option ist ” at the money“),<br />
ist eine Situation, die wie der Fall ST < K zu behandeln ist.<br />
Zusammengefasst ergibt sich <strong>für</strong> <strong>den</strong> Besitzer der Option eine ” Auszahlung“ zum Zeitpunkt<br />
T in Höhe von<br />
(ST − K) +<br />
wobei h + := h, falls h ≥ 0, h + := 0, falls h < 0 ist.<br />
Aus <strong>den</strong> obigen Ausführungen können wir schließen, dass eine Option <strong>ihrem</strong> Besitzer<br />
eine nichtnegative Auszahlung zusichert, die in ihrer Höhe allerdings unsicher ist. Daher ist<br />
es verständlich, dass man <strong>für</strong> <strong>den</strong> Erwerb einer Option eine Zahlung, die Optionsprämie,<br />
leisten muss. Die Auszahlung ist also um <strong>den</strong> Wert der Optionsprämie zu mindern, genauer<br />
um <strong>den</strong> verzinsten Wert der Optionsprämie, um <strong>den</strong> Gewinn/Verlust zu ermitteln.<br />
Hier haben wir ein Optionsgeschäft beschrieben, das man europäisch nennt. Bei einem<br />
amerikanischen Optionsgeschäft kann man zu jedem Zeitpunkt in [0, T ] entschei<strong>den</strong>,<br />
ob man das Recht ausüben will. Es ist offensichtlich, dass <strong>für</strong> eine amerikanische Option<br />
eine höhere Optionsprämie zu entrichten sein sollte, bietet sie doch mehr Rechte.<br />
Stand: 21. November 2011 83 ○c J. Baumeister, T.G. Macedo
Das Ein-Perio<strong>den</strong>-Modell<br />
8.4 Simulation von Optionen<br />
Das Problem im (seriösen) Optionshandel ist, die Optionsprämie zu berechnen, d.h. <strong>den</strong><br />
Preis der Option zum Zeitpunkt t = 0 festzusetzen, <strong>und</strong>, um <strong>den</strong> Handel mit der Option,<br />
solange sie noch nicht ausgeübt ist, zu ermöglichen, zu jedem Zeitpunkt t <strong>den</strong> Wert<br />
der Option zu bestimmen. Die Schwierigkeit besteht darin, dass man <strong>den</strong> Verlauf des<br />
Aktienkurses über <strong>den</strong> Laufzeitraum nicht kennt.<br />
Wir machen uns die Problematik an einem einfachen Modell klar, dem sogenannten<br />
Ein-Perio<strong>den</strong> -Binomialmodell. Zur Frage der Festsetzung des Optionspreises wird ein<br />
Wertpapierdepot, auch Portfolio genannt, gebildet, das folgendermaßen zusammenzusetzen<br />
ist:<br />
Aktiendepot der betreffen<strong>den</strong> Aktie, festverzinsliche Anleihe.<br />
Es ist nicht überraschend, dass nun Anleihen ins Spiel kommen, müssen doch die Aktien<br />
bzw. die Optionsprämie finanziert wer<strong>den</strong>.<br />
Wir kaufen also einen Bruchteil 50 ∆ der Aktie auf, <strong>und</strong> finanzieren die Geschäfte durch<br />
die Aufnahme eines Kredits B. Zum Zeitpunkt T = 1 verfalle die Option, deren Preis wir<br />
ermitteln wollen, d.h. T = 1 ist die Laufzeit. Diesen Preis setzen wir dann als Wert<br />
des Depots zum Zeitpunkt t = 0 fest, dessen quantitative Zusammensetzung wir noch<br />
nicht kennen, da ∆ <strong>und</strong> B noch unbekannt sind. Man spricht bei diesem Vorgehen von<br />
einer Duplikationsstrategie. Dabei ist es notwendig, neben <strong>den</strong> angegebenen Daten die<br />
Verzinsung <strong>für</strong> risikolose Geldaufnahmen <strong>und</strong> Geldanlagen zu kennen.<br />
Im weiteren wird angenommen, dass der konstante Zinssatz <strong>für</strong> risikofreie Anlagen <strong>für</strong><br />
eine Periode am Markt r ist, dass der Aufzinsungsfaktor bei einmaliger Verzinsung also<br />
gerade z := 1 + r ist. Offen ist die Kursentwicklung der Aktie. Das einstufige Binomialmodell<br />
besteht nun darin, anzunehmen, dass der Kurs der Aktie mit Wahrscheinlichkeit q<br />
auf <strong>den</strong> Wert uS0 steigt <strong>und</strong> mit Wahrscheinlichkeit 1 − q auf <strong>den</strong> Wert lS0 fällt; also<br />
u > 1, 0 < l ≤ 1 . Das Diagramm 24 gibt die Entwicklung des Portfolios wieder. Dabei<br />
gehen wir davon aus, dass lS0 ≤ K ≤ uS0 gilt (um hier anderen Annahmen über <strong>den</strong><br />
Markt aus dem Wege zu gehen). Die Optionsprämie wird nun so festgesetzt, dass<br />
Endwert des Duplikationsdepots = Auszahlungswert der Option<br />
erfüllt ist. Dies führt auf zwei Gleichungen <strong>für</strong> die Unbekannten ∆ <strong>und</strong> B :<br />
Hieraus folgt:<br />
l∆S0 − zB = 0 , u∆S0 − zB = uS0 − K .<br />
∆ = uS0 − K<br />
, B =<br />
(u − l)S0<br />
l(uS0 − K)<br />
.<br />
(u − l)z<br />
Nun ist die Zusammensetzung des äquivalenten Portfolios bekannt <strong>und</strong> die Optionsprämie<br />
C0 berechenbar:<br />
C0 = ∆S0 − B .<br />
Beachte: Die Wahrscheinlichkeit q geht gar nicht ein.<br />
Das obige einstufige Modell ist nur von theoretischem Wert. Ersetzt man nun die einmalige<br />
Preisänderung der Aktien durch eine endliche Anzahl n von Änderungen im Zeitraum<br />
[0, T ] kommt man einer kontinuierlicher Preisänderung schon nahe; die Analyse des<br />
50 In der Wirklichkeit erwirbt man ein Paket von Optionen, die Anzahl der aufzukaufenen<strong>den</strong> Aktien<br />
wird dann auch eine ganze Zahl.<br />
Stand: 21. November 2011 84 ○c J. Baumeister, T.G. Macedo
8.4 Simulation von Optionen<br />
Portfoliobewegung Wert des Portfolios Wert des Portfolios<br />
t = 0 T = 1<br />
Aktie kaufen, t = 0 ∆S0 l∆S0 u∆S0<br />
Anleihe aufnehmen, t = 0 −B −zB −zB<br />
Summe ∆S0 − B l∆S0 − zB u∆S0 − zB<br />
Beachte die Annahme S0 ≤ K ≤ uS0<br />
Abbildung 24: Duplikationsstrategie<br />
Auszahlung<br />
T = 1<br />
0 uS0 − K<br />
Modells birgt keine neuen Schwierigkeiten, nur der Aufwand wird größer. Dieses so entstehende<br />
so genannte n-Perio<strong>den</strong>-Modell wird Cox-Ross-Rubinstein-Modell (1979)<br />
genannt.<br />
Wir wollen nun Annahmen über <strong>den</strong> zugr<strong>und</strong>eliegen<strong>den</strong> Finanzmarkt anführen. Sie gilt<br />
es immer im Auge zu behalten, wenn man Diskrepanzen zwischen Modell <strong>und</strong> Wirklichkeit<br />
diskutieren will 51 .<br />
Marktannahmen <strong>und</strong> Marktbegriffe<br />
Regel 8.4 ( ” Geschäftsbedingungen“)<br />
• Alle Investoren haben <strong>den</strong> selben Informationsstand <strong>und</strong> können verzögerungsfrei<br />
handeln,<br />
• Investoren handeln rational <strong>und</strong> ziehen ein größeres Vermögen einem kleineren vor,<br />
• es wer<strong>den</strong> keine Transaktionskosten <strong>und</strong> Steuern berücksichtigt,<br />
• der Wertpapier– bzw. Optionshandel ist zu jedem Zeitpunkt möglich,<br />
• Leerverkäufe (Verkauf eines Basiswertes, <strong>den</strong> man noch nicht besitzt, aber später<br />
liefert) sind möglich,<br />
• gewünschte Transaktionen können in beliebigem Umfang ohne Rückwirkungen auf<br />
die Kursentwicklung durchgeführt wer<strong>den</strong>,<br />
• Wertpapiere sind beliebig teilbar,<br />
• Wertpapiere stehen in beliebiger Menge zur Verfügung (Liquidität),<br />
• die Verzinsung <strong>für</strong> festverzinsliche Anleihen <strong>und</strong> Geldanlagen erfolgt nach demselbem<br />
Zinssatz. Zusätzlich vereinbaren wir eine kontinuierliche Verzinsung (eine Vereinbarung,<br />
die nicht zwingend wäre, beachte aber, dass daraus quantitative Konsequenzen<br />
sich ergeben).<br />
Regel 8.5 (Arbitragefreiheit) Der Markt lässt keine Arbitragemöglichkeiten zu.<br />
Regel 8.6 (Modellierbarkeit) Der Markt, bestehend aus Wertpapieren, Anleihen, Optionen,<br />
. . . kann durch ein Modell abgebildet wer<strong>den</strong>.<br />
51 Der Zoologe Thomas Huxley schreibt: Die Tragödie der Wissenschaft - das Erschlagen einer schönen<br />
Hypothese durch eine hässliche Tatsache<br />
Stand: 21. November 2011 85 ○c J. Baumeister, T.G. Macedo
8.4 Simulation von Optionen<br />
Unter einem Leerverkauf (short selling) versteht man eine Handelsstrategie, bei<br />
der ein Teilnehmer am Finanzgeschehen (Investor) Objekte, die er nicht besitzt, verkauft<br />
<strong>und</strong> sie später zurückkauft. 52<br />
Eine Arbitragemöglichkeit ist eine Handelsstrategie, die keine Anfangsinvestitionen<br />
benötigt <strong>und</strong> mit positiver Wahrscheinlichkeit einen Gewinn ergibt, ohne das Risiko eines<br />
Verlustes zu beinhalten. Etwas formaler:<br />
Sei I(t) die Entwicklung des Vermögens eines Investors über <strong>den</strong> Zeitraum<br />
[0, T ] . Man sagt, dass eine Arbitragemöglichkeit <strong>für</strong> <strong>den</strong> Investor besteht,<br />
falls es möglich ist, dass er mit dem Vermögen I(0) startet <strong>und</strong> <strong>für</strong> sein Endvermögen<br />
I(T )<br />
I(T ) ≥ I(0) , Wahrscheinlichkeit({I(T ) > I(0)}) > 0<br />
gilt. Hierbei wird I(t), t ∈ [0, T ], als Zufallsgröße aufgefasst.<br />
Rendite, Risiko <strong>und</strong> Volatilität<br />
Rendite bezeichnet <strong>den</strong> Gesamterfolg einer Kapitalanlage, gemessen als tatsächliche Verzinsung<br />
des eingesetzten Kapitals. Sie beruht auf <strong>den</strong> Ertragseinnahmen (z.B. Zinsen,<br />
Divi<strong>den</strong><strong>den</strong>, realisierte Kursgewinne) <strong>und</strong> <strong>den</strong> Kursveränderungen. Die Rendite soll erkennbar<br />
machen, wie gut sich eine früher angelegte Kapitalanlage entwickelt hat. Rendite<br />
wird meist in Prozent <strong>und</strong> jährlich angegeben.<br />
Mit dem Begriff Risiko bezeichnet man<br />
in der Finanzwelt die Unsicherheit, mit<br />
der die erwarteten Renditen auch wirklich<br />
eintreten. Je stärker das Risiko einer<br />
Anlageform ist, um so stärker schwankt<br />
die Wertentwicklung im Zeitverlauf <strong>und</strong><br />
umgekehrt.<br />
Abbildung 25: DAX-Verlauf im April 2011<br />
53 Das Instrument um diese<br />
Unregelmäßigkeit oder Flatterhaftigkeit<br />
der Renditeentwicklungen zu messen,<br />
ist die sogenannte Volatilität54 . Sie<br />
misst die Schwankungsbreite des Kurses<br />
des Basiswertes <strong>für</strong> Kursbewegungen innerhalb<br />
eines bestimmten Zeitrahmens.<br />
Üblicherweise wird sie mit σ bezeichnet.<br />
Die Volatilitätsgröße ist keine direkt beobachtbare<br />
Größe. Sie ist daher aus Marktdaten<br />
zu schätzen“. Man unterscheidet zwi-<br />
”<br />
schen historischer <strong>und</strong> impliziter Volatilität<br />
unterschei<strong>den</strong>, solange wir die Volatilität als eine Konstante betrachten.<br />
Die Aufgabe eines Investment-Analysten ist nun die Zusammenstellung eines Portfolios<br />
aus Finanztiteln, welches einen möglichst guten Kompromiss zwischen Risiko <strong>und</strong><br />
52 Aus der FAS am 31. Juli 2011, S. 38: Dabei dürfte es solche hohen Preise eigentlich nicht geben. In<br />
einem effizienten Markt sollte jede Überschätzung des Kurses sofort professionelle Investoren auf <strong>den</strong> Plan<br />
rufen, die mit so genannten Leerverküfen auf fallende Kurse spekulieren <strong>und</strong> gleichzeitig <strong>den</strong> Aktienkurs<br />
zurückstutzen.<br />
53 Diese Binsenweisheit wollen nicht alle akzeptieren <strong>und</strong> reissen damit sich (o.k.) <strong>und</strong> andere, ja ganze<br />
Staaten ins Unglück. Man sollte sich an folgende Weisheit (Andrè Kostelany) halten: Man sollte wissen,<br />
dass hinter <strong>den</strong> Fassa<strong>den</strong> großer Finanzinstitute keine Musterknaben sitzen.<br />
54 lat. volare: fliegen; volatilis: fliegend, flüchtig<br />
Stand: 21. November 2011 86 ○c J. Baumeister, T.G. Macedo
8.5 Simulationen von Optionen<br />
möglichem Gewinn darstellt. Da<strong>für</strong> benötigt er eine Abschätzung des Wertes der Option,<br />
welche von der Preisentwicklung der ihr zugr<strong>und</strong>eliegen<strong>den</strong> Aktie abhängt.<br />
8.5 Simulationen von Optionen<br />
Mit dem oben skizzierten Rechenvorschriften können wir viele“ Approximationen SN <strong>für</strong><br />
”<br />
. Damit stehen uns auch die Auszahlungen<br />
<strong>den</strong> Basiskurs ST errechnen, etwa S1 N , . . . , SM N<br />
(S1 N − K)+ , . . . , (S1 N − K)+ zur Verfügung. Eine Approximation CN,M <strong>für</strong> <strong>den</strong> zu ermitteln<strong>den</strong><br />
Optionspreis besteht nun im Mittelwert dieser Auszahlungen, diskontiert auf <strong>den</strong><br />
Zeitpunkt t = 0:<br />
−rT 1<br />
C0 := e<br />
M<br />
M�<br />
j=1<br />
(S j<br />
N<br />
− K)+<br />
Die Qualität der Diskretisierung hängt von <strong>den</strong> Parametern N, M ab: N sollte groß sein,<br />
damit der ” Pfad“ der Aktienkurse gut approximiert wird, M sollte groß sein, damit die<br />
Qualität der Mittelwertsberechnung hoch ist. Bei Berücksichtigung dieser Forderungen<br />
entsteht ein hoher Rechenaufwand. Den Beweis, dass dieses Vorgehen realisiert <strong>und</strong> mathematisch<br />
abgesichert wer<strong>den</strong> kann, müssen wir übergehen.<br />
Bibliographische Anmerkungen<br />
Die Monte Carlo-Metho<strong>den</strong> sind beschrieben in ganz unterschiedlichen Disziplinen der<br />
Wissenschaften: im Kontext Physik siehe [18], in der <strong>Mathematik</strong> als Methode der Integration<br />
siehe etwa [64], als Werkzeug in der Finanzmathematik siehe [37].<br />
Zur Normalverteilung <strong>und</strong> ihrer Approximation durch die Normalverteilung siehe etwa<br />
[38, 21, 51]. Zur Simulation der Normalverteilung siehe [37, 36].<br />
Die Theorie zur approximativen Lösung von stochastischen Differentialgleichungen ist<br />
ein extrem schnell wachsendes Gebiet; siehe [25, 48].<br />
Als ” einfachster Zugang“ zur Modellierung von Bewertungsmodellen <strong>für</strong> Optionen kann<br />
[24] angesehen wer<strong>den</strong>. Die Bewertung von Optionen wird elementar beschrieben etwa in<br />
[19, 41, 53].<br />
Stand: 21. November 2011 87 ○c J. Baumeister, T.G. Macedo<br />
(43)
9 Sierpinski-Mengen<br />
Für einen Zufallsgenerator braucht man einen richtigen<br />
Samen ( ” Seed“). Wer kennt <strong>den</strong> weltweit zufälligsten ?<br />
Eintrag in einem Forum zum Thema Gutes Chaos ist<br />
verdammt teuer !<br />
Das Sierpinski-Dreieck 55 ist eine geometrische Figur, die die Eigenschaft des Fraktals 56<br />
besitzt. Es kann unter Zuhilfenahme von <strong>Zufallszahlen</strong> auf unterschiedliche Weise erzeugt<br />
wer<strong>den</strong>; der Zusammenhang mit dynamischen Systemen wird dabei offensichtlich.<br />
Da der Zufall benutzt wird, kann die Konstruktion als Test <strong>für</strong> Pseudozufallszahlen<br />
verwendet wer<strong>den</strong>; wir gehen diesem Ansatz aber nicht eigentlich nach.<br />
9.1 Sierpinski-Dreieck<br />
Viele Formen der Natur lassen sich nicht mit <strong>den</strong> klassischen geometrischen Körpern ausreichend<br />
beschreiben: eine Wolke ist keine Kugel, ein Baum kein Kegel, ein Blitz keine Linie,<br />
ein Farn kein Dreieck. Bei genauerem Hinsehen entdecken wir oft Selbstähnlichkeit<br />
<strong>und</strong> eine zerbrochene Struktur. Selbstähnlichkeit bedeutet, dass man die Form eines<br />
Objekt in sich selbst wieder auf kleinerer Skala wiederfindet, oder etwas mehr formal:<br />
Eine Struktur/Objekt heißt selbstähnlich genau dann, wenn sie in Teile zerlegt<br />
wer<strong>den</strong> kann, von <strong>den</strong>en jedes eine kleinere Kopie des Ausgangsobjekts<br />
ist.<br />
Das Sierpinski-Dreieck als geometrische Figur<br />
passt hier sehr gut her; siehe unten. Beispiele <strong>für</strong><br />
Selbstähnlichkeit fin<strong>den</strong> sich auch im Werk von<br />
M.C. Escher. Fraktale sind geometrische Objekte,<br />
<strong>den</strong>en keine im klassischen Sinne (ganzzahlige)<br />
Dimension zugeordnet wer<strong>den</strong> kann;<br />
daraus leitet sich die Namengebung Fraktal“<br />
”<br />
ab. Diese Begriffsbildung geht auf B. Mandelbrot<br />
Abbildung 26: Sierpinski-Dreieck<br />
57 zurück. Er griff dabei auf mathematische<br />
Gr<strong>und</strong>lagen zurück, die im 19. Jahrh<strong>und</strong>ert von<br />
Cantor, Peano <strong>und</strong> Hausdorff geschaffen wur<strong>den</strong>.<br />
Im Allgemeinen besitzen solche Objekte bestimmte<br />
Eigenschaften, wie zum Beispiel verschie<strong>den</strong>e<br />
Arten von Selbstähnlichkeit, eventuell<br />
unendlich großen Umfang, . . . . Das Sierpinski-<br />
Dreieck (siehe Abbildung 26), das als geometrische<br />
Figur schon vor Sierpinski bekannt war – es findet sich in itaienischen Kathedralen<br />
aus dem 12. Jahrh<strong>und</strong>ert als Fußbo<strong>den</strong>mosaik <strong>und</strong> an einer Kanzel – besitzt solche Eigenschaften.<br />
Das Konstruktionsverfahren <strong>für</strong> das Sierpinski-Dreieck ist einfach:<br />
• Man beginnt mit einem schwarzem gleichseitigem Dreieck, halbiert die Seiten <strong>und</strong><br />
nimmt das Dreieck ” heraus“, das durch die Seitenmittelpunkte gegeben ist.<br />
55 Wac̷law Sierpinski, <strong>Mathematik</strong>er <strong>und</strong> Physiker, 1882-1969<br />
56 Vom Lateinischen: frangere = brechen, fractus = gebrochen<br />
57 Benoit Mandelbrot, <strong>Mathematik</strong>er, 19??-2011<br />
Stand: 21. November 2011 88 ○c J. Baumeister, T.G. Macedo
• Es bleiben drei schwarze Teildreiecke übrig.<br />
9.2 Fraktale <strong>und</strong> ihre Dimension<br />
• Nehme bei <strong>den</strong> drei verbliebenen Dreiecken wieder das Mitteldreieck heraus <strong>und</strong><br />
fahre so fort.<br />
Das Sierpinski-Dreieck besteht offenbar aus Flächenstücken, die immer <strong>und</strong> immer wieder<br />
durchbrochen <strong>und</strong> zersplittert sind. Unten wer<strong>den</strong> wir zwei ” dynamische“ Konstruktionsverfahren<br />
kennenlernen.<br />
(a) Ausgangsdreieck (b) 1. Schritt (c) Weitere Schritte<br />
Abbildung 27: Konstruktion des Sierpinski-Dreiecks<br />
9.2 Fraktale <strong>und</strong> ihre Dimension<br />
Unser gewohnter Dimensionsbegriff in der Geometrie ist die euklidische Dimension: ein<br />
Punkt hat die Dimension null, eine Strecke die Dimension eins, eine Fläche die Dimension<br />
zwei, einer Pyramide die Dimension 3, . . . . In der Linearen Algebra/Analytischen<br />
Geometrie ordnen wir Vektorräumen als Dimension die Zahl zu, die die minimale Anzahl<br />
der zur Erzeugung aller Punkte des Raums erforderlichen Basisvektoren angibt; jeweils<br />
haben wir eine ganze Zahl als Dimension.<br />
Wie oben beschrieben, können selbstähnliche Objekte beliebig zerlegt wer<strong>den</strong> <strong>und</strong> die<br />
entstehen<strong>den</strong> Teilmengen ergäben vergrö¨sert wieder das Ausgangsobjekt. Für die Objekte<br />
der euklidischen Geometrie mit einer Dimension d gilt bei einem Verkleinerungsfaktor s<br />
<strong>für</strong> die Anzahl t der verkleinerten Objekte<br />
t = 1<br />
( 1<br />
s )d<br />
d.h. d = log(t)<br />
log(s)<br />
Dies lässt sich nun auf Fraktale übertragen. Beim Sierpinski-Dreieck haben wir <strong>für</strong> s = 2<br />
t = 3 <strong>und</strong> daher<br />
dSierpinski = log(3)<br />
≈ 1.585<br />
log(2)<br />
(45)<br />
Der Wert dSierpinski ≈ 1.585 macht <strong>den</strong> fraktalen Charakter des Sierpinski-Dreiecks messbar.<br />
Mit dem obigen Dimensionsbegriff können interessante <strong>und</strong> zumeist klassische Beispiele<br />
fraktaler Objekte bestimmt wer<strong>den</strong>. Etwa:<br />
• Koch-Kurve als Nachbildung einer ” Schneeflocke“. Die Dimension ist<br />
DKoch = log(4)<br />
log(3)<br />
Stand: 21. November 2011 89 ○c J. Baumeister, T.G. Macedo<br />
(44)
9.3 Konstruktion mit Hilfe des ” Chaos-Spiel-Verfahrens“<br />
• Dürer-Pentagon Dabei wird jedes regelmäßiges Fünfeck in sechs kleinere regelmäßige<br />
Fünfecke zerlegt. Keine Überraschung sollte sein, dass die gol<strong>den</strong>e Schnittzahl g hierbei<br />
ins Spiel kommt bei der Dimensionsformel:<br />
DDuerer = log(6)<br />
log(1 + g)<br />
≈ 1.863<br />
9.3 Konstruktion mit Hilfe des ” Chaos-Spiel-Verfahrens“<br />
Um das Sierpinski-Dreieck zu konstruieren, wendet man <strong>den</strong> ” Chaos-Spiel-Algorithmus“<br />
oder ein iteriertes Funktionssystem an. Dabei ist es unverzichtbar, gleichverteilte <strong>Zufallszahlen</strong><br />
<strong>für</strong> die Erzeugung von Koordinaten der Punkte zu benutzen; siehe unten.<br />
Unter einer Iteration 58 versteht man in der <strong>Mathematik</strong> eine wiederholte Durchführung<br />
einer Anweisung oder eines Anweisungsblocks. Ein iteriertes Funktionssystem ist damit<br />
die Wiederholung einer Folge von festdefinierten Funktionen. Wir haben diese Idee<br />
schon im Zusammenhang mit der Erzeugung von <strong>Zufallszahlen</strong> kennengelernt.<br />
Der Name des Spiels kommt daher, dass jedem, der sich das erste Mal mit diesem<br />
Verfahren beschäftigt, am Anfang das Ganze wie ein Chaos vorkommt. Die Regeln des<br />
Spiels sind folgendermaßen beschrieben:<br />
1. Man definiert 3 Eckpunkte eines (gleichseitigen) Dreiecks.<br />
2. Man legt einen Startpunkt in das Dreieck.<br />
3. Man wählt zufällig einen der drei Eckpunkte mit Wahrscheinlichkeit p = 1<br />
3 .<br />
4. Man bildet einen neuen Punkt, in dem man die Strecke zwischen dem Startpunkt<br />
bzw. dem zuletzt erzeugten Punkt <strong>und</strong> dem ausgewählten Eckpunkt halbiert <strong>und</strong><br />
<strong>den</strong> neuen Punkt dorthin legt.<br />
5. Man wiederholt Schritt 3 <strong>und</strong> 4.<br />
Da der Zufall ” blind“ ist, erwartet man, dass die ” Spielpunkte“ gleichmäßig im Dreieck<br />
verteilt sind. Die Überraschung ist aber groß, es bildet sich ein strukturiertes Bild heraus.<br />
Die Struktur ist nach ca. 500 Iterationen schon erkennbar <strong>und</strong> nach ca. 10.000 Iterationen<br />
ist das Sierpinski-Dreieck ” fertig“.<br />
Die Entstehung wird plausibel, wenn man eine Ecke des Ausgangsdreiecks als Startpunkt<br />
wählt. Man stellt fest, dass die dann erzeugten Punkte stets Eckpunkte eines Teildreiecks<br />
der jeweils nächsten Konstruktionsstufe gemäß sind.<br />
Abschließend noch eine Anmerkung zur Namensgebung des Konstruktionsverfahrens.<br />
In Abschnitt 2.5 haben wir Kausalität, sensitive Abhängigkeit <strong>und</strong> Chaos angesprochen.<br />
Wie ordnet sich dies hier ein? Haben wir zwei nahe benachbarte Startwerte gewählt,<br />
so ist ganz einfach einzusehen, dass die Punktfolge, die nun konstruiert wird, schon nach<br />
ganz wenigen Konstruktionsschritten sich im Allgemeinen weit voneinander entfernt. Aber<br />
auch das ” Gegenteil“ist zu beobachten, nämlich, dass sie sich auch wieder stark annähern.<br />
Dieses Verhalten ist Teil der Definition von Chaos in dynamischen Systemen. Man mag<br />
nun der Meinung sein, dass dies eine Folge des Zufalls ist, <strong>den</strong> wir eingebaut haben. Dies<br />
ist nicht der Fall, sensitive Abhängigkeit kann eintreten auch bei einer Nichtzufallsfolge<br />
der gewählten Eckpunkte; siehe nachfolgende Bemerkung.<br />
Überraschenderweise hängt aber das Ergebnis des ” Spiels“ nicht von diesen Sensitivitäten<br />
ab: bei jedem Startwert erhalten wir diesselbe Figur.<br />
58 Vom Lateinischen: iterare = wiederholen<br />
Stand: 21. November 2011 90 ○c J. Baumeister, T.G. Macedo
9.4 Konstruktion mit Hilfe eines iterierten Funktionssystems<br />
Bemerkung 9.1 Die Anwendung von Zufall ist <strong>für</strong> die Konstruktion eines Sierpinski-<br />
Dreiecks unverzichtbar. Wenn wir zum Beispiel eine periodische Zahlenfolge statt ein Zufallsexperiment<br />
<strong>für</strong> die Wahl des angewendeten Funktionsparameter oder <strong>für</strong> die Wahl des<br />
Eckpunktes im ” Chaos-Spiel-Algorithmus“ benutzen, wer<strong>den</strong> wir keine fertige Struktur erkennen.<br />
Im Allgemeinen entsteht dann eine periodische Punktfolge oder eine Punktfolge,<br />
die offenbar gegen Fixpunkte konvergiert. �<br />
9.4 Konstruktion mit Hilfe eines iterierten Funktionssystems<br />
In einem Koordinatensystem setzt man einen Startpunkt, dann wählt man zufällig eine<br />
Funktion aus eine Gruppe von drei Funktionen <strong>und</strong> setzt <strong>den</strong> Startpunkt ein, um die<br />
Koordinaten des neuen Punktes zu erzeugen. Dabei wiederholt man dieses Verfahren, bis<br />
die Struktur erkennbar ist.<br />
Die Funktionen, die dabei benutzt wer<strong>den</strong>, sind Funktionen auf R×R, also Funktionen<br />
mit <strong>den</strong> Variablen x, y ∈ R. Sie sind definiert als:<br />
f(x, y) := ax + by + e<br />
g(x, y) := cx + dy + f<br />
wobei die Parameter a, b, . . . , f Zahlen zwischen 0 <strong>und</strong> 1 sind; sie wer<strong>den</strong> <strong>den</strong> Zeilen der<br />
Tabelle in Abbildung 28 entnommen. Damit ergibt sich die Iteration<br />
xn+1 := axn + byn + e<br />
yn+1 := cxn + dyn + f<br />
mit einem noch zu wählen<strong>den</strong> Startwert (x0, y0) . Die Funktionen wer<strong>den</strong> entsprechend<br />
der gewählten Zufallszahl aus {1, 2, 3} gewählt. Wir können die Iteration als diskretes<br />
dynamisches System interpretieren.<br />
F a b c d e f<br />
1 0.5 0.0 0.0 0.5 0.00 0.0<br />
2 0.5 0.0 0.0 0.5 0.25 0.5<br />
3 0.5 0.0 0.0 0.5 0.50 0.0<br />
Abbildung 28: Parameter zum Sierpinski-Dreieck<br />
Die Aussage von Bemerkung 9.1 trifft auch hier zu.<br />
9.5 Variationen des Sierpinski-Dreiecks<br />
Es gibt verschie<strong>den</strong>e Möglichkeiten, mit <strong>den</strong>en man abgeänderte Sierpinski-Dreiecke konstruieren<br />
kann. Hier stellen wir ein paar Variationen mit anderen Anfangswerten <strong>und</strong> Gegebenheiten<br />
vor, die die fertige Struktur des Dreiecks anders gestalten. Zudem erklären<br />
wir, wie wichtig die Verwendung des Zufalls bei der Konstruktion des Fraktals ist.<br />
Verzerrung<br />
Die Form des Fraktals muss nicht gleichseitig sein. Als Gr<strong>und</strong>form könnte man zum Beispiel<br />
ein beliebiges Dreieck nehmen. Dadurch entsteht eine ” verzerrte“ Struktur, die die<br />
Eigenschaften eines Sierpinski-Dreiecks immer noch besitzt; siehe: Abbildung 29 (a).<br />
Stand: 21. November 2011 91 ○c J. Baumeister, T.G. Macedo
(a) (b) (c)<br />
Veränderte Wahrscheinlichkeiten<br />
Abbildung 29: Variationen des Themas<br />
9.5 Variationen des Sierpinski-Dreiecks<br />
Bei der Konstruktion eines normalen Sierpinski-Dreiecks nutzen wir <strong>für</strong> die Wahl des<br />
Eckpunktes im ” Chaos-Spiel-Verfahren“ ein Laplace-Experiment; siehe Kapitel ??. Jedes<br />
Elementareireignis tritt also mit der gleichen Wahrscheinlichkeit p ein. Wenn wir nun<br />
die Wahrscheinlichkeit der Wahl verändern, entsteht eine Struktur mit abgeschwächter<br />
Dichte der Punkte; siehe Abbildung 29 (b). Als Beispiel setzen wir beim ” Chaos-Spiel-<br />
Algorithmus“ die Wahrscheinlichkeiten <strong>für</strong> die Wahl der Eckpunkte folgendermaßen:<br />
• Eckpunkt 1: p = 5<br />
10<br />
• Eckpunkt 2: p = 1<br />
10<br />
• Eckpunkt 3: p = 4<br />
10<br />
Sierpinski-Teppich<br />
Der Sierpinski-Teppich ist ein Fraktal, welcher eine selbstähnliche Teilmenge eines Quadrats<br />
ist. Um das Fraktal zu konstruieren, überträgt man die Idee des ” Chaos-Spiel-<br />
Algorithmus“ auf diese Situation. Der Unterschied zu der Konstruktion eines Sierpinski-<br />
Dreiecks besteht darin, dass man beim Sierpinski-Teppich vier Eckpunkte <strong>und</strong> vier Mittelpunkte<br />
aller Kanten einsetzt, also insgesamt acht Punkte nutzt. Dadurch entstehen acht<br />
Teilquadrate. Außerdem teilt man, um einen neuen Punkt zu erzeugen, die Verbindungsstrecke<br />
zwischen dem aktuellen Punkt <strong>und</strong> dem gewählten Eckpunkt nicht in zwei sondern<br />
in drei Teile. Der neu konstruierte Punkt entsteht als Endpunkt der Drittelstrecke, die im<br />
gewählten Eckpunkt endet; siehe Abbildung 29 (c).<br />
Bibliographische Anmerkungen<br />
In Abschnitt haben wir die ” Selbstähnlichkeitsdimension“ kennengelernt. Es gibt eine<br />
Reihe weiterer Dimensionsbegriffe; siehe <strong>für</strong> einen Überblick [39, 87].<br />
Interessante Fraktale kommen als Attraktoren <strong>und</strong> daraus abgeleiteten Mengen von<br />
dynamischen Systemen zustande; siehe etwa [4, 58, 66].<br />
Stand: 21. November 2011 92 ○c J. Baumeister, T.G. Macedo
Literatur<br />
[1] M. Aigner. Diskrete <strong>Mathematik</strong>. Vieweg, 1996.<br />
[2] M. Aigner and G.M. Ziegler. Proofs from THE BOOK. Springer, 1998.<br />
[3] L. Afflerbach <strong>und</strong> J. Lehn. <strong>Zufallszahlen</strong> <strong>und</strong> Simulation. Teubner, 1986.<br />
[4] M.F. Barnsley. Fractals everywhere. Academic Press, 1993.<br />
[5] G.E. Bärwolf. Höhere <strong>Mathematik</strong>. Elsevier, 2004.<br />
LITERATUR<br />
[6] F.L. Bauer. Entzifferte Geheimnisse: Metho<strong>den</strong> <strong>und</strong> Maximen der Kryptographie.<br />
Springer, 2000.<br />
[7] F. Benford. The law of anomalous numbers. Proceedings of the American Philosophical<br />
Society, 78:551–572, 1938.<br />
[8] A. Berger. Multi-dimensional dynamical systems and Benford’s law. Discrete and<br />
Continuous Dynamical Systems, 13:219–237, 2005.<br />
[9] A. Berger. Benfordâs law in power-like dynamical systems. Stochastic Dynamics,<br />
5:587–607, 2007.<br />
[10] A. Berger and T. Hill. Newtons’method obeys Benford’s law. Amer. Math. Monthly,<br />
114:588–601, 2007.<br />
[11] A. Berger and T. Hill. F<strong>und</strong>amental flaws in Feller’s lassical derivation of Benford’s<br />
Law. Technical report, University of Alberta, 2010.<br />
[12] A. Berger and T. Hill. A basic theory of Benford’s law. Probability Surveys, 8:1–126,<br />
2011.<br />
[13] A. Berger and T. Hill. Benford’s law strikes back: no simple explanation in sight for<br />
mathematical gem. The mathematical intelligencer, 33:85–91, 2011.<br />
[14] A. Berger, A. Bunimovich and T. Hill. One-dimensional dynamical systems and benford’s<br />
law. Trans. Amer. Math. Soc., 357:197–219, 2004.<br />
[15] A. Beutelsbacher. Kryptologie. Vieweg, 1993.<br />
[16] A. Beutelsbacher, H. Neumann <strong>und</strong> T. Schwarzpaul. Kryptographie in Theorie <strong>und</strong><br />
Praxis. Vieweg, 2005.<br />
[17] J. Bewersdorff. Glück, Logik <strong>und</strong> Bluff. Vieweg, Braunschweig, 1998.<br />
[18] K. Binder. Applications of the Monte Carlo method in statistical physics. Springer,<br />
Berlin, 1984.<br />
[19] F. Black and M. Scholes. The pricing of options and corporate liabilities. J. of<br />
political economy, 81:637–659, 1973.<br />
[20] J. Blankenagel. Elemente der Angewandten <strong>Mathematik</strong>. Wissenschaftsverlag, 1994.<br />
[21] K. Bosch. Elementare Einführung in die Wahrscheinlichkeitsrechnung. Vieweg,<br />
Braunschweig, 1995.<br />
Stand: 21. November 2011 93 ○c J. Baumeister, T.G. Macedo
LITERATUR<br />
[22] C. Breuning and A. Goerres. Searching for electoral irregularities in an established<br />
democracy: applying Benford’s law tests to B<strong>und</strong>estag elections in Unified Germany.<br />
Electoral Studies, xxx:1–12, 2011.<br />
[23] J. Buchmann. Einführung in die Kryptographie. Springer, Berlin, 2009.<br />
[24] J.C. Cox and S.A. Ross. The valuation of option for alternative stochastic processes.<br />
Journal of Financial Economics, 3:145–166, 1976.<br />
[25] S. Cyganovski, P. Kloe<strong>den</strong> and J. Ombach. From Elementary Probability to Stochastic<br />
Differential Equations with MAPLE. Springer, Berlin, 2001.<br />
[26] P. Diaconis. The distribution of leading digits and uniform distribution mod 1. The<br />
Annals of Probability, pages 72–81, 1977.<br />
[27] A. Diekmann. Datenfälschung. Ergebnisse aus Experimenten mit der Benford-Verteilung.<br />
Manuscript, ETH Zürich, 2004.<br />
[28] A. Diekmann. Not the First Digit! Using Benford’s Law to Detect Fraudulent Scientific<br />
Data. Manuscript, ETH Zürich, 2004.<br />
[29] J. Eichenauer-Herrmann. Inversive congruential pseudorandom numbers: A tutorial.<br />
Int. Stat. Rev., 60:167–176, 1992.<br />
[30] W. Feller. An Introduction to Probability Theory and its Applications. Wiley, Provi<strong>den</strong>ce,<br />
1966.<br />
[31] R. Fewster. A simple explanation of Benford’s law. Amer. Stat., 63:26–32, 2009.<br />
[32] O. Forster. Algorithmische Zahlentheorie. Vieweg, Wiesba<strong>den</strong>, 1996.<br />
[33] O. Forster. Analysis 1,2. Vieweg, Wiesba<strong>den</strong>, 1996.<br />
[34] A.S. Fraenkel. New proof of the generalized chinese remainder theorem. Proc. of the<br />
american mathematical society, 14:790–791, 1963.<br />
[35] B. Gaertner. Ein Reinfall mit Computer-<strong>Zufallszahlen</strong>. DMV-Mitteilungen, Ausgabe<br />
2:55–60, 1999.<br />
[36] J.E. Gentle. Random number generation and Monte Carlo methods. Springer, 2001.<br />
[37] P. Glasserman. Monte Carlo Methods in Financial Engineering. Springer, Baltimore,<br />
2003.<br />
[38] N. Henze. Stochastik <strong>für</strong> Einsteiger. Vieweg, Braunschweig, 1997.<br />
[39] D. Herrmann. Algorithmen <strong>für</strong> Chaos <strong>und</strong> Fraktale. Addison-Wesley, Bonn, Paris,<br />
1994.<br />
[40] T. Hill. Base-invariance implies Benford’s law. Proc Amer. Math. Soc., 123:887–895,<br />
1995.<br />
[41] J.C. Hull. Options, Futures, and other Derivatives. Prentice Hall, 2003.<br />
[42] H. Humenberger. Das Benford Gesetz über die Verteilung der ersten Ziffer von Zahlen.<br />
Manuscript, 1996. Wien.<br />
Stand: 21. November 2011 94 ○c J. Baumeister, T.G. Macedo
LITERATUR<br />
[43] N. Hungerbühler. Benfords Gesetz über führende Ziffern: Wie die <strong>Mathematik</strong><br />
Steuersündern das Fürchten lehrt, 2007. Publication von www.educeth.ch.<br />
[44] R. Ineichen. Der schlechte Würfel – ein selten behandeltes Problem in der Geschichte<br />
der Stochastik. Historia Mathematica, 18:253–261, 1991.<br />
[45] T. Jech. The logarithmic distribution of leading digits and finitely additive measures.<br />
Discrete Mathematics, 108:53–57, 1992.<br />
[46] B. Kaynar, A. Berger, T. Hill and A. Ridder. Finite-state Markov chains obey<br />
Benford’s law, 2010.<br />
[47] R. Kippenhahn. Verschlüsselte Botschaften: Geheimschrift, Enigma <strong>und</strong> Chipkarte.<br />
Rowohlt, 1999.<br />
[48] P. Kloe<strong>den</strong> and E. Platen. Numerical Solution of SDE through Computer Experiments.<br />
Springer, Berlin, 1994.<br />
[49] D.E. Knuth. The Art of Computer Programming, Vol. 1,2,3. Addison-Wesley, Reading,<br />
1998.<br />
[50] J.F. Koksma. Ein mengentheoretischer Satz über die Gleichverteilung modulo Eins.<br />
Compositio, 2:250–258, 1935.<br />
[51] U. Krengel. Einführung in die Wahrscheinlichkeitstheorie <strong>und</strong> Statistik. Vieweg,<br />
Braunschweig, 1991.<br />
[52] G. Kropp. Geschichte der <strong>Mathematik</strong>. Sammlung Aula, Wiesba<strong>den</strong>, 1994.<br />
[53] R. Korn <strong>und</strong> E. Korn. Optionsbewertung <strong>und</strong> Portfolio–Optimierung. Vieweg, Braunschweig,<br />
1999.<br />
[54] L. Kuipers and H. Niederreiter. Uniform Distribution of sequences. Wiley, New York,<br />
1974.<br />
[55] D.H. Lehmer. Mathematical methods in large-scale computing units, 1949.<br />
[56] R.W. Leven, B.-P Koch and B. Pompe. Chaos in dissipativen Systemen. Vieweg<br />
Verlag, Wiesba<strong>den</strong>, 1989.<br />
[57] E. Ley. On the peculiar distribution of the u.s. stock indexes’ digits. Amer. Stat.,<br />
50:311–314, 1996.<br />
[58] B.B. Mandelbrot. Die fraktale Geometrie der Natur. Birkhäuser, Basel, 1987.<br />
[59] E. Maor. Dem Unendlichen auf der Spur. Birkhäuser, Basel, 1982.<br />
[60] G. Marsaglia and T.A. Bray. A convenient method for generating normal variables.<br />
SIAM Review, 6:260–264, 1964.<br />
[61] S. Newcomb. Note on the frequency of use of the different digits in natural numbers.<br />
American Journal of Mathematics, 4:39–40, 1981.<br />
[62] H. Niederreiter. Random Number Generation and Quasi-Monte-Carlo-Methods.<br />
SIAM, Philadelphia, 1992.<br />
[63] M.J. Nigrini. A taxpayer compliance application of Benford’s law. J. of the Amer.<br />
Taxation Assoc., 18:72–91, 1996.<br />
Stand: 21. November 2011 95 ○c J. Baumeister, T.G. Macedo
LITERATUR<br />
[64] E. Nowak and K. Ritter. High dimensional integration of smooth functions over<br />
cubes. Numerische <strong>Mathematik</strong>, 75:79–97, 1996.<br />
[65] J.A. Paulos. <strong>Von</strong> Algebra bis Zufall. Campus, Frankfurt, 1992.<br />
[66] H.-O. Peitgen, H. Jürgens and D. Saupe. Bausteine des Chaos – Fraktale. Springer-<br />
Klett-Cotta, Berlin, 1992.<br />
[67] R.C. Pierce. A brief history of logarithm. The two-year college mathematics journal,<br />
8:22–26, 1977.<br />
[68] R.S. Pinkham. On the distribution of first significant digits. The Annals of Statistics,<br />
32:1223–1230, 1961.<br />
[69] H. Poincaré. Répartition des décimales dans une table numérique. Calcul des probabilités,<br />
pages 313–320, 1912.<br />
[70] B.F. Roukema. Benford’s law anomalies in the 2009 iranian presi<strong>den</strong>tial election.<br />
Artikel-id: 0906.2789v2, 2009.<br />
[71] D. Ruelle. Zufall <strong>und</strong> Chaos. Springer, New York, 1992.<br />
[72] L. Russio. Die vergessene Revolution. Springer, New York, 2003.<br />
[73] M. Sambridge, H. Tkalcic and A. Jackson. Benford’s law in the natural sciences.<br />
Geophys. Res. Lett., 37:xx–xx, 2010.<br />
[74] P. Samuelson. Rational theory of warrant pricing. Industrial Management Review,<br />
6:13–32, 1965.<br />
[75] P. Schulz. Fünfstellige logarithmische <strong>und</strong> trigonometrische Tafeln; 32. Auflage.<br />
C.C. Buchners, Bamberg, 1956.<br />
[76] B. Schuppar. Elementare Numerische <strong>Mathematik</strong>. Vieweg, 1999.<br />
[77] H.-G. Schuster. Deterministisches Chaos: eine Einführung. VCH Verlagsgesellschaft,<br />
Weinheim, 1994.<br />
[78] A. Sen De and U. Sen. Benford’s law: a detection of quantum phase transitions<br />
similarly as earthquakes, 2011. arXiv:1103.5398v1[quant-ph].<br />
[79] S. Simonet, S. Monteleone and D. Adolf. Analyse von Bildflächen auf Benfordverteilung<br />
am Beispiel von Northern Blots. Manuscript, ETH Zürich, 2008.<br />
[80] S. Sing. Geheime Botschaften. Carl Hanser, München, 2000.<br />
[81] D.J. Struik. A concise history of mathematics. Dover Publications, 1987.<br />
[82] L. Tarassow. Wie der Zufall will? Vom Wesen der Wahrscheinlichkeit. Springer,<br />
Berlin, 1998.<br />
[83] G. Teschl. Dynamische Systeme, 2005.<br />
[84] C.R. Tolle, J.L. Budzien and R.A. LaViolette. Do dynamical systems follow<br />
Benford’s law? Chaos: An Interdisciplinary Journal of Nonlinear Science, 10:331,<br />
2000.<br />
Stand: 21. November 2011 96 ○c J. Baumeister, T.G. Macedo
LITERATUR<br />
[85] H. Weyl. über die Gleichverteilung von Zahlen mod 1. Mathematische Annalen,<br />
77:313–352, 1916.<br />
[86] J. Wolfart. Einführung in die Zahlentheorie <strong>und</strong> Algebra. Vieweg, 1996.<br />
[87] H. Zeitler <strong>und</strong> W. Neidhardt. Fraktale <strong>und</strong> Chaos. Wiss. Buchgesellschaft, 1994.<br />
Weitere Quellen<br />
[Ber06] http://www-i1.informatik.rwth-aachen.de/ algorithmus/algo26.php<br />
[Ber11] http://www.benfordonline.net/<br />
[FAZ11] Frankfurter Allgemeine Zeitung, 18.9.2011, Seite 67<br />
[Fib??] http://www.ijon.de/mathe/fibonacci/index.html<br />
[Hun10] http://www.educ.ethz.ch/unt/um/mathe/ana/benford/Benford−Fuehrende<br />
−Ziffern.pdf)<br />
[RiS10] http://www.mathematik.uni-erlangen.de/∼richard/vortrag.pdf<br />
[Sch03] http://www.schimmeck.de/Texte/benford.htm<br />
[Sei07] http://www.mathematik.uni-kassel.de/∼seiler/Courses/AGCA-0708/<br />
ModRechnen.pdf<br />
[Stu10] http://stubber.math-inf.uni-greifswald.de/∼bandt/statprak10/Benford/<br />
Benford−U−Horn.pdf<br />
[WeG10] https://www.physik.uni-marburg.de/fileadmin/user−upload/forschung/kosy/<br />
Lenz/Comp−phys−I/Benfords−Gesetz.pdf<br />
[Wei04] https://www.uni-koblenz.de/∼steigner/seminar-asym-krypt/weizel.pdf<br />
[Zei00] http://homepages.cwi.nl/ paulv/news/zeit00-plain<br />
Stand: 21. November 2011 97 ○c J. Baumeister, T.G. Macedo