13.07.2015 Aufrufe

Angewandte Mathematik: Body and Soul

Angewandte Mathematik: Body and Soul

Angewandte Mathematik: Body and Soul

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Angew<strong>and</strong>te</strong> <strong>Mathematik</strong>: <strong>Body</strong> <strong>and</strong> <strong>Soul</strong>


3BerlinHeidelbergNew YorkHongkongLondonMail<strong>and</strong>ParisTokio


K. Eriksson · D. Estep · C. Johnson<strong>Angew<strong>and</strong>te</strong> <strong>Mathematik</strong>:<strong>Body</strong> <strong>and</strong> <strong>Soul</strong>[VOLUME 1]Ableitungen und Geometrie in IR 3Übersetzt von Josef SchüleMit 192 Abbildungen13


Kenneth ErikssonClaes JohnsonChalmers University of TechnologyDepartment of Mathematics41296 Göteborg, Swedene-mail:keneth|claes@math.chalmers.seDonald EstepColorado State UniversiyDepartment of MathematicsFort Collins, CO 80523-1874USAe-mail: estep@math.colostate.eduÜbersetzer:Josef SchüleTechnische Universität BraunschweigRechenzentrumHans-Sommer-Str. 6538106 BraunschweigMathematics Subject Classification (2000): 15-01, 34-01, 35-01, 49-01, 65-01, 70-01, 76-01ISBN 3-540-21401-1 Springer-Verlag Berlin Heidelberg New YorkBibliografische Information der Deutschen BibliothekDie Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie;detaillierte bibliografische Daten sind im Internet über abrufbar.Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, desNachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oderder Vervielfältigung auf <strong>and</strong>eren Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nurauszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auchim Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der BundesrepublikDeutschl<strong>and</strong> vom 9. September 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig.Zuwiderh<strong>and</strong>lungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes.Springer-Verlag ist ein Unternehmen von Springer Science+Business Mediaspringer.de© Springer-Verlag Berlin Heidelberg 2004Printed in GermanyDie Wiedergabe von Gebrauchsnamen, H<strong>and</strong>elsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auchohne besondere Kennzeichnung nicht zu der Annahme, daß solche Namen im Sinne der Warenzeichen- undMarkenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften.Satz: Josef Schüle, BraunschweigDruckdatenerstellung: LE-TEX Jelonek, Schmidt & Vöckler GbR, Leipzig,Einb<strong>and</strong>gestaltung: design & production GmbH, HeidelbergGedruckt auf säurefreiem Papier SPIN: 10995525 46/3141/tr-543210


Den Studierenden der Chemieingenieurwissenschaften an derChalmers Universität zwischen 1998-2002, die mitBegeisterung an der Entwicklung des Reformprojekts, das zudiesem Buch geführt hat, teilgenommen haben.


VorwortIch gebe zu, dass alles und jedes in seinem Zust<strong>and</strong> verharrt, solangees keinen Grund zur Veränderung gibt. (Leibniz)Die Notwendigkeit für eine Reformder <strong>Mathematik</strong>ausbildungDie Ausbildung in <strong>Mathematik</strong> muss nun, da wir in ein neues Jahrtausendschreiten, reformiert werden. Diese Überzeugung teilen wir mit einerschnell wachsenden Zahl von Forschern und Lehrern sowohl der <strong>Mathematik</strong>als auch natur- und ingenieurwissenschaftlicher Disziplinen, die aufmathematischen Modellen aufbauen. Dies hat natürlich seine Ursache inder Revolution der elektronischen Datenverarbeitung, die grundlegend dieMöglichkeiten für den Einsatz mathematischer und rechnergestützter Technikenin der Modellbildung, Simulation und der Steuerung realer Vorgängeverändert hat. Neue Produkte können mit Hilfe von Computersimulationenin Zeitspannen und zu Kosten entwickelt und getestet werden, die umGrößenordnungen kleiner sind als mit traditionellen Methoden, die auf ausgedehntenLaborversuchen, Berechnungen von H<strong>and</strong> und Versuchszyklenbasieren.Von zentraler Bedeutung für die neuen Simulationstechniken sind dieneuen Disziplinen des so genannten Computational Mathematical Modeling(CMM) wie die rechnergestützte Mechanik, Physik, Strömungsmechanik,Elektromagnetik und Chemie. Sie alle beruhen auf der Kombination von


VIIIVorwortLösungen von Differentialgleichungen auf Rechnern und geometrischer Modellierung/ComputerAided Design (CAD). Rechnergestützte Modellierungeröffnet auch neue revolutionäre Anwendungen in der Biologie, Medizin,den Ökowissenschaften, Wirtschaftswissenschaften und auf Finanzmärkten.Die Ausbildung in <strong>Mathematik</strong> legt die Grundlage für die natur- undingenieurwissenschaftliche Ausbildung an Hochschulen und Universitäten,da diese Disziplinen weitgehend auf mathematischen Modellen aufbauen.Das Niveau und die Qualität der mathematischen Ausbildung bestimmt dahermaßgeblich das Ausbildungsniveau im Ganzen. Die neuen CMM/CADTechniken überschreiten die Grenze zwischen traditionellen Ingenieurwissenschaftenund Schulen und erzwingen die Modernisierung der Ausbildungin den Ingenieurwissenschaften in Inhalt und Form sowohl bei den Grundlagenals auch bei weiterführenden Studien.Unser ReformprogrammUnser Reformprogramm begann vor etwa 20 Jahren in Kursen in CMM fürfortgeschrittene Studierende. Es hat über die Jahre erfolgreich die Grundlagenausbildungin Infinitesimalrechnung und linearer Algebra beeinflusst.Unser Ziel wurde der Aufbau eines vollständigen Lehrangebots für die mathematischeAusbildung in natur- und ingenieurwissenschaftlichen Disziplinen,angefangen bei Studierenden in den Anfangssemestern bis hin zuGraduierten. Bis jetzt umfasst unser Programm folgende Bücher:1. Computational Differential Equations, (CDE)2. <strong>Angew<strong>and</strong>te</strong> <strong>Mathematik</strong>: <strong>Body</strong> & <strong>Soul</strong> I–III, (AM I–III)3. Applied Mathematics: <strong>Body</strong> & <strong>Soul</strong> IV–, (AM IV–).Das vorliegende Buch AM I–III beh<strong>and</strong>elt in drei Bänden I–III die Grundlagender Infinitesimalrechnung und der linearen Algebra. AM IV– erscheintab 2003 als Fortsetzungsreihe, die speziellen Anwendungsbereichen gewidmetist, wie Dynamical Systems (IV), Fluid Mechanics (V), Solid Mechanics(VI) und Electromagnetics (VII). Das 1996 erschienene Buch CDEkann als erste Version des Gesamtprojekts Applied Mathematics: <strong>Body</strong> &<strong>Soul</strong> angesehen werden.Außerdem beinhaltet unser Lehrangebot verschiedene Software (gesammeltim mathematischen Labor) und ergänzendes Material mit schrittweisenEinführungen für Selbststudien, Aufgaben mit Lösungen und Projekten.Die Website dieses Buches ermöglicht freien Zugang dazu. Unser Ehrgeizbesteht darin eine “Box“ mit einem Satz von Büchern, Software und Zusatzmaterialanzubieten, die als Grundlage für ein vollständiges Studium,


VorwortIXangefangen bei den ersten Semestern bis zu graduierten Studien, in angew<strong>and</strong>ter<strong>Mathematik</strong> in natur- und ingenieurwissenschaftlichen Disziplinendienen kann. Natürlich hoffen wir, dass dieses Projekt durch ständig neuhinzugefügtes Material schrittweise ergänzt wird.Basierend auf AM I–III haben wir seit Ende 1999 das Studium in angew<strong>and</strong>ter<strong>Mathematik</strong> für angehende Chemieingenieure beginnend mit Erstsemesterstudierendenan der Chalmers Universität angeboten und Teile desMaterials von AM IV– in Studiengängen für fortgeschrittene Studierendeund frisch Graduierte eingesetzt.Schwerpunkte des Lehrangebots: Das Angebot basiert auf einer Synthese von <strong>Mathematik</strong>, Datenverarbeitungund Anwendung. Das Lehrangebot basiert auf neuer Literatur und gibt damit von Anfangan eine einheitliche Darstellung, die auf konstruktiven mathematischenMethoden unter Einbeziehung von Berechnungsmethodenfür Differentialgleichungen basiert. Das Lehrangebot enthält als integrierten Best<strong>and</strong>teil Software unterschiedlicherKomplexität. Die Studierenden erarbeiten sich fundierte Fähigkeiten, um in MatlabBerechnungsmethoden umzusetzen und Anwendungen und Softwarezu entwickeln. Die Synthese von <strong>Mathematik</strong> und Datenverarbeitung eröffnet Anwendungenfür die Ausbildung in <strong>Mathematik</strong> und legt die Grundlagefür den effektiven Gebrauch moderner mathematischer Methoden inder Mechanik, Physik, Chemie und angew<strong>and</strong>ten Disziplinen. Die Synthese, die auf praktischer <strong>Mathematik</strong> aufbaut, setzt Synergienfrei, die es schon in einem frühen Stadium der Ausbildung erlauben,komplexe Zusammenhänge zu untersuchen, wie etwa Grundlagenmodellemechanischer Systeme, Wärmeleitung, Wellenausbreitung,Elastizität, Strömungen, Elektromagnetismus, Diffusionsprozesse,molekulare Dynamik sowie auch damit zusammenhängendeMulti-Physics Probleme. Das Lehrangebot erhöht die Motivation der Studierenden dadurch,dass bereits von Anfang an mathematische Methoden auf interessanteund wichtige praktische Probleme angewendet werden. Schwerpunkte können auf Problemlösungen, Projektarbeit und Präsentationengelegt werden.


XVorwort Das Lehrangebot vermittelt theoretische und rechnergestützte Werkzeugeund baut Vertrauen auf. Das Lehrangebot enthält einen Großteil des traditionellen Materialsaus Grundlagenkursen in Analysis und linearer Algebra. Das Lehrangebot schließt vieles ein, das ansonsten oft in traditionellenProgrammen vernachlässigt wird, wie konstruktive Beweise allergrundlegenden Sätze in Analysis und linearer Algebra und fortgeschrittenerThemen sowie nicht lineare Systeme algebraischer Gleichungenbzw. Differentialgleichungen. Studierenden soll ein tiefes Verständnis grundlegender mathematischerKonzepte, wie das der reellen Zahlen, Cauchy-Folgen, Lipschitz-Stetigkeit und konstruktiver Werkzeuge für die Lösung algebraischerGleichungen bzw. Differentialgleichungen, zusammen mit der Anwendungdieser Werkzeuge in fortgeschrittenen Anwendungen wie etwader molekularen Dynamik, vermittelt werden. Das Lehrangebot lässt sich mit unterschiedlicher Schwerpunktssetzungsowohl in mathematischer Analysis als auch in elektronischerDatenverarbeitung umsetzen, ohne dabei den gemeinsamen Kern zuverlieren.AM I–III in KurzfassungAllgemein formuliert, enthält AM I–III eine Synthese der Infinitesimalrechnung,linearer Algebra, Berechnungsmethoden und eine Vielzahl vonAnwendungen. Rechnergestützte/praktische Methoden werden verstärktbeh<strong>and</strong>elt mit dem doppelten Ziel, die <strong>Mathematik</strong> sowohl verständlichals auch benutzbar zu machen. Unser Ehrgeiz liegt darin, Studierendefrüh (verglichen zur traditionellen Ausbildung) mit fortgeschrittenen mathematischenKonzepten (wie Lipschitz-Stetigkeit, Cauchy-Folgen, kontrahierendeOperatoren, Anfangswertprobleme für Differentialgleichungssysteme)und fortgeschrittenen Anwendungen wie Lagrange-Mechanik, Vielteilchen-Systeme,Bevölkerungsmodelle, Elastizität und Stromkreise bekanntzu machen, wobei die Herangehensweise auf praktische/rechnergestützteMethoden aufbaut.Die Idee dahinter ist es, Studierende sowohl mit fortgeschrittenen mathematischenKonzepten als auch mit modernen Berechnungsmethoden vertrautzu machen und ihnen so eine Vielzahl von Möglichkeiten zu eröffnen,um <strong>Mathematik</strong> auf reale Probleme anzuwenden. Das steht im Widerspruchzur traditionellen Ausbildung, bei der normalerweise der Schwerpunkt aufanalytische Techniken innerhalb eines eher eingeschränkten konzeptionellenGebildes gelegt wird. So leiten wir Studierende bereits im zweiten


VorwortXIHalbjahr dazu an (in Matlab) einen eigenen Löser für allgemeine Systemegewöhnlicher Differentialgleichungen auf gesundem mathematischen Bodenzu schreiben (hohes Verständnis und Kenntnisse in Datenverarbeitung),wohingegen traditionelle Ausbildung sich oft zur selben Zeit darauf konzentriert,Studierende Kniffe und Techniken der symbolischen Integrationzu vermitteln. Solche Kniffe bringen wir Studierenden auch bei, aber unserZiel ist eigentlich ein <strong>and</strong>eres.Praktische <strong>Mathematik</strong>: <strong>Body</strong> & <strong>Soul</strong>In unserer Arbeit kamen wir zu der Überzeugung, dass praktische Gesichtspunkteder Infinitesimalrechnung und der linearen Algebra stärker betontwerden müssen. Natürlich hängen praktische und rechnergestützte <strong>Mathematik</strong>eng zusammen und die Entwicklungen in der Datenverarbeitung habendie rechnergestützte <strong>Mathematik</strong> in den letzten Jahren stark vorangetrieben.Zwei Gesichtspunkte gilt es bei der mathematischen Modellierungzu berücksichtigen: Den symbolischen Aspekt und den praktisch numerischen.Dies reflektiert die Dualität zwischen infinit und finit bzw. zwischenkontinuierlich und diskret. Diese beiden Gesichtspunkte waren bei der Entwicklungeiner modernen Wissenschaft, angefangen bei der Entwicklung derInfinitesimalrechnung in den Arbeiten von Euler, Lagrange und Gauss bishin zu den Arbeiten von von Neumann zu unserer Zeit vollständig mitein<strong>and</strong>erverwoben. So findet sich beispielsweise in Laplaces gr<strong>and</strong>iosemfünfbändigen Werk Mécanique Céleste eine symbolische Berechnung einesmathematischen Modells der Gravitation in Form der Laplace-Gleichungzusammen mit ausführlichen numerischen Berechnungen zur Planetenbewegungin unserem Sonnensystem.Beginnend mit der Suche nach einer exakten und strengen Formulierungder Infinitesimalrechnung im 19. Jahrhundert begannen sich jedochsymbolische und praktische Gesichtspunkte schrittweise zu trennen. DieTrennung beschleunigte sich mit der Erfindung elektronischer Rechenmaschinenab 1940. Danach wurden praktische Aspekte in die neuen Disziplinennumerische Analysis und Informatik verbannt und hauptsächlichaußerhalb mathematischer Institute weiterentwickelt. Als unglückliches Ergebniszeigt sich heute, dass symbolische reine <strong>Mathematik</strong> und praktischenumerische <strong>Mathematik</strong> weit vonein<strong>and</strong>er entfernte Disziplinen sind undkaum zusammen gelehrt werden. Typischerweise treffen Studierende zuerstauf die Infinitesimalrechnung in ihrer reinen symbolischen Form und erstviel später, meist in <strong>and</strong>erem Zusammenhang, auf ihre rechnerische Seite.Dieser Vorgehensweise fehlt jegliche gesunde wissenschaftliche Motivationund sie verursacht schwere Probleme in Vorlesungen der Physik, Mechanikund angew<strong>and</strong>ten Wissenschaften, die auf mathematischen Modellenberuhen.


VorwortXIIIL f und K f (¯x), wohingegen die üblichen Definitionen mit Grenzwerten reinqualitativ arbeiten.Mit diesen strengeren Definitionen vermeiden wir pathologische Fälle,die Studierende nur verwirren können (besonders am Anfang). Und, wieausgeführt, vermeiden wir so den (schwierigen) Begriff des Grenzwerts, woin der Tat keine Grenzwertbildung stattfindet. Somit geben wir Studierendenkeine Definitionen der Stetigkeit und Differenzierbarkeit, die nahelegen, dass die Variable x stets gegen ¯x strebt,d.h.stetsein(merkwürdiger)Grenzprozess stattfindet. Tatsächlich bedeutet Stetigkeit doch, dassdie Differenz f(x)−f(¯x) klein ist, wenn x− ¯x klein ist und Differenzierbarkeitbedeutet, dass f(x) lokal nahezu linear ist. Und um dies auszudrücken,brauchen wir nicht irgendeine Grenzwertbildung zu bemühen.Diese Beispiele verdeutlichen unsere Philosophie, die Infinitesimalrechnungquantitativ zu formulieren, statt, wie sonst üblich, rein qualitativ.Und wir glauben, dass dies sowohl dem Verständnis als auch der Exaktheithilft und dass der Preis, der für diese Vorteile zu bezahlen ist, es wert istbezahlt zu werden, zumal die verloren gegangene allgemeine Gültigkeit nureinige pathologische Fälle von geringerem Interesse beinhaltet. Wir könnenunsere Definitionen natürlich lockern, zum Beispiel zur Hölder-Stetigkeit,ohne deswegen die quantitative Formulierung aufzugeben, so dass die Ausnahmennoch pathologischer werden.Die üblichen Definitionen der Stetigkeit und Differenzierbarkeit bemühensich um größtmögliche Allgemeinheit, eine der Tugenden der reinen <strong>Mathematik</strong>,die jedoch pathologische Nebenwirkungen hat. Bei einer praktischorientierten Herangehensweise wird die praktische Welt ins Interesse gestelltund maximale Verallgemeinerungen sind an sich nicht so wichtig.Natürlich werden auch bei uns Grenzwertbildungen beh<strong>and</strong>elt, aber nurin Fällen, in denen der Grenzwert als solches zentral ist. Hervorzuhebenist dabei die Definition einer reellen Zahl als Grenzwert einer Cauchy-Folgerationaler Zahlen und die Lösung einer algebraischen Gleichung oder Differentialgleichungals Grenzwert einer Cauchy-Folge von Näherungslösungen.Cauchy-Folgen spielen bei uns somit eine zentrale Rolle. Aber wir suchennach einer konstruktiven Annäherung mit möglichst praktischem Bezug,um Cauchy-Folgen zu erzeugen.In St<strong>and</strong>ardwerken zur Infinitesimalrechnung werden Cauchy-Folgen undLipschitz-Stetigkeit im Glauben, dass diese Begriffe zu kompliziert für Anfängerseien, nicht beh<strong>and</strong>elt, wohingegen der Begriff der reelle Zahlen undefiniertbleibt (offensichtlich glaubt man, dass ein Anfänger mit diesemBegriff von Kindesbeinen an vertraut sei, so dass sich jegliche Diskussionerübrige). Im Gegensatz dazu spielen diese Begriffe von Anfang an eineentscheidende Rolle in unserer praktisch orientierten Herangehensweise. ImBesonderen legen wir erhöhten Wert auf die grundlegenden Gesichtspunkteder Erzeugung reeller Zahlen (betrachtet als möglicherweise nie endendedezimale Entwicklung).


XIVVorwortWir betonen, dass eine konstruktive Annäherung das mathematischeLeben nicht entscheidend komplizierter macht, wie es oft von Formalisten/Logikernführender mathematischer Schulen betont wird: Alle wichtigenSätze der Infinitesimalrechnung und der linearen Algebra überleben,möglicherweise mit einigen unwesentlichen Änderungen, um den quantitativenGesichtspunkt beizubehalten und ihre Beweise strenger führen zukönnen. Als Folge davon können wir grundlegende Sätze wie den der implizitenFunktionen, den der inversen Funktionen, den Begriff des kontrahierendenOperators, die Konvergenz der Newtonschen Methode in mehrerenVariablen mit vollständigen Beweisen als Best<strong>and</strong>teil unserer Grundlagender Infinitesimalrechnung aufnehmen: Sätze, die in St<strong>and</strong>ardwerken als zuschwierig für dieses Niveau eingestuft werden.Beweise und SätzeDie meisten <strong>Mathematik</strong>bücher wie auch die über Infinitesimalrechnungpraktizieren den Satz-Beweis Stil, in dem zunächst ein Satz aufgestelltwird, der dann bewiesen wird. Dies wird von Studierenden, die oft ihreSchwierigkeiten mit der Art und Weise der Beweisführung haben, seltengeschätzt.Bei uns wird diese Vorgehensweise normalerweise umgekehrt. Wir formulierenzunächst Gedanken, ziehen Schlussfolgerungen daraus und stellendann den zugehörigen Satz als Zusammenfassung der Annahme und der Ergebnissevor. Unsere Vorgehensweise lässt sich daher eher als Beweis-SatzStil bezeichnen. Wir glauben, dass dies in der Tat oft natürlicher ist als derSatz-Beweis Stil, zumal bei der Entwicklung der Gedanken die notwendigenErgänzungen, wie Hypothesen, in logischer Reihenfolge hinzugefügt werdenkönnen. Der Beweis ähnelt dann jeder ansonsten üblichen Schlussfolgerung,bei der man ausgehend von einer Anfangsbetrachtung unter gewissenAnnahmen (Hypothesen) Folgerungen zieht. Wir hoffen, dass diese Vorgehensweisedas oft wahrgenommene Mysterium von Beweisen nimmt, ganzeinfach schon deswegen, weil die Studierenden gar nicht merken werden,dass ein Beweis geführt wird; es sind einfach logische Folgerungen wie imtäglichen Leben auch. Erst wenn die Argumentationslinie abgeschlossen istwird sie als Beweis bezeichnet und die erzielten Ergebnisse zusammen mitden notwendigen Hypothesen in einem Satz zusammengestellt. Als Folgedavon benötigen wir in der Latexfassung dieses Buches die Satzumgebung,aber nicht eine einzige Beweisumgebung; der Beweis ist nur eine logischeGedankenfolge, die einem Satz, der die Annahmen und das Hauptergebnisbeinhaltet, vorangestellt wird.


Das mathematische LaborVorwortXVWir haben unterschiedliche Software entwickelt, um unseren Lehrgang ineiner Art mathematischem Labor zu unterstützen. Einiges dieser Softwaredient der Veranschaulichung mathematischer Begriffe wie die Lösungvon Gleichungen, Lipschitz-Stetigkeit, Fixpunkt-Iterationen, Differenzierbarkeit,der Definition des Integrals und der Analysis von Funktionen mehrererVeränderlichen; <strong>and</strong>eres ist als Ausgangsmodell für eigene Computerprogrammevon Studierenden gedacht; wieder <strong>and</strong>eres, wie die Löser fürDifferentialgleichungen, sind für Anwendungen gedacht. Ständig wird neueSoftware hinzugefügt. Wir wollen außerdem unterschiedliche Multimedia-Dokumente zu verschiedenen Teilen des Stoffes hinzuzufügen.In unserem Lehrprogramm erhalten Studierende von Anfang an ein Trainingim Umgang mit MATLAB als Werkzeug für Berechnungen. Die Entwicklungpraktischer mathematischer Gesichtspunkte grundlegender Themenwie reelle Zahlen, Funktionen, Gleichungen, Ableitungen und Integralegeht H<strong>and</strong> in H<strong>and</strong> mit der Erfahrung, Gleichungen mit Fixpunkt-Iterationen oder der Newtonschen Methode zu lösen, der Quadratur, numerischenMethoden oder Differentialgleichungen. Studierende erkennenaus ihrer eigenen Erfahrung, dass abstrakte symbolische Konzepte tief mitpraktischen Berechnungen verwurzelt sind, was ihnen einen direkten Zugangzu Anwendungen in physikalischer Realität vermittelt.Besuchen sie http://www.phi.chalmers.se/bodysoul/Das Applied Mathematics: <strong>Body</strong> & <strong>Soul</strong> Projekt hat eine eigene Website,die zusätzliches einführendes Material und das mathematische Labor (MathematicsLaboratory) enthält. Wir hoffen, dass diese Website für Studierendezum sinnvollen Helfer wird, der ihnen hilft, den Stoff (selbständig) zuverdauen und durchzugehen. Lehrende mögen durch diese Website angeregtwerden. Außerdem hoffen wir, dass diese Website als Austauschforumfür Ideen und Erfahrungen im Zusammenhang mit diesem Projekt genutztwird und wir laden ausdrücklich Studierende und Lehrende ein, sich miteigenem Material zu beteiligen.AnerkennungDie Autoren dieses Buches möchten ihren herzlichen Dank an die folgendenKollegen und graduierten Studenten für ihre wertvollen Beiträge, Korrekturenund Verbesserungsvorschläge ausdrücken: Rickard Bergström, NiklasEriksson, Johan Hoffman, Mats Larson, Stig Larsson, Mårten Levenstam,Anders Logg, Klas Samuelsson und Nils Svanstedt, die alle aktiv an unse-


XVIVorwortrem Reformprojekt teilgenommen haben. Und nochmals vielen Dank allenStudierenden des Studiengangs zum Chemieingenieur an der Chalmers Universität,die damit belastet wurden, neuen, oft unvollständigen Materialienausgesetzt zu sein und die viel enthusiastische Kritik und Rückmeldunggegeben haben.Dem MacTutor Archiv für Geschichte der <strong>Mathematik</strong> verdanken wir diemathematischen Bilder. Einige Bilder wurden aus älteren Exemplaren desJahresberichts des Schwedischen Technikmuseums, Daedalus, kopiert.My heart is sad <strong>and</strong> lonelyfor you I sigh, dear, onlyWhy haven’t you seen itI’m all for you body <strong>and</strong> soul(Green, <strong>Body</strong> <strong>and</strong> <strong>Soul</strong>)


Inhalt B<strong>and</strong> 1Ableitungen und Geometrie imR 3 11 Was ist <strong>Mathematik</strong>? 31.1 Einleitung......................... 31.2 DiemoderneWelt .................... 31.3 DieRolleder<strong>Mathematik</strong>................ 101.4 EntwurfundHerstellungvonAutos........... 111.5 Wettervorhersagen und globale Erwärmung ...... 111.6 Navigation:VondenSternenzuGPS.......... 111.7 MedizinischeTomographie................ 131.8 Molekulare Dynamik und Arzneimittelforschung . . . . 131.9 Wirtschaft:AktienundOptionen............ 141.10 Sprachen.......................... 141.11 <strong>Mathematik</strong> als Wissenschaftssprache . . . . . . . . . . 151.12 Fundamentale Bereiche der <strong>Mathematik</strong> . . . . . . . . 161.13 WasistWissenschaft? .................. 171.14 WasistBewusstsein?................... 181.15 Wie man dieses Buch als Helfer begreift . . . . . . . . 192 Das mathematische Labor 232.1 Einleitung......................... 232.2 <strong>Mathematik</strong>erfahrung .................. 24


XVIII Inhalt B<strong>and</strong> 13 Einführung in die Modellbildung 293.1 Einleitung......................... 293.2 ModelleinerMittagssuppe................ 293.3 DasModellvomschlammigenHof ........... 323.4 EinGleichungssystem .................. 333.5 Gleichungen aufstellen und lösen ............ 344 Kurzer Kurs zur Infinitesimalrechnung 374.1 Einleitung......................... 374.2 AlgebraischeGleichungen ................ 384.3 Differentialgleichungen.................. 384.4 Verallgemeinerung .................... 444.5 DerJugendtraumvonLeibniz.............. 464.6 Zusammenfassung..................... 484.7 Leibniz........................... 495 Natürliche und ganze Zahlen 535.1 Einleitung......................... 535.2 Die natürlichenZahlen.................. 545.3 Gibt es eine größte natürliche Zahl? . . . . . . . . . . 575.4 Die MengeNaller natürlichenZahlen.......... 585.5 GanzeZahlen....................... 605.6 Absolutwert und Abst<strong>and</strong> zwischen Zahlen . . . . . . . 625.7 DivisionmitRest..................... 645.8 ZerlegunginPrimzahlen................. 655.9 GanzeZahlenimComputer ............... 666 Mathematische Induktion 696.1 Induktion . . . . . . . . . . . . . . . . . . . . . . . . . 696.2 Insektenpopulationen................... 747 Rationale Zahlen 797.1 Einleitung......................... 797.2 Wie die rationalen Zahlen konstruiert werden . . . . . 807.3 Zur Notwendigkeit der rationalen Zahlen . . . . . . . . 837.4 Dezimale Entwicklungen der rationalen Zahlen . . . . 837.5 Periodische Dezimaldarstellungen rationaler Zahlen . . 857.6 Mengenschreibweise.................... 897.7 Die MengeQderrationalenZahlen........... 907.8 Die rationale Zahlengerade und Intervalle . . . . . . . 907.9 Bakterienwachstum.................... 927.10 ChemischesGleichgewicht................ 938 Pythagoras und Euklid 978.1 Einleitung......................... 97


Inhalt B<strong>and</strong> 1XIX8.2 Der Satz von Pythagoras . . . . . . . . . . . . . . . . . 978.3 Die Winkelsumme in Dreiecken beträgt 180 ◦ ...... 998.4 ÄhnlicheDreiecke..................... 1018.5 Wann stehen zwei Gerade senkrecht? . . . . . . . . . . 1018.6 GPSNavigation...................... 1048.7 Geometrische Definition von sin(υ) und cos(υ)..... 1068.8 Geometrischer Beweis von Additionsformeln für cos(υ) 1078.9 Erinnerung an einige Flächenformeln.......... 1088.10 Griechische<strong>Mathematik</strong> ................. 1098.11 Die euklidische EbeneQ 2 ................ 1108.12 Von Pythagoras über Euklid zu Descartes . . . . . . . 1118.13 Nicht-euklidischeGeometrie............... 1129 Was ist eine Funktion? 1159.1 Einleitung......................... 1159.2 Funktionen im täglichenLeben ............. 1199.3 Darstellung von Funktionen ganzer Zahlen . . . . . . . 1229.4 Darstellung von Funktionen rationaler Zahlen . . . . . 1259.5 Eine Funktion zweier Variabler . . . . . . . . . . . . . 1279.6 Funktionen mehrerer Variabler . . . . . . . . . . . . . 12810 Polynomfunktionen 13110.1 Einleitung......................... 13110.2 LinearePolynome..................... 13210.3 ParalleleGeraden..................... 13610.4 SenkrechteGeraden.................... 13610.5 QuadratischePolynome ................. 13810.6 ArithmetikmitPolynomen ............... 14210.7 Graphen allgemeiner Polynome . . . . . . . . . . . . . 14810.8 Stückweise definierte Polynomfunktionen . . . . . . . . 15011 Kombinationen von Funktionen 15311.1 Einleitung......................... 15311.2 Summe zweier Funktionen und Produkt einerFunktionmiteinerZahl ................. 15411.3 Linearkombination von Funktionen . . . . . . . . . . . 15411.4 Multiplikation und Division von Funktionen . . . . . . 15511.5 RationaleFunktionen................... 15511.6 ZusammengesetzteFunktionen ............. 15712 Lipschitz-Stetigkeit 16112.1 Einleitung......................... 16112.2 Lipschitz-Stetigkeit einer linearen Funktion . . . . . . 16212.3 DefinitionderLipschitz-Stetigkeit............ 16312.4 Monome.......................... 167


XX Inhalt B<strong>and</strong> 112.5 Linearkombinationen von Funktionen . . . . . . . . . . 16912.6 BeschränkteFunktionen ................. 17012.7 Das Produkt von Funktionen . . . . . . . . . . . . . . 17212.8 Der Quotient von Funktionen . . . . . . . . . . . . . . 17312.9 ZusammengesetzteFunktionen ............. 17412.10 Funktionen zweier rationaler Variablen . . . . . . . . . 17512.11 Funktionen mehrerer rationaler Variablen . . . . . . . 17513 Folgen und Grenzwerte 17913.1 Ein erstes Treffen mit Folgen und Grenzwerten . . . . 17913.2 Ringschraubenschlüsselsatz ............... 18113.3 J.P. Johanssons verstellbarer Schraubenschlüssel . . . 18313.4 Die Macht der Sprache:Von unendlich Vielen zu Einem . . . . . . . . . . . . . 18313.5 Die ǫ − N Definition eines Grenzwertes . . . . . . . . . 18513.6 Konvergente Folgen haben eindeutige Grenzwerte . . . 18913.7 Lipschitz-stetige Funktionen und Folgen . . . . . . . . 18913.8 Verallgemeinerung auf Funktionen zweier Variablen . . 19113.9 BerechnungvonGrenzwerten .............. 19213.10 Computerdarstellung rationaler Zahlen . . . . . . . . . 19513.11 SonyaKovalevskaya ................... 19614 Wurzel Zwei 20114.1 √Einleitung......................... 20114.2 2istkeinerationaleZahl! ............... 20314.3 Berechnung von √ 2durchBisektion .......... 20414.4 Der Bisektionsalgorithmus konvergiert! . . . . . . . . . 20614.5 Erste Begegnung mit Cauchy-Folgen . . . . . . . . . . 20814.6 Berechnung von √ 2 mit dem Dekasektionsalgorithmus 20915 Reelle Zahlen 21315.1 Einleitung......................... 21315.2 Addition und Subtraktion reeller Zahlen . . . . . . . . 21515.3 Verallgemeinerung zur Lipschitz-stetigen Funktionf(x, ¯x) ........................... 21715.4 Multiplikation und Division reeller Zahlen . . . . . . . 21815.5 DerAbsolutbetrag .................... 21815.6 Vergleich zweier reeller Zahlen . . . . . . . . . . . . . . 21815.7 Zusammenfassung der Arithmetik reeller Zahlen . . . . 21915.8 Warum √ 2 √ 2gleich2ist ................ 21915.9 Betrachtungen über √ 2 ................. 22015.10 Cauchy-Folgen reeller Zahlen . . . . . . . . . . . . . . 22215.11 Erweiterung von f :Q→Q zu f :R→R ....... 22315.12 Lipschitz-Stetigkeit erweiterter Funktionen . . . . . . . 22315.13 Graphen von f :R→R ................. 224


Inhalt B<strong>and</strong> 1XXI15.14 Erweiterung einer Lipschitz-stetigen Funktion . . . . . 22415.15 IntervallereellerZahlen ................. 22615.16 Was ist f(x) für irrationales x? ............. 22715.17 Stetigkeit versus Lipschitz-Stetigkeit . . . . . . . . . . 22916 Bisektion für f(x)=0 23516.1 Bisektion ......................... 23516.2 EinBeispiel........................ 23716.3 Berechnungsaufw<strong>and</strong>................... 23917 Streiten <strong>Mathematik</strong>er?* 24317.1 Einleitung......................... 24317.2 DieFormalisten...................... 24617.3 Die Logiker und die Mengentheorie . . . . . . . . . . . 24617.4 DieKonstruktivisten................... 24917.5 Peano’sche Axiome für natürlicheZahlen........ 25117.6 ReelleZahlen ....................... 25217.7 Cantor versus Kronecker . . . . . . . . . . . . . . . . . 25317.8 Wann sind Zahlen rational oder irrational? . . . . . . . 25517.9 Die Menge aller möglichen Bücher ........... 25517.10 Rezepte und gutes Essen . . . . . . . . . . . . . . . . . 25617.11 Neue <strong>Mathematik</strong>“ in der Grundschule . . . . . . . . 257”17.12 Die Suche nach Stringenz in der <strong>Mathematik</strong> . . . . . 25817.13 Ein nicht konstruktiver Beweis . . . . . . . . . . . . . 25917.14 Zusammenfassung..................... 26018 Die Funktion y = x r 26518.1 Die Funktion √ x ..................... 26518.2 Rechnen mit der Funktion √ x .............. 26618.3 Ist √ x Lipschitz-stetig aufR + ?............. 26618.4 Die Funktion x r für rationales r = p q.......... 26718.5 Rechnen mit der Funktion x r .............. 26718.6 Verallgemeinerung der Lipschitz-Stetigkeit . . . . . . . 26718.7 Turbulente Strömung ist Hölder- (Lipschitz-)stetigzum Exponenten 1 3.................... 26819 Fixpunkte und kontrahierende Abbildungen 26919.1 Einleitung......................... 26919.2 Kontrahierende Abbildungen . . . . . . . . . . . . . . 27019.3 f(x) = 0 umformuliert zu x = g(x) ........... 27119.4 Kartenverkaufsmodell .................. 27219.5 Modell fürdasPrivateinkommen ............ 27319.6 Fixpunkt-Iteration im Kartenverkaufsmodell . . . . . . 27419.7 Eine kontrahierende Abbildunghat einen eindeutigen Fixpunkt . . . . . . . . . . . . . 278


XXII Inhalt B<strong>and</strong> 119.8 Verallgemeinerung auf g :[a,b] → [a,b] ......... 28019.9 Lineare Konvergenz der Fixpunkt-Iteration . . . . . . 28119.10 SchnellereKonvergenz .................. 28219.11 QuadratischeKonvergenz ................ 28320 Analytische Geometrie inR 2 28920.1 Einleitung......................... 28920.2 Descartes, Erfinder der analytischen Geometrie . . . . 29020.3 Descartes: Dualismus von Körper und Seele . . . . . . 29120.4 Die euklidische EbeneR 2 ................ 29220.5 Vermesser und Navigatoren . . . . . . . . . . . . . . . 29420.6 EinersterBlickaufVektoren .............. 29420.7 Geordnete Paare als Punkte oder Vektoren/Pfeile . . . 29620.8 Vektoraddition ...................... 29720.9 Vektoraddition und das Parallelogramm . . . . . . . . 29720.10 Multiplikation eines Vektors mit einer reellen Zahl . . 29820.11 DieNormeinesVektors ................. 29920.12 Polardarstellung von Vektoren . . . . . . . . . . . . . . 30020.13 St<strong>and</strong>ardisierte Basisvektoren . . . . . . . . . . . . . . 30220.14 Skalarprodukt....................... 30220.15 Eigenschaften des Skalarproduktes . . . . . . . . . . . 30320.16 Geometrische Interpretation des Skalarproduktes . . . 30420.17 Orthogonalität und Skalarprodukt . . . . . . . . . . . 30520.18 Projektion eines Vektors auf einen Vektor . . . . . . . 30720.19 Drehung um 90 ◦ ..................... 30920.20 Drehung um einen beliebigen Winkel θ ......... 31020.21 Nochmals Drehung um θ! ................ 31120.22 Drehung eines Koordinatensystems . . . . . . . . . . . 31220.23 Vektorprodukt ...................... 31220.24 Die Fläche eines Dreiecks mit einer Ecke im Ursprung 31420.25 FlächeeinesbeliebigenDreiecks............. 31520.26 Die Fläche eines durch zwei VektorenaufgespanntenParallelogramms............. 31620.27 Geraden.......................... 31720.28 Projektion eines Punktes auf eine Gerade . . . . . . . 31920.29 Wann sind zwei Geraden parallel? . . . . . . . . . . . . 31920.30 Ein System zweier linearen GleichungenmitzweiUnbekannten .................. 32020.31 Lineare Unabhängigkeit und Basis . . . . . . . . . . . 32220.32 Die Verbindung zur InfinitesimalrechnungeinerVariablen ...................... 32420.33 Lineare Abbildungen f :R 2 →R ............ 32420.34 Lineare Abbildungen f :R 2 →R 2 ............ 32420.35 Lineare Abbildungen und lineare Gleichungssysteme . 32520.36 Eine erste Begegnung mit Matrizen . . . . . . . . . . . 326


Inhalt B<strong>and</strong> 1XXIII20.37 Erste Anwendungen der Matrixschreibweise . . . . . . 32720.38 AdditionvonMatrizen.................. 32820.39 Multiplikation einer Matrix mit einer reellen Zahl . . . 32920.40 MultiplikationzweierMatrizen ............. 32920.41 Die Transponierte einer Matrix . . . . . . . . . . . . . 33020.42 Die Transponierte eines 2-Spaltenvektors . . . . . . . . 33120.43 DieEinheitsmatrix.................... 33120.44 DieInverseeinerMatrix................. 33120.45 Nochmals Drehung in Matrixschreibweise! . . . . . . . 33220.46 Eine Spiegelung in Matrixschreibweise . . . . . . . . . 33320.47 NochmalsBasiswechsel! ................. 33320.48 KöniginChristina..................... 33421 Analytische Geometrie inR 3 33921.1 Einleitung......................... 33921.2 Vektoraddition und Multiplikation mit einem Skalar . 34121.3 SkalarproduktundNorm................. 34121.4 Projektion eines Vektors auf einen Vektor . . . . . . . 34221.5 Der Winkel zwischen zwei Vektoren . . . . . . . . . . . 34321.6 Vektorprodukt ...................... 34421.7 Geometrische Interpretation des Vektorprodukts . . . 34521.8 Zusammenhang zwischen den VektorprodukteninR 2 undR 3 ....................... 34621.9 Volumen eines von drei Vektorenaufgespannten schiefen Würfels ............. 34721.10 Das Dreifach-Produkt a · b × c .............. 34821.11 Eine Formel für das von drei VektorenaufgespannteVolumen .................. 34821.12 Geraden.......................... 34921.13 Projektion eines Punktes auf eine Gerade . . . . . . . 35021.14 Ebenen........................... 35121.15 Schnitt einer Geraden mit einer Ebene . . . . . . . . . 35321.16 Zwei sich schneidende Ebenen ergeben eine Gerade . . 35321.17 Projektion eines Punktes auf eine Ebene . . . . . . . . 35421.18 Abst<strong>and</strong> zwischen Punkt und Ebene . . . . . . . . . . 35521.19 DrehungumeinenVektor ................ 35621.20 Unterräume........................ 35721.21 3 lineare Gleichungen mit 3 Unbekannten . . . . . . . 35721.22 Lösung eines 3 × 3 Systems durch Gauss-Elimination . 35921.23 3 × 3-Matrizen: Summe, Produkt und Transponierte . 36021.24 Betrachtungsweisen für lineare Gleichungssysteme . . . 36221.25 Nicht-singuläreMatrizen................. 36321.26 DieInverseeinerMatrix................. 36421.27 VerschiedeneBasen.................... 36421.28 Linear unabhängige Menge von Vektoren . . . . . . . . 365


XXIV Inhalt B<strong>and</strong> 121.29 Orthogonale Matrizen . . . . . . . . . . . . . . . . . . 36521.30 Lineare Abbildungen vs. Matrizen . . . . . . . . . . . . 36621.31 Das Skalarprodukt ist invariant unterorthogonalen Abbildungen . . . . . . . . . . . . . . . . 36721.32 Ausblick auf Funktionen f :R 3 →R 3 .......... 36822 Komplexe Zahlen 37122.1 Einleitung......................... 37122.2 Addition und Multiplikation . . . . . . . . . . . . . . . 37322.3 DieDreiecksungleichung................. 37422.4 OffeneGebiete ...................... 37422.5 Polardarstellung komplexer Zahlen . . . . . . . . . . . 37422.6 Geometrische Interpretation der Multiplikation . . . . 37522.7 KomplexeKonjugation.................. 37622.8 Division .......................... 37622.9 Der Fundamentalsatz der Algebra . . . . . . . . . . . . 37622.10 Wurzeln .......................... 37722.11 Lösung der quadratischen Gleichung w 2 +2bw + c = 0 37722.12 GöstaMittag-Leffler ................... 37823 Ableitungen 38123.1 Veränderungsraten .................... 38123.2 Steuernbezahlen ..................... 38223.3 W<strong>and</strong>ern.......................... 38523.4 DefinitionderAbleitung................. 38523.5 Die Ableitung einer linearen Funktion ist konstant . . 38823.6 Die Ableitung von x 2 ist 2x ............... 38923.7 Die Ableitung von x n ist nx n−1 ............. 39123.8 Die Ableitung von 1 x ist − 1 xfür x ≠0......... 391223.9 DieAbleitungalsFunktion ............... 39123.10 Schreibweise der Ableitung von f(x) alsDf(x) .... 39223.11 Schreibweise der Ableitung von f(x) als dfdx...... 39323.12 Ableitung als Grenzwert von Differenzenquotienten . . 39423.13 Wie wird die Ableitung berechnet? . . . . . . . . . . . 39623.14 Gleichmäßige Differenzierbarkeit auf einem Intervall . 39823.15 Eine beschränkte Ableitung impliziertLipschitz-Stetigkeit.................... 39923.16 Einetwas<strong>and</strong>ererBlickwinkel.............. 40023.17 Swedenborg........................ 40124 Ableitungsregeln 40524.1 Einleitung......................... 40524.2 Regel für Linearkombinationen . . . . . . . . . . . . . 40624.3 Produktregel ....................... 40724.4 Kettenregel ........................ 408


Inhalt B<strong>and</strong> 1XXV24.5 Quotientenregel...................... 41024.6 Ableitungen von Ableitungen: f (n) = D n f = dn fdx. . . 411n24.7 EinseitigeAbleitungen.................. 41224.8 Quadratische Näherung: Taylor-Formel zweiter Ordnung 41224.9 Ableitung einer inversen Funktion . . . . . . . . . . . . 41524.10 ImpliziteAbleitung.................... 41624.11 PartielleAbleitung .................... 41724.12 Zwischenbilanz ...................... 41925 Die Newton-Methode 42125.1 Einleitung......................... 42125.2 Konvergenz der Fixpunkt-Iteration . . . . . . . . . . . 42125.3 DieNewton-Methode................... 42225.4 Die Newton-Methode konvergiert quadratisch . . . . . 42325.5 Geometrische Interpretation der Newton-Methode . . . 42425.6 Wie groß ist der Fehler einer Nullstellennäherung? . . 42525.7 Endkriterium ....................... 42825.8 Global konvergente Newton-Methoden . . . . . . . . . 42826 Galileo, Newton, Hooke, Malthus und Fourier 43126.1 Einleitung......................... 43126.2 NewtonsBewegungsgesetz................ 43226.3 Galileos Bewegungsgesetze . . . . . . . . . . . . . . . . 43326.4 DasHookescheGesetz .................. 43626.5 Newtonsches Gesetz plus Hookesches Gesetz . . . . . . 43726.6 Fouriersches Gesetz der Wärmeausbreitung . . . . . . 43826.7 Newton und der Raketenantrieb . . . . . . . . . . . . . 43926.8 Malthus und Populationswachstum . . . . . . . . . . . 44026.9 Einsteinsches Bewegungsgesetz . . . . . . . . . . . . . 44226.10 Zusammenfassung..................... 443Literaturverzeichnis 447Sachverzeichnis 449


B<strong>and</strong> 1AbleitungenundGeometrie imR 3|u(x j ) − u(x j−1 )|≤L u |x j − x j−1 |u(x j ) − u(x j−1 ) ≈ u ′ (x j−1 )(x j − x j−1 )a · b = a 1 b 1 + a 2 b 2 + a 3 b 3


1Was ist <strong>Mathematik</strong>?Die Frage nach den ultimativen Grundlagen und der ultimativenBedeutung der <strong>Mathematik</strong> bleibt offen; wir wissen nicht, in welcheRichtung eine endgültige Lösung zu finden sein wird oder obeine letzte objektive Antwort überhaupt existiert. ”Mathematisierung“mag eine kreative Tätigkeit mit einzigartiger Orginalität fürMenschen, wie Sprache oder Musik sein deren historische Entscheidungeneiner vollständigen objektiven Rationalisierung widerstehen.(Weyl)1.1 EinleitungZunächst beginnen wir mit einer kurzen Vorstellung der <strong>Mathematik</strong> undder Rolle der <strong>Mathematik</strong> in unserer Gesellschaft.1.2 Die moderne Welt: Automatisierte Produktionund DatenverarbeitungDie Massenproduktion der industriellen Gesellschaft wurde durch automatisierteMassenproduktion materieller Güter wie Lebensmittel, Kleidungsstücke,Wohnungen, Fernseher, CD-Spieler und Autos ermöglicht. Wenndiese Güter von H<strong>and</strong> hergestellt werden müssten, wären sie Privilegieneiniger weniger.


4 1. Was ist <strong>Mathematik</strong>?Abb. 1.1. Erstes Bild zur Buchdrucktechnik (von Danse Macabre, Lyon 1499)Ganz analog beruht die aufkommende Informationsgesellschaft auf demMassenkonsum automatisierter Datenverarbeitung durch Computer. Sie erzeugteine neue ”virtuelle Realität“, revolutioniert Technik, Kommunikation,Verwaltung, Wirtschaft, Medizin und Unterhaltungsindustrie. Die Informationsgesellschaftbietet nicht-materielle Güter in Form von Wissen,Information, Belletristik, Filme, Spiele und Kommunikationsmittel. Dermoderne PC oder Laptop ist ein mächtiges Datenverarbeitungsgerät zurMassenproduktion und zum Massenkonsum von Informationen, sei es inForm von Wörtern, Bildern, Filmen oder Musik.Schlüsselschritte für die Automatisierung oder Mechanisierung der Produktionwaren: Gutenbergs Erfindung des Buchdrucks (Deutschl<strong>and</strong>, 1450),die automatische Maschine für Uhrenzahnräder von Christoffer Polhem(Schweden, 1700), die spinnende Jenny (Engl<strong>and</strong>, 1764), der mit Lochkartengesteuerte Webstuhl von Jacquard (Frankreich, 1801) und FordsFließb<strong>and</strong> (USA, 1913), vgl. Abb. 1.1, Abb. 1.2 und Abb. 1.3.Schlüsselschritte bei der Automatisierung der Datenverarbeitung waren:Der Abacus (antikes Griechenl<strong>and</strong>, Römisches Reich), der Rechenschieber(Engl<strong>and</strong>, 1620), Pascals mechanischer Rechner (Frankreich, 1650), dieDifferenzenmaschinen von Babbage (Engl<strong>and</strong>, 1830) und Scheutz (Schweden,1850), der Electronic Numerical Integrator <strong>and</strong> Computer (ENIAC)(USA, 1945) und der Personal Computer (PC) (USA, 1980), vgl. Abb. 1.5,Abb. 1.6, Abb. 1.7 und Abb. 1.8.Die Differenzenmaschine konnte einfache Differentialgleichungen lösenund wurde für die Berechnung von Computertabellen von Elementarfunktionenwie dem Logarithmus benutzt. ENIAC war einer der ersten modernenComputer (elektronisch und programmierbar). Er best<strong>and</strong> aus 18000Vakuumröhren auf 140 Quadratmetern mit einem Gewicht von 30 Ton-


1.2 Die moderne Welt 5Abb. 1.2. Christoffer Polhems Maschine für Uhrenzahnräder (1700), die spinnendeJenny (1764) <strong>and</strong> Jaquards programmierbarer Webstuhl (1801)


6 1. Was ist <strong>Mathematik</strong>?Abb. 1.3. Fords Fließb<strong>and</strong> (1913)Abb. 1.4. Rechenhilfe der Inkakulturnen und hatte einen Energieverbrauch von ca. 200 Kilowatt. Er wurde alswesentlicher Teil der Bemühungen der Alliierten im Zweiten Weltkrieg benutzt,um Differentialgleichungen für ballistische Tabellen zu berechnen.EinmodernerLaptopfür ca. 2000 Euro, einem 2 GHz Prozessor und512 MByte internem Speicher besitzt die hunderttausendfache Verarbeitungsfähigkeiteiner ENIAC.


1.2 Die moderne Welt 7Abb. 1.5. Klassische Rechenhilfen: Abacus (300 v.Chr.-), Galileos Kompass(1597) und Rechenschieber (1620-)


8 1. Was ist <strong>Mathematik</strong>?Abb. 1.6. Napiers Rechenstäbchen (1617), Pascals mechanischer Rechner (1630),Babbages Differenzenmachine (1830) und schwedische Differenzenmachine vonScheutz (1850)


1.2 Die moderne Welt 9Abb. 1.7. Odhners mechanischer Rechner, der in Göteburg, Schweden, zwischen1919–1950 hergestellt wurdeAbb. 1.8. ENIAC Electronic Numerical Integrator <strong>and</strong> Calculator (1945)


10 1. Was ist <strong>Mathematik</strong>?Automatisierung beruht auf der häufigen Wiederholung eines bestimmtenAlgorithmuses oder Schemas mit immer neuen Daten. Der Algorithmuskann aus einer Folge relativ einfacher Schritte bestehen, die zusammeneinen komplizierten Prozess bilden. Bei der automatisierten Fabrikation,wie etwa beim Fließb<strong>and</strong> in der Automobilindustrie, wird physikalischesMaterial entsprechend einem strengen Ablaufplan verändert. In der automatisiertenDatenverarbeitung werden die 1en und 0en des Mikroprozessorsin jeder Sekunde milliardenfach verändert, so wie es ein Computerprogrammvorgibt. Ganz ähnlich kann die genetische Information eines Organismusesals Algorithmus zur Erzeugung eines lebenden Wesens, wenn wirnur das Wechselspiel mit seiner Umgebung sehen, betrachtet werden. Einegenetische Information mehrfach (mit kleinen Veränderungen) zu realisieren,erzeugt eine Population. Massenproduktion ist der Schlüssel zu immerkomplizierteren Strukturen in Anlehnung an die Natur: Elementarteilchen→ Atom → Molekül und Molekül → Zelle → Lebewesen → Populationoder das Muster unserer Gesellschaft: Individuum → Gruppe → Gesellschaftoder Computer → Computernetzwerk → globales Netz.1.3 Die Rolle der <strong>Mathematik</strong><strong>Mathematik</strong> kann als Rechensprache aufgefasst werden und ist deshalb zentralfür die moderne Informationsgesellschaft. <strong>Mathematik</strong> ist auch Wissenschaftsspracheund deshalb zentral für die industrielle Gesellschaft, dieaus der wissenschaftlichen Revolution im 17. Jahrhundert, die von Leibnizund Newton mit der Formulierung der Infinitesimalrechnung eingeläutetwurde, erwuchs. Mit Hilfe der Infinitesimalrechnung konnten die grundlegendenGesetze der Mechanik und der Physik, wie etwa das NewtonscheGesetz, formuliert werden; als mathematische Modelle in Form von Differentialgleichungen.Mit Hilfe dieser Modelle konnten reale Phänomenevorausberechnet (simuliert) und (mehr oder weniger) kontrolliert werdenund industrielle Prozesse konnten darauf begründet werden.Der Massenkonsum materieller wie auch nicht-materieller Güter, der alsEckstein unserer modernen demokratischen Gesellschaft angesehen wird,wurde durch die Automatisierung der Produktion wie der Datenverarbeitungerst ermöglicht. Deswegen ist <strong>Mathematik</strong> zentral für die technischenMöglichkeiten unserer modernen Gesellschaft, die sich um automatisierteProduktion materieller Güter und automatisierte Datenverarbeitung vonInformationen dreht.Die Vision einer virtuellen Realität, die auf automatisierten Berechnungenberuht, wurde bereits von Leibniz im 17. Jahrhundert formuliert undvon Babbage ab 1830 mit seiner analytischen Maschine weiterentwickelt.Diese Vision wird schließlich im modernen Computerzeitalter verwirklicht,in der Synthese von <strong>Body</strong> <strong>and</strong> <strong>Soul</strong> der <strong>Mathematik</strong>.


1.4 Entwurf und Herstellung von Autos 11Wir geben im Folgenden einige Beispiele für den heutigen Gebrauch der<strong>Mathematik</strong>, die auf unterschiedliche Arten mit automatisierter Datenverarbeitungverknüpft sind.1.4 Entwurf und Herstellung von AutosIn der Automobilindustrie können Fahrzeugteile oder komplette Automobilemit Hilfe des Computer Aided Designs CAD modelliert werden. DasCAD-Modell beschreibt die Geometrie des Automobils in mathematischenAusdrücken und das Modell kann am Bildschirm dargestellt werden. DieEigenschaften des Entwurfs können in Computersimulationen getestet werden,wozu Differentialgleichungen auf Hochleistungsrechnern gelöst werden,wobei das CAD-Modell die Eingabe der geometrischen Daten liefert. DieCAD-Daten können ferner direkt bei der automatisierten Produktion verwendetwerden. Diese neue Technik revolutioniert die komplette industrielleHerstellung vom Entwurf bis zur Montage.1.5 Wettervorhersagen und globale ErwärmungWettervorhersagen benötigen die Lösung von Differentialgleichungen, diedie Vorgänge in der Atmosphäre beschreiben, auf Supercomputern. Einigermaßenverlässliche tägliche Wettervorhersagen werden routinemäßig fürdie Zeiträume von einigen wenigen Tagen durchgeführt. Mit der Längedes Zeitraums nimmt die Verlässlichkeit schnell ab und mit den aktuellverfügbaren Rechnern sind Tagesvorhersagen für die nächsten zwei Wochenunmöglich.Dagegen lassen sich Durchschnittswerte für die Temperatur und die Niederschlagsmengemit der heute verfügbaren Rechenleistung über Monatevorhersagen, was auch routinemäßig durchgeführt wird.Jahresdurchschnittstemperaturen werden in Langzeitstudien über 20–50 Jahre ebenfalls durchgeführt, um Klimaveränderungen, wie die globaleErwärmung, durch die Nutzung fossiler Brennstoffe, vorherzusagen. DieVerlässlichkeit dieser Simulationen wird diskutiert.1.6 Navigation: Von den Sternen zu GPSSeit den Babyloniern war die Navigation mit Hilfe der Planeten, der Sterne,dem Mond und der Sonne die treibende Kraft hinter der Entwicklungder Geometrie und der <strong>Mathematik</strong>. Mit einer Uhr, einem Sextanten undmathematischen Tabellen konnten die Seefahrer im 18. Jahrhundert ihrePosition mehr oder weniger genau bestimmen. Aber das Ergebnis hing


12 1. Was ist <strong>Mathematik</strong>?stark von der Genauigkeit der Uhr und den Beobachtungen ab und schnellhatten sich große Fehler eingeschlichen. In der Vergangenheit war NavigationnieeineeinfacheSache.Abb. 1.9. GPS-System mit 4 SatellitenWährend des letzten Jahrzehnts wurden die klassischen Navigationsmethodendurch GPS, dem Global Positioning System, ersetzt. Mit einemGPS-Gerät, das für einige hundert Euro erworben werden kann, zur H<strong>and</strong>können wir unsere Koordinaten (Länge und Breite) mit einem Knopfdruckauf 50 m genau bestimmen. GPS basiert auf einer einfachen mathematischenMethode, die schon den Griechen bekannt war: Wenn wir unserenAbst<strong>and</strong> zu drei Punkten mit bekannten Koordinaten im Raum kennen,können wir unsere Position berechnen. GPS macht sich dieses Prinzip zunutzeund misst den Abst<strong>and</strong> zu drei Satelliten mit bekannten Positionenund errechnet daraus seine eigene Position. Um diese Technik zu nutzen,müssen wir Satelliten ins All schießen, sie in Zeit und Raum exakt verfolgenund die entsprechenden Abstände messen. Dies wurde erst im letzten Jahrzehntmöglich. Natürlich werden die Satelliten durch Computer gesteuertund der Mikroprozessor im GPS in unserer H<strong>and</strong> misst den Abst<strong>and</strong> undberechnet daraus die Koordinaten.GPS hat die Tür zum Massenkonsum in der Navigation aufgestoßen, wasvorher das Privileg einiger weniger war.


1.7 Medizinische Tomographie1.7 Medizinische Tomographie 13Der Computertomograph erzeugt ein Bild über des Innere eines menschlichenKörpers, indem er eine bestimmt Integralgleichung in sehr komplexenBerechnungen löst. Die Daten werden aus der Abschwächung sehr schwacherRöntgenstrahlen, die durch den Körper aus verschiedenen Richtungengeschickt werden, erhalten. Diese Technik eröffnet den Massenkonsum medizinischerBilder und veränderte radikal die medizinische Forschung undDiagnose.Abb. 1.10. Medizinischer Tomograph1.8 Molekulare Dynamikund ArzneimittelforschungDie traditionelle Art neue Arzneimittel zu entdecken ist sehr kosten- undzeitintensiv. Zunächst werden geeignete organisch-chemische Substanzen,etwa in den Regenwäldern Südamerikas, gesucht. Wurde so eine neue organischeVerbindung entdeckt, wird sie von Arzneimittel- und Chemieunternehmenlizenziert und in breit angelegten Laborversuchen wird ihreBrauchbarkeit untersucht. Wie Verbindungen interagieren können und welcheWechselwirkungen für die Beherrschung von Krankheiten oder für dieLinderung körperlicher Beschwerden wahrscheinlich sinnvoll sein mögen,verlangt ein immenses Expertenwissen organischer Chemiker. Dieses Expertenwissenist notwendig, um die Zahl der durchzuführenden Laborversucheeinzuschränken. Ansonsten wäre die Vielzahl an Möglichkeitenüberwältigend.Die Nutzung von Computern bei der Suche nach neuen Arzneimittelnnimmt sehr rasch zu. Ihr Einsatzgebiet ist die Entdeckung neuer Verbindun-


14 1. Was ist <strong>Mathematik</strong>?gen ohne teure Expeditionen im südamerikanischen Regenwald. Bei dieserSuche kann der Computer bereits mögliche Konfigurationen von Molekülenklassifizieren und wahrscheinliche Wechselwirkungen vorhersagen, was dieZahl der Laborversuche drastisch verringert.Abb. 1.11. Das Valiummolekül1.9 Wirtschaft: Aktien und OptionenDas Modell von Black-Scholes zur Bewertung von Optionen hat einen neuenMarkt für sogenannte Derivate als Ergänzung zum Aktienmarkt erzeugt.Optionen richtig zu bewerten, ist mathematisch kompliziert und sehr rechenintensivund Börsenmakler mit exzellenter Software (mit Antwortzeitenvon Sekunden) haben klare H<strong>and</strong>elsvorteile.1.10 Sprachen<strong>Mathematik</strong> ist eine Sprache. Es gibt viele unterschiedliche Sprachen. UnsereMuttersprache, sei es nun Englisch, Schwedisch, Deutsch etc., ist unserewichtigste Sprache, die ein dreijähriges Kind bereits ziemlich gut be-


1.11 <strong>Mathematik</strong> als Wissenschaftssprache 15herrschen kann. In der angeborenen Sprache schreiben zu lernen, erfordertgrößere Mühe und nimmt einen Großteil der ersten Schuljahre ein. In einerFremdsprache sprechen und schreiben zu lernen, ist ein wichtiger Best<strong>and</strong>teileiner höheren Schulbildung.Sprache wird für die Kommunikation mit <strong>and</strong>eren Menschen, um zusammenzuarbeiten,Erfahrungen auszutauschen oder Kontrolle auszuüben,benötigt. Mit der Entwicklung moderner Kommunikationsmittel wird dieKommunikationen in unsere Gesellschaft zunehmend wichtiger.Mit Hilfe von Sprache können wir Modelle für interessante Phänomeneaufstellen und an H<strong>and</strong> dieser Modelle können wir diese Phänomene besserverstehen oder vorhersagen. Innerhalb eines Modells können weitere Modellezur Analyse, d.h. zur genaueren Untersuchung, einzelner Teile aufgestelltwerden, oder wir können Modelle für das Wechselspiel verschiedener Teilein einer Synthese zum Verständnis des Ganzen zusammenführen. EinRoman ist wie ein Modell der realen Welt, ausgedrückt in einer geschriebenenSprache, etwa in Deutsch. In einem Roman können die Charaktereder Romanfiguren analysiert werden und zwischenmenschliche Beziehungenkönnen dargestellt und untersucht werden.Ameisen in einem Ameisenhaufen oder Bienen in einem Bienenstockhaben auch eine Sprache zur Kommunikation. Tatsächlich findet man inder modernen Biologie auch die Formulierung ”mitein<strong>and</strong>er reden“ für dieWechselwirkung von Zellen und Proteinen unterein<strong>and</strong>er.Es hat den Anschein, dass menschliche Wesen ihre Sprache benutzen,wenn sie denken, und dass wir im Gehirn Sprache als Modell verwenden,wenn wir verschiedene Möglichkeiten in Gedankenspielen (Simulationen)durchgehen: ”Wenn das passiert, dann tue ich das und wenn stattdessenjenes eintritt, werde ich so und so h<strong>and</strong>eln . . .“. Unseren Tagesablauf zuplanen oder unsere Terminplanung kann ebenso als eine Art von Modellierungund Simulation von Ereignissen betrachtet werden. Simulationen,bei denen wir unsere Sprache einsetzen, scheinen in unserem Kopf ständigabzulaufen.Es gibt auch <strong>and</strong>ere Sprachen, wie die Sprache der Musik mit ihrer Notationin Noten, Takten, Pausen usw. Eine Partitur ist wie ein Modell für dieeigentliche Musik. Für einen geübten Komponisten kann das Modell dergeschriebenen Partitur der gespielten Musik sehr nahe kommen. Für Amateuremag die Partitur nichts-sagend sein, weil sie wie eine Fremdspracheist, die nicht verst<strong>and</strong>en wird.1.11 <strong>Mathematik</strong> als Wissenschaftssprache<strong>Mathematik</strong> ist als Wissenschaftssprache und Technologiesprache für dieMechanik, Astronomie, Physik, Chemie und Disziplinen wie Strömungs-,Festkörpermechanik, Elektromagnetik usw. bezeichnet worden. Die mathe-


16 1. Was ist <strong>Mathematik</strong>?matische Sprache wird eingesetzt im Umgang mit geometrischen Begriffenwie Position, Form und mechanischen Begriffe wie Geschwindigkeit, Kraftund Feld. Ganz allgemein dient <strong>Mathematik</strong> jenen Bereichen als Sprache,die mit Zahlen beschrieben werden, für quantitative Gesichtspunkte, wiedie Wirtschaft, die Buchhaltung, die Statistik usw. <strong>Mathematik</strong> dient alsGrundlage für die modernen elektronischen Kommunikationsmittel,woInformationals Folge von 0en und 1en kodiert, übertragen, verändert undgespeichert wird.Worte der mathematischen Sprache werden oft unserer normalen Spracheentnommen, wie Punkt, Gerade, Kreis, Geschwindigkeit, Funktion, Abbildung,Grenzen, Folgen, Gleichheit, Ungleichheit usw.Ein mathematisches Wort, Ausdruck oder Begriff sollte eine spezifischeBedeutung haben, die mit <strong>and</strong>eren schon bekannten Begriffen und Ausdrückendefiniert wird. Dasselbe Prinzip findet sich im Thesaurus, wo relativkomplizierte Worte mit Hilfe einfacherer Worte erklärt werden. AmAnfang solcher Definitionsketten werden gewisse fundamentale Worte oderAusdrücke benutzt, die nicht mit Hilfe bereits definierter Werte definierbarsind. Grundlegende Zusammenhänge zwischen fundamentalen Begriffenkönnen in Axiomen beschrieben werden. Grundlegende Begriffe der euklidischenGeometrie sind der Punkt und die Gerade, und ein grundlegendeseuklidisches Axiom besagt, dass jedes Paar verschiedener Punkte genaudurch eine Gerade verbunden werden kann. Ein Satz ist eine Aussage, dieaus Axiomen oder <strong>and</strong>eren Sätzen durch logisches Überlegen gefolgert wird.Diese Folgerung wird Beweis des Satzes genannt.1.12 Fundamentale Bereiche der <strong>Mathematik</strong>Fundamentale Bereiche der <strong>Mathematik</strong> sind Geometrie Algebra Analysis.Geometrie beschäftigt sich mit Objekten wie Geraden, Dreiecken und Kreisen.Algebra und Analysis arbeiten mit Zahlen und Funktionen. Grundbereicheder mathematischen Ausbildung in den Ingenieurs- oder den Naturwissenschaftensind Infinitesimalrechnung Lineare Algebra.Infinitesimalrechnung ist ein Zweig der Analysis, der sich mit Eigenschaftenvon Funktionen wie Stetigkeit und Operationen auf Funktionen wie


1.13 Was ist Wissenschaft? 17Ableitung und Integration ausein<strong>and</strong>er setzt. Infinitesimalrechnung ist inder Untersuchung linearer Funktionen oder linearer Abbildungen mit derlinearen Algebra verbunden und mit der analytischen Geometrie, die geometrischeFragen algebraisch formuliert. Fundamentale Bereiche der Infinitesimalrechnungsind: Funktion Ableitung Integral.Lineare Algebra kombiniert Geometrie und Algebra und ist verbunden mitder analytischen Geometrie. Grundbegriffe der linearen Algebra sind Vektor Vektorraum Projektion, Orthogonalität lineare Abbildung.Dieses Buch lehrt die Grundlagen der Infinitesimalrechnung und der linearenAlgebra, die den mathematischen Unterbau für die meisten Anwendungenbilden.1.13 Was ist Wissenschaft?Die beiden Komponenten Gleichungen aufstellen (Modellierung) Gleichungen lösen (Berechnung)können als theoretischer Kern der Naturwissenschaften angesehen werden.Zusammen bilden sie die Substanz der mathematischen Modellierung undder rechnergestützten mathematischen Modellierung. Der erste wirklich großeTriumph der Naturwissenschaften und der mathematischen Modellierungist das Newtonsche Modell. Darin wird unser Planetensystem als einSatz von Differentialgleichungen beschrieben, entsprechend dem NewtonschenGesetz, das Beschleunigung und Kraft, invers proportional zum Quadratdes Abst<strong>and</strong>s, in Zusammenhang stellt. Ein Algorithmus kann als eineVorgehensweise oder praktische Vorschrift für die Lösung einer gegebenenGleichung durch Berechnung angesehen werden. Durch Anwendung einesAlgorithmuses und seine Berechnung können reale Phänomene simuliertund Vorhersagen getroffen werden.


18 1. Was ist <strong>Mathematik</strong>?Traditionelle Rechentechniken waren symbolische oder numerische Rechnungenmit Papier und Bleistift, Tabellen, Rechenschieber und mechanischerRechenmaschine. Automatisierte Berechnungen mit Computern,Analoga des natürlichen Prinzips der ständigen Wiederholung einfacherOperationen, öffnen uns neue Simulationsfelder für reale Phänomene undmögliche Anwendungen ergeben sich schnell in Naturwissenschaften, Technik,Medizin und Wirtschaft.<strong>Mathematik</strong> ist die Grundlage für (i) die Formulierung wie (ii) die Lösungvon Gleichungen. <strong>Mathematik</strong> liefert die Sprache, um Gleichungen aufzustellenund Werkzeuge, um sie zu lösen.Mathematischen Ruhm erlangt man durch das Aufstellen oder Lösenvon Gleichungen. Der Erfolg manifestiert sich üblicherweise darin, dass dieGleichung oder die Lösungsmethode mit dem Namen des Erfinders verknüpftwird. Beispiele par excellence sind: Newtonsche Methode, Euler-Gleichungen, Lagrange-Gleichung, Poisson-Gleichung, Laplace-Gleichung,Navier-Gleichung, Navier-Stokes-Gleichungen, Boussinesq-Gleichung, Einstein-Gleichung,Schrödinger-Gleichung,Black-Scholes-Formel....Aufdiemeisten werden wir im Folgenden wieder finden.1.14 Was ist Bewusstsein?Man glaubt, dass Hirnaktivitäten aus elektrischen/chemischen Signalen/Wellenbestehen, die Milliarden von Synapsen zu einer Art Berechnungin großem Maßstab verbinden. Die Frage nach dem menschlichen Bewusstseinhat in der Entwicklung der menschlichen Kulturen seit den antikenGriechen eine zentrale Rolle gespielt und heutzutage versuchen Informatikersein nicht fassbares Wesen in verschiedenen Ausprägungen künstlicherIntelligenz einzufangen. Die Vorstellung, dass sich Gehirnaktivitätenin einen (kleinen) bewussten rationalen“ Teil und einen (großen) unbewusstenirrationalen“ Teil einteilen lassen, ist seit den Tagen von Freud weit-””hin akzeptiert. Der rationale Teil ist für die Analyse“ und die Kontrolle“” ”im Hinblick auf einen Sinn“ zuständig und übernimmt somit die Rolle”der Seele. Der Großteil der Berechnung“ wird dem Körper in dem Sinnezugeordnet, dass er nur“ aus elektrischen/chemischen Wellen besteht.””Wir treffen dieselben Gesichtspunkte in der numerischen Optimierung wieder,wobei der Optimierungsalgorithmus die Rolle der Seele spielt, die dieBerechnungsbemühungen zu einem Ziel drängt, wohingegen die zugrundeliegenden Berechnungen die Rolle des Körpers übernehmen.Wir wurden in dem Gedanken erzogen, dass das Bewusstsein die geistigenBerechnungen“ kontrolliert, aber wir wissen, dass dies oft nicht der Fall ist.”In der Tat scheinen wir ausgesprochene Fähigkeiten bei der nachträglichenRationalisierung entwickelt zu haben: Was auch immer passiert, außer eswar ein Unfall“ oder etwas völlig Unerwartetes“, wird von uns als Folge” ”


1.15 Wie man dieses Buch als Helfer begreift 19eines zuvor ausgedachten rationalen Plans gedeutet. Somit verw<strong>and</strong>eln wira posteriori Beobachtungen in a priori Vorhersagen.1.15 Wie man mit Verständnisschwierigkeitenzum Stoff zurecht kommt und dieses Buchsogar als sinnvollen Helfer begreifen kannWir wollen dieses einleitende Kapitel mit einigen Vorschlägen abschließen,die dem Leser/der Leserin helfen sollen, die Herausforderung zu meistern,dieses Buches zum ersten Mal zu lesen und gedanklich sogar so weit zukommen, dieses Buch als sinnvollen Helfer statt als Gegenteil zu betrachten.Aus unserer Lehrerfahrung mit dem Stoff in diesem Buch wissen wir, dasses eine ziemliche Frustration und negative Empfindungen hervorrufen kann,die nicht sehr hilfreich sind.<strong>Mathematik</strong> ist schwierig: Stecken Sie Sich eigene ZieleZunächst einmal müssen wir zugeben, dass <strong>Mathematik</strong> ein schwierigesFach ist: Daran führt kein Weg vorbei. Außerdem sollte man sich klardarüber werden, dass ein glückliches Leben mit einer akademischen oderindustriellen Karriere auch möglich ist, wenn man nur Grundkenntnissein <strong>Mathematik</strong> besitzt. Dafür gibt es viele Beispiele, auch unter Nobelpreisträgern.Somit ist es ratsam, sich ein Ziel für das Studium der <strong>Mathematik</strong>zu stecken, das realistisch ist und Interesse und Neigungen einzelnerStudierender entspricht. Viele Studierende der Ingenieurwissenschaftenhaben <strong>and</strong>ere vorrangige Ziele als die <strong>Mathematik</strong>, aber es gibt auch Studierende,die <strong>Mathematik</strong> und theoretische ingenieurwissenschaftliche Gebiete,die <strong>Mathematik</strong> benutzen, mögen. Somit wird bei einer Gruppe vonStudierenden, die einem Kurs zu diesem Buch folgen, das mathematischeInteresse sehr unterschiedlich sein und es ist nur angemessen, wenn dies beider Zielsetzung berücksichtigt wird.Fortgeschrittene Studien: Bleiben Sie offen und zuversichtlichDas Buch enthält ziemlich viel Material für ”Fortgeschrittene“, das üblicherweisein einführenden <strong>Mathematik</strong>kursen nicht zu finden ist. Das kannman überspringen und dabei doch glücklich bleiben. Es ist wahrscheinlichbesser mit einer kleinen Menge mathematischer Werkzeuge richtig vertrautzu sein und diese auch zu verstehen und daraus die Fähigkeit zu ziehen,sich mit Selbstvertrauen neuen Herausforderungen zu stellen, als wiederund wieder daran zu scheitern, eine zu große Portion zu verdauen. <strong>Mathematik</strong>ist so reichhaltig, dass selbst ein Vollzeitstudium nur einen kleinen


20 1. Was ist <strong>Mathematik</strong>?Bereich abdecken kann. Die wichtigste Fähigkeit muss sein, neuen Stoffoffen und mit etwas Zuversicht anzugehen!Einige Teile der <strong>Mathematik</strong> sind einfachAuf der <strong>and</strong>eren Seite gibt es auch viele Teile der <strong>Mathematik</strong>, die nicht soschwer, ja geradezu ”einfach“, sind, wenn sie erst richtig verst<strong>and</strong>en wurden.Daher enthält das Buch sowohl schwierigen als auch einfachen Stoffund bei Studierenden überwiegt beim ersten Eindruck der schwierigere.Um dem abzuhelfen, haben wir die wichtigsten, nicht trivialen Fakten inkurzen Zusammenfassungen gesammelt, die wir bildlich als Werkzeugkofferbezeichnen. Wir haben Werkzeugkoffer zu folgenden Themen zusammengestellt:Infinitesimalrechnung I und II, lineare Algebra, Differentialgleichungen,Anwendungen, Fourier-Analyse und Funktionalanalysis. Der Leser/dieLeserin wird diese Werkzeugkoffer erstaunlich kurz finden: Nur einige Seiten,alle zusammen zwischen 15 und 20 Seiten. Werden diese richtig verst<strong>and</strong>en,so wird dieser Stoff lange weiterhelfen und es ist ”alles“, was manvom Studium der <strong>Mathematik</strong> für weitere Studien und das berufliche Lebenin <strong>and</strong>eren Disziplinen behalten muss. Da das Buch ca. 1200 Seiten umfasst,bedeutet das zwischen 50 und 100 Buchseiten pro Seite Zusammenfassung.Das heißt auch, dass das Buch mehr als nur das absolute Minimum anInformationen gibt mit dem Ehrgeiz, mathematische Begriffe geschichtlichund hinsichtlich ihrer Anwendbarkeit einzuordnen. Also hoffen wir, dassStudierende nicht von der ziemlich großen Anzahl an Worten abgeschrecktwerden und sich stattdessen daran erinnern, dass die wesentlichen Faktendes Buches letztendlich in nur zwischen 15 und 20 Seiten enthalten sind.Bei etwa eineinhalb Jahren <strong>Mathematik</strong>studium bedeutet das effektiv einedrittel Seite pro Woche!Zunehmende/Abnehmende Bedeutung der <strong>Mathematik</strong>Das Buch berücksichtigt sowohl die zunehmende Bedeutung der <strong>Mathematik</strong>in der heutigen Informationsgesellschaft, als auch die abnehmendeBedeutung von vielem in der analytischen <strong>Mathematik</strong>, das traditionelleLehrpläne füllt. Studierende sollten also glücklich darüber sein, dass vieleder klassischen Formeln nicht länger ein Muss sind und dass ein richtigesVerständnis verhältnismäßig weniger grundlegender mathematischer Faktenbei der Bewältigung des modernen Lebens und der Wissenschaftengenügt.Welche Kapitel können beim ersten Lesen ausgelassen werden?Einige Kapitel, die Anwendungen gewidmet sind, sind mit einem * gekennzeichnetund können beim ersten Lesen übersprungen werden, ohne denroten Faden zu verlieren und stattdessen später beh<strong>and</strong>elt werden.


Aufgaben zu Kapitel 1 21Aufgaben zu Kapitel 11.1. Finden Sie heraus, welche Nobelpreisträger ihren Preis für das Aufstellenoder Lösen von Gleichungen gewonnen haben.1.2. Formulieren Sie Gedanken zum ”Denken“ und ”Berechnen“.1.3. Finden Sie mehr zu den im Text genannten Themen heraus.1.4. (a) Mögen oder hassen Sie <strong>Mathematik</strong> oder liegen Ihre Empfindungendazwischen? Erläutern Sie Ihren Gesichtspunkt. (b) Formulieren Sie, was Sie vonIhrem <strong>Mathematik</strong>studium erwarten.1.5. Formulieren Sie grundlegende Gesichtspunkte der Naturwissenschaften.Abb. 1.12. Linke Person: ”Ist es nicht erstaunlich, dass man den Abst<strong>and</strong> zuSirius, Aldebaran und Cassiopeja berechnen kann?“. Rechte Person: ”Ich finde esnoch erstaunlicher, dass man weiß, wie sie heißen!“ (Assar von Ulf Lundquist)


2Das mathematische LaborEs grenzt an ein Wunder, dass moderne Unterweisungsmethoden bisjetzt noch nicht vollständig die heilige Wissbegierde erstickt haben.(Einstein)2.1 EinleitungDas Buch wird durch verschiedene Software im mathematischen Labor vervollständigt,die frei auf der Website des Buches erhältlich ist. Das mathematischeLabor enthält verschiedene Arten von Software, die unter denfolgenden Rubriken organisiert sind: Math Experience (<strong>Mathematik</strong>erfahrungen),Tools (Werkzeuge), Applications (Anwendungen) und StudentsLab. (studentisches Labor).In der Rubrik <strong>Mathematik</strong>erfahrungen werden mathematische Begriffeder Analysis und der linearen Algebra wie das Lösen von Gleichungen,die Lipschitz-Stetigkeit, die Fixpunkt-Iteration, die Differenzierbarkeit, dieDefinition des Integrals und Grundlagen für Funktionen mit mehreren Variablenveranschaulicht.Werkzeuge enthält (i) Fertigprodukte wie verschiedene Löser von Differentialgleichungenund (ii) Umgebungen, die Studierenden helfen sollen,ihre eigenen Werkzeuge wie Löser für Gleichungssysteme und Differentialgleichungenzu erstellen.Anwendungen enthält weiter entwickelte Software wie DOLFIN (DynamicObject Oriented Library for FInite Elements) und Tanganyika zurmulti-adaptiven Lösung gewöhnlicher Differentialgleichungen.


24 2. Das mathematische LaborDas studentische Labor enthält Beiträge studentischer Projekte und hoffentlichwird es zur Inspirationsquelle, bei der Wissen von alten auf neueStudierende übertragen wird.2.2 <strong>Mathematik</strong>erfahrungUnter der Rubrik <strong>Mathematik</strong>erfahrung findet sich eine Sammlung vonMATLAB GUI Software, die entwickelt wurde, um ein tieferes Verständniswichtiger mathematischer Begriffe und Ideen wie zum Beispiel Konvergenz,Stetigkeit, Linearisierung, Differentiation, Taylor-Polynome, Integrationetc. zu vermitteln. Die Idee dabei ist, auf dem Bildschirm ein interaktives”Computer-Labor“ zur Verfügung zu stellen, in dem Studierende,angeleitet durch einige wohl formulierte Fragen, sich selbständig bemühenkönnen (a) Begriffe und Konzepte als solches und (b) die mathematischenFormeln und Gleichungen, die diese Begriffe beschreiben, vollständig zuverstehen. So kann man zum Beispiel im ”Taylor Lab“ (vgl. Abb. 2.1) eineFunktion eingeben oder aus einer Auswahl auswählen und dazu die polynomialeTaylor-Entwicklung in verschiedenen Graden betrachten und ihreAbhängigkeit vom Entwicklungspunkt, der mit der Maus verschoben werdenkann, oder vom Abst<strong>and</strong> zum Entwicklungspunkt, durch Vergrößernoder Verkleinern der Ansicht untersuchen. Man kann sich auch einen Filmansehen, in dem nach und nach Terme in der Taylor-Entwicklung hinzugefügtwerden. Im ”MultiD Lab“ (vgl. Abb. 2.2) kann eine Funktionu(x 1 ,x 2 ) definiert werden, ihr Integral über eine Kurve oder ein Gebiet berechnetwerden und ihr Gradientenfeld, ein Kontur-Plot, Tangentenflächenetc. betrachtet werden. Auch Vektorfelder (u,v) lassen sich untersuchen,ihre Divergenz und Rotation betrachten und die Integrale dieser Größenberechnen, um die fundamentalen Sätze der Vektorrechnung zu verifizieren,das durch (u,v) abgebildete Gebiet und die Jakobi-Matrix der Abbildungkann betrachtet werden usw., usw.Die folgenden Labore sind unter der Website des Buches verfügbar: Func lab - Relationen und Funktionen, inverse Funktionen etc. Graph Gallery - Elementarfunktionen und ihre Parameterabhängigkeit Cauchy lab - beh<strong>and</strong>elt Folgen und Konvergenz Lipschitz lab - Stetigkeitsbegriff Root lab - Bisektion und Fixpunkt-Iteration Linearisierung und Ableitung Newton lab - verdeutlicht das Newton-Verfahren


2.2 <strong>Mathematik</strong>erfahrung 25Abb. 2.1. Taylor lab Taylor lab - Polynome Opti lab - elementare Optimierung Piecewise polynomial lab - über stückweise polynomiale Näherungen Integration lab - Euler- und Riemann-Summen, adaptive Integration Dynamical system lab Pendulum lab - Auswirkungen von Linearisierung und Approximation Vector algebra - berechnet graphische Vektoren Analytic geometry - verbindet Geometrie und lineare Algebra MultiD Calculus - Integration und Vektorrechnung FE-lab - verdeutlicht die Methode der finiten Elemente Adaptive FEM - verdeutlicht adaptive finite Elementtechniken


26 2. Das mathematische LaborAbb. 2.2. MultiD Calculus lab


Poisson lab - Lösungen von Grundgleichungen etc. Fourier lab Wavelet lab2.2 <strong>Mathematik</strong>erfahrung 27 Optimal control lab - Kontrollprobleme im Zusammenhang mit Differentialgleichungen Archimedes lab - für Experimente im Zusammenhang mit dem archimedischenPrinzip


3Einführung in die ModellbildungDas beste materielle Modell für eine Katze ist eine <strong>and</strong>ere odernoch besser dieselbe Katze. (Rosenblueth/Wiener in ”Philosophy ofScience“ 1945)3.1 EinleitungZu Beginn wollen wir zwei grundlegende Beispiele für den Einsatz der <strong>Mathematik</strong>bei der Beschreibung realer Situationen geben. Das erste Beispielstammt aus der Hauswirtschaft und das zweite aus der Vermessung. BeideProbleme waren seit den Babyloniern wichtige Anwendungen für die<strong>Mathematik</strong>. Die Modelle sind sehr einfach, verdeutlichen dabei aber dochgrundlegende Ideen.3.2 Modell einer MittagssuppeSie wollen zusammen mit Ihrer Freundin eine Suppe für das Mittagessenbereiten. Einem Rezept folgend, bitten Sie Ihre Freundin in einem Lebensmittelladenfür 10 Euro Kartoffeln, Mohrrüben und Rindfleisch im Gewichtsverhältnis3:2:1 einzukaufen. Oder <strong>and</strong>ers formuliert, Ihre Freundinbekommt10Eurofür die Zutaten, die so zu kaufen sind, dass die Kartoffelndreimal so viel wiegen wie das Rindfleisch und die Menge an Mohrrübendoppelt so schwer ist wie das Rindfleisch. Im Lebensmittelladen erfährt IhreFreundin, dass 1 Kilo Kartoffeln 1 Euro kostet, Mohrrüben gibt es für


30 3. Einführung in die Modellbildung2 Euro das Kilo und das Rindfleisch kostet 8 Euro pro Kilo. Somit stehtIhre Freundin vor dem Problem, wie viel sie von jeder Zutat kaufen soll,um dafür genau 10 Euro auszugeben.Eine Möglichkeit ist es, dieses Problem durch Ausprobieren zu lösen:Ihre Freundin nimmt im Verhältnis 3:2:1 eine gewisse Menge Zutaten <strong>and</strong>ie Kasse, lässt sich von der Verkäuferin den Preis sagen und wiederholt dasganze so lange, bis sie genau 10 Euro bezahlen muss. Wahrscheinlich könnensich sowohl Ihre Freundin als auch die Verkäuferin bessere Möglichkeitenausdenken, um den Nachmittag zu verbringen. Eine <strong>and</strong>ere Möglichkeit ist,ein mathematisches Modell für das Problem aufzustellen und mit dessenHilfe die zu kaufenden Mengen genau zu berechnen. Die grundlegende Ideedabei ist, das Problem mit Gehirnschmalz, Papier und Bleistift oder einemTaschenrechner zu lösen, anstatt durch rein körperliche Arbeit.Das mathematische Modell lässt sich wie folgt aufstellen: Zunächst bemerkenwir, dass es genügt, wenn wir die zu kaufende Menge Rindfleischberechnen, um genau zu wissen was einzukaufen ist, denn wir brauchengenau doppelt soviel Karotten wie Fleisch und dreimal so viele Kartoffelnwie Rindfleisch. Wir wollen die Größe, die wir berechnen, mit x bezeichnen.Das Symbol x, dieUnbekannte, stehtfür eine unbekannte Größe, inunserem Fall der zu kaufenden Menge Rindfleisch in Kilo, die wir aus deruns verfügbaren Information berechnen wollen.Wenn wir x Kilo Rindfleisch kaufen, dann kostet es 8x Euro, daFleischkosteninEuro=xKilo × 8 EuroKilo =8xEuro.Da die Kartoffeln dreimal so viel wiegen sollen wie das Fleisch, wiegen dieKartoffeln 3x Kilo und kosten 3x Euro, da ein Kilo Kartoffeln einen Eurokostet. Schließlich brauchen wir noch 2x Karotten, die 2-mal 2x =4x Eurokosten, da sie 2 Euro pro Kilo kosten. Somit lassen sich die Kosten fürunseren Einkauf berechnen, indem wir die Preise für die einzelnen Zutatenzusammenzählen:8x +3x +4x =15x.Da wir davon ausgehen, dass wir 10 Euro für den Einkauf haben, erhaltenwir die Beziehung15x =10, (3.1)die uns den Zusammenhang zwischen den zu erwartenden Kosten und demverfügbaren Geld liefert. Das ist eine Gleichung der Unbekannten x undweiteren Daten, die sich aus unserem tatsächlichen Problem ergeben. Ausdieser Gleichung kann Ihre Freundin nun ausrechnen, wie viel Fleisch zukaufen ist. Dazu werden beide Seiten der Gleichung (3.1) durch 15 geteilt,was uns x =10/15 = 2/3 ≈ 0.67 Kilo Fleisch liefert. Die Menge Mohrrübenergibt sich dann zu 2 × 2/3=4/3 ≈ 1.33 Kilo und schließlich 3 × 2/3=2Kilo für die Kartoffeln.


3.2 Modell einer Mittagssuppe 31Das mathematische Modell für das Problem ist 15x = 10, wobei x fürdie Menge Fleisch steht, 15x bezeichnet die Gesamtkosten und 10 ist dasverfügbare Geld. Das Modell besteht darin, dass die Gesamtkosten 15xfür die Zutaten als Vielfaches der Menge Fleisch x ausgedrückt werden.Beachten Sie, dass wir in unserem Modell nur die wirklich wichtigen Informationenfür den Kauf von Kartoffeln, Mohrrüben und Rindfleisch für dieSuppe berücksichtigt haben und uns nicht durch die Preise <strong>and</strong>erer Waren,die wir nicht benötigen, wie Eis oder Bier, haben stören lassen. Für mathematischeModelle ist es wichtig und manchmal schwierig festzustellen,welche Informationen benötigt werden.Eine gute Eigenschaft mathematischer Modelle ist ihre Wiederverwendbarkeitzur Simulation verschiedener Probleme. So ergibt zum Beispieldas Modell 15x = 15, falls man 15 Euro zum Ausgeben hat, die Lösungx = 1 und bei 25 Euro lautet das Modell 15x =25mitderLösungx =25/15 = 5/3. Ganz allgemein lautet das Modell 15x = y, falls maneinen Betrag y ausgeben kann. In diesem Modell benutzen wir zwei Symbolex und y, unter der Annahme, dass der Betrag y gegeben und die Menge anRindfleisch x die gesuchte Unbekannte ist, die sich aus der Modellgleichung(15x = y) ergibt. Die Rollen können auch vertauscht sein: Man kann sichauch vorstellen, dass die Menge Rindfleisch x gegeben ist und die Kosten,bzw. die Ausgaben, (aus der Formel y =15x) berechnet werden müssen. Imersten Fall betrachten wir die Fleischmenge x als Funktion der Ausgabeny und im zweiten die Ausgaben y als Funktion von x.Wichtigen Größen, bekannten oder unbekannten, Symbole zuzuweisen,ist ein wichtiger Schritt bei der mathematischen Modellierung. Die Idee,unbekannten Größen Symbole zuzuweisen, wurde bereits von den Babylonierneingesetzt (die oft Modelle wie das der Mittagssuppe benutzten,um die Beköstigung der vielen Menschen zu organisieren, die am Bewässerungssystemarbeiteten).Angenommen, wir können die Gleichung 15x = 10 nicht lösen, weil wirzu ungeschickt in der Lösung von Gleichungen sind (wir könnten den Trickmit der Division durch 15 vergessen haben, den wir in der Schule gelernthaben). Wir könnten dann durch geschicktes Ausprobieren wie folgt nacheiner Lösung suchen. Zunächst nehmen wir an, dass x =1ist.Darausergeben sich Kosten von 15 Euro, was zu viel ist. Dann versuchen wires mit einer geringeren Menge Fleisch, z.B. x =0, 6, und berechnen dieKosten zu 9 Euro, was zu wenig ist. Darauf versuchen wir es mit einem Wertzwischen 0, 6 und 1, etwa x =0, 7, und erhalten Kosten von 10, 5Euro,wasein bisschen zu viel ist. Daraus folgern wir, dass der richtige Wert zwischen0, 6 und 0, 7 liegen muss, wahrscheinlich etwas näher bei 0, 7. So können wirweitermachen, bis wir so viele Dezimalstellen von x gefunden haben, wiewir wollen. So probieren wir beispielsweise genau wie vorher als nächstes,dass x zwischen 0, 66 und 0, 7 liegen muss. In diesem Fall wissen wir diegenaue Antwort x =2/3=0, 66666 .... Die gerade beschriebene Methodedes Ausprobierens ist ein Modell dafür, Essen zur Kasse zu bringen, um die


32 3. Einführung in die ModellbildungVerkäuferin den Preis berechnen zu lassen. Mit diesem Modell berechnenwir den Preis selbst, ohne die Waren körperlich einzusammeln und zurKasse zu bringen, was das Ausprobieren doch erheblich erleichtert.3.3 Das Modell vom schlammigen HofEiner der Autoren besitzt ein Haus mit einem Hinterhof mit 100m×100m,der die unangenehme Eigenschaft hat, bei jedem Regen zu einem schlammigenSee zu werden. Auf der linken Seite von Abb. 3.1 ist ein Blick aufAbb. 3.1. Blick auf einen Hof mit schlechter Drainage zusammen mit einemModell, dass die Größenordnungen wiedergibtden Hof zu sehen. Aufgrund des Gefälles auf dem Hof hat sich sein Besitzerschon seit längerem ausgedacht, das Problem durch einen flachenGraben entlang der Diagonalen des Hofs zu beheben, in dem ein perforiertesPlastikrohr verlegt wird. Nun stellt sich für ihn die Frage, wie vieleMeter Rohr er kaufen muss. Eine Vermessung des Eigentums liefert nurdie Grundstücksgrenzen und die Positionen der Ecken, da eine persönlichedirekte Messung der Diagonalen durch den Schlamm hindurch nicht so einfachist. Deswegen hat er sich entschieden, den Abst<strong>and</strong> mathematisch zuberechnen. Kann ihm <strong>Mathematik</strong> bei seinen Bemühungen helfen?Eine Untersuchung des Grundstücks und der Karte deutet darauf, dassder Hof durch ein horizontales Quadrat modelliert werden kann (das Gefällescheint gering zu sein) und wir müssen daher versuchen, die Länge derDiagonalen des Quadrats zu berechnen. Wir skizzieren das Modell auf derrechten Seite von Abb. 3.1, wobei wir mit Einheiten von 100m arbeiten,so dass die Größe des Feldes jetzt 1 × 1 ist. Die Länge der Diagonalenbezeichnen wir mit x. Jetzt erinnern wir uns an den Satz von Pythagoras,nach dem x 2 =1 2 +1 2 = 2 gilt. Um die Länge x des Drainagerohrs zubestimmen, müssen wir also die Gleichungx 2 =2 (3.2)


3.4 Ein Gleichungssystem 33lösen. Die Gleichung x 2 = 2 zu lösen, scheint zunächst irreführenderweiseeinfach zu sein; die positive Lösung ist schließlich x = √ 2. Aber in einGeschäft zu gehen und √ 2 Einheiten eines Rohrs zu verlangen, wird nichtunbedingt das gewünschte Ergebnis zeitigen. Vorgefertigte Rohre sind nichtauf die Länge √ 2 genormt und Metermaße zeigen √ 2 nicht an, weswegenein Verkäufer etwas genauere Information über den Wert von √ 2benötigt,um die richtige Rohrlänge auszumessen.Wir können durch Ausprobieren versuchen, den Wert von √ 2zupräzisieren,und einfach probieren, dass 1 2 =1< 2 ist und 2 2 =4> 2. Daherwissen wir, dass √ 2 irgendetwas zwischen 1 und 2 ist. Als nächstes probierenwir 1.1 2 =1, 21, 1, 2 2 =1, 44, 1, 3 2 =1, 69, 1, 4 2 =1, 96, 1, 5 2 =2, 25,1, 6 2 =2, 56, 1, 7 2 =2, 89, 1, 8 2 =3, 24, 1, 9 2 =3, 61. Offensichtlich liegt√2zwischen1, 4 und 1, 5. Als nächstes können wir uns an der drittenDezimale versuchen. Jetzt finden wir heraus, dass 1, 41 2 =1, 9881 und1, 42 2 =2, 0164 ist. Also liegt √ 2 offensichtlich zwischen 1, 41 und 1, 42und wahrscheinlich etwas näher an 1, 41. Es scheint so, dass wir auf dieseArt und Weise so viele Dezimalen von √ 2 bestimmen können, wie wir wollenund somit können wir das Problem, wie viel Drainagerohr wir kaufenmüssen, als gelöst betrachten.Im Weiteren werden wir auf viele Gleichungen treffen, deren Lösung verschiedeneAusprobiertechniken verlangen. Tatsächlich können die meistenmathematischen Gleichungen nicht exakt durch algebraische Umformungengelöst werden, wie wir es (wenn wir schlau genug wären) beim Modell derMittagssuppe gekonnt hätten (3.1). Konsequenterweise ist das Ausprobierenimmens wichtig in der <strong>Mathematik</strong>. Des Weiteren werden wir sehen,dass die Lösung von Gleichungen wie x 2 = 2 uns direkt ins Zentrum der<strong>Mathematik</strong> führt, von Pythagoras und Euklid durch die Streitigkeiten beider Gründung der <strong>Mathematik</strong> mit ihrem Gipfel in den 1930ern und weiterin die Neuzeit der modernen Computer.3.4 Ein Gleichungssystem:Das Mittagssuppe/Eiscreme ModellAngenommen, wir möchten unsere Mittagssuppe mit etwas Eiscreme zu3 Euro das Kilo abschließen und dabei immer noch insgesamt 10 Euroausgeben. Wie viel von jedem müsste dann gekauft werden?Also, wenn wir y Kilo Eis nehmen, belaufen sich die Gesamtkosten auf15x +3y, was uns auf die Gleichung 15x +3y =10führt. Sie drückt aus,dass die Gesamtkosten dem verfügbaren Geld entsprechen. Jetzt haben wirzwei Unbekannte x und y und wir benötigen daher eine weitere Gleichung.Wir könnten natürlich x = 0 setzen, nach y =10/3auflösen und alles Geldfür Eis ausgeben. Dies würde gegen einige Regeln verstoßen, die wir alskleine Kinder gelernt haben. Die benötigte zweite Gleichung könnte aus der


34 3. Einführung in die ModellbildungVorstellung erwachsen, die Menge an Eiscreme (ungesundes Essen) gegendie Menge an Möhren (gesundes Nahrungsmittel) auszubalancieren, zumBeispiel nach der Formel 2x = y +1oder2x − y = 1. Zusammen erhaltenwir so das folgende System aus zwei Gleichungen mit zwei Unbekannten xund y:15x +3y =10,2x − y =1.Auflösen der zweiten Gleichung nach y führt zu y =2x − 1, das eingesetztin die erste Gleichung, ergibt:15x +6x − 3=10, d.h. 21x =13, d.h. x = 1321 .Einsetzen von x = 1321≈ 0, 60 in die Gleichung 2x − y = 1 liefert schließlichfür die Menge Eis y = 521≈ 0, 24. Damit haben wir die Lösung desGleichungssystems, das das aktuelle Problem modelliert, erhalten.3.5 Gleichungen aufstellen und lösenWir wollen die Modelle für die Mittagssuppe und den schlammigen Hof ausdem Blickwinkel, die oben angeführten Gleichungen aufzustellen und zulösen, betrachten. Gleichungen aufzustellen entspricht dem systematischenSammeln von Informationen und Gleichungen zu lösen bedeutet, Schlüsseaus den gesammelten Informationen zu ziehen.Wir begannen bei der Beschreibung der physikalischen Situation der Modellefür die Mittagssuppe und den schlammigen Hof in Form mathematischerGleichungen. Dieser Aspekt bezieht sich nicht alleine auf die <strong>Mathematik</strong>,sondern schließt alle Informationen aus der Physik, Wirtschaft,Geschichte, Psychologie etc. ein, die für die modellierte Situation von Bedeutungsein kann. Die Gleichungen, die wir in den Modellen für die Mittagssuppeund den schlammigen Hof erhalten haben, nämlich 15x =10und x 2 = 2, sind Beispiele für algebraische Gleichungen, in denen sowohlDaten als auch Unbekannte x Zahlen sind. Wenn wir kompliziertere Situationenbetrachten, werden wir oft auf Modelle treffen, in denen Datenund die Unbekannten Funktionen sind. Solche Modelle enthalten üblicherweiseAbleitungen und Integrale und werden Differentialgleichungen bzw.Integralgleichungen bezeichnet.Der zweite Aspekt ist die Lösung der Modellgleichungen, um die Unbekanntenzu bestimmen und neue Informationen über das aktuelle Problemzu erhalten. Im Falle des Mittagssuppenmodells können wir die Modellgleichung15x = 10 exakt lösen und die Lösung x =2/3 als rationale Zahldarstellen. Im Modell für den schlammigen Hof greifen wir zu einer iterativen”Ausprobierstrategie“, um so viele Dezimalstellen der Lösung x = √ 2


Aufgaben zu Kapitel 3 35zu berechnen wie nötig. Allgemein ist es so, dass wir manchmal die Lösungeiner Modellgleichung explizit formulieren können, aber meist müssen wirmit einer Näherungslösung zufrieden sein, deren Dezimalstellen wir durchiterative Berechnungen bestimmen können.Es gibt keinen Grund dafür, darüber enttäuscht zu sein, dass Gleichungenfür mathematische Modelle im Allgemeinen nicht exakt gelöst werdenkönnen. Es ist besser, eine komplizierte aber genaue mathematische Modellgleichung,die nur näherungsweise gelöst werden kann, vor sich zu habenals eine einfache ungenaue Modellgleichung, die exakt lösbar ist! Das Wunderbarean Computern ist, dass sie auch für komplizierte genaue Modellgleichungengenaue Lösungen berechnen können, wodurch die Modellierungrealer Phänomene möglich wird.Aufgaben zu Kapitel 33.1. Angenommen, 1 Kilo Kartoffeln kostet im Lebensmittelgeschäft 40 Cent,Mohrrüben 80 Cent pro Kilo und Rindfleisch 40 Cent pro 100g. Stellen Sie dieModellgleichung für den Gesamtpreis auf.3.2. Angenommen, Sie ändern das Rezept für die Suppe so, dass Sie die gleicheMenge Kartoffeln und Möhren enthält, und dass deren Gewicht zusammendas sechsfache der Rindfleischmenge ist. Stellen Sie die Modellgleichung für denGesamtpreis auf.3.3. Angenommen, Sie wollen Zwiebeln im Verhältnis 2 : 1 zum Fleisch in dieSuppe tun. Das Verhältnis der <strong>and</strong>eren Zutaten bleibt gleich. Im Geschäft kostendie Zwiebeln 1 Euro pro Kilo. Stellen Sie die Modellgleichung für den Gesamtpreisauf.3.4. Während Sie in einem Fluggerät über dem Flughafen in einer Höhe von 1Kilometer fliegen, sehen Sie Ihre Wohnanlage am Fenster auftauchen. Sie wissen,dass der Flughafen 4 km von Ihrer Wohnanlage entfernt ist. Wie weit sind Sievon zu Hause und einem kalten Bier entfernt, wenn Ihre Wohnanlage die Höhe 0hat?3.5. Stellen Sie ein Modell für die Drainage eines Hofs mit drei ungefähr gleichenSeiten der Länge 2 auf, wobei das Rohr von einer Ecke zum Mittelpunkt dergegenüberliegenden Seite verläuft. Wie viel Rohr wird benötigt?3.6. Vater und Kind spielen mit einer Wippe mit einem 12m langen Sitzbrett.Stellen Sie ein Modell für den Lagerpunkt des Sitzbretts auf, so dass die Wippevollständig ausbalanciert ist, wenn der Vater 85 Kilo wiegt und das Kind 22, 5Kilo. Hinweis: Das Hebelgesetz besagt, dass das Produkt aus dem Abst<strong>and</strong> vomDrehpunkt und der entsprechenden Masse auf beiden Seiten gleich sein muss,damit der Hebel sich im Gleichgewicht befindet.


4Kurzer Kurs zur Infinitesimalrechnung<strong>Mathematik</strong> genießt den völlig falschen Ruf fehlerfreie Schlussfolgerungenzu erzielen. Seine Fehlerfreiheit ist nichts <strong>and</strong>eres als Gleichheit.Zwei mal zwei ist nicht vier, sondern genau zwei mal zwei unddas ist es, was wir in Kurzform vier nennen. Und so türmt sich Folgerungauf Folgerung, außer dass mit der Höhe die Gleichheit ausdem Blickwinkel entschwindet. (Goethe)4.1 EinleitungDie Naturwissenschaften werden allgemein als eine Kombination aus derFormulierung und der Lösung von Gleichungen angesehen. Die bloßen Best<strong>and</strong>teiledieses Bildes betrachten wir nun aus einem mathematischen Gesichtspunkt.Wir bieten einen kurzen Einblick in die Hauptthemen der Infinitesimalrechnung,die wir beim Erarbeiten dieser Buchreihe entdeckenwerden. Im Besonderen werden wir auf die magischen Worte Funktion,Ableitung und Integral treffen. Falls Sie schon eine Vorstellung dieser Begriffehaben, werden Sie einiges des Skizzierten verstehen. Falls Sie mitdiesem Stoff bisher nicht vertraut sind, können Sie in diesem Kapitel einenersten Eindruck erhalten, worum es sich bei der Infinitesimalrechnung h<strong>and</strong>elt,ohne dass Sie erwarten sollten, die Feinheiten zu diesem Zeitpunkt zuverstehen. Vergessen Sie nicht, dass wir nur die Schauspieler hinter demVorhang vorstellen wollen, bevor das eigentliche Schauspiel beginnt!Wir hoffen, dass die Leserin/der Leser auf den wenigen Seiten dieses Kapitelseinen Blick für das Wesentliche der Infinitesimalrechnung bekommt.


38 4. Kurzer Kurs zur InfinitesimalrechnungEigentlich ist das zwar völlig unmöglich, weil die Infinitesimalrechnung soviele Formeln und Einzelheiten umfasst, dass man sehr leicht überwältigtund entmutigt werden kann. Deswegen wollen wir die Leserin/den Leserzwingen, die folgenden wenigen Seiten durchzublättern, um eine schnelleVorstellung zu bekommen und um später mit einem ”Aha-Erlebnis“ daraufzurückkommen zu können.Auf der <strong>and</strong>eren Seite mag die Leserin/der Leser überrascht sein, dassetwas, das scheinbar so einfach auf einigen wenigen Seiten erklärt werdenkann, in diesem Buch (und <strong>and</strong>eren Büchern) in Wahrheit mehrere hundertSeiten zur Auflösung benötigt. Wir scheinen nicht in der Lage zu seindiesen ”Widerspruch“ auflösen zu können, etwa in der Art ”was schwer aussiehtkann auch einfach sein“ oder umgekehrt. Kurze Zusammenfassungender Infinitesimalrechnung finden sich auch in den Kapiteln ”WerkzeugkofferInfinitesimalrechnung I+II“, die die Vorstellung untermauern, dass einKonzentrat der Infinitesimalrechnung tatsächlich auf ein paar Seiten gegebenwerden kann.4.2 Algebraische GleichungenWir untersuchen algebraische Gleichungen der Form: Gesucht sei ¯x,sodassf(¯x)=0, (4.1)wobei f(x) eineFunktion von x ist. Dabei heißt f(x) eine Funktion vonx, falls für jede Zahl x eine Zahl y = f(x) existiert. Oft wird f(x) durcheine algebraische Formel definiert: Z.B. f(x)=15x−10 wie im Modell derMittagssuppe, oder f(x)=x 2 −2 wie im Modell für den schlammigen Hof.Wir nennen ¯x eine Lösung der Gleichung f(x) = 0, falls f(¯x) =0.DieLösung der Gleichung 15x − 10 = 0 ist ¯x = 2 3.DiepositiveLösung derGleichung x 2 −2=0ist √ 2 ≈ 1, 41. Wir werden verschiedene Methoden zurBerechnung einer Lösung ¯x von f(¯x) = 0 betrachten, wie das Ausprobieren,das oben kurz im Zusammenhang mit dem Modell für den schlammigen Hofangeführt wurde.Wir werden auch Systeme algebraischer Gleichungen kennen lernen, wobeiwir mehrere Unbekannte finden müssen, die mehreren Gleichungengenügen wie im Mittagssuppen/Eiscreme Modell.4.3 DifferentialgleichungenWir werden auch die folgende Differentialgleichung untersuchen: Gesuchtsei eine Funktion x(t), so dass für alle tx ′ (t)=f(t) (4.2)


4.3 Differentialgleichungen 39gilt, wobei f(t) eine vorgegebene Funktion ist, und x ′ (t) dieAbleitung derFunktion x(t) bezeichnet. Diese Gleichung hat mehrere neue Zutaten. Zumeinen suchen wir eine Funktion x(t) mit einer Menge unterschiedlicher Wertex(t)für verschiedene Werte der Variablen t und nicht nur einen einzigenWert von x wie bei der oben betrachteten Lösung der algebraischen Gleichungx 2 =2.Tatsächlich lernten wir etwas Ähnliches schon beim Problemder Mittagssuppe kennen, als wir einen beliebigen Geldbetrag y ausgebenkonnten. Dies führte zur Gleichung 15x = y mit der Lösung x = y/15,die von der Variablen y abhängt, d.h. x = x(y) = y 15. Zum <strong>and</strong>eren beinhaltetdie Gleichung x ′ (t)=f(t) die Ableitung x ′ (t) vonx(t), so dass wirAbleitungen untersuchen müssen.Ein wichtiger Best<strong>and</strong>teil der Infinitesimalrechnung ist es, (i) zu erklären,was eine Ableitung ist und (ii) die Differentialgleichung x ′ (t) =f(t) füreine vorgegebene Funktion f(t) zulösen. Die Lösung x(t) derDifferentialgleichungx ′ (t) =f(t) wirdIntegral von f(t) genannt oder alternativStammfunktion“ von f(t). Somit ist die Suche nach der Stammfunktionx(t) einer vorgegebenen Funktion f(t) eines der grundlegenden Proble-”me der Infinitesimalrechnung, entsprechend der Lösung der Differentialgleichungx ′ (t)=f(t).Wir versuchen jetzt (i) die Bedeutung von (4.2) sowie die Bedeutung derAbleitung x ′ (t) der Funktion x(t)zuerklären und (ii) einen Hinweis zu geben,wie die Lösung x(t) der Differentialgleichung x ′ (t)=f(t), ausgedrücktdurch die vorgegebene Funktion f(t), gefunden werden kann.Wir wollen uns als konkretes Beispiel ein Auto auf der Autobahn vorstellen.Dabei stehe t für die Zeit, x(t) sei der zur Zeit t zurückgelegte Weg undf(t) seidiejeweilige Geschwindigkeit des Autos zur Zeit t, vgl. Abb. 4.1.f(t)x(t)Abb. 4.1. Autobahn mit Auto (Volvo?) mit Geschwindigkeit f(t) und zurückgelegterWegstrecke x(t)Wir wählen eine Anfangszeit, t = 0, und eine Endzeit, t = 1, und wirbeobachten das Auto, wie es sich von seiner Ausgangsposition x(0) = 0zur Zeit t =0über eine Folge dazwischenliegender anwachsender Zeitent 1 ,t 2 ,...mit den zugehörigen Abständen x(t 1 ),x(t 2 ),..., zur Endzeit t =1am Endpunkt x(1), bewegt. Folglich gehen wir davon aus, dass 0 = t 0


40 4. Kurzer Kurs zur Infinitesimalrechnungf(t n−1) f(t n)x(t n−1)x(t n)Abb. 4.2. Abstände und Geschwindigkeiten zu den Zeiten t n−1 und t nwas besagt, dass der Abst<strong>and</strong> x(t n )zurZeitt n dadurch erhalten wird, dasszum Abst<strong>and</strong> x(t n−1 )zurZeitt n−1 das Produkt f(t n−1 )(t n − t n−1 )ausder Geschwindigkeit f(t n−1 )zurZeitt n−1 und der Zeitspanne t n − t n−1addiert wird. Das kommt daher, weilAbst<strong>and</strong>sänderung = Durchschnittsgeschwindigkeit × verstrichene Zeit,oder, der in der Zeit zwischen t n−1 und t n zurückgelegte Weg entsprichtder (Durchschnitts-)Geschwindigkeit, multipliziert mit der Länge der Zeitspannet n − t n−1 . Beachten Sie, dass wir genauso gut x(t n ) und x(t n−1 )durch die Formelx(t n ) ≈ x(t n−1 )+f(t n )(t n − t n−1 ), (4.4)in der t n−1 durch t n im f(t)-Ausdruck ersetzt wurde, hätten verknüpfenkönnen. Wir gebrauchen das ”ungefähr gleich“ Zeichen ≈, weil wir die Geschwindigkeitf(t n−1 )oderf(t n ) benutzen, die nicht wirklich der Durchschnittsgeschwindigkeitin der Zeitspanne zwischen t n−1 und t n entspricht,aber ähnlich sein sollte, falls die Zeitspanne kurz ist (und die Geschwindigkeitsich nicht sehr schnell ändert).Beispiel 4.1. Ist x(t) =t 2 , dann gilt x(t n ) − x(t n−1 )=t 2 n − t2 n−1 =(t n + t n−1 )(t n − t n−1 ), und (4.3) und (4.4) besagen, dass wir die Durchschnittsgeschwindigkeit(t n + t n−1 ) durch 2t n−1 bzw. 2t n approximieren.Formel (4.3) ist zentral für die Infinitesimalrechnung! Sie enthält sowohldie Ableitung von x(t) als auch das Integral von f(t). Zunächst einmalerhalten wir, durch Verschieben von x(t n−1 ) nach links und Division mitder Zeitspanne t n − t n−1 ,x(t n ) − x(t n−1 )t n − t n−1≈ f(t n−1 ). (4.5)Dies ist das Gegenstück zu Gleichung (4.2). Diese Formel vermittelt uns einGefühl dafür, wie die Ableitung x ′ (t n−1 ) zu definieren ist, um die Gleichungx ′ (t n−1 )=f(t n−1 )zuerfüllen:x ′ (t n−1 ) ≈ x(t n) − x(t n−1 )t n − t n−1. (4.6)


4.3 Differentialgleichungen 41Diese Formel besagt, dass die Ableitung x ′ (t n−1 ) ungefähr der Durchschnittsgeschwindigkeitx(t n ) − x(t n−1 )t n − t n−1in der Zeit zwischen t n−1 und t n entspricht. Daher können wir folgern, dassdie Gleichung x ′ (t) =f(t) besagt, dass die Ableitung x ′ (t) des zurückgelegtenWeges x(t) nach der Zeit t der momentanen Geschwindigkeit f(t)entspricht. Formel (4.6) besagt ihrerseits, dass die Geschwindigkeit x ′ (t n−1 )zur Zeit t n−1 ,d.hdiemomentanen Geschwindigkeit zur Zeit t n−1 ,ungefährder Durchschnittsgeschwindigkeit während der Zeitspanne (t n−1 ,t n )gleicht. Wir haben nun etwas vom Rätsel der in (4.3) versteckten Ableitungenthüllt.Als nächstes betrachten wir die (4.3) entsprechende Formel für die Zeitspannezwischen t n−2 und t n−1 , die wir durch einfaches Ersetzen in (4.3)erhalten:x(t n−1 ) ≈ x(t n−2 )+f(t n−2 )(t n−1 − t n−2 ). (4.7)Diese Formel ergibt zusammen mit (4.3)x(t n ) ≈≈x(t n−1){ }} {x(t n−2 )+f(t n−2 )(t n−1 − t n−2 )+f(t n−1 )(t n − t n−1 ). (4.8)Dieses Einsetzen können wir bis x(t 0 )=x(0) = 0 wiederholen, und wirerhaltenx(t n ) ≈ X n = f(t 0 )(t 1 − t 0 )+f(t 1 )(t 2 − t 1 )+···+ f(t n−2 )(t n−1 − t n−2 )+f(t n−1 )(t n − t n−1 ).(4.9)Beispiel 4.2. Die Geschwindigkeit sei f(t)= t1+tund wachse mit der Zeitt von Null bei t = 0 an. Wie groß ist dann der zurückgelegte Weg x(t n )zur Zeit t n ?Umeine(genäherte) Antwort zu erhalten, berechnen wir dieNäherung X n ,gemäß (4.9):x(t n ) ≈ X n = t 11+t 1(t 2 − t 1 )+ t 21+t 2(t 3 − t 2 )+···+ t n−21+t n−2(t n−1 − t n−2 )+ t n−11+t n−1(t n − t n−1 ).Bei ”identischen“ Zeitspannen k = t j − t j−1 für alle j lässt sich dies zux(t n ) ≈ X n =k1+k k + 2k1+2k k + ···(n − 2)k (n − 1)k+ k +1+(n − 2)k 1+(n − 1)k kvereinfachen. Für k =0, 05 sind die jeweiligen Summen für n =1, 2,...,Nberechnet und die Ergebnisse X n ,diex(t n )annähern, in Abb. 4.3 wiedergegeben.


42 4. Kurzer Kurs zur InfinitesimalrechnungGeschwindigkeitzurückgelegter WegZeitZeitAbb. 4.3. Zurückgelegter Weg X n als Näherung für x(t)für f(t)= t zu den1+tZeitschritten k =0, 05Wir kehren jetzt zu (4.9) zurück und erhalten für n = Nx(1) = x(t N ) ≈ f(t 0 )(t 1 − t 0 )+f(t 1 )(t 2 − t 1 )+···+f(t N−2 )(t N−1 − t N−1 )+f(t N−1 )(t N − t N−1 ).Somit entspricht also x(1) (näherungsweise) einer Summe von Ausdrückenf(t n−1 ) · (t n − t n−1 ), wobei n von n =1bisn = N läuft. Wir können dasmit Hilfe des Summenzeichens Σ verkürzt schreiben:x(1) ≈N∑f(t n−1 )(t n − t n−1 ). (4.10)n=1Diese Formel drückt aus, dass sich der zurückgelegte Weg x(1) als Summealler Weginkremente f(t n−1 )(t n − t n−1 )für n =1,...,N schreiben lässt.Wir können diese Formel als Variante folgender ”Teleskopformel“=0{ }} {{ }} {x(1) = x(t N ) −x(t N−1 )+x(t N−1 ) −x(t N−2 )+x(t N−2 )···= x(t N ) − x(t N−1 )} {{ }≈f(t N −1)(t N −t N −1)=0=0{ }} {+ −x(t 1 )+x(t 1 )−x(t 0 )+ x(t N−1 ) − x(t N−2 ) + x(t N−2 )···−x(t 1 )} {{ }≈f(t N −2)(t N −1−t N −2)+ x(t 1 ) − x(t 0 )} {{ }≈f(t 0)(t 1−t 0)betrachten, in der der zurückgelegte Weg x(1) als Summe aller Weginkrementex(t n )−x(t n−1 ) (unter der Annahme, dass x(0) = 0) formuliert wird,


4.3 Differentialgleichungen 43unter Berücksichtigung vonx(t n ) − x(t n−1 ) ≈ f(t n−1 )(t n − t n−1 ).In der Teleskopformel erscheint jeder Wert x(t n ), außer x(t N )=x(1) undx(t 0 ) = 0, zweimal mit unterschiedlichem Vorzeichen.In der Sprache der Infinitesimalrechnung wird die Formel (4.10) alsx(1) =∫ 10f(t)dt (4.11)geschrieben, wobei das ≈ durch ein =, die Summe Σ durch das Integral∫und die Zeitspannen tn − t n−1 durch dt ersetzt wurden. Die Folge von” diskreten“ Zeitpunkten t n, die von der Zeit 0 zur Zeit 1 laufen (odereher in kleinen Schritten ”springen“) entsprechen der Integrationsvariablent, die( ”stetig“) von 0 nach 1 läuft. Die rechte Seite von (4.11) nennenwir das Integral von f(t) von 0 nach 1. Wir haben nun etwas vom Rätseldes in (4.11) versteckten Integrals enthüllt, das sich durch Summation derGrundformel (4.3) ergibt.Die Schwierigkeiten mit der Infinitesimalrechnung hängen kurz formuliertdamit zusammen, dass wir in (4.5) mit einer kleinen Zahl, nämlich derZeitspanne t n −t n−1 , dividieren, was Geschicklichkeit verlangt, und dass wirin (4.10) eine große Zahl von Näherungen summieren. Natürlich stellt sichdabei die Frage, ob die genäherte Summe, d.h. die Summe der Näherungenf(t n−1 )(t n − t n−1 )vonx(t n ) − x(t n−1 ), noch eine vernünftige Näherungder ”tatsächlichen“ Summe x(1) ist. Bedenken Sie dabei, dass eine Summevieler kleiner Fehler sich sehr wohl zu einem großen Fehler aufschaukelnkann.Nun haben wir einen ersten Einblick der Infinitesimalrechnung erhalten.Zur Wiederholung: Im Zentrum steht die Formeloder mit f(t)=x ′ (t)x(t n ) ≈ x(t n−1 )+f(t n−1 )(t n − t n−1 )x(t n ) ≈ x(t n−1 )+x ′ (t n−1 )(t n − t n−1 ),die eine Verbindung zwischen zurückgelegten Wegstrecken und der mit Zeitspannenmultiplizierten Geschwindigkeit herstellt. Diese Formel beinhaltetsowohl die Definition des Integrals, denken Sie an (4.10), die durch Summationerhalten wurde, als auch die Definition der Ableitung x ′ (t), vergleichenSie (4.6), die wir durch Division mit t n −t n−1 erhalten haben. Im Folgendenwerden wir die überraschend starke Aussagekraft dieser scheinbar einfachenBeziehungen enthüllen.


44 4. Kurzer Kurs zur Infinitesimalrechnung4.4 VerallgemeinerungWir werden auch auf die folgende Verallgemeinerung von (4.2) treffenx ′ (t)=f(x(t),t), (4.12)in der die Funktion f auf der rechten Seite nicht nur von t, sondern auchvon der unbekannten Lösung x(t) selbst abhängig ist. Das Analogon vonFormel (4.3) nimmt dann die Formx(t n ) ≈ x(t n−1 )+f (x(t n−1 ),t n−1 )(t n − t n−1 ) (4.13)an,bzw.nachÄnderung von t n−1 in t n im f-Ausdruck unter Berücksichtigungvon (4.4)x(t n ) ≈ x(t n−1 )+f (x(t n ),t n )(t n − t n−1 ), (4.14)wobei, wie oben, 0 = t 0


4.4 Verallgemeinerung 45Abb. 4.4. Graph von exp(t): Exponentielles WachstumSpäter werden wir sehen, dass es in der Tat eine exakte Lösung der Gleichungx ′ (t)=x(t) für t>0, die x(0) = 1 genügt, gibt. Wir werden sie mitx(t) =exp(t) bezeichnen und Exponentialfunktion nennen. Formel (4.16)liefert die folgende Näherungsformel für exp(1), wobei exp(1) = e üblicherweiseals Basis des natürlichen Logarithmus’ bezeichnet wird:e ≈(1+ 1 N) N. (4.17)Unten angeführt sind Werte für (1 + 1 N )N für verschiedene N:N (1 + 1 N )N1 22 2,253 2,374 2,44145 2,48836 2,52167 2,546510 2,593720 2,6533100 2,70481000 2,716910000 2,7181


46 4. Kurzer Kurs zur InfinitesimalrechnungMit der Differentialgleichung x ′ (t) =x(t) für t>0 kann beispielsweisedie Entwicklung einer Bakterienpopulation modelliert werden, die mit derZuwachsrate x ′ (t) wächst, die der aktuellen Zahl an Bakterien x(t) zumZeitpunkt t entspricht. Nach jeder Zeiteinheit hat sich solch eine Populationum den Faktor e ≈ 2, 72 vervielfacht.4.5 Der Jugendtraum von LeibnizEine Form der Infinitesimalrechnung hat sich Leibniz bereits als Jugendlicherausgedacht. Der junge Leibniz pflegte sich mit Tabellen der Artodern 1 2 3 4 5 6 7n 2 1 4 9 16 25 36 491 3 5 7 9 11 131 2 2 2 2 2 2n 1 2 3 4 5n 3 1 8 27 64 1251 7 19 37 611 6 12 18 241 5 6 6 6die Zeit zu vertreiben. Dabei ist unter jeder Zahl die Differenz dieser Zahlund der links von ihr stehenden Zahl geschrieben. Aus dieser Schreibweisewird deutlich, dass sich jede Zahl in den Tabellen als Summe der Zahl linksvon ihr und der Zahl in der Reihe unter ihr ergibt. Zum Beispiel erhaltenwir für die Quadrate n 2 in der ersten Tabelle die Formeln 2 =(2n − 1) + (2(n − 1) − 1) + ···+(2· 2 − 1) + (2 · 1 − 1), (4.18)die sich umgeformt schreiben lässt alsn 2 + n =2(n +(n − 1) + ···+2+1)=2n∑k. (4.19)Das entspricht der Fläche des dreiecksförmigen ( ”triangulären“) Gebiets inAbb. 4.5, in der jeder Ausdruck (inklusive dem Faktor 2) der Summe derFlächen einer der aus Quadraten bestehenden Säulen entspricht.Die Formel (4.19) ist ein Analogon der Formelx 2 =2∫ x0ydy,k=1


4.5 Der Jugendtraum von Leibniz 47Abb. 4.5.wobei x, y und dy den Zahlen n, k und 1 entsprechen und ∫ x∑ 0die Summenk=1 ersetzt. Beachten Sie, dass in der Summe n2 + n in (4.19) der n-Ausdruck verglichen zu n 2 für große n vernachlässigbar ist.Nach Division durch n 2 lässt sich (4.18) auch schreiben alswas analog ist zu1=2n∑ k 1n n − 1 n , (4.20)k=11=2∫ 10ydy.Hierbei entsprechen dy und y den Zahlen 1 n und k n und ∫ 1∑ 0 symbolisiertnk=1 . Beachten Sie, dass der Ausdruck − 1 nin (4.20) als kleiner Fehlerausdruckfungiert, der mit wachsendem n kleiner wird.Aus der zweiten Tabelle mit n 3 können wir ganz ähnlich die Gleichungn 3 =erhalten, die analog zur Formeln∑(3k 2 − 3k + 1) (4.21)k=1x 3 =∫ x03y 2 dyist, wobei x, y und dy den Zahlen n, k und 1 entsprechen.Nach Division durch n 3 lässt sich (4.21) auch als1=n∑k=0( ) 2 k 13n n − 1 nn∑3 k 1n n + 1 n 2k=0


48 4. Kurzer Kurs zur Infinitesimalrechnungformulieren, die analog ist zu1=∫ 103y 2 dy,wobei y und dy den Brüchen 1 n und k n entsprechen und ∫ 10dem Summenzeichen∑ nk=0. Die auftretenden Fehlerausdrücke werden wiederum mit wachsendemn kleiner.Beachten Sie, dass sich beispielsweise n 3 durch wiederholte Anwendungder Summation auch dadurch berechnen lässt, dass man bei den konstantenDifferenzen 6 anfängt und die Tabelle von unten her aufbaut.4.6 ZusammenfassungMan kann die Infinitesimalrechnung als Wissenschaft zur Lösung von Differentialgleichungenansehen. Mit einer ähnlich oberflächlichen Aussage kannlineare Algebra als Wissenschaft zur Lösung algebraischer Gleichungen betrachtetwerden. Wir können dann die grundlegenden Studiengebiete derlinearen Algebra und der Infinitesimalrechnung durch die folgenden Problemecharakterisieren:Suche x, sodassf(x) = 0 (algebraische Gleichung), (4.22)wobei f(x) eine vorgegebene Funktion von x ist, und:Suche x(t), so dass x ′ (t)=f(x(t),t)für t ∈ (0, 1],x(0) = 0 (Differentialgleichung), (4.23)wobei f(x, t) eine vorgegebene Funktion von x und t ist. Wenn Sie sich <strong>and</strong>iese grobe Charakterisierung im weiteren Verlauf dieses Buches erinnern,mag es Ihnen beim mathematischen Dschungel an Notationen und Technikender linearen Algebra und der Infinitesimalrechnung behilflich sein.Wir werden größtenteils einen praktischen Zugang zur Lösung von Gleichungensuchen, wobei wir Algorithmen nach dem Kriterium aussuchen,welche mehr oder weniger Arbeit benötigen, um eine Lösung zu bestimmenoder zu berechnen. Algorithmen sind wie Rezepte, bei denen ein Schrittnach dem <strong>and</strong>eren zur Lösung führt. Während wir praktisch konstruierenddie Lösung von Gleichungen entwickeln, werden wir verschiedene TypenZahlen benötigen, wie die natürlichen Zahlen, dieganzen Zahlen und dierationalen Zahlen. Wir werden auch die Begriffe reelle Zahlen, reelle Variable,reellwertige Funktion, Zahlenfolge, Konvergenz, Cauchy-Folge undLipschitz-stetige Funktion benötigen.Diese Begriffe sollen unsere treuen Diener und nicht terrorisierendenHerrscher sein, wie es in der mathematischen Ausbildung oft der Fall ist.


4.7 Leibniz 49Um diesen St<strong>and</strong>punkt zu erlangen, werden wir uns bemühen, die Begriffezu entzaubern, indem wir, wenn irgend möglich, einen praktischen Zugangzu ihnen geben. So, als ob wir versuchen, hinter den Vorhang der mathematischenBühne zu schauen, auf der <strong>Mathematik</strong>lehrer oft eindrucksvollanzuschauende Phänomene und Zaubertricks vorführen und wir werdensehen, dass Studenten diese St<strong>and</strong>ardtricks sehr wohl selbst beherrschenkönnen und darüber hinaus neue Kniffe lernen können, die sogar besser alsdie alten sein können.4.7 Leibniz: Erfinder der Infinitesimalrechnungund UniversalgenieGottfried Wilhelm von Leibniz (1646–1716) ist vielleicht der vielseitigsteWissenschaftler, <strong>Mathematik</strong>er und Philosoph aller Zeiten. Newton undLeibniz haben unabhängig vonein<strong>and</strong>er unterschiedliche Formulierungender Infinitesimalrechnung entwickelt; die Schreibweise und der Formalismusvon Leibniz wurde schnell berühmt und sie sind es, die heute nochbenutzt werden und auf die wir im Weiteren treffen werden. Leibniz grifftapfer grundlegende Probleme der Physik, Philosophie und Psychologie desLeib-Seele-Problems in seinem Werk Système nouveau de la nature et dela communication des substances, aussi bien que de l’union, qu’il y a entrel’âme et le corps auf. In diesem Werk stellte Leibniz seine Theorie derprästabilierten Harmonie von Leib und Seele auf; in der verw<strong>and</strong>ten Monadologiebeschreibt er einfache Substanzen (einfach im Sinne von unteilbar),die Monaden, die jede für sich eine verschwommene unvollständige Wahrnehmungvom Rest der Welt haben und somit in Besitz einer Art primitiverSeele sind. Die moderne Variante der Monadologie ist die Quantenmechanik,einer der atemberaubendsten wissenschaftlichen Errungenschaften deszwanzigsten Jahrhunderts.Es folgt eine Beschreibung von Leibniz aus dem Brockhaus Lexikon:Leibniz’ Universalgelehrtheit resultiert keineswegs nur aus seiner unglaublichenBelesenheit und seinem schier unerschöpflichen Wissensdrang, sie hat”auch einen methodischen Grund darin, dass es nach Leibniz Leitgedankengibt, die in allen Wissenschaften wiederkehren. Dieses Denken, das, da esauf Gemeinsamkeiten ausgerichtet ist und vom Wesen her versöhnend ist,ermöglichte überhaupt erst die universale Gelehrtheit von Leibniz. Nichtaufgrund der hohen Spezifizierung und Detailfülle der Einzelwissenschaftengibt es nach Leibniz keine Universalgelehrten mehr, sondern weil dasversöhnende Denken zugunsten eines polarisierenden und ausschließendenDenkens aufgegeben wurde, weil Rationalität aufgesplittert wurde in einzelwissenschaftlicheRationalitäten.“


50 4. Kurzer Kurs zur InfinitesimalrechnungAbb. 4.6. Leibniz, Erfinder der Infinitesimalrechnung: Theoria cum praxis“.”Als ich mir zum Ziel setzte, die Einheit von Leib und Seele zu reflektieren,”wurde ich scheinbar auf das offene Meer zurückgeworfen. Ich konnte nämlichkeine Erklärung dafür finden, wie der Leib etwas in der Seele verursacht oderumgekehrt... Übrig bleibt nur meine Hypothese der prästabilierten Harmonie,d.h. einem göttlichen Kunstgriff, der beide Substanzen von Anfang an so formt,dass sie zwar ihren eigenen Gesetzen folgen, die ihnen innewohnen, aber dennochim Gleichschritt bleiben, so als ob sie sich gegenseitig beeinflussen, oder als obGott immer wieder ordnend und korrigierend eingreifen würde“Aufgaben zu Kapitel 44.1. Leiten Sie mathematische Modelle der Form y = f(x) her, die die Auslenkungx in Abhängigkeit von der Kraft y = f(x) für die folgenden mechanischenSysteme beschreiben. Dabei soll es sich in den ersten beiden Fällen um einenelastischen Faden h<strong>and</strong>eln und im dritten Fall um eine elastische Feder an einemelastischen Faden. Finden Sie Näherungsmodelle der Form y = x r ,mitr =1,3, 1 2 .xxf(x)xf(x)f(x)Abb. 4.7.


Aufgaben zu Kapitel 4 514.2. Lösen Sie wie Galileo die folgenden Differentialgleichungen: (a) x ′ (t) =v,(b) x ′ (t)=at, wobeiv und a Konstanten sind.4.3. Betrachten Sie die folgende Tabelle.0 0 2 4 8 16 32 640 2 4 8 16 32 64 1282 4 8 16 32 64 128 256Erkennen Sie einen Zusammenhang zur Exponentialfunktion?4.4. Die Fläche eines Kreises mit Radius 1 ist gleich π. Berechnen Sie untereund obere Grenzen für π, indem Sie die Kreisfläche mit den Flächen der einbeschriebenenund umbeschriebenen Vielecke vergleichen, vgl. Abb. 4.8.Abb. 4.8.4.5. Lösen Sie das Mittagssuppe/Eiscreme-Problem, wobei Sie die Gleichung2x = y + 1 durch x =2y + 1 ersetzen.


5Natürliche und ganze Zahlen” Aber“, mögen sie sagen, nichts davon erschüttert meinen Glauben,”dass 2 plus 2 4 ergibt“. Sie haben recht, außer in unwesentlichenFällen .. .und nur in unwesentlichen Fällen zweifeln sie daran, obein gewisses Tier ein Hund ist oder eine gewisse Länge weniger alsein Meter ist. Zwei muss zwei von irgendwas sein, und die Aussage2 plus 2 macht 4“ ist wertlos, wenn sie nicht angewendet werden”kann. Zwei Hunde plus zwei Hunde sind sicherlich vier Hunde, aberes mögen Fälle vorkommen, wo sie zweifeln, ob zwei davon wirklichHunde sind. Na gut, aber auf jeden Fall sind es vier Tiere“, mögen”sie einwenden. Aber es gibt Mikroorganismen, bei denen es fraglichist, ob sie Tiere oder Pflanzen sind. Na gut, dann eben lebende”Organismen“, mögen sie einwenden. Aber es gibt Dinge, bei denenman zweifelt, ob es lebende Organismen sind oder nicht. Sie mögenmir jetzt antworten wollen: Zwei Größen plus zwei Größen sind vier”Größen“. Wenn sie mir dann erklärt haben, was sie unter Größen“ ”verstehen, werde ich meine Argumente wiederholen. (Russell)5.1 EinleitungIn diesem Kapitel wollen wir wiederholen, wie natürliche und ganze Zahlenkonstruktiv definiert werden und wie die grundlegenden Rechenregeln, diewir in der Schule gelernt haben, bewiesen werden können. Unser Ziel istes, ein kurzes Beispiel zu geben, wie eine mathematische Theorie aus sehrgrundlegenden Tatsachen entwickelt werden kann. Wir wollen den Leserbefähigen, beispielsweise seiner Großmutter zu erklären, warum 2mal3


54 5. Natürliche und ganze Zahlendas gleiche ergibt wie 3 mal 2. Fragen dieser Art beantworten zu können,vertieft das Verständnis von den ganzen Zahlen und ihren Rechenregeln,so dass es tiefer geht als die Tatsachen, die man in der Schule lernt, einfür allemal als gegeben zu akzeptieren. Ein wichtiger Gesichtspunkt diesesProzesses ist es, gesichert geltende Tatsachen zu hinterfragen. Ein Prozess,der dem Warum-Fragen folgt und zu neuen Einsichten führenkannundzur Erkenntnis, dass neue Wahrheiten Alte ersetzen.5.2 Die natürlichen ZahlenDie natürlichen Zahlen wie 1, 2, 3, 4,... sind aus unserer Erfahrung mitdem Zählen geläufig, wo wir bei 1 angefangen wiederholt 1 addieren. Soist2 = 1+1,3 = 2+1 = 1+1+1, 4 = 3+1 = 1+1+1+1,5 = 4+1 = 1+1+1+1+1und so weiter. Zuzählen ist eine allgegenwärtigeTätigkeit in menschlicher Gesellschaft: Wir zählen die Minuten, die wir aufden Bus warten und die Jahre unseres Lebens; die Verkäuferin zählt dasWechselgeld im Laden, der Lehrer zählt die Prüfungspunkte und RobinsonCrusoe zählte die Tage, indem er Kerben in einen Baumstamm schnitzte.In all diesen Fällen steht die Einheit 1 für Unterschiedliches; Minuten undJahre, Cents, Prüfungspunkte, Tage; aber der Vorgang des Zählens ist stetsderselbe. Kinder lernen bereits sehr früh zu zählen und können etwa mit3bis10zählen. Intelligente Schimpansen können auch lernen auf 10 zuzählen. Kinder im Alter von 5 Jahren können lernen bis 100 zu zählen.Die Summe n+m, die durch Addieren zweier natürlichen Zahlen n und merhalten wird, ist die natürliche Zahl, die man dadurch erhält, dass Einsenzunächst n-mal und dann nochmals m-mal addiert werden. Wir nennen nund m Summ<strong>and</strong>en der Summe n + m. Die Gleichheit 2 + 3 = 5 = 3 + 2entspricht der Tatsache, dass(1+1)+(1+1+1)=1+1+1+1+1=(1+1+1)+(1+1).Sie kann etwa mit der Beobachtung erklärt werden, dass wir 5 Kekse vertilgenkönnen, indem wir zunächst 2 und dann 3 Kekse essen oder ebenso gutzuerst 3 Kekse verspeisen und dann 2 Kekse. Mit eben diesen Argumentenkönnen wir das Kommutativ-Gesetz der Additionm + n = n + mbeweisen, sowie das Assoziativ-Gesetz der Additionm +(n + p)=(m + n)+p,wobei m, n und p natürliche Zahlen sind.Das Produkt m×n = mn, das wir durch Multiplikation zweier natürlichenZahlen m und n erhalten, ist diejenige natürliche Zahl, die sich ergibt, wenn


5.2 Die natürlichen Zahlen 55wir m-mal n zu sich selbst addieren. Die Zahlen m und n eines Produktsm×n werden Faktoren genannt. Das Kommutativ-Gesetz der Multiplikationm × n = n × m (5.1)besagt nichts <strong>and</strong>eres, als dass die m-malige Addition von n zu sich selbstmit der n-maligen Addition von m zu sich selbst gleich ist. Diese Tatsachelässt sich dadurch absichern, dass wir ein rechteckiges Punktraster mit mZeilen und n Spalten zeichnen und die Gesamtzahl der m × n Punkte aufzwei Arten zählen:Alserstessummierenwirdiem Punkte in jeder Spalteund addieren dann die n Spalten und als zweites summieren wir die nPunkte in jeder Zeile und addieren dann die m Zeilen, vgl. Abb. 5.1.nmAbb. 5.1. Veranschaulichung des Kommutativ-Gesetzes der Multiplikationm × n = n × m. Wir erhalten dieselbe Summe unabhängig davon, ob wir spaltenweiseoder zeilenweise zählenGanz ähnlich können wir das Assoziativ-Gesetz der Multiplikationm × (n × p)=(m × n) × p (5.2)beweisen sowie das Distributiv-Gesetz, das Addition und Multiplikationverbindetm × (n + p)=m × n + m × p, (5.3)für die natürlichen Zahlen m, n und p.BeachtenSie,dasswirunsdabei<strong>and</strong>ie Konvention halten, und Multiplikationen vor Summationen ausführen,falls dies nicht <strong>and</strong>ers angedeutet ist. So bedeutet beispielsweise 2 + 3 × 42+(3× 4) = 24 und nicht (2 + 3) × 4 = 20. Um diese Konvention außerKraft zu setzen, können wir Klammern benutzen, wie in (2+3)×4=5×4.Aus (5.3) (und (5.1)) erhalten wir die nützliche Formel(m + n)(p + q)=(m + n)p +(m + n)q = mp + np + mq + nq. (5.4)


56 5. Natürliche und ganze ZahlenWir definieren n 2 = n × n, n 3 = n × n × n und ganz allgemeinn p = n × n ×···×n,(p Faktoren)für die natürlichen Zahlen n und p und bezeichnen n p als die p-te Potenzvon n oder ”n hoch p“. Die grundlegenden Eigenschaften(np ) q= npqn p × n q = n p+qn p × m p =(nm) pfolgen direkt aus der Definition, dem Assoziativ-Gesetz der Multiplikationund dem Distributiv-Gesetz.Wir haben auch eine klare Vorstellung davon, natürliche Zahlen derGröße nach anzuordnen. Wir bezeichnen m größer als n, geschrieben m>n,falls wir m durch wiederholte Addition von 1 zu n erhalten. Die Ungleichheitsrelationgenügt ihren eigenen Gesetzen, wiem


5.3 Gibt es eine größte natürliche Zahl? 57die Markierung 1 zu kommen. Wir können diese Operation als 0 + 1 = 1bezeichnen und im Allgemeinen gilt0+n = n +0=n (5.5)für jede natürliche Zahl n. Weiter definieren wir n × 0=0× n = 0 undn 0 =1.0 1 2 3 4Abb. 5.3. Erweiterter Zahlenstrahl mit 0Natürliche Zahlen als Summe von Einsen wie in 1+1+1+1+1 oder 1+1+1+1+1+1+1+1+1 darzustellen, d.h. wie Kerben in einen Baumstamm oderwie Perlen auf einem Faden, wird für größere Zahlen unpraktisch. Bequemerist es, verschiedene Stellen zu benutzen, um natürliche Zahlen beliebigerGröße zu schreiben. In einer Zahlendarstellung zur Basis 10 benutzen wirdieZiffern0,1,2,3,4,5,6,7,8und9,umjedenatürliche Zahl eindeutigals Summe von Ausdrücken der Formd × 10 p (5.6)auszudrücken, wobei d eine der Ziffern 0,1,2,...,9 und p eine natürlicheZahl oder 0 ist. Beispielsweise ist4711 = 4 × 10 3 +7× 10 2 +1× 10 1 +1× 10 0 .Normalerweise benutzen wir eine Zahlendarstellung zur Basis 10, wobei dieBasiswahl natürlich auf das Zählen mit den Fingern zurückgeht.Zur Zahlendarstellung kann jede natürliche Zahl als Basis gewählt werden.Computer nutzen normalerweise eine binäre Darstellung zur Basis 2,wobei eine natürliche Zahl als Folge von Nullen und Einsen ausgedrücktwird. Beispielsweise ist die Zahl 9 gleich1001 = 1 × 2 3 +0× 2 2 +0× 2 1 +1× 2 0 . (5.7)Wir werden später auf dieses Thema zurückkommen.5.3 Gibt es eine größte natürliche Zahl?Die Erkenntnis, dass Zählen durch hinzufügen von 1 immer und immerfortgesetzt werden kann, d.h. die Erkenntnis, dass es zu jeder natürlichenZahl n eine natürliche Zahl n + 1 gibt, ist ein wichtiger Schritt in derEntwicklung eines Kindes in den ersten Schuljahren. Bei jeder natürlichen


58 5. Natürliche und ganze ZahlenZahl, die ich als größte natürliche Zahl bezeichnen würde, könnten Sie1 hinzufügen und behaupten, dass diese Zahl größer sei und ich müsstewahrscheinlich zugeben, dass es keine größte natürliche Zahl geben kann.Der Zahlenstrahl lässt sich nach rechts beliebig ausdehnen.Natürlich ist diese Vorstellung mit einer Art unbegrenztem Gedankenexperimentverbunden. In der Realität könnten Zeit und Raum Grenzensetzen. Gegebenenfalls ist Robinsons Baumstamm voll mit Kerben und esscheint unmöglich eine natürliche Zahl mit etwa 10 50 Ziffern im Computerzu speichern, da die Zahl aller Atome im Universum auf eine Zahl dieserGrößenordnung geschätzt wird. Die Anzahl Sterne im Universum ist wahrscheinlichendlich, obwohl wir dazu neigen, deren Zahl für grenzenlos zuhalten.Wir können daher sagen, dass es im Prinzip keine größte natürliche Zahlgibt, wohingegen wir in der Praxis höchstwahrscheinlich nie mit natürlichenZahlen größer als 10 100 zu tun haben. <strong>Mathematik</strong>er sind an Prinzipieninteressiert und sie betonen daher gerne zuerst, was prinzipiell gilt underst zu einem späteren Zeitpunkt, was praktisch gilt. Andere Menschenziehen es vor, sich an die Realität zu halten. Natürlich sind Prinzipien sehrwichtig und nützlich, aber man sollte nie aus den Augen verlieren, wasprinzipiell wahr und was tatsächlich wahr ist.Die Vorstellung, dass es prinzipiell keine größte natürliche Zahl gebenkann, ist eng mit dem Begriff der Unendlichkeit verknüpft. Wir könnensagen, dass es unendlich viele natürlich Zahlen gibt oder dass die Mengeder natürlichen Zahlen unendlich groß ist, in der Hinsicht, dass wir immerweiterzählenkönnen oder beliebig oft aufhören können; es ist immermöglich, wo<strong>and</strong>ers aufzuhören und wiederum 1 hinzuzufügen. Mit dieserVorstellung ist es nicht so schwer, die Unendlichkeit in den Griff zu bekommen;sie bedeutet einfach, dass wir nie an ein Ende kommen. Unendlichviele Schritte bedeutet, dass wir unabhängig von der Zahl der Schritte, diewir schon gemacht haben, die Möglichkeit haben einen weiteren Schritt zutun. Es gibt keine Grenzen oder Beschränkungen. Unendlich viele Keksezu haben bedeutet, dass wir immer wieder einen Keks nehmen können,wann immer wir wollen und unabhängig davon, wie viele Kekse wir schongegessen haben. Die Möglichkeit scheint realistischer (und angenehmer) alstatsächlich unendlich viele Kekse zu essen.5.4 Die MengeNaller natürlichen ZahlenWir können die Menge {1, 2, 3, 4, 5}, bestehend aus den ersten fünf natürlichenZahlen 1, 2, 3, 4, 5 leicht begreifen. Dies kann man durch Hinschreibender Zahlen 1, 2, 3, 4 und 5 auf ein Blatt Papier erreichen und die Zahlen alsEinheit betrachten wie eine Telefonnummer. Wir können sogar die Menge{1, 2,...,100} der ersten 100 natürlichen Zahlen 1, 2, 3,...,99, 100 auf die


5.4 Die Menge Æ aller natürlichen Zahlen 59gleiche Weise begreifen. Wir können auch einzelne große Zahlen begreifen;beispielsweise können wir die Zahl 1.000.000.000 begreifen, indem wir unsvorstellen, was wir für 1.000.000.000 Euro kaufen könnten. Wir fühlen unsauch bei dem Gedanken wohl, dass wir prinzipiell zu jeder natürlichen Zahl1hinzufügen können. Wir könnten sogar zustimmen, mitNalle natürlichenZahlen zu bezeichnen, die wir erhalten, indem wir immer wieder 1hinzufügen.Wir können unsNals die Menge der möglichen natürlichen Zahlen denken,wobei klar ist, dass sich diese Menge immer im Bau befindet und niewirklich fertig werden kann. Es ist wie beim Hochbau, wo ständig neueGeschäfte oben hinzugefügt werden können ohne eine Begrenzung durchdas Stadtbauamt oder die Statik. Wir verstehen, dassN eher eine Möglichkeitverkörpert als etwas Existierendes, so wie wir es oben ausgeführt haben.Die Definition vonNals die Menge der möglichen natürlichen Zahlen istetwas vage, weil der Ausdruck ”möglich“ etwas vage ist. Wir sind darangewohnt, dass etwas, das für Sie möglich ist, für mich unmöglich sein kannund umgekehrt. Wessen ”möglich“ ist das gültige? Hiermit wollen wir dieTür für jedermann einen Spalt offen lassen, um sich eine eigene VorstellungvonN, als der Menge der individuell ”möglichen natürlichen Zahlen“, zumachen.Wenn wir mit der zugegeben Unbestimmtheit der Vorstellung vonN,als der ”Menge aller möglichen natürlichen Zahlen“, nicht glücklich sind,können wir stattdessen nach einer Definition der ”Menge aller natürlichenZahlen“, die allgemeiner wäre, suchen. Natürlich würde jeder Versuch dieseMenge zu zeigen, indem man alle natürlichen Zahlen auf ein Blatt Papierschreibt, jäh durch die Realität unterbrochen werden. Dieser Möglichkeitberaubt, auch prinzipiell, stellt sich die Frage, ob wir bezüglich der BedeutungvonNals ”die Menge aller natürlichen Zahlen“ eine Hilfe von einerArt ”Big Brother“ erhalten können.Die Vorstellung einer universellen Big Brother Definition für schwierigemathematische Begriffe, die die Unendlichkeit in einer oder einer <strong>and</strong>erenArt beinhalten, wie beispielsweiseN, wuchs stark gegen Ende des 19. Jahrhunderts.Der Kopf dieser Schule war Cantor, der eine vollständig neueTheorie aufstellte, die sich mit unendlichen Mengen und unendlichen Zahlenbeschäftigte. Cantor glaubte, die Menge der natürlichen Zahlen als eineeinzige vollständige Größe zu begreifen, um daraus weitere Mengen mitnoch größerem Ausmaß an Unendlichkeit zu konstruieren. Cantors Arbeitenhatten tief greifenden Einfluss auf die Sicht der Unendlichkeit in der<strong>Mathematik</strong>, aber seine Theorien über unendliche Mengen wurden nur vonwenigen verst<strong>and</strong>en und von noch wenigeren verwendet. Was heute übriggeblieben ist von Cantors Werk, ist der feste Glaube bei einer Mehrzahlvon <strong>Mathematik</strong>ern, dass die Menge aller natürlichen Zahlen als ein eindeutigdefiniertes vollständiges Wesen betrachtet werden kann, das mitNbezeichnet wird. Eine Minderheit von <strong>Mathematik</strong>ern, Anhänger des Kon-


60 5. Natürliche und ganze Zahlenstruktivismus angeführt von Kronecker, haben sich Cantors Ideen widersetztund stellen sichNeher etwas unbestimmt definiert vor, als die Mengealler möglichen natürlichen Zahlen, wie wir das oben vorgeschlagen haben.Das Resultat scheint zu sein, dass es keine Übereinstimmung über dieDefinition vonNgibt. Welche Interpretation vonNSie bevorzugen, bleibtIhnen, wie bei einer Religion, alleine überlassen. Eine gewisse Zweideutigkeitbleibt bei dieser Bezeichnung haften. Das spiegelt wider, dass wirNamen für Dinge benutzen, die wir nicht vollständig begreifen, wie dieWelt, Seele, Liebe, Jazzmusik, Ego, Glück etc. Wir alle haben unsere eigeneVorstellung von der Bedeutung dieser Worte.Wir persönlich neigen zur Vorstellung vonNals die ”Menge aller möglichennatürlichen Zahlen“. Zugegebenermaßen ist das etwas vage (aber ehrlich)und diese Unbestimmtheit scheint keine Probleme bei unserer Arbeitzu erzeugen.5.5 Ganze ZahlenWenn wir die Addition einer natürlichen Zahl p mit einer Bewegung ump Einheiten auf dem Zahlenstrahl nach rechts assoziieren, können wir dieSubtraktion von p als Bewegung um p Einheiten nach links einführen. Beidem Bild von Keksen in einer Schachtel können wir uns die Addition sovorstellen, dass wir Kekse entsprechend in die Schachtel legen und bei derSubtraktion nehmen wir Kekse heraus. Wenn wir beispielsweise 12 Keksein der Schachtel haben und 7 davon aufessen, wissen wir, dass 5 übrigbleiben. Die 12 Kekse kamen ursprünglich in die Schachtel, weil einzelneKekse in die Schachtel gelegt wurden und wir können Kekse herausnehmenoder subtrahieren, indem wir sie einzeln wieder aus der Schachtel nehmen.Mathematisch schreiben wir das als 12−7 = 5, was eine <strong>and</strong>ere Schreibweisefür 5 + 7 = 12 ist.Bei der Subtraktion treffen wir sofort auf eine Komplikation, die wir beider Addition nicht vorf<strong>and</strong>en. Während die Summe n + m zweier natürlichenZahlen immer eine natürliche Zahl ergibt, ist die Differenz n − mnur dann eine natürliche Zahl, wenn m


5.5 Ganze Zahlen 61Wirsagenzu1,2,3,...,positive ganze Zahlen und zu −1, −2, −3,...negativeganze Zahlen. Bildlich stellen wir uns vor, dass der Zahlenstrahl dernatürlichen Zahlen nach links erweitert wird und wir markieren den Punktlinks von 0 im Abst<strong>and</strong> einer Einheit mit −1 und so weiter. So erhalten wirdie Zahlengerade, vgl. Abb. 5.4.−3− − 0 12 1 2 3Abb. 5.4. Die ZahlengeradeWir können die Summe n + m zweier ganzer Zahlen n und m folgendermaßenals Ergebnis der Addition von m zu n definieren. Sind n und mnatürliche Zahlen oder positive ganze Zahlen, dann erhalten wir n+m wieüblich, indem wir bei 0 beginnen, zunächst n Einheiten nach rechts unddann nochmals m Einheiten nach rechts gehen. Ist n positiv und m negativ,dann erhalten wir n + m, indem wir bei 0 anfangen, uns n Einheitennach rechts und dann m Einheiten nach links bewegen. Ganz ähnlich istes, wenn n negativ und m positiv ist. Wir beginnen bei 0, bewegen uns nEinheiten nach links und dann m Einheiten nach rechts und erhalten son + m. Schließlich erhalten wir die Summe n + m zweier negativer Zahlenn und m, indem wir bei 0 beginnend zunächst n Einheiten nach links unddann m weitere Einheiten nach links gehen. Bei der Addition von 0 bewegenwir uns weder nach rechts noch nach links und somit gilt n +0=nfür alle ganzen Zahlen n. Jetzt haben wir die Addition von den natürlichenZahlen auf die ganzen Zahlen übertragen.Als nächstes wollen wir die Subtraktion definieren. Dazu einigen wir unszunächst darauf, dass wir mit −n die ganze Zahl bezeichnen, die ein umgekehrtesVorzeichen als die ganze Zahl n hat. Somit gilt für jede ganzeZahl n, dass−(−n) =n, da ein zweimal umgekehrtes Vorzeichenwieder das Ausgangsvorzeichen ergibt, und n +(−n) =(−n)+n =0,wobei wir daran denken, dass eine Bewegung von n Einheiten vorwärtsund rückwärts, beginnend bei 0, wieder bei 0 endet. Jetzt definieren wirn − m = −m + n = n +(−m), was wir m abziehen (subtrahieren) vonnnennen. Wir erkennen, dass die Subtraktion von m von n das gleiche ist,wie die Addition von −m zu n.Schließlich müssen wir noch die Multiplikation auf ganze Zahlen übertragen.Um eine Vorstellung zu bekommen, wie wir das am besten machen,multiplizieren wir als Richtschnur zunächst die Gleichung n +(−n) =0,in der n eine natürliche Zahl ist, mit der natürlichen Zahl m. Wir erhaltenm×n+m×(−n) = 0, d.h. m×(−n)=−(m×n), da ja m×n+(−(m×n)) = 0gilt. Das führt uns zur Definition m × (−n)=−(m × n)für positive ganzeZahlen m und n und analog (−n)×m = −(n × m). Beachten Sie, dass mitdieser Definition −n × m, sowohl(−n) × m als auch −(n × m) bedeuten


62 5. Natürliche und ganze Zahlenkann. Speziell erhalten wir (−1)×n = −n für die positive ganze Zahl n.Umschließlich das Produkt (−n)×(−m)für positive ganze Zahlen n und m zudefinieren, multiplizieren wir die Gleichungen n+(−n) = 0 und m+(−m)=0 und erhalten so n×m+n×(−m)+(−n)×m+(−n)×(−m) = 0, was uns zurGleichung −n × m +(−n) × (−m)=0führt, d.h. (−n) × (−m)=n × m.Diese Gleichung nehmen wir nun als Definition für das Produkt zweiernegativer Zahlen (−n) und(−m). Speziell gilt (−1) × (−1) = 1. Jetzthaben wir das Produkt zweier beliebiger ganzer Zahlen definiert (natürlichsoll n × 0=0× n =0für jede beliebige ganze Zahl n gelten).Zusammenzufassend haben wir die Addition und die Multiplikation ganzerZahlen definiert und können nun alle vertrauten Regeln für die Rechnungmit ganzen Zahlen überprüfen, wie das Kommutativ-, AssoziativundDistributiv-Gesetz, die wir oben für die natürlichen Zahlen formulierthaben.Beachten Sie, dass wir auch sagen könnten, dass wir die negativen Zahlen−1, −2,...aus den natürlichen Zahlen 1, 2,...durch eine Spiegelung an 0konstruiert haben, wobei jede natürliche Zahl n zum Spiegelbild −n wird.Somit könnten wir auch sagen, dass wir die Zahlengerade durch Spiegelungan 0 aus dem Zahlenstrahl konstruiert haben. Kronecker sagt, dass dienatürlichen Zahlen von Gott gegeben sind und dass alle <strong>and</strong>eren Zahlenwie die negativen ganzen Zahlen von Menschen konstruiert seien.Eine <strong>and</strong>ere Möglichkeit −n für eine natürliche Zahl n zu konstruierenoder zu definieren, bietet die Vorstellung von −n als Lösung x = −n derGleichung n + x =0,dajan +(−n) = 0, oder genauso gut als Lösungvon x + n =0,da(−n)+n = 0. Diese Vorstellung ist leicht von n auf −nübertragbar, d.h. auf die negativen ganzen Zahlen, indem wir −(−n) alsLösung von x +(−n)=0betrachten.Dan +(−n) = 0, schließen wir mitder vertrauten Formel −(−n)=n. Zusammenzufassend können wir −n alsLösung der Gleichung x + n =0für jede ganze Zahl n betrachten.Des weiteren können wir die Ordnungsrelationen von den natürlichenZahlen zu allen Zahlen inZübertragen, indem wir m−n gilt. Diese Ordnungsrelation istein bisschen verwirrend, weil wir beispielsweise −1000 für sehr viel größerhalten als −10. Dennoch schreiben wir −1000 < −10, was besagt, dass−1000 kleiner ist als −10. Was uns fehlt, ist ein Maß für die Größe einerZahl, ohne Rücksicht auf das Vorzeichen. Das ist das Thema im folgendenAbschnitt.5.6 Absolutwert und Abst<strong>and</strong> zwischen ZahlenWie oben angedeutet, kann eine Diskussion zur Größe einer Zahl, ohneRücksicht auf das Vorzeichen, nützlich sein. Aus diesem Grund definieren


wir den Absolutwert |p| der Zahl p durch5.6 Absolutwert und Abst<strong>and</strong> zwischen Zahlen 63|p| ={p, p ≥ 0−p, p < 0.Beispielsweise ist |3| = 3 und |−3| = 3. Somit misst, wie gewünscht |p| dieGröße einer Zahl p, ohne Rücksicht auf das Vorzeichen. Beispielsweise ist|−1000| > |−10|.Oft sind wir am Unterschied zweier Zahlen p und q interessiert, wobeiuns in erster Linie die Größe des Unterschieds und nicht das Vorzeicheninteressiert, d.h. wir suchen |p − q| als den Abst<strong>and</strong> der beiden Zahlen aufder Zahlengeraden.Beispielsweise wollen wir eine Türzarge kaufen und messen dafür mitdem Metermaß die eine Seite der Türöffnung mit 2 cm und die <strong>and</strong>eremit 82 cm. Natürlich gehen wir nicht in den Baumarkt und fragen denVerkäufer nach einer Türzarge die bei 2 cm anfängt und bei 82 cm aufhört.Stattdessen werden wir dem Verkäufer nur sagen, dass wir 82 − 2=80cmbrauchen. Hier ist 80 der Abst<strong>and</strong> zwischen 82 und 2. Wir definieren denAbst<strong>and</strong> zweier ganzer Zahlen p und q als |p − q|.Indem wir den Absolutwert benutzen, stellen wir sicher, dass der Abst<strong>and</strong>zwischen p und q derselbe ist wie der Abst<strong>and</strong> zwischen q und p,beispielsweise |5 − 2| = |2 − 5|.In diesem Buch werden wir oft mit Ungleichheiten zwischen Absolutwertenzu tun haben. Wir geben ein Beispiel, das jedem Studierenden amHerzen liegt.Beispiel 5.1. Angenommen, dass wir ein ”Gut“ geben, falls Studierendebei insgesamt 100 Punkten um maximal 5 Punkte von 79 abweichen undwir eine Punkteliste für diese Note erstellen wollen. Diese beinhaltet allePunkte x, die einen Abst<strong>and</strong> von maximal 5 von 79 haben, was sich als|x − 79|≤5 (5.8)formulieren lässt. Dabei gibt es zwei Fälle: x


64 5. Natürliche und ganze ZahlenBeispiel 5.2. |x − 79|≤5 bedeutet, dass−5 ≤ x − 79 ≤ 574 ≤ x ≤ 84.Um |4 − x|≤18 zu lösen, schreiben wir−18 ≤ 4 − x ≤ 1818 ≥ x − 4 ≥ −18 (Achtung, geändert!)22 ≥ x ≥ −14Beispiel 5.3. Um die folgende Ungleichung für x|x − 79|≥5 (5.9)zu lösen, nehmen wir zunächst an, dass x ≥ 79 gilt, wodurch (5.9) zux−79 ≥ 5, bzw. x ≥ 84 wird. Ist dagegen x ≤ 79, wird (5.9) zu −(x−79) ≥ 5oder (x − 79) ≤−5bzw.x ≤−74. Die Antwort ist folglich, dass alle x,fürdie x ≥ 84 oder x ≤ 74 gilt, die Ungleichung (5.9) lösen.Zum Abschluss möchten wir daran erinnern, dass die Multiplikation einerUngleichung mit einer negativen Zahl wie (-1) die Ungleichung umkehrt:m−n.5.7 Division mit RestWir definieren die Division mit Rest einer natürlichen Zahl n durch eine<strong>and</strong>ere natürliche Zahl m mit n>mals den Vorgang, die nicht negativenganzen Zahlen p und r


5.8 Zerlegung in Primzahlen 65Wir können das richtige p bei der Division mit Rest von n durch mdurch wiederholte Subtraktion von m erhalten. Zum Beispiel können wirbei n = 63 und m =15schreiben63 = 15 + 4863 = 15 + 15 + 33 = 2 × 15 + 3363 = 3 × 15 + 1863 = 4 × 15 + 3,und erhalten so p = 4 und r =3.Eine systematischere Vorgehensweise für die Division mit Rest ist derDivisionsalgorithmus, wie er in der Schule beigebracht wird. Wir habenhier zwei Beispiele (63 = 4 × 15 + 3 und 2418610 = 19044 × 127 + 22) inAbb. 5.6.415 636034×1519044127 24186101271×12711481143561508530508229×1274×1274×127Abb. 5.6. Zwei Beispiele der Schuldivision5.8 Zerlegung in PrimzahlenEin Teiler einer natürlichen Zahl n ist eine natürliche Zahl m, mit der sichn ohne Rest teilen lässt, d.h. n = pm mit einer natürlichen Zahl p. ZumBeispiel sind sowohl 2 als auch 3 Teiler von 6. Jede natürliche Zahl n hatdie Teiler n und 1, da 1 × n = n. Einenatürliche Zahl n wird Primzahlgenannt, wenn sie nur die Teiler 1 und n hat. Die ersten Primzahlen (ohnedie 1, da solche Teiler nicht von großem Interesse sind) sind 2, 3, 5, 7, 11,....Die einzige gerade Primzahl ist 2. Angenommen, wir haben die natürlicheZahl n und suchen zwei Teiler n = pq. DazugibteszweiMöglichkeiten:Entweder sind die einzigen Teiler 1 und n, d.h.n ist Primzahl oder wirfinden zwei Teiler p und q, von denen keiner 1 oder n ist. Es ist übrigenseinfach, ein Programm zu schreiben, um alle Teiler einer natürlichen Zahln zu finden, indem systematisch n durch alle natürlichen Zahlen kleinerals n geteilt wird. Im zweiten Fall müssen sowohl p als auch q kleiner als


66 5. Natürliche und ganze Zahlenn sein. Tatsächlich genügt sogar p ≤ n/2 und q ≤ n/2, da der kleinstemögliche Teiler ungleich 1 die 2 ist. Wir können das Spiel fortsetzen und pund q weiter faktorisieren. Entweder sind die Zahlen Primzahlen oder wirkönnen sie in kleinere natürliche Zahlen faktorisieren. Dann wiederholenwir das Ganze mit den kleineren Teilern. Dieser Vorgang wird schließlichbeendet sein, da n endlich ist und die Teiler bei jedem Schritt nicht größerals halb so groß wie die Teiler beim vorangehenden Schritt sein können.Wenn der Vorgang beendet ist, haben wir n in ein Produkt von Primzahlenzerlegt. Diese Zerlegung ist abgesehen von der Reihenfolge eindeutig.Eine Konsequenz der Zerlegung in Primzahlen ist die folgende Tatsache:Angenommen, wir wüssten, dass 2 ein Teiler von n ist. Ist n = pq irgendeineFaktorisierung von n, so folgt, dass mindestens einer der Teiler p und qdurch 2 teilbar sein muss. Dasselbe gilt für die Primzahlen 3,5,7 etc., d.h.für jede Primzahl.5.9 Ganze Zahlen im ComputerDa wir begleitend zu diesem Kurs Computer nutzen werden, müssen wir einigeEigenschaften der Computer-Arithmetik deutlich machen. Wir unterscheidendabei die Arithmetik auf einem Rechner von der ”theoretischen“Arithmetik, die wir in der Schule lernen.Das Grundproblem das sich uns stellt, wenn wir einen Computer benutzen,ist die physikalische Begrenztheit an Speicher. Ein Rechner mussZahlen auf einem physikalischen Gerät speichern, das nicht ”unendlich“sein kann. Daher kann ein Rechner nur eine endliche Anzahl von Zahlendarstellen. Jede Programmiersprache hat eine endliche Grenze für die Zahlen,die sie darstellen kann. Im Allgemeinen haben Programmierspracheninteger und long integer Datentypen, wobei eine integer Zahl eineganze Zahl im Bereich −32768, −32767,...,32767 sein kann; das sind dieZahlen die in 2 Byte Platz finden. Ein long integer Datentyp ist eineganze Zahl im Bereich −2147483648, −2147483647,...,2147483647, die 4Byte Platz benötigt (ein ”Byte“ Speicher besteht aus 8 ”Bits“, die jedesentweder eine 0 oder eine 1 speichern können). Das kann ernste Konsequenzenhaben, wie jeder sofort herausfindet, der eine Schleife programmiert, inder ein ganzzahliger Index über die angegebenen Grenzen hinausgeht. Vorallem können wir nicht prüfen, ob eine Behauptung für alle ganzen ZahlenGültigkeit hat, indem wir mit dem Computer alle möglichen Fälle testen.


Aufgaben zu Kapitel 5 67Aufgaben zu Kapitel 55.1. Nennen Sie fünf Situationen in Ihrem Leben, in denen Sie zählen. Was istdabei die Einheit ”1“?5.2. Nutzen Sie den Zahlenstrahl, um folgende Gleichungen zu interpretierenund zu beweisen: (a) x+y = y +x und (b) x+(y +z)=(x+y)+z. Diese geltenfür alle natürlichen Zahlen x,y und z.5.3. Benutzen Sie (zwei- und dreidimensionale) Punktemuster, um Folgendeszu interpretieren und zu beweisen: (a) das Distributiv-Gesetz der Multiplikationm×(n+p)=m×n+m×p und (b) das Assoziativ-Gesetz (m×n)×p = m×(n×p).5.4. Benutzen Sie die Definition von n p für natürliche Zahlen n und p, umzubeweisen, dass (a) (n p ) q = n pq und (b) n p × n q = n p+q für natürliche Zahlenn, p, q gilt.5.5. Beweisen Sie, dass m × n = 0 nur dann gilt, wenn m =0odern =0fürnatürliche Zahlen m und n gilt. Welche Bedeutung hat oder dabei? Beweisen Sie,dass für p ≠0,p× m = p × n genau dann gilt, wenn m = n ist. Was ist, wennp =0ist?5.6. Zeigen Sie mit Hilfe von (5.4), dass für ganze Zahlen n und m gilt:(n + m) 2 = n 2 +2nm + m 2(n + m) 3 = n 3 +3n 2 m +3nm 2 + m 3(n + m)(n − m)=n 2 − m 2 .(5.10)5.7. Benutzen Sie die Zahlengerade, um die vier möglichen Fälle bei der Definitionvon n + m für ganze Zahlen n und m zu veranschaulichen.5.8. Teilen Sie (a) 102 durch 18, (b) −4301 durch 63 und (c) 650912 durch 309nach der Schuldivisionsmethode.5.9. (a) Finden Sie alle natürlichen Zahlen, die 40 ohne Rest teilen. (b) WiederholenSie das Gleiche für 80.5.10. (Abstrakt) Benutzen Sie die Schuldivisionsmethode, um zu zeigen, dassa 3 +3a 2 b +3ab 2 + b 3a + b= a 2 +2ab + b 2 .5.11. (a) Schreiben Sie eine MATLAB Funktion, die testet, ob eine vorgegebenenatürliche Zahl n Primzahl ist. Hinweis: Teilen Sie n systematisch durch allekleineren natürlichen Zahlen zwischen 2 und n/2, um festzustellen, ob sie Teilervon n sind. Erklären Sie, weswegen es genügt, bis n/2 zu testen. (b) BenutzenSie diese Funktion für eine MATLAB Funktion, die alle Primzahlen kleiner alsein vorgegebenes n findet. (c) Geben Sie alle Primzahlen kleiner als 1000 an.


68 5. Natürliche und ganze Zahlen5.12. Finden Sie für die folgenden ganzen Zahlen die Primzahlzerlegung; (a) 60,(b) 96, (c) 112 und (d) 129.5.13. Finden Sie zwei natürliche Zahlen p und q,sodasspq den Teiler 4 enthält,aber weder p noch q durch 4 teilbar sind. Das bedeutet, dass aus der Tatsache,dass eine natürliche Zahl m Teiler eines Produkts n = pq ist, nicht gefolgertwerden kann, dass m Teiler einer der Zahlen p oder q ist. Warum widersprichtdas nicht der Tatsache, dass wenigstens einer der Zahlen p oder q durch 2 teilbarsein muss, wenn das Produkt pq durch 2 teilbar ist?5.14. Finden Sie die ungültigen Aussagena


6Mathematische InduktionTraditionell stehen Anhänger der Induktion und der Deduktion inOpposition zuein<strong>and</strong>er. Meiner Meinung nach ist das so vernünftig,als ob die beiden Enden eines Wurms sich stritten. (Whitehead)6.1 InduktionCarl Friedrich Gauss (1777–1885), der auch Prinz der <strong>Mathematik</strong> genanntwurde, ist einer der größten <strong>Mathematik</strong>er aller Zeiten. Zusätzlich zu einerunglaublichen Fähigkeit zu rechnen (was im 19. Jahrhundert besonderswichtig war) und einer unübertroffenen Fähigkeit mathematisch zubeweisen, hatte Gauss eine erfinderische Vorstellungskraft und ein pausenlosesInteresse an der Natur. Ihm gelangen wichtige Entdeckungen in einematemberaubend breiten Bereich in reiner und angew<strong>and</strong>ter <strong>Mathematik</strong>. Erwar auch ein Pionier im Sinne eines Baumeisters, der sich tief in viele derbis dahin akzeptierten mathematischen Wahrheiten eingrub, um wirklichzu verstehen, was jedermann für wahr ”hielt“. Vielleicht ist die einzige wirklichunglückselige Seite von Gauss, dass er seine Arbeit nur sehr spärlichdokumentierte und viele <strong>Mathematik</strong>er, die ihm folgten, waren dazu verurteilt,Dinge neu zu erfinden, die er bereits wusste.Die folgende Geschichte wird über Gauss im Alter von 10 Jahren inder Schule berichtet. Sein altmodischer Arithmetiklehrer wollte vor seinenSchülern angeben, indem er sie bat, viele aufein<strong>and</strong>er folgende Zahlen vonH<strong>and</strong> zu addieren. Der Lehrer wusste (aus einem Buch), dass dies einfach


70 6. Mathematische Induktionund genau durch die folgende nette Formel geleistet wird:1+2+3+···+(n − 1) + n =n(n +1). (6.1)2Dabei bedeutet ”···“, dass wir alle natürlichen Zahlen zwischen 1 und naddieren. Mit Hilfe dieser Formel können die n − 1 Additionen auf derrechten Seite durch eine Multiplikation und eine Division ersetzt werden,was eine beträchtliche Arbeitsersparnis ist, besonders dann, wenn man fürdie Rechnung auf eine Schiefertafel und einen Griffel angewiesen ist.Der Lehrer stellte der Klasse die Aufgabe, die Summe 1 + 2 + ···+99zu berechnen, aber bereits kurz darauf meldete sich Gauss und legte seineSchiefertafel mit der richtigen Antwort (4950) auf das Lehrerpult, währendder Rest der Klasse noch mit den Anfängen kämpfte. Wie brachte es derjunge Gauss fertig, die Summe so schnell zu berechnen? Kannte er bereitsdie nette Formel (6.1)? Natürlich nicht, aber er leitete sie mit den folgendenklugen Argumenten sofort her: Um die Summe 1 + 2 + ···+ 99 zu bilden,gruppieren wir die Zahlen paarweise wie folgt:1+···+99= (1 + 99) + (2 + 98) + (3 + 97) + ···(49 + 51) + 50=49× 100 + 50 = 49 × 2 × 50 + 50 = 99 × 50,was mit der Formel (6.1) für n =99übereinstimmt. Mit dieser Argumentationlässt sich die Gültigkeit von (6.1) für jede natürliche Zahl n beweisen.Ein moderner Lehrer, der nicht angeben muss, könnte die Formel (6.1)anschreiben und die Schüler bitten, sie etwa für n = 99 anzuwenden, undsie dann nach Hause schicken, um den Trick bei ihren Eltern zu probieren.Wir wollen uns jetzt dem Problem stellen, die Gültigkeit der Formel(6.1), da wir sie jetzt kennen, für jede natürliche Zahl n zu beweisen. Angenommen,wir seien nicht so schlau wie Gauss und kämen nicht auf dieIdee, wie oben gezeigt, die Zahlen paarweise zu betrachten. Wir sind alsogefragt, die Richtigkeit einer Formel zu prüfen, und diese nicht erst zu findenund dann ihre Gültigkeit zu beweisen. Dies ist wie in einem multiplechoice Test, bei dem uns die Frage gestellt wird, ob König Gustaf AdolfII von Schweden 1632 oder 1932 gestorben ist oder ob er noch lebt, imUnterschied zur direkten Frage, in welchem Jahr der König gestorben sei.Jeder weiß, dass multiple choice Fragen einfacher zu beantworten sind alsdirekte Fragen.Wir sind also aufgefordert die Gültigkeit von Formel (6.1) für jede natürlicheZahl n zu zeigen. Ihre Wahrheit für n =1:1=1× 2/2, für n =2:1+2=3=2× 3/2 und für n =3:1+2+3=6=3× 4/2 zu beweisen,ist sehr einfach. Jedoch wäre es sehr ermüdend, ihre Gültigkeit auf dieseWeise für jede natürliche Zahl, eine nach der <strong>and</strong>eren, bis zu n = 1000 zuzeigen. Natürlich könnten wir den Computer zur Hilfe nehmen, aber auchder Computer würde für sehr große n an Grenzen stoßen. Außerdem haben


6.1 Induktion 711 2 3 nn+1Abb. 6.1. Das Prinzip der Induktion: Fällt n um dann wird n+1 umfallen, d.h.wenn 1 umfällt, dann fallen sie alle!wir noch im Hinterkopf, dass unabhängig davon, wie viele natürliche Zahlenn wir schon geprüft haben, immer noch natürliche Zahlen übrig bleiben,die wir noch nicht geprüft haben.Gibt es nicht einen <strong>and</strong>eren Weg, um die Gültigkeit von (6.1) für jedenatürliche Zahl n zu beweisen? Ja, wir können das Prinzip der mathematischenInduktion bemühen, das darauf beruht, dass eine Formel automatischfür n +1gültig ist, wenn wir ihre Gültigkeit für n gezeigt haben.Der erste Schritt ist, zu prüfen, ob die Formel für n = 1 gilt. Diesen einfachenSchritt haben wir schon gemacht. Der verbleibende Schritt, der induktiveSchritt, ist der Nachweis, dass, wenn die Formel für eine bestimmtenatürliche Zahl gültig ist, sie auch für die nächste natürliche Zahl gilt. DasPrinzip der mathematischen Induktion behauptet, dass die Formel dannfür jede beliebige natürliche Zahl n wahr sein muss. Wahrscheinlich sindSie bereit, dieses Prinzip rein intuitiv zu akzeptieren: Wir wissen, dass dieFormel für n = 1 gilt. Durch den induktiven Schritt gilt sie auch für dienächste Zahl, d.h. für n = 2, und somit für n = 3, wiederum durch deninduktiven Schritt, und somit für n = 4 u.s.w. Da wir auf diese Art jedenatürliche Zahl erreichen, können wir auch ziemlich sicher sein, dass dieFormel für jede natürliche Zahl Gültigkeit hat. Natürlich basiert das Prinzipder mathematischen Induktion auf der Überzeugung, dass wir sicherlichjede natürliche Zahl erreichen, wenn wir bei 1 beginnen und genügend oft1 dazu addieren.Jetzt wollen wir den Induktionsschritt unternehmen, um (6.1) zu beweisen.Wir nehmen dazu an, dass Formel (6.1) für n = m−1gültig ist, wobeim ≥ 2einenatürliche Zahl ist. Anders formuliert, nehmen wir an, dass(m − 1)m1+2+3+···+ m − 1= (6.2)2gilt. Wir wollen nun die Formel für die nächste natürliche Zahl n = mbeweisen. Dazu addieren wir m zu beiden Seiten von (6.2):(m − 1)m1+2+3+···+ m − 1+m = + m2= m2 − m+ 2m 2 2 = m2 − m +2m2m(m +1)= ,2was uns die Richtigkeit der Formel für n = m zeigt. Somit wissen wir,dass, wenn (6.1) für eine bestimmte natürliche Zahl n = m − 1 gilt, sie


72 6. Mathematische Induktionauch für die nächste natürliche Zahl n = m Gültigkeit hat, d.h. wir habenden induktiven Schritt vollzogen. Durch Wiederholung dieses induktivenSchritts können wir sehen, dass (6.1) für jede natürliche Zahl n gilt.Wir können den Beweis des induktiven Schritts alternativ auch wie folgtformulieren, wobei wir auf die Einführung der natürlichen Zahl m verzichten.Bei dieser Umformulierung nehmen wir an, dass (6.1) gilt, wenn wir ndurch n − 1 ersetzen, d.h. wir nehmen an, dass1+2+3+···+ n − 1=Hinzufügen von n auf beiden Seiten liefert(n − 1)n.21+···+ n − 1+n =(n − 1)n2+ n =n(n +1),2was (6.1) entspricht. Somit können wir den induktiven Schritt zum Beweisvon (6.1) auch so vornehmen, dass wir die Gültigkeit von (6.1) annehmenund dabei n durch n − 1 ersetzen.Formeln wie (6.1) stehen eng mit grundlegenden Integrationsformeln derInfinitesimalrechnung in Verbindung, auf die wir später treffen werden undsie treten beispielsweise auch bei der Zinseszins-Berechnung und beim Zusammenzählenvon Tierpopulationen auf. Diese Formeln sind also nicht nurzum Eindruckmachen zu gebrauchen.Viele Studierende finden, dass der Beweis einer Eigenschaft wie (6.1) fürein bestimmtes n wie 1, 2 oder 100 nicht sonderlich schwer ist. Aber derverallgemeinernde induktive Schritt: Unter der Annahme, dass die Formelwahr ist für eine vorgegebene natürliche Zahl und dann nachweisen, dasssie auch für die nächste natürliche Zahl stimmt, wird beschwerlich, weildie vorgegebene Zahl nicht konkret angegeben wird. Lassen Sie Sich nichtdurch dieses fremdartige Gefühl davon abbringen, es zu versuchen: Wie oftin der <strong>Mathematik</strong> ist es nicht so schwer, das Problem zu lösen, als sichvorzustellen, das Problem lösen zu müssen (wie zum Zahnarzt zu gehen).Einige Induktionsprobleme durchzuarbeiten ist eine gute Übung, um sichan einige der Argumente, auf die wir später treffen werden, zu gewöhnen.Die Induktionsmethode mag sinnvoll sein, um die Gültigkeit einer Formelzu beweisen, aber zunächst muss die Formel irgendwie gefunden werden,was ein gute Portion Intuition, Ausprobieren oder sonst eine Einsicht (wiedie kluge Idee von Gauss) verlangt. Induktion kann Ihnen helfen, weil esIhnen eine Methodik (Annahme der Gültigkeit für eine natürliche Zahl undanschließend die Gültigkeit für die nächste beweisen) an die H<strong>and</strong> gibt, aberSie müssen einen guten Ausgangspunkt oder eine Vermutung haben.Sie können versuchen, auf Formel (6.1) durch Ausprobieren zu kommen,wenn Sie erst einmal den Mut aufbringen eine Formel zu suchen. Sie könntenargumentieren, dass der Durchschnittswert der Zahlen 1 bis n etwan/2 ist und da n Zahlen zu addieren sind, sollte ihre Summe irgendwie n n 2


6.1 Induktion 73sein, was der richtigen Formel (n+1) n 2sehr nahe kommt. Sie müssen nichtGauss sein, um das zu erkennen.Im Folgenden geben wir drei weitere Beispiele, die die mathematischeInduktion verdeutlichen.Beispiel 6.1. Zunächst geben wir die folgende Formel für die Summe einerendlichen geometrischen Reihe an:1+p + p 2 + p 3 + ···+ p n = 1 − pn+11 − p , (6.3)wobei p der Quotient ist, von dem angenommen wird, dass er eine vorgegebenenatürliche Zahl sei, und n ist eine natürliche Zahl. Beachten Sie, dassp fest vorgeben ist und sich nicht ändert und die Induktion gilt der Zahl nmit n + 1 Termen in der Reihe. Die Formel (6.3) gilt für n =1,da1+p =(1 − p)(1 + p)1 − p= 1 − p21 − p ,wobei wir die Formel a 2 −b 2 =(a−b)(a+b) benutzen. Unter der Annahme,dass sie gültig sei, wenn wir n durch n − 1 ersetzen, erhalten wir1+p + p 2 + p 3 + ···+ p n−1 = 1 − pn1 − p .Nach Addition von p n auf beiden Seiten erhalten wir1+p + p 2 + p 3 + ···+ p n−1 + p n = 1 − pn1 − p + pnwomit der induktive Schritt bewiesen ist.= 1 − pn1 − p + pn (1 − p)1 − p= 1 − pn+11 − p ,Natürlich lässt sich (6.3) noch einfacher beweisen, da (1−p)(1+p+p 2 +p 3 +...+p n )=1+p+p 2 +p 3 +...+p n −p−p 2 −p 3 −...−p n −p n+1 =1−p n+1gilt und wir dann nur noch durch (1 − p) dividieren müssen.Beispiel 6.2. Induktion kann auch benutzt werden, um Eigenschaften, diekeine Summationen beinhalten, zu beweisen. Als Beispiel zeigen wir einenützliche Ungleichung. Für jede feste natürliche Zahl p gilt(1 + p) n ≥ 1+np (6.4)für jede beliebige natürliche Zahl n. Die Ungleichung (6.4) ist sicherlich fürn =1gültig, da (1+p) 1 =1+1×p. Die Annahme, dass sie für n−1wahrist, liefert(1 + p) n−1 ≥ 1+(n − 1)p.


74 6. Mathematische InduktionMultiplikation beider Seiten mit der positiven Zahl 1 + p ergibt(1 + p) n =(1+p) n−1 (1 + p) ≥ (1 + (n − 1)p)(1 + p)=1+(n − 1)p + p +(n − 1)p 2 =1+np +(n − 1)p 2 .Da (n−1)p 2 nicht negativ ist, können wir es von der rechten Seite abziehenund erhalten so (6.4).6.2 InsektenpopulationenMit Hilfe der Induktion werden oft Modelle hergeleitet. Wir stellen nun einBeispiel vor, das das Wachstum einer Insektenpopulation betrifft. Wir betrachtendazu eine vereinfachte Situation einer Insektenpopulation, wobeidie Erwachsenen sich während des ersten Sommers ihres Lebens vermehrenund dann vor dem nächsten Sommer sterben. Wir wollen verstehen,wie sich die Population der Insekten von Jahr zu Jahr verändert. Das isteine wichtige Fragestellung, wenn die Insekten zum Beispiel Krankheitentragen oder die Ernte fressen. Im Allgemeinen gibt es viele Faktoren, diedie Reproduktionsrate beeinflussen: Nahrungsversorgung, Wetter, Insektenvernichtungsmittelund sogar die Populationsgröße selbst. Aber in derersten Modellbildungsphase vereinfachen wir all dies und nehmen an, dassdie Zahl der Nachkommen in jeder Fortpflanzungsperiode der Anzahl inder Periode lebender Insekten proportional ist. Experimentell ist das ofteine vernünftige Annahme, wenn die Population nicht zu groß ist.Weil wir Insektenpopulationen über mehrere Jahre beschreiben wollen,müssen wir eine Notation einführen, die es uns einfach macht, Variablennamenfür verschiedene Jahre zu benutzen. Deswegen indizieren wir. Wir bezeichnenmit P 0 die erste oder Anfangspopulation und mit P 1 ,P 2 ,...,P n ,...die Populationen in den Folgejahren 1, 2,...,n,.... Der tiefgestellte Indexbei P n ist praktisch, um das Jahr zu kennzeichnen. Entsprechend unsererAnnahme, ist P n stets proportional zu P n−1 . Unsere Modellierungsannahmeist, dass die Population P n , nach jeder beliebigen Anzahl an Jahren n,der Population des Vorjahres P n−1 proportional, d.h. ein Vielfaches davon,ist. Bezeichnet R die Proportionalitätskonstante, so haben wirP n = RP n−1 . (6.5)Unter der Annahme, dass wir die Anfangspopulation P 0 kennen, stellt sichdie Frage, wann die Population eine gewisse Schwelle M erreicht. Andersformuliert, wir suchen das kleinste n,sodassP n ≥ M.Um das zu erreichen, wollen wir eine Formel finden, die die Abhängigkeitvon P n mit n direkt ausdrückt. Dies können wir mit Hilfe der Induktion für(6.5) erreichen. Da (6.5) auch für n − 1 gilt, d.h. P n−1 = RP n−2 ,erhaltenwir nach Substitution:P n = RP n−1 = R(RP n−2 )=R 2 P n−2 .


6.2 Insektenpopulationen 75Nun substituieren wir für P n−2 = RP n−3 ,P n−3 = RP n−4 usw. Nach n − 2Substitutionen erhalten wirP n = R n P 0 . (6.6)Da R und P 0 bekannt sind, haben wir somit eine explizite Formel für P nin Abhängigkeit von n. Beachten Sie, dass die Art, wie wir hierbei mitInduktion umgehen, <strong>and</strong>ers scheinen mag als im vorherigen Beispiel. Aberdieser Unterschied ist nur oberflächlich. Damit das Induktionsargumentdem des vorigen Beispiels ähnelt, können wir annehmen, dass (6.6) fürn − 1 gilt und (6.5) benutzen, um zu zeigen, dass dies auch für n gilt.Zurück zur Frage, in welchem Jahr n die Population P n die Schwelle Merreicht (P n ≥ M). Es ergibt sich nunR n ≥ M/P 0 . (6.7)Ist R>1, wächst R n sicherlich soweit an, dass dies eintritt. Ist beispielsweiseR =2,wächst P n sehr schnell mit n.IstP 0 = 1000, so ist P 1 = 2000,P 5 = 32 000 und P 10 =1.024.000.Abb. 6.2. Gauss 1831: ”... so protestiere ich zuvörderst gegen den Gebraucheiner unendlichen Größe als einer Vollendeten, welcher in der <strong>Mathematik</strong> niemalserlaubt ist. Das Unendliche ist nur eine façon de parler, indem man eigentlichvon Grenzen spricht, denen gewisse Verhältnisse so nahe kommen als man will,während <strong>and</strong>eren ohne Einschränkung zu wachsen verstattet ist“


76 6. Mathematische InduktionAufgaben zu Kapitel 66.1. Zeigen Sie durch Induktion für folgende Formeln(a) 1 2 +2 2 +3 2 + ···+ n 2 =n(n + 1)(2n +1)6(6.8)und 2(b) 1 3 +2 3 +3 3 + ···+ n 3 n(n +1)= , (6.9)2dass sie für alle natürlichen Zahlen n gelten.6.2. Zeigen Sie durch Induktion, dass die folgende Formel für alle natürlichenZahlen n gültig ist:11 × 2 + 12 × 3 + 13 × 4 + ···+ 1n(n +1) = 1n +1 .6.3. Zeigen Sie durch Induktion, dass die folgenden Ungleichungen für alle natürlichenZahlen n gelten:(a) 3n 2 ≥ 2n +1, (b)4 n ≥ n 2 .6.4. Modellieren Sie eine Insektenpopulation, die eine einzige Fortpflanzungsperiodewährend des Sommers hat. Die Erwachsenen vermehren sich während desersten Sommers ihres Lebens und sterben vor dem nächsten Sommer. FormulierenSie die Insektenpopulation als eine Funktion des Jahres, unter der Annahme, dassdie ausgeschlüpften Nachkommen in jeder Fortpflanzungsperiode dem Quadratder Zahl Erwachsener proportional ist.6.5. Modellieren Sie eine Insektenpopulation, die eine einzige Fortpflanzungsperiodewährend des Sommers hat. Die Erwachsenen vermehren sich währenddes ersten Sommers ihres Lebens und sterben vor dem nächsten Sommer. Allerdingstöten und essen die Erwachsenen einige ihrer Nachkommen. Leiten Sieeine Gleichung her, die die Insektenpopulation eines Jahres in Abhängigkeit vonder Population im Vorjahr angibt, unter der Annahme, dass die ausgeschlüpftenNachkommen in jeder Fortpflanzungsperiode der Anzahl Erwachsener unddie Zahl der getöteten Nachkommen dem Quadrat der Zahl der Erwachsenenproportional ist.6.6. (Schwierig) Modellieren Sie eine Insektenpopulation, die eine einzige Fortpflanzungsperiodewährend des Sommers hat. Die Erwachsenen vermehren sichwährend des ersten und zweiten Sommers ihres Lebens und sterben vor demdritten Sommer. Formulieren Sie die Insektenpopulation für ein beliebiges Jahr(außer dem ersten) in Abhängigkeit von den vergangenen zwei Jahren, unter derAnnahme, dass die ausgeschlüpften Nachkommen in jeder Fortpflanzungsperiodeder Zahl der lebenden Insekten proportional ist.


Aufgaben zu Kapitel 6 776.7. Leiten Sie Formel (6.1) her, indem Sie die Summe1 + 2 + ··· + n − 1 + n+ n + n − 1 + ··· + 2 + 1n +1 + n +1 + ··· + n +1 + n +1beweisen und zeigen, das dies bedeutet, dass 2(1+2+ ···+n)=n ×(n+1) gilt.6.8. (Schwierig) Zeigen Sie durch Induktion an der Schuldivisionsmethode, dassdie Formel für die geometrische Reihe (6.3) für folgenden Ausdruck stimmt:p n+1 − 1p − 1


7Rationale ZahlenDas Hauptziel aller unserer Untersuchungen der äußeren Welt solltedie Entdeckung der rationalen Ordnung und Harmonie sein, die Gottihr gegeben hat und die er uns in der Sprache der <strong>Mathematik</strong> zuerkennen gibt. (Kepler)7.1 EinleitungWir lernen in der Schule, dass eine rationale Zahl r eine Zahl ist, die sich alsr = p qschreiben lässt, wobei p und q ≠ 0 ganze Zahlen sind. Solche Zahlenwerden auch gebrochene Zahlen, Quotienten oder Verhältnisse genannt.Wir nennen p den Zähler und q den Nenner des Bruchs oder des Quotienten.Wir wissen, dass p 1= p und dass die rationalen Zahlen die ganzen Zahlenbeinhalten. Der Grund für die Einführung der rationalen Zahlen ist der,dass wir mit ihnen auch Gleichungen der Formqx = plösen können, in der p und q ≠ 0 ganze Zahlen sind. Die Lösung ist x = p q .Im Modell der Mittagssuppe trafen wir auf die Gleichung 15x =10indieserForm, mit der Lösung x = 1015 = 2 3. Es ist offenbar, dass wir die Gleichung15x =10nichthätten lösen können, wenn wir uns auf die natürlichenZahlen beschränkt hätten. Somit sollten Sie und Ihre Freundin glücklichdarüber sein, dass es die rationalen Zahlen gibt.Wenn die natürliche Zahl m ein Teiler der natürlichen Zahl n ist, sodass n = pm mit der natürlichen Zahl p gilt, dann ist p = n m und n m ist


80 7. Rationale Zahleneine natürliche Zahl. Besitzt die Division von n durch m einen von Nullverschiedenen Rest, so dass n = pm+r mit 0


7.2 Wie die rationalen Zahlen konstruiert werden 81xs = sx und qxsy = qsxy = qs(xy). Wir erhaltenworaus wir schließen, dassqs(xy)=pr,xy =(pr,qs)= prqs ,da z = xy sichtlich die Gleichung qsz = pr löst. Somit erhalten wir die unsbekannte Regelxy = p q × r s = prqsoder (p,q) × (r, s)=(pr,qs), (7.1)die besagt, dass Zähler und Nennen getrennt multipliziert werden.Um einen Hinweis zu bekommen, wie rationale Zahlen x =(p,q) =pq und y =(r, s) = r saddiert werden, beginnen wir wiederum bei denDefinitionsgleichungen qx = p und sy = r. Nach Multiplikation beiderSeiten von qx = p mit s und beider Seiten von sy = r mit q, erhaltenwirqsx = ps und qsy = qr. Aus diesen Gleichungen erhalten wir mit Hilfe desDistributiv-Gesetzes für ganze Zahlen qs(x + y)=qsx + qsy, dasswas uns die Vorschriftx + y = p q + r s=ps + qrqsqs(x + y)=ps + qr,oder (p,q)+(r, s)=(ps + qr,qs) (7.2)liefert. Dies entspricht der geläufigen Art der Addition zweier rationalenZahlen mit einem gemeinsamen Zähler.Wir können ferner feststellen, dass für s ≠0,qx = p nur dann gilt, wennauch sqx = sp gilt (vgl. Aufgabe 5.5), da die beiden Gleichungen qx = pund sqx = sp die gleiche Lösung x besitzen:pq = x = spsqoder (p,q)=(sp,sq). (7.3)Das besagt, dass ein gemeinsamer von Null verschiedener Faktor s in Nennerund Zähler gekürzt oder umgekehrt eingeführt werden kann.Mit der Inspiration der obigen Berechnungen können wir jetzt die rationalenZahlen als geordnete Paare (p,q) definieren,wobeip und q ≠ 0 ganzeZahlen sind und wir beschließen (p,q) = p qzu schreiben. Inspiriert von(7.3) definieren wir (p,q)=(sp,sq)für s ≠ 0, und betrachten so (p,q) und(sp,sq) als (zwei verschiedene Darstellungen für) ein und dieselbe rationaleZahl, wie etwa 6 4 = 3 2 .Als Nächstes definieren wir die Multiplikation × und Addition + rationalerZahlen durch (7.1) und (7.2). Ferner können wir die rationale Zahl(p,1) der ganzen Zahl p gleichsetzen, da p die Gleichung 1x = p löst. So


82 7. Rationale Zahlenkönnen wir die rationalen als Erweiterung der ganzen Zahlen sehen, ähnlichwie die ganzen Zahlen als Erweiterung der natürlichen Zahlen. Wirbemerken, dass p + r =(p,1) + (r, 1) = (p + r, 1) = p + r ebenso wiepr =(p,1) × (r, 1) = (pr,1) gilt, und dass Addition und Multiplikationrationaler Zahlen, die ganze Zahlen sind, wie bisher ausgeführt werden.Somit können wir die Division (p,q)/(r, s) zweier rationalen Zahlen (p,q)und (r, s) mitq,r ≠0alsLösung x der Gleichung (r, s)x =(p,q) betrachten.Da (r, s)(ps,qr)=(rps, sqr)=(p,q) gilt, ergibt sichwas wir ebenso in der Formx =(p,q)/(r, s)= (p,q)(r, s) =(ps,qr),pqrs= psqrschreiben können. Schließlich können wir die rationalen Zahlen wie folgtanordnen: Wirdefinieren die rationale Zahl (p,q) (mitq ≠0)alspositiv,falls p und q das gleiche Vorzeichen haben und schreiben dafür (p,q) > 0.Für zwei rationale Zahlen (p,q) und (r, s) schreiben wir (p,q) < (r, s) falls(r, s) − (p,q) > 0 gilt. Beachten Sie, dass sich diese Differenz aus (r, s) −(p,q)=(qr − sp,sq) ergibt,da−(p,q)einegebräuchliche Schreibweise für(−p,q) ist. Beachten Sie ferner, dass −(p,q)=(−p,q)=(p,−q), wie aus− p q = −pq = p −qersichtlich ist.Der Absolutwert |r| einer rationalen Zahl r =(p,q) = p qwird wie beinatürlichen Zahlen durch{r falls r ≥ 0,|r| =(7.4)−r falls r


7.3 Zur Notwendigkeit der rationalen Zahlen 83Also haben wir die rationalen Zahlen aus den ganzen Zahlen konstruiert,in dem Sinne, dass wir jede rationale Zahl p qals ein geordnetes Paar (p,q)ganzer Zahlen p und q ≠ 0 betrachten. Die Rechenregeln für rationaleZahlen haben wir angegeben, indem wir sie auf die Rechenregeln für ganzeZahlen zurückgeführt haben.Abschließend bemerken wir, dass jede Größe, die wir durch Addition,Subtraktion, Multiplikation und Division rationaler Zahlen erhalten (unterVermeidung der Division durch 0) wieder einer rationalen Zahl entspricht.Mathematisch gesprochen ist die Menge der rationalen Zahlen abgeschlossen“gegenüber arithmetischen Operationen, da diese Operationen nicht ”aus der Menge herausführen. Hoffentlich ist Ihre (aufnahmefähige) Freundinjetzt zufrieden.7.3 Zur Notwendigkeit der rationalen ZahlenDie Notwendigkeit der rationalen Zahlen wird bereits früh in der Schuleerklärt. Die ganzen Zahlen alleine sind ein zu grobes Instrument und wirbenötigen Brüche, um eine zufriedenstellende Genauigkeit zu erreichen. Unseretägliche Erfahrung liefert dafür genug Gründe, etwa beim Abmessenverschiedener Güter. Wenn wir ein st<strong>and</strong>ardisiertes Messsystem erzeugen,wie das englische Fuß-Pfund System oder das metrische System wählenwir beliebige Größen als Einheitsmaße. Beispielsweise den Meter oder dasYard für Abstände, das Pfund oder das Kilogramm für das Gewicht unddie Minute oder die Sekunde für die Zeit. Alles wird in Bezug auf dieseEinheiten gemessen. Aber selten ergibt eine Messung ein ganzes Vielfachesdieser Einheiten und somit sind wir gezwungen, mit Teilen dieser Einheitenzurechtzukommen. Die einzige Möglichkeit dies zu vermeiden wäre, winzigeEinheiten (wie die italienische Lire) zu wählen, aber das ist unpraktisch.Wir geben sogar gewissen Teileinheiten eigene Namen; Zentimetersind 1/100 eines Meters, Millimeter sind 1/1000 eines Meters, Inche sind1/12 eines Fußes, Unzen sind 1/16 eines Pfunds u.s.w.Betrachten Sie das Problem 76cm zu 5m zu addieren. Dazu w<strong>and</strong>eln wirdie Meter in Zentimeter, 5m=500cm, und erhalten dann 576cm. Aber dasist genau dasselbe wie einen gemeinsamen Nenner für die beiden Abstände,nämlich Zentimeter, d.h. 1/100 eines Meters, zu finden und dann das Ergebniszu addieren.7.4 Dezimale Entwicklungen der rationalen ZahlenDie nützlichste Art eine rationale Zahl darzustellen, ist die Dezimaldarstellungwie 1/2=0, 5, 5/2=2, 5 und 5/4=1, 25. Ganz allgemein betrachtet,


84 7. Rationale Zahlenist eine endliche Dezimaldarstellung eine Zahl der Form±p m p m−1 ...p 2 p 1 p 0 ,q 1 q 2 ...q n , (7.5)wobei die Ziffern p m ,p m−1 ,...,p 0 ,q 0 ,...,q n alle aus der Menge 0, 1,...,9stammen und m und n natürliche Zahlen sind. Die Dezimaldarstellung (7.5)ist eine Kurzschreibweise für die Zahl± p m 10 m + p m−1 10 m−1 + ···+ p 1 10 1 + p 0 10 0Zum Beispiel+ q 1 10 −1 + ···+ q n−1 10 −(n−1) + q n 10 −n .432, 576 = 4 × 10 2 +3× 10 1 +2× 10 0 +5× 10 −1 +7× 10 −2 +6× 10 −3 .Der ganzzahlige Teil der Dezimalzahl (7.5) ist p m p m−1 ...p 1 p 0 , wohingegen0,q 1 q 2 ...q n Dezimal- oder Nachkommastellen sind. Für das Beispiel gilt:432,576=432 + 0,576.Dezimaldarstellungen werden berechnet, indem man die Schuldivisionhinter“ dem Dezimalkomma fortsetzt, statt sie zu beenden, wenn der Rest”gefunden wurde. Wir verdeutlichen das in Abb. 7.1.Abb. 7.1. Dezimaldarstellung mit Hilfe der SchuldivisionsmethodeDa sie eine Summe rationaler Zahlen ist, ist eine endliche Dezimaldarstellungnotwendigerweise eine rationale Zahl. Das kann auch dadurch verdeutlichtwerden, dass p m p m−1 ...p 1 p 0 ,q 1 q 2 ...q n als Quotient ganzer Zahlengeschrieben wird:p m p m−1 ...p 1 p 0 ,q 1 q 2 ...q n = p mp m−1 ...p 1 p 0 q 1 q 2 ...q n10 n ,wie 423, 576 = 423576/10 3 .


7.5 Periodische Dezimaldarstellungen rationaler Zahlen 857.5 Periodische Dezimaldarstellungenrationaler ZahlenBei der Berechnung von Dezimaldarstellungen rationaler Zahlen nach derSchuldivisionsmethode stößt man schnell auf folgende interessante Beobachtung:Einige Dezimaldarstellungen ”hören nicht auf“. Anders formuliert,so enden einige Dezimaldarstellungen nie, d.h. sie enthalten eine unendlicheZahl von Null verschiedener Dezimalstellen. So ist beispielsweise die Lösungder Gleichung 15x = 10 im Modell der Mittagssuppe x =2/3=0, 666 ....Ferner ist 10/9 =1, 11111 ..., wie in Abb. 7.2 dargestellt. Dabei benut-Abb. 7.2. Die Dezimalentwicklung von 10/9 hört nicht aufzen wir das Wort ”unendlich“ um anzudeuten, dass die Dezimaldarstellungendlos fortgeführt werden kann. Wir können viele Beispiele für unendlicheDezimaldarstellungen finden:1=0, 3333333333 ···32=0, 18181818181818 ···114=0, 571428571428571428571428 ···7Wir schließen daraus, dass das System der rationalen Zahlen p q ,mitdenganzen Zahlen p und q ≠ 0, und das Dezimalsystem nicht vollständig zuein<strong>and</strong>erpassen. Gewisse rationale Zahlen dezimal darzustellen ist mit einerendlichen Zahl Dezimalstellen unmöglich, solange wir keine Ungenauigkeitenakzeptieren wollen.Wir stellen fest, dass sich bei allen oben angeführten Beispielen unendlicherDezimaldarstellungen die Ziffern ab einer Dezimalstelle wiederholen.Die Ziffern bei 10/9 und 1/3 wiederholen sich sofort, die Ziffern von 2/11wiederholen sich nach 2 Dezimalstellen und die Ziffern von 4/7 wiederho-


86 7. Rationale Zahlenlen sich nach 6 Zeichen. Wegen dieser Wiederholung nennen wir derartigeDezimaldarstellungen periodisch.Tatsächlich stellen wir bei der Schuldivision zur Berechnung von Dezimaldarstellungenvon p/q fest, dass die Dezimaldarstellung jeder rationalenZahl entweder endlich (falls der Rest irgendwann Null wird) oder periodisch(falls der Rest niemals Null wird) ist. Um zu erkennen, dass dies die einzigenAlternativen sind, nehmen wir an, dass die Darstellung nicht endlichsei. Bei jedem Divisionsschritt ist der Rest folglich ungleich Null und derRest entspricht, unter Vernachlässigung des Dezimalzeichens, einer natürlichenZahl r, die offensichtlich 0


7.5 Periodische Dezimaldarstellungen rationaler Zahlen 87auf 3 Nachkommastellen verkürzen, erhalten wir109=1, 111 + 0, 0001111 ...mit dem Fehler 0, 0001111 ..., was sicher kleiner ist als 10 −3 .Ganzanalogwäre der Fehler kleiner als 10 −n ,wennwirnachn Dezimalstellen abschneiden.Da sich diese Diskussion direkt um die unendliche Dezimaldarstellungdreht, die durch das Abschneiden weg fällt, und da wir uns bisher nochnicht damit beschäftigt haben, wie mit unendlichen Dezimaldarstellungenumzugehen ist, wollen wir das Problem nun von einem etwas <strong>and</strong>eren Blickwinkelaus angehen. Wir wollen die Dezimaldarstellung von 10/9, die wirnach n Nachkommastellen abschneiden, mit 1, 1 ...1 n (d.h. mit n Stellengleich 1 hinter dem Komma) bezeichnen:1, 11 ...11 n =1+10 −1 +10 −2 + ...+10 −n+1 +10 −n .Mit Hilfe der Formel (6.3) für die geometrische Reihe können wir die Summeauf der rechten Seite berechnen und erhalten1, 11 ...11 n = 1 − 10−n−11 − 0, 1= 109 (1 − 10−n−1 ), (7.6)und somit109 =1, 11 ...11 n + 10−n9 . (7.7)Der Fehler, den wir durch das Abschneiden machen, ist somit 10 −n /9, derder Einfachheit halber durch 10 −n beschränkt ist. Der Fehler 10 −n /9wirdso klein, wie wir wollen, indem wir nur n groß genug wählen und so könnenwir 1, 11 ...11 n so weit an 10/9annähern, wie wir wollen, indem wir n großgenug wählen. Das führt uns dazu, dass wir die Bedeutung von109=1, 11111111 ...so übersetzen, dass wir die Zahlen 1, 11 ... n so weit wir wollen an 10/9annähern können, indem wir n groß wählen. Insbesondere ergibt das fürden Fehler| 109 − 1, 11 ···11 n|≤10 −n .Der Fehler wird kleiner als jede vorgegebene positive Zahl, wenn wir nurgenügend viele Dezimalstellen der niemals endenden Dezimaldarstellungvon 109 einbeziehen.Wir wollen ein weiteres Beispiel geben, bevor wir verallgemeinern. Wirberechnen 2/11 = 0, 1818181818 .... Nehmen wir die ersten m Paare der


88 7. Rationale ZahlenZiffernfolge 18, so erhalten wird.h.und somit0, 1818 ...18 m = 18100 + 18= 1810010000 + 18 18+ ···+(1000000 10 2m1+ 1100 + 1)100 2 + ···+ 1100 m−1= 18 1 − (100 −1 ) m100 1 − 100 −1 = 18 100100 99 (1 − 100−m )= 211 (1 − 100−m ),211 =0, 1818 ...18 m + 211 100−m ,| 211 − 0, 1818 ...18 m|≤100 −m .Wir interpretieren die Bedeutung von 2/11 = 0, 1818181818 ...so, dass wirdie Zahlen 0, 1818 ...18 m so weit an 2/11 annähern können, wie wir wollen,indem wir m genügend groß wählen.Jetzt betrachten wir den allgemeinen Fall einer unendlichen periodischenDezimaldarstellung der Formp =0,q 1 q 2 ...q n q 1 q 2 ...q n q 1 q 2 ...q n ...,wobei jede Periode aus den n Ziffern q 1 ...q n bestehe. Schneiden wir dieDezimaldarstellung nach m Perioden ab, so erhalten wir mit Hilfe von (6.3)p m = q 1q 2 ...q n10 n + q 1q 2 ...q n10 n2 + ···+ q 1q 2 ...q n10 nm= q (1q 2 ...q n10 n 1+ 110 n + 1)(10 n ) 2 + ···+ 1(10 n ) m−1d.h.und somit= q 1q 2 ...q n 1 − (10 −n ) m10 n 1 − 10 −n = q 1q 2 ...q n10 n − 1q 1 q 2 ...q n10 n − 1 = p m + q 1q 2 ...q n10 n − 1 10−nm ,∣ ∣∣∣ q 1 q 2 ...q n10 n − 1 − p m∣ ≤ 10−nm .Zusammenfassend können wir die Bedeutung vonp = q 1q 2 ...q n10 n − 1(1 − (10 −n ) m) ,


7.6 Mengenschreibweise 89so interpretieren, dass der Unterschied zwischen der abgeschnittenen Dezimaldarstellungp m von p und q 1 q 1 ...q n /(10 n − 1) kleiner als jede positiveZahl gemacht werden kann, indem wir die Anzahl der Periodenm groß genug wählen, d.h. indem wir mehr Nachkommastellen von pberücksichtigen. Somit können wir p gleich einer rationalen Zahl, nämlichp = q 1 q 1 ...q n /(10 n − 1), setzen.Beispiel 7.1. 0, 123123 ...entspricht der rationalen Zahl 12399und 4, 1212 ...ist gleich 4 + 12 9 = 4×9+129= 48 9 .Wir fassen zusammen, dass jede unendliche periodische Dezimaldarstellungeiner rationalen Zahl gleich gesetzt werden kann und umgekehrt. Wirkönnen daher die Diskussion in diesem Abschnitt in folgendem grundlegendemSatz zusammenfassen:Satz 7.1 Die Dezimaldarstellung einer rationalen Zahl ist periodisch. Eineperiodische Dezimaldarstellung ist gleich einer rationalen Zahl.7.6 MengenschreibweiseWir haben bereits mehrere Beispiele von Mengen kennengelernt, z.B. dieMenge {1, 2, 3, 4, 5} der ersten 5 natürlichen Zahlen und die (unendliche)MengeN={1, 2, 3, 4,...} aller (möglichen) natürlichen Zahlen. Eine Mengewird durch ihre Elemente definiert. Beispielsweise besteht die MengeA = {1, 2, 3, 4, 5} aus den Elementen 1,2,3,4 und 5. Um zu kennzeichnen,dass ein Objekt ein Element einer Menge ist, benutzen wir das Zeichen∈, z.B.4∈ A. Ferner gilt 7 ∈Naber 7 /∈ A. Um eine Menge zu definieren,müssen wir in einer Weise ihre Elemente angeben. In den beidengegebenen Beispielen, konnten wir die Elemente innerhalb der Mengenklammern{ und } einfach auflisten. Wenn wir auf komplizierte Mengentreffen, müssen wir unsere Notation weiter entwickeln. Eine bequeme Artum Elemente einer Menge anzugeben, besteht darin, einen charakteristischeEigenschaft zu nennen. Beispielsweise A = {n ∈N:n≤5}, was bedeutetdie Menge der natürlichen Zahlen n,mitn ≤ 5“. Als ein weiteres Beispiel”kann die Menge der ungeraden natürlichen Zahlen angegeben werden, als{n ∈N:n ungerade} oder auch {n ∈N:n= 2j − 1für j ∈N}. DerDoppelpunkt : hat hierbei die Bedeutung für die gilt“. ”Sind die Mengen A und B gegeben, können wir neue Mengen konstruieren.Im Besonderen bezeichnen wir mit A ∪ B die Vereinigung von A undB, die aus allen Elementen, die mindestens in einer der Mengen A oderB enthalten sind, besteht und mit A ∩ B den Schnitt von A und B, deraus allen Elementen besteht, die sowohl in A als auch in B enthalten sind.Ferner bezeichnet A \ B die Teilmenge von Elementen aus A, dienicht inB enthalten sind, was als Subtraktion“ von B (genauer von B ∪A)vonA”


90 7. Rationale ZahlenAbb. 7.3. Die Mengen A ∪ B, A ∩ B und A \ Binterpretiert werden kann, vgl. Abb. 7.3. Des Weiteren bezeichnet A×B dieProduktmenge von A und B. Das ist die Menge aller möglichen geordnetenPaare (a,b), wobei a ∈ A und b ∈ B gilt.Beispiel 7.2. Ist A = {1, 2, 3} und B = {3, 4},dannsindA∪B = {1, 2, 3, 4},A ∩ B = {3}, A \ B = {1, 2} und A × B = {(1, 3), (1, 4), (2, 3), (2, 4), (3, 3),(3, 4)}.7.7 Die MengeQder rationalen ZahlenEs ist allgemein üblich, die Menge aller möglichen rationalen Zahlen mitQ zu bezeichnen, d.h. die Menge aller Zahlen x der Form x = p/q =(p,q),wobei p und q ≠ 0 ganze Zahlen sind. Oft lassen wir dabei das möglich“ ”weg und sagen einfach, dassQdie Menge der rationalen Zahlen bezeichnet,die geschrieben werden können alsQ ={x = p }q : p,q ∈Z, q≠0 .Wir könnenQebenso als Menge der Zahlen mit endlichen oder periodischenDezimaldarstellungen formulieren.7.8 Die rationale Zahlengerade und IntervalleErinnern Sie sich daran, dass wir die ganzen Zahlen mit der Zahlengerade,einer Geraden, auf der wir Punkte in festen Abständen markiert haben,dargestellt haben? Wir können auch die rationalen Zahlen mit Hilfe einerGerade darstellen. Dazu beginnen wir mit der Zahlengerade für die ganzenZahlen und fügen die rationalen Zahlen hinzu, die eine Nachkommastellebesitzen:− ...,−1, (−0, 9), (−0, 8),...,(−0, 1), 0, (0, 1), (0, 2),...,(0, 9), 1,....


7.8 Die rationale Zahlengerade und Intervalle 91Dazu fügen wir dann rationale Zahlen mit zwei Nachkommastellen:− ...,(−0, 99), (−0, 98),...,(−0, 01), 0, (0, 01),...,(0, 98), (0, 99), 1,....Dann dazu die rationalen Zahlen mit 3, 4,... Nachkommastellen, wie inAbb. 7.4 dargestellt. Wir erkennen, dass ganz schnell so viele Punkte zuAbb. 7.4. Auffüllen der Zahlengerade für rationalen Zahlen zwischen −4 und4, beginnend mit ganzen Zahlen, Dezimalzahlen mit einer, und dann zwei Nachkommastellenu.s.w.zeichnen sind, dass die Zahlengerade durchgezogen aussieht. Eine durchgezogeneLinie würde bedeuten, dass alle Zahlen rational sind. Darauf kommenwir später zurück. Wir nennen die Gerade die rationale Zahlengerade.Für vorgegebene rationale Zahlen a und b mit a ≤ b bezeichnen wir allerationalen Zahlen x, für die a ≤ x ≤ b gilt, als abgeschlossenes Intervall.Wir schreiben für das Intervall [a,b], bzw.[a,b]={x ∈Q:a≤x≤b}.a und b werden Endpunkte des Intervalls genannt. Ganz ähnlich definierenwir offene (a,b) und halboffene Intervalle [a,b) und (a,b] durch(a,b)={x ∈Q:a


92 7. Rationale Zahlen.5 2.5


7.10 Chemisches Gleichgewicht 93reproduziert werden. Bei der Wahl, die wir getroffen haben, werden experimentelleDaten gut wiedergegeben und (7.9) wurde nicht nur als Modellfür Bakterien, sondern auch für menschliche Populationen und die Fischereibenutzt.Wir suchen jetzt eine Formel, die ausdrückt, wie P n von n abhängt. Dazudefinieren wir Q n =1/P n und aus (7.9) wird (bitte nachprüfen!)Q n = Q n−12+ 12K .Wie im Insektenmodell benutzen wir jetzt Induktion:Q n = 1 2 Q n−1 + 12K= 1 2 2Q n−2 + 12K + 14K= 1 2 3Q n−3 + 12K + 14K= 12 nQ 0 + 12K.18K(1+ 1 2 + ···+ 12 n−1 ).Mit jeder Stunde, die verstreicht, fügen wir einen weiteren Ausdruck zurSumme für Q n hinzu, wobei uns interessiert, wie Q n sich verändert, wennn anwächst. Mit Hilfe der Formel für die Summe der geometrischen Reihe(6.3), die für die Summe rationaler Zahlen ebenso gilt wie für ganze Zahlen,erhalten wirP n = 1Q n=112Q n 0 + 1 K(1 −12 n ). (7.10)7.10 Chemisches GleichgewichtDie Löslichkeit ionischer Ausfällungen ist ein wichtiges Thema in der analytischenChemie. Für das GleichgewichtA x B y ⇋ xA y+ + y B x− (7.11)einer gesättigten Lösung schwach löslicher Elektrolyte wird die LöslichkeitsproduktkonstantedurchK sp =[A y+ ] x [B x− ] y (7.12)gegeben. Die Löslichkeitsproduktkonstante ist z.B. für die Löslichkeit vonElektrolyten und für Vorhersagen wichtig, ob sich Niederschläge unter vorgegebenenBedingungen bilden oder nicht.


94 7. Rationale ZahlenWir werden sie benutzen, um die Löslichkeit von Ba(JO 3 ) 2 in einer 0,020molaren Lösung von KJO 3 zu bestimmen:Ba(IO 3 ) 2 ⇋ Ba 2+ +2JO − 3 .Dabei ist K sp für Ba(JO 3 ) 2 1, 57×10 −9 . Wir bezeichnen die Löslichkeit vonBa(JO 3 ) 2 mit S. DieStöchiometrie besagt, dass S =[Ba 2+ ], wohingegenJodationen sowohl vom Lösungsmittel KJO 3 (somit 0,02 molar) als auchvon Ba(JO 3 ) 2 (2 Ionen pro Eintrag) frei gesetzt werden. Somit ergibt sichdie Jodatkonzentration aus der Summe der beiden Einträge:[JO − 3 ]=(0, 02 + 2S).Einsetzen in (7.12) ergibt die GleichungS (0, 02 + 2S) 2 =1, 57 × 10 −9 . (7.13)Aufgaben zu Kapitel 77.1. Erklären Sie Ihrer Freundin, was rationale Zahlen sind und wie man mitihnen rechnet. Vertauschen Sie auch die Rollen.7.2. Beweisen Sie das Kommutativ-, Assoziativ- und Distributiv-Gesetz für rationaleZahlen.7.3. Verifizieren Sie die Kommutativ- und Distributiv-Gesetze für die Additionund Multiplikation rationaler Zahlen anh<strong>and</strong> der Definitionen der Addition undMultiplikation.7.4. Zeigen Sie anh<strong>and</strong> der üblichen Definitionen der Multiplikation und Additionrationaler Zahlen, dass r(s + t) =rs + rt für rationale Zahlen r, s undt.7.5. Bestimmen Sie die Lösungsmengen der folgenden Ungleichungen:(a) |3x − 4| ≤1 (b) |2 − 5x| < 6(c) |14x − 6| > 7 (d) |2 − 8x| ≥3.7.6. Verifizieren Sie, dass für rationale Zahlen r, s und t gilt:|s − t| ≤|s| + |t|, (7.14)und|s − t| ≤|s − u| + |t − u|, (7.15)|st| = |s||t|. (7.16)


Aufgaben zu Kapitel 7 957.7. Eine Person läuft mit 2,4m/Sekunde auf einem Schiff zum Bug, währendsich das Schiff mit 32km/Stunde bewegt. Wie groß ist die Geschwindigkeit desLäufers für einen stationären Beobachter? Interpretieren Sie die Berechnung alsSuche nach einem gemeinsamen Nenner.7.8. Berechnen Sie Dezimaldarstellungen für (a) 3/7, (b) 2/13 und (c) 5/17.7.9. Berechnen Sie Dezimaldarstellungen für (a) 432/125 und (b) 47, 8/80.7.10. Finden Sie rationale Zahlen für die Dezimaldarstellungen(a) 0, 42424242 ...,(b)0, 881188118811 ... und (c) 0,4290542905 ....7.11. Stellen Sie die folgenden Mengen auf der rationalen Zahlengeraden dar:(a) {x ∈ É : −3


8Pythagoras und Euklid(1) Mathematische Regeln regieren das Universum.(2) Philosophie kann der geistigen Reinigung dienen.(3) Die Seele kann mit dem Göttlichen verschmelzen.(4) Gewisse Symbole haben mystische Bedeutung.(5) Alle Brüder des Ordens müssen strenge Loyalität und Geheimhaltungbefolgen.(Glaubenssätze des Pythagoras)8.1 EinleitungIn diesem Kapitel werden wir einige grundlegende und nützliche Tatsachender Geometrie beh<strong>and</strong>eln. Dabei werden wir Verbindungen zu denUrsprüngen der <strong>Mathematik</strong> im antiken Griechenl<strong>and</strong> vor 2500 Jahren ziehen.Insbesondere zu zwei Idolen: Pythagoras und Euklid. In ihren Arbeitenfinden wir die Wurzeln für die meisten Themen, die wir unten beh<strong>and</strong>eln.8.2 Der Satz von PythagorasWahrscheinlich haben Sie schon von dem Satz von Pythagoras für ein rechtwinkligesDreieck gehört, da er zu den grundlegendsten und wichtigstenErgebnissen der Geometrie zählt. Erinnern Sie Sich, dass wir den Satz vonPythagoras bereits im Modell vom schlammigen Hof benutzt haben? Habendie einem rechten Winkel benachbarten Seiten die Längen a und b, und


98 8. Pythagoras und Euklidhat die gegenüberliegende Seite (die Hypotenuse) die Länge c, dann besagtder Satz von Pythagoras, vgl. Abb. 8.1.c 2 = a 2 + b 2cbAbb. 8.1. Der Satz von PythagorasaAngenommen, so unwahrscheinlich es auch sei, Ihre Freundin habe nochnie von diesem Ergebnis gehört. Wie könnten wir sie davon überzeugen,dass der Satz von Pythagoras wahr ist? D.h., wie können wir ihn beweisen?Wir könnten wie folgt argumentieren: Konstruiere ein Rechteck, dass dasDreieck einschließt, dessen eine Seite die Hypotenuse ist und dessen paralleleSeite durch die Ecke mit dem rechten Winkel verläuft, vgl. Abb. 8.2.Wir haben somit drei Dreiecke, zwei neue angrenzend an das ursprüngliche.Alle diese Dreiecke haben dieselbe Form, d.h. sie haben die gleichenWinkel: Ein rechter Winkel von 90 ◦ , einen Winkel der Größe α und einender Größe β, vgl. Abb. 8.2. Das rührt daher, dass α+β =90 ◦ ,dadieWinkelsummein einem Dreieck immer 180 ◦ beträgt und ein rechter Winkel 90 ◦besitzt. Da die Dreiecke die gleichen Winkel haben, haben sie auch dieselbeForm oder <strong>and</strong>ers formuliert, die Dreiecke sind ähnlich. Das bedeutet, dassdie Seitenverhältnisse für entsprechende Seiten für alle drei Dreiecke gleichcαβbαβaβαyxAbb. 8.2. Beweis des Satzes von Pythagoras


8.3 Die Winkelsumme in Dreiecken beträgt 180 ◦ 99sind. Indem wir diese Tatsache zweimal ausnutzen, erhalten wir x/a = a/cund y/b = b/c. Daraus folgern wir, dass c = x + y = a 2 /c + b 2 /c oderc 2 = a 2 + b 2 gilt, was genau dem Satz von Pythagoras entspricht, vgl.Abb. 8.2.Das sollte Ihre Freundin überzeugen, vorausgesetzt, dass Sie angemessenmit (i) der Tatsache, dass die Winkelsumme in einem Dreieck 180 ◦ ist, und(ii) den Eigenschaften ähnlicher Dreiecke vertraut ist. Falls nicht, solltenwir unserer Freundin mit den folgenden zwei Abschnitten behilflich sein.8.3 Die Winkelsumme in Dreiecken beträgt 180 ◦Wir betrachten ein Dreieck mit den Ecken A, B und C und den Winkelnα, β und γ, wie es in Abb. 8.3 dargestellt ist. Wir erinnern daran, dass derWinkel zwischen zwei Geraden (oder Strecken), die sich in einem Punkttreffen, ein Maß dafür ist, um wie viel die eine der Linien zur <strong>and</strong>erenLinie gedreht wurde. Die gebräuchlichste Einheit dafür ist Drehung“ oder”Umdrehung“. Der Zeiger einer Uhr macht eine volle Umdrehung von 12”zu 12 und eine halbe Umdrehung von 12 zu 6. Schlagen wir die erste Seiteeiner Zeitung nach hinten um, dann haben wir sie um eine volle Umdrehungrotiert. Wenn wir alleine am Frühstückstisch sitzen und daher genug Platzhaben, schlagen wir die Seite einfach nur um, was einer halben Umdrehungentspricht. Normalerweise nutzen wir eine Gradeinteilung um Winkel zumessen, wobei eine volle Umdrehung 360 Grad entspricht. Somit hat einehalbe Umdrehung 180 Grad und eine viertel Umdrehung entspricht einemrechten Winkel mit 90 Grad.αγCβAαβBAbb. 8.3. Die Winkelsumme in einem Dreieck beträgt 180 ◦Zurück zum Dreieck in Abb. 8.3; wir fragen uns, warum α+β+γ = 180 ◦gilt. Dazu zeichnen wir durch die Ecke C eine Gerade parallel zur GrundlinieAB. Die Winkel in C sind α, γ und β und zusammen bilden sie einenWinkel von 180 ◦ , was wir zeigen wollten. Dabei benutzen wir die Tatsache,dass eine Gerade, die zwei parallele Geraden schneidet, diese im gleichenWinkel schneidet, vgl. Abb. 8.4. Diese Aussage ist das berühmte fünfte Axiomder Geometrie von Euklid, das auch Parallelen Axiom genannt wird.


100 8. Pythagoras und EuklidααAbb. 8.4. Zwei parallele Linien werden von einer dritten geschnittenBAAbb. 8.5. Euklids erstes Axiom: Zwei verschiedene Punkte lassen sich mit genaueiner Geraden verbindenEinAxiomistdabeietwas,daswirfür wahr annehmen, ohne weiter auf eineBegründung zu warten. Wir können die Gültigkeit eines Axioms intuitivoder wie eine Spielregel akzeptieren. Die euklidische Geometrie basiert auffünf Axiomen, wobei das erste besagt, dass zwei Punkte eindeutig durcheine gerade Strecke mitein<strong>and</strong>er verbunden werden können, vgl. Abb. 8.5.In diesen Axiomen erscheinen undefinierte Begriffe, wie Punkte und Gerade.Wenn wir an diese Begriffe denken, benutzen wir unsere Intuition ausdem täglichen Leben. Das zweite Axiom behauptet, dass eine Strecke zueiner Geraden verlängert werden kann. Das dritte Axiom besagt, dass sichaus Zentrum und Radius ein Kreis konstruieren lässt und das vierte Axiombehauptet, dass alle rechten Winkel gleich sind.Euklidische Geometrie beh<strong>and</strong>elt ebene Geometrie, was auch als Geometrieauf einer flachen Oberfläche betrachtet werden kann. Wir könnenuns vorstellen, dass ein Fußballfeld flach ist, aber wir wissen, dass sehrAbb. 8.6. Ein ”Dreieck“auf der Erdoberfläche mit einer Ecke am Nordpol undzwei Ecken auf dem Äquator mit 90 ◦ Longitudenabst<strong>and</strong>


8.4 Ähnliche Dreiecke 101große Flächen auf der Erde nicht vollständigflachseinkönnen. Geometrieauf gebogenen Flächen wird nicht-euklidische Geometrie genannt. NichteuklidischeGeometrie hat einige überraschende Eigenschaften und es gibtinsbesondere kein Parallelen Axiom. Folglich kann die Winkelsumme in einemDreieck auf der gebogenen Oberfläche der Erde von 180 ◦ abweichen.Betrachten Sie dazu Abb. 8.6, wo die Winkelsumme im angedeuteten Dreieckmit drei rechten Winkel (können Sie es erkennen?) 270 ◦ ist, also wirklichnicht 180 ◦ .8.4 Ähnliche DreieckeZwei Dreiecke mit denselben Winkeln heißen ähnlich. Euklid sagt, dassdas Verhältnis entsprechender Seiten zweier ähnlicher Dreiecke gleich ist.Wenn ein Dreieck Seiten der Länge a, b und c hat, dann wird ein ähnlichesDreieck Seiten der Länge ā = ka, ¯b = kb und ¯c = kc haben, wobei k>0eingemeinsamer Skalierungsfaktor ist, vgl Abb. 8.7. Anders formuliert ist dasVerhältnis entsprechender Seiten gleich: kakb = a b , kakc = a kbcundkc = b c . Eine<strong>and</strong>ere Betrachtungsweise dieser Tatsache ist, dass sich die Winkel in einemDreieck nicht ändern, wenn wir dessen Größe verändern, indem wir dieSeitenlängen um einen gemeinsamen Faktor ändern. Dies gilt nicht für dienicht-euklidische Geometrie. Wenn wir die Größe eines (großen) Dreiecksauf der Oberfläche der Erde vergrößern, werden die Winkel auch größer.Wir stellen den Beweis, dass ähnliche Dreiecke tatsächlich proportionaleSeiten haben, als Herausforderung an den Leser, vgl. Aufgabe 8.4.cb¯c¯baāa/b =ā/¯bAbb. 8.7. Die Seiten von ähnlichen Dreiecken sind proportional8.5 Wann stehen zwei Gerade senkrecht?Wir wollen mit einer weiteren Anwendung des Satzes von Pythagoras fortfahren,die von fundamentaler Wichtigkeit sowohl für die Infinitesimalrech-


102 8. Pythagoras und EuklidBbO90 ◦ ?aAAbb. 8.8. Sind diese zwei Geraden(stücke) senkrecht?nung als auch die lineare Algebra ist. Sie hat Zimmerleuten als grundlegendestheoretisches Werkzeug über Jahrhunderte gedient. Wir stellen dieFrage: Wie können wir entscheiden, ob zwei sich schneidende Geraden einereuklidischen Ebene einen rechten Winkel bilden, d.h. ob die beidenGeraden rechtwinklig (orthogonal) sind oder nicht, vgl. Abb. 8.8? DieseFrage stellt sich typischerweise beim Bau eines rechtwinkligen Gebäudes.Angenommen, die Geraden schneiden sich im Punkt O und angenommen,dass eine der Geraden durch Punkte A und die <strong>and</strong>ere durch Punkt B aufder Fläche geht, vgl. Abb. 8.8. Wir betrachten jetzt das Dreieck AOB undfragen dabei, ob der Winkel AOB gleich 90 ◦ ist, d.h. ob die Seite OA rechtwinkligzur Seite OB ist, vgl. Abb. 8.9. Wir könnten das direkt mit einemtragbaren rechten Winkel überprüfen, aber das würde Spielraum für falscheEntscheidungen geben, insbesondere dann, wenn die Größe des tragbarenrechten Winkels viel kleiner ist als das Dreieck AOB selbst. Das wäre üblicherweiseimmer beim Legen eines Fundaments für ein Gebäude der Fall.Eine <strong>and</strong>ere Möglichkeit bietet der Gebrauch des Satzes von Pythagoras.Wir erwarten, dass der Winkel BOA 90 ◦ beträgt, wenna 2 + b 2 = c 2 (8.1)erfüllt ist, wobei a die Länge der Seite OA ist, b die Länge der Seite OBund c die der Seite AB, vgl. Abb. 8.9. Wir werden das in Kürze beweisen,wollen aber zunächst beobachten, wie ein Zimmermann dieses Ergebnis inder Praxis benutzt. Er würde 3 Stücke mit den Längen 3,4, und 5 Einheitenvon einer Schnur schneiden. Das Besondere gerade dieser Zahlen ist, dassBEc 2 = a 2 + b 2bcbcO90 ◦ ?aAQaDAbb. 8.9. Test auf Rechtwinkligkeit


sie in die Gleichung (8.1) passen:8.5 Wann stehen zwei Gerade senkrecht? 1033 2 +4 2 =5 2 . (8.2)Wenn unsere Vermutung richtig ist, dann muss ein Dreieck mit den Seitenlängen3,4 und 5 einen rechten Winkel haben. Angenommen, dass a =3und b =4ist,sokönnten wir im Dreieck AOB prüfen, ob es einen rechtenWinkel hat, indem wir die Schnur mit Länge 5 auf AB legen und kontrollieren,ob c = 5 ist. Falls ja, dann ist der Winkel AOB 90 ◦ . Mit Hilfedreier Schnurstücke der Längen 3,4 und 5 Einheiten kann ein Zimmermannsomit einen rechten Winkel konstruieren. Die Einheitswahl ist bei praktischenAnwendungen dieser Idee wichtig. Sehr kurze Schnüre wären zwarpreiswert, aber die Genauigkeit würde darunter leiden. Sehr lange Stückewären sehr unh<strong>and</strong>lich.Nun zurück zur Vermutung, dass ein Dreieck AOB einen rechten Winkelhat,fallsa2 + b 2 = c 2 . Um uns zu überzeugen, könnten wir EuklidsArgumenten folgen: Konstruiere ein rechtwinkliges Dreieck DQE mit rechtemWinkel in Q mit Seitenlänge DQ = a und Seitenlänge EQ = b. Dannist nach dem Satz von Pythagoras das Quadrat der Länge von DE gleicha 2 + b 2 . Mit der Annahme, dass a 2 + b 2 = c 2 ,istdieSeiteDE gleich c.Somit haben die Dreiecke DQE und AOB die gleichen Seitenlängen undwären daher ähnlich. Folglich wäre der Winkel AOB gleich dem WinkelDQE,der90 ◦ ist, womit wir bewiesen haben, dass AOB rechtwinklig ist.Wir können a 2 + b 2 = c 2 als Prüfstein für die Orthogonalität der SeitenOA und OB nehmen, indem wir den Trick des Zimmermanns benutzen,aber das könnte immer noch eine gewisse Unsicherheit hinterlassen, wennwir beispielsweise Schnüre benutzen müssen, die viel kleiner als das Fundamentsind.Angenommen, wir wüssten die Koordinaten (a 1 ,a 2 )derEckeA und dieKoordinaten (b 1 ,b 2 )derEckeB. Dieswäre der Fall, wenn das Dreiecküber diese Koordinaten definiert würde, wenn wir beispielsweise eine Kartebenutzen, um das Dreieck zu identifizieren. Somit hätten wira 2 = a 2 1 + a2 2 , b2 = b 2 1 + b2 2 , c2 =(b 1 − a 1 ) 2 +(b 2 − a 2 ) 2 ,wobei sich die letzte Gleichung aus Abb. 8.10 ergibt. Wir folgern, dassc 2 = b 2 1 + a2 1 − 2b 1a 1 + b 2 2 + a2 2 − 2b 2a 2 = a 2 + b 2 − 2(a 1 b 1 + a 2 b 2 )und wir erkennen, dass a 2 + b 2 = c 2 genau dann gilt, wenna 1 b 1 + a 2 b 2 =0. (8.3)Somit wird unser Test auf Orthogonalität reduziert auf die Überprüfung deralgebraischen Gleichung a 1 b 1 +a 2 b 2 = 0. Wenn wir die Koordinaten (a 1 ,a 2 )und (b 1 ,b 2 ) kennen, lässt sich diese Bedingung einfach durch Multiplikation


104 8. Pythagoras und Euklidb 2Bca 2b 1AOa 1Abb. 8.10.von Zahlen überprüfen und ist daher nicht länger Geschmackssache odereine einsame Entscheidung (bis auf Rundungsfehler).Die magische Formel (8.3) zur Überprüfung der Orthogonalität wird imFolgenden eine wichtige Rolle spielen. Sie w<strong>and</strong>elt eine geometrische Beobachtung(Orthogonalität) in eine arithmetische Gleichung um.8.6 GPS NavigationGPS (Global Positioning System) ist eine wundervolle neue Erfindung. Eswurde vom amerikanischen Militär in den 80ern entwickelt, hat aber inzwischenwichtige zivile Anwendungen. Sie können einen GPS Empfänger fürweniger als 200 Euro kaufen und bei Ihrer W<strong>and</strong>erung in den Bergen inder Tasche mit sich tragen, auf Ihrem Segelboot auf dem Ozean oder in IhremAuto bei einer Fahrt durch die Wüste oder München. Auf Knopfdruckan Ihrem Empfänger erhalten sie Ihre aktuellen Koordinaten: Breiten- undLängengrad als ein geordnetes Zahlenpaar (57,25;12,60). Dabei ist die ersteZahl (57,25) die Breite und die zweite Zahl (12,60) die Länge. Die Genauigkeitliegt bei etwa 10 Metern. Etwas aufwändigere Nutzung von GPS kanneine Genauigkeit von 1 Millimeter liefern.Wenn sie Ihre Koordinaten kennen, können sie Ihre aktuelle Positionauf einer Karte bestimmen und ablesen, in welche Richtung Sie Ihr Zielerreichen. Somit löst GPS das Hauptproblem der Navigation: Die Bestimmungder aktuellen Koordinaten auf einer Karte. Vor GPS konnte das sehrschwer sein, mit unzuverlässigen Ergebnissen. Die Breite zu bestimmen warverhältnismäßig einfach, wenn man die Sonne sah und ihre Höhe über demHorizont mit Hilfe eines Sextanten zur Mittagszeit messen konnte. Die Bestimmungdes Längengrads war sehr viel schwieriger und verlangte einegute Uhr. Der Hauptgrund für all die Mühe bei der Entwicklung genauer


8.6 GPS Navigation 105?d Ad BABAbb. 8.11. Positionsbestimmung mit GPSUhren oder Chronometern im 18. Jahrhundert war die Bestimmung derLänge auf See. Vor den Chronometern konnte das Ergebnis äußerst ungenausein: Man konnte glauben, wie Columbus, nach Indien zu kommen,obwohl man tatsächlich in der Nähe von Amerika war!GPS basiert auf einem einfachen (und klugen) mathematischen Prinzip.Wir stellen die Grundlagen vor, unter der Annahme, dass unsere Erde eineeuklidische Ebene mit einem Koordinatensystem ist. Das Problem ist, unsereKoordinaten zu bestimmen. Angenommen, wir könnten den Abst<strong>and</strong>zu zwei Punkten A und B mit genauen Positionen, die wir mit d A und d Bbezeichnen, messen. Mit dieser Information wissen wir, dass wir uns aufeinem der Schnittpunkte der Kreise um A mit Radius d A und um B mitRadius d B , wie in Abb. 8.11 dargestellt, befinden müssen. Beachten Sie,dass diese Kreise nach dem 3. euklidischen Axiom existieren.Um die Koordinaten (x 1 ,x 2 ) des Schnittpunkts herauszufinden, müssenwir das folgende System zweier Gleichungen mit den beiden Unbekanntenx 1 und x 2 lösen:(x 1 − a 1 ) 2 +(x 2 − a 2 ) 2 = d 2 A und (x 1 − b 1 ) 2 +(x 2 − b 2 ) 2 = d 2 B.Wenn wir dieses Gleichungssystem gelöst haben, können wir bestimmen,wo wir sind, vorausgesetzt, dass wir über zusätzliche Information verfügen,die uns besagt, welche der beiden möglichen Lösungen die richtige ist. Beidrei Dimensionen müssten wir unseren Abst<strong>and</strong> zu drei Punkten im Raummit bekannten Positionen bestimmen und ein Gleichungssystem mit dreiGleichungen in drei Unbekannten lösen, die den Schnitten dreier Kugelnentsprechen.GPS arbeitet mit 24 Satelliten, die in Vierergruppen auf 6 Orbitalenkreisen. Jeder Satellit besitzt einen kreisförmigen Orbit in ca. 26.000 kmHöhe mit einer Umrundungszeit von 12 Stunden. Jeder Satellit trägt einegenaue Uhr und ein System überwacht die Position der Satelliten in jedemAugenblick. Ein GPS Empfänger empfängt ein Signal von jedem sichtbarenSatelliten, das die Position und die Uhrzeit des Satelliten enthält. Der


106 8. Pythagoras und EuklidEmpfänger berechnet den Zeitunterschied, indem er die empfangene Zeitmit seiner eigenen vergleicht und berechnet dann an H<strong>and</strong> der Lichtgeschwindigkeitdie Abstände. Das GPS berechnet seine Position aus denAbständen zu den Satelliten und deren Positionen als einer der beidenSchnittpunkte dreier Kugeln. Einer dieser Punkte liegt weit draußen imRaum und kann ausgeschlossen werden, solange wir uns auf der Erde befinden.Als Ergebnis erhalten wir unsere Position im Raum, charakterisiertdurch Längen-, Breitengrad und Höhe über dem Meer. Praktisch wird einvierter Satellit benötigt, um die Uhren der Satelliten und des Empfängerszu kalibrieren, was nötig ist, um die Abstände richtig zu berechnen. Sindmehr als vier Satelliten sichtbar, löst das GPS eine Näherungslösung derkleinsten Fehlerquadrate aus dem sich ergebenden überbestimmten Gleichungssystem.Die Genauigkeit wächst mit der Zahl der Satelliten an.GPS verknüpft Geometrie mit Arithmetik oder Algebra. Jeder physikalischePunkt im Raum kann durch ein Zahlentripel mit Länge, Breite undHöhe charakterisiert werden.8.7 Geometrische Definition von sin(υ) und cos(υ)Betrachten Sie ein rechtwinkliges Dreieck mit Winkel υ und Seiten derLänge a, b und c wie in Abb. 8.12. Wir erinnern uns an die Definitionencos(v)= a csin(v)= b c .Beachten Sie, dass die Werte cos(υ) und sin(υ) nicht von dem speziellenvca¯cbvā¯bAbb. 8.12. cos(υ)=a/c und sin(υ)=b/cDreieck abhängen, das wir benutzen, sondern nur von υ. Das liegt daran,dass ein <strong>and</strong>eres rechtwinkliges Dreieck mit demselben Winkel υ undden Seiten ā, ¯b und ¯c, wie rechts in Abb. 8.12 gezeigt, zu dem zunächstbetrachteten Dreieck ähnlich wäre. Und die Verhältnisse entsprechenderSeiten in ähnlichen Dreiecken sind gleich, wie wir bereits gezeigt haben.Anders formuliert, a/c =ā/¯c und b/c = ¯b/¯c. Z.B.können wir ein Dreieckmit c =1wählen, so dass cos(υ) =a und sin(υ) =b gilt. Wenn wir diesesDreieck, wie in Abb. 8.13 dargestellt, in den Einheitskreis x 2 1 + x2 2 =1einbetten, dann ist a = x 1 und b = x 2 ,d.h.cos(υ)=x 1 und sin(υ)=x 2 .


8.8 Geometrischer Beweis von Additionsformeln für cos(υ) 107x 2(x 1,x 2)x 2 1 + x 2 2 =11xv 2xx 11Abb. 8.13. cos(υ)=x 1 und sin(υ)=x 2Diese Einbettung ermöglicht es auch, die Definition von cos(υ) und sin(υ)auszuweiten, insbesondere zu Winkeln υ mit 90 ◦ ≤ υ


108 8. Pythagoras und Euklidsin(α)βsin(α)sin(β) sin(α)cos(α)1cos(α)αβ − αcos(β−α)βcos(β)cos(α)Abb. 8.14. Warum cos(β − α)=cos(β)cos(α)+sin(β)sin(α) giltυ größer als 180 ◦ und kleiner als 0 ◦ , wobei die letzteren zu Winkelngehören, die entstehen, wenn man den Punkt (x 1 ,x 2 ) im Uhrzeigersinn,beginnend bei (1,0) auf dem Einheitskreis in Abb. 8.13, bewegt. Dabei istsin(υ) =− sin(−υ) und cos(υ) =cos(−υ), in Übereinstimmung mit denBeziehungen cos(υ)=x 1 und sin(υ)=x 2 .8.9 Erinnerung an einige FlächenformelnWir möchten die/den Leserin/Leser an die folgenden wohl bekannten Formelnfür die Flächen von Rechtecken, Dreiecken und Kreisen, dargestelltin Abb. 8.15, erinnern. Wir werden später auf diese wichtigen Formelnzurückkommen und sie etwas genauer begründen.Abb. 8.15. Einige weit verbreitete Formeln für Flächen A


8.10 Griechische <strong>Mathematik</strong>8.10 Griechische <strong>Mathematik</strong> 109Griechische <strong>Mathematik</strong> wird von den Schulen von Pythagoras und Euklidbeherrscht. Die Schule von Pythagoras baut auf Zahlen auf, d.h. istarithmetisch, und die von Euklid auf Geometrie. 2000 Jahre später, im 17.Jahrhundert, führte Descartes beide Gebiete in der analytischen Geometriezusammen.<strong>Mathematik</strong> wurde gewöhnlich in Babylonien und Griechenl<strong>and</strong> für praktischeBerechnungen zur Astronomie, Navigation etc. benutzt, wohingegendie Pythagoräer ”die <strong>Mathematik</strong> von einer Fähigkeit der Sklaven in eineAusbildung für Aristokraten (freie Männer) umw<strong>and</strong>elten“. Aus diesemGrund waren experimentelle Wissenschaften und die Mechanik im klassischenGriechenl<strong>and</strong> schlecht entwickelt. Stattdessen dominierte das Prinziplogischer Herleitung.Pythagoras wurde 585 v.Chr. auf der Insel Samos vor der Küste vonKleinasien geboren und gründete seine eigene Schule auf Croton, einer griechischenSiedlung in Süd-Italien. Die pythagoräische Schule war eine Bruderschaft,die ihre wichtigsten Kenntnisse geheim hielt. Die Pythagoräerverkehrten mit Aristokraten und Pythagoras selbst wurde aus politischenGründen um 497 v.Chr. ermordet, worauf sich seine Anhänger in ganzGriechenl<strong>and</strong> verstreuten.Die platonische Schule, Akademie genannt, wurde in Athen 387 v.Chr.von Platon (427–347 v.Chr.), einem großen idealistischen Philosophen, gegründet.Platon war ein Anhänger der Pythagoräer und sagte, dass ”Arithmetikeinen sehr großen und erhöhenden Effekt hat und die Seele zwingt,über abstrakte Zahlen nachzudenken und sich gegen die Einführung sichtbarerund berührbarer Objekte bei der Argumentation wehrt ...“. Platonliebte <strong>Mathematik</strong>, weil sie die Existenz der wunderbaren Welt perfekterObjekte wie Zahlen, Dreiecke, Punkte etc. beweise, die Platon so spannendf<strong>and</strong>. Platon betrachtete die reale Welt als unvollkommen und verdorben.Die Entdeckung (wir werden später darauf zurückkommen), dass dieLänge der Diagonale eines Quadrats der Länge eins, bezeichnet durch dieZahl √ 2, sich nicht als Bruch zweier natürlichen Zahlen schreiben lässt,d.h. dass √ 2keinerationale Zahl ist, war ein schwerer Rückschlag für denGlauben von Pythagoras, dass das Universum durch Relationen zwischennatürlichen Zahlen verst<strong>and</strong>en werden könne. Letztendlich führte das zurEntwicklung der Schule von Euklid, die auf Geometrie anstatt auf Arithmetikaufbaute, bei der die irrationale Natur von √ 2 verarbeitet werdenkonnte oder genauer vermieden werden konnte. Für Euklid war die Diagonaleeines Quadrates nur eine geometrische Größe, die eine bestimmteLänge hatte. Man musste sie nicht mit der Hilfe von Zahlen ausdrücken. DieLänge war, was sie war, nämlich die Länge der Diagonale eines Quadratsder Länge eins. In ähnlicher Weise ”geometrisierte“ Euklid die Arithmetik.Z.B. kann das Produkt ab zweier Zahlen a und b als Fläche eines Rechtecksmit den Seitenlängen a und b betrachtet werden.


110 8. Pythagoras und EuklidDas Musterbeispiel eines auf logischer Deduktion aufgebauten Systemsist Elemente“, ein monumentales Werk von Euklid über Geometrie in”dreizehn Bänden. Die Folgerungen reichen von Axiomen und Definitionen,bis hin zu Sätzen, die nach logischen Regeln hergeleitet werden.Um logische Abhängigkeiten auszudrücken, wurde eine eigene Spracheentwickelt. So bedeutet beispielsweise A ⇒ B, wenn A dann B“, d.h. B”folgt aus A, so dass, wenn A gültig ist, auch B gültig ist, was auch alsA impliziert B“ formuliert wird. Ähnlich bedeutet A ⇐ B, dassA aus B”folgt. Wenn A impliziert B und B impliziert A, sagen wir, dass A und Bäquivalent sind, ausgedrückt durch A ⇔ B.Beispiel 8.1. x>0 ⇒ x +1> 0.B<strong>and</strong> I beginnt mit Definitionen und Axiomen und wird mit Kongruenzsätzenund Parallelen fortgesetzt und beweist den Satz von Pythagoras.Die Bände I-IV beh<strong>and</strong>eln geradlinige Figuren, die sich aus Geradenstückenzusammensetzen. B<strong>and</strong> V beh<strong>and</strong>elt Proportionen (!) und wird als wahrscheinlichdie größte Errungenschaft der euklidischen Geometrie betrachtet.B<strong>and</strong> VI beh<strong>and</strong>elt ähnliche Objekte (!!). Die Bände VII-IX sind derArithmetik, d.h. den Eigenschaften der ganzen und rationalen Zahlen gewidmet.B<strong>and</strong> X betrachtet irrationale Zahlen wie √ 2. Die Bände XI, XIIund XIII beh<strong>and</strong>eln die Geometrie in drei Dimensionen und diskutieren diefünf regulären (platonischen) Körper.8.11 Die euklidische EbeneQ 2Wenn wir das Parallelen Axiom akzeptieren, welches insbesondere zumBeweis, dass die Winkelsumme in einem Dreieck 180 ◦ beträgt, geführt hat,bedeutet das, dass wir annehmen auf einer ebenen Fläche oder euklidischenEbene zu arbeiten.Somit nehmen wir an, dass die/der Leserin/Leser eine intuitive Vorstellungder euklidischen Ebene hat, die man sich vorstellen muss, als sehrgroße ebene Fläche, die in alle Richtungen ohne Grenzen ausgedehnt ist.Beispielsweise wie ein endloser ebener Parkplatz ohne ein einziges parkendesAuto. In dieser euklidischen Ebene, die wir uns aus Punkten bestehenddenken, stellen wir uns ein Koordinatensystem vor, das aus zwei sich imrechten Winkel, im so genannten Ursprungspunkt, schneidenden Geraden,besteht. Weiter denken wir uns, dass jede dieser Koordinatenachsen eineKopie der rationalen Zahlengerade ist, vgl. Abb. 8.16.Eine der Koordinatenachsen identifizieren wir als Achse 1 und die <strong>and</strong>ereals Koordinatenachse 2. Somit lassen sich zu jedem Punkt in der Ebene zweiKoordinaten x 1 und x 2 angeben, wobei x 1 dem Schnittpunkt der Geradenparallel zur Achse 2 durch diesen Punkt mit Achse 1 entspricht und umgekehrt.Wir schreiben die Koordinaten in der Form (x 1 ,x 2 ), was wir uns


8.12 Von Pythagoras über Euklid zu Descartes 111x 2O(x 1,x 2)x 1Abb. 8.16. Koordinatensystem der euklidischen Ebeneals geordnetes Paar rationaler Zahlen mit einer ersten Komponente x 1 ∈Qund einer zweiten Komponente x 2 ∈Qdenken. Somit können wir die euklidischeEbene formulieren als MengeQ 2 = {(x 1 ,x 2 ):x 1 ,x 2 ∈Q}, d.h. alsMenge der geordneten Paare (x 1 ,x 2 ) mit rationalen Zahlen x 1 und x 2 .Zujedem Punkt in der euklidischen Ebene gehören seine Koordinaten als geordnetePaare rationaler Zahlen und zu jedem geordneten Paar rationalerZahlen kann ein Punkt in der Ebene mit diesen Koordinaten zugeordnetwerden.8.12 Von Pythagoras über Euklid zu DescartesJedem geometrischen Punkt in der euklidischen Ebene können also Koordinatenals geordnete Paare rationaler Zahlen zugeordnet werden. Dasverbindet geometrische Punkte mit der Arithmetik oder Algebra, dieaufZahlen aufbaut, und ist eine sehr grundlegende und fruchtvolle Verbindung.Das war die Vorstellung von Descartes, der der Idee von Pythagoras folgte,und Geometrie auf Zahlen aufbaute. Euklid drehte dies um und begründeteZahlen auf Geometrie.Wir werden später öfter auf die Verbindung von Geometrie und Algebrazurückkommen. Es ist wahrscheinlich einer der grundlegensten Ideen dergesamten <strong>Mathematik</strong>. Die Zuordnung von Zahlen zu Punkten im Raumeröffnet mächtige Möglichkeiten und erlaubt es, mit Zahlen zu arbeitenstatt mit Punkten. Das ist die ”Arithmetisierung“ der Geometrie von Descartesim 17. Jahrhundert, die der Infinitesimalrechnung vorausging unddie Geschichte der Menschheit veränderte.


112 8. Pythagoras und EuklidDie Vorstellung von Pythagoras und Descartes, Geometrie auf Zahlenaufzubauen führt uns jedoch in sehr ernste Schwierigkeiten, die uns zwingenwerden, die rationalen Zahlen auf die reellen Zahlen auszuweiten, die dieso genannten irrationalen Zahlen enthalten. Diese aufregende Geschichtewird im Folgenden aufgelöst werden.8.13 Nicht-euklidische GeometrieAber nicht jede nützliche Geometrie basiert auf den euklidischen Axiomen.Im letzten Jahrhundert haben Physiker beispielsweise mit Hilfe der nichteuklidischenGeometrie erklärt, wie sich das Universum verhält. Einer derersten Menschen, die sich mit nicht-euklidischer Geometrie beschäftigten,war der große <strong>Mathematik</strong>er Gauss.Das Interesse von Gauss an der nicht-euklidischen Geometrie gibt unseinen guten Einblick, wie sein Verst<strong>and</strong> arbeitete. Im Alter von 16 begannGauss, die euklidische Geometrie ernsthaft in Frage zu stellen. Zu LebzeitenGauss’, hatte die euklidische Geometrie einen nahezu heiligen Statusund wurde von vielen <strong>Mathematik</strong>ern und Philosophen als eine der hohenWahrheiten betrachtet, die niemals in Frage gestellt werden können. Dennochbekümmerte Gauss die Tatsache, dass euklidische Geometrie sich aufPostulate stützte, die sich offensichtlich nicht beweisen ließen, wie etwa,dass sich zwei parallele Gerade niemals treffen. Er entwickelte eine Theorieder nicht-euklidischen Geometrie, in der sich parallele Geraden treffenkönnen und mit dieser Theorie ließ sich die Welt so gut beschreiben wie mitder euklidischen Geometrie. Gauss veröffentlichte seine Theorie nicht, da erzu viele Kontroversen fürchtete, aber er entschloss sich, sie zu prüfen. In dereuklidischen Geometrie ist die Winkelsumme in einem Dreieck 180 ◦ ,wohingegendies in der nicht-euklidischen Geometrie nicht zutrifft. So hat Gaussbereits Jahrhunderte vor dem Zeitalter der modernen Physik ein Experimentdurchgeführt, um zu sehen, ob das Universum ”gekrümmt“ ist, indemer Winkel von Dreiecken, die durch drei Berggipfel definiert sind, gemessenhat. Unglücklicherweise war die Genauigkeit seiner Messinstrumente nichtgut genug, um diese Frage zu klären.Aufgaben zu Kapitel 88.1. Welcher Punkt hat die Koordinaten (Länge;Breite) (57,25;12,60)? BestimmenSie Ihre eigenen Koordinaten.8.2. Leiten Sie (8.5) aus Abb. 8.14 her.8.3. Geben Sie einen weiteren Beweis für den Satz von Pythagoras.


Aufgaben zu Kapitel 8 1138.4. (a) Beweisen Sie mit Euklids Axiomen, dass die Seiten zweier Dreiecke mitdenselben Winkeln proportional sind (Hinweis: Machen Sie ausgiebig von Axiom5 Gebrauch). (b) Zeigen Sie, dass die drei Geraden, die jeden Winkel in einemDreieck halbieren, sich in genau einem Punkt innerhalb des Dreiecks schneiden.(Hinweis: Zerlegen Sie das gegebene Dreieck in drei Dreiecke mit einer gemeinsamenEcke im Schnittpunkt zweier Winkelhalbierenden). (c) Zeigen Sie, dassdie drei Geraden, die jeweils eine der Ecken mit dem Seitenmittelpunkt der gegenüberliegendenSeite verbinden, einen gemeinsamen Schnittpunkt innerhalbdes Dreiecks haben.Abb. 8.17. Zwei klassische Werkzeuge


9Was ist eine Funktion?Der, der Praxis ohne Theorie liebt, ist wie ein Seemann, der ohneRuder und Kompass zur See fährt und niemals weiß, wo er die Angelauswirft. (Leonardo da Vinci)Alle Bibeln oder heiligen Schriften sind die Ursachen für folgendeIrrtümer gewesen:1. Dass der Mensch zwei wirklich existierende Prinzipien hat, nämlicheinen Körper & eine Seele.2. Dass Energie, das Böse genannt, allein vom Körper kommt & Vernunft,das Gute genannt, allein von der Seele.3. Dass Gott den Menschen bis in alle Ewigkeit dafür strafen wird,wenn er seinen Energien folgt.Doch im Gegensatz dazu ist Folgendes wahr:1. Der Mensch hat keinen von seiner Seele getrennten Körper. Dennwas Körper genannt wird, ist nur ein Teil der Seele, der von denfünf Sinnen wahrgenommen wird, den Hauptzugängen der Seele innerhalbder Zeitlichkeit.2. Energie ist das einzige Leben und kommt aus dem Körper; Vernunftist die Schranke oder äußere Begrenzung der Energie.3. Energie ist ewige Freude. (William Blake 1757–1827)9.1 EinleitungDer Begriff Funktion ist fundamental für die <strong>Mathematik</strong>. Wir trafen aufdiesen Begriff bereits im Zusammenhang mit dem Modell der Mittagssuppe,wo die Gesamtkosten 15x (Euro) betragen, wenn x (Kilo) Rindfleisch


116 9. Was ist eine Funktion?gekauft werden. Jeder Menge Fleisch x entsprechen Gesamtkosten in Höhevon 15x. Wir sagen, dass die Gesamtkosten 15x eine Funktion von oderabhängig von der Menge Fleisch x sind.Der Ausdruck Funktion und die heute übliche mathematische Schreibweisewurde von Leibniz (1646–1716) eingeführt, der sagte, dass f(x), wasals f von x“ gelesen wird, eine Funktion von x ist, falls für jeden Wert von”x aus einer gegebenen Menge, innerhalb der x genommen werden kann, eineindeutiger Wert f(x) zugewiesen werden kann. Im Modell der Mittagssuppeist f(x) =15x. Es mag hilfreich sein, sich x als Argument zu denken,während f(x) das zugehörige Resultat ist, so dass, wenn x sich ändert,sich der Wert von f(x) entsprechend der Zuweisung ändert. So schreibenwir auch oft x → f(x), um anzudeuten, dass x auf f(x) abgebildet wird.Wir stellen uns auch die Funktion f als Maschine“ vor, die x nach f(x)”umw<strong>and</strong>elt, vgl. Abb. 9.1.fx → f(x)fxf(x)D fW fAbb. 9.1. Darstellung von f : D f → W fWir bezeichnen x als Variable,dax verschiedene Werte annehmen kannoder als Argument der Funktion. Die vorgegebene Menge, in der sich xändern kann, wird Definitionsmenge der Funktion genannt und D(f) bezeichnet.Die Menge an Funktionswerten f(x), die zu den Werten von xin der Definitionsmenge D(f) gehören, wird Wertebereich W(f) vonf(x)genannt. Wenn x sich innerhalb der Definitionsmenge D(f) ändert, ändernsich die zugehörigen Werte f(x)inW(f). Wir schreiben dies oft symbolischals f : D(f) → W(f), was verdeutlicht, dass für jedes x ∈ D(f) einWertf(x) ∈ W(f) zugewiesen wird.Im Zusammenhang mit dem Modell für die Mittagssuppe mit f(x)=15xkönnen wir D(f) =[0, 1] wählen, wenn wir entscheiden, dass die MengeRindfleisch sich innerhalb des Intervalls [0, 1] ändern kann, wodurchW(f) =[0, 15]. Für jede Fleischmenge x im Intervall [0, 1] gibt es zugehörigeGesamtkosten f(x) =15x im Intervall [0, 15]. Denken Sie daran:Die Gesamtkosten 15x sind eine Funktion der Fleischmenge x. Wir könnenauch <strong>and</strong>ere Mengen möglicher Werte für die Fleischmenge x als DefinitionsmengeD(f)wählen, wie D(f)=[a,b], wobei a und b positive rationale


9.1 Einleitung 117Zahlen sind, mit dem zugehörigen Wertebereich W(f) =[15a,15b] oderD(f) =Q + mit zugehörigem Wertebereich W(f) =Q + .DabeiistQ +die Menge der positiven rationalen Zahlen. Wir können sogar die Funktionx → f(x)=15x mit D(f)=Q und zugehörigem Wertebereich W(f)=Qbetrachten, die uns vom Modell für die Mittagssuppe entfernt, da dortx nicht negativ sein kann. Für verschiedene Vorschriften x → f(x), d.h.verschiedene Funktionen f(x), können wir daher unterschiedliche DefinitionsmengenD(f) und zugehörige Wertemengen W(f)inAbhängigkeit vonder Problemstellung zuordnen.Im Allgemeinen wird für das Resultat einer Funktion ein variabler Namebenutzt, wie z.B. y = f(x). Damit wird der Wert der Variablen y durchden Wert der Funktion f(x), die von x abhängt, bestimmt. Daher nennenwir x auch die unabhängige Variable und y die abhängige Variable.Die unabhängige Variable x nimmt Werte in der Definitionsmenge D(f)an, wohingegen die abhängige Variable y Werte im Wertebereich W(f)annimmt.Beachten Sie, dass die Namen für die unabhängige und die abhängigeVariable bei einer Funktion f <strong>and</strong>ers lauten können. Die Namen x undy sind zwar allgemein üblich, aber diese Buchstaben sind nicht speziell.So bezeichnet z = f(u) dieselbe Funktion, solange wir f nicht ändern,d.h. die Funktion y =15x kann genauso gut als z =15u geschriebenwerden. In beiden Fällen wird durch die Funktion f eine gegebene Zahlx oder u mit 15 multipliziert, d.h. 15x oder 15u. Wir sagen zwar ”dieFunktion f(x)“, obwohl es richtiger wäre, nur ”die Funktion f“ zu sagen,da f der ”Name“ der Funktion ist, wohingegen f(x) eher eine Beschreibungoder Definition der Funktion ist. Nichtsdestotrotz werden wir oft den etwassaloppen Ausdruck ”die Funktion f(x)“ benutzen, da es sowohl den Namender Funktion wie auch ihre Beschreibung/Definition wiedergibt.Beispiel 9.1. Die Funktion x → f(x)=x 2 , oder in Kurzschreibweise f(x)=x 2 , kann mit Definitionsmenge D(f) =Q + und Wertebereich W(f) =Q + betrachtet werden, vgl. Abb. 9.2, aber ebenso mit DefinitionsmengeD(f) =Q und Wertebereich W(f) =Q + ,aberauchmitD(f) =Z undW(f)={0, ±1, ±2, ±4,...}.f(x)=x 2−1 0 12345 −1 0 12345D fAbb. 9.2. Veranschaulichung von f : É → É + mit f(x)=x 2W fBeispiel 9.2. Für die Funktion f(z)=z +3können wir z.B. D(f)=N mitW(f)={4, 5, 6,...},oderD(f)=Z mit W(f)=Z wählen.


118 9. Was ist eine Funktion?Beispiel 9.3. Wir können die Funktion f(n) =2 −n mit D(f) =N undW(f)={ 1 2 , 1 4 , 1 8,...} betrachten.Beispiel 9.4. Für die Funktion x → f(x) =1/x können wir D(f) =Q +und W(f)=Q + wählen. Für jedes x inQ + ist der Wert f(x)=1/x inQ +und somit ist W(f) eine Untermenge vonQ + . Entsprechend ist für jedes yinQ + ein x inQ + mit y =1/x und somit W(f)=Q + ,d.h.W(f) nimmtden gesamtenQ + an.Während die Definitionsmenge D(f) einer Funktion f(x) oft durch denZusammenhang oder die Eigenschaften von f(x) gegeben ist, ist es oftschwierig, die zugehörige Wertemenge W(f) genau zu bestimmen. Wir lesendaher oft f : D(f) → B in der Bedeutung, dass die zugehörigen Werte vonf(x), für jedes x in D(f), innerhalb der Menge B liegen. Der WertebereichW(f) ist somit in B enthalten, aber die Menge B kann auch größer sein alsW(f). Das befreit uns davon, genau herauszufinden, wie W(f) aussieht,was nötig wäre, um f : D(f) → W(f) einen tieferen Sinn zu geben. Wirsagen, dass fD(f)aufW(f) abbildet, da jedes Element der Menge W(f)sich als f(x) für ein x ∈ D(f) schreibenlässt. Wenn wir f : D(f) → Bschreiben, sagen wir, dass fD(f) inB abbildet.Die Schreibweise f : D(f) → B dient eher dem Zweck, die Eigenschaftenoder die Art der Funktionswerte f(x) wiederzugeben, als zu präzisieren,welche Funktionswerte angenommen werden, wenn x sich in D(f) ändert.So bedeutet beispielsweise f : D(f) →N, dass die Funktionswerte f(x)natürliche Zahlen sind. Wir werden im weiteren Funktionen x → f(x)kennen lernen, in denen die Variable x nicht nur eine Zahl symbolisiert,sondern etwas Allgemeineres wie ein Zahlenpaar und entsprechend kannauch f(x) ein Zahlenpaar sein. Die Schreibweise f : D(f) → B, mitden richtigen Mengenbezeichnungen für D(f) und B, kann die Informationtragen, dass x eine Zahl ist und f(x) ein Zahlenpaar. Wir werden untenauf viele konkrete Beispiele treffen.Beispiel 9.5. Die Funktion f(x)=x 2 genügt f :Q → [0, ∞)mitD(f)=Qund W(f) =[0, ∞). Wir könnten auch f : Q →Qschreiben, wodurchangezeigt wird, dass x 2 eine rationale Zahl ist, falls x es auch ist, vgl. Abb.9.2.Beispiel 9.6. Die Funktionf(x)=x 3 − 4x 2 +1(x − 4)(x − 2)(x +3)ist für alle rationalen Zahlen x ≠4, 2, −3 definiert. Daher ist es ganznatürlich, D(f) ={x ∈Q:x≠ 4,x ≠2,x ≠ −3} zu definieren. Wirsetzen die Definitionsmenge oft als die größtmöglichste Zahlenmenge an,für die eine Funktion definiert ist. Die Wertemenge ist schwer zu berechnen,aber sicherlich gilt f : D(f) →Q.


9.2 Funktionen im täglichen Leben9.2 Funktionen im täglichen Leben 119Im täglichen Leben stolpern wir alle Nase lang über Funktionen. Ein Autoverkäuferlegt für jedes Auto x in seinem Betrieb einen Preis f(x) fest,der eine Zahl ist. Hierbei kann D(f) eine Zahlenmenge sein, falls die Autosfest nummeriert sind, oder D(f) kann auch eine Beschreibungsliste sein,wie {VW92blau, Opel93grün, ...} und W(f) ist die Menge aller möglichenPreise der Autos in D(f). Wenn das Finanzamt die Steuern berechnet, wirdeine Zahl f(x), das sind die Steuern, die wir schulden, mit einer <strong>and</strong>erenZahl x, das ist das Einkommen, verknüpft. Sowohl die DefinitionsmengeD(f) als auch die Wertemenge W(f) hängen ganz entschieden davon ab,woher der politische Wind weht.Jede Größe, die von der Zeit abhängt, kann als Funktion der Zeit angesehenwerden. Die tägliche Spitzentemperatur in Grad Celsius in Stockholmim Jahr 1999 ist eine bestimmte Funktion f(x) vomTagx, mitD(f) ={1, 2,...,365} und W(f) istüblicherweise eine Untermenge von[−30, 30]. Der Preis f(x) einer Aktie an einem H<strong>and</strong>elstag an der FrankfurterBörse ist eine Funktion der Tageszeit x mit D(f)=[9:00, 19 : 00]und W(f) ist die Schwankungsbreite des Aktienpreises an dem Tag. DieRocklänge variiert über die Jahre um das Knie herum und ist ein guterIndikator für das wirtschaftliche Klima. Die Größe eines Menschen ändertsich in seinem Leben und die Dicke der Ozonschicht über Jahre.Wir können genauso gut mehrere Größen, die gleichzeitig von der Zeitabhängen, betrachten, wie etwa die Temperatur t(x) in Celsiusgraden unddie Windgeschwindigkeit w(x) in Meter pro Sekunde in Amsterdam alsFunktion der Zeit x, wobeix sich über den Monat Januar erstreckt. Wirkönnen die zwei Werte t(x) und w(x) zu einem Zahlenpaar ”t(x) und w(x)“kombinieren, was wir in der Form f(x) = ”t(x) und w(x)“ oder kürzerf(x) =(t(x),w(x)) schreiben können, wobei die Klammer das Paar umschließt.So würde beispielsweise f(10) = (−30, 20) die Information liefern,dass es am 10. Januar bis zu -30 ◦ Celsius kalt war und ein starker Windmit 20 Metern pro Sekunde blies. Aus dieser Information könnten wir diegefühlten Temperaturen zu -50 ◦ Celsius berechnen, indem wir den Windberücksichtigen.Ebenso kann die Argumentvariable x ein Zahlenpaar repräsentieren wiedie Temperatur und die Windgeschwindigkeit und das Resultat könnte diegefühlte Temperatur sein, bei der der Wind berücksichtigt wird (FindenSie die Formel heraus!).Zusammenfassend können wir sagen, dass das Argument x einer Funktionf(x) beliebig sein kann, angefangen bei einfachen Zahlen, Zahlenpaarenaber auch Beschreibungen für Autos. Das Gleiche gilt auch für das Resultatf(x).Beispiel 9.7. Die Volkszählung von 1890 in den USA wurde mit Hilfe desLochkartensystems von Hermann Hollerith (1860–1829) durchgeführt. Da-


120 9. Was ist eine Funktion?bei wurden die Daten für jede Person (Geschlecht, Alter, Adresse, etc.) inForm von positionierten Löchern in einer Karte von der Größe eines Geldscheinseingegeben, die dann automatisch mit einer Maschine, bei der elektrischeSchaltkreise durch Nadeln an den Lochstellen geschlossen wurden,gelesen werden konnten, vgl. Abb. 9.3. Die Gesamtbevölkerung wurde nacheiner Zählzeit von drei Monaten mit dem Hollerith System zu 62,622,250gezählt, wofür ursprünglich eine Projektzeit von 2 Jahren veranschlagt war.Offensichtlich können wir das Hollerith System als eine Funktion der Mengealler Einwohner der USA von einem Lochkartenstabel ansehen. Um seinSystem noch weiter auszunutzen, gründete Hollerith die Tabulating MachineCompany, die 1924 in International Business Machines CorporationIBM umbenannt wurde.Abb. 9.3. Hermann Hollerith, Erfinder der Lochkartenmaschine: ”Mein FreundDr. Billings schlug mir eines Abends im Gasthaus vor, dass es eine mechanischeMöglichkeit zur Durchführung der Volkszählung geben sollte, etwas in der Artwie der Webstuhl von Jacquard, bei dem Löcher in einer Karte das Webmustersteuern“


9.2 Funktionen im täglichen Leben 121Beispiel 9.8. Ein Buch besteht aus einer Menge von Seiten, die von 1bis N nummeriert sind. Wir können die Funktion f(n) einführen, die aufD(f) ={1, 2,...,N} definiert ist, wobei f(n) die tatsächliche Seite imBuch mit Seitenzahl n angibt. In diesem Fall erstreckt sich der WertebereichW(f) auf die Gesamtzahl der Seiten im Buch.Beispiel 9.9. Ein Film besteht aus einer Folge von Bildern, die mit einer Ratevon 16 Bildern pro Sekunde abgespielt werden. Üblicherweise folgen wireinem Film vom ersten bis zum letzten Bild. Hinterher diskutieren wir verschiedeneSzenen im Film, die eine Untermenge der Gesamtzahl an Bildernist. Sehr wenige Menschen, wie der Regisseur, können den Film als Folgevon Einzelbildern in der Definitionsmenge, das sind alle Bilder im Film,sehen. Bei der Aufnahme nummerieren sie die Bildsequenzen 1, 2, 3,...,N,wobei 1, 2,...,16 die Bilder kennzeichnen, die hinterein<strong>and</strong>er in der erstenSekunde gespielt werden, und N ist das letzte Bild. Wir können somit denFilm als eine Funktion f(n) mitD(f) ={1, 2,...,N} ansehen, die jederZahl n in D(f) eine Bildsequenz mit Zahl n zuweist.Beispiel 9.10. Das Telefonverzeichnis einer Stadt wie Hamburg ist einfachnur eine gedruckte Form der Funktion f(x), die jeder aufgeführten Personx eine Telefonnummer zuweist. Ist zum Beispiel x =Hans Schmidt, dann istf(x) = 46322345567 die Telefonnummer von Hans Schmidt. Wenn wir eineTelefonnummer suchen, ist unser erster Gedanke das Telefonbuch, d.h. diegedruckte Version des gesamten Definitionsbereichs der Funktion f, unddann die Suche nach dem Resultat, d.h. der Telefonnummer eines Individuumsim Definitionsbereich. Bei diesem Beispiel ordnen wir die Definitionsmengeeinzelner Namen von in Hamburg lebenden Menschen so an, dassdie Suche nach einem besonderen Argument einfach wird. D.h. wir ordnendie Individuen alphabetisch. Wir könnten die Individuen stattdessen auchnach ihrer Steuernummer anordnen.Es gibt einen wichtigen Gesichtspunkt bei den drei Beispielen Buch, Filmund Telefonverzeichnis, der nicht bei der Formulierung dieser Objekte alsFunktionen x → f(x) mit vorgegebener Definitionsmenge D(f) und WertebereichW(f) berücksichtigt wird, nämlich die Anordnung in D(f). Buchseitenund Bilder in einem Film werden fortlaufend nummeriert und dieDefinitionsmenge bei einem Verzeichnis ist alphabetisch geordnet. BeimBuch und beim Film hilft die Anordnung für das Verständnis, und ein Verzeichnisohne eine Anordnung ist nahezu unbenutzbar. Sicherlich gehörtdas Hin-und-Herschalten zwischen Filmen heutzutage fast schon zum Lebensstil,aber die Gefahr etwas nicht zu verstehen oder zu verpassen liegtauf der H<strong>and</strong>. Um die Hauptgedanken eines Buches oder die Haupth<strong>and</strong>lungin einem Film als Ganzes zu begreifen, ist es notwendig, die Seiten ineiner gewissen Reihenfolge zu lesen und die Bilder geordnet anzuschauen.Die Anordnung hilft uns, ein Gesamtverständnis zu bekommen.


122 9. Was ist eine Funktion?Die Haupteigenschaften einer Funktion f(x) einzufangen, kann ähnlichnützlich sein. Manchmal hilft uns die Zeichnung oder Veranschaulichungder Funktion mit Hilfe einer geeigneten Anordnung von D(f). Wir werdenuns jetzt der graphischen Darstellung von Funktionen f(x), wobei D(f)und W(f) Untermengen vonQsind, widmen und dabei die natürlicheAnordnung inQbenutzen. Dabei wollen wir versuchen, die Eigenschafteneiner gegebenen Funktion ”als Ganzes“ zu begreifen.9.3 Darstellung von Funktionen ganzer ZahlenBis jetzt haben wir eine Funktion entweder durch Auflisten aller ihrer Wertein einer Tabelle wie dem Telefonbuch oder durch Zuweisung zu einer Formelwie f(n) =n 2 mit dem jeweiligen Definitionsbereich charakterisiert. EinBild von dem Verhalten der Funktion zu haben, kann nützlich sein oder <strong>and</strong>ersformuliert, es kann sinnvoll sein, eine Funktion geometrisch darzustellen.Funktionen darzustellen ist eine Art Sichtbarmachung der Funktion,so dass wir ihre Eigenschaften ”in einem Blick“ oder als etwas Konkretesbegreifen können. So können wir beispielsweise eine Funktion als in einemBereich ansteigend und einem <strong>and</strong>eren abnehmend beschreiben, ohne siegenauer zu spezifizieren.Wir beginnen mit der Beschreibung der Darstellung von Funktionenf :Z→Z. Denken Sie daran, dass ganze Zahlen geometrisch durch dieZahlengerade dargestellt werden. Um Argument und Resultat einer Funktionf :Z→Z zu zeigen, benötigen wir daher zwei Zahlengeraden, so dasswir die Punkte in D(f) auf einer und die Punkte in W(f) auf der <strong>and</strong>erenmarkieren können. Bequemerweise werden diese Zahlengeraden senkrechtzuein<strong>and</strong>er angeordnet, vgl. Abb. 9.4. Wenn wir die Schnittpunkte waagrechterLinien, die durch die Markierungen der senkrechten Zahlengeradengehen, mit senkrechten Linien, die durch die Markierungen der waagrechtenAbb. 9.4. Die Koordinatenebene ganzer Zahlen


9.3 Darstellung von Funktionen ganzer Zahlen 123Zahlengeraden verlaufen, markieren, erhalten wir ein Gitter wie in Abb. 9.4.Dieses wird Koordinatenebene ganzer Zahlen genannt. Die Zahlengeradenwerden Achsen der Koordinatenebene genannt und der Schnittpunkt derbeiden Zahlengeraden wird Ursprung bezeichnet und mit 0 markiert.Wie wir gesehen haben, kann eine Funktion f :Z→Z durch eine Tabelle,bei der die Argumente den Resultaten gegenübergestellt werden, dargestelltwerden. Eine solche Tabelle ist in Abb. 9.5 für f(n) =n 2 wiedergegeben.Wir können eine derartige Tabelle auch in der Koordinatenebene darstellen,indem wir nur die Punkte markieren, die zu Einträgen in der Tabellegehören, d.h. durch Markierung jedes Schnittpunkts der Linie senkrechtbeim Argument mit der waagrecht beim Resultat. Wir zeigen das Bild fürf(n)=n 2 in Abb. 9.5.n01-12-23-34-45-56-6f(n)011514491091616525253636 -4 -2 2 4Abb. 9.5. Tabelle für f(n) = n 2 und eine Darstellung der zur Funktionf(n)=n 2 gehörenden Punkte mit den ganzen Zahlen als DefinitionsmengeBeispiel 9.11. In Abb. 9.6 tragen wir n, n 2 und 2 n entlang der vertikalenAchse gegen n =1, 2, 3,...,6 auf der waagrechten Achse auf. Die Abbildunglegt nahe, dass 2 n schneller mit n wächst als n und n 2 . In Abb. 9.7 istn −1 , n −2 und 2 −n für n =1, 2, 3,...,6 aufgetragen. Wir können erkennen,dass 2 −n am schnellsten abnimmt und n −1 am langsamsten. VergleichenSie dieses Ergebnis mit Abb. 9.6.Anstatt die Punkte einer Funktion in einer Tabelle aufzulisten, können wirdie Punkte in der Koordinatenebene mathematisch gesehen auch als geordneteZahlenpaare darstellen. Dazu ordnen wir dem Schnittpunkt einervertikalen Geraden durch n (auf der waagrechten Zahlengeraden) und einerwaagrechten Gerade durch m (auf der vertikalen Zahlengeraden) dasZahlenpaar (n, m) zu. Das sind die Koordinaten des Punktes. Mit dieserNotation können wir die Funktion f(n) =n 2 als die Menge geordneterPaare{(0, 0), (1, 1), (−1, 1), (2, 4), (−2, 4), (3, 9), (−3, 9),...}


124 9. Was ist eine Funktion?60504030201002 4 6Abb. 9.6. Zeichnungen der Funktionen Æ f(n) = n, ¤ f(n) =n 2 und•f(n)=2 n mit D(f)=Nformulieren. Beachten Sie, dass wir bei dieser Schreibweise die erste Zahlmit der waagrechten Lage des Punktes und die zweite Zahl mit der vertikalenLage verbinden. Dies ist eine willkürliche Wahl.Wir können die Vorstellung, dass Funktionen eine Abbildung ihres Definitionsbereichsin den Wertebereich sind, durch ihren Graphen schön veranschaulichen.Betrachten Sie Abb. 9.5. Wir beginnen mit einem Punktim Definitionsbereich auf der waagrechten Achse, folgen einer Linie senkrechtnach oben bis zum Punkt in der Zeichnung der Funktion und folgeneiner horizontalen Linie zur senkrechten Achse. Anders formuliert, könnenwir das Resultat zu einem bestimmten Argument dadurch finden, dass wirzuerst einer senkrechten und dann einer waagrechten Linie folgen.Beachten Sie, dass bei Funktionen mit D(f)=N oder D(f)=Q nur Teileder Funktion dargestellt werden können, einfach deswegen, weil wir prak-1.75.5.2501 2 3 4 5 6Abb. 9.7. Zeichnungen der Funktionen Æ f(n) =n −1 , ¤ f(n) =n −2 und•f(n)=2 −n mit D(f)=N


9.4 Darstellung von Funktionen rationaler Zahlen 125tisch den Zahlenstrahl, oder die Zahlengerade nicht ”unendlich“ verlängernkönnen. Natürlich muss auch eine tabellarische Darstellung solch einerFunktion auf eine endliche Zahl von Argumenten eingeschränkt werden.Nur eine beschreibende Formel der Funktionswerte, wie f(n)=n 2 (zusammenmit der Angabe von D(f)), kann in diesen Fällen ein vollständigesBild geben.9.4 Darstellung von Funktionen rationaler ZahlenNun betrachten wir Darstellungen von Funktionen f :Q→Q. Wirgehenwie bei Funktionen ganzer Zahlen vor und zeichnen Funktionen rationalerZahlen auf der rationalen Koordinatenebene. Zur Konstruktion gehen wirvon zwei rationalen Zahlengeraden im rechten Winkel aus, die wir Achsennennen, die sich im Ursprung schneiden. Dann markieren wir jeden Punktmit rationalen Koordinaten. Natürlich, wenn wir uns an Abb. 7.4 erinnern,würde solch eine Ebene schwarz vor Punkten erscheinen, selbst wenn sie esnicht wirklich wäre. Wir verzichten auf ein Beispiel!Wenn wir wieder die Zeichnung einer Funktionen rationaler Zahlen damitbeginnen, dass wir eine Liste von Werten aufschreiben, erkennen wirsofort, dass die Zeichnung einer rationalen Funktion komplizierter ist alsdie Zeichnung einer ganzzahligen Funktion. Wenn wir Werte einer ganzzahligenFunktion berechnen, können wir nicht alle Werte berechnen, weiles unendlich viele ganze Zahlen gibt. Stattdessen wählen wir eine kleinsteund eine größte ganze Zahl und beschränken uns auf die Berechnung derFunktionswerte für die ganzen Zahlen dazwischen. Aus demselben Grundkönnen wir nicht alle Werte einer rationalen Funktion berechnen. Abernun müssen wir die Liste auch in einer <strong>and</strong>eren Hinsicht einschränken:Wie vorher müssen wir eine kleinste und eine größte Zahl für die Tabellewählen, aber wir müssen auch entscheiden, wie viele Punkte wir zwischenden kleinen und großen Werten benutzen wollen. Anders gesagt, könnenwir nicht die Funktionswerte in allen rationalen Zahlen zwischen zwei rationalenZahlen berechnen. Das bedeutet, dass eine Tabelle von rationalenFunktionswerten immer ”Lücken“ zwischen den Punkten, an denen wir dieFunktion auswerten, hat. Hier ein Beispiel zum besseren Verständnis.Beispiel 9.12. Wir tabellieren einige Funktionswerte für f(x) = 1 2 x + 1 2definiert für die rationalen Zahlen:1x2 x + 1 2−5 −2−2, 8 −0, 9−2 −0, 5−1, 2 −0, 1−1 0x12 x + 1 2−0, 6 0, 20, 2 0, 61 13 25 3


126 9. Was ist eine Funktion?und stellen dann die Funktionswerte in Abb. 9.8 dar.Abb. 9.8. Graphische Darstellung der Funktionswerte von f(x)= 1 2 x+ 1 2 zusammenmit mehreren <strong>and</strong>eren Funktionen, die dieselben Werte an den ausgewähltenPunkten annehmenDie aufgelisteten Werte deuten stark darauf hin, diese Punkte durch eineGerade zu verbinden, um die Funktion zu zeichnen. Wie können jedochnicht sicher sein, dass dies wirklich der korrekte Graph ist, da es viele Funktionengibt, die in den berechneten Punkten mit 1 2 x + 1 2 übereinstimmen.Zwei haben wir in Abb. 9.8 dargestellt. Daher müssen wir normalerweiseeine Funktion an viel mehr Punkten auswerten als wir in Abb. 9.8 benutzthaben, um ihren Graphen richtig darzustellen. Auf der <strong>and</strong>eren Seite istes unmöglich, f(x) für alle möglichen rationalen Zahlen x zu berechnen,so dass wir letzten Endes immer noch Werte zwischen den berechnetenPunkten raten müssen, unter der Annahme, dass die Funktion an diesenStellen sich nicht seltsam verhält. MATLAB überbrückt beim Zeichnendie Lücken zwischen berechneten Punkten beispielsweise mit geraden Segmenten.Die Entscheidung, ob wir eine für rationale Zahlen definierte Funktionoft genug ausgewertet haben, um in der Lage zu sein, ihr Verhaltenzu raten oder nicht, ist ein interessantes und wichtiges Problem. Es istnebenbei nicht nur ein theoretisches Problem: Wenn wir Größen für einExperiment messen müssen, die theoretisch auf einer Linie liegen müssten,bekommen wir wahrscheinlich die Zeichnung einer Funktion, die einer Linienahe kommt, die aber aufgrund experimenteller Fehler kleine Ausschlägeaufweisen wird.Bei dieser Entscheidung kann uns tatsächlich die Infinitesimalrechnungbehilflich sein. Für den Augenblick wollen wir annehmen, dass sich die zuzeichnenden Funktionen sanft zwischen den Probenpunkten ändern, wasgrößtenteils für die Funktionen, die wir in diesem Buch beh<strong>and</strong>eln, zutrifft.Wir beenden dieses Kapitel mit einem weiteren Beispiel einer Zeichnung.Im nächsten Kapitel werden wir viel mehr Zeit auf graphische Darstellungenverwenden.


9.5 Eine Funktion zweier Variabler 127Beispiel 9.13. Wir führen einige Funktionswerte von f(x) =x 2 definiertauf den rationalen Zahlen an:x x 2−4 16−3, 5 12, 25−3, 1 9, 618−2 4−1, 8 3, 24−1, 4 1, 96−1 1x x 2−0, 8 0, 64−0, 4 0, 160 00, 2 0, 041, 2 1, 441, 5 2, 252, 21 4, 8841und zeichnen die Funktionswerte in Abb. 9.9.x x 22, 3 5, 292, 4 5, 763 93, 1 9, 613, 6 12, 963, 7 13, 694 16Abb. 9.9. Zeichnung einiger Punkte, die durch f(x)=x 2 gegeben sind und miteiner glatten Kurve verbunden wurden9.5 Eine Funktion zweier VariablerWir geben ein Beispiel für eine Funktion zweier Variabler. Die Gesamtkostenim Mittagssuppe/Eiscreme Modell betrugen15x +3y,wobei x für die Fleischmenge und y für die Menge Eiscreme st<strong>and</strong>. Wirkönnen die Gesamtkosten 15x +3y als eine Funktion f(x, y) =15x +3yzweier Variabler x und y betrachten. Für jeden Wert von x und y gibtes einen entsprechenden Funktionswert f(x, y) =15x +3y, der die Gesamtkostenangibt. Dabei sind für uns sowohl x als auch y unabhängige


128 9. Was ist eine Funktion?Variable, die frei verändert werden können, entsprechend jeder beliebigenKombination von Rindfleisch und Eiscreme, wohingegen der Funktionswertz = f(x, y) eineabhängige Variable ist. Für jedes Paar von Werten x undy gibt es einen zugehörigen Wert z = f(x, y) =15x +3y. Wir schreiben(x, y) → f(x, y) =15x +3y und bezeichnen dabei das Paar x und y mit(x, y).Dies führt uns zu einer natürlichen und sehr wichtigen Erweiterung desbisherigen Funktionsbegriffs: Eine Funktion kann von zwei unabhängigenVariablen abhängen. Angenommen, wir lassen für die Funktion f(x, y) =15x +3y Änderungen in x und y im Intervall [0, ∞) zu, so schreiben wirf :[0, ∞) × [0, ∞) → [0, ∞), um anzuzeigen, dass für jedes x ∈ [0, ∞) undy ∈ [0, ∞), d.h. für jedes Paar (x, y) ∈ [0, ∞)×[0, ∞) ein eindeutiger Wertf(x, y)=15x +3y ∈ [0, ∞)existiert.Beispiel 9.14. Ihre Freundin muss für x Kilo Rindfleisch und y Kilo Eiscremeeinen Preis von p =15x +3y bezahlen, d.h. p = f(x, y), wobeif(x, y)=15x +3y.Beispiel 9.15. Die Zeit t für eine Radtour hängt von der Tourlänge s undvon der (Durchschnitts-)Geschwindigkeit v mit s v ab, d.h. t = f(s, v)= s v .Beispiel 9.16. Der Druck p in einem idealen (dünnen) Gasgemisch hängtvon der Temperatur T und dem Volumen V , das das Gas einnimmt, wiep = f(T,V)= nRTVab, wobei n die Anzahl der Mole Gas angibt und R dieuniverselle Gaskonstante ist.9.6 Funktionen mehrerer VariablerNatürlich können wir weiter gehen und Funktionen, die von mehreren Variablenabhängen, betrachten.Beispiel 9.17. Wenn Sie Ihrer Freundin freie H<strong>and</strong> beim Einkauf von Fleischx, Mohrrüben y und Kartoffeln z bei der Mittagssuppe geben, werden dieKosten k der Suppe k =8x+2y+z betragen und von den drei Variablen x,y und z abhängen. Somit werden die Kosten gegeben durch k = f(x, y, z)mit f(x, y, z)=8x +2y + z.Beispiel 9.18. Die Temperatur u an einem bestimmten Punkt der Erdehängt sowohl von den drei Raumkoordinaten x, y und z als auch von derZeit t ab, d.h. u = f(x, y, z, t).Wennwirmehralsnureinpaarunabhängige Variable betrachten, wirdes bald nötig, die Schreibweise anzupassen und eine Art Indizierung derVariablen zu verwenden, wie z.B. x 1 , x 2 und x 3 für die Raumkoordinatenanstatt x, y und z. Die Temperatur u im letzten Beispiel wird dann durch


Aufgaben zu Kapitel 9 129die Funktion u = f(x, t) gegeben, wobei x =(x 1 ,x 2 ,x 3 ) drei Raumkoordinatenenthält.Aufgaben zu Kapitel 99.1. Identifizieren Sie vier Funktionen in Ihrem täglichen Umfeld und bestimmenSie jeweils die Definitionsmenge und den Wertebereich.9.2. Bestimmen Sie für die Funktion f(x) =4x − 2 den Wertebereich bei (a)D(f)=(−2,4], (b) D(f)=(3, ∞), (c) D(f)={−3, 2,6, 8}.9.3. Finden Sie für die Funktion f(x) =2− 13x den Definitionsbereich D(f)zur Wertemenge W(f)=[−1,1] ∪ (2, ∞).9.4. Bestimmen Sie die Definitionsmenge und den Wertebereich der Funktionf(x) =x 3 /100 + 75, wobei die Funktion f(x) die Temperatur in einem Aufzugmit x Personen beschreibt, der Platz für 9 Personen bietet.9.5. Bestimmen Sie Definitionsmenge und Wertebereich von H(t) =50− t 2 ,wobei H(t) eine Funktion ist, die die Höhe in Metern für einen zur Zeit t =0fallengelassenen Ball angibt.9.6. Finden Sie den Wertebereich der Funktion f(n) =1/n 2 über D(f) ={n ∈ Æ : n ≥ 1}.9.7. Bestimmen Sie den Definitionsbereich und eine Menge B, in der die Wertemengeenthalten ist, für die Funktion f(x)=1/(1 + x 2 ).9.8. Finden Sie die Definitionsbereiche der Funktionen(a)2 − x(x +2)x(x − 4)(x − 5)(b)x4 − x 2 (c)12x +1 + x2x − 8 .9.9. (Schwierig) Betrachten Sie die Funktion f(n), definiert auf den natürlichenZahlen, wobei f(n) der Rest ist, den man bei der Division von n durch 5 mitder Schuldivisionsmethode erhält. So ist z.B. f(1) = 1, f(6) = 1, f(12) = 2, etc.Bestimmen Sie W(f).9.10. Stellen Sie die Abbildung f : Æ → É für zwei Intervalle da, wobeif(n)=2 −n .9.11. Zeichnen Sie die folgenden Funktionen f : → nachdem Sie eine Tabellemit mindestens 5 Werten berechnet haben: (a) f(n)=4−n,(b)f(n)=2n −n 2 ,(c) f(n)=(n +1) 3 .9.12. Zeichnen Sie drei verschiedene Kurven, die durch die Punkte (−2, −1),(−1, −5), (0;0, 25), (1; 1,5) und (3,4) gehen.


130 9. Was ist eine Funktion?9.13. Zeichnen Sie die Funktionen: (a) 2 −n ,(b)5 −n und (c) 10 −n ; definiert überden natürlichen Zahlen n. Vergleichen Sie die Zeichnungen.9.14. Zeichnen Sie die Funktion f(n)= 10 9 (1−10−n−1 ) definiert auf den natürlichenZahlen.9.15. Zeichnen Sie die Funktion f : É → É mit f(x) =x 3 , nachdem Sie eineWertetabelle angelegt haben.9.16. Schreiben Sie eine MATLAB Funktion, die zwei rationale Argumente xund y akzeptiert und deren Summe x + y zurückgibt.9.17. Schreiben Sie eine MATLAB Funktion, die zwei Argumente x und y,die zwei Geschwindigkeiten symbolisieren, akzeptiert und den Zeitgewinn proKilometer wiedergibt, der sich aus der Geschwindigkeitserhöhung von x auf yergibt.


10PolynomfunktionenManchmal dachte er für sich Warum?“ und manchmal dachte er,”” Weswegen?“, und manchmal dachte er Inwiefern welches?“ (Pu-”Bär)Er war einer der originellsten und unabhängigsten Männer, der niemalsetwas so tat oder formulierte wie ein <strong>and</strong>erer. Das Resultat war,dass man bei seinen Vorlesungen nur sehr schlecht Notizen machenkonnte, so dass wir hauptsächlich auf Rankines Lehrbuch angewiesenwaren. Gelegentlich vergaß er bei den höheren Klassen, dass er Vorlesungenhalten sollte und nachdem wir etwa zehn Minuten gewartethatten, schickten wir den Hausmeister, um ihm bestellen zu lassen,dass die Klasse auf ihn wartete. Er pflegte dann durch die Tür zustürmen, ein Exemplar von Rankine vom Tisch zu nehmen, es offensichtlichzufällig zu öffnen, die ein oder <strong>and</strong>ere Formel anzuschauenund zu behaupten, dass sie falsch sei. Er ging dann zur Tafel, umdies zu beweisen. Er schrieb mit dem Rücken zu uns an die Tafel,sprach mit sich selbst und von Zeit zu Zeit wischte er alles weg undsagte, dass es falsch sei. Dann fing er in einer neuen Zeile an, undso weiter. Gegen Ende der Stunde beendete er normalerweise eineZeile, wischte sie nicht weg und sagte, dass dies jetzt bewiese, dassRankine doch recht gehabt hätte. (Rayleigh über Reynolds)10.1 EinleitungWir untersuchen nun Polynomfunktionen, die für die Infinitesimalrechnungund die lineare Algebra immens wichtig sind. Eine Polynomfunktion oder


132 10. Polynomfunktionenein Polynom f(x) hat die Formf(x)=a 0 + a 1 x + a 2 x 2 + a 3 x 3 + ···+ a n x n , (10.1)wobei a 0 ,a 1 ,...,a n gegebene rationale Zahlen sind, die Koeffizienten genanntwerden. Die Variable x kann sich innerhalb einer Teilmenge der rationalerZahlen verändern. Der Wert einer Polynomfunktion f(x) kann direktdurch Addition und Multiplikation rationaler Zahlen berechnet werden. DieFunktion für die Mittagssuppe f(x)=15x ist ein Beispiel für ein linearesPolynom mit n =1,a 0 = 0 und a 1 = 15. Die Funktion für den schlammigenHof f(x)=x 2 ist ein Beispiel einer quadratischen Funktion,mitn =2,a 0 = a 1 = 0 und a 2 =1.Wenn alle Koeffizienten a i Null sind, dann ist f(x) =0für alle x undwir nennen f(x) dasNullpolynom. Istn der größte Index mit a n ≠0,sosagen wir, dass n der Grad oder die Ordnung von f(x) ist. Die einfachstenPolynome außer dem Nullpolynom sind die konstanten Polynome f(x)=a 0vom Grad 0. Der nächst einfache Fall sind lineare Polynome f(x)=a 0 +a 1 xvom Grad 1 und quadratische Polynome f(x)=a 0 +a 1 x+a 2 x 2 vom Grad2 (unter der Annahme, dass a 1 ≠0,bzw.a 2 ≠ 0), zu denen wir geradeBeispiele gegeben haben. Ein Polynom dritten Grades haben wir bereitsim Modell zur Löslichkeit von Ba(IO 3 ) 2 im Abschnitt 7.10 kennengelernt.Polynome sind zentrale ”Bausteine“ von Funktionen, und es wird für unsspäter sehr nützlich sein, wenn wir uns jetzt etwas Mühe geben, einiges übersie zu lernen und Polynome zu verstehen. Desweiteren werden wir noch <strong>and</strong>ereFunktionen wie die Elementarfunktionen, zu denen die trigonometrischenFunktionen wie sin(x) und die Exponentialfunktion exp(x) gehören,kennen lernen. Alle Elementarfunktionen sind Lösungen gewisser zentralerDifferentialgleichungen, und die Auswertung derartiger Funktionen erfordertdie Lösung der zugehörigen Differentialgleichung. Daher heißen dieseFunktionen nicht elementar, weil sie elementar einfach auszuwerten sind,was für Polynome zutrifft, sondern weil sie zentralen ”elementaren“ Differentialgleichungengenügen.In der Geschichte der <strong>Mathematik</strong> gab es zwei gr<strong>and</strong>iose Versuche ”allgemeineFunktionen“ als (i) Polynomfunktionen (Potenzreihen) und (ii)trigonometrische Funktionen (Fourierreihen) auszudrücken. In der finitenElemente Methode werden allgemeine Funktionen mit Hilfe stückweise definierterPolynome beschrieben.Wir beginnen mit linearen und quadratischen Polynomen, bevor wir allgemeinePolynomfunktionen betrachten.10.2 Lineare PolynomeWir beginnen mit dem linearen Polynom y = f(x) =mx, wobeim einerationale Zahl ist. Wir schreiben hier m anstelle von a 1 ,weildiesdie


10.2 Lineare Polynome 133gebräuchlichere Schreibweise ist. Wir können D(f) =Q wählen und mitm ≠0auchW(f) =Q. Wenny irgendeine rationale Zahl ist, dann ergibtx = y/m eingesetzt in f(x) =mx den Wert von f(x) =y. Andersformuliert, bildet für m ≠ 0 die Funktion f(x)=mxQinQab.Eine Betrachtungsweise für die Menge an Paaren (x, y), die y = mxgenügt, ist die, dass die Paare auch y/x = m erfüllen. Angenommen,(x 0 ,y 0 ) und (x 1 ,y 1 ) seien zwei Punkte, die y/x = m erfüllen. Wenn wir einDreieck mit einer Ecke im Ursprung und einer Seite der Länge x 0 parallelzur x-Achse und die <strong>and</strong>ere Seite der Länge y 0 parallel zur y-Achse zeichnenund anschließend das entsprechende Dreieck für den <strong>and</strong>eren Punktmit den Seitenlängen x 1 und y 1 wiederholen, vgl. Abb. 10.1, so bedeutetdie Bedingungy 0= m = y 1,x 0 x 1dass die beiden Dreiecke ähnlich sind. Tatsächlich muss jeder Punkt (x, y),der y/x = m genügt, ein Dreieck bilden, das dem Dreieck für (x 0 ,y 0 )ähnlich ist, vgl. Abb. 10.1. D.h., dass derartige Punkte auf einer Geradenliegen, die wie angedeutet durch den Ursprung verläuft.Abb. 10.1. Punkte, die y = mx genügen, formen ähnliche Dreiecke. In derAbbildung ist m =3/2Umgangssprachlich wird m oder das Verhältnis von y zu x auch Anstiegüber einer Strecke genannt, wohingegen <strong>Mathematik</strong>er zu m Steigung derGeraden sagen. Wenn wir uns vorstellen, auf einer geraden ansteigendenStraße zu stehen, dann sagt uns die Steigung, wie hoch wir für einen waagrechtenAbst<strong>and</strong> klettern müssen. Anders ausgedrückt: Je größer die Steigungm, desto steiler ist die Gerade. Die Gerade verläuft übrigens abwärts,wenn die Steigung negativ ist. In Abb. 10.2 haben wir verschiedene Geradendargestellt. Ist die Steigung m = 0, dann liegt eine waagrechte Geradedirekt auf der x-Achse vor. Andererseits ist eine senkrechte Gerade eineMenge an Punkten (x, y) mitx = a für eine Konstante a. Senkrechte Geradenhaben keine wohl-definierte Steigung.


134 10. Polynomfunktionen42y=2xy=x/2-2 2y=-x/3-2y=-x-4Abb. 10.2. Beispiele von Geraden(x 1,y 1)(x 0,y 0)x 1- x 0y 1-y 0Abb. 10.3. Die Steigung jeder Geraden wird durch den Anstieg über einerStrecke bestimmtMit Hilfe der Steigung anzugeben, ob eine Gerade ansteigt oder abfällt,hängt nicht davon ab, ob die Gerade durch den Ursprung geht. Wir könnenan jedem Punkt der Geraden beginnen und uns waagrecht um die Streckex bewegen um herauszufinden, ob eine Gerade ansteigt oder abfällt, vgl.Abb. 10.3. Bei zwei Punkten (x 0 ,y 0 ) und (x 1 ,y 1 )isty 1 −y 0 der Anstieg aufder Strecke x 1 − x 0 . Somit ist die Steigung der Geraden durch die Punkte(x 0 ,y 0 ) und (x 1 ,y 1 )m = y 1 − y 0x 1 − x 0.Ist (x, y) ein beliebiger Punkt auf der Geraden, dann wissen wir, dassy − y 0x − x 0= m = y 1 − y 0x 1 − x 0


10.2 Lineare Polynome 135bzw.(y − y 0 )=m(x − x 0 ). (10.2)Dies wird die Punkt-Steigungs-Form der Geraden genannt.Beispiel 10.1. Wir bestimmen die Geradengleichung durch (4, −5) und(2, 3). Die Steigung istm = 3 − (−5)2 − 4= −4und die Gerade ist durch y − 3=−4(x − 2) definiert.Wir können (10.2) in die Form (10.1) bringen, indem wir (10.2) ausmultiplizierenund nach y auflösen. Das führt zur Steigung-Schnitt-Form:y = mx + b (10.3)mit b = y 0 − mx 0 . b wird y − Achsenabschnitt der Geraden genannt, daihr Graph die y-Achse im Punkt (0,b) schneidet. Der Unterschied zwischenden Kurven von y = mx und y = mx + b ist einfach der, dass jeder Punktauf y = mx + b senkrecht um den Abst<strong>and</strong> b vom zugehörigen Punktauf y = mx verschoben ist. Anders ausgedrückt können wir y = mx + bdadurch zeichnen, dass wir zunächst y = mx zeichnen und dann die Geradesenkrecht um b bewegen, wie in Abb. 10.4 dargestellt. Ist b>0, dannbewegen wir die Gerade aufwärts und für b0Beispiel 10.2. Wir bestimmen die Geradengleichung durch (−3, 5) und(4, 1). Die Steigung beträgtm = 1 − 54 − (−3) = −4 7 .


136 10. PolynomfunktionenUm den Schnitt mit der y-Achse zu finden, setzen wir einen der Punkte indie Gleichung y = − 4 7x + b ein, z.B.5=− 4 × (−3) + b,7woraus sich b =23/7 und y = − 4 7 x + 237 ergibt.Eine bekannte Kurve zu verschieben, kann beim Zeichnen sehr nützlichsein. So können wir, wenn wir einmal y =4x gezeichnet haben, schnelldurch Verschieben die Funktionen y =4x−12, y =4x− 1 5, y =4x+1 undy =4x + 113, 45 darstellen.10.3 Parallele GeradenWir wollen jetzt eine Verbindung zum Parallelen Axiom der euklidischenGeometrie ziehen, das wir im Kapitel ”Euklid und Pythagoras“ diskutierten.Zunächst seien y = mx + b 1 und y = mx + b 2 zwei Geraden mitgleicher Steigung m, aber unterschiedlichen y-Achsenabschnitten b 1 undb 2 , so dass die Geraden nicht identisch sind. Die beiden Geraden könnensich niemals schneiden, da es kein x gibt, das mx+b 1 = mx+b 2 erfüllt, dab 1 ≠ b 2 . Wir folgern, dass zwei Geraden mit derselben Steigung im Sinneder euklidischen Geometrie parallel sind.Andererseits schneiden sich zwei Geraden y = m 1 x+b 1 und y = m 2 x+b 2mit verschiedenen Steigungen m 1 ≠ m 2 , da wir die Gleichung m 1 x + b 1 =m 2 x+b 2 eindeutig lösen können mit x =(b 1 −b 2 )/(m 2 −m 1 ). Wir folgern,dass zwei Geraden, repräsentiert durch zwei lineare Polynome y = m 1 x+b 1und y = m 2 x + b 2 , dann und nur dann parallel sind, wenn m 1 = m 2 .Beispiel 10.3. Wir bestimmen die Gleichung der Geraden, die parallel zurGeraden durch (2, 5) und (−11, 6) ist und durch den Punkt (1, 1) geht. DieSteigung der Gleichung muss m =(6−5)/((−11)−2) = −1/13 sein. Dahergilt 1 = −1/13 × 1+b,bzw.b =14/13 und y = − 113 x + 1413 .Beispiel 10.4. Wir können den Schnittpunkt der beiden Geraden y =2x+3und y = −7x−4 bestimmen, indem wir 2x+3=−7x−4 setzen. Additionvon 7x und Subtraktion von 3 auf beiden Seiten liefert 2x +3+7x − 3=−7x − 4+7x − 3 und somit 9x = −7 bzw.x = −7/9. Die y-Koordinatelässt sich aus beiden Gleichungen ermitteln: y =2x +3=2( −79 )+3= 13 9bzw. y = −7x − 4=−7( −79 ) − 4=13 9 .10.4 Senkrechte GeradenAls Nächstes wollen wir zeigen, dass zwei Geraden, die durch zwei linearePolynome y = m 1 x + b 1 und y = m 2 x + b 2 repräsentiert werden, dann und


10.4 Senkrechte Geraden 137nur dann senkrecht zuein<strong>and</strong>er sind, d.h. einen Winkel von 90 ◦ oder 270 ◦einschließen, wenn m 1 m 2 = −1.Da die Werte von b 1 und b 2 verändert werden können, ohne damit dieRichtungen der Geraden zu beeinflussen, genügt es, die Aussage für zweiGerade zu beweisen, die durch den Ursprung gehen. Angenommen, die Liniensind senkrecht zuein<strong>and</strong>er. Dann müssen m 1 und m 2 unterschiedlicheVorzeichen haben, da ansonsten beide Geraden ansteigen oder beide abfallenund dann nicht senkrecht sein können. Nun betrachten wir die inAbb. 10.5 dargestellten Dreiecke. Die Geraden sind genau dann senkrecht,wenn die Winkel Θ 1 und Θ 2 , die die Geraden mit der x-Achse bilden,zusammen 90 ◦ ergeben. Dies kann nur dann der Fall sein, wenn die gezeichnetenDreiecke ähnlich sind. Das bedeutet, dass 1/|m 1 | = |m 2 | ist,Gerade 1m 1θ 1θ 2m 2Gerade 2Abb. 10.5. Ähnliche Dreiecke, definiert durch senkrechte Geraden mit Steigungenm 1 und m 2.DieWinkelΘ 1 und Θ 2 ergebenzusammen90 ◦bzw. |m 1 ||m 2 | = 1. Das ist der Beweis, da m 1 und m 2 unterschiedlicheVorzeichen haben, bzw. m 1 m 2 < 0.Abschließend folgt aus der Annahme m 1 m 2 = −1, dass die zwei Dreieckeähnlich sind, woraus sich Orthogonalität schließen lässt.Beispiel 10.5. Wir können die Gleichung für die Gerade, die senkrecht zurGeraden durch (2, 5) und (−11, 6) ist und durch den Punkt (1, 1) verläuft,bestimmen. Die Steigung der ersten Gerade ist m =(6− 5)/(−11 − 2) =−1/13. Daher ist die Steigung der gesuchten Gerade −1/(−1/13) = 13.Somit ist 1 = 13 × 1+b,mitb = −12 und y =13x − 12.Wir werden auf parallele und orthogonale Geraden in einer etwas allgemeinerenBetrachtung im Kapitel ”analytische Geometrie inR 2 “zurück-


138 10. Polynomfunktionenkommen. Insbesondere werden die bis jetzt ausgeschlossenen Fälle vertikaleroder horizontaler Geraden in natürlicher Weise einbezogen.10.5 Quadratische PolynomeDas allgemeine quadratische Polynom hat die Formf(x)=a 2 x 2 + a 1 x + a 0 ,mit den Konstanten a 2 , a 1 und a 0 , wobei wir a 2 ≠ 0 annehmen (ansonstenfallen wir auf den linearen Fall zurück).Wir zeigen, wie eine derartige Funktion gezeichnet werden kann, wennwir Überlegungen aus dem vorausgegangenen Abschnitt nutzen. Wir beginnenmit dem einfachsten Beispiel einer quadratischen Funktiony = f(x)=x 2 .Der Definitionsbereich von f ist die Menge der rationalen Zahlen, wohingegender Wertebereich nur nicht negative rationale Zahlen enthält. Wirführen hier einige der Werte an:x x 2−3 9−2 4−1 1x x 2−0, 5 0, 25−0, 1 0, 010 0x x 20, 1 0, 010, 5 0, 251 1x x 22 43 94 16Wir können erkennen, dass f(x) =x 2 für x>0 anwächst, d.h.wenn0


10.5 Quadratische Polynome 13910741-4 -3 -2 -1 1 2 3 4-2Abb. 10.6. Graph von f(x) =x 2 . Das Polynom nimmt für x0zuAbb. 10.7. Zeichnungen für vier verschiedene Skalierungen von y = x 2bei |a 2 | < 1. Ist a 2 < 0, dann ist die Zeichnung zusätzlich umgedreht oderan der x-Achse gespiegelt.Die zweite Änderungsmethode, die wir betrachten, ist das Verschieben.Dabei haben wir die Möglichkeit waagrecht, senkrecht oder seitlich zu verschieben.Wir haben dazu Beispiele in Abb. 10.8 dargestellt. Graphen quadratischerFunktionen der Form f(x)=(x+x 0 ) 2 werden durch waagrechtesVerschiebendesGraphenvony = x 2 nach rechts um den Abst<strong>and</strong> |x 0 | erzielt,falls x 0 < 0 und nach links um den Abst<strong>and</strong> x 0 , falls x 0 > 0. Die einfachsteMethode, um herauszufinden, in welche Richtung verschoben wird,ist die, die neue Position des Scheitelpunktes, das ist der kleinste oder derhöchste Wert der quadratischen Funktion, zu berechnen. Bei y =(x − 1) 2ist der kleinste Punkt in x = 1, und daher wird ihr Graph dadurch erhalten,dass der Graph von y = x 2 so verschoben wird, dass der Scheitelpunkt jetztin x = 1 liegt. Bei y =(x +0, 5) 2 ist der Scheitelpunkt in x = −0, 5, undwir erhalten den Graphen durch Verschiebung des Graphen von y = x 2 um0, 5 nach links. Auf der <strong>and</strong>eren Seite erhalten wir die Graphen der Funktioneny = x 2 + d durch senkrechtes Verschieben des Graphen von y = x 2 ,


140 10. Polynomfunktionenwobei wir dabei ähnlich vorgehen wie bei den Geraden und für d>0denGraphen nach oben verschieben und für d


10.5 Quadratische Polynome 141Die Zeichnung der quadratischen Funktion y = ax 2 + bx + c ist derletzte Schritt. Wir beginnen damit, diese in der Form y = a(x−x 0 ) 2 +d zuschreiben. Dann können wir den Graphen einfach zeichnen. Um zu erklärenwie das funktioniert, arbeiten wir ausgehend vom Beispiel y = −2(x+1) 2 +3rückwärts. Ausmultiplizieren lieferty = −2(x 2 +2x +1)+3=−2x 2 − 4x − 2+3=−2x 2 − 4x +1.Ist y = −2x 2 − 4x + 1 gegeben, so führen wir die folgenden Schritte aus:y = −2x 2 − 4x +1= −2(x 2 +2x)+1= −2(x 2 +2x +1− 1) + 1= −2(x 2 +2x +1)+2+1= −2(x +1) 2 +3.Diese Vorgehensweise wird quadratischen Ergänzung genannt. Ist x 2 + xgeben, so addieren wir die Zahl m, sodassx 2 + bx + m sich als Quadrat(x − x 0 ) 2 für ein geeignetes x 0 schreiben lässt. Natürlich müssen wir mwieder abziehen, um die Funktion nicht zu verändern. Deswegen habenwir bei obigem Beispiel 1 innerhalb der Klammer addiert und subtrahiert!Ausmultiplizieren liefertwas übereinstimmen sollte mit(x − x 0 ) 2 = x 2 − 2x 0 x + x 2 0,x 2 + bx + m.Das bedeutet, dass x 0 = −b/2 und m = x 2 0 = b2 /4. Im obigen Beispiel istb =2,x 0 = −1 und m =1.Beispiel 10.7. Wir führen die quadratischen Ergänzung für x 2 − 3x +7durch. Somit ist b = −3, x 0 =3/2 und m =9/4 und wir erhaltenx 2 − 3x +7 = x 2 − 3x + 9 4 − 9 4 +7(= y − 3 ) 2+ 192 4 .Beispiel 10.8. Wir führen die quadratischen Ergänzung für 6y 2 +4y − 2durch. Zunächst formen wir dies um zu6y 2 +4y − 2=6(y 2 + 2 )3 y − 2.


142 10. PolynomfunktionenSomit ist b =2/3, x 0 = −1/3 und m =1/9 und wir erhalten(6y 2 +4y − 2=6 y 2 + 2 3 y + 1 9 − 1 )− 29(=6 y + 1 2−3) 6 9 − 2(=6 y + 1 2−3) 8 3 .Beispiel 10.9. Wir führen die quadratischen Ergänzung für 1 2 x2 − 2x +3durch.12 x2 − 2x +3= 1 2 (x2 − 4x)+3= 1 2 (x2 − 4x +4− 4) + 3= 1 2 (x − 2)2 − 2+3= 1 2 (x − 2)2 +1.10.6 Arithmetik mit PolynomenWir wenden uns jetzt der Untersuchung von Polynomen mit allgemeinemGrad zu, wobei wir mit arithmetischen Eigenschaften beginnen. DenkenSie daran, dass das Ergebnis der Addition, Subtraktion oder Multiplikationzweier rationaler Zahlen wieder eine rationale Zahl ist. In diesem Abschnittwollen wir zeigen, dass die analoge Eigenschaft auch für Polynome gilt.Die Σ-Schreibweise für endliche SummenBevor wir die Arithmetik mit Polynomen untersuchen, wollen wir für denUmgang mit langen endlichen Summen die praktische Schreibweise mit demgriechischen Buchstaben Sigma Σ einführen. Gegeben seien n + 1 beliebigeGrößen a 0 ,a 1 ,...,a n mit tiefgestellten Indizes. Wir schreiben dann dieSummea 0 + a 1 + ···+ a n =Σ n i=0a i .Der Index der Summe ist i, das bei der Summierung alle ganzen Zahlenzwischen der unteren Grenze, die hier 0 ist, und der oberen Grenze,diehiern ist, annimmt.Beispiel 10.10. Die endliche harmonische Reihe der Ordnung n lautetn∑ 1i =1+1 2 + 1 3 + ···1ni=1


10.6 Arithmetik mit Polynomen 143während die endliche geometrische Reihe der Ordnung n mit Faktor rlautet.n∑1+r + r 2 + ···+ r n = r i .i=0Betrachten Sie den Index i als Attrappe, in dem Sinne, dass er beliebigumbenannt werden kann oder die Summation so formuliert werden kann,dass sie bei einer <strong>and</strong>eren ganzen Zahl beginnt.Beispiel 10.11. Die folgenden Summen sind identisch:n∑i=11n i = ∑z=1n−11z = ∑i=0n+31i +1 = ∑i=41i − 3 .Mit Hilfe der Σ-Schreibweise lässt sich das allgemeine Polynom (10.1)komprimierter schreiben als:f(x)=n∑a i x i = a 0 + a 1 x 1 + ···+ a n x n .i=0Beispiel 10.12. Wir könnenschreiben und1+2x +4x 2 +8x 3 + ···+2 20 x 20 =20∑i=02 i x i1 − x + x 2 − x 3 −···−x 99 =99∑i=0(−1) i x i ,da (−1) i =1für i gerade und (−1) i = −1für i ungerade.Addition von PolynomenGegeben seien zwei Polynomeundf(x)=a 0 + a 1 x 1 + a 2 x 2 + ···+ a n x ng(x)=b 0 + b 1 x 1 + b 2 x 2 + ···+ b n x n .Wir können ein neues Polynom (f + g)(x) definieren und es wie folgt alsSumme von f(x) und g(x) verstehen:(f + g)(x)=(b 0 + a 0 )+(b 1 + a 1 )x 1 +(b 2 + a 2 )x 2 + ···(b n + a n )x n .


144 10. PolynomfunktionenSomit können wir das Polynom (f + g)(x) als Summe von f(x) und g(x)durch die Formel(f + g)(x)=f(x)+g(x)definieren. Weiter unten werden wir diese Definition auf allgemeine Funktionenausdehnen.Beispiel 10.13. Ist f(x)=1+x 2 − x 4 +2x 5 und g(x)=33x +7x 2 +2x 5 ,dann ist(f + g)(x)=1+33x +8x 2 − x 4 +4x 5 ,wobei wir natürlich mit ”fehlenden“ Monomen, d.h. Termen mit Koeffizientengleich Null, ”auffüllen“, um diese Definition zu nutzen.Ganz allgemein fügen wir zu einem Polynom g vom Grade mg(x)=m∑b i x i ,i=0” fehlende“ Koeffizienten b m+1 = b m+2 = ··· = b n = 0 hinzu, um dieseszum Polynomn∑f(x)= a i x ivom Grade n (mit den Annahmen, dass a n ≠ 0 und m ≤ n) definitionsgemäßzu addieren.i=0Beispiel 10.14.mit15∑i=0(i +1)x i +a i =30∑i=0x i =30∑i=0a i x i{i +2, 0 ≤ i ≤ 151, 16 ≤ i ≤ 30.Multiplikation eines Polynoms mit einer ZahlGegeben sei das Polynomf(x)=n∑a i x i ,i=0sowie eine Zahl c ∈Q. Wir definieren ein neues Polynom mit der Schreibweise(cf)(x) und bezeichnen es als Produkt von f(x) mit der Zahl c wiefolgt:n∑(cf)(x)= ca i x i .i=0


10.6 Arithmetik mit Polynomen 145Äquivalent können wir (cf)(x) auch definieren durch(cf)(x)=cf(x)=c × f(x).Beispiel 10.15.2, 3 × (1 + 6x − x 7 )=2, 3+13, 8x − 2, 3x 7 .Gleichheit von PolynomenDen obigen Definitionen folgend, sagen wir, dass zwei Polynome f(x) undg(x) gleich sind, falls (f − g)(x) dem Null-Polynom entspricht, bei demalle Koeffizienten Null sind, d.h., dass alle Koeffizienten in f(x) und g(x)gleich sind. Zwei Polynome sind nicht notwendigerweise gleich, weil siezufälligerweise in einem Punkt den gleichen Wert annehmen!Beispiel 10.16. f(x)=x 2 − 4 und g(x)=3x − 6 nehmen beide für x =2den Wert Null an, sind aber nicht gleich.Linearkombination von PolynomenWir können jetzt Polynome kombinieren, indem wir sie addieren und mitrationalen Zahlen multiplizieren, und dadurch wieder neue Polynome erhalten.Sind f 1 (x),f 2 (x),...,f n (x) n gegebene Polynome und c 1 ,c 2 ,...,c nn gegebene Zahlen, dann istf(x)=n∑c m f m (x)m=1ein neues Polynom, das Linearkombination der Polynome f 1 ,f 2 ,...,f n mitden Koeffizienten c 1 ,c 2 ,...,c n genannt wird.Beispiel 10.17. Die Linearkombination von 2x 2 und 4x − 5mitdenKoeffizienten1 und 2 istEin allgemeines Polynom1 ( 2x 2) +2 ( 4x − 5 ) =2x 2 +8x − 10.f(x)=n∑a i x ikann als Linearkombination einzelner Polynome 1, x, x 2 ,...,x n ,dieMonomegenannt werden, formuliert werden, vgl. Abb. 10.11, mit den Koeffizientena 0 ,a 1 ,...,a n . Die Formulierung wird konsistent, wenn wir x 0 =1für alle x setzen.i=0


146 10. PolynomfunktionenWir fassen zusammen:Satz 10.1 Eine Linearkombination von Polynomen ist ein Polynom. Einallgemeines Polynom ist eine Linearkombination von Monomen.Als Folge der oben getroffenen Definitionen erhalten wir einige Regelnfür Linearkombinationen von Polynomen, die Regeln für rationalen Zahlenentsprechen. Sind f, g und h Polynome und c eine rationale Zahl, so istbeispielsweisef + g = g + f, (10.4)(f + g)+h = f +(g + h), (10.5)c(f + g)=cf + cg, (10.6)wobei wir zur Vereinfachung die Variable x weggelassen haben.Multiplikation von PolynomenJetzt wenden wir uns der Multiplikation von Polynomen zu. Sind die zweiPolynome f(x) = ∑ ni=0 a ix i und g(x) = ∑ mj=0 b jx j gegeben, so könnenwir ein neues Polynom, das wir mit (fg)(x) bezeichnen, definieren. Wirbezeichnen es als Produkt von f(x) und g(x) wie folgt:(fg)(x)=f(x)g(x).Wir betrachten zunächst das Produkt zweier Monome f(x) =x j undg(x)=x i , um zu zeigen, dass (fg)(x) tatsächlich ein Polynom ist:(fg)(x)=f(x)g(x)=x j x i = x j × x i = x j+i .Der Grad des Produkts ist gleich der Summe der Ordnungen der Monome.Als Nächstes erhalten wir durch Anwendung des Distributiv-Gesetzes fürein Monom f(x)=x j und ein Polynom g(x)= ∑ ni=0 a ix i(fg)(x)=x j g(x)=a 0 x j + a 1 x j × x + a 2 x j × x 2 + ···+ a n x j × x n= a 0 x j + a 1 x 1+j + a 2 x 2+j + ···+ a n x n+jn∑= a i x i+j ,i=0d.h. ein Polynom der Ordnung n + j.Beispiel 10.18.x 3 (2 − 3x + x 4 +19x 8 )=2x 3 − 3x 4 + x 7 +19x 11 .


10.6 Arithmetik mit Polynomen 147Schließlich erhalten wir für zwei Polynome f(x)= ∑ n∑ i=0 a ix i und g(x)=mj=0 b jx j( n)(∑ m)∑(fg)(x)=f(x)g(x)= a i x i b i x i==⎛n∑⎝ a i x ii=0n∑i=0 j=0m ∑j=0i=0m∑a i b j x i+j ,b j x j ⎞⎠ =i=0⎛n∑⎝a ii=0ein Polynom vom Grad n + m. Hier ein Beispiel:Beispiel 10.19.m ∑j=0b j x i+j ⎞⎠(1 + 2x +3x 2 )(x − x 5 )=1(x − x 5 )+2x(x − x 5 )+3x 2 (x − x 5 )= x − x 5 +2x 2 − 2x 6 +3x 3 − 3x 7= x +2x 2 +3x 3 − x 5 − 2x 6 − 3x 7 .Zusammenfassend:Satz 10.2 Das Produkt eines Polynoms mit Grad n mit einem Polynomvom Grad m ist ein Polynom vom Grad n + m.Die üblichen Kommutativ-, Assoziativ- und Distributiv-Gesetze geltenfürfg = gf, (10.7)(fg)h = f(gh), (10.8)(f + g)h = fh+ gh, (10.9)wobei wir ebenfalls wieder die Variable x weggelassen haben.Produkte zu berechnen ist sehr mühsam, aber es ist glücklicherweise nurselten notwendig. Sind die Polynome sehr kompliziert, können wir sie beispielsweisemit MAPLE berechnen. Einige Beispiele auswendig zu können,mag vorteilhaft sein:(x + a) 2 =(x + a)(x + a)=x 2 +2ax + a 2(x + a)(x − a)=x 2 − a 2(x + a) 3 = x 3 +3ax 2 +3a 2 x + a 3 .


148 10. Polynomfunktionen10.7 Graphen allgemeiner PolynomeEin allgemeines Polynom mit einer Ordnung größer als 2 oder 3 kann eineziemlich komplizierte Funktion sein und es ist schwer, etwas Genaues überihre Graphen zu sagen. In Abb. 10.10 zeigen wir ein Beispiel. Ist der Gradeines Polynoms hoch, dann zeigen die Zeichnungen die Tendenz große ”Ausbuchtungen“zu haben, die es schwierig machen, die Funktion zu zeichnen.Der Wert des Polynoms in Abb. 10.10 ist 987940, 8für x =3.1284-1.05 -0.30 0.45 1.20-4-8Abb. 10.10. Graph von y =1,296+1, 296x −35, 496x 2 −57, 384x 3 +177,457x 4+203, 889x 5 −368, 554x 6 −211, 266x 7 +313, 197x 8 +70, 965x 9 −97, 9x 10 −7, 5x 11+10x 12Auf der <strong>and</strong>eren Seite können wir Monome sehr einfach zeichnen. DieGraphen der Monome vom Grad n ≥ 2 mit geradem Grad n sehen ähnlichaus, wie auch die Graphen aller höheren Polynome mit ungeradem Grad.Einige Beispiele sind in Abb. 10.11 gezeigt. Eine der deutlichsten Eigen-12108642x 618 x 7x 2 -612x 56x 3x 4-1.5 -0.5 0.5 1.5-1.5 -0.5 0.5 1.5-2-12-18Abb. 10.11. Zeichnungen einiger Monome


10.7 Graphen allgemeiner Polynome 149schaften der Graphen von Monomen ist deren Symmetrie. Ist ihr Grad gerade,dann sind die Zeichnungen symmetrisch zur y-Achse, vgl. Abb. 10.12.Das bedeutet, dass der Wert der Monome für x und −x der gleiche ist,oder <strong>and</strong>ers formuliert x m =(−x) m für m gerade. Ist der Grad ungerade,dann sind die Zeichnungen punktsymmetrisch zum Ursprung. Andersformuliert ist der Funktionswert für x negativ zum Funktionswert für −x,bzw. (−x) m = −x m für m ungerade.ygeradexyxungerade-xx-xxAbb. 10.12. Symmetrien bei Monomen gerader und ungerader OrdnungWir können die Überlegungen zur Skalierung und Verschiebung auf Graphenvon Funktionen der Form y = a(x − x 0 ) m + d übertragen.Beispiel 10.20. Wir zeigen in Abb. 10.13 y = −0, 5(x − 1) 3 − 6, indemwir systematisch verschieben und skalieren. Glücklicherweise gibt es keineProzedur wie die quadratische Ergänzung für Monome höherer Ordnung.27x 313.5(x-1) 3-1 1 2-13.5-27-.5(x-1) 3-.5(x-1) 3 -6Abb. 10.13. Verfahren zur Zeichnung von y = −0, 5(x − 1) 3 − 6


150 10. Polynomfunktionen10.8 Stückweise definierte PolynomfunktionenWir begannen dieses Kapitel mit der Erklärung, dass Polynome Bausteinevon Funktionen sind. Eine wichtige Klasse von Funktionen, die aus Polynomenkonstruiert werden, sind die stückweise definierten Polynome. Dassind Funktionen, die auf Intervallen im Definitionsbereich Polynomen entsprechen.Ein Beispiel kennen wir schon, nämlich{x, x ≥ 0|x| =−x, x < 0.Die Funktion |x| sieht für x ≥ 0auswiey = x und für x


Aufgaben zu Kapitel 10 151Aufgaben zu Kapitel 1010.1. Bestimmen Sie die Punkt-Steigung-Form der Geraden durch die folgendenPunktepaare. Zeichnen Sie jeweils die Geraden.(a) (1,3) & (2, 7)(b) (−4,2) & (−6,3)(c) (3,7) & (5, 7) (d) (3,5;1, 5) & (2, 1;11, 8)(e) (−3,2) & (−3,3)(f) (2, −1) & (4, −7).10.2. Bestimmen Sie die Steigung-Schnitt-Form der Geraden durch die folgendenPunktepaare. Zeichnen Sie jeweils die Geraden.(a) (4, −6) & (14, 2)(b) (3, −2) & (−1,4)(c) (13,4) & (13,89) (d) (4,4) & (6, 4)(e) (−0,2;9) & (−0,4;7) (f) (−1, −1) & (−4, 7).10.3. Geben Sie eine Formel für den Schnitt mit der x-Achse einer Geraden derForm y = mx + b in Abhängigkeit von m und b an.10.4. Zeichnen Sie die Geraden y = 1 2 x, y = 1 2 x − 2, y = 1 2 x + 4 und y = 1 2 x +1durch Verschieben.10.5. Sind die Geraden 2 − y =7(4− x) und y =7x − 13 parallel?10.6. Sind die Geraden y = 3 11 x − 4 und y =13− 11 3senkrecht zuein<strong>and</strong>er?10.7. Finden Sie den Schnittpunkt für die folgenden Geradenpaare:(a) y =3x + 2 und y = −4x − 2,(b) y − 5=7(x − 1) und y +3=−4(x − 9).10.8. Bestimmen Sie die Geraden durch den Punkt (3,0), die (a) parallel und(b) senkrecht zur Geraden durch (9,4) und (−1, 3) sind.10.9. Bestimmen Sie die Geraden durch den Punkt (1,2), die (a) parallel und(b) senkrecht zur Geraden durch (−2,7) und (8, 8) sind.10.10. Zeigen Sie, dass f(x)=x 2 für x


152 10. Polynomfunktionen10.14. Zeichnen Sie die folgenden quadratischen Funktionen auf −3 ≤ x ≤ 3:(a) − 1 2 (x − 1)2 +2,(b)2(x +2) 2 − 5 und (c) 1 3 (x − 3)2 − 1.10.15. Führen Sie die quadratische Ergänzung für die folgenden quadratischenFunktionen durch und zeichnen Sie sie auf −3 ≤ x ≤ 3: (a) x 2 +4x +5,(b) 2x 2 − 2x − 1 2 und (c) −1 3 x2 +2x − 1.10.16. Schreiben Sie die folgenden endlichen Summen in der Summenschreibweise.Prüfen Sie, ob die Anfangs- und die Endwerte richtig gewählt sind!(a) 1 + 1 4 + 1 9 + 1 16 + ···+ 1n 2 (b) −1+ 1 4 − 1 9 + 1 16 −···± 1n 2(c) 1 + 12×3 + 13×4 + ···+ 1n×(n+1)(d)1+3+5+7+···+2n +1(e) x 4 + x 5 + ···+ x n (f) 1 + x 2 + x 4 + x 6 + ···+ x 2n .10.17. Schreiben Sie die endliche Summe È ni=1 i2 um, so dass (a) i mit −1beginnt, (b) i mit 15 beginnt, (c) der Koeffizient die Form (i +4) 2 hat und (d) imit n + 7 endet.10.18. Gegeben seien f 1(x) =−4+6x +7x 3 , f 2(x) =2x 2 − x 3 +4x 5 undf 3(x)=2−x 4 . Berechnen Sie die folgenden Polynome: (a) f 1 −4f 2,(b)3f 2 −12f 1,(c) f 2 + f 1 + f 3,(d)f 2f 1,(e)f 1f 3,(f)f 2f 3,(g)f 1f 3 − f 2,(h)(f 1 + f 2)f 3,(i)f 1f 2f 3.10.19. Berechnen Sie für a konstant (a) (x + a) 2 ,(b)(x + a) 3 ,(c)(x − a) 3 und(d) (x + a) 4 .10.20. Berechnen Sie f 1f 2 für f 1(x)= È 8i=0 i2 x i und f 2(x)= È 11j=010.21. Zeichnen Sie die Funktionf(x) = 360x − 942x 2 + 949x 3 − 480x 4 + 130x 5 − 18x 6 + x 71j+1 xj .mit MATLAB oder MAPLE .Wählen Sie ein gutes Intervall für die Zeichnungdurch Ausprobieren. Sie sollten Zeichnungen für verschiedene Intervalle anfertigenund bei −0,5 ≤ x ≤ 0, 5 beginnen und langsam vergrößern.10.22. (a) Zeigen Sie, dass das Monom x 3 für alle x anwächst. (b) Zeigen Sie,dass das Monom x 4 für x0 ansteigt.10.23. Zeichnen Sie die folgenden Monome auf −3 ≤ x ≤ 3: (a) x 3 ,(b)x 4 und(c) x 5 .10.24. Zeichnen Sie die folgenden Polynome auf −3 ≤ x ≤ 3:(a) 1 3 (x +2)3 − 2 (b)2(x − 1) 4 − 13 (c) (x +1) 5 − 1.10.25. Zeichnen Sie die folgenden stückweise definierten Polynome auf −2 ≤x ≤ 2:−1 − x, −2 ≤ x ≤−1, 1, −2 ≤ x ≤−1,(a) f(x)= x2 1+x, −1


11Kombinationen von FunktionenUnd er machte einen tiefen Seufzer und gab sich große Mühe Eulezuzuhören. (Pu-Bär)11.1 EinleitungIn diesem Kapitel betrachten wir verschiedene Methoden, um durch Kombinationalter Funktionen neue zu erzeugen. Wir versuchen oft komplizierteFunktionen als Kombinationen einfacherer bekannter Funktionen zu beschreiben.Im vorangegangen Kapitel sahen wir, wie allgemeine Polynomedurch Addition des Vielfachen von Monomen, d.h. durch Linearkombinationenvon Monomen, erzeugt werden können. In diesem Kapitel betrachtenwir zunächst Linearkombinationen beliebiger Funktionen, dann Multiplikationund Division und schließlich zusammengesetzte Funktionen.In vielen Bereichen ist die Kombination einfacher Dinge zu komplizierterenGebilden ein grundlegender Best<strong>and</strong>teil. Ein gutes Beispiel dafür ist dieMusik: Akkorde und Harmonien werden aus einzelnen Tönen aufgebaut,komplizierte Rhythmen kann man durch Überlagerung einfacher Grundrhythmenerhalten, einzelne Instrumenten bilden zusammen ein Orchester.Ein <strong>and</strong>eres Beispiel ist ein großartiges Essen, das aus Vorspeise, Hauptgericht,Dessert und Kaffee besteht und zusammen mit Aperitif, Wein undKognak beliebig kombiniert und variiert werden kann. Zusätzlich ist jedesGericht für sich eine Kombination der Zutaten wie Rindfleisch, Möhren undKartoffeln.


154 11. Kombinationen von Funktionen11.2 Summe zweier Funktionen und Produkteiner Funktion mit einer ZahlGegeben seien zwei Funktionen f 1 : D f1 →Qund f 2 : D f2 →Q. Wirdefinieren eine neue Funktion (f 1 + f 2 )(x) und nennen sie die Summe vonf 1 (x) und f 2 (x) mit folgender Vorschrift:(f 1 + f 2 )(x)=f 1 (x)+f 2 (x), für x ∈ D f1 ∩ D f2 .Natürlich gehen wir davon aus, dass x sowohl zu D f1 als auch zu D f2 gehört,damit f 1 (x) und f 2 (x) wohl definiert sind. So können wir auch schreibenD f1+f 2= D f1 ∩ D f2 .Sei eine Funktion f : D f →Qund eine Zahl c ∈Qgegeben. Wirdefinieren eine neue Funktion (cf)(x) und nennen sie das Produkt von f(x)und c mit folgender Vorschrift:(cf)(x)=cf(x) für x ∈ D f .Der Definitionsbereich von cf entspricht dem von f, d.h. D cf = D f .Die Definitionen einer Summe von Funktionen und einem Produkt einerFunktion mit einer Zahl sind konsistent mit den oben festgelegten entsprechendenDefinitionen für Polynome.Beispiel 11.1. Die Funktion f(x)=x 3 +1/x, definiert auf D f = {x ∈Q :x ≠0}, ist die Summe der Funktionen f 1 (x) =x 3 mit DefinitionsbereichD f1 =Q und f 2 (x)=1/x mit Definitionsbereich D f2 = {x ∈Q : x ≠0}.Die Funktion f(x)=x 2 +2 x definiert aufZist die Summe von x 2 definiertaufQund 2 x definiert aufZ.11.3 Linearkombination von FunktionenGegeben seien n Funktionen f 1 : D f1 →Q,...,f n : D fn →Q und Zahlenc 1 ,...,c n . Wir definieren die Linearkombination von f 1 ,...,f n mit denKoeffizienten c 1 ,...,c n ,diewir(c 1 f 1 +···+c n f n )(x) bezeichnen und zwarmit folgender Vorschrift:(c 1 f 1 + ···+ c n f n )(x)=c 1 f 1 (x)+···+ c n f n (x).Der Definitionsbereich D c1f 1+···+c nf nder Linearkombination c 1 f 1 + ···+c n f n ist die Schnittmenge der Definitionsbereiche D f1 ,...,D fn .Beispiel 11.2. Der Definitionsbereich der Linearkombinationaus { 1 x , x1+x , 1+x2+x− 1 x +2 x1+x +61+x 2+x} ist {x ∈Q : x ≠0,x≠ −1,x≠ −2}.


11.4 Multiplikation und Division von Funktionen 155Die Summenschreibweise ist nützlich, um allgemeine Linearkombinationenzu formulieren.Beispiel 11.3. Die Linearkombination aus { 1 x ,..., 1x n } gegeben durch2x + 4 x + 8 n2n+ ···+x x n = ∑ 2 ix ii=1hat den Definitionsbereich {x ∈Q : x ≠0}.11.4 Multiplikation und Division von FunktionenWir multiplizieren Funktionen so, wie wir bei der Multiplikation von Polynomenvorgegangen sind. Gegeben seien zwei Funktionen f 1 : D f1 →Qund f 2 : D f2 →Q. Wir definieren das Produkt der Funktionen (f 1 f 2 )(x)durch(f 1 f 2 )(x)=f 1 (x)f 2 (x) für x ∈ D f1 ∩ D f2und den Quotienten der Funktionen durch(f 1 /f 2 )(x)= f 1(x)= f 1(x)f 2 f 2 (x)wobei wir natürlich annehmen, dass f 2 (x) ≠0ist.Beispiel 11.4. Die Funktionfür x ∈ D f1 ∩ D f2 ,f(x)=(x 2 − 3) 3 (x 6 − 1 x − 3 )mit D f = {x ∈ Q : x ≠0} ist das Produkt der Funktionen f 1 (x) =(x 2 − 3) 3 und f 2 (x) =x 6 − 1/x − 3. Die Funktion f(x) =x 2 2 x ist dasProdukt von x 2 und 2 x .Beispiel 11.5. Der Definitionsbereich von1+1/(x +3)2x − 5ist die Schnittmenge von {x ∈Q : x ≠ −3} und {x ∈Q : x ≠5/2}, bzw.{x ∈Q : x ≠ −3, 5/2}.11.5 Rationale FunktionenDer Quotient f 1 /f 2 zweier Polynome f 1 (x) und f 2 (x)wirdrationale Funktiongenannt. Dies ist das Analogon zu den rationalen Zahlen, die als Quotientzweier ganzer Zahlen definiert sind.


156 11. Kombinationen von FunktionenBeispiel 11.6. Die Funktion f(x)=1/x ist eine rationale Funktion definiertauf {x ∈Q : x ≠0}. Die Funktionf(x)= (x3 − 6x +1)(x 11 − 5x 6 )(x 4 − 1)(x +2)(x − 5)ist eine rationale Funktion definiert auf {x ∈Q : x ≠1, −1, −2, 5}.In einem der Beispiele oben haben wir gesehen, dass x − 3 Teiler ist vonx 2 − 2x − 3, da x 2 − 2x − 3=(x − 3)(x +1),d.h.x 2 − 2x − 3x − 3= x +1.Ganz ähnlich lässt sich eine rationale Zahl p/q manchmal zu einer ganzenZahl vereinfachen, falls q Teiler von p ohne Rest ist. Wir können mit derSchuldivision erkennen, ob dies stimmt. Es zeigt sich, dass die Schuldivisionauch bei Polynomen benutzt werden kann. Bei der Schuldivision gleichenwir in jedem Schritt die führende Ziffer des Nenners gegen den Rest ab. Beider Division von Polynomen schreiben wir diese als Linearkombination vonMonomen, angefangen mit dem Monom höchster Ordnung, und gleichennach und nach die Koeffizienten der Monome ab.Beispiel 11.7. Hier sind einige Beispiele für Polynomdivisionen gegeben.In Abb. 11.1 geben wir ein Beispiel ohne Rest. Wir folgern, dassx 3 +4x 2 − 2x +3x − 1= x 2 +5x +3.Abb. 11.1. Ein Beispiel für eine Polynomdivision ohne RestIn Abb. 11.2 geben wir ein Beispiel mit Rest, d.h. wir führen die Divisionsolange durch, bis der übrig gebliebene Zähler einen kleineren Grad besitzt


x 2 +x-311.6 Zusammengesetzte Funktionen 1572x 2 - 2x +152x 4 + 0x 3 + 7x 2 - 8x + 32x 4 + 2x 3 - 6x 2- 2x 3 +13x 2 - 8x- 2x 3 - 2x 2 + 6x15x 2 - 14x + 315x 2 + 15x -45-29x +48Abb. 11.2. Ein Beispiel für eine Polynomdivision mit Restals der Nenner. Beachten Sie, dass in unserem Beispiel im Nenner ein Ausdruck”fehlt“, den wir mit Null als Koeffizient auffüllen, um die Divisioneinfacher zu machen. Wir fassen zusammen, dass2x 4 +7x 2 − 8x +3x 2 + x − 3=2x 2 − 2x +15+−29x +48x 2 + x − 3 .Wir werden uns jetzt dem Spezialfall zuwenden, dass der Nenner dieForm x − ¯x mit Grad eins hat, wobei ¯x fest vorgegeben ist. Das führt zuf(x)=(x − ¯x)g(x)+r(x), (11.1)wobei das Restpolynom r(x) vom Grad Null sein muss, d.h. konstant.Das folgende Ergebnis ist besonders interessant. Ist f(x) ein Polynomvom Grade n und f(¯x) = 0, dann ist x − ¯x ein Teiler von f(x), d.h. dieDivision von f(x) mitx − ¯x ergibtf(x)=(x − ¯x)g(x)+r(x), (11.2)wobei r(x) ≡ 0. Andererseits ist für r(x) ≡ 0auchf(¯x) =0.Umdieszu beweisen, bemerken wir, dass der Grad von r(x) kleiner als der Gradvon x − ¯x sein muss, d.h. r(x) ist tatsächlich eine Konstante. Weiter istr(¯x)=0,daf(¯x) = 0. D.h. aber, dass r(x) eine Konstante ist, die Null ist,d.h. r(x) ≡ 0. Somit haben wir folgenden Satz bewiesen:Satz 11.1 Ist ¯x eine Nullstelle des Polynoms f(x), d.h. gilt f(¯x)=0, dannlässt sich f(x) in die Form f(x)=(x− ¯x)g(x) zerlegen, wobei g(x) ein Polynomist, das eine Ordnung kleiner ist als der Grad von f(x). Der Faktorg(x) kann durch Polynomdivision von f(x) mit x − ¯x ermittelt werden.11.6 Zusammengesetzte FunktionenAus zwei gegebenen Funktionen f 1 und f 2 können wir eine neue Funktionf definieren, indem wir zunächst f 1 auf ein Argument anwenden und dann


158 11. Kombinationen von Funktionenf 2 auf das Ergebnis, d.h.f(x)=f 2 (f 1 (x)).Wir sagen, dass f die zusammengesetzte Funktion von f 2 und f 1 ist undschreiben f = f 2 ◦ f 1 , d.h.(f 2 ◦ f 1 )(x)=f 2 (f 1 (x)).Wir veranschaulichen diese Definition in Abb. 11.3.f 1f2xD f1f 1(x)D f2f 2(f 1(x))Abb. 11.3. Veranschaulichung der zusammengesetzten Funktion f 2 ◦ f 1Beispiel 11.8. Ist f 1 (x) =x 2 und f 2 (x) =x +1,dannistf 1 ◦ f 2 =f 1 (f 2 (x)) = (x +1) 2 , wohingegen f 2 ◦ f 1 = f 2 (f 1 (x)) = x 2 +1ist.Dieses Beispiel veranschaulicht die allgemeine Regel, dass f 2 ◦ f 1 ≠ f 1 ◦ f 2 .Die Bestimmung des Definitionsbereichs für die zusammengesetzte Funktionf 2 ◦ f 1 kann kompliziert sein. Natürlich müssen wir zur Berechnungvon f 2 (f 1 (x)) sicherstellen, dass x im Definitionsbereich von f 1 (x)ist,sonstwäre f 1 (x) undefiniert. Da wir f 2 auf das Resultat anwenden, muss f 1 (x)einen Wert ergeben, der im Definitionsbereich von f 2 liegt. Daher ist derDefinitionsbereich von f 2 ◦f 1 die Menge von Punkten x in D f1 für die f 1 (x)in D f2 liegt.Beispiel 11.9. Sei f 1 (x) =3+1/x 2 und f 2 (x) =1/(x − 4). Dann istD f1 = {x ∈Q : x ≠0} und D f2 = {x ∈Q : x ≠4}. Daher müssen wir beider Berechnung von f 2 ◦ f 1 vermeiden, dass 3 + 1/x 2 =4,bzw.1/x 2 =1und somit x =1oderx = −1. Wir folgern, dass D f2◦f 1= {x ∈Q : x ≠0, 1, −1}.


Aufgaben zu Kapitel 11 159Aufgaben zu Kapitel 1111.1. Bestimmen Sie den Definitionsbereich folgender Funktionen(a) 3(x − 4) 3 +2x 2 +4x3x − 1 + 6(d) (2x − 3) 2 x(x − 1) 2 4x +6(b) 2 + 4 x − 6x +4(x − 2)(2x +1) (c) x 3 1+ 1 x(e)(f)6x − 1(2 − 3x)(4 + x)4x +2 + 6x 2 +3x +2 .11.2. Schreiben Sie die folgenden Linearkombinationen in der Summenschreibweiseund bestimmen Sie die Definitionsbereiche des Ergebnisses.(a) 2x(x − 1) + 3x 2 (x − 1) 2 +4x 3 (x − 1) 3 + ···+ 100x 101 (x − 1) 101(b)2x − 1 + 4x − 2 + 8 8192+ ···+x − 3 x − 13 .11.3. (a) Sei f(x)=ax+b,wobeia und b Zahlen sind. Zeigen Sie, dass f(x+y)=f(x)+f(y) für alle Zahlen x und y gilt. (b) Sei g(x) =x 2 .ZeigenSie,dassg(x + y) ≠ g(x)+g(y), außer für einige besondere Werte von x und y.11.4. Wenden Sie Polynomdivision für die folgenden rationalen Funktionen an,und zeigen Sie, dass der Nenner den Zähler genau teilt, bzw. bestimmen Sie denRest.(a) x2 +2x − 3x − 1(c) 4x2 +2x − 1x +6(e) 5x3 +6x 2 − 42x 2 +4x +1(g) x8 − 1x 3 − 1(b) 2x2 − 7x − 42x +1(d) x3 +3x 2 +3x +2x +2(f) x4 − 4x 2 − 5x − 4x 2 + x +1(h) xn − 1x − 1 , n in Æ .11.5. Seien f 1(x)=3x −5, f 2(x)=2x 2 +1 und f 3(x)=4/x gegeben. SchreibenSie Gleichungen für die folgenden Funktionen(a) f 1 ◦ f 2 (b) f 2 ◦ f 3 (c) f 3 ◦ f 1 (d) f 1 ◦ f 2 ◦ f 3 .11.6. Zeigen Sie für f 1(x)=4x + 2 und f 2(x)=x/x 2 ,dassf 2 ◦ f 1 ≠ f 1 ◦ f 2.11.7. Sei f 1(x) =ax + b und f 2(x) =cx + d, wobeia, b, c und d rationaleZahlen sind. Stellen Sie eine Bedingung an die Zahlen a, b, c und d auf, so dassf 2 ◦ f 1 = f 1 ◦ f 2 gilt, und geben Sie ein Beispiel an.


160 11. Kombinationen von Funktionen11.8. Bestimmen Sie den Definitionsbereich von f 2 ◦f 1 für die gegebenen Funktionenf 1 und f 2(a) f 1(x)=4− 1 x und f2(x)= 1 x 2(b) f 1(x)=1+1− 4 und f2(x)=x .(x − 1)2x


12Lipschitz-StetigkeitInfinitesimalrechnung brauchte die Stetigkeit, und Stetigkeit solltedas unendlich Kleine brauchen, aber niem<strong>and</strong> konnte entdecken, wasdieses unendlich Kleine sein könnte. (Russell)12.1 EinleitungZeichnen wir die Funktion f(x) einer rationalen Variablen x, sogewährenwir einen Vertrauensvorschuss, indem wir annehmen, dass die Funktionswertef(x) sich ”sanft“ oder ”stetig“ zwischen den ausgewählten Punkten xändern, so dass wir den Graphen der Funktion zeichnen können, ohne denBleistift anzuheben. Insbesondere gehen wir davon aus, dass die Funktionswertef(x) keine unverhofften Sprünge für irgendwelche x machen. Wirnehmen somit an, dass die Funktionswerte f(x) sich nur um kleine Beträgeändern, wenn wir x um kleine Werte verändern. Ein grundlegendesProblem der Infinitesimalrechnung ist die Frage, wie viel sich die Funktionswertef(x)verändern, wenn x sich ändert,d.h.den ”Grad an Stetigkeit“ füreine Funktion zu messen. In diesem Kapitel gehen wir dieses grundlegendeProblem mit dem Begriff der Lipschitz-Stetigkeit an, die eine wichtige Rollebei der Variante der Infinitesimalrechnung, die in diesem Buch vorgestelltwird, spielt.Ungleichheiten (< und ≤) und Absolutwerte (|·|) spielen eine große Rollein diesem Kapitel, so dass eine Wiederholung der Regeln für den Umgangmit diesen Symbolen im Kapitel ”Rationale Zahlen“ durchaus vorteilhaftsein kann.


162 12. Lipschitz-StetigkeitAbb. 12.1. Rudolph Lipschitz (1832–1903), Erfinder der Lipschitz-Stetigkeit:In der Tat, ich habe eine sehr nette Möglichkeit gefunden, um Stetigkeit auszudrücken..”.“12.2 Lipschitz-Stetigkeit einer linearen FunktionWir beginnen mit dem Verhalten eines linearen Polynoms. Der Wert eineskonstanten Polynoms ändert sich nicht mit dem Argument x, so dass linearePolynome die ersten interessanten Beispiele sind. Die lineare Funktion seif(x)=mx + b,mitm ∈Qund b ∈Q. Seien f(x 1 )=mx 1 + b und f(x 2 )=mx 2 + b die Funktionswerte bei x = x 1 und x = x 2 .DieVeränderung imArgument ist folglich |x 2 − x 1 | und für die entsprechende Veränderung imResultat |f(x 2 ) − f(x 1 )| ergibt sich:|f(x 2 ) − f(x 1 )| = |(mx 2 + b) − (mx 1 + b)| = |m(x 2 − x 1 )| = |m||x 2 − x 1 |.(12.1)Anders formuliert, ist die Veränderung im Absolutbetrag der Funktionswerte|f(x 2 ) −f(x 1 )| proportional zum Betrag der Änderung in den Argumenten|x 2 −x 1 |, wobei die Proportionalitätskonstante gleich der Steigung|m| ist. Insbesondere bedeutet das, dass wir die Änderung beim Resultatbeliebig klein machen können, indem wir die Änderung bei den Argumentenklein machen, was unserer Vorstellung nahe kommt, dass eine lineareFunktion sich stetig ändert.Beispiel 12.1. f(x) =2x beschreibe die Kilometerzahl für ein ”hin undzurück“ Fahrradrennen, mit x Kilometern in einer Richtung. Um die Gesamtstreckeum 4 Kilometer zu verlängern, verlängern wir die einfacheStrecke x um 4/2 = 2 Kilometer. Um die Gesamtstrecke um 0, 01 Kilometerzu verlängern, verlängern wir die einfache Strecke x um 0, 005 Kilometer.


12.3 Definition der Lipschitz-Stetigkeit 163Wir machen nun eine wichtige Beobachtung: Die Steigung m der linearenFunktion f(x) =mx + b bestimmt, wie sehr der Funktionswert sichverändert, wenn x sich ändert. Je größer |m| ist, d.h. je steiler die Geradeist, desto stärker ändert sich der Funktionswert bei einer bestimmtenÄnderung in den Argumenten, wie wir in Abb. 12.2 veranschaulichen.y =3xy =1/2xAbb. 12.2. Die Funktionswerte der beiden Funktionen ändern sich um verschiedeneWerte bei vorgegebener Änderung in den ArgumentenBeispiel 12.2. Gegeben seien f 1 (x)=4x+1 und f 2 (x) = 100x−5. Um denFunktionswert von f 1 (x)inx um einen Betrag von 0, 01 anzuheben, müssenwir den x-Wert um 0, 01/4=0, 0025 verändern. Die gleiche Veränderungim Funktionswert von f 2 (x) inx erhalten wir bereits mit einer Verändungvon x um 0, 01/100 = 0, 0001.12.3 Definition der Lipschitz-StetigkeitJetzt sind wir bereit, den Begriff der Lipschitz-Stetigkeit einzuführen. Erwurde entworfen, um Änderungen in Funktionswerten relativ zu Änderungenin der unabhängigen Variablen für eine allgemeine Funktion f : I →Q,wobei I eine Teilmenge der rationalen Zahlen ist, zu messen. Üblicherweiseist I ein Intervall rationaler Zahlen {x ∈Q : a ≤ x ≤ b}. Sindx 1und x 2 Zahlen in I, dannist|x 2 − x 1 | die Änderung im Argument und|f(x 2 ) − f(x 1 )| die entsprechende Änderung im Resultat. Wir sagen, dassf auf I Lipschitz-stetig ist zur Lipschitz-Konstanten L f , falls es eine (notwendigerweisenicht negative) Konstante L f gibt, so dass|f(x 1 ) − f(x 2 )|≤L f |x 1 − x 2 | für alle x 1 ,x 2 ∈ I. (12.2)


164 12. Lipschitz-StetigkeitWie durch die Schreibweise angedeutet, hängt die Lipschitz-Konstante L fvon der Funktion f ab und kann daher für eine Funktion klein sein und füreine <strong>and</strong>ere groß. Ist L f klein, dann kann f(x) sich nur geringfügig bei einerkleinen Veränderung in x ändern, wohingegen sich f(x) bei einer kleinenVeränderung in x viel ändern kann, falls die Lipschitz-Konstante groß ist.Nochmals: L f kann in Abhängigkeit von der Funktion f klein oder großsein.Beispiel 12.3. Eine lineare Funktion f(x) =mx + b ist auf der Gesamtmengeder rationalen ZahlenQLipschitz-stetig zur Lipschitz-KonstantenL f = |m|.Beispiel 12.4. Wir zeigen, dass f(x)=x 2 auf dem Intervall I =[−2, 2] zurLipschitz-Konstanten L f = 4 Lipschitz-stetig ist. Dazu wählen wir zweiZahlen x 1 und x 2 innerhalb [−2, 2]. Die zugehörige Veränderung bei denFunktionswerten ist|f(x 2 ) − f(x 1 )| = |x 2 2 − x2 1 |.Nun suchen wir eine Abschätzung in Abhängigkeit von den Argumenten|x 2 − x 1 |. Mit den Regeln über Produkte von Polynomen aus Abschnitt10.6 erhalten wir|f(x 2 ) − f(x 1 )| = |x 2 + x 1 ||x 2 − x 1 |. (12.3)Wir haben zwar die gewünschte Differenz auf der rechten Seite, sie wirdaber mit einem Faktor, der von x 1 und x 2 abhängt, multipliziert. Im Gegensatzdazu besitzt die vergleichbare Beziehung (12.1) für lineare Funktioneneinen konstanten Faktor, nämlich |m|. An dieser Stelle müssen wir die Tatsacheausnutzen, dass x 1 und x 2 im Intervall [−2, 2] liegen, was bedeutet,dass mit der Dreiecksungleichunggilt. Daraus folgern wir, dass|x 2 + x 1 |≤|x 2 | + |x 1 |≤2+2=4|f(x 2 ) − f(x 1 )|≤4|x 2 − x 1 |für alle x 1 und x 2 im Intervall [−2, 2].Lipschitz-Stetigkeit erlaubt eine quantitative Abschätzung für das stetigeVerhalten einer Funktion mit Hilfe der Lipschitz-Konstanten L f .Wirwiederholen: Ist L f mäßig groß, dann ergeben kleine Veränderungen imArgument x kleine Änderungen im Resultat der Funktion f(x). Aber einegroße Lipschitz-Konstante bedeutet, dass die Funktionswerte von f(x)große Veränderungen zeigen können, wenn sich das Argument x nur umeinen kleinen Wert verändert.


12.3 Definition der Lipschitz-Stetigkeit 165Es ist jedoch wichtig festzustellen, dass der Definition der Lipschitz-Stetigkeit (12.2) ein gewisses Maß an Ungenauigkeit innewohnt und wirmüssen umsichtig sein, wenn wir in Fällen, wo die Lipschitz-Konstantegroß ist, Schlüsse ziehen. Der Grund liegt darin, dass (12.2) nur eine obereAbschätzung gibt, um wie viel sich die Funktion verändert, und dietatsächliche Veränderung kann viel kleiner sein als durch die Konstanteangedeutet.Beispiel 12.5. Wir wissen von Beispiel 12.4, dass f(x)=x 2 zur Lipschitz-Konstanten L f = 4 auf dem Intervall I =[−2, 2] Lipschitz-stetig ist. Sieist auch Lipschitz-stetig zur Lipschitz-Konstanten L f = 121, da|f(x 2 ) − f(x 1 )|≤4|x 2 − x 1 |≤121|x 2 − x 1 |.Aber der zweite Wert von L f überschätzt die Änderungen in f bei Weitem,wobei der Wert L f = 4 gerade richtig ist, wenn x 1 und x 2 nahe bei 2 liegen,da 2 2 − 1, 9 2 =0, 39 = 3, 9 × (2 − 1, 9) und 3, 9 ≈ 4.Um die Lipschitz-Konstante zu bestimmen, müssen wir Abschätzungenvornehmen und das Ergebnis kann stark davon abhängen, wie schwer dieAbschätzungen zu berechnen sind und wie geschickt wir bei Abschätzungensind.Es ist auch wichtig festzustellen, dass die Größe und die Lage des Intervallsfür die Definition wichtig ist, und dass wir davon ausgehen können,für ein <strong>and</strong>eres Intervall eine unterschiedliche Lipschitz-Konstante L f zuerhalten.Beispiel 12.6. Wir zeigen, dass f(x) =x 2 auf dem Intervall I =[2, 4]Lipschitz-stetig ist zur Lipschitz-Konstanten L f = 8. Wir beginnen bei(12.3) und erhalten für x 1 und x 2 in [2, 4]so dassfür alle x 1 und x 2 in [2, 4] gilt.|x 2 + x 1 |≤|x 2 | + |x 1 |≤4+4=8,|f(x 2 ) − f(x 1 )|≤8|x 2 − x 1 |Der Grund dafür, dass die Lipschitz-Konstante im zweiten Beispiel größerist, erkennt man am Graphen in Abb. 12.3, in der wir Veränderungen in f,die zu gleichen Abständen in x in der Nähe von x = 2 und x =4gehören,dargestellt haben. Da f(x)=x 2 in der Nähe von x = 4 steiler ist, verändertsich f bei einer Änderung im Argument in der Nähe von x =4stärker.Beispiel 12.7. f(x) =x 2 ist auf dem Intervall I =[−8, 8] Lipschitz-stetigzur Lipschitz-Konstanten L f = 16 und auf I =[−400, 200] zu L f = 800.Bei allen Beispielen zu f(x)=x 2 benutzen wir die Tatsache, dass das betrachteteIntervall endlich ist. Eine Menge rationaler Zahlen I ist beschränktdurch a, wenn |x|≤a für alle x in I,wobeia eine (endliche) rationale Zahlist.


166 12. Lipschitz-Stetigkeit16−4 −2 0 2 4Abb. 12.3. Änderungen in f(x)=x 2 für identische Änderungen in x nahe beix = 2 und x =4Beispiel 12.8. Die Menge der rationalen Zahlen I =[−1, 500] ist beschränkt,jedoch nicht die Menge der geraden ganzen Zahlen.Während lineare Funktionen Lipschitz-stetig auf der unbeschränkte MengeQ sind, sind nicht lineare Funktionen im allgemeinen nur auf einer beschränktenMenge Lipschitz-stetig.Beispiel 12.9. Die Funktion f(x) =x 2 ist nicht Lipschitz-stetig auf derMenge der rationalen ZahlenQ. Das folgt aus (12.3), da |x 1 + x 2 | beliebiggroß werden kann, wenn man x 1 und x 2 frei inQwählt. Somit ist es nichtmöglich, eine Konstante L f zu finden, dass|f(x 2 ) − f(x 1 )| = |x 2 + x 1 ||x 2 − x 1 |≤L f |x 2 − x 1 |für alle x 1 und x 2 inQgilt.Die Definition der Lipschitz-Stetigkeit geht auf den deutschen <strong>Mathematik</strong>erRudolph Lipschitz (1832–1903) zurück, der seinen Stetigkeitsbegriffbenutzte, um die Existenz von Lösungen für einige wichtige Differentialgleichungenzu beweisen. Dies ist nicht die übliche Stetigkeitsdefinition inKursen zur Infinitesimalrechnung, die rein qualitativ vorgehen, wohingegendie Lipschitz-Stetigkeit eine quantitative Definition liefert. Sicherlichsind beide Definition eng mitein<strong>and</strong>er verbunden, und eine Lipschitz-stetigeFunktion ist auch im üblichen Sinne stetig, wohingegen es sein kann, dasses <strong>and</strong>ers herum nicht gilt: Lipschitz-Stetigkeit ist eine stärkere Forderung.


12.4 Monome 167Die quantitative Formulierung der Stetigkeit als Lipschitz-Stetigkeit vereinfachtjedoch viele Aspekte der mathematischen Analysis und die Verwendungder Lipschitz-Stetigkeit ist aus den Ingenieurwissenschaften und derangew<strong>and</strong>ten <strong>Mathematik</strong> nicht mehr wegzudenken. Sie hat darüber hinausden Vorteil, dass sie einige sehr technische Details bei der Definition derStetigkeit eliminiert, die knifflig sind, aber unwichtig für die Praxis.12.4 MonomeWir fahren mit der Untersuchung stetiger Funktionen fort und zeigen alsNächstes, dass Monome auf beschränkten Intervallen Lipschitz-stetig sind,wie wir es von ihren Graphen erwarten.Beispiel 12.10. Wir zeigen, dass die Funktion f(x) =x 4 Lipschitz-stetigauf I =[−2, 2] ist zur Lipschitz-Konstanten L f = 32. Wir wählen x 1 undx 2 in I und wollen|f(x 2 ) − f(x 1 )| = |x 4 2 − x4 1 |durch |x 2 − x 1 | abschätzen.Um dies zu erreichen, zeigen wir zunächst, dassx 4 2 − x4 1 =(x 2 − x 1 )(x 3 2 + x2 2 x 1 + x 2 x 2 1 + x3 1 ),indem wir zunächst ausmultiplizizieren(x 2 − x 1 )(x 3 2 + x2 2 x 1 + x 2 x 2 1 + x3 1 )= x 4 2 + x 3 2x 1 + x 2 2x 2 1 + x 2 x 3 1 − x 3 2x 1 − x 2 2x 2 1 − x 2 x 3 1 − x 4 1und dann die Ausdrücke in der Mitte streichen und so x 4 2 − x 4 1 erhalten.Daraus folgt, dass|f(x 2 ) − f(x 1 )| = |x 3 2 + x 2 2x 1 + x 2 x 2 1 + x 3 1||x 2 − x 1 |.Jetzt haben wir den gewünschten Abst<strong>and</strong> |x 2 − x 1 | auf der rechten Seiteund müssen nur den Faktor |x 3 2 + x2 2 x 1 + x 2 x 2 1 + x3 1 | abschätzen. Mit derDreiecksungleichung erhalten wir|x 3 2 + x 2 2x 1 + x 2 x 2 1 + x 3 1|≤|x 2 | 3 + |x 2 | 2 |x 1 | + |x 2 ||x 1 | 2 + |x 1 | 3 .Da x 1 und x 2 in I liegen, sind |x 1 |≤2 und |x 2 |≤2, so dass|x 3 2 + x2 2 x 1 + x 2 x 2 1 + x3 1 |≤23 +2 2 2+22 2 +2 3 =32und somit|f(x 2 ) − f(x 1 )|≤32|x 2 − x 1 |.


168 12. Lipschitz-StetigkeitBeachten Sie, dass die Lipschitz-Konstante L f =4für f(x) =x 2 auf Iist. Die Tatsache, dass die Lipschitz-Konstante auf [−2, 2] von x 4 größerist als die von x 2 ,istnichtüberraschend, wenn wir die Graphen der beidenFunktionen vergleichen, vgl. Abb. 10.11.Wir können dieselbe Technik anwenden um zu zeigen, dass die Funktionf(x)=x m Lipschitz-stetig ist, wobei m jede natürliche Zahl sein kann.Beispiel 12.11. Die Funktion f(x)=x m ist auf jedem Intervall I =[−a,a]Lipschitz-stetig, wobei a eine positive rationale Zahl ist, mit der Lipschitz-Konstanten L f = ma m−1 . Sind x 1 und x 2 in I gegeben, so wollen wir|f(x 2 ) − f(x 1 )| = |x m 2 − xm 1 |durch |x 2 − x 1 | abschätzen. Dazu benutzen wir die Tatsache, dassx m 2 − x m 1 =(x 2 − x 1 )(x m−12 + x m−22 x 1 + ···+ x 2 x m−21 + x m−11 )m−1∑=(x 2 − x 1 ) x m−1−i2 x i 1 .i=0Um dies zu zeigen, multiplizieren wir zunächst aus(x 2 − x 1 )m−1∑i=0m−12 x i 1 = ∑x m−1−ii=0m−12 x i 1 − ∑x2 m−1−i x i+11 .x m−iUm zu erkennen, dass sich viele Ausdrücke in der Mitte der beiden Summenauf der rechten Seite gegenseitig aufheben, lösen wir den ersten Ausdruckder ersten Summe und den letzten Ausdruck der zweiten Summe heraus(x 2 − x 1 )m−1∑i=0m−12 x i 1 = xm 2 + ∑x m−1−ii=1x m−ii=0m−22 x i 1 − ∑x2 m−1−i x i+11 − x m 1und ändern den Index in der zweiten Summe und erhalten so(x 2 − x 1 )m−1∑i=0x m−1−i2 x i 1m−1∑= x m 2 +i=1m−1∑x m−i2 x i 1 −i=1i=0x m−i2 x i 1 − x m 1 = x m 2 − x m 1 .Es ist zwar mühsam, aber sich zu vergewissern, dass diese Argumentationrichtig ist, ist eine gute Übung.Das bedeutet, dassm−1∑|f(x 2 ) − f(x 1 )| =∣x2 m−1−i x i 1i=0∣ |x 2 − x 1 |.


12.5 Linearkombinationen von Funktionen 169Jetzt haben wir den ersehnten Abst<strong>and</strong> |x 2 −x 1 | auf der rechten Seite undmüssen nur noch den Faktorm−1∑x2 m−1−i x i 1∣ ∣i=0abschätzen. Aus der Dreiecksungleichung ergibt sichm−1∑m−1x2 m−1−i x i 1∣ ∣ ≤ ∑|x 2 | m−1−i |x 1 | i .i=0Da x 1 und x 2 in [−a,a] liegen, sind |x 1 |≤a und |x 2 |≤a.Somitm−1∑m−1x2 m−1−i x i 1∣ ∣ ≤ ∑m−1∑a m−1−i a i = a m−1 = ma m−1i=0i=0i=0i=0und|f(x 2 ) − f(x 1 )|≤ma m−1 |x 2 − x 1 |.12.5 Linearkombinationen von FunktionenNun, da wir gesehen haben, dass die Monome auf beschränkten IntervallenLipschitz-stetig sind, ist es nur noch ein kurzer Schritt um zu zeigen, dassjedes Polynom auf einem beschränkten Intervall Lipschitz-stetig ist. Aberstatt dies nur für Polynome zu zeigen, zeigen wir, dass eine Linearkombinationbeliebiger Lipschitz-stetiger Funktionen auch Lipschitz-stetig ist.Angenommen, dass f 1 auf dem Intervall I Lipschitz-stetig zur KonstantenL 1 ist und f 2 Lipschitz-stetig zur Konstanten L 2 .BeachtenSie,dasswir hier (und im Folgenden) die Schreibweise vereinfachen und z.B. L 1schreiben statt L f1 . Dann ist auch f 1 + f 2 Lipschitz-stetig auf I mit derKonstanten L 1 + L 2 , da, wenn wir zwei Punkte x und y in I wählen, aufgrundder Dreiecksungleichung gilt:|(f 1 + f 2 )(y) − (f 1 + f 2 )(x)| = |(f 1 (y) − f 1 (x)) + (f 2 (y) − f 2 (x))|≤|f 1 (y) − f 1 (x)| + |f 2 (y) − f 2 (x)|≤ L 1 |y − x| + L 2 |y − x|=(L 1 + L 2 )|y − x|.Dieselbe Argumentation zeigt, dass f 2 −f 1 Lipschitz-stetig ist mit der KonstantenL 1 + L 2 (natürlich nicht L 1 − L 2 !). Noch einfacher zu zeigen ist,dass, wenn f(x) Lipschitz-stetig zur Lipschitz-Konstanten L ist, auch dasProdukt cf(x) Lipschitz-stetig auf I ist, mit der Lipschitz-Konstanten |c|L.


170 12. Lipschitz-StetigkeitVon diesen beiden Tatsachen ist es nur noch ein kurzer Schritt, dasErgebnis auf jede Linearkombination Lipschitz-stetiger Funktionen auszuweiten.Angenommen, f 1 ,...,f n seien Lipschitz-stetig auf I mit denLipschitz-Konstanten L 1 ,...,L n . Wir arbeiten mit Induktion und beginnendaher mit der Linearkombination zweier Funktionen. Aus den obigenBemerkungen folgt, dass c 1 f 1 +c 2 f 2 Lipschitz-stetig ist mit der Konstanten|c 1 |L 1 +|c 2 |L 2 .Seii ≤ n gegeben. Wir nehmen an, dass c 1 f 1 ···+c i−1 f i−1Lipschitz-stetig ist mit der Konstanten |c 1 |L 1 + ···+ |c i−1 |L i−1 |.UmdieBehauptung für i zu zeigen, schreiben wirc 1 f 1 ···+ c i f i =(c 1 f 1 ···+ c i−1 f i−1 )+c i f i .Aber die Annahme, dass c 1 f 1 ···+ c i−1 f i−1 Lipschitz-stetig ist, bedeutet,dass wir c 1 f 1 ···+ c i f i als Summe zweier Lipschitz-stetiger Funktionengeschrieben haben, nämlich (c 1 f 1 ···+c i−1 f i−1 ) und c i f i . Der Beweis folgtaus dem Beweis für die Linearkombination zweier Funktionen. Somit habenwir durch Induktion bewiesen:Satz 12.1 Die Funktionen f 1 ,...,f n seien jeweils Lipschitz-stetig auf Imit den Lipschitz-Konstanten L 1 ,...,L n . Dann ist auch die Linearkombinationc 1 f 1 +···+c n f n Lipschitz-stetig auf I mit der Lipschitz-Konstanten|c 1 |L 1 + ···+ |c n |L n .Korollar 12.2 Polynome sind auf jedem beschränkten Intervall Lipschitzstetig.Beispiel 12.12. Wir zeigen, dass die Funktion f(x) =x 4 − 3x 2 Lipschitzstetigist auf [−2, 2] mit der Konstanten L f = 44. Für x 1 und x 2 in [−2, 2]müssen wir|f (x 2 ) − f (x 1 )| = ∣ ∣ ( x 4 2 − 3x 2 2)−(x41 − 3x 2 1)∣ ∣= ∣ ( x 4 2 − x 4 (1)− 3x22 − 3x1)∣ 2 ∣≤ ∣ ∣x 4 2 − x4 ∣1 +3 ∣ ∣x 2 2 − x2 ∣1abschätzen. Aus Beispiel 12.11 wissen wir, dass x 4 Lipschitz-stetig ist auf[−2, 2] mit der Konstanten 32, und x 2 Lipschitz-stetig ist auf [−2, 2] mitder Lipschitz-Konstanten 4. Daher gilt|f(x 2 ) − f(x 1 )|≤32|x 2 − x 1 | +3× 4|x 2 − x 1 | =44|x 2 − x 1 |.12.6 Beschränkte FunktionenLipschitz-Stetigkeit ist eng mit einer <strong>and</strong>eren wichtigen Eigenschaft vonFunktionen verbunden, die Beschränktheit genannt wird. Eine Funktion


12.6 Beschränkte Funktionen 171f ist beschränkt auf einer Teilmenge der rationalen Zahlen I, wenneineKonstante M existiert, so dass|f(x)|≤M für alle x ∈ I,vgl. Abb. 12.4. Wenn wir an die Abschätzungen zurückdenken, die wirgemacht haben, um die Definition der Lipschitz-Stetigkeit (12.2) zu beweisen,so erkennen wir, dass sie immer mit dem Nachweis einhergingen, dassFunktionen auf dem gegebenen Intervall beschränkt waren.yy = Mxy = f(x)y = −MAbb. 12.4. Eine beschränkte Funktion auf IBeispiel 12.13. Um in Beispiel 12.4 zu zeigen, dass f(x) =x 2 auf [−2, 2]Lipschitz-stetig ist, haben wir bewiesen, dass |x 1 + x 2 |≤4für x 1 und x 2in [−2, 2] gilt.Es zeigt sich, dass eine Funktion, die auf einem beschränkten IntervallLipschitz-stetig ist, auch automatisch auf diesem Definitionsbereich beschränktist. Um etwas genauer zu sein, nehmen wir an, dass eine Funktionf auf einer durch a beschränkten Menge I Lipschitz-stetig ist zur Lipschitz-Konstanten L f .Wirwählen einen Punkt y in I.Dannistfür jeden <strong>and</strong>erenPunkt x in I|f(x) − f(y)|≤L f |x − y|.Zunächst einmal wissen wir, dass |x − y|≤|x| + |y|≤2a. Außerdem folgtaus |b + c|≤|d|, dass|b|≤|d| + |c| für beliebige Zahlen b, c und d. Somiterhalten wir|f(x)|≤|f(y)| + L f |x − y|≤|f(y)| +2L f a.Obwohl wir |f(y)| nicht kennen, wissen wir doch, dass der Wert endlich ist.Damit ist |f(x)| beschränkt durch die Konstante M = |f(y)| +2L f a füralle x ∈ I. Wirdrücken das dadurch aus, dass wir sagen, dass f(x) auf Ibeschränkt ist. So erhalten wir:


172 12. Lipschitz-StetigkeitSatz 12.3 Eine auf einer beschränkten Menge I Lipschitz-stetige Funktionist beschränkt auf I.Beispiel 12.14. In Beispiel 12.12 haben wir gezeigt, dass f(x)=x 4 +3x 2auf [−2, 2] zur Lipschitz-Konstanten L f = 44 Lipschitz-stetig ist. Darauserhalten wir|f(x)|≤|f(0)| +44|x − 0|≤0+44× 2=88für alle x in [−2, 2]. Da x 4 in 0 ≤ x anwächst, wissen wir tatsächlich, dass|f(x)| ≤|f(2)| =16für alle x in [−2, 2]. Somit ist die Abschätzung derGröße von |f| mit Hilfe der Lipschitz-Konstanten nicht sehr genau.12.7 Das Produkt von FunktionenAls nächsten Schritt bei der Untersuchung der Lipschitz-Stetigkeit vonFunktionen betrachten wir das Produkt zweier Lipschitz-stetiger Funktionenauf einem beschränktem Intervall I. Wir zeigen, dass das Produkt auchLipschitz-stetig ist auf I.Istf 1 Lipschitz-stetig zur Konstanten L 1 und f 2Lipschitz-stetig zur Konstanten L 2 auf einem beschränktem Intervall I,dann ist auch f 1 f 2 auf I Lipschitz-stetig. Um dies zu zeigen, wählen wirzwei Punkte x und y in I und benutzen den alten Trick, dieselben Ausdrückezu addieren und zu subtrahieren, um abzuschätzen|f 1 (y)f 2 (y) − f 1 (x)f 2 (x)|= |f 1 (y)f 2 (y) − f 1 (y)f 2 (x)+f 1 (y)f 2 (x) − f 1 (x)f 2 (x)|≤|f 1 (y)f 2 (y) − f 1 (y)f 2 (x)| + |f 1 (y)f 2 (x) − f 1 (x)f 2 (x)|= |f 1 (y)||f 2 (y) − f 2 (x)| + |f 2 (x)||f 1 (y) − f 1 (x)|.Nun wenden wir Satz 12.3 an, nach dem Lipschitz-stetige Funktionen beschränktsind. Demnach existiert eine Konstante M, sodass|f 1 (y)| ≤Mund |f 2 (x)|≤M für x, y ∈ I. Nun nutzen wir noch die Lipschitz-Stetigkeitvon f 1 und f 2 in I aus und erhalten so|f 1 (y)f 2 (y) − f 1 (x)f 2 (x)|≤ML 1 |y − x| + ML 2 |y − x|Wir fassen zusammen:= M(L 1 + L 2 )|y − x|.Satz 12.4 Sind f 1 und f 2 Lipschitz-stetig auf einem beschränkten IntervallI, dann ist auch f 1 f 2 Lipschitz-stetig auf I.Beispiel 12.15. Die Funktion f(x)=(x 2 +5) 10 ist Lipschitz-stetig auf derMenge I =[−10, 10], da x 2 + 5 Lipschitz-stetig ist auf I und somit nachSatz 12.4 auch (x 2 +5) 10 =(x 2 +5)(x 2 +5)···(x 2 +5).


12.8 Der Quotient von Funktionen12.8 Der Quotient von Funktionen 173Wir wollen unsere Untersuchung auf den Quotienten zweier Lipschitz-stetigerFunktionen ausdehnen. Für diesen Fall benötigen wir jedoch mehr Informationenals nur die Lipschitz-Stetigkeit über die Funktion im Nenner.Wir müssen auch wissen, dass sie nicht zu klein wird. Wieso das so ist,verdeutlicht folgendes Beispiel.Beispiel 12.16. Wir zeigen, dass f(x)=1/x 2 auf dem Intervall I =[1/2, 2]Lipschitz-stetig ist zur Lipschitz-Konstanten L = 64. Dazu wählen wir zweiPunkte x 1 und x 2 aus I und schätzen die folgende Änderung ab|f(x 2 ) − f(x 1 )| =1∣x 2 − 1 2 x 2 ∣ ,1wobei wir zunächst einige algebraische Umformungen durchführen:1x 2 2− 1 x 2 1= x2 1x 2 − x2 21 x2 2 x 2 = x2 1 − x 2 21 x2 2 x 2 1 x2 2= (x 1 + x 2 )(x 1 − x 2 )x 2 .1 x2 2Das bedeutet, dass|f(x 2 ) − f(x 1 )| =x 1 + x 2∣ x 2 1 x2 ∣ |x 2 − x 1 |.2Nun haben wir die gewünschte Differenz auf der rechten Seite und müssennur noch den Faktor abschätzen. Der Zähler ist der gleiche wie in Beispiel12.4 und wir wissen, dassFerner wissen wir, dass|x 1 + x 2 |≤4.aus x 1 ≥ 1 2 folgt 1 x 1≤ 2 daraus folgt 1 x 2 1≤ 4und analog auch 1 x 2 2≤ 4. Somit erhalten wir|f(x 2 ) − f(x 1 )|≤4 × 4 × 4|x 2 − x 1 | =64|x 2 − x 1 |.Bei diesem Beispiel mussten wir ausnutzen, dass die linke Grenze des IntervallsI 1/2ist.Jenäher die linke Grenze bei Null liegt, desto größer wirddie Lipschitz-Konstante und 1/x 2 ist in der Tat nicht Lipschitz-stetig auf[0, 2].Wir bilden dieses Beispiel im allgemeinen Fall f 1 /f 2 nach, indem wirannehmen, dass der Zähler durch eine positive Konstante von unten beschränktist. Den Beweis des folgenden Satz stellen wir als Übung.


174 12. Lipschitz-StetigkeitSatz 12.5 Seien die Funktionen f 1 und f 2 Lipschitz-stetig auf einer beschränktenMenge I zu den Lipschitz-Konstanten L 1 und L 2 . Ferner gebees eine Konstante m>0, so dass |f 2 (x)|≥m für alle x ∈ I gilt. Dann istf 1 /f 2 Lipschitz-stetig auf I.Beispiel 12.17. Die Funktion f(x) =1/x 2 genügt den Annahmen desSatz 12.5 nicht auf dem Intervall [0, 2] und wir wissen, dass sie auf diesemIntervall nicht Lipschitz-stetig ist.12.9 Zusammengesetzte FunktionenWir wollen die Untersuchungen zur Lipschitz-Stetigkeit mit der Betrachtungzusammengesetzter Lipschitz-stetiger Funktionen abschließen. Das isttatsächlich einfacher als die Betrachtungen bei Produkten oder Quotientenvon Funktionen. Die einzige Schwierigkeit dabei ist, dass wir beim Definitionsbereichund dem Wertebereich der Funktionen vorsichtig sein müssen.Wir beginnen mit der zusammengesetzten Funktion f 2 (f 1 (x)). Vermutlichmüssen wir x auf ein Intervall einschränken, auf dem f 1 Lipschitz-stetigist, und wir müssen uns auch vergewissern, dass die Werte von f 1 in derMenge liegen, auf der f 2 Lipschitz-stetig ist.Daher nehmen wir an, dass f 1 Lipschitz-stetig auf I 1 zur Konstanten L 1ist und f 2 Lipschitz-stetig auf I 2 zur Konstanten L 2 . Sind x und y Punktein I 1 , dann gilt, so lange f 1 (x) und f 1 (y)inI 2 liegen,|f 2 (f 1 (y)) − f 2 (f 1 (x))|≤L 2 |f 1 (y) − f 1 (x)|≤L 1 L 2 |y − x|.Wir fassen dies in einem Satz zusammen.Satz 12.6 Sei f 1 Lipschitz-stetig auf I 1 zur Lipschitz-Konstanten L 1 ,undf 2 Lipschitz-stetig auf I 2 zur Lipschitz-Konstanten L 2 , so dass f 1 (I 1 ) ⊂ I 2 .Dann ist die zusammengesetzte Funktion f 2 (f 1 (x)) = f 2 ◦f 1 Lipschitz-stetigauf I 1 zur Lipschitz-Konstanten L 1 L 2 .Beispiel 12.18. Die Funktion f(x) =(2x − 1) 4 ist Lipschitz-stetig aufjedem beschränkten Intervall, da f 1 (x) =2x − 1 und f 2 (x) =x 4 auf jedembeschränkten Intervall Lipschitz-stetig sind. Wenn wir das Intervall[−0, 5;1, 5] betrachten, dann ist f 1 (I) ⊂ [−2, 2]. Aus Beispiel 12.10 wissenwir, dass x 4 Lipschitz-stetig auf [−2, 2] ist, mit der Lipschitz-Konstanten32. Die Lipschitz-Konstante von 2x − 1 ist 2. Daher ist auch f Lipschitzstetigauf [−0, 5;1, 5] mit der Konstanten 64.Beispiel 12.19. Die Funktion 1/(x 2 −4) ist Lipschitz-stetig auf jedem abgeschlossenenIntervall, das weder 2 noch −2enthält. Das ergibt sich daraus,dass f 1 (x) =x 2 − 4 Lipschitz-stetig ist auf jedem abgeschlossenen Intervall,wohingegen f 2 (x)=1/x Lipschitz-stetig ist auf jedem abgeschlossenenIntervall, das nicht die 0 enthält. Um die Null zu vermeiden, müssen wirverhindern, dass x 2 =4,d.h.x = ±2.


12.10 Funktionen zweier rationaler Variablen 17512.10 Funktionen zweier rationaler VariablenBis jetzt haben wir Funktionen f(x) einer rationalen Variablen x betrachtet.Aber natürlich gibt es auch Funktionen, die von mehr als einem Argumentabhängen, wie z.B. die Funktionf(x 1 ,x 2 )=x 1 + x 2 ,die jedem Paar rationaler Zahlen x 1 und x 2 deren Summe x 1 +x 2 zuordnet.Wir können dies in der Form f :Q×Q →Qschreiben. Dies bedeutet, dasswir zu jedem x 1 ∈Q und x 2 ∈Q einen Wert f(x 1 ,x 2 ) ∈Q zuordnen, wiebeispielsweise f(x 1 ,x 2 )=x 1 + x 2 . Wir sagen, dass f(x 1 ,x 2 )eineFunktionzweier unabhängiger rationaler Variablen x 1 und x 2 ist. Dabei stellen wirunsQ ×Q als die Menge aller Paare (x 1 ,x 2 )mitx 1 ∈Q und x 2 ∈Q vor.Wir schreiben auchQ 2 =Q ×Q und betrachten f(x 1 ,x 2 )=x 1 + x 2 alseine Funktion f :Q 2 →Q. Wir werden auch die Funktion f : I × J →Qbetrachten, wobei I und J Teilmengen, wie z.B. Intervalle, vonQsind. Diesbedeutet nichts <strong>and</strong>eres, als dass wir zu jedem x 1 ∈ I und x 2 ∈ J einenWert f(x 1 ,x 2 ) ∈Q zuordnen.Wir können Lipschitz-Stetigkeit ganz natürlich auf Funktionen zweierrationaler Variablen ausdehnen. Wir sagen dann, dass f : I × J →QLipschitz-stetig ist zur Lipschitz-Konstanten L f ,wenn|f(x 1 ,y 1 ) − f(x 2 ,y 2 )|≤L f (|x 1 − x 2 | + |y 1 − y 2 |)für x 1 ,x 2 ∈ I und y 1 ,y 2 ∈ J.Beispiel 12.20. Die Funktion f : Q 2 →Q, definiert durch f(x 1 ,x 2 )=x 1 + x 2 ist Lipschitz-stetig zur Lipschitz-Konstanten L f =1.Beispiel 12.21. Die Funktion f : [0, 2] × [0, 2] → Q, definiert durchf(x 1 ,x 2 )=x 1 x 2 ist Lipschitz-stetig zur Lipschitz-Konstanten L f =2,da für x 1 ,x 2 ∈ [0, 2]|x 1 x 2 − y 1 y 2 | = |x 1 x 2 − y 1 x 2 + y 1 x 2 − y 1 y 2 |≤|x 1 − y 1 |x 2 + y 1 |x 2 − y 2 |≤2(|x 1 − y 1 | + |x 2 − y 2 |).12.11 Funktionen mehrerer rationaler VariablenDie Überlegungen zu einer Funktion zweier rationaler Variablen lassen sichauch auf mehrere Variablen übertragen, d.h. wir betrachten Funktionenf(x 1 ,...,x d )mitd rationalen Variablen. Wir schreiben f : Q d → Q,wenn für vorgegebene d rationale Zahlen x 1 ,...,x d eine rationale Zahlf(x 1 ,...,x d ) zugeordnet wird.


176 12. Lipschitz-StetigkeitDie Definition der Lipschitz-Stetigkeit lässt sich ebenfalls direkt übertragen.Wir sagen, dass f : Q d →QLipschitz-stetig ist zur Lipschitz-Konstanten L f ,wennfür alle x 1 ,...,x d ∈Q und y 1 ,...,y d ∈Qgilt.|f(x 1 ,...,x d ) − f(y 1 ,...,y d )|≤L f (|x 1 − y 1 | + ···+ |x d − y d |)Beispiel 12.22. Die Funktion f :Q d →Q, definiert durch f(x 1 ,...,x d )=x 1 +x 2 +···+x d , ist Lipschitz-stetig mit der Lipschitz-Konstanten L f =1.Aufgaben zu Kapitel 1212.1. Beweisen Sie die Aussagen in Beispiel 12.7.12.2. Zeigen Sie, dass f(x)=x 2 auf [10, 13] Lipschitz-stetig ist und bestimmenSie eine Lipschitz-Konstante.12.3. Zeigen Sie, dass f(x)=2x −x 2 auf [−2, 2] Lipschitz-stetig ist und bestimmenSie eine Lipschitz-Konstante.12.4. Zeigen Sie, dass f(x)=|x| auf É Lipschitz-stetig ist und bestimmen Sieeine Lipschitz-Konstante.12.5. In Beispiel 12.10 haben wir gezeigt, dass x 4 Lipschitz-stetig ist auf [−2, 2]mit der Lipschitz-Konstanten L = 32. Erklären Sie, warum das eine sinnvolleWahl für die Lipschitz-Konstante ist.12.6. Zeigen Sie, dass f(x)=1/x 2 auf [1, 2] Lipschitz-stetig ist und bestimmenSie eine Lipschitz-Konstante.12.7. Zeigen Sie, dass f(x) =1/(x 2 +1)auf[−2, 2] Lipschitz-stetig ist undbestimmen Sie eine Lipschitz-Konstante.12.8. Bestimmen Sie die Lipschitz-Konstante für f(x)=1/x auf dem Intervall(a) [0, 1; 1], (b) [0,01; 1] und (c) [0, 001; 1].12.9. Bestimmen Sie die Lipschitz-Konstante für die Funktion f(x) = √ x mitD(f)=(δ, ∞) für ein vorgegebenes δ>0.12.10. Erklären Sie, warum f(x)=1/x nicht auf (0, 1] Lipschitz-stetig ist.12.11. (a) Erklären Sie, warum die Funktion´1, x


Aufgaben zu Kapitel 12 17712.12. Angenommen, die Lipschitz-Konstante L einer Funktion f sei L =10 100 .Diskutieren Sie die Stetigkeitseigenschaften von f(x) und entscheiden Sie insbesondereaus rein praktischen Gesichtspunkten, ob f stetig ist.12.13. Angenommen, f 1 sei Lipschitz-stetig mit der Lipschitz-Konstanten L 1und f 2 sei Lipschitz-stetig mit der Lipschitz-Konstanten L 2 auf einer MengeI. Sei ferner c eine Zahl. Zeigen Sie, dass f 1 − f 2 Lipschitz-stetig ist mit derLipschitz-Konstanten L 1 + L 2 auf I, und dass cf 1 Lipschitz-stetig ist auf I mitder Konstanten cL 1.12.14. Zeigen Sie, dass auf dem Intervall [−c, c] die Lipschitz-Konstante einesPolynoms f(x)= È ni=0 aixibeträgt.L =ni=1|a i|ic i−1 = |a 1| +2c|a 2| + ···+ nc n−1 |a n|12.15. Erklären Sie, warum f(x)=1/x auf [−1, 0] nicht beschränkt ist.12.16. Beweisen Sie Satz 12.5.12.17. Zeigen Sie mit Hilfe der Sätze dieses Kapitels, dass die folgenden Funktionenauf den gegebenen Intervallen Lipschitz-stetig sind und versuchen Sie eineAbschätzung der Lipschitz-Konstanten oder beweisen Sie, dass sie nicht Lipschitzstetigsind.(a) f(x)=2x 4 − 16x 2 +5x auf [−2,2](c)(b)1−x 2 − 1 auf 1 2 , 1 211+x 2 − 2x − 3 auf [2, 3) (d) 1 4auf [1, 2] .x12.18. Zeigen Sie, dass die Funktionf(x)=1c 1x + c 2(1 − x)auf [0, 1] Lipschitz-stetig ist mit c 1 > 0 und c 2 > 0.


13Folgen und GrenzwerteEr setzte sich und dachte in der nachdenklichsten Weise nach, aufdie er nachdenken konnte. (Pu-Bär)13.1 Ein erstes Treffen mit Folgenund GrenzwertenDie Dezimalentwicklung rationaler Zahlen, die wir im Kapitel ”RationaleZahlen“ diskutiert haben, führt uns zu den Begriffen Folge, konvergierendeFolge und Grenzwert einer Folge, die eine zentrale Rolle in der <strong>Mathematik</strong>spielen. Die Entwicklung der Infinitesimalrechnung war zum großenTeil ein Kampf um schwer zugängliche Gesichtspunkte dieser Begriffe. Wirbemühen uns, einige dieser Mysterien zu enthüllen, indem wir so konkretsind wie möglich und mit beiden Füßen auf dem Boden bleiben.Wir beginnen mit der Wiederholung der Dezimalentwicklung 1,11...von109 in (7.7): 109 =1, 11 ···11 n + 1 9 10−n . (13.1)Wir erhalten die folgende Abschätzung der Differenz zwischen 1, 111 ...11 nund 10/9, wobei wir zur Vereinfachung 1 9 10−n durch die obere Grenze 10 −nersetzen:10∣ 9 − 1, 11 ...11 n∣ ≤ 10−n . (13.2)


180 13. Folgen und GrenzwerteDiese Abschätzung zeigt, dass wir 1, 11 ...11 n als Näherung für 10/9auffassenkönnen, die umso genauer wird, je größer die Zahl der Dezimalstellen nist. Anders formuliert kann der Fehler |10/9−1, 11 ...11 n | so klein gemachtwerden, wie wir wollen, wenn wir nur n genügend groß wählen. Wenn derFehler kleiner oder gleich 10 −10 sein soll, wählen wir einfach n ≥ 10.Wir können die aufein<strong>and</strong>er folgenden Näherungen 1, 1, 1, 11, 1, 111,1, 11 ...11 n und so weiter als eine Folge von Zahlen a n auffassen, mitn =1, 2, 3,...,wobeia 1 =1, 1, a 2 =1, 11, ..., a n =1, 11 ...11 n ,...,die Elemente der Folge genannt werden. Allgemeiner formuliert ist eine Folgea 1 ,a 2 ,a 3 ,...eine nicht endende Auflistung von Elementen a 1 ,a 2 ,a 3 ,...,wobei der Index der Reihe nach die Werte der natürlichen Zahlen 1, 2, 3,...annimmt. Eine Folge rationaler Zahlen ist eine Auflistung a 1 ,a 2 ,a 3 ,...,wobei jedes Element a n eine rationale Zahl ist. Wir verwenden die Schreibweise{a n } ∞ n=1für die nicht endende Auflistung a 1 ,a 2 ,a 3 ,...von Elementen a n , wobei derIndex n die natürlichen Zahlen n =1, 2, 3,...durchläuft. Das Unendlich“ ”bezeichnete Symbol ∞ deutet an, dass die Auflistung für immer in demSinne fortgesetzt werden kann, wie die natürlichen Zahlen 1, 2, 3,... fürimmer fortgesetzt werden können, ohne dabei an ein Ende zu kommen.Wir kehren nun zu der Folge rationaler Zahlen {a n } ∞ n=1 zurück, wobeia n =1, 11 ...11 n , d.h. die Folge {1, 11 ...11 n } ∞ n=1. Die Genauigkeitvon Element a n =1, 11 ...11 n als Näherung für 10 9wächst mit der AnzahlDezimalstellen n. Jede Zahl in der Folge ist ihrerseits eine bessereNäherung an 10/9 als die vorangehende Zahl und wenn wir dies fortsetzen,liegen die Zahlen immer näher an 10/9. Der entscheidende Vorteil beider Betrachtung der Folge {1, 11 ...11 n } ∞ n=1 , oder der nicht endenden Auflistung1, 1; 1, 11; 1, 111;.. . ist, dass wir in der Lage sind, jede möglicheGenauigkeitsanforderung zu übertreffen. Betrachten wir nur ein Element,z.B. 1, 11 ...11 10 ,sokönnten wir keine Genauigkeitsanforderung von 10 −15bei der Abschätzung von 10 9erfüllen. Wenn wir aber die komplette Folgezur H<strong>and</strong> haben, können wir 1, 11 ...11 16 oder 1, 11 ...11 17 , oder allgemeiner1, 11 ...11 n mit n ≥ 15, als eine dezimale Näherung für 109 miteinem Fehler unter 10 −15 herausgreifen. Die Folge liefert uns also einenganzen Rucksack“ voller Zahlen, oder eine Sammlung von Näherungen”von 10 9, mit der wir jede gewünschte Genauigkeit erfüllen können. Die Folge1, 1,...,1, 11 ...11 n ,...kann also als Sammlung von Näherungen an 10 9betrachtet werden, die der Reihe nach genauer werden, so dass wir jedegewünschte Genauigkeit erzielen können.Wir sagen, dass die Folge {1, 11 ...11 n } ∞ n=1 gegen den Wert 10 9konvergiert,da der Unterschied zwischen 109und 1, 11 ...11 n kleiner wirdals jede vorgegebene positive Zahl, falls wir n nur groß genug wählen.Dies folgt aus (13.2). Wir sagen, dass 109 Grenzwert der Folge {a n} ∞ n=1 ={1, 11 ...11 n } ∞ n=1 ist und drücken die Konvergenz der Folge {a n } ∞ n=1 mit


den Elementen a n =1, 11 ...11 n wie folgt aus:13.2 Ringschraubenschlüsselsatz 181lim a n = 10n→∞ 9oder limn→∞ 1, 11..11 n = 109 .Der Grenzwert 109besitzt keine endliche Dezimaldarstellung. Die Elemente1, 11 ...11 n der konvergenten Folge {1, 11 ...11 n } ∞ n=1 sind Näherungenmit endlich vielen Dezimalstellen des Grenzwertes 109, wobei der Fehlerkleiner ist als jede vorgegebene positive Zahl, falls wir n nur groß genugwählen.Angenommen, wir beschränken uns darauf, mit endlichen Dezimaldarstellungenzu arbeiten, so wie es ein Computer normalerweise tut. Dannkönnen wir den Wert 10 9mit den vorh<strong>and</strong>enen Mitteln nicht exakt darstellen,da 10 9keine endliche Dezimaldarstellung hat. Als Stellvertreteroder Näherung können wir beispielsweise 1, 11 ...11 10 wählen, aber dieseseinzelne Element hat nur eine begrenzte Genauigkeit. Es wäre nichtvollständig richtig, wenn wir behaupten würden, dass 109 =1, 11 ...11 10.Steht uns stattdessen die komplette Folge {1, 11 ...11 n } ∞ n=1 zur Verfügung,können wir jede Genauigkeitsanforderung erfüllen, indem wir das Element1, 11 ...11 n mit groß genugem n wählen. Indem wir mehr und mehr Dezimalstellenanhängen, können wir die Genauigkeit auf jedes gewünschteNiveau anheben.Die Folge {1, 11 ...11 n } ∞ n=1 enthält endliche Dezimaldarstellungen von109,diejedegewünschte positive Toleranz oder Genauigkeitsanforderungerfüllen. Dies wird manchmal durch1, 111 ...= 109ausgedrückt, wobei die drei Punkte <strong>and</strong>euten, dass jede Genauigkeit erreichtwerden kann, indem genügend viele Dezimalstellen (alle gleich 1)berücksichtigt werden. Eine <strong>and</strong>ere Schreibweise dafür istlim 1, 11 ...11 n = 10n→∞ 9 ,bei der eine mögliche Doppeldeutigkeit durch die drei kleinen Punkte vermiedenwird.13.2 RingschraubenschlüsselsatzUm eine sechseckige Schraube mit Durchmesser 2/3 anzuziehen oder zulösen, benötigt ein Mechaniker einen etwas größeren Schraubenschlüssel.Die Toleranz beim Unterschied zwischen dem Schraubenkopf und demSchlüssel hängt von der Festigkeit, dem Material der Schraube und des


182 13. Folgen und GrenzwerteSchlüssels ab und davon, ob die Schraube eingerostet ist oder das Schraubengewindegeölt ist. Ist der Schraubenschlüssel zu groß, wird der Schraubenkopfeinfach nur beschädigt, bevor die Schraube angezogen oder gelöstist. In Abb. 13.1 haben wir zwei Schlüssel mit unterschiedlichen Toleranzendargestellt.Ein Amateurmechaniker wird einen Schlüssel, etwa mit der Größe 0,7haben. Ein professioneller Mechaniker mag 10 verschiedene Schlüssel inden Größen 0, 7, 0, 67, 0, 667,..., 0, 66 ...667 10 bei sich haben. Sowohl derAmateurmechaniker wie der professionelle Mechaniker werden bei entsprechendschwierigen Bedingungen nicht weiterkommen, da die Schlüssel fürihre Aufgabe zu groß sind.Abb. 13.1. Zwei Ringschraubenschlüssel mit unterschiedlichen ToleranzenEin idealer Profimechaniker würde die komplette Folge {0, 66 ...67 n } ∞ n=1bereit haben, wobei der Fehler beim Ringschraubenschlüssel n durch∣ 0, 66 ...67 n − 2 3∣ ≤ 10−nabschätzbar ist. Somit kann ein idealer Profimechaniker in seinen Werkzeugkoffergreifen und einen Schraubenschlüssel herausnehmen, der jedwedenGenauigkeitsanforderungen gerecht wird. Er wäre somit in der Lage,die Schraube unter beliebig schwierigen Bedingungen zu drehen oder jedesKurbeldrehmoment zu erzeugen, das Fahrradhersteller angegeben haben.Genauer formuliert kann man sich den idealen Profimechaniker alsjem<strong>and</strong>en vorstellen, der in der Lage ist, einen Schraubenschlüssel selbstherzustellen, der jede Toleranz oder Genauigkeit erfüllt. Falls nötig, könnteder ideale Profimechaniker etwa einen Schlüssel mit der Größe 0, 66 ...67 20herstellen, falls er nicht genau so einen Schlüssel bereits in seinem (großen)Werkzeugkoffer hat. Der Amateurmechaniker und der professionelle Mechanikerwären nicht in der Lage, ihre eigenen Ringschraubenschlüssel herzustellen,sondern müssten mit ihren fabrikgefertigten Schlüsselsätzen (diesie in einem Baumarkt kaufen können) zufrieden sein. Wir gehen davon aus,dass die Kosten für die Herstellung eines Schlüssels der Größe 0, 66 ...67 n


13.3 J.P. Johanssons verstellbarer Schraubenschlüssel 183(schnell) mit n anwächst, da die Genauigkeit bei der Herstellung vergrößertwerden muss.Ganz allgemein kostet die Berechnung der Zahlen 0, 66 ...67 n aus 2 3 nachder Schuldivisionsmethode mehr Arbeit, wenn n anwächst. Wir gewinnendurch diese Mehrarbeit eine bessere Genauigkeit in 0, 66 ...67 n als Näherungan 2 3. Arbeit gegen Genauigkeit einzutauschen ist die Grundidee hinterder Lösung von Gleichungen durch Berechnung, insbesondere auf einemComputer. Eine Abschätzung wie (13.2) liefert ein quantitatives Maßdafür, wie viel größere Genauigkeit wir mit mehr Arbeit gewinnen. Dahersind solche Näherungen nicht nur für <strong>Mathematik</strong>er wichtig, sondern auchfür Ingenieure und Naturwissenschaftler.Die Notwendigkeit einer immer besseren Annäherung kann in diesem Fallals Inkompatibilität zweier Systeme angesehen werden: Die Schraube hatdie Größe 2 3im System der rationalen Zahlen, währenddessen die Schraubenschlüsselim Dezimalsystem 0, 7, 0, 67, 0, 667, ... fabriziert werden. Esgibt keinen Schraubenschlüssel mit der exakten Größe 2 3 .13.3 J.P. Johanssons verstellbarerSchraubenschlüsselDer verstellbare Schraubenschlüssel ist eine schwedische Erfindung aus demJahre 1891 vom genialen J.P. Johansson (1839–1924), vgl. Abb. 13.2. Prinzipiellist der verstellbare Schraubenschlüssel ein analoges Gerät, das zujedem Schraubenkopf innerhalb eines gewissen Bereichs passt. Jeder Mechanikerweiß, dass ein verstellbarer Schraubenschlüssel Probleme verursachenkann, die mit einem exakt passenden Ringschraubenschlüssel nichtauftreten, da die Größe des verstellbaren Schraubenschlüssels bei wachsendemDrehmoment nicht vollständig stabil ist.13.4 Die Macht der Sprache:Von unendlich Vielen zu EinemDie Dezimalentwicklung 0, 6666 ...von 2 3besitzt unendlich viele Dezimalstellen.Die Folge {0, 66 ...667 n } ∞ n=1 besitzt unendlich viele Elemente, diesich mit wachsender Genauigkeit an 2 3nähern. Über unendlich viele Dezimalstellenoder unendlich viele Elemente zu reden oder daran zu denken,bedeutet eine ernsthafte Schwierigkeit, die mit der Einführung des Begriffsder Folge erleichtert wird. Eine Folge besteht aus unendlich vielen Elementen,ist selbst aber nur eine einzige Größe. Wir ordnen also die unendlichvielen Elemente in einer Folge zusammen und gelangen so von der Unendlichkeitzu einem. Nach diesem semantischem Kunstgriff sind wir daher in


184 13. Folgen und GrenzwerteAbb. 13.2. Der schwedische Erfinder J.P. Johansson mit zwei verschiedenenModellen verstellbarer Schraubenschlüsselder Lage, von einer Folge zu reden und können für den Augenblick vergessen,dass eine Folge tatsächlich unendlich viele Elemente enthält.Das ist so, als ob wir von dem Werkzeugkoffer des idealen Profimechanikers,der die Folge {0, 66 ...667 n } ∞ n=1 unendlich vieler Schraubenschlüsselenthält, als einer Größe sprechen würden: Einem Werkzeugkoffermit unendlich vielen Schraubenschlüsseln. Einen Werkzeugkoffer Schraubenschlüsselzu nennen, klingt zunächst merkwürdig, aber wenn wir denWerkzeugkoffer zunächst einmal so etwas wie Superschraubenschlüssel“”nennen würden, und dann später das Super“ weglassen?”Ähnlich können wir 0, 6666 ...als Superzahl“ bezeichnen, da sie unendlichviele Dezimalstellen hat, dann das Super“ vergessen und sagen,dass””0, 6666 ...eine Zahl ist. Das macht tatsächlich auch Sinn, da wir 0, 6666 ...mit 2 3, einer Zahl, identifizieren. Im Folgenden werden wir auf nicht periodischeunendliche Dezimalentwicklungen treffen, die keine rationale Zahlensind. Zunächst könnenwirvondiesenZahlenalseineArt Superzahlen“ ”denken. Später werden wir solche Zahlen als reelle Zahlen“ bezeichnen.”Die Diskussion veranschaulicht die Nützlichkeit der Vorstellung einerMenge oder Folge mit unendlich vielen Elementen. Natürlich sollten wiruns der Gefahr bewusst sein, Sprache zu benutzen, um Tatsachen zu verschleiern.Politische Sprache wird oft auf diese Art benutzt, was ein Grundfür die schwindende Glaubwürdigkeit von Politikern ist. Für uns als <strong>Mathematik</strong>ergibt es keinen Grund zu versuchen, so ehrlich wie möglich zusein und Sprache so klar wie möglich einzusetzen.


13.5 Die ǫ − N Definition eines Grenzwertes 18513.5 Die ǫ − N Definition eines GrenzwertesDie mathematische Formulierung eines Grenzwertes besagt, dass die Elementea n einer konvergenten Folge {a n } ∞ n=1 sich vom Grenzwert A beliebigwenig unterscheiden, wenn nur der Index n groß genug ist, und wir habendafür die Schreibweiselim a n = An→∞eingeführt. Es gibt dafür einen mathematischen Jargon, der äußerst populärgeworden ist. Er wurde von Karl Weierstrass (1815–97), vgl. Abb. 13.3,entwickelt und lautet folgendermaßen: Der Grenzwert der Folge {a n } ∞ n=1Abb. 13.3. Weierstrass zu Sonya Kovalevskaya: ”...geträumt und wurde bezaubertvon so vielen Rätseln, die für uns noch zu lösen sind, in endlichen undunendlichen Räumen, zur Stabilität des Weltsystems und zu allen <strong>and</strong>eren größerenProbleme der <strong>Mathematik</strong> und der Physik der Zukunft... .Sie waren mir nahe...mein ganzes Leben lang ..., undnie habe ich jem<strong>and</strong> <strong>and</strong>eren gefunden, dermir soviel Verständnis für die höchsten Ziele der Wissenschaft entgegengebrachthat und eine so freudvolle Übereinstimmung mit meinen Plänen und Grundvorstellungenhatte wie sie“ist gleich A, und wir schreibenlimn→∞ a n = A,falls für jedes (rationale) ǫ>0einenatürliche Zahl N existiert, so dass|a n − A|≤ǫ für alle n ≥ N.Wir wissen beispielsweise, dass der Wert 10/9durchdasElement1, 11 ...1 nder Folge {1, 11 ...1 n } auf jede angegebene Genauigkeit (größer als 0) angenähertwerden kann, wenn n groß genug gewählt wird. Von (13.2) wissenwir, dass ∣ ∣∣∣ 109 − 1, 11 ...1 n∣ ≤ 10−n


186 13. Folgen und Grenzwerteund folglich ∣ ∣∣∣ 109 − 1, 11 ...1 n∣ ≤ ǫgilt, falls 10 −n ≤ ǫ. Wir können dies so formulieren, dass10∣ 9 − 1, 11 ...1 n∣ ≤ ǫ,wenn n ≥ N mit 10 −N ≤ ǫ. Istǫ =0,p 1 p 2 ...mit p 1 = p 2 = ...= p m =0und p m+1 ≠0,sokönnen wir dazu jedes N mit N ≥ m wählen. Wir sagen,dass eine kleinere Wahl von ǫ ein größeres N verlangt. Somit hängt N vonǫ ab.Wir wollen betonen, dass die ǫ − N Definition der Konvergenz etwasausgefallen für die Aussage ist, dass der Abst<strong>and</strong> |A − a n | kleiner als jedegegebene Zahl gemacht werden kann, wenn nur n groß genug gewählt wird.Das Risiko (und die Versuchung) besteht darin, die ǫ − N Definitionder Konvergenz zu benutzen, statt der etwas schwerfälligeren ”so klein wirwollen, wenn nur n groß genug ist“. Die Aussage ”|A − a n | kann kleinergemacht werden als jede vorgegebene positive Zahl, wenn nur n groß genugist“, ist eine sehr qualitative Aussage. Nichts wird darüber gesagt, wie großn sein muss, um eine gewisse Genauigkeit zu erreichen. Eine sehr qualitativeAussage ist notwendigerweise etwas vage. Auf der <strong>and</strong>eren Seite, sieht dieAussage ”für jedes ǫ>0 existiert ein N, sodass|A − a n |≤ǫ, wennn ≥ N“ sehrpräzise aus, wobei sie tatsächlich so qualitativ ist wie die ersteAussage, wenn die Abhängigkeit von N von ǫ nicht klar ausgedrückt wird.Das Risiko liegt also darin, dass wir bei der Benutzung des ǫ − N-Jargonsverwirrt werden und glauben, dass etwas Vages tatsächlich sehr präzise sei.Natürlich liegt darin auch eine Versuchung, die eng mit der allgemeinenVorstellung zur <strong>Mathematik</strong> als etwas extrem Präzises verknüpft ist. SeienSie also vorsichtig und lassen Sie Sich nicht durch einfache Tricks zumNarren halten: Die ǫ − N Definition eines Grenzwerts ist vage, in demMaße, wie die Abhängigkeit von N von ǫ vage ist.Der Begriff eines Grenzwerts einer Zahlenfolge ist fundamental für dieInfinitesimalrechnung. Er ist eng verbunden mit nicht endenden Dezimalentwicklungen,d.h. Dezimalentwicklungen mit unendlich vielen von Nullverschiedenen Dezimalen. Die Elemente mit dieser Eigenschaft werden dadurcherhalten, dass nach und nach mehr und mehr Dezimale berücksichtigtwerden. Tatsächlich stammt das Hauptinteresse an Folgen von dieser Eigenschaft.Wie so oft hat die Vorstellung einer Folge und von Grenzwertenein Eigenleben entwickelt, das viele Studenten der Infinitesimalrechnunggeplagt hat. Wir werden uns bemühen, Ausschweifungen in diese Richtungzu vermeiden und stattdessen eine enge Verbindung zu der ursprünglichenMotivation, die zur Einführung von Folgen und Grenzwerten führte, zu halten,nämlich die, immer bessere und bessere Näherungen für die Lösungenvon Gleichungen zu suchen.


13.5 Die ǫ − N Definition eines Grenzwertes 187Wir werden nun an H<strong>and</strong> einiger Beispiele den ǫ−N-Jargon praktizieren,um zu zeigen, dass gewisse Folgen Grenzwerte besitzen. Die Folgen, die wirvorstellen, sind ”künstlich“, d.h. zurechtgebastelt, aber wir benutzen sie,um grundlegende Gesichtspunkte zu veranschaulichen. Nach dem Durcharbeitendieser Beispiele, sollte der Leser in der Lage sein, das offenbareMysterium der ǫ − N Definition zu durchschauen, und verstehen, dass eseigentlich etwas sehr Einfaches ausdrückt. Aber bedenken Sie: Die ǫ − NDefinition eines Grenzwerts ist in dem Maße vage, als die Abhängigkeit vonN von ǫ vage ist.Beispiel 13.1. Der Grenzwert der Folge { 1 n }∞ n=1 ist 0, d.h.1limn→∞ n =0.Das liegt auf der H<strong>and</strong>, da 1 nso weit an 0 angenähert werden kann, wie wirmögen, indem wir n groß genug wählen. Wir werden nun diese offensichtliche(und triviale) Tatsache im ǫ − N-Jargon formulieren. Wir müssen alsoden verschlagenen <strong>Mathematik</strong>er zufriedenstellen, der ein ǫ>0 vorgibt undnach einer natürlichen Zahl N fragt, so dass∣ 1 ∣∣∣∣n − 0 ≤ ǫ (13.3)für alle n ≥ N gilt. Um diese Anforderung zu erfüllen, wählen wir irgendeinenatürliche Zahl größer (oder gleich) 1/ǫ für N, beispielsweise die kleinstenatürliche Zahl, die größer oder gleich 1/ǫ ist. Dann ist (13.3) für n ≥N erfüllt und wir haben die verschlagene Anforderung erfüllt und wissen1jetzt, dass lim n→∞ n= 0. In diesem Beispiel ist die Verbindung zwischenǫ und N völlig klar: Wir können N als kleinste natürliche Zahl wählen,die größer oder gleich 1/ǫ ist. Ist beispielsweise ǫ =1/100, dann N =100. Wir hoffen, dass die Leserin/der Leser die Verbindung zwischen dereinfachen Vorstellung, dass 1/n so nahe an 0 herankommt, wie wir mögen,indem wir n genügend groß wählen, und der pompösen Formulierung diesesGedankens im ǫ − N-Jargon knüpfen kann.Beispiel 13.2. Als Nächstes zeigen wir, dass der Grenzwert der Folge{ nn+1 }∞ n=1 = {1 2 , 2 3,...} gleich 1 ist, d.h.limn→∞n=1. (13.4)n +1Zunächst berechnen wir∣ 1 − n∣ ∣∣∣ n +1∣ = n +1− nn +1 ∣ = 1n +1 .nDaraus sehen wir, dassn+1beliebig nahe an 1 herankommt, wenn n großgenug ist, wodurch die Aussage bewiesen ist. Wir formulieren dies nun im


188 13. Folgen und Grenzwerte1ǫ − N-Jargon. Sei ein ǫ>0 gegeben.n+1≤ ǫ gilt für n ≥ 1/ǫ − 1. Daher∣ist ∣1 − nn+1∣ ≤ ǫ für alle n ≥ N, vorausgesetzt, dass N ≥ 1/ǫ − 1gewähltwurde. Dadurch ist die Aussage ebenfalls bewiesen.Beispiel 13.3. Die Summe1+r + r 2 + ···+ r n =n∑r i = s nwird endliche geometrische Reihe der Ordnung n mit Faktor r genannt. Sieenthält die Potenzen r i des Faktors r bis i = n. Wir haben diese Reihebereits oben mit r =0, 1 und s n =1, 11 ...11 n kennen gelernt. Wir betrachtennun einen beliebigen Wert für den Faktor r im Intervall |r| < 1.Wir wiederholen die Formels n =n∑i=0i=0r i = 1 − rn+1,1 − rdie für alle r ≠ 1 gilt. Was passiert, wenn die Anzahl n von Ausdrückengrößer und größer wird? Es liegt auf der H<strong>and</strong>, die Folge {s n } ∞ n=1 zu betrachten,um diese Frage zu beantworten. Wir werden beweisen, dass für|r| < 1lim s n = lim (1 + r +n→∞ n→∞ r2 + ···+ r n )= 1 (13.5)1 − rgilt, was wir in der Form∞∑i=0r i = 1 , für |r| < 11 − rschreiben. Rein intuitiv fühlen wir, dass dies stimmt, da r n+1 so klein wirdwie wir mögen, indem wir n groß genug wählen (bedenken Sie, dass |r| < 1).Wir nennen ∑ ∞i=0 ri eine unendliche geometrische Reihe mit Faktor r.Wir wollen nun einen ǫ − N-Beweis für (13.5) geben. Dazu müssen wirzeigen, dass für ein ǫ>0einN existiert, so dass∣1 − r n+11 − r− 1∣ ∣∣∣ 1 − r∣ = r n+11 − r∣ ≤ ǫfür alle n ≥ N gilt. An dieser Stelle ist es ausreichend, da |r| < 1ist,einN zu finden, mit|r| N+1 ≤ ǫ |1 − r|. (13.6)Da |r| < 1ist,können wir |r| N+1 so klein machen, wie wir wollen, indemwir N genügend groß wählen. Deswegen können wir die Ungleichung(13.6) erfüllen, indem wir N genügend groß machen. Unten werden wir dieLogarithmus-Funktion definieren und damit einen genauen Wert für N alsFunktion von ǫ in (13.6) erhalten.


13.6 Konvergente Folgen haben eindeutige Grenzwerte 18913.6 Konvergente Folgenhaben eindeutige GrenzwerteDer Grenzwert einer konvergenten Folge ist eindeutig definiert. Das sollteeigentlich selbsterklärend sein, da es unmöglich ist, gleichzeitig beliebig nahean zwei verschiedenen Zahlen heranzukommen. Versuchen Sie es! Wirgeben hier einen etwas längeren Beweis und benutzen dabei typische Argumente,wie sie oft in <strong>Mathematik</strong>büchern gefunden werden. Die Leserin/derLeser kann aus diesen Argumenten lernen und verstehen, dass etwas scheinbarSchwieriges tatsächlich eine sehr einfache Idee verstecken kann.Wir beginnen mit der folgenden Form der Dreiecksungleichung, s. (7.15):|a − b|≤|a − c| + |c − b|. (13.7)Sie gilt für alle a, b und c. Angenommen, die Folge {a n } ∞ n=1 konvergiere zuzwei unterschiedlichen Zahlen A 1 und A 2 . Aus (13.7) erhalten wir für jedesn mit a = A 1 , b = A 2 und c = a n|A 1 − A 2 |≤|A 1 − a n | + |a n − A 2 |.Da a n gegen A 1 konvergiert, können wir |A 1 − a n | beliebig klein machen,für ein genügend großes n insbesondere auch kleiner als 1 4 |A 1 − A 2 |, fallsA 1 ≠ A 2 .Entsprechendkönnen wir auch |a n −A 2 | < 1 4 |A 1 −A 2 | erreichen,wenn wir n groß genug wählen. Mit (13.7) bedeutet dies, dass für große n|A 1 − A 2 |≤ 1 2 |A 1 − A 2 | gilt, was nur stimmen kann, wenn A 1 = A 2 ,wasder Annahme A 1 ≠ A 2 widerspricht, die folglich falsch sein muss.Gilt lim n→∞ a n = A, dann beispielsweise auch lim n→∞ a n+1 = A undlim n→∞ a n+7 = A. Anders ausgedrückt interessiert für den Grenzwertlim n→∞ a n nur der ”Schwanz“ einer Folge {a n }.13.7 Lipschitz-stetige Funktionen und FolgenEin entscheidender Grund für die Einführung Lipschitz-stetiger Funktionenf :Q→Q ist die folgende Verbindung zu Folgen rationaler Zahlen. Sei {a n }eine konvergierende Folge mit dem rationalen Grenzwert lim n→∞ a n undsei f :Q→Qeine Lipschitz-stetige Funktion mit der Lipschitz-KonstantenL. Welche Aussagen sind bezüglich der Folge {f(a n )} möglich? Konvergiertsie und falls ja, wozu?Die Antwort ist einfach: Die Folge {f(a n )} konvergiert gegenlimn→∞ f(a n)=f(limn→∞ a nDer Beweis ist ebenfalls einfach. Aus der Lipschitz-Stetigkeit von f :Q→Qergibt sich ∣ ( )∣ ∣ ∣∣f(am ∣∣) − f lim a ∣∣amn ≤ L − lim a ∣n∣.n→∞ n→∞).


190 13. Folgen und GrenzwerteDa {a n } gegen A konvergiert, kann die rechte Seite durch ein genügendgroßes m kleiner gemacht werden als jede vorgegebene positive Zahl. Somitwird auch die linke Seite kleiner als jede positive Zahl, falls m groß genuggewählt wird, wodurch der Beweis geliefert ist.Beachten Sie, dass, da lim n→∞ a n eine rationale Zahl ist, der Funktionswertf(lim n→∞ a n )wohldefiniertist,dawirvonf :Q→Q ausgehen.Dabei genügt es, dass f(x) Lipschitz-stetig ist auf einem Intervall I,dasalle Elemente a n und den Grenzwert lim n→∞ a n enthält. Somit haben wirdas folgende wichtige Ergebnis bereits bewiesen.Satz 13.1 Sei {a n } eine Folge mit rationalem Grenzwert lim n→∞ a n .Seif : I → Q eine Lipschitz-stetige Funktion mit a n ∈ I für alle n undlim n→∞ a n ∈ I.Danngiltlimn→∞ f(a n)=f(limn→∞ a n). (13.8)Beachten Sie, dass die Wahl eines abgeschlossenen Intervalls I garantiert,dass lim n→∞ a n ∈ I, falls a n ∈ I für alle n.Wir wollen jetzt einige Beispiele betrachten.Beispiel 13.4. Bei dem Modell zum Bakterienwachstum im Kapitel ”RationaleZahlen“, müssen wirlimn→∞ P n = limn→∞112 n Q 0 + 1 K(1 − 12 n )berechnen. Die Folge {P n } wird durch Anwendung der Funktionf(x)=1Q 0 x + 1 K(1 − x)auf die Elemente der Folge { }12 erhalten. Da n limn→∞ 1/2 n =0,erhaltenwir lim n→∞ P n = f(0) = K, daf beispielsweise auf dem Intervall [0, 1/2]Lipschitz-stetig ist. Die Lipschitz-Stetigkeit ergibt sich aus der Tatsache,dass f(x) aus der Funktion f 1 (x) =Q 0 x + 1 K(1 − x) und der Funktionf 2 (y)=1/y zusammengesetzt ist.Beispiel 13.5. Die Funktion f(x)=x 2 ist Lipschitz-stetig auf beschränktenIntervallen. Konvergiert {a n } ∞ n=1 gegen einen rationalen Grenzwert A, sofolgern wir, dasslim (a n) 2 = A 2 .n→∞Im nächsten Kapitel werden wir uns mit der Berechnung von lim n→∞ (a n ) 2für eine spezielle Folge {a n } ∞ n=1 , die wir aus dem Modell für den schlammigenHof kennen, beschäftigen, was mit einer Überraschung enden wird.Können Sie erraten, um was es dabei geht?


13.8 Verallgemeinerung auf Funktionen zweier Variablen 191Beispiel 13.6. Aus Satz 13.1 ergibt sich bei entsprechender Wahl (welcher?)von f(x):( 3+1)9 (nlimn→∞ 4+ 2 = limn→∞n3+ 1 )9n4+ 2 nBeispiel 13.7. Aus Satz 13.1 folgt=(limn→∞ (3 + 1 n ))9 ( ) 9 3lim n→∞ (4 + 2 n ) = .4limn→∞ (2−n ) 7 + 14(2 −n ) 4 − 3(2 −n )+2=0 7 +14× 0 4 − 3 × 0+2=2.13.8 Verallgemeinerung auf Funktionenzweier VariablenWir wiederholen, dass eine Funktion f : I × J → Q zweier rationalerVariablen, wobei I und J abgeschlossene Intervalle inQsind, Lipschitzstetigist, wenn es eine Konstante L gibt, so dass|f(x 1 ,x 2 ) − f(¯x 1 , ¯x 2 )|≤L(|x 1 − ¯x 1 | + |x 2 − ¯x 2 |),für x 1 , ¯x 1 ∈ I und x 2 , ¯x 2 ∈ J.Seien nun {a n } und {b n } zwei konvergente Folgen rationaler Zahlen, mita n ∈ I und b n ∈ J. Dann gilt()f lim a n, lim b nn→∞ n→∞= limn→∞ f(a n,b n ). (13.9)Der Beweis folgt sofort:()(∣ ∣ ∣ ∣)∣∣f lim a n, lim b ∣∣ ∣∣ ∣∣ ∣∣n − f (a m ,b m ) ∣ ≤ L lim a n − a m + lim b n − b mn→∞ n→∞ n→∞ n→∞(13.10)da die rechte Seite beliebig klein gemacht werden kann, indem m groß genuggewählt wird.Wir geben eine erste Anwendung dieses Ergebnisses für die Funktionf(x 1 ,x 2 )=x 1 +x 2 ,dieaufQ×Q Lipschitz-stetig zur Lipschitz-KonstantenL = 1 ist. Wir folgern aus (13.9)lim (a n + b n ) = lim a n + lim b n, (13.11)n→∞ n→∞ n→∞was besagt, dass der Grenzwert einer Summe gleich der Summe der Grenzwerteist.Ähnlich ergibt sich natürlich für die Funktion f(x 1 ,x 2 )=x 1 − x 2 :limn→∞ (a n − b n ) = limn→∞ a n − limn→∞ b n.


192 13. Folgen und GrenzwerteAls Spezialfall ergibt sich durch die Wahl a n = a für alle nlim (a + b n)=a + lim b n.n→∞ n→∞Als Nächstes betrachten wir die Funktion f(x 1 ,x 2 )=x 1 x 2 ,dieaufI ×JLipschitz-stetig ist, falls I und J abgeschlossene beschränkte Intervalle inQsind. Mit Hilfe von (13.9) ergibt sich für zwei konvergente Folgen rationalerZahlen {a n } und {b n },dasslim (a n × b n ) = lim a n × lim b nn→∞ n→∞ n→∞gilt, was besagt, dass der Grenzwert von Produkten gleich dem Produktder Grenzwerte ist.Als Spezialfall ergibt sich durch die Wahl a n = a für alle nlim (a × b n)=a lim b n.n→∞ n→∞Wir wollen jetzt die Funktion f(x 1 ,x 2 )=x 1 /x 2 betrachten, die auf I×JLipschitz-stetig ist, falls I und J abgeschlossene Intervalle inQsind und Jnicht die 0 enthält. Ist b n ∈ J für alle n und lim n→∞ b n ≠ 0, dann giltlim (a n/b n )= lim n→∞ a n,n→∞ lim n→∞ b nwas besagt, dass der Grenzwert eines Quotienten gleich dem Quotientender Grenzwerte ist, falls der Grenzwert des Nenners ungleich Null ist.13.9 Berechnung von GrenzwertenWir werden nun die obigen Regeln für die Berechnung einiger Grenzwertebenutzen.Beispiel 13.8. Wir betrachten {2+3n −4 +(−1) n n −1 } ∞ n=1 .(lim 2+3n −4 +(−1) n n −1)n→∞= lim 2 + 3 limn→∞ n→∞ n−4 + limn→∞ (−1)n n −1=2+3× 0+0=2.Wir nutzen (13.11), um dieses Beispiel zu lösen und die Tatsache, dassfür jede natürliche Zahl p gilt.(limn→∞ n−p = lim n−1) p=0 p =0n→∞


Weitere wichtige Ergebnisse sindlimn→∞ rn =13.9 Berechnung von Grenzwerten 193⎧0 falls |r| < 1,⎪⎨1 falls r =1,divergiert zu ∞ falls r>1,⎪⎩divergiert sonst.Wir bewiesen dies für r =1/2 im Beispiel 13.4 und Sie werden die Verallgemeinerungspäter als Aufgabe zeigen.Beispiel 13.9. Mit Hilfe von Beispiel 13.3 können wir die Grenzwerte fürdas Bakterienwachstum, vgl. Beispiel 13.4, bestimmen. Es giltlim P n =n→∞=limn→∞112 n Q 0 + limn→∞10+ 1 K (1 − 0) = K.(11 − 1 )K 2 nAnders formuliert strebt eine Bakterienpopulation, die mit einschränkendenRessourcen wächst, nach dem Verhulst Modell gegen eine konstantePopulation.Beispiel 13.10. Wir untersuchen} ∞ {4 1+n−33+n −2 .n=1Wir berechnen den Grenzwert mit Hilfe verschiedener Regeln:Beispiel 13.11. Wir untersuchenlim 4 1+n−3n→∞ 3+n −2 =4lim n→∞(1 + n −3 )lim n→∞ (3 + n −2 )=4 1 + lim n→∞ n −33 + lim n→∞ n −2=4 1+03+0 = 4 3 .{6n 2 ∞+24n 2 .− n + 1000}n=1Überlegen Sie Sich, was passiert, wenn n groß wird, bevor wir den Grenzwertberechnen. Im Zähler wird 6n 2 viel größer als 2, wenn n groß ist und


194 13. Folgen und Grenzwerteganz ähnlich wird im Zähler 4n 2 betragsmäßig viel größer als −n + 1000,wenn n groß ist. Daher könnten wir vermuten, dass für große n6n 2 +24n 2 − n + 1000 ≈ 6n24n 2 = 6 4gilt. Das wäre ein guter Tipp für den Grenzwert. Um zu sehen, dass dieswirklich stimmt, benutzen wir einen Trick, der die Folge in eine bessereForm für die Grenzwertberechnung bringt:limn→∞6n 2 +24n 2 − n + 1000 = limn→∞(6n 2 +2)n −2(4n 2 − n + 1000)n −26+2n −2= limn→∞ 4 − n −1 + 1000n −2= 6 4 ,womit wir, wie im vorherigen Beispiel, die Berechnung abgeschlossen haben.Der Trick, Zähler und Nenner eines Bruchs mit einer Potenz zu multiplizieren,lässt sich auch einsetzen, um herauszufinden, ob eine Folge gegenNull konvergiert oder gegen Unendlich divergiert.Beispiel 13.12.n 3 − 20n 2 +1 (n 3 − 20n 2 +1)n −3limn→∞ n 8 = lim+2n n→∞ (n 8 +2n)n −31 − 20n −1 + n −3= limn→∞ n 5 +2n −2 .Hieraus erkennen wir, dass der Zähler gegen 1 konvergiert und der Nennerbeliebig groß wird. Daher giltBeispiel 13.13.n 3 − 20n 2 +1limn→∞ n 8 =0.+2n−n 6 + n +10 (−n 6 + n + 10)n −4limn→∞ 80n 4 = lim+7 n→∞ (80n 4 +7)n −4−n 2 + n −3 +10n −4= limn→∞ 80 + 7n −4 .Hieraus erkennen wir, dass der Zähler ohne Beschränkung ins Negativeanwächst, während der Zähler gegen 80 konvergiert. Daherdivergiert{ −n 6 + n +1080n 4 +7} ∞n=1gegen −∞.


13.10 Computerdarstellung rationaler Zahlen 19513.10 Computerdarstellung rationaler ZahlenDie Dezimalentwicklung ±p m p m−1 ...p 1 p 0 ,q 1 q 2 ...q n basiert auf der Basis10, und folglich kann jede der Ziffern p i und q j einen der 10 Werte0, 1, 2,...9 annehmen. Natürlich können auch <strong>and</strong>ere Basen als 10 benutztwerden. So nutzten beispielsweise die Babylonier die Basis sechzig und ihreZiffern umfassten daher den Bereich von 0 bis 59. Computer arbeiten mitder Basis 2 und den zwei Ziffern 0 und 1. Eine Zahl in Basis 2 hat die Form± p m 2 m + p m−1 2 m−1 + ···+ p 2 2 2 + p 1 2 1 + p 0 2 0 + q 1 2 −1 + q 2 2 −2was wir wiederum in der Kurzform+ ···+ q n−1 2 −(n−1) + q n 2 −n ,±p m p m−1 ...p 1 p 0 ,q 1 q 2 ...q n = p m p m−1 ...p 1 p 0 +0,q 1 q 2 ...q nschreiben können, wobei n und m natürliche Zahlen sind und p i und q jjeweils den Wert 0 oder 1 annehmen. So ist beispielsweise in Basis zwei11, 101 = 1 · 2 1 +1· 2 0 +1· 2 −1 +1· 2 −3 .In der Fließkomma-Arithmetik eines Computers werden Zahlen mit denüblichen 32 Bits in der Form±r2 Ndargestellt, wobei 1 ≤ r ≤ 2dieMantisse ist. Der Exponent N ist eine ganzeZahl. Von den 32 Bits werden 23 Bits für die Speicherung der Mantissebenutzt, 8 Bits werden für den Exponenten verwendet und ein Bit wird fürdas Vorzeichen benötigt. Da 2 10 ≈ 10 3 ist, kann die Mantisse zwischen 6und 7 Dezimalstellen darstellen. Der Exponent N kann sich zwischen −126und 127 bewegen, woraus folgt, dass sich der Absolutbetrag von Zahlen,die in einem Computer gespeichert werden können, etwa zwischen 10 −40und 10 40 bewegt. Zahlen außerhalb dieses Bereichs können mit 32 Bitsim Computer nicht dargestellt werden. Einige Sprachen erlauben die Verwendungvon doppelt genauen Variablen (double precision) mit 64 Bits,wobei 11 Bits für den Exponenten benutzt werden, der somit den Bereich−1022 ≤ N ≤ 1023 abdeckt, und 52 Bits werden für die Speicherung derMantisse eingesetzt, was circa 15 Dezimalstellen entspricht.Wir betonen, dass die endliche Speicherungsfähigkeit eines Computerszwei Effekte beim Umgang mit rationalen Zahlen hat. Der erste Effekt istdem Effekt bei der Speicherung ganzer Zahlen ähnlich, nämlich der, dassnur Zahlen in einem endlichen Bereich gespeichert werden können. Derzweite Effekte ist etwas spitzfindig, hat aber weitaus ernstere Konsequenzen.Das ist die Tatsache, dass Zahlen nur mit einer gewissen Anzahl vonStellen gespeichert werden. Jede rationale Zahl, die mehr als eine endliche


196 13. Folgen und GrenzwerteAnzahl von Stellen in ihrer Dezimalentwicklung benötigt, was beispielsweiseauf alle rationalen Zahlen mit unendlichen periodischen Entwicklungenzutrifft, werden deshalb auf dem Computer mit einem Fehler behaftet gespeichert.So wird beispielsweise 2/11 als 0, 1818181 oder 0, 1818182 gespeichert,je nachdem ob der Computer rundet oder nicht.Aber das ist noch nicht alles. Ein Fehler in der 7. oder 15. Stelle wärenicht so problematisch, wenn man von der Tatsache absähe, dass solcheRundungsfehler sich beim Ausführen arithmetischer Operationen akkumulieren.Anders ausgedrückt kann das Ergebnis der Addition zweier mit einemkleinen Fehler behafteter Zahlen einen größeren Fehler aufweisen, derder Summe der einzelnen Fehler entspricht (wenn die Fehler nicht unterschiedlichesVorzeichen haben oder sich sogar gegenseitig auslöschen).Wir geben weiter unten im Kapitel ”Reihen“ ein Beispiel, das überraschendeErgebnisse aufzeigt, wie Sie beim Arbeiten mit endlichen Dezimaldarstellungenmit Rundungsfehler auftreten können.13.11 Sonya Kovalevskaya: Die erste Frauauf einem <strong>Mathematik</strong>lehrstuhlSonya Kovalevskaya (1850–91) war bei Weierstrass Studentin und sie erhielt1889 als erste Frau überhaupt eine Professur in <strong>Mathematik</strong> an der UniversitätStockholm, vgl. Abb. 13.4. Ihr Mentor war der berühmte schwedischeAbb. 13.4. Sonya Kovalevskaya, erste Frau mit einer <strong>Mathematik</strong>professur: ”Ichfühlte allmählich eine so starke Anziehung zur <strong>Mathematik</strong>, dass ich meine <strong>and</strong>erenStudien mehr und mehr vernachlässigte“ (im Alter von 11)<strong>Mathematik</strong>er Gösta Mittag-Leffler (1846–1927), der die PrestigezeitschriftActa Mathematica gründete, vgl. Abschnitt 22.12.


Aufgaben zu Kapitel 13 197Kovalevskaya erhielt 1886 den mit 5.000 Francs dotierten Prix Bordinfür ihre Veröffentlichung Mèmoire sur un cas particulier du problème de lerotation d’un corps pesant autour d’un point fixe, ou l’intgration s’effectuel’aide des fonctions ultraelliptiques du temps. Sie starb auf dem Höhepunktihrer Karriere mit nur 41 Jahren an einer Grippe, die durch eine Lungenentzündungkompliziert wurde.Aufgaben zu Kapitel 1313.1. Zeichnen Sie die Funktionen (a) 2 −n ,(b)5 −n und (c) 10 −n für natürlicheZahlen n. Vergleichen Sie die Kurven.13.2. Zeichnen Sie die Funktion f(n)= 10 9 (1 − 10−n−1 ), n ∈ Æ.13.3. Schreiben Sie die folgenden Folgen in Index-Schreibweise:(a) {1, 3,9, 27,...} (b) {16, 64, 256,...}(c) {1, −1, 1, −1,1,...} (d) {4, 7, 10, 13,...}(e) {2, 5, 8,11,...} (f) {125, 25,5, 1, 1 5 , 1 25 , 1125 ,...}.13.4. Beweisen Sie die folgenden Grenzwerte mit Hilfe der formalen Definitiondes Grenzwertes:8(a) limn→∞ 3n +1 = 04n +3(b) limn→∞ 7n − 1 = 4 7n 2(c) limn→∞ n 2 +1 =1.13.5. Zeigen Sie, dass limn→∞ rn =0für ein beliebiges r mit |r| ≤1/2.13.6. Eines der klassischen Paradoxa, das von griechischen Philosophen aufgestelltwurde, lässt sich mit Hilfe geometrischer Reihen lösen. Angenommen, Siebefinden sich mit Ihrem Fahrrad in der Lüneburger Heide, 32 Kilometer von zuHause weg. Eine Speiche ist gebrochen, Sie haben kein Essen mehr, eben das letzteWasser ausgetrunken, Sie haben kein Geld bei sich und jetzt fängt es auch nochan zu regnen. Während Sie nach Hause fahren, kommt Ihnen ein schrecklicherGedanke: Sie können nie nach Hause kommen! Sie denken: Zunächst muss ich 16Kilometer fahren, dann 8 Kilometer, dann 4, dann 2, dann 1, dann 1/2, dann 1/4u.s.w. Offensichtlich bleibt immer ein kleiner Weg übrig, den Sie noch zurücklegenmüssen, egal wie nahe Sie auch sind. Sie müssen eine unendliche Anzahl vonStrecken zurücklegen, um irgendwohin zu kommen! Die griechischen Philosophenwussten nicht mit Grenzwerten von Folgen umzugehen, so dass dieses Problemihnen einiges Kopfzerbrechen bereitete. Erklären Sie mit Hilfe der Summe einergeometrischen Reihe, warum hier kein Paradoxon vorliegt.


198 13. Folgen und Grenzwerte13.7. Beweisen Sie folgende Aussagen mit Hilfe der formalen Definition derDivergenz gegen Unendlich:(a) lim −4n +1=−∞n→∞(b) limn→∞ n3 + n 2 = ∞.13.8. Zeigen Sie, dass limn→∞ rn = ∞ für ein beliebiges r mit |r| ≥2.13.9. Finden Sie die Ergebnisse von(a) 1 − 0, 5+0,25 − 0,125 + ···(b) 3 + 3 4 + 316 + ···(c) 5 −2 +5 −3 +5 −4 + ···13.10. FindenSieFormelnfür die Summen der folgenden Reihen mit Hilfe derFormel für die Summe der geometrischen Reihe für |r| < 1:(a) 1 + r 2 + r 4 + ···(b) 1 − r + r 2 − r 3 + r 4 − r 5 + ···13.11. Bestimmen Sie, wie viele verschiedene Folgen sich in der folgenden Auflistungverbergen, und identifizieren Sie gleiche Folgen. 4n/2 ∞ 2 n ∞(a)(b)4+(−1) n n=14+(−1) n n=1(c)2 car4+(−1) car ∞car =12 n+2(d)2 n−14+(−1) n−1 ∞n=2 ∞ ∞(e)(f) 8.4+(−1) n+2 n=04+(−1) n+3 n=−2 2+n2 ∞13.12. Schreiben Sie die Folgeum, so dass: (a) der Index n von9 n n=1−4 gegen ∞ läuft, (b) der Index n von 3 gegen ∞ läuft, (c) der Index n von 2gegen −∞ läuft.13.13. Zeigen Sie, dass (7.14) bei den folgenden Fällen gilt: a0. Zeigen Sie mit Hilfe von (7.14) unda − c + c − b = a − b, dass (13.7) gilt.13.14. Angenommen {a n} ∞ n=1 konvergiere gegen A und {b n} ∞ n=1 gegen B.ZeigenSie, dass {a n − b n} ∞ n=1 gegen A − B konvergiert.13.15. (Schwierig) Angenommen {a n} ∞ n=1 konvergiere gegen A und {b n} ∞ n=1gegen B. Zeigen Sie, dass für b n ≠0für alle n und B ≠0,{a n/b n} ∞ n=1 gegenA/B konvergiert. Hinweis: Schreiben Sie2 na nb n− A B = anb n− anB + anB − A B .Nutzen Sie, dass für n groß genug, |b n|≥B/2, wobei Sie dies erst schlüssig zeigensollten!


Aufgaben zu Kapitel 13 19913.16. Berechnen Sie die Grenzwerte der Folgen {a n} ∞ n=1 mit folgenden Elementenoder beweisen Sie deren Divergenz.(a) a n =1+ 7 n(b) a n =4n 2 − 6n(c) a n = (−1)n(d) an 2 n = 2n2 +9n +36n 2 +2(e) a n = (−1)n n 27n 2 +1(g) a n = (n − 1)2 − (n +1) 2n n 2(f) a n = +23(h) a n =1 − 5n 84+51n 3 +8n 8(i) a n = 2n3 + n +16n 2 − 5(j) a n =7¡ n− 18¡ n+1 .7813.17. Berechnen Sie die folgenden Grenzwerte: 37 n +3(a) limn→∞ 2n +8(c) limn→∞12+ 1 n 31(b) limn→∞ n + 2 42 n +7 ¼ ¡ 8(d) lim 1+ 2 2 3 4 ½ 5 .n→∞ n13.18. Schreiben Sie auf drei verschiedene Arten diese Folgen, als Funktionangewendet, auf eine <strong>and</strong>ere Folge:(a)´n 2 µ 3 ∞+2n 2 +1n=1(b) ¨(n 2 ) 4 +(n 2 ) 2 +1 © ∞n=1 .13.19. Zeigen Sie, dass die unendliche Dezimalentwicklung 0, 9999 ... gleich 1ist. Anders ausgedrückt,zeigenSie,dasslim 0, 99 ...99n =1,n→∞wobei 0, 99 ...99 n n Dezimalstellen, alle gleich 9, besitzt.13.20. Bestimmen Sie die Anzahl Ziffern, die für die Speicherung rationalerZahlen in der von Ihnen benutzten Programmiersprache benutzt wird. Rundetdie Sprache die Zahlen oder werden Zahlen abgeschnitten?13.21. Die Maschinengenauigkeit u ist die kleinste in einem Computer darstellbarepositive Zahl u,die1+u>1erfüllt. Beachten Sie, dass u nicht Null ist! Ineiner einfach-genauen Sprache ist beispielsweise 1+0, 00000000001 = 1. ErklärenSie, warum. Schreiben Sie ein kleines Programm, dass u für Ihren Computer undIhre Programmiersprache berechnet. Hinweis: 1 + 0, 5 > 1 in jeder Programmiersprache.Ebenso ist 1 + 0, 25 > 1. Setzen Sie dies fort.


14Wurzel ZweiDer ist es nicht wert, ein Mann genannt zu werden, der nicht weiß,dass die Diagonale eines Quadrates nicht vergleichbar ist mit seinerSeite. (Platon)Genauso wie die Einführung der irrationalen Zahlen ein vereinfachenderMythosist,derdieGesetzederArithmetikvereinfacht...sosind physikalische Objekte postulierte Größen, die die Darstellungunseres Lebensflusses abrunden und vereinfachen. ..Die Begriffsweltphysikalischer Objekte ähnelt einem praktischen Mythos, einfacherals literarische Wahrheiten, und doch enthält sie diese literarischenWahrheiten als Einzelteil. (Quine)14.1 EinleitungWir haben die Gleichung x 2 = 2 bereits im Zusammenhang mit demschlammigen Hof kennen gelernt, wo wir versuchten die Länge der Diagonaleeines Quadrats mit Seitenlänge 1 zu bestimmen. In der Schule habenwir gelernt, dass x = √ 2 die (positive) Lösung der Gleichung x 2 =2ist.Aber einmal ehrlich, was ist √ 2? Wir können der Einfachheit halber sagen,dass es die Lösung der Gleichung x 2 =2istoder ”die Zahl, die quadriert 2ergibt“. Aber das führt uns auf einen Zirkelschluss, der uns nicht viel beimKauf eines Rohrs der Länge √ 2helfenwird.Sie mögen aus der Schulzeit noch wissen, dass √ 2 ≈ 1, 41, aber die Rechnung1, 41 2 =1, 9881 zeigt uns, dass √ 2 nicht wirklich gleich ist mit 1, 41.Ein besserer Tipp ist 1, 414, aber damit erhalten wir 1, 414 2 =1, 999386.


202 14. Wurzel ZweiWir benutzen MAPLE , um die Dezimalentwicklung von√2 auf 415 Dezimalegenau zu berechnen:x =1,414213562373095048801688724209698078569671875376948073176679737990732478462107038850387534327641572735013846230912297024924836055850737212644121497099935831413222665927505592755799950501152782060571470109559971605970274534596862014728517418640889198609552329230484308714321450839762603627995251407989687253396546331808829640620615258352395054745750287759961729835575220337531857011354374603408498847160386899970699.Wenn wir wieder mit MAPLE damit x 2 berechnen, erhalten wirx 2 =1,9999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999863810370027903935475449214815675207193643367223922486271791890987870158099602326405972613126407604056912999503092957478318885969500708874056058336501652271573809445593320690045817264222173935969533242515158760233604272994889141803598971038204956184812333321625160160972831371230644994979436534796986297766833340665770240318513306002427232125175273043547767486608089987807935797774759645877082503170068870585486010.Die Zahl x =1, 4142 ...699 genügt der Gleichung x 2 = 2 mit hoher Genauigkeit,aber nicht exakt. Tatsächlich erhalten wir mit einer endlichenDezimalentwicklung, egal wie viele Nachkommastellen wir dabei auch benutzen,niemals eine Zahl, die quadriert genau 2 ergibt. Allem Anschein


14.2 √ 2 ist keine rationale Zahl! 203nach haben wir nicht wirklich den genauen Wert von √ 2erhalten.Wielautet er also?Um einen Hinweis zu bekommen, können wir die Dezimalentwicklungvon √ 2 auf ein Muster hin untersuchen. Allerdings besitzen die ersten 415Nachkommastellen kein periodisches Muster.14.2 √ 2 ist keine rationale Zahl!In diesem Abschnitt zeigen wir, dass √ 2 keine rationale Zahl der Formp/q, wobeip und q ganze Zahlen sind, sein kann, und dass folglich dieDezimalentwicklung von √ 2 nicht periodisch sein kann. Im Beweis werdenwir die Eindeutigkeit der Primzahlzerlegung natürlicher Zahlen ausnutzen,die wir im Kapitel ”Natürliche und ganze Zahlen“ gezeigt haben. Eine Folgeder Faktorisierung in Primzahlen ist die folgende Tatsache: Angenommen,2 ist ein Faktor von n.Istn = pq eine Faktorisierung von n in ganze Zahlenp und q, dann folgt daraus, dass mindestens einer der Faktoren p oder qdurch 2 ohne Rest teilbar sein muss.Wir argumentieren über einen Widerspruch, indem wir zeigen, dass dieAnnahme, dass √ 2 rational ist, zu einem Widerspruch führt, und somit√2 nicht rational sein kann. Wir nehmen an, dass√2=p/q, wobeipund q teilerfremd sind. Hätten also beispielsweise p und q den Teiler 3, soersetzen wir p durch p/3 und q durch q/3, was den Quotienten p/q nichtverändert. Wir schreiben unsere Annahme um in √ 2q = p, wobeip und qwie gesagt teilerfremd sind und quadrieren beide Seiten zu 2q 2 = p 2 .Dadie linke Seite den Faktor 2 enthält, muss auch die rechte Seite p 2 durch2 teilbar sein, d.h. p muss eine gerade Zahl sein. Daher können wir p =2 × ¯p schreiben, wobei ¯p eine natürliche Zahl ist. Wir folgern daraus, dass2q 2 =4× ¯p 2 , d.h. q 2 =2× ¯p 2 . Somit ergibt dieselbe Argumentation, dass qdurch 2 teilbar sein muss. Also sind sowohl p als auch q durch 2 teilbar, wasunserer Ausgangsannahme widerspricht, dass p und q teilerfremd sind. DieAnnahme, dass √ 2 eine rationale Zahl ist, führt also zu einem Widerspruchund daher kann √ 2 keine rationale Zahl sein.Die eben ausgeführte Argumentation war bereits den Pythagoräern bekannt,die also wussten, dass √ 2 keine rationale Zahl ist. Dieses Wissenverursachte viele Probleme. Auf der einen Seite steht √ 2für die Diagonaleeines Quadrats mit der Kantenlänge eins, weswegen die Existenz von √ 2gesichert scheint. Auf der <strong>and</strong>eren Seite baute die pythagoräische Schulefür Philosophie auf dem Prinzip auf, dass alles durch natürliche Zahlenbeschrieben werden kann. Die Entdeckung, dass √ 2 keine rationaleZahl war, d.h., dass √ 2 sich nicht durch ein Paar natürlicher Zahlen ausdrückenlässt, wirkte wie ein Schock! Der Legende nach wurde die Person,die diesen Beweis entdeckte, von den Göttern bestraft, weil sie eine Unvollkommenheitim Universum aufdeckte. Die Pythagoräer versuchten die


204 14. Wurzel ZweiEntdeckung geheim zu halten und lehrten sie nur einigen Auserwählten,aber die Entdeckung wurde dennoch aufgedeckt und danach löste sich diepythagoräische Schule schnell auf. Zur selben Zeit wurde die euklidischeSchule, die auf Geometrie statt auf Zahlen fußte, einflussreicher. Aus demgeometrischen Blickwinkel schien sich das Problem mit √ 2 ”aufzulösen“,da niem<strong>and</strong> in Frage stellte, dass eine Quadrat der Kantenlänge 1 eine Diagonalemit einer bestimmten Länge hat, und somit lässt sich √ 2einfachals diese Länge definieren. Die Schule der euklidische Geometrie übernahmdie Führung und war durch das Mittelalter hindurch bis Descartes im 17.Jahrhundert beherrschend. Descartes ließ die pythagoräische Schule, die aufZahlen aufbaute, in Form der analytischen Geometrie wieder auferstehen.Da die heutigen digitalen Computer auf natürlichen Zahlen aufbauen oderbesser auf Folgen von 0en und 1en,können wir sagen, dass die Vorstellungenvon Pythagoras heute sehr lebendig sind: Alles kann durch natürlicheZahlen ausgedrückt werden. Andere pythagoräische Dogmen, wie ”iss keineBohne“ und ”hebe nichts auf, was heruntergefallen ist“, haben die Zeitnicht so gut überlebt.14.3 Berechnung von √ 2 durch BisektionWir stellen jetzt einen Algorithmus vor, mit dessen Hilfe eine Folge rationalerZahlen berechnet werden kann, die die Gleichung x 2 = 2 besser undbesser erfüllt. D.h. wir konstruieren eine Folge rationaler Näherungslösungenfür die Gleichungf(x)=0, (14.1)mit f(x)=x 2 − 2. Der Algorithmus baut auf einer Strategie des Ausprobierensauf, die auf f(r) < 0oderf(r) > 0für eine vorgegebene Zahl rprüft,d.h.obr 2 < 2oderr 2 > 2. Alle Zahlen r, die so konstruiert werden,sind rational, so dass keine davon jemals gleich sein kann mit √ 2.Wir beginnen damit, dass f(1) < 0, da 1 2 < 2 und f(2) > 0da2 2 > 2.Da aus 0


14.3 Berechnung von √ 2 durch Bisektion 205Suche so lange wir mögen auf diese Art fortsetzen und bei jedem Schrittzwei rationale Zahlen bestimmen, die eine Lösung von (14.1) ”einschließen“.Dieser Prozess wird Bisektionsalgorithmus genannt.1. Wähle Anfangswerte x 0 und X 0 so, dass f(x 0 ) < 0 und f(X 0 ) > 0.Setze i =1.2. Bei zwei gegebenen rationalen Zahlen x i−1 und X i−1 ,mitf(x i−1 ) < 0und f(X i−1 ) > 0, setze ¯x i =(x i−1 + X i−1 )/2. Stopp, falls f(¯x i )=0. Ist f(¯x i ) < 0, setze x i =¯x i und X i = X i−1 . Ist f(¯x i ) > 0, setze x i = x i−1 und X i =¯x i .3. Erhöhe i um 1 und fahre mit Schritt 2 fort.Wir geben die Ausgabe mit x 0 = 1 und X 0 =2für 20 Schritte diesesAlgorithmuses mit einem MATLAB m-file in Abb. 14.1 wieder.i x i X i0 1,00000000000000 2,000000000000001 1,00000000000000 1,500000000000002 1,25000000000000 1,500000000000003 1,37500000000000 1,500000000000004 1,37500000000000 1,437500000000005 1,40625000000000 1,437500000000006 1,40625000000000 1,421875000000007 1,41406250000000 1,421875000000008 1,41406250000000 1,417968750000009 1,41406250000000 1,4160156250000010 1,41406250000000 1,4150390625000011 1,41406250000000 1,4145507812500012 1,41406250000000 1,4143066406250013 1,41418457031250 1,4143066406250014 1,41418457031250 1,4142456054687515 1,41418457031250 1,4142150878906216 1,41419982910156 1,4142150878906217 1,41420745849609 1,4142150878906218 1,41421127319336 1,4142150878906219 1,41421318054199 1,4142150878906220 1,41421318054199 1,41421413421631Abb. 14.1. 20 Schritte mit dem Bisektionsalgorithmus


206 14. Wurzel Zwei14.4 Der Bisektionsalgorithmus konvergiert!Indem wir den Bisektionsalgorithmus weiterführen ohne aufzuhören, erhaltenwir zwei Folgen rationaler Zahlen {x i } ∞ i=0 und {X i} ∞ i=0 :x 0 ≤ x 1 ≤ x 2 ≤ ... und X 0 ≥ X 1 ≥ X 2 ≥ ...x i 0 gilt, wird bei jedem Schritt halbiert. Das bedeutet, dass beianwachsendem i mehr und mehr Ziffern in den Dezimalentwicklungen vonx i und X i übereinstimmen. Da 2 10 ≈ 10 3 ist, gewinnen wir etwa 3 Dezimalstellenalle 10 Schritte des Bisektionsalgorithmuses. Das können wir inAbb. 14.1 erkennen.Die Abschätzung (14.2) für die Differenz von X i − x i impliziert ferner,dass sich die Elemente der Folge {x i } ∞ i=0 mit wachsendem Index annähern.Das folgt daraus, dass x i ≤ x j i. Daher folgt aus (14.2)d.h.|x i − x j |≤|x i − X i |≤2 −i falls j ≥ i,|x i − x j |≤2 −i falls j ≥ i. (14.3)Wir veranschaulichen dies in Abb. 14.2. Insbesondere bedeutet dies, dassfür 2 −i ≤ 10 −N−1 , die ersten N Dezimalstellen von x j mit denen von x iidentisch sind für alle j ≥ i.x ix jX jX i|x i − x j||x i − X i|Abb. 14.2. |x i − x j|≤|X i − x i|


14.4 Der Bisektionsalgorithmus konvergiert! 207Anders formuliert, stimmen mehr und mehr führende Dezimalstellen derZahlen x i überein, während wir mehr und mehr Zahlen x i berechnen. Wirschließen daraus, dass die Folge {x i } ∞ i=0 , eine bestimmte (unendliche) Dezimalentwicklungfestlegt. Um die ersten N Ziffern dieser Entwicklung zuerhalten, nehmen wir einfach die ersten N Ziffern irgendeines x j in derFolge mit 2 −j ≤ 10 −N−1 . Aus der Ungleichheitsrelation (14.3) folgt, dassalle derartigen x j in den ersten N Ziffern übereinstimmen.Wäre diese unendliche Dezimalentwicklung die Dezimalentwicklung einerrationalen Zahl ¯x,würde natürlich gelten¯x = limi→∞x i .Wir haben jedoch oben gezeigt, dass die durch die Folge {x i } ∞ i=0 definierte(unendliche) Dezimalentwicklung nicht periodisch sein kann. Daher gibt eskeine rationale Zahl ¯x, die Grenzwert der Folge x i sein kann.Wir sind jetzt an dem Punkt angelangt, an dem die Pythagoräer vor2.500 Jahren nicht weiter kamen. Die Folge x i versucht“ gegen einen”Grenzwert zu konvergieren“, aber der Grenzwert ist keine Zahl von der”Art, die wir kennen, d.h. eine rationale Zahl. Um nicht das gleiche Schicksalwie die Pythagoräer zu erleiden, müssen wir einen Weg aus diesem Dilemmafinden. Der Grenzwert scheint eine neue Art Zahl zu sein, weswegenes nahe liegt, die rationalen Zahlen irgendwie zu erweitern. Diese Erweiterungerhalten wir dadurch, dass wir jede unendliche Dezimalentwicklung,sei sie periodisch oder nicht, als eine Art Zahl betrachten, genauer gesagtals eine reelle Zahl. Dadurch erhalten wir offensichtlich eine Erweiterungder Menge der rationalen Zahlen, da die rationalen Zahlen nur periodischeDezimalentwicklungen enthalten. Wir bezeichnen nicht periodische Dezimalentwicklungenals irrationale Zahlen.Damit die Erweiterung der rationalen zu den reellen Zahlen Sinn macht,müssen wir zeigen, dass wir mit irrationalen Zahlen genauso gut rechnenkönnen, wie mit rationalen Zahlen. Wir werden sehen, dass dies tatsächlichmöglich ist und wir werden erkennen, dass der Umgang mit irrationalenZahlen dem natürlichen Vorgehen entspricht: Wir benutzen abgeschnitteneDezimalentwicklungen! Im nächsten Kapitel, das den reellen Zahlen gewidmetist, werden wir dies näher erläutern.Wir wollen jetzt zusammenfassen und uns alles nochmals klar vor Augenführen: Wir erhalten eine Folge {x i } ∞ i=0 , indem wir den Bisektionsalgorithmusauf die Gleichung x 2 − 2 = 0 anwenden, die|x i − x j |≤2 −i falls j ≥ i (14.4)erfüllt. Die Folge {x i } ∞ i=0 definiert eine unendliche nicht periodische Dezimalentwicklung,die wir als irrationale Zahl bezeichnen. Wir geben dieserirrationalen Zahl den Namen √ 2. Wir benutzen also √ 2alsSymbol,umeinebestimmte unendliche Dezimalentwicklung zu kennzeichnen, die wir ausdem Bisektionsalgorithmus für die Gleichung x 2 − 2 = 0 gewonnen haben.


208 14. Wurzel ZweiAls Nächstes müssen wir Rechenregeln für die irrationalen Zahlen angeben.Wenn wir das erledigt haben, bleibt zu zeigen, dass die spezielleirrationale Zahl, die wir √ 2 genannt haben, tatsächlich auch die Gleichungx 2 = 2 erfüllt. D.h. wir müssen, nachdem wir die Multiplikation von irrationalenZahlen wie √ 2 definiert haben, nachweisen, dass√2√2=2. (14.5)Beachten Sie, dass obige Gleichheit nicht direkt aus der Definition folgt.So wäre es gewesen, wenn wir √ 2als ”das Ding“ definiert hätten, dasmit sich selbst multipliziert 2 ergibt (was keinen Sinn macht, da wir nichtwissen, ob ”das Ding“ existiert). Stattdessen haben wir √ 2 als unendlicheDezimalentwicklung definiert, die der Bisektionsalgorithmus für x 2 −2=0liefert und es ist ein nicht trivialer Schritt, zuerst zu definieren, was wirunter der Multiplikation von √ 2mit √ 2 verstehen, und dann zu zeigen,dass tatsächlich √ 2 √ 2 = 2 gilt. Die Pythagoräer schafften dies nicht, wasverheerende Folgen für ihre Gemeinschaft hatte.Wir kehren zum Beweis von (14.5) zurück, nachdem wir im nächstenKapitel gezeigt haben, wie mit reellen Zahlen gerechnet wird, so dass wirinsbesondere wissen, wie die irrationale Zahl √ 2 mit sich selbst multipliziertwird!14.5 Erste Begegnung mit Cauchy-FolgenWir kommen nochmals darauf zurück, dass die Folge {x i }, die durch denBisektionsalgorithmus bei der Lösung der Gleichung x 2 = 2 definiert wird,der Ungleichung|x i − x j |≤2 −i falls j ≥ i (14.6)genügt, woraus wir folgerten, dass die Folge {x i } ∞ i=1 eine bestimmte unendlicheDezimalentwicklung definiert. Um die ersten N Dezimalstellen derEntwicklung zu erhalten, nehmen wir die ersten N Dezimalstellen irgendeinerZahl x j aus der Folge mit 2 −j ≤ 10 −N−1 . Zwei so herausgegriffeneZahlen x j stimmen in N Dezimalstellen überein und ihre Differenz beträgthöchstens 1 in der (N + 1)-ten Stelle.Die Folge {x i }, die (14.6) erfüllt, ist ein Beispiel einer Cauchy-Folge rationalerZahlen. Ganz allgemein wird eine Folge y i rationaler Zahlen Cauchy-Folge genannt, falls für jedes ǫ>0einenatürliche Zahl N existiert, sodass|y i − y j |≤ǫ falls i,j ≥ N.Um zu zeigen, dass eine Folge {x i }, die (14.6) erfüllt, tatsächlich eineCauchy-Folge ist, wählen wir zunächst ein ǫ>0 und wählen dann einN,sodass2 −N ≤ ǫ.


14.6 Berechnung von √ 2 mit dem Dekasektionsalgorithmus 209Wir wollen als ein wichtiges Beispiel zeigen, dass die Folge {x i } ∞ i=1 mitx i = i−1ieine Cauchy-Folge ist. Für j>ierhalten wiri − 1∣ − j − 1∣ ∣ ∣∣∣ i j ∣ = (i − 1)j − i(j − 1)∣∣∣ ij ∣ = i − jij ∣ ≤ 1 i .Für ein vorgegebenes ǫ>0wählen wir die natürliche Zahl N ≥ 1/ǫ, so1dassN+1≤ ǫ, womit wiri − 1∣ − j − 1i j ∣ ≤ ǫ für i,j ≥ Nerhalten. Dies zeigt, dass {x i } mit x i = i−1ieine Cauchy-Folge ist, und somitgegen einen Grenzwert lim i→∞ x i konvergiert. Wir haben oben gezeigt,dass lim i→∞ x i =1.14.6 Berechnung von √ 2mit dem DekasektionsalgorithmusWir beschreiben nun für x 2 − 2 = 0 eine Variante des Bisektionsalgorithmuses,der Dekasektionsalgorithmus genannt wird. Wie die Bisektionerzeugt auch der Dekasektionsalgorithmus eine Zahlenfolge {x i } ∞ i=1 ,diegegen√ 2 konvergiert. Beim Dekasektionsalgorithmus stimmt x i mit √ 2iniDezimalstellen überein, wodurch sich die Konvergenzgeschwindigkeit leichtbestimmen lässt.Beim Dekasektionsalgorithmus wird im Unterschied zum Bisektionsalgorithmusbei jedem Schritt das aktuelle Intervall in 10 Unterintervalle,anstatt in 2, unterteilt. Wir beginnen wieder mit f(x) =x 2 − 2, x 0 =1und X 0 =2,sodassf(x 0 ) < 0 und f(X 0 ) > 0. Nun berechnen wir denWert von f in den dazwischen liegenden rationalen Punkten 1, 1; 1, 2;...;1, 9 und wählen daraus zwei aufein<strong>and</strong>er folgende Zahlen x 1 und X 1 ,sodass f(x 1 ) < 0undf(X 1 ) > 0. Diese beiden aufein<strong>and</strong>er folgenden Punkteexistieren, da wir wissen, dass f(x 0 )=f(1) < 0. Dann ist entwederf(y) < 0für alle y =1, 1;1, 2;...;1, 9 und wir erhalten x 1 =1, 9 undX 1 =2, 0, da f(X 1 ) > 0 oder es gilt bereits f(y) > 0für einen dazwischenliegenden Punkt. Wir finden heraus, dass x 1 =1, 4 und X 1 =1, 5dieseForderungen erfüllen. Nun setzen wir die Prozedur fort und berechnen fin den rationalen Zahlen 1, 41, 1, 42,...,1, 49 und wählen daraus zwei aufein<strong>and</strong>erfolgende Zahlen x 2 und X 2 mit f(x 2 ) < 0 und f(X 2 ) > 0. Wirerhalten so x 2 =1, 41 und X 2 =1, 42. Dann bearbeiten wir die dritte,vierte, fünfte, . . .Dezimalstelle und erhalten so zwei Folgen {x i } ∞ i=0 und{X i } ∞ i=0 , die beide gegen √ 2 konvergieren. Wir haben die ersten 14 Schrittedieses Algorithmuses mit Hilfe eines MATLAB m-files ausgeführt undin Abb. 14.3 wiedergegeben.


210 14. Wurzel Zweii x i X i0 1,00000000000000 2,000000000000001 1,40000000000000 1,500000000000002 1,41000000000000 1,420000000000003 1,41400000000000 1,415000000000004 1,41420000000000 1,414300000000005 1,41421000000000 1,414220000000006 1,41421300000000 1,414214000000007 1,41421350000000 1,414213600000008 1,41421356000000 1,414213570000009 1,41421356200000 1,4142135630000010 1,41421356230000 1,4142135624000011 1,41421356237000 1,4142135623800012 1,41421356237300 1,4142135623740013 1,41421356237300 1,4142135623731014 1,41421356237309 1,41421356237310Abb. 14.3. 14 Schritte des DekasektionsalgorithmusesDurch die Konstruktion giltund somit|x i − X i |≤10 −i ,|x i − x j |≤10 −i für j ≥ i. (14.7)Aus der Ungleichung (14.7) folgt, dass {x i } eine Cauchy-Folge ist und somiteine unendliche Dezimalentwicklung definiert. Da wir mit dem Dekasektionsalgorithmuseine Dezimalstelle pro Schritt gewinnen, können wirdas Element x i der Folge mit der nach i Stellen abgeschnittenen Dezimalentwicklungidentifizieren. In diesem Fall gibt es somit eine sehr einfacheVerbindung zwischen der Cauchy-Folge und der Dezimalentwicklung.Aufgaben zu Kapitel 1414.1. Benutzen Sie die evalf Funktion von MAPLE ,um √ 2 auf 1000 Dezimalstellenzu berechnen. Quadrieren Sie das Ergebnis und vergleichen Sie es mit2.14.2. (a) Zeigen Sie, dass √ 3 (vgl. Aufgabe 3.5) irrational ist. Hinweis: NutzenSie eine mächtige mathematische Technik: Versuchen Sie einen Beweis zu nutzen,den Sie bereits kennen. (b) Wiederholen Sie das Gleiche für √ a,wobeia einePrimzahl ist.14.3. Geben Sie mit Hilfe der Ziffern 3 und 4 drei verschiedene irrationale Zahlenan.


Aufgaben zu Kapitel 14 21114.4. Programmieren Sie den Bisektionsalgorithmus. Schreiben Sie die Ausgabefür 30 Schritte beginnend bei: (a) x 0 = 1 und X 0 =2,(b)x 0 = 0 undX 0 =2,(c)x 0 = 1 und X 0 =3,(d)x 0 = 1 und X 0 = 20. Vergleichen Sie dieGenauigkeiten der Methoden in jedem Schritt, indem Sie die Werte von x i mitden oben angegebene Dezimalentwicklung von √ 2 vergleichen. Erklären Sie denGenauigkeitsunterschied, der sich bei den verschiedenen Anfangswerten ergibt.14.5. (a) Benutzen Sie das Programm aus Aufgabe 14.4 und schreiben Sie dieAusgabe für 40 Schritte mit x 0 = 1 und X 0 = 2. (b) Beschreiben Sie allesAuffällige betreffend der letzten 10 Werte von x i und X i.(c)Erklären Sie IhreBeobachtung. (Hinweis: Denken Sie an die Darstellung von Fließkommazahlenim Rechner).14.6. Benutzen Sie die Ergebnisse aus Aufgabe 14.4(a). Zeichnen Sie: (a) |X i−x i|gegen i,(b)|x i −x i−1| gegen i und (c) |f(x i)| gegen i. Bestimmen Sie jeweils, obdie Größen bei jedem Schritt um den Faktor 1/2 abnehmen.14.7. Lösen Sie die Gleichung x 2 = 3 und x 3 = 2 mit dem Bisektionsalgorithmus.Finden Sie außerdem mit dem Algorithmus die negative Lösung von x 2 =3.14.8. Zeigen Sie für a0, dass aus b−a


15Reelle ZahlenSolange du das, worüber du sprichst, messen kannst oder mit Zahlenausdrücken kannst, sage ich, du weißt etwas darüber; aber wenn dues nicht in Zahlen ausdrücken kannst, ist dein Wissen nur spärlichund unbefriedigend; möglicherweise ist es der Anfang des Verstehens,aber du bist in deinen Gedanken kaum zur Stufe der Wissenschaftvorgedrungen, worum es sich dabei auch h<strong>and</strong>eln mag. (Kelvin 1889)Das Wasser weicht zurückdie Steine werden sichtbar.Seit dem letzten Mal ist eine lange Zeit vergangen.Eigentlich haben sie sich nicht verändert.Die alten Steine.(Der Brunnen, Lars Gustafsson, 1977)15.1 EinleitungJetzt sind wir bereit, die reellen Zahlen einzuführen. Wir werden reelle Zahlenso betrachten, als wären sie durch unendliche Dezimalentwicklungender Form±p m ...p 0 ,q 1 q 2 q 3 ...spezifiziert, mit nicht endenden Dezimalstellen q 1 q 2 q 3 ..., wobei jedes derp i und q j eineder10Ziffern0,1,...,9ist.Wirtrafenbereitsobenaufdie


214 15. Reelle ZahlenDezimalentwicklung 1, 4142135623 ...von √ 2. Die zugehörige Folge {x i } ∞ i=1abgeschnittener Dezimalentwicklungen ist durch die rationalen Zahlenx i = ±p m ...p 0 ,q 1 ...q i = ±(p m 10 m + ...+ q i 10 −i )gegeben. Für j>ihaben wir|x i − x j | = |0, 0 ...0q i+1 ...q j |≤10 −i . (15.1)Wir folgern, dass die Folge {x i } ∞ i=1 abgeschnittener Dezimalentwicklungender unendlichen Dezimalentwicklung ±p m ...p 0 ,q 1 q 2 q 3 ...eine Cauchy-Folge rationaler Zahlen ist.Im Allgemeinen wissen wir aus Kapitel Folgen und Grenzwerte“, dass”jede Cauchy-Folge rationaler Zahlen eine unendliche Dezimalentwicklungangibt, und dass daher eine Cauchy-Folge rationaler Zahlen eine reelle Zahlspezifiziert. Wir können daher eine reelle Zahl entweder als eine unendlicheDezimalentwicklung oder als Cauchy-Folge rationaler Zahlen betrachten.Wir benutzen dabei wieder den semantischen Trick, eine unendliche Dezimalentwicklungals eine einzige reelle Zahl zu bezeichnen.Wir unterteilen die reellen Zahlen in zwei verschiedene Typen: RationaleZahlen mit periodischen Dezimalentwicklungen und irrationale Zahlenmit nicht periodischen Dezimalentwicklungen. Bedenken Sie, dass wirnatürlich auch rationale Zahlen mit endlich vielen von Null verschiedenenDezimalstellen einbeziehen, wie 0, 25, als besondere periodische Dezimalentwicklung,bei der für große i alle Stellen q i = 0 sind.Wir sagen, dass die unendliche Dezimalentwicklung ±p m ...p 0 ,q 1 q 2 q 3 ...die reelle Zahl x = ±p m ...p 0 ,q 1 q 2 q 3 ... spezifiziert, und wir einigen unsdarauflim x i = x (15.2)i→∞zu schreiben, wobei {x i } ∞ i=1 die zugehörige Folge abgeschnittener Dezimalentwicklungenvon x ist. Ist x = ±p m ...p 0 ,q 1 q 2 q 3 ...eine periodische Entwicklung,d.h. wenn x eine rationale Zahl ist, dann stimmt diese Definitionmit unserer vorherigen aus Kapitel Folgen und Grenzwerte“ für den”Grenzwert einer Folge {x i } ∞ i=1 abgeschnittener Dezimalentwicklungen vonx überein. Wir wiederholen, dass109 = limi→∞ x i, mit x i =1, 11 ...1 i .Ist x = ±p m ...p 0 ,q 1 q 2 q 3 ... nicht periodisch, d.h. wenn x eine irrationaleZahl ist, dann dient (15.2) als Definition. Dabei wird die reelle Zahldurch die Dezimalentwicklung x = ±p m ...p 0 ,q 1 q 2 q 3 ... definiert, d.h. diereelle Zahl x, definiert durch die Cauchy-Folge {x i } ∞ i=1 abgeschnittener Dezimalentwicklungenvon x, wird als lim i→∞ x i geschrieben. Alternativ dient(15.2) dazu, den Grenzwert lim i→∞ x i als ±p m ...p 0 ,q 1 q 2 q 3 ... zu schreiben.


15.2 Addition und Subtraktion reeller Zahlen 215Wir haben beschlossen, für die Folge {x i } ∞ i=1 , die wir aus dem Bisektionsalgorithmusfür x 2 − 2=0erhalten, √ 2 = lim i→∞ x i zu schreiben.Somit können wir auch √ 2=1, 412 ... schreiben, wobei 1, 412 ... die unendlicheDezimalentwicklung, definiert durch den Bisektionsalgorithmus,bezeichnet.Wir werden im Folgenden Regeln für das Rechnen mit den so definiertenreellen Zahlen angeben, insbesondere wie reelle Zahlen addiert, subtrahiert,multipliziert und dividiert werden. Natürlich werden wir dabei so vorgehen,dass wir unsere Erfahrungen im Umgang mit rationalen Zahlen erweitern.Damit schließen wir den Prozess ab, die natürlichen Zahlen zunächst zuden ganzen Zahlen, dann zu den rationalen Zahlen und schließlich zu denreellen Zahlen zu erweitern.Wir bezeichnen die Menge aller reellen Zahlen mitR, d.h. die Menge allermöglichen unendlichen Dezimalentwicklungen. Wir werden diese Definitionunten im Kapitel Streiten <strong>Mathematik</strong>er?“ diskutieren.”15.2 Addition und Subtraktion reeller ZahlenUm unser Anliegen zu erläutern, betrachten wir die Addition zweier reellerZahlen x und ¯x, spezifiziert durch die Dezimalentwicklungenx = ±p m ...p 0 ,q 1 q 2 q 3 ...= limi→∞x i ,¯x = ±¯p m ...¯p 0 , ¯q 1¯q 2¯q 3 ...= limi→∞¯x imit den zugehörigen abgeschnittenen Dezimalentwicklungenx i = ±p m ...p 0 ,q 1 ...q i ,¯x i = ±¯p m ...¯p 0 , ¯q 1 ...¯q i .Wie x i und ¯x i zu addieren sind, wissen wir: Wir beginnen rechts, addierendie Dezimalen q i und ¯q i , erhalten so eine neue i-te Dezimalstelle und möglicherweiseeinen Übertrag zur Summe der nächsten Ziffern q i−1 und ¯q i−1 ,usw. Dabei ist es wichtig, dass wir von rechts beginnen (kleinste Dezimale)und nach links w<strong>and</strong>ern (größere Dezimale).Versuchen wir so die beiden unendlichen Folgen x = ±p m ...p 0 ,q 1 q 2 q 3 ...und ¯x = ±¯p m ...¯p 0 , ¯q 1¯q 2¯q 3 ... zu addieren, indem wir rechts beginnen,haben wir ein Problem, da es kein rechtes Ende gibt, bei dem wir anfangenkönnten. Was sollen wir tun?Der Ausweg ist natürlich, die Folge {y i },diewirausy i = x i +¯x i erhalten,zu betrachten. Da sowohl {x i } als auch {¯x i } Cauchy-Folgen sind, folgt, dassauch {y i } eine Cauchy-Folge ist, die somit eine Dezimalentwicklung, d.h.eine reelle Zahl definiert. Folgende Definition ist nahe liegend und richtig:x +¯x = limi→∞y i = limi→∞(x i +¯x i )


216 15. Reelle ZahlenDas entspricht der Formellim x i + lim ¯x i = lim (x i +¯x i ).i→∞ i→∞ i→∞Wir geben ein konkretes Beispiel und berechnen die Summe vonx = √ 2=1, 4142135623730950488 ...und¯x = 1043 =2, 3758542141230068337 ....439Dazu berechnen wir y i = x i +¯x i für i =1, 2,..., die die Dezimalentwicklungvon x +¯x definiert, vgl. Abb. 15.1. Gelegentlich beeinflusst das Hinix i +¯x i1 32 3, 73 3, 784 3, 7895 3, 7900 ∗6 3, 790067 3, 7900678 3, 79006779 3, 7900677710 3, 79006777611 3, 790067776412 3, 7900677764913 3, 79006777649614 3, 790067776496015 3, 7900677764960916 3, 790067776496101 ∗17 3, 790067776496101818 3, 7900677764961018719 3, 790067776496101881 ∗20 3, 7900677764961018825 ∗....Abb. 15.1. Berechnung der Dezimalentwicklung von √ 2 + 1043/439 mit Hilfeabgeschnittener Dezimalfolgen. Beachten Sie die mit ∗ markierten Zahlen, beidenen vorh<strong>and</strong>ene Stellen durch die Addition neuer Ziffern verändert werdenzufügen neuer Stellen die links davon stehenden Ziffern, wie beispielsweisebei 0, 9999 + 0, 0001 = 1, 0000.Natürlich wird die Differenz x − ¯x zweier reeller Zahlen x = lim i→∞ x iund ¯x = lim i→∞ ¯x i ähnlich definiert:x − ¯x = limi→∞(x i − ¯x i ).


15.3 Verallgemeinerung zur Lipschitz-stetigen Funktion f(x, ¯x) 21715.3 Verallgemeinerung zur Lipschitz-stetigenFunktion f(x, ¯x)Wir verallgemeinern nun zu weiteren Kombinationen reeller Zahlen. Angenommen,wir wollen die reellen Zahlen x und ¯x zu einer Größe f(x, ¯x), dievon x und ¯x abhängt, kombinieren. Beispielsweise, können wir f(x, ¯x) =x +¯x wählen, was der Summation x +¯x zweier reeller Zahlen x und ¯xentspricht, oder aber f(x, ¯x)=x¯x, entsprechend der Multiplikation von xmit ¯x.Wir nehmen an, dass f :Q×Q →QLipschitz-stetig ist, um f(x, ¯x) ähnlichwie bei f(x, ¯x)=x +¯x zu definieren. Dies ist eine ganz entscheidendeAnnahme und die Einführung der Lipschitz-Stetigkeit wurde zum Großteilwegen der Anwendbarkeit in diesem Zusammenhang motiviert.Wir wissen vom Kapitel ”Folgen und Grenzwerte“, dassf(x, ¯x)=f( limi→∞x i , limi→∞¯x i ) = limi→∞f(x i , ¯x i ),falls x = lim i→∞ x i und ¯x = lim i→∞ ¯x i rational sind. Sind x = lim i→∞ x iund ¯x = lim i→∞ ¯x i irrational, nutzen wir diese Formel einfach, um die reelleZahl f(x, ¯x) zudefinieren. Diesistmöglich, da {f(x i , ¯x i )} eine Cauchy-Folge ist und somit eine reelle Zahl definiert. Dabei ist {f(x i , ¯x i )} eineCauchy-Folge, da {x i } und {¯x i } Cauchy-Folgen sind und f :Q ×Q →QLipschitz-stetig ist. Die Formel für diese entscheidende Folgerung ist|f(x i , ¯x i ) − f(x j , ¯x j )|≤L(|x i − x j | + |¯x i − ¯x j |),wobei L die Lipschitz-Konstante von f ist.Wir wenden diese Argumentation auf den Fall f : Q ×Q → Q mitf(x, ¯x)=x +¯x an, die Lipschitz-stetig zur Lipschitz-Konstanten L =1istund definieren die Summe x +¯x zweier reeller Zahlen x = lim i→∞ x i und¯x = lim i→∞ ¯x i durchx +¯x = lim (x i +¯x i )i→∞d.h.lim x i + lim ¯x i = lim (x i +¯x i ). (15.3)i→∞ i→∞ i→∞Dies ist exakt dasselbe, was wir oben getan haben.Wir wiederholen: Die wichtige Formel istf( limi→∞x i , limi→∞¯x i ) = limi→∞f(x i , ¯x i ),die wir bereits von rationalen Zahlen x = lim i→∞ x i und ¯x = lim i→∞ ¯x ikennen und wodurch f(x, ¯x) für irrationale x und ¯x definiert wird. Wirwiederholen nochmal, dass die Lipschitz-Stetigkeit von f entscheidend ist.Wir können dies direkt auf Lipschitz-stetige Funktionen f : I × J →Qausweiten, wobei I und J Intervalle inQsind, unter der Annahme, dassx i ∈ I und ¯x i ∈ J für i =1, 2,....


218 15. Reelle Zahlen15.4 Multiplikation und Division reeller ZahlenDie Funktion f(x, ¯x)=x¯x ist Lipschitz-stetig für x ∈ I und ¯x ∈ J,wobeiIund J beschränkte Intervalle inQsind. Daher können wir das Produkt x¯xzweier reeller Zahlen x = lim i→∞ x i und ¯x = lim i→∞ ¯x i wie folgt definieren:x¯x = lim xi→∞i¯x i .Die Funktion f(x, ¯x) =x¯xist Lipschitz-stetig für x ∈ I und ¯x ∈ J, fallsI und J beschränkte Intervalle inQsind und J nicht die Null enthält.Daher können wir den Quotienten x¯x zweier reeller Zahlen x = lim i→∞ x iund ¯x = lim i→∞ ¯x i mit ¯x ≠ 0 wie folgt definieren:x¯x = lim x i.i→∞ ¯x i15.5 Der AbsolutbetragDie Funktion f(x) =|x| ist Lipschitz-stetig aufQ. Daherkönnen wir denAbsolutbetrag |x| einer reellen Zahl x = lim i→∞ x i wie folgt definieren:|x| = limi→∞|x i |.Ist x i eine Folge abgeschnittener Dezimalentwicklungen von x = lim i→∞ x i ,erhalten wir mit (15.1) |x j − x i |≤10 −i für j>i. Unter Benutzung desGrenzwertes für j gegen unendlich, ergibt sich|x − x i |≤10 −i für i =1, 2,... (15.4)15.6 Vergleich zweier reeller ZahlenSeien x = lim i→∞ x i und ¯x = lim i→∞ ¯x i reelle Zahlen mit den zugehörigenFolgen abgeschnittener Dezimalentwicklungen {x i } ∞ i=1 und {¯x i} ∞ i=1 .Wiekönnen wir entscheiden, ob x =¯x? Istesnötig, dass x i =¯x i für alle i?Nicht ganz. Betrachten Sie beispielsweise die zwei Zahlen x =0, 9999 ...und ¯x =1, 0000 ....Tatsächlich ist es ganz natürlich, die Aussage etwas zulockern und stattdessen x =¯x zu sagen, dann und nur dann, wenn|x i − ¯x i |≤10 −i für i =1, 2,... (15.5)Diese Bedingung ist sicherlich ausreichend, um zu sagen x =¯x, daderUnterschied |x i − ¯x i | so klein wird wie wir wollen, wenn wir nur i großgenug wählen. Anders ausgedrückt, haben wir somitund somit x =¯x.|x − ¯x| = limi→∞|x i − ¯x i | =0


15.7 Zusammenfassung der Arithmetik reeller Zahlen 219Falls (15.5) nicht gilt, existiert auf der <strong>and</strong>eren Seite ein positives ǫ undi,sodassx i − ¯x i > 10 −i + ǫ oder x i − ¯x i < 10 −i − ǫ.Da [x i − x j |≤10 −i für j>i, muss folglichx j − ¯x j >ǫ oderx j − ¯x j < −ǫ für j>igelten und somit, wenn wir den Grenzwert einsetzen für j gegen unendlichx − ¯x ≥ ǫ oderx − ¯x ≤−ǫ.Daraus folgern wir, dass für zwei reelle Zahlen x und ¯x entweder x =¯x gilt,oder x¯x.Diese Folgerung versteckt jedoch einen wunden Punkt. Zu wissen ob zweireelle Zahlen gleich sind oder nicht, kann die vollständige Kenntnis derDezimalentwicklungen verlangen, was nicht immer realistisch ist. Setzenwir beispielsweise x =10 −p ,wobeip den Anfang von 59 Dezimalstellen,die alle gleich 1 sind, in der Dezimalentwicklung von √ 2, angibt. Um dieDefinition von x zu vervollständigen, setzen wir x = 0 sonst. Wie sollenwir wissen, ob x>0oderx = 0 ist, wenn wir nicht zufälligerweise dieSequenz von 59 Dezimalstellen, die alle gleich 1 sind, unter den ersten 10 50Dezimalstellen von √ 2 oder wie viele Dezimalstellen wir möglicherweise zuberechnen in der Lage sind, finden. In so einem Fall scheint es sinnvollerzu sein zu sagen, dass wir nicht wissen können, ob x =0oderx>0ist.15.7 Zusammenfassung der Arithmetikreeller ZahlenMit diesen Definitionen können wir ganz einfach zeigen, dass die üblichenKommutativ-, Distributiv- und Assoziativgesetze für rationale Zahlen alleauch für reelle Zahlen gelten. So ist die Addition beispielsweise kommutativ,weilx +¯x = lim (x i +¯x i ) = lim (¯x i + x i )=¯x + x.i→∞ i→∞15.8 Warum √ 2 √ 2 gleich 2 istSeien {x i } und {X i } die Folgen, die sich aus dem Bisektionsalgorithmusfür die Gleichung x 2 = 2, wie oben konstruiert, ergeben. Wir haben√2 = lim x i (15.6)i→∞


220 15. Reelle Zahlendefiniert, d.h. wir bezeichnen mit √ 2 die unendliche, nicht periodische Dezimalentwicklung,die sich aus dem Bisektionsalgorithmus für die Gleichungx 2 = 2 ergibt.Wir beweisen jetzt, dass √ 2 √ 2 = 2, was wir oben noch offen gelassenhaben. Aus der Definition der Multiplikation reeller Zahlen ergibt sich√ √2 2 = lim x 2i→∞i, (15.7)und wir müssen daher beweisen, dasslimi→∞ x2 i =2. (15.8)Wir nutzen die Lipschitz-Stetigkeit der Funktion x → x 2 auf [0, 2] mit derLipschitz-Konstanten L = 4 um dies zu beweisen. Wir erkennen, dass|(x i ) 2 − (X i ) 2 |≤4|x i − X i |≤2 −i+2 ,wobei wir die Ungleichung |x i −X i |≤2 −i benutzen. Aus der Konstruktionist x 2 i < 2


15.9 Betrachtungen über √ 2 2212. √ 2 ist die Bezeichnung für die Dezimalentwicklung der Folge {x i } ∞ i=1 ,die sich mit dem Bisektionsalgorithmus für die Gleichung x 2 =2ergibt und die mit einer geeigneten Definition der Multiplikation dieGleichung √ 2 √ 2=2erfüllt.Diese sind analog zu den folgenden zwei Definition von 1 2 :11.2 ist das Ding“, das mit 2 multipliziert 1 ergibt.”12.2ist das geordnete Paar (1, 2), das mit einer geeigneten Definitionder Multiplikation die Gleichung (2, 1) × (1, 2) = (1, 1) erfüllt.Wir können zusammenfassen, dass in beiden Fällen die erste Aussagekritisiert werden könnte, weil sie uns im Unklaren lässt, was ”das Ding“wirklich ist und in welcher Beziehung es zu uns Bekanntem steht. Außerdemkann man den Zirkelschluss bei dieser Aussage ahnen und den Verdachthaben, dass es sich dabei nur um ein Wortspiel h<strong>and</strong>elt. Daraus folgernwir, dass nur die zweite Definition eine solide konstruktive Basis besitzt,obwohl wir intuitiv die erste benutzen, wenn wir daran denken.Gelegentlich können wir Berechnungen mit √ 2 durchführen und dabeinur ausnutzen, dass ( √ 2) 2 = 2, ohne dabei die Dezimalentwicklung von √ 2zu benötigen. So können wir beispielsweise zeigen, dass ( √ 2) 4 = 4, indemwir nur von der Gleichung ( √ 2) 2 = 2 Gebrauch machen, ohne eine einzigeDezimalstelle von √ 2 zu kennen. In solchen Fällen benutzen wir √ 2alseinSymbol für ”das Ding“, das quadriert 2 ergibt. Es ist allerdings selten, dassdiese Art symbolische Manipulation uns allein schon zum Ziel führt unddie endgültige Antwort liefert.Wir stellen fest, dass die Tatsache, dass √ 2 die Gleichung x 2 =2löst, eineArt von Konvention oder Übereinstimmung oder Definition beinhaltet.Was wir wirklich taten, war der Beweis, dass das Quadrat der abgeschnittenenDezimalentwicklung von √ 2 beliebig an 2 angenähert werden kann.Wir nahmen dies als Definition oder Übereinstimmung, dass ( √ 2) 2 =2.Indem wir dies taten, haben wir das Dilemma der Pythagoräer gelöst undso können wir (fast) sagen, dass wir das Problem gelöst haben, indemwir übereinstimmen, dass das Problem gar nicht existierte. Dies kann in(schwierigen) Fällen der einzige Ausweg sein.In der Tat vertrat der berühmte Philosoph Wittgenstein den St<strong>and</strong>punkt,dass der einzige Weg zur Lösung philosophischer Probleme der sei, (mitviel Mühe) zu zeigen, dass das vorgegebene Problem gar nicht existiere.Das Nettoergebnis dieser Art Gedanken scheint Null zu sein: Zuerst wirdein Problem gestellt und dann gezeigt, dass es gar nicht existiert. Jedochvermittelt der Weg selbst, der zu dieser Schlussfolgerung zurückgelegt werdenmusste, wichtige zusätzliche Einsichten, nicht das Ergebnis als solches.Dieser Ansatz könnte sich auch außerhalb der Philosophie oder der <strong>Mathematik</strong>als fruchtbar erweisen.


222 15. Reelle Zahlen15.10 Cauchy-Folgen reeller ZahlenWir können die Schreibweise für Folgen und Cauchy-Folgen auf reelle Zahlenausweiten. Wir sagen, dass {x i } ∞ i=1 eine Folge reeller Zahlen ist, wenndie Elemente x i reelle Zahlen sind. Die Definition der Konvergenz ist identischzu der für Folgen rationaler Zahlen. Eine Folge {x i } ∞ i=1 reeller Zahlenkonvergiert gegen eine reelle Zahl x, wennfür jedes ǫ>0 eine natürlicheZahl N existiert, so dass |x i − x| 0einenatürliche Zahl N existiert, so dass|x i − x j |≤ǫ für i,j ≥ N. (15.9)Ist {x i } ∞ i=1 eine konvergente Folge reeller Zahlen mit Grenzwert x = lim x i,i→∞so gilt nach der Dreiecksungleichung|x i − x j |≤|x − x i | + |x − x j |,wobei wir x i −x j = x i −x+x−x j ausgenutzt haben. Dies zeigt, dass {x i } ∞ i=1eine Cauchy-Folge ist. Wir formulieren dieses (offensichtliche) Ergebnis ineinem Satz.Satz 15.1 Eine konvergente Folge reeller Zahlen ist ein Cauchy-Folge reellerZahlen.Eine Cauchy-Folge reeller Zahlen bestimmt, auf dieselbe Art wie eineFolge rationaler Zahlen, eine Dezimalentwicklung. Wir können annehmen,möglicherweise nach Entfernen von Elementen und Änderung der Indizierung,dass eine Cauchy-Folge reeller Zahlen |x i −x j |≤2 −i für j ≥ i genügt.Wir folgern, dass eine Cauchy-Folge reeller Zahlen gegen eine reelle Zahlkonvergiert. Dies ist ein fundamentales Ergebnis für die reellen Zahlen, daswir als Satz formulieren:Satz 15.2 Eine Cauchy-Folge reeller Zahlen konvergiert eindeutig gegeneine reelle Zahl.Die Benutzung von Cauchy-Folgen war seit den Tagen des großen <strong>Mathematik</strong>ersCauchy in der ersten Hälfte des 19. Jahrhunderts sehr populär.Cauchy war Lehrer an der Ecole Polytechnique in Paris, die von Napoleongegründet wurde und ein Modell für technische Universitäten in ganz Europawurde (Chalmers 1829, Helsinki 1849, ...). CauchysReformierung derVorlesung über Infinitesimalrechnung im Ingenieurwesen, die seine berühmteCours d’Analyse einbezieht, wurde ebenso ein Modell, das bis heute einenGroßteil des Unterrichts in Infinitesimalrechnung durchdringt.


15.11 Erweiterung von f : É → É zu f : Ê → Ê 22315.11 Erweiterung von f :Q→Q zu f :R→RIn diesem Kapitel möchten wir zeigen, wie eine gegebene Lipschitz-stetigeFunktion f : Q → Q zu einer Funktion f : R → R erweitert werdenkann. Dazu nehmen wir an, dass f(x)für rationale x definiert ist, und dassf(x) eine rationale Zahl ist. Wir wollen zeigen, wie f(x) für irrationale xzu definieren ist. Tatsächlich hängt unsere Motivation für die Einführungder Lipschitz-Stetigkeit größtenteils mit seiner Verwendbarkeit in diesemZusammenhang zusammen.Wir haben die grundlegenden Probleme schon bei der Definition der Rechenregelnfür reelle Zahlen kennen gelernt und wir werden nun dieselbenIdeen für eine allgemeine Funktion f :Q→Qanwenden. Ist x = lim i→∞ x ieine irrationale reelle Zahl und die Folge {x i } ∞ i=1 die zugehörige abgeschnitteneDezimalentwicklung von x, sokönnen wir f(x) als die reelle Zahl definieren,die durchf(x) = lim f(x i ) (15.10)i→∞definiert ist. Ist nämlich f(x) Lipschitz-stetig zur Lipschitz-Konstanten L,so gilt|f(x i ) − f(x j )|≤L|x i − x j |,woraus wir folgern, dass {f(x i )} ∞ i=1 eine Cauchy-Folge ist, da {x i} ∞ i=1 eineCauchy-Folge ist. Somit existiert lim i→∞ f(x i ) und er definiert eine reelleZahl f(x). Auf diese Weise wird f :R→R definiert und wir sagen, dassdiese Funktion die Erweiterung von f :Q→Qist; von den rationalenZahlenQzu den reellen ZahlenR.Ganz ähnlich können wir eine Lipschitz-stetige Funktion f : I →Q,definiert auf einem Intervall rationaler Zahlen I = {x ∈Q:a≤x≤b},verallgemeinern und zu einer Funktion f : J →Rerweitern, die auf dementsprechenden Intervall reeller Zahlen J = {x ∈R:a≤x≤b} definiertist. Offensichtlich erfüllt die erweiterte Funktion f : J →Rf( limi→∞x i ) = limi→∞f(x i ), (15.11)für jede konvergente Folge {x i } in J (wobei automatisch lim i→∞ x i ∈ Jgilt, da J abgeschlossen ist).15.12 Lipschitz-Stetigkeit erweiterter FunktionenIst f :Q→Q Lipschitz-stetig zur Lipschitz-Konstanten L f ,dannistihreErweiterung f :R→Rebenfalls Lipschitz-stetig zu derselben Lipschitz-Konstanten L f . Gilt nämlich x = lim i→∞ x i und y = lim i→∞ y i ,dannist|f(x) − f(y)| = ∣ lim (f(x i ) − f(y i )) ∣ ≤ L lim |x i − y i | = L|x − y|.i→∞ i→∞


224 15. Reelle ZahlenDaraus folgt sofort, dass die Eigenschaften Lipschitz-stetiger Funktionenf :Q→Q, die oben angeführt sind, auch für die zugehörige erweiterteFunktion f :R→R gelten. Dies fassen wir in folgendem Satz zusammen:Satz 15.3 Eine Lipschitz-stetige Funktion f : I →R, wobeiI =[a,b] einIntervall reeller Zahlen ist, erfülltf( limi→∞x i ) = limi→∞f(x i ) (15.12)für jede konvergente Folge {x i } in I. Sindf : I →Rund g : I → RLipschitz-stetig und α und β reelle Zahlen, dann ist die Linearkombinationαf(x)+βg(x) Lipschitz-stetig auf I. Ist das Intervall I beschränkt, dannsind auch f(x) und g(x) beschränkt und f(x)g(x) ist Lipschitz-stetig aufI. IstI beschränkt und außerdem |g(x)| ≥c>0 für alle x ∈ I für einebeliebige Konstante c, dann ist f(x)/g(x) Lipschitz-stetig auf I.Beispiel 15.1. Wir können jedes Polynom so erweitern, dass es auf denreellen Zahlen definiert ist. Dies ist möglich, da jedes Polynom auf jedembeschränkten Intervall rationaler Zahlen Lipschitz-stetig ist.Beispiel 15.2. Aus dem vorangegangenen Beispiel folgt, dass wir die Funktionf(x)=x n für jede ganze Zahl n auf reelle Zahlen erweitern können. Wirkönnen ferner zeigen, dass f(x)=x −n auf jedem abgeschlossenen Intervallrationaler Zahlen, das nicht die 0 enthält, Lipschitz-stetig ist. Daher kannf(x)=x n auf reelle Zahlen erweitert werden, wobei n eine ganze Zahl ist,unter der Voraussetzung, dass für n


15.14 Erweiterung einer Lipschitz-stetigen Funktion 225eine Cauchy-Folge, dessen Grenzwert lim i→∞ f(x i ) existiert. Daher könnenwir f(a) = lim i→∞ f(x i ) definieren. Daraus ergibt sich direkt, dass dieerweiterte Funktion f :[a,b] →R Lipschitz-stetig ist zur selben Lipschitz-Konstanten.Wir geben eine Anwendung für diese Überlegungen, die bei der Betrachtungvon Quotienten zweier Funktionen auftritt. Klar, dass wir Punktevermeiden müssen, in denen der Nenner Null und der Zähler von Null verschiedenist. Sind jedoch Zähler und Nenner in einem Punkte beide gleichNull, kann die Funktion um diesen Punkt erweitert werden, wenn die Quotientenfunktionum diesen Punkt Lipschitz-stetig ist. Wir geben zunächstein ”triviales“ Beispiel.Beispiel 15.3. Betrachten Sie den Quotientenx − 1x − 1mit Definitionsbereich {x ∈R:x≠1}.Dax − 1=1× (x − 1) (15.13)für alle x, ist es ganz natürlich die Polynome zu ”dividieren“ und sox − 1x − 1 = 1 (15.14)zu erhalten. Der Definitionsbereich der konstanten Funktion 1 istR, sodass die linke und die rechte Seite von (15.14) unterschiedliche Definitionsbereichehaben und deswegen zwei verschiedene Funktionen repräsentierenmüssen. Wir veranschaulichen diese zwei Funktionen in Abb. 15.2 und wirerkennen, dass die beiden Funktionen in jedem Punkt, außer dem ”fehlenden“Punkt x =1,übereinstimmen.11Abb. 15.2. Zeichnungen von (x − 1)/(x − 1) (links) und 1 (rechts)Beispiel 15.4. Da x 2 − 2x − 3=(x − 3)(x + 1), gilt für x ≠3x 2 − 2x − 3x − 3= x +1.


226 15. Reelle ZahlenDie auf {x ∈R:x≠4} definierte Funktion (x 2 − 2x − 3)/(x − 3) kann zurFunktion x + 1 erweitert werden, die für alle x ∈R definiert ist.Beachten Sie jedoch, dass alleine die Tatsache, dass zwei Funktionen f 1 undf 2 im selben Punkte Null sind, nicht genügt, um ihren Quotienten gegeneine Funktion auszutauschen, die auf allen Punkten definiert ist.Beispiel 15.5. Die auf {x ∈R:x≠1} definierte Funktionx − 1(x − 1) 2ist gleich der Funktion 1/(x−1), die ebenfalls auf {x ∈R:x≠1} definiertist und die sich nicht auf x = 1 erweitern lässt.15.15 Intervalle reeller ZahlenSeien a und b zwei reelle Zahlen mit aaund x


15.16 Was ist f(x)für irrationales x? 227Schreibweise können wir die Menge der reellen Zahlen alsR= (−∞, ∞)schreiben.Damit können wir jetzt Lipschitz-stetige Funktionen f : I → R aufIntervallen I ⊂R definieren.x < aabb £ xAbb. 15.4. Unendliche Intervalle (−∞,a) und [b, ∞)15.16 Was ist f(x)für irrationales x?Wenn x irrational ist, werden die Folgen abgeschnittener Dezimalentwicklungenfür x und f(x) gleichzeitig bestimmt. Je mehr Dezimalstellen wirfür x erhalten, desto mehr erhalten wir für f(x). Das ergibt sich einfachaus f(x) = lim i→∞ f(x i )für die Folge {x i } ∞ i=1 abgeschnittener Dezimalentwicklungenvon x. Dies ist klar aus Abb. 15.5 ersichtlich. Damit erscheintauch die Vorstellung, dass f(x) eine Funktion von x ist, in einem neuenLicht. Bei der traditionellen Betrachtung von f(x), denken wir uns x gegebenund verknüpfen dann den Wert f(x) mitx. Wirkönnen das sogarin der Form x → f(x) schreiben, die <strong>and</strong>eutet, dass wir von x zu f(x)gelangen.Ist x jedoch irrational, so haben wir gerade erkannt, dass wir nicht damitbeginnen können, alle Dezimalstellen von x zu kennen, um daraus f(x) zuberechnen. Stattdessen bestimmen wir nach und nach die Dezimalentwicklungenx i zusammen mit den zugehörigen Funktionswerten f(x i ), d.h. wirkönnen x i → f(x i )für i =1, 2,...schreiben, aber nicht wirklich x → f(x).Es ist so, als ob wir zwischen Näherungen x i von x und Näherungen f(x i )von f(x) hin und her springen. Das bedeutet, dass wir x nicht exakt kennen,wenn wir f(x) berechnen. Damit dieses Verfahren Sinn macht, mussdie Funktion f(x) Lipschitz-stetig sein. Dann verursachen kleine Änderungenin x kleine Veränderungen in f(x), wodurch das Verfahren ermöglichtwird.Beispiel 15.6. Wir berechnen f(x)=0, 4x 3 − x in x = √ 2, mit Hilfe derabgeschnittenen Dezimalfolge x i in Abb. 15.5.Dies führt uns zur Überlegung, dass wir nur Lipschitz-stetige Funktionenbeh<strong>and</strong>eln können. Ist eine Verknüpfung von x-Werten zu Werten f(x)nicht Lipschitz-stetig, dann sollte sie es nicht verdient haben, Funktiongenannt zu werden. Das führt uns zur Folgerung, dass alle FunktionenLipschitz-stetig sind (mehr oder weniger).


228 15. Reelle Zahleni x i 0, 4x 3 i − x i1 1 −0, 62 1, 4 0, 09763 1, 41 0, 12128844 1, 414 0, 13085837765 1, 4142 0, 13133830051526 1, 41421 0, 13136230022458447 1, 414213 0, 13136950020358463888 1, 4142135 0, 131370700203054524159 1, 41421356 0, 131370844203047931474406410 1, 414213562 0, 1313708490030479221535281312...Abb. 15.5. Berechnung der Dezimalentwicklung von f( √ 2) für f(x)=0, 4x 3 −xmit Hilfe der abgeschnittenen DezimalfolgeDiese Aussage wäre für viele <strong>Mathematik</strong>er, die Tag und Nacht mitdiskontinuierlichen Funktionen arbeiten, schockierend. Tatsächlich wird ingroßen Bereichen der <strong>Mathematik</strong> (z.B. der Integrationstheorie) extrem diskontinuierlichen”Funktionen“ viel Aufmerksamkeit geschenkt. Besonderspopulär istf(x)=0 für x rational,f(x)=1für x irrational.Was immer dies sei, es ist keine Lipschitz-stetige Funktion und aus unseremBlickwinkel daher überhaupt keine Funktion, denn für ein Argumentx kann es extrem schwer sein zu entscheiden ob x rational oder irrationalist, und dann wüssten wir nicht, welchen der Funktionswerte f(x)=0oderf(x) =1zuwählen ist. Um zu entscheiden, ob x rational ist oder nicht,müssten wir die unendliche Dezimalentwicklung von x kennen, was für unsmenschliche Wesen unmöglichseinkann.Würden wir beispielsweise die klugeArgumentation, die beweist, dass x = √ 2 nicht rational sein kann, nichtkennen, dann wären wir bei jeder abgeschnittenen Dezimalentwicklung von√2 nicht in der Lage zu entscheiden, ob f(x)=0oderf(x)=1.Wir kämen sogar in Schwierigkeiten, die folgende ”Funktion“ f(x) zudefinierenf(x)=af(x)=bfür x


15.17 Stetigkeit versus Lipschitz-Stetigkeit 229unmöglich sein kann. Natürlicher wäre es da, sich die ”Funktion mit einemSprung“ aus zwei Funktionen zusammengesetzt zu denken, und zwar ausder Lipschitz-stetigen Funktionf(x)=afür x ≤ ¯xund der Lipschitz-stetigen Funktionf(x)=bfür x ≥ ¯x,mit zwei möglichen Werten a ≠ b für x =¯x:DenWerta von links (x ≤ ¯x)und den Wert b von rechts (x ≥ ¯x), vgl. Abb. 15.6."+" "="¯x¯x¯xAbb. 15.6. Eine Sprungfunktion“, betrachtet als zwei Funktionen”Es scheint also, dass wir die bloße Vorstellung einer diskontinuierlichenFunktion f(x) verwerfen müssen. Dies folgt daraus, dass wir nicht annehmenkönnen, dass wir x genau kennen und somit können wir nur Situationenbetrachten, bei denen kleine Änderungen in x kleine Veränderungen inf(x) bewirken, was ja gerade der Kern der Lipschitz-Stetigkeit ist. Stattdessenwerden wir dahin geleitet, Funktionen mit Sprüngen als Kombinationenvon Lipschitz-stetigen Funktionen mit zwei möglichenWertenbeiden Sprüngen, einer, der von rechts, und einer, der von links erreicht wird,zu betrachten.15.17 Stetigkeit versus Lipschitz-StetigkeitWie bereits angedeutet, benutzen wir eine Stetigkeitsdefinition (Lipschitz-Stetigkeit), die sich von der in den meisten Lehrbüchern der Infinitesimalrechnungunterscheidet. Wir erinnern an die grundlegende Eigenschaft einerLipschitz-stetigen Funktion f : I →R:f(limi→∞ x i)= limi→∞f(x i ), (15.15)für jede konvergente Folge {x i } in I mit lim i→∞ x i ∈ I. Die St<strong>and</strong>arddefinitionder Stetigkeit einer Funktion f : I →Rbeginnt bei (15.15) und klingtfolgendermaßen: Die Funktion f : I →R heißt stetig auf I (entsprechendder St<strong>and</strong>arddefinition), falls (15.15) für alle konvergenten Folgen x i in Imit lim i→∞ x i ∈ I erfüllt ist. Offensichtlich ist eine Lipschitz-stetige Funktionstetig nach der St<strong>and</strong>arddefinition, wohingegen das Gegenteil nicht


230 15. Reelle Zahlenwahr zu sein scheint. Anders ausgedrückt benutzen wir eine Definition, dieetwas strenger ist als die St<strong>and</strong>arddefinition.Die St<strong>and</strong>arddefinition genügt einer Maximalitätsanforderung (erstrebenswertfür viele reine <strong>Mathematik</strong>er), leidet aber unter der (oft verwirrenden)Benutzung von Grenzwerten. Tatsächlich kann die intuitive Vorstellungder ”stetigen Abhängigkeit“ der Funktionswerte f(x) von einer reellenVariablen x durch ”f(x) ist nahe bei f(y), wenn x nahe bei y ist“ ersetztwerden, für die die Lipschitz-Stetigkeit eine quantitative präzise Formulierunggibt, wohingegen die St<strong>and</strong>arddefinition etwas weit hergeholt ist.Stimmt’s?Aufgaben zu Kapitel 1515.1. Definieren Sie einen ”Satz“ als eine beliebige Kombination von 500 Buchstaben,wählbar aus 26 verschiedenen Zeichen und Zwischenräumen, die in einerZeile anein<strong>and</strong>er gereiht sind. Berechnen Sie (näherungsweise) die Anzahl allermöglichen Sätze.15.2. Angenommen x und y seien zwei reelle Zahlen und {x i} und {y i} seiendie durch abgeschnittene Dezimalentwicklungen erzeugte Folgen. Treffen Sie mitHilfe von (7.14) und (15.4) Abschätzungen für (a) |(x + y) − (x i + y i)| und (b)|xy − x iy i|. Hinweis: Benutzen Sie für (b) xy − x iy i =(x − x i)y + x i(y − y i) underklären Sie, warum aus (15.4) folgt, dass |x i|≤|x| +1für genügend großes i.15.3. Finden Sie ein möglichst kleines i, sodass|xy − x iy i|≤10 −6 für x ≈ 100und y ≈ 1. Finden Sie möglichst kleine i und j, sodass|xy − x iy j|≤10 −6 .15.4. Seien x =0, 37373737 ..., y = √ 2 und {x i} und {y i} seien die durch Abschneidender Dezimalentwicklungen erzeugten Folgen. Berechnen Sie die ersten10 Ausdrücke der Folgen, die x + y und x − y definieren, und die ersten 5 Ausdrückeder Folgen, die xy und x/y definieren. Hinweis: Folgen Sie dem Beispielin Abb. 15.1.15.5. Sei x der Grenzwert der FolgeAntwort.ii +1.Istx


Aufgaben zu Kapitel 15 23115.8. Finden Sie die Mengen {x}, die(a)| √ 2 − 3| ≤7 und (b) |3x − 6 √ 2| > 2erfüllen.15.9. Zeigen Sie, dass die Dreiecksungleichung (7.14) auch für reelle Zahlen sund t gilt.15.10. (Schwierig) (a) Sei p eine rationale Zahl, x eine reelle Zahl und {x i} einebeliebige Folge rationaler Zahlen, die gegen x konvergiert. Zeigen Sie, dass p


232 15. Reelle Zahlen15.18. Berechnen Sie die ersten fünf Ausdrücke der Folge, die den Wert derFunktion f(x) =x in x = √ 2 definiert. Hinweis: Folgen Sie Abb. 15.5 undx+2nutzen Sie die evalf Funktion von MAPLE , um alle Dezimalstellen zu bestimmen.15.19. Sei x i die Folge mit x i =3 − 2 iund f(x) =x 2 − x. Wie lautet derGrenzwert der Folge f(x i)?15.20. Zeigen Sie, dass |x| Lipschitz-stetig ist auf Ê.15.21. Sei n eine natürliche Zahl. Zeigen Sie, dass Lipschitz-stetig ist aufder Menge rationaler Zahlen I = {x : 0,01 ≤ x ≤ 1} und bestimmen Sie dieLipschitz-Konstante ohne Hilfe von Satz 15.3. Hinweis: Benutzen Sie die Identitätx n 2 − x n 1 =(x 2 − x 1) x n−12 + x n−22 x 1 + x n−32 x 2 1=(x 2 − x 1)n−1j=0x n−1−j2 x j 1,1x n+ ···+ x 2 2x n−31 + x 2x n−21 + x n−11nachdem Sie diese bewiesen haben. Beachten Sie, dass in der letzten Summe nAusdrücke auftreten und dass die Lipschitz-Konstante von n abhängt.15.22. Beweisen Sie Satz 15.3.15.23. Schreiben Sie die folgenden Mengen als Intervalle und veranschaulichenSie die Mengen auf der Zahlengeraden.(a) {x : −2


Aufgaben zu Kapitel 15 233Euklid beh<strong>and</strong>elt in B<strong>and</strong> X seines Hauptwerks ”Die Elemente“ allgemeineUntersuchungen über Kommensurabilitäten und aufgrundder Postulate auftretende irrationale Strecken. Diese Untersuchungenhatten in der Schule des Pythagoras ihren Ursprung, wurdenaber entschieden durch den Athener Theaetetus, der berechtigterweisefür seine natürliche Haltung in dieser wie <strong>and</strong>eren Feldern der<strong>Mathematik</strong> bewundert wurde, weiterentwickelt. Als einer der begabtestenMänner widmete er sich geduldig Untersuchungen der indiesen Wissenschaftszweigen enthaltenen Wahrheiten .. .und er warmeiner Meinung nach der Kopf hinter der Formulierung exakter Unterscheidungenund unwiderlegbarer Beweise im Zusammenhang mitden oben angeführten Größen. (Pappus (etwa) 290–350)


16Bisektion für f(x)=0Divide ut regnes (Teile und herrsche). (Machiavelli 1469–1527)16.1 BisektionWir verallgemeinern jetzt den Bisektionsalgorithmus, mit dessen Hilfe wiroben die positive Lösung der Gleichung x 2 − 2 = 0 berechnet haben, umLösungen der Gleichungf(x) = 0 (16.1)zu finden, d.h. wir suchen Nullstellen von f,wobeif :R→R eine LipschitzstetigeFunktion ist. Der Bisektionsalgorithmus funktioniert wie folgt, wobeiTOL eine vorgegebene positive Toleranz ist:1. Wähle Anfangswerte x 0 und X 0 mit x 0


236 16. Bisektion für f(x)=0Die Gleichung f(x) = 0 kann viele Lösungen haben. Die Wahl der Anfangswertex 0 und X 0 mit f(x 0 )f(X 0 ) ≤ 0schränkt die Suche einer odermehrerer Lösungen auf das Intervall [x 0 ,X 0 ] ein. Um alle Nullstellen einerFunktion zu finden, kann es notwendig werden, systematisch alle möglichenStartintervalle [x 0 ,X 0 ] zu durchsuchen.Der Beweis für die Konvergenz des Bisektionsalgorithmuses ist analogzum speziellen Fall f(x) =x 2 − 2, der oben gegeben wurde. Aus seinerKonstruktion ergibt sich nach i Schritten, unter den Annahmen, dass wirnicht wegen f(¯x)=0aufhören und dass X 0 − x 0 =1,dassund wie oben, dass0 ≤ X i − x i ≤ 2 −i|x i − x j |≤2 −i für j ≥ i.Wie ausgeführt, ist {x i } ∞ i=1 eine Cauchy-Folge, die folglich gegen eine eindeutigereelle Zahl ¯x konvergiert. Aus der Konstruktion ergibt sich|x i − ¯x|≤2 −i und |X i − ¯x|≤2 −i .Bleibt noch zu zeigen, dass ¯x eine Lösung von f(x) = 0 ist, d.h. dassf(¯x) = 0 gilt. Nach Definition gilt f(¯x) =f(lim i→∞ x i ) = lim i→∞ f(x i )und somit müssen wir zeigen, dass lim i→∞ f(x i ) = 0. Dazu nutzen wir dieLipschitz-Stetigkeit und erhalten|f(x i ) − f(X i )|≤L|x i − X i |≤L2 −i .Da f(x i )f(X i ) < 0, d.h. f(x i ) und f(X i ) haben unterschiedliche Vorzeichen,ist dadurch bewiesen, dass tatsächlich|f(x i )|≤L2 −i (und somit auch |f(X i )|≤L2 −i ),womit lim i→∞ f(x i ) = 0 gilt und damit auch f(¯x) = lim i→∞ f(x i )=0,was wir zeigen wollten.Wir fassen dies als Satz zusammen, der nach dem katholischen PriesterB. Bolzano (1781–1848), der als einer der ersten analytische Beweise zuEigenschaften stetiger Funktionen führte, Satz von Bolzano benannt ist.Satz 16.1 (Satz von Bolzano) Ist f :[a,b] →R eine Lipschitz-stetigeFunktion und f(a)f(b) < 0, dann gibt es eine reelle Zahl ¯x ∈ [a,b], so dassf(¯x)=0.Eine Folgerung aus diesem Satz wird Zwischenwertsatz genannt. Er besagt,dass eine Lipschitz-stetige Funktion g(x) auf einem Intervall [a,b] alleWerte zwischen g(a) und g(b) mindestens einmal annimmt, wenn x sichin [a,b] bewegt. Dies folgt aus dem Satz von Bolzano, angewendet auf dieFunktion f(x)=g(x) − y =0,wobeiy zwischen g(a) und g(b) liegt.Satz 16.2 (Zwischenwertsatz) Ist f :[a,b] →R eine Lipschitz-stetigeFunktion, so gibt es für jede reelle Zahl y im Intervall zwischen f(a) undf(b) eine reelle Zahl x ∈ [a,b], so dass f(x)=y.


16.2 Ein Beispiel 237Abb. 16.1. Bernard Placidus Johann Nepomuk Bolzano (1781–1848), tschechischer<strong>Mathematik</strong>er, Philosoph und katholischer Priester: ”Mein besonderesVergnügen an der <strong>Mathematik</strong> beruhte auf seinen rein theoretischen Teilen, mit<strong>and</strong>eren Worten, ich schätzte nur die Teile der <strong>Mathematik</strong>, die auch philosophischerNatur waren“16.2 Ein BeispielAls Anwendung des Bisektionsalgorithmuses berechnen wir die Lösungder chemischen Gleichgewichtsgleichung (7.13) aus dem Kapitel ”RationaleZahlen“:S(0, 02 + 2S) 2 − 1, 57 × 10 −9 =0. (16.2)Der Graph der Funktion ist in Abb. 16.2 dargestellt. Offensichtlich gibtes Lösungen bei −0, 01 und 0. Um sie zu berechnen, scheint es zunächst0.0000720.000032-.02 .02-0.000008Abb. 16.2. Graph der Funktion S(0, 02 + 2S) 2 − 1, 57 × 10 −9


238 16. Bisektion für f(x)=0angebracht, die Gleichung zu skalieren und beide Seiten von (16.2) mit 10 9zu multiplizieren:Wir formulieren dies neu zu10 9 × S(0, 02 + 2S) 2 − 1, 57 = 0.10 9 × S (0, 02 + 2S) 2 =10 3 × S × 10 6 × (0, 02 + 2S) 2=10 3 × S × ( 10 3) 2× (0, 02 + 2S) 2 =10 3 × S × ( 10 3 × (0, 02 + 2S) ) 2=10 3 × S × ( 20 + 2 × 10 3 × S ) 2.Wenn wir nun noch die neue Variable x =10 3 S einführen, erhalten wir diefolgende zu lösende Gleichung:f(x)=x(20 + 2x) 2 − 1, 57 = 0. (16.3)Das Polynom f(x) hatvernünftigere Koeffizienten und die Lösungen sindnicht annähernd so klein wie bei der ursprünglichen Formulierung. Wennwir eine Lösung x von f(x) = 0 finden, ergibt sich die physikalische VariableS =10 −3 x. Wir wollen noch festhalten, dass in diesem Modell nur positivenLösungen eine Bedeutung zukommt, da es keine ”negativen“ Löslichkeitengeben kann.Die Funktion f(x) ist ein Polynom und daher Lipschitz-stetig auf jedembeschränkten Intervall. Daher kann die Bisektion zur Berechnung derLösungen verwendet werden. In Abb. 16.3 ist f(x) wiedergegeben. Wirvermuten daraus eine Lösung von f(x) = 0 bei 0 und bei −10.-11 -5.3 .4100-250-600Abb. 16.3. Graph der Funktion f(x)=x(20 + 2x) 2 − 1,57Um eine positive Lösung zu berechnen, wählen wir x 0 = −0, 1 undX 0 =0, 1 und führen 20 Schritte des Bisektionsalgorithmuses aus. Die Ergebnissesind in Abb. 16.4 wiedergegeben. Wir erkennen, dass x ≈ 0, 00392Gleichung (16.3) löst und somit S ≈ 3, 92 × 10 −6 .


16.3 Berechnungsaufw<strong>and</strong> 239i x i X i0 −0,10000000000000 0,100000000000001 0,00000000000000 0,100000000000002 0,00000000000000 0,050000000000003 0,00000000000000 0,025000000000004 0,00000000000000 0,012500000000005 0,00000000000000 0,006250000000006 0,00312500000000 0,006250000000007 0,00312500000000 0,004687500000008 0,00390625000000 0,004687500000009 0,00390625000000 0,0042968750000010 0,00390625000000 0,0041015625000011 0,00390625000000 0,0040039062500012 0,00390625000000 0,0039550781250013 0,00390625000000 0,0039306640625014 0,00391845703125 0,0039306640625015 0,00391845703125 0,0039245605468816 0,00392150878906 0,0039245605468817 0,00392150878906 0,0039230346679718 0,00392150878906 0,0039222717285219 0,00392189025879 0,0039222717285220 0,00392189025879 0,00392208099365Abb. 16.4. 20 Schritte des Bisektionsalgorithmuses für (16.3) mit x 0 = −0,1und X 0 =0,116.3 Berechnungsaufw<strong>and</strong>Wir haben oben den Dekasektionsalgorithmus zur Berechnung von √ 2angewendet.Natürlich können wir diesen Algorithmus ebenso zur Lösungallgemeiner Gleichungen benutzen. Da wir mehr als eine Methode zur Berechnungeiner Lösung kennen, ist es nahe liegend, nach der besten“ Methodezu fragen. Zunächst müssen wir natürlich entscheiden, was wir unter ”am besten“ verstehen. Bei diesem Problem könnte beispielsweise am bestenam genauesten“ oder am billigsten“ bedeuten. Das Kriterium richtet” ””sich nach unseren Bedürfnissen.Das Kriterium kann von vielen Dingen abhängen, wie z.B. die zu erzielendeGenauigkeit. Natürlich hängt dies von der Anwendung und dem Berechungsaufw<strong>and</strong>ab. Im Modell für den schlammigen Hof genügen praktischgesehen einige Dezimalstellen. Falls wir beispielsweise versuchen würden,die Diagonale mit einem Maßb<strong>and</strong> zu messen, würden wir bis auf einigeZentimeter genau sein können, selbst wenn wir von der Schwierigkeitabsehen, entlang einer Geraden zu messen. Für eine höhere Genauigkeitkönnten wir einen Laser einsetzen und den Abst<strong>and</strong> bis auf einige Wel-


240 16. Bisektion für f(x)=0lenlängen genau messen. Deswegen könnten wir mit einer Genauigkeit vonvielen Dezimalstellen rechnen wollen. Das wäre bei diesem Beispiel sicherlichzu viel des Guten, könnte aber bei Anwendungen in der Astronomieoder der Geodäsie (z.B. bei der Kontinentalverschiebung) notwendig sein.In der Physik werden bestimmte Größen mit vielen Dezimalstellen Genauigkeitbenötigt. So möchte man beispielsweise die Masse von Elektronensehr genau kennen. Bei Anwendungen aus der Mechanik genügen oft eineH<strong>and</strong> voll Dezimalstellen.Bei der Dekasektion und der Bisektion ist Genauigkeit offensichtlich keinThema, da beide Algorithmen so lange ausgeführt werden können, bis wirauf 16 Stellen genau sind, oder wie viele Stellen die Darstellung einer Fließkommazahlbesitzen möge. Deswegen ist es vernünftig, diese Methodenüber die Rechenzeit, die für das Erreichen einer gewissen Genauigkeit notwendigist, zu bewerten. Rechenzeiten werden oft auch Berechnungskostenbezeichnet, ein Überbleibsel aus der Zeit, als Rechenzeiten auf dem Computersekundenweise abgerechnet wurden.Der Aufw<strong>and</strong> bei diesen Algorithmen kann so bestimmt werden, dasszunächst die Kosten per Iteration ermittelt werden, um dann mit derZahl der Schritte zu multiplizieren, die wir für die gewünschte Genauigkeitbenötigen. Bei einem Schritt des Bisektionsalgorithmuses muss der Computerden Mittelpunkt zwischen zwei Punkten berechnen, die Funktion f indiesem Punkt auswerten, das Ergebnis kurzfristig zwischenspeichern, dasVorzeichen des Funktionswertes überprüfen und dann die neuen Werte fürx i und X i speichern. Wir nehmen an, dass die Zeit im Computer für jededieser Operationen gemessen werden kann, und wir definierenC m =Kostenfür die MittelpunktsberechnungC f =Kostenfür die Funktionsauswertung in diesem PunktC ± =Kostenfür Vorzeichenüberprüfung einer VariablenC s =Kostenfür die Speicherung einer Variablen.Die Gesamtkosten für einen Schritt Bisektion sind C m + C f + C ± +4C s ,und die Kosten nach N b Schritten daherN b (C m + C f + C ± +4C s ). (16.4)Ein Schritt des Dekasektionsalgorithmuses verursacht entschieden höhereKosten, da 9 Zwischenpunkte getestet werden müssen. Die Gesamtkostennach N d Schritten des Dekasektionsalgorithmuses belaufen sich zuN d (9C m +9C f +9C ± +20C s ). (16.5)Andererseits nimmt der Unterschied |x i − ¯x| um einen Faktor 1/10 beijedem Schritt der Dekasektion ab, verglichen mit einem Faktor 1/2beiderBisektion. Da 1/2 3 > 1/10 > 1/2 4 , werden mit der Bisektion zwischendrei- und viermal so viele Schritte benötigt wie bei der Dekasektion, um


16.3 Berechnungsaufw<strong>and</strong> 241den Anfangsabst<strong>and</strong> |x 0 − ¯x| entsprechend zu reduzieren, d.h. N b ≈ 4N d .Somit betragen die Kosten für den Bisektionsalgorithmus4N d (C m + C f + C ± +4C s )=N d (4C m +4C f +4C ± +16C s ).Vergleicht man dies mit (16.5), so erkennt man, dass die Bisektion billigeranzuwenden ist als der Dekasektionsalgorithmus.


17Streiten <strong>Mathematik</strong>er?*Die Beweise der Sätze von Bolzano und Weierstrass haben einen entschiedennicht konstruktiven Charakter. Sie liefern keine Methode,um eine Nullstelle oder einen Extremwert einer Funktion mit einervorgegebenen Genauigkeit in einer endlichen Zahl von Schrittenzu finden. Nur die pure Existenz oder die Absurdität einer Nicht-Existenz des gewünschten Wertes wird bewiesen. Dies ist ein weitereswichtiges Beispiel, gegen das die ”Intuitionisten“ Einspruch erhobenhaben; einige best<strong>and</strong>en sogar darauf, solche Sätze aus der <strong>Mathematik</strong>zu streichen. Studierende der <strong>Mathematik</strong> sollten dies nichternster nehmen als die meisten Kritiker. (Courant)Ich weiß, dass der große Hilbert sagte: ”Wir werden nicht aus demParadies getrieben, das Cantor für uns erschaffen hat“, und ich antworte:”Für mich gibt es keinen Grund hineinzugehen“. (R. Hamming)Es gibt einen Begriff, der alle <strong>and</strong>eren verdirbt und umwirft. Ichmeine nicht das Böse, das auf Moral beschränkt ist; ich meine dasUnendliche. (Borges)Entweder ist die <strong>Mathematik</strong> zu groß für den menschlichen Verst<strong>and</strong>oder der menschliche Verst<strong>and</strong> ist mehr als eine Maschine. (Gödel)17.1 Einleitung<strong>Mathematik</strong> wird gerne als ”absolute Wissenschaft“ betrachtet, in der es eineklare Unterscheidung zwischen wahr und unwahr oder richtig und falsch


244 17. Streiten <strong>Mathematik</strong>er?*gibt, die allgemein von allen berufsmäßigen <strong>Mathematik</strong>ern und jedem aufgeklärtenLaien akzeptiert werden sollte. Dies ist im Großen und Ganzenrichtig, aber es gibt wichtige Aspekte der <strong>Mathematik</strong>, in denen Übereinstimmungfehlte und immer noch fehlt. Die Entwicklung der <strong>Mathematik</strong>beinhaltet tatsächlich so heftige Kämpfe wie in jeder <strong>and</strong>eren Wissenschaft.Zu Beginn des 20. Jahrhunderts waren die Grundlagen der <strong>Mathematik</strong>heftig umstritten. Gleichzeitig entwickelte sich eine Aufspaltung in ”reine“und ”angew<strong>and</strong>te“ <strong>Mathematik</strong>, die es vorher nicht gegeben hatte. Traditionellwaren <strong>Mathematik</strong>er Generalisten, die Arbeiten in theoretischer<strong>Mathematik</strong> mit Anwendungen der <strong>Mathematik</strong> und sogar Arbeiten in derMechanik, der Physik und <strong>and</strong>eren Disziplinen kombinierten. Leibniz, Lagrange,Gauss, Poincaré und von Neumann arbeiteten alle mit konkretenProblemen der Mechanik, Physik und einer Vielzahl von Anwendungen wieauch Fragen der theoretischen <strong>Mathematik</strong>.Bei den mathematischen Grundlagen gibt es verschiedene ”mathematischeSchulen“, die etwas unterschiedlich mit grundlegenden Begriffen undAxiomen umgehen und die etwas unterschiedliche Argumente bei ihrer Arbeitbenutzen. Die drei Hauptschulen sind die Formalisten,dieLogiker undschließlich die Intuitionisten, die auch als Konstruktivisten bekannt sind.Wie wir im Folgenden erklären werden, fassen wir die Formalisten und dieLogiker unter einer idealistischen Tradition zusammen und die Konstruktivistenunter einer realistischen Tradition. Es ist auch möglich, die idealistischeTradition mit einem ”aristokratischen“ St<strong>and</strong>punkt und die realistischeTradition mit einem ”demokratischen“ St<strong>and</strong>punkt zu assoziieren.Die Geschichte der westlichen Zivilisation kann in großen Zügen als Kampfzwischen idealistischen/aristokratischen und einer realistischen/demokratischenTradition betrachtet werden. Der griechische Philosoph Platon istdie Portalfigur der idealistischen/aristokratischen Tradition, wohingegen,zusammen mit der im 16. Jahrhundert eingeleiteten wissenschaftlichen Revolution,die realistische/demokratische Tradition eine führende Rolle inunserer Gesellschaft übernommen hat.Die Ausein<strong>and</strong>ersetzung zwischen Formalisten/Logikern und den Konstruktivistenhatte ihren Höhepunkt in den 1930ern, als das von den Formalistenund Logikern vorgeschlagene Programm einen schweren Schlagdurch den Logiker Kurt Gödel, vgl. Abb. 17.1, erlitt. Gödel zeigte, zur Überraschungder Welt und großer <strong>Mathematik</strong>er wie Hilbert, dass es in jederaxiomatischen mathematischen Theorie, die die Axiome für die natürlichenZahlen enthalten, Tatsachen gebe, die sich aus den Axiomen nicht beweisenlassen. Dies ist die berühmte Unvollständigkeitstheorie von Gödel.Alan Turing (1912–1954, Doktorarbeit am Kings College, Cambridge1935) schlug in seinem 1936 erschienenen berühmten Aufsatz On ComputableNumbers, with an application to the Entscheidungsproblem eine ähnlicheGedankenlinie ein, in Gestalt der Berechenbarkeit reeller Zahlen. In seinemAufsatz stellte Turing eine abstrakte Maschine vor, die nun Turing Maschinegenannt wird, die zum Prototypen des modernen programmierba-


17.1 Einleitung 245Abb. 17.1. Kurt Gödel (mit Einstein 1950): ”Jedes formale System ist unvollständig“Abb. 17.2. Alan Turing: Ich frage mich, ob meine Maschine ein Ende findet?“”ren Computers wurde. Er zeigte, dass π berechenbar sei, stellte jedoch fest,dass die meisten reellen Zahlen nicht berechenbar seien. Er gab Beispiele fürnicht entscheidbare Probleme“, die er als Frage formulierte, ob seine Ma-”


246 17. Streiten <strong>Mathematik</strong>er?*schine ein Ende finden würde oder nicht, vgl. Abb. 17.2. Turing entwickelte,zur selben Zeit als die ENIAC in den Vereinigten Staaten entst<strong>and</strong>, Plänefür einen elektronischen Computer mit Namen Analytical Computing EngineACE, in Anlehnung an die analytische Maschine von Babbage.Gödels und Turings Arbeiten kennzeichneten eine klare Niederlage für dieFormalisten/Logiker und einen klaren Sieg für die Konstruktivisten. Paradoxerweisegewannen die Formalisten/Logiker kurz nach ihrer Niederlagedie Kontrolle über die mathematischen Abteilungen, und die Konstruktivistenmussten neue Abteilungen der Informatik und Numerik, die auf konstruktiver<strong>Mathematik</strong> aufbauen, gründen. Anscheinend reichte das durchGödel und Turing hervorgerufene Trauma zur Unvollständigkeit axiomatischerMethoden und der Nicht-Berechenbarkeit so tief, dass die vorherigeKoexistenz von Formalisten/Logikern und Konstruktivisten nicht längermöglich war. Auch heute noch wird die mathematische Welt von dieserTrennung stark beeinflusst.Wir werden auf den Disput zwischen Formalisten/Logikern und Konstruktivistenunten zurückkommen und ihn benutzen, um grundlegendeGesichtspunkt der <strong>Mathematik</strong> zu veranschaulichen, was hoffentlich unseremVerständnis dienen kann.17.2 Die FormalistenDieSchulederFormalisten sagt, dass die eigentliche Bedeutung grundlegenderBegriffe unwichtig sei, da sich die <strong>Mathematik</strong> mit Beziehungenzwischen diesen grundlegenden Begriffen beschäftige, was sie auch bedeutenmögen. Daher müssen (und können) wir die grundlegenden Begriffenicht erklären oder definieren und können <strong>Mathematik</strong> als eine Art ”Spiel“auffassen. Einem Formalisten wäre jedoch der Nachweis äußerst wichtig,dass es in seinem formalen System nicht möglich ist, Widersprüche zu finden;falls doch, würde sein Spiel Gefahr laufen ausein<strong>and</strong>er zu fallen. EinFormalist würde daher großen Wert auf die Konsistenz seines formalen Systemslegen. Ein Formalist würde ferner gerne wissen, dass er, zumindestprinzipiell, in der Lage ist, sein eigenes Spiel vollständig zu verstehen, d.h.,dass er prinzipiell in der Lage wäre, eine mathematische Erklärung oderBeweis für jede wahre Eigenschaft des Spiels zu geben. Der <strong>Mathematik</strong>erHilbert war die führende Figur in der Schule der Formalisten. Hilbert warvon den Ergebnissen von Gödel schockiert.17.3 Die Logiker und die MengentheorieDie Logiker versuchten die <strong>Mathematik</strong> auf Logik und Mengentheorie aufzubauen.Die Mengentheorie wurde während der zweiten Hälfte des 19.


17.3 Die Logiker und die Mengentheorie 247Abb. 17.3. Bertr<strong>and</strong> Russell: ”Ich protestiere“Jahrhunderts entwickelt und die Sprache der Mengentheorie wurde Best<strong>and</strong>teilunserer Alltagssprache und sie wurde sehr von Schulen der Formalistenwie der Logiker geschätzt, wohingegen die Konstruktivisten ihretwas reserviert gegenüberst<strong>and</strong>en. Eine Menge ist eine Ansammlung vonDingen, die die Elemente der Menge sind. Ein Element einer Menge heißtzugehörig zur Menge. Beispielsweise kann ein Essen als Menge verschiedenerGerichte (Vorspeise, Hauptspeise, Nachtisch, Kaffee) angesehen werden.Eine Familie (die Müllers) kann als Menge betrachtet werden, die aus einemVater (Herr Müller), einer Mutter (Frau Müller) und zwei Kindern(Anja und Thomas) besteht. Ein Fußballverein (z.B. der FC Freiburg) bestehtaus der Menge aller Spieler der Mannschaft. Die Menschheit kann alsMenge aller menschlichen Wesen betrachtet werden.Mengentheorie erlaubt es, von Ansammlungen von Objekten zu sprechen,als ob sie ein einzelnes Objekt seien. Das ist sowohl in den Wissenschaftenwie der Politik sehr beliebt, da es die Möglichkeit bietet, neue Begriffe undGruppen in hierarchische Strukturen anzuordnen. Aus alten Mengen lassensich neue Mengen bilden, deren Elemente die alten Mengen sind. <strong>Mathematik</strong>erlieben es, über die Menge aller reellen Zahlen, bezeichnet mitR, dieMenge aller positiven reellen Zahlen, dieMenge aller Primzahlen, etc.zusprechen und ein Politiker, der einen Wahlkampf plant, mag an die Mengealler demokratischen Wählern, die Menge aller Selbstständigen, die Mengealler weiblichen Erstwählerinnen oder an die Menge aller armen, arbeitslosenmännlichen Kriminellen denken. Ferner kann man sich Gewerkschaftenals Mengen von Arbeitern in einer bestimmten Fabrik oder mit einem bestimmtenBerufsbild denken und dass Gewerkschaften sich vereinigen undMengen von Gewerkschaften bilden.Eine Menge kann durch die Angabe aller seiner Elemente beschriebenwerden. Das kann zu einer großen Herausforderung werden, wenn die Menge


248 17. Streiten <strong>Mathematik</strong>er?*viele Elemente (wenn beispielsweise die Menge die Menschheit ist) hat.Alternativ kann eine Menge über eine gemeinsame Eigenschaft beschriebenwerden, wie die Menge aller Menschen mit der Eigenschaft, gleichzeitig arm,arbeitslos, männlich und kriminell zu sein. Die Menschheit als Menge allermenschlichen Wesen mit der gemeinsamen Eigenschaft menschlich zu sein,gleicht jedoch eher einem Wortspiel als etwas sehr Nützlichem.Die führende Persönlichkeit der Schule der Logiker war der Philosophund Friedensaktivist Bertr<strong>and</strong> Russell (1872–1970), vgl Abb. 17.3. Russellentdeckte, dass die Definition von Mengen von Mengen, die sich nicht selbstenthalten, nicht widerspruchsfrei sei, was die Glaubwürdigkeit des gesamtenlogischen Systems gefährdete. Russell formulierte Varianten des altenLügner-Paradoxons und des Barbier-Paradoxons, die wir hier wiedergeben.Gödels Satz kann als Variante dieses Paradoxons betrachtet werden.Das Lügner-ParadoxonDas Lügner-Paradoxon lautet wie folgt: Eine Person sagt: ”Ich lüge“. Wielässt sich dieser Satz interpretieren? Angenommen, es stimmt, was diesePerson sagt. Das bedeutet, dass sie lügt und somit ist das, was sie sagt nichtwahr. Wenn man auf der <strong>and</strong>eren Seite annimmt, dass es nicht wahr ist, wassie sagt, d.h. sie lügt, dann sagt sie die Wahrheit. Wie auch immer, scheintman auf einen Widerspruch zu stoßen, oder? Vergleichen Sie Abb. 17.4.Das Barbier-ParadoxonAbb. 17.4. ”Ich lüge (nicht)“Das Barbier-Paradoxon lautet folgendermaßen: Der Barbier eines Dorfeshat beschlossen jedermann im Dorf zu rasieren, der sich nicht selbst ra-


17.4 Die Konstruktivisten 249siert. Was tut der Barbier bei sich? Wenn er sich entschließt sich selbstzu rasieren, dann gehört er zu der Gruppe von Menschen, die sich selbstrasieren, und getreu seiner Entscheidung sollte er sich nicht rasieren, waszu einem Widerspruch führt. Entscheidet er sich <strong>and</strong>ererseits dafür, sichnicht zu rasieren, dann gehört er zu der Gruppe von Menschen, die sichnicht selbst rasieren, und entsprechend dieser Entscheidung sollte er sichselbst rasieren, was wiederum zu einem Widerspruch führt. Vgl. Abb. 17.5.Abb. 17.5. Einstellungen zum ”Barbier-Paradoxon“: entspannt oder sehr nachdenklich17.4 Die KonstruktivistenDie Intuitionisten/Konstruktivisten verlangen von grundlegenden Begriffen,dass sie direkt ”intuitiv“ von unseren Gehirnen und Körpern durchErfahrung verst<strong>and</strong>en werden, ohne weitere Erklärung zu bedürfen. Fernerwürden die Intuitionisten gerne konkrete oder ”konstruktive“ Argumentebenutzen, damit ihre <strong>Mathematik</strong> immer eine intuitive ”reale“ Bedeutunghat und nicht nur Formalität ist, wie in einem Spiel.Ein Intuitionist mag sagen, dass die natürlichen Zahlen 1, 2, 3,...durchwiederholtes Addieren von 1 zu 1 erhalten werden. So sind wir bei derEinführung der natürlichen Zahlen vorgegangen. Wir wissen, dass aus derSicht eines Konstruktivisten, die natürlichen Zahlen in einer Art endlosemProzess erzeugt werden. Ist eine natürliche Zahl n gegeben, so gibt es immereine nächste natürliche Zahl n+1 und der Prozess endet nie. Ein Konstruktivistwürde nicht davon sprechen, dass die Menge der natürlichen Zahlenetwas Vollständiges ist und eine Größe für sich selbst, so wie Formalistenoder Logiker die Menge aller natürlichen Zeiten auffassen. Gauss machtedeutlich, dass ”die Menge aller natürlichen Zahlen“ eher eine ”Sprachregelung“ist als eine existierende Menge.


250 17. Streiten <strong>Mathematik</strong>er?*Ein Intuitionist würde keine Notwendigkeit für eine ”Rechtfertigung“oder einen Konsistenzbeweis durch eine eigene Argumentation benötigen,sondern würde sagen, dass die Rechtfertigung bereits dem eigentlichen konstruktivenProzess beim Aufbau innewohnt. Ein Konstruktivist würde sozusageneine Maschine bauen, die fliegen kann (ein Flugzeug), und ebendieser konstruktive Prozess wäre für sich bereits der Beweis dafür, dassder Bau eines Flugzeugs möglich ist. Ein Konstruktivist ähnelt im Geisteeinem praktischen Ingenieur. Ein Formalist würde nicht wirklich ein Flugzeugbauen, sondern eher ein Modell eines Flugzeuges, und er bräuchtedann Argumente, um Investoren und Passagiere zu überzeugen, dass dasFlugzeug fliegen kann; zumindest prinzipiell. Die führende Persönlichkeitder Schule der Intuitionisten war Brouwer (1881–1967), vgl. Abb. 17.6. EinAbb. 17.6. Luitzen Egbertus Jan Brouwer 1881–1966: ”Man kann die Grundlagenund die Natur der <strong>Mathematik</strong> nicht untersuchen, ohne auf die Frage nachden Operationen einzugehen, wodurch mathematische Aktivitäten des Verst<strong>and</strong>esgeleitet werden. Wird dies nicht berücksichtigt, bleibt man bei der Untersuchungdes mathematischen Formalismus stehen, ohne zur Essenz der <strong>Mathematik</strong> vorzudringen“echter Konstruktivist zu sein machte das Leben sehr schwer (wie ausgeprägterVegetarismus), und da die Schule der Konstruktivisten von Brouwersehr fundamental war, wurden es schnell sehr wenige und sie verlorenin den 1930ern ihren Einfluss. Das Zitat von Courant zu Beginn zeigt diestarken Gefühle, um die es dabei ging, was damit zusammenhängt, dasssehr fundamentale Dogmen auf dem Spiel st<strong>and</strong>en, und es zeigt den allgemeinverbreiteten Mangel an rationalen Argumenten gegen die Kritikder Intuitionisten, die stattdessen oft Lächerlichkeit und Unterdrückungpreisgegeben wurden.Van der Waerden, <strong>Mathematik</strong>er, studierte von 1919 bis 1923 in Amsterdam:”Brouwer kam [zur Universität], um seine Vorlesungen abzuhalten,


17.5 Peano’sche Axiome für natürliche Zahlen 251lebte aber in Laren. Er kam nur einmal die Woche. Normalerweise ist dasnicht erlaubt - er hätte in Amsterdam leben müssen - aber für ihn wurdeeineAusnahmegemacht....Ichunterbrachihneinmalwährend einer Vorlesung,um eine Frage zu stellen. Vor der Vorlesung in der folgenden Woche,kam sein Assistent zu mir, um mir mitzuteilen, dass Brouwer während derVorlesung keine Fragen gestellt haben möchte. Er wollte es einfach nicht.Er schaute immer zur Tafel und nie zu den Studenten. ...Obwohl seinewichtigsten Forschungsbeiträge in der Topologie lagen, hielt Brouwer nieeine Vorlesung über Topologie, sondern immer über - und das ausschließlich- die Grundlagen des Intuitionismus. Es schien, dass er nicht länger vonseinen Ergebnissen in der Topologie überzeugt war, da sie aus dem Blickwinkeldes Intuitionismus nicht korrekt waren, und er beurteilte alles, waser vorher getan hatte, auch seine größten Leistungen, als falsch im Sinneseiner Philosophie. Er war eine sehr seltsame Person, vollständig verliebtin seine Philosophie“.17.5 Peano’sche Axiome für natürliche ZahlenDer italienische <strong>Mathematik</strong>er Peano (1858–1932) formulierte Axiome fürdie natürlichen Zahlen mit den undefinierten Begriffen natürliche Zahl“,”” Nachfolger“, ” gehört zu“, ” Menge“ und gleich mit“. Seine fünf Axiome”lauten:1. 1 ist eine natürliche Zahl.2. 1 ist kein Nachfolger irgendeiner <strong>and</strong>eren natürlichen Zahl.3. Jede natürliche Zahl n hat einen Nachfolger.4. Sind die Nachfolger von n und m gleich, dann auch n und m.Es gibt ein fünftes Axiom, das Axiom der mathematischen Induktion. Esbesagt, dass eine Eigenschaft für alle natürlichen Zahlen gilt, wenn siefür jede natürliche Zahl n gilt, falls sie für die n vorangehende natürlicheZahl und für n = 1 gilt. Aufbauend auf diesen fünf Axiomen können alleoben angeführten grundlegenden Eigenschaften der reellen Zahlen hergeleitetwerden.Wir erkennen, dass die Peano’schen Axiome unser intuitives Gefühl fürnatürliche Zahlen, dass sie durch wiederholtes Addieren von 1 ohne jemalsaufzuhören entstehen, im Kern einfangen. Offen bleibt die Frage, obuns die Peano’schen Axiome eine klarere Vorstellung von den natürlichenZahlen vermitteln, als wir sie ohnedies intuitiv haben. Mag sein, dass diePeano’schen Axiome uns helfen, die grundlegenden Eigenschaften natürlicherZahlen zu identifizieren, aber so richtig deutlich wird nicht, worin dieverbesserte Einsicht nun besteht.


252 17. Streiten <strong>Mathematik</strong>er?*Der Logiker Russell schlug in Principia Mathematica vor, die natürlichenZahlen mit Hilfe der Mengentheorie und Logik zu definieren. Beispielsweisekönnte die Zahl 1 als die Menge aller Single, die Zahl zwei als die Mengealler Dyaden oder Paare, die Zahl drei als die Menge aller Triple, etc.definiert werden. Wieder stellt sich die Frage, ob unsere Vorstellung vonden natürlichen Zahlen dadurch vertieft wird?17.6 Reelle ZahlenViele Lehrbücher der Infinitesimalrechnung beginnen mit der Annahme,dass der Leser bereits mit reellen Zahlen vertraut ist. Sie führen schnell dieBezeichnungRzur Kennzeichnung der Menge der reellen Zahlen ein. DerLeser wird normalerweise daran erinnert, dass die reellen Zahlen als Punkteauf der reellen Zahlengeraden, einer waagerechten (dünnen, schwarzenund durchgezogenen) Linie mit Markierungen für 1, 2 und vielleicht auchZahlen wie 1, 1, 1, 2, √ 2, π etc., dargestellt werden können. Die Idee, Arithmetisches,d.h. Zahlen, auf Geometrisches zurückzuführen, geht auf Euklidzurück, der diesen Weg einschlug, um so die Probleme der irrationalen Zahlenzu vermeiden, die von den Pythagoräern entdeckt wurden. Allein aufgeometrische Argumente zu vertrauen, ist jedoch sehr unpraktisch und Descartesdrehte den Spieß im 17. Jahrhundert um und baute Geometrie aufArithmetik auf, wodurch der Weg zur Revolution der Infinitesimalrechnungfrei wurde. Die Probleme mit der Nichtfassbarkeit irrationaler Zahlen, dieden Pythagoräern Probleme bereiteten, traten natürlich wieder auf, unddie damit zusammenhängenden Fragen, die die innersten Grundlagen der<strong>Mathematik</strong> berührten, entwickelten sich zu einem Streit mit aggressivenBeiträgen vieler der größten <strong>Mathematik</strong>er, der in den 1930ern seinen Höhepunkterreichte und der die mathematische Welt von heute geprägt hat.Wir kamen oben zum St<strong>and</strong>punkt, dass eine reelle Zahl durch seine Dezimalentwicklungdefiniert werden kann. Eine rationale Zahl hat eine Dezimalentwicklung,die vielleicht periodisch wird. Eine irrationale Zahl hateine Dezimalentwicklung, die unendlich und nicht periodisch ist. Wir habenR als die Menge aller möglichen unendlichen Dezimalentwicklungen definiertund dabei darauf hingewiesen, dass diese Definition etwas vage ist,da die Bedeutung von ”möglich“ vage bleibt. Man könnte sagen, dass wireine konstruktivistische/intuitionistische Definition vonRbenutzen.Formalisten/Logiker würden lieberRals die Menge aller unendlichenDezimalentwicklungen definieren oder als Menge aller Cauchy-Folgen rationalerZahlen, in einer Art universellen Big Brother Definition.Die Menge der reellen Zahlen wird oft als ”Kontinuum“ der reellen Zahlenbezeichnet. Die Vorstellung eines ”Kontinuums“ ist grundlegend in derklassischen Mechanik, bei der sowohl Raum als auch Zeit als ”kontinuierlich“und nicht als ”diskret“ angesehen werden. Bei der Quantenmechanik,


17.7 Cantor versus Kronecker 253der modernen Version der Mechanik, die auf atomaren und molekularenSkalen arbeitet, zeigt sich die Materie eher diskret als kontinuierlich. Diesspiegelt den berühmten Teichen-Welle Dualismus in der Quantenmechanikwider, wobei das Teilchen diskret und die Welle kontinuierlich ist. Abhängigvon der Brille, die wir aufsetzen, erscheinen Phänomene mehr oder wenigerdiskret oder kontinuierlich und keine einzelne Beschreibungsart scheintauszureichen. Die Diskussionen um die Natur der reellen Zahlen mag mitdiesem Dilemma verwurzelt sein und daher niemals aufgelöst werden.17.7 Cantor versus KroneckerWir wollen einen kurzen Blick in die Diskussionen um die reellen Zahlenwerfen, die von zwei führenden Persönlichkeiten, nämlich Cantor (1845–1918) auf der Seite der Formalisten und Kronecker (1823–91) auf der Seiteder Konstruktivisten, geführt wurden. Diese beiden <strong>Mathematik</strong>er warenEnde des 19. Jahrhunderts in einen tiefen akademischen Streit verwickelt,der bis in ihr berufliches Leben reichte (was bei Cantor zu einer tragischengeistigen Unordnung geführt haben mag). Cantor erschuf die Mengentheorie,insbesondere eine Theorie über Mengen mit unendlich vielen Zahlen.Cantors Theorie wurde von Kronecker und vielen <strong>and</strong>eren kritisiert, die einfachnicht an Cantors geistige Gebilde glauben konnten oder sie für wichtighalten konnten. Kronecker schlug einen nüchternen Weg ein und sagte,dass nur Mengen mit endlich vielen Elementen von menschlichen Gehirnenrichtig verst<strong>and</strong>en werden können ( ”Gott erschuf die ganzen Zahlen, alles<strong>and</strong>ere ist Menschenwerk“). Kronecker sagte weiter, dass nur mathematischeObjekte existieren, die in endlich vielen Schritten ”konstruiert“ werdenAbb. 17.7. Cantor (links): ”Ich erkenne, dass ich mich bei diesem Unterfangenin eine gewisse Opposition zu weitverbreiteten Ansichten über das mathematischUnendliche und der häufig vertretenen Meinung über die Natur von Zahlenbegebe“. Kronecker (rechts): ”Gott erschuf die ganzen Zahlen, alles <strong>and</strong>ere istMenschenwerk“


254 17. Streiten <strong>Mathematik</strong>er?*können, wohingegen Cantor unendlich viele Schritte bei einer ”Konstruktion“erlaubte. Cantor würde sagen, dass die Menge aller natürlichen Zahlen,d.h. die Menge mit den Elementen 1, 2, 3, 4,...als ein Objekt ”existiere“,als Menge aller natürlichen Zahlen, die vom menschlichen Gehirn erfasstwerden könne, wohingegen Kronecker etwas derartiges ablehnte und einemhöheren Wesen zuschrieb. Natürlich behauptete Kronecker nicht, dass esnur endlich viele natürliche Zahlen gebe oder dass es eine größte natürlicheZahl gebe, aber er würde (Aristoteles folgend) sagen, dass die Existenzeiner beliebig großen natürlichen Zahl eher eine ”Möglichkeit“ sei als einetatsächliche Realität.Die erste Runde ging an Kronecker, da Cantors Theorien über das Unendlichevon vielen <strong>Mathematik</strong>ern des späten 19. und des frühen 20. Jahrhundertsverworfen wurden. Aber in der nächsten Runde schlug sich dereinflussreiche <strong>Mathematik</strong>er Hilbert, Führer der Schule der Formalisten, aufdie Seite von Cantor. Bertr<strong>and</strong> Russell und Norbert Whitehead versuchtenin ihrer gewaltigen Principia Mathematica (1910–13) <strong>Mathematik</strong> auf einFundament aus Logik und Mengentheorie zu stellen und können ebenso zuden Unterstützern von Cantor gezählt werden. So haben, trotz des Schlagsvon Gödel in den 1930ern, die Schulen der Formalisten/Logikern die Szeneübernommen und die <strong>Mathematik</strong>ausbildung bis in unsere Zeit beherrscht.Heute wendet sich mit der Entwicklung der Computer allmählich das Blattzugunsten der Konstruktivisten, einfach deswegen, weil kein Computer unendlichviele Operationen ausführen kann oder unendlich viele Zahlen speichernkann. Deswegen mag der alte Kampf wieder aufleben.Cantors Theorien über unendliche Zahlen sind größtenteils vergessen, bisauf ein Überbleibsel, das in den meisten Grundlagen der Infinitesimalrechnungzu finden ist, nämlich Cantors Argumentation, dass das Ausmaß anUnendlichkeit bei den reellen Zahlen streng größer ist als das der rationalenoder natürlichen Zahlen. Cantor argumentierte wie folgt: Angenommen,wir versuchen die reellen Zahlen, beginnend bei r 1 , und dann r 2 usw., zuzählen. Cantor behauptete, dass in jeder derartigen Aufzählung reelle Zahlenfehlen müssten, beispielsweise alle reelle Zahlen, die sich von r 1 in derersten Dezimalstelle, von r 2 in der zweiten Dezimalstelle usw. unterscheiden.Oder? Kronecker argumentierte gegen diese Konstruktion, indem ereinfach vollständige Information etwa über r 1 verlangte, d.h. vollständigeInformation über alle Dezimalstellen von r 1 . Gut, diese Information istverfügbar, wenn r 1 rational ist. Ist r 1 jedoch irrational, wäre die alleinigeAuflistung aller Dezimalstellen von r 1 niemals beendet, weswegen die Ideeeiner Aufzählung der reellen Zahlen für sich gesehen nicht sehr sinnvoll ist.Also, was ist Ihre Meinung? Cantor oder Kronecker?Cantor dachte nicht nur über verschiedene Ausmaße an Unendlichkeitnach, sondern klärte auch konkretere Fragen, wie beispielsweise die Konvergenztrigonometrischer Reihen, bei denen reelle Zahlen als Grenzwertevon Cauchy-Folgen rationaler Zahlen auf ziemlich genau die gleiche Weise,wiewirsiepräsentiert haben, betrachtet werden.


17.8 Wann sind Zahlen rational oder irrational? 25517.8 Wann sind Zahlen rational oder irrational?Wir verweilen noch etwas bei den reellen Zahlen. Sei x eine reelle Zahl, vonder wir die Dezimalstellen eine nach der <strong>and</strong>eren durch einen bestimmtenAlgorithmus bestimmen können. Wie können wir entscheiden, ob x rationaloder irrational ist? Rein theoretisch ist x rational, wenn die Dezimalentwicklungperiodisch ist, ansonsten irrational. Es gibt jedoch ein praktischesProblem mit dieser Antwort, da wir nur eine endliche Zahl von Dezimalstellenberechnen können, etwa niemals mehr als 10 100 .Wiekönnen wirsicher sein, dass die Dezimalentwicklung sich danach nicht zu wiederholenbeginnt? Ehrlich gesagt scheint die Frage sehr schwer beantwortbar zusein. Tatsächlich ist eine Voraussage darüber, was in einer vollständigenDezimalentwicklung passiert, unmöglich, wenn man nur eine endliche Zahlvon Dezimalstellen betrachtet. Die einzige Möglichkeit um zu entscheiden,ob eine Zahl x rational oder irrational ist, ist sich ein kluges Argumentauszudenken, wie etwa das der Pythagoräer, mit dem sie zeigten, dass √ 2irrational ist. Solche Argumente für besondere Zahlen wie π und e zu finden,hat eine Menge <strong>Mathematik</strong>er über die Jahre interessiert.Andererseits kann der Computer nur rationale Zahlen berechnen undsogar nur rationale Zahlen mit endlichen Dezimalentwicklungen. Wenn irrationaleZahlen bei praktischen Berechnungen nicht existieren, ist es dannwirklich sinnvoll, darüber nachzudenken, ob sie wirklich existieren. Konstruktivistische<strong>Mathematik</strong>er wie Kronecker und Brouwer würden nichtbehaupten, dass irrationale Zahlen wirklich existieren.17.9 Die Menge aller möglichen BücherWir schlagen vor, die Menge aller reellen Zahlen R als die Menge allermöglichen Dezimalentwicklungen oder gleichbedeutend die Menge allermöglichen Cauchy-Folgen rationaler Zahlen zu definieren. PeriodischeDezimalentwicklungen gehören zu rationalen Zahlen und nicht periodischeEntwicklungen zu irrationalen Zahlen. Die MengeRsetzt sich folglich ausder Menge aller rationalen Zahlen zuzüglich der Menge der irrationalenZahlen zusammen. Wir wissen, das üblicherweise das Wort ”möglich“ beider vorgeschlagenen Definition vonRweggelassen wird undRals ”die Mengealler reellen Zahlen“ oder als ”die Menge aller unendlichen Dezimalentwicklungen“definiert wird.Wir wollen an H<strong>and</strong> einer Analogie kontrollieren, ob sich dahinter etwasTrickreiches verbirgt. Angenommen wir definieren ein ”Buch“ als eineendliche Buchstabenfolge. Es gibt besondere Bücher, wie ”Der alte Mannund das Meer“ von Ernest Hemingway, ”Die Buddenbrocks“ von ThomasMann, ”Alice im Wunderl<strong>and</strong>“ von Lewis Carrol und ”1984“ von GeorgeOrwell, über die wir uns unterhalten. Wir könnten B als die ”Menge al-


256 17. Streiten <strong>Mathematik</strong>er?*ler möglichen Bücher“, die aus allen Büchern, die schon geschrieben sindund wahrscheinlich noch geschrieben werden, einführen und dieser Mengenoch all die Bücher“, die aus zufällig angeordneten Buchstaben bestehen,”hinzufügen. Damit wären auch die wunderbaren Werke enthalten, die vonSchimpansen geschrieben hätten werden können, die mit einer Schreibmaschinespielen. Wahrscheinlich könnten wir diese Art Terminologie ohnegrößere Probleme bewältigen und wir wären uns einig, dass 1984“ ein Elementvon B ist. Ganz allgemein könnten wir sagen, dass ein beliebiges Buch ”ein Element von B ist. Obwohl diese Aussage kaum verneint werden kann,ist es doch schwer zu behaupten, dass sie besonders nützlich ist.Angenommen, wir lassen nun das Wort möglich weg und beginnen damit,von B als derMengeallerBücher“ zu sprechen. Das würde uns den”Eindruck vermitteln, dass B in gewisser Weise etwas Existentes ist, anstelleetwas Potentielles, wie wenn wir über mögliche Bücher“ sprechen. Die”Menge B könnte als Bibliothek, in der alle Bücher stehen, betrachtet werden.Diese Bibliothek wäre enorm groß und die meisten der Bücher“ wären”für Niem<strong>and</strong>en von Interesse. Zu glauben, dass die Menge aller Bücher realexistiert“, mag für die meisten Menschen nicht natürlich sein.”Die Menge der reellen ZahlenRhat denselben Beigeschmack wie dieMenge aller Bücher B. Es muss eine sehr große Menge an Zahlen sein, vondenen nur relativ wenige, wie die rationalen Zahlen und einige bestimmteirrationale Zahlen, jemals in der Praxis angetroffen werden. Dennoch wirdR traditionell als die Menge aller reellen Zahlen definiert und nicht als dieMenge aller möglichen reellen Zahlen“. Der Leser mag die Interpretation”vonRnach seinem eigenen Geschmack wählen. Ein wahrer Idealist würdebehaupten, dass die Menge aller reellen Zahlen existiert“, wohingegen einebodenständige Person eher von der Menge aller möglichen reellen Zah-”len sprechen würde. Vielleicht endet es mit einem persönlichen religiösenGefühl; einige Menschen scheinen zu glauben, dass der Himmel existiert,wohingegen <strong>and</strong>ere es als Möglichkeit oder als poetische Möglichkeit betrachten,um etwas zu beschreiben, das schwer zu begreifen ist.Welche Interpretation Sie auch immer wählen, so werden Sie sicherlichdamit übereinstimmen, dass einige reelle Zahlen klarer spezifiziert sind als<strong>and</strong>ere und dass die Spezifikation einer reellen Zahl einen Algorithmus erfordert,der es erlaubt, so viele Stellen der reellen Zahl zu berechnen wiemöglicherweise (oder vernünftigerweise) gewünscht werden.17.10 Rezepte und gutes EssenDer Bisektionsalgorithmus erlaubt es, jede beliebige Anzahl von Dezimalstellenvon √ 2 zu berechnen, falls genug Rechenleistung zur Verfügungsteht. Einen Algorithmus einzusetzen, um eine Zahl zu spezifizieren, istanalog zur Benutzung eines Rezepts um beispielsweise Großvaters Scho-


17.11 ”Neue <strong>Mathematik</strong>“ in der Grundschule 257koladenkuchen zu spezifizieren. Wenn wir dem Rezept folgen, können wireinen Kuchen backen, der eine mehr oder weniger genaue Näherung <strong>and</strong>en Idealkuchen (den nur Großvater selbst backen kann) darstellt, die vonunseren Fertigkeiten, Ausstattung und Zutaten abhängt. Zwischen dem Rezeptund dem damit hergestellten Kuchen besteht ein klarer Unterschied,da wir den Kuchen mit Genuss essen können, aber nicht das Rezept. DasRezept ist wie ein Algorithmus, der angibt, wie vorzugehen ist, wie vieleEier beispielsweise benutzt werden, wohingegen der Kuchen das Ergebnisder tatsächlichen Anwendung des Algorithmuses mit echten Eiern ist.Natürlich gibt es Leute, die es scheinbar genießen, Rezepte zu lesen oderauch nur Bilder von Essen in Zeitschriften anzuschauen und darüber zureden. Aber falls sie selbst nie etwas kochen, werden ihre Freunde wahrscheinlichdas Interesse an dieser Beschäftigung verlieren. Ganz ähnlichkann man es genießen, die Symbole π, √ 2 etc. anzuschauen, über sie zusprechen oder sie auf Papier zu malen, aber wenn man sie niemals wirklichberechnet, wird man sich irgendwann fragen, was man eigentlich macht.In diesem Buch werden wir auf viele mathematische Größen treffen, dienur näherungsweise mit Hilfe eines Computer-Algorithmuses berechenbarsind. Beispiele für solche Größen sind √ 2, π und die Basis e des natürlichenLogarithmuses. Später werden wir sehen, dass auch Funktionen, sogarElementarfunktionen wie sin(x) und exp(x), für verschiedene Werte vonx berechnet werden müssen. Genauso, wie wir einen Kuchen erst backenmüssen, bevor wir ihn genießen können, müssen wir solche idealen mathematischenGrößen erst mit bestimmten Algorithmen berechnen, bevor wirsie für <strong>and</strong>ere Zwecke benutzen können.17.11 ”Neue <strong>Mathematik</strong>“ in der GrundschuleNach der Niederlage der Formalisten in den 1930ern durch die Argumentevon Gödel gewann die Schule der Formalisten paradoxerweise an Einflussund die Mengentheorie bekam ihre zweite Chance. Wie eine Welle erfasstediese Entwicklung den <strong>Mathematik</strong>unterricht in der Grundschule in den1960ern als ”neue <strong>Mathematik</strong>“. Zahlen wurden mit Hilfe der Mengentheorieerklärt, so wie Russell und Whitehead es 60 Jahre zuvor in ihrer Principiaversucht hatten. So lernten Kinder, dass eine Menge, die aus einer Kuh,zwei Bechern, einem Stuhl und einer Orange besteht, fünf Elemente hat. Sosollte die Zahl 5 erklärt werden, statt fünf an den Fingern abzuzählen oder5 Orangen aus einem Stapel Orangen herauszunehmen. Die ”neue <strong>Mathematik</strong>“verwirrte die Kinder und viel mehr noch die Eltern und Lehrer undwurde nach einigen turbulenten Jahren vergessen.


258 17. Streiten <strong>Mathematik</strong>er?*17.12 Die Suche nach Stringenz in der <strong>Mathematik</strong>Die Formalisten versuchten, die <strong>Mathematik</strong> streng formal aufzubauen. DieSuche nach Stringenz begann mit Cauchy und Weierstrass, die versuchten,präzise Definitionen für die Begriffe Grenzwert, Ableitung und Integral zugeben. Sie wurde von Cantor und Dedekind fortgesetzt, die versuchten, diepräzise Bedeutung von Begriffen wie Kontinuum, reelle Zahl, die Mengereeller Zahlen etc. klarzustellen. Die Bemühungen, <strong>Mathematik</strong> auf einevollständig rationale Basis zu stellen, brachen schließlich zusammen, wiewir oben angedeutet haben.Wir können zwei Arten von Stringenz ausmachen: konstruktive Stringenz formale Stringenz.Konstruktive Stringenz ist notwendig, um schwierige Aufgaben bewältigenzukönnen,wie beispielsweise eine Herzoperation auszuführen, einenMenschen auf den Mond zu schicken, eine schmale Hängebrücke zu bauen,den Mount Everest zu besteigen oder ein langes Computerprogramm zuschreiben, das korrekt funktioniert. In allen Fällen kann die kleinste Einzelheitwichtig sein und falls das gesamte Unternehmen nicht mit extremerStringenz durchgeführt wird, wird es wahrscheinlich misslingen. Letztendlichist es eine Stringenz, die Materielles oder tatsächliche Vorgänge betrifft.Formale Stringenz ist <strong>and</strong>ersartig und besitzt keine direkten konkretenObjekte, wie die oben angeführten. Formale Stringenz mag an einem königlichenHof exerziert werden oder in der Diplomatie. Es ist eine Stringenz,die sich in Sprache (Worten) oder Benehmen ausdrückt. Die Scholastikerim Mittelalter waren Formalisten, die formale Stringenz liebten. Sie konntenbeispielsweise mit sehr komplizierten Argumenten die Frage diskutieren,wie viele Engel auf einer Messerspitze Platz fänden. Einige Menschenbenutzen eine formal korrekte Sprache, die als Ausdruck einer formalenStringenz betrachtet werden kann. Autoren legen großen Wert auf sprachlicheFormalitäten und können stundenlang einen einzigen Satz polieren,bis er die richtige Form bekommt. Ganz allgemein können formale Gesichtspunktein der Kunst und der Ästhetik sehr wichtig sein. Sie dientaber einem <strong>and</strong>eren Zweck als konstruktive Stringenz. Konstruktive Stringenzdient der Sicherstellung, dass etwas tatsächlich wie gewünscht abläuft.Formale Stringenz kann dazu dienen, Menschen zu kontrollieren oder zubeeindrucken oder auch nur um Menschen ein gutes Gefühl zu vermittelnoder um diplomatische Verh<strong>and</strong>lungen zu führen. Formale Stringenz kannin einem Spiel oder einem Wettbewerb mit gewissen aber sehr spezifischenRegeln exerziert werden, die sehr streng sind, aber keinem direkten praktischenZweck außerhalb des Spiels dienen.Auch in der <strong>Mathematik</strong> kann zwischen konkreter und formaler Stringenzunterschieden werden. Eine Berechnung, wie die Multiplikation zwei-


17.13 Ein nicht konstruktiver Beweis 259er natürlichen Zahlen, ist eine konkrete Aufgabe und Stringenz bedeuteteinfach, dass die Berechnung richtig ausgeführt wird. Das mag in der Wirtschaftoder im Ingenieurwesen sehr wichtig sein. Die Wichtigkeit dieser Artvon Stringenz ist nicht schwer zu erklären und Studierende haben keineSchwierigkeiten für sich selbst zu formulieren, welche Kriterien konstruktiverStringenz in verschiedenen Zusammenhängen angebracht sind.Formale Stringenz in der Infinitesimalrechnung wurde von Weierstrassmit dem Ziel voran getrieben, grundlegende Begriffe und Argumente wiedas Kontinuum reeller Zahlen oder Grenzwertprozesse ”formal korrekter“zu machen. Die Vorstellung formaler Stringenz ist noch sehr lebendig in <strong>Mathematik</strong>ausbildungen,die von der Schule der Formalisten beherrscht wird.Üblicherweise können Studierende die Bedeutung dieser Art von ”formalstrenger Überlegung“ nicht verstehen und sehr selten können sie diese Artformaler Stringenz ohne Anleitung des Lehrers anwenden.Wir werden einem Ansatz folgen, der versucht, konstruktive Stringenz ineinem begründbaren Maß zu erreichen und wir werden versuchen, formaleStringenz begrifflich verständlich zu machen und einige ihrer Tugenden zuerklären.17.13 Ein nicht konstruktiver BeweisWir geben nun einen nicht konstruktiven Beweis als Beispiel, der in vielenBüchern der Infinitesimalrechnung eine wichtige Rolle spielt, obwohl derBeweis, wegen seiner nicht konstruktiven Vorgehensweise als so schwierigbetrachtet wird, dass nur ausgewählte fortgeschrittene <strong>Mathematik</strong>er dafürVerständnis haben.Er lautet folgendermaßen: Wir betrachten eine beschränkte anwachsendeFolge {a n } ∞ 1 reeller Zahlen, d.h. a n ≤ a n+1 für n =1, 2,... mit einerKonstanten C, sodassa n ≤ C für n =1, 2,.... Die Behauptung ist, dassdie Folge {a n } ∞ 1 gegen einen Grenzwert A konvergiert. Es folgt der Beweis:Alle Zahlen a n liegen im Intervall I =[a 1 ,C]. Der Einfachheit halber seia 1 = 0 und C = 1. Wir teilen nun das Intervall [0, 1] in zwei Intervalle[0, 1/2] und [1/2, 1] und treffen die folgende Wahl: Ist eine der reellen Zahlena n ∈ [1/2, 1], dann wählen wir das rechte Intervall [1/2, 1], ansonstendas linke Intervall [0, 1/2]. Dann wiederholen wir die Unterteilung in einrechtes und linkes Intervall und wählen eines der Intervalle nach derselbenMethode: Liegt die reelle Zahl a n im rechten Intervall, dann wählen wirdieses, ansonsten das linke Intervall. So erhalten wir eine verschachtelteFolge von Intervallen, deren Länge gegen Null geht, die eine eindeutige reelleZahl definieren, die offensichtlich Grenzwert der Folge {a n } ∞ 1 ist. SindSie davon überzeugt? Falls nicht, müssen Sie ein Konstruktivist sein.Also, wo ist der nicht konstruktive Haken bei diesem Beweis? Er liegtnatürlich in der Intervallwahl: Um das richtige Intervall auszuwählen, muss


260 17. Streiten <strong>Mathematik</strong>er?*man prüfen können, ob eines der a n im rechten Intervall liegt, d.h. wirmüssen prüfen, ob a n für genügend großes n im rechten Intervall liegt.Beim konstruktivistischen St<strong>and</strong>punkt stellt sich die Frage, ob wir dieseÜberprüfung in einer endlichen Zahl von Schritten ausführen können. Dasmag von der besonderen Folge a n ≤ a n+1 abhängen. Wir wollen zunächsteine Folge betrachten, die so einfach ist, dass wir mit Fug und Recht sagenkönnen, alles Interessante darüber zu wissen: Beispielsweise die Folge{a n } ∞ 1 mit a n =1−2 −n , d.h. die Folge 1/2, 3/4, 7/8, 15/16, 31/32,.... Einebeschränkte anwachsende Folge, die offensichtlich gegen 1 konvergiert. Fürdiese Folge könnten wir stets das richtige Intervall (das rechte) auswählen,weil sie so einfach ist.Als Nächstes wollen wir die Folge {a n } ∞ 1 mit a n = ∑ n1 1kbetrachten,2die offensichtlich anwachsend ist. Es ist ganz einfach zu zeigen, dass siebeschränkt ist. In diesem Fall ist die Wahl des Intervalls bedeutend schwierigerund es ist nicht klar, wie wir die Wahl konstruktiv treffen können ohnevorher den Grenzwert zu konstruieren. Nun stehen wir da und können unsfragen, welchen Wert ein nicht konstruktiver Beweis zur Existenz einesGrenzwertes hat, wenn wir den Grenzwert auf jeden Fall vorher konstruierenmüssen.Wie auch immer fassen wir hier das Ergebnis, das wir unten einige Malebenutzen werden, zusammen:Satz 17.1 (nicht konstruktiv!) Eine beschränkte anwachsende Folge istkonvergent.17.14 ZusammenfassungNach Platon existieren ideale Punkte und Geraden in einer Art Himmel,während Punkte und Geraden, mit denen Menschen umgehen, mehr oderweniger unvollständige Kopien oder Schatten oder Bilder dieser Ideale sind.Das ist Platons idealistischer Ansatz, der mit der Schule der Formalistenverbunden ist. Ein Intuitionist würde sagen, dass die Existenz der Idealenicht sicher belegt ist, und dass wir uns stattdessen auf die mehr oder wenigerunvollständigen Kopien konzentrieren sollten, die wir als menschlicheWesen selbst konstruieren können. Die Frage nach der tatsächlichen Existenzder Ideals wird zur Frage der Metaphysik oder der Religion und wahrscheinlichgibt es keine definitive Antwort dafür. Unseren eigenen Empfindungenfolgend, können wir selbst wählen, ob wir eher Idealist/Formalistoder Intuitionist/Konstruktivist sein wollen oder irgendetwas dazwischen.Die Autoren dieses Buch haben einen Mittelweg zwischen den konstruktivistischenund formalistischen Schulen gewählt. Wir versuchen von einempraktischen St<strong>and</strong>punkt aus so konstruktiv wie möglich zu sein, aber oftnutzen wir aus Bequemlichkeitsgründen eine formalistische Sprache. Derkonstruktive Ansatz hat seinen Schwerpunkt auf konkreten Aspekten der


Aufgaben zu Kapitel 17 261<strong>Mathematik</strong> und schafft Nähe zum Ingenieurwesen und dem ”Leib“. Dermystische Charakter der <strong>Mathematik</strong> wird dadurch reduziert und es hilftdem Verständnis. Andererseits kann <strong>Mathematik</strong> nicht eine Ingenieurswissenschaftoder nur ”Leib“ sein und die weniger konkreten Aspekte oderdie ”Seele“ sind ebenso wertvoll für unser Denken und das Modellieren derWelt um uns herum. So suchen wir eine gute Synthese der konstruktivistischenund der formalistischen <strong>Mathematik</strong> oder eine Synthese von <strong>Body</strong> &<strong>Soul</strong>.Wenn wir zum Anfang unserer kleinen Diskussion zurückgehen, so assoziierenwir die Schulen der Logiker und der Formalisten mit der idealistischen/aristokratischenTradition <strong>and</strong> die Konstruktivisten mit der konstruktiven/demokratischenTradition. Als Studierende würden wir wahrscheinlicheinen konstruktiven/demokratischen Ansatz schätzen, da es demVerständnis hilft und den Studierenden eine aktive Rolle einräumt. Andererseitssind gewisse Dinge tatsächlich sehr schwer zu verstehen oder zukonstruieren, und dann bietet der idealistische/aristokratische Ansatz eineMöglichkeit, um dieses Dilemma zu lösen.Der konstruktivistische Ansatz, wo immer er eingesetzt werden kann, istvom Ausbildungsst<strong>and</strong>punkt sehr attraktiv, da er den Studierenden eineaktive Rolle einräumt. Studierende sind aufgefordert, selbst zu konstruierenund nicht nur einem omnipotenten Lehrer zu folgen, der vorgefertigteBeispiele aus dem Hut zaubert.Die Entwicklung moderner Computer hat für die konstruktive <strong>Mathematik</strong>einen immensen Schub bedeutet, da der Computer konstruktiv arbeitet.Die <strong>Mathematik</strong>ausbildung wird immer noch von der Schule der Formalistenbeherrscht, und die meisten heutigen Probleme im Zusammenhangmit der <strong>Mathematik</strong>ausbildung haben ihre Ursache in der Überbetonungder idealistischen Schulen in Zeiten, da die konstruktive <strong>Mathematik</strong> dieAnwendungen beherrscht.Turings Prinzip einer ”universellen Rechenmaschine“ (mit dem SchlüsselartikelComputable Numbers) verbindet direkt die Arbeiten am Fundamentder <strong>Mathematik</strong> in den 1930ern mit der Entwicklung moderner Computerin den 1940ern (mit ACE als Schlüsselwort) und verdeutlicht so konkretdie Kraft der (konstruktiven!) <strong>Mathematik</strong>.Aufgaben zu Kapitel 1717.1. Können Sie begreifen, wie das Barbier-Paradoxon konstruiert ist? Angenommen,der Barbier kommt aus einem <strong>and</strong>eren Dorf. Löst das das Paradox?17.2. Folgendes ist ein ähnliches Paradoxon: Betrachten Sie alle natürlichenZahlen, die Sie mit höchstens 100 Worten oder Buchstaben beschreiben können.Z.B. können Sie die Zahl 10 000 durch das Wort ”zehntausend“ beschreiben,oder ”eine eins mit vier Nullen“. Beschreiben Sie nun eine Zahl, indem Sie sie als


262 17. Streiten <strong>Mathematik</strong>er?*die kleinste natürliche Zahl spezifizieren, die nicht mit höchsten hundert Wortenbeschrieben werden kann. Aber der Satz ”die kleinste natürliche Zahl, die nichtmit höchstens hundert Worten beschreibbar ist“ ist eine Beschreibung einer bestimmtenZahl in weniger als 100 Worten (es sind genau 12), was der Definitiondieser Zahl als nicht in weniger als 100 Worten beschreibbare Zahl, widerspricht.Können Sie herausfinden, wie dieses Paradoxon entsteht?17.3. Beschreiben Sie so genau wie möglich, was Sie unter Punkt oder Geradeverstehen. Bitten Sie einen Freund, das gleiche zu tun und vergleichen Sie dieBegriffe.17.4. Studieren Sie auf den ersten Seiten eines Buches über Infinitesimalrechnungin der nächsten Bibliothek oder in ihrem Bücherregal, wie der Begriff reelle Zahleingeführt wird.17.5. Definieren Sie die Zahl ω ∈ (0,1) folgendermaßen: Die erste Stelle von ωsei 1 in der Position, in der bei der Dezimalentwicklung von √ 2 zum zehnten Maldie 1 auftritt; die <strong>and</strong>eren Stellen seien 0. Die zweite Stelle von ω sei gleich 1bei der 20. 1 in der Dezimalentwicklung von √ 2, ansonsten Null, usw. Ist ω einewohl definierte reelle Zahl? Wie viele Stellen von ω können ihrer Meinung nachhöchstens berechnet werden?17.6. Führen Sie eine Abstimmung darüber durch, was Menschen unter einerreellen Zahl verstehen, bei Freunden, Verw<strong>and</strong>ten, Politikern, Rock Musikern bishin zu Physikern und <strong>Mathematik</strong>professoren.Einige angesehene <strong>Mathematik</strong>er haben neulich verfochten, nichtkonstruktive Beweise mehr oder weniger vollständig aus der <strong>Mathematik</strong>zu verbannen. Selbst wenn ein solches Programm wünschenswertwäre, würde es doch immense Probleme aufwerfen und sogardie teilweise Zerstörung der Körper lebender <strong>Mathematik</strong>er. Daherist es nicht weiter verwunderlich, dass die Schule der ”Intuitionisten“,die dieses Programm vertritt, auf großen Widerst<strong>and</strong> stieß,und dass sogar die eingefleischtesten Intuitionisten nicht immer nachihren Überzeugungen leben können. (Courant)Das Schreiben gewaltiger Bücher ist ein mühseliger und erschöpfenderLuxus. Auf fünfhundert Seiten eine Idee zu entwickeln, die mündlichin einigen wenigen Minuten erschöpfend vorgestellt werden kann!Da ist es doch besser vorzutäuschen, dass diese Bücher bereits existierenund stattdessen eine Zusammenfassung, einen Kommentaranzubieten.... Weil ich vernünftiger, plumper und träger bin, habeich es vorgezogen, Anmerkungen über imaginäre Bücher zu schreiben.(Borges, 1941)Ich habe mir das Paradies immer als eine Art Bibliothek vorgestellt.(Borges)Mein Buchpreis der Sherbourne Schule (von Neumanns ”MathematischeGrundlagen der Quantenmechanik“) erweist sich als sehr interessantund überhaupt nicht schwer lesbar, obwohl die angew<strong>and</strong>ten<strong>Mathematik</strong>er es scheinbar sehr ”heftig“ finden. (Turing, Alter 21)


Aufgaben zu Kapitel 17 263Abb. 17.8. Blick auf den Fluss Cam in Cambridge 2003 mit ACE im Vordergrund(und ”UNTHINKABLE“ rechts im Hintergrund)


18Die Funktion y = x rMit gleicher Leidenschaft habe ich nach Erkenntnis gestrebt. Ichwollte das Herz der Menschen ergründen. Ich wollte begreifen, warumdie Sterne scheinen. Ich habe die Kraft zu erfassen gesucht, durch dienach den Pythagoräern die Zahl den Strom des Seins beherrscht. Einwenig davon, wenn auch nicht viel, ist mir gelungen. (Bertr<strong>and</strong> Russell1872–1970)18.1 Die Funktion √ xWir haben oben gezeigt, dass wir die Gleichung x 2 = a für jede positiverationale Zahl a mit Hilfe des Bisektionsalgorithmuses lösen können. Dieeindeutige positive Lösung ist eine reelle Zahl, geschrieben √ a.Wirkönnen√ a als eine Funktion von a betrachten, definiert für a ∈Q+ .Natürlichkönnen wir die Funktion √ a auf [0, ∞) erweitern, da 0 2 =0oder √ 0=0.Tauschen wir den Namen a gegen x,sokönnen wir die Funktion f(x)=√ x betrachten, mit D(f)=Q+ und f :Q + →R + . Wie im Kapitel ”ReelleZahlen“ erläutert, können wir sie zu einer Funktion f :R + →R + erweiternmit f(x)= √ x, da wie oben diskutiert, √ x auf Intervallen (δ, ∞)mitδ>0Lipschitz-stetig ist. Da nach Definition √ x die Lösung der Gleichung y 2 = xmit der Unbekannten y ist, haben wir für x ∈R +( √ x) 2 = x. (18.1)Wir stellen die Funktion √ x in Abb. 18.1 graphisch dar.


266 18. Die Funktion y = x r4.54Quadratwurzel von x3.532.521.510.500 2 4 6 8 10 12 14 16 18Abb. 18.1. Die Funktion √ x von xxDie Funktion y = √ x ist ansteigend: Ist x>¯x, dann √ x> √¯x. Istferner {x i } eine Folge positiver reeller Zahlen mit lim i→∞ x i =0,soistoffensichtlich lim i→∞√xi =0,d.h.limx→0 + √ x =0. (18.2)18.2 Rechnen mit der Funktion √ xIst x 2 = a und y 2 = b, dann(xy) 2 = ab. Daraus erhalten wir die folgendeEigenschaft der Quadratwurzelfunktion:√ a√b =√ab. (18.3)Ganz ähnlich erhalten wir√ a√b=√ ab . (18.4)18.3 Ist √ x Lipschitz-stetig aufR + ?Um zu prüfen, ob die Funktion f(x) = √ x Lipschitz-stetig ist aufR + ,betrachten wirf(x) − f(¯x)= √ x − √¯x =1√ x +√¯x(x − ¯x),


da ( √ x − √¯x)( √ x + √¯x)=x − ¯x.Da18.4 Die Funktion x r für rationales r = p q2671√ x +√¯xbeliebig groß werden kann, wenn x und ¯x (positiv) klein werden, hat dieFunktion f(x) = √ x keine beschränkte Lipschitz-Konstante aufR + ,d.h.f(x)= √ x ist nicht Lipschitz-stetig aufR + . Dies spiegelt die Beobachtungwider, dass die Steigung“ von √ x scheinbar ohne Beschränkung anwächst,”wenn x sich an Null annähert. Dagegen ist f(x)= √ x Lipschitz-stetig aufjedem Intervall (δ, ∞), wobei δ eine feste positive Zahl ist, da wir dann dieLipschitz-Konstante L f zu 12δwählen können.18.4 Die Funktion x r für rationales r = p qWir betrachten die Gleichung y q = x p mit der Unbekannten y, wobeipund q vorgegebene ganze Zahlen sind und x eine positive reelle Zahl. Mitdem Bisektionsalgorithmus lässt sich beweisen, dass diese Gleichung eineeindeutige Lösung y für jede gegebene positive Zahl x hat. Wir nennen dieLösung y = x p q = x r ,mitr = p q. Auf diese Art definieren wir eine Funktionf(x)=x r aufR + , bekannt als x hoch r“. Die Eindeutigkeit folgt daraus,”dass y = x r mit x ansteigt. Anscheinend ist √ x = x 1 2.18.5 Rechnen mit der Funktion x rAus der Definitionsgleichung y q = x p erhalten wir für x ∈R + und r, s ∈Q :x r x s = x r+s ,x rx s = xr−s . (18.5)18.6 Verallgemeinerung der Lipschitz-StetigkeitEs gibt folgende natürliche Verallgemeinerung der Lipschitz-Stetigkeit. Sei0


268 18. Die Funktion y = x rsomit eine größere Klasse von Funktionen. Beispielsweise können wir zeigen,dass die Funktion f(x) = √ x Lipschitz-stetig ist auf (0, ∞) mitdemExponenten θ =1/2 zur Lipschitz-Konstanten L =1,d.h.| √ x − √¯x|≤|x − ¯x| 1/2 . (18.6)Für den Beweis nehmen wir an, dass x>¯x und rechnen rückwärts, beginnendbei ¯x ≤ √ x √¯x, und erhalten so x +¯x − 2 √ x √¯x ≤ x − ¯x = |x − ¯x|,was als( √ x − √¯x) 2 ≤ (|x − ¯x| 1/2 ) 2geschrieben werden kann, woraus die gewünschte Abschätzung durch Ziehender Wurzel gewonnen wird. Der Fall ¯x>xist identisch.Lipschitz-stetige Funktionen mit Lipschitz-Exponenten θ


19Fixpunkte und kontrahierendeAbbildungenGebt mir einen festen Punkt und ich werde die Erde aus den Angelnheben. (Archimedes)19.1 EinleitungEin Spezialfall für die Lösung einer algebraischen Gleichung f(x)=0hatdie Form: Finde ¯x so, dass¯x = g(¯x) (19.1)gilt, wobei g :R→Reine gegebene Lipschitz-stetige Funktion ist. Gleichung(19.1) besagt, dass ¯x ein Fixpunkt der Funktion y = g(x) ist,d.h.das Resultat g(¯x) stimmtmitdemArgument¯x überein. Anschaulich gesprochen,suchen wir den Schnittpunkt des Graphen der Geraden y = xmit der Kurve y = g(x), vgl. Abb. 19.1.Um die Gleichung x = g(x) zulösen, können wir sie zu f(x) =0mit(beispielsweise) f(x)=x−g(x) umschreiben und dann die Bisektion (oderDekasektion) auf f(x) = 0 anwenden. Beachten Sie, dass die beiden Gleichungenf(x) =0mitf(x) =x − g(x) und x = g(x) exakt die gleichenLösungen haben, d.h., die beiden Gleichungen sind äquivalent.In diesem Kapitel wollen wir einen <strong>and</strong>eren Algorithmus zur Lösung von(19.1) betrachten, der von zentraler Bedeutung in der <strong>Mathematik</strong> ist. Dasist die Fixpunkt-Iteration, die folgendermaßen aussieht: Beginnend bei x 0 ,berechnen wir für i =1, 2,...x i = g(x i−1 ) für i =1, 2, 3,... . (19.2)


270 19. Fixpunkte und kontrahierende Abbildungeny=xy = g(x)x = g(x)xAbb. 19.1. Veranschaulichung eines Fixpunktproblems g(¯x)=¯xIn Worte gefasst, beginnen wir mit einer Anfangsnäherung x 0 , berechnendann x 1 = g(x 0 ), x 2 = g(x 1 ), x 3 = g(x 2 ) usw. Wir berechnen für dasaktuelle Argument x i−1 das zugehörige Resultat g(x i−1 ) und wählen dannx i = g(x i−1 ) als neues Argument. Wenn wir diese Prozedur wiederholen,erhalten wir eine Folge {x i } ∞ i=1 .Wir werden unten die folgenden wichtigen Fragen zur Folge {x i } ∞ i=1 ,diedurch die Fixpunkt-Iteration erzeugt wird, untersuchen: Konvergiert {x i } ∞ i=1 , d.h. existiert ¯x = lim i→∞ x i ? Ist ¯x = lim i→∞ x i ein Fixpunkt von y = g(x), d.h. ist ¯x = g(¯x)?Wir werden ferner untersuchen, ob ein Fixpunkt ¯x eindeutig bestimmt istoder nicht.19.2 Kontrahierende AbbildungenWir werden in diesem Abschnitt beweisen, dass es für die beiden obengestellten Fragen bejahende Antworten gibt, falls g(x) Lipschitz-stetig istzur Lipschitz-Konstanten L


19.3 f(x) = 0 umformuliert zu x = g(x) 271mit der Fixpunkt-Iteration erzeugt wird. Dies ist ein mathematisch höchstwichtiges Ergebnis mit einer Fülle von Anwendungen, das auch als BanachscherFixpunktsatz bezeichnet wird. Banach war ein berühmter polnischer<strong>Mathematik</strong>er, der die Funktionalanalysis, die eine Verallgemeinerung derInfinitesimalrechnung und der linearen Algebra ist, mitbegründete.19.3 f(x) = 0 umformuliert zu x = g(x)Die Fixpunkt-Iteration ist ein Algorithmus, um Lösungen für Gleichungender Form x = g(x) zu berechnen. Wenn eine Gleichung der Form f(x)=0gegeben ist, kann es sein, dass wir diese Gleichung als Fixpunktgleichungx = g(x) umschreiben wollen. Dafür gibt es viele verschiedene Möglichkeiten,z.B.g(x)=x + αf(x),wobei α eine wählbare von Null verschiedene reelle Zahl ist. Offensichtlicherhalten wir ¯x = g(¯x) genau dann, wenn f(¯x) = 0. Um schnelle Konvergenzzu erhalten, versuchen wir α so zu wählen, dass die Lipschitz-Konstante derzugehörenden Funktion g(x) klein ist. Wir werden sehen, dass uns die Suchenach derartigen Werten von α in die wunderbare Welt des NewtonschenVerfahrens zur Lösung von Gleichung führen wird, einem sehr wichtigenVerfahren in der <strong>Mathematik</strong>.Die Suche nach einem guten Wert von α,mitdemg(x)=x+αf(x)einekleine Lipschitz-Konstante hat, könnte folgendermaßen aussehen:g(x) − g(y)=x + αf(x) − (y + αf(y)) = x − y + α(f(x) − f(y))()f(x) − f(y)= 1+α |x − y|x − yunter der Annahme x>y, woraus sich eine Wahl für α von− 1 α=f(x) − f(y)x − yanbietet. Wir erhalten dieselbe Formel für x


272 19. Fixpunkte und kontrahierende Abbildungen(y, f(y))(x, f(x))Abb. 19.2. Verbindungssekante der Punkte (x,f(x)) und (y,f(y)) in Ê 219.4 KartenverkaufsmodellEin Hausierer, der Grußkarten verkauft, hat einen Lizenzvertrag mit der folgendenPreisabsprache mit einer Vertriebsfirma. Die Lieferung der Kartenkostet eine Pauschale von 25 Euro. Dazu kommt eine zusätzliche Abgabevon 25% für jede verkaufte Karte. Mathematisch formuliert, bezahlt er,wenn wir in Einheiten von x-hundert Euro rechnen, an die Vertriebsfirmag(x)= 1 4 + 1 x, (19.4)4wobei g das Vielfache von hundert Euro wiedergibt. Wir fragen nach derGewinnschwelle, d.h. der Zahl der Verkäufe ¯x, bei denen das eingenommeneGeld (= ¯x) genau die Kosten (= g(¯x)) ausgleicht. Natürlich freut sich derHausierer schon auf seinen Gewinn, den er ab diesem Punkt einzustreichenhofft.Wir veranschaulichen das Problem in Abb. 19.3 mit Hilfe zweier Linien.Die erste Linie y = x steht für die Einnahmen beim Verkauf von x. Hierbeimessen wir die Einnahmen in Euro, statt in der Anzahl verkaufter Karten,so dass wir y = x schreiben können. Die zweite Gerade y = g(x)= 1 4 x + 1 4steht für die Kosten, die an die Herstellerfirma zu bezahlen sind. Wegen derAnfangspauschalen von 25 Euro beginnt der Hausierer mit einem Verlust.Mit jeder verkauften Karte nähert er sich der Gewinnschwelle ¯x,abdererschließlich Gewinn erzielt.Beim Kartenverkaufsmodell ist es einfach, die Gewinnschwelle für denHausierer analytisch zu berechnen, d.h. den Fixpunkt ¯x, da wir die Gleichung¯x = g(¯x)= 1 4 ¯x + 1 4direkt lösen können und ¯x =1/3erhalten.


19.5 Modell für das Privateinkommen 273Einnahmeny = xy = ¼ x + ¼¼Zahlungenan die FirmaVerlustGewinnxVerkäufeAbb. 19.3. Veranschaulichung der Gewinnschwelle für den Hausierer. Verkaufszahlenoberhalb der Gewinnschwelle ¯x ergeben einen Gewinn für den Hausierer,aber Verkaufszahlen unterhalb dieses Punktes bedeuten einen Verlust19.5 Modell für das PrivateinkommenIhre Freundin hat für ihr Privateinkommen das folgende Modell formuliert:Bezeichne x das Netto-Einkommen, das veränderlich ist und Beiträgevon der Familie, einem Stipendium und Gelegenheitsarbeit in einer Imbissbudeumfasst. Die Ausgaben setzen sich aus einem Fixbetrag von 1 (inEinheiten von 500 Euro pro Monat) für Miete und Versicherungen, einemvariablen Betrag von x/2 für gutes Essen, gute Bücher und intellektuelleFilme und einem variablen Betrag 1/x für Fastfood, Zigaretten und schlechteFilme zusammen. Dieses Modell beruht auf der Beobachtung, dass dieLebensführung Ihrer Freundin umso bürgerlicher ist, je mehr Geld sie hat.Die Gesamtausgaben betragen folglichg(x)= x 2 +1+1 x .Die Kunst liegt darin, eine Balance zwischen Einnahmen und Ausgaben zufinden, d.h. das Einkommen ¯x zu finden, so das ¯x = g(¯x) und die Ausgabenden Einnahmen gleich sind. Sind die Einnahmen größer als ¯x, dannwirdIhre Freundin nicht all ihr Geld verbrauchen, was ihrer Natur zuwider ist.Sind ihre Einnahmen kleiner als ¯x, geraten die Eltern Ihrer Freundin ausder Fassung, da sie die resultierenden Schulden ausgleichen müssen.Auch in diesem Fall kann der Fixpunkt ¯x direkt durch Lösen der Gleichung¯x = ¯x 2 +1+1¯xanalytisch berechnet werden und wir erhalten ¯x =1+ √ 3 ≈ 2, 73.Falls wir nicht genug motiviert sind, den Lösungsweg nachzuvollziehen,könnten wir es stattdessen mit einer Fixpunkt-Iteration versuchen. Wir


274 19. Fixpunkte und kontrahierende Abbildungenwürden mit Einnahmen von x 0 = 1 beginnen und daraus die Ausgaben zug(1) = 2, 5 berechnen, dann die Einnahmen zu x 1 =2, 5wählen, darausdie Ausgaben zu g(2, 5) = 2, 65 berechnen, dann x 2 =2, 65 setzen undg(x 2 )=... usw. Natürlich erwarten wir, dass lim i x i =¯x =1+ √ 3, waswir unten als tatsächlich richtig zeigen werden!19.6 Fixpunkt-Iteration im KartenverkaufsmodellWir benutzen nun die Fixpunkt-Iteration im Kartenverkaufsmodell. Wirzeichnen in Abb. 19.4 die Funktion g(x)= 1 4 x+ 1 4zusammen mit y = x unddem Fixpunkt ¯x.Wirwählen x 0 < ¯x,dadieVerkäufe bei Null beginnen undxy=xy=g(x)g(x)xxxAbb. 19.4. Erster Schritt der Fixpunkt-Iteration im Kartenverkaufsmodell: g(x)ist näher an ¯x als xdann anwachsen. Aus der Abbildung können wir erkennen, dass x 1 = g(x 0 )näher an ¯x ist als x 0 , d.h.|g(x 0 ) − ¯x| < |x 0 − ¯x|.Tatsächlich können wir die Differenzen exakt berechnen, da ¯x =1/3:|g(x 0 ) − ¯x| =1∣4 x 0 + 1 4 − 1 ∣ (∣∣∣ 3∣ = 1x 0 − 1 ∣∣∣=4 3)∣ 1 4 |x 0 − ¯x|.Also ist der Abst<strong>and</strong> von x 1 = g(x 0 )zu¯x genau viermal kleiner als derAbst<strong>and</strong> von x 0 zu ¯x. Dieselbe Argumentation ergibt, dass der Abst<strong>and</strong>von x 2 = g(x 1 )zu¯x viermal kleiner ist als der Abst<strong>and</strong> von x 1 zu ¯x undsomit 1/16 des Abst<strong>and</strong>s von x 0 zu ¯x:|x 2 − ¯x| = 1 4 |x 1 − ¯x| = 116 |x 0 − ¯x|.


19.6 Fixpunkt-Iteration im Kartenverkaufsmodell 275y=xxg(g(x))y=g(x)g(x)xg(x) xg(g(x))Abb. 19.5. Zwei Schritte der Fixpunkt-Iteration für das Problem in Modell 19.4.Der Abst<strong>and</strong> von g(g(x)) zu ¯x ist 1/4 des Abst<strong>and</strong>s von g(x)zu¯x und 1/16 desAbst<strong>and</strong>s von x zu ¯xWir haben dies in Abb. 19.5 dargestellt. Ganz allgemein ergibt sichund daher für i =1, 2,...|x i − ¯x| = 1 4 |x i−1 − ¯x||x i − ¯x| =4 −i |x 0 − ¯x|.Da 4 −i so klein wird, wie wir wollen, wenn i genügend groß wird, zeigt dieseAbschätzung, dass die Fixpunkt-Iteration für das Kartenverkaufsmodellkonvergiert, d.h. lim i→∞ x i =¯x.Wir betrachten einige weitere Beispiele, bevor wir die Frage nach derKonvergenz der Fixpunkt-Iteration für allgemeine Fälle beh<strong>and</strong>eln.Beispiel 19.1. Um besser vergleichen zu können, zeigen wir die Ergebnissedes Fixpunktproblems in Modell 19.4, indem wir die Fixpunkt-Iteration aufg(x) = 1 4 x + 1 4anwenden und gleichzeitig den Bisektionsalgorithmus aufdas äquivalente Problem f(x) =− 3 4 x + 1 4. Um fair zu sein, benutzen wirx 0 = 1 als Anfangswert für die Fixpunkt-Iteration und die Punkte x 0 =0und X 0 =1für den Bisektionsalgorithmus und vergleichen die Werte vonX i vom Bisektionsalgorithmus mit x i der Fixpunkt-Iteration in Abb. 19.6.Der Fehler der Fixpunkt-Iteration nimmt bei jedem Schritt um den Faktor1/4 ab, im Unterschied zum Fehler beim Bisektionsalgorithmus, derum den Faktor 1/2 abnimmt. Dies ist aus der Ergebnistabelle offensichtlich.Da beide Methoden eine Funktionsauswertung und eine Speicherungpro Iteration brauchen, der Bisektionsalgorithmus außerdem noch einen


276 19. Fixpunkte und kontrahierende AbbildungenBisektionsalgorithmus Fixpunkt-Iterationi X i x i0 1,00000000000000 1,000000000000001 0,50000000000000 0,500000000000002 0,50000000000000 0,375000000000003 0,37500000000000 0,343750000000004 0,37500000000000 0,335937500000005 0,34375000000000 0,333984375000006 0,34375000000000 0,333496093750007 0,33593750000000 0,333374023437508 0,335937500000009 0,3339843750000010 0,3339843750000011 0,3334960937500012 0,3334960937500013 0,33337402343750Abb. 19.6. Ergebnisse für das Fixpunktproblem in Modell 19.4 mit dem Bisektionsalgorithmusund der Fixpunkt-Iteration. Der Fehler der Fixpunkt-Iterationnimmt mit jeder Iteration stärker abzusätzlichen Vorzeichentest, kostet die Fixpunkt-Iteration sogar noch etwasweniger pro Iteration. Wir fassen zusammen, dass die Fixpunkt-Iterationwahrlich ”schneller“ für dieses Problem ist als die Bisektion.Beispiel 19.2. Bei der Ermittlung der Löslichkeit von Ba(IO 3 ) 2 in Modell7.10 haben wir das Problem (16.3)x(20 + 2x) 2 − 1, 57 = 0mit dem Bisektionsalgorithmus gelöst. Die Ergebnisse sind in Abb. 16.4 zusammengestellt.Nun wollen wir die Fixpunkt-Iteration auf das äquivalenteFixpunktproblem1, 57g(x)=(20 + 2x) 2 = x (19.5)anwenden. Wir wissen, dass g auf jedem Intervall ohne x = −10 Lipschitzstetigist (und wir wissen auch, dass der Fixpunkt/die Lösung nahe beiNull ist). Wir beginnen die Iteration mit x 0 = 1 und geben die Ergebnissein Abb. 19.7 wieder.Beispiel 19.3. Im Fall der Fixpunkt-Iteration für das Kartenverkaufsmodellkönnen wir die Iterierten explizit berechnen:x 1 = 1 4 x 0 + 1 4


19.6 Fixpunkt-Iteration im Kartenverkaufsmodell 277x ii0 1,000000000000001 0,004845679012352 0,003928806624653 0,003928085931694 0,003928085365275 0,00392808536483Abb. 19.7. Ergebnisse der Fixpunkt-Iteration für (19.5)undx 2 = 1 4 x 1 + 1 4 = 1 4( 14 x 0 + 1 4)+ 1 4Ganz ähnlich erhalten wir= 1 4 2x 0 + 1 4 2 + 1 4 .und nach n Schrittenx 3 = 1 4 3 x 0 + 1 4 3 + 1 4 2 + 1 4x n = 14 n x 0 +n∑i=114i. (19.6)Der erste Term auf der rechten Seite von (19.6),14 n x 0 konvergiert gegen 0,falls n gegen Unendlich wächst. Der zweite Ausdruck stimmt überein mitn∑i=114 i = 1 n−14 × ∑i=014 i = 1 4 × 1 − 14 n1 − 1 4= 1 − 14 n,3wobei die Formel für die geometrische Summe Anwendung findet. Daherkonvergiert der zweite Ausdruck gegen 1/3, dem Fixpunkt von (19.4), fallsn gegen Unendlich wächst.Eine wichtige Beobachtung beim letzten Beispiel ist, dass die Iterationkonvergiert, weil g(x)= 1 4 x+ 1 4die Steigung 1/4 < 1 hat. Dies erzeugt einenFaktor 1/4 bei jeder Iteration und zwingt die rechte Seite von (19.6) zurKonvergenz, wenn n gegen Unendlich wächst. Wir erinnern uns, dass dieSteigung einer Geraden der Lipschitz-Konstanten entspricht. Wir könnendaher sagen, dass das Beispiel konvergiert, da g die Lipschitz-KonstanteL =1/4 < 1hat.Im Gegenzug, würde das Analogon von (19.6) nicht konvergieren, wenndie Lipschitz-Konstante, oder Steigung, von g größer als 1 wäre. Wir veranschaulichendies in Abb. 19.8 für die Funktion g(x) =2x + 1 4 .DerAbst<strong>and</strong>zwischen aufein<strong>and</strong>er folgenden Iterationen wächst mit jeder Iterationan und die Fixpunkt-Iteration konvergiert nicht. Aus der Zeichnung


278 19. Fixpunkte und kontrahierende Abbildungeng(x) = 2 x + ¼y = xg(x) = ¾ x + ¼y = xx 0 x 1 x 2 x 3x 0 x 1 x 2 x 3 xAbb. 19.8. Links zeigen wir die ersten drei Fixpunkt-Iterierten für g(x)=2x+ 1 4 .Die Iterierten wachsen bei fortlaufender Iteration ohne Grenze. Rechts zeigen wirdie ersten drei Fixpunkt-Iterierten für g(x)= 3 4 x + 1 4 .IndiesemFallkonvergiertdie Iteration zum Fixpunktwird deutlich, dass kein positiver Fixpunkt existiert. Andererseits wird dieFixpunkt-Iteration konvergieren, wenn sie auf irgendeine lineare Funktionmit der Lipschitz-Konstanten L


19.7 Eine kontrahierende Abbildung hat einen eindeutigen Fixpunkt 279|x k+1 − x k |. Dazu subtrahieren wir x k = g(x k−1 )vonx k+1 = g(x k ) underhaltenx k+1 − x k = g(x k ) − g(x k−1 ).Mit Hilfe der Lipschitz-Stetigkeit von g(x), ergibt sich folglichÄhnlich giltund somit|x k+1 − x k |≤L|x k − x k−1 |. (19.7)|x k − x k−1 |≤L|x k−1 − x k−2 ||x k+1 − x k |≤L 2 |x k−1 − x k−2 |.Indem wir das Argument wiederholen, erhalten wir|x k+1 − x k |≤L k |x 1 − x 0 |. (19.8)Wir können nun mit dieser Abschätzung |x i − x j | für j>iabschätzen.Wir erhalten|x i − x j | = |x i − x i+1 + x i+1 − x i+2 + x i+2 −···+ x j−1 − x j |und mit der Dreiecksungleichung∑j−1|x i − x j |≤|x i − x i+1 | + |x i+1 − x i+2 | + ···+ |x j−1 − x j | = |x k − x k+1 |.Wir benutzen nun (19.8) für jeden Summenausdruck |x k − x k+1 | und erhalten∑j−1∑j−1|x i − x j |≤ L k |x 1 − x 0 | = |x 1 − x 0 | L k .k=iMit Hilfe der Formel für die Summe einer geometrischen Reihe berechnenwir∑j−1L k = L i ( 1+L + L 2 + ···+ L j−i−1) = L i 1 − Lj−i1 − L .k=iNun nutzen wir, dass L


280 19. Fixpunkte und kontrahierende AbbildungenBeweis, dass ¯x = lim i→∞ x i ein Fixpunkt istDa g(x) Lipschitz-stetig ist, gilt( )g (¯x)=g lim x ii→∞= limi→∞g (x i ).Aufgrund der Vorschrift x i = g(x i−1 ) bei der Fixpunkt-Iteration, giltDa natürlichlimi→∞ g(x i−1) = limi→∞x i =¯x.lim g(x i−1) = lim g(x i ),i→∞ i→∞erhalten wir, wie gewünscht g(¯x)=¯x. Daraus folgern wir, dass der Grenzwertlim i x i =¯x ein Fixpunkt ist.Beweis der EindeutigkeitSeien x und y zwei Fixpunkte, d.h. g(x)=x und g(y)=y. Dag :R→Reine kontrahierende Abbildung ist, gilt|x − y| = |g(x) − g(y)|≤L|x − y|,was nur möglich ist für x = y, daL


19.9 Lineare Konvergenz der Fixpunkt-Iteration 28119.9 Lineare Konvergenz der Fixpunkt-IterationSei ¯x = g(¯x) der Fixpunkt der kontrahierenden Abbildung g :R→R und{x i } ∞ i=1 , die durch die Fixpunkt-Iteration erzeugte Folge. Wir können sehreinfach eine Abschätzung erhalten, wie schnell der Fehler der Fixpunkt-Iterierten x i abnimmt, wenn i anwächst; man spricht von Konvergenzgeschwindigkeit.Da ¯x = g(¯x), erhalten wir|x i − ¯x| = |g(x i−1 ) − g(¯x)|≤L|x i−1 − ¯x|, (19.9)woran wir erkennen, dass der Fehler mindestens um einen Faktor L


282 19. Fixpunkte und kontrahierende AbbildungenIn Abb. 19.9 vergleichen wir die Konvergenzgeschwindigkeiten der Fixpunkt-Iterationenfür g(x) = 1 9 x + 34 und g(x) =1 5x + 2. Die Iterationfür 1 9 x + 3 4erreicht innerhalb von 15 Iterationen eine Genauigkeit von 15Dezimalstellen, wohingegen die Iteration für 1 5x + 2 nach 20 Iterationennur auf 14 Stellen genau ist.19.10 Schnellere KonvergenzDie Funktionen 1 2 x und 1 2 x2 sind beide Lipschitz-stetig auf [−1/2, 1/2] zurLipschitz-Konstanten L =1/2 und besitzen einen eindeutigen Fixpunkt¯x = 0. Nach der Abschätzung (19.9) erwarten wir die gleiche Konvergenzratefür beide Fixpunkt-Iterationen. Wir zeigen die Ergebnisse der Fixpunkt-Iteration für beide in Abb. 19.10. Wir erkennen, dass die Fixpunkt-Iterationi x i für 1 2 x x i für 1 2 x20 0,50000000000000 0,500000000000001 0,25000000000000 0,250000000000002 0,12500000000000 0,062500000000003 0,06250000000000 0,003906250000004 0,03125000000000 0,000015258789065 0,01562500000000 0,000000000232836 0,00781250000000 0,00000000000000Abb. 19.10. Ergebnisse der Fixpunkt-Iterationen für 1 2 x und 1 2 x2für 1 2 x2 sehr viel schneller konvergiert und nach 7 Iterationen bereits 15 genaueStellen hat. Die Abschätzung (19.9) sagt daher nicht die ganze Wahrheit.Wir werden nun für die Funktion g(x) = 1 2 x2 etwas genauer hinter dieArgumentation bei (19.9) schauen. Wie oben erhalten wir mit ¯x =0x i − 0= 1 2 x2 i−1 − 1 2 02 = 1 2 (x i−1 +0)(x i−1 − 0),somit also|x i − 0| = 1 2 |x i−1||x i−1 − 0|.Wir folgern daraus, dass der Fehler der Fixpunkt-Iteration für 1 2 x2 um denFaktor 1 2 |x i−1| bei der i. Iteration abnimmt. Anders ausgedrücktfür i =1istderFaktor 1 2 |x 0|,für i =2istderFaktor 1 2 |x 1|,für i =3istderFaktor 1 2 |x 2|,


19.11 Quadratische Konvergenz 283usw. Wir erkennen, dass der Reduktionsfaktor vom Wert der aktuellenIterierten abhängt.Was passiert, wenn die Iteration fortschreitet und die Iterierten x i−1immer näher an Null kommen? Der Faktor, um den der Fehler in jedemSchritt abnimmt, wird kleiner mit anwachsendem i! Anders ausgedrücktnähern sich die Iterierten schneller an Null, je näher sie zur Null kommen.Die Abschätzung in (19.9) überschätzt den Fehler der Fixpunkt-Iterationfür 1 2 x2 beträchtlich, da sie davon ausgeht, dass der Fehler stets um einenkonstanten Faktor abnimmt. Sie kann daher nicht verwendet werden, umdie schnelle Konvergenz dieser Funktion vorherzusagen. Der erste Teil von(19.9) besagt dasselbe für eine Funktion g:|x i − ¯x| = |g(x i−1 ) − g(¯x)|.Der Fehler von x i hängt von der Änderung in g zwischen ¯x und der vorherigenIterierten x i−1 ab. Diese Änderung kann von x i−1 abhängen unddann konvergiert die Fixpunkt-Iteration nicht linear.19.11 Quadratische KonvergenzWir betrachten ein zweites wichtiges Beispiel, bei dem wir quadratischeKonvergenz feststellen. Wir wissen, dass der Bisektionsalgorithmus zur Berechnungder Lösung von f(x)=x 2 − 2 linear mit dem Konvergenzfaktor1/2 konvergiert: Der Fehler wird bei jedem Schritt um den Faktor 1/2 kleiner.Wir können die Gleichung x 2 −2 = 0 als Fixpunktgleichung schreiben:x = g(x)= 1 x + x 2 . (19.10)Wir erkennen das nach Multiplikation von (19.10) mit x. Wir wenden nundie Fixpunkt-Iteration auf (19.10) an, um √ 2 zu berechnen, und zeigendas Ergebnis in Abb. 19.11. Wir bemerken, dass wir nur 5 Iterationenbenötigen, um 15 Stellen Genauigkeit zu erreichen. Die Konvergenz scheintsehr schnell zu sein.ix i0 1,000000000000001 1,500000000000002 1,416666666666673 1,414215686274514 1,414213562374695 1,414213562373106 1,41421356237310Abb. 19.11. Fixpunkt-Iteration für (19.10)


284 19. Fixpunkte und kontrahierende AbbildungenWir suchen eine Beziehung zwischen dem Fehler in zwei aufein<strong>and</strong>erfolgenden Schritten, um die tatsächliche Konvergenzgeschwindigkeit zu bestimmen.Wir erhalten, wenn wir wie in (19.9) vorgehen, dass∣∣x i − √ ∣(√ )∣ ∣∣2∣ = ∣g (x i−1 ) − g 2x i−1=∣ 2(√ )∣+ 1 2−x i−1 2 + √ 1 ∣∣∣∣2=x 2 i−1 +2∣ − √ 22x i−1∣ .Wir suchen nun einen gemeinsamen Teiler für die Brüche auf der rechtenSeite und benutzen dabei, dassund erhalten so:(x i−1 − √ 2) 2= x2i−1 − 2 √ 2x i−1 +2∣∣x i − √ 2∣ =(xi−1 − √ 2 ) 2≈ 1 (2x i−1 2 √ x i−1 − √ 22). (19.11)2Wir fassen zusammen, dass der Fehler in x i dem Quadrat des Fehlers in1x i−1 bis auf einen Faktor2 √ entspricht. Das entspricht quadratischer Konvergenz,die sehr schnell ist. Bei jedem Iterationsschritt verdoppelt sich die2Zahl der akkuraten Dezimalstellen!Abb. 19.12. Archimedes, wie er die Erde mit einem Hebel und einem Fixpunktbewegt


Aufgaben zu Kapitel 19 285Aufgaben zu Kapitel 1919.1. Ein Hausierer, der Staubsauger verkauft, hat folgenden Lizenzvertrag. Beieiner Lieferung von Staubsaugern bezahlt der Hausierer eine Gebühr von 100Euro und dann einen Prozentsatz der Einnahmen, gemessen in Einheiten von100 Euro, der mit den Einnahmen abnimmt. Bei Einnahmen von x beträgt derProzentsatz 20x%. Zeigen Sie, dass dieses Modell zu einem Fixpunktproblemführt und machen Sie eine Zeichnung, die die Lage des Fixpunktes anzeigt.19.2. Schreiben Sie die folgenden Fixpunktprobleme auf drei verschiedene Artenals Nullstellensuche:(a) x3 − 1x +2 = x(b) x5 − x 3 +4=x.19.3. Schreiben Sie die folgenden Nullstellenprobleme auf drei verschiedene Artenals Fixpunktproblem:(a) 7x 5 − 4x 3 +2=0 (b)x 3 − 2 x =0.19.4. (a) Zeichnen Sie eine Lipschitz-stetige Funktion g auf dem Intervall [0, 1],die drei Fixpunkte hat, so dass g(0) > 0 und g(1) < 1. (b) Zeichnen Sie eineLipschitz-stetige Funktion g auf dem Intervall [0, 1], die drei Fixpunkte hat, sodass g(0) > 0 und g(1) > 1.19.5. Schreiben Sie ein Programm, das Algorithmus 19.2 implementiert. Das Programmsoll zwei Methoden als Kriterium zur Beendigung benutzen: (1) wenn dieZahl der Iterationen eine wählbare Zahl überschreitet und (2) wenn der Unterschiedzwischen aufein<strong>and</strong>er folgende Iterierte |x i −x i−1| kleiner ist als eine wählbareToleranz. Testen Sie Ihr Programm, indem Sie die Ergebnisse in Abb. 19.9,die mit MATLAB berechnet wurden, reproduzieren.19.6. Sei K sp für Ba(IO 3 ) 2 gleich 1, 8 × 10 −5 (Abschnitt 7.10). Berechnen Siedie Löslichkeit S mit dem Programm aus Aufgabe 19.5 auf 10 Dezimalstellengenau. Schreiben Sie dazu das Problem als geeignetes Fixpunktproblem. Hinweis:1,8 × 10 −5 =18× 10 −6 und 10 −6 =10 −2 × 10 −4 .19.7. Berechnen Sie die Löslichkeit von Ba(IO 3 ) 2 (Abschnitt 7.10) in einer 0,037molaren (Mol/Liter) Lösung von KIO 3 auf 10 Dezimalstellen genau. SchreibenSie dazu das Problem als geeignetes Fixpunktproblem und benutzen Sie das Programmaus Aufgabe 19.5.19.8. Die Energie P eines Verstärkers der Klasse A mit Ausgangswiderst<strong>and</strong> Qund Ausgangsspannung E bei der Leistung R beträgtP =E2 R(Q + R) 2 .Suchen Sie alle möglichen Lösungen R für P =1,Q = 3 und E =4auf10Dezimalstellen genau. Schreiben Sie dazu das Problem als geeignetes Fixpunktproblemund benutzen Sie das Programm aus Aufgabe 19.5.


286 19. Fixpunkte und kontrahierende Abbildungen19.9. Das van der Waalsche Modell für ein Mol eines idealen Gases unter Berücksichtigungder Molekülgröße und der gegenseitigen Anziehungskräfte beträgtP + a (V − b)=RT,V 2mit dem Druck P, dem vom Gas eingenommenen Volumen V , der Temperatur Tund der idealen Gaskonstante R. a ist eine Konstante, die von der Molekülgrößeund den Anziehungskräften abhängt und b ist eine Konstante, die vom Volumen,das alle Moleküle eines Mols einnehmen, abhängt. Suchen Sie alle möglichen VoluminaV des Gases für P =2,T = 15, R =3,a = 50 und b =0, 011 auf 10Dezimalstellen genau. Schreiben Sie dazu das Problem als geeignetes Fixpunktproblemund benutzen Sie das Programm aus Aufgabe 19.5.19.10. Zeigen Sie, dass (19.6) gültig ist.19.11. (a) Finden Sie eine explizite Formel (ähnlich (19.6)) für die n. Fixpunkt-Iterierte x n für die Funktion g(x) =2x + 1 . (b) Zeigen Sie, dass xn gegen ∞4divergiert, wenn n gegen ∞ strebt.19.12. (a) Finden Sie eine explizite Formel (ähnlich (19.6)) für die n. Fixpunkt-Iterierte x n für die Funktion g(x)= 3 x + 1 . (b) Zeigen Sie, dass xn konvergiert,4 4wenn n gegen ∞ strebt und bestimmen Sie den Grenzwert.19.13. (a) Finden Sie eine explizite Formel (ähnlich (19.6)) für die n. Fixpunkt-Iterierte x n für die Funktion g(x)=mx + b. (b) Zeigen Sie, dass x n konvergiert,wenn n gegen ∞ strebt unter der Voraussetzung, dass L = |m| < 1 ist undbestimmen Sie den Grenzwert.19.14. Zeichnen Sie eine Lipschitz-stetige Funktion g,für die nicht aus x ∈ [0, 1]folgt, dass g(x)in[0, 1] liegt.19.15. (a) Finden Sie, falls möglich, Intervalle, um die Fixpunkt-Iteration aufjedes der drei Fixpunktprobleme in Aufgabe 19.3(a) anzuwenden. (b) FindenSie, falls möglich, Intervalle, um die Fixpunkt-Iteration auf jedes der drei Fixpunktproblemein Aufgabe 19.3(b) anzuwenden. In allen Fällen ist ein geeignetesIntervall eines, auf der die Funktion eine kontrahierende Abbildung ist.19.16. Schwierig Wenden Sie Satz 19.2 auf die Funktion g(x)=1/(1 + x 2 )anund zeigen Sie, dass die Fixpunkt-Iteration auf jedem Intervall [a,b] konvergiert.19.17. Berechnen Sie aus den folgenden Ergebnissen der Fixpunkt-Iteration füreine Funktion g(x)ix i0 14,000000000000001 14,250000000000002 14,468750000000003 14,660156250000004 14,827636718750005 14,97418212890625die Lipschitz-Konstante L für g. Hinweis: Betrachten Sie (19.8).


Aufgaben zu Kapitel 19 28719.18. Verifizieren Sie die Details von Beispiel 19.4.19.19. (a) Zeigen Sie, dass g(x) = 2 3 x3 Lipschitz-stetig ist auf [−1/2, 1/2]zur Lipschitz-Konstanten L =1/2. (b) Benutzen Sie das Programm von Aufgabe19.5, um mit x 0 =0, 5 sechs Fixpunkt-Iterationen zu berechnen und vergleichenSie sie mit den Ergebnissen in Abb. 19.10. (c) Zeigen Sie, dass der Fehlervon x i ungefähr kubisch mit i abnimmt.19.20. Beweisen Sie, dass (19.11) wahr ist.19.21. (a) Zeigen Sie, dass das Nullstellenproblem von f(x) =x 2 + x − 6alsFixpunktproblem g(x)=x mit g(x)= 6 geschrieben werden kann. Zeigen Sie,x+1dass der Fehler von x i linear zum Fixpunkt ¯x = 2 abnimmt, und schätzen Sieden Konvergenzfaktor von x i nahe bei 2 ab. (b) Zeigen Sie, dass das Nullstellenproblemvon f(x)=x 2 + x − 6 als Fixpunktproblem g(x)=x mit g(x)= x2 +62x+1geschrieben werden kann. Zeigen Sie, dass der Fehler von x i quadratisch abnimmt,wenn die Fixpunkt-Iteration gegen 2 konvergiert.19.22. Entscheiden Sie aus den folgenden Ergebnissen einer Fixpunkt-Iteration,ob die Konvergenzrate linear ist oder nicht.ix i0 0,500000000000001 0,707106781186552 0,840896415253713 0,917004043204674 0,957603280698575 0,9785720620877019.23. Die Regula falsi Methode ist eine Variante der Bisektionsmethode, umdie Lösung von f(x) = 0 zu finden. Angenommen f(x i−1) und f(x i)habenunterschiedliche Vorzeichen. Definieren Sie für i ≥ 1 x i+1 den Punkt, wo dieGerade durch (x i−1,f(x i−1)) und (x i,f(x i)) die x-Achse schneidet. SchreibenSie das Problem als Fixpunkt-Iteration, indem Sie ein geeignetes g(x) angebenund schätzen Sie den zugehörigen Konvergenzfaktor ab.


20Analytische Geometrie inR 2Die Philosophie ist in dem großen Buch niedergeschrieben, das immeroffen vor unseren Augen liegt, dem Universum. Aber dieses Buchist nicht zu verstehen, ehe man nicht gelernt hat, die Sprache zu verstehen,und die Buchstaben kennt, in denen es geschrieben ist. Esist in der Sprache der <strong>Mathematik</strong> geschrieben, und die Buchstabensind Dreiecke, Kreise und <strong>and</strong>ere geometrische Figuren. Ohne dieseMittel ist es dem Menschen unmöglich, ein einziges Wort davonzu verstehen; ohne sie ist es ein vergebliches Umherirren in einemdunklen Labyrinth. (Galileo)20.1 EinleitungWir geben eine kurze Einführung in die analytische Geometrie in zwei Dimensionen,das entspricht der linearen Algebra in der euklidischen Ebene.Die übliche Schulbildung hat uns eine intuitive geometrische Vorstellungder euklidischen Ebene vermittelt, als eine unendliche flache Ebene, dieaus Punkten besteht, ohne Grenzen. Wir haben auch eine intuitive geometrischeVorstellung von geometrischen Objekten wie Geraden, Dreieckenund Kreisen in der Ebene. Unsere Kenntnisse und Intuitionen in Geometriewurden im Kapitel ”Pythagoras und Euklid“ etwas aufpoliert. Wirhaben auch ein Koordinatensystem in der euklidischen Ebene eingeführt,das aus zwei senkrechten Kopien vonQbesteht, wodurch wir jedem Punktin der Ebene zwei Koordinaten (a 1 ,a 2 )zuordnenkönnen und wir betrachtenQ2 als die Menge aller geordneter Paare rationaler Zahlen. Allein mit


290 20. Analytische Geometrie in Ê 2den rationalen ZahlenQstoßen wir schnell auf Probleme, da wir Abständezwischen Punkten inQ 2 nicht berechnen können. So ist beispielsweise derAbst<strong>and</strong> zwischen den Punkten (0, 0) und (1, 1) die Länge der Diagonaledes Einheitsquadrats, also gleich √ 2, was keine rationale Zahl ist. DieProbleme werden gelöst, wenn wir reelle Zahlen benutzen, d.h.Q 2 zuR 2erweitern.In diesem Kapitel stellen wir grundlegende Gesichtspunkte der analytischenGeometrie in der euklidischen Ebene vor, indem wir ein Koordinatensystembenutzen, das sich mitR 2 identifizieren lässt. Wir folgen dabeiden Vorstellungen von Descartes, Geometrie mit Zahlen auszudrücken.Unten erweitern wir die analytische Geometrie zum dreidimensionalen euklidischenRaum, der sich mitR 3 identifizieren lässt, bevor wir schließlichzur analytischen Geometrie imR n übergehen, wobei die Dimension n jedenatürliche Zahl sein kann. Die Betrachtung vonR n führt für n ≥ 4zur linearen Algebra, die eine Fülle von Anwendungen außerhalb der euklidischenGeometrie besitzt, auf die wir unten treffen werden. Die Begriffeund Werkzeuge, die wir in diesem Kapitel für die analytische Geometrie imR 2 entwickeln, werden für uns bei den Verallgemeinerungen der GeometriezumR 3 undR n und zur linearen Algebra immens wichtig sein.Die geometrischen Werkzeuge von Euklid waren das Lineal und der Kompass,wohingegen die Werkzeuge der analytischen Geometrie der Rechnerzum Umgang mit Zahlen ist. Daher können wir sagen, dass Euklid eine analogeTechnik repräsentiert, wohingegen analytische Geometrie eine digitaleTechnik ist, die auf Zahlen beruht. Heute explodiert die digitale Technikförmlich in der Kommunikation, der Musik und allen Arten der virtuellenRealität.20.2 Descartes,Erfinder der analytischen GeometrieRené Descartes (1596–1650) legte im Discours de la méthode pour bienconduire sa raison et chercher la vérité dans les sciences im Jahre 1637 dasFundament moderner Wissenschaften. Die Methode enthielt als Anhang LaGéometrie mit der ersten Beh<strong>and</strong>lung analytischer Geometrie. Descartesglaubte, dass nur <strong>Mathematik</strong> abgesichert sei, und dass daher alles auf<strong>Mathematik</strong> aufgebaut werden müsse, dem Fundament der kartesischenSicht auf die Welt.Im Jahre 1649 überredete Königin Christina von Schweden Descartesnach Stockholm zu gehen, um sie <strong>Mathematik</strong> zu lehren. Die Königin wolltejedoch um 5 Uhr in der Frühe Tangenten zeichnen, und so musste Descartesmit seiner Gewohnheit brechen, um 11 Uhr aufzustehen, vgl. Abb. 20.1.Nach nur wenigen Monaten im kalten nordischen Klima, wo er jeden Morgenum5UhrzumPalastgehenmusste,starberanLungenentzündung.


20.3 Descartes: Dualismus von Leib und Seele 291Abb. 20.1. Descartes: ”Das Prinzip, dem ich bei meinen Studien stets folgte unddas mir am meisten geholfen hat, mein Wissen zu erlangen, war, niemals mehr alseinige wenige Stunden täglich in Gedanken zu verbringen, die die Vorstellungskraftbeschäftigen und einige wenige Stunden im Jahr, die meine Auffassungsgabebeschäftigen und all den Rest meiner Zeit der Entspannung der Sinne und derGelassenheit des Geistes zu widmen“20.3 Descartes: Dualismus von Leib und SeeleDescartes setzte mit seinem Werk De Homine, das 1633 fertig gestellt wurde,für lange Zeit den St<strong>and</strong>ard für Studien von Leib und Seele. Descartesschlug darin einen Mechanismus für die automatische Reaktion als Antwortauf externe Vorgänge durch Nervenfasern vor, vgl. Abb. 20.2. NachDescartes’ Vorstellung kann die rationale Seele, ein vom Leib verschiedenesAbb. 20.2. Automatische Reaktion als Antwort auf eine externe Stimulation ausDescartes’ De Homine, erschienen 1644


292 20. Analytische Geometrie in Ê 2Wesen, das mit dem Leib in der Epiphyse verbunden ist, die unterschiedlichenImpulse der Lebensgeister (spiritus animales) durch die Nervenfasernwahrnehmen oder wahlweise nicht wahrnehmen. Bei solch einer Wahrnehmungwar das Ergebnis eine bewusste Empfindung - der Leib beeinflusstdie Seele. Im Gegenzug kann die Seele in freiwilliger H<strong>and</strong>lung einen unterschiedlichenImpuls der Lebensgeister einleiten. Die Seele konnte somitauch den Leib beeinflussen.Im Jahre 1649 beendete Descartes Les passions de l’ame mit einer Darstellungkausaler Leib/Seele Wechselwirkungen und der Vermutung einerLokalisierung der Kontaktstelle zwischen Leib und Seele in der Epiphyse.Descartes wählte die Epiphyse, da es für ihn das einzige Organ im Hirn war,das nicht bilateral dupliziert vorliegt und weil er fälschlicherweise glaubte,dass nur der Mensch darüber verfüge; Descartes betrachtete Tiere als reinephysische Automaten ohne Verst<strong>and</strong>.20.4 Die euklidische EbeneR 2Wir wählen ein Koordinatensystem für die euklidische Ebene, das aus zweiGeraden besteht, die sich in einem Winkel von 90 ◦ im Ursprung schneiden.Eine dieser Geraden wird x 1 -Achse genannt und die <strong>and</strong>eren x 2 -Achse undjede dieser Geraden ist eine Kopie der reellen ZahlengeradenR. DieKoordinateneines Punktes a in der Ebene sind ein geordnetes Paar reellerZahlen (a 1 ,a 2 ), wobei a 1 dem Schnittpunkt der Geraden durch a parallelzur x 2 -Achse mit der x 1 -Achse entspricht und a 2 dem Schnittpunkt derGeraden durch a parallel zur x 1 -Achse mit der x 2 -Achse, vgl. Abb. 20.3.Die Koordinaten des Ursprungs sind (0, 0).So können wir jeden Punkt a in der Ebene durch seine Koordinaten(a 1 ,a 2 ) identifizieren und somit die euklidische Ebene mitR 2 ,wobeiR 2x 2a 1a 2(a 1,a 2)x 1Abb. 20.3. Koordinatensystem für Ê 2


20.4 Die euklidische Ebene Ê 2 293die Menge geordneter Paare (a 1 ,a 2 ) reeller Zahlen a 1 und a 2 ist, d.h.R 2 = {(a 1 ,a 2 ):a 1 ,a 2 ∈R}.Wir habenR 2 bereits oben als Koordinatensystem benutzt, als wir Funktionenf :R→R zeichneten, wobei Paare reeller Zahlen (x, f(x)) als geometrischePunkte in der euklidischen Ebene (einer Buchseite) dargestelltwerden.Um genauer zu sein, können wir die euklidische Ebene mitR 2 identifizieren,nachdem wir (i) den Ursprung, (ii) die Richtung und (iii) die Skalierungder Koordinatenachsen gewählt haben. Es gibt viele mögliche Koordinatensystememit verschiedenen Ursprüngen und Richtungen/Skalierungender Koordinatenachsen, und die Koordinaten eines geometrischen Punkteshängen von der Wahl des Koordinatensystems ab. Damit stellt sich die Frage,wie sich Koordinaten beim Wechsel von einem System in ein <strong>and</strong>eresändern. Dies wird unten ein wichtiges Thema.Oft ordnen wir die Achsen so an, dass die x 1 -Achse waagerecht liegt undnach rechts anwächst. Die x 2 -Achse erhalten wir, wenn wir die x 1 -Achse um90 ◦ , das entspricht einem Viertel einer vollen Drehung, gegen den Uhrzeigersinndrehen, vgl. Abb. 20.3. In Abb. 20.4 ist das Koordinatensystem vonMATLAB wiedergegeben. Die positive Richtung jeder Koordinatenachsekann durch einen Pfeil in Richtung anwachsender Koordinaten angedeutetwerden.Dies ist jedoch nur eine Möglichkeit. Beispielsweise wird die Positioneines Punktes auf dem Computerbildschirm oder ein Fenster auf dem Bildschirm,in einem Koordinatensystem mit dem Ursprung in der oberen linkenEcke angegeben, wobei die positive x 2 -Achse abwärts zeigt und dienegative aufwärts.0.80.60.40.2(0, 5; 0, 2)x20−0.2−0.4−0.6−0.8−0.4 −0.2 0 0.2 0.4 0.6 0.8 1 1.2 1.4x 1Abb. 20.4. Das Koordinatensystem für eine Ebene in MATLAB


294 20. Analytische Geometrie in Ê 220.5 Vermesser und NavigatorenErinnern Sie sich noch an unseren Freund, den Vermesser, der L<strong>and</strong> inGrundstücke einteilt und den Navigator, der ein Schiff steuert? In beidenFällen gehen wir davon aus, dass die betrachteten Abstände so klein sind,dass die Krümmung der Erde vernachlässigbar ist und wir die Erde alsR 2betrachten können. Grundlegende Probleme für den Vermesser sind (v1)Punkte in der Natur zu finden, die vorgegebene Koordinaten auf einerKarte haben und (v2) die Fläche eines Grundstücks zu berechnen, vondem man die Ecken kennt. Grundlegende Probleme für einen Navigatorsind, (n1) die Koordinaten auf der Karte zu seiner aktuellen Position inder Natur zu finden und (n2) die Richtung festzulegen, um ans Ziel zugelangen.Aus dem Kapitel Pythagoras und Euklid“ wissen wir, dass sich das”Problem (n1) mit einem GPS Empfänger lösen lässt, der die Koordinaten(a 1 ,a 2 ) der aktuellen Position auf Knopfdruck liefert. Auch Problem(v1) lässt sich mit Hilfe eines GPS Empfängers iterativ, gewissermaßeninvers“, lösen: Mit Knopfdruck und Vergleich der Position und entsprechenderBewegung, falls wir am falschen Ort sind. In der Praxis bestimmt”die Genauigkeit des GPS Systems seine Nützlichkeit und eine Erhöhungder Genauigkeit öffnet üblicherweise neue Anwendungsfelder. Das normaleGPS mit einer Genauigkeit von 10m mag für einen Navigator genügen, abernicht für einen Vermesser, der bis auf Meter oder Zentimeter genau arbeitenmuss, was von der Größe des Grundstücks abhängt. Wissenschaftler, diedie Kontinentalverschiebung oder einen beginnenden Erdrutsch vermessen,verwenden eine weiterentwickelte Variante des GPS mit einer Genauigkeitvon Millimetern.Nachdem wir die Probleme (v1) und (n1), die nach der Koordinate füreinen vorgegebenen Punkt in der Natur suchten oder umgekehrt, gelösthaben, gibt es noch viele verw<strong>and</strong>te Probleme vom Typ (v2) und (n2), diemathematisch gelöst werden können. Das Berechnen einer Grundstücksflächeaus vorgegebenen Koordinaten oder die Berechnung der Richtungeiner Strecke bei vorgegebenen Anfangs- und Endpunkten sind Beispieledafür. Wir wollen diese, neben <strong>and</strong>eren wichtigen geometrischen Problemen,mit Hilfe von Werkzeugen der analytischen Geometrie oder der linearenAlgebra lösen.20.6 Ein erster Blick auf VektorenBevor wir in die analytische Geometrie einsteigen, stellen wir fest, dassR 2 ,den wir bisher als Menge geordneter Paare reeller Zahlen betrachten, nochfür <strong>and</strong>eres als nur die Festlegung der Positionen geometrischer Punkte benutzbarist. Um beispielsweise das aktuelle Wetter zu beschreiben, könn-


20.6 Ein erster Blick auf Vektoren 295ten wir uns darauf einigen (27, 1013) zu schreiben, um anzudeuten, dassdie Temperatur 27 ◦ Cbeträgt bei 1013 Millibar Luftdruck. Dann könnenwir eine bestimmte Wetterlage als geordnetes Zahlenpaar beschreiben, wie(27, 1013). Natürlich ist die Anordnung der beiden Zahlen für die Interpretationkritisch. Eine Wetterlage zum Paar (1013, 27) mit einer Temperaturvon 1013 ◦ C und 27mb Druck ist sicherlich ganz verschieden von (27, 1013)mit 27 ◦ C und 1013 Millibar.Nachdem wir uns von der Vorstellung freigemacht haben, dass ein Zahlenpaardie Koordinaten eines Punktes in einer euklidischen Ebene repräsentierenmuss, finden wir rasch weitere Möglichkeiten Zahlenpaare zuformen, wobei die Zahlen für unterschiedliche Dinge stehen. Jede neue Interpretationkann als eine neue Interpretation desR 2 betrachtet werden.In einem weiteren Beispiel, das mit Wetter zu tun hat, könnten wir unsdarauf verständigen (8,NNE) zu schreiben, um anzudeuten, dass der Windmit 8m/s in Richtung Nordnordost (aus Südsüdwest kommend) weht. Nunist NNE keine reelle Zahl und wir ersetzen NNE durch den zugehörigenWinkel, um zuR 2 zu gelangen, d.h. 22, 5 ◦ . Dabei rechnen wir positivbeginnend bei Nord im Uhrzeigersinn. Daher können wir eine bestimmteWindstärke und -richtung durch das geordnete Paar (8;22,5) beschreiben.Sie sind sicherlich damit vertraut, wie die Wetterfee den Wind auf derWetterkarte mit einem Pfeil veranschaulicht.Der Windpfeil könnte auch mit einem <strong>and</strong>eren Zahlenpaar beschriebenwerden, nämlich dadurch, wie sehr er nach Osten und nach Norden gedrehtist, d.h. durch das Paar (8 sin(22, 5 ◦ ), 8cos(22, 5 ◦ )) ≈ (3, 06;7, 39).Wir könnten sagen, dass 3, 06 der ”Anteil Osten“ ist und 7, 39 der ”AnteilNorden“ an der Windgeschwindigkeit. Nun geben wir noch die Windstärke8 an, wobei wir uns die Windstärke als Absolutwert der Windgeschwindigkeit(3, 06;7, 39) denken. Wir stellen uns also die Windgeschwindigkeit miteiner Richtung und einem ”absoluten Wert“ oder ”Länge“ vor. In diesemFall betrachten wir ein geordnetes Paar (a 1 ,a 2 )alsVektor, nicht als Punkt,und wir können dann den Vektor durch einen Pfeil veranschaulichen.Wir werden bald sehen, dass geordnete Paare, die als Vektoren betrachtetwerden, durch Multiplikation mit einer reellen Zahl skaliert werden können,und dass sich zwei Vektoren addieren lassen.Die Addition von Geschwindigkeitsvektoren lässt sich auf dem Fahrradspüren, wenn sich die Windgeschwindigkeit und unsere eigene Geschwindigkeitrelativ zum Boden addieren, um eine Gesamtgeschwindigkeit relativzur umgebenden Atmosphäre zu ergeben, die sich im gefühlten Luftwiderst<strong>and</strong>äußert. Um die Flugzeit über den Atlantik zu berechnen, addiertder Pilot den Geschwindigkeitsvektor des Flugzeuges gegenüber der Atmosphärezur Geschwindigkeit des Jetstreams, um die Geschwindigkeit desFlugzeuges gegenüber dem Boden zu erhalten. Wir werden unten auf Anwendungender analytischen Geometrie in der Mechanik zurückkommenund dabei wieder auf diese Beispiele treffen.


296 20. Analytische Geometrie in Ê 220.7 Geordnete Paare als Punkteoder Vektoren/PfeileWir haben gesehen, dass wir geordnete Paare reeller Zahlen (a 1 ,a 2 )alsPunkt imR 2 mit den Koordinaten a 1 und a 2 interpretieren können. Daherkönnen wir kurz a =(a 1 ,a 2 ) schreiben und sagen, dass a 1 die erste und a 2die zweite Koordinate des Punktes a ist.Alternativ können wir ein geordnetes Paar (a 1 ,a 2 ) ∈R 2 als einen Pfeilinterpretieren, mit dem Ende im Ursprung und dem Kopf im Punkt a =(a 1 ,a 2 ), vgl. Abb. 20.5. Benutzen wir die Interpretation von (a 1 ,a 2 )alsPfeil, dann bezeichnen wir (a 1 ,a 2 )alsVektor. Wiederum schreiben wira =(a 1 ,a 2 ) und sagen, dass a 1 und a 2 Komponenten des Pfeils/Vektorsa =(a 1 ,a 2 ) sind und nennen a 1 die erste und a 2 die zweite Komponente.x 2a 1a 2(a 1,a 2)ax 1Abb. 20.5. Vektor mit Ende im Ursprung und Kopf im Punkt a =(a 1,a 2)Somit können wir ein geordnetes Paar (a 1 ,a 2 ) ∈ R 2 zweierlei interpretieren:Als einen Punkt mit den Koordinaten (a 1 ,a 2 ) oder als einenPfeil/Vektor mit den Komponenten (a 1 ,a 2 ), der im Ursprung beginnt undim Punkt (a 1 ,a 2 ) endet. Offensichtlich hängen die Punkt- und die Pfeil-Interpretation eng zusammen, da der Punkt Kopf des Pfeils ist (unter derAnnahme, dass das Ende im Ursprung liegt). In Anwendungen werdenPositionen in der Punkt-Interpretation dargestellt und Geschwindigkeitenund Kräfte in der Pfeil-/Vektor-Interpretation. Wir werden unten die Pfeil-/Vektor-Interpretation auf Pfeile mit Ende in <strong>and</strong>eren Punkten als demUrsprung verallgemeinern. Welche Interpretation die geeignetste ist, ergibtsich aus dem Kontext. Oft wechselt die Interpretation von a =(a 1 ,a 2 )zwischen Punkt und Pfeil völlig unbemerkt. Daher müssen wir flexibel seinund die Interpretation benutzen, die am geeignetsten oder am bequemstenist. Wenn wir zu Anwendungen aus der Mechanik übergehen, werden wirnoch etwas mehr Fantasie benötigen.


20.8 Vektoraddition 297Manchmal werden Vektoren wie a =(a 1 ,a 2 ) fett geschrieben oder miteinem Pfeil versehen, wie a oder ⃗a oder a oder <strong>and</strong>ere Schreibweisen. Wirziehen es vor, diese ausgeklügelten Schreibweisen nicht zu benutzen, daes zunächst einmal das Schreiben vereinfacht, aber vor allem, weil es dieFantasie des Lesers anregt, sich die richtige Interpretation des Buchstabena als eine einfache (skalare) Zahl oder als Vektor a =(a 1 ,a 2 )odersonstetwas <strong>and</strong>eres vorzustellen.20.8 VektoradditionAls Nächstes definieren wir die Addition von Vektoren und deren Multiplikationmit reellen Zahlen imR 2 . In diesem Zusammenhang interpretierenwirR 2 als die Menge von Vektoren, die durch Pfeile dargestellt werden undderen Enden im Ursprung liegen.Seien a =(a 1 ,a 2 ) und b =(b 1 ,b 2 )VektorenimR 2 . Wir schreiben a + bfür den Vektor (a 1 + b 1 ,a 2 + b 2 )inR 2 , der durch getrennte Addition derKomponenten entsteht. Wir nennen a+b die durch Vektoraddition erhalteneSumme von a und b. Sinda =(a 1 ,a 2 ) und b =(b 1 ,b 2 )VektorenimR 2 ,dann gilt daher(a 1 ,a 2 )+(b 1 ,b 2 )=(a 1 + b 1 ,a 2 + b 2 ). (20.1)Dies besagt, dass wir die Vektoraddition durch getrennte Addition derKomponenten ausführen. Wir halten fest, dass a + b = b + a,daa 1 + b 1 =b 1 + a 1 und a 2 + b 2 = b 2 + a 2 . Wir nennen 0 = (0, 0) den Nullvektor,da a +0=0+a = a für jeden Vektor a. Beachten Sie den Unterschiedzwischen dem Vektor Null und seinen zwei Komponenten Null, die normalerweiseSkalare sind.Beispiel 20.1. Es gilt (2, 5) + (7, 1) = (9, 6) und (2, 1;5, 3) + (7, 6;1, 9) =(9, 7;7, 2).20.9 Vektoraddition und das ParallelogrammWir können Vektoradditionen geometrisch mit Hilfe eines Parallelogrammsdarstellen. Der Vektor a + b entspricht dem Pfeil entlang der Diagonalendes Parallelogramms, das durch die Pfeile a und b aufgespannt wird, vgl.Abb. 20.6. Dies liegt daran, dass die Koordinaten des Kopfes von a + bdurch getrennte Addition der Koordinaten von a und b erhalten werden.Dies ist in Abb. 20.6 dargestellt.Den Punkt (a 1 +b 1 ,a 2 +b 2 )können wir mit unserer Definition der Vektoradditionauf drei verschiedene Wege erreichen. Als Erstes folgen wir einfachdem Pfeil (a 1 + b 1 ,a 2 + b 2 ) zum Kopf, was einem Weg auf der Diagonalen


298 20. Analytische Geometrie in Ê 2¯baa+bāba 1 b 1Abb. 20.6. Vektoraddition im Parallelogrammdes durch a und b aufgespannten Parallelogramms entspricht. Als Zweiteskönnten wir dem Pfeil a vom Ursprung zum Kopf im Punkt (a 1 ,a 2 ) folgenund von dort zum Kopf des Pfeils ¯b, der parallel zu b verläuft und die gleicheLänge wie b besitzt, aber sein Ende in (a 1 ,a 2 )hat.Alternativkönnenwir auch dem Vektor b vom Ursprung aus bis zum Kopf in (b 1 ,b 2 ) folgenund dann zum Kopf des Vektors ā, der parallel zu a verläuft und die gleicheLänge wie a besitzt, aber sein Ende in (b 1 ,b 2 ) hat. Diese drei verschiedenenWege zum Punkt (a 1 + b 1 ,a 2 + b 2 ) sind in Abb. 20.6 dargestellt.Wir fassen dies in folgendem Satz zusammen:Satz 20.1 Die Addition zweier Vektoren a =(a 1 ,a 2 ) und b =(b 1 ,b 2 ) zurSumme a + b =(a 1 + b 1 ,a 2 + b 2 ) entspricht inR 2 der Addition der Pfeilea und b im Parallelogramm.Insbesondere können wir einen Vektor als eine Summe seiner Komponentenin Richtung der Koordinatenachsen, vgl. Abb. 20.7, schreiben:(a 1 ,a 2 )=(a 1 , 0) + (0,a 2 ). (20.2)20.10 Multiplikation eines Vektorsmit einer reellen ZahlSei λ eine reelle Zahl und a =(a 1 ,a 2 ) ∈R 2 ein Vektor. Wir definiereneinen neuen Vektor λa ∈R 2 durchλa = λ(a 1 ,a 2 )=(λa 1 ,λa 2 ). (20.3)Beispielsweise ist 3 (1, 1;2, 3) = (3, 3;6, 9). Wir sagen, dass λa durch Multiplikationdes Vektors a =(a 1 ,a 2 ) mit der reellen Zahl λ erhalten wird und


20.11 Die Norm eines Vektors 299(0,a 2)a(a 1,0)Abb. 20.7. Vektor, dargestellt als Summe zweier Vektoren, die parallel zu denKoordinatenachsen sindnennen diese Operation Multiplikation eines Vektors mit einem Skalar.Untenwerden wir noch auf <strong>and</strong>ere Multiplikationsarten treffen, nämlich dasSkalarprodukt von Vektoren und das Vektorprodukt von Vektoren, diesichbeide von der Multiplikation eines Vektors mit einem Skalar unterscheiden.Wir definieren −a =(−1)a =(−a 1 , −a 2 ) und a − b = a +(−b). Wirhalten fest, dass a − a = a +(−a) =(a 1 − a 1 ,a 2 − a 2 )=(0, 0) = 0 undgeben ein Beispiel in Abb. 20.8.20.11 Die Norm eines VektorsWir definieren die euklidische Norm |a| eines Vektors a =(a 1 ,a 2 ) ∈R 2durch|a| = ( a 2 1 + a2 2) 1/2. (20.4)a0,7a − b−bbAbb. 20.8. Summe 0, 7a − b der Vielfachen 0,7a und (−1)b von a und b


300 20. Analytische Geometrie in Ê 2Aus dem Satz von Pythagoras und Abb. 20.9 folgt, dass die euklidischeNorm |a| eines Vektors a =(a 1 ,a 2 ) gleich der Länge der Hypotenuse desrechtwinkligen Dreiecks mit Seiten a 1 und a 2 ist. Mit <strong>and</strong>eren Worten istdie euklidische Norm eines Vektors a =(a 1 ,a 2 ) gleich dem Abst<strong>and</strong> vomUrsprung zum Punkt (a 1 ,a 2 ) oder einfach nur die Länge des Pfeils (a 1 ,a 2 ).Es gilt |λa| = |λ||a| für λ ∈Rund a ∈R 2 ; Multiplikation eines Vektors mitder reellen Zahl λ verändert die Norm des Vektors um den Faktor |λ|.DerNullvektor (0, 0) hat die euklidische Norm 0. Hat ein Vektor die euklidischeNorm 0, dann muss es der Nullvektor sein.a 2(a 1,a 2)a|a| =(a 2 1 + a 2 2) 1/2a 1Abb. 20.9. Die Norm |a| des Vektors a =(a 1,a 2)ist|a| = a 2 1 + a 2 ¡ 1/22Die euklidische Norm eines Vektors misst seine ”Länge“ oder ”Größe“.Es gibt viele Möglichkeiten, die ”Größe“ eines Vektors mit zugehörigenNormen zu messen. Wir werden auf verschiedene alternative Normen einesVektors a =(a 1 ,a 2 )treffen,wie|a 1 | + |a 2 | oder max(|a 1 |, |a 2 |). InAbschnitt 12.10 benutzten wir |a 1 | + |a 2 | bei der Definition der Lipschitz-Stetigkeit von f :Q 2 →Q.Beispiel 20.2. Ist a =(3, 4), dann |a| = √ 9 + 16 = 5 und |2a| = 10.20.12 Polardarstellung von VektorenDie Punkte a =(a 1 ,a 2 ) ∈ R 2 mit |a| = 1, die zu Vektoren a mit dereuklidischen Norm 1 gehören, bilden einen im Ursprung zentrierten Kreismit Radius 1, den wir Einheitskreis nennen, vgl. Abb. 20.10.Jeder Punkt auf dem Einheitskreis kann in der Form a =(cos(θ), sin(θ))für einen Winkel θ geschrieben werden, den wir Richtungswinkel oder Richtungdes Vektors a nennen. Das folgt aus der Definition von cos(θ) undsin(θ) imKapitel ”Pythagoras und Euklid“, vgl. Abb. 20.10.


20.12 Polardarstellung von Vektoren 301x 2a 11a 2a|a| =1a 1 =cos(θ)a 2 =sin(θ)θ1x 1Abb. 20.10. Vektoren der Länge 1 können als (cos(θ),sin(θ)) geschrieben werdenJeder Vektor a =(a 1 ,a 2 ) ≠(0, 0) lässt sich alsa = |a|â = r(cos(θ), sin(θ)) (20.5)schreiben, wobei r = |a| die Norm von a ist, und â =(a 1 /|a|,a 2 /|a|) istein Vektor der Länge 1 mit Richtungswinkel θ von â, vgl. Abb. 20.11. Wirbezeichnen (20.5) als Polardarstellung von a. Wir nennen θ die Richtungvon a und r die Länge von a, vgl. Abb. 20.11.x 2a 1ra 2a|a| = ra 1 = r cos(θ)a 2 = r sin(θ)θrx 1Abb. 20.11. Vektoren der Länge r werden durch a = r(cos(θ),sin(θ)) =(r cos(θ),rsin(θ)) gegeben, mit r = |a|Ist b = λa, wobeiλ>0 und a ≠ 0, dann hat b dieselbe Richtung wiea.Istλ


302 20. Analytische Geometrie in Ê 2Beispiel 20.3. Wir haben(1, 1) = √ 2(cos(45 ◦ ), sin(45 ◦ )) und (−1, 1) = √ 2(cos(135 ◦ ), sin(135 ◦ )).20.13 St<strong>and</strong>ardisierte BasisvektorenWir bezeichnen die Vektoren e 1 =(1, 0) und e 2 =(0, 1) als st<strong>and</strong>ardisierteBasisvektoren oder Einheitsvektoren inR 2 .EinVektora =(a 1 ,a 2 )kanndurch die Basisvektoren ausgedrückt werden:daa = a 1 e 1 + a 2 e 2 ,a 1 e 1 + a 2 e 2 = a 1 (1, 0) + a 2 (0, 1) = (a 1 , 0) + (0,a 2 )=(a 1 ,a 2 )=a.(a 1,a 2)a a = a 1e 1 + a 2e 2e 2e 1Abb. 20.12. Einheitsvektoren e 1 und e 2 und a =(a 1,a 2)=a 1e 1 + a 2e 2 alsLinearkombination von e 1 und e 2Wir nennen a 1 e 1 +a 2 e 2 Linearkombination von e 1 und e 2 mit den Koeffizientena 1 und a 2 . Jeder Vektor inR 2 kann daher als Linearkombinationder Basisvektoren e 1 und e 2 mit den Koordinaten a 1 und a 2 als Koeffizientenausgedrückt werden, vgl. Abb. 20.12.Beispiel 20.4. Wir haben (3, 7) = 3 (1, 0) + 7 (0, 1) = 3e 1 +7e 2 .20.14 SkalarproduktWährend die Addition von Vektoren und das Skalieren von Vektoren miteiner reellen Zahl natürliche Interpretationen haben, werden wir nun ein


20.15 Eigenschaften des Skalarproduktes 303(erstes) Produkt zweier Vektoren einführen, das auf den ersten Blick wenigeranschaulich ist.Seien a =(a 1 ,a 2 ) und b =(b 1 ,b 2 )zweiVektoreninR 2 , so definieren wirihr Skalarprodukt a · b durcha · b = a 1 b 1 + a 2 b 2 . (20.6)Wir halten fest, dass das Skalarprodukt a · b zweier Vektoren a und b inR 2 , wie die Bezeichnung suggeriert, einen Skalar, d.h. eine Zahl inRliefert,wohingegen die Faktoren a und b Vektoren inR 2 sind. Beachten Sie, dassdie Bildung des Skalarproduktes zweier Vektoren nicht nur Multiplikationbedeutet, sondern auch eine Summation beinhaltet!Wir stellen die folgende Verbindung zwischen Skalarprodukt und Normfest:|a| =(a · a) 1 2 . (20.7)Unten werden wir eine <strong>and</strong>ere Art der Multiplikation von Vektoren definieren,das als Ergebnis einen Vektor liefert. Wir betrachten daher zweiverschiedene Arten von Produkten von Vektoren, die wir entsprechend Skalarproduktoder Vektorprodukt bezeichnen. Zunächst könnten wir, solangewir Vektoren imR 2 untersuchen, das Vektorprodukt als eine einzige Zahlbetrachten. ImR 3 ist das Vektorprodukt aber tatsächlich ein Vektor imR 3 .(Natürlich gibt es auch das (triviale) ”komponentenweise“ Vektorproduktwie a ∗ b =(a 1 b 1 ,a 2 b 2 )inMATLAB .)Wir können das Skalarprodukt als Funktion f :R 2 ×R 2 →Rbetrachten,mit f(a,b)=a·b. Jedem Paar von Vektoren a,b ∈R 2 ordnen wir eine Zahlf(a,b)=a · b ∈R zu. Ähnlich können wir die Summation zweier Vektorenals Funktion f :R 2 ×R 2 →R 2 betrachten. Hier bedeutetR 2 ×R 2 natürlichdie Menge aller geordneten Paare (a,b) von Vektoren a =(a 1 ,a 2 ) undb =(b 1 ,b 2 )inR 2 .Beispiel 20.5. Wir erhalten (3, 7) · (5, 2) = 15 + 14 = 29 und (3, 7) · (3, 7) =9 + 49 = 58, so dass |(3, 7)| = √ 58.20.15 Eigenschaften des SkalarproduktesDas Skalarprodukt a · b inR 2 ist linear in jedem der Argumente a und b,d.h.a · (b + c)=a · b + a · c,(a + b) · c = a · c + b · c,(λa) · b = λa· b, a · (λb)=λa· b,


304 20. Analytische Geometrie in Ê 2für alle a,b ∈R 2 und λ ∈R. Dies folgt direkt aus der Definition (20.6). Sohaben wir beispielsweisea · (b + c)=a 1 (b 1 + c 1 )+a 2 (b 2 + c 2 )= a 1 b 1 + a 2 b 2 + a 1 c 1 + a 2 c 2 = a · b + a · c.Mit der Schreibweise f(a,b)=a · b lässt sich die lineare Eigenschaft auchformulieren alsf(a,b + c)=f(a,b)+f(a,c),f(λa, b)=λf(a,b),f(a + b,c)=f(a,c)+f(b,c),f(a,λb)=λf(a,b).Wir sagen auch, dass das Skalarprodukt a·b = f(a,b)einebilinear FormaufR 2 ×R 2 ist, d.h. eine Funktion vonR 2 ×R 2 aufRist, da a · b =f(a,b) für jedes Paar von Vektoren a und b inR 2 eine reelle Zahl ist unda · b = f(a,b) in beiden Variablen (oder Argumenten) a und b linear ist.Das Skalarprodukt a · b = f(a,b) ist außerdem symmetrisch, in dem Sinne,dassa · b = b · a oder f(a,b)=f(b,a)und positiv definit, d.h.a · a = |a| 2 > 0 für a ≠0=(0, 0).Wir können zusammenfassend sagen, dass das Skalarprodukt a·b = f(a,b)eine bilineare symmetrische positiv definite Form aufR 2 ×R 2 ist.Für die Basisvektoren e 1 =(1, 0) und e 2 =(0, 1) stellen wir fest, dasse 1 · e 2 =0, e 1 · e 1 =1, e 2 · e 2 =1.Mit Hilfe dieser Beziehungen können wir unter Ausnutzung der Linearitätdas Skalarprodukt zweier beliebiger Vektoren a =(a 1 ,a 2 ) und b =(b 1 ,b 2 )inR 2 folgendermaßen berechnen:a · b =(a 1 e 1 + a 2 e 2 ) · (b 1 e 1 + b 2 e 2 )= a 1 b 1 e 1 · e 1 + a 1 b 2 e 1 · e 2 + a 2 b 1 e 2 · e 1 + a 2 b 2 e 2 · e 2 = a 1 b 1 + a 2 b 2 .Daher können wir das Skalarprodukt alleine für die Basisvektoren definierenund es dann mit Hilfe der Linearität in jeder Variablen auf beliebigeVektoren ausweiten.20.16 Geometrische Interpretationdes SkalarproduktesWir werden nun beweisen, dass das Skalarprodukt a · b zweier Vektoren aund b inR 2 in der Forma · b = |a||b| cos(θ) (20.8)


20.17 Orthogonalität und Skalarprodukt 305ausgedrückt werden kann, wobei θ der Winkel zwischen den Vektoren a undb ist, vgl. Abb. 20.13. Diese Formel hat eine geometrische Interpretation.Unter der Annahme, dass |θ| ≤90 ◦ , so dass cos(θ) positiv ist, betrachtenwir das rechtwinklige Dreieck OAC in Abb. 20.13. Die Länge der Seite OCist |a| cos(θ). Somit ist a · b gleich dem Produkt der Seitenlängen OC undOB. Wir nennen OC die Projektion von OA auf OB und somit können wirsagen, dass a · b gleich dem Produkt der Länge der Projektion OA auf OBund der Länge von OB ist. Aufgrund der Symmetrie, können wir ebensoa · b mit der Projektion von OB auf OA verbinden und folgern, dass a · bdem Produkt der Länge der Projektion von OB auf OA und der Länge OAentspricht.ABaθCbOAbb. 20.13. a · b = |a||b|cos(θ)Um (20.8) zu beweisen, schreiben wir mit Hilfe der Polardarstellunga =(a 1 ,a 2 )=|a|(cos(α), sin(α)),b=(b 1 ,b 2 )=|b|(cos(β), sin(β)),wobei α der Richtungswinkel von a und β der Richtungswinkel von b ist.Mit der grundlegenden trigonometrischen Formel (8.4) erhalten wira · b = a 1 b 1 + a 2 b 2 = |a||b|(cos(α)cos(β)+sin(α)sin(β))= |a||b| cos(α − β)=|a||b| cos(θ),wobei θ = α − β der Winkel zwischen a und b ist. Da cos(θ) =cos(−θ),können wir den Winkel zwischen a und b aus α − β oder β − α berechnen.20.17 Orthogonalität und SkalarproduktWir sagen, dass zwei von Null verschiedene Vektoren a und b inR 2 geometrischorthogonal sind, geschrieben a ⊥ b, wenn der Winkel zwischen den


306 20. Analytische Geometrie in Ê 2baAbb. 20.14. Orthogonale Vektoren a und bVektoren 90 ◦ oder 270 ◦ beträgt, vgl. Abb. 20.14. Die st<strong>and</strong>ardisierten Basisvektorene 1 und e 2 sind Beispiele für geometrisch orthogonale Vektoren,vgl. Abb. 20.12.Seien a und b zwei von Null verschiedene Vektoren, die einen Winkelvon θ einschließen. Aus (20.8) wissen wir, dass a · b = |a||b| cos(θ), undsomit a·b = 0 dann und nur dann, wenn cos(θ) = 0, d.h. genau dann, wennθ =90 ◦ oder θ = 270 ◦ . Wir haben inzwischen den folgenden Satz bewiesen:Satz 20.2 Zwei von Null verschiedene Vektoren a und b sind dann undnur dann geometrisch orthogonal, wenn a · b =0.Dieses Ergebnis stimmt mit unserer Erfahrung im Kapitel ”Pythagorasund Euklid“ überein. Schließen nämlich zwei im Ursprung O beginnendeStrecken OA endend im Punkt A =(a 1 ,a 2 ) und OB endend im PunktB =(b 1 ,b 2 ) den Winkel OAB ein, so ist dieser genau dann ein rechterWinkel, wenna 1 b 1 + a 2 b 2 =0.Zusammengefasst haben wir die geometrische Bedingung, dass zwei Vektorena =(a 1 ,a 2 ) und b =(b 1 ,b 2 ) geometrisch orthogonal sind, in einealgebraische Bedingung a · b = a 1 b 1 + a 2 b 2 =0übersetzt.In einem allgemeineren Kontext werden wir dies unten umdrehen undzwei Vektoren a und b als orthogonal definieren, wenn a · b =0,wobeia · bdas Skalarprodukt von a und b ist. Wir haben gerade gesehen, dass diesealgebraische Definition der Orthogonalität als Erweiterung unseren intuitivenVorstellung der geometrischen Orthogonalität inR 2 gesehen werdenkann. Dies entspricht dem Grundprinzip der analytischen Geometrie, geometrischeBeziehungen algebraisch auszudrücken.


20.18 Projektion eines Vektors auf einen Vektor 30720.18 Projektion eines Vektors auf einen VektorProjektionen sind elementar für die lineare Algebra. Wir werden nun zumersten Mal auf diesen Begriff treffen und ihn unten in verschiedenen Zusammenhängenbenutzen.dbcaAbb. 20.15. Orthogonale Zerlegung von bSeien a =(a 1 ,a 2 ) und b =(b 1 ,b 2 ) zwei von Null verschiedene Vektoren.Wir betrachten das folgende elementare Problem: Gesucht sind Vektorenc und d, sodassc parallel zu a, d orthogonal zu a ist und c + d = b,vgl. Abb. 20.15. Wir nennen b = c + d orthogonale Zerlegung von b. Wirbezeichnen den Vektor c als die Projektion von b in Richtung a oder dieProjektion von b auf a und schreiben dies als P a (b) =c. Wirkönnen dieZerlegung von b dann als b = P a (b)+(b − P a (b)), mit c = P a (b) undd = b−P a (b) schreiben. Die folgenden Eigenschaften der Zerlegung ergebensich sofort:P a (b)=λafür ein λ ∈R,(b − P a (b)) · a =0.Wir setzen die erste Gleichung in die zweite ein und erhalten die Gleichung(b − λa) · a =0für λ, woraus wirλ = b · aa · a = b · a|a| 2erhalten und folgern, dass die Projektion P a (b)vonb auf a durchgegeben ist. Die Länge von P a (b) berechnen wir zuP a (b)= b · a|a| 2 a (20.9)|P a (b)| =|a · b| |a||b||cos(θ)||a| = = |b|| cos(θ)|, (20.10)|a|2|a|


308 20. Analytische Geometrie in Ê 2 aθP a(b)|P a(b)| = |b||cos(θ)| = |b · a|/|a|Abb. 20.16. Die Projektion P a(b) vonb auf awobei θ der Winkel zwischen a und b ist und wir (20.8) benutzen. Wirstellen fest, dass|a · b| = |a||P a (b)|, (20.11)was unserer Erfahrung mit dem Skalarprodukt in Abschnitt 20.16 übereinstimmt,vgl. Abb. 20.16.Wir können die Projektion P a (b) des Vektors b auf den Vektor a alsAbbildung vonR 2 aufR 2 betrachten: Für den Vektor b ∈R 2 definieren wirden Vektor P a (b) ∈R 2 durchP a (b)= b · a a. (20.12)|a|2Wir schreiben in Kurzform Pb= P a (b), unterdrücken dabei die Abhängigkeitvon a und die Klammern, und halten fest, dass die durch x → Pxdefinierte Abbildung P :R 2 →R 2 linear ist. Es gelten nämlichP(x + y)=Px+ Py, und P(λx)=λPx (20.13)für alle x und y inR 2 und λ ∈R (wobei wir den Namen der unabhängigenVariablen von b in x oder y geändert haben), vgl. Abb. 20.17.Wir bemerken, dass P(Px)=Px für alle x ∈R 2 , was auch als P 2 = Pgeschrieben werden kann und eine charakteristische Eigenschaft von Projektionenist. Eine wiederholte Projektion hat keinen Einfluss!Wir fassen zusammen:Satz 20.3 Die Projektion x → Px = P a (x) auf einen vorgegebenen vonNull verschiedenen Vektor a ∈R 2 ist eine lineare Abbildung P :R 2 →R 2mit der Eigenschaft, dass PP = P.Beispiel 20.6. Für a =(1, 3) und b =(5, 2) ist P a (b) = (1,3)·(5,2)1 2 +3 2 (1, 3) =(1, 1;3, 3).


20.19 Drehung um 90 ◦ 309λxaxP(λx)=λPxPxAbb. 20.17. P(λx)=λPx20.19 Drehung um 90 ◦Wir haben oben gesehen, dass für eine orthogonale Zerlegung b = c+d mitc parallel zu a nur c gefunden werden musste, da d = b − c. Stattdessen,hätten wir zuerst nach einem d, das orthogonal zu a sein muss, suchenkönnen. Dies führt uns zum Problem, eine zu einer vorgegebenen Richtungsenkrechte Richtung zu finden, d.h. zu dem Problem einen vorgegebenenVektor um 90 ◦ zu drehen. Damit wollen wir uns nun beschäftigen.Sei a =(a 1 ,a 2 ) ein gegebener Vektor inR 2 . Eine schnelle Berechnungzeigt, dass der Vektor (−a 2 ,a 1 )diegewünschte Eigenschaft hat, da seinSkalarprodukt mit a =(a 1 ,a 2 )(−a 2 ,a 1 ) · (a 1 ,a 2 )=(−a 2 )a 1 + a 1 a 2 =0.Daher ist (−a 2 ,a 1 ) orthogonal zu (a 1 ,a 2 ). Außerdem folgt sofort, dass derVektor (−a 2 ,a 1 )diegleicheLänge hat wie a.Sei a = |a|(cos(α), sin(α)). Aus den Gleichungen − sin(α)=cos(α+90 ◦ )und cos(α)=sin(α+90 ◦ )können wir erkennen, dass der Vektor (−a 2 ,a 1 )=|a|(cos(α +90 ◦ ), sin(α +90 ◦ )) dadurch erhalten wird, dass wir den Vektor(a 1 ,a 2 ) gegen den Uhrzeigersinn um 90 ◦ drehen, vgl. Abb. 20.18. Ganzähnlich wird der Vektor (a 2 , −a 1 )=−(−a 2 ,a 1 ) durch Drehung von (a 1 ,a 2 )um 90 ◦ im Uhrzeigersinn erhalten.Wir können die Drehung eines Vektors um 90 ◦ gegen den Uhrzeigersinnals Abbildung betrachten: Sei der Vektor a =(a 1 ,a 2 ) gegeben, so erhaltenwir einen <strong>and</strong>eren Vektor a ⊥ = f(a) durch die Formela ⊥ = f(a)=(−a 2 ,a 1 ),wobei wir das Bild des Vektors a sowohl mit a ⊥ als auch f(a) bezeichnen.Durch die Abbildung a → a ⊥ = f(a) definieren wir eine lineare Funktion


310 20. Analytische Geometrie in Ê 2(−a 2,a 1)(a 1,a 2)Abb. 20.18. Drehung um 90 ◦ gegen den Uhrzeigersinn von a =(a 1,a 2)f :R 2 →R 2 ,daf(a + b)=(−(a 2 + b 2 ),a 1 + b 1 )=(−a 2 ,a 1 )+(−b 2 ,b 1 )=f(a)+f(b),f(λa)=(−λa 2 ,λa 1 )=λ(−a 2 ,a 1 )=λf(a).Es genügt, die Wirkung auf die Basisvektoren e 1 und e 2 anzugeben, um dieWirkung von a → a ⊥ = f(a) auf einen beliebigen Vektor a auszudrücken:e ⊥ 1 = f(e 1 )=(0, 1) = e 2 und e ⊥ 2 = f(e 2 )=(−1, 0) = −e 1 .Aufgrund der Linearität können wir so berechnen:a ⊥ = f(a)=f(a 1 e 1 + a 2 e 2 )=a 1 f(e 1 )+a 2 f(e 2 )= a 1 (0, 1) + a 2 (−1, 0) = (−a 2 ,a 1 ).Beispiel 20.7. Drehung des Vektors (1, 2) um 90 ◦ gegen den Uhrzeigersinnergibt den Vektor (−2, 1).20.20 Drehung um einen beliebigen Winkel θWir verallgemeinern nun zu Drehungen gegen den Uhrzeigersinn um einenbeliebigen Winkel θ.Seia = |a|(cos(α), sin(α)) ein gegebener Vektor inR 2 .Wir suchen einen Vektor R θ (a) ∈R 2 mit gleicher Länge, den wir durchDrehung von a gegen den Uhrzeigersinn um den Winkel θ erhalten. Ausder Definition des Vektors R θ (a), als Ergebnis der Rotation des Vektorsa = |a|(cos(α), sin(α)) um θ, ergibt sichR θ (a)=|a|(cos(α + θ), sin(α + θ)).Mit Hilfe der trigonometrischen Formeln (8.4) und (8.5),cos(α + θ)=cos(α)cos(θ) − sin(α)sin(θ),sin(α + θ)=sin(α)cos(θ)+cos(α)sin(θ),


20.21 Nochmals Drehung um θ! 311können wir die Formel für den gedrehten Vektor R θ (a) folgendermaßenschreiben:R θ (a)=(a 1 cos(θ) − a 2 sin(θ),a 1 sin(θ)+a 2 cos(θ)). (20.14)Wir können die Drehung eines Vektors gegen den Uhrzeigersinn um einenWinkel θ als Abbildung betrachten: Ist ein Vektor a =(a 1 ,a 2 ) gegeben, soerhalten wir einen neuen Vektor R θ (a) durch Drehung um θ, entsprechendder obigen Formel. Natürlich können wir diese Abbildung auch als FunktionR θ (a) :R 2 → R 2 betrachten. Dass diese Funktion linear ist, lässt sicheinfach zeigen. Es genügt, die Auswirkungen von R θ auf die Basisvektorene 1 und e 2 anzugeben, um die Auswirkungen von R θ auf einen beliebigenVektor a zu spezifizieren:R θ (e 1 )=(cos(θ), sin(θ)),und R θ (e 2 )=(− sin(θ), cos(θ)).Formel (20.14) kann somit auch unter Ausnutzung der Linearität folgendermaßengewonnen werden:R θ (a)=R θ (a 1 e 1 + a 2 e 2 )=a 1 R θ (e 1 )+a 2 R θ (e 2 )= a 1 (cos(θ), sin(θ)) + a 2 (− sin(θ), cos(θ))=(a 1 cos(θ) − a 2 sin(θ),a 1 sin(θ)+a 2 cos(θ)).Beispiel 20.8. Wenn wir den Vektor (1, 2) um 30 ◦ drehen, so erhalten wirden Vektor (cos(30 ◦ )−2sin(30 ◦ ), sin(30 ◦ )+2cos(30 ◦ )) = ( √ 32 −1, 1 2 +√ 3).20.21 Nochmals Drehung um θ!Wir wollen noch einen <strong>and</strong>eren Weg zu (20.14) aufzeigen, der darauf beruht,dass die Abbildung R θ :R 2 →R 2 einer Drehung um θ gegen denUhrzeigersinn durch folgende Eigenschaften definiert wird:(i) |R θ (a)| = |a|, und (ii) R θ (a) · a =cos(θ)|a| 2 . (20.15)Eigenschaft (i) besagt, dass die Drehung die Länge erhält und (ii) verknüpftdie Richtungsänderung mit dem Skalarprodukt. Wir wollen nun R θ (a)aus(i) und (ii) bestimmen. Sei a ∈R 2 . Wir setzen a ⊥ =(−a 2 ,a 1 ) und drückenR θ (a)inderFormR θ (a)=αa + βa ⊥ mit geeigneten reellen Zahlen α undβ aus. Wir bilden nun das Skalarprodukt mit a und nutzen dabei, dassa · a ⊥ = 0. Aus (ii) erhalten wir, dass α =cos(θ). Im Weiteren besagt (i),dass |a| 2 = |R θ (a)| 2 =(α 2 + β 2 )|a| 2 , woraus wir folgern, dass β = ± sin(θ)und schließlich β =sin(θ) aufgrund der Drehung gegen den Uhrzeigersinn.Wir folgern, dassR θ (a)=cos(θ)a +sin(θ)a ⊥ =(a 1 cos(θ) − a 2 sin(θ),a 1 sin(θ)+a 2 cos(θ))und haben so wiederum (20.14) erhalten.


312 20. Analytische Geometrie in Ê 220.22 Drehung eines KoordinatensystemsAngenommen, wir rotieren die Basisvektoren e 1 =(1, 0) und e 2 =(0, 1)gegen den Uhrzeigersinn um den Winkel θ und erhalten so die neuen Vektorenê 1 =cos(θ)e 1 +sin(θ)e 2 und ê 2 = − sin(θ)e 1 +cos(θ)e 2 . Wir können ê 1und ê 2 als neues Koordinatensystem benutzen und nach dem Zusammenhangzwischen den Koordinaten eines gegebenen Vektors (oder Punktes)im alten und im neuen Koordinatensystem fragen. Seien (a 1 ,a 2 ) die Koordinatenin der Einheitsbasis e 1 und e 2 und (â 1 , â 2 ) die Koordinaten in derneuen Basis ê 1 und ê 2 . Wir habena 1 e 1 + a 2 e 2 =â 1 ê 1 +â 2 ê 2=â 1 (cos(θ)e 1 +sin(θ)e 2 )+â 2 (− sin(θ)e 1 +cos(θ)e 2 )=(â 1 cos(θ) − â 2 sin(θ))e 1 +(â 1 sin(θ)+â 2 cos(θ))e 2und die Eindeutigkeit der Koordinaten im Hinblick auf e 1 und e 2 implizierta 1 =cos(θ)â 1 − sin(θ)â 2 ,a 2 =sin(θ)â 1 +cos(θ)â 2 .(20.16)Da wir e 1 und e 2 durch Drehung von ê 1 und ê 2 im Uhrzeigersinn um denWinkel θ erhalten, giltâ 1 =cos(θ)a 1 +sin(θ)a 2 ,â 2 = − sin(θ)a 1 +cos(θ)a 2 .(20.17)Der Zusammenhang zwischen den Koordinaten in den beiden Koordinatensystemenwird somit durch (20.16) und (20.17) gegeben.Beispiel 20.9. Drehung gegen den Uhrzeigersinn um 45 ◦ liefert die folgendeBeziehung zwischen alten und neuen Koordinaten:â 1 = 1 √2(a 1 + a 2 ), und â 2 = 1 √2(−a 1 + a 2 ).20.23 VektorproduktWir definieren nun das Vektorprodukt a × b zweier Vektoren a =(a 1 ,a 2 )und b =(b 1 ,b 2 )inR 2 durch die Formela × b = a 1 b 2 − a 2 b 1 . (20.18)Das Vektorprodukt a × b wird wegen seiner Schreibweise auch Kreuzproduktgenannt (bringen Sie dies nicht mit dem ”דinder ”Produktmenge“R 2 ×R 2 durchein<strong>and</strong>er). Das Vektorprodukt oder Kreuzprodukt kann als


20.23 Vektorprodukt 313FunktionR 2 ×R 2 →Rbetrachtet werden. Diese Funktion ist bilinear, waseinfach zu zeigen ist und anti-symmetrisch, d.h.a × b = −b × a, (20.19)was für ein Produkt erstaunlich ist.Da das Vektorprodukt bilinear ist, können wir seine Auswirkungen aufzwei beliebige Vektoren a und b durch seine Wirkung auf die Basisvektorenspezifizieren:e 1 × e 1 =0,e 2 × e 2 =0,e 1 × e 2 =1,e 2 × e 1 = −1. (20.20)Mit Hilfe dieser Beziehungen erhalten wira × b =(a 1 e 1 + a 2 e 2 ) × (b 1 e 1 + b 2 e 2 )=a 1 b 2 e 1 × e 2 + a 2 b 1 e 2 × e 1= a 1 b 2 − a 2 b 1 .Wir zeigen jetzt, dass die Bilinearität und die Anti-Symmetrie tatsächlichdas Vektorprodukt inR 2 bis auf eine Konstante charakterisieren. BeachtenSie zunächst, dass Anti-Symmetrie und Bilinearitäte 1 × e 1 + e 1 × e 2 = e 1 × (e 1 + e 2 )=−(e 1 + e 2 ) × e 1= −e 1 × e 1 − e 2 × e 1implizieren. Da e 1 ×e 2 = −e 2 ×e 1 ,erhaltenwire 1 ×e 1 =0.Ähnlich erhaltenwir e 2 × e 2 = 0. Wir folgern daraus, dass die Wirkung des Vektorproduktesauf die Basisvektoren tatsächlich mit (20.20) bis auf eine Konstanteübereinstimmt.Als Nächstes beobachten wir, dassa × b =(−a 2 ,a 1 ) · (b 1 ,b 2 )=a 1 b 2 − a 2 b 1eine Beziehung zwischen Vektorprodukt a×b und Skalarprodukt a ⊥ ·b mitdemum90 ◦ gegen den Uhrzeigersinn gedrehten Vektor a ⊥ =(−a 2 ,a 1 )herstellt. Wir fassen zusammen, dass das Vektorprodukt a × b zweier vonNull verschiedenen Vektoren a und b genau dann Null ist, wenn a und bparallel sind. Wir fassen dieses wichtige Ergebnis in einem Satz zusammen.Satz 20.4 Zwei von Null verschiedene Vektoren a und b sind dann undnur dann parallel, wenn a × b =0.Wir können somit überprüfen, ob zwei von Null verschiedene Vektoren aund b parallel sind, indem wir auf a × b =0prüfen. Dies ist ein weiteresBeispiel für die Übersetzung geometrischer Bedingungen (Parallelitätzweier Vektoren a und b) in algebraische Bedingungen (a × b =0).


314 20. Analytische Geometrie in Ê 2Wir wollen jetzt noch mehr Information aus der Beziehung a×b = a ⊥ ·bziehen. Dazu nehmen wir an, dass a und b den Winkel θ einschließen undsomit schließen a ⊥ und b den Winkel θ +90 ◦ ein:|a × b| = ∣ a⊥ · b ∣ ∣ ∣ ∣ (= ∣a ⊥ ∣∣cos |b| θ + π )∣ ∣∣2= |a||b||sin(θ)|,wobei wir ausgenutzt haben, dass |a ⊥ | = |a| und | cos(θ ± π/2)| = | sin(θ)|.Daher ist|a × b| = |a||b|| sin(θ)|, (20.21)wobei θ = α − β der Winkel zwischen a und b ist, vgl. Abb. 20.19.(−a 2,a 1)aθbAbb. 20.19. Warum |a × b| = |a||b|| sin(θ)| istWir können Formel (20.21) noch präzisieren, indem wir die Absolutbeträgeum a × b und den Sinusfaktor entfernen und uns auf eine geeigneteVorzeichenkonvention einigen. Dies führt uns zur genaueren Version von(20.21), die wir als Satz formulieren, vgl. Abb. 20.20.Satz 20.5 Für zwei von Null verschiedene Vektoren a und b gilta × b = |a||b| sin(θ), (20.22)wobei θ der Winkel zwischen a und b ist, der bei einer Bewegung von a nachb gegen den Uhrzeigersinn positiv und bei einer Bewegung im Uhrzeigersinnnegativ ist.20.24 Die Fläche eines Dreiecks mit einer Eckeim UrsprungWir betrachten ein Dreieck OAB mit Ecken im Ursprung O und den PunktenA =(a 1 ,a 2 ) und B =(b 1 ,b 2 ), die durch die Vektoren a =(a 1 ,a 2 ) und


20.25 Fläche eines beliebigen Dreiecks 315aθbAbb. 20.20. a × b = |a||b| sin(θ) ist hier negativ, da der Winkel θ negativ istb =(b 1 ,b 2 ) gebildet werden, vgl. Abb. 20.21. Wir sagen auch, dass dasDreieck OAB durch die Vektoren a und b aufgespannt wird. Wir sind mitder Formel vertraut, dass die Fläche dieses Dreiecks gleich der Grundseite|a| mal der Höhe |b|| sin(θ)| mal 1 2ist, wobei θ der Winkel zwischen a undb ist, vgl. Abb. 20.21. Mit Rückgriff auf (20.21) fassen wir zusammen:Satz 20.6Fläche(OAB)= 1 2 |a||b||sin(θ)| = 1 |a × b|.2Die Fläche des Dreiecks OAB kann mit Hilfe des Vektorproduktes inR 2berechnet werden.Bb|b|sin(θ)OθaAAbb. 20.21. Die Vektoren a und b spannen ein Dreieck der Fläche 1 |a × b| auf220.25 Fläche eines beliebigen DreiecksWir betrachten ein Dreieck CAB mit Ecken in den Punkten C =(c 1 ,c 2 ),A =(a 1 ,a 2 ) und B =(b 1 ,b 2 ) und stellen die Frage nach der Fläche dieses


316 20. Analytische Geometrie in Ê 2Dreiecks. Wir haben das Problem oben für C = O gelöst, wobei O der Ursprungist. Wir können das aktuelle Problem auf obigen Fall zurückführen,wenn wir das Koordinatensystem wie folgt ändern: Wir betrachten ein neuesKoordinatensystem mit Ursprung in C =(c 1 ,c 2 ) mit einer ˆx 1 -Achse parallelzur x 1 -Achse und einer ˆx 2 -Achse parallel zur x 2 -Achse, vgl. Abb. 20.22.x 2ˆx 1ˆx 2B =(b 1,b 2)b−cθa−cC =(c 1,c 2)A =(a 1,a 2)Ox 1Abb. 20.22. Die Vektoren a − c und b − c spannen ein Dreieck mit der Fläche|(a − c) × (b − c)| auf12Angenommen, (â 1 , â 2 ) bezeichne die Koordinaten im neuen Koordinatensystem.Die neuen Koordinaten sind durchâ 1 = a 1 − c 1 , â 2 = a 2 − c 2mit den alten Koordinaten verbunden. Die Koordinaten der Punkte A, Bund C im neuen Koordinatensystem sind somit (a 1 − c 1 ,a 2 − c 2 )=a − c,(b 1 −c 1 ,b 2 −c 2 )=b−c und (0, 0). Mit Hilfe des Ergebnisses im vorherigenAbschnitt erhalten wir für die Fläche des Dreiecks CABFläche(CAB)= 1 |(a − c) × (b − c)| . (20.23)2Beispiel 20.10. Die Fläche des Dreiecks mit den Koordinaten A =(2, 3),B =(−2, 2) und C =(1, 1) ist Fläche(CAB)= 1 2 |(1, 2) × (−3, 1)| = 7 2 .20.26 Die Fläche eines durch zwei Vektorenaufgespannten ParallelogrammsDie Fläche des durch zwei Vektoren a und b aufgespannten Parallelogramms,vgl. Abb. 20.23, ist gleich |a × b|, dadieFläche des Parallelogrammsdoppelt so groß ist wie die Fläche des durch a und b aufgespannten


20.27 Geraden 317Dreiecks. Wenn wir die Fläche eines durch die Vektoren a und b aufgespanntenParallelogramms mit V (a,b) bezeichnen, so lautet die FormelV (a,b)=|a × b|. (20.24)Dies ist eine grundlegende Formel mit wichtigen Verallgemeinerungen imR 3 undR n .b|b|sin(θ)θaAbb. 20.23. Die Vektoren a und b spannen ein Parallelogramm auf, das dieFläche |a × b| = |a||b|| sin(θ)| besitzt20.27 GeradenSei n =(n 1 ,n 2 ) ∈R 2 ein gegebener, von Null verschiedener, Vektor. Dannbilden die Punkte x =(x 1 ,x 2 ) in der EbeneR 2 , die die Bedingungn 1 x 1 + n 2 x 2 = n · x = 0 (20.25)erfüllen, eine Gerade durch den Ursprung, die zu (n 1 ,n 2 ) senkrecht steht,vgl. Abb. 20.24. Wir nennen (n 1 ,n 2 ) Normale zur Geraden. Wir könnendie Punkte x ∈R 2 der Geraden in der Formx = sn ⊥ ,s∈Rschreiben, wobei n ⊥ =(−n 2 ,n 1 ) orthogonal zu n ist, vgl. Abb. 20.24.Aufgrund seiner Wichtigkeit formulieren wir dies in einem Satz.Satz 20.7 Eine Gerade inR 2 , die durch den Ursprung verläuft und normalzu n ∈R 2 ist, kann entweder als Punkte x ∈R 2 ,dien · x =0genügen,oder als Menge von Punkten der Form x = sn ⊥ ,mitn ⊥ ∈R 2 orthogonalzu n und s ∈R, formuliert werden.


318 20. Analytische Geometrie in Ê 2x 2 x 2n ⊥ x = sn ⊥nnxx 1 x 2Abb. 20.24. Die Vektoren x = sn ⊥ erzeugen eine Gerade durch den Ursprungmit Normaler n, wobein ⊥ orthogonal zum gegebenen Vektor n istSei <strong>and</strong>ererseits n =(n 1 ,n 2 ) ∈R 2 ein gegebener, von Null verschiedener,Vektor und d eine gegebene Konstante. Dann erzeugen die Punkte (x 1 ,x 2 )inR 2 mitn 1 x 1 + n 2 x 2 = d (20.26)eine Gerade, die nicht durch den Ursprung verläuft, wenn d ≠0.Wirerkennen, dass dann n normal zur Geraden ist, da für zwei Punkte x und ˆxauf der Geraden (x− ˆx)·n = d−d = 0 ist, vgl. Abb. 20.25. Wir können dieGerade als die Punkte x =(x 1 ,x 2 )inR 2 definieren, so dass die Projektionn·x|n|n des Vektors x =(x 2 1 ,x 2 ) in Richtung n gleich d|n|n. Dies folgt aus2der Definition der Projektion und der Tatsache, dass n · x = d.x 2nn ⊥x =(x 1,x 2)ˆxOx 1Abb. 20.25. Die Gerade durch die Punkte ˆx und x, die durch den Richtungsvektorn ⊥ erzeugt wird


20.28 Projektion eines Punktes auf eine Gerade 319Die Gerade in Abb. 20.24 kann auch als eine Menge von Punktenx =ˆx + sn ⊥mit s ∈Rdargestellt werden, wobei ˆx ein beliebiger Punkt auf der Geraden ist (undsomit n · ˆx = d genügt). Dies ergibt sich daher, dass jeder Punkt x derForm x = sn ⊥ +ˆx offensichtlich n · x = n · ˆx = d genügt. Wir fassen diesin einem Satz zusammen.Satz 20.8 Die Punkte x ∈R 2 ,für die n · x = d gilt, wobei n ∈R 2 eingegebener, von Null verschiedener, Vektor ist und d eine gegebene Konstante,beschreiben eine Gerade imR 2 . Die Gerade kann auch in der Formx =ˆx + sn ⊥ für s ∈R formuliert werden, wobei ˆx ∈R 2 ein Punkt auf derGeraden ist.Beispiel 20.11. Die Gerade x 1 +2x 2 = 3 kann alternativ auch als Mengevon Punkten x =(1, 1) + s(−2, 1) mit s ∈R formuliert werden.20.28 Projektion eines Punktes auf eine GeradeSei b ein Punkt imR 2 , der nicht auf der Geraden n · x = d liege. Wirsuchen den Punkt Pb auf der Geraden, der b am nächsten kommt, vgl.Abb. 20.28. Er wird Projektion des Punktes b auf die Gerade genannt. Diesist äquivalent zur Suche nach einem Punkt Pb auf der Geraden, so dassb−Pborthogonal zur Geraden ist, d.h. wir suchen einen Punkt Pb,sodassn · Pb= d (Pb ist ein Punkt auf der Geraden),b − Pb ist parallel zur Normalen n, (b − Pb= λn, für ein λ ∈R).Offensichtlich gilt Pb = b − λn und die Gleichung n · Pb = d führt zun · (b − λn)=d, d.h. λ = b·n−d|n| 2 . Somit istPb= b − b · n − d|n| 2 n. (20.27)Ist d = 0, d.h. die Gerade n · x = d = 0 geht durch den Ursprung, dann(vgl. Aufgabe 20.26) giltPb= b − b · n n. (20.28)|n|220.29 Wann sind zwei Geraden parallel?Seiena 11 x 1 + a 12 x 2 = b 1 ,a 21 x 1 + a 22 x 2 = b 2 ,


320 20. Analytische Geometrie in Ê 2zwei Geraden inR 2 mit den Normalen (a 11 ,a 12 ) und (a 21 ,a 22 ). Wie erfahrenwir, ob die Geraden parallel sind? Natürlich sind die Geraden genaudann parallel, wenn ihre Normalen parallel sind. Aus obigem wissen wir,dass Normale genau dann parallel sind, wenn(a 11 ,a 12 ) × (a 21 ,a 22 )=a 11 a 22 − a 12 a 21 =0und folgerichtig nicht parallel (und somit schneiden sie sich irgendwo) dannund nur dann, wenn(a 11 ,a 12 ) × (a 21 ,a 22 )=a 11 a 22 − a 12 a 21 ≠0. (20.29)Beispiel 20.12. Die zwei Geraden 2x 1 +3x 2 = 1 und 3x 1 +4x 2 =1sindnicht parallel, da 2 · 4 − 3 · 3=−1 ≠0.20.30 Ein System zweier linearen Gleichungenmit zwei UnbekanntenSind a 11 x 1 + a 12 x 2 = b 1 und a 21 x 1 + a 22 x 2 = b 2 zwei Geraden imR 2 mitNormalen (a 11 ,a 12 ) und (a 21 ,a 22 ), dann wird ihr Schnittpunkt durch daslineare Gleichungssystema 11 x 1 + a 12 x 2 = b 1 ,a 21 x 1 + a 22 x 2 = b 2(20.30)gegeben. Es besagt, dass wir einen Punkt (x 1 ,x 2 ) ∈R 2 suchen, der aufbeiden Geraden liegt. Dies ist ein System zweier linearen Gleichungen mitzwei Unbekannten x 1 und x 2 oder ein 2 × 2-System. Die Zahlen a ij , i,j =1, 2 sind die Koeffizienten des Gleichungssystems und die b i , i =1, 2, diezugehörige rechte Seite.Sind die Normalen (a 11 ,a 12 ) und (a 21 ,a 22 ) nicht parallel und somit nach(20.29) a 11 a 22 − a 12 a 21 ≠0,dannmüssen sich die Geraden schneiden unddas System (20.30) hat eine eindeutige Lösung (x 1 ,x 2 ). Um x 1 zu bestimmen,multiplizieren wir die erste Gleichung mit a 22 und erhaltena 11 a 22 x 1 + a 12 a 22 x 2 = b 1 a 22 .Multiplikation der zweiten Gleichung mit a 12 ergibta 21 a 12 x 1 + a 22 a 12 x 2 = b 2 a 12 .Beim Subtrahieren beider Gleichungen löschen sich die Ausdrücke mit x 2aus und wir erhalten die folgende Gleichung in der Unbekannten x 1 :a 11 a 22 x 1 − a 21 a 12 x 1 = b 1 a 22 − b 2 a 12 .


20.30 Ein System zweier linearen Gleichungen mit zwei Unbekannten 321Auflösen nach x 1 ergibtx 1 =(a 22 b 1 − a 12 b 2 )(a 11 a 22 − a 12 a 21 ) −1 .Ähnlich erhalten wir x 2 , indem wir die erste Gleichung mit a 21 multiplizieren,davon die mit a 11 multiplizierte zweite Gleichung abziehen, wodurchder x 1 Ausdruck wegfällt. Alles in allem erhalten wir die Lösungsformelnx 1 =(a 22 b 1 − a 12 b 2 )(a 11 a 22 − a 12 a 21 ) −1 ,x 2 =(a 11 b 2 − a 21 b 1 )(a 11 a 22 − a 12 a 21 ) −1 .(20.31a)(20.31b)Diese Formeln liefern die eindeutigen Lösungen von (20.30), unter der Annahme,dass a 11 a 22 − a 12 a 21 ≠0.Unter der Annahme, dass a 11 a 22 − a 12 a 21 ≠0,können wie die Lösungsformeln(20.31) auch <strong>and</strong>ers erhalten. Dazu definieren wir a 1 =(a 11 ,a 21 )und a 2 =(a 12 ,a 22 ). a 1 und a 2 beschreiben nun Vektoren mit a 1 × a 2 =a 11 a 22 − a 12 a 21 ≠ 0. Wir formulieren nun die beiden Gleichungen (20.30)in Vektorschreibweise:x 1 a 1 + x 2 a 2 = b. (20.32)Wir bilden das Vektorprodukt dieser Gleichung mit a 2 und a 1 und nutzendabei, dass a 2 × a 2 = a 1 × a 1 =0:Da a 1 × a 2 ≠0,erhaltenwirx 1 a 1 × a 2 = b × a 2 , x 2 a 2 × a 1 = b × a 1 .x 1 = b × a 2a 1 × a 2, x 2 = b × a 1a 2 × a 1= − b × a 1a 1 × a 2, (20.33)was mit den Gleichungen (20.31) übereinstimmt.Wir beenden diesen Abschnitt mit der Diskussion des Falles a 1 × a 2 =a 11 a 22 − a 12 a 21 =0,d.h.wenna 1 und a 2 parallel sind oder äquivalent diebeiden Geraden parallel sind. In diesem Fall ist a 2 = λa 1 für ein λ ∈Runddas Gleichungssystem (20.30) hat genau dann eine Lösung, wenn b 2 = λb 1gilt, da sich dann die zweite Gleichung aus der ersten nach Multiplikationmit λ ergibt. In diesem Fall gibt es unendlich viele Lösungen, da die beidenGeraden zusammenfallen. Wählen wir insbesondere b 1 = b 2 =0,sobestehen die Lösungen aus allen (x 1 ,x 2 )für die a 11 x 1 + a 12 x 2 =0,waseiner Geraden durch den Ursprung entspricht. Ist auf der <strong>and</strong>eren Seiteb 2 ≠ λb 1 , dann beschreiben die beiden Gleichungen zwei unterschiedlicheparallele Geraden, die sich nicht schneiden. Folglich gibt es keine Lösungfür (20.30).Wir fassen unsere Erfahrungen mit zwei Gleichungen für zwei Unbekanntewie folgt zusammen:Satz 20.9 Das lineare Gleichungssystem x 1 a 1 + x 2 a 2 = b, wobeia 1 ,a 2und b gegebene Vektoren inR 2 sind, hat eine eindeutige Lösung (x 1 ,x 2 )mit (20.33) falls a 1 × a 2 ≠0.Für den Fall a 1 × a 2 =0hat das System inAbhängigkeit von b keine oder unendlich viele Lösungen.


322 20. Analytische Geometrie in Ê 2Beispiel 20.13. Die Lösung des Gleichungssystemsx 1 +2x 2 =3,4x 1 +5x 2 =6,lautetx 1 =(3, 6) × (2, 5)(1, 4) × (2, 5) = 3 −3 = −1, x (3, 6) × (1, 4)2 = −(1, 4) × (2, 5) = − 6 −3 =2.20.31 Lineare Unabhängigkeit und BasisWir haben oben das System (20.30) in der Vektorschreibweisex 1 a 1 + x 2 a 2 = bgeschrieben, wobei b =(b 1 ,b 2 ), a 1 =(a 11 ,a 21 ) und a 2 =(a 12 ,a 22 ) VektoreninR 2 sind und x 1 und x 2 reelle Zahlen. Wir sagen, dassx 1 a 1 + x 2 a 2eine Linearkombination der Vektoren a 1 und a 2 ist oder eine Linearkombinationder Vektoren der Menge {a 1 ,a 2 }, mit den reellen Zahlen x 1 und x 2als Koeffizienten. Wir nennen x 1 und x 2 Koordinaten von b, bezogen aufdie Vektoren der Menge {a 1 ,a 2 }, was wir auch als geordnetes Paar (x 1 ,x 2 )schreiben können.Die Lösungsformeln (20.33) besagen somit, dass für a 1 × a 2 ≠0,einbeliebiger Vektor b inR 2 als Linearkombination der Vektoren der Menge{a 1 ,a 2 } mit eindeutig bestimmten Koeffizienten x 1 und x 2 geschriebenwerden kann. Das bedeutet, dass uns für a 1 ×a 2 ≠0dieMenge{a 1 ,a 2 } alsBasis fürR 2 dienen kann, in dem Sinne, dass jeder Vektor b inR 2 eindeutigals Linearkombination b = x 1 a 1 + x 2 a 2 der Vektoren {a 1 ,a 2 } geschriebenwerden kann. Die Vektoren {a 1 ,a 2 } werden auch Basissatz genannt. Wirnennen das geordnete Paar (x 1 ,x 2 ) Koordinaten von b in der Basis {a 1 ,a 2 }.Das Gleichungssystem b = x 1 a 1 + x 2 a 2 beschreibt somit die Kopplungzwischen den Koordinaten (b 1 ,b 2 )desVektorsb in der Einheitsbasis undden Koordinaten (x 1 ,x 2 )inderBasis{a 1 ,a 2 }. Insbesondere sind x 1 =0und x 2 =0für b =0.Andererseits ist für a 1 × a 2 = 0, d.h. wenn a 1 und a 2 parallel sind, jedervon Null verschiedene Vektor b, der orthogonal zu a 1 ist, auch orthogonalzu a 2 und kann daher nicht in der Form b = x 1 a 1 + x 2 a 2 ausgedrücktwerden. Somit kann {a 1 ,a 2 } mit a 1 × a 2 = 0 nicht als Basis dienen. Damithaben wir den folgenden grundlegenden Satz bewiesen:Satz 20.10 Eine Menge {a 1 ,a 2 } zweier von Null verschiedener Vektorena 1 , a 2 kann dann und nur dann als Basis fürR 2 dienen, wenn a 1 ×a 2 ≠0


20.31 Lineare Unabhängigkeit und Basis 323ist. Die Koordinaten (b 1 ,b 2 ) eines Vektors b in der Einheitsbasis und dieKoordinaten (x 1 ,x 2 ) von b in der Basis {a 1 ,a 2 } sind durch das lineareGleichungssystem b = x 1 a 1 + x 2 a 2 verknüpft.Beispiel 20.14. Die zwei Vektoren a 1 =(1, 2) und a 2 =(2, 1) (formuliertin der Einheitsbasis) bilden eine Basis imR 2 ,daa 1 × a 2 =1− 4=−3. Seib =(5, 4) in der Einheitsbasis. Um b in der Basis {a 1 ,a 2 } auszudrücken,suchen wir reelle Zahlen x 1 und x 2 ,sodassb = x 1 a 1 + x 2 a 2 . Mit Hilfe derLösungsformeln (20.33) erhalten wir x 1 = 1 und x 2 = 2. Die Koordinatenvon b im Basissatz {a 1 ,a 2 } lauten somit (1, 2), während die Koordinatenvon b in der Einheitsbasis (5, 4) sind.Als Nächstes wollen wir lineare Unabhängigkeit einführen, die im Folgendeneine wichtige Rolle spielen wird. Wir nennen eine Menge {a 1 ,a 2 }zweier von Null verschiedener Vektoren a 1 und a 2 inR 2 linear unabhängig,wenn das Gleichungssystemx 1 a 1 + x 2 a 2 =0die eindeutige Lösung x 1 = x 2 = 0 hat. Wir wissen, dass aus a 1 × a 2 ≠0die lineare Unabhängigkeit von a 1 und a 2 folgt (da aus b =(0, 0) folgtx 1 = x 2 = 0). Andererseits sind a 1 und a 2 parallel, wenn a 1 × a 2 =0,sodass a 1 = λa 2 für ein λ ≠ 0 gilt. Dann gibt es viele Möglichkeiten für x 1und x 2 ,sodassx 1 a 1 + x 2 a 2 = 0 erfüllt ist, wie z.B. x 1 = −1 und x 2 = λneben x 1 = x 2 = 0. Somit haben wir bewiesen:Satz 20.11 Die Menge {a 1 ,a 2 } zweier von Null verschiedener Vektorena 1 und a 2 ist dann und nur dann linear unabhängig, wenn a 1 × a 2 ≠0.x 2c 1c 2c =0, 73c 1 +1, 7c 2x 1Abb. 20.26. c als Linearkombination zweier linear unabhängigen Vektoren c 1und c 2


324 20. Analytische Geometrie in Ê 220.32 Die Verbindung zur Infinitesimalrechnungeiner VariablenWir haben die Infinitesimalrechnung reellwertiger Funktionen y = f(x)einer reellen Variablen x ∈R untersucht und ein Koordinatensystem inR 2benutzt, um die Graphen von Funktionen y = f(x), wobei x und y die zweiKoordinatenachsen repräsentieren, zu zeichnen. Alternativ können wir denGraphen als Menge von Punkten (x 1 ,x 2 ) ∈R 2 betrachten, der aus Paaren(x 1 ,x 2 ) reeller Zahlen x 1 und x 2 besteht, so dass x 2 = f(x 1 ) gilt, bzw.x 2 − f(x 1 )=0,wobeix 1 für x und x 2 für y steht. Wir bezeichnen dasgeordnete Paar (x 1 ,x 2 ) ∈R 2 als Vektor x =(x 1 ,x 2 ) mit den Komponentenx 1 und x 2 .Wir haben auch Eigenschaften linearer Funktionen f(x)=ax + b untersucht,wobei a und b reelle Konstanten sind. Deren Graphen sind Geradenx 2 = ax 1 +b inR 2 . Noch allgemeiner ist eine Gerade inR 2 eine Menge vonPunkten (x 1 ,x 2 ) ∈R 2 ,sodassx 1 a 1 + x 2 a 2 = b, wobeia 1 ,a 2 und b reelleKonstanten sind, mit a 1 ≠ 0 und/oder a 2 ≠ 0. Wir stellen fest, dass (a 1 ,a 2 )als Richtung inR 2 betrachtet werden kann, die senkrecht oder normal zurGeraden a 1 x 1 + a 2 x 2 = b ist, und dass (b/a 1 , 0) bzw. (0,b/a 2 ) die Punktesind, in denen die Gerade die x 1 -, bzw. die x 2 -Achse schneidet.20.33 Lineare Abbildungen f :R 2 →REine Funktion f :R 2 →Rheißt linear, wennfür jedes x =(x 1 ,x 2 ) undy =(y 1 ,y 2 )inR 2 und jedes λ inRf(x + y)=f(x)+f(y) und f(λx)=λf(x) (20.34)gilt. Indem wir c 1 = f(e 1 ) ∈R und c 2 = f(e 2 ) ∈Rsetzen, wobei e 1 =(1, 0)und e 2 =(0, 1) die Einheitsbasisvektoren inR 2 sind, können wir f :R 2 →Rfolgendermaßen formulieren:f(x)=x 1 c 1 + x 2 c 2 = c 1 x 1 + c 2 x 2 ,mit x =(x 1 ,x 2 ) ∈ R 2 . Wir nennen eine lineare Funktion auch lineareAbbildung.Beispiel 20.15. Die Funktion f(x 1 ,x 2 )=x 1 +3x 2 definiert eine lineareAbbildung f :R 2 →R.20.34 Lineare Abbildungen f :R 2 →R 2Eine Funktion f :R 2 →R 2 ,diedieWertef(x) =(f 1 (x),f 2 (x)) ∈R 2annimmt, heißt linear, wenn die Funktionen f 1 :R 2 →R und f 2 :R 2 →R


20.35 Lineare Abbildungen und lineare Gleichungssysteme 325linear sind. Indem wir a 11 = f 1 (e 1 ), a 12 = f 1 (e 2 ), a 21 = f 2 (e 1 ) und a 22 =f 2 (e 2 ) setzen, können wir f :R 2 →R 2 als f(x)=(f 1 (x),f 2 (x)) schreiben,wobeif 1 (x)=a 11 x 1 + a 12 x 2 ,f 2 (x)=a 21 x 1 + a 22 x 2(20.35a)(20.35b)gilt und die a ij reelle Zahlen sind.Eine lineare Abbildung f :R 2 →R 2 bildet (parallele) Geraden in (parallele)Geraden ab, da f(x)=f(ˆx + sb)=f(ˆx)+sf(b)für x =ˆx + sb,vgl.Abb. 20.27.x 2y 1y 2y = f(ˆx)+sf(b)x =ˆx + sby = sf(b)x = sbx 1Abb. 20.27. Eine lineare Abbildung f : Ê 2 → Ê 2 bildet (parallele) Geraden in(parallele) Geraden ab und somit Parallelogramme in ParallelogrammeBeispiel 20.16. Die Funktion f(x 1 ,x 2 )=(x 1 +3x 2 , 2x 1 − x 2 ) definiert einelineare AbbildungR 2 →R 2 .20.35 Lineare Abbildungenund lineare GleichungssystemeSei b ∈R 2 ein Vektor und f :R 2 →R 2 eine lineare Abbildung. Wir suchenein x ∈R 2 ,sodassf(x)=b.Angenommen, f(x) sei in der Form (20.35), dann suchen wir die Lösungx ∈R 2 für das 2 × 2 lineare Gleichungssystema 11 x 1 + a 12 x 2 = b 1 ,a 21 x 1 + a 22 x 2 = b 2 ,(20.36a)(20.36b)


326 20. Analytische Geometrie in Ê 2wobei die Koeffizienten a ij und die Koordinaten b i auf der rechten Seitegegeben sind.20.36 Eine erste Begegnung mit MatrizenWir schreiben die linke Seite von (20.36), wie folgt, um:( )( ) ( )a11 a 12 x1 a11 x= 1 + a 12 x 2. (20.37)a 22 x 2 a 21 x 1 + a 22 x 2a 21Das quadratische Feld ( )a11 a 12a 21 a 22wird 2×2-Matrix genannt. Wir können diese Matrix als Kombination zweierZeilen ( ) ( )a11 a 12 und a21 a 22oder zweier Spalten(a11a 21)und( )a12a 22betrachten. Jede Zeile kann als 1 × 2-Matrix mit 1 waagrechten Feld mit2 Elementen betrachtet werden. Jede Spalte kann als 2 × 1-Matrix mit 1vertikalen Feld mit 2 Elementen betrachtet werden. Insbesondere kann dasFeld(x1x 2)als 2 × 1-Matrix betrachtet werden. Wir nennen eine 2 × 1-Matrix aucheinen 2-Spaltenvektor und eine 1×2-Matrix einen 2-Zeilenvektor.Wennwirx =(x 1 ,x 2 ) schreiben, dann kann x als 1×2-Matrix oder 2-Zeilenvektor betrachtetwerden. In Matrixschreibweise ist es jedoch natürlich, x =(x 1 ,x 2 )als 2-Spaltenvektor zu betrachten.Der Ausdruck (20.37) definiert das Produkt einer 2 × 2-Matrix mit einer2 × 1-Matrix bzw. einem 2-Spaltenvektor. Das Produkt kann auch als(a11 a 12a 21a 22)(x1x 2)=(c1 · xc 2 · x)(20.38)interpretiert werden, wobei wir c 1 =(a 11 ,a 12 ) und c 2 =(a 21 ,a 22 ) als zweigeordnete Paare sehen können, die den beiden Zeilen der Matrix entsprechenund x ist das geordnete Paar (x 1 ,x 2 ). Dabei bilden wir das Skalarproduktder geordneten Paare c 1 und c 2 , die den 2-Zeilenvektoren der Matrix ( )x1entsprechen, mit dem geordneten Paar, das dem 2-Spaltenvektor x =x 2entspricht.


20.37 Erste Anwendungen der Matrixschreibweise 327Indem wirA =( )a11 a 12a 21 a 22und x =(x1x 2)und b =(b1b 2)(20.39)schreiben, können wir das Gleichungssystem (20.36) in komprimierter Formin der folgenden Matrixgleichung schreiben:Ax = b,oder( )( )a11 a 12 x1=a 22 x 2a 21(b1b 2).Wir haben jetzt einen ersten Eindruck von Matrizen erhalten, inklusiveder grundlegenden Operation der Multiplikation einer 2 × 2-Matrix miteiner 2 × 1-Matrix bzw. einem 2-Spaltenvektor. Unten werden wir die Rechenmethodenfür Matrizen verallgemeinern auf Additionen von Matrizen,Multiplikationen von Matrizen mit einer reellen Zahl und der Multiplikationvon Matrizen mitein<strong>and</strong>er. Wir werden auch eine Art der Matrixdivisionentdecken, die wir Inversion von Matrizen nennen, die es uns ermöglicht,die Lösung eines Systems Ax = b als x = A −1 b zu formulieren, unterder Bedingung, dass die Spalten (oder äquivalent die Zeilen) von A linearunabhängig sind.20.37 Erste Anwendungen der MatrixschreibweiseUm die Nützlichkeit der eben eingeführten Matrixschreibweise zu zeigen,wollen wir einige der linearen Gleichungssysteme und Abbildungen umschreiben,die wir oben kennengelernt haben.Drehung um θDie Abbildung R θ :R 2 →R 2 , die eine Drehung eines Vektors x um denWinkel θ beschreibt, wird durch (20.14) gegeben, d.h.R θ (x)=(x 1 cos(θ) − x 2 sin(θ),x 1 sin(θ)+x 2 cos(θ)). (20.40)Mit Hilfe der Matrixschreibweise können wir R θ (x), wie folgt, schreiben:( cos(θ) − sin(θ)R θ (x)=Ax =sin(θ) cos(θ))(x1x 2).Dabei ist A die 2 × 2-Matrix( )cos(θ) − sin(θ)A =. (20.41)sin(θ) cos(θ)


328 20. Analytische Geometrie in Ê 2Projektion auf einen Vektor aDie durch (20.9) gegebene Projektion P a (x)= x·a|a| 2 a eines Vektors x ∈R 2auf einen gegebenen Vektor a ∈R 2 kann in Matrixschreibweise, wie folgt,ausgedrückt werden:Dabei ist A die 2 × 2-Matrix( )( )a11 aP a (x)=Ax = 12 x1.a 22 x 2A =a 21( a2 )1 a 1a 2|a| 2 |a| 2a 1a 2 a 2|a| 2 2|a| 2. (20.42)BasiswechselDas lineare System (20.17), das einen Basiswechsel beschreibt, kann inMatrixschreibweise als) ( )( )(ˆx1 cos(θ) sin(θ) x1=ˆx 2 − sin(θ) cos(θ) x 2oder in kompakter Form als ˆx = Ax geschrieben werden, wobei x, ˆx 2-Spaltenvektoren sind und A die Matrix( )cos(θ) sin(θ)A =.− sin(θ) cos(θ)20.38 Addition von MatrizenSei A eine gegebene 2 × 2-Matrix mit den Elementen a ij , i,j =1, 2, d.h.A =( )a11 a 12.a 21 a 22Wir schreiben A =(a ij ). Sei B =(b ij )eineweitere2× 2-Matrix. Wir definierendie Summe C = A + B als die Matrix C =(c ij ) mit den Elementenc ij = a ij +b ij für i,j =1, 2. Anders formuliert, addieren wir zwei Matrizenelementweise:( ) ( ) ( )a11 aA + B = 12 b11 b+ 12 a11 + b= 11 a 12 + b 12= C.a 21 a 22 b 21 b 22 a 21 + b 21 a 22 + b 22


20.39 Multiplikation einer Matrix mit einer reellen Zahl 32920.39 Multiplikation einer Matrixmit einer reellen ZahlSei A eine 2 × 2-Matrix mit den Elementen a ij , i,j =1, 2 und λ eine reelleZahl. Wir definieren die Matrix C = λA durch die Elemente c ij = λa ij .Anders ausgedrückt, werden alle Elemente a ij mit λ multipliziert:λA = λ( )a11 a 12=a 21 a 22( )λa11 λa 12= C.λa 21 λa 2220.40 Multiplikation zweier MatrizenSeien A =(a ij ) und B =(b ij )zwei2× 2-Matrizen. Wir definieren dasProdukt C = AB durch die Elemente c ij mitc ij =2∑a ik b kj .k=1Wenn wir die Summe ausschreiben, erhalten wir( )( )a11 aAB = 12 b11 b 12a 21 a 22 b 21 b 22( )a11 b= 11 + a 12 b 21 a 11 b 12 + a 12 b 22= C.a 21 b 11 + a 22 b 21 a 21 b 12 + a 22 b 22Anders formuliert, erhalten wir das Element c ij des Produktes C = AB,indem wir das Skalarprodukt der Zeile i von A mit der Spalte j von Bbilden.Im Allgemeinen ist das Matrixprodukt nicht kommutativ, so dass meistAB ≠ BA.Wir sagen, dass beim Produkt AB die Matrix A von rechts mit derMatrix B multipliziert wird und dass B von links mit der Matrix A multipliziertwird. Nicht-Kommutativität der Matrixmultiplikation bedeutet,dass Multiplikation von rechts oder links unterschiedliche Ergebnisse liefernkann.Beispiel 20.17. Wir haben( )( ) ( )1 2 1 3 3 5= , wohingegen1 1 1 1 2 4( )( )1 3 1 2=1 1 1 1( )4 5.2 3Beispiel 20.18. Wir berechnen BB = B 2 ,wobeiB die Projektionsmatrixaus (20.42) ist, d.h.B =( a21)a 1a 2|a| 2 |a| 2a 1a 2 a 2|a| 2 2|a| 2= 1 ( ) a21 a 1 a 2|a| 2 a 1 a 2 a 2 .2


330 20. Analytische Geometrie in Ê 2Wir erhaltenBB = 1 ( )( )a21 a 1 a 2 a21 a 1 a 2|a| 4 a 1 a 2 a 2 2 a 1 a 2 a 2 2= 1 ( a21 (a 2 1 + a2 2 ) a 1a 2 (a 2 1 + a2 2 ) )|a| 4 a 1 a 2 (a 2 1 + a2 2 ) a2 2 (a2 1 + a2 2 ) = 1 ( ) a21 a 1 a 2|a| 2 a 1 a 2 a 2 2woran wir, wie erwartet, sehen, dass BB = B.= B,Beispiel 20.19. Als weitere Anwendung wollen wir das Produkt zweierMatrizen, die Drehungen um die Winkel α und β repräsentieren, berechnen:( ) ( )cos(α) − sin(α)cos(β) − sin(β)A =und B =. (20.43)sin(α) cos(α)sin(β) cos(β)Wir berechnen( )( )cos(α) − sin(α) cos(β) − sin(β)AB =sin(α) cos(α) sin(β) cos(β)( )cos(α)cos(β) − sin(α)sin(β) − cos(α)sin(β) − sin(α)cos(β)cos(α)sin(β)+sin(α)cos(β) cos(α)cos(β) − sin(α)sin(β)( )cos(α + β) − sin(α + β)=,sin(α + β) cos(α + β)wobei wir wieder die Formeln für cos(α + β) (8.4) und sin(α + β) (8.5)benutzt haben. Wir folgern, dass, wie erwartet, zwei aufein<strong>and</strong>er folgendeDrehungen um die Winkel α und β einer Drehung um den Winkel α + βentspricht.20.41 Die Transponierte einer MatrixSei A eine 2 × 2-Matrix mit den Elementen a ij . Wir definieren die Transponiertevon A, geschrieben A ⊤ , als Matrix C = A ⊤ mit den Elementenc 11 = a 11 , c 12 = a 21 , c 21 = a 12 , c 22 = a 22 . Anders ausgedrückt, die Zeilenvon A sind die Spalten von A ⊤ und umgekehrt. Beispielsweise:Ist A =( 1 23 4)dann A ⊤ =( 1 32 4Natürlich ist (A ⊤ ) ⊤ = A. Zweimaliges Transponieren liefert die Ausgangsmatrix.Wir können die Gültigkeit für die folgenden Rechenregeln mit derTransponierten sofort erkennen:(A + B) ⊤ = A ⊤ + B ⊤ , (λA) ⊤ = λA ⊤ ,(AB) ⊤ = B ⊤ A ⊤ .).


20.42 Die Transponierte eines 2-Spaltenvektors 33120.42 Die Transponierte eines 2-SpaltenvektorsDie Transponierte eines 2-Spaltenvektors ist der 2-Zeilenvektor mit denselbenElementen:( )x1Ist x = , dann xx ⊤ = ( )x 1 x 2 .2Wir können das Produkt einer 1 × 2-Matrix (2-Zeilenvektor) x ⊤ mit einer2 × 1-Matrix (2-Spaltenvektor) y, wie folgt, definieren:x ⊤ y = ( ) ( )yx 1 x 12 = xy 1 y 1 + x 2 y 2 .2Insbesondere können wir|x| 2 = x · x = x ⊤ xschreiben, wobei wir x als ein geordnetes Paar und als einen 2-Spaltenvektorinterpretieren.20.43 Die EinheitsmatrixDie 2 × 2-Matrix ( ) 1 00 1wird Einheitsmatrix genannt und mit I geschrieben. Es gilt IA = A undAI = A für jede 2 × 2-Matrix A.20.44 Die Inverse einer MatrixSei A eine 2 × 2-Matrix mit Elementen a ij und a 11 a 22 − a 12 a 21 ≠0.Wirdefinieren die inverse Matrix A −1 durch( )A −1 1 a22 −a=12. (20.44)a 11 a 22 − a 12 a 21 −a 21 a 11Die direkte Berechnung liefert A −1 A = I und AA −1 = I. DiesisteineEigenschaft, die wir von einer ”Inversen“ erwarten. Wir erhalten die ersteSpalte von A −1 mit Hilfe der Formel (20.31) mit b =(1, 0) und die zweiteSpalte mit der Wahl b =(0, 1).Die Lösung des Gleichungssystems Ax = b kann als x = A −1 b geschriebenwerden, was wir durch Multiplikation von Ax = b von links mit A −1erhalten.


332 20. Analytische Geometrie in Ê 2Wir können die Gültigkeit der folgenden Rechenregeln für die Inversesofort überprüfen:(λA) −1 = λ −1 A −1(AB) −1 = B −1 A −1 .20.45 Nochmals Drehung in Matrixschreibweise!Wir haben gesehen, dass die Drehung eines Vektors x um den Winkel θin den Vektor y durch y = R θ x geschrieben werden kann, wobei R θ dieRotationsmatrix ( )cos(θ) − sin(θ)R θ =(20.45)sin(θ) cos(θ)ist. Wir haben auch gesehen, dass zwei aufein<strong>and</strong>er folgende Drehungenum die Winkel α und β in der Formy = R β R α x (20.46)geschrieben werden können, wobei R β R α = R α+β . Dadurch wird die offensichtlicheTatsache formuliert, dass zwei aufein<strong>and</strong>er folgende Drehungenum α und β in einer einzigen Drehung um den Winkel α+β erreicht werdenkönnen.Wir berechnen nun mit Hilfe von (20.44) die Inverse R −1 der DrehungR θ :R −1θ=(1 cos(θ)cos(θ) 2 +sin(θ) 2 − sin(θ)) ( )sin(θ) cos(−θ) − sin(−θ)=,cos(θ) sin(−θ) cos(−θ)θ(20.47)wobei wir cos(α) =cos(−α) und sin(α) =− sin(−α) ausnutzen. Wir erkennen,dass R −1θ= R −θ . Damit haben wir die (offensichtliche) Tatsacheausgedrückt, dass die Inverse einer Drehung um θ eine Drehung um −θ ist.Wir beobachten, dass R −1θ= Rθ ⊤,wobeiR⊤ θ die Transponierte zu R θ ist,so dass insbesondereR θ Rθ ⊤ = I. (20.48)Wir benutzen dies für den Beweis, dass die Länge eines Vektors bei einerDrehung nicht verändert wird. Ist nämlich y = R θ x,dannauch|y| 2 = y ⊤ y =(R θ x) ⊤ (R θ x)=x ⊤ R ⊤ θ R θx = x ⊤ x = |x| 2 . (20.49)Ganz allgemein wird das Skalarprodukt bei einer Drehung erhalten. Isty = R θ x und ŷ = R θˆx, dann gilty · ŷ =(R θ x) ⊤ (R θˆx)=x ⊤ R ⊤ θ R θˆx = x · ˆx. (20.50)Die Gleichung (20.48) besagt, dass die Matrix R θ orthogonal ist. OrthogonaleMatrizen spielen eine wichtige Rolle und wir werden zu diesem Themaunten zurückkommen.


20.46 Eine Spiegelung in Matrixschreibweise 33320.46 Eine Spiegelung in MatrixschreibweiseWir betrachten die lineare Abbildung 2P −I,wobeiPx= a·x|a|a die Projektionauf den von Null verschiedenen Vektor a ∈R 2 ist, d.h. auf die Gerade2x = sa, die durch den Ursprung verläuft. Diese kann in Matrixschreibweise,wie folgt, formuliert werden:2P − I = 1|a| 2 ( a21 − a 2 2 2a 1 a 22a 2 a 1 a 2 2 − a2 1Nach einiger Überlegung(!), mit Hilfe von Abb. 20.28, verstehen wir, dassdie Abbildung I +2(P − I) =2P − I den Punkt x in sein Spiegelbildzur Geraden durch den Ursprung mit Richtung a abbildet. Wir erkennen,).xPx−xaAbb. 20.28. Die Abbildung 2P − I bildet Punkte in ihr Spiegelbild relativ zureingezeichneten Gerade abdass 2P − I das Skalarprodukt erhält, wenn wir von y =(2P − I)x undŷ =(2P − I)ˆx ausgehen und berechnen:y · ŷ = ((2P − I)x) ⊤ (2P − I)ˆx = x ⊤ (2P ⊤ − I)(2P − I)ˆx =x ⊤ (4P ⊤ P − 2P ⊤ I − 2PI+ I)ˆx = x ⊤ (4P − 4P + I)ˆx = x · ˆx, (20.51)wobei wir ausnutzten, dass P = P ⊤ und P 2 = P.20.47 Nochmals Basiswechsel!Seien {a 1 ,a 2 } und {â 1 , â 2 } zwei verschiedene Basen inR 2 .Wirkönnenjedes b ∈R 2 alsb = x 1 a 1 + x 2 a 2 =ˆx 1 â 1 +ˆx 2 â 2 (20.52)ausdrücken mit Koordinaten (x 1 ,x 2 ) in Bezug auf {a 1 ,a 2 } und <strong>and</strong>erenKoordinaten (ˆx 1 , ˆx 2 )bzgl.{â 1 , â 2 }.


334 20. Analytische Geometrie in Ê 2x 2b ba 2b 2a 1b 2ˆb1 ˆb1x 1â 2â 1Abb. 20.29. Ein Vektor b kann mit Hilfe der Basis {a 1,a 2} oder der Basis{â 1, â 2} ausgedrückt werdenUm eine Verbindung zwischen (x 1 ,x 2 ) und (ˆx 1 , ˆx 2 ) herzustellen, formulierenwir die Basisvektoren {â 1 , â 2 } in der Basis {a 1 ,a 2 }:c 11 a 1 + c 21 a 2 =â 1 ,c 12 a 1 + c 22 a 2 =â 2 ,mit bestimmten Koeffizienten c ij . Einsetzen in (20.52) liefertNach Umsortieren:ˆx 1 (c 11 a 1 + c 21 a 2 )+ˆx 2 (c 12 a 1 + c 22 a 2 )=b.(c 11ˆx 1 + c 12ˆx 2 )a 1 +(c 21ˆx 1 + c 22ˆx 2 )a 2 = b.Wir folgern aufgrund der Eindeutigkeit, dassx 1 = c 11ˆx 1 + c 12ˆx 2 ,x 2 = c 21ˆx 1 + c 22ˆx 2 .Wir erhalten so eine Verbindung zwischen den Koordinaten (x 1 ,x 2 ) und(ˆx 1 , ˆx 2 ), die wir in Matrixschreibweise als x = Cˆx schreiben können, mit( )c11 cC = 12.c 21 c 2220.48 Königin ChristinaKönigin Christina von Schweden (1626–1689), Tochter von König GustafVasa von Schweden (1611–1632), wurde im Alter von 5 Jahren zur Königingekrönt. Die offizielle Krönung f<strong>and</strong> 1644 statt. Sie dankte 1652 ab,konvertierte zum katholischen Glauben und zog 1655 nach Rom.


20.48 Königin Christina 335Während ihres gesamten Lebens hatte Christina eine Passion für Künsteund für das Lernen und sie umgab sich mit Musikern, Schriftstellern, Künstlern,aber auch Philosophen, Theologen, Wissenschaftlern und <strong>Mathematik</strong>ern.Christina besaß eine eindrucksvolle Skulpturen- und Gemäldesammlungund war für ihren Kunst- wie Literaturgeschmack hoch geachtet. Sieschrieb auch mehrere Bücher, u.a. die Briefe an Descartes und Maxims.Ihr Zuhause, der Palast Farnese, war über mehrere Dekaden das aktivekulturelle und intellektuelle Zentrum in Rom.Duc de Guise, zitiert in Georgina Massons Biographie über Königin Christina,beschreibt Königin Christina folgendermaßen: ”Sie ist nicht schlank,sondern hat eine wohl gefüllte Figur und einen großen Hintern, schöne Arme,weiße Hände. Eine Schulter ist höher als die <strong>and</strong>ere, aber sie verstecktdiesen Mangel ausgezeichnet hinter ihrer bizarren Kleidung, Gang und Bewegungen... . Die Form ihres Gesichts ist mittelmäßig, aber eingerahmtvon einer besonders außergewöhnlichen Frisur. Es ist eine Männerperücke,sehr schwer und vorne hoch gesteckt, dick hängend an den Seiten und hintenmit einer leichten Ähnlichkeit an eine Frauenfrisur.. . . Sie trägt stetseine Menge Gesichtscreme und ist darüber sehr dick gepudert“.Abb. 20.30. Königin Christina zu Descartes: ”Wenn wir uns die Welt in derriesigen Ausdehnung vorstellen, die Sie ihr geben, dann ist es unmöglich, dassein Mensch sich darin seinen ehrwürdigen St<strong>and</strong> erhält. Vielmehr wird er sichzusammen mit der ganzen Erde, die er bewohnt, nur als etwas Kleines, Winzigesvorkommen, das in keinem Verhältnis zur enormen Größe des Universums steht.Er wird wahrscheinlich annehmen, dass diese Sterne Bewohner haben oder sogar,dass die Welten, die sie umkreisen, von Kreaturen bevölkert sind, die intelligenterund besser sind als er. Sicherlich wird er nicht zur Ansicht kommen, dass diesesunendliche Ausmaß der Welt für ihn gemacht sei oder ihm in irgendeiner Weisedienen kann“


336 20. Analytische Geometrie in Ê 2Aufgaben zu Kapitel 2020.1. Gegeben seien die Vektoren a,b und c in Ê 2 und die Skalare λ,µ ∈ Ê.Beweisen Sie die folgenden Aussagen:a + b = b + a, (a + b)+c = a +(b + c), a+(−a)=0a +0=a, 3a = a + a + a, λ(µa)=(λµ)a,(λ + µ)a = λa + µa, λ(a + b)=λa + λb, |λa| = |λ||a|.Versuchen Sie sowohl einen analytischen als auch einen geometrischen Beweis.20.2. Finden Sie eine Formel für die Abbildung f : Ê 2 → Ê 2 , die eine Reflektionan der Richtung eines gegebenen Vektors a ∈ Ê 2 beschreibt und formulieren Siedie zugehörige Matrix.20.3. Seien a =(3,2) und b =(1,4) gegeben. Berechnen Sie (i) |a|, (ii) |b|, (iii)|a + b|, (iv)|a − b|, (v)a/|a| und (vi) b/|b|.20.4. Zeigen Sie, dass die Norm von a/|a| für |a| ∈Ê 2 , a ≠0gleich1ist.20.5. Seien a,b ∈ Ê 2 gegeben. Beweisen Sie die folgenden Ungleichungen:(i) |a + b| ≤|a| + |b|, (ii) a · b ≤|a||b|.20.6. Berechnen Sie a · b für(i) a =(1, 2),b=(3, 2)(ii) a =(10, 27),b=(14, −5).20.7. Seien a,b,c ∈ Ê 2 gegeben. Bestimmen Sie, welche der folgenden Aussagensinnvoll sind: (i) a · b, (ii) a · (b · c), (iii) (a · b)+|c|, (iv)(a · b)+c und (v) |a · b|.20.8. Welchen Winkel schließen a =(1,1) und b =(3,7) ein?20.9. Finden Sie zu b =(2, 1) die Menge aller Vektoren a ∈ Ê 2 ,sodassa ·b =2.Geben Sie eine geometrische Deutung des Ergebnisses.20.10. Finden Sie die Projektion von a auf b =(1, 2) für (i) a =(1, 2),(ii) a =(−2,1), (iii) a =(2,2) und (iv) a =( √ 2, √ 2).20.11. Zerlegen Sie den Vektor b =(3,5) in eine Komponente parallel zu a undeine Komponente orthogonal zu a für alle Vektoren a aus der vorherigen Übung.20.12. Seien a,b und c = a − b in Ê 2 gegeben, wobei a und b den Winkel ϕeinschließen. Zeigen Sie:Interpretieren Sie das Ergebnis.|c| 2 = |a| 2 + |b| 2 − 2|a||b| cos ϕ.20.13. Beweisen Sie das Kosinusgesetz für ein Dreieck mit Seitenlängen a,b, c:c 2 = a 2 + b 2 − 2abcos(θ),wobei θ der Winkel zwischen den Seiten a und b ist.


Aufgaben zu Kapitel 20 33720.14. Berechnen Sie Ax und A ⊤ x für die 2 × 2-Matrix 1 2A =3 4für die folgenden x ∈ Ê 2 :(i) x ⊤ =(1, 2) (ii) x ⊤ =(1,1).20.15. Gegeben seien die 2 × 2-Matrizen 1 2A =3 4,B= 5 67 8Berechnen Sie (i) AB, (ii) BA, (iii) A T B,(iv)AB T ,(v)B T A T ,(vi)(AB) T , (vii)A −1 , (viii) B −1 ,(ix)(AB) −1 ,(x)A −1 A.20.16. Beweisen Sie, dass (AB) T = B T A T und dass (Ax) T = x T A T .20.17. Was lässt sich über A sagen, wenn: (i) A = A T (ii) AB = I?20.18. Zeigen Sie, dass die ProjektionP a(b)= b · a|a| 2 ain der Form Pb geschrieben werden kann, wobei P eine 2 × 2-Matrix ist. ZeigenSie, dass PP = P und P = P ⊤ .20.19. Berechnen Sie das Spiegelbild eines Punktes bzgl. einer Geraden in Ê 2 ,die nicht durch den Ursprung verläuft. Formulieren Sie die Abbildung in Matrixschreibweise.20.20. Formulieren Sie die lineare Abbildung einer Drehung eines Vektors umeinen bestimmten Winkel als Matrix Vektor Produkt.20.21. Seien a,b ∈ Ê 2 gegeben. Zeigen Sie, dass der ”Spiegelvektor“ ¯b, der durchReflektion von b an a entsteht, als¯b =2Pb− bausgedrückt werden kann, wobei P eine bestimmte Projektion ist. Zeigen Sie,dass das Skalarprodukt zwischen zwei Vektoren invariant unter einer Reflektionist, d.h. dassc · d =¯c · ¯d.20.22. Berechnen Sie a × b und b × a für (i) a =(1, 2),b =(3,2), (ii) a =(1,2),b=(3,6) und (iii) a =(2, −1),b=(2,4).20.23. Erweitern Sie die MATLAB Funktionen für Vektoren in Ê 2 um eineFunktion für das Vektorprodukt (x = vecProd(a, b)) und Drehung (b = vecRotate(a,Winkel)) von Vektoren..


338 20. Analytische Geometrie in Ê 220.24. Überprüfen Sie die Ergebnisse aus der vorherigen Übung mit MATLAB .20.25. Zeigen Sie, dass die Projektion Px = P a(x) linear in x ist. Ist sie auchlinear in a? Veranschaulichen Sie, wie in Abb. 20.17, dass P a(x + y)=P a(x)+P a(y).20.26. Zeigen Sie, dass Formel (20.28) für die Projektion eines Punktes auf eineGerade durch den Ursprung mit (20.9) für die Projektion eines Vektors b auf dieRichtung der Geraden übereinstimmt.20.27. Zeigen Sie, dass für â = λa,wobeia ein von Null verschiedener Vektor inÊ 2 ist und λ ≠0,für jedes b ∈ Ê 2 gilt: Pâ(b)=P a(b), wobei P a(b)dieProjektionvon b auf a ist. Folgern Sie, dass die Projektion auf einen von Null verschiedenenVektor a ∈ Ê 2 nur von der Richtung und nicht von der Norm von a abhängt.


21Analytische Geometrie inR 3Wir müssen in aller Bescheidenheit zugeben, dass, während die Zahlenallein ein Produkt unseres Geistes sind, der Raum jenseits desGeistes eine Realität hat, dessen Regeln wir nicht vollständig vorgebenkönnen. (Gauss 1830)Man kann nicht umhin, jem<strong>and</strong>en zu respektieren, der DIENSTAGbuchstabieren kann, sogar dann nicht, wenn er es nicht richtig buchstabiert.(Das Haus an der Pu-Ecke, Milne)21.1 EinleitungWir dehnen die Diskussion analytischer Geometrie auf den euklidischendreidimensionalen Raum oder in Kurzform den euklidischen 3D Raum aus.Wir stellen uns vor, dass dieser Raum entsteht, wenn wir eine Normaledurch den Ursprung einer euklidischen zweidimensionalen Ebene, die durchorthogonale x 1 - und x 2 -Achsen aufgespannt wird, zeichnen. Diese Normalenennen wir x 3 -Achse. Dadurch erhalten wir ein orthogonales Koordinatensystem,das aus drei Achsen x 1 , x 2 und x 3 besteht, die sich im Ursprungschneiden, wobei jede Achse eine Kopie vonRist, vgl. Abb. 21.1.In unserem täglichen Leben können wir uns ein Zimmer als ein Teil desR 3 vorstellen, wobei der waagerechte Boden ein Stück vonR 2 ist, mit denbeiden Koordinaten (x 1 ,x 2 ) und mit der vertikalen Richtung als dritteKoordinate x 3 . Auf einer größeren Skala können wir uns unsere Umgebungin den drei orthogonalen Richtungen West-Ost, Süd-Nord und Unten-Oben


340 21. Analytische Geometrie in Ê 3x 3 x 3(a 1,a 2,a 3)(a 1,a 2,a 3)x 2 x 2x 1 x 1Abb. 21.1. Koordinatensystem für den Ê 3vorstellen, wiederum als ein Ausschnitt desR 3 ,wennwirdieErdkrümmungvernachlässigen.Das Koordinatensystem kann mit rechts- oder links-Orientierung aufgestelltwerden. Das Koordinatensystem heißt rechts-orientiert, dies ist derNormalfall, wenn das Eindrehen einer normalen Schraube in Richtung derpositiven x 3 -Achse die x 1 -Achse auf dem kürzesten Weg in die x 2 -Achseüberführt, vgl. Abb. 21.2. Alternativ können wir uns die ausgestreckte rechteH<strong>and</strong> entlang der x 1 -Achse denken, so dass die Finger in Richtung derpositiven x 2 -Achse zeigen, wenn wir sie nach innen beugen. Zeigt dann derausgestreckte Daumen in Richtung der positiven x 3 -Achse, liegt rechts-Orientierung vor.x 3x 2x 1x 1 x 3x 1x 2x 2 x 3Abb. 21.2. Zwei ”rechte“ Koordinatensysteme und ein ”linkes“. Dabei wird dievertikale Achse nach oben positiv angenommen, d.h. die horizontale Ebene wirdvon oben betrachtet. Was passiert, wenn die vertikale Achse nach oben negativangenommen wird?Nachdem wir ein rechts-orientiertes Koordinatensystem gewählt haben,können wir jedem Punkt a drei Koordinaten (a 1 ,a 2 ,a 3 ) nach denselbenRegeln wie bei der euklidischen Ebene zuweisen, vgl. Abb. 21.1. Auf dieseArt können wir den euklidischen 3D Raum als die Menge aller geordneter3-Tupel a =(a 1 ,a 2 ,a 3 )repräsentieren, mit a i ∈Rfür i =1, 2, 3oder


21.2 Vektoraddition und Multiplikation mit einem Skalar 341alsR 3 .Natürlich können wir verschiedene Koordinatensysteme mit unterschiedlichemUrsprung, Koordinatenrichtungen oder Skalierungen der Koordinatenachsenwählen. Unten werden wir auf den Wechsel von einem zueinem <strong>and</strong>eren Koordinatensystem zurückkommen.21.2 Vektoraddition und Multiplikationmit einem SkalarDie meisten Begriffe und die Schreibweise der analytischen Geometrie in dereuklidischen Ebene, repräsentiert durchR 2 ,lässt sich auf den euklidischen3D Raum, der durchR 3 repräsentiert wird, erweitern.Insbesondere können wir einen geordneten 3-Tupel a =(a 1 ,a 2 ,a 3 )entwederals Punkt im dreidimensionalen Raum mit den Koordinaten a 1 , a 2und a 3 betrachten oder als Vektor/Pfeil mit Ende im Ursprung und Kopfim Punkt (a 1 ,a 2 ,a 3 ), vgl. Abb. 21.1.Wir definieren die Summe a + b zweier Vektoren a =(a 1 ,a 2 ,a 3 ) undb =(b 1 ,b 2 ,b 3 )inR 3 durch die komponentenweise Additiona + b =(a 1 + b 1 ,a 2 + b 2 ,a 3 + b 3 )und die Multiplikation eines Vektors a =(a 1 ,a 2 ,a 3 ) mit einer reellen Zahlλ durchλa=(λa 1 ,λa 2 ,λa 3 ).Der Nullvektor ist der Vektor 0 = (0, 0, 0). Ebenso schreiben wir −a =(−1)a und a − b = a +(−1)b. Die geometrische Interpretation dieser Definitionist analog zu der inR 2 . So sind beispielsweise zwei von Null verschiedeneVektoren a und b inR 3 parallel, wenn b = λa für eine von Nullverschiedene reelle Zahl λ gilt. Die üblichen Regeln gelten und die Vektoradditionist kommutativ, a+b = b+a und assoziativ,(a+b)+c = a+(b+c).Ferner gilt λ(a+b)=λa+λb und κ(λa)=(κλ)a für Vektoren a und b undreelle Zahlen λ und κ.Die Einheitsbasisvektoren imR 3 sind e 1 =(1, 0, 0), e 2 =(0, 1, 0) unde 3 =(0, 0, 1).21.3 Skalarprodukt und NormDas normale Skalarprodukt a · b zweier Vektoren a =(a 1 ,a 2 ,a 3 ) und b =(b 1 ,b 2 ,b 3 )inR 3 wird durcha · b =3∑a i b i = a 1 b 1 + a 2 b 2 + a 3 b 3 (21.1)i=1


342 21. Analytische Geometrie in Ê 3definiert. Das Skalarprodukt inR 3 hat dieselben Eigenschaften wie seinVetter inR 2 , d.h. es ist bilinear, symmetrisch und positiv definit und wirnennen zwei Vektoren a und b orthogonal, wenna · b =0.Die euklidische Länge oder Norm |a| eines Vektors a =(a 1 ,a 2 ,a 3 )wirddefiniert durch( 3∑)12|a| =(a · a) 1 2 = a 2 i . (21.2)i=1Dadurch wird der Satz von Pythagoras in 3D ausgedrückt und wir erhaltenihn, indem wir den üblichen 2D Satz von Pythagoras zweimal anwenden.Der Abst<strong>and</strong> |a − b| zwischen zwei Punkten a =(a 1 ,a 2 ,a 3 ) undb =(b 1 ,b 2 ,b 3 )ist( 3∑) 1/2|a − b| = (a i − b i ) 2 .i=1Die Cauchysche Ungleichung besagt, dass für zwei Vektoren a und b inR 3|a · b|≤|a||b| (21.3)gilt. Wir beweisen die Cauchysche Ungleichung unten im Kapitel ”AnalytischeGeometrie inR n “. Wir stellen fest, dass die Cauchysche UngleichungimR 2 direkt daraus folgt, dass a · b = |a||b| cos(θ), wobei θ der Winkelzwischen a und b ist.21.4 Projektion eines Vektors auf einen VektorSei a ein von Null verschiedener Vektor inR 3 . Wir definieren die ProjektionPb= P a (b) einesVektorsb inR 3 auf den Vektor a durch die FormelPb= P a (b)= a · ba · a a = a · b a. (21.4)|a|2Dies ist eine direkte Verallgemeinerung der entsprechenden Formel imR 2 ,die darauf beruht, dass Pb parallel zu a und b − Pb orthogonal zu a ist,vgl. Abb. 21.3, d.h.Pb= λa für ein λ ∈R und (b − Pb) · a =0.Daraus erhalten wir die Formel (21.4) mit λ = a·b|a|. 2Die Abbildung P :R 3 →R 3 ist linear, d.h. für jedes b und c ∈R 3 undλ ∈R giltP(b + c)=Pb+ Pc, P(λb)=λPb,und PP = P.


21.5 Der Winkel zwischen zwei Vektoren 343x 3x 3bbθPb θx 2 x 2Pbx 1 ax 1aAbb. 21.3. Projektion Pb eines Vektors b auf einen Vektor a21.5 Der Winkel zwischen zwei VektorenWir definieren den Winkel θ zwischen zwei von Null verschiedenen Vektorena und b inR 3 durchcos(θ)= a · b|a||b| , (21.5)wobei wir annehmen, dass 0 ≤ θ ≤ 180 ◦ . Da nach der Cauchyschen Ungleichung(21.3) |a · b|≤|a||b|, gibt es einen Winkel θ, der (21.5) genügt undder eindeutig definiert ist, wenn wir zusätzlich 0 ≤ θ ≤ 180 ◦ fordern. Wirkönnen (21.5) auch in der Forma · b = |a||b| cos(θ) (21.6)schreiben, wobei θ der Winkel zwischen a und b ist. Offensichtlich werdendadurch die entsprechenden Ergebnisse aus demR 2 erweitert.Wir definieren den Winkel zwischen zwei Vektoren a und b über das Skalarprodukta · b in (21.5), was sich als algebraische Definition betrachtenlässt. Natürlich hätten wir es gerne, wenn diese Definition mit der üblichengeometrischen Definition übereinstimmt. Liegen a und b in der x 1 − x 2 -Ebene, dann wissen wir aus Kapitel ”Analytische Geometrie inR 2 “, dassdie beiden Definitionen übereinstimmen. Wir werden unten sehen, dass dasSkalarprodukt a·b gegenüber Drehungen des Koordinatensystems invariantist (d.h. es verändert sich nicht), was bedeutet, dass wir für beliebige Vektorena und b das Koordinatensystem so drehen können, dass a und b in derx 1 − x 2 -Ebene liegen. Daraus folgern wir, dass die algebraische Definition(21.5) des Winkels zwischen zwei Vektoren mit der üblichen geometrischenDefinition übereinstimmt. Insbesondere sind zwei von Null verschiedeneVektoren dann und nur dann geometrisch orthogonal, in dem Sinne, dassder geometrische Winkel θ zwischen den Vektoren cos(θ)=0genügt, wenna · b = |a||b| cos(θ)=0.


344 21. Analytische Geometrie in Ê 321.6 VektorproduktJetzt definieren wir das Vektorprodukt a×b zweier Vektoren a =(a 1 ,a 2 ,a 3 )und b =(b 1 ,b 2 ,b 3 )inR 3 durch die Formela × b =(a 2 b 3 − a 3 b 2 ,a 3 b 1 − a 1 b 3 ,a 1 b 2 − a 2 b 1 ). (21.7)Wir stellen fest, dass das Vektorprodukt a × b zweier Vektoren a und b inR 3 wieder ein Vektor inR 3 ist. Anders formuliert, ist f(a,b) =a × b mitf :R 3 →R 3 . Wir nennen das Vektorprodukt wegen seiner Schreibweiseauch Kreuzprodukt.Beispiel 21.1. Ist a =(3, 2, 1) und b =(4, 5, 6), dann ist a×b =(12−5, 4−18, 15 − 8) = (7, −14, 7).Daneben gibt es auch noch das triviale komponentenweise ”Vektorprodukt“,das über (in MATLAB Schreibweise) a∗b =(a1 b 1 ,a 2 b 2 ,a 3 b 3 )definiertist. Das oben definierte Vektorprodukt ist jedoch etwas ganz <strong>and</strong>eres!Die Formel für das Vektorprodukt mag etwas seltsam (und kompliziert)aussehen und wir werden nun sehen, wie es entsteht. Wir beginnen mit derFeststellung, dass der Ausdruck a 1 b 2 − a 2 b 1 in (21.7) dem Vektorproduktzweier Vektoren (a 1 ,a 2 ) und (b 1 ,b 2 )inR 2 entspricht; somit haben wirwenigstens ein Muster.Wir können direkt überprüfen, ob das Vektorprodukt a × b sowohl in aals auch b linear ist:a × (b + c)=a × b + a × c, (a + b) × c = a × c + b × c,(λa) × b = λa× b, a × (λb)=λa× b,wobei die Produkte × vor einer <strong>and</strong>eren Operation berechnet werden, fallsdie Klammerung nicht etwas <strong>and</strong>eres vorgibt. Dies ergibt sich direkt daraus,dass die Komponenten von a × b linear von den Komponenten von a undb abhängen.Da das Vektorprodukt in a und b linear ist, nennen wir a × b bilinear.Wir sehen ferner, dass das Vektorprodukt a × b anti-symmetrisch ist, daa × b = − b × a. (21.9)Somit ist das Vektorprodukt a × b anti-symmetrisch und bilinear und außerdemkönnen wir feststellen, dass diese beiden Eigenschaften wie inR 2das Vektorprodukt bis auf eine Konstante festlegen.Für die Vektorprodukte der Basisvektoren e i erhalten wir (nachprüfen!)e i × e i =0,i=1, 2, 3,e 1 × e 2 = e 3 , e 2 × e 3 = e 1 , e 3 × e 1 = e 2 , (21.10)e 2 × e 1 = −e 3 , e 3 × e 2 = −e 1 , e 1 × e 3 = −e 2 .


21.7 Geometrische Interpretation des Vektorprodukts 345Wir sehen, dass e 1 × e 2 = e 3 sowohl zu e 1 als auch e 2 orthogonal ist.Ganz ähnlich ist e 2 × e 3 = e 1 sowohl zu e 2 als auch e 3 orthogonal unde 1 × e 3 = −e 2 ist sowohl zu e 1 als auch e 3 orthogonal.Dieses Muster lässt sich verallgemeinern. Tatsächlich ist der Vektor a×bfür beliebige von Null verschiedene Vektoren a und b orthogonal zu a undb,daa·(a×b)=a 1 (a 2 b 3 −a 3 b 2 )+a 2 (a 3 b 1 −a 1 b 3 )+a 3 (a 1 b 2 −a 2 b 1 )=0, (21.11)und ähnlich erhalten wir b · (a × b)=0.Wir können das Vektorprodukt zweier Vektoren a =(a 1 ,a 2 , a 3 ) undb =(b 1 ,b 2 ,b 3 ) mit Hilfe der Linearität und (21.10) wie folgt berechnen:a × b =(a 1 e 1 + a 2 e 2 + a 3 e 3 ) × (b 1 e 1 + b 2 e 2 + b 3 e 3 )= a 1 b 2 e 1 × e 2 + a 2 b 1 e 2 × e 1+ a 1 b 3 e 1 × e 3 + a 3 b 1 e 3 × e 1+ a 2 b 3 e 2 × e 3 + a 3 b 2 e 3 × e 2=(a 1 b 2 − a 2 b 1 )e 3 +(a 3 b 1 − a 1 b 3 )e 2 +(a 2 b 3 − a 3 b 2 )e 1=(a 2 b 3 − a 3 b 2 ,a 3 b 1 − a 1 b 3 ,a 1 b 2 − a 2 b 1 ).Dies stimmt mit (21.7) überein.21.7 Geometrische Interpretationdes VektorproduktsWir werden nun eine geometrische Interpretation des Vektorprodukts a×bzweier Vektoren a und b inR 3 geben.Dazu beginnen wir mit der Annahme, dass a =(a 1 ,a 2 , 0) und b =(b 1 ,b 2 , 0) zwei von Null verschiedene Vektoren in der x 1 -x 2 -Ebene sind.Der Vektor a × b =(0, 0,a 1 b 2 − a 2 b 1 ) ist offensichtlich zu a und b orthogonal.Mit Hilfe von (20.21) zum Vektorprodukt inR 2 wissen wir, dass|a × b| = |a||b|| sin(θ)|, (21.12)wobei θ der Winkel zwischen a und b ist.Wir wollen nun beweisen, dass sich dieses Ergebnis auf beliebige Vektorena =(a 1 ,a 2 ,a 3 ) und b =(b 1 ,b 2 ,b 3 )inR 3 verallgemeinern lässt. Zunächsteinmal wurde im vorherigen Abschnitt bewiesen, dass a×b sowohl zu a alsauch b orthogonal ist. Dann halten wir fest, dass wir durch Multiplikationder trigonometrischen Gleichung sin 2 (θ) =1− cos 2 (θ) mit|a| 2 |b| 2 unterZuhilfenahme von (21.6)|a| 2 |b| 2 sin 2 (θ)=|a| 2 |b| 2 − (a · b) 2 (21.13)


346 21. Analytische Geometrie in Ê 3erhalten. Schließlich liefert uns (eine etwas umständliche) Berechnung|a × b| 2 = |a| 2 |b| 2 − (a · b) 2 ,womit (21.12) bewiesen ist. Wir fassen dies im folgenden Satz zusammen.x 3|a×b| = V (a,b)=|a||b||sin(θ)|a×bbθax 1x 2Abb. 21.4. Geometrische Interpretation des VektorproduktsSatz 21.1 Das Vektorprodukt a×b zweier von Null verschiedener Vektorena und b inR 3 ist sowohl zu a als auch b orthogonal und |a×b| = |a||b|| sin(θ),wobei θ der Winkel zwischen a und b ist. Insbesondere sind a und b dannund nur dann parallel, wenn a × b =0.Wir können den Satz noch präzisieren, indem wir die folgende Regel fürdas Vorzeichen hinzufügen: Der Vektor a × b weist in die gleiche Richtungwie eine normale Schraube, die auf kürzestem Weg den Vektor a in denVektor b dreht.21.8 Zusammenhang zwischen denVektorprodukten inR 2 undR 3Wir stellen fest, dassa × b =(0, 0,a 1 b 2 − a 2 b 1 ) (21.14)für a =(a 1 ,a 2 , 0) und b =(b 1 ,b 2 , 0). Die zunächst präsentierte Formela × b = a 1 b 2 − a 2 b 1 für a =(a 1 ,a 2 ) und b =(b 1 ,b 2 )inR 2 kann daher alsKurzschreibweise für (21.14) gesehen werden, wobei a 1 b 2 − a 2 b 1 die dritteKoordinate von a × b inR 3 ist. Für die Vorzeichenregelungen inR 2 undR 3 halten wir fest, dass a 1 b 2 − a 2 b 1 ≥ 0, wenn eine Schraubendrehung inpositiver x 3 -Richtung a auf dem kürzesten Weg in b dreht. Dies entsprichteiner Drehung von a nach b gegen den Uhrzeigersinn und dass sin(θ) ≥ 0für den Winkel θ zwischen a und b gilt.


21.9 Volumen eines von drei Vektoren aufgespannten schiefen Würfels 34721.9 Volumen eines von drei Vektorenaufgespannten schiefen WürfelsBetrachten Sie den von drei Vektoren a, b und c aufgespannten schiefenWürfel in Abb. 21.5.x 3a×bcbθax 1x 2Abb. 21.5. Von drei Vektoren aufgespannter schiefer WürfelWir suchen nach einer Formel für das Volumen V (a,b,c) eines schiefenWürfels. Wir erinnern uns, dass das Volumen V (a,b,c) sich aus der vonden Vektoren a und b aufgespannten Grundfläche V (a,b) multipliziert mitder Höhe h ergibt. Diese erhalten wir als Projektion von c auf einen zurGrundfläche senkrechten Vektor. Da a × b zu a und b senkrecht ist, ergibtsich die Höhe h als Länge der Projektion von c auf a × b. Aus (21.12) und(21.4) wissen wir, dassV (a,b)=|a × b|,h=|c · (a × b)||a × b|und somitV (a,b,c)=|c · (a × b)|. (21.15)Natürlich können wir das Volumen auch berechnen, indem wir die Grundflächevon b und c aufspannen lassen, oder auch von a und c. Somit istV (a,b,c)=|a · (b × c)| = |b · (a × c)| = |c · (a × b)|. (21.16)Beispiel 21.2. Das Volumen V (a,b,c) des von a =(1, 2, 3), b =(3, 2, 1)und c =(1, 3, 2) aufgespannten schiefen Würfels ist a · (b × c) =(1, 2, 3) ·(1, −5, 7) = 12.


348 21. Analytische Geometrie in Ê 321.10 Das Dreifach-Produkt a · b × cDer Ausdruck a · (b × c) tritt in den Formeln (21.15) und (21.16) auf. Erwird Dreifach-Produkt der drei Vektoren a, b und c genannt. Üblicherweiseschreiben wir das Dreifach-Produkt ohne Klammern, da nach den Regelndas Vektorprodukt × zuerst berechnet wird. Tatsächlich macht eine alternativeInterpretation (a · b) × c gar keinen Sinn, da a · b ein Skalar ist unddas Vektorprodukt einen Vektor als Faktor braucht!Die folgenden Eigenschaften des Dreifach-Produkts lassen sich einfachdurch direkte Anwendung der Definitionen für das Skalarprodukt und dasVektorprodukt beweisen:a · b × c = c · a × b = b · c × a,a · b × c = −a · c × b = −b · a × c = −c · b × a.Wir merken uns diese Formeln folgendermaßen: Tauschen zwei Vektorenihre Plätze, so verändert sich das Vorzeichen. Werden alle drei Vektorenzyklisch vertauscht (beispielsweise a,b,c gegen c, a, b oder b,c,a), so bleibtdas Vorzeichen erhalten.Mit Hilfe des Dreifach-Produkts a · b × c können wir die geometrischeEigenschaft des Volumens V (a,b,c) eines von a, b und c aufgespanntenschiefen Würfels algebraisch exakt angeben:V (a,b,c)=|a · b × c|. (21.17)Wir werden diese Formel unten oft benutzen. Beachten Sie, dass wir späternoch mit Hilfe der Infinitesimalrechnung beweisen werden, dass das Volumeneines schiefen Würfels aus dem Produkt von Grundfläche und Höheberechnet wird.21.11 Eine Formel für das von drei Vektorenaufgespannte VolumenSeien a 1 =(a 11 ,a 12 ,a 13 ), a 2 =(a 21 ,a 22 ,a 23 ) und a 3 =(a 31 ,a 32 ,a 33 )dreiVektoren in R 3 .BeachtenSie,dassa 1 ein Vektor in R 3 ist, mit a 1 =(a 11 ,a 12 ,a 13 ), etc. Wir können eine 3 × 3 Matrix A =(a ij ) aufstellen,wobei die Zeilen den Koordinaten von a 1 , a 2 und a 3 entsprechen:⎛A = ⎝ a ⎞11 a 12 a 13a 21 a 22 a 23⎠ .a 31 a 32 a 33Wir werden unten auf 3 × 3 Matrizen zurückkommen. Hier benutzen wirdie Matrix nur, um die Koordinaten der Vektoren a 1 , a 2 und a 3 h<strong>and</strong>lichzu schreiben.


21.12 Geraden 349Wir geben eine explizite Formel für das von den drei Vektoren a 1 , a 2 unda 3 aufgespannte Volumen V (a 1 ,a 2 ,a 3 ) an. Beginnend bei (21.17) erhaltenwir durch direktes Ausrechnen±V (a 1 ,a 2 ,a 3 )=a 1 · a 2 × a 3= a 11 (a 22 a 33 − a 23 a 32 ) − a 12 (a 21 a 33 − a 23 a 31 )+ a 13 (a 21 a 32 − a 22 a 31 ).(21.18)Wir halten fest, dass V (a 1 ,a 2 ,a 3 ) eine Summe von Ausdrücken ist, die alleProdukte dreier Faktoren a ij a kl a mn sind, mit gewissen Indizes ij, kl undmn. Wenn wir die Indizes in jedem Ausdruck näher betrachten, erkennenwir, dass die Abfolge der Zeilenindizes ikm (ersten Indizes) stets {1, 2, 3}ist. Die Abfolge der Spaltenindizes jln (zweite Indizes) sind Permutationender Folge {1, 2, 3}, d.h. die Zahlen 1, 2 und 3 treten in irgendeiner Ordnungauf. Somit haben alle Ausdrücke die Forma 1j1 a 2j2 a 3j3 , (21.19)wobei {j 1 ,j 2 ,j 3 } eine Permutation von {1, 2, 3} ist. Das Vorzeichen derAusdrücke verändert sich mit der Permutation. Bei genauerem Hinsehenerkennen wir das folgende Muster: Können die Permutationen mit einergeraden Zahl von Umordnungen in die Reihung {1, 2, 3} gebracht werden,dann ist das Vorzeichen +. Dabei ist eine Umordnung ein Vertauschenzweier Indizes. Bei einer ungeraden Anzahl von Umordnungen ist das Vorzeichen−. So ist beispielsweise die Permutation der zweiten Indizes imAusdruck a 11 a 23 a 32 {1, 3, 2}, der eine ungerade Anzahl von Umordnungenbenötigt, um zurück zu {1, 2, 3} gebracht zu werden und folglich hatder Ausdruck ein negatives Vorzeichen. Als weiteres Beispiel ist die Permutationim Ausdruck a 12 a 23 a 31 {2, 3, 1}, die durch eine gerade Zahl vonUmordnungen, nämlich {2, 1, 3} und {1, 2, 3} geordnet werden kann.Wir haben nun eine Technik für die Berechnung von Volumina kennengelernt,die wir unten auf denR n verallgemeinern werden. Dies führt unszu Determinanten. Wir werden sehen, dass Formel (21.18) besagt, dass dasmit einem Vorzeichen versehene Volumen ±V (a 1 ,a 2 ,a 3 ) der Determinanteder 3 × 3MatrixA =(a ij )entspricht.21.12 GeradenSei a ein von Null verschiedener Vektor inR 3 und ˆx ein gegebener PunktinR 3 . Dann beschreiben die Punkte x imR 3 ,mitx =ˆx + saeine Gerade inR 3 , wenn die reelle Zahl s ganzRdurchläuft. Die Geradegeht durch den Punkt ˆx und hat die gleiche Richtung wie a, vgl. Abb. 21.6.Ist ˆx = 0, dann verläuft die Gerade durch den Ursprung.


350 21. Analytische Geometrie in Ê 3x 3ˆxax =ˆx + sax 2x 1saAbb. 21.6. Gerade in Ê 3 der Form x =ˆx + saBeispiel 21.3. Die Gerade durch (1, 2, 3) in Richtung (4, 5, 6) lautetx =(1, 2, 3) + s(4, 5, 6) = (1 + 4s,2+5s,3+6s) mit s ∈R.Die Gerade durch (1, 2, 3) und (3, 1, 2) hat die Richtung (3, 1, 2)−(1, 2, 3) =(2, −1, −1) und lautet somit x =(1, 2, 3) + s(2, −1, −1).Beachten Sie, dass auch <strong>and</strong>ere Richtungen für die Formulierung der Geradengewählt werden können, wie beispielsweise x =(1, 2, 3) + ŝ(−2, 1, 1)oder x =(1, 2, 3) + ˜s(6, −3, −3). Natürlich kann auch der ”Aufpunkt“ derGeraden, der s = 0 entspricht, auf der Geraden beliebig gewählt werden.So könnte der Punkt (1, 2, 3) durch den Punkt (−1, 3, 4) ersetzt werden,der auch auf der Geraden liegt.21.13 Projektion eines Punktes auf eine GeradeSei x =ˆx + sa eine Gerade inR 3 durch ˆx mit Richtung a. Wir suchen dieProjektion Pb eines gegebenen Punktes b ∈R 3 auf die Gerade, d.h. wirsuchen Pb ∈R 3 mit der Eigenschaft, dass (i) Pb =ˆx + sa für ein s ∈Rund (ii) (b − Pb) · a = 0. Beachten Sie, dass wir b als Punkt betrachtenanstatt als Vektor. Einsetzen von (i) in (ii) ergibt die folgende Gleichungfür s: (b − ˆx − sa) · a = 0, woraus wir folgern, dass s = b·a−ˆx·a|a|und somit2Pb=ˆx + b · a − ˆx · a|a| 2 a. (21.20)Ist ˆx = 0 und läuft die Gerade somit durch den Ursprung, dann ist Pb =b·a|a| 2 a,inÜbereinstimmung mit der entsprechenden Formel (20.9) inR 2 .


21.14 Ebenen 35121.14 EbenenSeien a 1 und a 2 zwei von Null verschiedene, nicht parallele Vektoren inR 3 ,d.h. a 1 × a 2 ≠ 0. Die Punkte x inR 3 , die in der Formx = s 1 a 1 + s 2 a 2 (21.21)geschrieben werden können, wobei s 1 und s 2 reelle Zahlen sind, bilden eineEbene inR 3 , die durch den Ursprung läuft und von den beiden Vektoren a 1und a 2 aufgespannt wird, vgl. Abb. 21.7. Der Vektor a 1 ×a 2 ist orthogonalzu a 1 und a 2 und somit zu allen Vektoren x in der Ebene, die ja Linearkombinationenvon a 1 und a 2 sind. Somit ist der von Null verschiedene Vektorn = a 1 × a 2 eine Normale zur Ebene und die Punkte x in der Ebene lassensich auch durch die Orthogonalitätsbeziehungn · x = 0 (21.22)charakterisieren. Dabei ist (21.21) eine Vektorgleichung, die aus drei Skalargleichungen(Komponentengleichungen) besteht, und (21.22) eine Skalargleichung,die sich aus (21.21) ergibt, wenn wir in den darin enthaltenenSkalargleichungen s 1 und s 2 eliminieren.x 3n = a 1×a 2a 2x 2a 1x = s 1a 1 + s 2a 2x 1Abb. 21.7. Von a 1 und a 2 aufgespannte Ebene durch den Ursprung mit derNormalen n = a 1 × a 2Sei ˆx ein Punkt inR 3 . Die Punkte x inR 3 , die in der Formx =ˆx + s 1 a 1 + s 2 a 2 (21.23)geschrieben werden können, wobei s 1 und s 2 reelle Zahlen sind, bilden eineEbene inR 3 , die durch den Punkt ˆx geht und parallel zur entsprechendendurch den Ursprung laufenden Ebene ist, vgl. Abb. 21.8.


352 21. Analytische Geometrie in Ê 3x 3n = a 1×a 2ˆxx =ˆx + s 1a 1 + s 2a 2a 2a 1x = s 1a 1 + s 2a 2x 1x 2Abb. 21.8. Ebene durch ˆx mit der Normalen n, die durch n · x = d = n · ˆxdefiniert istIst x =ˆx + s 1 a 1 + s 2 a 2 , dann gilt n · x = n · ˆx, dan · a i =0,i =1, 2.Somit können wir die Punkte x mit x =ˆx + s 1 a 1 + s 2 a 2 alternativ auchals Vektor x definieren, für denn · x = n · ˆx (21.24)gilt. Auch hier erhalten wir die Skalargleichung (21.24), wenn wir die Parameters 1 und s 2 in (21.23) eliminieren.Wir fassen zusammen:Satz 21.2 Eine Ebene inR 3 durch den Punkt ˆx ∈R 3 mit Normalen nkann als Menge {x ∈R 3 : x =ˆx + s 1 a 1 + s 2 a 2 mit s 1 ,s 2 ∈R} formuliertwerden, wobei a 1 und a 2 Vektoren sind, für die n = a 1 × a 2 ≠0gilt.Alternativ lässt sich die Ebene auch als Menge {x ∈R 3 : n·x = d, mit d =n · ˆx} beschreiben.Beispiel 21.4. Wir betrachten die Ebene x 1 +2x 2 +3x 3 =4,d.h.dieEbene(1, 2, 3) · (x 1 ,x 2 ,x 3 )=4zurNormalenn =(1, 2, 3). Um die Punkte x derEbene in der Form x =ˆx + s 1 a 1 + s 2 a 2 zu schreiben, wählen wir zunächsteinen Punkt ˆx in der Ebene, z.B. ˆx =(2, 1, 0), da n · ˆx =4.AlsNächsteswählen wir zwei nicht parallele Vektoren a 1 und a 2 ,sodassn · a 1 =0und n · a 2 =0,z.B.a 1 =(−2, 1, 0) und a 2 = −(3, 0, 1). Alternativ hättenwir auch einen Vektor a 1 mit n · a 1 =0wählen und a 2 = n × a 1 setzenkönnen, der zu n und a 1 orthogonal ist. Einen Vektor a 1 ,für den a 1 ·n =0gilt, finden wir, indem wir einen beliebigen von Null verschiedenen Vektorm, der nicht parallel zu n ist, wählen und a 1 = m × n setzen, wie z.B.m =(0, 0, 1) und somit a 1 =(−2, 1, 0).Andersherum erhalten wir die Gleichung x 1 +2x 2 +3x 3 = 4, wenn die Ebenex =(2, 1, 0) + s 1 (−2, 1, 0) + s 2 (−3, 0, 1), d.h. x =ˆx + s 1 a 1 + s 2 a 2 mit ˆx =(2, 1, 0), a 1 =(−2, 1, 0) und a 2 =(−3, 0, 1), gegeben ist, indem wir einfach


21.15 Schnitt einer Geraden mit einer Ebene 353n = a 1 × a 2 =(1, 2, 3) berechnen. Da n· ˆx =(1, 2, 3)· (2, 1, 0) = 4, erhaltenwir die Gleichung für die Ebene wie folgt: n · x =(1, 2, 3) · (x 1 ,x 2 ,x 3 )=x 1 +2x 2 +3x 3 = n · ˆx =4.Beispiel 21.5. Wir betrachten die reellwertige Funktion z = f(x, y) =ax + by + c zweier reeller Variablen x und y,wobeia, b und c reelle Zahlensind. Indem wir x 1 = x, x 2 = y und x 3 = z setzen, können wir den Graphenvon z = f(x, y) inR 3 als Ebene ax 1 + bx 2 − x 3 = −c mit der Normalen(a,b,−1) beschreiben.21.15 Schnitt einer Geraden mit einer EbeneWir suchen den Schnitt einer Geraden x =ˆx+sa mit einer Ebene n·x = d,d.h. die Menge an Punkten x, die sowohl zur Geraden als auch zur Ebenegehören, wobei ˆx, a, n und d gegeben sind. Wir erhalten n · (ˆx + sa)=d,wenn wir x =ˆx + sa in n · x = d einsetzen, d.h. n · ˆx + sn · a = d. Darauserhalten wir s =(d − n · ˆx)/(n · a), wenn n · a ≠ 0 und wir erhalten eineneindeutigen Schnittpunktx =ˆx +(d − n · ˆx)/(n · a)a. (21.25)Diese Formel ist bedeutungslos, wenn n · a = 0 ist, d.h., wenn die Geradeparallel zur Ebene ist. Dann gibt es keinen Schnittpunkt, außer wenn ˆx einPunkt in der Ebene ist und die Gerade ein Teil der Ebene ist.Beispiel 21.6. Wir finden den Schnittpunkt der Ebene x 1 +2x 2 +x 3 =5mitder Geraden x =(1, 0, 0)+s(1, 1, 1), indem wir die Gleichung 1+s+2s+s =5lösen, wodurch wir s = 1 erhalten. Der Schnittpunkt ist folglich (2, 1, 1).Die Ebene x 1 +2x 2 + x 3 = 5 hat keinen Schnittpunkt mit der Geradenx =(1, 0, 0) + s(2, −1, 0), da die Gleichung 1 + 2s − 2s =5keineLösunghat. Betrachten wir dagegen die Ebene x 1 +2x 2 + x 3 = 1, so liegt dieGerade x =(1, 0, 0) + s(2, −1, 0) in der Ebene, da 1 + 2s − 2s =1für allereellen s erfüllt ist.21.16 Zwei sich schneidende Ebenenergeben eine GeradeSeien n 1 =(n 11 ,n 12 ,n 13 ) und n 2 =(n 21 ,n 22 ,n 23 )zweiVektoreninR 3und d 1 und d 2 zwei reelle Zahlen. Die Punkte x ∈R 3 , die in der Ebenen 1 · x = d 1 und n 2 · x = d 2 liegen, genügen dem Gleichungssystemn 1 · x = d 1 ,n 2 · x = d 2 .(21.26)


354 21. Analytische Geometrie in Ê 3Unsere Intuition sagt uns, dass im Allgemeinen die Schnittpunkte zweierEbenen eine Gerade inR 3 bilden sollten. Können wir die Formel dieserGeraden in der Form x =ˆx + sa mit geeigneten Vektoren a und ˆx inR 3und s ∈Rbestimmen? Zunächst nehmen wir an, dass d 1 = d 2 = 0 undsuchen eine Formel für die x, für die n 1 · x = 0 und n 2 · x = 0 gilt, d.h.die Menge an x-Werten, die sowohl zu n 1 als auch n 2 orthogonal sind. Diesführt uns zu a = n 1 ×n 2 .Somitkönnen wir die Lösung x für die Gleichungenn 1·x = 0 und n 2·x =0alsx = sn 1 ×n 2 ≠0mits ∈Rschreiben. Natürlichgehen wir dabei von der Annahme aus, dass n 1 ×n 2 ≠0,d.h.dassdiezweiNormalen n 1 und n 2 nicht parallel sind und folglich auch die Ebenen nichtparallel sind.Als Nächstes nehmen wir an, dass (d 1 ,d 2 ) ≠(0, 0). Wenn wir einenVektor ˆx finden können, so dass n 1 · x = d 1 und n 2 · x = d 2 ,dannkönnenwir die Lösung von (21.26), wie folgt, schreiben:x =ˆx + sn 1 × n 2 , s∈R. (21.27)Nun müssen wir noch beweisen, dass wir tatsächlich ein ˆx finden können,das n 1·ˆx = d 1 und n 2·ˆx = d 2 genügt. D.h. wir müssen nach ˆx ∈R 3 suchen,das das folgende Gleichungssystem erfüllt:n 11ˆx 1 + n 12ˆx 2 + n 13ˆx 3 = d 1 ,n 21ˆx 1 + n 22ˆx 2 + n 23ˆx 3 = d 2 .Da n 1 ×n 2 ≠0müssen einige Komponenten von n 1 ×n 2 nicht Null sein. Istbeispielsweise die dritte Komponente von n 1 ×n 2 nicht Null, d.h. n 11 n 22 −n 12 n 21 ≠0,sokönnen wir ˆx 3 =0wählen. Wir erinnern uns jetzt an dieBedingung n 11 n 22 −n 12 n 21 ≠0für ein 2×2 Gleichungssystem, weshalb wireindeutig nach ˆx 1 und ˆx 2 in Abhängigkeit von d 1 und d 2 auflösen könnenund so das gewünschte ˆx erhalten. Die Argumentation verläuft ähnlich,wenn die erste oder zweite Komponente von n 1 × n 2 von Null verschiedenist.Wir fassen zusammen:Satz 21.3 Zwei nicht-parallele Ebenen n 1 · x = d 1 und n 2 · x = d 2 , derenNormalen n 1 und n 2 n 1 ×n 2 ≠0erfüllen, schneiden sich in einer Geradenmit der Richtung n 1 × n 2 .Beispiel 21.7. Der Schnitt der beiden Ebenen x 1 + x 2 + x 3 = 2 und 3x 1 +2x 2 − x 3 =1lautetx =ˆx + sa mit a =(1, 1, 1) × (3, 2, −1) = (−3, 4, −1)und ˆx =(0, 1, 1).21.17 Projektion eines Punktes auf eine EbeneSei n · x = d eine Ebene inR 3 zur Normalen n und sei b ein Punkt inR 3 .Wir suchen die Projektion Pb von b auf die Ebene n · x = d. Dabei ist es


21.18 Abst<strong>and</strong> zwischen Punkt und Ebene 355natürlich, die folgenden zwei Bedingungen an Pbzu stellen, vgl. Abb. 21.9:n · Pb= d, d.h. Pb ist ein Punkt in der Ebene,b − Pb ist parallel zur Normalen n, d.h. b − Pb= λn für ein λ ∈R.Wir folgern, dass Pb = b − λn. Die Gleichung n · Pb = d ergibt somitn · (b − λn)=d. Folglich ist λ = b·n−d|n|und somit2Pb= b − b · n − d|n| 2 n. (21.28)Geht die Ebene n · x = d = 0 durch den Ursprung, d.h. d = 0, dann giltPb= b − b · n n. (21.29)|n|2Ist die Ebene in der Form x =ˆx + s 1 a 1 + s 2 a 2 gegeben, mit zwei nichtparallelen Vektoren a 1 und a 2 inR 3 ,können wir alternativ die ProjektionPbeines Punktes b auf die Ebene dadurch berechnen, dass wir reelle Zahlenx 1 und x 2 suchen, so dass Pb =ˆx + x 1 a 1 + x 2 a 2 und (b − Pb) · a 1 =(b − Pb) · a 2 = 0. Dies liefert das Gleichungssystemx 1 a 1 · a 1 + x 2 a 2 · a 1 = b · a 1 − ˆx · a 1 ,x 1 a 1 · a 2 + x 2 a 2 · a 2 = b · a 2 − ˆx · a 2(21.30)mit den beiden Unbekannten x 1 und x 2 . Damit dieses System eine eindeutigeLösung hat, müssen wir zeigen, dass â 11 â 22 − â 12 â 21 ≠0,wobeiâ 11 = a 1·a 1 ,â 22 = a 2·a 2 ,â 21 = a 2·a 1 und â 12 = a 1·a 2 Dies folgt aber direktaus der Annahme, dass a 1 und a 2 nicht parallel sind, vgl. Aufgabe 21.24.Beispiel 21.8. Die Projektion Pb des Punktes b =(2, 2, 3) auf die Ebenex 1 + x 2 + x 3 =1lautetPb=(2, 2, 3) − 7−13(1, 1, 1) = (0, 0, 1).Beispiel 21.9. Die Projektion Pb des Punktes b =(2, 2, 3) auf die Ebenex =(1, 0, 0) + s 1 (1, 1, 1) + s 2 (1, 2, 3) mit der Normalen n =(1, 1, 1) ×(1, 2, 3) = (1, −2, 1) ergibt sich zu Pb=(2, 2, 3)− (2,2,3)·(1,−2,1)6(1, −2, 1) =(2, 2, 3) − 1 6 (1, −2, 1) = 1 6(11, 14, 17).21.18 Abst<strong>and</strong> zwischen Punkt und EbeneWir sagen, dass der Abst<strong>and</strong> zwischen Punkt b und Ebene n · x = d demBetrag |b − Pb| entspricht, wobei Pb die Projektion von b auf die Ebeneist. Vom vorherigen Abschnitt wissen wir, dass|b − Pb| =|b · n − d|.|n|


356 21. Analytische Geometrie in Ê 3Wir halten fest, dass dieser Abst<strong>and</strong> der kürzeste Abst<strong>and</strong> zwischen b undirgendeinem Punkt der Ebene ist, vgl. Abb. 21.9 und Aufgabe 21.21.x 3nb−PbbPbx 1x 2Abb. 21.9. Projektion eines Punktes/Vektors auf eine EbeneBeispiel 21.10. Der Abst<strong>and</strong> vom Punkt (2, 2, 3) zur Ebene x 1 +x 2 +x 3 =1entspricht |(2,2,3)·(1,1,1)−1|√3=2 √ 3.21.19 Drehung um einen VektorWir betrachten nun ein etwas schwierigeres Problem. Sei a ∈R 3 ein gegebenerVektorundθ∈R 3 ein gegebener Winkel. Wir suchen die AbbildungR :R 3 →R 3 , die der Drehung um den Winkel θ um den Vektor a entspricht.Wir erinnern uns an Abschnitt 20.21 und verlangen von Rx = R(x)die folgenden Eigenschaften:(i) |Rx−Px| = |x −Px|, (ii) (Rx− Px)·(x−Px)=cos(θ)|x − Px| 2 ,wobei Px = P a (x) die Projektion von x auf a ist, vgl. Abb. 21.10. Wirschreiben Rx − Px als Rx − Px= α(x − Px)+βa× (x − Px) mit reellenZahlen α und β. Dabei ist Rx−Pxorthogonal zu a und a×(x−Px)istzua und x − Px orthogonal. Wir bilden mit (x − Px) das Skalarprodukt undmit einem sinnvollenVorzeichen. Somit können wir Rx in Abhängigkeit von der ProjektionPx ausdrücken als:erhalten mit (ii) für α =cos(θ) und (i) liefert β = sin(θ)|a|Rx = Px+cos(θ)(x − Px)+ sin(θ) a × (x − Px). (21.31)|a|


21.20 Unterräume 357x 3θxPxRxx 1x 2Abb. 21.10. Drehung um a =(0,0, 1) um den Winkel θ21.20 Geraden und Ebenen durch den Ursprungsind UnterräumeGeraden und Ebenen inR 3 durch den Ursprung sind Beispiele von UnterräumendesR 3 . Die typische Eigenschaft eines Unterraums ist, dassVektoradditionen und skalare Multiplikationen nicht außerhalb des Unterraumsführen. Sind beispielsweise x und y zwei Vektoren in der Ebene durchden Ursprung zur Normalen n, d.h. n · x = 0 und n · y = 0, dann gilt auchn · (x + y) = 0 und n · (λx) =0für jedes λ ∈R 3 . Folglich gehören dieVektoren x + y und λx auch zur Ebene. Gehören <strong>and</strong>ererseits x und y zueiner Ebene zur Normalen n, die nicht durch den Ursprung verläuft, so dassn · x = d und n · y = d, wobeid eine von Null verschiedene Konstante ist,dann ist n · (x + y)=2d ≠ d, weswegen x + y nicht in der Ebene liegt. Wirfolgern, dass Geraden und Ebenen durch den Ursprung Unterräume desR 3sind, wohingegen Gerade und Ebenen, die nicht durch den Ursprung verlaufen,keine Unterräume sind. Der Begriff des Unterraums ist sehr wichtigund wir werden unten oft auf ihn treffen.Beachten Sie, dass n · x = 0 eine Gerade inR 2 und eine Ebene inR 3definiert. Die Gleichung n · x = 0 erzwingt für x eine Reduktion um eineDimension, so dass wir inR 2 eine Gerade und inR 3 eine Ebene erhalten.21.21 3 lineare Gleichungen mit 3 UnbekanntenWir betrachten nun das folgende System aus 3 linearen Gleichungen mit 3Unbekannten x 1 , x 2 und x 3 (wie Leibniz schon 1683):a 11 x 1 + a 12 x 2 + a 13 x 3 = b 1 ,a 21 x 1 + a 22 x 2 + a 23 x 3 = b 2 ,a 31 x 1 + a 32 x 2 + a 33 x 3 = b 3 ,(21.32)


358 21. Analytische Geometrie in Ê 3mit den Koeffizienten a ij und rechter Seite b i , i,j =1, 2, 3. Wir könnendieses System auch als Vektorgleichung inR 3 schreiben:x 1 a 1 + x 2 a 2 + x 3 a 3 = b, (21.33)wobei a 1 =(a 11 ,a 21 ,a 31 ), a 2 =(a 12 ,a 22 ,a 32 ), a 3 =(a 13 ,a 23 ,a 33 ) undb =(b 1 ,b 2 ,b 3 )VektoreninR 3 zu den Koeffizienten und der rechten Seitesind.Wann ist das System (21.32) bei gegebener rechten Seite b eindeutig fürx =(x 1 ,x 2 ,x 3 )lösbar? Wir werden sehen, dass die eindeutige Lösbarkeitmit dem von den drei Vektoren a 1 , a 2 und a 3 aufgespannten Volumenzusammenhängt. Genauer gesagt, mussV (a 1 ,a 2 ,a 3 )=|a 1 · a 2 × a 3 | ≠ 0 (21.34)gelten.Wir argumentieren nun damit, dass die Bedingung a 1 · a 2 × a 3 ≠0tatsächlich die eindeutige Lösbarkeit von (21.32) garantiert. Dazu imitierenwir, was wir schon beim 2 × 2 Gleichungssystem getan haben: Wirbilden nachein<strong>and</strong>er das Skalarprodukt auf beiden Seiten der Vektorgleichungx 1 a 1 + x 2 a 2 + x 3 a 3 = b mit a 2 × a 3 , a 3 × a 1 und a 2 × a 3 .Dabeierhalten wir die folgenden Lösungsformeln (wenn wir uns entsinnen, dassa 1 · a 2 × a 3 = a 2 · a 3 × a 1 = a 3 · a 1 × a 2 ):x 1 = b · a 2 × a 3a 1 · a 2 × a 3,x 2 = b · a 3 × a 1a 2 · a 3 × a 1= a 1 · b × a 3a 1 · a 2 × a 3,x 3 = b · a 1 × a 2a 3 · a 1 × a 2= a 1 · a 2 × ba 1 · a 2 × a 3.(21.35)Dabei haben wir ausgenutzt, dass a i · a j × a k = 0, falls zwei der Indizesi, j oder k gleich sind. Die Lösungsformeln (21.35) liefern eine eindeutigeLösung von (21.32), falls a 1 · a 2 × a 3 ≠0.Wir halten fest, dass das Muster der Lösungen in (21.35) sich gleicht. DerNenner a 1 ·a 2 ×a 3 ist derselbe und die Zähler für x i erhält man, wenn mana i durch b ersetzt. Die Lösungsformeln (21.35) werden auch CramerscheRegel genannt. Wir haben den folgenden wichtigen Satz bewiesen:Satz 21.4 Das Gleichungssystem (21.32), bzw. die identische Vektorgleichung(21.33) ist eindeutig nach der Cramerschen Regel (21.35) lösbar,wenn a 1 · a 2 × a 3 ≠0.Wir wiederholen: V (a 1 ,a 2 ,a 3 )=a 1 · a 2 × a 3 ≠ 0 bedeutet, dass dasdurch die drei Vektoren a 1 , a 2 und a 3 aufgespannte Volumen nicht Nullist, d.h. dass die drei Vektoren in drei verschiedene Richtungen weisen (sodass die Ebene, die von zwei Vektoren aufgespannt wird, nicht den dritten


21.22 Lösung eines 3 × 3 Systems durch Gauss-Elimination 359Vektor enthält). Wir nennen die Menge dreier Vektoren {a 1 ,a 2 ,a 3 } linearunabhängig, wennV (a 1 ,a 2 ,a 3 ) ≠ 0, oder einfacher, dass die drei Vektorena 1 , a 2 und a 3 linear unabhängig sind.21.22 Lösung eines 3 × 3Systemsdurch Gauss-EliminationWir wollen eine Alternative zur Cramerschen Regel für die Lösung des3 × 3 Gleichungssystems (21.32) geben: Die berühmte Gauss-Elimination.Sei a 11 ≠ 0. Wir subtrahieren die erste Gleichung multipliziert mit a 21von der zweiten Gleichung multipliziert mit a 11 und ähnlich, die erste Gleichungmultipliziert mit a 31 von der dritten Gleichung multipliziert mit a 11 .Dadurch wird die Unbekannte x 1 in der zweiten und dritten Gleichungeliminiert und (21.32) nimmt folgende Form an:a 11 x 1 + a 12 x 2 + a 13 x 3 = b 1 ,(a 22 a 11 − a 21 a 12 )x 2 +(a 23 a 11 − a 21 a 13 )x 3 = a 11 b 2 − a 21 b 1 ,(a 32 a 11 − a 31 a 12 )x 2 +(a 33 a 11 − a 31 a 13 )x 3 = a 11 b 3 − a 31 b 1 .Stattdessen können wir auch(21.36)a 11 x 1 + a 12 x 2 + a 13 x 3 = b 1 ,â 22 x 2 +â 23 x 3 = ˆb 2 ,â 32 x 2 +â 33 x 3 = ˆb 3(21.37)schreiben, mit veränderten Koeffizienten â ij und ˆb i . Unter der Annahme,dass â 22 ≠ 0, wiederholen wir die Vorgehensweise für das 2×2Systemmit(x 2 ,x 3 ), wodurch wir die abschließende Dreiecksforma 11 x 1 + a 12 x 2 + a 13 x 3 = b 1 ,â 22 x 2 +â 23 x 3 = ˆb 2 ,ã 33 x 3 = ˜b 3(21.38)erhalten, mit veränderten Koeffizienten in der letzten Gleichung. Die 3.Gleichung kann nun für x 3 aufgelöst werden. Das Einsetzen von x 3 in diezweite Gleichung liefert x 2 und schließlich x 1 , durch das Einsetzen von x 2und x 3 in die erste Gleichung.Beispiel 21.11. Hier ein Beispiel für die Gauss-Elimination: Wir lösen dasGleichungssystemx 1 +2x 2 +3x 3 = 6,2x 1 +3x 2 +4x 3 = 9,3x 1 +4x 2 +6x 3 = 13.


360 21. Analytische Geometrie in Ê 3Wir subtrahieren die mit 2 multiplizierte erste Gleichung von der zweitenund die mit 3 multiplizierte erste Gleichung von der dritten und erhaltensox 1 +2x 2 +3x 3 = 6,−x 2 − 2x 3 = −3,−2x 2 − 3x 3 = −5.Nun subtrahieren wir die mit 2 multiplizierte zweite Gleichung von derdritten:x 1 +2x 2 + 3x 3 = 6,−x 2 − 2x 3 = −3,x 3 = 1,woraus wir x 3 = 1 erhalten. Die zweite Gleichung ergibt x 2 = 1 und schließlichdie erste Gleichung x 1 =1.21.23 3 × 3-Matrizen: Summe, Produktund TransponierteWir können die Schreibweise für 2×2-Matrizen direkt verallgemeinern: Wirbezeichnen das quadratische Feld⎛⎝ a ⎞11 a 12 a 13a 21 a 22 a 23⎠a 31 a 32 a 33als 3 × 3-Matrix A =(a ij ) mit Elementen a ij ,i,j=1, 2, 3. Dabei ist i derZeilenindex und j der Spaltenindex.Natürlich können wir auch die Schreibweise eines 2-Zeilenvektors (oder1×2-Matrix) und eines 2-Spaltenvektors (oder (2×1-Matrix) verallgemeinern.Jede Zeile von A, wobei(a 11 a 12 a 13 ) die erste Zeile ist, kann daherals 3-Zeilenvektor (oder 1 × 3-Matrix) und jede Spalte von A, wobei⎛⎝ a ⎞11a 21⎠a 31die erste Spalte ist, als 3-Spaltenvektor (oder 3×1-Matrix) betrachtet werden.Wir können daher sagen, dass eine 3 × 3-Matrix aus drei 3-Zeilenvektorenoder aus drei 3-Spaltenvektoren besteht.Seien A =(a ij ) und B =(b ij )zwei3× 3-Matrizen. Wir definieren dieMatrix C =(c ij ) als Summe C = A+B, mit den Elementen c ij = a ij +b ijfür i,j =1, 2, 3. Anders ausgedrückt, addieren wir zwei Matrizen, indemwir elementweise addieren.Sei A =(a ij )eine3× 3-Matrix und λ eine reelle Zahl. Wir definierendie Matrix C = λA als Matrix mit den Elementen c ij = λa ij . Andersausgedrückt, alle Elemente von A werden mit λ multipliziert.


21.23 3 × 3-Matrizen: Summe, Produkt und Transponierte 361Seien A =(a ij ) und B =(b ij )zwei3× 3-Matrizen. Wir definieren dasProdukt C = AB als 3 × 3-Matrix mit den Elementen c ij :c ij =3∑a ik b kj i,j =1, 2, 3. (21.39)k=1Matrixmultiplikation ist assoziativ, d.h.(AB)C = A(BC) für MatrizenA, B und C, vgl. Aufgabe 21.10. Das Produkt ist jedoch im Allgemeinennicht kommutativ, d.h.esgibtMatrizenA und B, sodassAB ≠ BA, vgl.Aufgabe 21.11.Sei A =(a ij ) eine 3×3-Matrix, so definieren wir die Transponierte von A,mit Schreibweise A ⊤ ,alsdieMatrixC = A ⊤ mit den Elementen c ij = a ji ,i,j =1, 2, 3. Anders ausgedrückt, sind die Zeilen von A die Spalten vonA ⊤ und umgekehrt. Aus dieser Definition folgt sofort, dass (A ⊤ ) ⊤ = A.Zweifaches Transponieren ergibt die Ausgangsmatrix.Wir können die folgenden Rechenregeln für Transponierte direkt verifizieren:(A + B) ⊤ = A ⊤ + B ⊤ , (λA) ⊤ = λA ⊤ ,(AB) ⊤ = B ⊤ A ⊤ .Ähnlich ist die Transponierte eines 3-Spaltenvektors ein 3-Zeilenvektormit denselben Elementen. Betrachten wir <strong>and</strong>ererseits die 3 × 1-Matrix⎛x = ⎝ x ⎞1x 2⎠x 3als 3-Spaltenvektor, so ist die Transponierte x ⊤ der entsprechende 3-Zeilenvektor(x 1 ,x 2 ,x 3 ). Wir definieren das Produkt einer 1 × 3-Matrix (3-Zeilenvektor) x ⊤ mit einer 3 × 1-Matrix (3-Spaltenvektor) y auf natürlicheWeise, als⎛ ⎞x ⊤ y = ( )y 1x 1 x 2 x 3⎝y 2⎠ = x 1 y 1 + x 2 y 2 + x 3 y 3 = x · y,y 3womit wir die Verbindung zum Skalarprodukt inR 3 geschaffen haben. Wirmachen daher die wichtige Beobachtung, dass das Produkt einer 1 × 3-Matrix (3-Zeilenvektor) mit einer 3 × 1-Matrix (3-Spaltenvektor) identischist mit dem Skalarprodukt der entsprechenden Vektoren. Somit können wirdie Elemente c ij des Produkts C = AB entsprechend (21.39) als Skalarproduktder Zeile i von A mit der Spalte j von B formulieren:⎛c ij = ( )a i1 a i2 a i3⎝ b ⎞1j 3∑b 2j⎠ = a ik b kj .b 3j k=1


362 21. Analytische Geometrie in Ê 3Wir halten fest, dass|x| 2 = x · x = x ⊤ x,wobei wir x sowohl als geordnetes 3-Tupel als auch als 3-Spaltenvektorbetrachten.Die 3 × 3-Matrix ⎛⎝ 1 0 0 ⎞0 1 0⎠0 0 1wird 3×3-Einheitsmatrix genannt und I geschrieben. Für jede 3×3-MatrixA gilt IA = A und AI = A.Sei A =(a ij )eine3× 3-Matrix und x =(x i )eine3× 1-Matrix mitElementen x i . Dann ist das Produkt Ax die 3×1-Matrix mit den Elementen3∑a ik x k i =1, 2, 3.k=1Das lineare Gleichungssystema 11 x 1 + a 12 x 2 + a 13 x 3 = b 1 ,a 21 x 1 + a 22 x 2 + a 23 x 3 = b 2 ,a 31 x 1 + a 32 x 2 + a 33 x 3 = b 3kann in Matrixschreibweise⎛⎝ a ⎞⎛11 a 12 a 13a 21 a 22 a 23⎠⎝ x ⎞ ⎛1x 2⎠ = ⎝ b ⎞1b 2⎠a 31 a 32 a 33 x 3 b 3geschrieben werden, d.h.mit A =(a ij ), x =(x i ) und b =(b i ).Ax = b,21.24 Betrachtungsweisenfür lineare GleichungssystemeWir können eine 3 × 3-Matrix A =(a ij )⎛⎝ a ⎞11 a 12 a 13a 21 a 22 a 23⎠a 31 a 32 a 33als Anordnung der Spaltenvektoren a 1 =(a 11 ,a 21 ,a 31 ), a 2 =(a 12 ,a 22 ,a 32 )und a 3 =(a 13 ,a 23 ,a 33 ) oder dreier Zeilenvektoren â 1 =(a 11 ,a 12 ,a 13 ), â 2 =


21.25 Nicht-singuläre Matrizen 363(a 21 ,a 22 ,a 23 ) und â 3 =(a 31 ,a 32 ,a 33 ) betrachten. Entsprechend können wirdas Gleichungssystem⎛⎝ a ⎞ ⎛11 a 12 a 13a 21 a 22 a 23⎠ ⎝ x ⎞ ⎛1x 2⎠ = ⎝ b ⎞1b 2⎠,a 31 a 32 a 33 x 3 b 3als Vektorgleichung dreier Spaltenvektorenoder als System dreier skalarer Gleichungenx 1 a 1 + x 2 a 2 + x 3 a 3 = b (21.40)â 1 · x = b 1â 2 · x = b 2â 3 · x = b 3(21.41)betrachten, wobei die Zeilen â i als Normale zu Ebenen interpretierbar sind.Wir wissen aus der Diskussion nach (21.34), dass (21.40) eindeutig lösbarist, wenn ±V (a 1 ,a 2 ,a 3 )=a 1 · a 2 × a 3 ≠0.Ferner wissen wir von Satz 21.3, dass die x ∈R 3 , die die beiden letztenGleichungen in (21.41) erfüllen, eine Gerade in Richtung â 2 × â 3 bilden,falls â 2 × â 3 ≠0.Istâ 1 nicht orthogonal zu â 2 × â 3 ,soerwartenwir,dassdiese Gerade die Ebene, die durch die erste Gleichung von (21.41) definiertwird, in einem Punkt trifft. Somit sollte (21.41) eindeutig lösbar sein, wennâ 1·â 2 ×â 3 ≠0.Daslässt uns vermuten, dass V (a 1 ,a 2 ,a 3 ) ≠ 0 dann und nurdann, wenn V (â 1 , â 2 , â 3 ) ≠0.Tatsächlich liefert eine genauere Betrachtungvon (21.18) das etwas präzisere Ergebnis:Satz 21.5 Sind a 1 , a 2 und a 3 die drei Spaltenvektoren einer 3 × 3-MatrixA und â 1 , â 2 und â 3 die Zeilenvektoren von A, dann ist V (a 1 ,a 2 ,a 3 )=V (â 1 , â 2 , â 3 ).21.25 Nicht-singuläre MatrizenSei A eine 3 × 3-Matrix aus drei 3-Spaltenvektoren a 1 , a 2 und a 3 .IstV (a 1 ,a 2 ,a 3 ) ≠ 0, so nennen wir A nicht-singulär. IstV (a 1 ,a 2 ,a 3 )=0,so nennen wir A singulär. Aus Abschnitt 21.21 wissen wir, dass die GleichungAx = b für jedes b ∈R 3 eine eindeutige Lösung x hat, wenn Anicht-singulär ist. Ferner liegen die drei Vektoren a 1 , a 2 und a 3 in einerEbene, wenn A singulär ist, weswegen wir einen dieser Vektoren als Linearkombinationder beiden <strong>and</strong>eren ausdrücken können. Daraus folgt, dass eseinen von Null verschiedenen Vektor x =(x 1 ,x 2 ,x 3 ) gibt, so dass Ax =0.Wir fassen zusammen:Satz 21.6 Ist A eine nicht-singuläre 3×3-Matrix, dann ist das GleichungssystemAx = b für jedes b ∈R 3 eindeutig lösbar. Ist A singulär, dann hatdas System Ax =0eine von Null verschiedene Lösung x.


364 21. Analytische Geometrie in Ê 321.26 Die Inverse einer MatrixSei A eine nicht-singuläre 3 × 3-Matrix. Seien c i ∈R 3 die Lösungen zu denGleichungen Ac i = e i für i =1, 2, 3, wobei e i die drei Einheitsvektoren als3-Spaltenvektor sind. Sei C =(c ij ) die Matrix, deren Spalten den Vektorenc i entsprechen. Dann gilt AC = I,wobeiI die 3 × 3-Einheitsmatrix ist, daAc i = e i . Wir nennen C die Inverse von A und schreiben C = A −1 .Wirhalten fest, dass A −1 eine 3 × 3-Matrix ist, für dieAA −1 = I, (21.42)d.h. Multiplikation von A mit A −1 von rechts ergibt die Einheitsmatrix.Nun wollen wir noch beweisen, dass auch A −1 A = I, d.h. dass Multiplikationvon A mit A −1 von links auch die Einheitsmatrix liefert. Dazu haltenwir zunächst fest, dass A −1 auch nicht-singulär sein muss, da ansonstenein von Null verschiedener Vektor x existieren würde, so dass A −1 x =0.Multiplikation von A von links ergibt AA −1 x = 0, was zum Widerspruchführt, da nach (21.42) AA −1 x = Ix = x ≠ 0. Multiplikation von AA −1 = Imit A −1 von links liefert A −1 AA −1 = A −1 , woraus wir A −1 A = I erhalten,wenn wir von rechts mit der Inversen von A −1 multiplizieren. Dieseexistiert, da A −1 nicht-singulär ist.Wir stellen fest, dass (A −1 ) −1 = A, was einer Umformulierung vonA −1 A = I entspricht. Ferner ist(AB) −1 = B −1 A −1 ,da B −1 A −1 AB = B −1 B = I. Wir fassen zusammen:Satz 21.7 Seien A, B nicht-singuläre 3 × 3-Matrizen, dann existiert dieInverse 3 × 3-Matrix A −1 und AA −1 = A −1 A = I. Fernergilt(AB) −1 =B −1 A −1 .21.27 Verschiedene BasenSei {a 1 ,a 2 ,a 3 } eine linear unabhängige Menge dreier Vektoren inR 3 , d.h.wir nehmen an, dass V (a 1 ,a 2 ,a 3 ) ≠ 0. Aus Satz 21.4 folgt, dass sich jederVektor b ∈R 3 eindeutig als Linearkombination von {a 1 ,a 2 ,a 3 },b = x 1 a 1 + x 2 a 2 + x 3 a 3 (21.43)schreiben lässt oder in Matrix Schreibweise⎛⎝ b ⎞ ⎛1b 2⎠ = ⎝ a ⎞ ⎛11 a 12 a 13a 21 a 22 a 23⎠ ⎝ x ⎞1x 2⎠b 3 a 31 a 32 a 33 x 3oder b = Ax,


21.28 Linear unabhängige Menge von Vektoren 365wobei die Vektoren a 1 =(a 11 ,a 21 ,a 31 ), a 2 =(a 12 ,a 22 ,a 32 ), und a 3 =(a 13 ,a 23 ,a 33 ) die Spalten der Matrix A =(a ij ) bilden. Da V (a 1 ,a 2 ,a 3 ) ≠0,hat das Gleichungssystem Ax = b eine eindeutige Lösung x ∈R 3 für jedesb ∈R 3 und somit kann jedes b ∈R 3 eindeutig als Linearkombinationb = x 1 a 1 +x 2 a 2 +x 3 a 3 von der Menge von Vektoren {a 1 ,a 2 ,a 3 } mit den Koeffizienten(x 1 ,x 2 ,x 3 ) geschrieben werden. Dies bedeutet, dass {a 1 ,a 2 ,a 3 }eine Basis für denR 3 ist. Wir bezeichnen (x 1 ,x 2 ,x 3 )alsKoordinaten von bbezüglich der Basis {a 1 ,a 2 ,a 3 }. Die Verbindung zwischen den Koordinaten(b 1 ,b 2 ,b 3 )vonb in der Einheitsbasis und den Koordinaten x von b in derBasis {a 1 ,a 2 ,a 3 } wird durch Ax = b oder x = A −1 b gegeben.21.28 Linear unabhängige Menge von VektorenIst V (a 1 ,a 2 ,a 3 ) ≠ 0, dann nennen wir die Menge {a 1 ,a 2 ,a 3 } der dreiVektoren inR 3 linear unabhängig. Wir haben gerade gesehen, dass einelinear unabhängige Menge {a 1 ,a 2 ,a 3 } dreier Vektoren als Basis für denR 3verwendet werden kann.Ist {a 1 ,a 2 ,a 3 } linear unabhängig, dann hat das System Ax =0,wobeidie Spalten der 3 × 3-Matrix von den Koeffizienten von a 1 , a 2 und a 3gebildet werden, keine <strong>and</strong>ere Lösung als x =0.Umgekehrt können wir als Test für die lineare Unabhängigkeit auchdas folgende Kriterium nutzen: Folgt aus Ax =0,dassx =0,dannist{a 1 ,a 2 ,a 3 } linear unabhängig und somit V (a 1 ,a 2 ,a 3 ) ≠0.Wir fassen zusammen:Satz 21.8 Eine Menge {a 1 ,a 2 ,a 3 } dreier Vektoren inR 3 ist linear unabhängigund kann daher als Basis für denR 3 benutzt werden, wenn dasVolumen ±V (a 1 ,a 2 ,a 3 )=a 1 · a 2 × a 3 ≠0. Eine Menge {a 1 ,a 2 ,a 3 } dreierVektoren inR 3 ist dann und nur dann linear unabhängig, wenn aus Ax =0folgt, dass x =0.21.29 Orthogonale MatrizenEine 3 × 3-Matrix Q für die Q ⊤ Q = I gilt heißt orthogonale Matrix. Eineorthogonale Matrix ist nicht-singulär mit Inverser Q −1 = Q ⊤ und somitgilt auch QQ ⊤ = I. Eine orthogonale Matrix ist somit durch die BeziehungQ ⊤ Q = QQ ⊤ = I charakterisiert.Seien q i =(q 1i ,q 2i ,q 3i )für i =1, 2, 3 die Spaltenvektoren von Q, d.h.die Zeilenvektoren von Q ⊤ . Die Aussage Q ⊤ Q = I ist identisch mit denForderungenq i · q j =0 für i ≠ j, und |q i | =1,d.h. die Spalten einer orthogonalen Matrix Q sind paarweise orthogonalund haben die Länge eins.


366 21. Analytische Geometrie in Ê 3Beispiel 21.12. Die Matrix⎛⎞cos(θ) − sin(θ) 0Q = ⎝sin(θ) cos(θ) 0⎠, (21.44)0 0 1ist orthogonal und entspricht einer Drehung um die x 3 -Achse um den Winkelθ.21.30 Lineare Abbildungen vs. MatrizenSei A =(a ij )eine3× 3-Matrix. Die Abbildung x → Ax,d.h.dieFunktiony = f(x)=Ax ist eine Abbildung vomR 3 in denR 3 . Diese Abbildung istlinear, da A(x+y)=Ax+Ay und A(λx)=λAx für λ ∈R 3 . Somit erzeugteine 3 × 3-Matrix eine lineare Abbildung f :R 3 →R 3 mit f(x)=Ax.Umgekehrt können wir jeder linearen Abbildung f :R 3 →R 3 eine MatrixA zuordnen, deren Koeffizientena ij = f i (e j )entsprechen, mit f(x)=(f 1 (x),f 2 (x),f 3 (x)). Aus der Linearität von f(x)folgtf(x)=⎛ ⎛⎝f 1⎝3∑j=1⎛3∑= ⎝ f 1 (e j )x j ,j=1⎛3∑= ⎝ a 1j x j ,j=1⎞ ⎛x j e j⎠ ,f 2⎝3∑j=13∑f 2 (e j )x j ,j=13∑a 2j x j ,j=13∑j=1⎞ ⎛x j e j⎠,f 3⎝3∑j=1⎞⎞3∑x j e j⎠⎠j=1⎞⊤f 3 (e j )x j⎠⎞⊤a 3j x j⎠ = Ax.Wir erkennen, dass eine lineare Abbildung f :R 3 →R 3 als f(x) =Axformulierbar ist, wobei die Matrix A =(a ij ) die Koeffizienten a ij = f i (e j )hat.Beispiel 21.13. Die Projektion Px= x·a|a|a auf einen von Null verschiedenen2Vektor a ∈R 3 hat die Matrixschreibweise⎛a 2 1 a 1a 2 a 1a 3 ⎛|a| 2 |a| 2 |a| 2Px= ⎜ a 2a 1 a 2⎝ |a| 2 2 a 2a 3 ⎟⎝ x 1|a| 2 |a| 2 ⎠ x 2⎠.a 3a 1 a 3a 2 a 2 3|a| 2 |a| 2|a| 2 ⎞x 3⎞⊤


21.31 Das Skalarprodukt ist invariant unter orthogonalen Abbildungen 367Beispiel 21.14. Die Projektion Px = x − x·n|n|n auf eine Ebene n · x =02durch den Ursprung hat die Matrixschreibweise⎛1 − n2 1Px= ⎜⎝|n| 2− n1n2|n| 2− n2n1|n| 2 1 − n2 2|n| 2− n3n1|n| 2− n1n3|n| 2− n2n3|n| 2⎞⎟⎠|n| 2− n3n2|n| 2 1 − n2 3⎛⎝ x ⎞1x 2⎠ .x 3Beispiel 21.15. Das Spiegelbild eines Punktes x bezüglich einer Ebene durchden Ursprung (2P − I)x,wobeiPxdie Projektion von x auf die Ebene ist,hat die Matrixschreibweise⎛2 a2 1|a|− 12(2P − I)x = ⎜⎝2 a1a2|a| 22 a2a1|a| 2 2 a2 22 a3a1|a| 22 a1a3|a| 22 a2a3|a| 2|a|− 1 22 a3a2|a|2 a2 2 3|a|− 1 2⎞⎛⎟⎝ x ⎞1⎠ x 2⎠ .x 321.31 Das Skalarprodukt ist invariantunter orthogonalen AbbildungenSei Q die Matrix {q 1 ,q 2 ,q 3 }, die aus den Basisvektoren q j gebildet wird.Wir nehmen an, dass Q orthogonal ist, was identisch ist zur Annahme, dass{q 1 ,q 2 ,q 3 } eine orthogonale Basis ist, d.h. dass die q j paarweise orthogonalsind und die Länge 1 haben. Die Koordinaten ˆx eines Vektors in der Einheitsbasisbezüglich der Basis {q 1 ,q 2 ,q 2 } werden durch ˆx = Q −1 x = Q ⊤ xerhalten. Wir wollen nun beweisen, dass aus ŷ = Q ⊤ y folgt, dassˆx · ŷ = x · y.Dies besagt, dass das Skalarprodukt invariant unter einem orthogonalenBasiswechsel ist. Wir berechnenˆx · ŷ = ( Q ⊤ x ) · (Q ⊤ y ) = x · (Q ⊤) ⊤Q ⊤ y = x · y,wobeiwirausnutzen,dassfür jede 3 × 3-Matrix A =(a ij ) und x, y ∈R 3⎛ ⎞ (3∑ 3∑3∑ 3∑)(Ax) · y = ⎝ a ij x j⎠y i = a ij y i x ji=1 j=1j=1 i=1(21.45)= ( A ⊤ y ) · x = x · (A ⊤ y ) ,mit A = Q ⊤ und außerdem, dass (Q ⊤ ) ⊤ = Q und QQ ⊤ = I.Wir können jetzt die Argumentation zur geometrischen Interpretationdes Skalarprodukts zu Beginn dieses Kapitels abschließen. Bei zwei nichtparallelen Vektoren a und b können wir uns eine orthogonale Abbildungdenken, die a und b in die x 1 -x 2 -Ebene dreht und somit gilt auch hier diegeometrische Interpretation aus Kapitel ”Analytische Geometrie inR 2 “.


368 21. Analytische Geometrie in Ê 321.32 Ausblick auf Funktionen f :R 3 →R 3Wir trafen lineare Abbildungen f :R 3 →R 3 der Form f(x) =Ax, wobeiA eine 3 × 3-Matrix ist. Unten werden wir auf allgemeinere (nicht lineare)Abbildungen f :R 3 →R 3 treffen, die jedem x =(x 1 ,x 2 ,x 3 ) ∈R 3 einenVektor f(x)=(f 1 (x),f 2 (x), f 3 (x)) ∈R 3 zuordnen. Beispielsweisef(x)=f (x 1 ,x 2 ,x 3 )= ( x 2 x 3 ,x 2 1 + x 3,x 4 3 +5)mit f 1 (x)=x 2 x 3 , f 2 (x)=x 2 1 + x 3 und f 3 (x)=x 4 3 + 5. Wir werden sehen,dass wir ganz natürlich die Begriffe Lipschitz-Stetigkeit und Differenzierbarkeitvon Funktionen f :R→Rauf Funktionen f :R 3 →R 3 übertragenkönnen. Beispielsweise sagen wir, dass f :R 3 →R 3 Lipschitz-stetig ist inR 3 , wenn es eine Konstante L f gibt, so dass|f(x) − f(y)|≤L f |x − y| für alle x, y ∈R 3 .Aufgaben zu Kapitel 2121.1. Zeigen Sie, dass die Norm |a| eines Vektors a =(a 1,a 2,a 3) gleich demAbst<strong>and</strong> vom Ursprung 0 = (0, 0,0) zum Punkt a =(a 1,a 2,a 3) ist. Hinweis:Benutzen Sie zweimal den Satz von Pythagoras.21.2. Welche der folgenden Koordinatensysteme sind rechts-orientiert?x 3x 1x 1x 2x 2x 1x 2 x 3x 321.3. Deuten Sie die Richtung von a × b und b × a in Abb. 21.1 an, wenn b inRichtung der x 1-Achse zeigt. Beantworten Sie dieselbe Frage für Abb. 21.2.21.4. Gegeben seien a =(1,2, 3) und b =(1, 3,1). Berechnen Sie a × b.21.5. Berechnen Sie das Volumen des schiefen Würfels, der von den drei Vektoren(1,0, 0), (1,1, 1) und (−1, −1, 1) aufgespannt wird.21.6. Berechnen Sie die Fläche des Dreiecks mit den drei Punkten: (1, 1,0),(2,3, −1) und (0,5, 1).


Aufgaben zu Kapitel 21 36921.7. Seien b =(1, 3,1) und a =(1,1, 1) gegeben. Berechnen Sie (a) den Winkelzwischen a und b, (b) die Projektion von b auf a, (c) einen Einheitsvektorsenkrecht zu a und b.21.8. Betrachten Sie die Ebene durch den Ursprung zur Normalen n =(1, 1,1)und den Vektor a =(1, 2,3). Welcher Punkt p in der Ebene besitzt den kürzestenAbst<strong>and</strong> zu a?21.9. Gelten die folgenden Aussagen oder nicht für beliebige 3 × 3-Matrizen A,B und C und eine Zahl λ:(a)A + B = B + A,(b)(A + B)+C = A +(B + C),(c) λ(A + B)=λA + λB?21.10. Beweisen Sie, dass für 3 ×3-Matrizen A, B und C gilt: (AB)C = A(BC).Hinweis: D =(AB)C hat die Elemente d ij = È 3k=1 (È 3l=1 a ilb lk )c kj .Führen Siedie Summation in veränderter Reihenfolge aus.21.11. Geben Sie Beispiele für 3 × 3-Matrizen A und B für die AB ≠ BA.Istesschwer, solche Beispiele zu finden, d.h. ist es die Ausnahme oder ”normal“, dassAB ≠ BA.21.12. Beweisen Sie Satz 21.5.21.13. Formulieren Sie die drei Matrizen, die Drehungen um die x 1-, x 2- undx 3-Achse beschreiben.21.14. Bestimmen Sie die Matrix, die eine Drehung um den Winkel θ um einengegebenen Vektor b in Ê 3 beschreibt.21.15. Formulieren Sie die Matrix, die die Spiegelung eines Vektors an der x 1-x 2-Ebene beschreibt.21.16. Betrachten Sie eine lineare Abbildung, die zwei Punkte p 1 und p 2 inÊ 3 auf zwei Punkte ˆp 1 und ˆp 2 abbildet. Zeigen Sie, dass alle Punkte, die aufder Geraden zwischen p 1, p 2 liegen, in Punkte auf der Geraden zwischen ˆp 1,ˆp 2abgebildet werden.21.17. Betrachten Sie die zwei Geraden in Ê 3 : a+λb und c+µd für a,b,c,d ∈ Ê 3und λ,µ ∈ Ê. Wie groß ist der kürzeste Abst<strong>and</strong> zwischen beiden Geraden?21.18. Berechnen Sie den Schnitt der beiden Geraden: (1,1, 0) + λ(1,2, −3) und(2,0, −3)+µ(1,1, −3). Ist es die Regel oder eine Ausnahme, dass ein Schnittpunktexistiert?21.19. Berechnen Sie den Schnitt zweier Ebenen durch den Ursprung zu denNormalen n 1 =(1,1, 1) und n 2 =(2, 3,1). Berechnen Sie auch den Schnitt dieserEbenen mit der x 1-x 2-Ebene.21.20. Beweisen Sie, dass (21.42) die Existenz der Inversen A −1 impliziert.


370 21. Analytische Geometrie in Ê 321.21. Zeigen Sie, dass der Abst<strong>and</strong> zwischen einem Punkt b und seiner Projektionauf eine Ebene n · x = d, demkürzesten Abst<strong>and</strong> zwischen b und irgendeinemPunkt der Ebene entspricht. Geben Sie sowohl einen geometrischenBeweis mit Hilfe des Satzes von Pythagoras als auch einen analytischen Beweis.Hinweis: Schreiben Sie für x in der Ebene |b − x| 2 = |b − Pb+(Pb − x)| 2 =(b − Pb+(Pb− x),b− Pb+(Pb− x)) und benutzen Sie (b − Pb,Pb− x)=0.21.22. Betrachten Sie eine Ebene durch den Punkt r zur Normalen n. BestimmenSie die Reflektion eines Lichtstrahls parallel zur Richtung von a.x 3anrbx 1x 221.23. Schreiben Sie (21.31) in Matrixschreibweise.21.24. Beenden Sie den Beweis zur eindeutigen Lösbarkeit von (21.30).


22Komplexe ZahlenImaginäre Zahlen sind eine vortreffliche und wundervolle Zufluchtdes göttlichen Geistes, fast wie eine Amphibie zwischen Sein undNicht-Sein. (Leibniz)Das Schreiben gewaltiger Bücher ist ein mühseliger und erschöpfenderLuxus. Auf fünfhundert Seiten eine Idee zu entwickeln, die mündlichin einigen wenigen Minuten vorgestellt werden kann! Da ist esdoch entschieden besser vorzutäuschen, dass diese Bücher bereitsexistieren und stattdessen eine Zusammenfassung, einen Kommentaranzubieten.... Weil ich vernünftiger, plumper und träger bin,habe ich es vorgezogen, Anmerkungen über imaginäre Bücher zuschreiben. (Borges, 1941)22.1 EinleitungIn diesem Kapitel führen wir die Menge der komplexen ZahlenCein. Einekomplexe Zahl, üblicherweise z geschrieben, ist ein geordnetes Paarz =(x, y) reeller Zahlen x und y. Dabeiistx der Realteil von z und yder Imaginärteil von z. Wir können daherCmitR 2 identifizieren und wirbezeichnenCauch oft als komplexe Ebene. Dabei betrachten wir die reelleZahlengeradeRals x-Achse in der komplexen EbeneC. Ferner identifizierenwir die Menge komplexer Zahlen mit dem Imaginärteil Null mit derMenge der reellen Zahlen und schreiben (x, 0) = x. Daher können wirCalsErweiterung vonRbetrachten. Ähnlich identifizieren wir die Menge komplexerZahlen mit Realteil Null mit der y-Achse und nennen sie auch rein


372 22. Komplexe Zahlenimaginäre Zahlen. Die komplexe Zahl (0, 1) hat einen besonderen Nameni =(0, 1); wir nennen sie imaginäre Einheit.y =Imzz =(x, y)i =(0,1)1=(1,0)x =RezAbb. 22.1. Die komplexe Ebene = Ê 2Die Addition inCist identisch mit der Vektoraddition inR 2 .DasNeueinCist die Multiplikation komplexer Zahlen, die sich von der skalarenMultiplikation und der Vektormultiplikation inR 2 unterscheidet.Die Motivation für die Einführung komplexer Zahlen entstammt Polynomialgleichungenwie x 2 = −1, die keine Lösung haben, wenn x auf diereellen Zahlen beschränkt ist. Es gibt keine reelle Zahl x, für die x 2 = −1gilt, da x 2 ≥ 0für x ∈R.Kannx eine komplexe Zahl sein, so wird die Gleichungx 2 = −1 lösbar und die beiden Lösungen sind x = ±i. Allgemeinerbesagt der Fundamentalsatz der Algebra, dass jede Polynomialgleichungmit reellen oder komplexen Koeffizienten in der Menge der komplexen Zahlenlösbar ist. Tatsächlich ergibt sich, dass eine Polynomialgleichung vomGrade n genau n Lösungen hat.Die Einführung der komplexen Zahlen schließt unsere Erweiterungsprozedurab, die wir bei den natürlichen Zahlen anfingen und uns über ganzeZahlen, rationale Zahlen hin zu reellen Zahlen führte, wobei in jedemSchritt eine neue Klasse von Polynomialgleichung gelöst werden konnte.Weitergehende Erweiterungen über die komplexen Zahlen hinaus, z.B. zuQuaternionen, die aus Quadrupeln reeller Zahlen bestehen, wurden im 19.Jahrhundert von Hamilton eingeführt. Aber die anfängliche Euphorie überdiese Konstrukte verblasste, da keine wirklich überzeugende Anwendunggefunden wurde. Die komplexen Zahlen haben sich dagegen als sehr nützlicherwiesen.


22.2 Addition und Multiplikation22.2 Addition und Multiplikation 373Wir definieren die Summe (a,b)+(c, d) zweier komplexer Zahlen (a,b) und(c, d), die wir durch eine Addition mit dem Zeichen + erhalten, folgendermaßen:(a,b)+(c, d)=(a + c, b + d), (22.1)d.h. wir addieren die Realteile und die Imaginärteile getrennt. Wir erkennen,dass die Addition zweier komplexer Zahlen der Vektoraddition entsprechendergeordneter Paare oder Vektoren inR 2 entspricht. Natürlichdefinieren wir die Subtraktion ähnlich: (a,b) − (c, d)=(a − c, b − d).Wir definieren das Produkt (a,b)(c, d) zweier komplexer Zahlen (a,b) und(c, d), das wir durch eine Multiplikation erhalten, folgendermaßen:(a,b)(c, d)=(ac − bd,ad + bc). (22.2)Wir können durch einfaches Anwenden der Rechenregeln für reelle Zahlenerkennen, dass die Addition und Multiplikation komplexer Zahlen dieKommutativ-, Assoziativ- und Distributiv-Gesetze erfüllen.Ist z =(x, y)einekomplexeZahl,sokönnen wir auchz =(x, y)=(x, 0) + (0,y)=(x, 0) + (0, 1)(y,0) = x + iy (22.3)schreiben, wobei wir komplexe Zahlen der Form (x, 0) mit x (und ähnlichnatürlich (y,0) mit y) identifizieren und i =(0, 1), wie oben eingeführt,benutzen. Wir nennen x den Realteil von z und y den Imaginärteil von zund schreiben auch x =Rez und y =Imz, d.h.Insbesondere stellen wir fest, dassz = Rez + i Im z =(Rez,Im z). (22.4)i 2 = ii=(0, 1)(0, 1) = (−1, 0) = −(1, 0) = −1. (22.5)Somit löst z = i die Gleichung z 2 +1=0.Ähnlich ergibt sich (−i) 2 = −1und folglich hat die Gleichung z 2 + 1 = 0 die beiden Lösungen z = ±i.Regel (22.2) für die Multiplikation komplexer Zahlen (a,b) und (c, d)kann nun mit Hilfe von i 2 = −1 neu gewonnen werden (wenn wir dasDistributiv-Gesetz für gültig erklären):(a,b)(c, d)=(a + ib)(c + id)=ac + i 2 bd + i(ad + bc)=(ac − bd,ad + bc).Wir definieren den Absolutwert |z| einer komplexen Zahl z =(x, y) =x + iy durch|z| =(x 2 + y 2 ) 1/2 , (22.6)d.h. |z| ist schlicht und einfach die Länge oder Norm des zugehörigen Vektors(x, y) ∈R 2 . Wir halten fest, dass für z = x + iy insbesondere gilt:|x| = |Re z|≤|z|, |y| = |Im z|≤|z|. (22.7)


374 22. Komplexe Zahlen22.3 Die DreiecksungleichungSind z 1 und z 2 zwei komplexe Zahlen, dann gilt|z 1 + z 2 |≤|z 1 | + |z 2 |. (22.8)Dies ist die Dreiecksungleichung für komplexe Zahlen, diedirektausderDreiecksungleichung inR 2 folgt.22.4 Offene GebieteWir erweitern die Schreibweise für ein offenes Gebiet inR 2 aufC, indemwir ein Gebiet Ω inCoffen nennen, wenn das zugehörige Gebiet inR 2 offenist, d.h. es gibt für jedes z 0 ∈ Ω eine positive Zahl r, so dass die komplexenZahlen z mit |z − z 0 |


22.6 Geometrische Interpretation der Multiplikation 375ersetzen, mit n = ±1, ±2,.... Durch die Wahl von θ ∈ [0, 2π)erhaltenwirdas Hauptargument von z,Argz.Beispiel 22.1. Die Polardarstellung der komplexen Zahl z =(1, √ 3) lautetz =2(cos( π 3 ), sin( π 3 )) oder z = 2(cos(60◦ ), sin(60 ◦ )).22.6 Geometrische Interpretationder MultiplikationUm eine Verbindung zwischen der Multiplikation komplexer Zahlen undVektoren inR 2 zu finden, benutzen wir Polarkoordinatenz =(x, y)=r(cos(θ), sin(θ)),wobei r = |z| und θ =Argz. Seiζ =(ξ,η) =ρ(cos(ϕ), sin(ϕ)) eine<strong>and</strong>ere komplexe Zahl in Polarkoordinaten, so liefern die trigonometrischenFormeln (8.4) und (8.5) aus Kapitel ”Pythagoras und Euklid“zζ = r(cos(θ), sin(θ))ρ(cos(ϕ), sin(ϕ))= rρ(cos(θ)cos(ϕ) − sin(θ)sin(ϕ), cos(θ)sin(ϕ)+sin(θ)cos(ϕ))= rρ(cos(θ + ϕ), sin(θ + ϕ)).ζy =Imz|zζ| = |z||ζ|Argzζ=Argz +Argζzζz1x =RezAbb. 22.3. Geometrische Interpretation der Multiplikation komplexer ZahlenWir folgern, dass die Multiplikation von z = r(cos(θ), sin(θ)) mit ζ =ρ(cos(ϕ), sin(ϕ)) einer Drehung des Vektors z um den Winkel ϕ =Argζentspricht, wobei zusätzlich der Betrag von z um den Faktor ρ = |ζ|verändert wird. Anders ausgedrückt, erhalten wirarg zζ =Argz +Argζ, |zζ| = |z||ζ|. (22.10)


376 22. Komplexe ZahlenBeispiel 22.2. Multiplikation mit i entspricht einer Drehung gegen den Uhrzeigersinnum π 2 ,bzw.90◦ .22.7 Komplexe KonjugationIst z = x + iy eine komplexe Zahl und x, y reell, so definieren wir die(komplex) Konjugierte ¯z durch¯z = x − iy.Wir erkennen, dass z dann und nur dann reell ist, wenn ¯z = z, und dass zrein imaginär ist, d.h. Re z = 0, dann und nur dann, wenn ¯z = −z.Wenn wirC mitR 2 identifizieren, erkennen wir, dass die komplexe Konjugationder Spiegelung an der reellen Achse entspricht. Wir stellen auchdie folgenden Beziehungen fest, die einfach beweisbar sind:|z| 2 = z¯z, Re z = 1 2 (z +¯z), Im z = 1 (z − ¯z). (22.11)2i22.8 DivisionWir wollen die Division reeller Zahlen (Schreibweise /) auf die Divisionkomplexer Zahlen erweitern, indem wir für w,u ∈C und u ≠ 0 definieren:z = w/u = w , dann und nur dann, wenn uz = w.uZur Berechnung von w/u für vorgegebene w,u ∈Cmit u ≠ 0 gehen wir,wie folgt, vor:w/u = w u = wūuū = wū|u| 2 .Beispiel 22.3. Es gilt1+i (1 + i)(2 − i)= = 3 2+i 5 5 + i1 5 .Beachten Sie, dass wir komplexe Zahlen als Skalare betrachten, obwohlsie viel mit Vektoren inR 2 gemeinsam haben. Der Hauptgrund dafür ist,dass ... .22.9 Der Fundamentalsatz der AlgebraWir betrachten eine Polynomialgleichung p(z) = 0 vom Grad n, d.h.p(z)=a 0 + a 1 z + ...+ a n z n mit den komplexen Koeffizienten a 0 ,...,a n .


22.10 Wurzeln 377Der Fundamentalsatz der Algebra besagt, dass die Gleichung p(z)=0mindestenseine komplexe Lösung z 1 hat, die p(z 1 )=0erfüllt. Mit Hilfe derPolynomfaktorisierung können wir p(z) faktorisieren:p(z)=(z − z 1 )p 1 (z),wobei p 1 (z) ein Polynom vom Grad kleiner gleich n−1ist.Tatsächlich liefertdie Faktorisierung aus dem Kapitel ”Kombinationen von Funktionen“Abschnitt 11.4, dassp(z)=(z − z 1 )p 1 (z)+c,wobei c eine Konstante ist. Das Einsetzen von z 1 impliziert c = 0. Wir wiederholendiese Argumentation und finden so, dass p(z) faktorisiert werdenkann, zup(z)=c(z − z 1 )...(z − z n ),wobei z 1 ,...,z n die (i.a. komplexen) Nullstellen von p(z) sind.22.10 WurzelnWir betrachten die Gleichungw n = zfür w ∈C, wobein =1, 2,... eine ganze Zahl und z ∈Cgegeben ist. Inden Polarkoordinaten z = |z|(cos(θ), sin(θ)) und w = |w|(cos(ϕ), sin(ϕ))nimmt die Gleichung w n = z folgende Form an:Wir folgern daraus, dass|w| n (cos(nϕ), sin(nϕ)) = |z|(cos(θ), sin(θ)).|w| = |z| 1 n ,ϕ=θn +2πk n ,mit k =0,...,n− 1. Wir erkennen, dass die Gleichung w n = znverschiedeneLösungen auf dem Kreis |w| = |z| 1 n hat. Insbesondere hat dieGleichung w 2 = −1 die beiden Lösungen w = ±i. Dien Lösungen derGleichung w n = 1 werden die n-ten Einheitswurzeln genannt.22.11 Lösung der quadratischen Gleichungw 2 +2bw + c =0Wir betrachten die quadratische Gleichung in w ∈C,w 2 +2bw + c =0


378 22. Komplexe Zahleny =Imzy =Imzzw 1zθ/2 θ/2 θ/3x =Rezw 2x =Rez11w 2w 3w 1Abb. 22.4. Die quadratischen“ und kubischen“ Wurzeln von z” ”für b,c ∈C. Die quadratische Ergänzung führt zu(w + b) 2 = b 2 − c.Gilt b 2 − c ≥ 0, dann istw = −b ± √ b 2 − c,wohingegen wir für b 2 − c


Aufgaben zu Kapitel 22 379Abb. 22.5. Gösta Mittag-Leffler, schwedischer <strong>Mathematik</strong>er und Gründer der” Acta Mathematica“: Die beste Arbeit eines <strong>Mathematik</strong>ers ist Kunst, eine hoch”perfektionierte Kunst, kühn wie die meisten traumhaft schönen Fantasien, klarund durchsichtig. Mathematisches Genie und künstlerisches Genie gleichen ein<strong>and</strong>er“Aufgaben zu Kapitel 2222.1. Zeigen Sie, dass (a) 1 i = −i, (b)i4 =1.22.2. Bestimmen Sie (a) Re11+i3+4i, (b) Im ,(c)Im .7−iz¯z22.3. Seien z 1 =4− 5i und z 2 =2+3i. Bestimmen Sie in der z = x + iySchreibweise (a) z 1z 2,(b) z 1 zz 2,(c) 1z 1 +z 2.22.4. Zeigen Sie, dass die Menge komplexer Zahlen z, die eine Gleichung derForm |z − z 0| = r für ein z 0 ∈ und r>0erfüllt, einen Kreis in der komplexenEbene bildet mit Zentrum z 0 und Radius r.22.5. Schreiben Sie in Polardarstellung (a) 1 + i, (b) 1+i1−i ,(c)2+3i 5+4i .22.6. Lösen Sie die Gleichungen (a) z 2 = i, (b)z 8 =1,(c)z 2 + z +1=−i, (d)z 4 − 3(1 + 2i)z 2 +6i =0.22.7. Bestimmen Sie die Mengen in der komplexen Ebene, die durch(a) | z+i | z−i =1,(b)Imz2 =2,(c)|Arg z| ≤ π beschrieben werden.422.8. Formulieren Sie z/w in Polarkoordinaten, ausgehend von Polarkoordinatenfür z und w.22.9. Beschreiben Sie geometrisch die Abbildungen f : → für (a) f(z) =az + b, mita,b ∈ , (b)f(z)=z 2 ,(c)f(z)=z 1 2 .


23AbleitungenIch werde euch Unterschiede lehren. (Shakespeare: ”König Lear“)Körper ohne Geschwindigkeit verändern ihre Position nicht. (Einstein)Nichts ist älter in der Natur als Bewegung, und über dieselbe gibt esweder wenige noch geringe Schriften der Philosophen. (Galileo)23.1 VeränderungsratenLeben ist Veränderung. Ein Neugeborenes verändert sich jeden Tag underwirbt neue Fähigkeiten, ein Teenager wird innerhalb einiger Jahre zumErwachsenen, Menschen in mittleren Jahren möchten sehen, wie ihre Familie,ihr Haus und ihre Karriere Jahr für Jahr gedeihen. Nur Menschenim Ruhest<strong>and</strong> wollen die Welt anhalten, um für immer Golf zu spielen, siebemerken aber, dass dies unmöglich ist und sie verstehen, dass es ein Endegibt, nachdem es niemals mehr eine Veränderung geben wird.Wenn sich etwas verändert, sprechen wir von der Gesamtveränderung,der Änderung pro Abschnitt oder der Veränderungsrate. Wenn unser Gehaltangehoben wird, erwarten wir einen Anstieg der Steuern und wir sprechenvon der Gesamtveränderung an Besteuerung (in einem Jahr). Wir könnenauch die Veränderung der Steuer pro zusätzlichem Euro berechnen, wasüblicherweise als prozentualer Einkommenssteuersatz bezeichnet wird. Derprozentuale Steuersatz ändert sich mit unserem Einkommen, so dass wirbei höherem Einkommen einen höheren prozentuallen Steuersatz bezahlen.


382 23. AbleitungenIst das Gesamteinkommen 10.000 Euro, dann können wir beispielsweise30 Cent Steuern für jeden zusätzlich verdienten Euro bezahlen, und wennunser Gesamteinkommen 50.000 Euro beträgt, dann könnten wir 50 CentSteuern für jeden zusäzlichen Euro bezahlen. Der prozentuale Einkommenssteuersatz,bzw. die Änderungsrate des Steuersatzes, ist für unser Beispiel0,3 bei einem Einkommen von 10.000 Euro und 0,5 bei einem Einkommenvon 50.000 Euro.Geschäftsleute reden von Grenzkosten eines Artikels, das sind die zusätzlichenKosten bei Erhöhung der Stückzahl, d.h. der Änderungsrate der Gesamtkosten.Normalerweise hängt der Stückpreis vom Kaufvolumen ab undtatsächlich sinkt der Stückpreis üblicherweise bei steigender Stückzahl. DieProduktionskosten eines Artikels verändern sich ebenfalls mit der hergestelltenStückzahl. Bei einem gewissen Produktionsst<strong>and</strong> können die Kostenfür die Herstellung eines zusätzlichen Artikels sehr gering sein. Mussallerdings eine neue Fabrik gebaut werden, um dieses eine zusätzliche Stückherzustellen, dann sind die Grenzkosten sehr hoch. Somit könnensichalsodie Stückkosten mit der Gesamtproduktion verändern.Der Begriff einer Funktion f : D(f) → W(f) ist ebenfalls eng mit Änderungenverknüpft. Für jedes x ∈ D(f) gibt es ein f(x) ∈ W(f) und normalerweiseändert sich f(x) mitx. Istf(x) für alle x gleich, dann ist dieFunktion f(x) eine konstante Funktion, die einfach zu begreifen ist undkeiner weiteren Untersuchungen bedarf. Ändert sich jedoch f(x) mitx, soist es nur natürlich, nach Wegen zu suchen, um die Änderungen von f(x)mit x qualitativ und quantitativ zu erfassen. Wir treffen wieder auf dieÄnderungsrate, wenn wir beschreiben wollen, wie f(x) sich mit x ändert.Die Ableitung einer Funktion f(x) inAbhängigkeit von x beschreibt dieVeränderungsrate von f(x), wenn x sich verändert. Die Ableitung unsererSteuer in Abhängigkeit vom Einkommen ist der Einkommenssteuersatz.Die Ableitung der gesamten Produktionskosten in Abhängigkeit von derGesamtproduktion sind die Stückkosten.Die Ableitung ist ein fundamentales Werkzeug der Infinitesimalrechnung.Tatsächlich fällt der Beginn des modernen Wissenschaftszeitalters mit derErfindung des Begriffs der Ableitung zusammen. Die Ableitung ist ein Maßfür Veränderungen.In diesem Kapitel werden wir den wundervollen mathematischen Begriffder Ableitung einführen, einige seiner Eigenschaften kennen lernen undAbleitungen bei der mathematischen Modellierung benutzen.23.2 Steuern bezahlenWir kehren zum obigen Beispiel zurück und beschreiben die Steuer als eineFunktion des Einkommens. Angenommen, wir bezeichnen mit x unserGesamteinkommen im nächsten Jahr und mit f(x) die zugehörige Steu-


23.2 Steuern bezahlen 38318000160001400012000Steuer10000800060004000200000 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5EinkommenAbb. 23.1. Einkommenssteuer f(x)inAbhängigkeit vom Einkommen xer, die wir zu bezahlen haben. Die Funktion f(x) beschreibt, wie sich dieEinkommenssteuer mit dem Einkommen x ändert. Für ein gegebenes Einkommenx existiert eine zugehörige zu bezahlende Einkommenssteuer f(x).Wir zeigen eine mögliche Funktion f(x) in Abb. 23.1.Die Funktion f(x) unseres Beispiels ist stückweise linear und Lipschitzstetig.Die Wert von f(x) ist bis zum Gesamteinkommen 5000 Null, dieSteigung beträgt im Intervall [5 000, 10 000] 0, 2, 0, 3 in [10 000, 20 000], 0, 4in [20 000, 30 000] und 0, 5 in [30 000, ∞).Für ein gegebenes ¯x entspricht die Steigung der Geraden, die f(x)inderNähe von ¯x repräsentiert, dem Einkommenssteuersatz. Wir bezeichnen dieSteigung von f(x) in¯x mit m(¯x). Wir erkennen, dass sich die Steigungm(¯x) mit¯x ändert. Beispielsweise ist m(¯x)=0, 3für x ∈ (10 000, 20 000).Verdienen wir bei einem Einkommen von ¯x ∈ (10 000, 20 000) einen Euromehr, dann wird unsere Einkommenssteuer um 0, 3 Euro wachsen.Der Einkommenssteuersatz entspricht der Steigung der Geraden, die dieEinkommenssteuer f(x) als Funktion des Einkommens x repräsentiert. Daherist beim Einkommen ¯x der Einkommenssteuersatz m(¯x) .DerSteuersatzist Null bis zu einem Einkommen von 5 000, der Steuersatz beträgt 0, 2im Einkommensbereich [5 000, 10 000], 0, 3 im Bereich [10 000, 20 000], 0, 4im Bereich [20 000, 30 000] und 0, 5für Einkommen im Bereich [30 000, ∞).Wir können mit den folgenden Formeln angeben, wie sich f(x)für jedenEinkommensbereich verändert:f(x)=0 für x ∈ [0, 5 000]f(x)=0, 2(x − 5 000) für x ∈ [5 000, 10 000]f(x)=f(10 000) + 0, 3(x − 10 000) für x ∈ [10 000, 20 000]f(x)=f(20 000) + 0, 4(x − 20 000) für x ∈ [20 000, 30 000]f(x)=f(30 000) + 0, 5(x − 30 000) für x ∈ [30 000, ∞).x 10 4


384 23. AbleitungenWir könnendieseFormelninderFormf(x)=f(¯x)+m(¯x)(x − ¯x) (23.1)zusammenfassen, wobei ¯x für ein vorgegebenes Einkommen steht mit derzugehörigen Steuer f(¯x). Wir sind an der Steuer f(x) beim Einkommen xin einem Intervall, das ¯x enthält, interessiert. So beschreibt etwa die Formelf(x)=f(15 000) + m(15 000)(x − 15 000) für x ∈ [10 000, 20 000],wie sich die Steuer mit dem Einkommen x in der Nähe des Einkommens¯x = 15 000 verändert, vgl. Abb. 23.2, wobei m(15 000) = 0, 3derEinkommenssteuersatzist.400035003000Steuer25002000150010001 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2EinkommenAbb. 23.2. Steuer f(x) für ein Einkommen x im Bereich [10 000, 20 000]x 10 4Die Ableitung der Funktion f(x)=f(¯x)+m(¯x)(x−¯x)istbeix =¯x gleichdem Steuersatz m(¯x). Die Formel f(x) =f(¯x)+m(¯x)(x − ¯x) beschreibt,wie sich f(x)mitx in einem Intervall um ¯x ändert. Die Formel besagt, dassf(x) inderNähe von ¯x eine Gerade mit Steigung m(¯x) ist.Ganz allgemein können wir für eine lineare Funktion f(x)=mx+b auchf(x)=f(¯x)+m(x − ¯x)schreiben, da f(¯x) =b + m¯x. Der Koeffizient m, mit dem die Änderungx − ¯x multipliziert wird, entspricht der Ableitung von f(x)in¯x. In diesemFall ist die Ableitung konstant gleich m für alle ¯x. DieÄnderung in f(x)ist der Änderung in x proportional mit dem Proportionalitätsfaktor m:f(x) − f(¯x)=m(x − ¯x), (23.2)


23.3 W<strong>and</strong>ern 385d.h. für x ≠¯x beträgt die Steigung mm =f(x) − f(¯x). (23.3)x − ¯xWir können die Steigung m als Änderung in f(x) pro Einheitsschritt in xoder als Veränderungsrate von f(x) inAbhängigkeit von x betrachten.23.3 W<strong>and</strong>ernWir wollen nun dem obigen Beispiel eine <strong>and</strong>ere Interpretation verleihen.Dazu nehmen wir an, dass x die Zeit in Sekunden ist und f(x)derAbst<strong>and</strong>in Meter, den ein W<strong>and</strong>erer auf seinem Pfad beginnend bei der Anfangszeitx =0zurücklegt. Entsprechend der obigen Formeln ist f(x) =0fürx ∈ [0, 5 000], was bedeutet, dass der Ausflug mit einer Pause von 5 000Sekunden anfängt (vielleicht, um etwas an der Ausrüstung zu reparieren).Für x ∈ [5 000, 10 000] gilt f(x) =0, 2(x − 5 000), was besagt, dass derW<strong>and</strong>erer 0, 2 Meter pro Sekunde zurücklegt, d.h. sich mit der Geschwindigkeit0, 2 Meter pro Sekunde bewegt. Im Zeitbereich [10 000, 20 000] giltf(x)=f(10 000)+0, 3(x−10 000), was bedeutet, dass die Geschwindigkeitdes W<strong>and</strong>erers nun bei 0, 3 Meter pro Sekunde liegt, u.s.w.Wir halten fest, dass die Steigung m(¯x) der Geraden f(x) =f(¯x)+m(¯x)(x − ¯x) die Geschwindigkeit bei ¯x repräsentiert. Wir können dahersagen, dass die Ableitung des Abst<strong>and</strong>s f(x)nachderZeitx, d.h. die Steigungm(¯x), gleich der Geschwindigkeit ist. Wir werden die Interpretationder Ableitung als Geschwindigkeit unten wieder finden.23.4 Definition der AbleitungWir wollen jetzt die Ableitung einer gegebenen Funktion f :R→R in einemgegebenen Punkt ¯x definieren. Wir werden dabei der Vorstellung folgen,dass die Ableitung von f(x) in¯x gleich m ist, wenn f(x) sich besondersgut durch die lineare Funktion f(¯x)+m(x − ¯x) für x in der Nähe von ¯xannähern lässt. Anders ausgedrückt, setzen wir die Ableitung von f(x)in¯xgleich der Steigung m der Näherungsfunktion f(¯x)+m(x−¯x). Natürlich istder Schlüsselschritt dabei, wie wir die ”besonders gute“ Näherung von f(x)durch f(¯x)+m(x− ¯x) interpretieren wollen. Wir werden auf die natürlicheForderung, dass der Fehler proportional zu |x− ¯x| 2 ist, d.h. dass der Fehlerquadratisch im Abst<strong>and</strong> x − ¯x ist, stoßen. Geometrisch entspricht dies derForderung, dass die Gerade y = f(¯x)+m(x−¯x) die Tangente zum Grapheny = f(x) in(¯x,f(¯x)) ist. Wir werden sehen, dass die Forderung, dass derFehler quadratisch in x − ¯x ist, ziemlich gut ist. Insbesondere wäre die


386 23. AbleitungenForderung, dass der Fehler noch kleiner ist, beispielsweise proportional zu|x − ¯x| 3 , eine zu starke Anforderung.Bevor wir die Ableitung definieren, wollen wir etwas zurücktreten, umuns vorzubereiten und verschiedene lineare Näherungen b + m(x − ¯x) dergegebenen Funktion f(x)für x in der Nähe von ¯x betrachten. Es gibt vieleunterschiedliche Geraden, die f(x) in der Nähe von ¯x annähern. Einigegute und schlechtere Näherungen sind in Abb. 23.3 gezeigt. Links zeigenwir einige schlechtere lineare Näherungen der Funktion f(x) in der Nähevon ¯x. Rechts sind bessere lineare Näherungen aufgetragen.y = f(x)y = f(x)¯x¯xAbb. 23.3. Lineare Näherungen von f(x) inderNähe von ¯xOffen bleibt die Frage, welche der vielen Näherungsgeraden eine besondersgute Wahl ist.Wir verfügen über Informationen, die wir nutzen sollten. Wir wissennämlich, dass der Wert von f(x)für x =¯x gleich f(¯x) ist. Daher betrachtenwir nur Geraden b+m(x− ¯x), die den Wert f(¯x)für x =¯x annehmen, d.h.wir wählen b = f(¯x). Derartige Geraden interpolieren f(x) in¯x und sinddaher durch die Gleichungy = f(¯x)+m(x − ¯x) (23.4)gegeben. Wir begannen diesen Abschnitt mit der Betrachtung von Näherungenvon f(x) in dieser Form. Wir stellen mehrere Beispiele in Abb. 23.4mit verschiedenen Steigungen m vor.Wir möchten natürlich die Steigung m so wählen, dass f(x) besondersgut durch die lineare Funktion f(¯x)+m(x− ¯x)für x nahe bei ¯x angenähertwird. Wir erwarten, dass die Steigung m von ¯x abhängt, d.h. m = m(¯x).Von den drei Geraden in Abb. 23.4 nahe (¯x,f(¯x)), scheint die mittlere beiweitem die beste zu sein. Diese Gerade ist eine Tangente an den Graphenvon f(x) im Punkt ¯x. Die Steigung der Tangente wird dadurch charakterisisert,dass der Fehler zwischen f(x) und der Näherung f(¯x)+m(¯x)(x− ¯x),d.h. die GrößeE f (x, ¯x)=f(x) − ( f(¯x)+m(¯x)(x − ¯x) ) , (23.5)


23.4 Definition der Ableitung 387y = f(x)f(¯x)¯xAbb. 23.4. Lineare Näherungen einer Funktion, die alle durch den Punkt(¯x, f(¯x)) gehen. Die Umgebung von (¯x,f(¯x)) ist rechts vergößertbesonders klein ist. Da f(¯x)+m(¯x)(x − ¯x) inx =¯x die Funktion f(x)interpoliert, gilt E(¯x, ¯x) = 0. Wir schreiben (23.5) neu:f(x)=f(¯x)+m(¯x)(x − ¯x)+E f (x, ¯x).E f (x, ¯x) kann als Korrektur zur linearen Näherung f(¯x)+m(¯x)(x− ¯x)vonf(x) betrachtet werden, vgl. Abb. 23.5. Wir erwarten, dass die KorrekturE f (x, ¯x) besonders klein ist, wenn sie viel kleiner ist als der Ausdruckm(x − ¯x), der eine lineare Korrektur zum konstanten Wert f(¯x) darstellt.Somit ist f(¯x)+m(¯x)(x − ¯x) eine lineare Näherung an f(x) in der Nähevon ¯x ohne Fehler in x =¯x und wir suchen m(¯x) so, dass die KorrekturE f (x, ¯x) klein ist verglichen zu m(x − ¯x) für x in der Nähe von ¯x.y = f(¯x)+m(¯x)(x − ¯x)E f (x, ¯x)y = f(x)¯xxAbb. 23.5. Graph y = f(x), Tangente y = f(¯x)+m(¯x)(x − ¯x) und FehlerE f (x, ¯x)


388 23. AbleitungenDaher ist es eine natürliche Forderung, dass E f (x, ¯x) durch einen Ausdruckbeschränkt werden kann, der quadratisch in x − ¯x ist, d.h.|E f (x, ¯x)|≤K f (¯x)|x − ¯x| 2 für xnahe bei ¯x, (23.6)wobei K f (¯x) konstant ist. Der Ausdruck K f (¯x)|x − ¯x| 2 ist viel kleiner alsm(¯x)|x − ¯x|,wennx genügend nahe bei ¯x ist, d.h. wenn der Faktor |x − ¯x|klein genug ist.Wir sagen in Kurzform, dass ein Fehlerausdruck E f (x, ¯x) quadratisch inx−¯x ist, wenn E f (x, ¯x) der Abschätzung (23.6) mit einer Konstanten K f (¯x)für x nahe bei ¯x genügt. Daher versuchen wir, die Steigung m = m(¯x) sozu wählen, dass der Fehler E f (x, ¯x) quadratisch in x − ¯x ist. Die lineareFunktion f(¯x)+m(¯x)(x−¯x) ist dann Tangente von f(x)in¯x. Wir erwarten,dass die Steigung der Tangente in ¯x von ¯x abhängt, was wir durch dieSchreibweise m(¯x) <strong>and</strong>euten.Nun sind wir in der Lage, die Ableitung von f(x)in¯x zu definieren. DieFunktion f(x) heißtdifferenzierbar in ¯x, wenn es Konstanten m(¯x) undK f (¯x) gibt, so dass für x nahe bei ¯xf(x)=f(¯x)+m(¯x)(x − ¯x)+E f (x, ¯x),mit |E f (x, ¯x)|≤K f (¯x)|x − ¯x| 2 . (23.7)Wir sagen dann, dass die Ableitung von f(x) in¯x gleich m(¯x) ist und wirschreiben die Ableitung als f ′ (¯x)=m(¯x). Die Ableitung f ′ (¯x)vonf(x)in¯x ist gleich der Steigung m(¯x) der Tangente y = f(¯x)+m(¯x)(x − ¯x) vonf(x) in¯x. Die Abhängigkeit von ¯x wird in f ′ (¯x) beibehalten.Wenn wir kurz zusammenfassen, so können wir uns Gleichung (23.7), diedie Ableitung von f in ¯x definiert, als Definition der linearen Näherungf(¯x)+f ′ (¯x)(x − ¯x) ≈ f(x)denken, für x nahe bei ¯x mit einem Fehler E f (x, ¯x), der quadratisch in x−¯xist. Die lineare Näherung f(¯x)+f ′ (¯x)(x − ¯x) vonf(x) mitquadratischemFehler in x− ¯x wird Linearisierung von f(x)in¯x genannt und E f (x, ¯x)istder Linearisierungsfehler.Wir berechnen nun die Ableitungen für einige wichtige Polynome f(x)anh<strong>and</strong> der Definition der Ableitung.23.5 Die Ableitung einer linearen Funktionist konstantIst f(x)=b + mx eine lineare Funktion mit reellen Konstanten b und m,dann istf(x)=b + mx = b + m¯x + m(x − ¯x)=f(¯x)+m(x − ¯x),


23.6 Die Ableitung von x 2 ist 2x 389wobei die zugehörige Fehlerfunktion E f (x, ¯x) =0für alle x. Wir folgerndaraus, dass f ′ (¯x)=m, falls f(x)=b + mx. Somit ist die Ableitung einerlinearen Funktion b + mx eine Konstante und entspricht der Steigung m.Wir halten fest, dass für m>0 die Funktion f(x)=b + mx ansteigt (mitwachsendem x), d.h. f(x) >f(¯x) für x>¯x und f(x)


390 23. Ableitungenfür f(x)=x 2 gilt f ′ (x)=2x. (23.10)Ein alternativer und kürzerer Weg zur Linearisierungsformel (23.9) ist:x 2 =(¯x +(x − ¯x)) 2 =¯x 2 +2¯x(x − ¯x)+(x − ¯x) 2 . (23.11)Wir sehen, dass x 2 für x0 ansteigt, was demVorzeichen der Ableitung f ′ (x)=2x entspricht.Wenn wir, um mit der Argumentation vertraut zu werden, die obigenBerechnungen insbesondere für ¯x = 1 wiederholen, erhalten wirx 2 =1+2(x − 1) + (x − 1) 2 .Somit hat die Ableitung von f(x)=x 2 in ¯x = 1 den Wert f ′ (1) = 2. Wirstellen x 2 und 1 + 2(x − 1) in Abb. 23.7 dar. Wir vergleichen einige Werteder Funktion x 2 mit der linearen Näherung 1+2(x−1) zusammen mit demFehler (x − 1) 2 in Abb. 23.8.43y = x 22y =1+2(x − 1)1012xAbb. 23.7. Linearisierung 1 + 2(x − 1) für x 2 in ¯x =1x f(x) f(1) + f ′ (1)(x − 1) E f (x, 1)0,7 0,49 0,4 0,090,8 0,64 0,6 0,040,9 0,81 0,8 0,011,0 1,0 1,0 0,01,1 1,21 1,2 0,011,2 1,44 1,4 0,041,3 1,69 1,6 0,09Abb. 23.8. Einige Werte von f(x)=x 2 , f(1) + f ′ (1)(x − 1) = 1 + 2(x − 1) undE f (x,1) = (x − 1) 2


23.7 Die Ableitung von x n ist nx n−123.7 Die Ableitung von x n ist nx n−1 391Wir berechnen nun die Ableitung der Monome f(x) =x n im Punkt ¯x,wobei n ≥ 2einenatürliche Zahl ist. Mit Hilfe der Binomialentwicklungkönnen wir (23.11) verallgemeinern:x n =(¯x + x − ¯x) n =¯x n + n¯x n−1 (x − ¯x)+E f (x, ¯x),wobei alle FehlerausdrückeE f (x, ¯x)=n(n − 1)¯x n−2 (x − ¯x) 2 + ···+(x − ¯x) n2mindestens zwei Faktoren (x − ¯x) enthalten,sodass|E f (x, ¯x)|≤K f (¯x)(x − ¯x) 2 .Dabei hängt K f (¯x)von¯x, x und n ab und ist sicherlich beschränkt, wennx und ¯x innerhalb eines beschränkten Intervalls liegen. Wir folgern, dassf ′ (¯x)=n¯x n−1 für alle ¯x, d.h. f ′ (x)=nx n−1 für alle x. Zusammengefasst:Für f(x)=x n gilt f ′ (x)=nx n−1 . (23.12)Für n = 2 treffen wir wieder auf die Formel f ′ (x)=2x für f(x)=x 2 .23.8 Die Ableitung von 1 x ist − 1 x 2 für x ≠0Wir berechnen nun die Ableitung der Funktion f(x) = 1 xfür x ≠0.Fürein x nahe bei ¯x ≠ 0 gilt1x = 1¯x ( 1 + x − 1¯x)= 1¯x (+ − 1 )(x − ¯x)= 1¯x (−x¯x+ 1¯x )2 (x − ¯x)+E,mitE =( 1¯x 2 − 1 )(x − ¯x)= 1x¯x x¯x 2 (x − ¯x)2 .Folglich gilt, wie gewünscht, |E|≤K|x − ¯x| 2 . Wir folgern, dass f(x)= 1 xdifferenzierbar in ¯x ist, mit der Ableitung f ′ (¯x)=− 1¯x 2 für ¯x ≠0,d.h.für f(x)= 1 x gilt f ′ (¯x)=− 1¯x 2 für ¯x ≠0. (23.13)23.9 Die Ableitung als FunktionIst eine Funktion f(x) differenzierbar in allen Punkten ¯x eines offenen IntervallsI, dann heißt f(x) differenzierbar auf I. Die Ableitung f ′ (¯x) ändert


392 23. Ableitungen525420315210151/x0−1/x 20−1−5−2−10−3−15−4−20−5−4 −2 0 2 4x−25−4 −2 0 2 4Abb. 23.9. Funktion f(x)= 1 x und ihre Ableitung f ′ (x)=− 1x 2 für x>0xsich im Allgemeinen mit ¯x. Wirkönnen daher die Ableitung f ′ (x) einerFunktion f(x), die auf einem Intervall I differenzierbar ist, als Funktionvon ¯x für ¯x ∈ I betrachten. Wie können den Namen der Variablen ¯xändern und über die Ableitung f ′ (x) als Funktion in x sprechen. Wir habendiesen Schritt bereits oben vollzogen. Somit können wir zu einer auf einemIntervall I differenzierbaren Funktion f(x) die Funktion f ′ (x) für x ∈ Izuordnen, die der Ableitung von f(x) entspricht.Wirkönnen daher vonder Ableitung f ′ (x) einer differenzierbaren Funktionf(x) sprechen. So istbeispielsweise die Ableitung von x 2 gleich 2x und die Ableitung von x 3 ist3x 2 .23.10 Schreibweise der Ableitung von f(x)als Df(x)Wir schreiben die Ableitung f ′ (x) vonf(x) auchDf(x), d.h.f ′ (x)=Df(x).Beachten Sie, dass D(f) der Definitionsbereich von f ist, wohingegen Df(x)die Ableitung von f(x) nachx bezeichnet.Wir können die wichtige Formulierung (23.12) auchfür f(x)=x n gilt f ′ (x)=Df(x)=nx n−1 (23.14)


oder23.11 Schreibweise der Ableitung von f(x) als dfdx393Dx n = nx n−1 für n =1, 2,... (23.15)schreiben. Dieses ist eines der wichtigsten Ergebnisse der Infinitesimalrechnung.Dabei nehmen wir an, dass n eine natürliche Zahl ist (inklusive desSonderfalls n = 0, falls wir uns darauf verständigen, dass x 0 =1für alle x).Unten werden wir diese Formulierung auf rationale n (und schließlich reellen) erweitern. Wir wiederholen, dass wir oben für x ≠ 0 bewiesen haben,dassfür f(x)= 1 x gilt f ′ (x)=Df(x)=− 1 x 2 ,was gleichbedeutend ist zu n = −1 in (23.14).Beispiel 23.1. Angenommen, Sie fahren mit einem Auto entlang der x-Achseund Ihre Position zur Zeit t, relativ zum Anfangspunkt (Zeit t =0),seis(t)=3×(2t−t 2 )km.Dabeiwirdt in Stunden gemessen und die positiveRichtung von s zeigt nach rechts. Ihre Geschwindigkeit ist s ′ (t)=6− 6t =6(1 − t) km/Stunde zur Zeit t. Da die Ableitung für 0 ≤ t


394 23. Ableitungen23.12 Ableitung als Grenzwertvon DifferenzenquotientenWir wiederholen, dass die Funktion f(x) in¯x differenzierbar ist mit derAbleitung f ′ (¯x), falls für ein x in einem offenen Intervall I, das¯x enthält,gilt, wobeif(x)=f(¯x)+f ′ (¯x)(x − ¯x)+E f (x, ¯x) (23.18)|E f (x, ¯x)|≤K f (¯x)|x − ¯x| 2 (23.19)mit der Konstanten K f (¯x). Ist x ≠¯x, können wir für x ∈ I durch x − ¯xdividieren und erhaltenwobeif(x) − f(¯x)x − ¯xder folgenden Ungleichung genügt:= f ′ (¯x)+R f (x, ¯x), (23.20)R f (x, ¯x)= E f(x, ¯x)x − ¯x(23.21)|R f (x, ¯x)|≤K f (¯x)|x − ¯x| für x ∈ I. (23.22)Ist nun {x i } ∞ i=1 eine Folge mit lim i→∞ x i =¯x mit x i ∈ I und x i ≠¯x für allei. Es gibt viele derartige Folgen. So können wir beispielsweise x i =¯x + i −1wählen oder x i =¯x +10 −i . Aus (23.22) folgt, dassund somit wegen (23.20)mit dem Differenzenquotientenlim R f(x i , ¯x) = 0 (23.23)i→∞f ′ (¯x) = limi→∞m i (¯x), (23.24)m i (¯x)= f(x i) − f(¯x), (23.25)x i − ¯xder von den beiden verschiedenen Punkten ¯x und x i abhängt. Der in (23.25)definierte Differenzenquotient m i (¯x) entspricht der Steigung der Sekanten,die die Punkte (¯x,f(¯x)) und (x i ,f(x i )) verbindet, vgl. Abb. 23.10, undkann als durchschnittliche Änderungsrate von f(x) zwischen¯x und x i interpretiertwerden.Die Gleichungf ′ f(x i ) − f(¯x)(¯x) = lim , (23.26)i→∞ x i − ¯x


23.12 Ableitung als Grenzwert von Differenzenquotienten 395f(x i)f(¯x)¯xx iAbb. 23.10. Die Sekante zwischen (¯x, f(¯x)) und (x i,f(x i))beschreibt die Ableitung f ′ (x) als Grenzwert der durchschnittlichen Änderungsratevon f(x) über das Intervall x i − ¯x dessen Länge gegen Null geht,wenn i gegen Unendlich strebt. Wir können daher f ′ (x) alslokale Änderungsratevon f(x) in¯x betrachten. Ist f(x) die Steuer zum Einkommenx, entsprichtf ′ (x) dem Einkommenssteuersatz in ¯x. Istf(x) einAbst<strong>and</strong>und x die Zeit, dann ist f ′ (x) diemomentane Geschwindigkeit zur Zeit ¯x.Alternativ können wir f ′ (¯x) als Steigung der Tangente von f(x)inx =¯xbetrachten, die sich als Grenzwert der Folge von Steigungen {m i (¯x)} vonSekanten durch die Punkte (¯x,f(¯x)) und (x i ,f(x i )) ergibt, wobei {x i } ∞ i=1eine Folge ist mit Grenzwert ¯x. Wir haben dies in Abb. 23.11 veranschaulicht.Sekantey = f(x)Tangente¯x x 4 x 3 x 2 x 1Abb. 23.11. Eine Folge von Sekanten, die sich an die Tangente in ¯x annähertBeispiel 23.2. Wir wollen nun die Ableitung von f(x)=x 2 in ¯x mit Hilfevon (23.24) berechnen. Sei x i =¯x +1/i. Die Steigung der Sekante durch


396 23. Ableitungen(¯x, ¯x 2 ) und (x i ,f(x i )) = (x i ,x 2 i )beträgtm i (¯x)= x2 i − ¯x2x i − ¯x = (x i − ¯x)(x i +¯x)=(x i +¯x).x i − ¯xDie Gleichung (23.24) liefertf ′ (¯x) = limi→∞m i (¯x) = limi→∞(2¯x + 1 i)=2¯xund so erhalten wir die bereits bekannte Formel Dx 2 =2x.23.13 Wie wird die Ableitung berechnet?Sei f(x) eine gegebene Funktion, für die wir die Ableitung f ′ (x) für ein¯x nicht analytisch berechnen können. Wir haben oben zwar analytischeBerechnungen für Polynome benutzt, aber keine Strategie vorgestellt, umdie Ableitung f ′ (x) für allgemeinere Funktionen f(x) zu bestimmen. DieFunktion f(x) mag beispielsweise nicht durch eine Formel gegeben sein,sondern als Resultat f(x) für x, das irgendwie berechnet wird.Dasselbe Problem stellt sich, wenn wir eine physikalische Geschwindigkeitüber Messungen bestimmen wollen. Ist etwa der Tachometer in unseremAuto kaputt, wie können wir dann die Geschwindigkeit zu einergewissen Zeit ¯x bestimmen? Natürlich kämen wir auf die Idee, ein Weginkrementf(x) − f(¯x)für eine Zeitintervall x − ¯x zu messen, wobei f(x)derGesamtweg ist, und dann den Quotienten f(x)−f(¯x)x−¯xzu bilden, um so dieDurchschnittsgeschwindigkeit über das Zeitintervall (¯x,x) zu bestimmen,die als Näherung für die momentane Geschwindigkeit zur Zeit ¯x dienenkann. Aber wie sollen wir die Länge des Zeitintervalls x−¯x wählen? Wählenwir x − ¯x zu klein, werden wir keine Änderung in der Position feststellenkönnen, d.h. wir beobachten f(x)=f(¯x), woraus wir die GeschwindigkeitNull folgern. Wählen wir x− ¯x dagegen zu groß, so kann sich die berechneteDurchschnittsgeschwindigkeit sehr stark von der gesuchten momentanenGeschwindigkeit in ¯x unterscheiden.Wir wollen nun mit Hilfe der Analysis das richtige Intervall x − ¯x suchen,um die Ableitung f ′ (¯x) einer gegebenen Funktion f(x) in¯x zu bestimmen.Dabei gehen wir davon aus, dass die Funktionswerte f(x) miteiner bestimmten Genauigkeit verfügbar sind. Aus der Definition von f ′ (¯x)erhalten wir für x nahe bei ¯x, x ≠¯x:mitf ′ (¯x)=f(x) − f(¯x)x − ¯x− E f(x, ¯x)x − ¯x∣ ∣∣∣ E f (x, ¯x)x − ¯x ∣ ≤ K f(¯x)|x − ¯x|.


Der Differenzenquotient23.13 Wie wird die Ableitung berechnet? 397f(x) − f(¯x)x − ¯xkann daher, bis auf einen Linearisierungsfehler der Größe K f (¯x)|x− ¯x|,alsNäherung von f ′ (¯x) betrachtet werden.Angenommen, wir würden die Größe f(x) − f(¯x) bis auf einen Fehlervon δf genau kennen. Wir gehen also davon aus, dass wir x und ¯x exaktkennen, aber die Funktionswerte f(x) und f(¯x) bei der Berechnung oder derMessung fehlerbehaftet sind, so dass wir einen Fehler von δf in f(x)−f(¯x)haben. Wir wissen, dass der Wert f(x) für ein x oft nur näherungsweiseaus Rechnungen bekannt ist.Der Fehler δf in f(x) − f(¯x) verursacht einen Fehler in der Größenordnung| δff(x)−f(¯x)x−¯x| für den Differenzenquotientenx−¯x. Somit haben wir einenGesamtfehler in f ′ (¯x) derGrößeδf∣x − ¯x ∣ + K f(¯x)|x − ¯x|, (23.27)der aus der Linearisierung und dem Fehler in f(x)−f(¯x) herstammt. Wennwir beide Fehlerbeiträge gleichsetzen, was uns die richtige Balance liefert,erhalten wir die Gleichungδf∣x − ¯x ∣ = K f|x − ¯x|,wobei wir K f = K f (¯x) schreiben, mit deren Hilfe wir das optimale Inkrement“√”δf|x − ¯x| =(23.28)K fberechnen können. Wählen wir |x − ¯x| kleiner, dann dominiert der Fehleranteil| δfx−¯x|.Wählen wir dagegen |x − ¯x| größer, dann dominiert derLinearisierungsfehler K f (¯x)|x − ¯x|.Wenn wir das optimale Inkrement in (23.27) einsetzen, erhalten wir einebeste“ Fehlerabschätzung” ∣ f ′ f(x) − f (¯x)(¯x) − x − ¯x ∣ ≤ 2√ δf √ K f . (23.29)Betrachten wir die zwei Formeln (23.28) und (23.29) für das optimaleInkrement und den zugehörigen kleinsten Fehler in f ′ (¯x), dann erkennenwir, dass dabei einige a priori Kenntnisse von δf und K f nötig sind. Wennwir keinerlei Vorstellungen von deren Größenordnungen haben, können wirkeine Abschätzung für das Inkrement x − ¯x treffen und wir werden nichtsüber den Fehler in der berechneten Ableitung wissen. Natürlich wird man invielen Fällen eine Vorstellung von der Größe von δf haben; ein Fehler, der


398 23. Ableitungensich aus Berechnungen oder Messungen ergibt. Aber es ist weniger ersichtlich,wie wir eine Vorstellung über die Größenordnung von K f erhalten.Wir werden unten auf diese Frage zurückkommen.Wir fassen zusammen: Wenn wir eine Näherung von f ′ (¯x) mit Hilfe desDifferenzenquotienten f(x)−f(¯x)x−¯xberechnen, sollten wir x − ¯x nicht zu kleinwählen, wenn wir einen Fehler in f(x) − f(¯x) erwarten. Daher mag dieGleichungf ′ f(x i ) − f(¯x)(¯x) = lim ,i→∞ x i − ¯xin der {x i } ∞ i=1 eine zu ¯x konvergente Folge mit x i ≠¯x ist, mit Vorsichtgenutzt werden. Wenn wir die Fälle oben untersuchen, bei denen wir dieAbleitung analytisch berechnen konnten, wie im Fall f(x)=x 2 , erkennenwir, dass wir tatsächlich durch x i − ¯x im Quotienten f(xi)−f(¯x)x i−¯xdividierenkonnten und so das gefährliche Auftauchen von x i −¯x im Nenner vermeidenkönnen. Beispielsweise nutzten wir bei der analytischen Berechnung vonDx 2 ,dassx 2 i − ¯x2x i − ¯x = (x i +¯x)(x i − ¯x)= x i +¯x,(x i − ¯x)woraus wir folgern konnten, dass x 2 =2x.23.14 Gleichmäßige Differenzierbarkeitauf einem IntervallWir bezeichen die Funktion f(x) differenzierbar auf dem Intervall I,wennf(x) für jedes ¯x ∈ I differenzierbar ist, d.h. es gibt für ¯x ∈ I Konstantenm(¯x) und K f (¯x), so dass für x nahe bei ¯xf(x)=(f(¯x)+m(¯x)(x − ¯x)) + E f (x, ¯x),|E f (x, ¯x)|≤K f (¯x)|x − ¯x| 2 .In vielen Fällen können wir ein und dieselbe Konstante K f (¯x) =K f füralle ¯x ∈ I wählen. Wir drücken dies dadurch aus, dass wir f(x) gleichmäßigdifferenzierbar auf I nennen. Lassen wir auch Änderungen von x in I zu, sokommen wir zu folgender Definition, die für uns unten noch sehr nützlichsein wird: Wir sagen, dass die Funktion f : I →Rgleichmäßig differenzierbarauf dem Intervall I mit Ableitung f ′ (¯x)in¯x ist, wenn es eine KonstanteK f gibt, so dass für x, ¯x ∈ If(x)=(f(¯x)+f ′ (¯x)(x − ¯x)) + E f (x, ¯x),|E f (x, ¯x)|≤K f |x − ¯x| 2 .Beachten Sie, dass das Wichtige dabei ist, dass K f nicht von ¯x abhängt,aber natürlich sehr wohl von der Funktion f und dem Intervall I.


23.15 Eine beschränkte Ableitung impliziert Lipschitz-Stetigkeit 39923.15 Eine beschränkte Ableitungimpliziert Lipschitz-StetigkeitAngenommen, dass f(x) gleichmäßig auf dem Intervall I =(a,b) differenzierbarsei und dass es eine Konstante L gibt, so dass für x ∈ I|f ′ (x)|≤L. (23.30)Wir werden nun zeigen, dass f(x) aufI Lipschitz-stetig zur Lipschitz-Konstanten L ist, d.h. wir werden zeigen, dass|f(x) − f(y)|≤L|x − y| für x, y ∈ I. (23.31)Das Ergebnis scheint uns völlig offensichtlich zu sein: Ist der Betrag dergrößtmöglichen Änderungsrate der Funktion f(x) durchL beschränkt, soist der Betrag der insgesamt möglichen Änderung |f(x)−f(y)| beschränktdurch L|x − y|.Steht f(x) für eine zurückgelegte Strecke und somit f ′ (x) für eine Geschwindigkeit,so besagt die Aussage, dass der Betrag des zurückgelegtenWeges |f(x) − f(y)| durch die zur Verfügung stehende Zeitspanne |x − y|multipliziert mit L beschränkt ist, wenn die Geschwindigkeit durch L beschränktist. Das ist doch einfach, mein lieber Watson!Wir werden dieses Ergebnis unten kurz beweisen, benötigen dazu allerdingsnoch ein Hilfsmittel (den Mittelwertsatz). Wir geben hier einen etwaslängeren Beweis.Nach den Annahmen gilt für x, y ∈ Iwobeif(x)=f(y)+f ′ (y)(x − y)+E f (x, y),|E f (x, y)|≤K f |x − y| 2mit einer Konstanten K f . Wir folgern, dass für x, y ∈ Iso dass für x, y ∈ I|f(x) − f(y)|≤(L + K f |x − y|)|x − y|,|f(x) − f(y)|≤¯L|x − y|mit ¯L = L + K(b − a). Damit haben wir unser Ziel fast erreicht; allerdingswurde L durch die etwas größere Lipschitz-Konstante ¯L ersetzt.Schränken wir x und y auf ein Teilintervall I δ von I der Länge δ ein, soerhalten wir|f(x) − f(y)|≤(L + Kδ)|x − y|.Indem wir δ verkleinern, können wir erreichen, dass L + Kδ so nahe an Lkommt, wie wir wollen. Seien nun x und y in I gegeben und sei x = x 0


400 23. Ableitungenδxyx 0 x 1 x 2 x i−1 x i x NAbb. 23.12. Unterteilung des Intervalls [x,y] in Teilintervalle der Länge 0 gilt, folgern wir, dass tatsächlichi=1|f(x) − f(y)|≤L|x − y|, für x, y ∈ I,womit das Erwünschte bewiesen ist. Wir fassen dies in folgendem Satzzusammen, den wir unten ausführlich benutzen werden:Satz 23.1 Angenommen, f(x) sei gleichmäßig differenzierbar auf dem IntervallI =(a,b) und angenommen, es gebe eine Konstante L, so dass|f ′ (x)|≤L, für x ∈ I.Dann ist f(x) Lipschitz-stetig auf I zur Lipschitz-Konstanten L.23.16 Ein etwas <strong>and</strong>erer BlickwinkelIn vielen Büchern der Infinitesimalrechnung wird die Ableitung einer Funktionf :R→R in einem Punkt ¯x folgendermaßen definiert: Existiert derGrenzwertf(x i ) − f(¯x)lim(23.32)i→∞ x i − ¯xfür jede Folge {x i }, die gegen ¯x konvergiert (lim i→∞ x i =¯x mit der Annahme,dass x i ≠¯x), so bezeichnen wir den (eindeutigen) Grenzwert alsdie Ableitung von f(x) inx =¯x und schreiben dafür f ′ (¯x). Wir haben in(23.24) bewiesen, dassf ′ f(x i ) − f(¯x)(¯x) = lim ,i→∞ x i − ¯x


23.17 Swedenborg 401falls f(x) entsprechend unserer Definition mit der Ableitung f ′ (¯x) differenzierbarist, da wir annehmen, dass∣ f ′ (¯x) − f(x i) − f(¯x)x i − ¯x ∣ ≤ K f(¯x)|x i − ¯x|. (23.33)Das bedeutet, dass unsere Definition der Ableitung etwas stärkere Anforderungenstellt, als es in vielen Infinitesimalbüchern üblich ist. Wirnehmen an, dass die Grenzwertbildung gleichmäßig durch (23.33) erfolgt,während die Definition (23.32) nur fordert, dass der Grenzwert ohne Angabeeiner Konvergenzrate existiert (was vielen <strong>Mathematik</strong>ern gefällt, daes größtmögliche Allgemeinheit bedeutet). In den meisten Fällen stimmenbeide Konzepte überein, aber in einigen sehr speziellen Fällen würde dieAbleitung nach den üblichen Infinitesimalbüchern existieren, aber nichtnach unserer Definition. Wir könnten natürlich unsere Definition lockernund die Beschränkung der rechten Seite in (23.33) zu K f (¯x)|x i − ¯x| θ mit einerpositiven Konstanten θ


402 23. AbleitungenAbb. 23.13. Emanuel Swedenborg, schwedisches Universalgenie, als jungerMann: ”Der Verkehr zwischen Seele und Leib ist daher nicht durch irgendeinenphysischen Strom oder irgendeine H<strong>and</strong>lung des Körpers auf den Geist oderdie Seele beeinflussbar; denn das Niedere kann das Höhere nicht beeinflussen unddie Natur kann nicht in Spirituelles eindringen. Dennoch kann sich die Seele ansensorische Änderungen im Gehirn anpassen und geistige Einsichten und Vorstellungenerzeugen. Sie kann auch die Freigabe der in ihr gespeicherten Energiezeitlich steuern und sie aus einem intelligenten Antrieb heraus in motivierte oderlebende H<strong>and</strong>lungen freisetzen“Aufgaben zu Kapitel 2323.1. Beweisen Sie direkt aus der Definition, dass 3x 2 die Ableitung von x 3 und4x 3 die Ableitung von x 4 ist.23.2. Beweisen Sie direkt aus der Definition, dass die Ableitung der Funktionf(x) = √ x = x 1 2 gleich ist zu f ′ (x) = 1 2 x− 1 2 für x>0. Hinweis: Benutzen Sie( √ x − √¯x)( √ x + √¯x)=x − ¯x.23.3. Berechnen Sie die Ableitung von √ x numerisch für verschiedene Wertevon x und untersuchen Sie, wie der Fehler vom benutzten Inkrement und derGenauigkeit in der Berechnung von √ x abhängt.23.4. Untersuchen Sie die symmetrische Differenzenquotientennäherungf ′ (¯x) ≈f(¯x + h) − f(¯x − h)hfürh>0.


Aufgaben zu Kapitel 23 403Wie sieht eine optimale Wahl von h aus, unter der Annahme, dass f(¯x ±h)nichtexakt bekannt ist Hinweis: Ein Blick vorwärts zu Taylors Formeln der Ordnung2 mag hilfreich sein.23.5. Berechnen Sie die Ableitung von x n numerisch für verschiedene Werte vonx und n und untersuchen Sie, wie der Fehler vom benutzten Inkrement abhängt.23.6. Können Sie aus der Definition die Ableitung von sin(x) und cos(x) berechnen?23.7. Bestimmen Sie die kleinstmögliche Lipschitz-Konstante für die Funktionf(x)=x 3 auf D(f)=[1,4].23.8. (Regel von l’Hopital). Seien f : Ê → Ê und g : Ê → Ê differenzierbareFunktionen auf einem offenen Intervall I,dasdie0enthält, und sei f(0) = g(0) =0. Beweisen Sie, dassf(x i)limi→∞ g(x = f ′ (0)i) g ′ (0)für g ′ (0) ≠0,wobei{x i} ∞ i=1 eine Folge mit Grenzwert lim i→∞ x i = 0 ist undx i ≠0für alle i. Diesistdieberühmte l’Hopitalsche Regel, die l’Hopital 1713 inseinem Buch Analyse de infiment petit, dem ersten Buch zur Infinitesimalrechnung,vorstellte! Beachten Sie, dass f(0) = 0 nicht wohl definiert ist. Hinweis:g(0) 0Schreiben Sie f(x i)=f(0) + f ′ (x i)x i + E f (x i,0) etc.23.9. Bestimmen Sie lim i→∞f(x i )g(x i ) für f(x)=√ x − 1 und g(x)=x − 1. Dabeiist {x i} ∞ i=1 eine konvergierende Folge mit lim i→∞ x i = 1 und x i ≠0für alle i.Erweitern Sie das Ergebnis auf f(x)=x r − 1für rationales r.


24AbleitungsregelnCalculemus. (Leibniz)Wenn ich einen Gedankengang beendet habe, kommt er mir oft soeinfach vor, dass ich mich frage, ob ich ihn von jem<strong>and</strong>em gestohlenhabe. (Horace Engdahl)24.1 EinleitungWir behaupten und beweisen nun einige Regeln, um Ableitungen von Kombinationenvon Funktionen zu berechnen, so dass wir hinterher Kombinationenvon Ableitungen der Funktionen haben. Diese Ableitungsregeln bildeneinen Teil der Infinitesimalrechnung, der mit Hilfe von Software zur symbolischenManipulation automatisiert werden kann. Im Unterschied dazuwerden wir unten sehen, dass Integration, die <strong>and</strong>ere wichtige Operationder Infinitesimalrechnung, nicht in demselben Ausmaß automatisiert werdenkann. Daher kommt es, dass eine bekannte Software zur symbolischenManipulation in der Infinitesimalrechnung Derive (= bilde Ableitungen)und nicht Integrate (= integriere) heißt.Die folgenden Ableitungsregeln sind grundlegend und werden im Weiterenoft benutzt. Sie bilden das Rückgrat der symbolischen Infinitesimalrechnung.Wenn wir in die Beweise eintauchen, werden wir mit unterschiedlichenwichtigen Gesichtspunkten der Ableitung vertraut und bereiten unsso darauf vor, unsere eigene Version von Derive zu schreiben.


406 24. Ableitungsregeln24.2 Regel für LinearkombinationenAngenommen, f(x) und g(x) seien zwei auf einem offenen Intervall I differenzierbareFunktionen und sei ¯x ∈ I. Nach der Definition gibt es FehlerfunktionenE f (x, ¯x) und E g (x, ¯x), die für x nahe bei ¯xf(x)=f(¯x)+f ′ (¯x)(x − ¯x)+E f (x, ¯x),g(x)=g(¯x)+g ′ (¯x)(x − ¯x)+E g (x, ¯x)(24.1)erfüllen mit|E f (x, ¯x)|≤K f |x − ¯x| 2 , |E g (x, ¯x)|≤K g |x − ¯x| 2 , (24.2)wobei K f und K g konstant sind. Die Addition ergibtf(x)+g(x)=f(¯x)+g(¯x)+(f ′ (¯x)+g ′ (¯x))(x − ¯x)Dies kann auch in der Form+E f (x, ¯x)+E g (x, ¯x).(f + g)(x)=(f + g)(¯x)+(f ′ (¯x)+g ′ (¯x))(x − ¯x)+E f+g (x, ¯x) (24.3)geschrieben werden mitAus (24.2) erhalten wirE f+g (x, ¯x)=E f (x, ¯x)+E g (x, ¯x).|E f+g (x, ¯x)|≤(K f + K g )|x − ¯x| 2 .Die Gleichung (24.3) zeigt, dass (f + g)(x) in¯x differenzierbar ist mit(f + g) ′ (¯x)=f ′ (¯x)+g ′ (¯x). (24.4)Wenn wir die erste Zeile von (24.1) mit einer Konstanten c multiplizieren,erhalten wir(cf)(x)=(cf)(¯x)+cf ′ (¯x)(x − ¯x)+cE f (x, ¯x). (24.5)Dies beweist, dass (cf)(x) in¯x differenzierbar ist, wenn f(x)in¯x differenzierbarist, wobei(cf) ′ (¯x)=cf ′ (¯x). (24.6)Wir fassen dies zusammen:Satz 24.1 Sind f(x) und g(x) differenzierbare Funktionen auf einem offenenIntervall I und c eine Konstante, dann sind auch (f + g)(x) und(cf)(x) auf I differenzierbar für alle x ∈ I:(f + g) ′ (x)=f ′ (x)+g ′ (x) oder D(f + g)(x)=Df(x)+Dg(x) (24.7)und(cf) ′ (x)=cf ′ (x) oder D(cf)(x)=cDf(x). (24.8)


24.3 Produktregel 407Beispiel 24.1.D ( 2x 3 +4x 5 + 7 x)=6x 2 +20x 4 − 7 x 2 .Beispiel 24.2. Mit Hilfe des Satzes und Dx i = ix i−1 erhalten wir die Ableitungvonzun∑f(x)=a 0 + a 1 x + a 2 x 2 + ···+ a n x n = a i x ii=0n∑f ′ (x)=a 1 +2a 2 x 2 + ···+ na n x n−1 = ia i x i−1 .i=124.3 ProduktregelWenn wir linke und rechte Seite der beiden Gleichungen (24.1) jeweils mitein<strong>and</strong>ermultiplizieren, erhalten wir(fg)(x)=f(x)g(x)=f(¯x)g(¯x)Wir folgern, dass+ f ′ (¯x)g(¯x)(x − ¯x)+f(¯x)g ′ (¯x)(x − ¯x)+f ′ (¯x)g ′ (¯x)(x − ¯x) 2+(g(¯x)+g ′ (¯x)(x − ¯x))E f (x, ¯x)+(f(¯x)+f ′ (¯x)(x − ¯x))E g (x, ¯x)+E f (x, ¯x)E g (x, ¯x).(fg)(x)=(fg)(¯x)+ ( f ′ (¯x)g(¯x)+f(¯x)g ′ (¯x) ) (x − ¯x)+E fg (x, ¯x)mit E fg (x, ¯x), quadratisch in x − ¯x. Somit haben wir bewiesen:Satz 24.2 (Produktregel) Sind f(x) und g(x) auf I differenzierbar,dann ist auch (fg)(x) auf I differenzierbar mit(fg) ′ (x)=f(x)g ′ (x)+f ′ (x)g(x), (24.9)d.h.D(fg)(x)=Df(x)g(x)+f(x)Dg(x). (24.10)Beispiel 24.3.D ( (10 + 3x 2 − x 6 )(x − 7x 4 ) )=(6x − 6x 5 )(x − 7x 4 )+(10+3x 2 − x 6 )(1 − 28x 3 ).


408 24. Ableitungsregeln24.4 KettenregelWir wollen nun die Ableitung der zusammengesetzten Funktion (f◦g)(x)=f(g(x)) mit Hilfe von Ausdrücken der Ableitungen f ′ (y)= dfdy und g′ (x)=dgdxberechnen. Angenommen, g(x) sei gleichmäßig differenzierbar auf einemoffenen Intervall I. Seig(x) ferner Lipschitz-stetig auf I zur Lipschitz-Konstanten L g und ¯x ∈ I. Weiterhin sei f(y) gleichmäßig auf einem offenenIntervall J differenzierbar, das ȳ = g(¯x) enthält. Nach der Definition gibtes Fehlerfunktionen E f (y,ȳ) und E g (x, ¯x), die für y nahe bei ȳ und x nahebei ¯x die Gleichungenf(y)=f(ȳ)+f ′ (ȳ)(y − ȳ)+E f (y,ȳ),g(x)=g(¯x)+g ′ (¯x)(x − ¯x)+E g (x, ¯x)(24.11)erfüllen mit|E f (y,ȳ)|≤K f |y − ȳ| 2 , |E g (x, ¯x)|≤K g |x − ¯x| 2 , (24.12)wobei K f und K g Konstanten sind, die von y bzw. x unabhängig sind. Ausder Annahme folgt weiter|g(x) − g(¯x)|≤L g |x − ¯x|. (24.13)Wenn wir y = g(x) setzen und daran denken, dass ȳ = g(¯x), erhalten wirf(g(x)) = f(y)=f(ȳ)+f ′ (ȳ)(y − ȳ)+E f (y,ȳ)= f(g(¯x)) + f ′ (g(¯x))(g(x) − g(¯x)) + E f (g(x),g(¯x)).Die Substitution von g(x) − g(¯x)=g ′ (¯x)(x − ¯x)+E g (x, ¯x) liefertf(g(x)) = f(g(¯x)) + f ′ (g(¯x))g ′ (¯x)(x − ¯x)Da aus (24.12) und (24.13) folgt, dass+ f ′ (g(¯x))E g (x, ¯x)+E f (g(x),g(¯x)).|E f (g(x),g(¯x))|≤K f |g(x) − g(¯x)| 2 ≤ K f L 2 g |x − ¯x|2 ,erhalten wir schließlich|f ′ (g(¯x))E g (x, ¯x)|≤|f ′ (g(¯x))| K g |x − ¯x| 2 ,(f ◦ g)(x)=(f ◦ g)(¯x)+f ′ (g(¯x))g ′ (¯x)(x − ¯x)+E f◦g (x, ¯x),wobei E f◦g (x, ¯x) inx − ¯x quadratisch ist. Somit haben wir bewiesen:Satz 24.3 (Kettenregel) Sei g(x) gleichmäßig differenzierbar auf einemoffenen Intervall I und Lipschitz-stetig auf I. Sei ferner f gleichmäßig


24.4 Kettenregel 409differenzierbar auf einem offenen Intervall J, das g(x) für x ∈ I enthält.Dann ist die zusammengesetzte Funktion f(g(x)) differenzierbar auf I,mitoder(f ◦ g) ′ (x)=f ′ (g(x))g ′ (x), für x ∈ I (24.14)dhdx = df dydy dx , (24.15)wobei h(x) =f(y) und y = g(x), d.h.h(x) =f(g(x)) = (f ◦ g)(x). Einealternative Schreibweise istmit Df = dfdy .D(f(g(x)) = Df(g(x))Dg(x) (24.16)Beispiel 24.4. Sei f(y) =y 5 und y = g(x) =9− 8x, sodassf(g(x)) =(f ◦g)(x)=(9−8x) 5 . Wir erhalten f ′ (y)=5y 4 und g ′ (x)=−8, und somitD((9 − 8x) 5 )=5y 4 g ′ (x)=5(9− 8x) 4 (−8) = −40(9 − 8x) 4 .Beispiel 24.5.D ( 7x 3 +4x +6 ) 18=18(7x 3 +4x +6 ) 17D(7x 3 +4x +6)=18 ( 7x 3 +4x +6 ) 17(21x 2 +4).Beispiel 24.6. Wir betrachten die zusammengesetzte Funktion f(g(x)) mitf(y)=1/y, d.h. die Funktion h(x)= 1g(x),wobeig(x) eine gegebene Funktionist, mit g(x) ≠0.DaDf(y) =− 1y, erhalten wir mit Hilfe der Kettenregel2 Dh(x)=D 1g(x) = −1(g(x)) 2 g′ (x)= −g′ (x)g(x) 2 , (24.17)solange g(x) differenzierbar ist und g(x) ≠0.Beispiel 24.7. Aus Beispiel 24.6 und der Kettenregel erhalten wir für n ≥ 1:ddx x−n = d ( ) 1dx x n = −1 d(x n ) 2 dx xn= −1x 2n × nxn−1 = −nx −n−1 .Dadurch wird die Gleichung Dx m = mx m−1 auf negative ganze Zahlenm = −1, −2,...erweitert.


410 24. AbleitungsregelnBeispiel 24.8. Die Kettenregel kann auch rekursiv benutzt werden:( ((d) ) 3 4 5(1 − x) 2 +1 +2 +3)dx(( ) 3 4 4 ( ( ) ) 3 3=5((1 − x) +1) 2 +2 +3)× 4 (1 − x) 2 +1 +2(2× 3 (1 − x) +1) 2 × 2(1 − x) × (−1).24.5 QuotientenregelSeien f(x) und g(x) differenzierbar auf I. Wir suchen die Ableitung von( f g )(x)=f(x) g(x) in ¯x. Die Anwendung der Produktregel auf f(x) 1g(x) = f(x)g(x)liefert mit Beispiel 24.6( ) ′ f(¯x)=f ′ (¯x)gwenn g(¯x) ≠ 0. Somit haben wir bewiesen:1g(¯x) + f(¯x)−g′ (¯x)g(¯x) 2 = f ′ (¯x)g(¯x) − f(¯x)g ′ (¯x)g(¯x) 2 ,Satz 24.4 (Quotientenregel) Seien f(x) und g(x) differenzierbar aufdem offenen Intervall I.Danngiltfür x ∈ I( ) ′ f(x)= f ′ (x)g(x) − f(x)g ′ (x)gg(x) 2 ,falls g(x) ≠0.Beispiel 24.9.D( ) 3x +4x 2 = 3 × (x2 − 1) − (3x +4)× 2x− 1 (x 2 − 1) 2 .Beispiel 24.10.(d x 3 ) 9+ xdx (8 − x) 6( x 3 ) 8 (+ x d x 3 )+ x=9(8 − x) 6 dx (8 − x) 6( x 3 ) 8+ x (8 − x) 6 d=9dx (x3 + x) − (x3 + x) ddx(8 − x)6(8 − x) 6 ( ) (8 − x)62( x 3 ) 8+ x (8 − x) 6 (3x 2 +1)− (x 3 + x)6(8 − x) 5 ×−1=9(8 − x) 6 (8 − x) 12 .


24.6 Ableitungen von Ableitungen: f (n) = D n f = dn fdx n 41124.6 Ableitungen von Ableitungen:f (n) = D n f = dn fdx nSei f(x) eine Funktion mit Ableitung f ′ (x). Da f ′ (x) eine Funktion ist,kann sie auch wieder differenzierbar sein. Dadurch würden wir beschreiben,wie sich die Änderungsrate in jedem Punkt x ändert. Die Ableitung derAbleitung f ′ (x) vonf(x) wirdzweite Ableitung von f(x) genanntundgeschrieben.f ′′ (x)=D 2 f(x)= d2 fdx 2 =(f ′ ) ′ (x)Beispiel 24.11. Für f(x)=x 2 , f ′ (x)=2x und f ′′ (x)=2.Beispiel 24.12. Für f(x) =1/x, f ′ (x) =−1/x 2 = −x −2 und f ′′ (x) =−(−2)x −3 =2/x 3 .Wir können auch die zweite Ableitung ableiten und erhalten so die dritteAbleitung:f ′′′ (x)=D 3 f(x)= d3 fdx 3 =(f ′′ ) ′ (x),insofern die Funktionen differenzierbar sind. Wir können die Ableitungf (n) = D n f von f der Ordnung n rekursiv definieren:f (n) (x)=D n f(x)= dn fdx n =(f(n−1) ) ′ (x)=D(D n−1 f)(x),wobei f ′ (x)=f (1) (x)=Df(x), f ′′ (x)=f (2) (x)=D 2 f(x), usw.Die Ableitung des Weges nach der Zeit ist die Geschwindigkeit. Die Ableitungder Geschwindigkeit nach der Zeit wird Beschleunigung genannt.Die Geschwindigkeit gibt an, wie schnell sich die Position eines Objektsmit der Zeit verändert. Die Beschleunigung gibt an, wie sehr das Objektmit der Zeit schneller oder langsamer wird (Geschwindigkeitsänderungen).Beispiel 24.13. Ist f(x) =x 4 ,dannDf(x) =4x 3 , D 2 f(x) =12x 2 ,D 3 f(x)=24x, D 4 f(x) = 24 und D 5 f(x) ≡ 0.Beispiel 24.14. Die n+1. Ableitung eines Polynoms vom Grade n ist Null.Beispiel 24.15. Ist f(x)=1/x,dannf(x)=x −1 ,Df(x)=−1 × x −2 ,D 2 f(x)=2× x −3 ,D 3 f(x)=−6 × x −4.D n f(x)=(−1) n × 1 × 2 × 3 ×···×nx −n−1 =(−1) n n!x −n−1 .


412 24. Ableitungsregeln24.7 Einseitige AbleitungenWir können auch Differenzierbarkeit von rechts in einem Punkt ¯x definieren.Die Definition entspricht der, die wir oben gegeben haben, mit der Einschränkung,dass x ≥ ¯x. Um genauer zu sein, wird die Funktion f : J →Rauf J =[¯x, b] mitb>¯x rechtsseitig differenzierbar in ¯x genannt, wenn esKonstanten m(¯x) und K f (¯x) gibt, so dass für ¯x ∈ [¯x,b]|f(x) − (f(¯x)+m(¯x)(x − ¯x))|≤K f (¯x)|x − ¯x| 2 . (24.18)Wir sagen, dass die rechtsseitige Ableitung von f(x) in¯x gleich m(¯x) istund wir bezeichnen die rechtsseitige Ableitung mit f + ′ (¯x)=m(¯x).Die linksseitige Ableitung f − ′ (¯x) =m(¯x) definieren wir analog mit derEinschränkung x ≤ ¯x.InbeidenFällen fordern wir einfach, dass die Linearisierungsabschätzungfür x auf einer Seite von ¯x gilt.Beispiel 24.16. Die Funktion f(x) =|x| ist für ¯x ≠ 0 differenzierbar mitder Ableitung f ′ (¯x) =1für ¯x >0 und f ′ (¯x) =−1 für ¯x


24.8 Quadratische Näherung: Taylor-Formel zweiter Ordnung 413natürliche Verallgemeinerung ist, nach der ”besten“ quadratischen Näherungder Formf(x)=f(¯x)+m 1 (¯x)(x − ¯x)+m 2 (¯x)(x − ¯x) 2 + E f (x, ¯x) (24.19)für ein x nahe bei ¯x zu suchen, wobei m 1 (¯x) und m 2 (¯x) Konstanten sind.Die Fehlerfunktion E f (x, ¯x) istnunkubisch in x − ¯x, d.h.|E f (x, ¯x)|≤K f (¯x)|x − ¯x| 3 (24.20)mit konstantem K f (¯x). Natürlich ist K f (¯x)|x − ¯x| 3 für kleines |x − ¯x| vielkleiner als m 1 (¯x)(x − ¯x) und m 2 (¯x)(x − ¯x) 2 , falls m 1 (¯x) oderm 2 (¯x) nichtzufälligerweise Null sind.Wenn (24.19) für x in der Nähe von ¯x gilt, dann ist m 1 (¯x) =f ′ (¯x), dam 2 (¯x)(x− ¯x) 2 +E f (x, ¯x) quadratisch in x− ¯x ist. Wenn (24.19) gilt, habenwir folglichf(x)=f(¯x)+f ′ (¯x)(x − ¯x)+m 2 (¯x)(x − ¯x) 2 + E f (x, ¯x). (24.21)Als Nächstes wollen wir die Konstante m 2 (¯x) bestimmen. Dazu differenzierenwir (24.21) nach x und erhaltenf ′ (x)=f ′ (¯x)+2m 2 (¯x)(x − ¯x)+ ddx E f(x, ¯x). (24.22)Wir wollen nun annehmen, dass für x nahe bei ¯xd∣dx E f(x, ¯x)∣ ≤ M f(¯x)|x − ¯x| 2 (24.23)gilt, mit konstantem M f (¯x). Dabei müssen wir beachten, dass die Ableitungdie Ordnung von |x − ¯x| um eins von 3 auf 2 reduziert. Dieses Phänomenwerden wir unten oft wieder finden. Mit (24.23) folgt aus der Definitionvon f ′′ (¯x), dass f ′′ (¯x)=(f ′ ) ′ (¯x)=2m 2 (¯x), d.h.m 2 (¯x)= 1 2 f ′′ (¯x).Somit gelangen wir zu einer Näherungsformel der Formf(x)=f(¯x)+f ′ (¯x)(x − ¯x)+ 1 2 f ′′ (¯x)(x − ¯x) 2 + E f (x, ¯x), (24.24)für x nahe bei ¯x,mit|E f (x, ¯x)|≤K f (¯x)|x− ¯x| 3 für eine Konstante K f (¯x).Beispiel 24.18. Wir betrachten die Funktion f(x) = 1 x¯x = 1. Dabei werden wir ausnutzen, dass für y ≠ −111+y =1− y 11+yfür x nahe bei


414 24. Ableitungsregelngilt, was wir sofort verifizieren können, wenn wir mit 1 + y multiplizieren.Somit ist( )11+y =1− y 11+y =1− y 11 − y1+y=1− y + y 2 11+y =1− y + y2 − y 3 11+y .Wir wählen y = x − 1 und erhalten1x = 11+(x − 1) =1− (x − 1) + (x − (x − 1)2 1)3−1+(x − 1) . (24.25)Wir erkennen, dass das quadratische Polynom1 − (x − 1) + (x − 1) 2eine Näherung für 1 xist für x nahe bei ¯x. Dabei ist der Fehler kubisch inx − ¯x. Als direkte Folgerung aus dieser Entwicklung erhalten wir f(1) = 1,f ′ (1) = −1 und f ′′ (1) = 2. Wir haben die Näherung in Abb. 24.1 dargestelltund einige Wert der Näherung in Abb. 24.2 wiedergegeben.4y = 1 x3y =1− (x − 1) + (x − 1) 2210x0.5 1.0 1.5 2.0Abb. 24.1. Quadratische Näherung 1 − (x − 1) + (x − 1) 2 von 1/x nahe ¯x =1Weiter unten werden wir unter der Bezeichnung Taylor-Formel,f(x)=f(¯x)+f ′ (¯x)(x − ¯x)+ 1 2 f ′′ (¯x)(x − ¯x) 2 + E f (x, ¯x) (24.26)für x nahe bei ¯x schreiben, wenn die Funktion f(x) dreimal differenzierbarist mit |f (3) (x)| ≤6K f (¯x) für x nahe bei ¯x und einer Konstanten K f (¯x).Dabei ist die Fehlerfunktion E f (x, ¯x) kubisch in x − ¯x, genauer|E f (x, ¯x)|≤K f (¯x)|x − ¯x| 3 , für x nahe bei ¯x. (24.27)Weiterhin ist ddx E f(x, ¯x) quadratisch in x−¯x, d.h. die Taylor-Formel liefertuns die quadratische Näherung, die wir in (24.19) gesucht haben.


24.9 Ableitung einer inversen Funktion 415x 1/x 1 − (x − 1) + (x − 1) 2 E f (x, 1)0,7 1,428571 1,39 0,0385710,8 1,25 1,22 0,030,9 1,111111 1,11 0,001111,0 1,0 1,0 0,01,1 0,909090 0,91 0,0009091,2 0,833333 0,84 0,006661,3 0,769230 0,79 0,02077Abb. 24.2. Einige Werte von f(x) = 1/x, derquadratischenNäherung1 − (x − 1) + (x − 1) 2 und des Fehlers E f (x,1)24.9 Ableitung einer inversen FunktionSei f :(a,b) →R differenzierbar in ¯x ∈ (a,b), so dass für x nahe bei ¯xf(x)=f(¯x)+f ′ (¯x)(x − ¯x)+E f (x, ¯x) (24.28)gilt, wobei |E f (x, ¯x)| ≤K f (¯x)(x − ¯x) 2 mit konstantem K f (¯x). Angenommen,dass f ′ (¯x) ≠0,sodassf(x) monoton anwachsend oder abfallendist, für x nahe bei ¯x. Dann hat die Gleichung y = f(x) eine eindeutigeLösung x für y nahe bei ȳ = f(¯x). Dadurch wird x als Funktion von ydefiniert. Diese Funktion wird Inverse der Funktion y = f(x)genanntundx = f −1 (y) geschrieben, vgl. Abb. 24.3.yy = f(x)yy = f(x)y = f(x)yxxx = f −1 (y)xAbb. 24.3. Die Funktion y = f(x) und ihre Inverse x = f −1 (y)Können wir die Ableitung der Funktion x = f −1 (y) nachy für y nahebei ȳ = f(¯x) berechnen? Dazu formulieren wir (24.28) um, zud.h.y =ȳ + f ′ (¯x)(f −1 (y) − f −1 (ȳ)) + E f (f −1 (y),f −1 (ȳ)),f −1 (y)=f −1 (ȳ)+ 1 1f ′ (y − ȳ) −(¯x) f ′ (¯x) E f(f −1 (y),f −1 (ȳ)). (24.29)


416 24. AbleitungsregelnNunnehmenwiran,dassf −1 Lipschitz-stetig sei auf einem offenen IntervallJ um ȳ, sodass|f −1 (y) − f −1 (ȳ)|≤L f −1|y − ȳ| für y ∈ J.Dann ist für y benachbart zu ȳ1|f ′ (¯x) E f(f −1 (y),f −1 (ȳ))|≤ 1|f ′ (¯x)| K f(¯x)(L f −1) 2 |y − ȳ| 2 .Wir erkennen mit (24.29), dass die Ableitung Df −1 (ȳ) vonf −1 (y) nachygleich1f ′ (¯x) ist, d.h. Df −1 (ȳ)= 1f ′ (¯x) , (24.30)wobei ȳ = f(¯x). Zusammengefasst heißt das:Satz 24.5 Sei y = f(x) differenzierbar nach x in ¯x und f ′ (¯x) ≠0.Dannist die inverse Funktion x = f −1 (y) differenzierbar nach y in ȳ = f(¯x) mitder Ableitung Df −1 (ȳ)= 1f ′ (¯x) .Beispiel 24.19. Die Inverse der Funktion y = f(x) =x 2 für x>0istdie Funktion x = f −1 (y) = √ y,diefür y>0 definiert ist. Es folgt, dassD √ y = 1f ′ (x) = 12x = 12 √ y. Indem wir y gegen x austauschen, erhalten wirfür x>0d √ √ 1x = D x =dx 2 √ x oder 1Dx1 2 =2 x− 1 2 . (24.31)24.10 Implizite AbleitungWir geben ein Beispiel für eine Technik, die implizite Ableitung genanntwird, um die Ableitung der Funktion x p qzu berechnen, wobei p und qganze Zahlen sind mit q ≠ 0 und x>0. Wir wissen, dass die Funktiony = x p q die eindeutige Lösung der Gleichung y q = x p ist bei gegebenemx>0. Daher können wir y als Funktion von x betrachten und y(x)=x p qschreiben und wir erhalten(y(x)) q = x p für x>0. (24.32)Angenommen, dass y(x)nachx differenzierbar sei mit der Ableitung y ′ (x),dann erhalten wir durch Ableitung beider Seiten von (24.32) nach x mitHilfe der Kettenregel für die linke Seite:q(y(x)) q−1 y ′ (x)=px p−1 .


24.11 Partielle Ableitung 417Daraus folgern wir, indem wir y(x)=x p qeinsetzen:Wir schließen damit, dassy ′ (x)= p q x− p q (q−1) x p−1 = p q x p q −1 .Dx r = rx r−1 für rationales r und x>0, (24.33)wobei wir die Berechnung als Anzeichen dafür nehmen, dass die Ableitungtatsächlich existiert.Vorausgesetzt, dass die Inverse x = f −1 (y) zur Funktion y = f(x) existiert,wobei wir y = y(x)=f(x) als Funktion von x und D = ddy betrachten,dann liefert das Ableiten beider Seiten von x = f −1 (y) nachx1=Df −1 (y)f ′ (x),womit wir wiederum (24.30) erhalten. Damit haben wir die Verbindungzum vorherigen Abschnitt hergestellt.24.11 Partielle AbleitungWir haben inzwischen einige Erfahrung beim Umgang mit Ableitungenreellwertiger Funktionen f :R→Reiner reellen Variablen x gewonnen.Unten werden wir reellwertige Funktion mehrerer reeller Variablen betrachten,was uns zu partiellen Ableitungen führen wird. Wir wollen hier einenersten Einblick vermitteln und betrachten dazu eine reellwertige Funktionf :R ×R →R zweier reeller Variablen, d.h. für jedes x 1 ∈Rund x 2 ∈Rerhalten wir eine reelle Zahl f(x 1 ,x 2 ). So steht beispielsweisef(x 1 ,x 2 )=15x 1 +3x 2 (24.34)für die Gesamtkosten im Mittagessen/Eiscreme Modell, wobei x 1 für dieMenge Fleisch und x 2 für die Menge Eiscreme steht. Um die partielle Ableitungder Funktion f(x 1 ,x 2 )=15x 1 +3x 2 nach x 1 zu berechnen, haltenwir die Variable x 2 konstant und berechnen die Ableitung der Funktionf 1 (x 1 )=f(x 1 ,x 2 ) als Funktion von x 1 .Soerhaltenwir df1dx 1= 15 und wirschreiben∂f=15∂x 1für die partielle Ableitung von f(x 1 ,x 2 )nachx 1 . Ähnlich berechnen wir diepartielle Ableitung der Funktion f(x 1 ,x 2 )=15x 1 +3x 2 nach x 2 , indem wirdie Variable x 1 konstant halten und die Ableitung der Funktion f 2 (x 2 )=f(x 1 ,x 2 )nachx 2 berechnen. So erhalten wir df2dx 2= 3 und wir schreiben∂f∂x 2=3.


418 24. AbleitungsregelnOffensichtlich betragen die zusätzlichen Kosten für ein Kilo Fleisch ∂f∂x 1=15 und die zusätzlichen Kosten für eine Einheit Eiscreme betragen ∂f∂x 2=3.Der Fleischkostensatz ist folglich ∂f∂x 1= 15 und der für Eiscreme ∂f∂x 2=3.Beispiel 24.20. Sei f :R×R →R die Funktion f(x 1 ,x 2 )=x 2 1 +x3 2 +x 1x 2 .Wir berechnen∂f∂x 1(x 1 ,x 2 )=2x 1 + x 2 ,∂f∂x 2(x 1 ,x 2 )=3x 2 2 + x 1,wobei wir den eben erklärten Regeln folgen: Um ∂f∂x 1zu berechnen, haltenwir x 2 konstant und leiten nach x 1 ab und um ∂f∂x 2zu berechnen, haltenwir x 1 konstant und leiten nach x 2 ab.Ganz allgemein können wir auf natürliche Weise die Regeln für die Differenzierbarkeiteiner reellwertigen Funktion f(x) in einer reellen Variablex auf die Differenzierbarkeit einer reellwertigen Funktion f(x 1 ,x 2 )zweierreeller Variablen x 1 und x 2 , wie folgt, übertragen: Wir sagen, dass dieFunktion f(x 1 ,x 2 )in¯x =(¯x 1 , ¯x 2 ) differenzierbar ist, wenn Konstantenm 1 (¯x 1 , ¯x 2 ), m 2 (¯x 1 , ¯x 2 ) und K f (¯x 1 , ¯x 2 ) existieren, so dass für (x 1 ,x 2 )nahebei (¯x 1 , ¯x 2 )f(x 1 ,x 2 )=f(¯x 1 , ¯x 2 )+m 1 (¯x 1 , ¯x 2 )(x 1 −¯x 1 )+m 2 (¯x 1 , ¯x 2 )(x 2 −¯x 2 )+E f (x, ¯x),wobeiBeachten Sie, dass|E f (x, ¯x)|≤K f (¯x 1 , ¯x 2 )((x 1 − ¯x 1 ) 2 +(x 2 − ¯x 2 ) 2 ).f(¯x 1 , ¯x 2 )+m 1 (¯x 1 , ¯x 2 )(x 1 − ¯x 1 )+m 2 (¯x 1 , ¯x 2 )(x 2 − ¯x 2 )eine lineare Näherung für f(x) ist mit quadratischem Fehler, deren Graphdie Tangentialebene an f(x) in¯x darstellt.Indem wir x 2 konstant gleich ¯x 2 halten, erkennen wir, das die partielleAbleitung von f(x 1 ,x 2 )in(¯x 1 , ¯x 2 )nachx 1 gleich ist mit m 1 (¯x 1 , ¯x 2 ) undwir schreiben für diese Ableitung∂f∂x 1(¯x 1 , ¯x 2 )=m 1 (¯x 1 , ¯x 2 ).Ähnlich sagen wir, dass die partielle Ableitung von f(x) in¯x nach x 2gleich ist mit m 2 (¯x 1 , ¯x 2 ) und schreiben für diese Ableitung ∂f∂x 2(¯x 1 , ¯x 2 )=m 2 (¯x 1 , ¯x 2 ).Diese Vorstellung lässt sich in natürlicher Weise auf reellwertige Funktionenf(x 1 ,...,x d )vond reellen Variablen x 1 ,...,x d erweitern und wirkönnen von der partiellen Ableitung von f(x 1 ,...,x d )nachx 1 ,...,x d sprechen(und sie berechnen) und dabei denselben Regeln folgen. Um die partielleAbleitung ∂f∂x jnach x j für ein j =1,...,dzu berechnen, halten wir alle


24.12 Zwischenbilanz 419Variablen außer x j konstant und berechnen die übliche Ableitung nach x j .Wir werden unten zum Begriff der partiellen Ableitung zurückkehren undanh<strong>and</strong> ausführlicher Erfahrungen lernen, dass dieser Begriff eine wichtigeRolle bei der mathematischen Modellierung spielt.24.12 ZwischenbilanzWir haben oben bewiesen, dassDx n = ddx xn = nx n−1 für eine ganze Zahl n und x ≠0,Dx r = ddx xr = rx r−1 für rationales r und x>0.Wir haben auch Regeln bewiesen, wie lineare Kombinationen, Produkteund Quotienten abgeleitet werden und wie wir zusammengesetzte Funktionenund Inverse differenzieren. Das ist soweit alles. Uns fehlen insbesonderenoch die Antworten zu folgenden Fragen: Welche Funktion u(x) hat die Ableitung u ′ (x)= 1 x ? Welche Ableitung hat die Funktion a x für konstantes a>0?Aufgaben zu Kapitel 2424.1. Konstruieren und differenzieren Sie Funktionen, die Sie durch Kombinationvon Funktionen der Form x r durch Linearkombinationen, Produkte, Quotienten,Zusammensetzen von Funktionen und Bilden der Inversen erhalten. BeispielsweiseFunktionen wie × Öxx 11 111+x −1,1 + x . 1,124.2. Berechnen Sie die partiellen Ableitung der Funktion f : Ê × Ê → Ê mitf(x 1,x 2)=x 2 1 + x 4 2.24.3. Wir haben 2 x für rationales x definiert. Wir wollen die Ableitung D2 x =ddx 2x nach x in x = 0 berechnen. Dies führt uns auf den Quotientenq n = 2 n 1 − 1,1nwobei n gegen Unendlich strebt. Führen Sie dies experimentell am Rechner durch.Beachten Sie, dass 2 1 n =1+q nn , d.h. wir suchen qn, sodass(1+ qn n )n =2.Vergleichen Sie dies mit den Erfahrungen zu (1 + 1 n )n aus dem Kapitel ”KurzerKurs zur Infinitesimalrechnung“.


420 24. Ableitungsregeln24.4. Angenommen, Sie wüssten, wie die Ableitung von 2 x in x = 0 berechnetwird. Wie lautet dann die Ableitung für x ≠ 0? Hinweis: 2 x+ 1 n =2 x 2 1 n .24.5. Betrachten Sie die Funktion f :(0,2) → Ê mit f(x) =(1+x 4 ) −1 für0


25Die Newton-MethodeVerst<strong>and</strong> zuerst und dann harte Arbeit. (Das Haus an der Pu-Ecke,Milne)25.1 EinleitungWir wollen die Newton-Methode zur Lösung von Gleichungen f(x)=0alseine wichtige Anwendung der Ableitung untersuchen. Die Newton-Methodeist einer der Bausteine konstruktiver <strong>Mathematik</strong>er. Als Vorbereitung beginnenwir mit der Konvergenzanalyse der Fixpunkt-Iteration mit Hilfe derAbleitung.25.2 Konvergenz der Fixpunkt-IterationSei g : I → I auf dem Intervall I =(a,b) gleichmäßig differenzierbar mit derAbleitung g ′ (x), die |g ′ (x)|≤L erfülle für x ∈ I mit L


422 25. Die Newton-Methodewir uns an (24.26) orientieren:g(x)=g(¯x)+g ′ (¯x)(x − ¯x)+ 1 2 g′′ (¯x)(x − ¯x) 2 + E g (x, ¯x). (25.1)Dabei ist |E g (x, ¯x)|≤K g (¯x)|x− ¯x| 3 .Wirwählen x = x i , setzen e i = x i − ¯xund benutzen ¯x = g(¯x). Dann erhalten wir für i groß genug:e i+1 = x i+1 − ¯x = g(x i ) − g(¯x)=g ′ (¯x)e i + 1 2 g′′ (¯x)e 2 i + E g(x i , ¯x). (25.2)Dabei ist |E g (x i , ¯x)|≤K g (¯x)|e i | 3 . Diese Formel liefert eine Fehlerentwicklungfür e i+1 im Schritt i + 1 als Polynom von e i .Für g ′ (¯x) ≠ 0 dominiert der lineare Ausdruck g ′ (¯x)e i , d.h.|e i+1 |≈|g ′ (¯x)||e i |, (25.3)woraus wir erkennen, dass der Fehler in jedem Schritt (ungefähr) mit demFaktor |g ′ (¯x)| abnimmt. Wir sagen, dass lineare Konvergenz vorliegt. Istg ′ (¯x) =(0, 1), gewinnen wir in jedem Schritt der Fixpunkt-Iteration eineDezimalstelle Genauigkeit.Die Konvergenz verbessert sich, wenn |g ′ (¯x)| abnimmt. Im Grenzfallg ′ (¯x) = 0 folgt aus (25.2)e i+1 = 1 2 g′′ (¯x)e 2 i + E g (x i , ¯x),so dass wir|e i+1 |≈ 1 2 |g′′ (¯x)|e 2 i (25.4)erhalten, wenn wir den kubischen Ausdruck E g (x i , ¯x) vernachlässigen. Indiesem Fall ist die Konvergenz quadratisch, da der Fehler |e i+1 | bis auf denFaktor |g ′′ (¯x)/2| gleich dem Quadrat des Fehlers |e i | ist. Ist die Konvergenzquadratisch, so verdoppelt sich etwa in jedem Schritt die Zahl der richtigenDezimalstellen.25.3 Die Newton-MethodeIm Kapitel ”Fixpunkt-Iteration“ haben wir gesehen, dass das Problem,eine Lösung für die Gleichung f(x)=0für eine gegebene Funktion f(x)zufinden, als Fixpunkt-Gleichung x = g(x) umformuliert werden kann. Dabeiist g(x) =x − αf(x) miteinerfreiwählbaren Konstanten α. Tatsächlichkönnen wir auch α(x)vonx abhängig wählen und f(x) = 0 umformulierenzug(x)=x − α(x)f(x),solange α(¯x) ≠0,wenn¯x die gesuchte Lösung ist. Aus Obigem wissenwir, dass es eine natürliche Strategie ist, α so zu wählen, dass g ′ (¯x) so


25.4 Die Newton-Methode konvergiert quadratisch 423klein wie möglich ist. Am besten wäre g ′ (¯x) = 0. Ableitung der Gleichungg(x)=x − α(x)f(x) nachx liefertg ′ (x)=1− α ′ (x)f(x) − α(x)f ′ (x).Unter der Annahme, dass f ′ (¯x) ≠ 0, erhalten wir mit Hilfe von f(¯x)=0:α(¯x)= 1f ′ (¯x) .Wenn wir α(x) = 1f ′ (x)setzen, erhalten wir die Newton-Methode zur Berechnungder Lösung von f(x)=0:Für i =0, 1, 2,...x i+1 = x i − f(x i)f ′ (x i ) , (25.5)mit einer Anfangsnäherung für x 0 . Die Newton-Methode entspricht einerFixpunkt-Iteration mitg(x)=x − f(x)f ′ (x) . (25.6)Wenn wir die Newton-Methode anwenden, gehen wir natürlicherweise vonf ′ (¯x) ≠ 0 aus, wodurch garantiert wird, dass f ′ (x i ) ≠0für große i, fallsf ′ (x) Lipschitz-stetig ist.Beispiel 25.1. Wir benutzen die Newton-Methode, um die Lösungen ¯x =2, 1, 0, −(0, 5), −(1, 5) der Polynomialgleichung f(x)=(x − 2)(x − 1)x(x +0, 5)(x +1, 5) = 0 zu berechnen. Wir sehen, dass f ′ (¯x) ≠0für alle gesuchtenLösungen ¯x. Wir berechnen 21 Newton-Iterationen für f(x) =0,beginnend bei 5000 gleichmäßig verteilten Anfangswerten in [−3, 3]. Dieentsprechenden gefundenen Lösungen sind in Abb. 25.1 wiedergegeben. Jededer Lösungen ist in einem Intervall enthalten, indem alle Anfangswertezu Iterationen führen, die gegen diese Lösung konvergieren. Außerhalb dieserIntervalle ist das Verhalten der Iterationen nicht vorhersehbar und naheliegende Anfangswerte können zu unterschiedlichen Lösungen konvergieren.25.4 Die Newton-Methode konvergiert quadratischWir wollen nun beweisen, dass die Newton-Methode quadratisch konvergiert,wenn der Anfangswert gut genug ist. Dazu berechnen wir die Ableitungdes zugehörigen Fixpunkt-Problems (25.6):g ′ (¯x)=1− f ′ (¯x) 2 − f(¯x)f ′′ (¯x)f ′ (¯x) 2= f(¯x)f ′′ (¯x)f ′ (¯x) 2 =0,


424 25. Die Newton-MethodeKonvergiert zuKonvergiert zuKonvergiert zuKonvergiert zu210-.5Konvergiert zu-1.5-3 -1.5 -.5 0 1 2 3Abb. 25.1. Diese Zeichnung zeigt die Lösungen von f(x) =(x − 2)(x − 1)x(x +0, 5)(x +1,5) = 0, wie sie von der Newton-Methode für 5000 gleichmäßigverteilte Anfangswerte in [−3,3] gefunden werden. Die waagrechte Position derPunkte zeigt die Lage der Anfangswerte. Die vertikale Position entspricht denWerten nach den ersten einundzwanzig Newton-Iterationenwobei wir ausgenutzt haben, dass f(¯x) = 0 und davon ausgingen, dassf ′ (¯x) ≠ 0. Wir folgern, dass die Newton-Methode quadratisch konvergiert,wenn f ′ (¯x) ≠ 0. Dieses Ergebnis hat Best<strong>and</strong>, wenn wir genügend nahe bei¯x beginnen, so dass insbesondere f ′ (x i ) ≠0für alle i.Um zu sehen, dass die Newton-Methode quadratisch konvergiert, könnenwir auch einen etwas direkteren Weg einschlagen: Wir subtrahieren ¯x vonjeder Seite von (25.5) und nutzen dabei aus, dass f(x i )=−f ′ (x i )(¯x −x i ) − E f (¯x,x i ), was wir aus der Linearisierungsgleichung f(¯x) =f(x i )+f ′ (x i )(¯x − x i )+E f (¯x, x i ) erhalten, da f(¯x) = 0. Somit erhalten wirWir folgern, dassx i+1 − ¯x = x i − f(x i)f ′ (x i ) − ¯x = E f(¯x,x i )f ′ .(x i )|x i+1 − ¯x| = | E f(¯x, x if ′ (x i ) |≤K f|f ′ (x i )| |x i − ¯x| 2 ,was uns die quadratische Konvergenz liefert, wenn f ′ (x) für x nahe bei ¯xvon Null entfernt bleibt.25.5 Geometrische Interpretationder Newton-MethodeEs gibt eine attraktive geometrische Interpretation der Newton-Methode.Sei x i eine Näherung für eine Lösung ¯x von f(x) = 0, d.h. f(¯x) =0.Wirbetrachten die Tangente an y = f(x) inx = x i ,y = f(x i )+f ′ (x i )(x − x i ).


25.6 Wie groß ist der Fehler einer Nullstellennäherung? 425Sei x i+1 der Schnittpunkt der Tangente mit der x-Achse, vgl. Abb. 25.2,d.h. x i+1 erfülle f(x i )+f ′ (x i )(x i+1 − x i ) = 0, so dassx i+1 = x i − f(x i)f ′ (x i ) , (25.7)was gerade der Newton-Methode entspricht. Wir folgern, dass die Iteriertenx i+1 der Newton-Methode den Schnitten der Tangenten an f(x) inx i mitder x-Achse entsprechen. In Worten gefasst: Auf der Suche nach ¯x mitf(¯x) = 0 ersetzen wir f(x) durch die lineare Näherungˆf(x)=f(x i )+f ′ (x i )(x − x i ),d.h. durch die Tangente in x = x i . Daraus berechnen wir x i+1 als Nullstellevon ˆf(x). Wir werden sehen, dass dieser Zugang zur Newton-Methode sichsehr einfach auf Systeme von Gleichungen verallgemeinern lässt und unsden Weg öffnet, Nullstellen von f(x) für f :R n →R n zu finden.y = f(x i)+f ′ (x i)(x − x i)y = f(x)x i ¯x x i+1Abb. 25.2. Darstellung eines Schritts der Newton-Methode von x i zu x i+125.6 Wie groß ist der Fehlereiner Nullstellennäherung?Sei x i eine Näherung einer Nullstelle ¯x einer gegebenen Funktion f(x).Können wir eine Aussage über den Fehler x i − ¯x machen, wenn wir f(x i )


426 25. Die Newton-Methodekennen? Wir werden immer wieder auf diese Frage treffen. Wir nennenf(x i )dasResiduum der Näherung x i .Für die exakte Lösung ¯x ist dasResiduum Null, da f(¯x)=0.Für die Näherung x i ist das Residuum f(x i )nicht Null (wenn nicht durch ein Wunder x i =¯x oder x i eine weitere Lösungvon f(x) = 0 ist).Folgendermaßen können wir eine grundlegende Verbindung zwischen demResiduum f(x i ) und dem Fehler x i − ¯x formulieren. Wenn wir ausnutzen,dass f(¯x) = 0 und annehmen, dass f(x) in¯x differenzierbar ist, dann giltf(x i )=f(x i ) − f(¯x)=f ′ (¯x)(x i − ¯x)+E f (x i , ¯x),mit |E f (x i , ¯x)| ≤K f (¯x)|x i − ¯x| 2 . Angenommen, f ′ (¯x) ≠ 0, dann folgernwir, dassx i − ¯x ≈ f(x i)f ′ (¯x) , (25.8)bis auf den Fehlerausdruck (f ′ (¯x)) −1 E f (x i , ¯x), der quadratisch in x i − ¯x istund somit viel kleiner als |x i − ¯x|, wennx i nahe bei ¯x ist, vgl. Abb. 25.3.y = f(x i)yy = f(x)f ′ (¯x)(x i − ¯x)¯x x iNäherungsfehlerResiduumxAbb. 25.3. Näherungsfehler und ResiduumDie Beziehung (25.8) zeigt, dass der Lösungsfehler x i − ¯x in etwa proportionalzum Residuum ist mit dem Proportionalitätsfaktor (f ′ (¯x)) −1 ,wennx i nahe bei ¯x ist und f ′ (x)inderNähe von x =¯x Lipschitz-stetig ist. Wirfassen dies in dem folgenden wichtigen Satz zusammen (den wir unten mitHilfe des Mittelwertsatzes vollständig beweisen werden).Satz 25.1 Sei f(x) differenzierbar auf dem Intervall I, das die Lösung ¯xvon f(x) =0enthält. Sei ferner |f ′ (x)| −1 ≤ M für x ∈ I. Dannerfüllteine Näherungslösung x i ∈ I die Abschätzung |x i − ¯x|≤M|f(x i )|.


25.6 Wie groß ist der Fehler einer Nullstellennäherung? 42710 010 −210 −4|x n − ¯x|10 −610 −810 −10|f(x n)|10 −1210 −140 5 10 15 20 25Abb. 25.4. Darstellung der Residuen • und Fehler § gegen die Iterationszahlbei der Newton-Methode für f(x)=(x − 1) 2 − 10 −15 x mit Anfangswert x 0 =1Ist insbesondere f ′ (¯x) sehr klein, kann der Fehler der Nullstellennäherungsehr groß sein, obwohl das Residuum sehr klein ist. In diesem Fall wird dieBerechnungsmethode für die Lösung ¯x als schlecht konditioniert bezeichnet.Beispiel 25.2. Wir wenden die Newton-Methode auf f(x) =(x − 1) 2 −10 −15 x mit der Nullstelle ¯x ≈ 1, 00000003162278 an. Hierbei ist f ′ (1) =−10 −15 und f ′ (¯x)≈0, 0000000316 und somit ist f ′ (x n ) sehr klein für allex n nahe bei ¯x und das Problem scheint sehr schlecht konditioniert zu sein.Wir stellen die Fehler und Residuen gegen die Iterationszahl in Abb. 25.4dar. Wir erkennen, dass die Residuen bedeutend schneller kleiner werdenals die Fehler.Wir erhalten die Beziehung|x i − ¯x|≈|x i+1 − x i |, (25.9)wenn wir die Näherung (25.8) in die Definition der Newton-Methodex i+1 = x i − f(x i )/f ′ (x i )einbauen. Anders formuliert, können wir den Fehler x i − ¯x abschätzen, indemwir einen zusätzlichen Schritt der Newton-Methode zu x i+1 ausführenund dann |x i+1 − x i | als Abschätzung für x i − ¯x benutzen. Dies ist einealternative Formulierung, um den Nullstellenfehler x i − ¯x abzuschätzen,ohne direkt auf die Ableitung f ′ (x) zurückzugreifen.Beispiel 25.3. Wir wenden die Newton-Methode auf f(x)=x 2 −2an.DerFehler und die Fehlerabschätzung (25.9) sind in Abb. 25.5 wiedergegeben.Die Fehlerabschätzung trifft den Fehler recht gut.


428 25. Die Newton-Methodei |x i − ¯x| |x i+1 − x i |0 0, 586 0, 51 0, 086 0, 0832 2, 453 × 10 −3 2, 451 × 10 −33 2, 124 × 10 −6 2, 124 × 10 −64 1, 595 × 10 −12 1, 595 × 10 −125 0 0Abb. 25.5. Fehler und Fehlerschätzung der Newton-Methode für f(x)=x 2 − 2mit x 0 =225.7 EndkriteriumAngenommen, wir wollen eine Näherung für die Lösung ¯x einer Gleichungf(x) = 0 mit einer bestimmten Genauigkeit, oder Fehlertoleranz TOL>0berechnen. Anders formuliert, wollen wir garantieren, dass|x i − ¯x|≤TOL, (25.10)wobei x i eine berechnete Näherung der Lösung ¯x ist. Wir können beispielsweiseTOL =10 −m wählen, um eine Näherungslösung x i mit m exaktenDezimalstellen zu finden. Können wir ein Endkriterium finden, das unsangibt, wann wir mit den Iterationen mit einem x i , das (25.10) erfüllt,aufhören können? Das folgende Kriterium, das auf (25.8) beruht, bietetsich an: Wir beenden die Iteration im Schritt i, wenn|(f ′ (¯x i )) −1 f(¯x i )|≤TOL. (25.11)Bis auf den Variablennamen ¯x i anstelle von ¯x entspricht dieses Kriteriumdem gewünschten Fehler aus (25.10).Als alternatives Endkriterium für die Newton-Methode können wir (25.9)benutzen, d.h. wir akzeptieren die Näherung x i mit der Toleranz TOL,wenn|x i+1 − x i |≤TOL. (25.12)25.8 Global konvergente Newton-MethodenIn diesem Kapitel haben wir die quadratische Konvergenz der Newton-Methode unter der Annahme, dass wir nahe genug bei der gesuchten Lösungbeginnen, bewiesen, d.h. wir haben die lokale Konvergenz der Newton-Methode gezeigt. Um einen genügend guten Anfangswert zu bekommen,können wir die Bisektion benutzen. Somit erhalten wir, indem wir die Bisektionzur Anfangssuche und die Newton-Methode für eine bestimmte Lösungbenutzen, eine global konvergente Methode, die Effektivität (quadratischeKonvergenz) mit Verlässlichkeit (garantierte Konvergenz) verbindet.


Aufgaben zu Kapitel 25 429Aufgaben zu Kapitel 2525.1. (a) Beweisen Sie theoretisch, dass die Fixpunkt-Iteration fürg(x)= 1 x + a 2 xmit ¯x = √ a quadratisch konvergiert. (b) Treffen Sie Aussagen, welche AnfangswerteKonvergenz garantieren für a = 3, indem Sie einige Fixpunkt-Iterationenberechnen.25.2. (a) Zeigen Sie analytisch, dass die Fixpunkt-Iteration fürg(x)= 1 x + a 2 xin dritter Ordnung zur Berechnung von ¯x = √ a konvergiert. (b) Berechnen Sieeinige Iterationen für a = 2 und x 0 = 1. Wie viele Dezimalstellen Genauigkeiterhalten Sie in jeder Iteration?25.3. (a) Betrachten Sie die Newton-Methode für eine differenzierbare Funktionf(x)mitf(¯x)=f ′ (¯x)=0aberf ′′ (¯x) ≠0,d.h.¯x ist eine doppelte Nullstelle vonf(x). Beweisen Sie, dass die Newton-Methode in diesem Fall linear konvergiert,indem Sie zeigen, dass g ′ (¯x)=1/2, für g(x)=x − f(x)/f ′ (x). (b) Wie hoch istdie Konvergenzgeschwindigkeit für die folgende Variante der Newton-Methodefür eine doppelte Nullstelle: g(x)=x − 2f(x)/f ′ (x)? Hinweis: Die Nutzung derRegel von l’Hopital kann hilfreich sein.25.4. Benutzen Sie die Newton-Methode um alle Nullstellen von f(x) =x 5 +3x 4 − 3x 3 − 5x 2 +5x − 1 zu berechnen.25.5. Benutzen Sie die Newton-Methode um die kleinste positive Nullstelle vonf(x)=cos(x)+sin(x) 2 (50x) zu berechnen.25.6. Benutzen Sie die Newton-Methode um die Nullstelle ¯x =0für die Funktion´√x x ≥ 0f(x)=− √ −x x


430 25. Die Newton-Methode25.10. Angenommen, f(x) habedieFormf(x) =(x − ¯x) 2 h(x), wobei h einedifferenzierbare Funktion ist, mit h(¯x) ≠ 0. (a) Beweisen Sie, dass f ′ (¯x) =0aber f ′′ (¯x) ≠ 0. (b) Zeigen Sie, dass die Newton-Methode für f(x) zu¯x linearkonvergiert und berechnen Sie den Konvergenzfaktor.


26Galileo, Newton, Hooke, Malthusund FourierIn einem Medium ohne Widerst<strong>and</strong> würden alle Körper mit derselbenGeschwindigkeit fallen. (Galileo)Alles, was Galileo über das Fallen von Körpern im leeren Raumsagt, ist bar jeglicher Grundlage; er sollte erst einmal die Natur desGewichts bestimmen. (Descartes)Man muss bereits etwas glauben, bevor man es erkennen kann. (Aristoteles)Galileo war der Erste, der uns die Tür ins Reich der Physik öffnete.(Hobbes)Prov<strong>and</strong>o e riprov<strong>and</strong>o (Beweise eines und verwirf das <strong>and</strong>ere). (Galileo)Messen was messbar ist und messbar machen, was nicht messbar ist.(Galileo)26.1 EinleitungIn diesem Kapitel beschreiben wir einige wichtige Modelle für physikalischePhänomene, die die Ableitung einer Funktion bzw. einigen Funktionenbeinhalten und die deswegen Differentialgleichungen genannt werden.Die Ableitung ist das fundamentale Werkzeug bei der Modellierungin den Naturwissenschaften und den Ingenieurwissenschaften. Differentialgleichungenzu formulieren und zu lösen war seit der Zeit, als Newtons


432 26. Galileo, Newton, Hooke, Malthus und FourierBewegungsgesetz aufgestellt wurde, ein wichtiger Teil der Wissenschaften.Heutzutage eröffnet der Computer neue Modellierungsmöglichkeiten fürDifferentialgleichungen, an die Newton und alle seine wissenschaftlichenNachfolger durch die Jahrhunderte hindurch nicht einmal im Traum gedachthaben.Wir formulieren daher in diesem Kapitel einige sehr wichtige Modelle fürDifferentialgleichungen und wir werden einen Großteil des verbleibendenBuches darauf verwenden, diese Gleichungen oder verw<strong>and</strong>te Verallgemeinerungenmit Hilfe analytischer oder numerischer Methoden zu lösen.26.2 Newtons BewegungsgesetzNewtons Bewegungsgesetz ist einer der Ecksteine der Newtonschen Physik,mit deren Hilfe wir vieles in der Welt, in der wir leben, beschreiben. DasNewtonsche Gesetz besagt, dass die Ableitung des Impulses m(t)v(t)einesKörpers nach der Zeit t, der sich als Produkt der Masse m(t) und derGeschwindigkeit v(t) desKörpers ergibt, gleich ist der Kraft f(t), die aufdiesen Körper einwirkt, d.h.(mv) ′ (t)=f(t). (26.1)Ist m(t) =m unabhängig von der Zeit, so können wir das NewtonscheGesetz in der Formmv ′ (t)=f(t) (26.2)schreiben oder in seiner meist verwendeten Form:wobeima(t)=f(t), (26.3)a(t)=v ′ (t)die Beschleunigung ist.Da die Geschwindigkeit der Ableitung des Weges s(t) nach der Zeit entspricht,können wir das Newtonsche Gesetz (26.2) bei konstanter Masseauch, wie folgt, schreiben:ms ′′ (t)=f(t). (26.4)Wenn wir uns die Kraft f(t) als eine Funktion über die Zeit t denken, dannstellen (26.2) und (26.4) die Differentialgleichungen für die Geschwindigkeitv(t) oderdiePositions(t) dar. Die Differentialgleichung beinhaltetsomit eine bekannte Funktion (f(t)) und eine Unbekannte, die ebenfallseine Funktion (v(t) oders(t)) ist. Differentialgleichungen beinhalten alsotypischerweise die Ableitung einer unbekannten Funktion und eine <strong>and</strong>ere


26.3 Galileos Bewegungsgesetze 433bekannte Funktion, die Eingabewerte liefert. Beachten Sie, dass wir üblicherweiseeine Funktion s(t) suchen, die die Differentialgleichung (26.4)erfüllt, nicht nur zu einer bestimmten Zeit t, sondern für alle t in einemIntervall.26.3 Galileos BewegungsgesetzeGalileo (1564–1642), <strong>Mathematik</strong>er, Astronom, Philosoph und Mitbegründerder wissenschaftlichen Revolution führte seine berühmten Experimenteaus, indem er Körper vom Turm von Pisa fallen ließ und die Zeit zählte,bis die Körper auf dem Boden aufschlugen. Oder er benutzte eine schiefeEbene, vgl. Abb. 26.1, um seine Bewegungsgesetze zu demonstrieren. Galileowurde 1632 von der katholischen Kirche verurteilt, weil er in Fragestellte, dass die Erde das Zentrum des Universums sei. Er versuchte mitseinen Experimenten die Natur der Bewegung zu verstehen, ein Thema, dasbereits die Griechen beschäftigte.Abb. 26.1. Galileo bei einer Vorführung der BewegungsgesetzeGalileo f<strong>and</strong> heraus, dass ein Körper nahe der Oberfläche der Erde, aufden nur die vertikale Gravitationskraft einwirkt, eine konstante Beschleunigungerfährt, die unabhängig von der Masse oder der Lage des Körpersist. Diese Beobachtung kann als ein Spezialfall des Newtonschen Geset-


434 26. Galileo, Newton, Hooke, Malthus und Fourierzes ma(t) =f(t) betrachtet werden, wobei m die Masse des Körpers istund a(t) die vertikale Beschleunigung. Die Gravitationskraft f(t)entsprichtf(t)=mg, wobeig ≈ 9, 81 (Meter/Sekunde 2 )dieberühmte physikalischeKonstante ist, die als Erdbeschleunigung an der Erdoberfläche bekannt ist.Sowohl Galileo als auch Newton würden folgern, dass die Beschleunigunga(t) =g unabhängig von m und der Lage des Körpers ist, solange derKörper nicht weit von der Oberfläche der Erde entfernt ist.Wir wollen die Bewegung eines Körpers, der von Galileo senkrecht vomTurm fallen gelassen wird, untersuchen. Wir nehmen an, dass die Massedes Körpers m ist und s(t) dieHöhe über dem Boden des Körpers zurZeit t angibt, wobei die positive Richtung aufwärts zeigt, vgl. Abb. 26.2. Indiesem Koordinatensystem bedeutet eine positive Geschwindigkeit v(t) =s ′ (t), dass der Körper sich aufwärts bewegt. Eine negative Geschwindigkeitbedeutet stattdessen, dass der Körper fällt. Nach dem Newtonschen Gesetzs(0) = s 0Anfangshöhes(t)s =0ErdbodenAbb. 26.2. Das Koordinatensystem, das die Position eines frei fallenden Körpersmit Anfangshöhe s(0) = s 0 zur Zeit t = 0 beschreibtgiltms ′′ = −mgoder mv ′ (t)=−mg,wobei das negative Vorzeichen daher kommt, dass die Gravitationskraftnach unten gerichtet ist. Wir erhalten somit im Sinne von Galileos ′′ (t)=v ′ (t)=−g, (26.5)nachdem wir durch den gemeinsamen Faktor m dividiert haben. Aus f(t)=ct ergibt sich f ′ (t)=c, mit einer Konstanten c. Daraus folgern wir, dassv(t)=−gt + c, (26.6)


26.3 Galileos Bewegungsgesetze 435wobei die Konstante c noch zu bestimmen ist. Wir sehen, dass d dt (−gt +c) =−g für alle t. Um nun die Geschwindigkeit eines fallenden Körperszu bestimmen, genügt es, die Geschwindigkeit zu einer bestimmten Zeitzu kennen. Nehmen wir beispielsweise an, dass die Anfangsgeschwindigkeitv(0) zur Zeit t =0bekanntist,v(0) = v 0 ,soerhaltenwirdieLösungv(t)=−gt+ v 0 für t>0. (26.7)Ist beispielsweise v 0 = 0, dann ist die Geschwindigkeit aufwärts v(t)=−gtund daher nimmt die Fallgeschwindigkeit gt linear mit der Zeit zu. Diesentspricht der Beobachtung von Galileo (zu seiner Überraschung).Nun haben wir die Geschwindigkeit v(t) mit (26.7) bestimmt und suchennun den Weg s(t), der sich als Lösung der Differentialgleichung s ′ (t)=v(t)ergibt, d.h.s ′ (t)=−gt + v 0 für t>0. (26.8)Wir erinnern uns daran, dass (t 2 ) ′ =2t und dass (cf(t)) ′ = cf ′ (t). Daher istdie Annahme natürlich, dass die Lösung von (26.8) durch die quadratischeFunktions(t)=− g 2 t2 + v 0 t + dgegeben wird, wobei d eine Konstante ist. Diese Funktion erfüllt (26.8). Ums(t) endgültig zu bestimmen, benötigen wir die Konstante d.Dazumüssenwir s(t) zu einer bestimmten Zeit t kennen. Wenn wir beispielsweise dieAnfangsposition s(0) = s 0 zur Zeit t = 0 kennen, so sehen wir, dass d = s 0und wir erhalten die Lösungsformelns(t)=− g 2 t2 + v 0 t + s 0 , v(t)=−gt + v 0 für t>0, (26.9)die uns den Weg s(t) und die Geschwindigkeit v(t) als Funktion der Zeitt für t>0 beschreiben, wenn die Anfangsposition s(0) = s 0 und die Anfangsgeschwindigkeitv(0) = v 0 bekannt sind. Wir fassen zusammen (dieEindeutigkeit der Lösung wird unten festgestellt):Satz 26.1 (Galileo) Seien s(t) und v(t) der vertikale Weg und die vertikaleGeschwindigkeit eines Körpers im freien Fall zur Zeit t ≥ 0 mit konstanterErdbeschleunigung g. Die Aufwärtsrichtung ist dabei positiv. Dannist s(t) =− g 2 t2 + v 0 t + s 0 und v(t) =−gt + v 0 ,wobeis(0) = s 0 undv(0) = v 0 die vorgegebene Anfangsposition und Geschwindigkeit sind.Beispiel 26.1. Die Anfangshöhe eines Körpers sei 15 Meter und er werde ausder Ruhelage fallen gelassen. Wie hoch ist er dann bei t =0, 5 Sekunden?Wir erhaltens(0, 5) = − 9, 82 (0, 5)2 +0× 0, 5+15=13, 775 Meter.


436 26. Galileo, Newton, Hooke, Malthus und FourierWird der Körper mit 2 Meter/Sek. nach oben geworfen, dann ist seine Höhenach t =0, 5 Sekundens(0, 5) = − 9, 82 (0, 5)2 +2× 0, 5+15=14, 775 Meter.Wird der Körper mit 2 Meter/Sek. nach unten geworfen, dann ist seineHöhe nach t =0, 5 Sekundens(0, 5) = − 9, 82 (0, 5)2 − 2 × 0, 5+15=12, 775 Meter.Beispiel 26.2. Ein Körper fällt aus der Ruhelage und trifft in t = 5 Sekundenauf den Boden. Wie hoch war er? Wir erhalten s(5) = 0 = − 9,82 52 +0×5+s 0und folglich s 0 = 122, 5 Meter.26.4 Das Hookesche GesetzWir betrachten eine Feder der Länge L, die senkrecht im Gleichgewicht vonder Decke hängt. Stellen Sie sich ein Koordinatensystem mit Ursprung <strong>and</strong>er Decke vor, dessen x-Achse nach unten zeigt. Sei f(x) das Gewicht <strong>and</strong>er Feder als Funktion vom Abst<strong>and</strong> x zur Decke. Bedenken Sie, dass diebelastete Feder zunächst als gewichtslos angenommen wird (wir schaltendie Erdgravitation kurz aus), was einer Zugkraft von Null entspricht. Wirstellen uns vor, dass wir die Erdgravitation allmählich anschalten und beobachten,wie sich die Feder unter dem zunehmenden Gewicht ausdehnt.Sei u(x)diezugehörige Auslenkung in x. Können wir die Auslenkung u(x)der Feder und die Dehnungskraft σ(x) an der Feder als Funktion von x beivoller Stärke der Schwerkraft bestimmen?Das Hookesche Gesetz für eine lineare (ideale) Feder besagt, dass dieDehnungskraft σ(x) proportional zur Auslenkung u ′ (x) ist:σ(x)=Eu ′ (x), (26.10)wobei E>0 die Federkonstante ist, die als Elastizitätsmodul der Federbezeichnet wird. Beachten Sie, dass u ′ (x) dieÄnderung der Auslenkungu(x) pro Einheit x bedeutet; das entspricht der Deformation.Die Änderung der Belastung der Feder durch das Gewicht zwischen xund x + h für h>0 ist ungefähr gleich f(x)h, daf(x) dasGewichtproEinheitslänge angibt. Die Belastung sollte der Änderung der Dehnungskraftentsprechen:−σ(x + h)+σ(x) ≈ f(x)h,d.h. −σ(x + h) − σ(x)h≈ f(x),was uns die Gleichgewichtsgleichung −σ ′ (x) =f(x) liefert. Alles in allemerhalten wir die folgende Differentialgleichung, da E unabhängig von x als


konstant angenommen wird:26.5 Newtonsches Gesetz plus Hookesches Gesetz 437−Eu ′′ (x)=f(x), für 0 0. Das HookescheGesetz besagt, dass die Kraft f(t), die auf die Masse wirkt, durch dieu=0 u>0Abb. 26.3. Koordinatensystem für das Feder-Masse System. Die Masse kannsich reibungslos hin und her bewegen


438 26. Galileo, Newton, Hooke, Malthus und FourierGleichungf(t)=−ku(t) (26.12)gegeben wird, mit der Proportionalitätskonstante k = E/L > 0. Die Federkonstantek entspricht dem Elastizitätsmodul aus (26.10) dividiert durchdie (natürliche) Länge L der Feder. Auf der <strong>and</strong>eren Seite besagt das NewtonscheGesetz, dass mu ′′ (t)=f(t), wodurch wir die folgende Differentialgleichungfür das Masse-Feder System erhalten:mu ′′ (t)=−ku(t) oder mu ′′ (t)+ku(t)=0, für t>0. (26.13)Die Lösung dieser Differentialgleichung führt uns, nach Angabe der Anfangspositionu(0) und der Anfangsgeschwindigkeit u ′ (0), in√die Welt dertrigonometrischen Funktionen sin(ωx) und cos(ωx) mitω =km .26.6 Fouriersches Gesetz der WärmeausbreitungFourier war einer der ersten <strong>Mathematik</strong>er, die den Vorgang der Wärmeleitunguntersuchten. Fourier entwickelte dazu mit Hilfe von Fourier-Reiheneine mathematische Technik, bei der ”allgemeine Funktionen“ als Linearkombinationender trigonometrischen Funktionen sin(nx) und cos(nx)mitn =1, 2,... ausgedrückt werden, vgl. Kapitel ”Fourier-Reihen“. Fourierentwickelte das einfachste Modell für die Wärmeausbreitung, indem er behauptete,dass der Wärmefluß proportional der Temperaturdifferenz oderallgemeiner dem Temperaturgradienten, das ist die Änderungsrate der Temperatur,ist.Wir suchen ein einfaches Modell für die folgende Situation: Sie leben inNordsk<strong>and</strong>inavien und benötigen eine elektrische Heizung für ihren Automotor,damit Sie den Wagen morgens starten können. Wir können uns dieFrage stellen, wann wir die Heizung anstellen müssen und wie kräftig wirdann heizen sollten. Kurze Zeit mit großer Leistung oder lange Zeit mitgeringer Leistung, wobei das natürlich auch vom Strompreis abhängt, derunterschiedliche Tarife für Tag und Nacht haben kann.Ein einfaches Modell könnte folgendermaßen aussehen: Sei u(t) dieMotortemperaturzur Zeit t, q + (t) derWärmefluß vom elektrischen Heizgerätin den Motor und q − (t) derWärmeverlust des Motors an die Umgebung(die Garage). Wir erhaltenλu ′ (t)=q + (t) − q − (t),wobei λ>0 eine Konstante ist; die so genannte Wärmekapazität. DieWärmekapazität ist ein Maß für den Temperaturanstieg beim Zuführeneiner Einheit Wärme.Das Fouriersche Gesetz besagt, dassq − (t)=k(u(t) − u 0 ),


26.7 Newton und der Raketenantrieb 439wobei u 0 die Temperatur der Garage ist. Zur Einfachheit nehmen wir u 0 =0 an und erhalten so die folgende Differentialgleichung für die Temperaturu(t):λu ′ (t)+ku(t)=q + (t) für t>0, u(0) = 0, (26.14)wobei wir noch die Anfangsbedingung u(0) = 0 eingefügt haben, die besagt,dass der Motor die gleiche Temperatur hat wie die Garage, wenndas Heizgerät zur Zeit t = 0 eingeschaltet wird. Wir können nun q + (t) alsbekannte Funktion und λ und k als bekannte Konstanten betrachten undnach der Temperatur u(t) als Funktion der Zeit fragen.26.7 Newton und der RaketenantriebWir wollen den Flug einer Rakete in den Weltraum, frei von jeglicher Gravitationskraft,untersuchen. Wird der Raketenantrieb gezündet, dann schießendie Verbrennungsgase durch Verbrennen des Treibstoffes mit hoherGeschwindigkeit nach hinten und die Rakete bewegt sich vorwärts, so dassder Gesamtimpuls von Gas plus Rakete erhalten bleibt, vgl. Abb. 26.4.Angenommen, die Rakete bewege sich nach rechts entlang einer Geraden,t = t 0Abb. 26.4. Modell für einen Raketenantriebdie wir mit der x-Achse identifizieren können. Sei s(t) die Position der Raketezur Zeit t und v(t) =s ′ (t) ihre Geschwindigkeit. Ferner sei m(t) dieMasse der Rakete zur Zeit t. Wir nehmen an, dass das Verbrennungsgasmit konstanter Geschwindigkeit u>0 relativ zur Rakete in Richtung dernegativen x-Achse austritt. Die Gesamtmasse m g (t) des Gases zur Zeit t seim g (t)=m(0)−m(t), wobei m(0) die anfängliche Gesamtmasse der Raketemit Brennstoff zur Zeit t =0sei.Sei ∆m g die ausgestoßene Gasmasse während des Zeitintervalls (t, t+∆t).Aus dem Impulserhalt der Rakete plus Gas über das Zeitintervall (t, t+∆t)folgt, dass(m(t) − ∆m e )(v(t)+∆v)+∆m e (v(t) − u)=m(t)v(t),


440 26. Galileo, Newton, Hooke, Malthus und Fourierwobei ∆v der Geschwindigkeitsanstieg der Rakete ist und ∆m g (v(t) − u)den Impuls des Gases, das in der Zeit (t, t +∆t) ausgetreten ist, angibt.Bedenken Sie, dass der Impuls sich aus dem Produkt von Masse und Geschwindigkeitergibt. Dies führt uns mit Hilfe von ∆m g = −∆m, wobei∆m die Änderung in der Raketenmasse ist, zur Beziehungm(t)∆v = −u∆m.Die Division durch ∆t führt uns zur Differentialgleichungm(t)v ′ (t)=−um ′ (t) für t>0. (26.15)Unten werden wir zeigen, dass sich die Lösung in der Form( ) m(0)v(t)=u logm(t)(26.16)schreiben lässt, wobei wir die Logarithmusfunktion log(x) vorwegnehmenund annehmen, dass v(0) = 0 ist. Diese Gleichung verbindet die Geschwindigkeitv(t) mit der Masse m(t). Normalerweise ist m(t) bekannt, da sie vonder Verbrennungstechnik abhängt, und wir können dann die zugehörige Geschwindigkeitv(t) aus (26.16) bestimmen. Beispielsweise erkennen wir, dassnach Verbrennen des halben Treibstoffs mit Austrittsgeschwindigkeit u relativzur Rakete die Geschwindigkeit der Rakete gleich u log(2) ≈ 0.6931 uist. Beachten Sie, dass diese Geschwindigkeit kleiner ist als u, da sich dieGeschwindigkeit des austretenden Gases zur Zeit t von −u für t =0zuv(t)=−u für t>0verändert.Könnte der Raketenantrieb so betrieben werden, dass die Absolutgeschwindigkeitdes austretenden Gases immer −u wäre (d.h. mit stetig wachsenderGeschwindigkeit relativ zur Rakete), dann würde der Impulserhaltungssatzergeben, dass( ) m(0)m(t)v(t)=(m(0) − m(t))u, d.h. v(t)=um(t) − 1 .Dabei wäre die Raketengeschwindigkeit gleich u,wennm(t)= 1 2 m(0).26.8 Malthus und PopulationswachstumDer englische Priester und Betriebswirt Thomas Malthus (1766–1834) entwickelteein Modell für das Populationswachstum in seinem Werk ”An Essayon the Theory of Population“, vgl Abb. 26.5. Seine Untersuchungenbereiteten ihm Sorge: Das Modell deutete an, dass die Population schnellerwachsen würde als die verfügbaren Ressourcen. Als Abhilfe schlug Malthusspäte Eheschließungen vor. Malthus stellte folgendes Modell auf: Angenommen,die Größe einer Population zur Zeit t wird durch die Funktion u(t)


26.8 Malthus und Populationswachstum 441gemessen, die Lipschitz-stetig ist in t. Da wir eine ziemlich große Populationbetrachten, normieren wir zu u(0) = 1, wobei die Gesamtzahl derIndividuen P(t) der Population gleich ist mit u(t)P 0 ,wobeiP 0 die Zahl derIndividuen zur Zeit t = 0 ist. Das Modell von Malthus für das Populationswachstumlautetu ′ (t)=λu(t), für t>0, u(0) = 1, (26.17)wobei λ eine positive Konstante ist. Malthus geht folglich davon aus, dassdie Wachstumsrate u ′ (t) zu jeder Zeit proportional zur Population u(t)ist,mit der Proportionalitätskonstanten λ, die als Differenz zwischen GeburtsundTodesrate betrachtet werden kann (unter Vernachlässigung <strong>and</strong>ererFaktoren wie die Aus-/Zuw<strong>and</strong>erung).Abb. 26.5. Thomas Malthus: ”Ich glaube, zwei Postulate aufstellen zu können.Erstens, dass Essen für die Existenz des Menschen notwendig ist. Zweitens, dassdie Leidenschaft zwischen den Geschlechtern notwendig ist und vermutlich unverändertauf dem augenblicklichen St<strong>and</strong> bleiben wirdSei t n = kn, n =0, 1, 2,...eine Folge diskreter Zeitschritte mit konstanterSchrittweite k>0. Damit können wir die Differentialgleichung (26.17)in das folgende diskrete Modell umformen:U n = U n−1 + kλU n−1 , für n =1, 2, 3 ..., U 0 =1. (26.18)Formal betrachtet entsteht (26.18) aus u(t n ) ≈ u(t n−1 )+ku ′ (t n−1 ), wennman u ′ (t n−1 )=λu(t n−1 )einsetztundU n als Näherung von u(t n )betrachtet.Wir sind bereits mit dem Modell (26.18) vertraut und wir wissen, dassdie Lösung durch die Formelgegeben ist. Wir erwarten, dassU n =(1+kλ) n , für n =0, 1, 2,... (26.19)u(kn) ≈ (1 + kλ) n , für n =0, 1, 2,... (26.20)


442 26. Galileo, Newton, Hooke, Malthus und Fourieroderu(t) ≈(1+ t n λ ) n, für n =0, 1, 2,... (26.21)Wir werden unten zeigen, dass die Differentialgleichung (26.17) die eindeutigeLösung u(t) hat,diewirinderFormu(t)=exp(λt)=e λt , (26.22)schreiben werden, wobei exp(λt) =e λt die berühmte Exponentialfunktionist. Wir werden zeigen, dass(exp(λt)=e λt = lim 1+ λt ) n, (26.23)n→∞ nwas die Tatsache widerspiegelt, dass U n eine zunehmend bessere Näherungfür u(t) für ein t = nk ist, je näher n gegen Unendlich strebt, d.h. derZeitschritt k = t ngegen Null geht.Insbesondere erhalten wir für λ =1,dassu(t)=exp(t) dieLösung derDifferentialgleichungu ′ (t)=u(t), für t>0, u(0) = 1 (26.24)ist. Wir haben die Funktion exp(t) in Abb. 4.4 dargestellt, aus der dieSorge von Malthus verständlich wird. Die Exponentialfunktion wächst nacheiniger Zeit tatsächlich schnell!(26.17) modelliert für λ ∈Rviele physikalische Probleme, wie den radioaktivenZerfall (λ0).26.9 Einsteinsches BewegungsgesetzEinsteins Fassung des Newtonschen Gesetzes (m 0 v(t)) ′ (t) =f(t), das dieBewegung eines Teilchens der Masse m 0 beschreibt, das sich auf einer Geradenunter der Kraft f(t) mit der Geschwindigkeit v(t) bewegt, lautetddt(m 0√1 − v2 (t)/c 2 v(t) )= f(t). (26.25)Dabei ist m 0 die Masse des Teilchens im Ruhezust<strong>and</strong> und c ≈ 3×10 8 m/sist die Geschwindigkeit des Lichts im Vakuum. Wenn wirw(t)=v(t)√1 − v2 (t)/c 2setzen und annehmen, dass f(t)=F konstant ist und dass v(0) = 0, dannerhalten wir w(t)= F m 0t, woraus sich die folgende Gleichung für v(t)ergibt:v(t)√1 − v2 (t)/c 2 = F m 0t.


26.10 Zusammenfassung 443Das Quadrieren beider Seiten liefertwas wir nach v(t) auflösen können:v 2 (t)1 − v 2 (t)/c 2 = F 2t 2 ,m 2 0v 2 (t)=c 2 F 2 t 2m 2 0 c2 + F 2 t 2 . (26.26)Wir folgern, dass v 2 (t) 0, u(0) = u 0 , (26.28)u ′ (x)=u(x) für x>0, u(0) = u 0 , (26.29)u ′′ (x)+u(x)=0 für x>0,u(0) = u 0 ,u ′ (0) = u 1 , (26.30)−u ′′ (x)=f(x) für 0


444 26. Galileo, Newton, Hooke, Malthus und FourierIm Kapitel ”Die Exponentialfunktion exp(x) =e x “ sehen wir, dass dieLösung von (26.29) u(x) =u 0 exp(x) ist und schließlich erkennen wir imKapitel ”Trigonometrische Funktionen “, dass die Lösung u(x) von (26.30)sin(x) ist, wenn u 0 = 0 und u 1 = 1 und cos(x), falls u 0 = 1 und u 1 =0.Wir schließen daraus, dass die wichtigen Elementarfunktionen exp(x),sin(x) und cos(x) Lösungen wichtiger Differentialgleichungen sind. Wirwerden erkennen, dass es äußerst fruchtbar ist, diese Elementarfunktionenals Lösungen der entsprechenden Differentialgleichungen zu definierenund dass sich wichtige Eigenschaften dieser Funktionen aus diesenDifferentialgleichungen herleiten lassen. So folgt beispielsweise die Tatsache,dass D exp(x) = exp(x) aus der definierenden DifferentialgleichungDu(x) =u(x). Ferner ergibt sich die Tatsache, dass D sin(x) =cos(x) durch Ableitung von D 2 sin(x)+sin(x) =0nachx. Dies ergibtD 2 (D sin(x)) + D sin(x) = 0. Daraus erkennen wir, dass D sin(x) dieGleichung u ′′ (x) +u(x) = 0 mit den Anfangsbedingungen u 0 = 1 undu 1 = Du(0) = D 2 sin(0) = − sin(0) = 0 löst, d.h. D sin(x)=cos(x)!Aufgaben zu Kapitel 2626.1. Ein Körper wird aus einer Höhe s 0 = 15 m fallen gelassen. Nach welcherZeit trifft er auf? Wie verlängert die Anfangsgeschwindigkeit v 0 = −2 die Zeit biszum Aufschlag? Benutzen Sie die (grobe) Näherung g ≈ 10, um die Berechnungenzu vereinfachen. Wie groß muss die Anfangsgeschwindigkeit sein, um die Fallzeitzu verdoppeln?26.2. Bestimmen Sie die Auslenkung einer hängenden Feder der Länge L =1und E = 1 bei uneinheitlichem Gewicht f(x)=x.26.3. (Schwierig!) Bestimmen Sie die Auslenkung einer hängenden Feder derLänge L = 2, die aus zwei Federn der Länge L =1mit(a)E = 1 und E =2besteht, wenn das Gewicht einheitlich f(x)=1beträgt, (b) jeweils E =1abermit den Gewichten f = 1 und f = 2 pro Einheitslänge.26.4. Leiten Sie (26.12) aus (26.10) her. Hinweis: u in (26.12) entspricht derAuslenkung L + u in (26.10) für x = L und die Auslenkung ist linear in x.26.5. Stellen Sie kompliziertere Populationsmodelle in der Form von Differentialgleichungssystemenauf.26.6. Stellen Sie Differentialgleichungssysteme für parallel und in Serie gekoppelteFedern auf.26.7. Stellen Sie eine Differentialgleichung für einen ”bungee jump“ auf, wobeiein Körper an einem elastischen B<strong>and</strong> der Gravitation ausgesetzt ist.26.8. Sie lassen eine heiße Kaffeetasse in einem Zimmer stehen, das eine Temperaturvon 20 ◦ Celsius hat. Stellen Sie eine Gleichung für die Änderungsrate derTemperatur des Kaffees mit der Zeit auf.


Aufgaben zu Kapitel 26 445Show that the median, hce che ech, interecting at royde angles theparilegs of a given obtuse one biscuts both the arcs that are in curveachordbehind. Brickbaths. The family umbroglia. A Tullagrovepole to the Heigt of County Fearmanagh has a septain inclininaison<strong>and</strong> the graphplot for all the functions in Lower County Monachan,whereat samething is rivisible by nighttim. may be involted into thezerois couplet, palls pell inhis heventh glike noughty times ∞, find,if you are literally cooefficient, how minney combinaisies <strong>and</strong> permut<strong>and</strong>iscan be played on the international surd! pthwndxrclzp!, hidscubid rute being extructed, takin anan illitterettes, ifif at a tom.Answers, (for teasers only). (Finnegans Wake, James Joyce)


Literaturverzeichnis[1] L. Ahlfors, Complex Analysis, McGraw-Hill Book Company, NewYork, 1979.[2] K. Atkinson, An Introduction to Numerical Analysis, John Wiley<strong>and</strong> Sons, New York, 1989.[3] L. Bers, Calculus, Holt, Rinehart, <strong>and</strong> Winston, New York, 1976.[4] M. Braun, Differential Equations <strong>and</strong> their Applications, Springer-Verlag, New York, 1984.[5] R. Cooke, The History of Mathematics. A Brief Course, John Wiley<strong>and</strong> Sons, New York, 1997.[6] R. Courant <strong>and</strong> F. John, Introduction to Calculus <strong>and</strong> Analysis,vol. 1, Springer-Verlag, New York, 1989.[7] R. Courant <strong>and</strong> H. Robbins, What is Mathematics?, OxfordUniversityPress, New York, 1969.[8] P. Davis <strong>and</strong> R. Hersh, The Mathematical Experience, HoughtonMifflin, New York, 1998.[9] J. Dennis <strong>and</strong> R. Schnabel, Numerical Methods for UnconstrainedOptimization <strong>and</strong> Nonlinear Equations, Prentice-Hall, New Jersey,1983.


448 Literaturverzeichnis[10] K. Eriksson, D. Estep, P. Hansbo, <strong>and</strong> C. Johnson, ComputationalDifferential Equations, Cambridge University Press, New York,1996.[11] I. Grattan-Guiness, The Norton History of the MathematicalSciences, W.W. Norton <strong>and</strong> Company, New York, 1997.[12] P. Henrici, Discrete Variable Methods in Ordinary Differential Equations,John Wiley <strong>and</strong> Sons, New York, 1962.[13] E. Isaacson <strong>and</strong> H. Keller, Analysis of Numerical Methods, JohnWiley <strong>and</strong> Sons, New York, 1966.[14] M. Kline, Mathematical Thought from Ancient to Modern Times,vol. I, II, III, Oxford University Press, New York, 1972.[15] J. O’Connor <strong>and</strong> E. Robertson, The MacTutor Historyof Mathematics Archive, School of Mathematics <strong>and</strong>Statistics, University of Saint Andrews, Scotl<strong>and</strong>, 2001.http://www-groups.dcs.st-<strong>and</strong>.ac.uk/∼history/.[16] W. Rudin, Principles of Mathematical Analysis, McGraw–Hill BookCompany, New York, 1976.[17] T. Ypma, Historical development of the Newton-Raphson method,SIAM Review, 37 (1995), pp. 531–551.


Sachverzeichnis, 371Æ, 59É, 90Ê, 215,60ǫ−N Definition des Grenzwerts, 185Abacus, 4Ableitung, 385Berechnung von, 396Definition, 388der Inversen, 415Differenzenquotient, 394einseitige, 412gleichmäßige, 398implizite, 416Kettenregel, 408partielle, 417Produktregel, 407Quotientenregel, 410Tangente, 385von x n , 391von Linearkombinationen, 406analytische Geometrie, 289Babbage, 4Banach, 271Barbier-Paradoxon, 248Basis, 322, 328, 365Bisektion, 204, 235Bolzano, 236Cantor, 253Cauchy-Folge, 208, 214Cauchysche Ungleichung, 342chemisches Gleichgewicht, 93Cramersche Regel, 358Definitionsmenge, 116Dekasektion, 209, 240Descartes, 290Determinante, 349Dezimalentwicklung, 85nicht periodische, 85, 214periodische, 214Differentialgleichung, 432Differenzenquotient, 394Drehung, 310, 327Dreifach-Produkt, 348Ebene, 351Einheitsmatrix, 331, 362Einsteinsches Bewegungsgesetz, 442Endkriterium, 428


450 SachverzeichnisENIAC, 4Euklid, 97, 136euklidische Ebene, 292euklidische Norm, 300, 342Fixpunkt, 269Flächeeines Dreiecks, 315eines Parallelogramms, 317Fließkomma Arithmetik, 195Formalisten, 246Fouriersches Gesetz, 438Fundamentalsatz der Algebra, 376Funktion, 115y = x r , 265Polynom-, 131rationale, 155zusammengesetzte, 153Gödel, 244Galileo, 433ganze Zahlen, 53Computerdarstellung von, 66Division mit Rest, 64Gauss, 69, 112Gauss-Elimination, 359geometrische Reihe, 143, 188geordnetes Paar, 296Gerade, 317, 349gleichmäßig differenzierbar, 398GPS, 12, 104, 294Grenzwert, 192Hölder-Stetigkeit, 267harmonische Reihe, 142Hilbert, 246Hookesches Gesetz, 436imaginäre Zahlen, 372Induktion, 71Intuitionisten, 249Invarianz, 367Inverse Funktion, 415Inverse Matrix, 364irrationale Zahlen, 207Jacquard, 4komplexe Ebene, 371komplexe Zahlen, 371Konstruktivisten, 249kontrahierende Abbildung, 270Konvergenz-geschwindigkeit, 281quadratische, 428Koordinatensystem, 292Kovalevskaya, 196Kreuzprodukt, 312, 344Kronecker, 253l’Hopital, Regel von, 403Lügner-Paradoxon, 248Leibniz, 46, 116lineare Abbildung, 324, 366lineare Unabhängigkeit, 323, 365lineares Gleichungssystem, 320, 357Linearkombination, 302Lipschitz-Stetigkeit, 161, 217, 224Beschränktheit, 171konvergente Folge, 189lineare Funktion, 162Linearkombination, 169Monome, 167Produkt von Funktionen, 172Quotient von Funktionen, 173Verallgemeinerung, 267zusammengesetzte Funktionen,174Logiker, 246Malthus, 440Mathematisches Labor, 23Matrix, 326Addition, 328, 360Inverse, 331, 364Multiplikation, 329, 361Multiplikation mit Skalar, 329,360orthogonal, 365Singularität, 363Transponierte, 330, 361medizinische Tomographie, 13Mengenschreibweise, 89Mittag-Leffler, 378Modell einer Mittagssuppe, 29Modell vom schlammigen Hof, 32natürliche Zahlen, 53


Sachverzeichnis 451Newton-Methode, 421Newtons Bewegungsgesetz, 432nicht-euklidische Geometrie, 112Norm, 300, 342Nullstelle, 157, 285, 377, 425orthogonale Matrix, 365orthogonale Zerlegung, 307parallele Geraden, 320Parallelogramm, 297Peano’sche Axiome, 251Polardarstellung, 301, 374Polynom, 131Population, 46, 441Bakterien, 92, 193Insekten, 74Primzahlen, 65Projektion, 307, 328, 342Punkt auf Ebene, 355Punkt auf Gerade, 319, 350Pythagoras, 97, 203quadratische Ergänzung, 141Quaternionen, 372Raketenantrieb, 439rationale Zahlen, 79Computerdarstellung von, 195Rechenschieber, 4reelle Zahlen, 213, 215Absolutbetrag, 218Addition, 215Cauchy-Folge, 222Division, 218Multiplikation, 218Vergleich, 219Residuum, 426Satz von Pythagoras, 97Schuldivision, 86Skalarprodukt, 303, 341Swedenborg, 401Tangente, 385Taylor-Formel, 414Turing, 246unabhängige Variable, 117unendliche Dezimalentwicklung, 213Unterraum, 357Variable, 116Vektor, 295Addition, 297Basis, 322, 328, 365Drehung, 310, 327Dreifach-Produkt, 348geometrisch orthogonal, 305lineare Unabhängigkeit, 323,365Linearkombination, 302Multiplikation mit Skalar, 299Norm, 300, 342Polardarstellung, 301Produkt, 312, 344Projektion, 307, 342Skalarprodukt, 303, 341, 361Winkel, 343Verhulst, 193Volumen, 347Wärmeausbreitung, 438Weierstrass, 185Wertebereich, 116Wettervorhersage, 11Wurzel aus Zwei, 201Zwischenwertsatz, 236


Druck:Verarbeitung:Strauss GmbH, MörlenbachSchäffer, Grünstadt

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!