12.07.2015 Aufrufe

Analysis II für Mathematiker

Analysis II für Mathematiker

Analysis II für Mathematiker

MEHR ANZEIGEN
WENIGER ANZEIGEN
  • Keine Tags gefunden...

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Vorlesung <strong>Analysis</strong> <strong>II</strong>SS 2013Steffen Roch


Für i = 0,...,n sei x i ∈ [a,b]. Die Menge Z := {x 0 ,...,x n } heißt eine Zerlegungdes Intervalls [a,b], wenn a = x 0 < x 1 < ... < x n = b. Die Länge des i. TeilintervallsI i := [x i ,x i+1 ] bezeichnen wir mit ∆x i := x i+1 − x i oder |I i |. Die Zahl|Z| := max 0≤i≤n−1 ∆x i heißt das Feinheitsmaß oder die Maschenweite von Z. IstZ eine Zerlegung von [a,b], und geht eine weitere Zerlegung Z ′ von [a,b] aus Zdurch Hinzufügen weiterer Punkte hervor, so heißt Z ′ Verfeinerung von Z. Dannist offenbar |Z ′ | ≤ |Z|.Sei Z = {x 0 ,...,x n } eine Zerlegung von [a,b] und ξ := (ξ 0 ,...,ξ n−1 ) ein zugehörigerZwischenvektor, d.h. es gelte x i ≤ ξ i ≤ x i+1 für jedes i. Dann heißtS(Z,ξ,f) :=∑n−1i=0f(ξ i )∆x ieine Riemann–Summe für f. Sei schließlich (Z n ) ∞ n=1 eine Folge von Zerlegungenvon [a,b] mit |Z n | → 0 für n → ∞, und für jedes n sei ξ (n) ein Zwischenvektorfür Z n . Dann heißt die Folge (S(Z n ,ξ (n) ,f)) ∞ n=1 der entsprechenden Riemann–Summen eine Riemann–Folge für f.Definition 8.1 Eine Funktion f : [a,b] → R heißt Riemann–integrierbar, wennjede Riemann–Folge (S(Z n ,ξ (n) ,f)) ∞ n=1 konvergiert.Lemma 8.2 Ist f : [a,b] → R Riemann–integrierbar, so haben alle Riemann–Folgen für f den gleichen Grenzwert.Beweis Sind (S n (1) ) und (S n (2) ) Riemann–Folgen für f, so ist auch (S n ) :=(S (1)1 ,S (2)1 , S (1)2 ,S (2)2 ,...,) eine Riemann–Folge für f. Nach Voraussetzung konvergiertdie Folge (S n ). Dann konvergieren auch ihre Teilfolgen (S n (1) ) und (S n (2) )gegen den gleichen Grenzwert.Definition 8.3 Sei f : [a,b] → R Riemann–integrierbar und (S(Z n ,ξ (n) ,f)) ∞ n=1eine Riemann–Folge f. Dann heißt der Grenzwert lim n→∞ S(Z n ,ξ (n) ,f) das Riemann–Integralvon f, und wir bezeichnen diesen Grenzwert mit ∫ ba f(x)dx.Beachten Sie, dass ∫ bf(x)dx nach Lemma 8.2 nicht von der Wahl der Riemann–aFolge abhängt.Satz 8.4 Ist f : [a,b] → R Riemann–integrierbar, so ist f beschränkt.Beweis Angenommen, f ist auf [a,b] unbeschränkt, etwa sup x∈[a,b] f(x) = +∞.Dann gibt es eine Folge (x i ) von Punkten aus [a,b] mit f(x i ) → +∞. Aus derFolge (x i ) lässt sich eine konvergente Teilfolge auswählen (Bolzano/Weierstraß).Der Einfachheit halber nehmen wir an, dass die Folge (x i ) bereits selbst konvergiert.Ihr Grenzwert sei ˆx.Ist Z eine Zerlegung von [a,b], so gibt es sicher ein Teilintervall I m von Z, welches126


den Punkt ˆx und noch unendlich viele der Punkte x i enthält. Der Einfachheit halbernehmen wir wieder an, dass alle x i in I m liegen.Für alle Teilintervalle I k ≠ I m von Z wählen wir irgendwelche Zwischenpunkteξ k und setzenS ′ := ∑ f(ξ k )|I k |.k≠mIst nun eine beliebig große Zahl G vorgegeben, so können wir wegen lim i→∞ f(x i )= +∞ als Zwischenpunkt ξ m ∈ I m einen der Punkte x i so wählen, dassf(ξ m ) > (G−S ′ )/|I m | bzw. S(Z,ξ,f) = S ′ +f(ξ m )|I m | > G.Es lässt sich also eine Riemann–Folge (S(Z n ,ξ (n) ,f)) ∞ n=1 konstruieren, welchebestimmt gegen +∞ divergiert. Dann kann f nicht Riemann–integrierbar sein.8.2 Darbouxsche IntegraleWirbetrachteneinenweiterenZugangzumRiemann–Integral.FürjedeZerlegungZ von [a,b] und jede beschränkte Funktion f : [a,b] → R seiund wir nennenU(Z,f) :=m i := infx∈I if(x), M i := supx∈I if(x),∑n−1i=0die zugehörige Unter– bzw. Obersumme.m i ∆x i bzw. O(Z,f) :=Lemma 8.5 Sei f : [a,b] → R beschränkt.∑n−1i=0M i ∆x i(a) Für jede Zerlegung Z von [a,b] und jede Verfeinerung Z ′ von Z giltU(Z,f) ≤ U(Z ′ ,f), O(Z ′ ,f) ≤ O(Z,f).(b) Für je zwei Zerlegungen Z 1 ,Z 2 von [a,b] gilt U(Z 1 ,f) ≤ O(Z 2 ,f).Beweis (a) Wir zeigen nur die erste Behauptung, und diese nur für den Fall,dass Z ′ genau einen Punkt x ∗ mehr enthält als Z. Unterscheiden sich Z und Z ′um p > 1 Punkte, muss diese Überlegung p mal angewandt werden.Sei Z = (x 0 ,...,x n ) und x j < x ∗ < x j+1 . Fürm ′ j := inf f(x) und m′′x∈[x j ,x ∗ j := inf f(x)] x∈[x ∗ ,x j+1 ]127


Da außerdem beim Übergang von Z n zu Z ′ n höchstens r neue Punkte hinzukommen,giltU(Z ′ n,f)−U(Z n ,f) ≤ 2rM|Z n |. (8.2)Wir überlegen uns (8.2) zunächst für einen hinzukommenden Punkt t. Liegt tetwa in [x i ,x i+1 ], wobei die x i Punkte der Zerlegung Z n sind, so hat manU(Z ′ n,f)−U(Z n ,f) = infx∈[x i ,t] f(x)(t−x i)+ infx∈[t,x i+1 ] f(x)(x i+1 −t)− infx∈[x i ,x i+1 ] f(x)(x i+1 −x i )≤ M(t−x i )+M(x i+1 −t)+M(x i+1 −x i )= 2M∆x i ≤ 2M|Z n |.Damit ist (8.2) für einen hinzukommenden Punkt gezeigt, und der allgemeineFall ergibt sich durch Wiederholung dieser Überlegungen.Addition von (8.1) und (8.2) ergibt nun∫ b0 ≤ f(x)dx−U(Z n ,f) < ε/2+2rM|Z n | ≤ ε/2+ 2rMε4rM = ε∗afür alle n ≥ N, woraus die behauptete Konvergenz folgt.Wir nennen eine beschränkte Funktion f : [a,b] → R Darboux–integrierbar, wenn∫ b ∫ ∗bf(x)dx = f(x)dx.∗aSatz 8.7 Eine beschränkte Funktion f : [a,b] → R ist genau dann Darboux–integrierbar, wenn es für jedes ε > 0 eine Zerlegung Z von [a,b] mit O(Z,f) −U(Z,f) < ε gibt.Beweis (⇐=)Seiε > 0.WirwähleneineZerlegungZ mitO(Z,f)−U(Z,f) < ε.Wegen∫ b ∫ ∗bU(Z,f) ≤ f(x)dx ≤ f(x)dx ≤ O(Z,f)ist dann erst recht0 ≤∗a∫ ∗baa∫f(x)dx−ab∗af(x)dx < ε.Dies gilt für jedes ε > 0. Also sind oberes und unteres Darbouxsches Integralgleich.(=⇒) Sei f Darboux–integrierbar und J := ∫ bf(x)dx, und ε > 0 sei beliebig∗a vorgegeben. Da J das Infimum von Ober– und das Supremum von Untersummenist, gibt es Zerlegungen Z 1 ,Z 2 von [a,b] so, dassJ −U(Z 1 ,f) < ε/2 und O(Z 2 ,f)−J < ε/2.129


Sei Z eine gemeinsame Verfeinerung von Z 1 und Z 2 . Dann ist nach Lemma 8.5(a) U(Z 1 ,f) ≤ U(Z,f) sowie O(Z,f) ≤ O(Z 2 ,f) und folglichJ −U(Z,f) < ε/2 und O(Z,f)−J < ε/2.Addition dieser Ungleichungen ergibt O(Z,f)−U(Z,f) < ε.DerZusammenhangzwischenRiemann–undDarboux–Integrierbarkeitwirddurchfolgenden Satz hergestellt.Satz 8.8 Eine beschränkte Funktion f : [a,b] → R ist genau dann Riemann–integrierbar, wenn sie Darboux–integrierbar ist. In diesem Fall gilt∫ b ∫ b ∫ ∗bf(x)dx = f(x)dx = f(x)dx.a∗aBeweis (=⇒) Sei f Darboux–integrierbar und (S(Z n ,ξ (n) ,f)) eine Riemann–Folge für f. Für alle n ∈ N ist dannaU(Z n ,f) ≤ S(Z n ,ξ (n) ,f) ≤ O(Z n ,f). (8.3)Nach Satz 8.6 konvergieren die linke Seite von (8.3) für n → ∞ gegen ∫ bf(x)dx ∗a und die rechte Seite gegen ∫ ∗bf(x)dx, und diese Grenzwerte sind gleich. Dannamuss∫aber auch die Riemann–Folge konvergieren, und ihr Grenzwert stimmt mitbf(x)dx überein (Satz 4.2). Also ist f Riemann–integrierbar.∗a (⇐=) Sei f Riemann–integrierbar und ε > 0 beliebig vorgegeben. Wir konstruierenzwei spezielle Riemann–Folgen für f wie folgt: Z n sei die Zerlegung von [a,b]in n Intervalle gleicher Länge, und ξ i,ξ ′ i ′′ ∈ [x i ,x i+1 ] seien so gewählt, dasssup f(x)−f(ξ ′ εi)


folgt. Nach Satz 8.7 ist f Darboux–integrierbar.Eine unmittelbare Folgerung aus Satz 8.7 und Satz 8.8 istFolgerung 8.9 (Riemannsches Integrabilitätskriterium) Eine beschränkteFunktion f : [a,b] → R ist genau dann Riemann–integrierbar, wenn für jedesε > 0 eine Zerlegung Z von [a,b] mit O(Z,f)−U(Z,f) < ε existiert.Beispielsweise ist für die Dirichlet–Funktion{1 falls x rationalf(x) =0 falls x irrationalauf [a,b] jede Obersumme gleich b − a und jede Untersumme gleich 0. DieseFunktion ist also nicht Riemann–integrierbar.8.3 Einige Klassen Riemann–integrierbarer FunktionenSatz 8.10 Monotone Funktionen auf [a,b] sind Riemann–integrierbar.Beweis Seif : [a,b] → Rbeispielsweisemonotonwachsend.Fürjedesn ∈ N\{0}sei Z n die Zerlegung von [a,b] in n Teilintervalle gleicher Länge. Dann istsowieAlso istU(Z n ,f) =O(Z n ,f) =O(Z n ,f)−U(Z n ,f) = b−an∑n−1k=0∑n−1k=0m k ∆x k = b−anM k ∆x k = b−an( n∑f(x k )−k=1∑n−1k=0∑n−1k=0∑n−1k=0f(x k )f(x k+1 ).)f(x k ) = b−a ( )f(b)−f(a) .nDies wird kleiner als jedes vorgegebene ε > 0, wenn nur n groß genug ist.Satz 8.11 Stetige Funktionen auf [a,b] sind Riemann–integrierbar.Beweis Sei f : [a,b] → R stetig und ε > 0. Da f auf [a,b] gleichmäßig stetigist (Satz 6.43), gibt es ein δ > 0 so, dass |f(t 1 ) − f(t 2 )| < ε/(b − a) für allet 1 ,t 2 ∈ [a,b] mit |t 1 −t 2 | < δ.Sei Z = (x 0 ,...,x n ) Zerlegung von [a,b] mit |Z| < δ. Dann ist∑n−1O(Z,f)−U(Z,f) = (M i −m i )∆x i .131i=0


DastetigeFunktionenaufkompaktenMengenihrSupremumundInfimumannehmen,gibt es für jedes i Punkte ξ i,ξ ′ i ′′ ∈ [x i ,x i+1 ] mit f(ξ i) ′ = M i und f(ξ i) ′′ = m i .Ausx i ≤ ξ i,ξ ′ i ′′ ≤ x i+1 folgtweiter|ξ i−ξ ′ i| ′′ < δ undsomitf(ξ i)−f(ξ ′ i) ′′ < ε/(b−a).Schließlich erhalten wir∑n−1( )O(Z,f)−U(Z,f) = f(ξ i)−f(ξ ′ i)′′ ∆x i ≤ ε ∑n−1∆x i = ε.b−ai=08.4 Das Lebesguesche IntegrabilitätskriteriumDieses Kriterium stellt einen Zusammenhang zwischen der Riemann–Integrierbarkeiteiner Funktion und der Menge ihrer Unstetigkeiten her. Wir benötigendafür den folgenden Begriff. Die Länge eines Intervalls I bezeichnen wir mit |I|.Definition 8.12 Eine Menge M ∈ R heißt Nullmenge, wenn es zu jedem ε > 0höchstens abzählbar viele abgeschlossene Intervalle I 1 ,I 2 ,... gibt, die M überdecken(d.h. M ⊆ ⋃ I j ) und für die ∑ |I j | < ε ist.Man kann in dieser Definition “abgeschlossen” durch “offen” ersetzen.Lemma 8.13 (a) Jede Teilmenge einer Nullmenge ist eine Nullmenge.(b) Abzählbare Teilmengen von R sind Nullmengen.(c) Die Vereinigung abzählbar vieler Nullmengen ist eine Nullmenge.(d) Eine kompakte Menge M ⊆ R ist genau dann Nullmenge, wenn es für jedesε > 0 endlich viele abgeschlossene Intervalle I j mit M ⊆ ⋃ j I j und ∑ j |I j| < εgibt.Beweis (a) Klar.(b) Sei {x 1 ,x 2 ,...} eine abzählbare Teilmenge von R und ε > 0. Dann liegt x j imIntervall I j := [x j − ε2 −j−2 ,x j + ε2 −j−2 ]. Also überdeckt die Vereinigung ⋃ j I jdie Menge {x 1 ,x 2 ,...}, und für die Intervalllängen gilti=0∞∑|I j | =j=1∞∑ε·2 −j−1 = ε/2 < ε.j=1(c) Seien M 1 ,M 2 ,... Nullmengen und ε > 0. Für jede Menge M j gibt es IntervalleI j1 ,I j2 ,... mit ∑ k |I jk| < ε · 2 −j , welche M j überdecken. Dann überdecken die(abzählbar vielen nach Satz 2.8) Intervalle I 11 ,I 12 ,...,I 21 ,I 22 ,...,I 31 ,I 32 ,... dieVereinigung ⋃ j M j, und für die Intervalllängen gilt∞∑j=1∞∑|I jk | 0. Ist M Nullmenge, so gibt es abgeschlosseneIntervalle I 1 ,I 2 ,... mit M ⊂ ⋃ j I j und ∑ j |I j| =: δ < ε. Ist etwa I j = [a j ,b j ] so132


setzen wir L j := (a j −(ε−δ)2 −j−2 , b j +(ε−δ)2 −j−2 ). Die offenen Intervalle L jüberdecken M. Da M kompakt ist, überdecken bereits endlich viele dieser Intervalledie Menge M, etwa L 1 ,...,L k . Dann überdecken auch die abgeschlossenenIntervalle L 1 ,...,L k die Menge M, und für die Intervalllängen gilt:k∑|L j | ≤j=1∞∑|L j | =j=1∞∑ ) (|I j |+(ε−δ)2 −j−1 = δ + 1 (ε−δ) < ε.2j=1Sei M ⊆ R. Eine Funktion f : M → R heißt auf M fast überall stetig, wenndie Menge ihrer Unstetigkeitsstellen eine Nullmenge ist. Allgemeiner sagt man,dass eine Eigenschaft fast überall erfüllt ist, wenn die “Ausnahmepunkte” eineNullmenge bilden.Satz 8.14 (Lebesguesches Integrabilitätskriterium) Eine Funktion f :[a,b] → R ist genau dann Riemann–integrierbar, wenn sie beschränkt und fastüberall stetig ist.FürdenBeweisbenötigenwireinigegenauereAussagenüberUnstetigkeitsstellen.Sei f : [a,b] → R eine beschränkte Funktion und T eine nichtleere Teilmenge von[a,b]. Die ZahlΩ f (T) := supt∈Tf(t)−inft∈Tf(t) = sup{|f(x)−f(y)| : x,y ∈ T}heißt Oszillation oder Schwankung von f auf T. Für jedes fixierte x ∈ [a,b] istdie Funktion)(0,∞) → R, δ ↦→ Ω f(U δ (x)∩[a,b]monoton wachsend und nach unten durch 0 beschränkt. Also existiert der Grenzwert( )lim Ω f U δ (x)∩[a,b] =: ω f (x).δ→0+Die Zahl ω f (x) heißt Oszillation von f in x.Lemma 8.15 Eine beschränkte Funktion f : [a,b] → R ist genau dann stetig inx ∈ [a,b], wenn ω f (x) = 0.Der Beweis benutzt nur die Definition der Stetigkeit und ist HA.Wir bezeichnen die Menge der Unstetigkeitsstellen von f mit ∆(f), und für jedesε > 0setzen wir ∆ ε (f) := {x ∈ [a,b] : ω f (x) ≥ ε}.EineunmittelbareKonsequenzvon Lemma 8.15 istFolgerung 8.16 Für jede beschränkte Funktion f : [a,b] → R ist∆(f) =∞⋃∆ 1/k (f).k=1133


Man kann leicht zeigen, dass jede der Mengen ∆ ε (f) kompakt ist.Folgerung 8.17 ∆(f) ist eine abzählbare Vereinigung kompakter Mengen.Wir kommen nun zum Beweis von Satz 8.14.Beweis (⇐) Sei f : [a,b] → R beschränkt (d.h. es ist |f(x)| ≤ C für alle x aus[a,b]) und ∆(f) sei Nullmenge. Wir zeigen, dass es für jedes ε > 0 eine ZerlegungZ von [a,b] mit O(Z,f)−U(Z,f) < (2C +b−a)ε gibt. Aus dem RiemannschenIntegrabilitätskriterium folgt dann die Riemann-Integrierbarkeit von f.Wie im Beweis von Lemma 8.13 (d) sieht man, dass ∆(f) durch abzählbar vieleoffene Intervalle J 1 ,J 2 ,... überdeckt werden kann, wobei für die Längen ihrerAbschließungen gilt: ∑|J j | < ε. (8.6)jWeiter: in jedem Punkt x ∈ [a,b]\∆(f) ist f stetig. Wir finden daher für jedessolche x ein offenes Intervall U x mitx ∈ U x und sup{f(x) : x ∈ U x }−inf{f(x) : x ∈ U x } < ε. (8.7)Das System aller Intervalle J j und U x bildet eine offene Überdeckung von [a,b].Nach dem Heine-Borelschen Überdeckungssatz lassen sich endlich viele IntervalleJ j1 ,...,J jn ,U x1 ,...,U xs auswählen,dieebenfalls[a,b]überdecken.SeinunZ eineZerlegung von [a,b] derart, dass jedes ihrer Teilintervalle I 0 ,...,I l in einem derIntervalle J j1 ,...,J jn , U x1 ,...,U xs liegt (man kann z.B. für Z die Menge allerEndpunkte der Intervalle J j1 ,...,U xs wählen, die in [a,b] liegen). Die Differenz∑l−1O(Z,f)−U(Z,f) = (M k −m k )|I k |schreiben wir als Σ 1 +Σ 2 , wobei Σ 1 die Summe aller (M k −m k )|I k | ist, für dieI k in einem der Intervalle J j liegt und Σ 2 die übrigen Summanden enthält. Aus(8.6) bzw. (8.7) folgt dannk=0Σ 1 ≤ ∑ j2C|J j | (8.6)< 2Cε bzw. Σ 2(8.7)≤ ε(b−a).Also ist O(Z,f)−U(Z,f) = Σ 1 +Σ 2 < (2C +b−a)ε.(⇒) Sei f : [a,b] → R Riemann-integrierbar. Dann ist f beschränkt nachSatz 8.4. Wir zeigen, dass ∆(f) eine Nullmenge ist. Nach Folgerung 8.16 ist∆(f) =∞⋃∆ 1/k (f),k=1134


und da jede abzählbare Vereinigung von Nullmengen eine Nullmenge ist (Lemma8.8(c) genügt es zu zeigen, dass jede der Mengen ∆ 1/k (f) eine Nullmenge ist.Falls ∆ 1/k (f) = ∅, ist nichts zu beweisen. Sei also ∆ 1/k (f) ≠ ∅. Sei ε > 0 beliebig.Nach dem Riemannschen Integrabilitätskriterium gibt es eine Zerlegung Z von[a,b] mitO(Z,f)−U(Z,f) < ε2k . (8.8)Wir bezeichnen mit M ∗ die Menge aller Teilintervalle I m von Z, die einen Punktaus ∆ 1/k (f) in ihrem Inneren enthalten. (Beachte: M ∗ kann leer sein.)Sei zunächst I m ∈ M ∗ , und x ∈ ∆ 1/k (f) liege im Inneren von I m . Dann gibt eseine δ–Umgebung U ⊆ I m von x mit Ω f (U) ≥ 1/k. Erst recht ist dannHieraus folgt mit (8.8) sofortd.h. es istM m −m m = Ω f (I m ) ≥ Ω f (U) ≥ 1/k.ε2k > O(Z,f)−U(Z,f) ≥ ∑(M m −m m )|I m | ≥ 1 ∑|I m |,kI m∈M ∗ I m∈M ∗∑I m∈M ∗ |I m | < ε 2 . (8.9)Schließlich bestimmen wir zu den Teilpunkten x 0 ,...,x n von Z abgeschlosseneIntervalle I ′ 0,...,I ′ n mitx k ∈ I ′ kundn∑|I k| ′ < ε 2 . (8.10)k=0Die Menge ∆ 1/k (f) wird vom endlichen Intervallsystem {I ′ 0,...I ′ n} ∪ M ∗ überdeckt,und da wegen (8.9) und (8.10) die Summe der entsprechenden Intervalllängenkleiner als ε/2+ε/2 = ε ist, ist ∆ 1/k (f) eine Nullmenge.Folgerung 8.18 Ist f : [a,b] → R beschränkt und die Menge der Unstetigkeitsstellenvon f abzählbar, so ist f Riemann-integrierbar.Man erhält hieraus wieder die Riemann-Integrierbarkeit stetiger und auch diemonotoner Funktionen (wie?). Auch ist beispielsweise die Funktion{0 wenn x irrational,f : x ↦→1/q wenn x = p/q mit p,q ∈ Z, q ≠ 0, g.g.T. (p,q) = 1auf jedem Intervall [a,b] Riemann-integrierbar. Es ist nämlich ∆(f) = Q∩[a,b].135


8.5 Eigenschaften des Riemann-IntegralsSatz 8.19 Sind f,g : [a,b] → R Riemann-integrierbar und stimmen f und g aufeiner in [a,b] dichten Menge M überein, so ist∫ baf(x)dx =∫ bag(x)dx.Beweis Sei (Z n ) eine Folge von Zerlegungen von [a,b] mit |Z n | → 0. Wegen derDichtheit von M in [a,b] findet man für jedes Z n einen Zwischenvektor ξ (n) =(ξ (n)0 ,...,ξ n−1) (n) mit ξ (n)i ∈ M für alle i und n. Dann ist aber auchf(ξ (n)i ) = g(ξ (n)i ) für alle i und n,und die entsprechenden Riemann-Summen stimmen überein:Hieraus folgt die Behauptung.S(Z n ,ξ (n) ,f) = S(Z n ,ξ (n) ,g).Folgerung 8.20 Sind f,g : [a,b] → R Riemann-integrierbar und ist N := {x ∈[a,b] : f(x) ≠ g(x)} eine Nullmenge, so ist∫ baf(x)dx =∫ bag(x)dx.Der Beweis folgt sofort aus Satz 8.19. Da N Nullmenge ist, enthält N keineoffenen Intervalle. Also ist [a,b]\N dicht in [a,b], und auf dieser Menge stimmenf und g überein.Satz 8.21 (a) Sei f auf [a,b] Riemann-integrierbar und a ≤ a 1 < b 1 ≤ b. Dannist f auch auf [a 1 ,b 1 ] Riemann-integrierbar.(b) Sei a < c < b, und f sei auf [a,c] und auf [c,b] Riemann-integrierbar. Dannist f auf [a,b] Riemann-integrierbar, und es gilt∫ baf(x)dx =∫ caf(x)dx+∫ bcf(x)dx. (8.11)Beweis Beide Aussagen ergeben sich leicht mit dem Lebesgueschen Integrabilitätskriterium.Ist etwa f auf [a,b] Riemann-integrierbar, so ist die Mengeder Unstetigkeitsstellen von f auf [a,b] eine Nullmenge. Dann ist erst recht dieMenge der Unstetigkeitsstellen auf [a 1 ,b 1 ] eine Nullmenge, d.h. f ist auf [a 1 ,b 1 ]Riemann-integrierbar. Aussage (b) ist HA.Die Regel (8.11) gilt bei beliebiger Lage der Punkte a,b,c, wenn man für a < bdie folgenden Definitionen trifft:∫ abf(x)dx := −∫ baf(x)dx und136∫ aaf(x)dx := 0.


Satz 8.22 Sind f,g : [a,b] → R Riemann-integrierbar und sind α,β ∈ R, so istauch αf +βg : [a,b] → R Riemann-integrierbar, und es gilt∫ ba(αf +βg)(x)dx = α∫ baf(x)dx+β∫ bag(x)dx.Die Menge der Riemann-integrierbaren Funktionen bildet also einen linearenRaum, und die Abbildung f ↦→ ∫ bf(x)dx ist linear.aBeweis Für jede Zerlegung Z und jeden zugehörigen Zwischenvektor ξ giltS(Z,ξ,αf +βg) = αS(Z,ξ,f)+βS(Z,ξ,g).Aus der Definition des Riemann-Integrals folgt die Behauptung.8.6 Integralungleichungen und MittelwertsätzeSatz 8.23 Sind f,g : [a,b] → R Riemann-integrierbar und ist f(x) ≥ g(x) füralle x ∈ [a,b], so ist auch∫ baf(x)dx ≥∫ bag(x)dx.Für jede Riemannsumme gilt nämlich S(Z,ξ,f) ≥ S(Z,ξ,g).Satz 8.24 (Dreiecksungleichung für Integrale) Für jedeRiemann-integrierbareFunktion f : [a,b] → R ist auch die Funktion |f| Riemann-integrierbar, undes gilt∫ b∫ b∣ f(x)dx∣ ≤ |f(x)|dx. (8.12)aBeachten Sie die Ähnlichkeit zur bekannten Dreiecksungleichung|a 1 +a 2 | ≤ |a 1 |+|a 2 | bzw.a∣n∑ ∣ ∣∣n∑a i ≤ |a i |.Beweis Die Riemann-Integrierbarkeit von |f| folgt mit dem Lebesgueschen Integrabilitätskriterium:Ist f in x stetig, so ist auch |f| in x stetig. Also kann |f|nicht mehr Unstetigkeitsstellen als f besitzen. Die Ungleichung (8.12) erhält manaus der Dreiecksungleichung für Riemann-Summen:i=1|S(Z,ξ,f)| ≤ S(Z,ξ,|f|)oder mit Satz 8.23 aus f ≤ |f| und −f ≤ |f|.i=1137


Satz 8.25 (Mittelwertsatz der Integralrechnung) Sei f : [a,b] → R Riemann–integrierbarund m := inf{f(x) : x ∈ [a,b]}, M := sup{f(x) : x ∈ [a,b]}.Dann gibt es ein η ∈ [m,M] mit∫ baf(x)dx = η(b−a).Ist f stetig, so gibt es ein ξ ∈ [a,b] mit η = f(ξ).Die Zahl η ist für a ≠ b eindeutig bestimmt und heißt Mittelwert von f über [a,b](in Analogie zum arithmetischen Mittel von Zahlen).Beweis Offenbar ist m ≤ f(x) ≤ M für alle x ∈ [a,b], und aus Satz 8.23 folgtm(b−a) =∫ bamdx ≤∫ baf(x)dx ≤∫ baM dx = M(b−a).Jede Zahl aus [m(b−a),M(b−a)] lässt sich als η(b−a) mit einem η ∈ [m,M]schreiben. Die Behauptung für stetiges f folgt aus dem Zwischenwertsatz undaus dem Satz von Weierstraß: Mit m und M wird auch jeder Wert aus [m,M]von f angenommen.Satz 8.26 (Erweiterter Mittelwertsatz) Sind f,g : [a,b] → R Riemann–integrierbar, so ist auch fg : [a,b] → R Riemann–integrierbar. Ist zusätzlichg ≥ 0 auf [a,b], so gibt es ein η ∈ [m,M] (mit m,M wie in Satz 8.25) so, dass∫ baf(x)g(x)dx = η∫ bag(x)dx.Ist f stetig auf [a,b], so gibt es ein ξ ∈ [a,b] mit f(ξ) = η.Beweis Die Riemann–Integrierbarkeit von fg zeigen Sie im Tutorium. Weiterfolgt wie im Beweis von Satz 8.25 aus m ≤ f ≤ M bzw. mg ≤ fg ≤ Mg, dassm∫ bag(x)dx ≤∫ baf(x)g(x)dx ≤ M∫ bag(x)dx.Ist ∫ bg(x)dx = 0, so folgt hieraus auch ∫ bf(x)g(x)dx = 0, und für η kann einea abeliebige Zahl aus [m,M] genommen werden. Falls ∫ bg(x)dx ≠ 0, so ista( ∫ b ) ( ∫ b )η := f(x)g(x)dx / g(x)dx ∈ [m,M].aaOhne Beweis (vgl. Heuser, Nr. 85.7) vermerken wir nochSatz 8.27 (Zweiter Mittelwertsatz der Integralrechnung) Sei f monotonund g stetig auf [a,b]. Dann existiert ein ξ ∈ [a,b] mit∫ baf(x)g(x)dx = f(a)∫ ξa138g(x)dx+f(b)∫ bξg(x)dx.


8.7 Die Hauptsätze der Differential– und IntegralrechnungDieseSätzestelleneinenZusammenhangzwischendenBegriffen“Ableitung”und“Integral” her, ermöglichen es, eine differenzierbare Funktion bis auf eine KonstanteausihrerAbleitungzurekonstruierenundbieteneinebequemeMöglichkeitzur Berechnung zahlreicher Riemann–Integrale.8.7.1 StammfunktionenDefinition 8.28 Sind F,f : [a,b] → R Funktionen und ist F differenzierbar auf[a,b] und F ′ (x) = f(x) für alle x ∈ [a,b], so heißt F eine Stammfunktion von f.Mit Folgerung 7.14 erhält man sofort:Satz 8.29 (a) Ist F Stammfunktion von f und C ∈ R, so ist auch F+C Stammfunktionvon f.(b) Je zwei Stammfunktionen einer gegebenen Funktion auf einem Intervall unterscheidensich nur um eine Konstante.EineStammfunktionF vonf wirdoftalsunbestimmtes Integral vonf bezeichnet,und man schreibt F = ∫ f(x)dx. Dies ist nicht sehr konsequent. Mit f ist jaz.B. auch F + 1 Stammfunktion und demzufolge auch F + 1 = ∫ f(x)dx. Wirwollen ∫ f(x)dxalsBezeichnungfürdieMengealleStammfunktionenbetrachten.Anstelle der etwas schwerfälligen Schreibweise∫f(x)dx = {F +C : C ∈ R}schreibt man meist (jedoch auch nicht sehr exakt) ∫ f(x)dx = F +C.AusdenunsbekanntenAbleitungenspeziellerFunktionenerhaltenwirdiefolgendenunbestimmtenIntegrale(diemanzusammenmiteinigenanderenals“Grundintegrale”bezeichnet).⎧∫⎪⎨ R falls α = 0,1,2,...• x α dx = xα+1α+1 +C auf R\{0} falls α = −2,−3,−4,...⎪ ⎩(0,∞) falls α ∈ R\{−1}.∫• x −1 dx = ln|x|+C auf R\{0}.∫• e x dx = e x +C auf R.∫• sinxdx = −cosx+C,∫cosxdx = sinx+C auf R.139


∫• sinhxdx = coshx+C,∫coshxdx = sinhx+C auf R.8.7.2 Der (erste) Hauptsatz der Differential– und IntegralrechnungSatz 8.30 Die Funktion F : [a,b] → R besitze auf [a,b] eine Riemann-integrierbareAbleitung f = F ′ . Dann ist∫ baf(x)dx =∫ bWir können dieses Resultat auch so formulieren.aF ′ (x)dx = F(b)−F(a). (8.13)Satz 8.31 Die Funktion f : [a,b] → R sei Riemann–integrierbar und besitze eineStammfunktion F. Dann gilt (8.13) unabhängig von der Wahl von F.Anmerkung 1 Es gibt differenzierbare Funktionen, deren Ableitung nicht Riemann–integrierbarist. Beispielsweise ist für{x √ xsin 1 für x > 0xF(x) =0 für x = 0die Ableitung{3√F ′ 2 xsin1x(x) = − √ 1xcos 1 für x > 0x0 für x = 0unbeschränktauf[0,1].AuchgibtesRiemann–integrierbareFunktionen,diekeineStammfunktion besitzen (z.B. die Funktion f : [−1,1] → R, die auf [−1,0) gleich−1 und sonst gleich 1 ist).Anmerkung 2 Statt F(b)−F(a) schreibt man oft F(x) ∣ ∣ b a .Beweis von Satz 8.30 Sei F : [a,b] → R differenzierbar und f := F ′ Riemann–integrierbar. Für jede Zerlegung Z = {x 0 ,...,x n } von [a,b] istF(b)−F(a) =∑n−1i=0( )F(x i+1 )−F(x i ) .NachdemMittelwertsatzderDifferentialrechnunggibtesfürjedesi = 0,...,n−1ein ξ i ∈ (x i ,x i+1 ) so, dassF(x i+1 )−F(x i ) = F ′ (ξ i )(x i+1 −x i ) = f(ξ i )∆x i .Der Vektor ξ Z := (ξ 0 ,...,ξ n−1 ) ist ein spezieller Zwischenvektor zu Z, und fürdiesen giltF(b)−F(a) =∑n−1i=0f(ξ i )∆x i = S(Z,ξ Z ,f). (8.14)140


Ist nun (Z n ) eine Folge von Zerlegungen von [a,b] mit |Z n | → 0, so wählen wirfür jedes n ∈ N einen Zwischenvektor ξ Zn wie oben und erhalten aus (8.14)Beispiel∫ π0F(b)−F(a) = S(Z n ,ξ Zn ,f) →∫ baf(x)dx.sinxdx = −cosx ∣ π = −cosπ −(−cos0) = 2.08.7.3 Der zweite Hauptsatz der Differential– und IntegralrechnungSatz 8.32 Jede auf [a,b] stetige Funktion f besitzt eine Stammfunktion auf [a,b].Eine solche Stammfunktion ist gegeben durchF(x) :=∫ xaf(t)dt, x ∈ [a,b]. (8.15)Beweis Jede stetige Funktion ist Riemann-integrierbar. Also existiert für jedesx ∈ [a,b] das Integral (8.15), und die Funktion F ist wohldefiniert. Wir zeigen,dass F auf [a,b] differenzierbar und F ′ = f ist. Seien x,x+h ∈ [a,b] und h ≠ 0.Dann istF(x+h)−F(x)h= 1 ( ∫ x+hf(t)dt−ha∫ xa)f(t)dt = 1 hNach Satz 8.25 (Mittelwertsatz) gibt es ein ξ ∈ [x,x+h] mitF(x+h)−F(x)h∫ x+hxf(t)dt.= 1 f(ξ)(x+h−x) = f(ξ). (8.16)hHalten wir x fest, so hängt ξ nur von h ab, und für h → 0 strebt ξ gegen x. Daf stetig ist, strebt dann f(ξ) gegen f(x). Also existiert der Grenzwert von (8.16)für h → 0, und es istF ′ (x) = limh→0F(x+h)−F(x)h8.8 Integrationstechniken= f(x).Der Hauptsatz der Differential- und Integralrechnung reduziert die Berechnungeines Riemann-Integrals für eine Funktion f auf die Bestimmung einer Stammfunktionfür f. Wir lernen nun einige Aussagen kennen, die diese Aufgabe erleichtern.Allerdings bleibt die Bestimmung einer Stammfunktion (im Gegensatz zurumgekehrten“ Aufgabe, der Bestimmung einer Ableitung) ein schwieriges Problem.Bereits für so einfache Funktionen wie x ↦→ 1/lnx und x ↦→ e −x2 (die nach”Satz 8.32 eine Stammfunktion auf (0,∞) bzw. R besitzen) ist es nicht möglich,141


Beispiel 2∫∫ ∫lnxdx = 1·lnxdx = xlnx− x· 1x dx∫= xlnx− 1dx = xlnx−x+C.(Hier benutzten wir (8.18) mit u(x) = x, v(x) = lnx.)Für Riemann-Integrale erhält man mit (8.18):Satz 8.35 Seien u,v : [a,b] → R stetig differenzierbar. Dann ist∫ bau ′ (x)v(x)dx = u(x)v(x)∣ b a−∫ bau(x)v ′ (x)dx. (8.19)Beweis Aus der stetigen Differenzierbarkeit von u und v folgt die Stetigkeit vonu ′ v unduv ′ .AlsobesitzenbeideFunktionenStammfunktionen,unddieRiemann-Integrale in (8.19) existieren. Die Behauptung folgt nun aus (8.18) und demHauptsatz der Differential- und Integralrechnung.8.8.3 Integration durch SubstitutionSei F eine Stammfunktion von f, und g sei differenzierbar. Ist die VerknüpfungF ◦g definiert, so folgt aus der Kettenregel( )dF g(t) ) ( )= F(g(t)′ g ′ (t) = f g(t) g ′ (t).dtAlso ist Φ := F ◦g : t ↦→ F ( g(t) ) Stammfunktion von (f ◦g)g ′ : t ↦→ f ( g(t) ) g ′ (t),d.h. ∫ ( ) ∫f g(t) g ′ (t)dt = f(x)dx| . (8.20)x=g(t)Satz 8.36 Die Funktion f besitze auf dem Intervall I eine Stammfunktion F,die Funktion g sei auf einem Intervall I 1 differenzierbar, und es gelte g(I 1 ) ⊆ I.Dann besitzt die Funktion (f ◦ g)g ′ auf I 1 eine Stammfunktion Φ, und es gilt(8.20) oder kurz Φ = F ◦g.Besitzt g eine Umkehrfunktion, so ist natürlich F = Φ ◦ g −1 . Ist g −1 darüberhinaus differenzierbar, folgt hieraus: Ist Φ Stammfunktion von (f ◦ g) · g ′ , sobesitzt f eine Stammfunktion F, und es gilt F = Φ◦g −1 .Beispiel 3 Auf R suchen wir ∫ cost·sin 2 tdt. Wählt man f(x) = x 2 und g(t) =sint, so ist g ′ (t) = cost und143


∫∫cost sin 2 tdt =x 2 dx ∣ ∣∣x=sint= x33∣ +C = sin3 t+C.x=sint 3Beispiel 4 Für f(x) = 1/x erhält man aus (8.20)∫ g ′ (t)dt = ln|g(t)|+C.g(t)Beispiel 5 Ist F eine Stammfunktion von f, und sind a,b ∈ R mit a ≠ 0, so gilt∫f(at+b)dt = 1 ∫f(at+b)·adt = 1 a a F(at+b)+C.Die Regel (8.20) führt ein Integral der Form ∫ f ( g(t) ) g ′ (t)dt auf ein Integral derForm ∫ f(x)dx zurück. Häufig möchte man den umgekehrten Weg gehen: Um∫f(x)dx zu bestimmen, versucht man, die Integrationsvariable als x = g(t) miteiner bijektiven differenzierbaren Funktion g zu schreiben und hofft, dass dasIntegral ∫ f ( g(t) ) g ′ (t)dt ausgewertet werden kann.Beispiel 6 Wir suchen ∫ √ a 2 −x 2 dx auf (−a,a). Dazu substituieren wir x :=asint mit t ∈ (− π, π) (beachten Sie: auf 2 2 (−π, π ) verschwindet die Ableitung2 2t ↦→ acost von x nach t nicht), und wir gelangen zu∫ √ ∫ ∫a 2 −a 2 sin 2 t·a costdt = a 2 cos 2 tdt = a2(1+cos2t)dt2= a2 ( 1 t+2 2 sin2t) +C = a2 (t+sint cost)+C2√= a22 (t+sint 1−sin 2 t)+C.Mit der Rücksubstitution t = arcsin x erhalten wira∫ √a2 (−x 2 dx = a2arcsin x 2 a + x √1−( x )a a )2 +C.Beispiel 7 Wir suchen ∫ 1wegen dx = 2 unddt 1+t 2auf das Integralsinxdx auf (0,π). Die Substitution x = 2arctant führtsinx = 2sin x 2 cos x 2 = 2tan x 2 cos2 x 2 = 2tan x 2= 2tan x 211+tan 2 x 2= 2t1+t 2cos 2 x 2sin 2 x 2 +cos2 x2∫ 1+t22t·∫2 dt1+t dt = 2 t = ln|t|+C.144


Rücksubstitution t = tan x 2 liefert∫1sinx dx = ln|tan x 2 |+C.Für Riemann-Integrale kann man die Substitutionsregel wie folgt formulieren.Satz 8.37 Sei f stetig und g stetig differenzierbar, und die Verkettung f ◦g seidefiniert. Dann ist∫ g(b)g(a)f(x)dx =∫ baf ( g(t) ) g ′ (t)dt. (8.21)Beweis Nach Voraussetzung sind f und (f◦g)g ′ stetig, so dass diese Funktionenentsprechend Stammfunktionen F und Φ besitzen und die Integrale in (8.21)definiert sind. Nach Satz 8.36 ist Φ = F ◦ g. Also ist nach dem Hauptsatz derDifferential- und Integralrechnungund∫ baf ( g(t) ) g ′ (t)dt = (F ◦g)(b)−(F ◦g)(a)∫ g(b)g(a)f(x)dx = F ( g(b) ) −F ( g(a) ) .Besitzt g eine Umkehrfunktion, so kann man (8.21) schreiben als∫ baf(x)dx =∫ g −1 (b)g −1 (a)f ( g(t) ) g ′ (t)dt.8.9 Stammfunktionen rationaler FunktionenEine Funktion P : x ↦→ a n x n +...+a 1 x+a 0 mit a i ∈ R und a n ≠ 0 heißt Polynomvom Grad n, und n heißt Grad des Polynoms. In Zeichen: n = degP. Sind Pund Q ≢ 0 Polynome, so ist der Quotient P/Q für alle x ∈ R mit Q(x) ≠ 0definiert. Funktionen dieser Gestalt heißen rational. Für rationale Funktionenlässt sich stets eine Stammfunktion konstruktiv bestimmen. Dazu benötigen wireinige Resultate aus der Algebra, die wir ohne Beweis zitieren.Seien P,Q Polynome mit Q ≢ 0. Zur Bestimmung einer Stammfunktion derrationalen Funktion P/Q geht man wie folgt vor.1. Schritt Polynomdivision von P durch Q liefert Polynome R und S mitPQ = R+ S , wobei degS < degQ.Q145


Für R kann man eine Stammfunktion angeben. Wir betrachten nur noch S/Q.2. Schritt Man zerlege das Nennerpolynom Q in Faktoren 1. und 2. Grades.Dass dies möglich ist, folgt aus nachstehendem Satz.Satz 8.38 (Fundamentalsatz der Algebra) Für jedesPolynom Q(x) = ∑ ni=0q i x i mit q n ≠ 0 und q i ∈ R gibt es reelle Zahlen b i ,c i ,d i mit b i ≠ b j und(c i ,d i ) ≠ (c j ,d j ) für i ≠ j und positive natürliche Zahlen k i ,m j ,r und s so,dassr∏ s∏Q(x) = q n (x−b i ) k i(x 2 +2c j x+d j ) m j∀x ∈ R (8.22)i=1mit k 1 +...+k r +2(m 1 +...+m s ) = n und d j −c 2 j > 0 für alle j.j=1Zur Bestimmung der b i ,c i ,d i ermittelt man die komplexen Nullstellen λ 1 ,...,λ nvon Q. Dann ist Q(x) = q n (x − λ 1 )...(x − λ n ). Die Terme (x − λ)(x − λ) mitλ ∉ R werden zu (x−λ)(x−λ) = x 2 −(λ+λ)x+|λ| 2 zusammengefasst.Die exakte Bestimmung der Nullstellen von Q ist oft sehr schwierig. Einen Beweisvon Satz 8.38 finden Sie in Heuser, <strong>Analysis</strong> I, Satz 69.3 und in der Vorlesungzur Funktionentheorie.3. Schritt Ist die Zerlegung (8.22) gefunden, wählt man den AnsatzS(x)r∑Q(x) =i=1∑k ik=1A iks∑(x−b i ) + kj=1m j∑m=1mit zu bestimmenden reellen Zahlen A ik ,B jm und C jm .B jm x+C jm(x 2 +2c j x+d j ) m (8.23)Satz 8.39 (Partialbruchzerlegung) Sei Q wie in (8.22) und S ein Polynommit degS < degQ. Dann existieren Zahlen A ik ,B jm und C jm , so dass (8.23) gilt,und diese Zahlen sind eindeutig bestimmt.Der Beweis ist in Heuser, <strong>Analysis</strong> I, Satz 69.5.Die Zahlen A ik ,B jm und C jm können ermittelt werden, indem man (8.23) mit Qmultipliziert und durch Koeffizientenvergleich ein lineares Gleichungsystem fürdie gesuchten Größen aufstellt.4. Schritt Zu allen in (8.23) vorkommenden Brüchen lassen sich Stammfunktionendurch partielle Integration und Substitution effektiv bestimmen. Einige der146


folgenden Regeln müssen dazu wiederholt angewandt werden:∫ { 1dx 1−k=(x−b)1−k falls k > 1(x−b) k ln|x−b| falls k = 1,∫∫∫∫dxx 2 +2cx+d = 1√d−c2arctanx+c√d−c2 ,dx(x 2 +2cx+d) = x+cm 2(m−1)(d−c 2 )(x 2 +2cx+d) m−1+(2m−3)2(m−1)(d−c 2 )αx+βx 2 +2cx+d dx = α 2 ln(x2 +2cx+d)+(β −αc)∫dxfür m ≥ 2,(x 2 +2cx+d) m−1∫dxx 2 +2cx+d ,αx+β(x 2 +2cx+d) dx = −αm 2(m−1)(x 2 +2cx+d) m−1∫dx+(β −αc)für m ≥ 2.(x 2 +2cx+d) m−1Beispiel Man bestimme ∫ x 4 +1x 4 −x 3 −x+1 dx.1. Schritt: Polynomdivisionx 4 +1x 4 −x 3 −x+1 = 1+ x 3 +xx 4 −x 3 −x+1 .2. Schritt: Faktorisierung des Nennerpolynomsx 4 −x 3 −x+1 = (x−1)(x 3 −1) = (x−1) 2 (x 2 +x+1).3. Schritt: Partialbruchzerlegung Der Ansatzx 3 +xx 4 −x 3 −x+1 = A 1x−1 + A 2(x−1) 2 + Bx+Cx 2 +x+1liefert nach Multiplikation mit x 4 −x 3 −x+1bzw.x 3 +x = A 1 (x−1)(x 2 +x+1)+A 2 (x 2 +x+1)+(Bx+C)(x−1) 2x 3 +x = (A 1 +B)x 3 +(A 2 −2B +C)x 2 +(A 2 +B −2C)x+(A 2 −A 1 +C).EinVergleichderKoeffizientenaufderlinkenbzw.rechtenSeiteergibtdaslineareGleichungssystem147


ei x 3 : A 1 +B = 1bei x 2 : A 2 −2B +C = 0bei x 1 : A 2 +B −2C = 1bei x 0 : A 2 −A 1 +C = 0.Die Lösung dieses Gleichungssystems ist A 1 = 2, A 3 2 = 2, B = 1 , C = 0. Die zu3 3integrierende Funktion ist alsox 4 +1x 4 −x 3 −x+1 = 1+ 2 34. Schritt: Integration1x−1 + 2 31(x−1) 2 + 1 3xx 2 +x+1 .∫x 4 ∫+1x 4 −x 3 −x+1 dx =1dx+ 2 ∫dx3 x−1 + 2 ∫3+ 1 ∫xdx3 x 2 +x+1= x+ 2 3 ln|x−1|− 2 3− 13 √ 3arctan2x+1√3+C.dx(x−1) 21x−1 + 1 6 ln(x2 +x+1)8.10 Uneigentliche IntegraleBisher haben wir ausschließlich beschränkte Funktionen auf kompakten Intervallenintegriert. Durch naheliegende Grenzprozesse erweitern wir nun die Definitiondes Riemann-Integrals zu sogenannten uneigentlichen Integralen.8.10.1 Integrale mit unbeschränktem IntegrationsintervallDie Funktion f : [a,∞) → R sei jedem Intervall [a,t] mit t > a Riemannintegrierbar.Wenn der Grenzwert∫ tlim f(x)dx (8.24)t→∞aexistiertundendlichist,sobezeichnenwirihnmit ∫ ∞f(x)dxundnennenihnuneigentlichesRiemann-Integral von f. Man sagt auch, dass f auf [a,∞) Riemann-aintegrierbar ist oder dass ∫ ∞f(x)dx konvergiert. Ist der Grenzwert (8.24) unendlichoderexistierternicht,heißt∫ ∞f(x)dxdivergent.Schließlichheißt∫ ∞f(x)dxa aaabsolut konvergent, wenn ∫ ∞|f(x)|dx konvergiert. Wie bei Reihen folgt aus dera148


absolutenKonvergenzdiegewöhnliche(Cauchy-Kriterium).AnalogeDefinitionentrifft man fürund für∫ ∞−∞Beispiel 1 Es ist∫ ∞1∫ a−∞f(x)dx =f(x)dx = lims→−∞∫ a−∞= lims→−∞f(x)dx+∫ as∫ as∫ ∞af(x)dxf(x)dxf(x)dx+ limt→+∞∫ taf(x)dx.∫ tx α dx = lim x α dx = lim− 1 falls α ≠ −1α+1 α+1t→∞1{lnt falls α = −1∞ falls α ≥ −1 (Divergenz)=t→∞{t α+1− 1α+1falls α < −1 (Konvergenz).Beispiel 2 Wir berechnen ∫ ∞x n e −x dx. Eine Stammfunktion des Integranden0istn∑F(x) = −e −x n!k! xk .Dies kann man einfach durch Differenzieren bestätigen. Wir überlegen uns, dasslim x→∞ F(x) = 0. Hierfür genügt es zu zeigen, dasslimx→∞k=0x k= 0 für jedes k ≥ 0. (8.25)ex Aus der Definition der Exponentialfunktion durch eine Potenzreihe folgt für jedesk ∈ N und jedes x > 0e x ≥ xk+1(k +1)!bzw. 0 ≤ xk (k +1)!≤ .ex xGrenzübergang x → ∞ in der rechten Ungleichung liefert (8.25). Zusammengefassterhalten wir∫ ∞0x n e −x dx = limt→∞∫ t0x n e −x dx = limt→∞F(t)−F(0) = −F(0) = n!Beispiel 3 Wir zeigen, dass ∫ ∞ sinxdx konvergiert. An der Stelle 0 ist der Integrandnicht definiert. Wegen lim x→0 = 1 lässt sich die Funktion x ↦→ sinxx x0 xsinxaber zu einer auf [0,∞) stetigen Funktion fortsetzen, wenn man ihren Wert ander Stelle 0 durch 1 festlegt. Insbesondere existiert ∫ 1 sinxdx als gewöhnliches0 x149


Riemann-Integral.Wirmüssenalsonochzeigen,dass ∫ ∞ sinxdxkonvergiert.PartielleIntegration liefert für jedes t >1 x1∫ t1sinxxdx = −cosxx∣ t −1∫ t1cosxx 2 dx.Offenbar existiert der Grenzwertlim −cosx∣ t ( cost= lim − +cos1 ) = cos1,t→∞ x 1 t→∞ t∫ t cosxund es verbleibt, die Existenz des Grenzwertes lim t→∞ dx zu beweisen.1 x 2Wir benutzen das Cauchy-Kriterium und schätzen für 1 ≤ t 1 < t 2 ab:∣∫ t2t 1cosxdx∣ ≤x 2∫ t2t 1|cosx|x 2dx ≤∫ t2t 11x 2 dx = 1 t 1− 1 t 2< 1 t 1.Ist nun ε > 0 beliebig vorgegeben, so gilt für alle t 2 > t 1 > 1/ε:∣∫ t2t 1cosxx 2 dx ∣ ∣ < ε.Also existiert ∫ ∞ cosxdx und damit auch ∫ ∞1 x 2 0ist übrigens gleich π/2.Wir haben oben ∫ ∞−∞∫ tf(x)dx. In diesem Sinn exi-sstiert z.B. ∫ ∞−∞sinxxdx. Der Wert dieses Integralsf(x)dx definiert als lims→−∞t→+∞xdx nicht als uneigentliches Riemann-Integral. Es ist aber∫ tx 2lim xdx = lim ∣ t = 0.t→∞−t t→∞ 2 −tDefinition 8.40 Ist f : R → R auf∫jedem Intervall [−t,t] Riemann-integrierbar,tund existiert der Grenzwert lim t→∞ f(x)dx im eigentlichen Sinn, so heißt dieserGrenzwert Cauchyscher Hauptwert, und wir bezeichnen ihn−tmitV.P.∫ ∞−∞f(x)dx.Beispielsweise ist also V.P. ∫ ∞xdx = 0.−∞Als eine Anwendung uneigentlicher Integrale vermerken wir das Integralkriteriumfür die Konvergenz von Reihen.Satz 8.41 Sei f : [1,∞) → [0,∞) monoton fallend. Dann konvergiert die Reihe∑ ∞n=1 f(n) genau dann, wenn das Integral ∫ ∞1f(x)dx konvergiert.Beweis Für jedes k ≥ 1 ist f(k +1) ≤ ∫ k+1f(x)dx ≤ f(k).k150


f(k)f(k +1)fkk +1Aufsummieren von k = 1,...,n−1 ergibt für jedes n ≥ 2f(2)+...+f(n) ≤∫ nFür die Partialsummen s n := ∑ nk=11s n −f(1) ≤f(x)dx ≤ f(1)+...+f(n−1).f(k) gilt also∫ n1f(x)dx ≤ s n−1 .Aus der linken Ungleichung folgt: Ist ∫ ∞f(x)dx konvergent, so bleiben die s1 nbeschränkt, also (da alle Reihenglieder nichtnegativ sind) konvergiert ∑ ∞n=1 f(n).Analog liefert die rechte Ungleichung die umgekehrte Behauptung.Beispiel 4 Aus Beispiel 1 wissen wir, daß ∫ ∞x −α dx für alle α > 1 konvergiert.1Also konvergiert ∑ ∞ 1n=1für alle α > 1.n α8.10.2 Integrale mit offenem IntegrationsintervallSei f : [a,b) → R für jedes ε ∈ (0,b − a)auf [a,b−ε] Riemann-integrierbar. Wenn∫ b−εder Grenzwert lim ε↘0 f(x)dx existiert,sobezeichnenwirihnmit∫ bf(x)dx aaund sagen, f sei auf [a,b) uneigentlich integrierbar.Eine analoge Definition trifftman für links halboffene Intervalle.afb−εbIst a < c < b und f auf [a,b]\{c} definiert, und existieren die uneigentlichenIntegrale ∫ cf(x)dx und ∫ bf(x)dx, so definiert mana c∫ baf(x)dx :=∫ caf(x)dx+∫ bcf(c)dx = limε↘0∫ c−εa∫ bf(x)dx+lim f(x)dx.δ↘0c+δ151


Schließlich definiert man in diesem Fall den Cauchyschen Hauptwert durchV.P.∫ ba( ∫ c−εf(x)dx := lim f(x)dx+ε↘0(falls dieser Grenzwert existiert und endlich ist).a∫ bc+ε)f(x)dxBeispiel 5 ∫ 1 1dx ist für α ≥ 1 divergent und für α < 1 konvergent. Im letzten0 x αFall ist dieses Integral gleich 1Beispiel 6 ∫ 101−α .lnxdx konvergiert und hat den Wert −1.( ∫ )−ε 1dx+∫ 1 1dx = 0.−1 x ε xBeispiel 7 V.P. ∫ 1 1dx = lim −1 x ε↘08.11 FlächeninhalteEines der Motive zur Einführung des bestimmten Integrals war der Wunsch,Flächeninhalte zu definieren und zu berechnen. Ist f : [a,b] → [0,∞) Riemannintegrierbar,so definieren wir als Flächeninhalt der Mengedie Zahl F(M) := ∫ ba f(x)dx.✻M := {(x,y ∈ R 2 : 0 ≤ y ≤ f(x), a ≤ x ≤ b}... . .. .. . . . ... . . . . .. .. . . . . . .. .. . . . . . . .. . . ... . . . . . . . .. . . .. . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .0 a b.f.F(M)Mit dieser Definition lassen sich auch die Inhalte komplizierter Mengen definierenund berechnen, wenn man akzeptiert, dass der Flächeninhalt die folgenden (ausunserer Erfahrung heraus plausiblen) Eigenschaften aufweist:(a) Geht M ′ aus M durch Verschiebung, Drehung oder Spiegelung an einerGeraden hervor, so ist F(M ′ ) = F(M).(b) Kann man M in zwei sich nicht überlappende Teilmengen A,B zerlegen,von denen jede einen Flächeninhalt besitzt, so ist F(M) = F(A)+F(B).DiezweiteForderungistsehrungenau(mansollteetwasüberA∩B voraussetzen).Darauf kommen wir später zurück.✲152


Beispiel 1 Für f : [0,a] → R, x ↦→ bfindet man F(M) = ∫ abdx = ab. Der von0uns definierte Flächeninhalt stimmt also fürRechtecke mit dem bekannten“ Flächeninhalt”überein.Beispiel 2 Die Dirichletfunktion{ 1 falls x rationalf(x) =0 falls x irrationalb✻.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .... .. .. .. .. .... .. .. .... ..0 a✲ist auf keinem Intervall [a,b] mit a < b Riemann-integrierbar. Unsere Definitionerlaubt es daher nicht, der Menge M = {(x,y) : a ≤ x ≤ b, 0 ≤ y ≤ f(x)} einenFlächeninhalt zuzuschreiben.Beispiel 3 Die Funktionen f,g seien auf [a,b] Riemann-integrierbar, und es seif(x) ≥ g(x) für alle x ∈ [a,b]. Gesucht ist der Flächeninhalt der MengeM = {(x,y) ∈ R 2 : a ≤ x ≤ b, g(x) ≤ y ≤ f(x)}.f0100 1101010 a0100 11010101g0100 11 01bf + cg + c=f + c−g + c0ab0ab0abWir verschieben M um c > 0 in Richtung der positiven y–Achse, bis das Bild vonM komplett oberhalb der x–Achse liegt. Mit den Eigenschaften (a), (b) folgt:F(M) =∫ ba∫( ) b ∫( ) b( )f(x)+c dx− g(x)+c dx = f(x)−g(x) dx.aBeispiel 4 Oft ist der Graph von f in Parameterdarstellung gegeben, etwa{(x,y) ∈ R 2 : x = x(t), y = y(t), t ∈ [α,β]}mit x(α) = a und x(β) = b. Unter entsprechenden Voraussetzungen an x und y(vgl. Satz 8.37) gilt dann∫ baf(x)dx =∫ βαf ( x(t) ) ẋ(t)dt =∫ βαay(t)ẋ(t)dt,153


wobeiẋ(t) = dxdt (t).Beispielsweisewirddurchx = acost, y = bsint mit t ∈ [0,2π]eine Ellipse beschrieben. Für ihren Flächeninhaltfindet man−ab−ba∫ aF(M) = 2= 2abBeispiel 5 Durch−a∫ π0f(x)dx = 2∫ 0π(sin 2 tdt = 2aby(t)ẋ(t)dt = 2ab− sintcost2∫ 0πsint(−sint)dt+ 1 )∣ ∣∣2 t π= πab.x = a(t−sint), y = a(1−cost) mit t ∈ Rwird eine Zykloide definiert. Diese Kurve beschreibt den Weg eines Punktes aufder Kreisperipherie beim Abrollen des Kreises.✻2a. . .. . . . .. . . . .. . . . . .. .. .. . .. . . . . .. ✲0 2πa 4πa 6πaFür die Fläche unter einem Zykloidenbogen findet manF(M) =∫ 2π0= a 2 ∫ 2π0= 3a 2 π.∫ 2πy(t)ẋ(t)dt = a 2 (1−cost)(1−cost)dt0((1−2cost+cos 2 t)dt = a 2 t−2sint+ costsint + t ) ∣∣ 2π2 200154


9 Folgen und Reihen von FunktionenIn diesem Abschnitt betrachten wir verschiedene Arten der Konvergenz einerFunktionenfolge. Besonders interessiert uns die Frage, ob sich Eigenschaften dereinzelnen Glieder einer konvergenten Funktionenfolge (f n ) auf die Grenzfunktionf vererben, etwa• ist f stetig, wenn alle f n stetig sind?• ist f differenzierbar (integrierbar), wenn alle f n differenzierbar (integrierbar)sind, und gilt in diesem Fallf ′ = (lim f n ) ′ = limf ′ nbzw.∫ baf(x)dx = lim∫ baf n (x)dx?IndiesenFragengehtesletztlichdarum,obzweiGrenzprozesse vertauscht werdenkönnen. Ein Beispiel, wo dieses Vertauschen erlaubt ist, haben wir in Abschnitt6.3 kennengelernt: Ist ∑ ∞n=0 a nz n eine Potenzreihe mit Konvergenzradius R > 0,so gilt für jedes z 0 ∈ C mit |z 0 | < R∑ ∞lim a n z n =z→z 0n=0∞∑a n z0 n =n=0∞∑n=0a n (limz→z0z) n .Wir gehen diese Probleme nun systematischer an und betrachten anschließendzwei spezielle Klassen von Funktionenreihen: Potenzreihen und Fourierreihen.9.1 Punktweise KonvergenzSei X eine nichtleere Menge, N ein metrischer Raum mit einer Metrik d und fürjedes n ∈ N sei eine Funktion f n : X → N gegeben. Dann heißt (f n ) n∈N eineFunktionenfolge auf X (beachten Sie: alle Glieder einer Funktionenfolge sind aufder gleichen Menge definiert und bilden in eine gleiche Menge hinein ab).Definition 9.1 Die Funktionenfolge (f n ) n∈N konvergiert auf X punktweise gegeneine Funktion f : X → N, wenn für jedes x ∈ X gilt( )d f n (x),f(x) → 0 bzw. lim f n (x) = f(x).n→∞Der punktweise Grenzwert einer Funktionenfolge (f n ) ist eindeutig bestimmt.Beispiel 1 Die Funktionen f n : [0,1] → R seien durch f n (x) = x n gegeben.Für 0 ≤ x < 1 ist lim n→∞ f n (x) = lim n→∞ x n = 0, während lim n→∞ f n (1) =lim n→∞ 1 = 1. Die stetigen (und sogar differenzierbaren) Funktionen f n konvergierenalso punktweise gegen die Funktion{0 für 0 ≤ x < 1f(x) =1 für x = 1,155


die im Punkt 1 nicht stetig ist.Beispiel 2 Für jedes x ∈ R sei( ) 2kf n (x) := lim cos(n!πx)k→∞(der Grenzwert existiert, da 0 ≤ (cos(n!πx)) 2 ≤ 1). Wir zeigen, dass die Folge(f n ) punktweise gegen die Dirichletfunktion{1 falls x rationalf(x) =0 falls x irrationalkonvergiert. Sei zunächst x = p/q rational. Für beliebiges n ≥ q ist dann(cos(n!π p q ) ) 2= 1.Es ist also f n (x) = 1 für alle n ≥ q, woraus sofort folgt, dasslim f n(x) = 1 für x rational.n→∞Ist dagegen x irrational, so ist n!x niemals ganzzahlig. Es ist daher in diesem Fallworaus für jedes n folgtEs ist daher0 ≤(cos(n!πx)) 2< 1,( 2kf n (x) = lim cos(n!πx))= 0.k→∞lim f n(x) = 0 für x irrational.n→∞Bildet man also von den (beliebig oft differenzierbaren!) Funktionenx ↦→( ) 2kcos(x!πx)erst den punktweisen Grenzwert bzgl. k und dann bzgl. n, so erhält man eineFunktion, die in keinem Punkt stetig ist!Der durch die punktweise Konvergenz hergestellte Zusammenhang zwischen derFolge (f n ) und ihrer Grenzfunktion f ist offenbar zu schwach, um z.B. das Vererbender Stetigkeit zu garantieren. Im nächsten Abschnitt betrachten wir einenwesentlich stärkeren Konvergenzbegriff.156


9.2 Gleichmäßige KonvergenzSei X eine nichtleere Menge, (N,d) ein metrischer Raum und (f n ) n∈N eine Folgevon Funktionen f n : X → N.Definition 9.2 Die Funktionenfolge (f n ) n∈N konvergiert auf X gleichmäßig gegendie Funktion f : X → N, wenn für jedes ε > 0 ein n 0 ∈ N existiert, sodass ( )d f n (x),f(x) < ε für alle n ≥ n 0 und alle x ∈ X.Beachten Sie: Bei punktweiser Konvergenz hängt n 0 i.Allg. von x ab, währendbei gleichmäßiger Konvergenz n 0 unabhängig von x gefunden werden kann. Ausder gleichmäßigen Konvergenz folgt offenbar die punktweise Konvergenz.Beispiel 1 Die Funktionenfolgen aus den Beispielen 1, 2 aus 9.1 konvergierennicht gleichmäßig. Wir überlegen uns dies für Beispiel 1. Sei ε > 0 und x ∈ (0,1).Wegen|x n −0| < ε ⇐⇒ x n < ε ⇐⇒ nlnx < lnε ⇐⇒ n > lnε/lnxkann es kein n 0 so geben, dass |f n (x)−f(x)| < ε für alle n ≥ n 0 und x ∈ M .Beispiel 2 Auf R sei f n (x) := 1 [nx] ([y] ist die größte ganze Zahl, die kleinernals oder gleich y ist.) Aus [nx] ≤ nx < [nx]+1 folgtd.h. es ist1n [nx] ≤ x ≤ 1 n [nx]+ 1 n bzw. f n(x) ≤ x ≤ f n (x)+ 1 n ,0 ≤ x−f n (x) < 1 nfür alle x ∈ R.Hieraus folgt sofort die gleichmäßige Konvergenz der Funktionen f n gegen dieFunktion f(x) = x.Im Weiteren sei N = R, versehen mit dem üblichen Abstand. Alle ÜberlegungendiesesAbschnittesbleibenaberauchfürN = R k (z.B.mitderEuklidschenNorm)undinsbesonderefürN = C(mitdemüblichenAbstand)richtig.Wirzeigen,dassman die gleichmäßige Konvergenz als Konvergenz in einem geeigneten metrischenRaum (dessen Elemente Funktionen sind) auffassen kann.Eine Funktion f : X → R heißt beschränkt, wenn||f|| ∞ := sup|f(x)| < ∞, (9.1)x∈Xund die Zahl ||f|| ∞ heißt die Supremumsnorm von f. Es ist klar, dass die MengeM(X) aller beschränkten reellwertigen Funktionen auf X einen reellen linearenRaum bildet und dass (9.1) ein Norm auf M(X) in folgendem Sinn definiert:157


Definition 9.3 Sei L ein reeller linearer Raum. Eine Abbildung ||.|| : L → Rheißt Norm auf L, wenn• ||x|| ≥ 0 für alle x ∈ L, und ||x|| = 0 genau dann, wenn x = 0.• ||αx|| = |α|||x|| für alle α ∈ R und x ∈ L.• ||x+y|| ≤ ||x||+||y|| für alle x,y ∈ L (Dreiecksungleichung).Für die Norm (9.1) folgt die letzte dieser Eigenschaften aus|f(x)+g(x)| ≤ |f(x)|+|g(x)| ≤ ||f|| ∞ +||g|| ∞ ,indem man auf der linken Seite das Supremum über alle x ∈ X bildet.Lemma 9.4 Ist L ein linearer Raum und ||.|| eine Norm auf L, so wird durchd(x,y) := ||x−y|| eine Metrik auf L definiert.Beweis Aus dem ersten Normaxiom folgtd(x,y) ≥ 0 sowie d(x,y) = 0 ⇐⇒ ||x−y|| = 0 ⇐⇒ x = y.Aus dem zweiten Normaxiom erhalten wir die Symmetrie von d:d(x,y) = ||x−y|| = ||−(y −x)|| = |−1|||y −x|| = d(y,x).Die Dreiecksungleichung für d ist eine unmittelbare Folgerung des dritten Normaxioms.Man nennt d(x,y) := ||x−y|| die durch die Norm ||·|| induzierte Metrik. Solangenichts anderes gesagt ist, versehen wir normierte Räume immer mit den induziertenMetriken und machen sie so zu metrischen Räumen. Man überlegt sichleicht, dass die gleichmäßige Konvergenz einer Folge (f n ) beschränkter reellwertigerFunktionen nichts anderes ist als die Konvergenz dieser Folge im metrischenRaum M(X) mit der durch die Supremumsnorm induzierten Metrik, d.h. f n → fbedeutet∀ε > 0 ∃n 0 ∈ N ∀n ≥ n 0 : ||f −f n || ∞ = supx∈X|f(x)−f n (x)| < ε.Definition 9.5 Ein normierter linearer Raum heißt Banachraum, wenn er bezüglichder durch die Norm induzierten Metrik vollständig ist.Einige Beispiele für Banachräume kennen wir bereits: R und C mit den üblichenBeträgen als Norm und R k mit der ||·|| 1 , ||·|| 2 oder ||·|| ∞ –Norm.Satz 9.6 Der lineare Raum M(X) der beschränkten reellwertigen Funktionenauf X, versehen mit der Norm ||·|| ∞ , ist ein Banachraum.158


Beweis Sei (f n ) ⊆ M(X) eine Cauchyfolge, d.h.∀ε > 0 ∃n 0 ∀m,n ≥ n 0 : d(f n ,f m ) = sup|f n (x)−f m (x)| < ε. (9.2)x∈XOffenbar ist für jedes feste x ∈ R die Folge ( f n (x) ) eine Cauchyfolge in R. DaR vollständig ist, konvergiert die Folge ( f n (x) ) gegen eine Zahl, die wir f(x)nennen. Hierdurch wird eine Funktion f : X → R festgelegt. Wir zeigen: f istbeschränkt (d.h. f ∈ M(X)) und d(f,f n ) = ||f −f n || ∞ → 0.Beschränktheit: Aus (9.2) wissen wir:∀ε > 0 ∃n 0 ∈ N ∀m,n ≥ n 0 ∀x ∈ X : |f n (x)−f m (x)| < ε.Vollziehen wir hierin den Grenzübergang m → ∞, folgt∀ε > 0 ∃n 0 ∈ N ∀n ≥ n 0 ∀x ∈ X : |f n (x)−f(x)| ≤ ε. (9.3)Wir wählen z.B. ε = 1 und das zugehörige n 0 und erhalten|f(x)| ≤ |f n0 (x)|+|f n0 (x)−f(x)| ≤ ||f n0 || ∞ +1 für alle x ∈ X,d.h. f ist beschränkt. Die Konvergenz von f n gegen f bzgl. der Supremumsnormfolgt ebenfalls sofort aus (9.3).Wir vermerken noch einige wichtige Konsequenzen der Vollständigkeit des RaumesM(X). Diese gelten entsprechend für beliebige Banachräume.Seien f n Funktionen aus M(X). Die Funktionenreihe ∑ ∞k=0 f k heißt punktweisebzw. gleichmäßig konvergent, wenn die Folge ihrer Partialsummen s n := ∑ nk=0 f kpunktweise ( bzw. ) gleichmäßig konvergiert. Aus der Vollständigkeit des RaumesM(X), ||·||∞ folgt sofort das Cauchysche Konvergenzkriterium.Satz 9.7 (Cauchy-Kriterium) Seien f n ∈ M(X).(a) Die Folge (f n ) konvergiert genau dann gleichmäßig, wenn sie eine Cauchyfolgeist, d.h. wenn∀ε > 0 ∃n 0 ∈ N ∀m,n ≥ n 0 : ||f n −f m || ∞ < ε.(b) Die Reihe ∑ ∞k=0 f k konvergiert genau dann gleichmäßig, wenn es für jedesε > 0 ein n 0 ∈ N gibt, so dass für alle n ≥ n 0 und alle r ∈ N gilt∑n+r∥ ∥∥∞∥ f k < ε.k=nDie Reihe ∑ ∞n=0 f n heißt absolut konvergent, wenn die Reihe ∑ ∞n=0 ||f n|| ∞ konvergiert.Wie im Beweis von Satz 5.9 zeigt man:159


Satz 9.8 Jede absolut konvergente Reihe in M(X) konvergiert gleichmäßig.Dieser Satz ist bemerkenswert, da man z.B. statt der gleichmäßigen Konvergenzeiner Funktionenreihe nur die absolute Konvergenz einer Zahlenreihe untersuchenmuß, für die wir zahlreiche Kriterien kennen.Beispiel 3 Die Reihe ∑ ∞n=11konvergiert für jedes x > 1 (ist also auf (1,∞)n xpunktweise konvergent), und sie ist gleichmäßig konvergent auf jedem Intervall[c,∞) mit c > 1. Die Funktionen f n (x) = n −x sind nämlich auf [c,∞) strengmonoton fallend. Also ist ||f n || ∞ = n −c , und für c > 1 konvergiert die Reihe∑ ∞n=11. Die Funktion ζ(x) := ∑ ∞n c n=11heißt die Riemannsche Zetafunktion.n xBeispiel 4 Jede Potenzreihe ∑ ∞n=0 a nz n mit Konvergenzradius R > 0 ist aufder Kreisscheibe {z ∈ C : |z| < R} punktweise konvergent. Für 0 ≤ r < Rkonvergiert sie auf jeder Kreisscheibe {z ∈ C : |z| ≤ r} sogar gleichmäßig. Fürdie Funktionen f n (z) = a n z n ist nämlich||f n || ∞ = sup |a n z n | = |a n |r n ,|z|≤rund die Reihe ∑ ∞n=0 |a n|r n konvergiert, da jede Potenzreihe im Inneren ihresKonvergenzbereichs absolut konvergiert (Satz 6.16).9.3 Gleichmäßige Konvergenz und StetigkeitIn diesem Abschnitt sei (X,d) ein metrischer Raum, und wir betrachten FunktionenX → R. Die Sätze 9.9 und 9.10 lassen sich problemlos auf FunktionenX → R k , k > 1, übertragen.Satz 9.9 Die Funktionen f n : X → R sollen gleichmäßig gegen f : X → Rkonvergieren, und sei x 0 ∈ X. Ist jede der Funktionen f n in x 0 stetig, so ist auchdie Grenzfunktion f in x 0 stetig.Beweis Sei ε > 0 beliebig. Wir wählen N so, dass ||f −f N || ∞ < ε/3. Dann istfür alle x ∈ X|f(x)−f(x 0 )| ≤ |f(x)−f N (x)|+|f N (x)−f N (x 0 )|+|f N (x 0 )−f(x 0 )|≤ 2||f −f N || ∞ +|f N (x)−f N (x 0 )| < 2ε/3+|f N (x)−f N (x 0 )|.Da f N in x 0 stetig ist, finden wir eine Umgebung U von x 0 so, dass |f N (x) −f N (x 0 )| < ε/3 für alle x ∈ U. Für alle x ∈ U ist alsoAlso ist f in x 0 stetig.|f(x)−f(x 0 )| < 2ε/3+|f N (x)−f N (x 0 )| < ε.160


Sind insbesondere alle Funktionen f n auf ganz X stetig, so ist auch f auf ganz Xstetig. Wir interpretieren dies wieder als eine Vollständigkeitsaussage. Sei C b (X)die Menge aller beschränkten stetigen Funktionen f : X → R. Es ist C b (X) ⊆M(X), und C b (X) ist ein normierter linearer Raum bzgl. der Supremumsnorm.Ist X kompakt, so ist jede stetige Funktion auf X beschränkt (Satz 6.39). DieMenge aller beschränkten stetigen Funktionen stimmt dann also überein mit derMenge C(X) aller stetigen Funktionen auf X.Satz 9.10 Der lineare Raum C b (X), versehen mit der Supremumsnorm, ist einBanachraum.Beweis Ist (f n ) Cauchyfolge in C b (X), so ist (f n ) erst recht Cauchyfolge inM(X). Da M(X) vollständig ist, konvergiert die Folge (f n ) gleichmäßig gegeneine beschränkte Grenzfunktion f. Aus Satz 9.9 wissen wir, dass f stetig ist, alsozu C b (X) gehört.Wir können das Bewiesene auch so formulieren: C b (X) ist abgeschlossen in M(X)bzgl. ||·|| ∞ . Als eine Anwendung geben wir einen weiteren Beweis von Satz 6.19.Beispiel Sei f(z) = ∑ ∞n=0 a nz n eine Potenzreihe mit Konvergenzradius R > 0,und sei |z 0 | < R. Dann ist f in z 0 stetig. Um dies einzusehen, wählen wir ein rmit |z 0 | < r < R. Nach Beispiel 4 aus 9.2 konvergiert die Reihe ∑ ∞n=0 a nz n aufX := {z ∈ C : |z| ≤ r} gleichmäßig. Da alle Partialsummen auf X stetig sind,ist f auf X und insbesondere in z 0 ∈ X stetig.Aus der Stetigkeit der Grenzfunktion folgt aber im Allgemeinen nicht, dass dieFunktionenfolge gleichmäßig konvergieren muss. Es gilt jedoch:Satz 9.11 (Dini) Seien f n : [a,b] → R stetige Funktionen, die punktweise undmonoton (d.h. jede Folge ( f n (x) ) ist monoton) gegen eine stetige Funktion fkonvergieren. Dann ist die Konvergenz sogar gleichmäßig.Einen Beweis finden Sie in Barner/Flohr, <strong>Analysis</strong> I, S. 321.9.4 Gleichmäßige Konvergenz und Integrierbarkeit/ DifferenzierbarkeitSei [a,b] ein endliches Intervall. Wir bezeichnen mit R([a,b]) die Menge derRiemann-integrierbaren Funktionen auf [a,b]. Da Riemann-integrierbare Funktionenbeschränkt sind (Satz 8.4), können wir R([a,b]) als Teilraum von M([a,b])auffassen.Satz 9.12 (a) Die Funktionen f n ∈ R([a,b]) sollen gleichmäßig gegen eine Funktionf konvergieren. Dann ist f ∈ R([a,b]), und es giltlimn→∞∫ baf n (x)dx =∫ ba(limn→∞f n )(x)dx =161∫ baf(x)dx.


(b) Der lineare Raum R([a,b]), versehen mit der Supremumsnorm, ist ein Banachraum.Beweis Wir zeigen zuerst, dass f Riemann-integrierbar ist. Sei ∆(f n ) die Mengealler Unstetigkeitsstellen von f n und U := ⋃ n ∆(f n). In allen Punkten x ∈[a,b]\U ist jede der Funktionen f n stetig. Nach Satz 9.9 ist dann auch f in allendiesen Punkten stetig. Also ist ∆(f) ⊆ U. Nach dem Lebesgueschen Integrabilitätskriterium(Satz 8.14) ist jedes ∆(f n ) eine Nullmenge. Nach Lemma 8.13 sindauch U und ∆(f) Nullmengen. Wieder nach Satz 8.14 ist f ∈ R([a,b]). Damit istauch klar, dass ∫ bf(x)dx existiert, und wir haben die Abschätzunga∣∫ baf n (x)dx−∫ baf(x)dx∣ ≤∫ ba|f n (x)−f(x)|dx ≤ (b−a)||f n −f|| ∞ .Aus der gleichmäßigen Konvergenz von f n gegen f folgt nun Behauptung (a). Seinoch (f n ) eine Cauchyfolge Riemann-integrierbarer Funktionen. Dann ist (f n )Cauchyfolge in M([a,b]) und folglich konvergent mit einer Grenzfunktion f. AusTeil(a)wissenwir,dassf ∈ R([a,b]).SchließlichfolgtausSatz8.22,dassR([a,b])ein linearer Raum ist.Interessanterweisegenügt diegleichmäßige KonvergenzeinerFolgedifferenzierbarerFunktionen nicht, um die Differenzierbarkeit der Grenzfunktion zu erzwingen.Man benötigt vielmehr die gleichmäßige Konvergenz der abgeleiteten Folge.Beispiel DieFolgederFunktionenf n (x) := 1 n sinnxkonvergiertaufRgleichmäßiggegen die Funktion f(x) := 0. (Warum?) Die Folge der Ableitungen f ′ n(x) =cosnx konvergiert z.B. für x = 0 gegen 1. Es ist aber1 = limf ′ n(0) ≠ (limf n ) ′ (0) = f ′ (0) = 0.Satz 9.13 Für die Funktionen f n : [a,b] → R gelte:• sie sind auf [a,b] differenzierbar.• die Folge (f ′ n) ihrer Ableitungen konvergiert gleichmäßig auf [a,b].• es gibt ein x 0 ∈ [a,b] für das die Folge ( f n (x 0 ) ) konvergiert.Dann konvergiert die Folge (f n ) gleichmäßig gegen eine differenzierbare Funktionf, und die Folge (f ′ n) konvergiert gleichmäßig gegen f ′ .Unter den getroffenen Annahmen dürfen Funktionenfolgen also gliedweise differenziertwerden, und es gilt (im Sinne der gleichmäßigen Konvergenz)limn→∞ f′ n = (lim f n ) ′ .n→∞162


Beweis Wir zeigen, dass die Folge (f n ) gleichmäßig gegen eine Funktion f konvergiert.Sei ε > 0. Wir wählen n 0 so, dassund|f m (x 0 )−f n (x 0 )| < ε/2 für alle m,n ≥ n 0 (9.4)||f ′ m −f ′ n|| ∞


für alle m,n ≥ n 0 . Dann istsup |F m (x)−F n (x)| ≤x∈[a,b]ε2(b−a)∀m,n ≥ n 0 .(F n ) ist also eine Cauchyfolge in M([a,b]) und nach Satz 9.6 auf [a,b] gleichmäßigkonvergent. Da sie auf [a,b] punktweise gegen F konvergiert, folgt, dass die F n aufganz [a,b] gleichmäßig gegen F konvergieren. Nach Satz 9.9 ist F auf [a,b] undinsbesondere in y stetig. Es existiert also der Grenzwert lim x→y F(x), und dieserstimmt mit F(y) überein. Dann ist die Funktion f an der Stelle y differenzierbar,und es giltf ′ (y) = limn→∞f ′ n(y).9.5 Ergänzungen zu PotenzreihenWir∑wenden zunächst das Resultat von Satz 9.13 auf Potenzreihen an. Sei f(x) =∞n=0 a nx n eine Potenzreihe mit Konvergenzradius R > 0. Die Partialsummens n (x) = ∑ nk=0 a kx k sind offenbar differenzierbar für x ∈ (−R,R), und ihre Ableitungistn∑s ′ n(x) = ka k x k−1 .k=1Die s ′ n sind die Partialsummen der Potenzreihe ∑ ∞n=1 na nx n−1 , und aus Folgerung6.18 wissen wir, dass diese Potenzreihe den gleichen Konvergenzradius wiedie Ausgangsreihe besitzt. Also ist (Beispiel 4 aus 9.2) die Folge (s ′ n) auf jederkompakten Teilmenge von {x ∈ R : |x| < R} gleichmäßig konvergent. Aus Satz9.13 folgt nun:Satz 9.14 Die Potenzreihe f(x) = ∑ ∞n=0 a nx n ist in jedem Punkt x ∈ (−R,R)differenzierbar, und ihre Ableitung kann gliedweise bestimmt werden:f ′ (x) =∞∑na n x n−1 .n=1Im 3. Semester übertragen wir dieses Resultat auf Potenzreihen im Komplexen.Eine wiederholte Anwendung von Satz 9.14 zeigt, dass Potenzreihen unendlichoft differenzierbar sind. Damit haben wir auch Satz 7.11 bewiesen.Wir vermerken noch, dass man wegen Satz 9.12 Potenzreihen gliedweise integrierendarf, d.h. es ist zum Beispiel∫ (y ∑ ∞)∞∑∫ y ∞∑a n x n dx = a n x n a ndx =n+1 yn+10n=0n=00n=0164


für alle y im Konvergenzintervall (−R,R).Das nächste Resultat besagt, dass die Werte einer Potenzreihe im Inneren ihresKonvergenzkreises eindeutig festgelegt sind, wenn man ihre Werte nur in einerFolge von Punkten z n mit lim n→∞ z n = 0 kennt. Genauer:Satz 9.15 (Identitätssatz für Potenzreihen) Seienf(z) =∞∑f n (z −z 0 ) n und g(z) =n=0∞∑g n (z −z 0 ) nPotenzreihen, die auf einer Kreisscheibe K := {z ∈ C : |z −z 0 | < R} mit R > 0konvergieren, und sei (z n ) ∞ n=1 ⊆ K\{z 0 } eine Folge mit Grenzwert z 0 . Ist f(z n ) =g(z n ) für alle n ≥ 1, so stimmen beide Funktionen bzw. beide Potenzreihen aufK überein, d.h. es istn=0f(z) = g(z) ∀z ∈ K und f n = g n ∀n ∈ N.Beweis Nach Satz 6.19 sind f und g stetig auf K. Also giltf 0 = f(z 0 ) = limn→∞f(z n ) = limn→∞g(z n ) = g(z 0 ) = g 0 .Wir nehmen dies als Induktionsanfang. Als Induktionsvoraussetzung nehmen wiran, wir hätten für ein gewisses n bereits gezeigt, dassf 0 = g 0 , f 1 = g 1 ,..., f n = g nund wollen zeigen, dass dann auch f n+1 = g n+1 . Dazu genügt es, die oben gemachtenÜberlegungen auf die Potenzreihenund˜f(z) := f(z)−∑ nk=0 f k(z −z 0 ) k(z −z 0 ) n+1 = f n+1 +f n+2 (z −z 0 )+f n+3 (z −z 0 ) 2 +...˜g(z) = g(z)−∑ nk=0 g k(z −z 0 ) k(z −z 0 ) n+1 = g n+1 +g n+2 (z −z 0 )+g n+3 (z −z 0 ) 2 +...anzuwenden. (Diese sind durch die Brüche nur für z ≠ z 0 , durch die rechtenSeiten aber auch für z = z 0 definiert.)Der Identitätssatz ist Grundlage des Koeffizientenvergleichs: Hat man ein unddieselbe Funktion in zwei Potenzreihen ∑ a n (z−z 0 ) n und ∑ b n (z−z 0 ) n mit positivemKonvergenzradius entwickelt, so folgt a n = b n für alle n. Ist beispielsweisef(z) :=∞∑a n z nn=0165


eine gerade Funktion, d.h. f(z) = f(−z) für alle z, so folgt aus∞∑ ∞∑f(z) = f(−z) = a n (−z) n = (−1) n a n z n ,dass a n = (−1) n a n für alle n bzw. a n = 0 für alle ungeraden n ist.n=0Das dritte Resultat dieses Abschnittes betrifft die Division von Potenzreihen.Satz 9.16 Die Potenzreihe f(z) = ∑ ∞n=0 a n(z−z 0 ) n konvergiere für |z−z 0 | < R,und es sei a 0 ≠ 0. Dann lässt sich 1/f in einer gewissen Umgebung von z 0 wiederin eine konvergente Potenzreihe entwickeln.Sehen wir uns die Potenzreihenentwicklung von 1/f zunächst formal und fürz 0 = 0 an. Aus f ·f −1 = 1 bzw. ( ∑ ∞n=0 a nz n )( ∑ ∞n=0 b nz n ) = 1 folgt nach Cauchy-Multiplikation∞∑ n∑( a k b n−k )z n = 1 = 1+0z 1 +0z 2 +... .n=0k=0n=0Durch Koeffizientenvergleich folgen hieraus die Gleichungena 0 b 0 = 1 (bei z 0 )a 1 b 0 +a 0 b 1 = 0 (bei z 1 )a 2 b 0 +a 1 b 1 +a 0 b 2 = 0(bei z 2 ) u.s.w.Wegen a 0 ≠ 0 kann man aus der ersten Gleichung b 0 ermitteln, dann aus derzweiten b 1 , aus der dritten b 2 usw. Hierdurch wird eine Potenzreihe ∑ ∞n=0 b nz neindeutig festgelegt, und Satz 9.16 sagt aus, dass diese Reihe einen positivenKonvergenzradius besitzt.Beispiel 1 Nach Satz 9.16 läßt sich die Tangensfunktion in einer Umgebung desPunktes0in einePotenzreiheentwickeln. Wir bestimmendieerstenKoeffizientender Potenzreihe tanx := ∑ ∞n=0 a nx n mit der Methode des Koeffizientenvergleichsaus tanx := sinx/cosx und den bekannten Potenzreihen für die Sinus- undKosinusfunktion. Koeffizientenvergleich inliefertx− x33!+ x55!−... = (a 0 +a 1 x+a 2 x 2 +a 3 x 3 +a 4 x 4 +...)·bei x 0 : 0 = a 0bei x 1 : 1 = a 1bei x 2 : 0 = a 2 − 1 2 a 0bei x 3 : − 1 6= a 3 − 1 2 a 1bei x 4 : 0 = a 4 − 1 2 a 2 + 124 a 0166·(1− x22!+ x44!− x66!+...)


und hieraus der Reihe nach a 0 = 0, a 1 = 1, a 2 = 0, a 3 = 1 3 und a 4 = 0. WeitereRechnungen lieferntanx = x+ 1 3 x3 + 215 x5 + 17315 x7 +...Es gibt keine ”einfache“ Formel für die Koeffizienten dieser Reihe.Beispiel 2 Wir suchen eine explizite Formel für die Glieder der Fibonacci-Folgea 0 = 1, a 1 = 1, a n = a n−1 +a n−2 für n ≥ 2. (9.7)Wir ordnen dieser Folge die Potenzreihe f(x) = ∑ ∞n=0 a nx n zu und finden mit(9.7)f(x) = 1+x+∞∑a n x n = 1+x+n=2n=0∞∑(a n−2 +a n−1 )x nn=2∑ ∞ ∞∑= 1+x+x 2 a n x n +x a n x nn=1= 1+x+x 2 f(x)+x ( f(x)−1 ) .Umstellen nach f(x) liefert f(x) = (1−x−x 2 ) −1 . Da die Potenzreihe 1−x−x 2(die ein Polynom ist) überall konvergiert und an der Stelle 0 ungleich 0 ist, folgtmit Satz 9.16, dass auch die Reihef(x) =11−x−x = ∑ ∞a 2 n x neinen positiven Konvergenzradius besitzt. Wir bestimmen die a n , indem wirf(x) = (1−x−x 2 ) −1 geschickt in eine Potenzreihe entwickeln. Dazu schreibenwirf(x) = √ 1 15 x− −1−√ 52= √ 1 15−1+ √ 5=− √ 1 15 x− −1+√ 52−x − 1 1√2 5−1− √ 5−x22 1√ √5(−1+ 5) 1− 2x−1+ √ 5−n=0(Partialbruchentwicklung)2 1√ √5(−1− 5) 1− 2x .−1− √ 5Ist |x| hinreichend klein, so ist dies gleich (geometrische Reihe!)2 ∑ ∞ (2x) nf(x) = √ √5(−1+ 5) −1+ √ 2 ∑ ∞ (2x− √ √5n=0 5(−1− 5) −1− √ 5n=0= √ 1 ∑ ∞ ( (2) n+1 (5 −1+ √ 2) ) n+1−5 −1− √ x n ,5n=0167) n


woraus nach Koeffizientenvergleich folgt( ( ) n+1 (a n = √ 1 25 −1+ √ 5 −) n+1 (−= 1√5( (1+ √ 522−1− √ 51− √ 52) n+1)) n+1).WirwerdenSatz9.16im3.Semesterbeweisen.FürInteressentenfolgteinBeweis,der nur reelle Methoden benutzt. Dafür benötigen wir einige Vorbereitungen.Eine Abbildung f : N × N → C heißt auch Doppelfolge. Wie bei gewöhnlichenFolgen identifiziert man f häufig mit ihren Werten f(m,n) =: a mn und schreibt(a mn ) ∞ m,n=0 für die Doppelfolge. Konvergenz der Doppelfolge (a mn ) ∞ m,n=0 gegena ∈ C bedeutet nach Definition∀ε > 0 ∃n 0 ∈ N ∀m,n ≥ n 0 : |a mn −a| < ε. (9.8)Beispiel 3 Für jede Folge (a n ) wird durch a mn := a m − a n eine Doppelfolgefestgelegt. Die Folge (a n ) ist genau dann Cauchyfolge, wenn die zugeordneteDoppelfolge (a mn ) gegen 0 konvergiert.Beispiel 4 Die Doppelfolge (a mn ) mit a mn = (−1) m+n ( 1 + 1 ) konvergiert gegenm n0. Für n 0 ≥ 2/ε und m,n ≥ n 0 ist nämlich|a mn −0| =1∣m + 1 n∣ ≤ 2 ≤ ε.n 0FürdenGrenzwertaeinerkonvergentenDoppelfolge(a mn )schreibtmanlim m,n→∞a mn = a. Wenn für jedes m die Grenzwerte lim n→∞ a mn bzw. für jedes n dieGrenzwerte lim m→∞ a mn existieren, kann man auch die iterierten Grenzwertelim m→∞ (lim n→∞ a mn ) bzw. lim n→∞ (lim m→∞ a mn ) betrachten.Man beachte, dass im Beispiel 4 zwar der Grenzwert lim m,n→∞ a mn existiert,nicht aber die Grenzwerte lim m→∞ a mn bzw. lim n→∞ a mn .Satz 9.17 Die Doppelfolge (a mn ) sei konvergent, und für jedes m bzw. n sollendie Grenzwerte lim n→∞ a mn und lim m→∞ a mn existieren. Dann existieren auch dieinterierten Grenzwerte, und es gilt:lim (lim a mn) = lim( lim am→∞ n→∞ n→∞mn) = lim a mn.m→∞ m,n→∞Beweis Sei a := lim m,n→∞ a m,n , und für jedes m existiere der Grenzwert α m :=lim n→∞ a mn . Konvergenz der Doppelfolge (a mn ) bedeutet gerade (9.8). Lassen wirin (9.8) n → ∞ streben, folgt∀ε > 0 ∃n 0 ∈ N ∀m ≥ n 0 |α m −a| ≤ ε.Dies heißt aber nichts anderes als dass lim m→∞ α n = a. Die zweite Aussage folgtanalog.168


Jede Doppelfolge (a mn ) erzeugt eine Doppelfolge (s mn ) durchs mn =m∑j=0n∑a jk .k=0WenndieDoppelfolge(s mn )gegenskonvergiert,soheißtdieDoppelreihe ∑ ∞j,k=0 a jkkonvergent, und man schreibt s = ∑ ∞j,k=0 a jk. Durch Übertragung von Satz 9.17erhält man sofort das folgende Resultat.Satz 9.18 Die Doppelreihe ∑ ∞j,k=0 a jk sei konvergent, und für jedes j bzw. ksollen die Reihen ∑ ∞k=0 a jk bzw. ∑ ∞j=0 a jk konvergieren. Dann konvergieren auchdie iterierten Reihen ∑ ∞ ∑ ∞j=0 k=0 a jk bzw. ∑ ∞ ∑ ∞k=0 j=0 a jk, und es gilt∞∑j=0∞∑a jk =k=0∞∑k=0∞∑ ∞∑a jk = a jk . (9.9)j=0 j,k=0Hieraus folgt leicht der wichtige Doppelreihensatz von Cauchy.∑ ∞k=0 a jk bzw. ∑ ∞k=0∑ ∞j=0 a jkSatz 9.19 Ist eine der iterierten Reihen ∑ ∞j=0absolut konvergent (d.h. konvergiert sie auch noch, wenn a jk durch |a jk | ersetztwird), dann sind auch die andere iterierte Reihe sowie die Doppelreihe ∑ ∞j,k=0 a jkabsolut konvergent, und es gilt (9.9).Beweis Sei z.B. ∑ ∞ ∑ ∞j=0 k=0 |a jk| konvergent mit der Summe a. Dann ist jedeReihe ∑ ∞k=0 a jk absolut konvergent, und wegen ∑ m ∑ nj=0 k=0 |a jk| ≤ a konvergiertauch die Doppelreihe absolut. Gleiches gilt wegen ∑ m∑ j=0 |a jk| ≤ a für jede Reihe∞j=0 |a jk|. Aus Satz 9.18 folgt nun die Behauptung.Beweis von Satz 9.16 Ohne Einschränkung der Allgemeinheit sei a 0 = 1. NachSatz 6.19 gibt es ein δ ∈ (0,R), so dass |a 1 z+a 2 z 2 +...| < 1 für alle |z| < δ. Fürdiese z ist (geometrische Reihe!)∞1f(z) = 11−(−a 1 z −a 2 z 2 −...) = ∑(−a 1 z −a 2 z 2 −...) j .Cauchymultiplikation ergibtj=0(−a 1 z −a 2 z 2 −...) j =∞∑a jk z k für j = 0,1,2,...k=0mit gewissen Koeffizienten a jk . Es ist also∞1f(z) = ∑j=0169∞∑a jk z k .k=0


Dürften wir hier die Summationsreihenfolge vertauschen, wäre dies die Behauptung.Wenn die Reihe ∑ ∞ ∑ ∞j=0 k=0 |a jk||z| k konvergiert, ist nach Satz 9.19 dasVertauschen möglich. Wir zeigen, dass dies für hinreichend kleine |z| tatsächlichgilt.Da jede Potenzreihe im Innern ihres Konvergenzkreises absolut konvergiert, gibtes ein ρ ∈ (0,δ) so, dass|a 1 ||z|+|a 2 ||z| 2 +... < 1 für alle z mit |z| < ρ.Für diese z konvergiert die geometrische Reihe ∑ ∞j=0 (|a 1||z| + |a 2 ||z| 2 + ...) j ,und diese lässt sich nach Cauchymultiplikation in der Form ∑ ∞ ∑ ∞j=0 k=0 α jk|z| kschreiben.∑Offenbar gilt dabei |a jk | ≤ α jk . Folglich konvergiert die iterierte Reihe∞ ∑ ∞j=0 k=0 |a jk||z| k fürallez mit|z| < ρ.HierausundausdemDoppelreihensatzfolgt die Behauptung.9.6 FourierreihenNach den Potenzreihen betrachten wir eine weitere Klasse von Funktionenreihen,die von großer Bedeutung in der <strong>Analysis</strong> sowie für ihre Anwendungen in Physikund Technik ist: die Fourierreihen. Wir haben im letzten Abschnitt gesehen, dassPotenzreihen im Inneren ihres Konvergenzintervalls beliebig oft differenzierbarsind. Es können also nur “wenige” Funktionen durch ihre Potenzreihe dargestelltwerden: die reell–analytischen. Demgegenüber lassen sich durch Fourierreihenz.B. auch periodische Funktionen darstellen, die nur stückweise differenzierbarsind und deren Ableitungen Sprünge haben. Aus Zeitgründen können wir unsnur einen elementaren Überblick über die Fourierreihen verschaffen, obwohl diesder Bedeutung dieser Reihen nicht angemessen ist. Auf weitere Aspekte wird z.B.in der Funktionalanalysis eingegangen.9.6.1 Periodische FunktionenEine auf R definierte Funktion f heißt periodisch mit der Periode L, wennf(x+L) = f(x) für alle x ∈ R.Beispielsweise sind die Funktionen x ↦→ sinkx und x ↦→ coskx 2π–periodisch,und für die Dirichletfunktion ist jede rationale Zahl eine Periode. Durch eineVariablensubstitution kann man Funktionen mit der Periode L auf solche mitder Periode 2π zurückführen. Hat f die Periode L, so hat F(x) := f ( Lx) die2πPeriode 2π:F(x+2π) = f ( L2π (x+2π)) = f ( L2π x+L) = f ( L2π x) = F(x).Wir betrachten daher von nun an nur Funktionen der Periode 2π.170


9.6.2 Trigonometrische ReihenEine Funktion f : R → R heißt trigonometrische Reihe, wenn es Konstantena n ∈ R (n ≥ 0) und b n ∈ R (n ≥ 1) so gibt, dassf(x) = a ∞02 + ∑(a n cosnx+b n sinnx) für alle x ∈ R. (9.10)n=1Trigonometrische Reihen sind offenbar 2π–periodisch.Satz 9.20 Wenn die Reihen ∑ ∞n=1 a n und ∑ ∞n=1 b n absolut konvergieren, so konvergiertdie Reihe (9.10) auf R absolut bezüglich der Supremumsnorm und gleichmäßig.Beweis Die absolute Konvergenz der Reihe (9.10) folgt aus||a n cosnx+b n sinnx|| ∞ = sup|a n cosnx+b n sinnx| ≤ |a n |+|b n |.x∈RNach Satz 9.8 folgt aus der absoluten die gleichmäßige Konvergenz.Im Weiteren benötigen wir die für alle m,n ∈ Z gültigen Identitäten∫ 2π⎧⎨ 0 für m ≠ ncosmx cosnxdx = π⎩für m = n ≠ 00∫ 2π0∫ 2π0sinmx sinnxdx =sinmx cosnxdx = 0.2π für m = n = 0,{ 0 für m ≠ nπ für m = n > 0,Diese kann man leicht mit Hilfe von Additionstheoremen wiecosαcosβ = 1 2(cos(α−β)+cos(α+β))(9.11)zeigen (↗ Übung). Mit den Identitäten (9.11) erhält man einen Zusammenhangzwischen den Werten einer trigonometrischen Reihe f und ihren Koeffizientena n ,b n .Satz 9.21 (Euler/Fourier) Die Reihe (9.10) sei auf R gleichmäßig konvergent.Dann gilta n = 1 πb n = 1 π∫ 2π0∫ 2π0f(x) cosnxdx (n = 0,1,2,...)f(x) sinnxdx (n = 1,2,...).171(9.12)


Beweis Wir multiplizieren beide Seiten von (9.10) mit cosnxf(x) cosnx = a ∞02 cosnx+ ∑(a m cosmx cosnx+b m sinmx cosnx)m=1und integrieren über [0,2π]. Da die Reihe (9.10) gleichmäßig konvergiert, konvergiertauch die Reihe f(x)cosnx gleichmäßig; Integration und Summation dürfenvertauscht werden. Mit (9.11) erhält man sofort die erste Behauptung in (9.12).Die zweite bekommt man analog durch Multiplikation von f mit sinnx.9.6.3 FourierreihenDie Formeln (9.12) erlauben die Bestimmung von Zahlen a n ,b n auch dann, wennf nicht als gleichmäßig konvergente trigonometrische Reihe vorausgesetzt wird,sondernnuralsRiemann-integrierbarauf[0,2π](esgenügtsogar,dass ∫ 2πf(x)dx0als uneigentliches Integral absolut konvergiert.) Ist f eine solche Funktion, sobestimmen wir gemäß (9.12) Zahlen a n ,b n , die dann die Fourierkoeffizienten vonf heißen, und ordnen f die trigonometrische Reihea 0∞2 + ∑(a n cosnx+b n sinnx) (9.13)n=1zu, die sogenannte Fourierreihe von f.Beispiel 1 Sei f : R → R die “Sägezahnfunktion”, die auf [0,2π) durch⎧⎨ −x+ πf(x) =2⎩ x− 3 2 πfür x ∈ [0,π)für x ∈ [π,2π)π20✻.π.. ..2π.✲definiert und 2π–periodisch ist.− π 2.Da f eine gerade Funktion ist (d.h. f(−x) = f(x) für alle x), ist b n = 0 für allen ≥ 1. Für die a n erhält mana n = 1 π∫ π0(−x+ π )cosnxdx+ 1 2 π∫ 2ππ(x− 3 2 π )cosnxdx.Für n = 0 erhält man sofort a 0 = 0. Für n ≥ 1 folgt mit partieller Integrationa n = 2 1 ( ) { 41−(−1)n=π n 2 π · 1für n ungeraden 20 für n gerade.Die durch f definierte Fourierreihe ist also4( cos3x cosx+ + cos5x +... ) .π 3 2 5 2172


DadieReihe ∑ a n absolutkonvergiert,konvergiertdieseFourierreihegleichmäßig(Satz 9.20). Es ist aber im Moment nicht klar, ob die Summe dieser trigonometrischenReihe etwas mit den Werten von f zu tun hat.Der folgende Satz 9.22 wird aber zeigen, dass tatsächlichf(x) = 4 (cosx+ cos3x + cos5x )+...π 3 2 5 2für alle x ∈ R ist. Hieraus folgt z.B. die bemerkenswerte Identitätindem man in (9.14) x = 0 setzt.11 + 1 2 3 + 1 2 5 + 1 π2+... = 2 72 8 ,(9.14)Beispiel 2 Die 2π–periodische Funktion f : R → R sei erklärt durch.✻. π..f(x) ={x für x ∈ (−π,π)0 für x = π... −π π 3π✲−π. . .Sie ist unstetig in allen Punkten x = (2k + 1)π mit k ∈ Z. Da f ungerade ist,sind alle a n = 0. Für die b n erhalten wirb n = 1 π∫ π−πxsinnxdx = 2 (−1)n+1n(wegen der 2π–Periodizität von f ist es egal, über welches Integral der Länge 2πman integriert). Die Fourierreihe von f lautet also2 ( sinx− sin2x2+ sin3x3−... ) .Es ist weder unmittelbar klar, ob diese Reihe für x ≠ 0 überhaupt konvergiert,noch ob ihre Grenzfunktion mit f übereinstimmt.9.6.4 Punktweise und gleichmäßige Konvergenz von FourierreihenDie zentrale Frage ist also: konvergiert die Fourierreihe einer 2π–periodischenFunktion f in irgendeinem Sinn (punktweise, gleichmäßig, ...), und wenn ja,stimmt ihre Grenzfunktion dann mit f überein?Einfache Überlegungen zeigen, dass in der Regel nicht einmal punktweise Konvergenzvorliegen kann: zwei Funktionen f und g, die sich nur in endlich vielen173


Punkten voneinander unterscheiden, besitzen die gleiche Fourierreihe. Selbst fürstetige Funktionen kann man nicht garantieren, dass ihre Fourierreihe gegen dieAusgangsfunktion punktweise konvergiert. Jedoch gilt:Satz 9.22 Die Funktion f : R → R sei 2π–periodisch und Riemann-integrierbarauf [0,2π], und die folgenden einseitigen Grenzwerte sollen an der Stelle x ∈ Rexistieren:f(x+0) = limh↘0f(x+h) ,limh↘0f(x+h)−f(x+0)hf(x−0) := limh↗0f(x+h),f(x+h)−f(x−0), lim .h↗0 hDann konvergiert die Fourierreihe von f an der Stelle x gegen f(x+0)+f(x−0)2.f sollalsoinxeinseitigeGrenzwerteund“einseitigeAbleitungen”besitzen.Dannkonvergiert die Fourierreihe gegen das arithmetische Mittel der einseitigen Grenzwerte.In den Beispielen 1 und 2 sind diese Bedingungen in jedem Punkt erfüllt.Man hat also jeweils punktweise Konvergenz der Fourierreihe gegen f auf ganzR. Einen Beweis dieses Satzes finden Sie in Heuser, <strong>Analysis</strong> <strong>II</strong>, Satz 136.4.Ohne die Differenzierbarkeitsannahme gilt dieser Satz nicht mehr. Man kann aberohne solche Annahmen auskommen, wenn man dafür den Begriff der Konvergenzselbst abschwächt.Wenn die Reihe ∑ ∞k=1 a k die Summe s besitzt, wenn also ihre Partialsummens n = a 1 +...+a n gegen s konvergieren, so konvergieren auch die arithmetischenMittel σ n := 1(s n 1 +...+s n ) gegen s (Cauchyscher Grenzwertsatz, vgl. Heuser,<strong>Analysis</strong> I, Satz 27.1). Es kann aber sein, dass die Folge (σ n ) auch dann nochgegen eine Zahl s konvergiert, wenn die Folge (s n ) nicht konvergiert (Beispiel:a n = (−1) n ). Man sagt dann, dass die Reihe ∑ ∞n=1 a n im Sinne von Cesarokonvergiert und dass ihre Summe gleich s ist.VonFejerwurdediesesKonzeptaufFourierreihenangewandt.Seidazus 0 (x) = a 02unds n (x) = a n∑02 + (a k coskx+b k sinkx) für n ≥ 1k=1die n-te Partialsumme der Fourierreihe undσ n (x) := 1 (s0 (x)+s 1 (x)+...+s n (x) ) .n+1Satz 9.23 (Fejer) Sei f : R → R 2π–periodisch und Riemann-integrierbar auf[0,2π]. Für jedes x ∈ R sollen die einseitigen Grenzwerte f(x+0) und f(x−0) existieren,und es sei f(x) = 1 2(f(x+0)+f(x−0)). Dann ist f(x) = limn→∞ σ n (x),d.h. die Fourierreihe von f konvergiert im Sinne von Cesaro punktweise gegen f.Ist f stetig, so konvergieren die σ n sogar gleichmäßig gegen f.174


Ein Beweis steht in Heuser, <strong>Analysis</strong> <strong>II</strong>, Sätze 139.3 und 139.5.Eine Anwendung findet die zweite Aussage dieses Satzes beim Beweis des wichtigenWeierstraßschen Approximationssatzes.Satz 9.24 (Weierstraß) Sei f stetig auf [a,b] und ε > 0. Dann gibt es einPolynom p mit||p−f|| ∞ = sup |p(x)−f(x)| < ε.x∈[a,b]Stetige Funktionen können bezüglich der Supremumsnorm also beliebig genaudurch Polynome approximiert werden. Einen Beweis finden Sie in Heuser, <strong>Analysis</strong><strong>II</strong>, Abschnitt 139, Aufgabe 3.9.6.5 Konvergenz im quadratischen MittelWir haben gesehen, dass die Untersuchung der punktweisen oder gar gleichmäßigenKonvergenz einer Fourierreihe erhebliche Schwierigkeiten bereitet. Ein zuFourierreihen“passender”KonvergenzbegriffistdieKonvergenzimquadratischenMittel.Seien f,g Riemann-integrierbare Funktionen auf [0,2π]. Für andere Intervalledefiniert man die folgenden Begriffe analog. Das Skalarprodukt von f und g istdie Zahl〈f,g〉 :=∫ 2π0f(t)g(t)dt,und die L 2 –Norm von f wird erklärt durch( ∫ 2π 1/2.||f|| 2 := 〈f,f〉 1/2 = |f(t)| dt) 2Dann gilt die Cauchy-Schwarz-Ungleichung0|〈f,g〉| ≤ ||f|| 2 ||g|| 2 . (9.15)Man beachte die Analogie zum Skalarprodukt bzw. zur Euklidischen Norm vonVektoren im R n . Die Cauchy-Schwarz-Ungleichung (9.15) wird genauso bewiesenwie in diesem Fall. Mit (9.15) erhält man leicht die DreiecksungleichungEs ist nämlich||f +g|| 2 ≤ ||f|| 2 +||g|| 2 .||f +g|| 2 2 = 〈f +g, f +g〉 = 〈f,f〉+2〈f,g〉+〈g,g〉≤ ||f|| 2 2 +2||f|| 2 ||g|| 2 +||g|| 2 2 = ( ||f|| 2 +||g|| 2) 2.Dennoch ist ||·|| 2 keine Norm auf R([0,2π])! (Warum nicht?) Mögliche Auswegesind:175


(A) Wir betrachten nur stetige Funktionen. Auf C([0,2π]) ist ||·|| 2 eine Norm.(B) Man identifiziert zwei Funktionen, wenn ||f −g|| 2 = 0.Wir werden hier beides nicht tun: (A) engt uns zu sehr ein, und (B) schauen wiruns im Rahmen der Lebesgueschen Integrationstheorie im 4. Semester an.Definition 9.25 Seien f,f n : R → R 2π–periodisch und Riemann-integrierbarauf [0,2π]. Die Folge (f n ) konvergiert im quadratischen Mittel gegen f, wenn∫ 2πlim ||f −f (n|| 2 = 0 bzw. lim f(x)−fn (x) ) 2dx = 0.n→0 n→∞0Noch einmal: die Tatsache, dass ||·|| 2 keine Norm auf R([0,2π]) ist, bringt einigeKomplikationen mit sich (z.B. kann (f n ) gegen zwei verschiedene Funktionen fund g im quadratischen Mittel konvergieren), die wir erst im vierten Semesterbeheben.Zwei Funktionen f,g ∈ R([0,2π]) heißen orthogonal, wenn 〈f,g〉 = 0.Eine Folge (u n ) von Funktionen heißt ein Orthogonalsystem, wenn 〈u m ,u n 〉 = 0für alle m ≠ n und ein Orthonormalsystem, wenn zusätzlich 〈u n ,u n 〉 = 1 für allen ist. Aus den Identitäten (9.11) wissen wir, dass die Funktionenu 0 (x) := 1 √2π, u 2n (x) := cosnx √ π, u 2n−1 (x) := sinnx √ π(n ≥ 1) (9.16)ein Orthonormalsystem über dem Intervall [0,2π] bilden.Ist f Riemann-integrierbar und (u n ) n≥0 ein Orthonormalsystem auf [0,2π], soheißen die Zahlen c n := 〈f,u n 〉 die Fourierkoeffizienten von f und ∑ ∞n=0 c nu ndie Fourierreihe von f. Man überlegt sich leicht, dass für das spezielle Orthonormalsystem(9.16) diese Begriffe mit den früher definierten übereinstimmen.Wann konvergiert nun die Fourierreihe einer Funktion im quadratischen Mittelgegen diese Funktion? Zunächst eine Vorüberlegung.Satz 9.26 (Besselsche Ungleichung) Sei f : R → R 2π–periodisch und Riemann–integrierbarauf [0,2π], und sei (u n ) ∞ n=0 ein Orthonormalsystem auf [0,2π].Dann gilt für die Fourierkoeffizienten c n = 〈f,u n 〉:∞∑|c n | 2 ≤n=0∫ 2π0|f(x)| 2 dx = ||f|| 2 2.Beweis Wir überlegen uns zunächst für jedes k ∈ N die Beziehung‖f −k∑c n u n ‖ 2 2 = ‖f‖ 2 2 −n=0176k∑|c n | 2 . (9.17)n=0


Sei g = ∑ kn=0 c nu n . Dann ist‖f −k∑c n u n ‖ 2 2 = ‖f −g‖ 2 2 = 〈f −g,f −g〉 = ‖f‖ 2 2 −2〈f,g〉+〈g,g〉.n=0Für die Skalarprodukte finden wir〈f,g〉 = 〈f,〈g,g〉 = 〈k∑c n u n 〉 =n=0k∑c n u n ,n=0k∑m=0k∑c n 〈f,u n 〉 =n=0c m u m 〉 =k∑n=0k∑m=0k∑|c n | 2 ,n=0c n c m 〈u n ,u m 〉 =k∑|c n | 2 ,womit (9.17) sofort folgt. Da ‖f −g‖ 2 2 ≥ 0, folgt aus (9.17) die Behauptung.Folgerung 9.27 Die Fourierreihe ∑ ∞n=0 c nu n von f konvergiert genau dann imquadratischen Mittel gegen f, wenn∞∑|c n | 2 = ‖f‖ 2 2. (9.18)n=0Dies folgt sofort aus (9.17). Die Beziehung (9.18) heißt Parsevalsche Gleichung.Satz 9.28 Sei f : R → R 2π–periodisch und Riemann-integrierbar auf [0,2π],und sei (u n ) das spezielle Orthonormalsystem (9.16). Dann konvergiert die Fourierreihevon f im quadratischen Mittel gegen f.Die Konvergenz der Fourierreihe gegen f im quadratischen Mittel gilt also ohneeinschränkende Voraussetzungen an f und ist deshalb eine “sehr natürliche”Konvergenzart für Fourierreihen. Dafür ist sie schwächer als die gleichmäßigeKonvergenz.Beweis 1. Schritt Sei 0 ≤ a < 2π. Wir zeigen die Aussage für die Funktion{1 wenn x ∈ [0,a]f(x) =0 wenn x ∈ (a,2π].Offenbar ist ‖f‖ 2 2 = ∫ a0c 0 = 〈f,u 0 〉 = 〈f,dx = a, und für die Fourierkoeffizienten gilt1√2π〉 = 1 √2π∫ ac 2n = 〈f,u 2n 〉 = 〈f, cosnx √ π〉 = 1 √ π∫ ac 2n−1 = 〈f,u 2n−1 〉 = 〈f, sinnx √ π〉 = 1 √ π∫ a00177dx = a √2π,0cosnxdx = sinnxn √ π∣∣ a 0sinnxdx = −cosnxn √ πn=0= sinnan √ π ,∣∣ a 0= 1−cosnan √ π.


Also ist (die absolute Konvergenz der betrachteten Reihen folgt aus der Konvergenzder Reihe ∑ ∞ 1n=1, vgl. Kapitel 5)n 2∞∑n=0|c n | 2 = a22π + ∞∑n=1= a22π + 1 π= a22π + 2 πsin 2 ∞nan 2 π + ∑ (1−cosna) 2n 2 πn=1∞∑ ( sin 2 na+ 1 n 2 n − 2cosna2 n 2n=1∞∑n=1( 1n 2 − cosnan 2 ).+ cos2 nan 2 )Mit der Identität∞∑n=1cosnxn 2=(π −x)24− π212 , x ∈ [0,2π](Nachrechnen!) erhalten wir weiter∞∑n=0|c n | 2 = a22π + 2 ππ 2= a22π + π 3 − 2 π6 − 2 π( π2( (π −a)24)− π2124 − πa2 + a24 − π212)= a.Für diese spezielle Funktion gilt also die Parsevalsche Gleichung (9.18), und ausFolgerung 9.27 folgt die Behauptung.2. Schritt Wir zeigen die Behauptung fürstückweise konstante Funktionen f (“Treppenfunktionen”).Für jede derartige Funktiongibt es Funktionen f 1 ,...,f r von der im 1.SchrittbeschriebenenGestaltsowieKonstantenα 1 ,...,α r so, dass f(x) = ∑ rj=1 α jf j (x) für allex ∈]0,2π] mit Ausnahme endlich vieler.Seien s n bzw. s nj die n. Partialsummen der Fourierreihen der Funktionen f bzw.f j . Dann ist offenbar s n = ∑ rj=1 α js nj und folglich0✻f..2π✲r∑‖f −s n ‖ 2 = ‖ α j (f j −s nj )‖ 2 ≤j=1r∑|α j |‖f j −s nj ‖ 2 .j=1Nach Schritt 1 folgt ‖f −s n ‖ 2 → 0.3. Schritt Wir zeigen die Behauptung für eine beliebige Riemann-integrierbare178


Funktion f mit ‖f‖ ∞ ≤ 1 (offenbar genügt es, solche Funktionen zu betrachten).Nach dem Riemannschen Integrabilitätskriterium gibt es für jedes ε > 02π–periodische Funktionen ϕ,ψ : R → R mit folgenden Eigenschaften:(a) ϕ,ψ sind Treppenfunktionen.(b) −1 ≤ ϕ ≤ f ≤ ψ ≤ 1.ψϕ(c) ∫ 2π(ψ(x)−ϕ(x))dx ≤ ε2. 0 802πSei g := f −ϕ, und seien s n,f ,s n,g bzw. s n,ϕ die n–ten Partialsummen der Fourierreihenvon f,g bzw. ϕ. Dann ist s n,f = s n,g +s n,ϕ und folglich‖f −s n,f ‖ 2 ≤ ‖ϕ−s n,ϕ ‖ 2 +‖g −s n,g ‖ 2 . (9.19)Nach Schritt 2 gibt es ein N so, dass ‖ϕ−s n,ϕ ‖ 2 < ε/2 für alle n ≥ N. Weiter ist‖g −s n,g ‖ 2 2∫(9.17) 2π≤ ‖g‖ 2 2 =≤∫ 2π00|g(x)| 2 dx =|ψ(x)−ϕ(x)| 2 dx ≤ 2∫ 2π0∫ 2π0|f(x)−ϕ(x)| 2 dx(ψ(x)−ϕ(x))dx (c)≤ ε24 .(Beachte: wegen |ψ−ϕ| ≤ 2 ist |ψ−ϕ| 2 ≤ 2(ψ−ϕ).) Mit (9.19) folgt schließlich∀ε > 0 ∃N ∈ N ∀n ≥ N ‖f −s n,f ‖ 2 < ε,d.h. die Partialsummen s n,f konvergieren in der L 2 -Norm gegen f.179


10 Differentialrechnung für Funktionen mehrererVeränderlicherReale Vorgänge hängen in der Regel von mehreren Einflussgrößen ab. Wir befassenuns daher in diesem Abschnitt mit der Differentialrechnung für Funktionen,die auf einer Teilmenge des R n definiert sind und in einen Raum R m abbilden.10.1 Lineare Abbildungen und StetigkeitWir bezeichnen wieder mit R n den linearen Raum aller Vektoren (x 1 ,...,x n ) mitden Operationen(x 1 ,...,x n )+(y 1 ....,y n ) := (x 1 +y 1 ,...,x n +y n ),α(x 1 ,...,x n ) := (αx 1 ,...,αx n ),wobei α ∈ R. Wir kennen bereits mehrere Normen auf R n :‖(x 1 ,...,x n )‖ ∞ := max1≤j≤n |x j|,‖(x 1 ,...,x n )‖ 2 :=‖(x 1 ,...,x n )‖ 1 :=Allgemeiner wird für jedes p ≥ 1 durch( n∑ ) 1/2,|x j | 2j=1n∑|x j |.j=1( n∑ ) 1/p‖(x 1 ,...,x n )‖ p := |x j | peine Norm auf R n definiert, die R n zu einem normierten linearen Raum macht(↗ Tutorium).Zwei Normen ‖ · ‖ A und ‖ · ‖ B auf einem linearen Raum X heißen äquivalent,wenn es Konstanten C 1 ,C 2 > 0 so gibt, dassj=1C 1 ‖x‖ A ≤ ‖x‖ B ≤ C 2 ‖x‖ A für alle x ∈ X.Satz 10.1 Alle Normen auf R n sind untereinander äquivalent.Beweis Sei ‖ · ‖ eine Norm auf R. Da die Äquivalenz von Normen eine Äquivalenzrelationist (HA), genügt es zu zeigen, dass ‖·‖ zur Maximumnorm ‖·‖ ∞äquivalent ist. Sei dazu e j = (0,...,0,1,0,...,0) der j. Einheitsvektor im R n .Für x = (x 1 ,...,x n ) = ∑ nj=1 x je j ist dannn∑ n∑n∑‖x‖ = ‖ x j e j ‖ ≤ |x j |‖e j ‖ ≤ ‖x‖ ∞ ‖e j ‖,j=1j=1180j=1


woraus mit C 2 := ∑ nj=1 ‖e j‖ die Abschätzungfolgt. Aus (10.1) erhalten wir für x 1 ,x 2 ∈ R nd.h. die Abbildung‖x‖ ≤ C 2 ‖x‖ ∞ für alle x ∈ R n (10.1)∣∣‖x 1 ‖−‖x 2 ‖ ∣ ≤ ‖x 1 −x 2 ‖ ≤ C 2 ‖x 1 −x 2 ‖ ∞ ,(R n ,‖·‖ ∞ ) → R, x ↦→ ‖x‖ (10.2)ist stetig (sogar Lipschitzstetig). Da {x ∈ R n : ‖x‖ ∞ = 1} beschränkt undabgeschlossen, also kompakt ist, nimmt die Funktion (10.2) ihr Minimum C 1 aufdieser Menge an, und C 1 ist positiv (warum?). Es ist also‖x‖ ≥ C 1 für alle x ∈ R n mit ‖x‖ ∞ = 1bzw.‖x‖ ≥ C 1 ‖x‖ ∞ für alle x ∈ R n .Folgerung 10.2 (a) R n ist bezüglich jeder Norm vollständig.(b) Konvergiert eine Folge im R n bzgl. einer Norm, so konvergiert sie bzgl. jederNorm.(c) Alle Normen auf R n liefern die gleichen offenen Mengen.(d) Die Stetigkeit einer Abbildung f : X → R n oder g : R n → Y, wobei X undY metrische Räume sind, hängt nicht von der Wahl der Norm auf R n ab.Der Beweis ist Hausaufgabe.Seien X,Y lineare Räume über R. Eine Abbildung A : X → Y heißt linear, wennA(αx+βy) = αAx+βAy ∀x,y ∈ X, α,β ∈ R.Sind X,Y normierte Räume, so heißt eine lineare Abbildung A : X → Y beschränkt,wenn sie die Einheitskugel von X in eine beschränkte Menge in Yüberführt. Die Zahl‖A‖ := sup{‖Ax‖ Y : x ∈ X, ‖x‖ X ≤ 1}heißt die durch die Normen ‖ · ‖ X , ‖ · ‖ Y induzierte Operatornorm von A. DieNorm ‖A‖ ist also gleich dem Radius der kleinsten Kugel um 0 ∈ Y, die das Bildder Einheitskugel von X unter der Abbildung A enthält. Sind beispielsweise R n181


und R m mit der Maximumnorm versehen und ist (a ij ) die Matrixdarstellung vonA : R n → R m bezüglich der kanonischen Basen, so ist‖A‖ = max1≤i≤mn∑|a ij |.Die Menge der linearen beschränkten Abbildungen von X nach Y bezeichnen wirmit L(X,Y). Versehen mit der Operatornorm wird L(X,Y) zu einem normiertenlinearen Raum (HA).Satz 10.3 Für eine lineare Abbildung A : X → Y zwischen normierten Räumensind folgende Aussagen äquivalent:(a) A ist beschränkt.(b) Es gibt ein C ≥ 0 so, dass ‖Ax‖ ≤ C‖x‖ für alle x ∈ X.(c) A ist stetig.(d) A ist stetig in 0 ∈ X.∥Beweis (a) =⇒ (b): Ist x ≠ 0, so ist ∥x/‖x‖ ∥ = 1 und daher ‖A x ‖ ≤ ‖A‖. ‖x‖Also ist ‖Ax‖ ≤ ‖A‖‖x‖ für alle x ∈ X.(b) =⇒ (c): Da A linear ist, istj=1‖Ax−Ay‖ = ‖A(x−y)‖ ≤ C‖x−y‖für beliebige x,y ∈ X. Also ist A sogar Lipschitzstetig.(c) =⇒ (d): Trivial.(d) =⇒ (a): Sei δ > 0 so, dass ‖Ax − A0‖ = ‖Ax‖ ≤ 1 falls ‖x‖ ≤ δ (ε-δ-Definition der Stetigkeit mit ε = 1). Dann ist ‖A(δx)‖ ≤ 1 für alle ‖x‖ ≤ 1, d.h.‖A‖ ≤ 1/δ.Satz 10.4 Jede lineare Abbildung von R n nach R m ist stetig.Beweis Sei A : R n → R m linear. Wegen Folgerung 10.2 (c) können wir annehmen,dass R n mit der Maximumnorm versehen ist. Für x = ∑ nj=1 x je j ∈ R nistn∑ n∑n∑‖Ax‖ = ‖ Ax j e j ‖ ≤ |x j |‖Ae j ‖ ≤ ‖x‖ ∞ ‖Ae j ‖.j=1j=1Nach Satz 10.3, Implikation (b) =⇒ (c), ist A stetig.Da jeder endlichdimensionale lineare Raum über R zu einem Raum R n isomorphist, gelten Sätze 10.1 und 10.4 entsprechend für beliebige endlichdimensionale182j=1


lineare Räume über R. Auch für endlichdimensionale Räume über C bleibendiese Sätze richtig.Als Ergänzung zur Stetigkeit schauen wir uns noch die Vertauschbarkeit vonGrenzübergängen an. Genauer: wir fragen, wann für f : R 2 → R giltlim lim f(x,y) = lim lim f(x,y)?x→x 0 y→y0 y→y0 x→x0Beispiel 1 Auf (0,1]×(0,1] sei f(x,y) = x y . Dann istlim limy→0 x→0 xy = lim 0 = 0, lim lim x y = lim 1 = 1.y→0 x→0 y→0 x→0Beispiel 2 Auf (0,1]×(0,1] seif(x,y) = xsin 1 +y x.x+yDann ist lim x→0 f(x,y) = 1 und lim y→0 f(x,y) = sin 1 . Folglich istxlim lim f(x,y) = 1,y→0 x→0aber lim x→0 lim y→0 f(x,y) existiert nicht.Satz 10.5 Sei f : (a,b)×(c,d) → R und (x 0 ,y 0 ) ∈ [a,b]×[c,d]. Der GrenzwertA :=lim f(x,y) (10.3)(x,y)→(x 0 ,y 0 )soll existieren, und für jedes y ∈ (c,d) existiere der Grenzwertϕ(y) := limx→x0f(x,y). (10.4)Dann existiert auch der iterierte Grenzwert lim y→y0 lim x→x0 f(x,y) und ist gleichA. Eine analoge Aussage gilt, wenn für jedes x ∈ (a,b) der Grenzwertψ(x) := limy→y0f(x,y) (10.5)existiert. Existieren also alle Grenzwerte (10.3)−(10.5), so istlim lim f(x,y) = lim lim f(x,y) = A.y→y 0 x→x0 x→x0 y→y0Beweis Wir zeigen nur die erste Aussage. Existenz des Grenzwertes (10.3) bedeutet:∀ε > 0 ∃δ > 0 ∀(x,y) ≠ (x 0 ,y 0 ) mit ‖(x,y)−(x 0 ,y 0 )‖ ∞ < δ :Mit der Definition der Maximumnorm ist also|f(x,y)−A| < ε.∀(x,y) ≠ (x 0 ,y 0 ) mit |x−x 0 | < δ,|y −y 0 | < δ : |f(x,y)−A| < ε.Wir fixieren ein y ≠ y 0 mit |y −y 0 | < δ und lassen x → x 0 streben. Dann folgt∀ε > 0 ∃δ > 0 ∀y ≠ y 0 mit |y −y 0 | < δ : |ϕ(y)−A| ≤ ε.Also existiert lim y→y0 ϕ(y) und ist gleich A.183


10.2 Partielle AbleitungenIn diesem Abschnitt sei U ⊆ R n offen und f : U → R. Ist x = (x 1 ,...,x n ) ∈ U,so schreiben wir statt f(x) auch f(x 1 ,...,x n ).Definition 10.6 Die Funktion f heißt in x ∈ U partiell differenzierbar bzgl. x i ,falls der Grenzwertlimh→0f(x 1 ,...,x i−1 ,x i +h,x i+1 ,...,x n )−f(x 1 ,...,x n )h(10.6)existiert. Dieser Grenzwert heißt die partielle Ableitung von f bzgl. x i an der∂fStelle x und wird mit (D i f)(x),∂x i(x) oder f xi (x) bezeichnet. Die Funktion fheißt partiell differenzierbar in x (auf U), wenn alle partiellen Ableitungen vonf in x (in jedem Punkt von U) existieren. Ist außerdem jede dieser partiellenAbleitungen in x (bzw. auf U) stetig, so heißt f stetig partiell differenzierbar inx (bzw. auf U).Ist e i der i. Einheitsvektor von R n , so ist also∂f f(x+he i )−f(x)(x) = lim .∂x i h→0 hBeispiel 1 Sei f : R n → R gegeben durch√f(x 1 ,...,x n ) = x 2 1 +...+x 2 n (= ‖x‖ 2 ). (10.7)Beim partiellen Differenzieren betrachten wir nur die i. der Variablen x 1 ,...,x nals veränderlich und die übrigen als fixiert. Wir können daher die bekanntenDifferentiationsregeln für Funktionen einer reellen Veränderlichen anwenden underhalten: Die Funktion (10.7) ist auf R n \{0} partiell differenzierbar, und∂f∂x i(x) = ∂f∂x i(x 2 1 +...+x 2 i +...+x 2 n) 1/2 = 1 2 (x2 1 +...+x 2 n) −1/2 ·2x i = x i‖x‖ 2.Offenbar ist die Funktion (10.7) auf R n \{0} sogar stetig partiell differenzierbar.Beispiel 2 BeiFunktionenaufR 2 oderR 3 schreibtmanoftf(x,y)bzw.f(x,y,z)statt f(x 1 ,x 2 ) bzw. f(x 1 ,x 2 ,x 3 ). Sei f : R 2 → R erklärt durch f(0,0) = 0 undf(x,y) =xy(x 2 +y 2 ) 2 falls (x,y) ≠ (0,0).Für (x,y) ≠ (0,0) finden wir die partiellen Ableitungen sofort:f x (x,y) =y(x 2 +y 2 ) −4 x 2 y2 (x 2 +y 2 ) , f y(x,y) =3184x(x 2 +y 2 ) 2 −4 xy 2(x 2 +y 2 ) 3 .


An der Stelle (x,y) = (0,0) arbeiten wir mit Definition 10.6:f x (0,0) = limh→0f(h,0)−f(0,0)h= 0.Analog ist f y (0,0) = 0. Also ist f auf ganz R 2 partiell differenzierbar. Manbeachte, dass f in (0,0) nicht stetig ist! Es ist nämlich( 1fn n), 1 = (1/n2 )(2/n 2 ) = n2→ ∞ für n → ∞.2 4Dieses Beispiel zeigt, dass aus der partiellen Differenzierbarkeit nicht die Stetigkeitfolgt. Später werden wir sehen, dass dagegen aus der stetigen partiellenDifferenzierbarkeit die Stetigkeit folgt.Ist f : U → R partiell differenzierbar und sind alle partiellen Ableitungen∂f∂x i= D i f : U → R wieder partiell differenzierbar, so heißt f zweimal partielldifferenzierbar, und wir schreiben ∂2 f∂x j ∂x i= D j D i f = f xi x jfür die partielle Ableitungvon ∂f∂x inach x j . Allgemein heißt f k–mal partiell differenzierbar (k ≥ 2)wenn f (k−1)–mal partiell differenzierbar ist und alle partiellen Ableitungen derOrdnung k−1 partiell differenzierbar sind. Schließlich heißt f k–mal stetig partielldifferenzierbar, wenn f k–mal partiell differenzierbar ist und alle partiellenAbleitungen bis zur k. Ordnung stetig sind.Beispiel 3 Wir erklären f : R 2 → R durch f(0,0) = 0 undFür alle Punkte (x,y) ≠ (0,0) istf(x,y) = xy x2 −y 2x 2 +y 2 für (x,y) ≠ (0,0).f x (x,y) = y x4 −y 4 +4x 2 y 2(x 2 +y 2 ) 2 , f y (x,y) = x x4 −y 4 −4x 2 y 2(x 2 +y 2 ) 2 ,und für (x,y) = (0,0) istf x (0,0) = limh→0f(h,0)−f(0,0)h= 0 und f y (0,0) = 0.Für die gemischten zweiten Ableitungen in (0,0) finden wir schließlichf x (0,h)−f x (0,0)f xy (0,0) = limh→0 hf y (h,0)−f y (0,0)f yx (0,0) = limh→0 h−h−0= limh→0 hh−0= limh→0 h= −1,= 1.(10.8)Die Reihenfolge der partiellen Ableitungen darf also i. Allg. nicht vertauschtwerden. Der folgende Satz gibt Bedingungen an, die dieses Vertauschen erlauben.185


Satz 10.7 (H.A. Schwarz) Sei U ⊆ R n offen, f : U → R und x ∗ ∈ U. Allepartiellen Ableitungen erster Ordnung von f sollen auf U existieren. Weiter existieredie zweite Ableitung2 f ∂∂x i ∂x jauf U, und diese sei in x ∗ stetig. Dann existiertauch ∂2 f∂x j ∂x iin x ∗ , und es gilt∂ 2 f(x ∗ ) = ∂2 f(x ∗ ).∂x i ∂x j ∂x j ∂x iBeweis Wir beschränken uns auf den Fall n = 2, schreiben (x,y) statt (x 1 ,x 2 )und setzen voraus, dass ∂2 fauf U existiert und in ∂y∂x x∗ stetig ist. Weiter nehmenwir an, dass (0,0) ∈ U und x ∗ = (0,0) (andernfalls verschieben wir U geeignet).Schließlich wählen wir δ > 0 so, dass (−δ,δ)×(−δ,δ) ⊆ U und arbeiten im weiterenausschließlich auf diesem Quadrat. Wir beginnen mit einer Vorüberlegung.Seien h,k ∈ (−δ,δ)\{0} fixiert. Der Mittelwertsatz, angewandt auf die FunktionF : (−δ,δ) → R, s ↦→ f(s,k)−f(s,0)liefert die Existenz eines ξ = ξ(h,k) zwischen 0 und h so, dass( ∂fF(h)−F(0) = hF ′ ∂f)(ξ) = h (ξ,k)−∂x ∂x (ξ,0) .Erneute Anwendung des Mittelwertsatzes, nun auf die FunktionG : (−δ,δ) → R, t ↦→ ∂f∂x (ξ,t),liefert die Existenz eines η = η(h,k) zwischen 0 und k so, dassEs ist also∂f ∂f(ξ,k)−∂x ∂x (ξ,0) = G(k)−G(0) = kG′ (η) = k ∂2 f∂y∂x (ξ,η).F(h)−F(0) = f(h,k)−f(h,0)−f(0,k)+f(0,0) = hk ∂2 f∂y∂x (ξ,η)mit gewissen ξ = ξ(h,k), η = η(h,k). Damit wirdf y (h,0)−f y (0,0)hf(h,k)−f(h,0)−f(0,k)+f(0,0)= limk→0 hk∂ 2 f= lim (ξ,η) (10.9)k→0 ∂y∂xmit gewissen Zahlen ξ,η, die von h und k abhängen und für die |ξ| ≤ |h| und|η| ≤ |k|. Für jedes fixierte h existiert also der Grenzwert (10.9). Außerdem186


existiert wegen der Stetigkeit von ∂2 f∂y∂x(h,k) → (0,0) der Grenzwertin (0,0) und wegen (ξ,η) → (0,0) fürlim(h,k)→(0,0)∂ 2 f∂y∂x (ξ,η) und ist gleich ∂2 f∂y∂x (0,0).Nach Satz 10.5 existiert dann auch der iterierte Grenzwert(∂ 2 f)lim limh→0 k→0 ∂y∂x (ξ,η) und ist gleich ∂2 f∂y∂x (0,0).Wegen (10.9) bedeutet dies, dass der Grenzwertlimh→0f y (h,0)−f y (0,0)h= ∂2 f∂x∂y (0,0) existiert und gleich ∂2 f(0,0) ist.∂y∂xDas ist die Behauptung.Entsprechend gilt natürlich f xxy = f yxx = f xyx , falls nur eine dieser Ableitungenexistiert und stetig ist.Eine Funktion f : R n ⊇ U → R m , gegeben durch()f(x) = f(x 1 ,...,x n ) = f 1 (x 1 ,...,x n ),...,f m (x 1 ,...,x n ) ,heißt partiell differenzierbar bzw. stetig partiell differenzierbar, wenn jede ihrerKomponenten diese Eigenschaft besitzt.Beispiel 4 Sei U ⊆ R n offen. Ist f : U → R partiell differenzierbar, so heißt derVektor( ∂f(gradf)(x) := (x),..., ∂f )(x) ∈ R n∂x 1 ∂x nder Gradient von f in x. Ist f : U → R n partiell differenzierbar, so heißt die Zahl(divf)(x) := ∂f 1∂x 1(x)+...+ ∂f n∂x n(x) ∈ Rdie Divergenz von f in x. Ist schließlich n = 3 und f : U → R 3 partiell differenzierbar,so heißt der Vektor(rotf)(x) :=die Rotation von f in x.( ∂f3∂x 2− ∂f 2∂x 3,∂f 1∂x 3− ∂f 3∂x 1,∂f 2∂x 1− ∂f 1∂x 2)∈ R 3Aus dem Satz von Schwarz folgt: Ist n = 3 und f : U → R zweimal stetig partielldifferenzierbar, so giltrotgradf = 0. (10.10)187


Die erste Komponente des Vektors rotgradf ist nämlich∂ ∂f− ∂ ∂f= ∂2 f− ∂2 f= 0.∂x 2 ∂x 3 ∂x 3 ∂x 2 ∂x 2 ∂x 3 ∂x 3 ∂x 2Ebenso sind die übrigen Komponenten gleich 0. Ähnlich zeigt man, dass für jedezweimal stetig partiell differenzierbare Funktion f : U → R 3 gilt:10.3 Differenzierbarkeitdivrotf = 0. (10.11)In diesem Abschnitt sehen wir uns an, wie sich das Konzept der Differentiationauf Funktionen mehrerer Veränderlicher übertragen lässt. Dazu erinnern wir andie Zerlegungsformel für differenzierbare Funktionen f : R → R :f(x+h) = f(x)+αh+r(h) mit α ∈ R und limh→0r(h)h = 0.Wir können diese Formel und damit die Grundidee der Differentiation wie folgtinterpretieren: Die Funktion f wird im Punkt x lokal durch die lineare Funktionh ↦→ αh approximiert. Im Weiteren sei ‖·‖ die Euklidsche Norm.Definition 10.8 Sei U ⊆ R n offen. Eine Funktion f : U → R m heißt differenzierbarin x ∈ U, wenn es eine lineare Abbildung A : R n → R m sowie eine ineiner Umgebung W von 0 ∈ R n definierte Funktion r mit Werten in R m und mitso gibt, dasslimh→0r(h)‖h‖ = 0f(x+h) = f(x)+Ah+r(h) für alle h ∈ W. (10.12)Man beachte, dass A und r von x abhängen und dass A eindeutig bestimmt ist(HA). Ist f in jedem Punkt x ∈ U differenzierbar, so heißt f differenzierbar aufU. In der Literatur spricht man auch von Frechét–Differenzierbarkeit oder totalerDifferenzierbarkeit.Man beachte auch, dass die Räume R n ,R m in dieser Definition keine wesentlicheRolle spielen. Eine ganz analoge Definition, bei der man allerdings zusätzlich dieStetigkeit von A fordert, trifft man für beliebige Banachräume.Wir überlegen uns die folgenden Beziehungen zwischen den eingeführten Differenzierbarkeitsbegriffen:f stetig partiell Satz 10.11 f differen– Satz 10.9 f partielldifferenzierbar =⇒ zierbar =⇒ differenzierbar⇓ Satz 10.10f stetig188


Satz 10.9 Sei U ⊆ R n offen und f = (f 1 ,...,f m ) T : U → R m in x ∈ U differenzierbar.Dann ist jede Funktion f i : U → R in x partiell differenzierbar, und dieMatrixdarstellung von A ∈ L(R n ,R m ) aus (10.12) bezüglich der Standardbasenvon R n bzw. R m ist⎛A =⎜⎝∂f 1∂x 1(x) ....∂f m∂x 1(x) ...∂f 1∂x n(x).∂f m∂x n(x)⎞. (10.13)⎟⎠Die Abbildung A in (10.12) ist also eindeutig bestimmt. Sie heißt Ableitung vonf in x und wird mit (Df)(x) oder f ′ (x) bezeichnet. Die Matrix (10.13) heißtJacobi–Matrix von f in x und wird oft mit J f (x) bezeichnet.Beweis Esgelte(10.12)mitA = (a ij ) mni,j=1 undr = (r 1 ,...,r m ) T ,h = (h 1 ,...,h n ) T .Mit diesen Bezeichnungen gilt für jedes i = 1,...,mf i (x+h) = f i (x)+n∑a ij h j +r i (h) ∀h ∈ W, (10.14)j=1wobei lim h→0r i (h)‖h‖= 0. Letzteres folgt aus |r i | ≤ ‖r‖ ∞ . Wir fixieren nun ein jzwischen 1 und n und wählen h = (0,...,0,h j ,0,...,0) = h j e j . Für hinreichendkleine h j liegen diese Vektoren in W, und (10.14) reduziert sich aufworaus folgtf i (x+h j e j ) = f i (x)+a ij h j +r i (h),f i (x+h j e j )−f i (x)h j= a ij + r i(h)h jfür h j ≠ 0.Wegen |h j | = ‖h‖ können wir h j → 0 streben lassen und bekommen∂f i∂x j(x) = limhj →0f i (x+h j e j )−f i (x)h j= a ij .Satz 10.10 Sei U ⊆ R n offen und f : U → R m in x ∈ U differenzierbar. Dannist f in x stetig.Beweis Da lineare Abbildungen von R n nach R m stetig sind (Satz 10.4) und0 in 0 überführen, geht die rechte Seite von (10.12) für h → 0 gegen f(x). Alsoexistiert lim h→0 f(x+h) und ist gleich f(x).Satz 10.11 Sei U ⊆ R n offen und f : U → R m in x ∈ U stetig partiell differenzierbar.Dann ist f in x differenzierbar.189


Beweis Es genügt, diese Aussage für jede Komponente von f zu zeigen, d.h. wirnehmen m = 1 an. Für h = (h 1 ,...,h n ) ∈ W definieren wiri∑x (0) = x und x (i) := x+ h j e jj=1für i = 1,...,n.Insbesondere ist x (n) = x+h. Da sich x (i) und x (i−1) nur in der i. Komponenteunterscheiden, gibt es nach dem Mittelwertsatz für Funktionen einer Veränderlichenfür jedes i = 1,...,n ein t i ∈ [0,1] so, dassAufsummieren liefertf(x (i) )−f(x (i−1) ) = ∂f∂x i(x (i−1) +t i h i e i )·h i .f(x+h)−f(x) = f(x (n) )−f(x (0) ) =n∑i=1∂f∂x i(x)h i +r(h)(Teleskopsumme) mitr(h) =n∑i=1( ∂f(x (i−1) +t i h i e i )− ∂f )(x) h i .∂x i ∂x iDa alle partiellen Ableitungen in x nach Voraussetzung stetig sind, ist( ∂flim (x (i−1) +t i h i e i )− ∂f )(x) = 0h→0 ∂x i ∂x ifür jedes i = 1,...,n und folglich lim h→0r(h)‖h‖ = 0.Wir nennen stetig partiell differenzierbare Funktionen daher auch kurz stetig differenzierbar.Keine der im Schema vor Satz 10.9 angegebenen Implikationen lässtsich umkehren: In Beispiel 2 aus Abschnitt 10.2 ist eine partiell differenzierbare,aber nicht differenzierbare Funktion angegeben. Ein Beispiel für eine differenzierbare,aber nicht stetig differenzierbare Funktion steht in Heuser, Ana <strong>II</strong>, Pkt.164, Aufg. 7.Die aus Kapitel 7 bekannten Differentiationsregeln übertragen sich ohne Änderungauf den allgemeinen Fall:Satz 10.12 Seien U ⊆ R n offen und f,g : U → R m in x ∈ U differenzierbar.Dann ist für α,β ∈ R auch die Funktion αf +βg in x differenzierbar, und es gilt(αf +βg) ′ (x) = αf ′ (x)+βg ′ (x).190


Die Produkt– und Quotientenregel vermerken wir nur für skalarwertige Funktionen.Satz 10.13 Seien U ⊆ R n offen und f,g : U → R in x ∈ U differenzierbar.Dann sind auch die Funktionen fg : U → R und (falls g(x) ≠ 0) f/g : U → Rin x differenzierbar, und es ist(fg) ′ (x) = g(x)f ′ (x)+f(x)g ′ (x),( f) ′(x) g(x)f ′ (x)−f(x)g ′ (x)= .g g 2 (x)Die Beweise dieser beiden Sätze werden wie im Fall n = 1 geführt und sind HA.Satz 10.14 (Kettenregel) Seien U ⊆ R n und V ⊆ R m offene Mengen, und g :U → R m und f : V → R k seien Funktionen mit g(U) ⊆ V. Ist g in x 0 ∈ U und fin g(x 0 ) ∈ Vdifferenzierbar, so ist die zusammengesetzte Funktion f◦g : U → R kin x 0 differenzierbar, und es gilt)(f ◦g) ′ (x 0 ) = f(g(x ′ 0 ) ◦g ′ (x 0 ).Das ◦ auf der rechten Seite steht für die Verkettung der linearen Abbildungeng ′ (x 0 ) und f ′ (g(x 0 )). In Matrixschreibweise bedeutet das gerade das Matrixproduktder k ×m–Matrix f ′ (g(x 0 )) mit der m×n–Matrix g ′ (x 0 ).Beweis Differenzierbarkeit von g in x 0 bzw. f in g(x 0 ) bedeutetwobeig(x)−g(x 0 = g ′ (x 0 )(x−x 0 )+r(x−x 0 ), (10.15)( ) )( ) ( )f(y)−f g(x 0 ) = f(g(x ′ 0 ) y −g(x 0 ) +s y −g(x 0 ) , (10.16)r(x−x 0 )limx→x 0 ‖x−x 0 ‖ = 0,limy→g(x 0 )s(y −g(x 0 ))‖y −g(x 0 )‖ = 0.Wir setzen in (10.16) y = g(x) und anschließend (10.16) in (10.15) ein:( ) ( ) ( )f g(x) −f g(x 0 ) = f ′ g(x 0 ) g ′ (x 0 )(x−x 0 )+t(x 0 ,x)mit) ( )t(x 0 ,x) = f(g(x ′ 0 ) r(x−x 0 )+s g(x)−g(x 0 ) .Wir müssen zeigen, dasst(x 0 ,x)( )‖x−x 0 ‖ = r(x−x0 )f′ g(x 0 )‖x−x 0 ‖ + s(g(x)−g(x 0))‖x−x 0 ‖für x → x 0 gegen 0 strebt. Für den ersten Summanden ist dies wegen der Stetigkeitder linearen Abbildung f ′ (g(x 0 )) und wegen lim h→0 r(h)/‖h‖ = 0 klar. Für191


den zweiten Summanden beachten wir, dass s(0) = 0. Für g(x) = g(x 0 ) ist alsos(g(x)−g(x 0 )) = 0, und für g(x) ≠ g(x 0 ) haben wirs(g(x)−g(x 0 ))‖x−x 0 ‖= s(g(x)−g(x 0))‖g(x)−g(x 0 )‖‖g(x)−g(x 0 )‖‖x−x 0 ‖Wegen der Stetigkeit von g in x 0 und wegen lim h→0 s(h)/‖h‖ = 0 ists(g(x)−g(x 0 ))limx→x 0 ‖g(x)−g(x 0 )‖ = 0,undwirzeigennoch,dassderQuotient‖g(x)−g(x 0 )‖/‖x−x 0 ‖ineinerUmgebungvon x 0 beschränkt bleibt. Dies folgt aber aus der Zerlegungsformel für g :‖g(x)−g(x 0 )‖‖x−x 0 ‖= ‖g′ (x 0 )(x−x 0 )+r(x−x 0 )‖‖x−x 0 ‖Wir sehen uns die Kettenregel für einige Spezialfälle an.≤ ‖g ′ (x 0 )‖+ ‖r(x−x 0)‖‖x−x 0 ‖ .Beispiel 1 Die reellwertigen Funktionen f bzw. x 1 ,...,x n seien auf der offenenMenge U ⊆ R n bzw. auf dem offenen Intervall I ⊆ R definiert, und die verketteteFunktion F(t) := f(x 1 (t),...,x n (t)) soll auf I erklärt sein. Sind alle Funktionenf und x i auf I differenzierbar, so ist auch F auf I differenzierbar, undgenauer: für t 0 ∈ I istdFdt (t 0) =dFdt = ∂f dx 1 ∂f dx n+...+∂x 1 dt ∂x n dt ,n∑i=1∂f( )x 1 (t 0 ),...,x n (t 0 ) · dx i∂x i dt (t 0).Der Beweis folgt sofort aus der Kettenregel, angewandt auf die äußere Funktionf und die innere Funktion g(t) := (x 1 (t),...,x n (t)) T : I → R n .Beispiel 2 Die reellwertigen Funktionen f bzw. u 1 ,...,u n seien auf der offenenMenge U ⊆ R n bzw. der offenen Menge V ⊆ R m definiert. Wir betrachten dieverkettete Funktion()F(x 1 ,...,x m ) = f u 1 (x 1 ,...,x m ),...,u n (x 1 ,...,x m )auf V. Ist f auf V differenzierbar und jede Funktion u i auf V partiell differenzierbar,so ist F auf V partiell differenzierbar, und es gilt∂F∂x i= ∂f∂u 1∂u 1∂x i+...+ ∂f∂u n∂u n∂x ifür alle i.Dies folgt sofort aus Beispiel 1. Ist sogar jede der Funktionen u i differenzierbar,so ist F auf V differenzierbar, und es ist192.


( ∂FF ′ = ,..., ∂F )∂x 1 ∂x mauf V.Beispiel 3 Sei x : (0,1) → R n \{0} eine differenzierbare Funktion. Dann ist dieverkettete Funktionf : (0,1) → R, t ↦→ ‖x(t)‖ 2nach Beispiel 1 aus Abschnitt 10.2 und nach Satz 10.14 differenzierbar, und dieKettenregel liefert wie in Beispiel 1f ′ (t) =n∑i=1x i (t)‖x(t)‖ 2·x ′ i(t) = 〈x(t),x′ (t)〉‖x(t)‖ 2,wobei 〈·,·〉 für das übliche Skalarprodukt im R n steht.Beispiel 4 Wir sehen uns die Anwendung der Kettenregel bei der Transformationvon Differentialausdrücken an. Durch Einführung von Polarkoordinatenx = rcosϕ,y = rsinϕ auf R 2 \{(0,0)} wird aus einer Funktion u = u(x,y) eineFunktion v = v(r,ϕ) = u(rcosϕ,rsinϕ).✻y. . . . . . . ..0rϕ.......x✲Wir zeigen, dass dabei beispielsweise der Ausdruck x ∂u∂y −y∂u ∂vin übergeht. Aus∂x ∂rx = rcosϕ und y = rsinϕ folgt r = √ x 2 +y 2 und ϕ = arctan y . Differenzierenxliefertund analog ∂r∂y∂r∂x == sinϕ sowie2x2 √ x 2 +y = rcosϕ2 r= cosϕ∂ϕ∂x = 1( −y)1+( y = −yx )2 x 2 x 2 +y = −rsinϕ2 r 2und analog ∂ϕ∂y = cosϕr. Demzufolge ist nach Beispiel 2= − sinϕr∂u∂x = ∂v ∂r∂r ∂x + ∂v ∂ϕ∂ϕ ∂x = ∂v ∂v sinϕcosϕ− ,∂r ∂ϕ r∂u= ∂v ∂r∂y ∂r ∂y + ∂v ∂ϕ∂ϕ ∂y = ∂v ∂v cosϕsinϕ+ .∂r ∂ϕ r193


Hieraus folgt schließlichx ∂u ( ∂v∂y −y∂u ∂x = rcosϕ ∂rsinϕ+∂v∂ϕcosϕ) ( ∂v−rsinϕr ∂rcosϕ−∂v∂ϕsinϕ)r= ∂v∂v(rsinϕcosϕ−rsinϕcosϕ)+∂r ∂ϕ (cos2 ϕ+sin 2 ϕ) = ∂v∂ϕ .Es ist also beispielsweise genau dann x ∂u − ∂y y∂u ∂v= 0, wenn = 0, d.h. genau∂x ∂ϕdann, wenn v nur von r abhängt, also rotationssymmetrisch ist.10.4 RichtungsableitungenDefinition 10.15 Sei U ⊆ R n offen, f : U → R, x ∈ U und v ∈ R n ein Vektorder Länge ‖v‖ 2 = 1. Man sagt, dass f eine Ableitung in Richtung des Vektors vbesitzt, wenn der Grenzwertf(x+tv)−f(x)limt→0 texistiert. Wir bezeichnen diesen Grenzwert mit ∂f∂v .Die partiellen Ableitungen ∂f∂x isind spezielle Richtungableitungen in Richtungder Einheitsvektoren e i = (0,...,0,1,0,...,0) mit der 1 an i. Stelle.Satz 10.16 Seien U,x,f wie in Definition 10.15, und f sei in x differenzierbar.Dann existiert für jeden Einheitsvektor v = (v 1 ,...,v n ) T ∈ R n die Ableitung vonf im Punkt x in Richtung v, und es gilt∂f∂v (x) = f′ (x)v = ∂f∂x 1(x)v 1 +...+ ∂f∂x n(x)v n . (10.17)Beweis Für hinreichend kleines t ist nach Definition von f ′ (x)Aus lim t→0‖r(tv)‖|t|f(x+tv)−f(x)t= f′ (x)·tv +r(tv)t= f ′ (x)v + r(tv)t= lim t→0‖r(tv)‖‖tv‖= 0 folgt die Behauptung.Mit Hilfe des Gradienten gradf = ( ∂f∂x 1,..., ∂f∂x n) können wir (10.17) auch als∂f(x) = 〈(gradf)(x),v〉 (10.18)∂vschreiben, wobei 〈x,y〉 = ∑ ni=1 x iy i das Skalarprodukt auf R n ist. Wie im R 2führt man den Winkel ϕ ∈ [0,π] zwischen zwei Vektoren x,y ∈ R n \{0} durch〈x,y〉 = ‖x‖‖y‖cosϕ194.


ein. Ist also (gradf)(x) ≠ 0, so folgt aus (10.18) für den Winkel ϕ zwischen vund (gradf)(x) :∂f(x) = ‖(gradf)(x)‖cosϕ.∂vFolgerung 10.17 Seien U,f,x,v wie in Definition 10.15, und sei (gradf)(x) ≠0. Dann ist die Richtungsableitung ∂f (x) genau dann maximal, wenn cosϕ = 1∂vbzw. ϕ = 0, d.h. wenn (gradf)(x) und v die gleiche Richtung haben. Der Gradientzeigt also in die Richtung des stärksten Anstieges von f in x. Diese Tatsache wirdbei der numerischen Lösung von Extremalaufgaben benutzt.10.5 Der MittelwertsatzAm Ende von Abschnitt 7.6 haben wir gesehen, dass der Mittelwertsatz in seinergewohnten Form für vektorwertige Funktionen nicht mehr gilt. Man hat jedochfür reellwertige Funktionen auf R n die folgende Version.Satz 10.18 (Mittelwertsatz) Sei U ⊆ R n offen und f : U → R differenzierbar.Weiter sei x+th ∈ U für alle t ∈ [0,1]. Dann existiert ein τ ∈ (0,1) mitf(x+h)−f(x) = f ′ (x+τh)h.Beweis Wir betrachten die differenzierbare Funktiong : [0,1] → R, t ↦→ f(x+th).Nach dem Mittelwertsatz 7.27 für Funktionen einer Veränderlichen gibt es einτ ∈ (0,1) mitf(x+h)−f(x) = g(1)−g(0) = dgdt (τ).Nach der Kettenregel (Beispiel 1 aus 10.3) ist weiterdgn∑dt (τ) =i=1∂f∂x i(x+τh)h i = f ′ (x+τh)h.Für Funktionen f : R n → R m mit m ≥ 2 ist die folgende Version des Mittelwertsatzesdie nächstbeste und sehr nützlich.Satz 10.19 Sei U ⊆ R n offen, f : U → R m stetig differenzierbar und x+th ∈ Ufür alle t ∈ [0,1]. Dann istf(x+h)−f(x) =∫ 10f ′ (x+τh)hdτ.Ist insbesondere ‖f ′ (x+th)‖ ≤ M für alle t ∈ [0,1], so folgt‖f(x+h)−f(x)‖ ≤ M‖h‖.195


Das Integral über die vektorwertige Funktion f ′ (x+τh)h ist komponentenweiseerklärt.Beweis Für g : [0,1] → R m , g(t) := f(x+th) ist g ′ (t) = f ′ (x+th)h und daherf(x+h)−f(x) = g(1)−g(0) =∫ 10g ′ (τ)dτ =∫ 10f ′ (x+τh)hdτ,womit die erste Aussage gezeigt ist. Die zweite folgt aus∫ 1∫ 1∥ f ′ (x+τh)hdτ∥ ≤ ‖f ′ (x+τh)h‖dτ00≤ ∫ 10 ‖f′ (x+τh)‖‖h‖dτ ≤ ∫ 1M‖h‖dτ = M‖h‖.010.6 Der Satz von TaylorWir lernen nun den Satz von Taylor für Funktionen mehrerer Veränderlicher kennen.Dabei beschränken wir uns auf reellwertige Funktionen. Wir führen zunächsteinige Bezeichnungen ein, die uns helfen, die Übersicht über die zahlreichen Summandenin der Taylorentwicklung zu behalten.Ein Multiindex ist ein n–Tupel (α 1 ,...,α n ) ∈ N n . Für jeden Multiindex α =(α 1 ,...,α n ) sei |α| := α 1 + ... + α n seine Ordnung und α! := α 1 !...α n ! seineFakultät. Für jede |α|–mal partiell differenzierbare Funktion f : R n ⊇ U → Rsetzen wirD α f := D α 11 ...D αnn f =und für x = (x 1 ,...,x n ) ∈ R n seix α := x α 11 ·...·x αnn .∂ |α| f∂x α 11 ...∂x αnnAls Vorbereitung für den Satz von Taylor zeigen wir:Satz 10.20 Sei U ⊆ R n offen, f : U → R k–mal stetig partiell differenzierbar,und sei x+th ∈ U für alle t ∈ [0,1]. Dann ist die Funktionk–mal stetig differenzierbar, und es giltg : [0,1] → R, t ↦→ f(x+th)d k gdt (τ) = ∑k|α|=k,k!α! (Dα f)(x+τh)h α (10.19)(die Summation erfolgt über alle Multiindizes der Ordnung k).196


Beweis Wir zeigen zuerst mit vollständiger Induktion, dassd k gn∑dt (τ) = (D k ik ...D i1 f)(x+τh)h i1 ·...·h ik . (10.20)i 1 ,...,i k =1Für k = 1 haben wir dies bereits im Beweis von Satz 10.18 getan. Aus derKettenregel folgt nämlichdgdt (τ) = df(x 1 +th 1 ,...,x n +th n )(τ) = ∂f dx 1dt ∂x 1 dt= ∂f h 1 +...+ ∂f n∑h n =∂x 1 ∂x n=n∑(D i1 f)(x+τh)h i1 .i 1 =1i 1 =1∂f∂x i1(x+τh)h i1∂f dx n+...+∂x n dtNehmen wir an, dass (10.20) für ein k −1 ≥ 1 richtig ist, so folgt analogd k gdt (τ) = d ( n∑(D k ik−1 ...D i1 f)(x+th)h i1 ...h ik−1)(τ)dt==i 1 ,...,i k−1 =1n∑ (D iki k =1n∑i 1 ,...,i k =1n∑i 1 ,...,i k−1 =1(D ik−1 ...D i1 f)(x+τh)h i1 ...h ik−1)h ik(D ik ...D i1 f)(x+τh)h i1 ...h ik .Damitist(10.20)gezeigt.Wirüberlegenunsnun,dassdierechteSeitevon(10.20)gleich der rechten Seite von (10.19) ist. Grundidee ist, dass es nach dem Satz vonSchwarz auf die Reihenfolge der partiellen Ableitungen nicht ankommt und wirdaher die partiellen Ableitungen umsortieren können. Kommt unter den Indizesi 1 ,...,i k die Zahl 1 genau α 1 –mal vor, die Zahl 2 genau α 2 –mal, ..., und dieZahl n genau α n –mal, so ergibt die Umsortierung und Zusammenfassung gleicherAbleitungen(D ik ...D i1 f)(x+τh)h i1 ...h ik = (D α 11 ...D αnn f)(x+τh)h α 11 ...h αnn .k!Da es geradeα 1 !...α n!= k! k–Tupel (iα! 1 ,...,i k ) gibt, in denen die Zahl j genauα j –mal vorkommt (beachten Sie: α 1 +...+α n = k), giltd k gn∑dt (τ) = (D k ik ...D i1 f)(x+τh)h i1 ...h iki 1 ,...,i k= ∑ k!α! (Dα 11 ...Dn αnf)(x+τh)h α 11 ...h αnn|α|=k= ∑ k!α! (Dα f)(x+τh)h α .|α|=k197


Satz 10.21 (Taylor) Sei U ⊆ R n offen, f : U → R (k+1)–mal stetig partielldifferenzierbar, und sei x+th ∈ U für alle t ∈ [0,1]. Dann gibt es ein τ ∈ (0,1)so, dass∑ 1f(x+h) =α! (Dα f)(x)h α + ∑ (D α f)(x+τh)h α .α!|α|≤k|α|=k+1} {{ } } {{ }Taylorpolynom der Ordnung k RestgliedBeispiel Wir bestimmen das Taylorpolynom der Ordnung 2 der Funktion f :R 2 → R, (x 1 ,x 2 ) ↦→ e x2 1 +cosx 2im Punkt x = (0,0). Dieses ist gleichf(0) + (D 1 f)(0)h 1 +(D 2 f)(0)h 2 + 1 2 (D2 1f)(0)h 2 1+ 1 2 (D2 2f)(0)h 2 2 +(D 1 D 2 f)(0)h 1 h 2 ,und wir bestimmen die partiellen Ableitungen von f bis zur 2. Ordnung:(D 1 f)(x 1 ,x 2 ) = 2x 1 e x2 1 +cosx 2=⇒ (D 1 f)(0) = 0.(D 2 f)(x 1 ,x 2 ) = −sinx 2 e x2 1 +cosx 2=⇒ (D 2 f)(0) = 0.(D 2 1f)(x 1 ,x 2 ) = (2+4x 2 1)e x2 1 +cosx 2=⇒ (D 2 1f)(0) = 2e.(D 2 2f)(x 1 ,x 2 ) = (−cosx 2 +sin 2 x 2 )e x2 1 +cosx 2=⇒ (D 2 2f)(0) = −e.(D 1 D 2 f)(x 1 ,x 2 ) = −2x 1 sinx 2 e x2 1 +cosx 2=⇒ (D 1 D 2 f)(0) = 0.Das gesuchte Taylorpolynom ist also(h 1 ,h 2 ) ↦→ e+eh 2 1 − e 2 h2 2.Beweis von Satz 10.21 Die Funktion g : [0,1] → R,t ↦→ f(x + th) ist nachSatz 10.20 (k+1)–mal stetig differenzierbar. Der Satz von Taylor für Funktioneneiner Veränderlichen behauptet die Existenz eines τ ∈ (0,1) so, dassf(x+h) = g(1) =k∑m=0g (m) (0)m!+ g(k+1) (τ)(k +1)! .Wieder nach Satz 10.20 istg (m) (0)m!= ∑|α|=m(D α f)(x)α!h αsowieg (k+1) (τ)(k +1)!= ∑|α|=k+1(D α f)(x+τh)α!h α ,woraus die Behauptung folgt.198


Anmerkung 1 Seien α,β Multiindizes gleicher Länge. Man rechnet leicht nach,dass für f(x) := x β gilt⎧⎨ β!(D α f)(x) = (β −α)! xβ−α falls β ≥ α⎩0 sonst(β −α und β ≥ α sind komponentenweise zu verstehen). Insbesondere ist{β! falls α = β(D α f)(0) =0 sonst.Hieraus folgt, dass wie bei Funktionen einer Veränderlichen alle partiellen Ableitungenin x bis zur k. Ordnung der Funktion f mit denen ihres Taylorpolynomsder Ordnung k übereinstimmen.Anmerkung 2 Man kann den Satz von Taylor auch für vektorwertige Funktionenf = (f 1 ,...,f m ) T : U → R m formulieren und beweisen. Definieren wir fürsolche Funktionen D i f := (D i f 1 ,...,D i f m ) T : U → R m , so sieht das entsprechendeTaylorpolynom (welches nun ein Vektor ist) formal genauso aus wie in Satz10.21. Für m > 1 muss jedoch das Restglied modifiziert werden (vgl. Abschnitt10.5 für den Mittelwertsatz).Wir sehen uns die Polynome P m (h) := ∑ |α|=man.(D α f)(x)α!h α für m = 0,1,2 genauerm = 0 : Notwendigerweise ist α = (0,...,0) und daher P 0 (h) = f(x).m = 1 : Die einzigen n–Tupel α ∈ N n mit |α| = 1 sind die “Einheitsvektoren”e j = (0,...,0,1,0,...,0) mit der 1 an der j. Stelle. Wegen D e jf = D j f, e j ! = 1und h e j= h j istP 1 (h) =n∑(D j f)(x)h i = 〈(gradf)(x),h〉.j=1m = 2 : Wir haben im Beweis von Satz 10.20 gesehen, dassP 2 (h) = ∑|α|=2(D α f)(x)α!h α = 1 2n∑(D i D j f)(x)h i h j .i,j=1Um dies kompakter zu schreiben, bezeichnen wir für jede zweimal stetig partielldifferenzierbare Funktion f : R n ⊇ U → R die n×n – Matrix( ) n ( ∂ 2 f n(D i D j f)(x) = (x))i,j=1 ∂x i ∂x j i,j=1199


mit (Hess f) (x) und nennen sie die Hesse–Matrix oder den Hessian von f inx. Nach dem Satz von Schwarz ist (Hess f) (x) eine symmetrische Matrix. Mitdieser können wir P 2 (h) schreiben alsP 2 (h) = 1 〈(Hess f)(x)h,h〉.2Folgerung 10.22 Ist U ⊆ R n offen, f : U → R dreimal stetig partiell differenzierbarund x+th ∈ U für alle t ∈ [0,1], so istf(x+h) = c+〈a,h〉+ 1 2 〈Ah,h〉+R 2(x,h)mit c = f(x), a = (gradf)(x), A = (Hess f)(x) und einem Restglied R 2 wie imSatz 10.21.10.7 Lokale ExtremaWir benutzen nun Folgerung 10.22 zur Untersuchung des lokalen Verhaltens vonFunktionen f : R n ⊇ U → R. Für offenes U ⊆ R n sei C k (U) die Menge allerk–mal stetig partiell differenzierbaren Funktionen f : U → R. Eine Funktionf : U → R besitzt in x 0 ∈ U ein lokales Minimum (bzw. Maximum), wenn füralle x aus einer Umgebung V ⊆ U von x 0 giltf(x 0 ) ≤ f(x)(bzw. f(x0 ) ≥ f(x) ) .Tritt die Gleichheit nur für x = x 0 ein, nennen wir x 0 ein isoliertes lokalesMinimum (bzw. Maximum).Satz 10.23 (Notwendige Bedingung) Sei U offen und f : U → R partielldifferenzierbar. Besitzt f in x 0 ∈ U ein lokales Extremum (Minimum oder Maximum),so ist (gradf)(x 0 ) = 0.Beweis Für i = 1,...,n betrachten wir die Funktionen g i (t) := f(x 0 + te i ).Diese sind auf einem Intervall (−ε,ε) mit ε > 0 definiert und differenzierbar, undsie besitzen in t = 0 ein lokales Extremum. Nach Lemma 7.9 ist g ′ i(0) = 0. Nunist aber g ′ i(0) = ∂f∂x i(x 0 ). Also ist (gradf)(x 0 ) = 0.Das Verschwinden aller partiellen Ableitungen in x 0 ist also eine notwendige Bedingungfür das Vorliegen eines lokalen Extremums. Wie bei Funktionen einerVeränderlichen erhält man hinreichende Bedingungen durch Betrachten der zweitenAbleitungen. Wir treffen dazu einige Vorbereitungen.Definition 10.24 Sei A eine symmmetrische (A = A T ) reelle n×n Matrix. Aheißt• positiv definit, wenn 〈Ax,x〉 > 0 für alle x ∈ R n \{0}.200


• positiv semidefinit, wenn 〈Ax,x〉 ≥ 0 für alle x ∈ R n .• negativ definit (semidefinit), wenn −A positiv definit (semidefinit) ist.• indefinit, wenn es x,y ∈ R n gibt mit 〈Ax,x〉 > 0 und 〈Ay,y〉 < 0.Aus der linearen Algebra kennen wir Kriterien für die Definitheit. So gilt:Satz 10.25 Sei A symmetrische reelle n×n – Matrix. Dann ist A• positiv definit ⇐⇒ alle Eigenwerte von A sind positiv.• positiv semidefinit ⇐⇒ alle Eigenwerte von A sind nichtnegativ.• indefinit ⇐⇒ A hat sowohl positive als auch negative Eigenwerte.Satz 10.26 (Hurwitz-Kriterium) Eine symmetrische reelle n × n – MatrixA = (a ij ) n i,j=1 ist genau dann positiv definit, wenn⎛ ⎞a 11 ... a 1kdet⎜⎝ . .⎟⎠ > 0 für k = 1,...,n.a k1 ... a kkInsbesondere für n = 2 ist die Anwendung dieses Kriteriums sehr einfach. Wirformulieren nun hinreichende Kriterien für das Vorliegen von Extremwerten.Satz 10.27 Sei U ⊆ R n offen, f ∈ C 2 (U), x 0 ∈ U und (gradf)(x 0 ) = 0. Danngilt:(a) ist (Hessf)(x 0 ) positiv definit, so hat f in x 0 ein isoliertes Minimum.(b) ist (Hessf)(x 0 ) negativ definit, so hat f in x 0 ein isoliertes Maximum.(c) ist (Hessf)(x 0 ) indefinit, so besitzt f in x 0 kein lokales Extremum.Ist (Hessf)(x 0 ) nur semidefinit, so ist keine Entscheidung möglich.Beweis Wir zeigen nur die Aussage (a) und nehmen der Einfachheit halberf ∈ C 3 (U) an. Nach Folgerung 10.22 gilt für alle x 0 +x aus einer Umgebung vonx 0f(x 0 +x) = f(x 0 )+ 1 〈Ax,x〉+R(x) (10.21)2mit A := (Hess f)(x 0 ). Da S := {y ∈ R n : ‖y‖ = 1} kompakt ist, nimmt diestetige FunktionS → R, y ↦→ 〈Ay,y〉201


auf S ihr Minimum α an. Da 〈Ay,y〉 > 0 für alle y ∈ S, ist insbesondere α > 0.Ist nun x ∈ R n \{0}, so ist x/‖x‖ ∈ S und folglich〈A x 〉‖x‖ , x≥ α > 0 bzw. 〈Ax,x〉 ≥ α‖x‖ 2 . (10.22)‖x‖Die letztere Abschätzung gilt offenbar auch für x = 0 und damit für alle x ∈ R.(Umgekehrt folgt aus dieser Abschätzung natürlich die positive Definitheit vonA; beide Aussagen sind also äquivalent.)Weiter: für das Restglied R(x) in (10.21) haben wir wegen |x i | ≤ ‖x‖ offenbardie Abschätzung|R(x)| = ∣ ∑ (D α f)(x 0 +τx)∣x α ∣∣ ≤ C‖x‖3α!|α|=3für alle x aus einer hinreichend kleinen Umgebung von 0. Wählen wir diese Umgebungso klein, dass auch C‖x‖ ≤ α/4, so wird|R(x)| ≤ C‖x‖ 3 = C‖x‖‖x‖ 2 ≤ α 4 ‖x‖2 .Hieraus und aus (10.21) und (10.22) folgt schließlichf(x 0 +x) ≥ f(x 0 )+ α 2 ‖x‖2 − α 4 ‖x‖2 = f(x 0 )+ α 4 ‖x‖2für alle x aus einer (hinreichend kleinen) Umgebung von 0. Also besitzt f in x 0ein isoliertes lokales Minimum.Beispiel Für f(x,y) = x 2 + 1 2 y2 +xy+10 ist (gradf)(0,0) = 0, und die Matrix( )2 1(Hessf)(0,0) =1 1ist positiv definit (Hurwitz–Kriterium). Also besitzt f in (0,0) ein lokales isoliertesMinimum.10.8 Parameterabhängige IntegraleIn diesem Abschnitt betrachten wir folgendes Problem: Wird eine Funktion fzweier Veränderlicher bzgl. einer der Veränderlichen integriert, so hängt das Ergebnisvon der zweiten Veränderlichen ab. Beispielsweise ist für f(x,y) = x y fürx,y ≥ 0∫ 2 ∫ 2f(x,y)dx = x y dx = xy+1∣ 2 = 2y+1 −1.11 y +1 1 y +1Die Frage ist, unter welchen Voraussetzungen an f diese Abhängigkeit stetig odersogar differenzierbar ist.202


Satz 10.28 Sei U ⊆ R n offen und D = [a,b] ⊆ R ein kompaktes Intervall. DieFunktion f : D×U → R sei stetig. Dann ist auch die FunktionF : U → R, x ↦→∫ baf(t,x)dtstetig. Hat f zusätzlich stetige partielle Ableitungen ∂f∂x i: D×U → R, i = 1,...,n,so ist auch F stetig partiell differenzierbar, und es gilt∫∂ b∂x iaf(t,x)dt =∫ ba∂f∂x i(t,x)dt.Unter den getroffenen Voraussetzungen dürfen Integration und Differentiationalso vertauscht werden.Beweis Wir überlegen uns zuerst die Stetigkeit von F. Sei x ∈ U. Da U offen ist,gibteseinr > 0so,dassU 2r (x) ⊆ U.DannliegtabererstrechtdieabgeschlosseneKugel U r (x) = {y ∈ R n : ‖x−y‖ ≤ r} in U. Weiter: die MengeD×U r (x) = [a,b]×{y ∈ R n : ‖x−y‖ ≤ r}ist abgeschlossen und beschränkt in R×R n = R n+1 , also kompakt. Also ist f aufdieser Menge sogar gleichmäßig stetig (Satz 6.41). Insbesondere gibt es zu jedemε > 0 ein δ ∈ (0,r) so, dass|f(t,x+h)−f(t,x)| < εb−afür alle t ∈ [a,b] und alle h ∈ R n mit ‖h‖ < δ. Integration liefert|F(x+h)−F(x)| ≤∫ bfür alle h mit ‖h‖ < δ. Also ist F in x stetig.a|f(t,x+h)−f(t,x)|dt ≤ εb−a (b−a) = εFür den Beweis der zweiten Aussage sei wieder x ∈ U beliebig. Wir wählen einr ∈ R so, dass x+he i ∈ U für alle h ∈ (−r,r). Wir zeigen, dass die Funktion⎧f(t,x+he i )−f(t,x)⎪⎨falls h ≠ 0hg(t,x,h) :=∂f ⎪⎩ (t,x) falls h = 0∂x iauf der MengeŨ := {(t,x,h) ∈ [a,b]×U ×(−r,r)}stetig ist. In allen Punkten (t,x,h) ∈ Ũ mit h ≠ 0 ist dies klar, so dass wirnoch die Stetigkeit in allen Punkten (t,x,0) ∈ Ũ zeigen müssen. Seien (t n,x n ,h n )203


Punkte aus Ũ mit lim n→∞(t n ,x n ,h n ) = (t,x,0) und h n ≠ 0 (für h n = 0 ist dieAussage wieder offensichtlich). Nach dem Mittelwertsatz der Differentialrechnungfür Funktionen einer Veränderlichen, angewandt auf die Funktiongibt es ein ξ n ∈ [0,1] mita : s ↦→ f(t n ,x n +sh n e i ),a(1)−a(0)h n= f(t n,x n +h n e i )−f(t n ,x n )h n= ∂f∂x i(t n ,x n +ξ n h n e i ).Für n → ∞ ist h n → 0 und folglich auch ξ n h n → 0. Wegen der Stetigkeit von ∂f∂x iist daherg(t n ,x n ,h n ) = f(t n,x n +h n e i )−f(t n ,x n )h n= ∂f (t n ,x n +ξ n h n e i ) → ∂f (t,x) = g(t,x,0).∂x i ∂x iAlso ist g stetig. Wenden wir die Aussage des ersten Teils des Satzes an, erhaltenwir∂F∂x i(x) = ∂∂x i∫ b=∫ baaf(t,x)dt = limg(t,x,0)dt =∫ bh→0a∫ bag(t,x,h)dt∂f∂x i(t,x)dt.Schließlich hängt diese Funktion – wieder nach dem ersten Teil des Satzes – stetigvon x ab.Beispiel Für |t| < 1 berechnen wir das IntegralF(t) :=∫ π0ln(1−2tcosx+t 2 )dx.Um Satz 10.28 benutzen zu können, wählen wir ein a ∈ (|t|,1) und betrachten Fauf dem kompakten Intervall [−a,a]. (Man beachte, dass 1−2tcosx+t 2 > 0 für|t| < 1.) Die Funktionf(x,t) := ln(1−2tcosx+t 2 )ist nach t stetig partiell differenzierbar und hat die Ableitung∂f∂t = 2t−2cosx1−2tcosx+t 2Aus der zweiten Aussage von Satz 10.28 folgtF ′ (t) =∫ π0auf [0,π]×[−a,a].2t−2cosx1−2tcosx+t 2 dx.204


Offenbar ist F ′ (0) = 0. Für t ≠ 0 substituieren wirs := tan x 2bzw. x = 2arctans.Dann ist dxds = 21+s 2 bzw. dx = 2ds1+s 2 sowiecosx = cos2 x 2 −sin2 x 2cos 2 x2 +sin2 x 2Das gesuchte Integral geht damit über in= 1−tan2 x 21+tan 2 x 2= 1−s21+s 2 .∫ ∞02t−2 1−s21+s 21−2t 1−s21+s 2 +t 2 ·Partialbruchzerlegung liefert∫2 ∞1+s ds = 4 2s 2 (1+t)−(1−t)4(1+t) 2 s 4 +2(1+t 2 )s 2 +(1−t) = 2 2 t0s 2 (1+t)−(1−t)(1+t) 2 s 4 +2(1+t 2 )s 2 +(1−t) 2 ds.( 1s 2 +1 +Mit dem Grundintegral∫1ax 2 +c dx = √ 1 aarctan√x für ac > 0ac ct 2 −1).(1+t) 2 s 2 +(1−t) 2erhalten wirF ′ (t) = 2 (arctans−arctan( 1+t )∣ ∣∣t 1−t s) ∞= 00(beachten Sie: arctan0 = 0, lim s→∞ arctans = π). Also ist 2 F′ (t) = 0 für allet ∈ (−1,1), und F eine konstante Funktion. Wir bestimmen ihren (einzigen)Wert, indem wir im Ausgangsintegral t = 0 setzen:F(t) = F(0) =∫ π0ln1dx = 0.Als weitere Anwendung von Satz 10.28 betrachten wir iterierte Integrale und ihreBerechnung. Sei f : [a,b]×[c,d] → R eine stetige Funktion. Nach Satz 10.28 istdie FunktionF(y) :=∫ baf(x,y)dxauf [c,d] stetig und kann folglich integriert werden. Man bezeichnet∫ dcF(y)dy =∫ d ∫ bcaf(x,y)dxdyals iteriertes Integral. Der folgende Satz sagt, dass es auf die Reihenfolge derIntegrationen nicht ankommt.205


Satz 10.29 Sei f : [a,b]×[c,d] → R stetig. Dann ist∫ dc∫ baf(x,y)dxdy =∫ ba∫ dcf(x,y)dydx.Beweis Wir erklären ϕ : [c,d] → R durchϕ(y) :=∫ ba∫ ycf(x,t)dtdx.Dann ist ϕ(c) = 0, ϕ ist nach Satz 10.28 differenzierbar, und es giltϕ ′ (y) =∫ ba∂∂y∫ ycf(x,t)dtdx =∫ baf(x,y)dx.Hieraus folgt∫ d ∫ bf(x,y)dxdy =∫ dϕ ′ (y)dy = ϕ(d)−ϕ(c) = ϕ(d) =∫ b ∫ dc aca cf(x,y)dydx.Ein analoger Satz gilt für n–fache Integrale einer stetigen Funktion auf einemQuader im R n .Abschließend betrachten wir noch uneigentliche Parameterintegrale der Gestalt∫ ∞af(x,y)dx, y ∈ [c,d].Da das Integrationsintervall nicht mehr kompakt ist, lässt sich der Beweis vonSatz 10.28 nicht unmittelbar übertragen, und wir benötigen stärkere Voraussetzungen.Definition 10.30 Das Integral ∫ ∞f(x,y)dx heißt auf [c,d] gleichmäßig konvergent,wenn es für jedes y ∈ [c,d] konvergiert und wenn für jedes ε > 0 einab 0 ≥ a existiert, so dass∣∫ ∞bf(x,y)dx∣ < ε für alle b ≥ b 0 und alle y ∈ [c,d].Man beachte, dass b 0 unabhängig von y ist.Satz∫10.31 (a) Sei f : [a,∞)×[c,d] → R stetig und beschränkt, und das Integral∞f(x,y)dx konvergiere gleichmäßig auf [c,d]. Dann ist die Funktionaϕ : [c,d] → R, y ↦→206∫ ∞af(x,y)dx (10.23)


stetig. Außerdem konvergiert das Integral ∫ ∞ ∫ df(x,y)dydx, und es gilta c∫ d ∫ ∞caf(x,y)dxdy =∫ ∞ ∫ dacf(x,y)dydx.(b) Sei f : [a,∞) × [c,d] → R stetig, beschränkt und nach y partiell differenzierbar,die Ableitung ∂f sei auf [a,∞)×[c,d] stetig und beschränkt, das Integral∫∂y∞ ∂f(x,y)dx sei gleichmäßig konvergent, und das Integral ∫ ∞f(x,c)dx konvergiere.Dann konvergiert das Integral ∫ ∞a ∂y af(x,y)dx für jedes y ∈ [c,d], dieaFunktion (10.23) ist differenzierbar, undϕ ′ (y) =∫ ∞a∂f∂y (x,y)dx.Beweis (a) Für alle y,y +h ∈ [c,d] und b ≥ a istϕ(y +h)−ϕ(y) ==∫ ba∫ ∞a( )f(x,y +h)−f(x,y) dx+( )f(x,y +h)−f(x,y) dx (10.24)∫ ∞bf(x,y +h)dx−∫ ∞bf(x,y)dx.Sei ε > 0. Wir wählen b so groß, dass der Betrag der letzten beiden Integralein (10.24) jeweils kleiner als ε/3 wird (gleichmäßige Konvergenz!). Weiter wissenwir aus Satz 10.28, dass y ↦→ ∫ bf(x,y)dx eine stetige Funktion ist, und daherawird auch das erste Integral in (10.24) kleiner als ε/3, wenn nur h hinreichendklein ist, etwa für h ≤ h 0 . Für alle h ≤ h 0 ist also|ϕ(y +h)−ϕ(y)| < ε.Für die zweite Aussage von (a) sei wieder ε > 0. Wir wählen b 0 ≥ a so, dass∣∫ ∞af(x,y)dx−∫ b(gleichmäßige Konvergenz!). Integrieren liefert∣∫ d ∫ ∞caaf(x,y)dx∣ < ε für alle y ∈ [c,d] und b ≥ b 0f(x,y)dxdy −∫ d ∫ bcaf(x,y)dxdy∣ < ε(d−c).Mit Satz 10.29 vertauschen wir die Integrationsreihenfolge im 2. Integral underhalten∫ d ∫ ∞ ∫ b ∫ d∣ f(x,y)dxdy − f(x,y)dydx∣ < ε(d−c).caDa dies für jedes b ≥ b 0 gilt, folgt die Behauptung.ac207


(b) Nach Teil (a) konvergiert für jedes t ∈ [c,d] das uneigentliche Integralund es giltDa ∂f∂y∫ t ∫ ∞ca∫ ∞ ∫ tac∂f∂y (x,y)dydx,∫∂f∞∂y (x,y)dxdy =a∫ tc∂f(x,y)dydx. (10.25)∂ystetig ist, folgt mit dem Hauptsatz der Differential- und Integralrechnung∫ tc∂f(x,y)dy = f(x,t)−f(x,c).∂yIntegration bzgl. x über [a,∞) liefert wegen (10.25) (und wegen der Konvergenzvon ∫ ∞f(x,c)dx nach Voraussetzung) für t ∈ [c,d]aϕ(t) =∫ ∞af(x,t)dx =∫ ∞af(x,c)dx+∫ t ∫ ∞ca∂f∂y (x,y)dxdy.Nun ist y ↦→ ∫ ∞ ∂f(x,y)dx stetig nach Teil (a). Wieder nach dem Hauptsatz dera ∂yDifferential- und Integralrechnung ist ϕ differenzierbar, undϕ ′ (t) =∫ ∞a∂f∂y (x,t)dx.Aufgabe: Benutzen Sie diesen Satz um zu zeigen, dass die Eulersche GammafunktionΓ(x) :=∫ ∞0e −t t x−1 dt, x ≥ 1stetig und sogar unendlich oft differenzierbar ist. (Für x ∈ (0,1) ist der Integrandunbeschränkt und Satz 10.31 nicht mehr unmittelbar anwendbar.)208


11 KurvenintegraleWir haben bisher ausschließlich Integrale über Intervallen betrachtet. Ein Zieldieses Kapitels ist es, Integrale über Kurven zu erklären. Besonders interessiertuns die Frage, wann ein solches Integral nur vom Anfangs- und Endpunkt derKurve abhängt.11.1 Wege und KurvenUnter einem Weg im R n verstehen wir eine stetige Abbildung γ : [a,b] → R n . DiePunkte γ(a) und γ(b) heißen Anfangs- bzw. Endpunkt des Weges. Ist γ : [a,b] →R n ein Weg, so heißt sein WertebereichΓ := {γ(t) ∈ R n : t ∈ [a,b]}die zugehörige Kurve. Man beachte: ein Weg γ ist eine Abbildung, die zugehörigeKurve eine Punktmenge. Man sagt auch, dass durch γ eine Parametrisierung derKurve Γ gegeben ist.Ein Weg γ : [a,b] → R n , γ(t) = ( γ 1 (t),...,γ n (t) ) Theißt (stetig) differenzierbar,wenn jede seiner Komponenten γ i : [a,b] → R (stetig) differenzierbar ist. Indiesem Fall heißt˙γ(t) = γ ′ (t) = ( γ ′ 1(t),...,γ ′ n(t) ) Tdie Ableitung (oder der Geschwindigkeitsvektor) von γ in t, und die Zahl( n∑ ) 1/2‖˙γ(t)‖ 2 = |γ j(t)| ′ 2die Geschwindigkeit von γ in t. Falls γ ′ (t 0 ) ≠ 0, so beschreibtdie Tangente an γ im Punkt t 0 .Beispiele 1. Für jedes n ∈ Z\{0} istj=1g : R → R n , t ↦→ γ(t 0 )+γ ′ (t 0 )tγ n : [0,2π] → R 2 , t ↦→ (cosnt, sinnt) Tein Weg. Alle diese Wege beschreiben die gleiche Kurve im R 2 , nämlich die Einheitskreislinie.2. Eine Ellipse um den Ursprung mit den Hauptachsen a,b wird durch den Wegγ : [0,2π] → R 2 , t ↦→ (a cost, b sint) T parametrisiert.3. Für a,b ∈ R n wird durch γ : [0,1] → R n , t ↦→ a+t(b−a) ein Weg definiert.Die zugehörige Kurve ist die Strecke [a,b].209


4. Die Neilsche Parabel γ : R → R 2 , t ↦→ (t 2 ,t 3 ) ist überall differenzierbar, obwohldie zugehörige Kurve eine Spitze in 0 hat.5. Eine Schraubenlinie im R 3 läßt sich durch den Weg γ : R → R 3 , t ↦→(cost, sint, t) T beschreiben.6. Jede stetige Funktion f : [a,b] → R definiert einen Weg γ : [a,b] → R 2 ,t ↦→ ( t,f(t) ) . Die zugehörige Kurve ist der Graph der Funktion.Wie das erste dieser Beispiele zeigt, kann ein Weg Teile einer Kurve mehrfachdurchlaufen. Will man dies ausschließen, muss man verlangen, dass je zwei Punktent 1 ,t 2 ∈ [a,b] mit t 1 ≠ t 2 unterschiedliche Punkte γ(t 1 ), γ(t 2 ) entsprechen.Da wir auch geschlossene Wege betrachten wollen (d.h. solche mit γ(a) = γ(b)),schließen wir Anfangs- und Endpunkt von dieser Forderung aus.Definition 11.1 Ein Weg γ : [a,b] → R n heißt Jordanweg, wenn für beliebigePunkte s,t ∈ [a,b] mit s < t und γ(s) = γ(t) folgt: s = a, t = b. Eine Kurveheißt Jordankurve, wenn sie durch einen Jordanweg beschrieben werden kann.Mit möglicher Ausnahme ihrer Endpunkte sind Jordankurven also doppelpunktfrei.Die oben betrachteten Beispiele haben diese Eigenschaft. Kurven (oder Wege)sind wesentlich kompliziertere Objekte als es unsere Anschauung erwartenläßt. Sogibt es Kurven,die ein Quadrat im R 2 komplett ausfüllen (Peano-Kurve),und Kurven, die in keinem Punkt eine Tangente besitzen (Koch’sche Schneeflocke).Umso bemerkenswerter ist der folgende Satz, der unserer Anschauungperfekt entspricht, dessen Beweis jedoch außerordentlich schwierig ist.Satz 11.2 (Jordanscher Kurvensatz) Jede geschlossene Jordankurve Γ ⊆ R 2zerlegt den R 2 in zwei Gebiete G 1 ,G 2 , die von ihr berandet werden (d.h. R 2 =G 1 ∪ Γ ∪ G 2 , ∂G 1 = ∂G 2 = Γ). Genau eines dieser Gebiete – es heißt dasInnengebiet von Γ – ist beschränkt.11.2 Rektifizierbare Wege und BogenlängeWir wollen nun die Länge eines Wegesγ : [a,b] → R n definieren und berechnen.Sei Z := {t 0 ,...,t m } mit a =t 0 < t 1 < ... < t m = b eine Zerlegungvon [a,b]. Wir verbinden für jedesi die Punkte γ(t i ) und γ(t i+1 ) durch eineStrecke und erhalten einen Polygonzugder LängeL(Z,γ) :=m−1∑i=0γ(t 1 )γ(a) = γ(t 0 )‖γ(t i+1 )−γ(t i )‖ 2 .γ(t 2 )γ(b) = γ(t 3 )210


Wir erwarten, dass sich bei Verfeinerung von Z die Länge des Polygonzuges derLänge von γ annähert“. Da sich bei Verfeinerung von Z die Zahl L(Z,γ) niemals”verkleinert, definieren wir:Definition 11.3 EinWegγ : [a,b] → R n heißt rektifizierbar,wenn supL(Z,γ) 1 n ,∑und die harmonische Reihe ∞ 1/n divergiert.n=1Für jeden Weg γ : [a,b] → R n und jedes c ∈ (a,b) sind auch γ 1 := γ| [a,c] und γ 2 :=γ| [c,b] Wege. Man überzeugt sich leicht davon, dass γ genau dann rektifizierbar ist,wenn γ 1 und γ 2 rektifizierbar sind und dass in diesem Fall L(γ) = L(γ 1 )+L(γ 2 )ist. Schließlich definieren wir die Weglängenfunktion{0 für t = as : [a,b] → R, t ↦→L(γ| [a,t] ) für t ∈ (a,b].Dann ist s(b) also gerade die Länge des Gesamtweges γ.Satz 11.4 Für jeden rektifizierbaren Weg ist seine Weglängenfunktion stetig.Einen Beweis finden Sie in Heuser, <strong>Analysis</strong> <strong>II</strong>, Satz 177.3. Unter stärkeren Voraussetzungenan γ wollen wir nun Weglängen berechnen.Satz 11.5 Der Weg γ : [a,b] → R n sei stetig differenzierbar. Dann ist γ rektifizierbar,die Weglängenfunktion s von γ ist stetig differenzierbar, und für allet ∈ [a,b] gilt s ′ (t) = ‖γ ′ (t)‖ 2 . Die Länge L(γ) von γ ist gleichL(γ) =∫ bas ′ (t)dt =∫ ba√γ′1 (t) 2 +...+γ ′ n(t) 2 dt, (11.1)wobei γ(t) = ( γ 1 (t),...,γ n (t) ) T.211


Beweis Wir benutzen im Beweis Integrale von vektorwertigen Funktionen, diewir komponentenweise erklären.Sei Z = {t 0 ,...,t m } eine Zerlegung von [a,b], d.h. a = t 0 < t 1 < ... < t m = b.Mit der Dreiecksungleichung für Integrale ist‖γ(t i+1 )−γ(t i )‖ 2 = ∥und Aufsummieren liefertL(Z,γ) =m−1∑i=0∫ ti+1t iγ ′ (t)dt∥ ≤2‖γ(t i+1 )−γ(t i )‖ 2 ≤∫ b∫ ti+1at i‖γ ′ (t)‖ 2 dt,‖γ ′ (t)‖ 2 dt.Alle Polygonzuglängen sind also durch eine von Z unabhängige Konstante nachoben beschränkt. Folglich ist γ rektifizierbar, undL(γ) = supL(Z,γ) ≤Z∫ ba‖γ ′ (t)‖ 2 dt. (11.2)Sei nun t ∈ [a,b) und h > 0 so, dass t + h ≤ b. Dann ist sicher die Länge derStrecke von γ(t) bis γ(t + h) nicht größer als die Länge des Weges von γ(t) bisγ(t+h):‖γ(t+h)−γ(t)‖ 2 ≤ s(t+h)−s(t).Wenden wir (11.2) speziell auf den Weg γ| [t,t+h] an, folgtγ(t+h)−γ(t)∥ h ∥ ≤ s(t+h)−s(t) ≤ 12h h∫ t+ht‖γ ′ (r)‖ 2 dr.Fürh ↘ 0strebtdielinkeSeitedieserAbschätzunggegen‖γ ′ (t)‖ 2 ,unddierechteSeite konvergiert nach dem Mittelwertsatz für Integrale gegen den gleichen Wert:1h∫ t+ht‖γ ′ (r)‖ 2 dr = ‖γ ′ (ξ h )‖ 2mit t ≤ ξ h ≤ t+h.Also existiert die rechtsseitige Ableitung von s in t und ist gleich ‖γ ′ (t)‖. Analogzeigt man die Differenzierbarkeit von links. Aus s ′ (t) = ‖γ ′ (t)‖ folgt nun sofortdie Behauptung (11.1).Beispiel 1 (Kreise und Ellipsen) Sei a > 0. Für den Weghaben wirL(γ) =∫ 2π0γ : [0,2π] → R 2 , t ↦→ (a cost, a sint)√γ′1 (t) 2 +γ ′ 2(t) 2 dt =∫ 2π0√∫ 2πa 2 sin 2 t+a 2 cos 2 tdt = adt = 2πa.0212


Die durch γ beschriebene Kurve ist eine Kreislinie vom Radius a. Analog führtdie Berechnung der Länge des Wegesγ : [0,2π] → R 2 , t ↦→ (a cost, b sint) mit a > b > 0(dessen zugehörige Kurve eine Ellipse ist) auf das IntegralL(γ) =∫ 2π0√a 2 sin 2 t+b 2 cos 2 tdt = a∫ 2π0√1−ε2 cos 2 tdt (11.3)mit ε := 1 a√a2 −b 2 (die sog. numerische Exzentrizität der Ellipse). Das Integralin (11.3) ist (für ε > 0) ein sog. elliptisches Integral und läßt sich nicht mit Hilfeelementarer Funktionen geschlossen darstellen.Beispiel 2 (Funktionsgraphen) Ist f : [a,b] → R eine stetig differenzierbareFunktion und γ: [a,b] → R 2 , t ↦→ (t,f(t)) der durch f induzierte Weg, so reduziertsich (11.1) aufL(γ) =∫ ba√1+f′ (t) 2 dt.Haben wir in Beispiel 1 mit L(γ) = 2πa tatsächlich den Kreisumfang (d.h. dieLänge einer Kurve) berechnet? Was wir berechnet haben, ist die Länge einesWeges. Um hieraus zu einem vernünftigen Begriff einer Kurvenlänge zu gelangen,müssen wir zunächst dafür sorgen, dass der Weg jeden Teil der Kurve nureinmal durchläuft, d.h. wir betrachten ausschließlich Jordanwege bzw. Jordankurven.Selbst für Jordankurven ist damit die Kurvenlänge noch nicht eindeutigfestgelegt. Es könnte ja sein, dass ein- und dieselbe Jordankurve durch verschiedeneJordanwege mit verschiedenen Weglängen parametrisiert werden kann. Derfolgende Satz klärt dieses Problem.Satz 11.6 Sei γ eine Jordankurve, die eine Darstellung durch einen rektifizierbarenJordanweg besitzt. Dann sind alle Jordandarstellungen rektifizierbar undhaben ein- und dieselbe Weglänge.Die gemeinsame Weglänge nennen wir die Länge einer Kurve Γ. Erst mit diesemSatzkönnenwirsagen,dasseinKreismitRadiusaeinenUmfang2πabesitzt(unddass auch Ellipsen einen Umfang besitzen, auch wenn wir ihn nicht elementarangeben können).Beweisidee Wir zeigen die Aussage nur für stetig differenzierbare Wege. Einenallgemeinen Beweis finden Sie in Heuser, <strong>Analysis</strong> <strong>II</strong>, Satz 178.3. Zunächst eineVorbemerkung. Ist γ : [a,b] → R n ein Weg mit zugehöriger Kurve Γ und istϕ : [α,β] → [a,b] eine stetige Bijektion, so ist γ ◦ ϕ: [α,β] → R n ebenfalls einWeg, der auf die Kurve Γ führt. Da ϕ stetig und bijektiv ist, tritt einer derfolgenden Fälle ein (Satz 6.41):213


(a) ϕ wächst streng monoton. Dann heißt ϕ orientierungserhaltend.(b) ϕ fällt streng monoton. Dann heißt ϕ orientierungsumkehrend.Sind insbesondere ϕ und ϕ (−1) stetig differenzierbar, so folgt aus ϕ (−1) (ϕ(t)) = tmit der Kettenregel ϕ (−1)′ (ϕ(t))·ϕ ′ (t) = 1, d.h. es ist ϕ ′ (t) ≠ 0 für alle t ∈ [α,β].Es ist klar, dass ϕ genau dann orientierungserhaltend (bzw. -umkehrend) ist,wenn ϕ ′ (t) > 0 (bzw. < 0) für alle t ∈ [α,β] ist.Sei nun γ : [a,b] → R n ein stetig differenzierbarer Weg und ϕ : [α,β] → [a,b] einestetig differenzierbare und orientierungserhaltende Bijektion. Dann istL(γ ◦ϕ) ==∫ βα∫ βα‖(γ ◦ϕ) ′ (t)‖ 2 dt =∫ β‖γ ′ (ϕ(t))‖ 2 ϕ ′ (t)dt =α∫ b‖γ ′ (ϕ(t))ϕ ′ (t)‖ 2 dtEin ähnlicher Beweis erfolgt für orientierungsumkehrendes ϕ.a‖γ ′ (x)‖ 2 dx = L(γ).Sei γ : [a,b] → R n stetig differenzierbar. Dann kann – wie wir gesehen haben –die Länge des Weges γ durch ∫ ba ‖γ′ (t)‖ 2 dt berechnet werden. Ist Γ die durch γdefinierteKurveundf : Γ → R m eineFunktion,fürdief◦γ Riemann-integrierbarist, so definiert man allgemeiner das Integral von f entlang γ durch∫γf :=∫ baf(γ(t))‖γ ′ (t)‖ 2 dt (11.4)(für m > 1 berechnen wir das Integral auf der rechten Seite komponentenweise).Insbesondere ist also ∫ 1 = L(γ), und ist γ : [a,b] → [a,b] die identischeγAbbildung, so ist∫ ∫ bf = f(t)dtγdas übliche Riemann-Integral. Man kann – ähnlich wie im Beweis von Satz 11.6– zeigen, dass ∫ f von der Parametrisierung von Γ unabhängig ist.γaIn die Definition des Kurvenintegrals (11.4) geht nur die Länge des Geschwindigkeitsvektorsγ ′ (t) ein, nicht seine Richtung. Dies ist für Anwendungen oft nichtausreichend (man denke etwa an einen Körper, der sich entlang eines Weges γin einem Kraftfeld bewegt und bei dem die verrichtete Arbeit berechnet werdensoll). In den nächsten Abschnitten werden wir uns einen angemessenen Begriffeines Kurvenintegrals erarbeiten.11.3 WegintegraleDas folgende Beispiel soll die einzuführenden Begriffe motivieren.214


Beispiel In einer offenen Menge U ⊆ R 3 sei das Vektorfeld F = (F 1 ,F 2 ,F 3 ):U → R 3 gegeben, das wir uns als zeitlich konstantes Kraftfeld denken. Ist γ :[a,b] → U ein stetig differenzierbarer Weg, so interpretieren wir das Integral∫ b〈F(γ(t)), ˙γ(t)〉dt =∫ baa3∑F i (γ(t))γ i(t)dt ′ (11.5)i=1als Arbeit, die man aufwenden muss, um sich vom Punkt γ(a) zum Punkt γ(b)entlang des Weges γ zu bewegen. Dies ist dadurch gerechtfertigt, dass man fürein kleines Wegstück näherungsweise annehmen kann, dass F konstant ist unddassγ(t) = γ(t i )+ t−t it i+1 −t i(γ(ti+1 )−γ(t i ) )gilt. Dann ist〈F(γ(t i )), ˙γ(t i )〉(t i+1 −t i ) = 〈F(γ(t i )), γ(t i+1 )−γ(t i )〉,und dieser Ausdruck ist proportional zur Weglänge, zur Größe des Kraftfeldesund zum Kosinus des Winkels α zwischen Weg- und Kraftvektor:〈F(γ(t i )), γ(t i+1 )−γ(t i )〉 = cosα‖F(γ(t i ))‖‖γ(t i+1 )−γ(t i )‖.Steht insbesondere das Kraftfeld senkrecht zur Wegrichtung, so wird keine Arbeitverrichtet.WirwerdenunsalsomitIntegralenderGestalt(11.5),d.h.mit ∫ b〈f(γ(t)), ˙γ(t)〉dtabefassen müssen, wobei f ein Vektorfeld ist. Dazu treffen wir folgende Definition.Definition 11.7 Seien γ : [a,b] → R n ein stetig differenzierbarer Weg mit zugehörigerKurve Γ und f = (f 1 ,...,f n ) : Γ → R n ein stetiges Vektorfeld. Danndefinieren wir das Wegintegral von f entlang γ durch∫γf · dx :=∫ bAnstelle von (11.6) findet man auch die Schreibweise∫f 1 dx 1 +...+f n dx n ,γan∑f i (γ(t))γ i(t)dt. ′ (11.6)i=1die man im Rahmen der Theorie der Pfaffschen Formen verstehen kann (vgl.Barner/Flohr, <strong>Analysis</strong> <strong>II</strong>, Abschnitt 17.1). Unter Verwendung von Riemann-Stieltjes-Integralen kann man ∫ f · dx für beliebige rektifizierbare Wege γ undγstetige Vektorfelder f auf Γ definieren und berechnen (vgl. Heuser, <strong>Analysis</strong> 2,Abschnitt 180).215


Der Weg γ : [a,b] → R n heißt stückweise stetig differenzierbar, wenn es eineZerlegung a = x 0 < x 1 < ... < x m = b des Intervalles [a,b] so gibt, dass die Wegeγ (i) := γ| [xi ,x i+1 ] : [x i ,x i+1 ] → R n , i = 0,...,m−1stetig differenzierbar sind. Für stückweise stetig differenzierbare Wege γ und stetigeVektorfelder f definieren wir das Wegintegral durch∫γf ·dx :=m−1∑i=0∫γ (i) f ·dx.Die folgenden Eigenschaften von Wegintegralen sind leicht zu sehen. Dabei ist γein stückweise stetig differenzierbarer Weg, und f und g sind stetige Vektorfelder.∫ ∫ ∫ ∫ ∫(a) (f +g)·dx = f ·dx+ g ·dx, (cf)·dx = c f ·dx.γγγ(b) Für jeden Weg γ : [a,b] → R n bezeichne γ − : [a,b] → R n den entgegengesetztenWeg, d.h. γ − (t) := γ(a+b−t). Offenbar beschreiben γ und γ − die gleicheKurve, die nur in unterschiedlicher Richtung durchlaufen wird. Es gilt∫ ∫f ·dx = − f ·dx.γ γ −(c) Ist γ : [a,b] → R n ein stückweise stetig differenzierbarer Weg und c ∈ (a,b),so sind auch γ 1 := γ| [a,c]und γ 2 := γ| [c,b]stückweise stetig differenzierbare(d)Wege, und es gilt∫γ∫∣∫ ∫f ·dx = f ·dx+ f ·dx.γ 1 γ 2γf ·dx∣ ≤ max ‖f(t)‖ 2 ·L(γ).t∈ΓWir untersuchen nun, inwieweit ∫ f·dx tatsächlich vom Weg γ oder nur von derγdurch γ definierten Kurve abhängt.Satz 11.8 Seien γ : [a,b] → R n ein stetig differenzierbarer Weg, f : Γ → R n einstetiges Vektorfeld, und ϕ : [α,β] → [a,b] eine stetig differenzierbare Bijektion mitϕ(α) = a und ϕ(β) = b. Dann ist γ ◦ϕ : [α,β] → R n ein stetig differenzierbarerWeg mit der gleichen Bildkurve wie γ und den gleichen Anfangs- und Endpunkten,und es gilt ∫ ∫f ·dx = f ·dx.γγ◦ϕγγ216


Beweis Mit Ketten- und Substitutionsregel finden wir∫ ∫ β 〈f ·dx = f ( (γ ◦ϕ)(t) ) 〉,(γ ◦ϕ) ′ (t) dtγ◦ϕ===α∫ βα∫ βα∫ ba〈f ( (γ ◦ϕ)(t) ) ,γ ′( ϕ(t) ) 〉ϕ ′ (t) dt〈f ( (γ ◦ϕ)(t) ) ,γ ′( ϕ(t) )〉 ϕ ′ (t)dt〈f ( γ(s) ) 〉 ∫,γ ′ (s) ds = f ·dx.γAnalog zeigt man, dass für jede stetig differenzierbare Bijektion ϕ : [α,β] → [a,b]mit ϕ(α) = b, ϕ(β) = a gilt:∫ ∫f ·dx = − f ·dx.γ◦ϕ γBei Umkehrung der Orientierung ändert das Kurvenintegral also sein Vorzeichen.Beispiel 1 Ein Punkt P bewege sich auf dem Wegγ : [0,2π] → R 3 , t ↦→ (a cost, a sint,h2π t)von γ(0) = (a,0,0) nach γ(2π) = (a,0,h). Dabei wirke eine Kraft F(x,y,z) =(F 1 ,F 2 ,F 3 ) = −α(x,y,z) mit α > 0. Für die zu leistende Arbeit finden wir∫ ∫ 2π(F ·dx = F1 (γ(t))γ 1(t)+F ′ 2 (γ(t))γ 2(t)+F ′ 3 (γ(t))γ 3(t) ) ′ dt=γ∫ 2π00((−αa cost)(−a sint)+(−αa sint)(a cost)+ ( −α h2π t)( h2π= −α h2(2π) 2 ∫ 2π0tdt = − αh2 (2π) 2(2π) 2 2= − αh22 .Bewegen wir P unter Einfluss der gleichen Kraft entlang vonγ : [0,h] → R 3 , t ↦→ (a,0,t)von (a,0,0) nach (a,0,h), so ergibt sich wegen∫ ∫ hF ·dx = F 3 (γ(t))γ 3(t)dt ′ =die gleiche geleistete Arbeit.γ0∫ h0(−αt)dt = − αh22) ) dtDiesesResultatistkeinZufall.VerantwortlichfürdiebeobachteteWegunabhängigkeitdes Integrals ist eine spezielle Eigenschaft der Funktion F.217


Definition 11.9 Sei U ⊆ R n offen. Eine Funktion f : U → R n heißt Gradientenfeld(oder vollständiges Differential), wenn es eine differenzierbare Funktionϕ : U → R gibt, so dassf(x) = (gradϕ)(x) ∀x ∈ U. (11.7)ϕ heißt dann auch Stammfunktion von f (und in der Physik heißt −ϕ ein Potentialvon f).Beispiel 2 Die Funktion f(x,y,z) = −α(x,y,z) aus Beispiel 1 ist ein Gradientenfeld,da z.B. für ϕ(x,y,z) = − α 2 (x2 + y 2 + z 2 ) die Beziehung (11.7) gilt.Physikalisch interessanter ist folgendes Beispiel. Denken wir uns eine Masse mim Nullpunkt eines Koordinatensystems konzentriert, so übt sie auf einen Punktmit der Masse 1, der sich in (x,y,z) ∈ R 3 befindet, eine Kraft f der Stärkem‖f‖ = G =‖(x,y,z)‖ 2 2Gmx 2 +y 2 +z 2aus (Newtonsches Gravitationsgesetz). Diese Kraft weist zum Nullpunkt, hat alsodie Richtung −(x,y,z)‖(x,y,z)‖ 2, und demzufolge istGm Gmf(x,y,z) = − (x,y,z) = − (x,y,z).‖(x,y,z)‖ 3 2 (x 2 +y 2 +z 2 )3/2Auch diese Funktion ist ein Gradientenfeld; für die Funktionϕ : R 3 \{0} → R mit ϕ(x,y,z) =gilt nämlich gradϕ = f.Gm√x2 +y 2 +z 2 für (x,y,z) ≠ 0Satz 11.10 Sei U ⊆ R n offen und F : U → R stetig differenzierbar (d.h. Fbesitzt auf U stetige partielle Ableitungen erster Ordnung nach allen Veränderlichen).Sind a,b zwei Punkte aus U, und ist γ irgendein stückweise stetig differenzierbarerWeg mit Anfangspunkt a und Endpunkt b, der ganz in U verläuft, soist ∫gradF ·dx = F(b)−F(a). (11.8)γDas Wegintegral über ein stetiges Gradientenfeld längs eines stückweise glattenWeges hängt also nur von Anfangs- und Endpunkt des Weges ab, nicht vomkonkreten Verlauf des Weges. Man kann Satz 11.10 als Verallgemeinerung desHauptsatzes der Differential- und Integralrechnung betrachten.Beweis Wir betrachten zunächst den speziellen Fall, wo a und b Anfangs- bzw.Endpunkt eines stetig differenzierbaren Weges γ : [α,β] → U sind, d.h. γ(α) = a,γ(β) = b. Dann ist∫ ∫ β〈(gradF)(x)·dx = (gradF)(γ(t)), γ ′ (t) 〉 dt.γα218


NachderKettenregelist〈(gradF)(γ(t)),γ ′ (t)〉geradedieAbleitungderFunktionφ(t) := F(γ(t)) = (F ◦γ)(t). Wir erhalten also∫γ(gradF)(x)·dx =∫ βαφ ′ (t)dt = φ(β)−φ(α)mit Hilfe des Hauptsatzes der Differential- und Integralrechnung. Schließlich istφ(β)−φ(α) = F(γ(β))−F(γ(α)) = F(b)−F(a).Der allgemeine Fall eines stückweise stetig differenzierbaren Weges ergibt sichdurch Zusammensetzen der einzelnen Integrale.Ist γ ein geschlossener Weg (d.h. ist γ(α) = γ(β)) so erhalten wir insbesondere∫gradF ·dx = 0.Beispiel 3 Auf U := R 2 \{0} betrachten wir das Vektorfeld(f(x,y) := − y )xx 2 +y 2, x 2 +y 2und den geschlossenen WegWegen γ ′ (t) = (−sint, cost) ist∫γf·dx =∫ 2π0γγ : [0,2π] → U , t ↦→ (cost, sint).( −sintsin 2 t+cos 2 t (−sint)+ cost)sin 2 t+cos 2 t (cost) dt =∫ 2π0dt = 2π.Die Funktion f ist also kein Gradientenfeld, da das Integral über die geschlosseneKurve γ nicht verschwindet. Dies ist ein wichtiger Unterschied zu Funktioneneiner Veränderlichen. Im R 1 besitzt jede auf einem Intervall stetige Funktion eineStammfunktion.11.4 Ergänzungen zum Begriff ”Zusammenhang“Für das Weitere müssen wir unsere Kenntnisse über zusammenhängende Mengenvertiefen. Dem in Abschnitt 6.8 entwickelten Zusammenhangsbegriff stellen wireinen zweiten gegenüber.Definition 11.11 Ein metrischer Raum (X,d) heißt wegzusammenhängend,wenn es für je 2 Punkte x,y ∈ X einen Weg γ : [a,b] → X mit γ(a) = x undγ(b) = y gibt.219


Eine Teilmenge U ⊆ R n heißt konvex, wenn sie mit je zwei Punkten x,y auchderen Verbindungsstrecke [x,y] := {λx + (1 − λ)y : λ ∈ [0,1]} enthält, undU heißt sternförmig, wenn es einen Punkt z ∈ U so gibt, dass [z,x] ⊆ U fürjedes x ∈ U. Der Punkt z heißt dann ein Zentrum von U. Offenbar sind konvexeMengen sternförmig, und jeder ihrer Punkte ist ein Zentrum. Sternförmige undinsbesondere konvexe Mengen sind wegzusammenhängend.Satz 11.12 Wegzusammenhängende metrische Räume sind zusammenhängend.BeweisSei(X,d)einwegzusammenhängendermetrischerRaum,undseienU 1 ,U 2nichtleere offene Teilmengen von X mit U 1 ∩ U 2 = ∅ und U 1 ∪ U 2 = X. Danngibt es Punkte u 1 ∈ U 1 und u 2 ∈ U 2 und einen Weg γ : [a,b] → X mit γ(a) = u 1und γ(b) = u 2 . Sei Γ die durch γ definierte Kurve. Nach Satz 6.47 ist Γ zusammenhängend.Andererseits giltein Widerspruch.U 1 ∩Γ ≠ ∅, U 2 ∩Γ ≠ ∅, U 1 ∩U 2 = ∅ und Γ ⊆ U 1 ∪U 2 ,Die Umkehrung von Satz 11.12 gilt im Allgemeinen nicht. Die MengeX := {(0,y) : y ∈ [−1,1]}∪{(x,y) : x ∈ (0,1], y = sin 1 x } ⊆ R2ist zwar zusammenhängend, jedoch nicht wegzusammenhängend (HA). Die Umkehrungvon Satz 11.12 gilt aber für offene Mengen. Eine zusammenhängendeoffene Menge heißt ein Gebiet.Satz 11.13 Gebiete im R n sind wegzusammenhängend. Genauer: ist U ⊆ R nein Gebiet und sind x,y ∈ U, dann gibt es einen Polygonzug γ : [0,1] → U mitγ(0) = x und γ(1) = y.z˜γyxBeweis Sei x ∈ U beliebig, und sei U x die Menge aller Punkte y ∈ U, für die eseinen Polygonzug γ : [0,1] → U mit γ(0) = x und γ(1) = y gibt. Wir zeigen, dassU x offen ist. Sei y ∈ U x . Da U offen ist, gibt es eine Umgebung U ε (y), die ganzin U liegt. Sei z ∈ U ε (y), und sei ˜γ : [0,1] → U ein Polygonzug mit ˜γ(0) = x,˜γ(1) = y. Wir verlängern“ ˜γ wie folgt:”{˜γ(2t) für t ∈ [0,1/2]γ : [0,1] → U, t ↦→y +(2t−1)(z −y) für t ∈ [1/2,1].220


Dann ist γ ein Polygonzug in U, der x mit z verbindet. Da z ∈ U ε (y) beliebigwar, folgt U ε (y) ⊆ U x , d.h. U x ist offen.Wir zeigen nun, dass auch U\U x offen ist. Ist y ∈ U\U x , so gibt es wie oben eineUmgebung U ε (y), die in U liegt. Läge ein Punkt z ∈ U ε (y) in U x , so könntenwir wie oben den Polygonzug von x nach z zu einem Polygonzug von x nach yverlängern, d.h. es wäre y ∈ U x . Dieser Widerspruch zeigt, dass U ε (y) ⊆ U\U x ,d.h. U\U x ist offen. Für die offenen Mengen U x und U\U x gilt nunU x ∩(U\U x ) = ∅ und U x ∪(U\U x ) = U .DaU zusammenhängendist,musseinederMengenU x undU\U x leersein.Wegenx ∈ U x ist U\U x = ∅, d.h. U x = U.11.5 Stammfunktionen und Wegunabhängigkeit von KurvenintegralenLemma 11.14 Sei U ⊆ R n offen, f : U → R n ein stetiges Vektorfeld, und c ∈ R.(a) Ist F Stammfunktion von f, so ist auch F +c Stammfunktion von f.(b) Ist U ein Gebiet, und sind F 1 und F 2 Stammfunktionen von f, so ist F 1 −F 2eine konstante Funktion.Beweis Aussage (a) ist klar, da F und F +c den gleichen Gradienten besitzen.Zu (b) : da F 1 und F 2 Stammfunktionen von f sind, gilt grad(F 1 −F 2 ) = 0. Wirzeigen: Ist F : U → R stetig differenzierbar auf dem Gebiet U und ist gradF = 0,so ist F eine Konstante. Seien x,y ∈ U. Nach Satz 11.13 gibt es einen stückweisestetig differenzierbaren Weg γ : [0,1] → U mit γ(0) = x und γ(1) = y. Aus Satz11.10 wissen wir, dass∫ ∫F(y)−F(x) = gradF ·dx = 0·dx = 0.Also ist F konstant.γAm Ende von Abschnitt 11.3 haben wir gesehen, dass nicht jedes stetige Vektorfeldeine Stammfunktion besitzt.Der folgende Satz stellt einen Zusammenhang her zwischen der Existenz einerStammfunktion und der Wegunabhängigkeit von Kurvenintegralen.Satz 11.15 Sei U ⊆ R n ein Gebiet und f ein stetiges Vektorfeld auf U. Dannbesitzt f genau dann eine Stammfunktion auf U, wenn für jeden geschlossenenstückweise stetig differenzierbaren Weg γ in U das Integral ∫ f·dx verschwindet.γγ221


Beweis Die Implikation =⇒ haben wir uns bereits im Anschluss an Satz 11.10überlegt. Nehmen wir nun also an, dass ∫ f·dx = 0 für jeden geschlossenen Wegγγ in U.Wir fixieren einen Punkt x 0 ∈ U. Für jeden Punkt y ∈ U gibt es nach Satz 11.13einen stückweise stetig differenzierbaren Weg γ : [0,1] → U mit γ(0) = x 0 undγ(1) = y. Wir möchten definieren∫F(y) := f ·dx. (11.9)Um auf diese Weise eine Funktion F festlegen zu können, müssen wir uns vergewissern,dass ∫ f ·dx nicht von der Wahl des Weges von x γ 0 nach y abhängt.Sei also η : [0,1] → U ein weiterer stückweise stetig differenzierbarer Weg mitη(0) = x 0 und η(1) = y. Wir betrachten den Weg{γ(t) für t ∈ [0,1]α : [0,2] → U, t ↦→η(2−t) für t ∈ [1,2].Offenbar ist α wieder stückweise stetig differenzierbar, und es gilt α(0) = α(2) =x 0 , d.h. der Weg α ist geschlossen. Nach Voraussetzung ist daher∫ ∫ ∫ ∫ ∫0 = f ·dx = f ·dx+ f ·dx = f ·dx− f ·dx,α α| [0,1] α| [1,2]da im zweiten Teilstück von α der Weg η rückwärts durchlaufen wird. Also isttatsächlich ∫ f·dx nur vom Anfangs- und Endpunkt von γ abhängig. Wir schreibendaher auch ∫ yγx 0f ·dx statt ∫ f ·dx. γWir zeigen nun, dass F Stammfunktion von f ist. Ist f = (f 1 ,...,f n ), so habenwir zu zeigen, dass F stetig differenzierbar in jedem Punkt y ∈ U ist und dass∂F∂x i(y) = f i (y) für alle i ist.Seiy ∈ U.Istε > 0hinreichendklein,soliegtmity auchdiekompletteUmgebungU ε (y) in U. Für alle z ∈ U ε (y) ist dannF(z) =∫ zx 0f ·dx =Wir betrachten den Weg∫ yx 0f ·dx+γ∫ zyγf ·dx = F(y)+γ z : [0,1] → U ε (y), t ↦→ y +t(z −y),der y mit z verbindet. Mit z −y := h erhalten wir∫ y+h ∫F(y +h)−F(y) = f ·dx = f ·dxy γ z∫ 1 n∑n∑∫ 1= f i (y +th)h i dt = f i (y +th)dt·h i .0i=1222i=10∫ zyηf ·dx.


Wählen wir speziell h so, dass alle Komponenten bis auf die i–te verschwinden,so folgtF(y +h i e i )−F(y) =∫ 10f i (y +th i e i )dt·h i ,woraus wir mit dem ersten Teil von Satz 10.28 erhalten∂F(y) = lim∂x i=hi →0∫ 10F(y +h i e i )−F(y)h ilim f i(y +th i e i )dt =h i →0= limhi →0∫ 10∫ 10f i (y +th i e i )dtf i (y)dt = f i (y).Die Bedingung, dass die Integrale über alle geschlossenen Wege verschwinden, istin der Regel schwierig zu überprüfen. Unser nächstes Ziel ist ein Kriterium, beidem nicht Integrations- sondern Differentiationseigenschaften eine Rolle spielenund das meist leichter zu überprüfen ist.Definition 11.16 Sei U ⊆ R n offen und f = (f 1 ,...,f n ) ein stetig differenzierbaresVektorfeld. Dann heißt f geschlossen, wenn∂f i∂x j= ∂f j∂x ifür alle i,j ∈ {1,...,n}.Besitzt das stetig differenzierbare Vektorfeld f eine Stammfunktion F, so ist fgeschlossen. Aus f i = ∂F∂x ifolgt nämlich mit dem Satz von Schwarz (Satz 10.7)∂f i= ∂2 F= ∂2 F= ∂f j.∂x j ∂x j ∂x i ∂x i dx j ∂x iDie Geschlossenheit von f ist also notwendig für die Existenz einer Stammfunktion,sie ist jedoch im Allgemeinen nicht hinreichend, wie das Beispiel(f(x,y) = − y )x 2 +y , xauf U = R 2 \{0} (11.10)2 x 2 +y 2zeigt. Für f 1 (x,y) := − yx 2 +y 2 und f 2 (x,y) := xx 2 +y 2 ist nämlich∂f 1∂y = y2 −x 2(x 2 +y 2 ) 2 = ∂f 2∂x .Das Vektorfeld f ist also geschlossen, besitzt aber – wie wir bereits wissen – keineStammfunktion.Ob die Geschlossenheit eines Vektorfeldes hinreichend für die Existenz einerStammfunktion ist, hängt von den Eigenschaften des Gebietes U ab. Wir sehenuns eine einfache Version eines solchen Resultates an.223


Satz 11.17 Ist das Gebiet U ⊆ R n sternförmig, so besitzt jedes geschlosseneVektorfeld f auf U eine Stammfunktion.Beweis Wir können o.E.d.A. annehmen, dass 0 zu U gehört und ein Zentrumvon U ist (andernfalls verschieben wir U geeignet). Für x ∈ U seiundγ x : [0,1] → U , t ↦→ tx∫F(x) := f ·dx =γ x∫ 10n∑f i (tx)x i dt.(Man beachte, dass wegen der Sternförmigkeit von U der Weg γ x komplett in Uverläuft).MitdemzweitenTeilvonSatz10.28erhaltenwir,dassF differenzierbarist und dass∂F∂x j(x) ===n∑∫ 1i=1 0∫ 1n∑i=1∫ 100n∑i=1i=1∂∂x j(f i (tx)x i )dt∂f i (tx)∂x j∂f j (tx)∂x itx i dt+tx i dt+Für L(t) := f j (tx) finden wir mit der Kettenregeln∑i=1∫ 10∫ 10f i (tx) ∂x i∂x jdtf j (tx)dt.L ′ (t) =n∑i=1∂f j (tx)∂x ix i ,und wir erhalten∂F∂x j(x) =∫ 10L ′ (t)tdt+∫ 10L(t)dt == tL(t) ∣ ∣ 1 0 = L(1) = f j(x).∫ 10(tL(t)) ′ dtWir kommen noch einmal auf das Beispiel (11.10) zurück. Natürlich ist R 2 \{0}nicht sternförmig. Nehmen wir allerdings aus R 2 die negative Halbachse (−∞,0]heraus, so ist R\(−∞,0] sternförmig, und f besitzt auf diesem kleineren Gebietnach Satz 11.17 eine Stammfunktion.Das folgende Vorgehen zum Auffinden einer Stammfunktion eines geschlossenenVektorfeldes f = (f 1 ,f 2 ) auf einem Gebiet U ⊆ R 2 ist praktikabel. Wir machenden Ansatz∂F∂x = f 1,224∂F∂y = f 2


mit einer Funktion F : U → R (von der wir ohne weitere Voraussetzungen nichtwissen, ob sie existiert). Aus ∂F = f ∂x 1 folgt∫F(x,y) = f 1 (x,y)dx+g(y)mit einer von y abhängenden Integrationskonstanten g. Wir leiten dies formalnach y ab und erhalten mit ∂F = f ∂y 2:∂F∂y = ∂ ∂y∫f 1 (x,y)dx+g ′ (y) = f 2 (x,y),alsog ′ (y) = f 2 (x,y)− ∂ ∂y∫f 1 (x,y)dx.Durch Integration bezüglich y gewinnt man g und damit F.Beispiel Für x ≠ 0 und y ≠ π 2+kπ, k ∈ Z, seif 1 (x,y) = − tanyx 2 +2xy +x 2 , f 2 (x,y) =Dann ist f = (f 1 ,f 2 ) geschlossen (d.h. ∂f 1∂F= f ∂y 2 liefertF(x,y) == ∂f 2∂y ∂x1xcos 2 y +x2 +y 2 .), und der Ansatz∂F∂x = f 1,∫ (− tanyx 2 +2xy +x 2) dx = tanyx +x2 y + x33 +g(y).Wir differenzieren nach y und setzen die Ableitung gleich f 2 :1xcos 2 y +x2 +g ′ (y) ! = f 2 (x,y) =1xcos 2 y +x2 +y 2 .Dann folgt g(y) = y33+C und F(x,y) =tanyx+x 2 y + x33 + y33 +C.225


12 Gleichungen und MannigfaltigkeitenWir wenden uns nun einer der typischen Aufgaben der Mathematik zu, demLösen von Gleichungen. Sind X,Y geeignete Mengen und ist F : X → Y eineentsprechende Abbildung, so sind in Verbindung mit der Gleichung F(x) = yfolgende Fragen von Interesse:– Für welche y ∈ Y hat die Gleichung F(x) = y eine Lösung x ∈ X?– Wenn die Gleichung F(x) = y für ein y ∈ Y lösbar ist, wieviele Lösungenhat sie dann?– Falls die Gleichung F(x) = y für alle y ∈ Y eindeutig lösbar ist, wie hängendann die Lösungen x von den rechten Seiten y ab? Ist diese Abhängigkeitstetig oder gar differenzierbar?– FallsdieGleichungF(x) = y mehrereLösungenbesitzt,wiekannmandanndie Menge aller Lösungen geeignet darstellen?– Wie findet man Lösungen?Die erste Frage ist eng mit der Surjektivität von F verknüpft, und die zweitemit der Injektivität. Ist F surjektiv und injektiv (also bijektiv), so besitzt F eineUmkehrabbildung F −1 , und der dritte Punkt fragt nach der Stetigkeit bzw.Differenzierbarkeit von F −1 . Schließlich wird uns die vierte Frage auf den Begriffeiner Mannigfaltigkeit führen.Wir wollen insbesondere sehen, inwieweit die uns zugänglichen Mittel der <strong>Analysis</strong>bei der Beantwortung dieser Fragen helfen. Wir betrachten deshalb meistdifferenzierbare Funktionen F : U → V, wobei U ⊆ R n und V ⊆ R m offeneMengen sind. Beginnen werden wir aber mit einem Resultat, das nicht auf diesenRahmen beschränkt ist.12.1 Der Banachsche FixpunktsatzSei (X,d) ein metrischer Raum. Eine Abbildung f : X → X heißt Kontraktion,wenn es eine Zahl L < 1 (die Kontraktionskonstante) so gibt, dassd(f(x),f(y)) ≤ Ld(x,y) für alle x,y ∈ X.Kontraktionen sind Lipschitz-stetig und insbesondere stetig. Ein Punkt x ∈ Xheißt Fixpunkt von f : X → X, wenn f(x) = x. Für die identische Abbildungvon X ist jeder Punkt ein Fixpunkt.Satz 12.1 (Banachscher Fixpunktsatz) Sei (X,d) ein nichtleerer vollständigermetrischer Raum und f : X → X eine Kontraktion mit einer KontraktionskonstantenL. Dann gilt226


(a) die Abbildung f besitzt genau einen Fixpunkt x ∗ .(b) für jeden Startvektor x 0 ∈ X konvergiert die durch x n := f(x n−1 ), n ≥ 1,definierte Folge (x n ) gegen x ∗ .(c) d(x n ,x ∗ ) ≤ 11−L d(x n,x n+1 ) ≤ Ln1−L d(x 0,x 1 ).Beweis Sei x 0 ∈ X und x n := f(x n−1 ) für n ≥ 1. Wir zeigen, dass (x n ) eineCauchyfolge ist. Für m ≥ 1 haben wird(x n ,x n+m ) ≤ d(x n ,x n+1 )+d(x n+1 ,x n+2 )+...+d(x n+m−1 ,x n+m )≤ (1+L+...+L m−1 )d(x n ,x n+1 )= 1−Lm1−L d(x n,x n+1 ) ≤ 11−L d(x n,x n+1 )L n≤1−L d(x 0,x 1 ).Wegen 0 ≤ L < 1 wird die rechte Seite kleiner als jedes vorgegebene ε > 0, wennnur n hinreichend groß ist. Also ist (x n ) eine Cauchyfolge. Da X vollständig ist,konvergiert (x n ) gegen ein x ∗ ∈ X. Aus der Stetigkeit von f folgt schließlichf(x ∗ ) = limn→∞f(x n ) = limn→∞x n+1 = x ∗ ;x ∗ ist also Fixpunkt von f. Die Abbildung f kann keine weiteren Fixpunktebesitzen. Aus x ∗ = f(x ∗ ) und y ∗ = f(y ∗ ) folgt nämlichd(x ∗ ,y ∗ ) = d(f(x ∗ ),f(y ∗ )) ≤ Ld(x ∗ ,y ∗ ),also d(x ∗ ,y ∗ ) = 0. Die in (c) angegebenen Abschätzungen folgen sofort ausd(x n ,x n+m ) ≤ 11−L d(x n,x n+1 ) ≤ Ln1−L d(x 0,x 1 ),wenn man m → ∞ streben läßt.Der Banachsche Fixpunktsatz ist ein wichtiges Werkzeug der <strong>Analysis</strong>, das Ihnenauch in anderen Situationen wiederbegegnen wird (z.B. in der Vorlesung überDifferentialgleichungen im 3. Semester). In der numerischen Mathematik ist derBanachsche Fixpunktsatz ein Instrument, um die Konvergenz von Näherungsverfahrenzu beweisen und Lösungen von Fixpunktgleichungen näherungsweise zuberechnen.Beispiel 1 Sei X das Stadtgebiet von Darmstadt (das wir als abgeschlosseneTeilmenge des R 2 auffassen und das deshalb vollständig ist). Irgendwo in DarmstadtbreitenwireinenStadtplanvonDarmstadtausunderkläreneineAbbildungf : X → X wie folgt. Jedem Punkt x ∈ X wird derjenige Punkt f(x) ∈ X zugeordnet,über dem das Bild von x auf dem Stadtplan liegt. Ist 1 : n der Maßstab227


des Stadtplans, so ist f eine kontrahierende Abbildung mit der KontraktionskonstantenL = 1/n. Nach dem Banachschen Fixpunktsatz gibt es genau einenPunkt x in Darmstadt mit f(x) = x, d.h. x liegt genau unter demjenigen Punktdes Stadtplanes, der x abbildet.Beispiel 2 Sei A ∈ L(R n ) eine lineare Abbildung mit ‖A‖ < 1. Wir wollen dielineare Gleichung(I −A)x = y, y ∈ R n , (12.1)lösen. Dazu betrachten wir die Abbildung f : R n → R n , z ↦→ Az+y, mit der wir(12.1) als Fixpunktgleichung f(x) = x schreiben können. Wegen‖f(z 1 )−f(z 2 )‖ = ‖(Az 1 +y)−(Az 2 +y)‖ = ‖A(z 1 −z 2 )‖ ≤ ‖A‖‖z 1 −z 2 ‖ist f eine Kontraktion mit der Kontraktionskonstanten ‖A‖ < 1. Nach Satz 12.1hat f genau einen Fixpunkt, d.h. die Gleichung (12.1) hat genau eine Lösungin R n . Diese können wir näherungsweise berechnen. Wir wählen z.B. x 0 = y alsStartvektor. Dann istx 1 = f(x 0 ) = Ay +y, x 2 = f(x 1 ) = Ax 1 +y = A(Ay +y)+y = A 2 y +Ay +yund allgemein, mit A 0 =: I,x n =n∑A k y für n ≥ 1.k=0Folglich ist(I −A) −1 y = x = limn→∞x n =∞∑A k y.Man kann auch leicht direkt beweisen, dass die Reihe ∑ ∞k=0 Ak in L(R n ) konvergiert(die geometrische Reihe ∑ ∞k=0 ‖A‖k ist eine konvergente Majorante) unddass∞∑A k = (I −A) −1 für ‖A‖ < 1.k=0k=0Die Reihe ∑ ∞k=0 Ak heißt die Neumann-Reihe von A.12.2 Der Satz über die UmkehrfunktionWirsehenunsnunan,wiemandenSatzüberdieUmkehrfunktionaufFunktionenmehrerer Veränderlicher verallgemeinert.Definition 12.2 Seien U ⊆ R n und V ⊆ R m offen. Eine Bijektion f : U → Vheißt Diffeomorphismus, wenn sowohl f als auch die Umkehrabbildung f −1 : V →U stetig differenzierbar sind.228


Lemma 12.3 Seien U ⊆ R n und V ⊆ R m offen und f : U → V eine stetigdifferenzierbare Funktion mit differenzierbarer Umkehrfunktion. Dann gilt:(a) für jedes x ∈ U ist f ′ (x) ∈ L(R n ,R m ) invertierbar, und(f ′ (x) ) −1= (f −1 ) ′( f(x) ) . (12.2)(b) m = n.(c) f : U → V ist ein Diffeomorphismus.Beweis Sei x ∈ U und y = f(x). Mit der Kettenregel folgt aus f −1 ◦ f = id Uund f ◦f −1 = id V , dassid R n= (f −1 ◦f) ′ (x) = (f −1 ) ′( f(x) )·f ′ (x),id R m = (f ◦f −1 ) ′ (y) = f ′( f −1 (y) )·(f −1 ) ′ (y) = f ′ (x)·(f −1 ) ′( f(x) ) .Also ist f ′ (x) invertierbar, und es gilt (12.2). Aus der Invertierbarkeit von f ′ (x) ∈L(R n ,R m ) folgt weiter m = n (lineare Algebra). Schließlich ist(f −1 ) ′ : V → L(R n ), y ↦→ ( f ′ (f −1 (y)) ) −1. (12.3)Um (c) zu zeigen, müssen wir die Stetigkeit dieser Funktion zeigen. Nach Voraussetzungsind f −1 und f ′ stetig. Damit ist auch ihre Verkettung f ′ ◦f −1 stetig,und wir müssen noch die Stetigkeit der AbbildungGL(R n ) → GL(R n ), A ↦→ A −1 (12.4)zeigen, wobei GL(R n ) für die Gruppe der invertierbaren Abbildungen aus L(R n )steht. Dies folgt leicht aus der expliziten Formel zur Berechnung der inversenMatrix von A, wonach A −1 = 1detA à mità = (ã ij ) n i,j=1 und ã ij = (−1) i+j detA ji .Hier ist A ji diejenige Untermatrix von A, die durch Streichen der j-ten Zeile undi-ten Spalte von A entsteht. Es ist klar, dass jeder Eintrag von à (und damità selbst) sowie detA stetig von (den Einträgen von) A abhängen. Also ist dieAbbildung (12.4) stetig. Damit ist die Stetigkeit von (f −1 ) ′ in (12.3) gezeigt. DieUmkehrfunktion f −1 ist also stetig differenzierbar, d.h. f ist ein Diffeomorphismus.Anmerkung Sei C k (U,R m ) die Menge der k-mal stetig differenzierbaren Funktionenf : U → R m . Verlangt man in Lemma 12.3 zusätzlich f ∈ C k (U,R m ), sokann man f −1 ∈ C k (V,R n ) zeigen. Dies geschieht wieder mit Hilfe der Darstellung(12.3). Man kann sich überlegen, dass die Abbildung (12.4) sogar beliebigoft differenzierbar ist.229


Beispiel Dieses Beispiel soll noch einmal auf die Unterschiede zwischen Funktioneneiner bzw. mehrerer Veränderlicher aufmerksam machen. Sei f : U → V einestetig differenzierbare und surjektive Funktion, deren Ableitung f ′ (x) in jedemPunkt x ∈ U invertierbar ist. Sind U,V offene Intervalle in R, so folgt hieraus,dass f bijektiv ist. Die Invertierbarkeit von f ′ (x) bedeutet im Eindimensionalennämlich gerade, dass f ′ (x) ≠ 0 ist. Ist dies für alle x ∈ U der Fall, so ist f strengmonoton, also injektiv. Im Mehrdimensionalen trifft dies jedoch nicht mehr zu,wie folgendes Beispiel zeigt. SeiDie Jacobimatrixf : (0,∞)×R → R 2 \{(0,0)}, (r,ϕ) ↦→ (rcosϕ, rsinϕ).f ′ (r,ϕ) =(cosϕ −rsinϕsinϕrcosϕhat die Determinante r ≠ 0 und ist folglich immer invertierbar. Die Funktion fist offenbar auch surjektiv, wegen f(r,ϕ) = f(r,ϕ+2π) jedoch nicht injektiv.Die Funktion f aus diesem Beispiel besitzt jedoch eine lokale Umkehrfunktion“.”Ist etwa U := (0,∞)×(−π,π), so ist f| U : U → R 2 injektiv, und V := f(U) =R 2 \(−∞,0] ist offen in R 2 . Man kann also eine Umkehrfunktion f −1 : V →U definieren. Wir wollen uns nun die Differenzierbarkeitseigenschaften solcherlokaler Umkehrfunktionen“ ansehen.”Definition 12.4 Sei U ⊆ R n offen. Ein stetig differenzierbare Abbildung f :U → R n heißt lokal um x ∈ U invertierbar, wenn es offene Umgebungen U 1 ⊆ Uvon x und V 1 von f(x) so gibt, daß f| U1 : U 1 → V 1 ein Diffeomorphismus ist.Die Abbildung (f| U1 ) −1 : V 1 → U 1 heißt dann eine lokale Umkehrfunktion von f.Schließlich heißt f ein lokaler Diffeomorphismus, wenn f um jeden Punkt x ∈ Ulokal invertierbar ist.Satz 12.5 (Satz über Umkehrfunktion) Sei U ⊆ R n offen, x 0 ∈ U, und seif : U → R n stetig differenzierbar. Die Funktion f ist genau dann um x 0 lokalinvertierbar, wenn f ′ (x 0 ) invertierbar ist.Verlangt man f ∈ C k (U,R n ), so folgt aus der Anmerkung nach Lemma 12.3, dassdie lokale Umkehrfunktion ebenfalls zu C k gehört.Beweis Ist f um x 0 lokal invertierbar, so folgt die Invertierbarkeit von f ′ (x 0 ) ausLemma 12.3. Sei umgekehrt f ′ (x 0 ) invertierbar. Wir zeigen, dass dann f um x 0lokal invertierbar ist. Ohne Einschränkung der Allgemeinheit können wir dabeiannehmen, dassx 0 = 0, f(0) = 0 und f ′ (0) = I (12.5)ist. Andernfalls ersetzen wir U durch Ũ = U −x 0 und f durch˜f(x) := ( f ′ (x 0 ) ) −1·(f(x0 +x)−f(x 0 ) ) .)230


Hat man dann eine lokale Umkehrfunktion von ˜f um 0 ∈ Ũ gefunden, so istf −1 (y) = ˜f −1( f ′ (x 0 ) −1 (y −f(x 0 )) ) +x 0 (12.6)die lokale Umkehrfunktion von f um x 0 . Aus der Definition von ˜f folgt nämlichx+x 0 = ˜f −1( (f ′ (x 0 )) −1 (f(x 0 +x)−f(x 0 )) ) +x 0 ,und die Substitution f(x 0 +x) = y liefert (12.6).Wir zeigen, dass man unter den Voraussetzungen (12.5) die Gleichung f(x) = yfür kleine y nach x auflösen kann. Um den Banachschen Fixpunktsatz benutzenzu können, schreiben wir f(x) = y als Fixpunktgleichung. Dazu definieren wirEs ist klar, dassg y : U → R n , x ↦→ y + ( x−f(x) ) .f(x) = y genau dann, wenn g y (x) = x.Wir suchen einen geeigneten vollständigen metrischen Raum X, auf dem g y kontraktivwirkt. Sei zunächst y = 0 und g := g 0 . Mit f ist auch g stetig differenzierbar.Da g ′ (0) = I −I = 0 ist, gibt es ein r > 0 so, dassU 2r (0) ⊆ U und ‖g ′ (x)‖ ≤ 1/2 für alle x mit ‖x‖ ≤ r.Sei X := {x ∈ R n : ‖x‖ ≤ r}. Da X im vollständigen metrischen Raum R nabgeschlossen ist, ist X selbst vollständig. Nach Satz 10.19 gilt weiter‖g(x)−g(x ′ )‖ ≤ 1 2 ‖x−x′ ‖ für alle x,x ′ ∈ X. (12.7)Mit x ′ = 0 folgt hieraus insbesondere ‖g(x)‖ = 1 ‖x‖ ≤ r/2 für x ∈ X.2Sei nun ‖y‖ ≤ r/2. Dann ist g y wegen ‖g y (x)‖ ≤ ‖g(x)‖ + ‖y‖ ≤ r für allex ∈ X eine Abbildung von X in X, die wegen g y (x) − g y (x ′ ) = g(x) − g(x ′ )und (12.7) eine Kontraktion mit der Kontraktionskonstanten 1/2 ist. Nach demBanachschen Fixpunktsatz gibt es also für jedes y mit ‖y‖ ≤ r/2 genau ein x mit‖x‖ ≤ r so, dass g y (x) = x bzw. f(x) = y.Sei U 1 := {x ∈ R n : ‖x‖ < r, ‖f(x)‖ < r/2} und V 1 := f(U 1 ). Wie wir geradegesehen haben, ist f| U1 : U 1 → V 1 bijektiv. Es existiert also die Umkehrabbildungϕ := (f| U1 ) −1 : V 1 → U 1 . Wir zeigen, dass U 1 und V 1 offen sind und ϕ stetigist. Für U 1 ist dies klar (Urbilder offener Mengen bzgl. stetiger Abbildungen sindoffen). Für V 1 zeigen wir V 1 = {y ∈ R n : ‖y‖ < r/2}, woraus die Offenheit vonV 1 folgt. Die Inklusion ⊆ ist klar. Für die umgekehrte Inklusion sei ‖y‖ < r/2.231


Dann existiert genau ein x mit ‖x‖ ≤ r und f(x) = y. Zu zeigen ist, dass sogar‖x‖ < r. Für beliebige Punkte x 1 ,x 2 ∈ U r (0) ist‖x 1 −x 2 ‖ = ‖g(x 1 )+f(x 1 )−g(x 2 )−f(x 2 )‖≤ ‖g(x 1 )−g(x 2 )‖+‖f(x 1 )−f(x 2 )‖≤ 1 2 ‖x 1 −x 2 ‖+‖f(x 1 )−f(x 2 )‖,also‖x 1 −x 2 ‖ ≤ 2‖f(x 1 )−f(x 2 )‖. (12.8)Wir setzen hierin x 2 = 0 und x 1 = x mit f(x) = y und ‖y‖ < r/2. Dann folgt‖x‖ ≤ 2‖y‖ < r, also x ∈ U 1 und y ∈ V 1 . Schreiben wir noch in (12.8) x 1 = ϕ(y 1 )und x 2 = ϕ(y 2 ), so erhalten wiralso die Stetigkeit von ϕ.‖ϕ(y 1 )−ϕ(y 2 )‖ ≤ 2‖y 1 −y 2 ‖ ∀y 1 ,y 2 ∈ V 1 , (12.9)Weiter ist f ′ (x) für alle x ∈ U 1 invertierbar. Für x ∈ U 1 ist nämlich‖f ′ (x)−I‖ = ‖g ′ (x)‖ ≤ 1/2,unddieInvertierbarkeitvonf ′ (x)folgtwieamEndevonAbschnitt12.1(Neumann-Reihe).Es verbleibt zu zeigen, dass ϕ stetig differenzierbar ist. Wir zeigen zunächst dieDifferenzierbarkeit von ϕ. Sei y ∈ V 1 und l so, dass y + l ∈ V 1 . Wir setzenx = ϕ(y) und x+h = ϕ(y +l), wobei h = ϕ(y +l)−ϕ(y) von l abhängt. Da fin x differenzierbar ist, haben wirHieraus folgtf(x+h)−f(x) = f ′ (x)h+r(h) mit limh→0r(h)‖h‖ = 0.ϕ(y +l)−ϕ(y) = (x+h)−x = h= ( f ′ (x) ) −1(f(x+h)−f(x)−r(h))= ( f ′ (ϕ(y)) ) −1l−(f ′ (x) ) −1r(h),und die Differenzierbarkeit von ϕ in y folgt, wenn wir gezeigt haben, dasslim l→0r(h(l))‖l‖= 0. Nun istr(h(l))‖l‖= r(h(l))‖h(l)‖‖h(l)‖‖l‖(12.10)232


(wegen der Bijektivität von ϕ ist h ≠ 0 für l ≠ 0). Wegen h = ϕ(y +l)−ϕ(y)und der Stetigkeit von ϕ folgt aus l → 0 auch h → 0. Also istr(h(l))liml→0 ‖h(l)‖ = limh→0r(h)‖h‖ = 0,und der zweite Faktor in (12.10) bleibt wegen (12.9) beschränkt:‖h(l)‖ = ‖ϕ(y +l)−ϕ(y)‖ ≤ 2‖(y +l)−y‖ = 2‖l‖.Also ist ϕ in y ∈ V 1 differenzierbar. Die Stetigkeit von ϕ ′ folgt aus Lemma 12.3(c).Der Satz über die Umkehrfunktion ist ein wichtiges Werkzeug der <strong>Analysis</strong>. Invielen Situationen dient er beispielsweise dazu, geeignete ”Koordinaten“ einzuführen,wobei wir uns die lokal invertierbaren Funktionen als ”Koordinatenwechsel“denken (in Analogie zu den Basistransformationen der linearen Algebra).Der Satz über die Umkehrfunktion ist eine lokale Aussage. Eine globaleVariante dieses Satzes erhält man, wenn man von vornherein die Existenz einer(globalen) Umkehrfunktion fordert.Folgerung 12.6 Sei U ⊆ R n offen, und f : U → R n sei injektiv, stetig differenzierbar,und f ′ (x) sei invertierbar für alle x ∈ U. Dann ist f(U) ⊆ R n offen, undf −1 : f(U) → U ist stetig differenzierbar.Ist sogar f ∈ C k (U,R n ), so folgt auch f −1 ∈ C k (f(U),R n ).Beweis Sei y ∈ f(U) und f(x) = y. Nach Satz 12.5 gibt es offene UmgebungenU 1 ⊆ U undV 1 ⊆ f(U)vonxbzw.y so,dassf| U1 : U 1 → V 1 einDiffeomorphismusist. Also ist f(U) offen und f −1 | V1 = (f| U1 ) −1 ist stetig differenzierbar.12.3 Der Satz über implizite FunktionenDieser Satz ist eine wichtige Folgerung aus dem Satz über die Umkehrfunktion.Er gibt uns insbesondere die Möglichkeit, die Lösungsmenge einer Gleichung wief(x,y) = 0 geeignet zu parametrisieren. Um den Satz über implizite Funktionenbesser zu verstehen, betrachten wir zunächst das folgende lineare Problem.Sei A : R n+k → R k eine lineare Abbildung. Wir schreiben die Elemente vonR n+k als Paare (x,y) ∈ R n × R k . Da A linear ist, gibt es lineare AbbildungenA 1 : R n → R k und A 2 : R k → R k so, dassA(x,y) = A 1 x+A 2 y für alle (x,y) ∈ R n ×R k .In dieser Darstellung ist klar, dass sich die Gleichung A(x,y) = 0 genau dannnach y auflösen lässt, wenn die lineare Abbildung A 2 invertierbar ist, und dass indiesem FallA(x,y) = 0 ⇐⇒ y = −A −12 A 1 x.233


Die Lösungsmenge ist also der Graph einer linearen Abbildung von R n nach R k .Der Satz über implizite Funktionen ist eine Verallgemeinerung dieser BeobachtungaufnichtlineareAbbildungen.WegenderNichtlinearitäterhältmannureinelokale Aussage.Satz 12.7 (Satz über implizite Funktionen) Seien U ⊆ R n und V ⊆ R koffen und f : U ×V → R k stetig differenzierbar. Für (x,y) ∈ U ×V spalten wirdie Ableitung f ′ (x,y) von f in zwei Teile auf:wobeif ′ (x,y) = ( d 1 f(x,y), d 2 f(x,y) ) ,d 1 f(x,y) = f ′ (x,y) ∣ ∣R n ×{0}∈ L(R n ,R k ),d 2 f(x,y) = f ′ (x,y) ∣ ∣{0}×R k∈ L(R k ,R k ).Ist (x 0 ,y 0 ) ∈ U ×V ein Punkt mit f(x 0 ,y 0 ) = 0 und ist d 2 f(x 0 ,y 0 ) invertierbar,so existieren offene Umgebungen U 1 ⊆ U von x 0 und V 1 ⊆ V von y 0 sowie einestetig differenzierbare Abbildung η : U 1 → V 1 mit η(x 0 ) = y 0 und{(x,y) ∈ U 1 ×V 1 : f(x,y) = 0} = {(x,η(x)) : x ∈ U 1 }. (12.11)Insbesondere ist f(x,η(x)) = 0 für alle x ∈ U 1 . Ist auch noch d 2 f(x,η(x)) invertierbar,so folgtη ′ (x) = − ( d 2 f(x,η(x)) ) −1d1 f(x,η(x)). (12.12)Speziell ist für n = k = 1∂fη ′ ∂x(x) = −(x,η(x))∂f(x,η(x)) .∂yDie Funktion η wird also implizit durch die Gleichung f(x,η(x)) = 0 definiert.Wir können diese Funktion auffassen als lokale Parametrisierung der Lösungsmengeder Gleichung f(x,y) = 0, da diese durch (12.11) lokal als Graph derFunktion η dargestellt wird. Ist f ∈ C m , so kann man wieder η ∈ C m zeigen.Beweis Wir identifizieren lineare Abbildungen mit ihren Matrixdarstellungenbezüglich der Standardbasis von R m . In diesem Sinn hat die Abbildungϕ : U ×V → R n ×R k , (x,y) ↦→ ( x,f(x,y) )die Ableitung (= Jacobimatrix)⎛1 0...ϕ ′ (x,y) =⎜0 1⎝ ( ) k,n∂f i∂x j(x,y)i,j=10 0...0 0(∂f i∂y l(x,y)) k,ki,l=1⎞(=⎟⎠I 0d 1 f(x,y) d 2 f(x,y)).234


Aus der Invertierbarkeit von d 2 f(x 0 ,y 0 ) folgt daher die von ϕ ′ (x 0 ,y 0 ). Da ϕ stetigdifferenzierbar ist, existiert nach dem Satz über die Umkehrfunktion eine UmgebungW ⊆ U × V von (x 0 ,y 0 ) so, dass ϕ| W : W → ϕ(W) ⊆ R n × R k einDiffeomorphismus ist. Die Umkehrfunktion ψ := (ϕ| W ) −1 : ϕ(W) → W hat danndie Gestaltψ(x,y) = ( x,g(x,y) ) mit g : ϕ(W) → R k .Wir definierenη : {x ∈ R n : (x,0) ∈ ϕ(W)} → R k , x ↦→ g(x,0).Dann ist ψ(x,0) = ( x,g(x,0) ) = ( x,η(x) ) und daher(x,0) = ϕ ( ψ(x,0) ) = ϕ ( x,η(x) ) = ( x,f(x,η(x)) ) ,also f(x,η(x)) = 0. Ist umgekehrt f(x,y) = 0 für (x,y) ∈ W, so ist ϕ(x,y) =(x,0) und daher (x,y) = ψ(x,0) = (x,g(x,0)) = (x,η(x)), also y = η(x). Dannist klar, dass{(x,y) ∈ W : f(x,y) = 0} = {(x,η(x)) ∈ W : (x,0) ∈ ϕ(W)}. (12.13)Wir wählen nun offene Umgebungen U ′ 1 von x 0 und V 1 von y 0 so klein, dassU ′ 1 × V 1 ⊆ W und dann eine Umgebung U 1 von x 0 mit η(U 1 ) ⊆ V 1 (diese lässtsich finden, da η stetig ist). Dann folgt (12.11) aus (12.13), und η ist stetigdifferenzierbar nach dem Satz über die Umkehrfunktion.Wir zeigen noch (12.12). Aus f(x,η(x)) = 0 für alle x ∈ U 1 undf ′ (x,y) = ( d 1 f(x,y),d 2 f(x,y) )folgt mit der Kettenregel (wir leiten f(x,η(x)) = 0 nach x ab):0 = f ′( x,η(x) ) ◦ ( id,η ′ (x) ) = d 1 f ( x,η(x) ) +d 2(f(x,η(x))◦η ′ (x).Ist d 2(f(x,η(x)))invertierbar, folgt hieraus (12.12).Beispiel 1 Wir betrachten den Einheitskreis, d.h. die Nullstellenmenge vonf : R 2 → R, (x,y) ↦→ x 2 +y 2 −1.Die lokale Auflösbarkeitsbedingung nach y lautet0 ≠ ∂f∂y (x 0,y 0 ) = 2y 0 .Für y 0 ≠ 0 existieren also Funktionen η so, dass der Einheitskreis lokal als Graphvon η darstellbar ist. Für y 0 > 0 ist η(x) = √ 1−x 2 , und für y 0 < 0 haben wir235


η(x) = − √ 1−x 2 . Für y 0 = 0 ist der Einheitskreis nicht lokal als Graph einerFunktion von x darstellbar. Dafür kann man um die Punkte (1,0) und (−1,0)den Einheitskreis lokal als Graph einer Funktion von y darstellen. Wegen∂f∂x (x 0,y 0 ) = 2x 0 ≠ 0ist in diesen Punkten nämlich die lokale Auflösbarkeitsbedingung nach x erfüllt.(Beachten Sie: es spielt keine Rolle, wie man den R n+k in zwei Unterräume E 1und E 2 aufteilt. Wichtig ist nur, dass d 2 f(x 0 ,y 0 ) : E 2 → R k invertierbar ist.)Entsprechend erhalten wir Funktionen η(y) = √ 1−y 2 für x 0 > 0 und η(y) =− √ 1−y 2 für x < x 0 .Beispiel 2 Die Funktion( ) xf : R 3 → R 2 , (x,y,z) ↦→2 −y 2x 2 −z 2hat die Jacobimatrix ( 2x −2y 02x 0 −2z).Die Auflösbarkeitsbedingung nach (y,z) ist erfüllt, wenn( ∂f) ( )det∂(y,z) (x −2y0 00,y 0 ,z 0 ) = det = 4y0 −2z 0 z 0 ≠ 0.0Ist dagegen( ∂f)det∂(x,z) (x 0,y 0 ,z 0 )( ) 2x0 0= det = −4x2x 0 −2z 0 z 0 ≠ 0,0so erhalten wir die lokale Auflösbarkeit nach dem Variablenpaar (x,z). Hier stehtfür die Jacobimatrix von f, betrachtet als Funktion von y und z.∂f∂(y,z)Beispiel 3 Sei f : R n ×R → R die Funktion∑n−1f(x,t) = t n + x k t k .Dann ist f(x,t) = 0 genau dann, wenn t eine Nullstelle des Polynoms P x (t) :=f(x,t)ist.Seit 0 eineeinfacheNullstellevonP x0 ,d.h.seiP x0 (t 0 ) = 0undP ′ x 0(t 0 ) ≠0. Dann ist∂f∂t (x 0,t 0 ) = P ′ x 0(t 0 ) ≠ 0.Also ist f(x,t) lokal nach t auflösbar.Wir haben in Beispiel 3 die folgende bemerkenswerte Aussage bewiesen:Die einfachen Nullstellen eines Polynoms hängen lokal beliebig oft differenzierbarvon den Koeffizienten des Polynoms ab.236k=0


12.4 Untermannigfaltigkeiten des R nWir haben im vorigen Abschnitt Lösungsmengen von Gleichungen lokal als Funktionsgraphendargestellt. Der folgende Begriff beschreibt allgemein Teilmengendes R n , die sich so darstellen lassen (unabhängig davon, ob sie Lösungsmengeeiner Gleichung sind).Definition 12.8 Eine Teilmenge M ⊆ R n heißt k-dimensionale C m -Untermannigfaltigkeit,wenn gilt: Für jedes x ∈ M gibt es offene Mengen U ⊆ R n undU ′ ⊆ R n mit x ∈ U und einen C m -Diffeomorphismusϕ : U → U ′ mit ϕ(U ∩M) = U ′ ∩(R k ×{0}).Eine solche Abbildung heißt Umgebungskarte. Eine Familie (ϕ j ) j∈J von Umgebungskartenϕ j : U j → U ′ j von M heißt Umgebungsatlas von M, wenn M ⊆⋃j∈J U j.R n−kR n−kMϕxU ′ = ϕ(U)UR kϕ(x)R kϕ(M)Eine Mannigfaltigkeit ist also eine Menge, die in geeigneten krummlinigen Koordinaten(beschrieben durch ϕ) lokal wie R k in R n aussieht.Beispiel 1 (Funktionsgraphen) Sei V ⊆ R k offen und f : V → R n stetig differenzierbar.Wir zeigen, dass der Graph von f, d.h. die MengeM := { ( x,f(x) ) ∈ R k+n : x ∈ V}eine k-dimensionale Untermannigfaltigkeit von R k+n ist. Dazu sei U := V ×R n .DieseMengeistoffenundenthältM (istalsoeineoffeneUmgebungjedesPunktesvon M). Die Abbildungϕ : U → U , (x,y) ↦→ ( x,y −f(x) )ist ein Diffeomorphismus von U mit der Umkehrabbildungϕ −1 : U → U , (x,y) ↦→ ( x,y +f(x) ) .237


Weiter istϕ(U ∩M) = ϕ(M) = V ×{0} = U ∩(R k ×{0}).Die Abbildung ϕ liefert also einen einelementigen Umgebungsatlas von M.Beispiel 2 Wir zeigen, dass die n-Sphäre∑n+1S n := {x ∈ R n+1 : ‖x‖ 2 = 1} = {x ∈ R n+1 : |x i | 2 = 1}eine n-dimensionale Untermannigfaltigkeit des R n+1 ist. Dazu betrachten wir fürjedes j = 1,...,n+1 die Mengeni=1U ± j := {x ∈ R n+1 : ∑ i≠jx 2 i < 1, ±x j > 0}.Jede dieser Mengen ist offen, und diese Mengen überdecken S n . Weiter: die Abbildungenϕ ± j : U ± j → R n+1 , (x 1 ,...,x n+1 ) ↦→↦→ ( x 1 ,...,x j−1 ,x j+1 ,...,x n+1 ,x j ∓(1− ∑ i≠jx 2 i) 1/2)sind Diffeomorphismen von U ± j auf ϕ ± j (U± j) (warum?), und es giltϕ ± j (U± j ∩S n ) = ϕ ± j (U± j )∩(Rn ×{0}).Die 2(n + 1) Umgebungskarten ϕ ± j , j = 1,...,n + 1, bilden also einen Umgebungsatlasvon S n .Beispiel 3 Sei A : R n → R k eine lineare Abbildung. Dann ist kerA eine lineareMannigfaltigkeit der Dimension dimkerA = n − rangA im Sinne der linearenAlgebra. Der Kern von A ist auch eine Untermannigfaltigkeit von R n der Dimensionn−rankA im Sinne von Definition 12.8. Dazu schreiben wir R n als direkteSumme kerA˙+N, wählen lineare Isomorphismenund definierenJ 1 : kerA → R n−rangA , J 2 : N → R rangAϕ : R n = kerA˙+N → R n = R n−rangA ×R rangA , x˙+y ↦→ (J 1 x,J 2 y).Den folgenden Satz kann man als eine globale Version des Satzes über impliziteFunktionen auffassen. Er gibt nicht nur Auskunft über die lokale Struktur derLösungsmenge einer Gleichung, sondern über deren globale Struktur.238


Definition 12.9 Sei U ⊆ R n offen und f : U → R k eine differenzierbare Funktion.Wir nennen x ∈ U einen kritischen Punkt und f(x) ∈ R k einen kritischenWert, wennrang ( f ′ (x) ) < k.Ein Punkt y ∈ R k heißt regulärer Wert, wenn sein volles Urbild f −1 (y) keinekritischen Punkte enthält.Satz 12.10 (Rangsatz) Sei U ⊆ R n offen und f : U → R k eine C m -Abbildung.Ist w ∈ f(U) ein regulärer Wert, so ist das volle Urbild f −1 (w) eine n−kdimensionaleC m -Untermannigfaltigkeit von R n .Im Spezialfall n = 2, k = 1 heißen die Mengen f −1 (w) Höhenlinien von f.Allgemeiner spricht man für n ≥ 2 von Niveauflächen.Beweis Wir können davon ausgehen, dass w = 0 ist (andernfalls wenden wir diefolgenden Überlegungen auf die Funktion ˜f : U → R k , x ↦→ f(x) − w an). Seialso u ∈ U ein Punkt mit f(u) = 0. Nach Voraussetzung ist(rangf ′ ∂fi) k,n(u) = rang = k.∂x j i,j=1O.B.d.A.könnenwirweiterannehmen,dassdieerstenk SpaltenderMatrix ( ∂f i∂x j)linearunabhängigsind(andernfallsnummerierenwirdieKoordinatenx j um).Seinunϕ : U → R n , x ↦→ ( f 1 (x),...,f k (x),x k+1 ,...,x n ).Dann ist⎛ϕ ′ (u) =⎜⎝(∂f i∂x j) k,ki=1,j=10 ... 0.... .0 ... 0(∂f i∂x j) k,ni=1,j=k+11 ... 0.... .0 ... 1eine invertierbare Matrix. Nach dem Satz über die Umkehrfunktion gibt es eineoffene Umgebung W ⊆ U von u so, dass ϕ| W : W → ϕ(W) ein Diffeomorphismusist. Dann istϕ ( f −1 (0)∩W ) = ({0}×R n−k )∩ϕ(W).Also ist ϕ eine Umgebungskarte von f −1 (0) um u. Da u ∈ f −1 (0) beliebig gewähltwar, folgt die Behauptung.Beispiel 4 Sei f : R 2 → R, (x,y) ↦→ x 4 − y 4 . Dann ist f ′ (x,y) = (4x 3 ,−4y 3 ).Folglich ist (0,0) ∈ R 2 der einzige kritische Punkt und w = 0 ∈ R der einzigekritische Wert von f. Für w ≠ 0 sind also alle Höhenlinien von f glatte eindimensionaleUntermannigfaltigkeiten von R 2 . Für w = 0 ist die zugehörige Höhenlinie239⎞⎟⎠


keine Untermannigfaltigkeit (sie besteht aus zwei Geraden, die sich in der Nullschneiden).Beispiel 5 Sei A ∈ L(R n ,R n ) symmetrisch und invertierbar undAusfolgt sofortf : R n → R, x ↦→ 〈Ax,x〉.〈A(x+h),x+h〉−〈Ax,x〉 = 〈Ax,h〉+〈Ah,x〉+〈Ah,h〉f ′ (x)h = 2〈Ax,h〉 = 2x T Ah,also f ′ (x) = 2x T A ∈ L(R n ,R). Da A invertierbar ist, ist x ∈ R n genau dannkritisch, wenn x = 0 ∈ R n , und w = 0 ∈ R ist der einzige kritische Wert von f.Ist beispielsweise A = diag(λ 1 ,...,λ n ) mit λ i > 0, und ist t > 0, so erhalten wir,dass die Ellipsoiden∑f −1 (t) = {x ∈ R n : λ i x 2 i = t}glatte n−1-dimensionale Untermannigfaltigkeiten von R n sind. Insbesondere istS n−1 eine n−1-dimensionale Untermannigfaltigkeit von R n (vgl. Beispiel 2).12.5 Extrema unter NebenbedingungenIn Kapitel 10 haben wir Extrema von Funktionen studiert, die auf einer offenenTeilmenge des R n definiert sind. Wir betrachten nun eine Situation, die in praktischenProblemen viel häufiger ist: wir suchen Extrema von Funktionen unterNebenbedingungen, d.h. Extrema von Funktionen auf Untermannigfaltigkeitendes R n . Wir wollen dabei vermeiden, durch eine geeignete Parametrisierung derUntermannigfaltigkeit das Problem auf die in Kapitel 10 betrachtete Situationzurückführen, da dies in der Regel recht schwierig ist.Wir präzisieren zunächst die Problemstellung. Sei U ⊆ R m+n eine offene Menge,und f : U → R sei stetig differenzierbar. Weiter sei g : U → R n eine stetigdifferenzierbare Funktion, für die 0 ∈ R n ein regulärer Wert ist. Dann isti=1M := {x ∈ U : g(x) = 0}eine m-dimensionale C 1 -Untermannigfaltigkeit in R m+n . Wir sagen, dass u ∈ Uein lokales Minimum (Maximum) von f unter der Nebenbedingung M oder g = 0ist, wenn u ∈ M und wenn es eine Umgebung V von u so gibt, dass f(x) ≥ f(u)(bzw. f(x) ≤ f(u)) für alle x ∈ V ∩M.240


Satz 12.11 Unter den soeben getroffenen Voraussetzungen gilt: Ist u ∈ U einlokales Extremum von f unter der Nebenbedingung g = 0, so gibt es reelle Zahlenλ 1 ,...,λ n so, dassn∑f ′ (u) = λ i g i(u). ′ (12.14)Diese Zahlen λ i heißen auch Lagrange-Multiplikatoren.i=1Beweis Nach Satz 12.10 ist M eine m-dimensionale Mannigfaltigkeit von R m+n .Wir finden also eine Umgebung W ⊆ U von u und einen Diffeomorphismusϕ : W → ϕ(W) ⊆ R m+n mitWir schreiben ϕ(W)∩(R m ×{0}) alsϕ(W ∩M) = ϕ(W)∩(R m ×{0}).{(y,0) ∈ R m ×R n : y ∈ V}mit einer offenen Menge V ⊆ R m und definierenψ : V → U , y ↦→ ϕ −1 (y,0). (12.15)Offenbar ist ψ eine Bijektion von V auf W ∩M. Die Abbildung ψ ist auch stetigdifferenzierbar. Mit der linearen AbbildungE : R m → R m ×R n , y ↦→ (y,0)können wir nämlich ψ auffassen als Einschränkung von ϕ −1 ◦E auf V. Die EinschränkungE| V ist aber differenzierbar, und ihre Ableitung ist in jedem PunktgleichE.Ausϕ◦ψ = E| V folgtaußerdemmitderKettenregelϕ ′ (ψ(y))·ψ ′ (y) = E.Für v := ϕ(u) is also insbesondere rangψ ′ (v) = rangE = m.Nach diesen Vorüberlegungen nun zum eigentlichen Beweis. Die Funktion f ◦ψ :V → R hat in v ein lokales Extremum (ohne Nebenbedingungen!). Es ist also(f ◦ψ) ′ (v) = f ′( ψ(v) ) ◦ψ ′ (v) = f ′ (u)◦ψ ′ (v) = 0. (12.16)Außerdem gilt für jedes i = 1,...,n, dass g i (ψ(y)) = 0 für y ∈ V. Differenzierenliefert g ′ i(ψ(y))·ψ ′ (y) = 0 und insbesondereg ′ i(u)◦ψ ′ (v) = 0 für i = 1,...,n. (12.17)Damit ist klar, dass imψ ′ (v) ⊆ kerg ′ (u). Nun ist aberdimkerg ′ (u)+rangg ′ (u) = dimkerg ′ (u)+n = m+n,241


also dimkerg ′ (u) = m. Hieraus folgt wegen rangψ ′ (v) = m sogarimψ ′ (v) = kerg ′ (u).Ist nun w ∈ imψ ′ (v), so folgt aus (12.16) und (12.17), dassf ′ (u)w −λ 1 g ′ 1(u)w−...−λ n g ′ n(u)w = 0 (12.18)für beliebige λ 1 ,...,λ n ∈ R. Um die Behauptung zu zeigen, müssen wir nochdie Vektoren aus dem orthogonalen Komplement W von imψ ′ (v) betrachten.Sei w 1 ,...,w n eine Basis von W. Wir bestimmen λ 1 ,...,λ n aus dem linearenGleichungssystemf ′ (u)w 1 − λ 1 g ′ 1(u)w 1 −...− λ n g ′ n(u)w 1 = 0..f ′ (u)w n − λ 1 g 1(u)w ′ n −...− λ n g n(u)w ′ n = 0.Dazu müssen wir uns lediglich klarmachen, dass die Matrix⎛⎞g 1(u)w ′ 1 ... g n(u)w ′ 1⎜⎟⎝ . . ⎠g 1(u)w ′ n ... g n(u)w ′ ninvertierbar ist. Wäre sie das nicht, so wären ihre Zeilen linear abhängig. Es gäbealso Zahlen µ 1 ,...,µ n , die nicht alle gleich Null sind, so dassbzw.µ 1(g′1 (u)w 1 ,...,g ′ n(u)w 1)+...+µn(g′1 (u)w n ,...,g ′ n(u)w n)= 0g ′ 1(u)w = ... = g ′ n(u)w = 0mit w = µ 1 w 1 +...+µ n w n . Der Vektor w liegt also im Kern von g ′ (u). Da w ∈ W,und da W senkrecht zu diesem Kern steht, folgt w = 0. Da aber die w i linearunabhängig sind, folgt µ 1 = ... = µ n = 0, ein Widerspruch.Wir können also die λ i aus dem Gleichungssystem eindeutig bestimmen. Da diew i den Raum W aufspannen, folgtf ′ (u)w −λ 1 g ′ 1(u)w−...−λ n g ′ n(u)w = 0für alle w ∈ W und folglich für alle w ∈ R m+n .ZurpraktischenBestimmunglokalerExtremaunterNebenbedingungenmussmanalso das System∂f ∂g 1 ∂g n(x) = λ 1 (x)+...+λ n (x) , k = 1,...,m+n∂x k ∂x k ∂x kg l (x) = 0, l = 1,...,n242(12.19)


estehendausm+2nGleichungenfürdiem+2nUnbekanntenx = (x 1 ,...,x n+m )und λ 1 ,...,λ n lösen und die erhaltenen extremwertverdächtigen Punkte auf ihreExtremaleigenschaften untersuchen. Es ist hilfreich, sich die FunktionG(x 1 ,..., ,x n+m ,λ 1 ,...,λ n ) := f(x)−λ 1 g 1 (x)−...−λ n g n (x)zu merken. Sucht man nämlich die extremwertverdächtigen Punkte von G durchpartielles Ableiten nach jeder der Variablen x i ,λ j und anschließendes Nullsetzen,so gelangt man gerade zum System (12.19).Beispiel 1 Gesucht sind Maximum und Minimum der Funktion f(x,y) = xy unterder Nebenbedingung g(x,y) := x 2 +y 2 −1 = 0, d.h. auf der Einheitskreislinie.Die Matrixg ′ (x,y) = (2x,2y)hat offenbar in jedem Punkt der Einheitskreislinie den Rang 1, so dass Satz 12.11anwendbar ist. Wir betrachten die FunktionG(x,y,λ) = f(x,y)−λg(x,y) = xy −λ(x 2 +y 2 −1)und setzen ihre partiellen Ableitungen Null:∂G= 0∂x⇒ y −2λx = 0,∂G= 0∂y⇒ x−2λy = 0,∂G∂λ = 0 ⇒ x2 +y 2 = 1.Wir multiplizieren die erste Gleichung mit y und die zweite mit x und findenx 2 = y 2 , woraus zusammen mit der dritten Gleichung für (x,y) die Paare( 1 1 √2 , √), 2(− 1 √2,− 1 √2),( 1√2,− 1 √2),(− √ 1 , 21)√2in Frage kommen. Diese lösen tatsächlich das System (die ersten beiden Paaremit λ = 1/2, die anderen mit λ = −1/2). Als Funktionswert ergibt sich für dieersten beiden Paare 1/2, für die anderen −1/2. Da die Funktion f Maximum undMinimum auf der Einheitskreislinie besitzen muss, ist 1/2 das Maximum und−1/2 das Minimum von f.Beispiel 2 Sei A eine symmetrische k ×k Matrix. Wir suchen die extremwertverdächtigenPunkte von f(x) = 〈Ax,x〉 auf der Sphäre S k−1 ⊆ R k , d.h. unterder Nebenbedingung g(x) = ‖x‖ 2 − 1 = 0. Hier ist n = 1 und m = k − 1, alsom+2n = k +1.243


Die Ableitung von f(x) = 〈Ax,x〉 ist f ′ (x) = 2x T A (vgl. Beispiel 5 in 12.4) unddie von g(y) = ‖x‖ 2 − 1 = 〈x,x〉 − 1 ist g ′ (x) = 2x T . Damit ist klar, dass dieRangbedingung erfüllt ist. Das zu lösende Gleichungssystem ist alsobzw. nach Transponierenf ′ (x)−λg ′ (x) = 2x T A−2λx T = 0,g(x) = ‖x‖ 2 −1 = 0,Ax = λx, ‖x‖ 2 = 1.Ein Punkt x ∈ S k−1 ist also genau dann extremwertverdächtig, wenn er Eigenvektorzum Eigenwert λ ist. Wegen f(x) = 〈Ax,x〉 ergibt sich für die zugehörigenFunktionswertef(x) = 〈Ax,x〉 = λ〈x,x〉 = λ.Folglich wird f in x genau dann minimal (maximal), wenn x ein Eigenvektorzum kleinsten (größten) Eigenwert von A ist. Man beachte: die stetige Funktionf nimmt auf der kompakten Menge S k−1 ihr Maximum an, woraus folgt, dass Amindestens einen reellen Eigenwert besitzen muss. Es ist alsomaxx≠0minx≠0〈Ax,x〉〈x,x〉〈Ax,x〉〈x,x〉= größter Eigenwert von A,= kleinster Eigenwert von A.244


13 Das Riemann-Integral für Funktionen mehrererVeränderlicherIn diesem Kapitel kommen wir zur Definition und wesentlichen Eigenschaften desRiemann-IntegralsfürFunktionenmehrererVeränderlicher.Genauso,wieunsdasProblemderFlächenberechnungeineMotivationfürdieEinführungdesRiemann-Integrals für Funktionen einer Veränderlichen war, kann uns nun das Problemder Volumendefinition- und berechnung (oder allgemeiner etwa das Problem derMassebestimmung eines Körpers mit ortsabhängiger Dichte) als eine Motivationdienen.In diesem und im folgenden Kapitel kann es lediglich darum gehen, einen erstenEindruck von der Integration im R n zu gewinnen und einige Rechentechniken zuvermitteln. Im vierten Semester wenden wir uns diesem Thema ausführlicher zu.13.1 Das Riemann-Integral über Intervallen im R nWir beginnen mit der Integration über den ”einfachsten“ Mengen im R n , nämlichüber Intervallen, Rechtecken, Quadern, ..., die wir kurz unter dem Namen Intervallim R n zusammenfassen. Im Unterschied zum R 1 gibt es aber im R n weitausmehr Mengen, über die man integrieren möchte (Kugeln, Pyramiden, ...). Wirwerden daher später die in diesem Abschnitt angestellten Überlegungen auf allgemeinereMengen übertragen.Unter einem abgeschlossenen Intervall im R n verstehen wir ein Produkt[a 1 ,b 1 ]×...×[a n ,b n ] = {(x 1 ,...,x n ) ∈ R n : a i ≤ x i ≤ b i für alle i}.Ein offenes Intervall im R n ist ein Produkt(a 1 ,b 1 )×...×(a n ,b n ) = {(x 1 ,...,x n ) ∈ R n : a i < x i < b i für alle i}.Ist I ein offenes oder abgeschlossenes Intervall wie oben, so erklären wir seinenInhalt durch|I| := (b 1 −a 1 )·...·(b n −a n ).Wir erhalten also für• n = 1 gewöhnliche Intervalle, und |I| ist die Intervall-Länge,• n = 2 Rechtecke, und |I| ist der Flächeninhalt,• n = 3 Quader, und |I| ist das Volumen, ....245


Eine Zerlegung Z eines Intervalles I ⊆ R n ist ein Produkt Z 1 × ... × Z n vonZerlegungen Z i der Intervalle [a i ,b i ]. Die Teilintervalle von Z erhält man, indemman im Produkt T 1 × T 2 × ... × T n die T i alle Teilintervalle der Zerlegung Z ivon [a i ,b i ] durchlaufen lässt. Eine Zerlegung Z ′ heißt Verfeinerung von Z, wennZ ⊆ Z ′ .Ist insbesondere Z = Z 1 ×...×Z n und Z ′ = Z ′ 1×...×Z ′ n, so ist Z ′ genau danneine Verfeinerung von Z, wenn jedes Z ′ i eine Verfeinerung von Z i ist. Unter demFeinheitsmaß (Maschenweite) von Z = Z 1 ×...×Z n versteht man die Zahl|Z| := maxi|Z i |.Dabei ist |Z i | das Feinheitsmaß der Zerlegung Z i des Intervalls [a i b i ].Beachte: In diese Definition geht nicht der Inhalt der Teilintervalle von Z einsondern deren ”Kantenlänge“.✻.dy 1.c... .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . ... .. .. .. .. .. I = [a,b]×[c,d].. .. I 1 .. .... ξ ..2 ..0..a x 1 x 2 x 3.Hat Z die Teilintervalle I 1 ,...,I r , und ist ξ = (ξ 1 ,...,ξ r ) ein Vektor mit ξ i ∈ I i ,so heißt ξ ein Zwischenvektor zu Z.Ist nun f eine reellwertige Funktion auf I, Z eine Zerlegung von I mit denTeilintervallen I 1 ,...,I r und ξ = {ξ 1 ,...,ξ r } ein Zwischenvektor zu Z, so heißt..b✲S(Z,ξ,f) :=r∑f(ξ i )|I i |i=1eine Riemannsumme für f.Definition 13.1 Die Funktion f : I → R heißt Riemann-integrierbar, wenn fürjede Folge (Z (m) ) von Zerlegungen von I mit |Z (m) | → 0 und für jede zugehörigeFolge von Zwischenvektoren (ξ (m) ) die Folge ( S(Z (m) ,ξ (m) ,f) ) der entsprechendenRiemannsummen konvergiert.Wenn f Riemann-integrierbar ist, dann sieht man wie im Beweis von Satz 8.10,dass alle Folgen ( S(Z (m) ,ξ (m) ,f) ) gegen den gleichen Wert konvergieren. Dieser246


heißt das Riemann-Integral von f über I. Wir schreiben dafür∫ ∫ ∫f dx, f(x)dx, f(x 1 ,...,x n )d(x 1 ,...,x n ) oderI I I∫If dV.Die folgenden Aussagen beweist man wie für n = 1 (Sätze 8.4, 8.22, 8.23, 8.24und 8.19).Satz 13.2 Jede auf einem Intervall I ⊆ R n Riemann-integrierbare Funktion fist beschränkt.Satz 13.3 Sind f,g Riemann-integrierbarauf I und α,β ∈ R, so ist auch αf+βgRiemann-integrierbar auf I, und es gilt∫ ∫ ∫(αf +βg)dx = α f dx+β gdx.ISatz 13.4 Sind f,g Riemann-integrierbar auf I und ist f(x) ≥ g(x) für allex ∈ I, dann ist auch ∫ ∫f dx ≥ gdx.Folgerung 13.5 Für Riemann-integrierbares f : I → R ist∫∣ f dx∣ ≤ sup |f(x)|·|I|.<strong>II</strong>x∈ISatz 13.6 Sind f,g Riemann-integrierbar auf I und stimmen f und g auf einerin I dichten Menge überein, so ist bereits∫ ∫f dx = gdx.13.2 Integrabilitätskriterien13.2.1 Charakterisierung über Darbouxsche IntegraleISei I ⊆ R n ein abgeschlossenes Intervall und f : I → R eine beschränkte Funktion.Weiter sei Z eine Zerlegung von I in Teilintervalle I 1 ,...,I r . Mit den Zahlenm k := infx∈I kf(x), M k := supx∈I kf(x)definieren wir die Unter- bzw. Obersummen von f bzgl. Z:<strong>II</strong><strong>II</strong>U(Z,f) :=r∑m k |I k |, O(Z,f) :=k=1247r∑M k |I k |k=1


und nennen∫f dx := supI ∗ ZU(Z,f) bzw.∫ ∗If dx := infZ O(Z,f)das untere bzw. obere Darbouxsche Integral von f. Für einen kurzen Momentwollen wir eine Funktion f Darboux-integrierbar nennen, wenn∫ ∫ ∗f dx = f dx.Wie Satz 8.7 beweist man:∗ISatz 13.7 Die beschränkte Funktion f : I → R ist genau dann Darboux-integrierbar,wenn für jedes ε > 0 eine Zerlegung Z von I mit O(Z,f)−U(Z,f) < εexistiert.Durch Übertragung des Beweises von Satz 8.8 (Details siehe Heuser, <strong>Analysis</strong> <strong>II</strong>,Satz 199.1) erhält man weiter:Satz 13.8 Eine Funktion f : I → R ist genau dann Riemann-integrierbar, wennsie beschränkt und Darboux-integrierbar ist. In diesem Fall gilt∫ ∫ ∫ ∗f dx = f dx = f dx.I I ∗ IFolgerung 13.9 (Riemannsches Integrabilitätskriterium) EineFunktionf :I → R ist genau dann Riemann-integrierbar, wenn sie beschränkt ist und wennfür jedes ε > 0 eine Zerlegung Z von I mit O(Z,f)−U(Z,f) < ε existiert.13.2.2 Charakterisierung über NullmengenÄhnlich wie im R 1 nennen wir eine Menge M ⊆ R N eine Nullmenge, wenn esfür jedes ε > 0 höchstens abzählbar viele (offene oder abgeschlossene) IntervalleI 1 ,I 2 ,... gibt, welche M überdecken (d.h. M ⊆ ⋃ k I k) und für die ∑ k |I k| < εist.Beispiel Für jedes c ∈ R und jedes j = 1,...,n ist die HyperebeneH := {(x 1 ,...,x n ) ∈ R n : x j = c}eine Nullmenge. Um dies einzusehen, bilden wir für jedes k ∈ N das IntervallI k := (a 1 ,b 1 )×(a 2 ,b 2 )×...×(a n ,b n ) mit{ {−k für i ≠ j k für i ≠ ja i :=εc− für i = j , b i :=εc+ für i = j .2 k+1 (2k) n−1 2 k+1 (2k) n−1248I


Dann ist H ⊆ ⋃ k I k (die Intervalle I k werden immer ”breiter“ und ”flacher“) und∞∑|I k | =k=1∞∑(2k) n−1 ·k=12ε2 k+1 (2k) = ε ∑ ∞ n−1k=112 k = ε.Es lassen sich die Beweise von Lemma 8.13 (Eigenschaften von Nullmengen)und Satz 8.14 auf den R n mit n > 1 übertragen. Auch die im Beweis benutzteSchwankung einer Funktion f auf einem Intervall I definiert man wie im R 1 :Ω f (I) = supf(t)−inff(t) = sup{|f(s)−f(t)| : s,t ∈ I}.t∈I t∈ISatz 13.10 (Lebesguesches Integrabilitätskriterium) Eine Funktion f : I→ R ist genau dann Riemann-integrierbar auf I, wenn sie beschränkt ist undwenn die Menge ihrer Unstetigkeitsstellen eine Nullmenge bildet, d.h. wenn ffast überall stetig ist.Folgerung 13.11 Jede auf I stetige Funktion ist Riemann-integrierbar.Folgerung 13.12 Mitf undg sindauch dieFunktionen|f|, max{f,g}, min{f,g}und f ·g Riemann-integrierbar auf I.Folgerung 13.13 Sei g Riemann-integrierbar auf I, g(I) ⊆ [a,b] und f stetigauf [a,b]. Dann ist auch f ◦g Riemann-integrierbar auf I.Beweis Ist f ◦g in x ∈ I unstetig, so muss auch g in x unstetig sein. Also ist∆(f ◦g) ⊆ ∆(g). Damit ist ∆(f ◦g) Nullmenge.Für Riemann-integrierbares f ist also z.B. auch die Funktion p√ |f(x)| Riemannintegrierbar.Folgerung 13.14 Sind f,g Riemann-integrierbar auf I, und sind f,g fast überallgleich, so ist ∫ ∫f dx = gdx.13.3 Der Satz von FubiniIDer nachfolgende Satz gibt uns in vielen Fällen ein bequemes Verfahren in dieHand, Riemann-Integrale auf mehrdimensionalen Intervallen zu berechnen.Satz 13.15 (Fubini) Seien I k ⊆ R k , I l ⊆ R l abgeschlossene Intervalle und I :=I k × I l ⊆ R k+l := R k × R l . Weiter sei die reellwertige Funktion f Riemannintegrierbarauf I, und für jedes y ∈ I l existiere das Riemann-Integral∫g(y) := f(x,y)dx.I k249I


Dann ist die Funktion g auf I l Riemann-integrierbar, und es gilt∫ ∫ ( ∫ )f(x,y)d(x,y) = f(x,y)dx dy. (13.1)<strong>II</strong> l I kBeweis Die Existenz des iterierten Integrals sowie die Identität (13.1) folgen ausdem Satz über iterierte Grenzwerte von Doppelfolgen (= Satz 9.17). Wir sehenuns einige Details des Beweises an.eine Zerlegung des Intervalles I k und ξ (m)k= (ξ (m)k,i ) eineine Zerlegung von I l mit= (ξ (n)l,j ). Dann definiert Z(m,n) := Z (m)k×Z (n)leine Zerlegungvon I, und ξ (m,n) := (ξ (m)k,ξ (n)l) ist ein zugehöriger Zwischenvektor. Wir erhaltenFür m ∈ N sei Z (m)kzugehöriger Zwischenvektor, und für n ∈ N sei Z (n)lZwischenvektor ξ (n)lS(Z (m,n) ,ξ (m,n) ,f) := ∑ (i,j)= ∑ (∑jSeien nun die Zerlegungsfolgen ( Z (m)kf(ξ (m)k,i ,ξ(n) l,j )|I(m) k,i ||I(n) l,i |if ( ξ (m)k,i , ) )ξ(n) (m)l,j |Ik,i |)m≥0 , ( Z (n)l)n≥0|I (n)l,i|. (13.2)so beschaffen, dass |Z(m)k|→ 0 und |Z (n)l| → 0 für m → ∞ bzw. n → ∞. Für die Produktzerlegung Z (m,n)gilt dann offenbar |Z (m,n) | → 0 für (m,n) → ∞. Da f auf I Riemann-integrierbarist, konvergiert die linke Seite von (13.2) für (m,n) → ∞ gegen ∫ I f(x,y)d(x,y).Außerdem wissen wir aus der Voraussetzung, dass für m → ∞ für jedes feste ξ (n)l,jder Klammerterm auf der rechten Seite von (13.2) konvergiert:limm→∞∑i∫f(ξ (m)k,i ,ξ(n) l,j )|I(m) k,i | =f(x,ξ (n)l,jI k)dx = g(ξ(n)l,j ).Nach dem erwähnten Satz 9.17 existiert dann auch der iterierte Grenzwert∑∫ (lim g(ξ (n)n→∞l,j )|I(n) l,j∫I ∫ )| = g(y)dy = g(x,y)dx dyl I l I kund stimmt mitüberein.j∫lim(m,n)→∞ S(Z(m,n) ,ξ (m,n) ,f) = f(x,y)d(x,y)IFolgerung 13.16 (Satz über Vertauschung der Integrationsreihenfolge)Die Bezeichnungen seien wie in Satz 13.15. Ist f auf I = I k × I l Riemannintegrierbar,und existieren die Integrale∫∫f(x,y)dx für jedes y ∈ I l und f(x,y)dy für jedes x ∈ I k ,I k I l250


so existieren alle iterierten Integrale, und es gilt∫ ( ∫ ) ∫ ( ∫ ) ∫f(x,y)dy dx = f(x,y)dx dy =I k I l I l I kIf(x,y)d(x,y).Für stetiges f wissen wir dies bereits aus Satz 10.29. Durch wiederholtes Anwendendes Satzes von Fubini und von Folgerung 13.16 erhalten wir:Folgerung 13.17 Ist f stetig auf I = [a 1 ,b 1 ]×...×[a n ,b n ], so ist∫∫ b1∫( bnf(x 1 ,...,x n )d(x 1 ,...,x n ) = ... f(x 1 ,...,x n )dx n ... ) dx 1 .a 1 a nIDabei darf die Reihenfolge der Integrationen noch beliebig vertauscht werden.Beispiel Auf I = [0,1]×[0,1]×[0,1] sei f(x,y,z) := xyz. Dann ist∫∫ 1 ∫ 1 ∫ 1f(x,y,z)d(x,y,z) = xyzdxdydzI= 1 20 0 0∫ 1 ∫ 100yzdydz = 1 4∫ 10zdz = 1 8 .13.4 Integration über Jordan-messbaren MengenIn diesem Abschnitt geht es um die Integration auf komplizierteren Mengen alsIntervallen. Für jede nichtleere Menge B ⊆ R n und jede Funktion f : B → Rdefinieren wir{f B : R n f(x) falls x ∈ B→ R, f B (x) :=0 falls x ∉ B,d.h. f B setzt die Funktion f durch 0 auf ganz R n fort.Definition 13.18 Sei B ⊆ R n nichtleer und beschränkt, und I ⊆ R n sei einabgeschlossenes Intervall mit B ⊆ I. Die Funktion f : B → R heißt Riemannintegrierbarauf B, wenn die Funktion f B Riemann-integrierbar auf I ist. Indiesem Fall heißt ∫ ∫f dx := f B dxdas Riemannintegral von f über B.Anmerkungen• Diese Definition ist unabhängig von der Wahl von I.B• Diese Definition bietet auch im R 1 etwas Neues, da B kein Intervall seinmuss.251I


Ob eine Funktion f auf einer Menge B integrierbar ist, hängt sowohl von f alsauch von B ab. Insbesondere erwartet man von B, dass wenigstens so einfacheFunktionen wie χ : B → R, χ(x) = 1, Riemann-integrierbar sind. Die entsprechendeFunktion{χ B : R n 1 wenn x ∈ B→ R, χ B (x) =0 wenn x ∉ Bheißt die charakteristische Funktion von B.Definition 13.19 Eine nichtleere beschränkte Menge B ⊆ R n heißt Jordanmessbar,wenn ihre charakteristische Funktion χ B Riemann-integrierbar ist. Indiesem Fall heißt ∫ ∫ ∫|B| := χ B dx = 1dx = dxder (n-dimensionale) Jordan-Inhalt von B.Anschauliche Deutung:IBB1∫1dx beschreibt das Volumen eines Zylinders über B mit der Höhe 1. DiesesBist gleich Grundfläche × Höhe, also gleich |B|.Deutung über Ober- und Untersummen: Seien B ⊆ R n nichtleer und beschränkt,I ⊆ R n ein Intervall mit B ⊆ I und Z eine Zerlegung von I in TeilintervalleI 1 ,...,I r . Dann istinf χ B (x) =x∈I ksupx∈I kχ B (x) =B{1 falls I k ganz in B0 sonst.{1 falls I k ∩B nicht leer0 sonst.252


000000000000011111111111110000000000000111111111111100000000000001111111111111000000000000011111111111110000000000000111111111111100000000000001111111111111000000000000011111111111110000000000000111111111111101 O(Z,χ B ) 01 U(Z,χ B)Für die zugehörigen Unter- bzw. Obersummen giltU(Z,χ B ) = ∑ k′|Ik |, O(Z,χ B ) = ∑ k′′|Ik |,wobei ∑ ′bzw. ∑ ′′über alle k mit I k ⊆ B bzw. mit I k ∩B ≠ ∅ erstreckt wird.Die Darbouxschen Integrale∫χ B dx,∗I∫ ∗Iχ B dxheißen innerer bzw. äußerer Inhalt von B. Aus dem Riemannschen Integrabilitätskriteriumfolgt sofort:Folgerung 13.20 Eine nichtleere beschränkte Menge B ⊆ R n ist genau dannJordan-messbar, wenn ihr innerer und ihr äußerer Inhalt übereinstimmen. Indiesem Fall ist ∫ ∫ ∗|B| = χ B dx = χ B dx.∗IBeispiel: Sei B := {(x,y) ∈ R 2 : 0 ≤ x ≤ 1, 0 ≤ y ≤ 1, x rational}. AlsIntervall“ wählen wir z.B. das Quadrat [0,1]×[0,1].”Dann ist für jede Zerlegung Z von [0,1] × [0,1] klar,1. . . . . . . .dass U(Z,χ B ) = 0, O(Z,χ B ) = 1. Also ist der innereInhalt von B gleich 0 und der äußere gleich 1. B istalso nicht Jordan-messbar, und wir schreiben B keinen.Flächeninhalt zu0 1IEine Anwendung des Lebesgueschen Integrabilitätskriteriums liefert sofortSatz 13.21 Eine nichtleere beschränkte Menge B ⊆ R n ist genau dann Jordanmessbar,wenn ihr Rand ∂Ω eine Nullmenge ist.Beweis Nach Definition und dem Lebesgueschen Kriterium ist B genau dannJordan-messbar, wenn die Menge der Unstetigkeitsstellen vor χ B eine Nullmengeist. Man macht sich leicht klar, dass χ B genau dann in x ∈ R n unstetig ist, wennx ein Randpunkt von Ω ist.253


Satz 13.22 (Allgemeines Lebesguesches Integrabilitätskriterium) SeiB ⊆ R n nichtleer und beschränkt, und B sei Jordan-messbar. Eine Funktion f :B → R ist genau dann auf B Riemann-integrierbar, wenn sie auf B beschränktund fast überall stetig ist.Beweis Sei I ⊆ R n ein Intervall mit B ⊆ I. Sei f auf B Riemann-integrierbar.Dann ist f B auf I Riemann-integrierbar. Nach Satz 13.10 ist f B beschränkt undfast überall stetig auf I. Dann ist f auch beschränkt und fast überall stetig aufB. Ist umgekehrt f beschränkt und fast überall stetig auf B, so ist f B beschränktauf I, und für die Menge der Unstetigkeitsstellen gilt: ∆(f B ) ⊆ ∆(f)∪∂B. NachSatz 13.21 ist ∂B eine Nullmenge. Also ist ∆(f B ) Nullmenge, d.h. f B ist auf IRiemann-integrierbar, und f ist auf B Riemann-integrierbar.Esistnunklar,dassauchdieFolgerungen13.11–13.14entsprechendfürIntegraleüber Jordan-messbare Mengen gelten. Beispielsweise gilt:Folgerung 13.23 StetigeFunktionenauf kompaktenundJordan-messbarenMengensind Riemann-integrierbar.Wir überlegen uns nun, wie das Integral bei fester Funktion f vom Integrationsbereichabhängt. Dazu vereinbaren wir:∫f dx := 0.∅AusSatz13.21bzw.demLebesgueschenIntegrabilitätskriteriumfolgtsofort:SindA und B Jordan-messbar, so sind auch A∪B, A∩B und A\B Jordan-messbar(die Ränder dieser Mengen liegen in ∂A ∪ ∂B und sind folglich Nullmengen).Weiter: Ist f auf einer Jordan-messbaren Menge B integrierbar, so ist f auch aufjeder Jordan-messbaren Teilmenge von B integrierbar.Satz 13.24 Seien A,B ⊆ R n Jordan-messbar und f auf A und B Riemannintegrierbar.Dann gilt:∫ ∫ ∫ ∫f dx+ f dx = f dx+ f dx.A∪BA∩BBeweis Die Existenz aller Integrale folgt aus den Vorbemerkungen. Wir zeigendie Behauptung zuerst im Fall A∩B = ∅ und wählen dazu ein Intervall I ⊆ R nmit A∪B ⊆ I. Dann ist∫ ∫ ∫ ∫ ∫f dx+ f dx = f A dx+ f B dx = (f A +f B )dxA B I I I∫ ∫= f A∪B dx = f dx. (13.3)IAA∪BB254


Im Fall A ∩ B ≠ ∅ schreiben wir A, B und A ∪ B als Vereinigung paarweisedisjunkter IntervalleA = (A∩B)∪(A\B), B = (A∩B)∪(B\A), A∪B = (A∩B)∪(A\B)∪(B\A)und erhalten durch wiederholte Anwendung von (13.3)∫ ∫ ∫ ∫ ∫f dx+ f dx = f dx+ f dx+A B∫A∩B∫A\B= f dx+ f dx.A∪BA∩BB\AFolgerung 13.25 Für Jordan-messbare Mengen A, B gilt|A∪B|+|A∩B| = |A|+|B|.∫f dx+A∩Bf dxFolgerung 13.26 Für Jordan-messbare Mengen A, B mit A ⊆ B gilt |A| ≤ |B|.Beweis Auf jedem Intervall I mit B ⊆ I gilt χ A ≤ χ B und daher∫ ∫ ∫ ∫|A| = dx = χ A dx ≤ χ B dx = dx = |B|.AIWir sagen, dass sich zwei Mengen A, B nicht überlappen, wenn sie nur Randpunktegemeinsam haben, d.h. wenn A∩B ⊆ ∂A∪∂B.Satz 13.27 Seien A, B sich nicht überlappende Jordan-messbare Mengen, undsei f auf A und B Riemann-integrierbar. Dann ist∫ ∫ ∫f dx = f dx+ f dx.A∪BABeweis Nach Satz 13.24 genügt es zu zeigen, dass ∫ f dx = 0. Da außerdemA∩Bgilt:∫∣ f dx∣ ≤ ‖f‖ ∞ |A∩B|,A∩Bgenügt es zu zeigen, dass |A ∩ B| = 0. Da A ∩ B ⊆ ∂A ∪ ∂B, und da ∂A, ∂Bkompakte Nullmengen sind, folgt diese Aussage aus der folgenden Behauptung:JedekompakteNullmengeN istJordan-messbar undbesitztdenJordan-Inhalt 0.Wir beweisen diese Behauptung. Da N Nullmenge ist, gibt es für jedes ε > 0eine Überdeckung von N durch abzählbar viele offene Intervalle I 1 ,I 2 ,... mit|I 1 | + |I 2 | + ... < ε. Da N kompakt ist, überdecken bereits endlich viele dieserIntervalle I 1 ,...,I n die Menge N, und es gilt |I 1 |+...+|I n | < ε. Da auch ∂NIBB255


von diesen Intervallen überdeckt wird, ist ∂N Nullmenge und daher N Jordanmessbar.Für den Inhalt von N erhalten wir aus Folgerung 13.25 und Folgerung13.26:n⋃ n∑|N| ≤ | I n | ≤ |I n | < ε.i=1i=1Also ist |N| ≤ ε für jedes ε > 0 und folglich |N| = 0.Folgerung 13.28 Für sich nicht überlappende Jordan-messbare Mengen A, Bgilt|A∪B| = |A|+|B|.Man kann auch leicht die Umkehrung zur im Beweis von Satz 13.27 formuliertenBehauptung beweisen: Jede Jordan-messbare Menge mit Inhalt 0 ist Nullmenge.Folgerung 13.29 Eine beschränkte Menge B ⊆ R n ist genau dann Jordanmessbar,wenn ihr Rand Jordan-messbar ist und den Inhalt 0 hat.Beweis ∂B ist kompakt, und kompakte Mengen sind genau dann Nullmengen,wenn sie Jordan-messbar sind und den Inhalt 0 besitzen.Wir haben nun schon so viel über Jordan-messbare Mengen erfahren, wissen aberimmer noch nicht, ob so einfache Mengen wie ein Kreis im R 2 oder eine Kugelim R 3 Jordan-messbar sind. Auf Grund von Folgerung 13.29 benötigen wir nochKriteriendafür,dasseinebeschränkteMengeJordan-messbaristunddenJordan-Inhalt 0 besitzt. Solche Mengen nennen wir auch Jordansche Nullmengen. Wirgeben zwei solcher Kriterien an.Satz 13.30 Sei B ⊆ R n Jordan-messbar und f : B → R Riemann-integrierbar.Dann ist der Graph von f, d.h. die MengeG(f) := {(x,y) ∈ R n ×R : x ∈ B,y = f(x)},eine Jordansche Nullmenge im R n+1 .Beweis Sei I ⊆ R n ein Intervall, welches B umfaßt, und ˆf sei die Einschränkungvon f B auf I. Nach dem Riemannschen Integrabilitätskriterium gibt es für jedesε > 0 eine Zerlegung Z von I mit O(Z, ˆf) − U(Z, ˆf) < ε. Damit haben wirsofort eine Überdeckung von G(ˆf) durch endlich viele abgeschlossene Intervallemit einer Inhaltssumme < ε. Wegen G(f) ⊆ G(ˆf) gilt dies erst recht für G(f),und da ε > 0 beliebig war, folgt die Behauptung.256


RG(ˆf)111000111000111000111110001100000 11000 111111 0000 111100 11O(Z,f)−U(Z,f)IR nBeispiel Nun können wir endlich beweisen, dass Kreise, Kugeln, ... Jordanmessbarsind. Zunächst ist [−1,1] ⊆ R 1 Jordan-messbar (Intervall). Auf [−1,1]sind die Funktionen f + (x) := √ 1−x 2 und f − (x) = − √ 1−x 2 stetig und folglichRiemann-integrierbar. Nach Satz 13.30 sind die GraphenG(f ± ) = {(x,y) ∈ R 2 : x ∈ [−1,1],y = ± √ 1−x 2 }Jordansche Nullmengen. Wegen G(f + )∪G(f − ) = {(x,y) : x 2 +y 2 = 1} ist dieEinheitskreislinie im R 2 eine Jordansche Nullmenge. Folgerung 13.29 zeigt, dassdann der Einheitskreis B 2 := {(x,y) ∈ R 2 : x 2 + y 2 ≤ 1} Jordan-messbar ist.Analog betrachten wir auf der (nun als Jordan-messbar erkannten) Menge B 2 dieFunktioneng ± (x,y) = ± √ 1−x 2 −y 2 : B 2 → Rund erhalten wie oben, dass die Oberfläche der Einheitskugel im R 3 eine JordanscheNullmenge und damit die Einheitskugel selbst Jordan-messbar ist. Durchvollständige Induktion überträgt man dieses Resultat sofort auf Kugeln im R n .Satz 13.31 Sei N ⊆ R n eine Jordansche Nullmenge und f : N → R m eineLipschitz-stetige Funktion. Falls m ≥ n, so ist f(N) ⊆ R m eine JordanscheNullmenge.Lipschitz-stetige Funktionen überführen also Jordansche Nullmengen in JordanscheNullmengen. Im folgenden Beweis von Satz 13.31 ist es bequem, mit Würfelnstatt mit Intervallen zu arbeiten. Ein Intervall [a 1 ,b 1 ]×...×[a n ,b n ] ⊆ R n heißtWürfel, wenn b 1 − a 1 = b 2 − a 2 = ... = b n − a n . Die Zahl b 1 − a 1 heißt dannKantenlänge des Würfels. Man kann Würfel im R n als Kugeln bezüglich der Maximumnorm257


‖(x 1 ,...,x n ) T ‖ ∞ := max1≤i≤n |x i|betrachten: Für jeden Vektor x 0 ∈ R n undjedes r > 0 istI := {x ∈ R n : ‖x−x 0 ‖ ∞ ≤ r}✻x0.} {{ }2r✲der Würfel mit Mittelpunkt x 0 und achsenparallelen Kanten der Länge 2r. Manüberlegt sich leicht, dass sich jede Jordansche Nullmenge im R n für jedes ε > 0durch endlich viele Würfel I 1 ,...,I n mit gleicher Kantenlänge und mit ∑ |I i | < εüberdecken läßt (genauer: Heuser, <strong>Analysis</strong> <strong>II</strong>, S. 462).Beweis von Satz 13.31 Da sich Würfel bequem mit der Maximumnorm beschreibenlassen, arbeiten wir sowohl in R n als auch in R m mit Norm ‖·‖ ∞ . NachVoraussetzung gibt es ein L > 0, so dass‖g(x)−g(y)‖ ∞ ≤ L‖x−y‖ ∞ für alle x,y ∈ N.(Die Lipschitz-Stetigkeit einer Funktion ist unabhängig von der gewählten Norm.Die Lipschitz-Konstante L hängt dagegen sehr wohl von der Norm ab.) Für beliebigvorgegebenes ε > 0 überdecken wir N durch die k WürfelI i = {x ∈ R n : ‖x−ξ i ‖ ∞ ≤ r}, i = 1,...,kmit den Mittelpunkten ξ i und der Kantenlänge 2r < 1 so, dass ∑ ki=1 |I i| =k(2r) n < ε. Da N = ⋃ ki=1 (N ∩I i), ist g(N) = ⋃ ki=1 g(N ∩U i) (↗ Übung).Aus jeder Menge N ∩I i wählen wir einen festen Punkt η i . Für jedes x ∈ N ∩I iist dann‖x−η i ‖ ∞ ≤ ‖x−ξ i ‖ ∞ +‖ξ i −η i ‖ ∞ ≤ 2r,woraus mit der Lipschitz-Stetigkeit von g folgt:‖g(x)−g(η i )‖ ∞ ≤ L‖x−η i ‖ ∞ ≤ 2rL.Folglich ist g(N ∩ I i ) enthalten im Würfel mit Mittelpunkt g(η i ) und mit derKantenlänge 4rL. Die Menge g(N) kann also durch k Würfel überdeckt werden,für deren Inhaltssumme gilt:k(4rL) m = k ·(2r) n (2r) −n (4rL) m = L m (2r) m−n 2 m ·k(2r) n < (2L) m ε(beachte: 2r < 1, m−n ≥ 0). Also ist g(N) eine Jordansche Nullmenge.258


13.5 Inhalt von OrdinatenmengenNachdem wir nun wissen, dass Kreise im R 2 Jordan-messbar sind, möchten wirnun auch den Flächeninhalt von Kreisen berechnen. Allgemeiner geht es darum,Jordan-Inhalte so genannter Ordinatenmengen zu bestimmen. Die OrdinatenmengeM(f) einer Funktion f : R n ⊇ B → R + ist die MengeM(f) := {(x,y) ∈ R n ×R : x ∈ B, 0 ≤ y ≤ f(x)}.R✻Graph von f.... . .. .. . . . ... . . . . .. .. . . . . . .. . . . . . . ... .. . ... . . . . . . . .. . . .. . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .} {{ }B..M(f)Im Fall B = [a,b] ⊆ R 1 haben wir als Flächeninhalt von M(f) definiert:Inhalt von M(f) :=∫ baf(x)dx.Wir zeigen nun, dass der so definierte Flächeninhalt mit dem Jordanschen Inhaltvon M(f) übereinstimmt.Satz 13.32 Sei B ⊆ R n Jordan-messbar, f : B → R Riemann-integrierbar undf ≥ 0. Dann ist die Menge M(f) ⊆ R n+1 Jordan-messbar, und es gilt∫|M(f)| = f dx.Beweis Wir beweisen zuerst die Jordan-Messbarkeit von M(f). Dazu müssenwir zeigen, dass ∂M(f) eine Nullmenge im R n+1 ist.Sei S := sup x∈B f(x). Ein Punkt (x,y) ∈ R n × R liegt sicher im Inneren vonM(f), wenn x im Inneren von B liegt, 0 < y < f(x) ist, und f in x stetig ist.Also ist ∂M(f) sicher in der Vereinigung der folgenden Mengen enthalten:A 1 = {(x,0) : x ∈ B},A 2 = { ( x,f(x) ) : x ∈ B},A 3 = {(x,y) : x ∈ ∂B, 0 ≤ y ≤ S},A 4 = {(x,y) : x ∈ B, f in x unstetig, 0 ≤ y ≤ S}.259B✲R n


Wir zeigen, dass jede dieser Mengen eine Nullmenge ist. A 1 ist Teil der Hyperebene{(x,0) : x ∈ R n } und hat daher den Jordan-Inhalt 0 (vgl. das Beispiel ausAbschnitt 13.2.2). A 2 ist der Graph von f und hat nach Satz 13.30 den Jordan-Inhalt 0. Für A 3 geben wir uns ein ε > 0 vor und überdecken ∂B durch dien-dimensionalen Intervalle I 1 ,I 2 ,... mit der Inhaltssumme ∑ |I i | < ε/S. Dannüberdecken die (n + 1)-dimensionalen Intervalle I 1 × [0,S], I 2 × [0,S], ... dieMenge A 3 , und für deren Inhaltssumme gilt: ∑ |I i ×[0,S]| < ε/S·S = ε. Da dieMenge der Unstetigkeitsstellen von f eine Nullmenge ist, können wir auf analogeWeise zeigen, dass auch A 4 Nullmenge ist. Damit ist die Jordan-Messbarkeit vonM(f) klar.Für die Inhaltsformel sei I ein Intervall, welches B umfasst. Dann liegt M(f) imIntervall I ×[0,S], und es gilt nach Fubini:∫ ∫ ( ∫ S )|M(f)| = χ M(f) d(x,y) = χ M(f) (x,y)dy dx=∫I×[0,S]I( ∫ f B (x)0)1dy dx =∫<strong>II</strong>0∫f B (x)dx =Bf dx.Offenbar gilt auch die folgende Verallgemeinerung von Satz 13.32.Satz 13.33 Seien B ⊆ R n Jordan-messbar und f 1 ,f 2 : B → R Riemann-integrierbar,und sei f 1 (x) ≤ f 2 (x) für alle x ∈ B. Dann ist die MengeM(f 1 ,f 2 ) := {(x,y) ∈ R n ×R : x ∈ B, f 1 (x) ≤ y ≤ f 2 (x)}Jordan-messbar, und es ist∫|M(f 1 ,f 2 )| =B(f 2 −f 1 )dx.Beispiel Seien (x 0 ,y 0 ) ∈ R 2 , r > 0 sowie B = [x 0 −r, x 0 +r], und seif 1 (x) = y 0 − √ r 2 −(x−x 0 ) 2 , f 2 (x) = y 0 + √ r 2 −(x−x 0 ) 2 .Dann ist M(f 1 ,f 2 ) die Kreisscheibe mit Mittelpunkt (x 0 ,y 0 ) und Radius r. Fürihren Inhalt finden wir|M(f 1 ,f 2 )| = 2∫ x0 +rx 0 −r√ r √r2 −(x−x 0 ) 2 dx = 2∫r2 −t 2 dt[] ∣ r1= 2 +√ r2 2 −t 2 + 1 2 r2 arcsin t ∣∣r13.6 Integration über Normalbereiche−r−r= πr 2 .Unter einem Normalbereich bzgl. der x-Achse versteht man eine Menge B ⊆ R 2der GestaltB = {(x,y) ∈ R 2 : a ≤ x ≤ b, ϕ 1 (x) ≤ y ≤ ϕ 2 (x)}, (13.4)260


wobei ϕ 1 ,ϕ 2 stetige Funktionen auf [a,b] mit ϕ 1 (x) ≤ ϕ 2 (x) für alle x ∈ [a,b]sind.Satz 13.34 Sei B wie in (13.4) und f : B → R stetig. Dann istyϕ 2∫Bf d(x,y) =∫ ba( ∫ ϕ 2 (x)ϕ 1 (x))f(x,y)dy dx.Bϕ 1a b xBeweis Sei I := [a,b]×[m,M] ein Rechteck, welches B umfaßt. Nach Fubini ist∫f(x,y)d(x,y) =∫ b ∫ MBa mf B (x,y)dydx.z f B (x,y)Für jedes feste x ∈ [a,b] ist offenbar∫ Mmf B (x,y)dy =∫ ϕ2 (x)f(x,y)dy.ϕ 1 (x)yAnalog heißtdB := {(x,y) ∈ R 2 : c ≤ y ≤ d,ψ 1 (y) ≤ x ≤ ψ 2 (y)}0 m ϕ 1 (x) ϕ 2 (x) Mϕein Normalbereich bezüglich der y-Achse, und es gilt∫Bf(x,y)d(x,y) =∫ d ∫ ψ2 (y)cψ 1 (y)f(x,y)dxdy.Ganz ähnlich erklärt man Normalbereiche im R 3 .Sei B 1 := [a,b]. Auf B 1 sind stetige Funktionen ϕ 1 ,ψ 1 gegeben mit ϕ 1 (x) ≤ ψ 1 (x)für alle x ∈ B 1 . Dann seiB 2 := {(x,y) : x ∈ B 1 , ϕ 1 (x) ≤ y ≤ ψ 1 (x)} ⊆ R 2 .Auf B 2 sind stetige Funktionen ϕ 2 ,ψ 2 gegeben mit ϕ 2 (x,y) ≤ ψ 2 (x,y) für alle(x,y) ∈ B 2 . Dann istB 3 := {(x,y,z) : (x,y) ∈ B 2 , ϕ 2 (x,y) ≤ z ≤ ψ 2 (x,y)} ⊆ R 3ein Normalbereich in R 3 , und es gilt∫f(x,y,z)d(x,y,z) =B 3∫ b ∫ ψ1 (x) ∫ ψ2 (x,y)aϕ 1 (x)261ϕ 2 (x,y)c0Bf(x,y,z)dzdydx.x


Beispiel Ein Kreiskegel mit Radius R und Höhe h ist ein Normalbereich im R 3 .Wir haben etwaB 1 = [−R,R],B 2 = {(x,y) : x ∈ [−R,R], − √ R 2 −x 2 ≤ y ≤ √ R 2 −x 2 }(= Grundfläche des Kegels),B 3 = {(x,y,z) : (x,y) ∈ B 2 , 0 ≤ z ≤ h− h R√x2 +y 2 }.hl−R0 rR(Beachte: (x,y) hat von (0,0) den Abstand r := √ x 2 +y 2 .) Die Länge l dergestrichelten Strecke ist nach dem Strahlensatzh : R = l : (R−r) bzw. l = hR−hrRFür das Volumen dieses Kegels finden wir daher∫V = d(x,y,z) =B 3===∫ R ∫ √ R 2 −x 2−R∫ R−R∫ R= 2h−R∫ R∫ R ∫ √ R 2 −x ∫ 2 h−hR−R − √ R 2 −x 2 0√x2 +y 2 )dydx√x 2 +y 2(h− h− √ R 2 −x R(2 hy − h R(2h √ R 2 −x 2 −h √ R 2 −x 2 − x2 h0= h− h R r.dzdydx( y2√x2 +y 2 + x22 ln(y +√ x 2 +y 2 )( √R2−x 2 − x22R ln R+√ )R 2 −x 2R− √ dx.R 2 −x 2Wir substituieren x = Rsint, dx = Rcostdt und erhalten∫ π/2(V = 2h Rcost− R0 2 sin2 tln 1+cost1−cost∫ π/2= 2hR 20) ) ∣ ∣∣√R 2 −x 2− √ R 2 −x 2 dx2R ln R+√ )R 2 −x 2R− √ dxR 2 −x 2)Rcostdt(cos 2 t− 1 2 sin2 tcostln 1+cost1−cost262)dt.


DasIntegralsin 2 tcostln 1+cost kanndurchpartielleIntegrationbestimmtwerden1−cost(der Faktor sin 2 tcost wird integriert und liefert 1 3 sin3 t, der Faktor ln 1+cost wird 1−costdifferenziert und ergibt −2 ). Eingesetzt findet man schließlichsintalso( πV = 2hR 2 4 − 1 6 sin3 ϕln 1+cost∣1−cost13.7 Die SubstitutionsregelV = 1 3 πhR2 .∣ π/20− 2 6∫ π/20)sin 2 ϕdϕ ,Nach dieser aufwändigen Rechnung für ein elementares Resultat fragt man sich,ob man nicht von vornherein die Rechnung hätte vereinfachen können durch eineandere Beschreibung des Kegels, etwa in Zylinderkoordinaten (die Substitutionsregelhaben wir ja ohnehin verwenden müssen). Beschreiben wir die Grundflächein Polarkoordinaten, so wird der Kegel offenbar beschrieben durch{(r,ϕ,z) : r ∈ [0,R], ϕ ∈ [0,2π], z ∈ [0,h− h R r]},was eine wesentlich einfachere Integration erwarten läßt. Problem: Wie haben wirim Integral ∫ f(x,y,z)d(x,y,z) den Ausdruck d(x,y,z) zu transformieren, wennBwir von (x,y,z) zu neuen Koordinaten, etwa r,ϕ und z, übergehen?A Motivation. Zu berechnen ist das Integral∫f(x,y)d(x,y)Büber einem Bereich B ⊆ R 2 , versehen mit x,y-Koordinaten. Die Substitutionx := ϕ(u,v), y := ψ(u,v) führt neue Veränderliche ein. Durch diese Substitutionwerde ein Bereich B ′ ⊆ R 2 mit Koordinaten u,v (wir sagen auch: ein Bereich deruv-Ebene) injektiv auf B abgebildet; genauer: die Abbildung( ( )u ϕ(u,v)g : B ′ → B, ↦→ g(u,v) =v)psi(u,v)ist eine Bijektion von B ′ auf B. Diese Abbildung übersetzt ein Rechtecknetz überB ′ in ein ”krummliniges Netz“ über B:263


vyB ′00 1100 1100 11g00 1100 1100 1100 11B0u0xWir sehen uns genauer an, wie das schraffierte Rechteck in der uv-Ebene auf daskrummlinige“ Parallelogramm (ebenfalls schraffiert) in der xy-Ebene abgebildet”wird:(u j,v k + ∆v k ) (u j + ∆u j,v k + ∆v k )∆v kg(ϕ(uj + ∆u j,v k + ∆v k ),ψ(u j + ∆u j,v k + ∆v k ) )(ϕ(uj,v k + ∆v k ), (ψ(u j,v k + ∆v k ) ) ϕ(uj + ∆u j,v k ),ψ(u j + ∆u j,v k ) )(u j,v k )∆u j (u j + ∆u j,v k )(ϕ(uj,v k ),ψ(u j,v k ) )DerFlächeninhaltdiesesRechtecks(wieerinderDefinitiondesRiemann-Integralsüber B ′ auftritt) ist ∆u j ∆v k . Um den Flächeninhalt des krummlinigen“ Parallelogrammszu berechnen, nehmen wir an, dass ∆u j und ∆v k so klein sind, dass das”krumme“ Parallelogramm fast ein echtes Parallelogramm ist. Für den Flächeninhalteines Parallelogramms mit den Eckpunkten (x 1 ,y 1 ),...,(x 4 ,y 4 )”gilt(x 4 ,y 4 )(x 3 ,y 3 )(x 2 ,y 2 )(x 1 ,y 1 )Fläche = |(x 2 −x 1 )(y 4 −y 1 )−(x 4 −x 1 )(y 2 −y 1 )|. (13.5)Dies läßt sich leicht ableiten, indem man z.B. von der unten gezeichneten Rechteckflächedie schraffierten Dreiecksflächen subtrahiert:264


12(x 4 ,y 4 )000000000111111111000000000111111111000000000111111111000000000111111111000000000111111111000000000111111111000000000111111111000000111111 0000 1111000000111111 0000 1111000000111111 0000 1111y 4 −y 2y 4 −y 1(x 2 ,y 2 )(x 1 ,y 1 )x 1 −x 4 x 2 −x 1y 2 −y 1Parallelogrammfläche = Fläche des weißen Dreiecks= (y 4 −y 1 ) ( (x 2 −x 1 )+(x 1 −x 4 ) ) − 1 2 (y 2 −y 1 )(x 2 −x 1 )− 1 2 (x 1 −x 4 )(y 4 −y 1 )− 1 2 (y 4 −y 2 )(x 2 −x 4 ).Mit Hilfe von Determinanten läßt sich (13.5) schreiben als( )∣ Fläche =∣ det x2 −x 1 x 4 −x 1 ∣∣∣.y 2 −y 1 y 4 −y 1Die Fläche unseres krummen“ Parallelogramms ist also ungefähr gleich( ” )∣ ∣ det ϕ(uj +∆u j ,v k )−ϕ(u j ,v k ) ϕ(u j ,v k +∆v k )−ϕ(u j ,v n ) ∣∣∣.ψ(y j +∆u j ,v k )−ψ(u j ,v k ) ψ(u j ,v k +∆v k )−ψ(u j ,v k )Wir nehmen nun an, dass ϕ und ψ differenzierbar sind. Für kleines ∆u j ist dannϕ(u j +∆u j ,v k )−ϕ(u j ,v k ) ≈ ∂ϕ∂u (u j,v k )·∆u j .Der Ausdruck (13.4) ist daher ungefähr gleich( ∂ϕ∣ det (u ∂ϕ∂u j,v k ) (u )∣∂v j,v k ) ∣∣∣∣∂ψ(u ∂ψ∂u j,v k ) (u ∆u j ∆v k .∂v j,v k )Die hier stehende Matrix ist aber nichts anderes als die Jacobi-Matrix von g ander Stelle (u j ,v k ). Mit anderen Worten: (13.4) ist etwa gleich|detg ′ (u j ,v k )|·∆u j ∆v k .Wir erwarten daher die Näherungsgleichung∫f(x,y)d(x,y) ≈ ∑ f ( ϕ(u j ,v k ),ψ(u j ,v k ) ) |detg ′ (u j ,v k )|∆u j ∆v kBj,kund hieraus die Substitutionsregel∫ ∫f(x,y)d(x,y) = f ( ϕ(u,v),ψ(u,v) ) |detg ′ (u,v)|d(u,v).BB ′Es zeigt sich, dass die hier abgeleitete“ Formel unter entsprechenden Voraussetzungentatsächlich gilt und dass sie auch auf Funktionen mehrerer Veränderlicher”verallgemeinert werden kann.265


B Determinanten und Volumina von Parallelepipeden. Mit der Determinanteneiner 3×3–Matrix⎛ ⎞a 11 a 12 a 13det⎝a 21 a 22 a 23⎠ := a 11 a 22 a 33 +a 12 a 23 a 31 +a 13 a 21 a 32a 31 a 32 a 33−a 13 a 22 a 31 −a 12 a 21 a 33 −a 11 a 23 a 32kann man das Volumen eines Parallelepipeds im R 3 beschreiben:(x 4 ,y 4 ,z 4 )⎛⎞x 2 −x 1 x 3 −x 1 x 4 −x 1V =∣ det ⎝y 2 −y 1 y 3 −y 1 y 4 −y 1⎠(x 3 ,y 3 ,z 3 ) z 2 −z 1 z 3 −z 1 z 4 −z 1∣.(x 2 ,y 2 ,z 2 )(x 1 ,y 1 ,z 1 )DieDeterminanteeinern×n–Matrixwirdz.B.rekursivdefiniert.SeiA = (a ij ) n i,j=1eine n×n–Matrix, und A ij sei die (n−1)×(n−1)–Matrix, die aus A durch Streichender i-ten Zeile und der j-ten Spalte entsteht. Dann definiert man:detA = a 11 detA 11 −a 12 detA 12 +a 13 detA 13 +...+(−1) n−1 a 1n detA 1n .Die Determinante einer n×n–Matrix steht wie oben in engem Zusammenhangzum Volumen eines Parallelepipeds im R n .C Der allgemeine SubstitutionssatzSatz 13.35 Sei G ⊆ R n offen, und g : R n → R n sei injektiv und stetig differenzierbar.Die Determinante detg ′ (t) sei auf G entweder überall positiv oder überallnegativ. Weiter sei T eine kompakte und Jordan-messbare Teilmenge von G, undf sei eine auf g(T) stetige reellwertige Funktion. Dann ist g(T) wieder kompaktund Jordan-messbar, f ist auf g(T) Riemann-integrierbar, und es gilt∫ ∫f(x)dx = f ( g(t) ) |detg ′ (t)|dt. (13.6)g(T)TDie Formel (13.6) gilt auch dann noch, wenn – entgegen den obigen Voraussetzungen– die Determinante detg ′ (t) auf einer Teilmenge N von T verschwindetoder wenn g| N auf einer Teilmenge N von T nicht injektiv ist, sofern N denJordan-Inhalt 0 hat.Der Beweis kann z.B. mit vollständiger Induktion nach n erfolgen, ist aber rechtaufwändig (vgl. Heuser, S. 475–485).266


D Beispiele: Transformation auf Polar-, Zylinder- und KugelkoordinatenPolarkoordinaten Der ZusammenhangzwischendenkartesischenKoordinaten(x,y)und den Polarkoordinaten (r,ϕ) eines Punktesim R 2 ist gegeben durchx = rcosϕ, y = rsinϕ.rϕy0xEin Integral gemäß Satz 13.35 auf Polarkoordinaten zu transformieren heißt dieSubstitution ( ( )x rcosϕ= g(r,ϕ) =y)rsinϕvorzunehmen. Es istundg ′ (r,ϕ) =( ) cosϕ −rsinϕsinϕ rcosϕdetg ′ (r,ϕ) = cosϕ·rcosϕ−(−rsinϕ)sinϕ = r(cos 2 ϕ+sin 2 ϕ) = r.Für r > 0 ist also detg ′ (r,ϕ) stets positiv. Weiter ist klar, dass g den Bereich{(r,ϕ) : r > 0, 0 ≤ ϕ < 2π}injektiv auf R 2 \{0} abbildet und dass g insbesondere auf dem GebietG := {(r,ϕ) : r > 0, 0 < ϕ < 2π}injektivist.AufdiesemGebietkönnenwiralsoSatz13.35anwenden,undesfolgt:Folgerung 13.36 Ist B = g(T), wobei T ⊆ G kompakt und Jordan-messbar ist,so kann ∫ f(x,y)d(x,y) auf Polarkoordinaten transformiert werden, und es giltB∫ ∫f(x,y)d(x,y) = f(rcosϕ,rsinϕ)rd(r,ϕ). (13.7)BTIst beispielsweise T ein Rechteck in G, so ist B = g(T) ein Kreisring, und wirhaben nach Fubini∫ ∫ ϕ2∫ r2f(x,y)d(x,y) = f(rcosϕ,rsinϕ)rdrdϕ. (13.8)Bϕ 1 r 1267


ϕyϕ 2TgBϕ 1ϕ 2ϕ 10 r 1 r 2r 0 r 1 r 2xIn der Praxis ist T häufig ein Rechteck, welches im Streifen{(r,ϕ) : r ≥ 0, 0 ≤ ϕ ≤ 2π}liegt und Teile des Randes dieses Streifens enthält. Wir überlegen uns, dass dieFormel (13.8) auch in diesem Fall noch gilt. Dazu seiT = {(r,ϕ) : 0 ≤ r ≤ R, 0 ≤ ϕ ≤ 2π},und T ′ ⊆ T sei ein Rechteck der GestaltT ′ = {(r,ϕ) : ϱ ≤ r ≤ R,ϕ 1 ≤ ϕ ≤ ϕ 2 } mit ϱ > 0 und 0 < ϕ 1 < ϕ 2 < 2π.ϕ2πϕ 2ϕ 1T ′0 ρ R rAuf T ′ gilt (13.8), d.h. es ist∫ ∫f(x,y)d(x,y) = f(rcosϕ,rsinϕ)rd(r,ϕ),g(T ′ )T ′und aus∫∣T∫f(rcosϕ,rsinϕ)rd(r,ϕ)− f(rcosϕ,rsinϕ)rd(r,ϕ)∣T ∫′ =∣ f(rcosϕ,rsinϕ)rd(r,ϕ)∣T\T ′≤ sup|f(rcosϕ,rsinϕ)r|·|T\T ′ |r,ϕfolgt, dass ∫ f(rcosϕ,rsinϕ)rd(r,ϕ) gegen ∫ f(rcosϕ,rsinϕ)rd(r,ϕ) strebt,T ′ Twennϱ → 0,ϕ 1 → 0undϕ 2 → 2π.Ähnlicherhältman,dassauch ∫ f(x,y)d(x,y)g(T ′ )gegen ∫ f(x,y)d(x,y) strebt. Zusammengefasst:g(T)268


Folgerung 13.37 Ist T ein Rechteck [r 1 ,r 2 ] × [ϕ 1 ,ϕ 2 ] mit 0 ≤ r 1 < r 2 und0 ≤ ϕ 1 < ϕ 2 ≤ 2π, und ist f auf g(T) = B stetig, so gilt (13.8).yAnwendung: Sei B ⊆ R 2 dieMengeallerPunkte(r,ϕ)mit0 ≤r ≤ ϱ(ϕ) und ϕ 1 ≤ ϕ ≤ ϕ 2 , wobeiϱ auf [ϕ 1 ,ϕ 2 ] stetig und positivsei. Dann ist der Inhalt von BgleichBϕ 2ϕ 1x∫|B| =B1d(x,y) =∫ ϕ2ϕ 1∫ r(ϕ)0rdrdϕ =z∫ ϕ2r(ϕ) 2ϕ 12dϕ.Zylinderkoordinaten Die Zylinderkoordinaten(r,ϕ,z) eines PunktesP ∈ R 3 mit kartesischen Koordinaten(x,y,z) sind:zPx = rcosϕ, y = rsinϕ, z = z.ϕryFür die Substitution⎛ ⎞ ⎛ ⎞x rcosϕ⎝y⎠ = g(r,ϕ,z) = ⎝rsinϕ⎠ giltz z⎛ ⎞cosϕ −rsinϕ 0detg ′ (r,ϕ,z) = det⎝sinϕ rcosϕ 0⎠ = r.0 0 1Ähnlich wie bei Polarkoordinaten sieht man, dass die Substitutionsformel∫ ∫f(x,y,z)d(x,y,z) = f(rcosϕ,rsinϕ,z)rd(r,ϕ,z) (13.9)BT269x


sicher immer dann gilt, wenn T eine kompakte und Jordan-messbare Teilmengedes GebietesG = {(r,ϕ,z) : r > 0,0 < ϕ < 2π,−∞ < z < ∞}undB = g(T)ist.DieFormel(13.9)giltaberauchdannnoch,wennT einQuaderT = [r 1 ,r 2 ]×[ϕ 1 ,ϕ 2 ]×[z 1 ,z 2 ] mit 0 ≤ r 1 < r 2 ,0 ≤ ϕ 1 < ϕ 2 ≤ 2πist. In diesem speziellen Fall geht (13.9) über in∫ ∫ z2∫ ϕ2∫ r2f(x,y,z)d(x,y,z) = f(rcosϕ,rsinϕ,r)rdrdϕdz.Bz 1 ϕ 1 r 1KugelkoordinatenDerZusammenhangzwischendenKugelkoordinaten(r,ϑ,ϕ)und den kartesischen Koordinaten (x,y,z) eines Punktes P ∈ R 3 wird hergestelltdurchx = rcosϑcosϕ, y = rcosϑsinϕ, z = rsinϑ;dabei ist r ≥ 0,− π 2 ≤ ϑ ≤ π 2 , 0 ≤ ϕ < 2π.zPzPrϑyrz = rsinϑϕϑ0rcosϑx,yxFür die Substitution⎛ ⎞ ⎛ ⎞x rcosϑcosϕ⎝y⎠ = g(r,ϑ,ϕ) = ⎝rcosϑsinϕ⎠z rsinϑfindet man⎛⎞cosϑcosϕ −rsinϑcosϕ −rcosϑsinϕdetg ′ (r,ϑ,ϕ) = det⎝cosϑsinϕ −rsinϑsinϕ rcosϑcosϕ ⎠ = −r 2 cosϑ.sinϑ rcosϑ 0270


Diese Determinante ist stets negativ, wenn r > 0 und −π/2 < ϑ < π/2. Wieoben gilt für stetiges f die Transformationsformel∫ ∫f(x,y,z)d(x,y,z) = f(rcosϑcosϕ,rcosϑsinϕ,rsinϑ)r 2 cosϑd(r,ϑ,ϕ),BTwenn B = g(T) und T kompakte und Jordan-messbare Teilmenge vonG = {(r,ϑ,ϕ) : r > 0,− π 2 < ϑ < π ,0 < ϕ < 2π}2ist. Diese Formel gilt auch dann noch, wennT = [r 1 ,r 2 ]×[ϑ 1 ,ϑ 2 ]×[ϕ 1 ,ϕ 2 ]mit 0 ≤ r 1 < r 2 , − π ≤ ϑ 2 1 < ϑ 2 ≤ π und 0 ≤ ϕ 2 1 < ϕ 2 ≤ 2π ist. Insbesondere istdann nach Fubini∫f(x,y,z)d(x,y,z)B=∫ ϕ2ϕ 1∫ ϑ2ϑ 1∫ r2Beispiel (Volumen einer Kugel)r 1f(rcosϑcosϕ,rcosϑsinϕ,rsinϑ)r 2 cosϑdrdϑdϕ.Die Kugel B mit Mittelpunkt (0,0,0) und Radius R ist das Bild des QuadersT = [0,R]×[− π 2 , π 2 ]×[0,2π]unter der oben beschriebenen Transformation. Wir finden daher∫ ∫ 2π ∫ π/2 ∫ RV = d(x,y,z) = r 2 cosϑdrdϑdϕB==0 −π/2∫ 2π ∫ π/20∫ 2π0−π/20R 33 cosϑdϑdϕR 33 sinϑ ∣ ∣∣π/2−π/2dϕ = 2 3 R3 ∫ 2π0dϕ = 4 3 πR3 .Man vergleiche diese Rechnung mit der mühsamen Herleitung der Formel für dasKegelvolumen in Abschnitt 13.6.271


14 Oberflächenintegrale und IntegralsätzeNachdem wir im vergangenen Kapitel gesehen haben, wie man das Volumen einesdreidimensionalen Körpers (z.B. das Volumen einer Kugel) mit Hilfe der Integralrechnungbestimmen kann, wenden wir uns nun den Flächeninhalten gekrümmterFlächen zu (wie z.B. der Oberfläche einer Kugel), für die wir einen geeignetenIntegralbegriff entwickeln.14.1 Flächen, Tangenten und NormalenWir haben früher Kurven als Bilder von Intervallen bzgl. stetiger Abbildungenbeschrieben. Ganz analog definieren wir nun Flächenstücke als Bilder ebener Bereichebzgl. geeigneter Abbildungen.Definition 14.1 Sei D ⊆ R 2 eine beschränkte offene Menge, und ihre AbschließungD sei Jordan-messbar. Weiter sei F : D → R 3 eine stetig differenzierbareFunktion mitrangF ′ (x 1 ,x 2 ) = 2 für alle (x 1 ,x 2 ) ∈ D. (14.1)Dann heißt das Bild von D unter F, d.h. die MengeF := {F(x 1 ,x 2 ) ∈ R 3 : (x 1 ,x 2 ) ∈ D} (14.2)ein Flächenstück im R 3 und die Abbildung F : D → F heißt eine Parameterdarstellungdes Flächenstücks F oder kurz eine Fläche.Genau wie bei Wegen und Kurven unterscheiden wir sorgfältig zwischen der AbbildungF und ihrem Bild F. Offenbar kann es für ein- und dasselbe FlächenstückF verschiedene Parametrisierungen geben.Wichtige Vereinbarung. Wir haben früher die Differenzierbarkeit einer AbbildungF : X → R 3 nur für offene Mengen X ⊆ R 2 erklärt. Die stetige Differenzierbarkeitvon F : D → R 3 haben wir wie folgt zu verstehen: Die Funktion Fläßt sich zu einer stetig differenzierbaren Funktion F : G → R 3 auf eine offeneMenge G ⊃ D fortsetzen. Diese Menge G ist für die Definition des Flächenstücksoffenbar unerheblich. Wir möchten jedoch auch in den Randpunkten von D diepartiellen Ableitungen F x1 und F x2 bilden können und verlangen daher, dass sichF auf eine offene Umgebung G von D stetig differenzierbar fortsetzen läßt.Die Rangbedingung (14.1) wird nur für Punkte aus D gefordert; auf dem Rand∂D = D\D muss sie nicht erfüllt sein. MitF(x 1 ,x 2 ) = ( F 1 (x 1 ,x 2 ), F 2 (x 1 ,x 2 ), F 3 (x 1 ,x 2 ) ) T272


lautet die Rangbedingung (14.1)in allen Punkten von D.rang⎛⎜⎝⎞∂F 1 ∂F 1∂x 1 ∂x 2∂F 2 ∂F 2 ⎟∂x 1 ∂x 2∂F 3 ∂F 3∂x 1 ∂x 2⎠ = 2 (14.3)Beispiel 1 (Kugeloberfläche) Sei D = (0,2π)×(−π/2, π/2) und r > 0. Dannist D das Rechteck [0,2π]×[−π/2, π/2]. Sei weiterF(u,v) = (rcosucosv, rsinucosv, rsinv)für (u,v) ∈ D. Dann ist F stetig differenzierbar auf D (und sogar auf ganz R 2 ),und die Funktionalmatrix⎛⎞−rsinucosv −rcosusinvF ′ (u,v) = ⎝ rcosucosv −rsinusinv⎠0 rcosvhat für alle (u,v) ∈ D den Rang 2. Das zugehörige Flächenstück F ist die Oberflächeeiner Kugel um den Nullpunkt mit dem Radius r.Beispiel 2 (Funktionsgraphen) Sei f : D → R eine stetig differenzierbareFunktion undF : D → R 3 , F(u,v) := ( u,v, f(u,v) ) T.Dann ist auch F stetig differenzierbar auf D, und die Funktionalmatrix⎛ ⎞1 0⎝ 0 1 ⎠∂f∂uvon F hat offenbar den Rang 2. Das durch F definierte Flächenstück ist geradeder Graph von f. Mit D = {(u,v) ∈ R 2 : u 2 +v 2 ≤ 1} und f(u,v) = uv erhältman beispielsweise eine Sattelfläche (hyperbolisches Paraboloid).Beispiel 3 (Ebenen) Seien a = (a 1 ,a 2 ,a 3 ) T und b = (b 1 ,b 2 ,b 3 ) T linear unabhängigeVektoren und sei x 0 ∈ R 3 . Auf D = [−1,1]×[−1,1] hat die FunktionF(u,v) = ua+vb+x 0 die Funktionalmatrix⎛ ⎞a 1 b 1⎝a 2 b 2⎠,a 3 b 3die wegen der linearen Unabhängigkeit von a und b den Rang 2 hat. Das zugehörigeFlächenstück ist ein Teil der durch a und b aufgespannten und durch x 0verlaufenden Ebene.273∂f∂v


Sei F : D → R 3 die Parametrisierung eines Flächenstücks F. Ist durch X =(X 1 ,X 2 ) T : [a,b] → D ein stetig differenzierbarer Weg in D gegeben, so istY : [a,b] → R 3 , Y(t) = F ( X(t) )einstetigdifferenzierbarerWeg,derkomplettinF verläuft.Fürt 0 ∈ [a,b]wirddieRichtung der Tangente an den Weg Y im Punkt Y(t 0 ) = F ( X(t 0 ) ) beschriebendurch den Vektor(Kettenregel!) mitundẎ(t 0 ) = F u(X(t0 ) ) Ẋ 1 (t 0 )+F v(X(t0 ) ) Ẋ 2 (t 0 ) (14.4)(F u X(t0 ) ) = ∂F (X(t0 ) ) ( ∂F1 (= X(t0 ) ) , ∂F 2(X(t0 ) ) , ∂F 3(X(t0 ) ))∂u ∂u ∂u ∂u(F v X(t0 ) ) = ∂F (X(t0 ) ) ( ∂F1 (= X(t0 ) ) , ∂F 2(X(t0 ) ) , ∂F 3(X(t0 ) )) .∂v ∂v ∂v ∂v(Die Rangbedingung (14.1) besagt gerade, dass die beiden Vektoren F u X(t0 ) )(und F v X(t0 ) ) für alle Punkte X(t 0 ) ∈ D linear unabhängig sind. Wir schreibenX(t 0 ) = (u 0 ,v 0 ). Betrachten wir alle Wege X durch den Punkt (u 0 ,v 0 ),so können in (14.4) die Ableitungen Ẋ1(t 0 ) und Ẋ2(t 0 ) beliebige Werte annehmen.Die beiden Vektoren F u (u 0 ,v 0 ) und F v (u 0 ,v 0 ) spannen also die kompletteTangentialebene an die Fläche F im Punkt F(u 0 ,v 0 ) auf. Eine Beschreibung derTangentialebene in Parameterform lautet daher{F(u 0 ,v 0 )+λF u (u 0 ,v 0 )+µF v (u 0 ,v 0 ) : λ,µ ∈ R}. (14.5)Den Normalenvektor an die Fläche F : D → R 3 im Punkt F(u,v) mit (u,v) ∈ Derklären wir durch das VektorproduktN(u,v) := F u(u,v)×F v (u,v)‖F u (u,v)×F v (u,v)‖ . (14.6)(Man beachte, dass F u (u,v) × F v (u,v) ≠ 0 ist, da beide Vektoren linear unabhängigsind.) Aus den Eigenschaften des Vektorprodukts wissen wir, dass derVektor N(u,v) senkrecht auf F u (u,v) und F v (u,v) (und damit auf der gesamtenTangentialebene (14.5)) steht. Außerdem hat er die Länge 1, so dass man auchvom Normaleneinheitsvektor spricht.Es stellt sich die Frage, inwieweit die eingeführten Begriffe (Tangential- undNormalenvektoren) von der Parametrisierung F oder nur vom Flächenstück Fabhängen. Dazu zunächst eine Definition.274


Definition 14.2 a) Seien D,E offen in R 2 . Eine bijektive Abbildung ϕ : D →E heißt Diffeomorphismus, wenn ϕ und die Umkehrabbildung ϕ −1 stetig differenzierbarsind.b) Zwei Parameterdarstellungen F : D → R 3 und G : E → R 3 heißen äquivalent,wenn es einen Diffeomorphismus ϕ : D → E gibt mit F = G◦ϕ unddetϕ ′ > 0 auf D.Sind F und G äquivalent, so sagt man auch, dass sie durch eine Parametertransformationϕ auseinander hervorgehen.Es gilt nun:Bei äquivalenten Parametertransformationen bleiben die wesentlichenFlächengrößen und Flächeneigenschaften (wie die Tangentialebenenund Normalenvektoren) unverändert.Anschaulichistklar,dassjedesFlächenstückinjedemPunktgenaueinenTangentialraum,aber zwei Normaleneinheitsvektoren (nach ”oben“ und nach ”unten“)besitzt. Ist F = G ◦ ϕ, so liefern F und G den gleichen Normalenvektor, wenndetϕ ′ > 0, und sie liefern entgegengesetzte Normalenvektoren, wenn detϕ ′ < 0.In letzterem Fall sagt man auch, dass die Orientierung von F gewechselt wird.Beispiel 4 Seien D und F wie in Beispiel 1 (Kugeloberfläche). Dann istund damitF u (u,v) = (−rsin ucos v, rcosucosv,0) T ,F v (u,v) = (−rcosusinv,−rsinusinv,rcosv) T ,F u (u,v)×F v (u,v) = (r 2 cosucos 2 v,r 2 sinucos 2 v,r 2 sinvcosv),‖F u (u,v)×F v (u,v)‖ = r 2 cosvN(u,v) = (cosucosv,sinucosv,sinv)für alle Punkte (u,v) ∈ (0,2π)×(−π/2,π/2).Beispiel 5 Sind D,f und F wie in Beispiel 2 (Funktionsgraphen), so istF u = ( 1,0, ∂f∂u) T,Fv = ( 0,1, ∂f ) T,∂vF u ×F v = ( − ∂f∂u ,−∂f ∂v ,1) , ‖F u ×F v ‖ =und damit schließlichN(u,v) =√ (∂f∂u√ ( ∂f∂u1 ( ∂f) 2 (+∂f) −2 ∂u ,−∂f ∂v ,1) .∂v +1275) 2 (∂f) 2+ +1∂v


Beispiel 6 Sei D = E = {(u,v) ∈ R 2 : u 2 +v 2 < 1}. Die ParametrisierungenundF : D → R 3 , F(u,v) = (u,v,uv) TG : E → R 3 , G(u,v) = (u,−v,−uv) Tliefern das gleiche Flächenstück. Wir bestimmen die Normalenvektoren im PunktF(0,0) = G(0,0) = (0,0,0) T . Zunächst istalsoF u (u,v) = (1,0,v) T , F v (u,v) = (0,1,u) T ,F u (u,v)×F v (u,v) = (−v,−u,1) T und F u (0,0)×F v (0,0) = (0,0,1) T .Andererseits istund damitG u (u,v) = (1,0,−v) T , G v (u,v) = (0,−1,−u) TG u (u,v)×G v (u,v) = (−v,u,−1) T und G u (0,0)×G v (0,0) = (0,0,−1) T .Bei Verwendung von F erhalten wir also (0,0,1) T als Normaleneinheitsvektorim Punkt (0,0,0) T an die Sattelfläche, und bei Verwendung von G den Vektor(0,0,−1) T . Man beachte, dass zwar F und G durch den Diffeomorphismus( )ϕ : D → E, ⃗ 1 0 u(u,v) T ↦→ = (u,−v)0 −1)( Tvauseinander hervorgehen, dass aberdetϕ ′ (u,v) = det( ) 1 0= −1 < 00 −1ist. Also sind F und G nicht zueinander äquivalent.14.2 FlächenintegraleWir wollen nun Flächenintegrale definieren. Als Motivation gehen wir ähnlich vorwiebeider ”Herleitung“ derSubstitutionsregelinAbschnitt13.7.SeiF : D → R 3eine Parametrisierung eines Flächenstückes F, wobei wir der Einfachheit halberannehmen, dass D ein achsenparalleles Rechteck in der uv-Ebene ist. Das RechteckD sei in Teilrechtecke Q 1 ,...,Q m zerlegt. Ihre Bilder F(Q 1 ),...,F(Q m ) nennenwir Maschen. Aus diesen Maschen setzt sich das Flächenstück F zusammen.276


vQ iF∆v i000 1100 1100 1100 11∆u iuF000 111000 111000 111000 111000 111F(Q i )Ist die Rechteckzerlegung von D fein genug, so haben die Maschen nahezu dieGestalt eines Parallelogramms. Ist Q i ein Teilrechteck in D mit den Seitenlängen∆u i und ∆v i und ist (u i ,v i ) der linke untere Eckpunkt von Q i , so ist die MascheF(Q i ) ungefähr gleich dem Parallelogramm, das von den VektorenF(u i +∆u i ,v i )−F(u i ,v i ) und F(u i ,v i +∆v i )−F(u i ,v i )aufgespannt wird. Diese Vektoren sind nach Definition der partiellen Ableitungenungefähr gleichF u (u i ,v i )∆u i und F v (u i ,v i )∆v i .Diese beiden Vektoren spannen ein Parallelogramm auf, dessen Flächeninhaltgleich der Länge des Vektorprodukts dieser Vektoren ist, also gleich der Längevon∆σ i := ( F u (u i ,v i )×F v (u i ,v i ) ) ∆u i ∆v i .Man kann daher ‖∆σ i ‖ als ungefähren Flächeninhalt der Masche F(Q i ) ansehenundm∑ m∑‖∆σ i ‖ = ‖F u (u i ,v i )×F v (u i ,v i )‖ ∆u i ∆v i (14.7)i=1i=1als Näherung für den Flächeninhalt des Flächenstückes F. Ist D kein Rechteck,so schöpfen wir D von innen durch rechteckzerlegte Bereiche aus. Lassen wir aufder rechten Seite von (14.7) die Zerlegung immer feiner werden, d.h. lassen wirmax i {∆u i ,∆v i } gegen 0 streben, so gelangen wir zum Integral∫∫‖F u (u,v)×F v (u,v)‖d(u,v).DUm sicherzustellen, dass dies tatsächlich dem Flächeninhalt von F entspricht,müssen wir noch (ähnlich wie bei Kurven) garantieren, dass nicht Teile desFlächenstücks mehrfach durchlaufen werden.Definition 14.3 Die Parameterdarstellung F : D → R 3 und das durch sie definierteFlächenstück heißen doppelpunktfrei, wenn F auf D eineindeutig ist.277


Definition 14.4 Ist F : D → R 3 eine doppelpunktfreie Parameterdarstellungeines Flächenstückes F, so ist der Flächeninhalt von F die Zahl∫∫I(F) = ‖F u (u,v)×F v (u,v)‖ d(u,v). (14.8)DDas Integral in (14.8) schreibt man auch als ∫ dσ, wobei dσ symbolisch fürF‖F u (u,v)×F v (u,v)‖ d(u,v)steht und Flächenelement heißt. Definition 14.4 wird wie folgt verallgemeinert:Definition 14.5 Durch F : D → R 3 sei ein Flächenstück F gegeben, und H :F → R sei stetig auf F. Dann heißt das Integral∫∫H ( F(u,v) ) ∫‖F u (u,v)×F v (u,v)‖d(u,v) =: Hdσ (14.9)Ddas Flächenintegral von H über F (manchmal auch Flächenintegral erster Art).Als Motivation kann man sich ein elektrostatisch geladenes Flächenstück F vorstellen,wobei die Ladungsdichte H in jedem Punkt von F bekannt und die Gesamtladunggesucht ist.Man kann (und muss) sich überlegen, dass die Integrale in (14.8) und (14.9)bei äquivalenten Parametertransformationen und Orientierungswechsel invariantbleiben. Im Falle der Doppelpunktfreiheit ist die Schreibweise rechts in (14.9)völlig eindeutig, da je zwei zugehörige Parameterdarstellungen entweder äquivalentoder entgegengesetzt orientiert sind.Beispiel 7 Seien D und F wie in Beispiel 1 (Kugeloberfläche). Mit Beispiel 4erhalten wir∫∫ ∫ 2π ∫ π/2I(F) = r 2 cosvd(u,v) = r 2 cosvdvdu = 4πr 2Dals Flächeninhalt der Kugeloberfläche.0−π/2Beispiel 8 Sind D, f und F wie in Beispiel 2 (Funktionsgraphen), so ist∫ ∫∫√I(F) = dσ = 1+f2u +fv 2 d(u,v)FDder Flächeninhalt des Funktionsgraphen. Vergleichen Sie dieses Resultat mitder entsprechenden Formel für die Kurvenlänge des Graphen einer Funktionf : [a,b] → R (vgl. Beispiel 2 in Abschnitt 11.2).278F


Definition 14.6 Durch F : D → R 3 sei ein Flächenstück F gegeben, und H :F → R 3 sei ein stetiges Vektorfeld auf F. Dann heißt∫ ∫∫H ·d⃗σ := H ( F(u,v) )·(F u (u,v)×F v (u,v) ) d(u,v) (14.10)FDdas Flächenintegral (zweiter Art) von H über F. (Der Punkt steht für das Skalarprodukt.)Schreiben wirF u (u,v)×F v (u,v) = F u(u,v)×F v (u,v)‖F u (u,v)×F v (u,v)‖ ‖F u(u,v)×F v (u,v)‖= N(u,v)‖F u (u,v)×F v (u,v)‖,so geht das Integral auf der rechten Seite von (14.10) über in∫∫H ( F(u,v) )·N(u,v)‖F u (u,v)×F v (u,v)‖d(u,v), (14.11)Dso dass man das Integral ∫ H ·d⃗σ zweiter Art auch als das Integral ∫ H ·N dσF Ferster Art auffassen kann. Flächenintegrale zweiter Art sind ebenfalls invariantbezüglich äquivalenter Parametertransformationen. Bei einem Orientierungswechseländern sie jedoch ihr Vorzeichen, da die Normalenvektoren ihre Richtungändern.Zur Motivation der Flächenintegrale zweiter Art stellen wir uns ein stationäres(zeitunabhängiges) Geschwindigkeitsfeld V : R 3 → R 3 einer strömenden FlüssigkeitvorundfragennachderFlüssigkeitsmenge,dieeingegebenesFlächenstückFpro Zeiteinheit durchfließt. Sinnvollerweise soll F orientiert sein, d.h. wir könnenuns etwa vorstellen, dass F eine “Unterseite” und eine “Oberseite” hat und dassdie Normalenvektoren in Richtung der Oberseite zeigen.Wie bei der Motivation zum Flächeninhalt denken wir uns F in Maschen unterteilt,die näherungsweise Parallelogrammform haben. Es sei ∆⃗σ i der Flächenvektoreines solchen Parallelogramms ∆F i , d.h. ∆⃗σ i steht senkrecht auf ∆F i undzeigt in Normalenrichtung, und ‖∆⃗σ i ‖ ist gleich dem Flächeninhalt von ∆F i .Dann ist |V(x i )·∆⃗σ i | (mit einem x i ∈ ∆F i ) das Flüssigkeitsvolumen, das näherungsweisepro Zeiteinheit durch ∆F i fließt. Pro Zeiteinheit schiebt sich nämlicheinParallelepipedmitdemGrundflächeninhalt‖∆⃗σ i ‖undderHöhe‖V(x i )‖cosϕ(vgl. die folgende Skizze), d.h. mit dem Volumen‖V(x i )‖‖∆⃗σ i ‖cosϕ = V(x i )·∆⃗σ idurch ∆F i . (In erster Näherung nehmen wir V als konstant auf ∆F i an.)279


∆⃗σ iV(x i )ϕ∆F iFließt die Flüssigkeit aus der Seite von ∆F i heraus, in die der Flächenvektor ∆⃗σ izeigt, so ist V(x i )·∆⃗σ i ≥ 0 und andernfalls ≤ 0. Das Vorzeichen von V(x i )·∆⃗σ igibt also an, in welche Richtung ∆F i durchflossen wird. Die Summation derDurchflüsse über alle Maschen∑V(x i )·∆⃗σ iiund der Übergang zu beliebig kleinen Maschenweiten führen zum Flächenintegral2. Art∫U = V(x)·d⃗σ.FDie Größe |U| gibt also das Gesamtvolumen an, das pro Zeiteinheit das FlächenstückF durchströmt, wobei die Anteile beider Strömungsrichtungen durch Fgegeneinander aufgerechnet sind. Das Vorzeichen von U gibt an, an welcher Seitedes Flächenstücks mehr herausfließt: Ist U > 0, so strömt mehr Flüssigkeitin Richtung der Normalenvektoren von F, ist U < 0, so in entgegengesetzterRichtung. Man nennt U auch den Fluss von V durch F.Beispiel 9 Seien D und F wieder wie in Beispiel 1 (Kugeloberfläche), und seiH : R 3 → R 3 die identische Abbildung, d.h. H(x,y,z) = (x,y,z). Dann ist nachBeispiel 4N(u,v) = (cosucosv,sinucosv,sinv),und mitH ( F(u,v) ) = F(u,v) = (rcosucosv,rsinucosv,rsinv)erhalten wir mit (14.11) für das Flächenintegral 2. Art∫ ∫ ∫ ∫H ·d⃗σ = H ·N dσ = rdσ = rFFDas Flächenintegral ∫ dσ ist gleich dem Flächeninhalt der Kugeloberfläche. WirFhaben es in Beispiel 7 berechnet und erhalten damit∫H ·d⃗σ = 4πr 3 .F280FFdσ.


14.3 Die Divergenz eines VektorfeldesUnsereletztenZieleindiesemKapitelsinddieVerallgemeinerungdesHauptsatzesder Differential- und Integralrechnung∫ baf ′ (x)dx = f(b)−f(a) = f(x) ∣ ∣ b aund der Formel der partiellen Integration∫ ba∫ bu ′ (x)v(x)dx = − u(x)v ′ (x)dx+u(x)v(x) ∣ b aaauf mehrdimensionale Integrale. Es stellt sich die Frage, durch welche Differentialoperatorendie Ableitungen f ′ ,u ′ ,v ′ und wodurch die Randterme f| b a und uv| b azu ersetzen sind.Unser erstes Ziel ist der Gaußsche Integralsatz im R 3 . Seine anschauliche Bedeutungist völlig einleuchtend:Die Flüssigkeitsmenge, die durch die Oberfläche eines räumlichen Gebietesherausströmt, ist gleich der Flüssigkeitsmenge, die die Quellenin diesem Gebiet hervorbringen.Wie kann man die Flüssigkeitsmenge, die eine Quelle im Punkt (x 0 ,y 0 ,z 0 ) ∈ R 3hervorbringt, mathematisch beschreiben? Wir betrachten eine stationäre (zeitunabhängige)Strömung einer inkompressiblen Flüssigkeit (d.h. mit konstanterDichte), die im Punkt (x,y,z) ∈ R 3 die Geschwindigkeit V(x,y,z) = ( V 1 (x,y,z),V 2 (x,y,z), V 3 (x,y,z) ) hat. Im Punkt (x 0 ,y 0 ,z 0 ) heften wir einen kleinen achsenparallelenQuader Q mit den Seitenlängen ∆x,∆y und ∆z an.zy∆x(x 0 ,y 0 ,z 0 )x∆z∆yDannistdasFlüssigkeitsvolumen,dasproZeiteinheitinRichtungderpositivenx-Achse durch die linke bzw. rechte Seitenwand des Quaders fließt, näherungsweisegleichV 1 (x 0 ,y 0 ,z 0 )∆y∆z bzw. V 1 (x 0 +∆x,y 0 ,z 0 )∆y∆z.281


Das Volumen, das pro Zeiteinheit aus dem Quader Q in der positiven x-Richtungaustritt, ist also etwa gleich(V1 (x 0 +∆x,y 0 ,z 0 )−V 1 (x 0 ,y 0 ,z 0 ) ) ∆y∆z= V 1(x 0 +∆x,y 0 ,z 0 )−V 1 (x 0 ,y 0 ,z 0 )∆x≈ ∂V 1∂x (x 0,y 0 ,z 0 )∆x∆y∆z.∆x∆y∆zWir stellen in ähnlicher Weise die Massenbilanz für den Fluß in positiver y- undz-Richtung auf und erhalten als Endresultat, dass das Flüssigkeitsvolumen, daspro Zeiteinheit aus Q austritt, ungefähr gleich( ∂V1∂x (x 0,y 0 ,z 0 )+ ∂V 2∂y (x 0,y 0 ,z 0 )+ ∂V 3∂z (x 0,y 0 ,z 0 )ist. Mit der in Abschnitt 10.2 eingeführten Divergenz)∆x∆y∆z (14.12)(divF)(x) =n∑i=1∂F i∂x i(x), x ∈ Deines stetig differenzierbaren Vektorfeldes F = (F 1 ,...,F n ) : D → R n könnenwir (14.12) schreiben als(divV)(x 0 ,y 0 ,z 0 )∆x∆y∆z.Dividieren wir diesen Wert durch das Volumen ∆x∆y∆z von Q und ziehen wir QaufdenPunkt(x 0 ,y 0 ,z 0 )zusammen,sokönnenwir(divV)(x 0 ,y 0 ,z 0 )alsQuellendichteder Strömung im Punkt (x 0 ,y 0 ,z 0 ) interpretieren. Ist (divV)(x 0 ,y 0 ,z 0 ) >0, so ist (x 0 ,y 0 ,z 0 ) eine Quelle im eigentlichen Sinn (ihr entströmt Flüssigkeit).Im Fall (divV)(x 0 ,y 0 ,z 0 ) < 0 heißt (x 0 ,y 0 ,z 0 ) auch eine Senke (da in diesemPunkt Flüssigkeit verschwindet).Einige Rechenregeln für die Divergenz Sei D ⊆ R n offen, und seien F,G :D → R n und ϕ : D → R stetig differenzierbar. Dann giltdiv(F +G) = divF +divG,div(λF) = λdivF für λ ∈ R,div(ϕF) = ϕdivF +gradϕ·F.14.4 Der Gaußsche Integralsatz im RaumWir können nun die anschauliche Aussage des Gaußschen Integralsatzes in Formelnfassen. Es sei G ein geeigneter räumlicher Bereich und ∂G sein Rand (seine282


Oberfläche). Die genauen Voraussetzungen geben wir später an. In jedem Randpunkthaben wir zwei Normaleneinheitsvektoren: einen, der in den Körper hineinzeigt(die sogenannte innere Normale) und einen, der von G weg zeigt (dieäußere Normale). Es sei N : ∂G → R 3 das Vektorfeld der äußeren Einheitsnormalen.Weiter sei V das Geschwindigkeitsfeld einer inkompressiblen Flüssigkeit.Nach Abschnitt 14.2 (Interpretation des Flächeninhalts 2. Art) ist der Durchflußdurch ∂G in Richtung der äußeren Normalen (also das, was aus G herausfließt),gleich∫∫V ·N dσ. (14.13)∂GDie durch Quellen und Senken in G hervorgebrachte Flüssigkeitsmenge erhaltenwir dagegen durch Aufintegrieren der Quellendichte über G:∫∫∫(divV)(x)dx. (14.14)GNach dem Gaußschen Integralsatz sind die Integrale (14.13) und (14.14) gleich.Nun zur exakten Formulierung.Definition 14.7 a) Eine Menge G ⊆ R 3 heißt C 1 -Normalbereich bzgl. derx 1 x 2 -Ebene, wenn es eine kompakte Menge K ⊆ R 2 und stetig differenzierbareFunktionen ϕ 1 ,ϕ 2 : K → R so gibt, dass{}G = (x 1 ,x 2 ,x 3 ) ∈ R 3 : (x 1 ,x 2 ) ∈ K, ϕ 1 (x 1 ,x 2 ) ≤ x 3 ≤ ϕ 2 (x 1 ,x 2 )gilt und dass der Rand ∂K durch einen stückweise stetig differenzierbarenWeg darstellbar ist. Analog erklärt man C 1 -Normalbereiche bezüglich derx 2 x 3 - und x 1 x 3 -Ebene.b) Die Menge G heißt ein C 1 -Normalbereich, wenn sie ein C 1 -Normalbereichbezüglich der x 1 x 2 -, der x 2 x 3 - und der x 1 x 3 -Ebene ist.(Es sei noch einmal an unsere Vereinbarung erinnert: Eine Funktion f : K → RaufeinerkompaktenMengeK heißtstetigdifferenzierbar,wennsiezueinerstetigdifferenzierbaren Funktion auf einer offenen Menge G ⊇ K fortgesetzt werdenkann.)Einen C 1 -Normalbereich bzgl. der x 1 x 2 -Ebene kann man sich so vorstellen:283


x 3S 2 = Graph von ϕ 2GS 1 = Graph von ϕ 1x 2x 1KDer obere Deckel S 2 ist ein Flächenstück im R 3 mit der ParameterdarstellungF 2 : K → R 3 , (x 1 ,x 2 ) ↦→ ( x 1 ,x 2 ,ϕ(x 1 ,x 2 ) ) .Der durch F 2 bestimmte Normaleneinheitsvektor (vgl. Beispiel 5 aus 14.1)(1N 2 (u,v) = √ (∂ϕ2 ) 2 (∂x 1+∂ϕ2) − ∂ϕ 2,− ∂ϕ )2,12∂x 2+1∂x 1 ∂x 2ist der äußere Normaleneinheitsvektor für G (da die z-Komponente > 0 ist). Deruntere Deckel S 1 wird beschrieben durchF 1 : K → R 3 , (x 1 ,x 2 ) ↦→ ( x 1 ,x 2 ,ϕ 1 (x 1 ,x 2 ) ) ,und der zugehörigen Normaleneinheitsvektor istN 1 (u,v) =1(√ ( ) 2 ( ) 2∂ϕ 1∂x 1+∂ϕ 1∂x 2+1− ∂ϕ 1, − ∂ϕ )1, 1 .∂x 1 ∂x 2Dieser zeigt ebenfalls in Richtung der positiven z-Achse (also in G hinein), sodass der äußere Normalenvektor an G auf S 1 gleich −N 1 (u,v) ist.Satz 14.8 (Gaußscher Integralsatz im R 3 ) Sei G ⊆ R 3 ein C 1 -Normalbereichund H : G → R 3 ein stetig differenzierbares Vektorfeld. Weiter bezeichneN : ∂G → R 3 das äußere Normalenfeld von G. Dann ist∫∫∫ ∫∫(divH)(x)dx = H ·Ndσ. (14.15)G∂GBeweis Es genügt, die Aussage zu beweisen, wenn H die Gestalt H = (0,0,H 3 ) That(mankannjaH alsSummedreierderartigerAusdrückeschreiben,unddieDivergenzsowie die Integrale in (14.15) sind linear in H). Nach Satz 13.34 erhalten284


wir wegen divH = ∂H 3∂x 3∫∫∫(divH)(x)dx =G∫∫=KAuf dem oberen Deckel S 2 ist∫∫K( ∫ ϕ 2 (x 1 ,x 2 )ϕ 1 (x 1 ,x 2 )∂H)3(x 1 ,x 2 ,x 3 )dx 3 d(x 1 ,x 2 )∂x 3(H 3(x1 ,x 2 ,ϕ 2 (x 1 ,x 2 ) ) −H 3(x1 ,x 2 ,ϕ 1 (x 1 ,x 2 ) )) d(x 1 ,x 2 ).H ·N =1√ ( ) 2 ( ) H 3 2∂ϕ 2∂x 1+∂ϕ 2∂x 2+1und damit∫∫H 3(x1 ,x 2 ,ϕ 2 (x 1 ,x 2 ) ) d(x 1 ,x 2 )K∫∫=K∫∫=(H ·N)H ·N dσ.√ (∂ϕ2∂x 1) 2+( ∂ϕ2∂x 2) 2+1d(x 1 ,x 2 )S 2Analog zeigt man, dass∫∫(− H 3 x1 ,x 2 ,ϕ 1 (x 1 ,x 2 ) ) ∫∫d(x 1 ,x 2 ) =H ·N dσ.KS 1Auf dem noch fehlenden Randstück ∂G\(S 1 ∪S 2 ) von G, also aufS 3 := {(x 1 ,x 2 ,x 3 ) ∈ R 3 : (x 1 ,x 2 ) ∈ ∂K, ϕ 1 (x 1 ,x 2 ) ≤ x 3 ≤ ϕ 2 (x 1 ,x 2 )},existiert der äußere Normalenvektor N ebenfalls (bis auf endlich viele Geradenstücke{y} × [ϕ 1 (y),ϕ 2 (y)] mit y ∈ ∂K, in denen die Parametrisierung von∂K nicht differenzierbar ist), und die Komponente von N in x 3 -Richtung ist 0.Daher ist H ·N = 0 auf S 3 . Zusammengefasst erhalten wir∫∫∫G(divH)(x)dx =3∑∫∫ ∫∫H ·N dσ =S jj=1∂GH ·N dσ.Beispiel 1 Wir kommen noch einmal zurück auf Beispiel 9 aus 14.2. Dort warenD und F wie in Beispiel 1 aus 14.1 (Kugeloberfläche) und H(x,y,z) = (x,y,z),285


und wir haben erhalten, dass∫∫ ∫∫H ·d⃗σ =H ·N dσ = 4πr 3 .∂G∂GAndererseits ist divH = 3, so dass mit dem Volumen V der Kugel G gilt∫∫∫ ∫∫∫(divH)(x)dx = 3 dx = 3V.GGDer Gaußsche Satz liefert nach GleichsetzenV = 4 3 πr3 .Folgerung 14.9 (Partielle Integration in R 3 ) Sei G ⊆ R 3 ein C 1 -Normalbereichund f,g : G → R seien stetig differenzierbare Funktionen. Weiter seiN = (N 1 ,N 2 ,N 3 ) : ∂G → R das äußere Normalenfeld an G. Dann gilt füri = 1,2,3∫∫∫Gf ∂g ∫∫∫dx = −∂x iG∫∫∂fgdx+∂x iBeweis Sei z.B. i = 1. Für die stetig differenzierbare Funktionist∂GfgN i dσ. (14.16)F : G → R 3 , F(x) = ( f(x)g(x),0,0) (14.17)divF = ∂(fg)∂x 1= ∂f∂x 1g +f ∂g∂x 1und F · N = fgN 1 . Die Behauptung folgt also sofort, wenn man die Funktion(14.17) in den Gaußschen Integralsatz (14.15) einsetzt.G∂GAnmerkung 1 Wir haben in Satz 14.8 und Folgerung 14.9 statt ∫ und ∫ die G ∂GSchreibweisen ∫∫∫und ∫∫benutzt, um deutlich zu machen, dass (dreidimensionale)Volumenintegrale und (zweidimensionale) Oberflächenintegrale auftreten.Anmerkung 2 Sind F 1 ,...,F n Flächenstücke, die sich nicht überlappen, so definiertman das Flächenintegral über F = F 1 ∪...∪F n durch∫ ∫= +...+F F 1∫Dies haben wir im Beweis des Gaußschen Satzes benutzt (∂G = S 1 ∪S 2 ∪S 3 ).F n.286


Anmerkung 3Satz14.8undFolgerung14.9geltenauchnochunterschwächerenVoraussetzungen. Z.B. genügt es, dass sich G als endliche Vereinigung sich nichtüberlappender C 1 -Normalbereiche schreiben läßt. Man beachte auch, dass derNormalenvektor nicht in jedem Randpunkt definiert ist (z.B. nicht entlang derKanten eines Quaders).14.5 Der Gaußsche Integralsatz in der EbeneDer Gaußsche Integralsatz und seine Folgerung gelten (bei geeigneter Definitiondes Flächenintegrals) in jeder Raumdimension n. Den Gaußschen Integralsatz imR 2 kann man durch geeignete Reduzierung um eine Koordinate wie folgt aus demGaußschen Integralsatz im R 3 gewinnen.Sei D ⊆ R 2 ein Normalbereich bezüglich der x 1 - und der x 2 -Achse (vgl. Definition14.8). In diesem Fall nennen wir D einfach einen Normalbereich. Der Rand ∂Dsei eine geschlossene Kurve, die durch einen stückweise stetig differenzierbarenWeg X : [a,b] → R 2 parametrisiert wird. Durchläuft t das Intervall [a,b] vona nach b, so wandert X(t) entlang ∂G in einer bestimmten Richtung, und wirwollen annehmen, dass dabei G stets links des Weges liegt. Man sagt auch, dassD vom Weg X positiv umlaufen wird oder dass der Rand ∂D positiv orientiertist (anschaulich: im Gegenuhrzeigersinn).DerTangentialvektoran∂DimPunktX(t) = ( X 1 (t),X 2 (t) ) istT := ( Ẋ 1 (t),Ẋ 2 (t) ) ,und N := ( Ẋ 2 (t),−Ẋ1(t) ) ist ein auf T senkrecht stehender Vektor, der nach außenzeigt.∂DDT = Ẋ(t)NManbeachte,dassdieseVektorennurinPunktendefiniertsind,indenenX stetigdifferenzierbar ist. Auf D sei ein stetig differenzierbares VektorfeldV = (V 1 ,V 2 ) T : D → R 2gegeben. Wir bilden aus D den räumlichen Bereich˜D := D×[0,1] = {(x 1 ,x 2 ,x 3 ) ∈ R 3 : (x 1 ,x 2 ) ∈ D,x 3 ∈ [0,1]},d.h. ˜D ist eine Scheibe (= ein Zylinder) der Dicke 1, bei dem Boden und Deckeldie Form von D haben. Offenbar ist ˜D ein Normalbereich im R 3 .287


˜DDMAußerdem erweitern wir V um eine Komponente:Ṽ : ˜D → R 3 , Ṽ(x 1 ,x 2 ,x 3 ) := ( V 1 (x 1 ,x 2 ),V 2 (x 1 ,x 2 ),0 ) T.Der Gaußsche Integralsatz (14.15), angewandt auf ˜D und Ṽ, liefert∫∫ ∫∫∫Ṽ ·N dσ = divṼ dx. (14.18)∂ ˜DBeim Flächenintegral auf der linken Seite heben sich die Anteile des Bodensund des Deckels weg, da die zugehörigen Normalenvektoren entgegengesetzt sind,sonst jedoch alles gleich ist. Es ist insbesondere Ṽ(x 1,x 2 ,0) = Ṽ(x 1,x 2 ,1). Alsoverbleibt nur das Integral über die Mantelfläche M = ∂D × [0,1]. Aus (14.18)folgt somit ∫∫ ∫∫∫Ṽ ·N dσ = divṼ dx. (14.19)MDie Mantelfläche hat eine Parameterdarstellung F : [a,b]×[0,1] := M → R 3 ,˜D˜DF(t,z) = ( X 1 (t),X 2 (t),z ) Tmit t ∈ [a,b],z ∈ [0,1],worausmandenäußeren(abernochnichtnormierten!)NormalenvektorimPunktF(t,z)n(F(t,z)) = ( Ẋ 2 (t),−Ẋ1(t),0 ) Terhält. Mit (14.11) erhalten wir für die linke Seite von (14.19)∫∫ ∫∫Ṽ ·N dσ = Ṽ ·n 1‖n‖ dσM(14.11)=M∫∫Ṽ ( F(t,z) )·n ( F(t,z) ) d(t,z)==[a,b]×[0,1]∫ 1 ∫ b0∫ baa(V1(X(t)),V2(X(t)),0)·(Ẋ2 (t),−Ẋ1(t),0 ) dtdz(V 1(X(t))Ẋ2 (t)−V 2(X(t))Ẋ1 (t))dt,288


während auf der rechten Seite von (14.19)ist. Daher ist∫∫∫divṼ d(x 1,x 2 ,x 3 ) =˜DdivṼ = ∂V 1∂x 1+ ∂V 2∂x 2= divV∫ 10∫∫D∫∫divV d(x 1 ,x 2 )dx 3 =DdivV d(x 1 ,x 2 ).Zusammengefaßt erhalten wirSatz 14.10 (Gaußscher Integralsatz im R 2 ) Sei D ⊆ R 2 ein Normalbereich(bzgl. der x 1 - und der x 2 -Achse), dessen Rand ∂D durch einen stückweise stetigdifferenzierbaren Weg X = (X 1 ,X 2 ) T : [a,b] → R 2 parametrisiert wird, der Dpositiv umläuft. Weiter sei V = (V 1 ,V 2 ) T : D → R 2 ein stetig differenzierbaresVektorfeld. Dann gilt∫ ba( ( ( )V 1 X(t))Ẋ2 (t)−V 2 X(t))Ẋ1 (t) dt =∫∫D(divV)(x)dx. (14.20)Man beachte, dass auf der linken Seite von (14.20) ein Wegintegral entlang desWeges X steht. Nehmen wir die UmbenennungW 1 := V 2 , W 2 := −V 1 , W := (W 1 ,W 2 ) Tvor, so geht nach Multiplikation mit −1 die linke Seite von (14.20) über in∫ ba( ( ( )W 1 X(t))Ẋ1 (t)+W 2 X(t))Ẋ2 (t) dt,d.h. in das Wegintegral ∫ W ·dX über den durch X parametrisierten Rand von∂DD, und auf der rechten Seite von (14.20) ist −divV = − ∂V 1∂x 1− ∂V 2∂x 2zu ersetzendurch ∂W 2∂x 1− ∂W 1∂x 2. Man schreibt oftrotW := ∂W 2∂x 1− ∂W 1∂x 2(14.21)und nennt rotW die (skalarwertige) Rotation des Vektorfeldes W = (W 1 ,W 2 ) T .MitdiesenBezeichnungenerhaltenwirdiefolgendeVersiondesGaußschenSatzesim R 2 .Satz 14.11 (Greenscher Integralsatz) Seien D und X wie in Satz 14.10, undW = (W 1 ,W 2 ) T : D → R 2 sei ein stetig differenzierbares Vektorfeld. Dann ist∫ ∫ ( ∂W2W ·dX = − ∂W ) ∫1d(x 1 ,x 2 ) = (rotW)(x)dx.∂x 1 ∂x 2∂ΩD289D


Die Sätze 14.10 und 14.11 gelten auch unter allgemeineren Bedingungen andie Menge D. Z.B. darf D die Abschließung eines beschränkten einfach zusammenhängendenGebietes sein, dessen Rand sich durch einen stückweise stetig differenzierbarenWeg parametrisieren läßt. Es genügt sogar, dass D sich in endlichviele derartige Mengen zerlegen läßt.DD 1 D 2 D 3Man beachte die Orientierung des (aus mehreren Stücken bestehenden) Randes.14.6 Der Stokessche IntegralsatzWir beginnen mit einer kurzen Motivation. Sei M ⊆ R 3 offen und V : M →R 3 ein stetig differenzierbares Vektorfeld, das wir als Geschwindigkeitsfeld einerströmenden Flüssigkeit deuten. In M sei ein Flächenstück F gegeben, dessenRand durch einen stückweise stetig differenzierbaren und doppelpunktfreien WegY : [a,b] → R 3 parametrisiert wird. Unter der Zirkulation von V entlang ∂Fversteht man das Kurvenintegral∫∂FV ·dY =∫ bDenkt man sich dieses Integral durch Riemann-Summen∑V(Y j )·∆Y ija3∑ (V i Y(t))Ẏi (t)dt. (14.22)i=1approximiert, so entspricht jeder Summand V(Y i )·∆Y i einer Geschwindigkeitskomponentenin der Durchlaufrichtung der Kurve. Die Summation dieser Komponentenist ein Maß dafür, wie stark die Kurve ∂F umströmt wird, d.h. wiestark die Flüssigkeit längs der Kurve zirkuliert.290


∂FV∆Y i V(Yi )Wir zerlegen das Flächenstück F in endlich viele kleine Maschen F i .F iFBei entsprechender Orientierung der Ränder der F i erhalten wir für die Zirkulation∫V ·dY = ∑∂F i∫∂F iV ·dY = ∑ i∫1V ·dY ·I(F i ), (14.23)I(F i ) ∂F iwobei I(F i ) für den Flächeninhalt von F i steht. Nun verfeinern wir die Maschen.Man kann zeigen (vgl. Burg/Haf/Wille IV, S. 156-158): Wenn man eine MascheF i auf einen Punkt x i ∈ F zusammenzieht, dann strebt der Quotient1I(F i )∫∂F iV ·dY (14.24)gegen einen festen Wert, nämlich gegen (rotV)(x i )·N(x i ). Dieser Ausdruck heißtauch die Wirbelstärke von V in x i . Hierbei ist N(x i ) die gemeinsame Flächennormaleder zu x i zusammengezogenen Maschen, und die Rotation rotV ist wie inAbschnitt 10.2 durch( ∂F3(rotF)(x) = (x)− ∂F 2(x), ∂F 1(x)− ∂F 3(x), ∂F 2(x)− ∂F ) T1(x)∂x 2 ∂x 3 ∂x 3 ∂x 1 ∂x 1 ∂x 2erklärt.Man beachte, dass man für ein Vektorfeld der GestaltF(x 1 ,x 2 ,x 3 ) = ( F 1 (x 1 ,x 2 ), F 2 (x 1 ,x 2 ), 0 )291


alsRotationgeradedasVektorfeld ( 0,0,rot(F 1 ,F 2 ) ) mitderin(14.21)eingeführtenRotation eines zweidimensionalen Vektorfeldes erhält.Für kleine ∆F i können wir also (14.24) näherungsweise durch(rotV)(x i )·N(x i )ersetzen, und aus (14.23) wird∫∂FV ·dY ≈ ∑ i(rotV)(x i )·N(x i )I(F i ). (14.25)Die rechte Seite ist eine Riemannsumme für das Flächenintegral∫rotV ·N dσ.FDer folgende Satz von Stokes sagt, dass unter geeigneten Voraussetzungen anF die Zirkulation ∫ V ·dY tatsächlich gleich diesem Flächenintegral über die∂FWirbelstärken ist.Satz 14.12 (Stokes’scher Integralsatz) Sei D ⊆ R 2 ein Normalbereich, dessenRand∂D durcheinenstückweisestetigdifferenzierbarenWegX = (X 1 ,X 2 ) T :[a,b] → R 2 parametrisiert wird, der D einmal positiv umläuft. Weiter sei F :D → R 3 eine zweimal stetig differenzierbare Abbildung, die ein FlächenstückF = F(D) parametrisiert. Der Weg Y : [a,b] → R 3 , Y(t) = F ( X(t) ) definierteine orientierte Kurve in F, die wir den Rand ∂F von F nennen. Schließlich seiN : F → R 3 das durch F wie in (14.6) festgelegte Normalenfeld. Dann gilt fürjedes stetig differenzierbare Vektorfeld H : F → R 3∫ ∫rotH ·N dσ = H ·dY. (14.26)FBeweis Es genügt, ein Vektorfeld H vom Typ (P,0,0) T zu betrachten. Der Beweisfür H = (0,Q,0) T und H = (0,0,R) T verläuft analog. Zuerst schreiben wirdas Kurvenintegral ∫ H·dY über der Kurve ∂F in ein Kurvenintegral über ∂D∂Fum:∫ ∫ b(P,0,0) T ·dY = P ( Y(t) ) Ẏ 1 (t)dt∂F===a∫ ba∫ b∫a∂D∂FP ( F ( X(t) )) (F 1 ◦X) ′ (t)dt)Ẋ 2 (t)∂x 2P ( F ( X(t) ))( ∂F 1Ẋ 1 (t)+ ∂F 1∂x(1(P ◦F)· ∂F 1, (P ◦F)· ∂F )1·dX,∂x 1 ∂x 2292dt


wobei wir in der dritten Zeile die Kettenregel benutzt haben. Nach Satz 14.11(Greenscher Integralsatz) ist dieses Integral gleich∫ (rot (P ◦F) ∂F 1, (P ◦F) ∂F )1(x)dx. (14.27)∂x 1 ∂x 2DWir berechnen die skalare (zweidimensionale) Rotation nach (14.21)(rot (P ◦F) ∂F 1, (P ◦F) ∂F )1∂x 1 ∂x 2= ∂ ((P ◦F) ∂F )1− ∂ ((P ◦F) ∂F )1∂x 1 ∂x 2 ∂x 2 ∂x 1=∂(P ◦F)∂x 1∂F 1∂x 2−∂(P ◦F)∂x 2∂F 1∂x 1+(P ◦F)( ) ∂ 2 F 1− ∂2 F 1,∂x 2 ∂x 1 ∂x 1 ∂x 2wobei wir die Produktregel benutzt haben. Der letzte Summand ist nach demSatz von Schwarz gleich 0. Mit der Kettenregel erhalten wir für die ersten beidenSummanden( ∂P ∂F 1+ ∂P ∂F 2+ ∂P )∂F 3 ∂F1−∂x 1 ∂x 1 ∂x 2 ∂x 1 ∂x 3 ∂x 1 ∂x 2−( ∂P∂x 1∂F 1∂x 2+ ∂P∂x 2∂F 2∂x 2+ ∂P∂x 3∂F 3∂x 2) ∂F1∂x 1= ∂P ( ∂F3 ∂F 1− ∂F )3 ∂F 1− ∂P ( ∂F1 ∂F 2− ∂F )2 ∂F 1.∂x 3 ∂x 1 ∂x 2 ∂x 2 ∂x 1 ∂x 2 ∂x 1 ∂x 2 ∂x 1 ∂x 2(∂F 1∂x 1, ∂F 2∂x 1, ∂F 3(∂F 1∂x 2, ∂F 2∂x 2, ∂F 3∂x 2), d.h. N =Sei n = (n 1 ,n 2 ,n 3 ) = ∂F∂x 1× ∂F∂x 2=∂x 1)×n/‖n‖ ist der Normaleneinheitsvektor zu F (vgl. (14.6)). Nach Definition desVektorprodukts istn 2 = ∂F 3∂x 1∂F 1∂x 2− ∂F 3∂x 2∂F 1∂x 1und n 3 = ∂F 1∂x 1∂F 2∂x 2− ∂F 2∂x 1∂F 1∂x 2und damit zusammengefasst(rot (P ◦F) ∂F 1, (P ◦F) ∂F )1= ∂P n 2 − ∂P n 3 . (14.28)∂x 1 ∂x 2 ∂x 3 ∂x 2Wegen rotH = rot(P,0,0) T =rot(0, ∂P∂x 3, − ∂P∂x 2) Tkönnen wir (14.28) schreiben als((P ◦F) ∂F 1, (P ◦F) ∂F )1= ( (rotH)◦F )·n.∂x 1 ∂x 2293


Wir setzen dies in (14.27) ein und erhalten schließlich∫ ∫ (H ·dY = rot (P ◦F) ∂F 1, (P ◦F) ∂F )1dx∂F D ∂x 1 ∂x∫2( )= (rotH)◦F (x)·ndxD∫ ∫= rotH ·d⃗σ = rotH ·N dσnach der Definition 14.6 des Flächenintegrals.FBeispiel 2 Sei D = {(u,v) ∈ R 2 : u ∈ [0,2π], v ∈ [0,π/2]}, r > 0 undF : R 2 → R 3 , F(u,v) = (rcosucosv, rsinucosv, rsinv).Das Flächenstück F(D) ist die obere Halbkugelfläche um den Ursprung mit demRadius r. Ein Vektorfeld H sei durchH : R 3 → R 3 , H(x,y,z) = (−y,x,1)gegeben. Der Rand ∂D des Rechtecks D läßt sich durch 4 Wege beschreiben:X 1 (t) = (t,0)X 2 (t) = (2π,t)Fmit t ∈ [0,2π],mit t ∈ [0,π/2],X 3 (t) = (−t,π/2) mit t ∈ [−2π,0],X 4 (t) = (0,−t)mit t ∈ [−π/2,0].Die zugehörigen Parameterdarstellungen Y k (t) = F ( X k (t) ) , k = 1,...,4, für dieKurve ∂F(D) sindY 1 (t) = (rcost, rsint,0)Y 2 (t) = (rcost,0,rsint)Y 3 (t) = (0,0,r)mit t ∈ [0,2π],mit t ∈ [0,π/2],mit t ∈ [−2π,0],Y 4 (t) = (rcost,0,−rsint) mit t ∈ [−π/2,0].vX 4X 3X 1DX 2uFY 2xzY 4Y 3Y 1y294


(Man beachte, dass F(∂D) nicht mit der Kreislinie in der xy-Ebene zusammenfällt!)Nun ist∫∂F(D)H ·dY =∫ 2π+0∫ 0H ( Y 1 (t) )·Ẏ1(t)dt+−2πWir berechnen das erste Integral:H ( Y 3 (t) )·Ẏ3(t)dt+∫ π/20∫ 0H ( Y 2 (t) )·Ẏ2(t)dt−π/2H ( Y 4 (t) )·Ẏ4(t)dt.∫ 2π0H ( Y 1 (t) )·Ẏ1(t)dt ==∫ 2π0∫ 2π0(−rsint, rcost, 1)·(−rsint, rcost, 0)dt(r 2 sin 2 t+r 2 cos 2 t)dt = 2πr 2 .Das dritte Integral ist wegen Ẏ3 = 0 gleich 0, und das zweite und vierte Integralheben sich gegenseitig auf (dies ist auch sofort klar, wenn man sich die WegeY 2 ,Y 3 und Y 4 ansieht). Also ist∫H ·dY = 2πr 2 .∂F(D)Nach dem Satz von Stokes ist dann auch ∫∫F(D)Übung nachrechnen. Zunächst ist rotH = (0,0,2) undrotH · N dσ = 2πr 2 , was wir zurN = (cosucosv,sinucosv,sinv) sowie ‖F u ×F v ‖ = r 2 cosvnach Beispiel 4 aus Abschnitt 14.1. Damit wird∫∫rotH ·N dσ = ∫∫(rotH) ( F(u,v) )·N(u,v)‖F u ×F v ‖d(u,v)F(D)D= ∫∫2sinv ·r 2 cosvd(u,v)D= r 2∫ 2π0∫ π/20sin2vdvdu = 2πr 2 .Auch der Satz von Stokes läßt sich unter schwächeren Voraussetzungen zeigen.Wir vermerken noch eine interessante Konsequenz des Stokes’schen Satzes.Folgerung 14.13 Sei B ein stückweise glatt berandeter Bereich im R 3 und H :B → R 3 stetig differenzierbar. Dann ist∫∫rotH ·N dσ = 0.∂B295


Kurz gesagt: Der Wirbelfluß durch eine geschlossene Fläche ist Null.Zum Beweis schneidet man einfach aus ∂B ein kleines geeignetes FlächenstückF heraus. Auf der verbleibenden Fläche ist nach Stokes∫∫ ∫rotH ·N dσ = H ·dX.∂B\FZieht man F auf einen Punkt zusammen, so geht das Integral auf der rechtenSeite gegen Null, da die Weglänge von ∂F gegen Null stebt.14.7 Einige weitere Differential- und Integralformeln14.7.1 Der Nabla-OperatorDer symbolische Vektor ∇ = ( ∂∂x , ∂∂y , ∂ ∂z)heißt Nabla-Operator. Formal rechnetman mit ihm wie mit einem Vektor aus R 3 . In diesem Sinne ist also für stetigdifferenzierbare Vektorfelder V und Skalarfelder ϕ∂F∇ϕ = gradϕ∇·F = divF∇×F = rotF.Ist das Skalarfeld ϕ zweimal stetig differenzierbar, so erhält man(∇·∇)ϕ = ∇·gradϕ = ϕ xx +ϕ yy +ϕ zz .Der Operatorheißt Laplace-Operator.∆ := ∇·∇ = ∂2∂x 2 + ∂2∂y 2 + ∂2∂z 214.7.2 Mehrfache Anwendungen der DifferentialoperatorenDas Vektorfeld F und das Skalarfeld ϕ seien zweimal stetig differenzierbar. DanngiltdivrotF = 0, (14.29)rotgradϕ = 0, (14.30)divgradϕ = ∆ϕ. (14.31)Man rechnet dies mit dem Satz von Schwarz leicht nach. Die ersten beiden Formelnbesagen: Wirbelfelder sind divergenzfrei und Gradientenfelder sind wirbelfrei.296


14.7.3 ProduktregelnDie Vektorfelder F, G und die Skalarfelder ϕ, ψ seien stetig differenzierbar. Danngelten z.B. die folgenden Produktregeln, die man leicht nachrechnet:grad(ϕψ) = ϕgradψ +ψgradϕ, (14.32)div(ϕF) = ϕdivF +F ·gradϕ, (14.33)rot(ϕF) = ϕrotF +gradϕ×F, (14.34)div(F ×G) = G ·rotF −F ·rotG. (14.35)Weitere Beziehungen finden Sie in der Literatur.14.7.4 Die Greenschen FormelnEs sei G wie im Gaußschen Integralsatz im Raum (Satz 14.8), und f,g : G → Rseien so oft stetig differenzierbar, wie es die folgenden Formeln verlangen. AusFormel (14.33) (mit F = gradg) erhalten wirdiv(fgradg) = f∆g +gradf ·gradg,wobei wir noch (14.31) benutzt haben. Integration über G und Anwendung desGaußschen Integralsatzes auf der linken Seite liefern∫∫ ∫∫∫fgradg ·N dσ = (f∆g +gradf ·gradg)dx∂Gmit dem äußeren Normalenvektor N an ∂G. Mit der RichtungsableitungG∂g= gradg ·N∂N(vgl. Abschnitt 10.4) erhalten wir die erste Greensche Integralformel∫∫f ∂g ∫∫∫∂N dσ = (f∆g +gradf ·gradg)dx. (14.36)∂GGVertauscht man hierin f mit g und subtrahiert die erhaltene Formel von (14.36),so erhält man die zweite Greensche Integralformel∫∫ (f ∂g ) ∫∫∫∂f−g dσ = (f∆g −g∆f)dx. (14.37)∂N ∂N∂GIm Spezialfall g = 1 folgt hieraus∫∫ ∫∫∫∂f∂N dσ = ∆fdx. (14.38)∂GMankannRaumintegraleüberLaplacescheDifferentialausdrücke∆f alsoinFlächenintegraleumschreiben. Die Greenschen Formeln sind außerordentlich nützlichbeim Studium von partiellen Differentialgleichungen.GG297

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!