7.5. Mittelwertsatz und höhere Ableitungen

7.5. Mittelwertsatz und höhere Ableitungen 

Wir betrachten wieder eine Funktion f von einer Teilmenge A der Ebene R 2 (oder eines höher 

dimensionalen Raumes R n ) nach R. Besonders nützlich ist der 

Mittelwertsatz 

Ist die Funktion f auf der ganzen Strecke zwischen zwei Punkten a und b differenzierbar in 

Richtung v = b − a, so gibt es einen Punkt u = a + t ( b − a ) auf dieser Strecke mit 

∂ 

f( b ) − f( a ) = 

∂v f( u ), 

und falls f auf dieser Strecke total differenzierbar ist, so gilt 

f( b ) − f( a ) = f ´ ( u ) ( b − a ). 

Bei dem letzten Ausdruck ist im mehrdimensionalen Fall wieder das Skalarprodukt gemeint. 

Bevor wir einen etwas allgemeineren Satz beweisen, betrachten wir den eindimensionalen Fall. 

Hier besagt der Mittelwertsatz: 

Die Sekante zwischen den Punkten ( a , f( a )) und ( b , f( b )) 

( f( b ) − f( a )) 

( x − a) 

S ab 

( x ) = f( a) 

+ 

b − a 

ist parallel zur Tangente im Zwischenpunkt ( u , f( u )) 

T u 

( x ) = f( u ) + f ´ ( u ) ( x − u) 

Beispiel 1: Kubische Parabel, Sekante und Tangente 

Die Funktion 

f( x ) = x 3 

hat zwischen den Punkten ( a, 

a 3 ) und ( b, 

b 3 ) die Sekante 

da S ab 

( a) 

= a 3 und S ab 

( b ) = b 3 . 

S , 

Im Punkt ( u, 

u 3 ) hat f die Tangente 

a b 

( x ) = ( a 2 + a b + b 2 ) x − a 2 b − a b 2 

T u 

( x ) = u 3 + 3 u 2 ( x − u ) 

Diese beiden Geraden sind genau dann parallel, wenn die Steigungen gleich sind: 

also für 

a 2 + a b + b 2 = 3 u 2 

a 2 + a b + b 2 

u = 

3 

Das ist die (oder zumindest eine) Stelle, an der die Aussage des Mittelwertsatzes zutrifft. 

Im Allgemeinen gelingt es aber nicht, solche Zwischenstellen explizit anzugeben!

Im zweidimensionalen Fall bedeutet der Mittelwertsatz geometrisch, daß für differenzierbare 

Funktionen der Verbindungsvektor zwischen je zwei Punkten des Funktionsgebirges parallel zur 

Tangente in einem Punkt über oder unter der Verbindungsstrecke ist. 

Verallgemeinerter Mittelwertsatz 

Zu zwei auf der Strecke zwischen a und b stetigen und im Inneren der Strecke differenzierbaren 

Funktionen f und g gibt es ein u zwischen a und b mit 

g´ ( u ) ( f( b ) − f( a )) 

= f´ ( u ) ( g( b ) − g( a )). 

Zum Beweis betrachtet man die folgende etwas kompliziert aussehende Funktion h : 

Es ist 

h( t ) = g ( a + t ( b − a )) 

( f( b ) − f( a )) 

− f ( a + t ( b − a ) ) ( g( b ) − g( a ) ) 

h( 0 ) = h( 1 ) = 

g( a ) ( ) 

f b − f( a ) g( b ). 

Als stetige Funktion hat h auf dem kompakten Intervall [ 0, 

1 ] ein Extremum, und wegen 

h( 0 ) = h( 1 ) wird ein solches im Inneren des Intervalls angenommen, etwa bei t (mit 0 < t < 1). 

Dort muß die Ableitung dann 0 sein (sonst hätte man eine von Null verschiedene Steigung und 

daher kein Extremum). Also ist für u = a + t ( b − a ) nach der Kettenregel 

0 = h´ ( t ) = g´ ( u ) ( f( b ) − f( a )) 

( b − a ) − f´ ( u ) ( g( b ) − g( a ) ) ( b − a ) . 

Für a ≠ b folgt daraus die Behauptung. Bei richtiger Interpretation mittels Skalarprodukten 

funktioniert diese Argumentation auch in höheren Dimensionen. 

Die spezielle Wahl g( x) 

= x liefert sofort den Mittelwertsatz in der klassischen Form, sofern f auf 

der Strecke von a bis b total differenzierbar ist. Falls nur die Existenz der Richtungsableitungen 

nach v = b − a gesichert ist, kann man den mehrdimensionalen auf den eindimensionalen Fall 

zurückführen, indem man die Funktion g( t ) = f ( a + t v ) für t zwischen 0 und 1 betrachtet. Es gibt 

dann eine Zwischenstelle z , so daß für u = a + z v gilt: 

g( 1 ) − g( 0 ) = g´ ( z ) = lim 

h → 0 

f ( u + h v ) − f( u ) 

∂ 

, d.h. f( b ) − f( a ) = 

h 

∂v f( u ) .

Stetige Differenzierbarkeit 

Während eine total differenzierbare Funktion stets auch partiell differenzierbar und stetig ist, gilt 

die Umkehrung im Allgemeinen nicht, wie wir am Beispiel homogener, aber nicht linearer 

Funktionen sahen. Ist jedoch nicht nur die Funktion f selbst, sondern auch jede ihrer partiellen 

Ableitungen stetig, so nennt man f stetig differenzierbar und kann in diesem Fall auf totale 

Differenzierbarkeit schließen: 

Differenzierbarkeitskriterium 

Existieren in einer Umgebung des Punktes a alle n partiellen Ableitungen und sind diese in a 

stetig, so ist f in a sogar total differenzierbar. 

Diese besonders nützliche Tatsache beruht wie viele weitere auf dem Mittelwertsatz. Wir beweisen 

sie nur für den in der Praxis am häufigsten auftretenden Fall n = 2. Wir haben zu zeigen, daß die 

Restfunktion 

f ( a + h ) − f( a ) − f ´ ( a ) h 

nach Division durch h immer noch gegen 0 strebt, falls h dies tut. Dabei ist f ´ ( a ) der Gradient, 

der sich aus den (nach Voraussetzung existierenden) partiellen Ableitungen f x 

( a ) und f y 

( a ) 

zusammensetzt. 

Der eindimensionale Mittelwertsatz liefert Zwischenstellen u j 

aus ] a j 

, a j 

+ h j 

[ mit 

f ( a + h ) − f( a ) = 

f ( a 1 

+ h 1 

, a 2 

+ h 2 

) − f ( a 1 

, a 2 

+ h 2 

) + f ( a 1 

, a 2 

+ h 2 

) − f ( a 1 

, a 2 

) = 

also 

f x 

( u 1 

, a 2 

+ h 2 

) h 1 

+ f y 

( a 1 

, u 2 

) h 2 

, 

f ( a + h ) − f( a ) − f ´ ( a ) h = 

( f x 

( u 1 

, a 2 

+ h 2 

) − f x 

( a 1 

, a 2 

) ) h 1 

+ ( f y 

( a 1 

, u 2 

) − f y 

( a 1 

, a 2 

) ) h 2 

, 

und dieser Ausdruck wird nach Division durch h wegen 

tatsächlich beliebig klein. 

h j 

≤ 

h und der Stetigkeit von f x 

und f y 

Achtung! Eine partiell differenzierbare Funktion braucht nicht total differenzierbar, ja nicht einmal 

stetig zu sein. 

Beispiel 2: Eine Wendeltreppe 

Die durch f ( 0, 

0) 

= 0 ergänzte Funktion 

x y 

f ( x, 

y ) = 

x 2 + y 2 

ist auf jeder Geraden durch den Ursprung (0,0) außerhalb von diesem konstant: Für festes 

( x 0 

, y 0 

) ≠ ( 0, 

0 ) und variables t ≠ 0 ist nämlich 

f ( t x 0 

, t y 0 

) = f ( x 0 

, y 0 

). 

Insbesondere existieren die partiellen Ableitungen in (0,0) und sind dort gleich 0.

Diese Funktion ist im Ursprung offensichtlich unstetig, denn 

lim 

t → 0 

f ( t x, 

t y ) = f ( x, 

y ) 

kann jeden Wert zwischen -1 und 1 annehmen. 

Höhere Ableitungen 

Wir betrachten wieder eine Funktion f von einer Teilmenge A des R n nach R. Indem man die 

partiellen Ableitungen 

∂ 

f xj 

= f 

∂x j

(soweit sie existieren) wieder als Funktionen auffaßt und, sofern möglich, nochmals partiell 

differenziert, erhält man die 

zweiten partiellen Ableitungen 

f xj x k 

Die Hessematrix 

∂ ⎛ ∂ ⎞ 

= 

∂x ⎜ f ⎟ . 

k ⎝∂x j ⎠ 

ist die aus den partiellen Ableitungen gebildete (n x n) - Matrix. Sie wird gelegentlich auch 

zweite Ableitung von f genannt und mit f ´´ bezeichnet. 

Im Spezialfall n = 

⎡ 

f´´ = 

⎢ 

⎣ 

f xx 

f yx 

f xy 

f yy 

2 ist also 

⎤ 

⎥ 

⎦ 

Durch Fortsetzung dieses Ableitungsprozesses gelangt man zu höheren partiellen Ableitungen. 

Für n = 2 hat man (mit x 1 

= x und x 2 

= y ) die beiden ersten Ableitungen 

f x 

∂ 

= 

∂x f , f y 

= 

∂ 

∂y f 

und den Gradienten 

f´ = [ f x 

, f y 

] , 

die vier zweiten Ableitungen 

f xx 

f yx 

∂ ⎛ ∂ ⎞ 

= ⎜ ⎟ 

∂x 

⎝∂x f ⎠ 

= ∂x ∂x f , f xy 

= ∂ ⎛ ∂ ⎞ 

⎜ ⎟ 

∂y 

⎝ ∂x f ⎠ 

= ∂y ∂x f , 

∂ ⎛ ∂ ⎞ 

= ⎜ ⎟ 

∂x 

⎝∂y f ⎠ 

= ∂ 2 

∂x ∂y f , f yy 

= 

∂ ⎛ ∂ ⎞ 

⎜ ⎟ 

∂y 

⎝ ∂y f ⎠ 

= ∂ 2 

∂y ∂y f 

und die Hesse-Matrix 

⎡f f´´ = 

xx 

f xy 

⎤ 

⎢ 

⎥ , 

⎣f yx 

f yy ⎦ 

sowie die acht dritten partiellen Ableitungen 

f xxx 

f yxx 

∂ 3 

∂ 2 

∂ 3 

= 

∂x ∂x ∂x f , f xxy 

= ∂y ∂x ∂x f , f xyx 

= ∂x ∂y ∂x f , f xyy 

= ∂y ∂y ∂x f , 

∂ 3 

∂ 3 

= 

∂x ∂x ∂y f , f yyx 

= ∂x ∂y ∂y f , f yxy 

= ∂y ∂x ∂y f , f yyy 

= ∂y ∂y ∂y f , 

die man zu einer "dreidimensionalen Hypermatrix" zusammensetzen kann: 

Nach k-maligem Ableiten landet man bei den 2 k partiellen Ableitungen k-ter Ordnung. Im 

allgemeinsten Falle einer Funktion in n Variablen gibt es sogar n k solche Ableitungen! 

∂ 2 

∂ 3 

∂ 3 

∂ 3 

∂ 3

Beispiel 3: Alle partiellen Ableitungen einer Sattelfläche 

f ( x, 

y ) = x 3 + y 3 

Erste Ableitungen: 

Zweite Ableitungen: 

Dritte Ableitungen: 

f x 

= 3 x 2 , f y 

= 3 y 2 

f xx 

= 6 x , f xy 

= 0 

f yx 

= 0 , = 6 y 

f yy 

f xxx 

= 6 , f xxy 

= 0 , f xyx 

= 0 , f xyy 

= 0 

f yxx 

= 0 , f yxy 

= 0 , f yyx 

= 0 , f yyy 

= 6 

Alle höheren Ableitungen verschwinden. 

Man sagt, eine Funktion sei (auf A) k-mal partiell differenzierbar, wenn ihre sämtlichen 

partiellen Ableitungen k-ter Ordnung auf A existieren. Sind diese sogar noch stetig, spricht man 

von einer k-mal stetig differenzierbaren Funktion. 

Es gelten also folgende 

Implikationen zwischen Differenzierbarkeitseigenschaften 

k+1-mal partiell differenzierbar 

=> k-mal stetig differenzierbar 

=> k-mal partiell differenzierbar (k > 1) 

... 

=> stetig differenzierbar 

=> total differenzierbar 

=> alle Richtungsableitungen existieren 

=> partiell differenzierbar 

Daß f zweimal stetig differenzierbar ist, bedeutet, daß die ersten und zweiten partiellen 

Ableitungen in allen Punkten des Definitionsbereichs existieren und stetig sind. Die Funktion aus 

Beispiel 3 ist sogar beliebig of differenzierbar.

Beispiel 4: Die Hessematrix der zweidimensionalen Potenzfunktion 

Wir betrachten nochmals in der Halbebene x > 0 die Funktion 

f ( x, 

y ) = x y . 

Die ersten partiellen Ableitungen kennen wir schon: 

x y y 

f x 

= , f = 

x y 

x y ln( x) 

Nun berechnen und zeichnen wir die zweiten partiellen Ableitungen: 

x y y 2 x y y 

f xx 

= − 

x 2 

x 2 

f yy 

= x y ln( x ) 

2 

x y y ln( x) 

f xy 

= + 

x 

x y y ln( x ) 

, f = 

x yx 

+ 

x 

x y 

x y 

x

Also f xy 

= f yx 

, d.h. die Matrix der zweiten Ableitungen ist symmetrisch! 

Allgemein kann man durch Betrachtung geeigneter Sekantensteigungen und Vertauschung eines 

gewissen Grenzprozesses folgende nützliche Tatsache beweisen (das entscheidende Hilfsmittel ist 

wieder der Mittelwertsatz, der es erlaubt, Sekanten durch Tangenten in Zwischenpunkten zu 

ersetzen): 

Schwarzsche Vertauschungsregel 

Existieren die zweiten partiellen Ableitungen und sind sie noch stetig, so gilt 

f xy 

= f yx 

, 

d.h. die Hessematrix ist symmetrisch. Analoges gilt für Funktionen in n Variablen. 

Daß diese Regel allerdings ohne die Stetigkeitsvoraussetzung für die zweiten Ableitungen nicht 

mehr richtig ist, zeigt folgendes 

Beispiel 5: Eine nicht symmetrische Hessematrix 

Wir geben zwei relle Zahlen a und b vor. Die im Nullpunkt durch f ( 0, 

0) 

= 0 ergänzte Funktion 

a x 3 y + b x y 3 

f ( x, 

y) 

= 

x 2 + y 2 

ist zweimal differenzierbar, aber nur für a = b sind die zweiten Ableitungen im Nullpunkt noch 

stetig. Wir testen das im Einzelnen: Außerhalb des Nullpunktes findet man durch "mechanisches 

Ableiten" (wir überlassen das MAPLE): 

3 a x 2 y + b y 3 2 ( a x 3 y + b x y 3 ) x 

f x 

= 

− 

x 2 + y 2 ( x 2 + y 2 ) 

2 

a x 3 + 3 b x y 2 2 ( a x 3 y + b x y 3 ) y 

f y 

= 

− 

x 2 + y 2 ( x 2 + y 2 ) 

2 

3 a x 2 + 3 b y 2 2 ( a x 3 + 3 b x y 2 ) x 2 ( 3 a x 2 y + b y 3 ) y 8 ( a x 3 y + b x y 3 ) y x 

f xy 

= 

− − + 

x 2 + y 2 ( x 2 + y 2 ) 

2 ( x 2 + y 2 ) 

2 ( x 2 + y 2 ) 

3 

Der gleiche Monsterausdruck kommt für f yx 

heraus. 

Die ersten und zweiten partiellen Ableitungen im Nullpunkt kann man nur durch Limesbildung 

berechnen, weil dort die Funktion durch Fallunterscheidung definiert ist. 

⎛ ∂ ⎞ 

Man erhält für f x 

( 0, 

0 ) = ⎜ ( ) 

⎝∂x f ⎠ 

⎟ 0, 

0 bzw. f y ( 0, 

0 ) = ⎛ ∂ ⎞ 

⎜ ( ) 

⎝∂y f ⎠ 

⎟ 0, 

0 : 

lim 

t → 0 

f ( t, 

0 ) − f ( 0, 

0) 

f ( 0, 

t ) − f ( 0, 

0 ) 

= 0 , lim 

= 0 

t 

t 

t → 0 

⎛ 

Entsprechend ergibt sich für f xy 

( 0, 

0 ) = 

∂ 2 ⎞ 

⎜ 

⎟( ) 

⎝ ∂y ∂x f ⎠ 

0, 

0 bzw. f yx ( 0, 

0 ) = 

⎛ 

∂ 2 ⎞ 

⎜ 

⎟( ) 

⎝ ∂x ∂y f ⎠ 

0, 

0 : 

lim 

t → 0 

f x 

( 0, 

t ) − f x 

( 0, 

0) 

f y 

( t, 

0 ) − f y 

( 0, 

0 ) 

= b , lim 

= a 

t 

t 

t → 0

Jetzt betrachten wir drei Spezialfälle. 

Zuerst einen der Fälle a = b : 

f ( x, 

y) 

a = 1 , b = 1 

= 

x 3 y + x y 3 

x 2 + y 2 

3 x 2 y + y 3 2 ( x 3 y + x y 3 ) x 

f x 

= − 

x 2 + y 2 ( x 2 + y 2 ) 

2 

x 3 + 3 x y 2 2 ( x 3 y + x y 3 ) y 

f y 

= − 

x 2 + y 2 ( x 2 + y 2 ) 

2 

Offenbar zwei Ebenen! Das muß doch einfacher gehen...?

Kürzen durch x 2 + y 2 bringt Freude: 

f ( x, 

y ) 

= x y 

f x 

= y , = x 

H f 

( 0, 

0 ) 

= 

f y 

⎡ 

⎢ 

⎣ 

0 1⎤ 

⎥ 

1 0⎦ 

Und nun zwei Fälle, wo f xy 

( 0, 

0) 

= a von f yx 

( 0, 

0) 

= b verschieden ist. 

Einmal gleiches Vorzeichen: 

f ( x, 

y ) 

a = 1 , b = 2 

= 

x 3 y + 2 x y 3 

x 2 + y 2 

3 x 2 y + 2 y 3 2 ( x 3 y + 2 x y 3 ) x 

f x 

= 

− 

x 2 + y 2 ( x 2 + y 2 ) 

2

x 3 + 6 x y 2 2 ( x 3 y + 2 x y 3 ) y 

f y 

= − 

x 2 + y 2 ( x 2 + y 2 ) 

2 

3 x 2 + 6 y 2 2 ( x 3 + 6 x y 2 ) x 2 ( 3 x 2 y + 2 y 3 ) y 8 ( x 3 y + 2 x y 3 ) y x 

f xy 

= − − + 

x 2 + y 2 ( x 2 + y 2 ) 

2 ( x 2 + y 2 ) 

2 ( x 2 + y 2 ) 

3 

Eine gefaltete Papierserviette, die im Nullpunkt offensichtlich unstetig ist. 

Und jetzt noch ein Beispiel mit verschiedenem Vorzeichen: 

f ( x, 

y) 

a = 1 , b = -1 

= 

x 3 y − x y 3 

x 2 + y 2

3 x 2 y − y 3 2 ( x 3 y − x y 3 ) x 

f x 

= − 

x 2 + y 2 ( x 2 + y 2 ) 

2 

x 3 − 3 x y 2 2 ( x 3 y − x y 3 ) y 

f y 

= − 

x 2 + y 2 ( x 2 + y 2 ) 

2 

3 x 2 − 3 y 2 2 ( x 3 − 3 x y 2 ) x 2 ( 3 x 2 y − y 3 ) y 8 ( x 3 y − x y 3 ) y x 

f xy 

= − − + 

x 2 + y 2 ( x 2 + y 2 ) 

2 ( x 2 + y 2 ) 

2 ( x 2 + y 2 ) 

3 

Ziemlich steil und wenig stetig!

7.5. Mittelwertsatz und höhere Ableitungen

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?