17.08.2013 Views

1 Dérivées partielles 2 Dérivées d'ordre supérieur

1 Dérivées partielles 2 Dérivées d'ordre supérieur

1 Dérivées partielles 2 Dérivées d'ordre supérieur

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

L2. 2005-2006. CALCUL DIFFERENTIEL.<br />

1 <strong>Dérivées</strong> <strong>partielles</strong><br />

Soit donc Ω un ouvert de R n , f une application de Ω dans F espace vectoriel normé. Soit<br />

a = (α1, α2, . . . , αn) dans Ω.<br />

Si x = (x1, x2, . . . , xn) est l’élément générique de Ω, on dit que f admet en a une dérivée<br />

partielle par rapport à xi si l’application ϕi : xi → f(α1, . . . , αi−1, xi, αi+1, . . . , αn) est dérivable<br />

en αi.<br />

Il faut bien voir que, puisque l’application qui à xi associe le n-uplet (α1, . . . , αi−1, xi, αi+1, . . . , αn)<br />

est continue, (ses fonctions composantes le sont, n − 1 étant constantes, l’autre identité), et qu’elle<br />

envoie αi sur a dans Ω ouvert, il existe un intervalle ] − αi − r, αi + r[ de R sur lequel ϕi est définie,<br />

et on peut chercher la dérivabilité de ϕi en αi.<br />

1.1<br />

On notera ∂f<br />

(a) cette dérivée partielle si elle existe : c’est donc<br />

∂xi<br />

∂f<br />

∂xi<br />

f(α1, . . . , αi−1, αi + hi, αi+1, . . . , αn) − f(α1, . . . , αi, . . . , αn)<br />

(a) = lim<br />

hi→0<br />

hi<br />

hi=0<br />

Si F , espace d’arrivée est égal à R p , la dérivée partielle de f en a, par rapport à xi, existe,<br />

si et seulement si chaque fonction composante fj : Ω ↦→ R, (j = 1, . . . , p) admet en a une dérivée<br />

par rapport à xi.<br />

2 <strong>Dérivées</strong> d’ordre <strong>supérieur</strong><br />

Supposons alors, avec Ω ouvert de Rn , et f : Ω ↦→ R, que f admette en chaque a de Ω une<br />

dérivée partielle par rapport a xi. On déduit ainsi une nouvelle fonction notée ∂f<br />

, sur Ω. Mais à<br />

∂xi<br />

son tour, cette fonction ∂f<br />

∂xi peut admettre une dérivée partielle par rapport à xj en tout a de Ω<br />

ce qui nous conduit à introduire la fonction.<br />

2.1<br />

∂ ∂f<br />

∂x i<br />

∂xj<br />

, notée conventionnellement<br />

∂ 2 f<br />

∂<br />

, comme si on composait les opérateurs ∂xj∂xi ∂xj<br />

et ∂<br />

∂xi<br />

agissant l’un après l’autre.<br />

Et si, n’ayons pas peur d’imaginer, les dérivées <strong>partielles</strong> d’abord par rapport à xj, puis par<br />

rapport à xi existaient, on disposerait de la fonction ∂2f . Sont-elles égales ? C’est bien dommage,<br />

∂xixj<br />

car cela aurait simplifié l’écriture !<br />

Théorème. (de Schwarz)<br />

Soit Ω un overt de R2 , f une application de Ω dans R. Si les deux dérivées <strong>partielles</strong> d’ordre<br />

2, ∂2f ∂x∂y et ∂2f ∂y∂x existent sur un voisinage de a dans ω, et sont continues en a, elles sont égales.<br />

Preuve. On forme la quantité φ(x0, y0) = f(x0, y0) − f(α, y0) − f(x0, β) + f(α, β), avec<br />

(α, β) = a et z = (x0, y0) dans un voisinage V de a qui sera précisé un peu plus tard, patience.<br />

Si, pour x0 fixé, on note Fx0 la fonction y → Fx0(y) = f(x0, y) − f(α, y) il vient φ(x0, y0) =<br />

Fx0(y0) − Fx0(β).<br />

1


Or, toujours avec x0 fixé, la fonction Fx0 est dérivable sur le segment d’extrémités y0 et β :<br />

on peut lui appliquer la formule des accroissements finis. Il existe donc η, fonctions de y0, et aussi<br />

de x0, entre β et y0, tel que φ(x0, y0) = (y0 − β)(Fx0) ′ (η).<br />

On a (Fx0) ′ (y) = ∂f<br />

∂y (x0, y) − ∂f<br />

∂y (α, y). (N’oublions pas que Fx0 est une fonction de y). On<br />

a donc :<br />

<br />

∂f<br />

φ(x0, y0) = (y0 − β)<br />

∂y (x0, η) − ∂f<br />

<br />

(α, η) .<br />

∂y<br />

Mais, on considère cette fois que y0 est fixé, et que c’est x qui varie, de façon que (x, y0)<br />

reste dans V . On a η fixé, et la fonction x ∂f<br />

∂y (x, η) est à son tour dérivable,e t on peut lui<br />

appliquer la formule des accroissements finis, entre x0 et α, d’où l’existence de ξ, fonction de x0,<br />

et de y0, entre x et α, tel que :<br />

∂f<br />

∂y (x0, η) − ∂f<br />

∂y (α, η) = (x0 − α) ∂2<br />

(ξ, η)<br />

∂x∂y<br />

et finalement, au couple (x0, y0) de V on a associé (ξ, η) de V tel que<br />

φ(x0, y0) = (x0 − α)(y0 − β) ∂2f (ξ, η).<br />

∂x∂y<br />

J’aurais du préciser au départ que, toutes les normes dur R 2 étant équivalentes et donnant<br />

la topologie produit, on prend un voisinage ouvert V du type ]α − r, α + r[×]β − r, β + r[, (pour <br />

∞). Comme cela, pour (x0, y0) dans V les (x, y) avec x entre x0 et α et y entre y0 et β sont dans<br />

V . Mais vous savez ce que c’est, on n’est pas toujours très frais, il est de bonne heure et je en suis<br />

pas encore bien réveillé. Enfin, mieux vaut tard que jamais...<br />

On inverse les rôles, et en Gy0 la fonction x définie par Gy0(x) = f(x, y0) − f(x, β), il vient<br />

φ(x0, y0) = Gy0(x0) − Gy0(α) = (x0 − α)(Gy0) ′ (ξ1)<br />

avec ξ1 entre x0 et α et (Gy0) ′ (x) = ∂f<br />

∂x (x, y0) − ∂f<br />

∂x (x, β). On a donc<br />

<br />

∂f<br />

φ(x0, y0) = (x0 − α)<br />

∂x (ξ1, y0) − ∂f<br />

∂x (ξ1,<br />

<br />

β)<br />

et comme on peut appliquer la formule des accroissements finis à la fonction qui à y associe<br />

∂f<br />

∂x (ξ1, y), entre y0 et β, il existe η1 entre y0 et β tel que<br />

φ(x0, y0) = (x0 − α)(y0 − β) ∂2 f<br />

∂y∂x (ξ1, η1).<br />

Mais alors pour tout (x0, y0) de V tel que x0 = α et y0 = β, on a trouvé ξ et ξ1 entre x0 et<br />

α, η et η1 entre y0 et β, tels que<br />

φ(x0, y0) ∂2<br />

=<br />

(x0 − α)(y0 − β) ∂x∂y (ξ, η) = ∂2f ∂y∂x (ξ1, η1).<br />

Il ne reste plus qu’à faire tendre x0 vers α et y0 vers β.<br />

Alors (ξ, η) et (ξ1, η1) tendent vers a = (α, β), et les dérivées secondes ∂2 f<br />

∂x∂y et ∂2f ∂y<br />

∂x étant<br />

continues en a, ∂2f ∂x∂y (ξ, η) tend vers ∂2f ∂x∂y (ξ, η) tend vers ∂2f ∂x∂y (α, β) alors que ∂2f ∂y∂x (ξ1, η1) tend vers<br />

(α, β). Ces deux quantités étant égales, à la limite on obtient bien<br />

∂ 2 f<br />

∂y∂x<br />

∂2f ∂x∂y (α, β) = ∂2f (α, β).<br />

∂y∂x<br />

Corollaire. Soit Ω un ouvert de Rn , n ≥ 2, f une application de Ω dans R telle que, pou i = j,<br />

∂ 2 f<br />

∂<br />

(x) et<br />

∂xi∂xj 2 f<br />

∂xj∂xi (x) existent pour x obtenu à partir de a = (α1, . . . , αn), en ne faisant varier<br />

que xi dans un voisinage de αi et xj dans un voisinage de αj. Si ces dérivées sont continues en a<br />

elles sont égales.<br />

2


3 Propriétés élémentaires. Règles de calcul.<br />

3.1 Applications linéaires- Applications affines<br />

Soit u : E → F une application linéaire, b un point de F , et H : E → F l’application affine<br />

définie par :<br />

H(x) = u(x) + b.<br />

donc<br />

En tout point a de E, l’application H est différentiable et sa différentielle est u.<br />

3.2 Somme.<br />

H(x) − H(a) = u(x) + b − u(a) − b = u(x − a)<br />

H(x) − H(a) = u(x − a) = 0<br />

DH(a) = u.<br />

Soient H1, H2 des applications d’une partie ouverte U de E dans F .<br />

Si H1 et H2 sont différentiables en un point a de U, alors H1 + H2 l’est aussi et on a :<br />

Da(H1 + H2) = DaH1 + DaH2.<br />

En termes de dérivées <strong>partielles</strong> relatives à une base de E, on a donc, pour 1 ≤ i ≤ m :<br />

3.3 Composition.<br />

∂i(H1 + H2) = ∂iH1 + ∂iH2.<br />

Soit G un troisième espace vectoriel (normé) de dimension finie. Soient U une partie ouverte<br />

de E, H une application de U dans F , V une partie ouverte de F , K une application de V dans<br />

G.<br />

Proposition. Soit a un point de U. On suppose que H est différentiable en a, que H(a) ∈ V ,<br />

et que K est différentiable en H(a). Alors, l’application K ◦ H est définie sur une boule ouverte<br />

centrée en a, est différentiable au point a, et sa différentielle en a est :<br />

Da(K ◦ H) = D H(a)K ◦ DaH.<br />

Démonstration. L’application H est continue en a donc il existe r > 0 tel que H(B(a, r)) ⊂ V .<br />

L’application K ◦ H est donc définie sur B(a, r).<br />

Posons L1 = DaH, L2 = D H(a)K, C1 = L1, C2 = L2 (où les normes dans les espaces<br />

vectoriels L(E, F ), L(F, G) ont été définies voir chapitre précédent).<br />

Comme H est différentiable en a, H est continue en a (voir début du cours)il existe r0 ∈]0, r[<br />

tel qu’on ait :<br />

H(x) − H(a) ≤ (1 + C1)x − a<br />

pour tout x ∈ B(a, r0).<br />

Soit ε > 0 ; il existe r1 ∈]0, r0[, tel qu’on ait, pour x − a < r1.<br />

H(x) − H(a) − L1(x − a) ≤<br />

K(y) − K(H(a)) − L2(y − H(a)) ≤<br />

ε<br />

1 + C1 + C2<br />

<br />

Soit x ∈ B<br />

r1 a, 1+C1<br />

. Posons y = H(x) ; on a alors :<br />

ε<br />

1 + C1 + C2<br />

y − H(a) ≤ (1 + C1)x − a < r1.<br />

3<br />

x − a,<br />

y − H(a).


Posons :<br />

On a :<br />

donc<br />

avec<br />

d’où finalement :<br />

R1 = H(x) − H(a) − L1(x − a),<br />

R2 = K(y) − K(H(a)) − L2(y − H(a)).<br />

K ◦ H(x) = K(y)<br />

= K ◦ H(a) + L2(y − H(a)) + R2,<br />

L2(y − H(a)) = L2(L1(x − a) + R1)<br />

= L2 ◦ L1(x − a) + L2(R1),<br />

K ◦ H(x) = K ◦ H(a) + L2 ◦ L1(x − a) + R2 + L2(R1),<br />

R2 ≤<br />

ε<br />

1 + C1 + C2<br />

y − H(a) ≤<br />

L2(R1) ≤ C2R1 ≤<br />

εC2<br />

1 + C1 + C2<br />

ε(1 + C1)<br />

x − a<br />

1 + C1 + C2<br />

x − a,<br />

K ◦ H(x) − K ◦ H(a) − L2 ◦ L1(x − a) ≤ εx − a,<br />

ce qui termine de prouver la proposition.<br />

Soient(e1, . . . , em) une base de E, (f1, . . . , fn) une base de F , H1, . . . , Hn les applications<br />

coordonnées de H relatives à cette base.<br />

En exprimant que la matrice jacobienne de K ◦H en a est le produit de la matrice jacobienne<br />

de K en H(a) et de la matrice jacobienne de H en a, on obtient, pour 1 ≤ i ≤ m<br />

3.4 Produits<br />

∂i(K ◦ H)(a) =<br />

n<br />

∂iHℓ(a)∂ℓK(a).<br />

ℓ=1<br />

Supposons que E soit le produit de deux espaces vectoriels E1, E2 et que H soit une application<br />

bilinéaire de E1 × E2 dans F .<br />

Proposition. L’application H est alors différentiable en tout point a = (a1, a2) de E, et sa différentielle<br />

en a vérifie :<br />

DaH(v1, v2) = H(v1, a2) + H(a1, v2),<br />

pour tout v = (v1, v2) ∈ E.<br />

Démonstration. L’application H est continue et il existe une constante C > 0 telle que :<br />

ait :<br />

∀x1 ∈ E1, ∀x2 ∈ E2, H(x1, x2) ≤ Cx1x2,<br />

D’autre part, comme toutes les normes sur E sont équivalentes, il existe c ′ > 0 tel qu’on<br />

∀x = x1, x2) ∈ E, max({x1, x2) ≤ C ′ x.<br />

On a alors, pour a = (a1, a2), v = (v1, v2) dans E :<br />

H(a + v) = H(a1, a2) + H(a1, v2) + H(v1, a2) + H(v1, v2)<br />

= H(a1, a2) + H(a1, v2) + H(v1 + a2) + O(v1v2)<br />

= H(a1, a2) + H(a1, v2) + H(v1, a2) + O(v 2 ),<br />

d’où la proposition.<br />

En combinant les propositions 5 et 6, on obtient les règles de différentiation pour différentes<br />

sortes de "produits" :<br />

4


i. Prenons F = R ; si H1, H2 sont deux applications à valeurs réelles définies sur une partie<br />

ouverte U de E, et différentiables en un point a de U, alors le produit H1 H2 est différentiable<br />

en a et on a, pour v ∈ E :<br />

Da(H1H2)(v) = H1(a)DaH2(v) + H2(a)DaH1(v).<br />

ii. Soient U une partie ouverte de E, H1 : U → F et H2 : U → R des applications, différentiables<br />

en un point a ∈ U. Alors H1H2 est différentiable en a et :<br />

3.5 Inverses.<br />

Da(H2H1)(v) = DaH2(v)H1(a) + H2(a)DaH1(v).<br />

Corollaire. Soient U une partie ouverte d’un espace vectoriel de dimension finie et H : U → R∗ une application. Si H est différentiable en un point a ∈ U, l’application 1<br />

H l’est aussi et on a ,<br />

pour v ∈ E :<br />

<br />

1<br />

Da (v) = −<br />

H<br />

DaH(v)<br />

.<br />

(H(a)) 2<br />

En terme de dérivée <strong>partielles</strong> (relatives à une base e1, . . . , em de E) :<br />

<br />

1<br />

∂i (a) = −<br />

H<br />

∂iH(a)<br />

.<br />

(H(a)) 2<br />

Soit (e1, . . . , e2) une base de E.<br />

Proposition. Pour que H soit de classe C 1 , il faut et il suffit que les deux conditions suivantes<br />

soient réalisées :<br />

i. pour tout x ∈ U, pour tout i ∈ {1, . . . , m}, l’application H admet en x une dérivée partielle<br />

∂iH(x) dans la direction de ei,<br />

ii. pour tout i ∈ {1, . . . , m}, l’application x ↦→ ∂iH(x) de U dans F est continue.<br />

Preuve. Si H est de classe C 1 , la condition i est réalisée et on a ∂iH(x) = DxH(ei), donc la<br />

condition ii est réalisée.<br />

Inversement, supposons les conditions i et ii vérifiées par H. Il suffit de démontrer que H<br />

est différentiable en tout point a ∈ U, ou encore que chaque application coordonnée de H (par<br />

rapport à une base de F ) est différentiable en tout point a ∈ U. Or ces applications coordonnées<br />

satisfont aux conditions i et ii s’il en est de même pour H. On peut donc supposer F = R.<br />

Soient a ∈ U, et ε > 0. Il existe δ > 0 tel que pour tout vecteur v = m<br />

1 viei vérifiant :<br />

on ait :<br />

Soit v ∈ E vérifiant (1). Posons v(0) = 0 et<br />

On a alors v(m) = v, d’où :<br />

H(a + v) − H(a) =<br />

max |vi| < δ (1)<br />

a + v ∈ U, (2)<br />

∀1 ≤ i ≤ m, |∂iH(a + v) − ∂iH(a)| < ε (3)<br />

v(k) =<br />

k<br />

viei, 1 ≤ k ≤ m<br />

i=1<br />

m<br />

(H(a + v(k − 1) + vkek) − H(a + v(k − 1))).<br />

k=1<br />

5


Soit 1 ≤ k ≤ m. D’après (2), l’application ∆kH : t ↦→ H(a + v(k − 1) + tek) est définie sur<br />

] − δ, +δ[, et d’après i et ii, elle est continûment différentiable sur cet intervalle. On a donc :<br />

∆kH(vk) − ∆kH(0) = vk<br />

D’après la relation (i), on a, pour 0 ≤ s ≤ 1 :<br />

et on en déduit :<br />

L’application H est donc différentiable en a.<br />

Il ressort immédiatement que :<br />

1<br />

0<br />

∂kH(a + v(k − 1) + svkek)ds.<br />

|∂kH(a + v(k − 1) + svkek) − ∂kH(a)| < ε,<br />

|∆kH(vk) − ∆kH(0) − vk∂kH(a)| ≤ ε|vk|,<br />

<br />

<br />

m<br />

<br />

n<br />

<br />

<br />

H(a<br />

+ v) − H(a) − vk∂kH(a) ≤ ε |vk|.<br />

<br />

k=1<br />

k=1<br />

i. Une somme (finie) d’application de classe C 1 est de classe C 1 .<br />

ii. Soient G un troisième espace vectoriel de dimension finie, U une partie ouverte de E, V une<br />

partie ouverte de F , H : U → F et K : V → G des applications de classe C 1 . Alors la<br />

composée K ◦ H : U ∩ H −1 (V ) → G est de classe C 1 .<br />

iii. Une application affine est de classe C 1 . Une application bilinéaire est de classe C 1 (et plus<br />

généralement, une application multilinéaire).<br />

iv. Si H1, H2 : U → R sont de classe C 1 , le produit l’est aussi. De même pour les autres types<br />

de produits considérés en §3.4, chapitre V.<br />

En particulier, toute application polinômiale H : E → R est de classe C 1 .<br />

v. Si H : U → R ∗ est de classe C 1 , l’application 1<br />

H<br />

4 Le théorème de la moyenne<br />

l’est aussi.<br />

Théorème. Soient I = [α, β] un intervalle compact de R, F un espace vectoriel normé (de dimension<br />

finie), et Φ : I → F , ϕ : I → R deux applications. On suppose que Φ et ϕ sont dérivables<br />

en tout point de I, et qu’on a, pour tout x ∈ I :<br />

On a alors<br />

Φ ′ (x) ≤ ϕ ′ (x)<br />

Φ(β) − Φ(α) ≤ ϕ(β) − ϕ(α).<br />

Remarque. La notation Φ ′ (x) désigne la dérivée de Φ en x, c’est-à-dire le vecteur DxΦ(1) de F .<br />

De même, ϕ ′ (x) est le nombre réel Dxϕ(1). Au point α, on a :<br />

Φ ′ (α) = lim t −1 (Φ(α + t) − Φ(α))<br />

t


iii. A est fermé, car Φ et ϕ sont continues.<br />

De ces trois propriétés il résulte qu’il existe un nombre θ < β. Comme θ ∈ A, on a :<br />

φ(θ) − φ(α) ≤ ϕ(θ) − ϕ(α) + ε(θ − α).<br />

Comme ϕ et Φ sont dérivables en θ, il existe δ > 0 tel q’on ait [θ, θ + δ] ⊂ [α, β] et, pour 0 ≤ t ≤ δ :<br />

Pour out t ∈ [0, δ], on a donc :<br />

Φ(θ + t) − Φ(θ) − tΦ ′ (θ) ≤ ε<br />

2 t,<br />

|ϕ(θ + t) − ϕ(θ) − tϕ ′ (θ)| ≤ ε<br />

2 t.<br />

Φ(θ + t) − Φ(θ) ≤ tΦ ′ (θ) + ε<br />

2t ≤ tϕ ′ (θ) + ε<br />

2t ≤ ϕ(θ + t) − ϕ(θ) + εt,<br />

Φ(θ + t) − Φ(α) ≤ Φ(θ + t) − Φ(θ) + Φ(θ) − Φ(α)<br />

≤ ϕ(θ + t) − ϕ(α) + ε(θ + t − α).<br />

Ceci implique qu’on a [α, θ + δ] ⊂ A, en contradiction avec la définition de θ. On a donc [α, β] = A,<br />

d’où :<br />

φ(β) − φ(α) ≤ ϕ(β) − ϕ(α) + ε(β − α).<br />

Comme ceci est vrai pour tout ε > 0, on conclut :<br />

φ(β) − φ(α) ≤ ϕ(β) − ϕ(α).<br />

On applique souvent le théorème précédent dans la situation suivante : E, F sont des espaces<br />

vectoriels normés de dimension finie, U est une partie ouverte de E, H : U → F est une application<br />

de classe C 1 , αo, α1 sont deux points de U tels que le segment joignant a0, a1 est contenu dans U.<br />

On prend alors α = 0, β = 1 et on définit Φ par :<br />

Φ(t) = H(a0 + t(a1 − a0)), 0 ≤ t ≤ 1.<br />

Posons, pour 0 ≤ T ≤ 1, at = a0 + t(a1 − a0) (la définition est cohérente pour t = 0 et t = 1).<br />

Pour t ∈ [0, 1], on a :<br />

Φ ′ (t) = Dat H(a1 − a0).<br />

Corollaire. Si M ≥ 0 est une constante telle que<br />

alors on a H(a1) − H(a0) ≤ M.<br />

∀t ∈ [0, 1], DatH(a1 − a0) ≤ M,<br />

Démonstration. Il suffit de prendre ϕ(t) = Mt.<br />

Corollaire. Si M ≥ 0 est une constante telle que<br />

alors on a H(a1) − H(a0) ≥ Ma1 − a0.<br />

∀t ∈ [0, 1], DatH ≤ M,<br />

Corollaire. Si M ≥ 0 est une constante telle que<br />

∀t ∈ [0, 1], DatH − Da0H ≤ M,<br />

alors on a H(a1) − H(a0) − Da0H(a1 − a0) ≤ Ma1 − a0.<br />

Démonstration. Il suffit d’appliquer le corollaire précédent à l’application H(x) = H(x)−Da0H(x).<br />

7


Corollaire. Supposons que U sont connexe, et que la différentielle de H en tout point de U soit<br />

nulle. Alors H est constante.<br />

Corollaire. Supposons que U soit convexe et qu’il existe une constante M ≥ 0 telle qu’on ait<br />

DxH ≤ M pour tout x ∈ U. Alors l’application H est M-lipschitzienne, c’est-à-dire qu’on a,<br />

pour x, y ∈ U :<br />

H(x) − H(y) ≤ Mx − y.<br />

Démonstration. Comme U est convexe, pour tous x, y ∈ U, le segment joignant x à y est contenu<br />

dans u et on peut appliquer le corollaire 2.<br />

8

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!