1 Dérivées partielles 2 Dérivées d'ordre supérieur
1 Dérivées partielles 2 Dérivées d'ordre supérieur
1 Dérivées partielles 2 Dérivées d'ordre supérieur
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
L2. 2005-2006. CALCUL DIFFERENTIEL.<br />
1 <strong>Dérivées</strong> <strong>partielles</strong><br />
Soit donc Ω un ouvert de R n , f une application de Ω dans F espace vectoriel normé. Soit<br />
a = (α1, α2, . . . , αn) dans Ω.<br />
Si x = (x1, x2, . . . , xn) est l’élément générique de Ω, on dit que f admet en a une dérivée<br />
partielle par rapport à xi si l’application ϕi : xi → f(α1, . . . , αi−1, xi, αi+1, . . . , αn) est dérivable<br />
en αi.<br />
Il faut bien voir que, puisque l’application qui à xi associe le n-uplet (α1, . . . , αi−1, xi, αi+1, . . . , αn)<br />
est continue, (ses fonctions composantes le sont, n − 1 étant constantes, l’autre identité), et qu’elle<br />
envoie αi sur a dans Ω ouvert, il existe un intervalle ] − αi − r, αi + r[ de R sur lequel ϕi est définie,<br />
et on peut chercher la dérivabilité de ϕi en αi.<br />
1.1<br />
On notera ∂f<br />
(a) cette dérivée partielle si elle existe : c’est donc<br />
∂xi<br />
∂f<br />
∂xi<br />
f(α1, . . . , αi−1, αi + hi, αi+1, . . . , αn) − f(α1, . . . , αi, . . . , αn)<br />
(a) = lim<br />
hi→0<br />
hi<br />
hi=0<br />
Si F , espace d’arrivée est égal à R p , la dérivée partielle de f en a, par rapport à xi, existe,<br />
si et seulement si chaque fonction composante fj : Ω ↦→ R, (j = 1, . . . , p) admet en a une dérivée<br />
par rapport à xi.<br />
2 <strong>Dérivées</strong> d’ordre <strong>supérieur</strong><br />
Supposons alors, avec Ω ouvert de Rn , et f : Ω ↦→ R, que f admette en chaque a de Ω une<br />
dérivée partielle par rapport a xi. On déduit ainsi une nouvelle fonction notée ∂f<br />
, sur Ω. Mais à<br />
∂xi<br />
son tour, cette fonction ∂f<br />
∂xi peut admettre une dérivée partielle par rapport à xj en tout a de Ω<br />
ce qui nous conduit à introduire la fonction.<br />
2.1<br />
∂ ∂f<br />
∂x i<br />
∂xj<br />
, notée conventionnellement<br />
∂ 2 f<br />
∂<br />
, comme si on composait les opérateurs ∂xj∂xi ∂xj<br />
et ∂<br />
∂xi<br />
agissant l’un après l’autre.<br />
Et si, n’ayons pas peur d’imaginer, les dérivées <strong>partielles</strong> d’abord par rapport à xj, puis par<br />
rapport à xi existaient, on disposerait de la fonction ∂2f . Sont-elles égales ? C’est bien dommage,<br />
∂xixj<br />
car cela aurait simplifié l’écriture !<br />
Théorème. (de Schwarz)<br />
Soit Ω un overt de R2 , f une application de Ω dans R. Si les deux dérivées <strong>partielles</strong> d’ordre<br />
2, ∂2f ∂x∂y et ∂2f ∂y∂x existent sur un voisinage de a dans ω, et sont continues en a, elles sont égales.<br />
Preuve. On forme la quantité φ(x0, y0) = f(x0, y0) − f(α, y0) − f(x0, β) + f(α, β), avec<br />
(α, β) = a et z = (x0, y0) dans un voisinage V de a qui sera précisé un peu plus tard, patience.<br />
Si, pour x0 fixé, on note Fx0 la fonction y → Fx0(y) = f(x0, y) − f(α, y) il vient φ(x0, y0) =<br />
Fx0(y0) − Fx0(β).<br />
1
Or, toujours avec x0 fixé, la fonction Fx0 est dérivable sur le segment d’extrémités y0 et β :<br />
on peut lui appliquer la formule des accroissements finis. Il existe donc η, fonctions de y0, et aussi<br />
de x0, entre β et y0, tel que φ(x0, y0) = (y0 − β)(Fx0) ′ (η).<br />
On a (Fx0) ′ (y) = ∂f<br />
∂y (x0, y) − ∂f<br />
∂y (α, y). (N’oublions pas que Fx0 est une fonction de y). On<br />
a donc :<br />
<br />
∂f<br />
φ(x0, y0) = (y0 − β)<br />
∂y (x0, η) − ∂f<br />
<br />
(α, η) .<br />
∂y<br />
Mais, on considère cette fois que y0 est fixé, et que c’est x qui varie, de façon que (x, y0)<br />
reste dans V . On a η fixé, et la fonction x ∂f<br />
∂y (x, η) est à son tour dérivable,e t on peut lui<br />
appliquer la formule des accroissements finis, entre x0 et α, d’où l’existence de ξ, fonction de x0,<br />
et de y0, entre x et α, tel que :<br />
∂f<br />
∂y (x0, η) − ∂f<br />
∂y (α, η) = (x0 − α) ∂2<br />
(ξ, η)<br />
∂x∂y<br />
et finalement, au couple (x0, y0) de V on a associé (ξ, η) de V tel que<br />
φ(x0, y0) = (x0 − α)(y0 − β) ∂2f (ξ, η).<br />
∂x∂y<br />
J’aurais du préciser au départ que, toutes les normes dur R 2 étant équivalentes et donnant<br />
la topologie produit, on prend un voisinage ouvert V du type ]α − r, α + r[×]β − r, β + r[, (pour <br />
∞). Comme cela, pour (x0, y0) dans V les (x, y) avec x entre x0 et α et y entre y0 et β sont dans<br />
V . Mais vous savez ce que c’est, on n’est pas toujours très frais, il est de bonne heure et je en suis<br />
pas encore bien réveillé. Enfin, mieux vaut tard que jamais...<br />
On inverse les rôles, et en Gy0 la fonction x définie par Gy0(x) = f(x, y0) − f(x, β), il vient<br />
φ(x0, y0) = Gy0(x0) − Gy0(α) = (x0 − α)(Gy0) ′ (ξ1)<br />
avec ξ1 entre x0 et α et (Gy0) ′ (x) = ∂f<br />
∂x (x, y0) − ∂f<br />
∂x (x, β). On a donc<br />
<br />
∂f<br />
φ(x0, y0) = (x0 − α)<br />
∂x (ξ1, y0) − ∂f<br />
∂x (ξ1,<br />
<br />
β)<br />
et comme on peut appliquer la formule des accroissements finis à la fonction qui à y associe<br />
∂f<br />
∂x (ξ1, y), entre y0 et β, il existe η1 entre y0 et β tel que<br />
φ(x0, y0) = (x0 − α)(y0 − β) ∂2 f<br />
∂y∂x (ξ1, η1).<br />
Mais alors pour tout (x0, y0) de V tel que x0 = α et y0 = β, on a trouvé ξ et ξ1 entre x0 et<br />
α, η et η1 entre y0 et β, tels que<br />
φ(x0, y0) ∂2<br />
=<br />
(x0 − α)(y0 − β) ∂x∂y (ξ, η) = ∂2f ∂y∂x (ξ1, η1).<br />
Il ne reste plus qu’à faire tendre x0 vers α et y0 vers β.<br />
Alors (ξ, η) et (ξ1, η1) tendent vers a = (α, β), et les dérivées secondes ∂2 f<br />
∂x∂y et ∂2f ∂y<br />
∂x étant<br />
continues en a, ∂2f ∂x∂y (ξ, η) tend vers ∂2f ∂x∂y (ξ, η) tend vers ∂2f ∂x∂y (α, β) alors que ∂2f ∂y∂x (ξ1, η1) tend vers<br />
(α, β). Ces deux quantités étant égales, à la limite on obtient bien<br />
∂ 2 f<br />
∂y∂x<br />
∂2f ∂x∂y (α, β) = ∂2f (α, β).<br />
∂y∂x<br />
Corollaire. Soit Ω un ouvert de Rn , n ≥ 2, f une application de Ω dans R telle que, pou i = j,<br />
∂ 2 f<br />
∂<br />
(x) et<br />
∂xi∂xj 2 f<br />
∂xj∂xi (x) existent pour x obtenu à partir de a = (α1, . . . , αn), en ne faisant varier<br />
que xi dans un voisinage de αi et xj dans un voisinage de αj. Si ces dérivées sont continues en a<br />
elles sont égales.<br />
2
3 Propriétés élémentaires. Règles de calcul.<br />
3.1 Applications linéaires- Applications affines<br />
Soit u : E → F une application linéaire, b un point de F , et H : E → F l’application affine<br />
définie par :<br />
H(x) = u(x) + b.<br />
donc<br />
En tout point a de E, l’application H est différentiable et sa différentielle est u.<br />
3.2 Somme.<br />
H(x) − H(a) = u(x) + b − u(a) − b = u(x − a)<br />
H(x) − H(a) = u(x − a) = 0<br />
DH(a) = u.<br />
Soient H1, H2 des applications d’une partie ouverte U de E dans F .<br />
Si H1 et H2 sont différentiables en un point a de U, alors H1 + H2 l’est aussi et on a :<br />
Da(H1 + H2) = DaH1 + DaH2.<br />
En termes de dérivées <strong>partielles</strong> relatives à une base de E, on a donc, pour 1 ≤ i ≤ m :<br />
3.3 Composition.<br />
∂i(H1 + H2) = ∂iH1 + ∂iH2.<br />
Soit G un troisième espace vectoriel (normé) de dimension finie. Soient U une partie ouverte<br />
de E, H une application de U dans F , V une partie ouverte de F , K une application de V dans<br />
G.<br />
Proposition. Soit a un point de U. On suppose que H est différentiable en a, que H(a) ∈ V ,<br />
et que K est différentiable en H(a). Alors, l’application K ◦ H est définie sur une boule ouverte<br />
centrée en a, est différentiable au point a, et sa différentielle en a est :<br />
Da(K ◦ H) = D H(a)K ◦ DaH.<br />
Démonstration. L’application H est continue en a donc il existe r > 0 tel que H(B(a, r)) ⊂ V .<br />
L’application K ◦ H est donc définie sur B(a, r).<br />
Posons L1 = DaH, L2 = D H(a)K, C1 = L1, C2 = L2 (où les normes dans les espaces<br />
vectoriels L(E, F ), L(F, G) ont été définies voir chapitre précédent).<br />
Comme H est différentiable en a, H est continue en a (voir début du cours)il existe r0 ∈]0, r[<br />
tel qu’on ait :<br />
H(x) − H(a) ≤ (1 + C1)x − a<br />
pour tout x ∈ B(a, r0).<br />
Soit ε > 0 ; il existe r1 ∈]0, r0[, tel qu’on ait, pour x − a < r1.<br />
H(x) − H(a) − L1(x − a) ≤<br />
K(y) − K(H(a)) − L2(y − H(a)) ≤<br />
ε<br />
1 + C1 + C2<br />
<br />
Soit x ∈ B<br />
r1 a, 1+C1<br />
. Posons y = H(x) ; on a alors :<br />
ε<br />
1 + C1 + C2<br />
y − H(a) ≤ (1 + C1)x − a < r1.<br />
3<br />
x − a,<br />
y − H(a).
Posons :<br />
On a :<br />
donc<br />
avec<br />
d’où finalement :<br />
R1 = H(x) − H(a) − L1(x − a),<br />
R2 = K(y) − K(H(a)) − L2(y − H(a)).<br />
K ◦ H(x) = K(y)<br />
= K ◦ H(a) + L2(y − H(a)) + R2,<br />
L2(y − H(a)) = L2(L1(x − a) + R1)<br />
= L2 ◦ L1(x − a) + L2(R1),<br />
K ◦ H(x) = K ◦ H(a) + L2 ◦ L1(x − a) + R2 + L2(R1),<br />
R2 ≤<br />
ε<br />
1 + C1 + C2<br />
y − H(a) ≤<br />
L2(R1) ≤ C2R1 ≤<br />
εC2<br />
1 + C1 + C2<br />
ε(1 + C1)<br />
x − a<br />
1 + C1 + C2<br />
x − a,<br />
K ◦ H(x) − K ◦ H(a) − L2 ◦ L1(x − a) ≤ εx − a,<br />
ce qui termine de prouver la proposition.<br />
Soient(e1, . . . , em) une base de E, (f1, . . . , fn) une base de F , H1, . . . , Hn les applications<br />
coordonnées de H relatives à cette base.<br />
En exprimant que la matrice jacobienne de K ◦H en a est le produit de la matrice jacobienne<br />
de K en H(a) et de la matrice jacobienne de H en a, on obtient, pour 1 ≤ i ≤ m<br />
3.4 Produits<br />
∂i(K ◦ H)(a) =<br />
n<br />
∂iHℓ(a)∂ℓK(a).<br />
ℓ=1<br />
Supposons que E soit le produit de deux espaces vectoriels E1, E2 et que H soit une application<br />
bilinéaire de E1 × E2 dans F .<br />
Proposition. L’application H est alors différentiable en tout point a = (a1, a2) de E, et sa différentielle<br />
en a vérifie :<br />
DaH(v1, v2) = H(v1, a2) + H(a1, v2),<br />
pour tout v = (v1, v2) ∈ E.<br />
Démonstration. L’application H est continue et il existe une constante C > 0 telle que :<br />
ait :<br />
∀x1 ∈ E1, ∀x2 ∈ E2, H(x1, x2) ≤ Cx1x2,<br />
D’autre part, comme toutes les normes sur E sont équivalentes, il existe c ′ > 0 tel qu’on<br />
∀x = x1, x2) ∈ E, max({x1, x2) ≤ C ′ x.<br />
On a alors, pour a = (a1, a2), v = (v1, v2) dans E :<br />
H(a + v) = H(a1, a2) + H(a1, v2) + H(v1, a2) + H(v1, v2)<br />
= H(a1, a2) + H(a1, v2) + H(v1 + a2) + O(v1v2)<br />
= H(a1, a2) + H(a1, v2) + H(v1, a2) + O(v 2 ),<br />
d’où la proposition.<br />
En combinant les propositions 5 et 6, on obtient les règles de différentiation pour différentes<br />
sortes de "produits" :<br />
4
i. Prenons F = R ; si H1, H2 sont deux applications à valeurs réelles définies sur une partie<br />
ouverte U de E, et différentiables en un point a de U, alors le produit H1 H2 est différentiable<br />
en a et on a, pour v ∈ E :<br />
Da(H1H2)(v) = H1(a)DaH2(v) + H2(a)DaH1(v).<br />
ii. Soient U une partie ouverte de E, H1 : U → F et H2 : U → R des applications, différentiables<br />
en un point a ∈ U. Alors H1H2 est différentiable en a et :<br />
3.5 Inverses.<br />
Da(H2H1)(v) = DaH2(v)H1(a) + H2(a)DaH1(v).<br />
Corollaire. Soient U une partie ouverte d’un espace vectoriel de dimension finie et H : U → R∗ une application. Si H est différentiable en un point a ∈ U, l’application 1<br />
H l’est aussi et on a ,<br />
pour v ∈ E :<br />
<br />
1<br />
Da (v) = −<br />
H<br />
DaH(v)<br />
.<br />
(H(a)) 2<br />
En terme de dérivée <strong>partielles</strong> (relatives à une base e1, . . . , em de E) :<br />
<br />
1<br />
∂i (a) = −<br />
H<br />
∂iH(a)<br />
.<br />
(H(a)) 2<br />
Soit (e1, . . . , e2) une base de E.<br />
Proposition. Pour que H soit de classe C 1 , il faut et il suffit que les deux conditions suivantes<br />
soient réalisées :<br />
i. pour tout x ∈ U, pour tout i ∈ {1, . . . , m}, l’application H admet en x une dérivée partielle<br />
∂iH(x) dans la direction de ei,<br />
ii. pour tout i ∈ {1, . . . , m}, l’application x ↦→ ∂iH(x) de U dans F est continue.<br />
Preuve. Si H est de classe C 1 , la condition i est réalisée et on a ∂iH(x) = DxH(ei), donc la<br />
condition ii est réalisée.<br />
Inversement, supposons les conditions i et ii vérifiées par H. Il suffit de démontrer que H<br />
est différentiable en tout point a ∈ U, ou encore que chaque application coordonnée de H (par<br />
rapport à une base de F ) est différentiable en tout point a ∈ U. Or ces applications coordonnées<br />
satisfont aux conditions i et ii s’il en est de même pour H. On peut donc supposer F = R.<br />
Soient a ∈ U, et ε > 0. Il existe δ > 0 tel que pour tout vecteur v = m<br />
1 viei vérifiant :<br />
on ait :<br />
Soit v ∈ E vérifiant (1). Posons v(0) = 0 et<br />
On a alors v(m) = v, d’où :<br />
H(a + v) − H(a) =<br />
max |vi| < δ (1)<br />
a + v ∈ U, (2)<br />
∀1 ≤ i ≤ m, |∂iH(a + v) − ∂iH(a)| < ε (3)<br />
v(k) =<br />
k<br />
viei, 1 ≤ k ≤ m<br />
i=1<br />
m<br />
(H(a + v(k − 1) + vkek) − H(a + v(k − 1))).<br />
k=1<br />
5
Soit 1 ≤ k ≤ m. D’après (2), l’application ∆kH : t ↦→ H(a + v(k − 1) + tek) est définie sur<br />
] − δ, +δ[, et d’après i et ii, elle est continûment différentiable sur cet intervalle. On a donc :<br />
∆kH(vk) − ∆kH(0) = vk<br />
D’après la relation (i), on a, pour 0 ≤ s ≤ 1 :<br />
et on en déduit :<br />
L’application H est donc différentiable en a.<br />
Il ressort immédiatement que :<br />
1<br />
0<br />
∂kH(a + v(k − 1) + svkek)ds.<br />
|∂kH(a + v(k − 1) + svkek) − ∂kH(a)| < ε,<br />
|∆kH(vk) − ∆kH(0) − vk∂kH(a)| ≤ ε|vk|,<br />
<br />
<br />
m<br />
<br />
n<br />
<br />
<br />
H(a<br />
+ v) − H(a) − vk∂kH(a) ≤ ε |vk|.<br />
<br />
k=1<br />
k=1<br />
i. Une somme (finie) d’application de classe C 1 est de classe C 1 .<br />
ii. Soient G un troisième espace vectoriel de dimension finie, U une partie ouverte de E, V une<br />
partie ouverte de F , H : U → F et K : V → G des applications de classe C 1 . Alors la<br />
composée K ◦ H : U ∩ H −1 (V ) → G est de classe C 1 .<br />
iii. Une application affine est de classe C 1 . Une application bilinéaire est de classe C 1 (et plus<br />
généralement, une application multilinéaire).<br />
iv. Si H1, H2 : U → R sont de classe C 1 , le produit l’est aussi. De même pour les autres types<br />
de produits considérés en §3.4, chapitre V.<br />
En particulier, toute application polinômiale H : E → R est de classe C 1 .<br />
v. Si H : U → R ∗ est de classe C 1 , l’application 1<br />
H<br />
4 Le théorème de la moyenne<br />
l’est aussi.<br />
Théorème. Soient I = [α, β] un intervalle compact de R, F un espace vectoriel normé (de dimension<br />
finie), et Φ : I → F , ϕ : I → R deux applications. On suppose que Φ et ϕ sont dérivables<br />
en tout point de I, et qu’on a, pour tout x ∈ I :<br />
On a alors<br />
Φ ′ (x) ≤ ϕ ′ (x)<br />
Φ(β) − Φ(α) ≤ ϕ(β) − ϕ(α).<br />
Remarque. La notation Φ ′ (x) désigne la dérivée de Φ en x, c’est-à-dire le vecteur DxΦ(1) de F .<br />
De même, ϕ ′ (x) est le nombre réel Dxϕ(1). Au point α, on a :<br />
Φ ′ (α) = lim t −1 (Φ(α + t) − Φ(α))<br />
t
iii. A est fermé, car Φ et ϕ sont continues.<br />
De ces trois propriétés il résulte qu’il existe un nombre θ < β. Comme θ ∈ A, on a :<br />
φ(θ) − φ(α) ≤ ϕ(θ) − ϕ(α) + ε(θ − α).<br />
Comme ϕ et Φ sont dérivables en θ, il existe δ > 0 tel q’on ait [θ, θ + δ] ⊂ [α, β] et, pour 0 ≤ t ≤ δ :<br />
Pour out t ∈ [0, δ], on a donc :<br />
Φ(θ + t) − Φ(θ) − tΦ ′ (θ) ≤ ε<br />
2 t,<br />
|ϕ(θ + t) − ϕ(θ) − tϕ ′ (θ)| ≤ ε<br />
2 t.<br />
Φ(θ + t) − Φ(θ) ≤ tΦ ′ (θ) + ε<br />
2t ≤ tϕ ′ (θ) + ε<br />
2t ≤ ϕ(θ + t) − ϕ(θ) + εt,<br />
Φ(θ + t) − Φ(α) ≤ Φ(θ + t) − Φ(θ) + Φ(θ) − Φ(α)<br />
≤ ϕ(θ + t) − ϕ(α) + ε(θ + t − α).<br />
Ceci implique qu’on a [α, θ + δ] ⊂ A, en contradiction avec la définition de θ. On a donc [α, β] = A,<br />
d’où :<br />
φ(β) − φ(α) ≤ ϕ(β) − ϕ(α) + ε(β − α).<br />
Comme ceci est vrai pour tout ε > 0, on conclut :<br />
φ(β) − φ(α) ≤ ϕ(β) − ϕ(α).<br />
On applique souvent le théorème précédent dans la situation suivante : E, F sont des espaces<br />
vectoriels normés de dimension finie, U est une partie ouverte de E, H : U → F est une application<br />
de classe C 1 , αo, α1 sont deux points de U tels que le segment joignant a0, a1 est contenu dans U.<br />
On prend alors α = 0, β = 1 et on définit Φ par :<br />
Φ(t) = H(a0 + t(a1 − a0)), 0 ≤ t ≤ 1.<br />
Posons, pour 0 ≤ T ≤ 1, at = a0 + t(a1 − a0) (la définition est cohérente pour t = 0 et t = 1).<br />
Pour t ∈ [0, 1], on a :<br />
Φ ′ (t) = Dat H(a1 − a0).<br />
Corollaire. Si M ≥ 0 est une constante telle que<br />
alors on a H(a1) − H(a0) ≤ M.<br />
∀t ∈ [0, 1], DatH(a1 − a0) ≤ M,<br />
Démonstration. Il suffit de prendre ϕ(t) = Mt.<br />
Corollaire. Si M ≥ 0 est une constante telle que<br />
alors on a H(a1) − H(a0) ≥ Ma1 − a0.<br />
∀t ∈ [0, 1], DatH ≤ M,<br />
Corollaire. Si M ≥ 0 est une constante telle que<br />
∀t ∈ [0, 1], DatH − Da0H ≤ M,<br />
alors on a H(a1) − H(a0) − Da0H(a1 − a0) ≤ Ma1 − a0.<br />
Démonstration. Il suffit d’appliquer le corollaire précédent à l’application H(x) = H(x)−Da0H(x).<br />
7
Corollaire. Supposons que U sont connexe, et que la différentielle de H en tout point de U soit<br />
nulle. Alors H est constante.<br />
Corollaire. Supposons que U soit convexe et qu’il existe une constante M ≥ 0 telle qu’on ait<br />
DxH ≤ M pour tout x ∈ U. Alors l’application H est M-lipschitzienne, c’est-à-dire qu’on a,<br />
pour x, y ∈ U :<br />
H(x) − H(y) ≤ Mx − y.<br />
Démonstration. Comme U est convexe, pour tous x, y ∈ U, le segment joignant x à y est contenu<br />
dans u et on peut appliquer le corollaire 2.<br />
8