LICENCE DE MATHÉMATIQUES FONDAMENTALES Calcul ...
LICENCE DE MATHÉMATIQUES FONDAMENTALES Calcul ...
LICENCE DE MATHÉMATIQUES FONDAMENTALES Calcul ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>LICENCE</strong> <strong>DE</strong> <strong>MATHÉMATIQUES</strong><br />
<strong>FONDAMENTALES</strong><br />
<strong>Calcul</strong> Différentiel et Équations Différentielles<br />
D. Azé<br />
Université Paul Sabatier Toulouse<br />
2008
Table des matières<br />
1 Généralités sur les espaces normés 3<br />
1.1 Espaces vectoriels normés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />
1.2 Espaces de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5<br />
1.3 Applications linéaires continues . . . . . . . . . . . . . . . . . . . . . . . . . . 8<br />
1.4 Normes équivalentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />
1.5 Applications multilinéaires continues . . . . . . . . . . . . . . . . . . . . . . . . 15<br />
1.6 Espaces de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18<br />
2 Applications différentiables dans les espaces normés 29<br />
2.1 Définition d’une application différentiable . . . . . . . . . . . . . . . . . . . . . 29<br />
2.2 Opérations sur les applications différentiables . . . . . . . . . . . . . . . . . . . 35<br />
2.3 Applications à valeurs dans un produit d’espaces . . . . . . . . . . . . . . . . . 38<br />
2.4 Applications définies sur un produit d’espaces . . . . . . . . . . . . . . . . . . . 39<br />
3 Théorème des Accroissements Finis et Applications 47<br />
3.1 Théorème des Accroissements Finis . . . . . . . . . . . . . . . . . . . . . . . . 47<br />
3.2 Applications du Théorème des Accroissements Finis . . . . . . . . . . . . . . . 51<br />
3.3 Applications Strictement Différentiables . . . . . . . . . . . . . . . . . . . . . . 55<br />
3.4 Opérateurs de Nemicki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56<br />
3.5 Primitives et Intégrales des Fonctions Réglées . . . . . . . . . . . . . . . . . . . 60<br />
4 Différentielles d’Ordre Supérieur 67<br />
4.1 Définition des Différentielles d’Ordre Supérieur . . . . . . . . . . . . . . . . . . 67<br />
4.2 Propriétés de Symétrie des Différentielles d’Ordre Supérieur . . . . . . . . . . . 71<br />
4.3 Formules de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />
4.4 Conditions d’Optimalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85<br />
5 Théorèmes d’Inversion et Applications 89<br />
5.1 Théorèmes d’inversion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89<br />
5.2 Théorème des Fonctions Implicites . . . . . . . . . . . . . . . . . . . . . . . . 93<br />
5.3 Application : Multiplicateurs de Lagrange . . . . . . . . . . . . . . . . . . . . . 95<br />
5.4 Introductions aux sous-variétés . . . . . . . . . . . . . . . . . . . . . . . . . . . 97<br />
5.4.1 Immersion et submersion locale . . . . . . . . . . . . . . . . . . . . . . 97<br />
5.4.2 Définitions équivalentes des sous-variétés . . . . . . . . . . . . . . . . . 98<br />
1
5.4.3 Sous-espace tangent . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101<br />
2
Chapitre 1<br />
Généralités sur les espaces normés<br />
1.1 Espaces vectoriels normés<br />
Le cadre naturel pour l’étude du calcul différentiel est celui des espaces vectoriels normés de<br />
dimension finie ou non. Commençons donc par rappeler les notions de base qui nous seront utiles<br />
dans la suite.<br />
Définition 1.1.1 Étant donné un espace vectoriel réel E, une norme est une fonction<br />
vérifiant<br />
i) ‖x‖ = 0 si et seulement si x = 0 ;<br />
‖ · ‖ : E → R + ,<br />
ii) ‖λx‖ = |λ|‖x‖, pour tout λ ∈ R et x ∈ E ;<br />
iii) ‖x + y‖ ≤ ‖x‖ + ‖y‖, pour tout x, y ∈ E.<br />
À toute norme est associée une distance d(x, y) = ‖x − y‖. Un espace normé est un espace<br />
métrique et donc un espace topologique. Une partie U ⊂ E est ouverte si, pour tout a ∈ U, il<br />
existe r > 0 tel que ¯B(a, r) ⊂ U où ¯B(a, r) = {x ∈ E : ‖x − a‖ ≤ r}. Les boules ouvertes<br />
B(a, r) = {x ∈ E : ‖x − a‖ < r} sont des ouverts et tout ouvert est réunion d’une famille<br />
de boules ouvertes. Une partie F de E est fermée si son complémentaire est ouvert (les boules<br />
fermées sont des fermés). Une suite (x n ) d’éléments de E est dite converger vers x ∈ E si la suite<br />
réelle (‖x n − x‖) converge vers 0. On écrit alors x = lim x n ou x n → x. La limite, quand elle<br />
n→∞<br />
existe, est unique ; elle est caractérisée par la propriété :<br />
pour tout ε > 0, il existe n 0 ∈ N tel que, pour tout n ≥ n 0 , ‖x n − x‖ ≤ ε.<br />
Les ensembles fermés F sont alors caractérisés par le fait que tout x ∈ E tel que pour tout r > 0,<br />
F ∩ B(x, r) ≠ ∅ appartient à F , ce qui équivaut à dire qu’ils contiennent toute limite d’une suite<br />
à valeurs dans F (le démontrer en exercice).<br />
3
Remarque 1.1.1<br />
et<br />
a) Pour tout x, y ∈ X on déduit des inégalités<br />
‖x‖ ≤ ‖x − y‖ + ‖y‖<br />
‖y‖ ≤ ‖y − x‖ + ‖x‖<br />
que l’on a, notant que ‖y − x‖ = ‖(−1)(x − y)‖ = ‖x − y‖,<br />
|‖x‖ − ‖y‖| ≤ ‖x − y‖.<br />
La fonction x ↦→ ‖x‖ est alors Lipschitzienne de constante 1, ce qui implique en particulier qu’elle<br />
est continue.<br />
b) Les applications (λ, x) ↦−→ λx et (x, y) ↦−→ x + y sont continues respectivement de R × E<br />
dans E et de E × E dans E. En effet si les suites (x n ), (y n ) et (λ n ) convergent respectivement<br />
vers x ∈ E, y ∈ E et λ ∈ R, on a<br />
‖(x n + y n ) − (x + y)‖ ≤ ‖x n − x‖ + ‖y n − y‖,<br />
‖λ n x n − λx‖ = ‖(λ n − λ)x n + λ(x n − x)‖<br />
≤<br />
≤<br />
|λ n − λ|‖x n ‖ + |λ|‖x n − x‖<br />
|λ n − λ|M + |λ|‖x n − x‖<br />
où M = sup‖x n ‖ < +∞ car une suite convergente est bornée. Il en résulte bien que x + y =<br />
n∈N<br />
lim (x n + y n ) et que λx = lim λ n x n .<br />
n→∞ n→∞<br />
c) Dans le cas où E = R n , on identifiera u ∈ R n à une matrice n × 1. Cela donne un sens<br />
au produit matriciel AX ∈ R n d’une matrice A ∈ M(m, n) par un vecteur X ∈ R n . Avec ces<br />
notations, le produit scalaire euclidien s’écrit, pour X, Y ∈ R n ,<br />
〈X, Y 〉 = Y T X =<br />
n∑<br />
X i Y i ,<br />
i=1<br />
où Y T ∈ M(1, n) est la matrice uniligne transposée de Y ∈ M(n, 1). On prendra garde de<br />
ne pas confondre le scalaire Y T X avec Y X T qui est la matrice carrée de taille n définie par<br />
[Y X T ] ij = Y i X j .<br />
Étant donnée une famille finie d’espaces normés E 1 , · · · , E d dont les normes sont indifféremment<br />
dénotées par ‖·‖, on utilisera sur le produit cartésien E = E 1 ×· · ·×E d les normes suivantes<br />
(démontrer en exercice que ce sont bien des normes).<br />
Définition 1.1.2 On pose<br />
‖(x 1 , · · · , x d )‖ 1 =<br />
4<br />
d∑<br />
‖x i ‖,<br />
i=1
et plus généralement pour 1 ≤ p < +∞<br />
on pose aussi<br />
( d∑ ) 1/2,<br />
‖(x 1 , · · · , x d )‖ 2 = ‖x i ‖ 2<br />
i=1<br />
( d∑ ) 1<br />
‖(x 1 , · · · , x d )‖ p = ‖x i ‖ p p<br />
,<br />
i=1<br />
‖(x 1 , · · · , x d )‖ ∞ = sup ‖x i ‖.<br />
1≤i≤d<br />
C’est un exercice facile de montrer qu’une suite (x n ) n∈N dans E 1 × · · · × E d converge pour ces<br />
normes vers x si et seulement si les suites (x n i) n∈N convergent vers x i dans E i pour tout i ∈ [1, d].<br />
1.2 Espaces de Banach<br />
Rappellons que dans un espace métrique (E, d), une suite (x n ) est dite de Cauchy si<br />
ce qui équivaut à<br />
lim d(x n, x m ) = 0,<br />
(m,n)→∞<br />
pour tout ε > 0, il existe n 0 tel que pour tout m, n ≥ n 0 , d(x n , x m ) ≤ ε.<br />
L’espace métrique (E, d) est dit complet si toute suite de Cauchy est convergente.<br />
Définition 1.2.1 Un espace de Banach est un espace normé (E, ‖ · ‖) complet pour la distance<br />
associée à la norme ‖ · ‖.<br />
Exemple 1.2.1<br />
a) Considérons R d muni de l’une des normes ‖ · ‖ 1 , ‖ · ‖ 2 , ‖ · ‖ ∞ de la définition 1.1.2. On a,<br />
pour tout x ∈ R d ,<br />
‖x‖ 2 ≤ ‖x‖ 1 ≤ n‖x‖ ∞ et ‖x‖ ∞ ≤ ‖x‖ 2 .<br />
Ces inégalités montrent que les suites convergentes sont les mêmes pour ces trois normes et qu’une<br />
suite converge si et seulement si les d suites de ses composantes convergent au sens usuel de R<br />
vers des limites qui sont alors les composantes de la limite. L’espace R d est alors de Banach pour<br />
ces trois normes (il est en fait complet pour toute norme comme on le verra dans la suite de ce<br />
chapitre).<br />
b) Plus généralement un produit fini d’espaces de Banach est de Banach pour les normes de la<br />
définition 1.1.2.<br />
c) Soit p un élément de R tel que 1 ≤ p ≤ ∞, on définit<br />
l p = {(x n ) n∈N ∗ ⊂ R : ‖x‖ p < +∞}<br />
5
où<br />
( ∑ ∞ ) 1/p<br />
‖x‖ p = |x n | p si 1 ≤ p < +∞,<br />
n=1<br />
‖x‖ ∞ = sup |x n | si p = +∞.<br />
n≥1<br />
Pour montrer que ‖ · ‖ p est une norme sur l p pour 1 ≤ p < +∞, il faut faire appel aux inégalités<br />
de Hölder et de Minkowski, le cas p = +∞ étant plus simple (voir T.D.). Montrons que l p est<br />
complet pour la norme ‖ · ‖ p . Remarquons que si (x n ) n∈N ∗ est une suite dans l p , chaque terme x n<br />
est une suite de nombres réels dont les termes sont notés (x n i ) i∈N ∗. On a donc un tableau infini à<br />
double entrée,<br />
x 1 1, · · · , x 1 i , · · ·<br />
.<br />
x n 1, · · · , x n i , · · ·<br />
.<br />
Traitons le cas où 1 ≤ p < +∞. Soit (x n ) n∈N ∗ une suite de Cauchy. Pour tout ε > 0, il existe<br />
n 0 ∈ N ∗ tel que, pour tout m, n ≥ n 0 , on ait<br />
∞∑<br />
|x n i − x m i | p ≤ ε p .<br />
i=1<br />
Pour tout i ∈ N ∗ on obtient donc que la suite (x n i ) n∈N ∗<br />
vers un réel x i . Pour tout N ∈ N ∗ , on a<br />
est de Cauchy dans R et converge donc<br />
N∑<br />
|x n i − x m i | p ≤<br />
i=1<br />
∞∑<br />
|x n i − x m i | p ≤ ε p .<br />
i=1<br />
En faisant tendre m vers +∞, il vient<br />
N∑<br />
|x n i − x i | p ≤ ε p (1.1)<br />
i=1<br />
ce qui implique que x n − x ∈ l p d’où x = x n − (x n − x) ∈ l p car l p est un espace vectoriel. Enfin,<br />
passant à la limite sur N dans l’inégalité 1.1, on obtient que pour tout n ≥ n 0 ,<br />
‖x n − x‖ p ≤ ε,<br />
d’où le résultat. Dans le cas p = +∞, la démonstration est analogue.<br />
d) On se donne un espace métrique (X, d), un espace normé (Y, ‖ · ‖) et on considère l’ensemble<br />
C b (X, Y ) des applications de X dans Y qui sont continues et bornées (i.e. sup x∈X ‖f(x)‖ <<br />
+∞). On munit C b (X, Y ) de la norme<br />
‖f‖ ∞ = sup ‖f(x)‖.<br />
x∈X<br />
6
Quand Y = R, on notera simplement C b (X, R) = C b (X). C’est un exercice facile de montrer que<br />
(C b (X, Y ), ‖·‖ ∞ ) est un espace de Banach quand c’est le cas pour (Y, ‖·‖). Dans le cas particulier<br />
où X = N et Y = R, on retrouve l’exemple c) en remarquant que C b (N) = l ∞ car toute fonction<br />
définie sur N est continue !<br />
e) L’ensemble C 1 ([0, 1]) des fonctions continuement dérivables sur [0, 1] est un espace de Banach<br />
muni de la norme<br />
‖f‖ C 1 = ‖f‖ ∞ + ‖f ′ ‖ ∞<br />
est un espace de Banach (le démontrer en exercice). Plus généralement il en est de même de<br />
l’ensemble C m ([0, 1]) des fonctions m fois continuement dérivables sur [0, 1] avec m ∈ N ∗ muni<br />
de la norme<br />
‖f‖ C m = ‖f‖ ∞ + ‖f ′ ‖ ∞ + · · · + ‖f (m) ‖ ∞ .<br />
f) L’espace C([0, 1]) des fonctions continues sur [0,1] à valeurs réelles muni de la norme<br />
‖f‖ 1 =<br />
n’est pas un espace de Banach (le démontrer).<br />
∫ 1<br />
0<br />
|f(t)| dt<br />
Définition 1.2.2 Soit (E, ‖ · ‖) un espace normé et (x n ) une suite dans E. On pose, pour tout<br />
n ∈ N, S n = ∑ n<br />
i=0 x i. On dit que la série de terme général (x n ) converge s’il en est de même de<br />
la suite (S n ) et on pose<br />
∞∑<br />
x i = lim S n .<br />
n→∞<br />
i=0<br />
On dit que la série de terme général (x n ) est normalement convergente si la série de terme général<br />
(‖x n ‖) est convergente.<br />
Théorème 1.2.1 Dans un espace de Banach (E, ‖ · ‖), toute série normalement convergente est<br />
convergente et<br />
∞∑ ∥ ∥∥ ∑ ∞<br />
∥ x n ≤ ‖x n ‖.<br />
Démonstration. Soit n > m, on a<br />
n=0<br />
n=0<br />
‖S n − S m ‖ = ‖x m+1 + · · · + x n ‖ ≤ T n − T m ,<br />
où T n = ∑ n<br />
i=0 ‖x i‖. La suite (T n ) étant convergente est de Cauchy. Il en est donc de même de<br />
(S n ) qui est donc convergente. Par ailleurs passant à la limite quand n → +∞ dans l’inégalité<br />
‖S n ‖ ≤ T n on obtient que ‖S‖ ≤ ‖T ‖, d’où le résultat.<br />
7
1.3 Applications linéaires continues<br />
Théorème 1.3.1 Soient (E, ‖·‖) et (F, ‖·‖) deux espaces normés et f : E → F une application<br />
linéaire. Les propriétés suivantes sont équivalentes<br />
i) f continue sur E,<br />
ii) f continue en 0,<br />
iii) il existe M ≥ 0 tel que pour tout x ∈ E, ‖f(x)‖ ≤ M‖x‖.<br />
Démonstration. Il est clair que i) ⇒ ii) et que iii) ⇒ i) car, pour tout x, y ∈ X,<br />
‖f(x) − f(y)‖ = ‖f(x − y)‖ ≤ M‖x − y‖.<br />
Il reste à montrer que ii) ⇒ iii). De part la continuité de f en 0, il existe η > 0 tel que, pour tout<br />
z ∈ ¯B(0, η),<br />
‖f(z)‖ = ‖f(z) − f(0)‖ ≤ 1.<br />
Soit alors x ∈ E\{0}. Remarquant que z :=<br />
η<br />
‖x‖ x ∈ ¯B(0, η), on obtient<br />
η<br />
‖f(x)‖ = ‖f(z)‖ ≤ 1,<br />
‖x‖<br />
d’où<br />
‖f(x)‖ ≤ (1/η)‖x‖.<br />
On notera L(E, F ) l’ensemble des applications linéaires continues de E dans F . Si F = R,<br />
on note E ∗ = L(E, R) et on dit que E ∗ est le dual topologique de E.<br />
Remarque 1.3.1 On peut montrer, en utilisant le Théorème de Hahn-Banach, que pour tout espace<br />
normé (E, ‖ · ‖), E ∗ = L(E, R) ≠ {0}. On peut aussi montrer qu’il existe des applications<br />
linéaires non continues.<br />
Définition 1.3.1 Pour tout f ∈ L(E, F ), on pose :<br />
‖f‖ = inf{M ≥ 0 : pour tout x ∈ E, ‖f(x)‖ ≤ M‖x‖}.<br />
Cette définition a bien un sens car l’ensemble de réels dont on considère la borne inférieure est<br />
non vide (Théorème 1.3.1) et minoré par 0.<br />
Proposition 1.3.1 La fonction ‖.‖ définie ci-dessus est une norme sur L(E, F ) et l’on a,<br />
‖f(x)‖<br />
‖f‖ = sup<br />
x≠0 ‖x‖<br />
= sup ‖f(x)‖ = sup ‖f(x)‖.<br />
‖x‖≤1<br />
‖x‖=1<br />
8
Démonstration. Soit M ≥ 0 tel que ‖f(x)‖ ≤ M‖x‖ pour tout x ∈ E. On a donc pour tout<br />
x ≠ 0,<br />
‖f(x)‖<br />
≤ M,<br />
‖x‖<br />
d’où<br />
Passant à la borne inférieure sur M, il vient<br />
Soit alors ε tel que 0 < ε < ‖f‖, on a<br />
Il existe donc z ≠ 0 tel que<br />
Il vient alors<br />
d’où<br />
‖f(x)‖<br />
sup<br />
x≠0 ‖x‖<br />
‖f(x)‖<br />
sup<br />
x≠0 ‖x‖<br />
≤ M.<br />
≤ ‖f‖.<br />
‖f‖ − ε ∉ {M ≥ 0 : pour tout x ∈ E, ‖f(x)‖ ≤ M‖x‖}.<br />
‖f(z)‖ > (‖f‖ − ε)‖z‖.<br />
‖f(x)‖<br />
sup<br />
x≠0 ‖x‖<br />
en faisant tendre ε vers 0. On a donc bien<br />
≥ ‖f(z)‖<br />
‖z‖<br />
‖f(x)‖<br />
sup<br />
x≠0 ‖x‖<br />
> ‖f‖ − ε,<br />
≥ ‖f‖<br />
‖f(x)‖<br />
‖f‖ = sup<br />
x≠0 ‖x‖ ,<br />
on a alors, notant que ‖f(x)‖<br />
‖x‖<br />
= f( x<br />
‖x‖ )<br />
Par ailleurs<br />
‖f(x)‖<br />
‖f‖ = sup<br />
x≠0 ‖x‖<br />
≤ sup ‖f(z)‖.<br />
‖z‖=1<br />
sup ‖f(x)‖ ≤ ‖f‖<br />
‖x‖≤1<br />
car ‖f(x)‖ ≤ ‖f‖‖x‖ pour tout x ∈ X. En résumé on a<br />
sup ‖f(x)‖ ≤ sup ‖f(x)‖ ≤ ‖f‖ ≤ sup ‖f(x)‖,<br />
‖x‖=1<br />
‖x‖≤1<br />
‖x‖=1<br />
d’où le résultat. Nous laissons alors au lecteur le soin de vérifier que la fonction ‖ · ‖ ainsi définie<br />
sur L(E, F ) est une norme.<br />
9
Remarque 1.3.2<br />
a) Pour montrer qu’une application linéaire est continue, il suffit donc de montrer qu’elle est<br />
bornée sur la boule unité de l’espace de départ.<br />
b) Ce qu’il faut retenir c’est que si une application linéaire de E dans F est telle qu’il existe<br />
M ≥ 0 telle que, pour tout x ∈ E,<br />
‖f(x)‖ ≤ M‖x‖,<br />
alors f est continue et ‖f‖ ≤ M. Notons également que pour tout f ∈ L(E, F ) et pour tout<br />
x ∈ E, on a<br />
‖f(x)‖ ≤ ‖f‖‖x‖,<br />
on en déduit aisément que, pour tout f ∈ L(E, F ), g ∈ L(F, G), on a<br />
En effet, pour tout x ∈ E avec ‖x‖ ≤ 1<br />
d’où<br />
‖g ◦ f‖ ≤ ‖g‖‖f‖. (1.2)<br />
‖g(f(x))‖ ≤ ‖g‖‖f(x)‖ ≤ ‖g‖‖f‖,<br />
‖g ◦ f‖ = sup ‖g(f(x))‖ ≤ ‖g‖‖f‖.<br />
‖x‖≤1<br />
L’inégalité 1.2 ne peut pas être remplacée par une égalité. En effet si f et g sont les projections<br />
orthogonales sur deux sous-espaces orthogonaux non réduits à {0} de R d , on a g ◦ f = 0 et<br />
‖f‖ = ‖g‖ = 1.<br />
Exemple 1.3.1<br />
a) Soit E = C([0, 1]) l’ensemble des fonctions continues définies sur [0, 1] muni de la norme<br />
‖f‖ ∞ = sup t∈[0,1] |f(t)|. L’application L : E −→ R définie par<br />
L(f) =<br />
∫ 1<br />
0<br />
f(t) dt<br />
est linéaire continue et ‖L‖ ≤ 1. En effet, pour tout f ∈ E<br />
|L(f)| ≤ ∣<br />
∫ 1<br />
0<br />
f(t) dt∣ ≤<br />
∫ 1<br />
0<br />
|f(t)| dt ≤<br />
∫ 1<br />
0<br />
‖f‖ ∞ dt ≤ ‖f‖ ∞ .<br />
b) Soit 1 < p < +∞ et soit l p défini dans l’exemple 1.2.1 b). Soit 1 < q < +∞ tel que<br />
1<br />
p + 1 q = 1. Soit y ∈ lq et L : l p −→ R définie pour tout x ∈ l p par<br />
L(x) =<br />
∞∑<br />
x n y n .<br />
n=1<br />
La série définissant L(x) est convergente, L est linéaire et<br />
|L(x)| ≤ ‖y‖ q ‖x‖ p<br />
10
ce qui montre que L est linéaire et ‖L‖ ≤ ‖y‖ q (voir T.D.).<br />
c) Soient E, F , G des espaces normés et soient f ∈ L(E, F ), g ∈ L(F, G). Pour tout x ∈ E<br />
on a<br />
‖g(f(x))‖ ≤ ‖g‖‖f(x)‖ ≤ ‖f‖‖g‖‖x‖.<br />
il en résulte que g ◦ f ∈ L(E, G) et<br />
De plus les applications<br />
et<br />
‖g ◦ f‖ ≤ ‖g‖‖f‖. (1.3)<br />
L : L(E, F ) −→ L(E, G)<br />
f ↦−→ f ◦ g<br />
M : L(F, G) −→ L(E, G)<br />
g ↦−→ f ◦ g<br />
sont linéaires. Elles sont aussi continues car pour tout f ∈ L(E, F ), g ∈ L(F, G) il découle de<br />
(1.3) que<br />
‖L(f)‖ ≤ ‖g‖‖f‖<br />
et<br />
‖M(g)‖ ≤ ‖f‖‖g‖.<br />
Théorème 1.3.2 Soient (E, ‖ · ‖) un espace normé et (F, ‖ · ‖) un espace de Banach. Alors<br />
L(E, F ) est un espace de Banach muni de la norme de la Définition 1.3.1.<br />
Démonstration. Soit (f n ) une suite de Cauchy dans L(E, F ). Pour tout ε > 0, il existe n 0 ∈ N<br />
tel que, pour tout m, n ≥ n 0 ,<br />
‖f n − f m ‖ = sup ‖f n (x) − f m (x)‖ ≤ ε, (1.4)<br />
‖x‖≤1<br />
Pour tout x ∈ B = B(0, 1), la suite (f n (x)) est de Cauchy, elle converge donc vers un élément<br />
noté ϕ(x). Il existe donc une application<br />
ϕ : B → F<br />
telle que la restriction f n |B converge uniformément vers ϕ. Posons, pour tout x ∈ X\{0}<br />
f(x) = ‖x‖ϕ(x/‖x‖) et f(0) = 0.<br />
Pour tout x ≠ 0, il vient<br />
f n (x) = ‖x‖f n (x/‖x‖),<br />
11
d’où<br />
lim f n(x) = ‖x‖ϕ(x/‖x‖) = f(x).<br />
n→∞<br />
Il est alors aisé de vérifier, en passant à la limite dans les égalités f n (λx) = λf n (x) et f n (x + y) =<br />
f n (x) + f n (y), que f est linéaire. Montrons que f est continue. En effet en prennant n = n 0 et en<br />
faisant tendre m vers l’infini dans (1.4) il vient<br />
d’où<br />
sup ‖f n0 (x) − f(x)‖ ≤ ε,<br />
‖x‖≤1<br />
sup ‖f(x)‖ ≤ ‖f n0 ‖ + ε,<br />
‖x‖≤1<br />
ce qui, compte tenu de la Remarque 1.3.2 a) montre la continuité de f. Enfin, revenant à 1.4, on a<br />
faisant tendre m vers l’infini,<br />
‖f n − f‖ = sup ‖f n (x) − f(x)‖ ≤ ε<br />
‖x‖≤1<br />
et ce, pour tout n ≥ n 0 , ce qui achève la démonstration.<br />
Définition 1.3.2 Soient E et F des espaces normés. On dit que f ∈ L(E, F ) est un isomorphisme<br />
si f est bijective et si f −1 ∈ L(F, E). On note alors Isom (E, F ) l’ensemble éventuellement vide<br />
des isomorphismes de E dans F .<br />
Remarque 1.3.3<br />
a) Si E est un espace de Banach et si F est isomorphe à E, alors F est un espace de Banach.<br />
En effet, il existe D > 0 telles que, pour tout y, y ′ ∈ F ,<br />
‖f −1 (y) − f −1 (y ′ )‖ ≤ D‖y − y ′ ‖.<br />
Il en résulte que si (y n ) est de Cauchy dans F alors (f −1 (y n )) est de Cauchy dans E et converge<br />
donc vers un élément x ∈ E, ce qui implique la convergence de (y n ) vers y = f(x).<br />
b) Il est clair que la composée de deux isomorphismes est un isomorphisme.<br />
c) Il existe des applications linéaires continues et bijectives qui ne sont pas des isomorphismes.<br />
Cependant on a le résultat positif suivant que nous démontrerons dans le chapitre 4.<br />
Théorème 1.3.3 Soient E et F des espaces de Banach et soit f ∈ L(E, F ) telle que f est bijective.<br />
Alors f est un isomorphisme.<br />
Définition 1.3.3 On dit que f ∈ L(E, F ) est une isométrie si pour tout x ∈ E<br />
‖f(x)‖ = ‖x‖.<br />
12
Exemple 1.3.2 Soit E un espace normé. Pour tout h ∈ E on définit l’application<br />
ϕ h :<br />
R −→ E<br />
t ↦−→ th<br />
On a ϕ h ∈ L(R, E) et l’application ϕ qui à h associe ϕ h est un isomorphisme et une isométrie de<br />
E dans L(R, E). En effet<br />
‖ϕ h ‖ = max(‖ϕ h (1)‖, ‖ϕ h (−1)‖) = ‖ϕ h (1)‖ = ‖h‖.<br />
L’isométrie réciproque ψ : L(R, E) → E est définie par<br />
ψ(f) = f(1) pour tout f ∈ L(R, E).<br />
Dans la suite, on identifiera L(R, E) et E par cette isométrie.<br />
Le résultat suivant a d’importantes applications.<br />
Théorème 1.3.4 Soient E, F des espaces de Banach, alors Isom (E, F ) est ouvert (éventuellement<br />
vide) dans L(E, F ) et l’application u ↦−→ u −1 est continue sur Isom (E, F ).<br />
Démonstration. Soit v ∈ L(E) tel que ‖v‖ < 1. La série de terme général (v n ) est alors normalement<br />
convergente car ‖v n ‖ ≤ ‖v‖ n . Posons S n = ∑ n<br />
k=0 vk , on a<br />
v ◦ S n = S n ◦ v = S n+1 − I<br />
où I désigne l’application identique de E dans E. Il résulte alors de la continuité des applications<br />
u ↦−→ u ◦ v et u ↦−→ v ◦ u (voir Exemple (1.3.1), c)) que S = ∑ ∞<br />
k=0 vk vérifie<br />
(I − v) ◦ S = S ◦ (I − v) = I,<br />
donc que I − v est bijective, c’est donc un isomorphisme d’après le Théorème 1.3.3. Soit alors<br />
u ∈ Isom (E, F ) et v ∈ L(E, F ). On a,<br />
v ∈ Isom(E, F ) → u −1 ◦ v ∈ Isom(E).<br />
Or u −1 ◦ v = I − w avec w = I − (u −1 ◦ v) = u −1 ◦ (u − v). On a,<br />
‖w‖ = ‖u −1 ◦ (u − v)‖ ≤ ‖u −1 ‖‖(u − v)‖.<br />
donc B(u, 1/‖u −1 ‖) ⊂ Isom (E, F ). Par ailleurs on a<br />
d’où<br />
On obtient alors<br />
‖v −1 − u −1 ‖ ≤<br />
v −1 = (u ◦ (I − w)) −1 = (I − w) −1 ◦ u −1 ,<br />
v −1 − u −1 = ((I − w) −1 − I) ◦ u −1 =<br />
∥<br />
∞∑ ∥<br />
w k ∥∥‖u −1 ‖ ≤<br />
k=1<br />
∞∑<br />
w k ◦ u −1 .<br />
k=1<br />
∞∑<br />
‖w k ‖‖u −1 ‖ ≤<br />
k=1<br />
Comme w tend vers 0 quand v tend vers u on a bien le résultat.<br />
‖w‖<br />
1 − ‖w‖ ‖u‖−1 .<br />
13
1.4 Normes équivalentes<br />
Définition 1.4.1 Soit E un espace vectoriel muni de deux normes ‖ · ‖ 1 et ‖ · ‖ 2 . On dit que ces<br />
deux normes sont équivalentes si elles définissent la même topologie (i.e. si les suites convergentes<br />
et leurs limites sont les mêmes). Ceci équivaut à la continuité des applications linéaires :<br />
Il en résulte immédiatement le<br />
I : (E, ‖ · ‖ 1 ) → (E, ‖ · ‖ 2 )<br />
I : (E, ‖ · ‖ 2 ) → (E, ‖ · ‖ 1 ).<br />
Théorème 1.4.1 Soient ‖ · ‖ 1 et ‖ · ‖ 2 deux normes sur un espace vectoriel E. Les propriétés<br />
suivantes sont équivalentes,<br />
i) ‖ · ‖ 1 et ‖ · ‖ 2 sont des normes équivalentes,<br />
ii) il existe a, b > 0 telles que, pour tout x ∈ E,<br />
‖x‖ 1 ≤ a‖x‖ 2 et ‖x‖ 2 ≤ b‖x‖ 1 .<br />
Démonstration. Elle résulte de la Définition 1.4.1 et du Théorème 1.3.2, remarquant que ii)<br />
équivaut à la continuité des applications linéaires<br />
I : (E, ‖ · ‖ 2 ) → (E, ‖ · ‖ 2 ) et I : (E, ‖ · ‖ 1 ) → (E, ‖ · ‖ 2 ).<br />
Dans le cas des espaces de dimension finie, on a<br />
Théorème 1.4.2 Toutes les normes sont équivalentes dans R d .<br />
Démonstration. Posons, pour tout x ∈ R d , ‖x‖ = ∑ d<br />
i=1 |x i| et considérons une norme ρ(.) sur<br />
R d . Pour tout i = 1, · · · , d définissons le vecteur e i = (0, · · · , 1, · · · , 0), dont toutes les composantes<br />
sont nulles sauf celle de rang i. Pour tout x, y ∈ R d on a<br />
( d∑ )<br />
ρ(x − y) = ρ (x i − y i )e i<br />
≤<br />
≤<br />
i=1<br />
d∑<br />
|x i − y i |ρ(e i )<br />
i=1<br />
M‖x − y‖,<br />
où M = sup 1≤i≤d ρ(e i ). La fonction ρ(.) est donc continue, elle atteint alors sa borne inférieure<br />
sur le compact S = {x ∈ R d : ‖x‖ = 1}. Il existe donc m > 0 tels que, pour tout x ≠ 0, on a<br />
m ≤ ρ(x/‖x‖),<br />
d’où m‖x‖ ≤ ρ(x) ≤ M‖x‖, ce qui montre que les normes ‖ · ‖ et ρ(.) sont équivalentes. Soient<br />
alors ρ 1 et ρ 2 deux normes sur R d . Comme ρ 1 est équivalente à ‖ · ‖ et que ‖ · ‖ est équivalente à<br />
ρ 2 , on obtient que ρ 1 est équivalente à ρ 2 (le vérifier).<br />
14
Corollaire 1.4.1<br />
i) R d est un espace de Banach pour toute norme.<br />
ii) Toute application linéaire de R d dans un espace normé (F, ‖ · ‖) est continue.<br />
Démonstration. i) Résulte du fait qu’un espace de Banach l’est encore quand on remplace sa<br />
norme par une norme équivalente, du Théorème 1.4.2 et du fait que R d est complet muni de l’une<br />
de ses normes usuelles (voir Exemple 1.2.1 a)).<br />
ii) Exercice facile.<br />
Remarque 1.4.1<br />
a) Soit (E, ‖ · ‖) un espace vectoriel de dimension d rapporté à une base (u 1 , · · · , u d ). L’application<br />
d∑<br />
ϕ(x 1 , · · · , x d ) = x i u i<br />
est bijective linéaire et continue (le démontrer) de R d dans E. La bijection réciproque ϕ −1 est aussi<br />
continue. En effet la fonction ‖ϕ(.)‖ qui est une norme sur R d est équivalente à la norme ‖ · ‖ ∞ .<br />
Il existe donc c > 0 tel que ‖ · ‖ ∞ ≤ c‖ϕ(.)‖, ce qui implique bien la continuité de ϕ −1 . Ainsi E<br />
est isomorphe à R d et le Théorème 1.4.2 ainsi que le Corollaire 1.4.1 sont vrais en remplaçant R d<br />
par un espace vectoriel E de dimension finie d.<br />
b) On peut montrer que la boule unité d’un espace normé de dimension infinie n’est jamais<br />
compacte (Théorème de F. Riesz).<br />
1.5 Applications multilinéaires continues<br />
Définition 1.5.1 Soient E 1 , · · · , E n , F des espaces vectoriels, on dit qu’une application<br />
i=1<br />
f : E 1 × · · · × E n −→ F<br />
est multilinéaire si, pour tout i ∈ [1, n], et pour tout a = (a 1 , · · · , a n ) ∈ E 1 × · · · × E n , les<br />
applications f i : E i → F définies par<br />
sont linéaires.<br />
f i (x) = f(a 1 , · · · , a i−1 , x, a i+1 , · · · , a n )<br />
Théorème 1.5.1 Soient E 1 , · · · E n , F des espaces normés et soit une application multilinéaire<br />
f : E 1 × · · · × E n −→ F . On munit l’espace vectoriel E 1 × · · · × E n d’une norme définissant<br />
la topologie produit (par exemple l’une des normes équivalentes de la Définition 1.1.2). Alors, les<br />
deux propriétés suivantes sont équivalentes.<br />
i) f est continue sur E 1 × · · · × E n ,<br />
ii) il existe M ≥ 0 telle que, pour tout x ∈ E 1 × · · · × E n , on a<br />
‖f(x)‖ ≤ M‖x 1 ‖ · · · ‖x n ‖.<br />
15
Démonstration. i) ⇒ ii). Comme f est continue en 0 et f(0) = 0, Il existe η > 0 tel que,<br />
‖x‖ = sup ‖x i ‖ ≤ η ⇒ ‖f(x)‖ ≤ 1.<br />
1≤i≤n<br />
Soit alors x ∈ (E 1 \{0}) × · · · × (E n \{0}). Posons y = η(x 1 /‖x 1 ‖, · · · ., x n /‖x n ‖), on a ‖y‖ ≤ η.<br />
Il en résulte ‖f(y)‖ ≤ 1, et donc<br />
‖f(x)‖ ≤ (1/η n )‖x 1 ‖ · · · .‖x n ‖.<br />
Enfin, si l’un des x i est nul l’inégalité ci-dessus est vérifiée avec 0 des deux côtés de l’inégalité.<br />
ii) ⇒ i). On procède par récurrence sur n. Soient x, h ∈ E 1 × · · · × E n . On a<br />
‖f(x + h) − f(x)‖ ≤ ‖f(x + h) − f(x + k)‖ + ‖f(x + k) − f(x)‖<br />
où k = (0, h 2 , · · · , h n ). On a alors<br />
‖f(x + h) − f(x + k)‖ ≤ M‖h 1 ‖(‖x 2 ‖ + ‖h 2 ‖) · · · (‖x n ‖ + ‖h n ‖)<br />
≤<br />
C‖h 1 ‖<br />
dès que ‖h‖ ≤ 1. Par ailleurs l’application g : E 2 × · · · × E n −→ F définie par<br />
est telle que g ∈ L(E 2 × · · · × E n , F ) et vérifie<br />
g(z 2 , · · · , z n ) = f(x 1 , z 2 , · · · , z n )<br />
‖g(z 2 , · · · , z n )‖ ≤ M ′ ‖z 2 ‖ · · · ‖z n ‖ avec M ′ = M‖x 1 ‖.<br />
De plus<br />
‖f(x + k) − f(x)‖ = ‖g(x 2 + h 2 , · · · , x n + h n ) − g(x 2 , · · · , x n )‖.<br />
On applique alors l’hypothèse de récurrence et on obtient l’existence de η > 0 tel que<br />
‖g(x 2 + h 2 , · · · , x n + h n ) − g(x 2 , · · · , x n )‖ ≤ ε/2<br />
pourvu que sup 2≤i≤n ‖h i ‖ ≤ η. Il en résulte que pour sup 1≤i≤n ‖h i ‖ ≤ max(η, ε/2C), on a<br />
‖f(x + h) − f(x)‖ ≤ C‖h 1 ‖ + ε/2 ≤ ε,<br />
ce qui démontre i).<br />
On note L(E 1 , · · · , E n ; F ) l’ensemble des applications multilinéaires continues de<br />
E 1 × · · · × E n dans F . Si E 1 = · · · = E n = E, on note L(E 1 , · · · , E n ; F ) = L n (E; F ). Nous<br />
laissons au lecteur le soin de démontrer que pour tout choix d’une norme sur E 1 × · · · × E n<br />
‖f‖ = sup ‖f(x)‖<br />
‖x‖≤1<br />
16
est une norme sur L(E 1 , · · · , E n , F ), que<br />
‖f‖ = inf{M ∈ R + : pour tout x ∈ E 2 × · · · × E n , ‖f(x)‖ ≤ M‖x 1 ‖ · · · ‖x n ‖},<br />
et que si F est de Banach, l’espace L(E 1 , · · · , E n ; F ) est un espace de Banach muni de cette norme<br />
(s’inspirer de la démonstration du Théorème 1.3.2). Enfin le lecteur démontrera que si E 1 , · · · , E n<br />
sont de dimension finie toute application multilinéaire définie sur E 1 × · · · × E n est continue.<br />
Le résultat suivant est fondamental pour l’étude des différentielles d’ordre supérieur.<br />
Théorème 1.5.2 L’application<br />
Φ : L m (E; L n (E; F )) → L n+m (E; F )<br />
définie pour g ∈ L m (E; L n (E; F )) et (x 1 , · · · , x n+m ) ∈ E n+m par<br />
Φ(g)(x 1 , · · · , x n+1 ) = g(x 1 , · · · , x m )(x 2 , · · · , x n+1 )<br />
est une isométrie de L m (E; L n (E; F )) dans L n+m (E; F ) et l’isométrie réciproque<br />
Ψ : L n+m (E; F ) → L m (E; L n (E; F ))<br />
est définie, pour tout f ∈ L n+m (E; F ), (z 1 , · · · , z m ) ∈ E m et (x 1 , · · · , x n ) ∈ E n par<br />
(Ψ(f)(z 1 , · · · , z m ))(x 1 , · · · , x n ) = f(z 1 , · · · , z m , x 1 , · · · , x n ).<br />
Démonstration. On a<br />
‖Φ(g)(x 1 , · · · , x n+m )‖ ≤ ‖g(x 1 , · · · , x m )‖ L n (E;F )‖x m+1 ‖ · · · ‖x n+1 ‖<br />
≤ ‖g‖ L m (E;L n (E;F ))‖x 1 ‖ · · · ‖x m ‖ · ‖x 2 ‖ · · · ‖x n+1 ‖<br />
ce qui montre que Φ(g) ∈ L n+m (E; F ) et<br />
‖Φ(g)‖ L n+m (E;F ) ≤ ‖g‖ L m (E;L n (E;F )). (1.5)<br />
Par ailleurs, pour tout (z 1 , · · · , z m ) ∈ E m ,<br />
‖Ψ(f)(z 1 · · · , z m )(x 1 , · · · , x n )‖ ≤ ‖f‖ L n+m (E;F )‖z 1 ‖ · · · ‖z m ‖ · ‖x 1 ‖ · · · ‖x n ‖<br />
ce qui montre que Ψ(f) ∈ L m (E; L n (E; F )) et<br />
‖Ψ(f)(z 1 , · · · , z m )‖ L n (E;F ) ≤ ‖f‖ L n+1 (E;F )‖z 1 ‖ · · · ‖z m ‖<br />
d’où<br />
‖Ψ(f)‖ L m (E;L n (E;F )) ≤ ‖f‖ L n+m (E;F ). (1.6)<br />
Les applications Φ et Ψ sont donc linéaires continues. Il est clair qu’elles sont aussi réciproques<br />
l’une de l’autre. On a alors pour tout f ∈ L n+m (E; F ), g ∈ L m (E; L n (E; F ))<br />
‖f‖ L n+m (E;F ) = ‖(Φ ◦ Ψ)(f)‖ L n+m (E;F ) = ‖Φ(Ψ(f))‖ L n+m (E;F ) ≤ ‖Ψ(f)‖ L m (E;L n (E;F ))<br />
17
et<br />
‖g‖ L m (E;L n (E;F )) = ‖(Ψ ◦ Φ)(g)‖ L m (E;L n (E;F )) = ‖Ψ(Φ(g))‖ L m (E;L n (E;F )) ≤ ‖Φ(g)‖ L n+m (E;F ),<br />
ce qui combiné à (1.5) et (1.6) montre que<br />
‖Φ(g)‖ L n+m (E;F ) = ‖g‖ L m (E;L n (E;F ))<br />
et<br />
On a donc bien le résultat.<br />
‖Ψ(f)‖ L m (E;L n (E;F )) = ‖f‖ L n+m (E;F ).<br />
1.6 Espaces de Hilbert<br />
Définition 1.6.1 Un produit scalaire 〈., .〉 sur un espace vectoriel E est une fonction de E × E<br />
dans R qui est bilinéaire symétrique (〈x, y〉 = 〈y, x〉 pour tout x, y ∈ E) non dégénérée positive<br />
(〈x, x〉 ≥ 0 pour tout x ∈ E et 〈x, x〉 = 0 implique x = 0), E muni du produit scalaire 〈., .〉 est<br />
dit alors préhilbertien.<br />
Exemple 1.6.1<br />
a) Pour tout x, y ∈ R d on pose<br />
On définit ainsi un produit scalaire.<br />
〈x, y〉 = x 1 y 1 + · · · + x d y d .<br />
b) Soit l 2 défini dans l’exemple 1.2.1, c). Pour x, y ∈ l 2 , on a, pour tout N ∈ N,<br />
N∑<br />
|x n y n | ≤<br />
n=1<br />
≤<br />
( ∑ N ) 1 ( ∑ N )<br />
|x n | 2 2 1/2<br />
|y n | 2<br />
n=1<br />
n=1<br />
( ∑ ∞ ) 1 ( ∑ ∞ )<br />
|x n | 2 2 1/2.<br />
|y n | 2<br />
n=1<br />
Il en résulte que ∑ ∞<br />
n=1 |x ny n | < ∞. On pose alors<br />
On définit ainsi un produit scalaire.<br />
〈x, y〉 =<br />
∞∑<br />
x n y n .<br />
n=1<br />
c) Soit E = C([0, 1]) l’ensemble des fonctions continues définies sur l’intervalle [0, 1]. Pour<br />
tout f, g ∈ E posons<br />
On définit ainsi un produit scalaire.<br />
〈f, g〉 =<br />
∫ 1<br />
0<br />
18<br />
n=1<br />
f(t)g(t) dt.
Théorème 1.6.1 INÉGALITÉ <strong>DE</strong> CAUCHY-SCHWARZ<br />
Soit (E, 〈., .〉) un espace préhilbertien. Alors pour tout x, y ∈ E,<br />
|〈x, y〉| 2 ≤ 〈x, x〉〈y, y〉<br />
avec égalité si et seulement si x et y sont colinéaires.<br />
Démonstration. On peut supposer que 〈y, y〉 > 0. Soit λ ∈ R, on a<br />
〈x + λy, x + λy〉 ≥ 0<br />
d’où<br />
λ 2 〈y, y〉 + 2λ〈x, y〉 + 〈x, x〉 ≥ 0.<br />
Le discriminant du trinôme du second degré est donc négatif ou nul, ce qui donne l’inégalité<br />
annoncée. Par ailleurs il est clair que l’inégalité est une égalité si y = µx. Réciproquement si x<br />
et y sont non colinéaires alors x + λy ≠ 0 pour tout λ ∈ R ce qui montre que le trinôme n’a<br />
pas de racine réelle. Il en résulte que son discriminant est strictement négatif, d’où |〈x, y〉| 2 <<br />
〈x, x〉〈y, y〉.<br />
Proposition 1.6.1 Soit (E, 〈., .〉) un espace préhilbertien. On définit alors une norme sur E en<br />
posant pour tout x ∈ E<br />
‖x‖ = 〈x, x〉 1/2 .<br />
Démonstration. La seule vérification non évidente est celle de l’inégalité triangulaire. Soient<br />
x, y ∈ E, on a, utilisant l’inégalité de Cauchy-Schwarz<br />
On a donc bien ‖x + y‖ ≤ ‖x‖ + ‖y‖.<br />
‖x + y‖ 2 = ‖x‖ 2 + ‖y‖ 2 + 2〈x, y〉<br />
≤<br />
‖x‖ 2 + ‖y‖ 2 + 2‖x‖‖y‖<br />
≤ (‖x‖ + ‖y‖) 2 .<br />
Remarque 1.6.1<br />
a) Théorème de Pythagore. Soit (E, 〈., .〉) un espace préhilbertien et soient x, y ∈ E tels que<br />
〈x, y〉 = 0. Alors<br />
‖x + y‖ 2 = ‖x‖ 2 + ‖y‖ 2 .<br />
En effet<br />
‖x + y‖ 2 = 〈x + y, x + y〉<br />
= 〈x, x〉 + 2〈x, y〉 + 〈y, y〉<br />
= 〈x, x〉 + 〈y, y〉<br />
= ‖x‖ 2 + ‖y‖ 2 .<br />
19
) Soit (E, 〈., .〉) un espace préhilbertien et soit a ∈ E. Définissons L a : E −→ R par<br />
L a (x) = 〈a, x〉<br />
pour tout x ∈ E. Utilisant l’inégalité de Cauchy-Schwarz, on a<br />
|L a (x)| ≤ ‖a‖‖x‖<br />
ce qui montre que l’application linéaire L a est continue et que ‖L a ‖ ≤ ‖a‖. De plus |L a (a)| =<br />
‖a‖ 2 donc ‖L a ‖ ≥ ‖a‖ ce qui montre que ‖L a ‖ = ‖a‖.<br />
Définition 1.6.2 Un espace de Hilbert est un espace préhilbertien (H, 〈., .〉) qui est complet pour<br />
la norme définie dans la Proposition 1.6.1.<br />
Exemple 1.6.2<br />
a) L’espace Euclidien R d muni du produit scalaire usuel (exemple 1.6.1, a)) est un espace de<br />
Hilbert.<br />
b) Soit l 2 défini dans l’exemple 1.2.1, c) muni du produit scalaire<br />
〈x, y〉 =<br />
∞∑<br />
x n y n .<br />
(exemple 1.6.1, b)). Alors l 2 est un espace de Hilbert pour ce produit scalaire.<br />
n=1<br />
c) L’espace E = C([0, 1]) muni du produit scalaire<br />
n’est pas un espace de Hilbert.<br />
〈f, g〉 =<br />
∫ 1<br />
0<br />
f(t)g(t) dt.<br />
Définition 1.6.3 Soit (E, d) un espace métrique, a ∈ E et soit B une partie non vide de E. La<br />
distance de a à la partie B est<br />
d(a, B) = inf{d(a, b) : b ∈ B}.<br />
On dit que b ∈ B est une projection de a sur B si<br />
d(a, b) = d(a, B).<br />
En général la projection n’existe pas et, s’il en existe, il peut en exister plusieurs.<br />
Définition 1.6.4 Une partie C d’un espace vectoriel E est dite convexe si, pour tout x, y ∈ C et<br />
pour tout λ ∈ [0, 1]<br />
λx + (1 − λ)y ∈ C.<br />
Dans le cas d’un espace préhilbertien il y a existence et unicité de la projection sur une partie<br />
convexe complète comme le montre le résultat fondamental suivant.<br />
20
Théorème 1.6.2 PROJECTION SUR UN CONVEXE COMPLET<br />
Soit C une partie convexe et complète d’un espace préhilbertien (E, 〈., .〉). Alors, pour tout<br />
x ∈ E, il existe y ∈ C unique tel que<br />
‖x − y‖ = d(x, C).<br />
Le vecteur p C (x) = y ∈ C est alors caractérisé par<br />
pour tout z ∈ C.<br />
〈x − p C (x), z − p C (x)〉 ≤ 0<br />
Démonstration. Remarquons que d(x, C) = d(0, C − x). Comme C − x est aussi convexe complet,<br />
on peut supposer que x = 0. Soit y n ∈ C tel que<br />
Pour tout x, z ∈ E, on a<br />
d’où<br />
On obtient alors<br />
‖y n ‖ ≤ d(0, C) + 1 n .<br />
‖x − z‖ 2 + ‖x + z‖ 2 = 2‖x‖ 2 + 2‖z‖ 2 ,<br />
‖x − z‖ 2 = 2‖x‖ 2 + 2‖z‖ 2 − 4∥ x + z<br />
∥ 2 .<br />
2<br />
‖y m − y n ‖ 2 = 2‖y m ‖ 2 + 2‖y n ‖ 2 − 4∥ y m + y n<br />
∥ 2 .<br />
2<br />
Comme C est convexe, on a y m + y n<br />
∈ C donc<br />
2<br />
d(0, C) ≤ ∥ y m + y n ∥<br />
∥.<br />
2<br />
Il en résulte que<br />
‖y m − y n ‖ 2 ≤ 2‖y m ‖ 2 + 2‖y n ‖ 2 − 4d 2 (0, C)<br />
≤ 4d(0, C)(1/m + 1/n) + 2/m 2 + 2/n 2 .<br />
La suite (y n ) est donc de Cauchy dans C qui est complet, elle converge donc vers un certain y ∈ C<br />
(C est fermé car C est complet). Passant à la limite dans l’inégalité ‖y n ‖ ≤ d(0, C) + 1/n, il vient<br />
‖y‖ ≤ d(0, C) et donc ‖y‖ = d(0, C) car ‖y‖ ≥ d(0, C). Montrons l’unicité de y. Si y 1 et y 2 sont<br />
solutions, on a<br />
‖y 1 − y 2 ‖ 2 ≤ 2‖y 1 ‖ 2 + 2‖y 2 ‖ 2 − 4d 2 (0, C) = 0<br />
donc y 1 = y 2 . Enfin, revenant au cas général, p C (x) est caractérisé par<br />
‖x − p C (x)‖ 2 ≤ ‖x − z‖ 2 pour tout z ∈ C.<br />
21
Soit y ∈ C et t ∈ [0, 1], on a z = p C (x) + t(y − p C (x)) ∈ C par convexité, d’où<br />
soit<br />
‖x − p C (x)‖ 2 ≤ ‖x − p C (x) − t(y − p C (x))‖ 2<br />
0 ≤ −2t〈x − p C (x), y − p C (x)〉 + t 2 ‖y − p C (x)‖ 2 .<br />
Divisant par t et faisant tendre t vers 0 on a bien<br />
〈x − p C (x), y − p C (x)〉 ≤ 0<br />
pour tout y ∈ C. Réciproquement, supposant que z ∈ C est tel que 〈x − z, y − z〉 ≤ 0 pour tout<br />
y ∈ C, il vient<br />
‖x − y‖ 2 = ‖x − z‖ 2 + ‖z − y‖ 2 − 〈x − z, y − z〉<br />
d’où<br />
pour tout y ∈ C, et donc z = p C (x).<br />
‖x − y‖ 2 ≥ ‖x − z‖ 2<br />
Proposition 1.6.2 Soit C une partie convexe et complète d’un espace préhilbertien (E, 〈., .〉).<br />
Alors, pour tout x 1 , x 2 ∈ E<br />
‖p C (x 1 ) − p C (x 1 )‖ ≤ ‖x 1 − x 2 ‖.<br />
Démonstration. Posons y 1 = p C (x 1 ) et y 2 = p C (x 2 ). On a<br />
〈x 1 − y 1 , y 2 − y 1 〉 ≤ 0 (1.7)<br />
et<br />
On a alors<br />
〈x 2 − y 2 , y 1 − y 2 〉 ≤ 0. (1.8)<br />
〈x 1 − x 2 , y 1 − y 2 〉 = 〈x 1 − y 1 , y 1 − y 2 〉 + 〈y 1 − y 2 , y 1 − y 2 〉 + 〈y 2 − x 2 , y 1 − y 2 〉.<br />
D’après (1.7) et (1.8), le premier et le troisième terme de l’inégalité précédente sont positifs ou<br />
nuls. Il en résulte que<br />
On a alors<br />
d’où<br />
ce qui achève la démonstration.<br />
〈x 1 − x 2 , y 1 − y 2 〉 ≥ 〈y 1 − y 2 , y 1 − y 2 〉 = ‖y 1 − y 2 ‖ 2 .<br />
‖x 1 − x 2 ‖‖y 1 − y 2 ‖ ≥ 〈x 1 − x 2 , y 1 − y 2 〉 ≥ ‖y 1 − y 2 ‖ 2<br />
‖y 1 − y 2 ‖ ≤ ‖x 1 − x 2 ‖<br />
22
Définition 1.6.5 Soit (E, 〈., .〉) un espace préhilbertien et soient x, y ∈ E. On dit que x est<br />
orthogonal à y et on note x ⊥ y si 〈x, y〉 = 0. Étant donné F ⊂ E, on note<br />
Remarque 1.6.2 Remarquons que<br />
F ⊥ = {y ∈ E : 〈x, y〉 = 0, pour tout x ∈ F }.<br />
F ⊥ = ∩ x∈F Ker 〈x, .〉<br />
et que 〈x, .〉 est linéaire continue (voir Remarque (1.6.1), b)). On obtient alors que F ⊥ est fermé<br />
comme intersection de fermés.<br />
Dans le cas où C est un sous-espace vectoriel le Théorème 1.6.2 prend la forme suivante<br />
Théorème 1.6.3 PROJECTION SUR UN SOUS-ESPACE VECTORIEL COMPLET<br />
Soit F un sous-espace vectoriel complet d’un espace préhilbertien (E, 〈., .〉). Alors<br />
et<br />
E = F ⊕ F ⊥<br />
p F ∈ L(E).<br />
Pour tout x ∈ E, p F (x) est l’unique vecteur de F tel que<br />
〈x − p F (x), y〉 = 0 pour tout y ∈ F.<br />
De plus,<br />
pour tout x ∈ E.<br />
‖p F (x)‖ ≤ ‖x‖<br />
Démonstration. D’après le Théorème 1.6.2 p F (x) est l’unique vecteur de F tel que<br />
〈x − p F (x), y − p F (x)〉 ≤ 0 pour tout y ∈ F.<br />
Pour tout z ∈ F on a p F (x) + z ∈ F d’où<br />
〈x − p F (x), z〉 ≤ 0 pour tout z ∈ F<br />
ce qui implique, changeant z en −z que<br />
〈x − p F (x), z〉 = 0 pour tout z ∈ F<br />
donc x − p F (x) ∈ F ⊥ . Tout vecteur x ∈ E s’écrit alors<br />
x = p F (x) + x − p F (x)<br />
où<br />
p F (x) ∈ F et x − p F (x) ∈ F ⊥ .<br />
23
Comme F ∩ F ⊥ = {0}, on a bien E = F ⊕ F ⊥ . De plus p F (.) est la projection algébrique<br />
sur F parallèlement à F ⊥ , c’est donc une application linéaire. Remarquons alors que, d’après le<br />
Théorème de Pythagore<br />
‖x‖ 2 = ‖x − p F (x)‖ 2 + ‖p F (x)‖ 2 ≥ ‖p F (x)‖ 2 ,<br />
ce qui montre que ‖p F (x)‖ ≤ ‖x‖ pour tout x ∈ E et que p F est continue.<br />
Voici un résultat très utile dans la pratique.<br />
Corollaire 1.6.1<br />
Soit F un sous-espace vectoriel fermé d’un espace de Hilbert (H, 〈., .〉). Alors<br />
a) F ⊥⊥ = F .<br />
b) F = H ⇐⇒ F ⊥ = {0}.<br />
Démonstration. a) Observons que F ⊂ F ⊥⊥ et que F ⊥ est un sous-espace vectoriel fermé de<br />
E (F ⊥ = ⋂ x∈F<br />
ker 〈x, .〉 et ker 〈x, .〉 est fermé comme noyau d’une forme linéaire continue<br />
(Remarque 1.6.1, b))). Les sous-espaces vectoriels F et F ⊥ sont donc complets ce qui permet<br />
d’appliquer le Théorème 1.6.3. On a alors<br />
donc F = F ⊥⊥ .<br />
F ⊂ F ⊥⊥<br />
E = F ⊕ F ⊥<br />
E = F ⊥⊥ ⊕ F ⊥<br />
b) Si F = H il est clair que F ⊥ = {0}. Réciproquement si F ⊥ = {0} on a H = F ⊕ {0}<br />
donc F = H.<br />
Définition 1.6.6 On dit qu’une famille de vecteurs (e i ) i∈I est orthogonale si<br />
〈e i , e j 〉 = 0 pour tout i, j ∈ I, i ≠ j.<br />
On dit que la famille orthogonale (e i ) i∈I est orthonormée si<br />
‖e i ‖ = 1 pour tout i ∈ I.<br />
Le résultat suivant dont la démonstration élémentaire est laissée au lecteur est d’une grande importance<br />
pratique.<br />
Proposition 1.6.3 Soit (e 1 , · · · , e n ) une famille orthononormée d’un espace préhilbertien (E, 〈., .〉),<br />
soit n ∈ N ∗ et λ 1 , · · · , λ n ∈ R. Posons x = ∑ n<br />
i=1 λ ie i , alors<br />
et<br />
λ i = 〈x, e i 〉 pour tout i ∈ [1, n],<br />
‖x‖ 2 =<br />
n∑<br />
|λ i | 2 .<br />
i=1<br />
24
Théorème 1.6.4 Soit (E, 〈., .〉) un espace préhilbertien et soit (e 1 , · · · , e n ) une famille orthonormée.<br />
On pose<br />
E n = [e 1 , · · · , e n ]<br />
(sous-espace vectoriel engendré par e 1 , · · · , e n ). Alors pour tout x ∈ E,<br />
a) p En (x) = ∑ n<br />
i=1 〈x, e i〉e i ,<br />
b) ‖x‖ 2 − d 2 (x, E n ) = ∑ n<br />
i=1 |〈x, e i〉| 2 .<br />
Démonstration. Remarquons qu’un sous-espace vectoriel de dimension finie est complet (voir<br />
Remarque 1.4.1). On peut donc appliquer le Théorème 1.6.3. On sait que p En (x) est caractérisé<br />
par<br />
〈x − p En (x), e i 〉 = 0 pour tout i ∈ [1, n].<br />
Il en résulte que<br />
De plus, on a<br />
et<br />
p En (x) =<br />
n∑<br />
〈p En (x), e i 〉e i =<br />
i=1<br />
D’après le Théorème de Pythagore, il vient<br />
n∑<br />
〈x, e i 〉e i .<br />
i=1<br />
x = x − p En (x) + p En (x)<br />
(x − p En (x)) ⊥ p En (x).<br />
‖x‖ 2 − ‖x − p En (x)‖ 2 = ‖p En (x)‖ 2 ,<br />
ce qui montre bien que<br />
‖x‖ 2 − d 2 (x, E n ) =<br />
n∑<br />
|〈x, e i 〉| 2 .<br />
i=1<br />
Théorème 1.6.5 INÉGALITÉ <strong>DE</strong> PARSEVAL-BESSEL<br />
Soit (E, 〈., .〉) un espace préhilbertien et (e i ) i∈N ∗ une famille orthonormée. Alors pour tout<br />
x ∈ E, la série de terme général (|〈x, e i 〉| 2 ) converge et<br />
∞∑<br />
|〈x, e i 〉| 2 ≤ ‖x‖ 2 .<br />
i=1<br />
Démonstration. Pour tout n ∈ N ∗ , on a ‖p En (x)‖ 2 ≤ ‖x‖ 2 et, d’après le Théorème 1.6.4 et la<br />
Proposition 1.6.3 on a<br />
n∑<br />
‖p En (x)‖ 2 = |〈x, e i 〉| 2 ,<br />
d’où le résultat.<br />
i=1<br />
25
Définition 1.6.7 Soit (e n ) n∈N ∗ une famille de vecteurs d’un espace normé (E, ‖ · ‖). On dit que<br />
cette famille est totale si<br />
∞⋃<br />
E = F n ,<br />
n=1<br />
où F n = [e 1 , · · · , e n ]. Autrement dit, si pour tout x ∈ X et pour tout ε > 0, il existe n ≥ 1 et<br />
x n ∈ F n tel que ‖x − x n ‖ ≤ ε. De façon équivalente la famille (e n ) n∈N ∗ est totale si et seulement<br />
si pour tout x ∈ E, on a lim n→∞ d(x, E n ) = 0 (le démontrer).<br />
Proposition 1.6.4 Soit (H, 〈., .〉) un espace de Hilbert. Alors la famille (e n ) n∈N ∗ est totale si et<br />
seulement si<br />
{e n : n ∈ N ∗ } ⊥ = 0.<br />
Démonstration. On a<br />
( ⋃ ∞ ) ⊥<br />
{e n : n ∈ N ∗ } ⊥ = F n .<br />
n=1<br />
En effet il est clair que<br />
( ⋃ ∞ ) ⊥<br />
{e n : n ∈ N ∗ } ⊥ = F n ,<br />
et l’orthogonal d’un sous espace vectoriel est égal à celui de son adhérence (le vérifier). On a donc<br />
∞⋃<br />
F n = H<br />
n=1<br />
n=1<br />
si et seulement si<br />
d’où le résultat.<br />
( ⋃ ∞ ) ⊥<br />
F n = {0},<br />
n=1<br />
On a alors une caractérisation simple des familles totales.<br />
Proposition 1.6.5 Soit (H, 〈., .〉) un espace de Hilbert et (e i ) i∈N ∗ une famille orthonormée. Alors<br />
les propriétés suivantes sont équivalentes,<br />
i) la famille (e i ) i∈N ∗ est totale,<br />
ii) pour tout x ∈ H, ‖x‖ 2 = ∑ ∞<br />
i=1 |〈x, e i〉| 2 ,<br />
iii) pour tout x ∈ H, x = ∑ ∞<br />
i=1 〈x, e i〉e i .<br />
26
Démonstration. i) ⇒ ii). Étant donné ε > 0, il existe n ∈ N ∗ et des réels λ 1 , · · · , λ n tels que<br />
∥<br />
n∑ ∥ ∥∥<br />
∥x − λ i e i ≤ ε.<br />
On a alors<br />
‖x‖ 2 −<br />
i=1<br />
i=1<br />
n∑<br />
|〈x, e i 〉| 2 = ‖x − p En (x)‖ 2 ∥<br />
≤ ∥x −<br />
n∑ ∥ ∥∥<br />
2<br />
λ i e i ≤ ε 2 ,<br />
d’où ‖x‖ 2 ≤ ∑ ∞<br />
i=1 |〈x, e i〉| 2 + ε 2 ce qui implique bien ii) en faisant tendre ε vers 0.<br />
ii) ⇒ iii). On a x = (x − p En (x)) + p En (x) et x − p En (x) et p En (x) sont orthogonaux. On<br />
obtient donc<br />
‖x‖ 2 − ‖p En (x)‖ 2 = ‖x − p En (x)‖ 2 = d 2 (x, E n )<br />
soit utilisant le Théorème (1.6.4)<br />
‖x‖ 2 −<br />
i=1<br />
n∑<br />
|〈x, e i 〉| 2 = ‖x − p En (x)‖ 2 ,<br />
i=1<br />
il en résulte que lim n→∞ p En (x) = x d’où le résultat car p En (x) = ∑ n<br />
i=1 〈x, e i〉e i .<br />
iii) ⇒ i). Évident.<br />
Exemple 1.6.3 Soit dans l 2 la famille (e i ) i∈N ∗ définie par e i n = δ i,n . Pour x ∈ l 2 , on a 〈x, e i 〉 = x i ,<br />
la famille (e i ) i∈N ∗ est donc totale dans l 2 d’après la Proposition 1.6.5, ii).<br />
Soit alors (H, 〈., .〉) un espace de Hilbert et a ∈ H. L’application l a : H → R définie par<br />
l a = 〈a, .〉 est linéaire et on a<br />
|〈a, x〉| ≤ ‖a‖‖x‖<br />
Il en résulte que l a est continue : l a ∈ H ∗ . Le résultat suivant montre que tous les éléments de H ∗<br />
sont représentables de cette manière.<br />
Théorème 1.6.6 Soit (H, 〈., .〉 un espace de Hilbert. Alors l’application<br />
l<br />
: H −→ H ∗<br />
est une isométrie surjective de H dans H ∗ .<br />
x ↦−→ l x<br />
Démonstration. Il est clair que l est linéaire. Soit ϕ ∈ H ∗ , si ϕ = 0 on a ϕ = l 0 . On peut donc<br />
supposer que ϕ ≠ 0. Le noyau F = ker ϕ est donc un hyperplan fermé de H. Il existe alors<br />
b ∈ F ⊥ tel que b ∉ F car dans le cas contraire on aurait F ⊥ ⊂ F et donc H = F ⊕ F ⊥ ⊂ F<br />
ce qui impliquerait la contradiction F = H. Remarquons alors que F ⊥ = [b] car H = F ⊕ [b],<br />
H = F ⊕ F ⊥ et [b] ⊂ F ⊥ . Comme ker l b = ker ϕ, il existe un réel λ tel que ϕ = λl b = l a avec<br />
a = λb. L’application l est alors linéaire et bijective de H dans H ∗ . De plus ‖l a (x)‖ ≤ ‖a‖‖x‖<br />
pour tout x ∈ H et ‖l a (a)‖ = ‖a‖‖a‖, d’où ‖l a ‖ = ‖a‖.<br />
On identifiera le plus souvent H avec H ∗ par l’isométrie définie ci-dessus.<br />
27
Chapitre 2<br />
Applications différentiables dans les espaces<br />
normés<br />
2.1 Définition d’une application différentiable<br />
Dans toute la suite, E et F sont des espaces normés, U est un ouvert de E, f est une application<br />
de U dans F et a est un élément de U.<br />
Définition 2.1.1 On dit que l’application f : U −→ F est différentiable au point a ∈ U s’il existe<br />
ϕ ∈ L(E, F ) telle que pour tout ε > 0, il existe η > 0 tel que pour tout x ∈ B(a, η)<br />
On note alors Df(a) = ϕ.<br />
‖f(x) − f(a) − ϕ(x − a)‖ ≤ ε‖x − a‖.<br />
Remarque 2.1.1<br />
a) Pour simplifier l’écriture, on écrira souvent, h étant un vecteur de E, Df(a)h au lieu de<br />
Df(a)(h).<br />
b) La définition s’écrit de façon équivalente, posant R(x) = f(x) − f(a) − ϕ(x − a),<br />
où lim x→a<br />
R(x)<br />
‖x−a‖<br />
= 0. Cela s’écrit aussi<br />
f(x) = f(a) + ϕ(x − a) + R(x),<br />
f(x) = f(a) + ϕ(x − a) + ‖x − a‖ε(x),<br />
où<br />
Cela équivaut bien sûr à<br />
où<br />
lim ε(x) = 0.<br />
x→a<br />
f(a + h) = f(a) + ϕ(h) + ‖h‖δ(h)<br />
lim δ(h) = 0.<br />
h→0<br />
29
On note parfois o(‖h‖) une fonction α(h) définie au voisinage de 0 et à valeurs dans un espace<br />
vectoriel normé telle que lim h→0 ‖h‖ −1 α(h) = 0. La différentibilité en a s’écrit alors<br />
f(a + h) = f(a) + ϕ(h) + o(‖h‖).<br />
c) Si f est différentiable en a, alors f est continue en a. En effet<br />
f(x) − f(a) = ϕ(x − a) + R(x),<br />
d’où utilisant la continuité en a de ϕ et le fait que lim x→a R(x) = 0,<br />
lim(f(x) − f(a)) = 0.<br />
x→a<br />
d) Si f est différentiable en a, alors pour tout h ∈ E,<br />
f(a + th) − f(a)<br />
Df(a)(h) = lim<br />
. (2.1)<br />
t→0 t<br />
En effet, f(a + th) − f(a) = tDf(a)(h) + ‖th‖ε(th). Il en résulte que<br />
f(a + th) − f(a)<br />
t<br />
= Df(a)(h) + ‖h‖ε(th),<br />
d’où le résultat. On remarque que cette propriété montre que la différentielle Df(a), quand elle<br />
existe, est unique.<br />
e) On note également que l’application f est différentiable en a si et seulement si il existe<br />
ϕ ∈ L(E, F ) telle que<br />
(f(x) − f(a) − ϕ(x − a))<br />
lim<br />
= 0,<br />
x ≠→a ‖x − a‖<br />
où x ≠→ a signifie x tend vers a et x ≠ a.<br />
f) Si f est différentiable en a et si une application g coincide avec f sur un voisinage de a,<br />
alors g est différentiable en a et Dg(a) = Df(a) (immédiat en utilisant (2.1)).<br />
g) La différentiabilité de f ne change pas quand on remplace les normes de E et F par des<br />
normes équivalentes (exercice facile).<br />
h) Si f : U −→ F est constante alors Df(x) = 0 pour tout x ∈ U, c’est immédiat.<br />
Définition 2.1.2 Soit f : I −→ E une fonction vectorielle définie sur un intervalle ouvert I de R.<br />
On dit que f est dérivable en t 0 ∈ I si la limite<br />
existe. On pose alors<br />
f(t) − f(t 0 )<br />
lim<br />
t→t 0 t − t 0<br />
f ′ (t 0 ) = df<br />
dt (t 0) = lim<br />
t→t0<br />
f(t) − f(t 0 )<br />
t − t 0<br />
.<br />
30
Théorème 2.1.1 Soit f : I −→ E une fonction vectorielle définie sur un intervalle ouvert I de<br />
R. Alors les deux propriétés suivantes sont équivalentes<br />
i) f est dérivable en t 0 ∈ I,<br />
ii) f est différentiable en t 0 ∈ I.<br />
De plus pour tout h ∈ R, on a<br />
Df(t 0 )(h) = h df<br />
dt (t 0),<br />
df<br />
dt (t 0) = Df(t 0 )(1).<br />
Démonstration. On sait (voir chap. 1, Exemple 1.3.2) que L(R, E) s’identifie à E quand on<br />
identifie ϕ ∈ L(R, E) avec le vecteur ϕ(1) et x ∈ E avec ϕ ∈ L(R, E) définie par ϕ(t) = tx.<br />
Remarquons que<br />
f(t) − f(t 0 )<br />
lim<br />
= x<br />
t→t 0 t − t 0<br />
équivaut à<br />
avec lim<br />
h→0<br />
ε(h) = 0, ce qui démontre le théorème.<br />
f(t) − f(t 0 ) − (t − t 0 )x = (t − t 0 )ε(t − t 0 )<br />
Exemple 2.1.1<br />
a) Soit (E, ‖.‖) un espace normé, alors la norme n’est pas différentiable en 0. Dans le cas<br />
contraire, on aurait (remarque 2.1.1, d)) pour tout h ∈ E<br />
D(‖.‖)(0)h = lim<br />
t→0<br />
‖th‖/t<br />
ce qui est absurde car le rapport ‖th‖/t a une limite à droite égale à ‖h‖ et une limite à gauche<br />
égale à −‖h‖ quand t tend vers 0.<br />
b) Soient E, F des espaces normés et soit f ∈ L(E, F ). Il découle de l’égalité,<br />
f(x) − f(a) − f(x − a) = 0 pour tout x, a ∈ E<br />
que, pour tout a ∈ E, f est différentiable en a ∈ E et que sa différentielle en a est Df(a) = f.<br />
c) Soit E, F , G des espaces normés, soit f ∈ L 2 (E, F ; G) une application bilinéaire continue<br />
et soient a, x ∈ E, b, y ∈ F . On a<br />
f(x, y) = f(a + (x − a), b + (y − b))<br />
= f(a, b) + f(a, y − b) + f(x − a, b) + f(x − a, y − b).<br />
Notons que l’application linéaire L : E × F −→ G définie par<br />
L(u, v) = f(a, v) + f(u, b) pour tout (u, v) ∈ E × F<br />
31
est continue car<br />
‖L(u, v)‖ ≤ ‖f‖‖a‖‖v‖ + ‖f‖‖b‖‖u‖ ≤ (‖f‖‖a‖ + ‖f‖‖b‖)‖(u, v)‖<br />
où ‖(u, v)‖ = sup(‖u‖, ‖v‖). Enfin<br />
ce qui montre que<br />
‖f(x − a, y − b)‖ ≤ ‖f‖‖x − a‖‖y − b‖ ≤ ‖f‖‖(x − a, y − b)‖ 2 ,<br />
lim<br />
(x,y)→(a,b)<br />
f(x − a, y − b)<br />
‖(x − a, y − b)‖ = 0.<br />
Il en résulte que toute application bilinéaire continue f ∈ L 2 (E, F ; G) est différentiable sur E ×F<br />
et que pour tout (a, b) ∈ E × F , (u, v) ∈ E × F<br />
Df(a, b)(u, v) = f(a, v) + f(u, b).<br />
Plus généralement si E 1 , · · · , E m , G sont des espaces normés et si f ∈ L(E 1 , · · · , E m ; G) est<br />
une application multilinéaire continue, alors f est différentiable sur E 1 × · · · × E m et pour tout<br />
(a 1 , · · · , a m ), (u 1 , · · · , u m ) ∈ E 1 × · · · × E m on a<br />
Df(a 1 , · · · , a m )(u 1 , · · · , u m ) = f(u 1 , a 2 , · · · , a m ) + · · · + f(a 1 , · · · , a m−1 , u m ),<br />
(exercice facile et fastidieux ou voir Corollaire 2.4.3).<br />
d) Soit U un ouvert de R n , f : U −→ R une application et soit a ∈ U. On rappelle que la<br />
dérivée partielle<br />
∂f<br />
∂x i<br />
(a)<br />
est égale quand elle existe au nombre dérivé ϕ ′ (a i ) où ϕ i est la fonction de la variable réelle définie<br />
au voisinage de a i par ϕ i (z) = f(a 1 , · · · , z, · · · , a n ). En d’autre termes<br />
soit<br />
∂f f(a 1 , · · · , z, · · · , a n ) − f(a 1 , · · · , a n )<br />
(a) = lim<br />
,<br />
∂x i z→ai z − a i<br />
∂f f(a 1 , · · · , a i + t, · · · , a n ) − f(a 1 , · · · , a n )<br />
(a) = lim<br />
.<br />
∂x i t→0 t<br />
Autrement dit<br />
∂f f(a + te i ) − f(a)<br />
(a) = lim<br />
,<br />
∂x i t→0 t<br />
{<br />
0 si j ≠ i<br />
∂f<br />
où (e i ) j =<br />
. Il résulte donc de (2.1) que si f est différentiable en a alors (a)<br />
1 si j = i ∂x i<br />
existe. On a de plus<br />
( n∑ )<br />
Df(a)(h) = Df(a) h i e i =<br />
i=1<br />
n∑<br />
Df(a)(e i )h i =<br />
i=1<br />
n∑<br />
i=1<br />
∂f<br />
∂x i<br />
(a)h i .<br />
32
Autrement dit<br />
Df(a)(h) = 〈∇f(a), h〉 pour tout h ∈ R n<br />
⎛<br />
∂f<br />
⎞<br />
(a)<br />
∂x<br />
où 〈., .〉 désigne le produit scalaire usuel sur R n 1 et ∇f(a) = ⎜<br />
⎝ . ⎟ est appelé le vecteur<br />
∂f<br />
⎠<br />
(a)<br />
∂x n<br />
gradient de f en a. On montrera dans la suite que si pour tout i = 1, · · · , n la fonction ∂f<br />
∂x i<br />
(.) est<br />
définie au voisinage de a et continue en a alors f est différentiable en a et que sa différentiellle en<br />
a est définie par<br />
Df(a)(h) = 〈∇f(a), h〉.<br />
e) Plus généralement, si U ⊂ R n est un ouvert et si l’application<br />
Df(a)(h) = lim<br />
t→0<br />
f(a + th) − f(a)<br />
t<br />
f = (f 1 , · · · , f m ) : U −→ R m<br />
est différentiable en a. On montrera un peu plus loin que f 1 , · · · , f m sont alors différentiables en<br />
a. On a alors d’après (2.1), pour tout h ∈ R n ,<br />
(<br />
= lim<br />
donc<br />
f 1 (a + th) − f(a)<br />
t→0 t<br />
Df(a)(h) = (〈∇f 1 (a), h〉, · · · , 〈∇f m (a), h〉),<br />
f m (a + th) − f(a)<br />
)<br />
, · · · , lim<br />
,<br />
t→0 t<br />
autrement dit<br />
Df(a)(h) = J f (a)h<br />
⎛ ⎞<br />
∇f 1 (a) T<br />
où J f (a) est la matrice à m lignes et n colonnes dont les lignes sont ⎝<br />
.<br />
⎠, autrement dit<br />
∇f m (a) T<br />
[J f (a)] ij = ∂f i<br />
∂x j<br />
(a) pour tout (i, j) ∈ [1, m] × [1, n].<br />
On dit que J f (a) est la matrice Jacobienne de f en a. On montrera que si les dérivées partielles<br />
( ∂fi<br />
)<br />
(.)<br />
existent au voisinage de a et sont continues en a on montrera alors que f<br />
∂x j (i,j)∈[1,m]×[1,n]<br />
est différentiable en a et que Df(a) est donné, pour tout vecteur h ∈ R m par<br />
Df(a)(h) = J f (a)h.<br />
La notion de vecteur gradient s’étend au cadre des espaces de Hilbert<br />
Définition 2.1.3 Soit U un ouvert d’un espace de Hilbert E et soit f : E −→ R une application<br />
différentiable en a. On a Df(a) ∈ E ∗ , on désigne alors par ∇f(a) ∈ E l’unique vecteur fourni<br />
par le Théorème de Riesz, tel que<br />
Df(a)(h) = 〈∇f(a), h〉 pour tout h ∈ E.<br />
33
Définition 2.1.4 Soit f : U ⊂ E −→ F une application. On dit que f est de classe C 1 sur U si f<br />
est différentiable sur U et si l’application, x ↦−→ Df(x) est continue de U dans L(E, F ).<br />
Théorème 2.1.2 Soient E, F des espaces normés. Alors l’application<br />
I : Isom (E, F ) −→ Isom (F, E),<br />
définie par I(u) = u −1 est de classe C 1 et pour tout h ∈ L(E, F ),<br />
DI(u)(h) = −u −1 ◦ h ◦ u −1 .<br />
Démonstration. On sait que Isom (E, F ) est ouvert dans L(E, F ) (Chapitre 1, Théorème 1.3.4).<br />
On remarque que L(.) définie par L(h) = −u −1 ◦ h ◦ u −1 est linéaire ; L(.) est aussi continue car<br />
‖L(h)‖ ≤ ‖u −1 ‖‖u −1 ‖‖h‖.<br />
Soit u ∈ Isom (E, F ), on peut supposer que h est assez petit pour que u + h ∈ Isom (E, F ). On a<br />
alors<br />
I(u + h) − I(u) = (u + h) −1 − u −1<br />
= (u + h) −1 ◦ u ◦ u −1 − (u + h) −1 ◦ (u + h) ◦ u −1<br />
= (u + h) −1 ◦ (u − (u + h)) ◦ u −1<br />
= −(u + h) −1 ◦ h ◦ u −1 .<br />
Posons<br />
R(h) = I(u + h) − I(u) − L(h).<br />
On a donc<br />
Montrons alors que lim<br />
h→0<br />
‖h‖ −1 R(h) = 0. On a<br />
R(h) = −(u + h) −1 ◦ h ◦ u −1 + u −1 ◦ h ◦ u −1<br />
= (u −1 − (u + h) −1 ) ◦ h ◦ u −1<br />
‖R(h)‖ ≤ ‖(u −1 − (u + h) −1 )‖‖h‖‖u −1 ‖.<br />
Or d’après le Théorème 1.3.4 du chapitre 1, on sait que<br />
‖(u −1 − (u + h) −1 )‖ ≤ ε/‖u −1 ‖,<br />
pour h assez petit, ce qui prouve la différentiabilité de I(.) en u ∈ Isom (E, F ).<br />
Il reste à prouver que DI(.) est continue de Isom (E, F ) dans L(L(E, F ), L(F, E)). Posons<br />
pour tout v, w ∈ L(F, E) et h ∈ L(E, F )<br />
Ψ(v, w)(h) = −v ◦ h ◦ w<br />
34
Il est clair que Ψ(v, w)(.) est linéaire de L(E, F ) dans L(F, E). Elle est aussi continue car<br />
‖Ψ(v, w)(h)‖ ≤ ‖v‖‖w‖‖h‖.<br />
Observons que l’application<br />
Ψ : L(F, E) × L(F, E) −→ L(L(E, F ), L(F, E))<br />
ainsi définie est bilinéaire (évident) et continue car<br />
‖Ψ(v, w)‖ ≤ ‖v‖‖w‖.<br />
On a alors<br />
DI = Ψ ◦ (I, I)<br />
ce qui montre que DI est continue comme composée d’applications continues.<br />
2.2 Opérations sur les applications différentiables<br />
Le résultat suivant découle de la continuité des opérations<br />
(voir chapitre 1, Remarque 1.2).<br />
(λ, x) ↦→ λx et (x, y) ↦→ x + y<br />
Proposition 2.2.1 Soient f, g : U −→ F deux applications différentiables en a ∈ U et soit<br />
λ ∈ R. Alors les applications λf et f + g sont différentiables en a et l’on a<br />
D(λf)(a) = λDf(a),<br />
D(f + g)(a) = Df(a) + Dg(a).<br />
Le résultat suivant est très important en calcul différentiel et il est impératif de savoir l’appliquer<br />
sans hésitation.<br />
Théorème 2.2.1 Soient E, F , G des espaces normés U ⊂ E, V ⊂ F des ouverts et soient<br />
f : U −→ V différentiable en a ∈ U, g : V −→ G différentiable en b = f(a) ∈ V . Alors<br />
l’application g ◦ f est différentiable en a et<br />
D(g ◦ f)(a) = Dg(f(a)) ◦ Df(a).<br />
Démonstration. On a,<br />
f(x) = f(a) + Df(a)(x − a) + r 1 (x),<br />
g(y) = g(b) + Dg(b)(y − b) + r 2 (y),<br />
35
avec<br />
et<br />
On a donc<br />
Il en résulte que<br />
où<br />
Il reste à montrer que<br />
Observons que<br />
ce qui montre que<br />
lim<br />
x→a<br />
lim<br />
y→b<br />
r 1 (x)<br />
‖x − a‖ = 0<br />
r 2 (y)<br />
‖y − b‖ = 0.<br />
g(f(x)) = g(b) + Dg(b)(Df(a)(x − a) + r 1 (x)) + r 2 (f(x)).<br />
g(f(x)) = g(b) + (Dg(b) ◦ Df(a))(x − a) + R(x),<br />
R(x) = Dg(b)(r 1 (x)) + r 2 (y).<br />
lim<br />
x→a<br />
R(x)<br />
‖x − a‖ = 0.<br />
‖Dg(b)(r 1 (x))‖ ≤ ‖Dg(b)‖‖r 1 (x)‖,<br />
Dg(b)(r 1 (x))<br />
lim<br />
x→a ‖x − a‖<br />
= 0.<br />
r 1 (x)<br />
Par ailleurs, utilisant le fait que lim = 0, il existe α > 0 tel que<br />
x→a ‖x − a‖<br />
‖r 1 (x)‖ ≤ ‖x − a‖<br />
pour tout x tel que ‖x − a‖ ≤ α. Il vient, pour tout x ∈ B(a, α),<br />
‖f(x) − b‖ = ‖Df(a)(x − a) + r 1 (x)‖<br />
≤<br />
‖Df(a)(x − a)‖ + ‖r 1 (x)‖<br />
≤<br />
‖Df(a)‖‖(x − a)‖ + ‖r 1 (x)‖,<br />
donc<br />
Soit alors ε > 0, il existe η > 0 tel que<br />
‖f(x) − b‖ ≤ (‖Df(a)‖ + 1)‖x − a‖. (2.2)<br />
‖r 2 (y)‖ ≤<br />
pour tout y tel que ‖y − b‖ ≤ η. Pour tout x tel que ‖x − a‖ ≤ min<br />
utilisant (2.2),<br />
ε<br />
‖y − b‖ (2.3)<br />
‖Df(a)‖ + 1<br />
‖f(x) − b‖ ≤ η,<br />
36<br />
(<br />
α,<br />
η<br />
)<br />
il vient,<br />
‖Df(a)‖ + 1)
et donc, utilisant (2.3),<br />
‖r 2 (f(x))‖<br />
ce qui achève la démonstration.<br />
≤<br />
≤<br />
≤<br />
ε<br />
‖f(x) − b‖<br />
‖Df(a)‖ + 1<br />
ε<br />
(‖Df(a)‖ + 1)‖x − a‖<br />
‖Df(a)‖ + 1<br />
ε‖x − a‖,<br />
Corollaire 2.2.1<br />
a) Soit I ⊂ R un intervalle ouvert de R, soient E, F des espaces normés et soit x : I −→ E<br />
et f : U −→ F une application définie sur un ouvert U de E. On suppose que x(I) ⊂ U, que x(.)<br />
est dérivable en t ∈ I et que f est différentiable en x(t). Alors f ◦ x est dérivable en t et<br />
(f ◦ x) ′ (t) = Df(x(t))(x ′ (t)).<br />
b) Soit I ⊂ R un intervalle ouvert de R, soient E, F , G des espaces normés, soient x : I −→ E<br />
et y : I −→ F . Soit f ∈ L 2 (E, F ; G) une application bilinéaire continue. On suppose que x(.) et<br />
y(.) sont dérivables en t ∈ I. Posons z(t) = f(x(t), y(t)), alors z(.) est dérivable en t et<br />
z ′ (t) = f(x ′ (t), y(t)) + f(x(t), y ′ (t)).<br />
Démonstration. a) D’après le Théorème 2.2.1, f ◦ x est différentiable en t donc dérivable en t et<br />
(f ◦ x) ′ (t) = D(f ◦ x)(t)(1) = (Df(x(t)) ◦ Dx(t))(1) = Df(x(t)(x ′ (t)).<br />
b) On a z = f ◦ g où g(.) = (x(.), y(.)). D’après le Théorème 2.2.1 il résulte que<br />
Dz(t) = Df(x(t), y(t)) ◦ Dg(t).<br />
Appliquant le Théorème 2.3.1 de la section 2.3 on a<br />
Il vient alors<br />
z ′ (t) = Dz(t)(1)<br />
Dg(t) = (Dx(t), Dy(t)).<br />
= Df(x(t), y(t))(Dx(t)(1), Dy(t)(1))<br />
= Df(x(t), y(t))(x ′ (t), y ′ (t)).<br />
Utilisant l’Exemple 2.1.1, c), on obtient bien le résultat.<br />
Exemple 2.2.1 Si (E, 〈·, ·〉) est un espace de Hilbert et x, y : I −→ E sont dérivables en t ∈ I,<br />
on déduit du corollaire précédent que<br />
(〈x(t), y(t)〉) ′ = 〈x ′ (t), y(t)〉 + 〈x(t), y ′ (t)〉.<br />
37
2.3 Applications à valeurs dans un produit d’espaces<br />
Soient F 1 , · · · , F m des espaces normés et F = F 1 ×· · ·×F m leur produit cartésien. On définit,<br />
pour tout i = 1, · · · , m<br />
p i : F −→ F i par p i (x 1 , · · · , x m ) = x i<br />
et<br />
u i : F i −→ F par u i (y) = (0, · · · , y, · · · , 0),<br />
où toutes les composantes sont nulles sauf celle de rang i qui est égale à y. On a p i ∈ L(F, F i ),<br />
u i ∈ L(F i , F ) (le démontrer) et, p i ◦ u i = I Fi .<br />
Théorème 2.3.1 Soit f : U −→ F = F 1 × · · · × F m une application définie sur un ouvert U d’un<br />
espace normé E à valeurs dans un produit d’espaces normé. Alors les propriétés suivantes sont<br />
équivalentes,<br />
i) f est différentiable en a ∈ U,<br />
ii) f 1 , · · · , f m sont différentiables en a où f = (f 1 , · · · , f m ).<br />
De plus pour tout h ∈ E,<br />
Df(a)(h) =<br />
m∑<br />
(u i ◦ Df i (a))(h) = (Df 1 (a)(h), · · · , Df m (a)(h)). (2.4)<br />
i=1<br />
Démonstration. Comme f est différentiable en a, l’application f i = p i ◦ f est aussi différentiable<br />
en a pour tout i = 1, · · · m, d’après le Théorème 2.2.1.<br />
Réciproquement, supposons que f 1 , · · · , f m sont différentiables en a. Alors, pour tout i =<br />
1, · · · , m, u i ◦ f i est différentiable en a comme composée d’une application différentiable en<br />
a et d’une application différentiable sur F i . Il en résulte que f qui est égal à ∑ m<br />
i=1 u i ◦ f i est<br />
différentiable en a et que, utilisant de nouveau le Théorème 2.2.1 pour tout h ∈ E<br />
ce qui achève la démonstration.<br />
Df(a)(h) =<br />
=<br />
m∑<br />
i=1<br />
m∑<br />
i=1<br />
(<br />
)<br />
Du i (f i (a)) ◦ Df i (a) (h)<br />
( )<br />
u i ◦ Df i (a) (h),<br />
Corollaire 2.3.1 Soit U un ouvert de R n et soit f : U −→ R m . Alors f est différentiable en a ∈ U<br />
si et seulement si f 1 , · · · , f m sont différentiables en a et on a, pour tout h ∈ R n ,<br />
Df(a)(h) = J f (a)h, (2.5)<br />
38
⎛ ⎞<br />
∇f 1 (a) T<br />
oú J f (a) = ⎝<br />
.<br />
⎠ est la matrice m × n définie par [J f (a)] ij = ∂f i<br />
(a), soit<br />
∂x j<br />
∇f m (a) T<br />
⎛<br />
J f (a) = ⎜<br />
⎝<br />
∂f 1<br />
∂x 1<br />
(a) · · ·<br />
. · · ·<br />
∂f m<br />
(a) · · ·<br />
∂x 1<br />
∂f<br />
⎞<br />
1<br />
(a)<br />
∂x n . ⎟<br />
∂f<br />
⎠ .<br />
m<br />
(a)<br />
∂x n<br />
Démonstration. La première partie de la conclusion découle du Théorème 2.3.1. Utilisant ce<br />
même Théorème, il vient<br />
Df(a)(h) = (Df 1 (a)(h), · · · , Df m (a)(h)).<br />
Par ailleurs, pour i ∈ [1, m], on a ∂f i<br />
∂x j<br />
(a) = Df i (a)(e j ) où e j est le j eme vecteur de la base<br />
canonique de R n de telle sorte que<br />
Df i (a)(h) =<br />
n∑<br />
h j Df i (a)(e j ) =<br />
j=1<br />
n∑<br />
j=1<br />
h j<br />
∂f i<br />
∂x j<br />
(a) = 〈∇f i (a), h〉.<br />
On a donc bien<br />
⎛<br />
⎞<br />
〈∇f 1 (a), h〉<br />
Df(a)(h) = ⎝<br />
.<br />
⎠ = J f (a)h.<br />
〈∇f m (a), h〉<br />
2.4 Applications définies sur un produit d’espaces<br />
Nous aurons besoin dans cette section de la Proposition 2.4.2 que nous démontrerons au chapitre<br />
suivant. Nous en donnons ici une autre démonstration basée sur la proposition suivante dont<br />
la démonstration fait appel au Théorème de Hahn-Banach.<br />
Proposition 2.4.1 Soit (E, ‖.‖) un espace normé. Alors pour tout x ∈ E on a<br />
‖x‖ = sup{|l(x)| : l ∈ E ∗ , ‖l‖ ≤ 1}.<br />
Proposition 2.4.2 Soit f : U ⊂ E −→ F une application différentiable définie sur un ouvert<br />
convexe d’un espace normé à valeurs dans un espace normé. On suppose qu’il existe M ∈ R + tel<br />
que<br />
sup ‖Df(x)‖ ≤ M.<br />
x∈U<br />
Alors pour tout x, z ∈ U<br />
‖f(z) − f(x)‖ ≤ M‖z − x‖.<br />
39
Démonstration. Soient x, z ∈ U et t ∈ [0, 1]. De part la convexité de U on a tx + (1 − t)z ∈ U.<br />
En fait il existe η > 0 tel que tx + (1 − t)z ∈ U pour tout t ∈ [−η, 1 + η] (choisir η > 0 tel que<br />
B(x, η‖x − z‖) ⊂ U et B(z, η‖x − z‖) ⊂ U). Soit l ∈ F ∗ telle que ‖l‖ ≤ 1. Posons pour tout<br />
t ∈ [−η, 1 + η]<br />
ϕ(t) = l(f(tx + (1 − t)z)) = l(f(α(t))).<br />
Utilisant la règle de différentiation des applications composées on obtient que ϕ est dérivable sur<br />
] − η, 1 + η[ et<br />
On a alors<br />
ϕ ′ (t) = Dl(f(α(t)))(Df(α(t))(α ′ (t))) = l(Df(tx + (1 − t)z))(x − z).<br />
|ϕ ′ (t)| ≤ ‖l‖‖(Df(tx + (1 − t)z)‖‖z − x‖<br />
≤<br />
≤<br />
‖(Df(tx + (1 − t)z)‖‖z − x‖<br />
M‖z − x‖.<br />
Utilisant le théorème des accroissements finis pour les fonctions d’une variable réelle il vient<br />
pout tout s, t ∈] − η, 1 + η[. On obtient alors<br />
On applique alors la Proposition 2.4.1 et il vient<br />
|ϕ(t) − ϕ(s)| ≤ M‖z − x‖|t − s|<br />
|l(f(z) − f(x))| = |ϕ(1) − ϕ(0)| ≤ M‖z − x‖.<br />
‖f(z) − f(x)‖ = sup{|l(f(z) − f(x))| : l ∈ F ∗ , ‖l‖ ≤ 1} ≤ M‖z − x‖.<br />
Soient E 1 , · · · , E n , F des espaces normés, U un ouvert du produit cartésien<br />
E = E 1 × · · · × E n ,<br />
et f : U −→ F une application. Étant donné a ∈ U, on introduit, pour tout i = 1, · · · , n,<br />
l’application ϕ i définie par<br />
ϕ i (z) = f(a 1 , · · · , z, · · · , a n ),<br />
(dans (a 1 , · · · , z, · · · , a n ), les composantes de rang j ≠ i sont égales à a j , celle de rang i est égale<br />
à z). L’application ϕ i est définie sur un voisinage U i de a i et à valeurs dans F .<br />
Définition 2.4.1 Soient E 1 , · · · , E n , F des espaces normés, U un ouvert du produit cartésien<br />
E = E 1 × · · · × E n et f : U −→ F une application. On dit que f admet une différentielle<br />
partielle en a ∈ U par rapport à la ième variable si ϕ i est différentiable en a i . On pose alors<br />
On remarque que D i f(a) ∈ L(E i , F ).<br />
D i f(a) = Dϕ i (a).<br />
40
Proposition 2.4.3 Soit f : U ⊂ E −→ F où U est un ouvert de E = E 1 × · · · × E n . Supposons<br />
que f est différentiable en a. Alors pour tout i = 1, · · · , n, D i f(a) existe et pour tout h ∈ E i<br />
où u i (h) = (0, · · · , h, · · · , 0).<br />
Démonstration. Posons, pour z ∈ E i ,<br />
v i (.) est définie dans un voisinage de a i et<br />
D i f(a)(h) = Df(a)(u i (h)),<br />
v i (z) = (a 1 , · · · , z, · · · , a n ),<br />
v i (z) − v i (a i ) = u i (z − a i ),<br />
ce qui montre que v i est différentiable en a i et que Dv i (a i ) = u i . D’après le Théorème 2.2.1,<br />
ϕ i = f ◦ v i est différentiable en a i et que, pour tout h ∈ E i<br />
(<br />
)<br />
Dϕ i (a i )(h) = Df(v i (a i )) ◦ Dv i (a i ) (h) = Df(a)(u i (h)),<br />
d’où le résultat.<br />
Le résultat suivant découle immédiatement de la Proposition 2.4.3<br />
Proposition 2.4.4 Soit f : U −→ R où U est un ouvert de R n . Alors il est équivalent de dire que<br />
f admet une différentielle partielle en a par rapport à la ième variable et que la dérivée partielle<br />
∂f<br />
∂x i<br />
(a) existe. De plus on a<br />
∂f<br />
∂x i<br />
(a) = Df(a)(e i ),<br />
et<br />
D i f(a)(h) = h ∂f<br />
∂x i<br />
(a),<br />
∂f<br />
∂x i<br />
(a) = D i f(a)(1).<br />
Il est faux en général que l’existence de différentielles partielles D i f(a), 1 ≤ i ≤ n, implique la<br />
différentiabilité de f en a. On a cependant le résultat suivant qui est très important.<br />
Théorème 2.4.1 Soit f : U ⊂ E 1 × · · · × E n −→ F et a ∈ U. On suppose que pour i = 1, · · · , n<br />
les différentielles partielles D i f(.) existent sur U et que les applications D i f : U −→ L(E i , F )<br />
sont continues en a ∈ U. Alors f est différentiable en a et,<br />
Df(a)(h) =<br />
n∑<br />
D i f(a)(h i ) pour tout h = (h 1 , · · · , h n ) ∈ E 1 × · · · × E n<br />
i=1<br />
41
Démonstration. On remarque que l’application<br />
L : E 1 × · · · × E n −→ F<br />
définie par L(h) = ∑ n<br />
i=1 D if(a)(h i ) est linéaire et continue. Posons<br />
R(x) = f(x) − f(a) −<br />
n∑<br />
D i f(a)(x i − a i ).<br />
i=1<br />
On a<br />
Ce que l’on peut écrire<br />
où<br />
R(x) = f(x 1 , · · · , x n ) − f(a 1 , x 2 , · · · , x n ) − D 1 f(a)(x 1 − a 1 )<br />
+ f(a 1 , x 2 , · · · x n ) − f(a 1 , a 2 , · · · , x n ) − D 2 f(a)(x 2 − a 2 )<br />
.<br />
+ f(a 1 , · · · , a n−1 , x n ) − f(a 1 , · · · , a n ) − D n f(a)(x n − a n ).<br />
R(x) = g 1 (x 1 ) − g 1 (a 1 ) + · · · + g n (x n ) − g n (a n ),<br />
g 1 (z 1 ) = f(z 1 , x 2 , · · · , x n ) − D 1 f(a)(z 1 − a 1 ),<br />
g 2 (z 2 ) = f(a 1 , z 2 , x 3 , · · · , x n ) − D 2 f(a)(z 2 − a 2 ),<br />
.<br />
g n (z n ) = f(a 1 , · · · , a n−1 , z n ) − D n f(a)(z n − a n ).<br />
Les applications g i sont définies et différentiables dans un voisinage de a i pour tout x voisin de a.<br />
Par définition de la différentielle partielle, on a<br />
Munissons alors E de la norme<br />
Dg 1 (z 1 ) = D 1 f(z 1 , x 2 , · · · , x n ) − D 1 f(a 1 , · · · , a n ),<br />
Dg 2 (z 2 ) = D 2 f(a 1 , z 2 , x 3 , · · · , x n ) − D 2 f(a 1 , · · · , a n ),<br />
.<br />
Dg n (z n ) = D n f(a 1 , · · · , a n−1 , z n ) − D n f(a 1 , · · · , a n ).<br />
‖(u 1 , · · · , u n )‖ = sup ‖u i ‖.<br />
1≤i≤n<br />
Utilisant la continuité de l’application D 1 f, étant donné ε > 0, il existe η > 0 tel que, pour tout<br />
y ∈ B(a, η) et pour tout i ∈ [1, n], on ait<br />
‖D i f(y) − D i f(a)‖ ≤ ε.<br />
42
On obtient donc pour tout x ∈ B(a, η) et pour tout i ∈ [1, n],<br />
‖Dg i (z i )‖ ≤ ε pour tout z i ∈ B(a i , η).<br />
Appliquant alors la Proposition 2.4.2, il vient pour tout x ∈ B(a, η) et pour tout i ∈ [1, n],<br />
‖g i (x i ) − g i (a i )‖ ≤ ε‖x i − a i ‖,<br />
d’où<br />
‖R(x)‖ ≤ ε<br />
ce qui achève la démonstration.<br />
n∑<br />
‖x i − a i ‖ = ε‖x − a‖ 1 ,<br />
i=1<br />
Corollaire 2.4.1 Soit f : U ⊂ E 1 ×· · ·×E n −→ F . Alors f est de classe C 1 sur U si et seulement<br />
si les différentielles partielles D i f(.) existent, i = 1, · · · , n et sont continues sur U.<br />
Démonstration. Supposons f de classe C 1 . Alors D i f(x) existe pour tout i = 1, · · · , n et pour<br />
tout x ∈ U. Pour tout i ∈ [1, n], x, z ∈ U et pour tout v ∈ E i , on a<br />
‖(D i f(z) − D i f(x))(v)‖ = ‖(Df(z) − Df(x))(0, · · · , v, · · · , 0)‖<br />
≤<br />
‖Df(z) − Df(x)‖ L(E1 ×···×E n,F )‖v‖,<br />
ce qui montre que<br />
‖D i f(z) − D i f(x)‖ L(Ei ,F ) ≤ ‖Df(z) − Df(x)‖ L(E1 ×···×E n,F ),<br />
d’où la continuité de D i f en tout x ∈ U. Réciproquement, d’après le Théorème 2.4.1 l’application<br />
f est différentiable sur U et pour tout x, z ∈ U, h ∈ E 1 × · · · × E n on a<br />
‖(Df(z) − Df(x))(h)‖<br />
≤<br />
≤<br />
n∑<br />
‖(D i f(z) − D i f(x))(h i )‖<br />
i=1<br />
( n∑<br />
i=1<br />
)<br />
‖(D i f(z) − D i f(x))‖ ‖h‖.<br />
On obtient donc<br />
‖(Df(z) − Df(x))‖ L(E1 ×···×E n,F ) ≤<br />
n∑<br />
‖(D i f(z) − D i f(x))‖ L(Ei ,F )<br />
i=1<br />
ce qui montre bien la continuité de Df.<br />
43
Corollaire 2.4.2 Soit U un ouvert de R n et f : U −→ R m , f = (f 1 , · · · , f m ).<br />
a) On suppose que les dérivées partielles ∂f i<br />
∂x j<br />
, (i, j) ∈ [1, m] × [1, n] existent au voisinage<br />
d’un point a ∈ U et sont continues en a. Alors f est différentiable en a et pour tout h ∈ R n<br />
où J f (a) est la matrice (m, n) définie par<br />
Df(a)(h) = J f (a)h,<br />
(J f (a)) i,j = ∂f i<br />
∂x j<br />
(a).<br />
b) De plus si les dérivées partielles ∂f i<br />
∂x j<br />
, (i, j) ∈ [1, m] × [1, n] sont continues sur U alors f<br />
est de classe C 1 sur U.<br />
Démonstration. a) Utilisant la Proposition 2.4.4, on a, pour tout i ∈ [1, m], j ∈ [1, n], x ∈ U et<br />
h ∈ R,<br />
( ∂fi<br />
|(D j f i (x) − D j f i (a))(h)| = ∣ (x) − ∂f )<br />
i<br />
(a) h∣<br />
∂x j ∂x j<br />
ce qui montre que<br />
=<br />
∣ ∂f i<br />
(x) − ∂f i ∣<br />
(a) ∣|h|,<br />
∂x j ∂x j<br />
‖D j f i (x) − D j f i (a)‖ L(R,R)<br />
= ∣ ∂f i<br />
(x) − ∂f i ∣<br />
(a) ∣.<br />
∂x j ∂x j<br />
Il en résulte que les applications D i f j sont continues en a. Utilisant les Théorèmes 2.3.1 et 2.4.1,<br />
on obtient bien que f est différentiable en a. Le calcul de Df(a)(h) découle alors du Corollaire<br />
2.3.1.<br />
b) Montrons que les différentielles partielles D i f, 1 ≤ i ≤ n sont continues. Pour tout u ∈ R<br />
et pour tout x ∈ U, on a, utilisant la Proposition 2.4.4<br />
D i f(x)(u) = Df(x)(ue i )<br />
= (Df 1 (x)(ue i ), · · · , Df m (x)(ue i ))<br />
( ∂f1<br />
= u (x), · · · , ∂f )<br />
m<br />
(x) .<br />
∂x i ∂x i<br />
Il en résulte que<br />
( ‖D i f(z) − D i f(x)‖ L(R,R m ) =<br />
∂f1<br />
∥ (z) − ∂f 1<br />
(x), · · · , ∂f m<br />
(z) − ∂f )∥<br />
m ∥∥∥<br />
(x) .<br />
∂x i ∂x i ∂x i ∂x i<br />
Il suffit alors d’appliquer le Corollaire 2.4.1.<br />
44
Remarque 2.4.1 Dans le cas où m = 1 on peut aussi écrire<br />
où<br />
∇f(a) =<br />
Df(a)(h) = 〈∇f(a), h〉<br />
( ∂f<br />
(a), · · · , ∂f )<br />
(a) .<br />
∂x 1 ∂x n<br />
Corollaire 2.4.3 Soient E 1 , · · · , E n , F des espaces normés et soit<br />
f ∈ L n (E 1 , · · · , E n ; F )<br />
une application multilinéaire continue. Alors f est de classe C 1 sur E 1 × · · · × E n et pour tout<br />
x, h ∈ E 1 × · · · × E n<br />
Df(a)(h) = f(h 1 , x 2 , · · · , x n ) + · · · + f(x 1 , · · · , x n−1 , h n ).<br />
Démonstration. Soit a ∈ E 1 × · · · × E n et i ∈ [1, n]. L’application partielle<br />
ϕ i (z) = f(a 1 , · · · , z, · · · , a n ),<br />
est alors linéaire et continue de E i dans F . Elle est donc différentiable d’après l’Exemple 2.1.1,<br />
b) et<br />
D i f(a) = ϕ i .<br />
Montrons alors que, pour tout 1 ≤ i ≤ n, l’application D i f est continue sur E 1 × · · · × E n ce<br />
qui démontrera le résultat grâce au Corollaire 2.4.1. Il suffit de faire la démonstration pour i = 1.<br />
Pour tout x ∈ E 1 × · · · × E n on a<br />
où<br />
est définie pour tout z ∈ E 2 × · · · × E n par<br />
D 1 f(x) = Ψ(x 2 , · · · , x n )<br />
Ψ : E 2 × · · · × E n −→ L(E 1 , F )<br />
Ψ(z) = f(., z 2 , · · · , z n ).<br />
Remarquons que Ψ est multilinéaire et que pour tout u ∈ E 1<br />
Il en résulte que<br />
‖ψ(z)(u)‖ ≤ ‖f‖‖z 2 ‖ · · · ‖z n ‖‖u‖.<br />
‖ψ(z)‖ L(E1 ,F ) ≤ ‖f‖‖z 2 ‖ · · · ‖z n ‖,<br />
donc d’après le Théorème 1.5.1 du Chapitre 1, Ψ est continue sur E 2 × · · · × E n ce qui implique<br />
que D 1 f est continue sur E 1 × · · · × E n .<br />
On a aussi le<br />
45
Corollaire 2.4.4 Soient f : U ⊂ E −→ R et g : U ⊂ E −→ R ∗ différentiables en a ∈ U. Alors<br />
l’application f g<br />
est différentiable en a, et, pour tout u ∈ E,<br />
( f<br />
)<br />
D (a)(u) =<br />
g<br />
g(a)Df(a)(u) − f(a)Dg(a)(u)<br />
g(a) 2 .<br />
Démonstration. On a f g = ϕ ◦ (f, g) avec ϕ : R × R∗ −→ R définie par ϕ(s, t) = s t . On a<br />
∂ϕ<br />
∂s (s, t) = 1 t<br />
et<br />
∂ϕ<br />
∂t (s, t) = − s t 2 . Ces dérivées partielles étant continues sur R × R∗ , on déduit du<br />
Corollaire 2.4.2 que ϕ est différentiable sur R × R ∗ . Il en résulte que f est différentiable en a, et<br />
g<br />
que, pour tout u ∈ E,<br />
( f<br />
)<br />
D (a)(u) = Dϕ(f(a), g(a))(Df(a)(u), Dg(a)(u)) = 1<br />
f(a)<br />
Df(a)(u) −<br />
g g(a) g(a) Dg(a)(u),<br />
2<br />
d’où le résultat.<br />
Remarquons que si, dans le corollaire précédent, E est un espace de HILBERT, on a alors<br />
( f<br />
)<br />
∇ (a) =<br />
g<br />
g(a)∇f(a) − f(a)∇g(a)<br />
g(a) 2 .<br />
46
Chapitre 3<br />
Théorème des Accroissements Finis et<br />
Applications<br />
3.1 Théorème des Accroissements Finis<br />
Définition 3.1.1 Soit f : I −→ E une fonction définie sur un intervalle I de R à valeurs dans<br />
un espace normé E, on dit que f est dérivable à droite (resp. à gauche) en t 0 ∈ I si le vecteur<br />
f(t) − f(t 0 )<br />
a une limite à droite (resp. à gauche) en t 0 . On note f d ′ t − t (t 0) (resp. f g(t ′ 0 )) cette limite<br />
0<br />
à droite (resp. à gauche) quand elle existe.<br />
Le résultat suivant est connu sous le nom de Théorème des accroissements finis.<br />
Théorème 3.1.1 Soit E un espace normé et soient f : [a, b] −→ E, g : [a, b] −→ R des fonctions<br />
continues sur [a, b] et dérivables sur ]a, b[. On suppose que, pour tout t ∈]a, b[<br />
‖f ′ (t)‖ ≤ g ′ (t).<br />
Alors<br />
‖f(b) − f(a)‖ ≤ g(b) − g(a).<br />
Démonstration. Montrons que l’on a<br />
‖f(v) − f(u)‖ ≤ g(v) − g(u) pour tout a < u < v < b,<br />
ce qui donnera bien la conclusion du théorème en faisant tendre u vers a et v vers b, utilisant la<br />
continuité de f et g en a et b. Supposons le contraire, il existe donc a < u < v < b tels que<br />
‖f(v) − f(u)‖ − (g(v) − g(u)) = η > 0.<br />
Définissons a 0 = u et b 0 = v. Comme<br />
∥<br />
‖f(v) − f(u)‖ − (g(v) − g(u)) ≤ ∥f(v) − f( u + v<br />
(<br />
) ∥ − g(v) − g( u + v )<br />
) +<br />
2<br />
2<br />
∥<br />
∥f( u + v<br />
(<br />
) − f(u) ∥ − g( u + v )<br />
) − g(u)<br />
2<br />
2<br />
47
on a<br />
∥ ∥∥f(v) − f(<br />
u + v<br />
2<br />
(<br />
) ∥ −<br />
ou bien<br />
∥ ∥∥f( u + v<br />
(<br />
) − f(u) ∥ −<br />
2<br />
Choisissons alors a 1 , b 1 ∈ {a 0 , b 0 } tels que<br />
g(v) − g( u + v<br />
2<br />
g( u + v<br />
2<br />
)<br />
) ≥ η 2 ,<br />
)<br />
) − g(u) ≥ η 2 .<br />
‖f(b 1 ) − f(a 1 )‖ − (g(b 1 ) − g(a 1 )) ≥ η 2 .<br />
On construit alors par récurrence, une suite décroissantes d’intervalles [a n , b n ] tels que b n − a n =<br />
b 0 − a 0<br />
2 n et<br />
‖f(b n ) − f(a n )‖ − (g(b n ) − g(a n )) ≥ η 2 n . (3.1)<br />
Les suites (a n ) n∈N et (b n ) n∈N convergent alors vers une limite commune c ∈ [a 0 , b 0 ] ⊂]a, b[.<br />
Utilisant la dérivabilité de f et g en c, on a<br />
f(a n ) = f(c) + (a n − c)f ′ (c) + (a n − c)ε(a n − c)<br />
f(b n ) = f(c) + (b n − c)f ′ (c) + (b n − c)ε(b n − c)<br />
g(a n ) = g(c) + (a n − c)g ′ (c) + (a n − c)η(a n − c)<br />
(3.2)<br />
g(b n ) = g(c) + (b n − c)g ′ (c) + (b n − c)η(b n − c),<br />
avec lim h→0 ε(h) = 0 et lim h→0 η(h) = 0. Revenant à (3.1), et utilisant l’inégalité triangulaire, il<br />
vient<br />
‖f(b n ) − f(c)‖ + ‖f(c) − f(a n )‖ − (g(b n ) − g(c)) − (g(c) − g(a n )) ≥ η 2 n .<br />
On obtient donc, utilisant (3.2) et le fait que a n ≤ c ≤ b n ,<br />
avec<br />
η<br />
2 n ≤ ‖f ′ (c)‖(b n − c + c − a n ) − g ′ (c)(b n − a n ) + r n<br />
r n = (b n − c)(‖ε(b n − c)‖ + |η(b n − c)|) + (c − a n )(‖ε(a n − c)‖ + |η(a n − c)|).<br />
Divisant par b n − a n , il vient<br />
η<br />
b 0 − a 0<br />
≤ ‖f ′ (c)‖ − g ′ (c) + (b n − a n ) −1 r n .<br />
Il existe δ > 0 tel que, pour tout |h| ≤ δ, on a ‖ε(h)‖ ≤ ε et ‖η(h)‖ ≤ ε. Pour tout n assez grand<br />
pour que b n − a n ≤ δ, on a alors b n − c ≤ b n − a n et c − a n ≤ b n − a n , de telle sorte que<br />
r n ≤ 4(b n − a n )ε,<br />
48
donc lim n→∞ (b n − a n ) −1 r n = 0. On arrive donc à la contradiction<br />
‖f ′ (c)‖ > g ′ (c).<br />
On peut en fait démontrer le résultat plus général suivant<br />
Théorème 3.1.2 Soient f : [a, b] −→ E, g : [a, b] −→ R des fonctions continues sur [a, b] et<br />
dérivables à droite sur ]a, b[ sauf éventuellement sur une partie au plus dénombrable D de ]a, b[.<br />
On suppose que, pour tout t ∈]a, b[\D,<br />
‖f ′ d(t)‖ ≤ g ′ d(t).<br />
Alors<br />
‖f(b) − f(a)‖ ≤ g(b) − g(a).<br />
Démonstration. Soit n ↦−→ ρ n une surjection de N sur D. Soit ε > 0, on va montrer que, pour<br />
tout t ∈ [a, b]<br />
‖f(t) − f(a)‖ ≤ g(t) − g(a) + ε(t − a + 2),<br />
ce qui démontrera bien le résultat en faisant t = b et en faisant tendre ε vers 0. Posons<br />
A = {a} ∪ {t ∈]a, b] : ψ(s) ≤ 0, ∀s ∈ [a, t[},<br />
où<br />
ψ(s) = ‖f(s) − f(a)‖ − (g(s) − g(a)) − ε(s − a) − ε ∑ ρ n
On a donc<br />
‖f(s) − f(c)‖ ≤ ‖f d(c)‖(s ′ − c) + (s − c)ε/2,<br />
≤ g d(c)(s ′ − c) + (s − c)ε/2<br />
≤ g(s) − g(c) + ε(s − c).<br />
Comme ψ(c) ≤ 0, on a<br />
‖f(c) − f(a)‖ ≤ (g(c) − g(a)) + ε(c − a) + ε ∑ ρ n
Corollaire 3.1.1 Soit f : [a, b] −→ E une fonction continue sur [a, b] et dérivable à droite sur<br />
]a, b[ sauf éventuellement sur une partie au plus dénombrable D de ]a, b[. On suppose qu’il existe<br />
M ≥ 0 telle que, pour tout t ∈]a, b[\D,<br />
Alors<br />
‖f ′ d(t)‖ ≤ M.<br />
‖f(b) − f(a)‖ ≤ M(b − a).<br />
Démonstration. Il suffit d’appliquer le Théorème 3.1.2 avec g(t) = Mt.<br />
Remarque 3.1.1<br />
a) Le Théorème 3.1.2 et le Corollaire 3.1.1 sont vrais en remplaçant la dérivée à droite par la<br />
dérivée à gauche.<br />
b) Quand E ≠ R, il n’existe pas en général d’élément c ∈ [a, b] tel que f(b) − f(a) =<br />
f ′ (c)(b − a) (voir T.D.).<br />
3.2 Applications du Théorème des Accroissements Finis<br />
Le résultat très utile suivant montre qu’une fonction différentiable dont la différentielle est<br />
majorée en norme par une constante M sur un convexe est M-Lipschitzienne sur ce convexe.<br />
Corollaire 3.2.1 Soit U ⊂ E un ouvert d’un espace normé et soit f : U −→ F une application<br />
différentiable et soit C ⊂ U un convexe tel que sup y∈C ‖Df(y)‖ ≤ M. Alors, pour tout x, z ∈ C<br />
‖f(z) − f(x)‖ ≤ M‖x − z‖.<br />
Démonstration. Soient x, z ∈ C. Définissons pour tout t ∈ [0, 1]<br />
et<br />
u(t) = tx + (1 − t)z ∈ U<br />
ϕ(t) = f(u(t)).<br />
La fonction ϕ est continue sur [0, 1], à valeurs dans C, dérivable sur ]0, 1[ et sa dérivée est donnée,<br />
utilisant le Corollaire 2.2.1 du Chapitre 2<br />
Il en résulte que pour tout t ∈]0, 1[<br />
ϕ ′ (t) = Df(u(t))u ′ (t) = Df(tx + (1 − t)z)(x − z).<br />
‖ϕ ′ (t)‖ ≤ M‖x − z‖ = g ′ (t)<br />
en posant g(t) = M‖x − z‖t. Le Théorème 3.1.1 implique que<br />
‖f(x) − f(z)‖ = ‖ϕ(1) − ϕ(0)‖ ≤ g(1) − g(0) = M‖x − z‖.<br />
Le résultat suivant est aussi utile<br />
51
Proposition 3.2.1 Foit U ⊂ E un ouvert d’un espace normé E et soit f : U −→ F une application<br />
différentiable que l’on suppose M-lipschitzienne sur U. Alors,<br />
‖Df(x)‖ ≤ M pour tout x ∈ U.<br />
Démonstration. Pour tout x ∈ U et u ∈ E, on sait que<br />
f(x + tu) − f(x)<br />
Df(x)(u) = lim<br />
,<br />
t→0 t<br />
donc<br />
∥ ∥∥ f(x + tu) − f(x)<br />
∥<br />
‖Df(x)(u)‖ = lim<br />
∥.<br />
t→0 t<br />
Pour tout t assez petit, on a x + tu ∈ U de telle sorte que<br />
‖f(x + tu) − f(x)‖ ≤ M|t|‖u‖,<br />
d’où<br />
∥ ∥∥ f(x + tu) − f(x)<br />
‖Df(x)(u)‖ = lim<br />
∥ ≤ M‖u‖,<br />
t→0 t<br />
ce qui montre bien que ‖Df(x)‖ ≤ M pour tout x ∈ U.<br />
Le résultat suivant est important.<br />
Corollaire 3.2.2 Soit U ⊂ E un ouvert connexe d’un espace normé, soit f : U −→ F une<br />
application différentiable telle que Df(x) = 0 pour tout x ∈ U. Alors f est constante sur U.<br />
Démonstration. Pour tout a ∈ U il existe un ouvert convexe, à savoir une boule ouverte B(a, r)<br />
sur laquelle Df est nulle et donc sur laquelle f est constante (Corollaire 3.2.1). Considérons<br />
a 0 ∈ U et posons b 0 = f(a 0 ) et U 0 = f −1 (b 0 ). L’ensemble U 0 est fermé car f est continue. Soit<br />
a ∈ U 0 , il existe une boule ouverte B(a, r) telle que f(x) = f(a) = b 0 sur B(a, r). Il en résulte<br />
que U 0 est ouvert dans U. Comme U 0 est aussi fermé dans U et que U est connexe, on a U = U 0<br />
ce qui achève la démonstration.<br />
Une application utile du Théorème des accroissements finis est de donner une condition suffisante<br />
pour passer à la limite sur la différentielle d’une suite de fonctions différentiables.<br />
Théorème 3.2.1 Soit U ⊂ E un ouvert connexe d’un espace normé et soit f p : U −→ F , p ∈ N<br />
une suite d’applications différentiables à valeurs dans un espace de Banach F . On suppose que<br />
i) il existe x 0 ∈ U tel que la suite (f p (x 0 )) converge ;<br />
ii) il existe une fonction g : U −→ L(E, F ) telle que, pour tout a ∈ U il existe une boule<br />
ouverte B(a) contenant a telle que la suite de fonctions (Df p ) converge uniformément sur B(a)<br />
vers g, ce qui signifie<br />
(<br />
lim<br />
p→∞<br />
sup<br />
y∈B(a)<br />
‖Df p (y) − g(y)‖ L(E,F )<br />
)<br />
= 0.<br />
Alors il existe une application différentiable f : U −→ F telle que pour tout a ∈ U, la suite<br />
(f p ) converge uniformément vers f sur B(a) et l’on a Df = g sur U.<br />
52
Démonstration. Soient p, q ∈ N et a ∈ U. On définit<br />
h(x) = f p (x) − f p (a) − (f q (x) − f q (a)).<br />
On a Dh(x) = Df p (x) − Df q (x) et h(a) = 0. Appliquant le Corollaire 3.2.1 à l’application h et<br />
à l’ouvert convexe B(a), on a pour tout x ∈ B(a) et pour tout p, q ∈ N,<br />
‖f p (x) − f p (a) − (f q (x) − f q (a))‖ ≤ ‖Df p − Df q ‖ C(B(a),F ) ‖x − a‖. (3.4)<br />
avec ‖Df p − Df q ‖ C(B(a),F ) = sup y∈B(a) ‖Df p (y) − Df q (y)‖. La suite (f p (x) − f p (a)) est donc<br />
de Cauchy dans F . Il en résulte que les suites (f p (x)) et (f p (a)) convergent ou divergent simultanément.<br />
Ceci implique que l’ensemble A des x ∈ U tels que (f p (x)) converge est à la fois ouvert<br />
et fermé dans U. En effet, d’après ce qui précéde on a B(a) ⊂ A ou B(a) ⊂ U \ A suivant que<br />
a ∈ A ou a ∈ U \ A. L’ensemble A qui est non vide par hypothèse est donc égal à U car U est<br />
connexe. Notons que pour tout x ∈ U, f(x) = lim p→∞ f p (x). Soit r(a) > 0 le rayon de la boule<br />
B(a). D’après 3.4 on a, pour tout x ∈ B(a) et pour tout p, q ∈ N,<br />
‖f p (x) − f p (a) − (f q (x) − f q (a))‖ ≤ ‖Df p − Df q ‖ C(B(a),F ) r(a),<br />
d’où, faisant tendre q vers l’infini, et passant à la borne supérieure sur x ∈ B(a),<br />
sup ‖f p (x) − f p (a) − (f(x) − f(a))‖ ≤ ‖Df p − Dg‖ C(B(a),F ) r(a).<br />
x∈B(a)<br />
Il en résulte que la suite d’applications (f p − f p (a)) converge uniformément vers f − f(a) sur<br />
B(a), donc (f p ) converge uniformément vers f sur B(a).<br />
Il reste à démontrer que f est différentiable et que Df = g. Soit a ∈ U. Posons pour tout x ∈ U<br />
où<br />
R(x) = f(x) − f(a) − g(a)(x − a) = R 1 (x) + R 2 (x) + R 3 (x),<br />
R 1 (x) = f(x) − f(a) − (f p (x) − f p (a)),<br />
R 2 (x) = f p (x) − f p (a) − Df p (a)(x − a),<br />
R 3 (x) = (Df p (a) − g(a))(x − a).<br />
On sait que pour tout x ∈ B(a) et pour tout p ∈ N<br />
‖R 1 (x)‖ = ‖f p (x) − f p (a) − (f(x) − f(a))‖ ≤ sup ‖Df p (y) − g(y)‖‖x − a‖.<br />
y∈B(a)<br />
Étant donné ε > 0 il existe p 0 ∈ N tel que pour tout p ≥ p 0<br />
sup ‖Df p (y) − g(y)‖ ≤ ε/3,<br />
y∈B(a)<br />
ce qui implique que, pour tout x ∈ B(a) et pour tout p ≥ p 0<br />
‖R 1 (x)‖ ≤ ‖x − a‖ε/3,<br />
‖R 3 (x)‖ ≤ sup ‖Df p (y) − g(y)‖‖x − a‖<br />
y∈B(a)<br />
≤ ‖x − a‖ε/3.<br />
53
Fixons alors p 0 (qui ne dépend que de ε). Utilisant la différentiabilité de f p0 en a, il existe η > 0<br />
tel que, pour tout x ∈ B(a, η) ⊂ B(a)<br />
On obtient donc, pour tout x ∈ B(a, η),<br />
ce qui achève la démonstration.<br />
‖f p0 (x) − f p0 (a) − Df p0 (a)(x − a)‖ ≤ ‖x − a‖ε/3.<br />
‖R(x)‖ ≤ ‖R 1 (x)‖ + ‖R 2 (x)‖ + ‖R 3 (x)‖ ≤ ε‖x − a‖,<br />
On peut écrire ce résultat pour des séries d’applications.<br />
Corollaire 3.2.3 Soit U ⊂ E un ouvert connexe d’un espace normé et soit u p : U −→ F une<br />
suite d’applications différentiables à valeurs dans un espace de Banach F . On suppose<br />
i) Il existe a ∈ U tel que la série de terme général (u p (a)) converge dans F .<br />
ii) La série de fonctions de terme général (Du p (.)) converge uniformément vers une application<br />
g : U −→ L(E, F ), ce qui signifie que<br />
(<br />
lim<br />
p→∞<br />
sup<br />
y∈U<br />
∥<br />
p∑<br />
) Du k (y) − g(y) ∥ = 0.<br />
L(E,F )<br />
k=0<br />
Alors la série d’applications de terme général (u p (.)) converge uniformément sur U et on a<br />
Dans le cas des fonctions on obtient :<br />
( ∑ ∞ )<br />
D u k (x) =<br />
k=0<br />
∞∑<br />
Du k x.<br />
Théorème 3.2.2 Soit I ⊂ R un intervalle ouvert, soient f p : I −→ F , p ∈ N une suite de<br />
fonctions dérivables à valeurs dans un espace de Banach F . On suppose que<br />
i) Il existe t 0 ∈ I tel que la suite (f p (t 0 )) converge.<br />
ii) Il existe une fonction g : I −→ F telle que, pour tout a ∈ I, il existe un intervalle<br />
ouvert I(a) contenant a tel que la suite de fonctions (f ′ p) converge uniformément vers une fonction<br />
g : I −→ F sur I(a).<br />
Alors il existe une fonction f : I −→ F telle que pour tout a ∈ I la suite de fonctions (f p )<br />
converge uniformément vers f sur I(a) et l’on a<br />
k=0<br />
f ′ (t) = g(t) pour tout t ∈ I.<br />
54
3.3 Applications Strictement Différentiables<br />
Définition 3.3.1 Soit f : U −→ F une application définie sur un ouvert d’un espace normé E et<br />
à valeurs dans un espace normé F . On dit que f est strictement différentiable en a ∈ U s’il existe<br />
une application linéaire continue ϕ ∈ L(E, F ) telle que, pour tout ε > 0, il existe η > 0 tel que<br />
f − ϕ soit ε-Lipschitzienne sur B(a, η), ce qui signifie<br />
pour tout x, z ∈ B(a, η), ‖f(z) − f(x) − ϕ(z − x)‖ ≤ ε‖z − x‖.<br />
Une application strictement différentiable en a est différentiable en a et Df(a) = ϕ. Il suffit de<br />
remplacer x par a dans l’inégalité ci-dessus.<br />
Théorème 3.3.1 Soit f : U −→ F une application définie sur un ouvert d’un espace normé E et<br />
à valeurs dans un espace normé F . On suppose que f est différentiable sur U et que l’application<br />
Df est continue en a. Alors f est strictement différentiable en a.<br />
Démonstration. Posons g(x) = f(x) − f(a) − Df(a)(x − a). On a Dg(x) = Df(x) − Df(a).<br />
Utilisant la continuité de Df en a et pour tout ε > 0, il existe donc η > 0 tel que, pour tout<br />
y ∈ B(a, η)<br />
‖Dg(y)‖ ≤ ε.<br />
D’après le Corollaire 3.2.1 pour tout x, z ∈ B(a, η), on a<br />
d’où le résultat.<br />
‖f(z) − f(x) − Df(a)(z − x)‖ = ‖g(z) − g(x)‖<br />
≤<br />
≤<br />
sup ‖Dg(y)‖ × ‖z − x‖<br />
y∈B(a,η)<br />
ε‖z − x‖<br />
Il existe des applications strictement différentiable en un point sans que la différentielle soit<br />
continue en 0.<br />
Exemple 3.3.1 Introduisons la fonction paire h :] − 1, 1[−→ R définie par<br />
⎧<br />
⎨ 0 si x = 0<br />
h(x) =<br />
⎩<br />
(n + 1) −1 si x ∈ [(n + 1) −1 , n −1 [<br />
et posons pour x ∈] − 1, 1[<br />
f(x) =<br />
∫ x<br />
0<br />
h(t) dt.<br />
Soit ε > 0 et n ∈ N ∗ tel que n + 1 −1 ≤ εn −1 . Comme |h(t)| ≤ ε sur ]−ε, ε[, f est ε-Lipschitzienne<br />
sur ] − ε, ε[ ce qui montre que f est strictement différentiable en 0 avec f ′ (0) = 0 alors que f<br />
n’est pas dérivable aux points x = n −1 .<br />
55
On a cependant la<br />
Proposition 3.3.1 Soit f : U −→ F une application définie sur un ouvert d’un espace normé E<br />
et à valeurs dans un espace normé F . On suppose que f est différentiable sur U et strictement<br />
différentiable en a ∈ U. Alors Df est continue en a.<br />
Démonstration. Soit ε > 0 et η > 0 tel que h = f − Df(a) soit ε-Lipschitzienne sur B(a, η). Il<br />
résulte de la Proposition 3.2.1 que ‖Dh(x)‖ = ‖Df(x) − Df(a)‖ ≤ ε pour tout x ∈ B(a, η).<br />
3.4 Opérateurs de Nemicki<br />
Soit U un ouvert d’un espace normé E, f : U −→ F une application continue à valeurs dans<br />
un espace normé F et I un intervalle compact de R. On note C(I, E) l’ensemble des fonctions<br />
continues de I dans E et l’on munit cet ensemble de la norme ‖.‖ ∞ de la convergence uniforme.<br />
On définit<br />
Ω = {x ∈ C(I, E) : x(I) ⊂ U} (3.5)<br />
et on introduit<br />
définie pour tout x ∈ Ω par<br />
N f : Ω −→ C(I, F )<br />
N f (x) = f ◦ x.<br />
Théorème 3.4.1 L’ensemble Ω défini en 3.5 est ouvert dans C(I, E) et l’application N f est continue.<br />
Démonstration. a) Ω est ouvert. Soit x ∈ Ω. Pour tout z ∈ x(I), il existe η z > 0 tel que<br />
B(z, 2η z ) ⊂ U. Du fait de la compacité de x(I), il existe n ∈ N ∗ et z 1 , . . . , z n ∈ x(I) tels que<br />
Posons η = min 1≤i≤n η zi . On a<br />
x(I) ⊂<br />
n⋃<br />
B(z i , η zi ).<br />
i=1<br />
B(x, η) ⊂ Ω.<br />
En effet, soit z ∈ B(x, η) et t ∈ I. Il existe alors i ∈ [1, n] tel que x(t) ∈ B(z i , η zi ). On a<br />
‖z(t) − z i ‖ ≤ ‖z(t) − x(t)‖ + ‖x(t) − z i ‖ ≤ 2η zi ,<br />
ce qui montre que z(t) ∈ B(z i , 2η zi ) ⊂ U. On a donc bien z ⊂ Ω.<br />
b) N f est continue. Soit x ∈ Ω et ε > 0. Pour tout z ∈ x(I), il existe η z > 0 tel que pour tout<br />
y ∈ B(z, 2η z ) on ait ‖f(y) − f(z)‖ ≤ ε/2. Du fait de la compacité de x(I), il existe n ∈ N ∗ et<br />
z 1 , . . . , z n ∈ x(I) tels que<br />
n⋃<br />
x(I) ⊂ B(z i , η zi ).<br />
i=1<br />
56
Soit alors 0 < η ≤ min 1≤i≤n η zi assez petit pour que B(x, η) ⊂ Ω. Pour tout y ∈ B(x, η) et pour<br />
tout t ∈ I, il existe i ∈ [1, n] tel que x(t) ∈ B(z i , η zi ). On a<br />
‖y(t) − z i ‖ ≤ ‖y(t) − x(t)‖ + ‖x(t) − z i ‖ ≤ 2η zi ,<br />
‖x(t) − z i ‖ ≤ 2η zi ,<br />
d’où<br />
‖f(y(t) − f(x(t))‖ ≤ ‖f(y(t) − f(z i )‖ + ‖f(z i ) − f(x(t))‖ ≤ ε.<br />
On a alors<br />
d’où le résultat.<br />
‖N f (y) − N f (x)‖ ∞ = ‖f(y) − f(x)‖ ∞ = sup ‖f(y(t)) − f(x(t))‖ ≤ ε<br />
t∈I<br />
L’opérateur N f est alors appelé opérateur de Nemicki associé à f. On considère alors un ouvert<br />
U ⊂ R × E et f : U −→ F une application continue. On pose<br />
A = {x ∈ C(I, E) : (t, x(t)) ∈ U pour tout t ∈ I}.<br />
L’ensemble A est ouvert, (éventuellement vide). En effet on a A = L −1 (Ω) où<br />
Ω = {u ∈ C(I, R × E) : u(I)) ∈ U}<br />
et<br />
est définie par<br />
L : C(I, E) −→ C(I, R × E)<br />
L(x) = (Id R , x).<br />
Comme L est continue et Ω ouvert, il en est donc bien de même de A. Introduisons<br />
N f : A −→ C(I, F )<br />
définie par<br />
N f (x) = (N f ◦ L)(x),<br />
à savoir N f (x) = f(·, x(·)). L’application N f est alors continue comme composée de deux applications<br />
continues. Etudions alors la différentiabilité de N f .<br />
Théorème 3.4.2 Soit f : U −→ F continue telle que D 2 f existe et est continue sur U. Alors<br />
l’application N f est de classe C 1 sur A et pour tout x ∈ A, h ∈ C(I, E), t ∈ I,<br />
)<br />
(DN f (x)(h) (t) = D 2 f(t, x(t))(h(t)).<br />
57
Démonstration. D’après le Théorème 3.4.1, l’application<br />
N D2 f : A −→ C(I, L(E, F ))<br />
définie par<br />
N D2 f = N D2 f ◦ L<br />
est continue. Soit x ∈ A. Pour tout ε > 0, il existe donc η > 0 tel que ‖y − x‖ ∞ ≤ η implique<br />
y ∈ A et<br />
‖N D2 f(y) − N D2 f(x)‖ ∞ = sup ‖D 2 f(t, y(t)) − D 2 f(t, x(t))‖ L(E,F ) ≤ ε.<br />
t∈I<br />
Soit h ∈ C(I, E) tel que ‖h‖ ∞ < η, soit t ∈ I. Posons<br />
ϕ t (ξ) = f(t, x(t) + ξ) − f(t, x(t)) − D 2 f(t, x(t))(ξ).<br />
Remarquons que ϕ t (ξ) est défini et différentiable sur B(0, η) avec<br />
Dϕ t (ξ) = D 2 f(t, x(t) + ξ) − D 2 f(t, x(t)).<br />
D’où<br />
sup ‖Dϕ t (ξ)‖ ≤ sup ‖D 2 f(t, x(t) + ξ) − D 2 f(t, x(t))‖ ≤ ε.<br />
‖ξ‖
(M est fini comme borne supérieure d’une fonction continue sur un compact). Il en résulte que<br />
‖L(h)‖ ≤ M‖h‖,<br />
ce qui montre que L ∈ L(C(I, E), C(I, F )) et donc que N f est différentiable en x. Reste à montrer<br />
que DN f est continue. Pour tout x, y, pour tout h ∈ C(I, E) et pout tout t ∈ I, on a<br />
de telle sorte que<br />
donc<br />
‖((DN f (y) − DN f (x))(h))(t)‖ ≤ ‖D 2 f(t, y(t)) − D 2 f(t, x(t))‖ L(E,F ) ‖h(t)‖,<br />
‖(DN f (y) − DN f (x))(h)‖ ∞ ≤ sup ‖D 2 f(t, y(t)) − D 2 f(t, x(t))‖ L(E,F ) ‖h‖ ∞<br />
t∈I<br />
‖DN f (y) − DN f (x)‖ L(C(I,E),C(I,F )) ≤ sup ‖D 2 f(t, y(t)) − D 2 f(t, x(t))‖ L(E,F ) ,<br />
t∈I<br />
ce qui montre que<br />
‖DN f (y) − DN f (x)‖ L(C(I,E),C(I,F )) ≤ ‖N D2 f(y) − N D2 f(x)‖ ∞ ,<br />
ce qui achève la démonstration car N D2 f est continue.<br />
Le Théorème 3.4.2 a de nombreuses applications. Citons le<br />
Théorème 3.4.3 Soit I = [a, b] un intervalle compact. Soit E un espace normé, U ⊂ R × E un<br />
ouvert et f : U −→ R n une application continue. On pose<br />
A = {x ∈ C(I, E) : (t, x(t)) ∈ U pour tout t ∈ I}<br />
et on définit une application I f : A −→ R n par<br />
Alors,<br />
a) I f est continue sur A.<br />
I f (x) =<br />
∫ b<br />
a<br />
f(t, x(t)) dt.<br />
b) Si de plus D 2 f existe et est continue sur U, l’application I f est de classe C 1 sur A et, pour<br />
x ∈ A et h ∈ C(I, E)<br />
(DI f (x))(h) =<br />
∫ b<br />
a<br />
D 2 f(t, x(t))h(t) dt.<br />
59
Démonstration. a) Définissons<br />
par<br />
I : C(I, R n ) −→ R n<br />
I(z) =<br />
∫ b<br />
a<br />
z(t) dt.<br />
Il est clair que I est linéaire continue et que I f = I ◦ N f . On obtient donc bien que I f est continue<br />
comme composée de deux applications continues.<br />
b) D’après le Théorème 3.4.2 l’application N f est continuement différentiable. Il en est donc<br />
de même de I f . Pour x ∈ A et h ∈ C(I, E), on a<br />
(DI f (x)h) = (I ◦ DN f (x))(h) =<br />
∫ b<br />
a<br />
D 2 f(t, x(t))(h(t)) dt.<br />
Remarque 3.4.1 Dans le cas où U ⊃ I × V où V est un ouvert de E, le Théorème 3.4.1 montre<br />
que l’ensemble Ω = {x ∈ C(I, E) : x(I) ⊂ V } est ouvert dans C(I, E). Comme A ⊃ Ω , il en<br />
résulte que A est non vide.<br />
3.5 Primitives et Intégrales des Fonctions Réglées<br />
Définition 3.5.1<br />
a) Soit I un intervalle d’extrémités éventuellement infinies a et b et f : I −→ E une fonction<br />
à valeurs dans un espace de Banach E. On dit que f est une fonction en escalier sur I s’il existe<br />
une suite finie a = t 0 < · · · < t n = b telle que f soit constante sur chacun des intervalles ]t i , t i+1 [<br />
pour tout 0 ≤ i ≤ n − 1.<br />
b) On dit que f : I −→ E est une fonction réglée si elle admet une limite à droite et une limite<br />
à gauche en tout t ∈ I. (Une fonction en escalier est réglée, une fonction continue est réglée ainsi<br />
qu’une fonction monotone à valeurs dans R).<br />
Le résultat suivant caractérise l’ensemble des fonctions réglées sur un intervalle compact<br />
comme étant l’adhérence pour la topologie de la convergence uniforme de l’ensemble des fonctions<br />
en escalier<br />
Théorème 3.5.1 Soit I un intervalle compact et f : I −→ E une fonction à valeurs dans un<br />
espace de Banach E. Alors les deux propriétés suivantes sont équivalentes,<br />
i) f est une fonction réglée,<br />
ii) f est limite uniforme sur I d’une suite de fonctions en escalier.<br />
60
Démonstration<br />
i) =⇒ ii). Pour tout n ∈ N ∗ et pour tout t ∈ I il existe, par application du critère de Cauchy à<br />
droite et à gauche en t, un intervalle ouvert I(t) =]a(t), b(t)[ contenant t tel que<br />
‖f(s) − f(s ′ )‖ ≤ 1/n<br />
pour tout s, s ′ ∈ I∩]t, b(t)[ ou s, s ′ ∈ I∩]a(t), t)[. Par compacité il existe m ∈ N ∗ et t 1 , . . . , t m ∈ I<br />
tels que I ⊂ ⋃ m<br />
i=1 I(t i). Soit alors c 0 < c 1 < · · · < c k la suite telle que<br />
{c 0 , . . . , c k } = {a, b, t i , a(t i ), b(t i ) : 1 ≤ i ≤ m} ∩ I.<br />
Chaque c j appartient à un intervalle I(t i ). Si c j ∈]a(t i ), t i [ alors c j < c j+1 ≤ t i . Si c j ∈ [t i , b(t i )[,<br />
alors c j < c j+1 ≤ b(t i ). Dans tous les cas on a |f(s) − f(s ′ )| ≤ 1/n sur ]c j , c j+1 [∩I. Soit alors la<br />
fonction f n définie par<br />
f n (c j ) = f(c j ) si c j ∈ I,<br />
f n (t) = f(τ j ) si t ∈]c j , c j+1 [∩I où τ j ∈]c j , c j+1 [∩I.<br />
On a alors ‖f n − f‖ ∞ ≤ 1/n, d’où le résultat.<br />
ii) =⇒ i). Soit t ∈ I. Pour tout ɛ > 0 il existe n ∈ N tel que ‖f n − f‖ ∞ ≤ ɛ/3. La fonction f n<br />
étant en escalier, il existe η > 0 tel que f n prend des valeurs constantes sur chacun des intervalles<br />
]t, t + η[∩I et ]t − η, t[∩I. Pour tout s, s ′ ∈]t, t + η[∩I ou s, s ′ ∈]t − η, t[∩I, on a<br />
‖f(s ′ ) − f(s)‖ ≤ ‖f(s ′ ) − f n (s ′ )‖ + ‖f n (s ′ ) − f n (s)‖ + ‖f n (s ′ ) − f(s)‖ ≤ ɛ.<br />
Le critère de Cauchy est alors vérifié à droite et à gauche en t. Il en résulte bien l’existence de<br />
limites à droite et à gauche en t, l’espace E étant supposé complet. □<br />
Définition 3.5.2 Soit I ⊂ R un intervalle et f : I −→ E une fonction à valeurs dans un espace<br />
de Banach E. On dit que la fonction continue Φ : I −→ E est une primitive de f dans I s’il existe<br />
une partie au plus dénombrable D ⊂ I telle que Φ soit dérivable sur I \ D et telle que Φ ′ = f<br />
sur I \ D.<br />
Proposition 3.5.1 Soit I ⊂ R un intervalle et f : I −→ E une fonction à valeurs dans un espace<br />
de Banach E. Alors si Φ 1 et Φ 2 sont deux primitives de f sur I, Φ 1 − Φ 2 est constante sur I.<br />
Démonstration<br />
D’après la définition des primitives, il existe deux parties au plus dénombrables D 1 et D 2 de<br />
I telles que (Φ 1 − Φ 2 ) ′ = 0 sur I \ (D 1 ∪ D 2 ). Écrivons I comme réunion d’une suite croissante<br />
d’intervalles compacts I n . D’après le Corollaire 3.1.1 la fonction Φ 1 −Φ 2 est constante sur chaque<br />
I n donc sur I, (détaillez le raisonnement en exercice). □<br />
Lemme 3.5.1 Soit I un intervalle compact de R et soit f : I −→ E une fonction en escalier,<br />
alors f admet une primitive sur I.<br />
61
Démonstration<br />
Soient a < b les extrémités de I et soit t −1 = 0 et a = t 0 < · · · < t n = b telle que pour tout<br />
0 ≤ i ≤ n − 1 f(t) = c i sur l’intervalle ]t i , t i+1 [. Posons F (t) = c 0 (t − t 0 ) pour t ∈ [t 0 , t 1 ] et pour<br />
1 ≤ i ≤ n − 1 et t ∈ [t i , t i+1 ]<br />
∑i−1<br />
F (t) = c i (t − x i ) + c k (t k+1 − t k )<br />
Nous laissons au lecteur le soin de vérifier que F est continue et vérifie F ′ (t) = f(t) pour tout<br />
t ∈ I \ {t 0 , . . . , t n }. □<br />
Théorème 3.5.2 Soit I ⊂ R un intervalle et f : I −→ E une fonction réglée à valeurs dans un<br />
espace de Banach E. Alors f admet une primitive Φ dans I.<br />
Démonstration<br />
Remarquons que I s’écrit comme réunion croissante d’une suite (I n ) d’intervalles compacts.<br />
Soit t 0 ∈ int (I). Supposons démontré que f possède une primitive Φ n dans I n telle que Φ n (t 0 ) =<br />
0. On observe alors que si m ≥ n, on a Φ m | ∣ = Φ n . En effet ces deux primitives d’une même<br />
n<br />
fonction différent d’une constante d’après la Proposition 3.5.1. Comme elles sont égales en t 0<br />
elles coïncident sur I n . On définit alors sans ambiguïté une primitive Φ de f par Φ(t) = Φ n (t) si<br />
t ∈ I n .<br />
On peut donc supposer I compact. D’après le Théorème 3.5.1 f est limite uniforme dans I<br />
d’une suite de fonctions en escalier (f n ). Soit Φ n une primitive de f n et D n ⊂ I telle que Φ ′ n = f n<br />
sur I \ D n . Choisissons Φ n telle que Φ n (t 0 ) = 0 où t 0 ∈ I. On peut alors appliquer le Théorème<br />
3.2.2 qui nous permet de conclure que la suite (Φ n ) converge uniformément vers une fonction Φ<br />
telle que Φ ′ = f sur l’ensemble I \ D où D = ⋃ n≥0 D n est au plus dénombrable, ce qui achève<br />
la démonstration. □<br />
On peut alors définir l’intégrale d’une fonction réglée définie sur un intervalle I et à valeurs<br />
dans un espace de Banach. Pour cette intégrale une primitive de fonction réglée est l’intégrale de<br />
sa dérivée.<br />
Théorème 3.5.3 THÉORÈME ET DÉFINITION<br />
Soit I ⊂ R un intervalle et f : I −→ E une fonction réglée à valeurs dans un espace de<br />
Banach E. On pose, pour tout a, b ∈ I (on ne suppose pas a ≤ b)<br />
∫ b<br />
a<br />
k=0<br />
f(t)dt = Φ(b) − Φ(a)<br />
où Φ est une primitive de f dont l’existence est garantie par le Théorème 3.5.2. On a alors<br />
∥<br />
∫ b<br />
a<br />
f(t)dt∥ ≤ ∣<br />
∫ b<br />
a<br />
∣<br />
‖f(t)‖dt∣.<br />
62
Démonstration<br />
La définition de ∫ b<br />
f(t)dt ne dépend pas de la primitive Φ car d’après la Proposition 3.5.1,<br />
a<br />
deux primitives d’une même fonction différent d’une constante. Pour démontrer l’inégalité<br />
∥<br />
∫ b<br />
a<br />
f(t)dt∥ ≤ ∣<br />
∫ b<br />
a<br />
‖f(t)‖dt∣<br />
on suppose a ≤ b. Soit Φ la primitive de f telle que φ(a) = 0. On a, pour tout t ∈ [a, b]<br />
Φ(t) =<br />
∫ t<br />
a<br />
f(s)ds.<br />
Il existe alors une partie au plus dénombrable D ⊂ [a, b] telle que sur [a, b] \ D,<br />
Φ ′ (t) = f(t),<br />
d’où ‖Φ ′ (t)‖ = ‖f(t)‖. Remarquons que la fonction ‖f(.)‖ est réglée car la norme est continue.<br />
Il existe donc ∆ ⊂ [a, b] au plus dénombrable telle que G ′ (t) = ‖f(t)‖ où G(t) = ∫ t<br />
‖g(s)‖ds.<br />
a<br />
Pour t ∈ [a, b] \ (D ∪ ∆) on a donc<br />
D’après le Théorème 3.1.1 on obtient<br />
d’où<br />
Remarque 3.5.1<br />
‖Φ ′ (t)‖ ≤ G ′ (t).<br />
‖F (b) − F (a)‖ ≤ G(b) − G(a),<br />
∥<br />
∫ b<br />
a<br />
f(t)dt∥ ≤<br />
∫ b<br />
a<br />
‖f(t)‖dt. □<br />
a) Soit I = [a, b], f : I −→ E une fonction en escalier à valeurs dans un espace de Banach<br />
E et soient a = t 0 < · · · < t n = b telle que f(t) = c i sur ]t i , t i+1 [. On sait que la fonction<br />
Φ : I −→ E définie par Φ(t) = c 0 (t − t 0 ) si t ∈ [t 0 , t 1 ] et<br />
∑i−1<br />
Φ(t) = c i (t − t i ) + c k (t k+1 − t k )<br />
k=0<br />
si t ∈ [t i , t i+1 ] est une primitive de f sur [a, b]. On a donc<br />
∫ b<br />
a<br />
∑n−2<br />
f(t)dt = Φ(b) − Φ(a) = c n−1 (t n − t n−1 ) + c k (t k+1 − t k )<br />
k=0<br />
d’où<br />
∫ b<br />
∑n−1<br />
f(t)dt = c k (t k+1 − t k ).<br />
a<br />
k=0<br />
63
) Il est important d’observer que si f : [a, b] −→ E est une fonction réglée, la fonction<br />
Φ : [a, b] → E définie par<br />
est une primitive de f sur [a, b].<br />
Φ(t) =<br />
∫ t<br />
a<br />
f(s)ds<br />
c) Si f : I −→ E est continue on a, pour toute primitive Φ de f<br />
Φ ′ (t) = f(t) pour tout t ∈ I.<br />
En effet on peut supposer que Φ(t) = ∫ t<br />
t 0<br />
f(s)ds pour un certain t 0 ∈ I. Il en résulte donc que<br />
‖Φ(t + h) − Φ(t) − hf(t)‖ =<br />
≤<br />
∥<br />
∣<br />
∫ t+h<br />
t<br />
∫ t+h<br />
t<br />
(f(s) − f(t))ds∥<br />
∣<br />
‖f(s) − f(t)‖ds∣.<br />
Etant donné ɛ > 0 il existe η > 0 tel que |s − t| ≤ η implique ‖f(s) − f(t)‖ ≤ ɛ. On a donc, pour<br />
|s − t| ≤ η<br />
∫ t+h<br />
‖Φ(t + h) − Φ(t) − hf(t)‖ ≤ ∣ ɛds∣ = ɛ|h|,<br />
d’où le résultat.<br />
Théorème 3.5.4 Soit I ⊂ R un intervalle et g : I −→ E une fonction à valeurs dans un espace<br />
de Banach E qui est primitive d’une fonction réglée. (Cela signifie que g est continue, qu’il existe<br />
une fonction réglée g ′ telle que la dérivée de g en t soit égale à g ′ (t) pour tout t ∈ I \ D où D ⊂ I<br />
est au plus dénombrable). Alors, pour tout t 0 , t ∈ I<br />
Démonstration<br />
Comme g ′ est réglée, la fonction<br />
g(t) = g(t 0 ) +<br />
γ(t) = g(t 0 ) +<br />
∫ t<br />
t<br />
t 0<br />
g ′ (s)ds.<br />
∫ t<br />
t 0<br />
g ′ (s)ds<br />
est une primitive de g ′ sur [a, b]. Comme g est aussi une primitive de g ′ et que g(t 0 ) = γ(t 0 ) on a<br />
g(.) = γ(.) sur I, ce qui achève la démonstration. □<br />
Nous laissons au lecteur le soin d’établir les règles de calcul pour cette intégrale. Nous donnons<br />
cependant le résultat utile suivant qui permet d’établir un lien entre l’intégrale de la limite et la<br />
limite des intégrales.<br />
64
Théorème 3.5.5 Soit I = [a, b] un intervalle compact et soit f n : I −→ F une suite de fonctions<br />
réglées à valeurs dans un espace de Banach F . On suppose que (f n ) converge uniformément vers<br />
f dans I. Alors f est réglée dans I et<br />
∫ b<br />
lim<br />
n→∞<br />
a<br />
f n (t)dt =<br />
∫ b<br />
a<br />
f(t)dt.<br />
Démonstration<br />
La fonction f est réglée. En effet, d’après le Théorème 3.5.1 pour tout n ∈ N, il existe une<br />
fonction ϕ n en escalier dans I telle que<br />
‖ϕ n − f n ‖ ≤ 1/n.<br />
La suite (ϕ n ) converge donc uniformément vers f dans I, ce qui montre, utilisant de nouveau le<br />
Théorème 3.5.1 que f est réglée dans I. On a alors<br />
∥<br />
∫ b<br />
a<br />
d’où le résultat. □<br />
f n (s)ds −<br />
∫ b<br />
a<br />
f(s)ds∥ ≤<br />
∫ b<br />
a<br />
‖f n (s) − f(s)‖ds ≤ (b − a)‖f n − f‖ ∞<br />
Théorème 3.5.6 Soient F , G des espaces de Banach, soit I = [a, b] un intervalle compact, soit<br />
f : I −→ F une fonction réglée et soit u ∈ L(F, G). Alors u ◦ f est réglée et<br />
( ∫ b<br />
u<br />
a<br />
)<br />
f(t)dt) =<br />
∫ b<br />
a<br />
u(f(t))dt.<br />
Démonstration<br />
Le fait que u ◦ f soit réglée découle de la continuité de u. Supposons que f est en escalier, il<br />
en est alors de même de u ◦ f. On a alors<br />
∫ b<br />
a<br />
( ∫ b<br />
u<br />
a<br />
f(t)dt =<br />
)<br />
f(t)dt<br />
=<br />
=<br />
∑n−1<br />
c k (t k+1 − t k ),<br />
k=0<br />
n−1<br />
∑<br />
u(c k )(t k+1 − t k )<br />
k=0<br />
∫ b<br />
a<br />
u(f(t))dt.<br />
Revenons au cas général. Il existe une suite (f n ) de fonctions en escalier qui converge uniformément<br />
vers f sur I. Comme, pour tout n ∈ N et pour tout t ∈ I, on a<br />
‖u(f n (t)) − u(f(t))‖ ≤ ‖u‖‖f n (t)) − (f(t)‖,<br />
65
la suite de fonctions en escalier (u ◦ f n ) converge uniformément vers u ◦ f sur I. Utilisant le<br />
Théorème 3.5.5, il vient<br />
∫ b<br />
a<br />
( ∫ b<br />
u(f(t))dt = lim<br />
n→∞<br />
= lim<br />
= u<br />
a<br />
u<br />
n→∞<br />
a<br />
( ∫ b<br />
lim<br />
n→∞<br />
a<br />
( ∫ b )<br />
= u f(t)dt<br />
d’après le Théorème 3.5.5, d’où le résultat. □<br />
Exemple 3.5.1<br />
a<br />
)<br />
u(f n (t))dt<br />
( ∫ b )<br />
(f n (t))dt car f n est en escalier,<br />
)<br />
(f n (t))dt car u est continue,<br />
a) Dans le cas où F = R n , G = R, i ∈ [1, n], u(x 1 , . . . , x n ) = x i et f(t) = (f 1 (t), . . . , f n (t)),<br />
on a<br />
( ∫ b ) ∫ b<br />
f(t)dt = f i (t)dt, et donc<br />
a<br />
i a<br />
∫ b ( ∫ b<br />
∫ b )<br />
f(t)dt = f 1 (t)dt, . . . , f n (t)dt .<br />
a<br />
a<br />
b) Dans le cas où u : L(E, F ) → F est définie par u(A) = A(h), h étant un élément fixé de<br />
E (vérifiez que u ∈ L(L(E, F ), F )) et si A : I → L(E, F ) est réglée, le Théorème 3.5.6 conduit<br />
à<br />
∫ b<br />
( ∫ b )<br />
A(t)(h)dt = A(t)dt (h).<br />
a<br />
a<br />
a<br />
66
Chapitre 4<br />
Différentielles d’Ordre Supérieur<br />
4.1 Définition des Différentielles d’Ordre Supérieur<br />
Soit f : U −→ F différentiable sur U et a ∈ U. Il est naturel de s’intéresser à la différentiabilité<br />
en a de l’application<br />
Df : U −→ L(E, F ).<br />
Rappellons qu’étant donnés des espaces normés E et F et un entier p ∈ N, on désigne par<br />
L p (E; F ) l’ensemble des applications de E p dans F qui sont multilinéaires (i.e. linéaires par<br />
rapport à chaque variable) et continues. On définit alors par récurrence la différentielle d’ordre p<br />
d’une application f : U −→ F .<br />
Définition 4.1.1 Soit f : U −→ F et p ≥ 2 un entier. On dit que f est p fois différentiable en<br />
a ∈ U si D p−1 f(x) ∈ L p−1 (E; F ) existe dans un voisinage V ⊂ U de a et si l’application<br />
D p−1 f : V −→ L p−1 (E; F )<br />
est différentiable en a. Pour tout u = (u 1 , · · · , u p ) ∈ E p on pose alors<br />
On a alors D p f(a) ∈ L p (E; F ).<br />
D p f(a)(u 1 , · · · , u p ) = (D(D p−1 f)(a)(u 1 ))(u 2 , · · · , u p ).<br />
On vérifie que cette définition est bien cohérente : on a D(D p−1 f)(a) ∈ L(E, L p−1 (E; F )), donc<br />
D(D p−1 f)(a)(u 1 ) ∈ L p−1 (E; F ) et (D(D p−1 f)(a)(u 1 ))(u 2 , · · · , u p ) ∈ F . Il est clair que D p f(a)<br />
est multilinéaire. Le fait que D p f(a) soit continue découle des inégalités suivantes<br />
‖D p f(a)(u 1 , · · · , u p )‖ ≤ ‖D(D p−1 f)(a)(u 1 )‖ L p−1 (E;F )‖u 2 ‖ · · · ‖u p ‖<br />
≤<br />
‖D(D p−1 f)(a)‖ L(E,L p−1 (E;F )‖u 1 ‖‖u 2 ‖ · · · ‖u p ‖.<br />
Remarque 4.1.1 On a vu au Théorème 1.5.2 que l’application<br />
Φ : L(E, L p−1 (E; F )) −→ L p (E; F )<br />
définie pour g ∈ L(E, L p−1 (E; F )) et (x 1 , · · · , x p ) ∈ E p par<br />
Φ(g)(x 1 , · · · , x p ) = g(x 1 )(x 2 , · · · , x p )<br />
67
est une isométrie linéaire de L(E, L p−1 (E; F )) dans L p (E; F ) et l’isométrie réciproque<br />
Ψ : L p (E; F ) → L(E, L p−1 (E; F ))<br />
est définie, pour tout f ∈ L p (E; F ), x ∈ E et (x 1 , · · · , x p−1 ) ∈ E p−1 par<br />
Ψ(f)(x)(x 1 , · · · , x p−1 ) = f(x, x 1 , · · · , x p−1 ).<br />
Avec ces notations, on a, si f est p fois différentiable en a,<br />
Ψ(D p f(a)) = D(D p−1 f)(a), (4.1)<br />
et<br />
Φ(D(D p−1 f)(a)) = D p f(a). (4.2)<br />
Si de plus f est p fois différentiable dans un voisinage V de a, alors<br />
D(D p−1 f) = Ψ ◦ D p f sur V,<br />
et<br />
D p f = Φ ◦ D(D p−1 f) sur V.<br />
Dans le cas où f est définie sur un intervalle ouvert de R, il est utile de faire le lien entre différentielle<br />
d’ordre p et dérivée d’ordre p.<br />
Définition 4.1.2 Soit f : I −→ E une fonction définie sur un intervalle ouvert I de R et p ∈ N ∗ .<br />
On dit que f est p fois dérivable en a ∈ I si f (p−1) existe au voisinage de a et est dérivable en a.<br />
On pose alors f (p) = (f (p−1) ) ′ .<br />
Proposition 4.1.1 Soit f : I −→ E une fonction définie sur un intervalle ouvert I de R. Alors<br />
f est p fois dérivable en a si et seulement si f est p fois différentiable en a. De plus pour tout<br />
(u 1 , · · · , u p ) ∈ R p on a<br />
D p f(a)(u 1 , · · · , u p ) = u 1 · · · u p f (p) (a) (4.3)<br />
et<br />
f (p) (a) = D p f(a)(1, · · · , 1). (4.4)<br />
Démonstration. Par récurrence sur p. Pour p = 1, c’est le Théorème 2.1.1 du Chapitre 2. Supposons<br />
le résultat à l’ordre p. Les relations (4.3) et (4.4) peuvent s’ecrire<br />
D p f = α ◦ f (p) et f (p) = e ◦ D p f,<br />
où α : E −→ L p (R; E) et e : L p (R; E) −→ E sont les applications linéaires continues définies<br />
pour tout x ∈ E, t 1 , · · · , t p ∈ R p , A ∈ L p (R; E) par α(x)(t 1 , · · · , t p ) = t 1 · · · t p x et e(A) =<br />
A(1, · · · , 1). Le résultat découle alors des Théorèmes 2.1.1 et 2.2.1 du chapitre 2. On obtient que<br />
D p f est différentiable en a et que<br />
D(D p f)(a) = α ◦ Df (p) (a),<br />
68
d’où<br />
D p+1 f(a)(u 1 , · · · , u p+1 ) = ((D(D p f)(a))(u 1 ))(u 2 , · · · , u p+1 )<br />
= α(u 1 f (p+1) (u 2 , · · · , u p+1 )<br />
et que f (p) est dérivable en a avec<br />
= u 1 · · · u p+1 f (p+1) (a),<br />
f (p+1) (a) = e((D p f) ′ (a))<br />
= e(D(D p f)(a)(1))<br />
= (D(D p f)(a)(1))(1, · · · , 1)<br />
= D p+1 f(a)(1, · · · , 1).<br />
Définition 4.1.3 On dit que f est de classe C p sur U si D p f existe sur U et si l’application<br />
D p f : U −→ L p (E; F ) est continue. On dit que f est de classe C ∞ si f est de classe C p pour tout<br />
p ∈ N ∗ .<br />
Un exemple simple de fonction de classe C ∞ est fourni par la :<br />
Proposition 4.1.2 Soit f ∈ L 2 (E, F ; G) une application bilinéaire continue, alors f est de classe<br />
C ∞ et D p f = 0 pour tout p > 2.<br />
Démonstration. On sait (voir chapitre 2, exemple 2.1.1, c)) que f est différentiable sur E × F et<br />
que pour tout (x 1 , x 2 ) ∈ E 2 , (u, v) ∈ E 2<br />
Df(x 1 , x 2 )(u, v) = f(x 1 , v) + f(u, x 2 ).<br />
Il en résulte aisément que Df : E × E −→ L(E × E, F ) est linéaire continue (le vérifier). On<br />
en déduit que D(Df)(x 1 , x 2 ) = Df pour tout (x 1 , x 2 ) ∈ E × F donc l’application D 2 f(.) est<br />
constante ce qui implique bien D p f = 0 pour p > 2.<br />
Proposition 4.1.3 Soient U ⊂ E, V ⊂ F des ouverts, soient f : U −→ V 2 fois différentiable en<br />
a ∈ U et g : V −→ G et g 2 fois différentiable en b = f(a). Alors g ◦ f est 2 fois différentiable en<br />
a.<br />
69
Démonstration. Définissons Φ : L(F, G) × L(E, F ) −→ L(E, G) par Φ(A, B) = A ◦ B.<br />
L’application Φ est bilinéaire et comme ‖Φ(A, B)‖ ≤ ‖A‖‖B‖, elle est continue. Utilisant le<br />
Théorème 2.2.1 du chapitre 2, on a, pour tout x voisin de a<br />
ce que l’on peut écrire<br />
D(g ◦ f)(x) = Dg(f(x)) ◦ Df(x),<br />
D(g ◦ f) = Φ ◦ Θ<br />
avec Θ = (Dg ◦ f, Df). On remarque que Θ est différentiable en a car ses deux composantes le<br />
sont, et que Φ est de classe C ∞ (voir Proposition 4.1.2). On obtient donc bien que D(g ◦ f) est<br />
différentiable en a donc g ◦ f est deux fois différentiable en a.<br />
Les propositions suivante sont utiles pour le calcul des différentielles d’ordre supérieur.<br />
Proposition 4.1.4 Soit f : U −→ F une application p fois différentiable en a ∈ U. Posons, pour<br />
x dans un voisinage de a et pour tout u 2 , · · · , u p ∈ E p−1 ,<br />
g(x) = D p−1 f(x)(u 2 , · · · , u p ).<br />
Alors g est différentiable en a et, pour tout u 1 ∈ E, on a<br />
D p f(a)(u 1 , · · · , u p ) = Dg(a)(u 1 ).<br />
Démonstration. On a g = e ◦ D p−1 f où e : L p−1 (E; F ) −→ F est définie par e(A) =<br />
A(u 2 , · · · , u p ). L’application e est linéaire. De plus ‖e(A)‖ ≤ ‖A‖‖u 2 ‖ · · · ‖u p ‖ donc A est continue.<br />
Il en résulte que g est différentiable en a et que pour tout u 1 ∈ E<br />
Dg(a)(u 1 ) = e(D(D p−1 f)(a)(u 1 ))<br />
= (D(D p−1 )f(a)(u 1 ))(u 2 , · · · , u p )<br />
= D p f(a)(u 1 , · · · , u p ).<br />
Proposition 4.1.5 a) Si f : U −→ F est p fois différentiable en a ∈ U, on a pour tout u ∈ E,<br />
v ∈ E p−1 ,<br />
D p f(a)(u, v) = ϕ ′ (0),<br />
où ϕ(t) = D p−1 f(a + tu)(v).<br />
b) Si f est p fois différentiable en a + tu ∈ U avec u ∈ E et t ∈ R, alors<br />
où ψ(t) = f(a + tu).<br />
D p f(a + tu)(u, · · · , u) = ψ (p) (t),<br />
70
Démonstration. a) On a ϕ = (e ◦ g)(a + tu) avec e(A) = A(v) pour A ∈ L p−1 (E; F ) est linéaire<br />
et continue et g(x) = D p−1 f(x) donc g est différentiable an a et<br />
Dg(a)(u) = D p f(a)(u, ·).<br />
On obtient donc que e ◦ g est différentiable en a, donc ϕ est dérivable en 0 et<br />
ϕ ′ (0) = D(e ◦ g)(a)(u) = e(Dg(a)(u)) = D p f(a)(u, v).<br />
b) Remarquons que ψ est définie dans un intervalle ouvert contenant t. Pour p = 1, ψ est<br />
dérivable en t car f est différentiable en a + tu et t ↦−→ a + tu est dérivable sur R, et, d’après la<br />
règle de la différentielle d’une composée, on a<br />
ψ ′ (t) = Df(a + tu)(u).<br />
Supposons le résultat vrai pour p et considérons f supposée p + 1 fois différentiable en a + tu. Il<br />
en résulte que f est p fois différentiable dans un voisinage de a + tu. Par hypothèse de récurrence,<br />
on obtient donc que la fonction ψ est p fois dérivable au voisinage de t et que<br />
ψ (p) (s) = D p f(a + su)(u, · · · , u),<br />
pour tout s voisin de t. Posant g(x) = D p f(x)(u, · · · , u), on a donc<br />
ψ (p) (s) = g(a + su),<br />
et g est différentiable en a + tu d’après la Proposition 4.1.4. On obtient alors, utilisant de nouveau<br />
la Proposition 4.1.4, que<br />
ce qui donne le résultat au rang p + 1.<br />
ψ (p+1) (t) = Dg(a + su)(u) = D p+1 f(a + tu)(u, · · · , u).<br />
4.2 Propriétés de Symétrie des Différentielles d’Ordre Supérieur<br />
Le résultat suivant (Théorème de SCHWARZ) est fondamental.<br />
Théorème 4.2.1 Soit f : U −→ F une application deux fois différentiable en a ∈ U. Alors pour<br />
tout u, v ∈ E<br />
D 2 f(a)(u, v) = D 2 f(a)(v, u).<br />
Démonstration. Soit ε > 0, utilisant la définition de la différentiabilité de Df en a, il existe δ > 0<br />
tel que<br />
‖Df(a + w) − Df(a) − D(Df)(a)(w)‖ L(E,F ) ≤ ε‖w‖,<br />
71
pour tout w tel que ‖w‖ ≤ δ. Posons, pour tout ‖u‖ ≤ δ/2 et ‖v‖ ≤ δ/2,<br />
G u (v) = f(a + u + v) − f(a + v) − f(a + u) + f(a) − (D(Df)(a)(u))(v).<br />
On a DG u (v) = Df(a + u + v) − Df(a + v) − D(Df)(a)(u) donc<br />
DG u (v) = Df(a+u+v)−Df(a)−D(Df)(a)(u+v)−(Df(a+v)−Df(a)−D(Df)(a)(v)).<br />
On a donc<br />
‖DG u (v)‖ L(E,F ) ≤ ε(‖u‖ + ‖v‖) + ε‖v‖ ≤ 2ε(‖u‖ + ‖v‖).<br />
Utilisant le corollaire 3.2.1 avec C = ¯B(0, ‖v‖), il en résulte que, pour tout ‖u‖ ≤ δ/2 et ‖v‖ ≤<br />
δ/2,<br />
‖G u (v)‖ = ‖G u (v) − G u (0)‖ ≤ ‖v‖<br />
On a alors<br />
sup<br />
‖w‖≤‖v‖<br />
‖DG u (w)‖ L(E,F ) ≤<br />
2‖v‖ε(‖u‖ + ‖v‖) ≤ 2ε(‖u‖ + ‖v‖) 2 .<br />
f(a + u + v) − f(a + v) − f(a + u) + f(a) − (D(Df)(a)(u))(v) = o(‖u‖ + ‖v‖) 2<br />
Soient alors u, v ∈ E, pour tout t assez petit, on a donc<br />
d’où<br />
f(a + tu + tv) − f(a + tv) − f(a + tu) + f(a) − t 2 (D(Df)(a)(u))(v) = o(t 2 ),<br />
f(a + tu + tv) − f(a + tv) − f(a + tu) + f(a)<br />
(D(Df)(a)(u))(v) = lim<br />
.<br />
t→0 t 2<br />
Comme le membre de droite ne change pas quand on permute u et v, il en est de même du membre<br />
de gauche donc (D(Df)(a)(u))(v) = (D(Df)(a)(v))(u), soit D 2 f(a)(u, v) = D 2 f(a)(v, u).<br />
Les propriétés de symétrie de la différentielle seconde s’étendent aux différentiellles d’ordre p.<br />
Théorème 4.2.2 Soit f : U −→ F une application p fois différentiable en a ∈ U. Alors, pour<br />
tout (u 1 , · · · , u p ) ∈ E p et pour toute permutation σ de [1, · · · , p], on a<br />
D p f(a)(u σ(1) , · · · , u σ(p) ) = D p f(a)(u 1 , · · · , u p ).<br />
Démonstration. Il suffit de démontrer le résultat pour une transposition σ i,j<br />
⎧<br />
⎨ k si k ∉ {i, j}<br />
σ i,j (k) = i si k = j,<br />
⎩<br />
j si k = i<br />
car toute permutation de [1, p] est produit d’un nombre fini de telles transpositions. Procédons par<br />
récurrence sur p. Pour p = 2 le résultat est démontré (Théorème 4.2.1). Supposons alors le résultat<br />
vrai pour tout 2 ≤ k ≤ p − 1 avec p ≥ 3.<br />
72
Si {i, j} = {1, 2}. Soient (u 3 , · · · , u p ) ∈ E p−2 et soit g(x) = D p−2 f(x)(u 3 , · · · , u p ). L’application<br />
g définie au voisinage de a est 2 fois différentiable au voisinage de a grâce à la Proposition<br />
4.1.3 car g = e ◦ D p−2 f avec e : L p−2 (E; F ) −→ F linéaire continue définie par<br />
e(A) = A(u 3 , · · · , u p ). D’après la Proposition 4.1.4, on a pour tout u 2 ∈ E,<br />
et, appliquant de nouveau la Proposition 4.1.4,<br />
Dg(x)(u 2 ) = D p−1 f(x)(u 2 , · · · , u p ),<br />
D 2 g(a)(u 2 , u 1 ) = D p f(a)(u 1 , u 2 , · · · , u p ).<br />
D’après le Theorème 4.2.1, on obtient donc que D 2 g(a)(u 2 , u 1 ) = D 2 g(a)(u 1 , u 2 ), soit<br />
D p f(a)(u 1 , u 2 , · · · , u p ) = D p f(a)(u 2 , u 1 , · · · , u p ). (4.5)<br />
Si i, j ∈ {3, · · · , n}, on utilise de nouveau l’application<br />
Par hypothèse de récurrence, on a<br />
où σ = σ i,j . On obtient bien alors<br />
g(x) = D p−2 f(x)(u 3 , · · · , u p ).<br />
g(x) = D p−2 f(x)(u σ(3) , · · · , u σ(p) ),<br />
D p f(a)(u 1 , u 2 , u 3 , · · · , u p ) = D p f(a)(u σ(1) , u σ(2) , u σ(3) , · · · , u σ(p) ).<br />
Si i = 1, j ∈ {3, · · · , n}, on pose g(x) = D p−1 f(x)(u 2 , · · · , u j , · · · , u p ) et on a g(x) =<br />
D p−1 f(x)(u j , u 2 , · · · , u p ) par hypothèse de récurrence. On calcule alors Dg(a)(u 1 ) à l’aide des<br />
deux expressions de g et on obtient que l’on peut échanger j et 2. Ensuite on échange j et 1 comme<br />
dans (4.5) puis 1 et 2. Enfin si i = 2, j ∈ {3, · · · , n}, on peut échanger 1 et 2 comme dans (4.5) et<br />
on est ramené au cas précédent.<br />
La proposition suivante est importante. Si sa conclusion coule de source, il n’en est pas de même<br />
de sa démonstration.<br />
Proposition 4.2.1 Soient p, q ∈ N ∗ des entiers et soit f : U −→ F une application q + p fois<br />
différentiable en a ∈ U. Alors D p f est q fois différentiable en a, et pour tout (u 1 , · · · , u q ) ∈ E q et<br />
(v 1 , · · · , v p ) ∈ E p , on a<br />
(D q (D p f)(a)(u 1 , · · · , u q ))(v 1 , · · · , v p ) = D q+p f(a)(u 1 , · · · , u q , v 1 , · · · , v p ).<br />
Démonstration. Par récurrence sur q. Pour q = 1, c’est la définition de D p+1 f. Supposons la<br />
propriété vraie à l’ordre q et considérons f supposée q + 1 + p fois différentiable en a. Comme f<br />
est q + p fois différentiable au voisinage de a, l’ hypothèse de récurrence nous dit que<br />
(D q (D p f)(x)(u 1 , · · · , u q ))(v 1 , · · · , v p ) = D q+p f(x)(u 1 , · · · , u q , v 1 , · · · , v p ),<br />
73
pour tout x voisin de a. Cela s’écrit<br />
D q (D p f) = Ψ ◦ D q+p f,<br />
avec Ψ : L p+q (E; F ) −→ L q (E; L p (E; F )) linéaire continue (le vérifier) définie par<br />
(Ψ(A)(u 1 , · · · , u q ))(v 1 , · · · , v p ) = A(u 1 , · · · , u q , v 1 , · · · , v p )<br />
pour tout A ∈ L p+q (E; F ), (u 1 , · · · , u q ) ∈ E q et (v 1 , · · · , v p ) ∈ E p . Comme Ψ et D q+p f sont<br />
différentiables en a, on obtient que D q (D p f) est différentiable en a donc D p f est q + 1 fois<br />
différentiable en a.<br />
Posant alors g(x) = D q+p f(x)(u 1 , · · · , u q , v 1 , · · · , v p ), on a, utilisant la Proposition 4.1.4 et la<br />
symétrie de D q+p+1 f(a)<br />
Dg(a)(u q+1 ) = D q+p+1 f(a)(u 1 , · · · , u q , u q+1 , v 1 , · · · , v p ), (4.6)<br />
pour tout u q+1 ∈ E. Par ailleurs, on a g = e ◦ Φ avec e : L p (E; F ) −→ F linéaire continue définie<br />
par e(A) = A(v 1 , · · · , v p ) et Φ : U −→ L p (E; F ) définie par Φ(x) = (D q (D p f)(x))(u 1 , · · · , u q ).<br />
On a alors, appliquant la Proposition 4.1.4 à D p f, et utilisant la symétrie des différentielles d’ordre<br />
supérieur,<br />
DΦ(a)(u q+1 ) = D q+1 (D p f)(a)(u 1 , · · · , u q , u q+1 )<br />
et<br />
Dg(a)(u q+1 ) = e(DΦ(a)(u q+1 )) = (D q+1 (D p f)(a)(u 1 , · · · , u q , u q+1 ))(v 1 , · · · , v p ),<br />
ce qui joint à (4.6) montre la propriété au rang q + 1.<br />
Nous aurons besoin du résultat suivant.<br />
Proposition 4.2.2 Soit f : U −→ F 1 × · · · × F m avec f = (f 1 , · · · , f m ).<br />
a) On suppose que f 1 , · · · , f m sont p fois différentiables en a ∈ U. Alors f est p fois différentiable<br />
en a, et on a, pour tout (u 1 , · · · , u p ) ∈ E p ,<br />
D p f(a)(u 1 , · · · , u p ) = (D p f 1 (a)(u 1 , · · · , u p ), · · · , D p f m (a)(u 1 , · · · , u p )).<br />
b) Si f 1 , · · · , f m sont de classe C p sur U, alors f est de classe C p sur U.<br />
Démonstration. a) par récurrence sur p. Pour p = 1, le résultat découle du Théorème 2.3.1.<br />
Supposons la propriété vraie à l’ordre p. On a D p f = (D p f 1 , · · · , D p f m ) au voisinage de a, et<br />
D p f 1 , · · · , D p f m sont différentiables en a. Appliquant de nouveau le Théorème 2.3.1 on obtient<br />
que f est p + 1 fois différentiable en a avec D p+1 f(a) = (D p+1 f 1 (a), · · · , D p+1 f m (a))<br />
b) Démonstration analogue.<br />
74
Théorème 4.2.3 Soit f : U −→ V et g : V −→ G deux applications telles que f(U) ⊂ V où U<br />
et V sont des ouverts d’espaces normés E, F et G est un espace normé.<br />
a) Si f est p fois différentiable en a ∈ U et si g est p fois différentiable en b = f(a) ∈ V , alors<br />
g ◦ f est p fois différentiable en a.<br />
b) Si f est de classe C p sur U et si g est de classe C p sur V , alors g ◦ f est de classe C p sur U.<br />
Démonstration. a) Procédons par récurrence sur p. Pour p = 1 le résultat est vrai. Supposons le<br />
résultat vrai à l’ordre p − 1. On a, dans un voisinage W de a<br />
D(g ◦ f)(x) = Dg(f(x) ◦ Df(x) = Φ(A(x), B(x))<br />
où A : U −→ L(F, G) et B : U −→ L(E, F ) sont définis par A(x) = (Dg ◦ f)(x), B(x) =<br />
Df(x) et<br />
Φ : L(F, G) × L(E, F ) −→ L(E, G)<br />
est définie par Φ(A, B) = A ◦ B. Or Dg et f sont p − 1 fois différentiables en a (utiliser la<br />
Proposition 4.2.1), donc il en est de même de A = Dg ◦ f, de B = Df (utiliser les Propriétés<br />
4.2.1 et 4.2.2) et de (A, B) (Proposition 4.2.2). Par ailleurs Φ est bilinéaire et continue car<br />
‖Φ(A, B)‖ ≤ ‖A‖‖B‖, elle est donc p−1 fois différentiable d’après la Proposition 4.1.2. L’hypothèse<br />
de récurrence nous permet de conclure que D(g◦f) = Φ◦(A, B) est p−1 fois différentiable<br />
en a donc g ◦ f est bien p fois différentiable en a (utiliser de nouveau les Propriétés 4.2.1 et 4.2.2).<br />
b) Même méthode que dans a).<br />
Théorème 4.2.4 Soient E et F des espaces de BANACH, alors l’application<br />
u ↦−→ I(u) = u −1<br />
de Isom(E, F ) dans Isom(F, E) est de classe C ∞ .<br />
Démonstration. On sait que Isom(E, F ) est ouvert dans L(E, F ), que I est de classe C 1 (chapitre<br />
2) et que pour tout h ∈ L(E, F ), on a DL(u)h = −u −1 ◦ h ◦ u −1 . Pour tout (v, w) ∈ L(F, E) ×<br />
L(F, E), et pour tout h ∈ L(E, F ), posons<br />
ψ(v, w)(h) = v ◦ h ◦ w.<br />
L’application Ψ(v, w) est linéaire de L(E, F ) dans L(F, E), de plus<br />
‖ψ(v, w)(h)‖ ≤ ‖v‖‖h‖‖w‖. (4.7)<br />
On a donc Ψ(v, w) ∈ L(L(E, F ) × L(F, E)). L’application Ψ est alors bilinéaire de L(F, E) ×<br />
L(F, E) dans L(L(E, F ) × L(F, E)), elle est de plus continue car<br />
‖ψ(v, w)‖ L(L(E,F )×L(F,E)) ≤ ‖v‖‖w‖<br />
d’après (4.7). Par ailleurs<br />
DI(u) = Ψ(I(u), I(u)).<br />
75
Supposons que I soit de classe C p , il en est alors de même de l’application (I(.), I(.)) ainsi que<br />
de Ψ qui est bilinéaire continue. Utilisant le Théorème 4.2.3, b) on obtient que DI = Ψ ◦ (I, I)<br />
est de classe C p donc I est de classe C p+1 . Par récurrence, on a donc bien I de classe C ∞ .<br />
Comme application de la différentielle seconde, nous allons maintenant caractériser la convexité<br />
des fonctions deux fois différentiables.<br />
Définition 4.2.1 On dit qu’une fonction f : U −→ R définie sur un ouvert convexe U d’un espace<br />
normé E est convexe si, pour tout x, y ∈ x, y ∈ U et pour tout t ∈ [0, 1], on a<br />
f(ty + (1 − t)x) ≤ tf(y) + (1 − t)f(x).<br />
Théorème 4.2.5 Soit f : U −→ R définie sur un ouvert convexe U d’un espace normé E. On<br />
suppose que f est deux fois différentiable sur U. Alors f est convexe si et seulement si<br />
D 2 f(x)(u, u) ≥ 0 pour tout x ∈ X, u ∈ E. (4.8)<br />
Démonstration. Supposons f convexe, et soient x, y ∈ x, y ∈ U et t ∈]0, 1]. On a<br />
f(x + t(y − x)) ≤ tf(y) + (1 − t)f(x),<br />
donc<br />
f(x + t(y − x)) − f(x)<br />
t<br />
≤ f(y) − f(x), ce qui donne, faisant tendre t vers 0<br />
Df(x)(y − x) ≤ f(y) − f(x),<br />
ainsi donc<br />
d’où par addition<br />
Df(y)(x − y) ≤ f(x) − f(y),<br />
(Df(y) − Df(x))(y − x) ≥ 0 pour tout x, y ∈ U.<br />
Introduisons alors, pour x ∈ U et u ∈ E, la fonction ϕ(t) = Df(x + tu)(u) définie pour tout t<br />
voisin de 0. Pour 0 ≤ t, on a<br />
(Df(x + tu) − Df(x))(tu) ≥ 0<br />
donc ϕ(t) ≥ ϕ(0). Il en résulte que ϕ d (0) ≥ 0 donc D 2 f(x)(u, u) ≥ 0. Réciproquement, supposons<br />
(4.8). Pour tout x, y ∈ U et t ∈ [0, 1], posons ψ(t) = f(x + t(y − x)) − Df(x)(x + t(y − x))<br />
de telle sorte que ψ ′ (t) = (Df(x + t(y − x)) − Df(x))(y − x) et<br />
ψ ′′ (t) = D 2 f(x + t(y − x))(y − x, y − x) ≥ 0.<br />
On a donc ψ ′ (t) ≥ ψ ′ (0) = 0, donc ψ(1) ≥ ψ(0), d’où<br />
Posant x t = x + t(y − x), t ∈ [0, 1], il vient<br />
f(y) − f(x) ≥ Df(x)(y − x) pour tout x, y ∈ U.<br />
f(y) ≥ f(x t ) + (1 − t)Df(x t )(y − x),<br />
76
et<br />
f(x) ≥ f(x t ) + tDf(x t )(y − x).<br />
Multipliant la première inégalité par t, la seconde par 1 − t et ajoutant, on obtient<br />
tf(y) + (1 − t)f(x) ≥ f(x t ),<br />
donc f est bien convexe.<br />
Dans le cas particulier où E = E 1 × · · · × E n , on rappelle que la différentiabilité de f en a ∈ U<br />
implique l’existence des différentielles partielles D j f(a) ∈ L(E j , F ). Si l’application D j f :<br />
U −→ L(E j , F ) est différentiable en a ∈ U on a pour tout 1 ≤ i ≤ n<br />
Pour tout u i ∈ E i et v j ∈ E j on pose alors<br />
D i D j f(a) ∈ L(E i , L(E j , F )).<br />
D i D j f(a)(u i , v j ) =<br />
(<br />
)<br />
D i D j f(a)(u i ) (v j ).<br />
On vérifie immédiatement que D i D j f(a) ∈ L 2 (E i , E j ; F ). On a alors<br />
Proposition 4.2.3 Soit f : U ⊂ E 1 × · · · × E n −→ F une application deux fois différentiable<br />
en a ∈ U. Alors les applications D i f, 1 ≤ i ≤ n sont différentiables en a et pour 1 ≤ i ≤ n,<br />
1 ≤ j ≤ n, et pour tout u, v ∈ E 1 × · · · × E n , on a<br />
D 2 f(a)(u, v) =<br />
n∑ n∑<br />
D i D j f(a)(u i , v j ).<br />
i=1 j=1<br />
De plus, pour tout (ū, ¯v) ∈ E i × E j<br />
D j D i f(a)(¯v, ū) = D i D j f(a)(ū, ¯v).<br />
Démonstration. Pour tout x voisin de a et pour tout h ∈ E j , on a<br />
D j f(x)(h) = Df(x)(0, · · · , h, · · · , 0) = (Df(x) ◦ ϕ j )(h)<br />
où ϕ j est l’injection canonique de E j dans E 1 × · · · × E n . On a donc<br />
D j f = Φ j ◦ Df<br />
où Φ j ∈ L(L(E 1 × · · · × E n , F ), L(E j , F )) est définie par<br />
Φ j (A) = A ◦ ϕ j .<br />
Comme Df et Φ j sont différentiables en a il en est de même de D j f. Il en résulte que les différentielles<br />
partielles<br />
D i D j f(a) ∈ L(E i , L(E j , F ))<br />
77
existent pour tout i, j ∈ [1, n]. On remarque alors que<br />
n∑<br />
Df = T j ◦ D j f<br />
où<br />
est définie par<br />
j=1<br />
T j ∈ L(L(E j , F )), L(E 1 × · · · × E n , F ))<br />
T j (A) = A ◦ π j<br />
avec π j (x 1 , · · · , x n ) = x j . On a alors pour 1 ≤ i ≤ n, 1 ≤ j ≤ n, et u, v ∈ E 1 × · · · × E n<br />
n∑<br />
D(Df)(a) = T j ◦ D(D j f)(a)<br />
donc<br />
d’où<br />
D(Df)(a)(u) =<br />
=<br />
=<br />
D 2 f(a)(u, v) =<br />
j=1<br />
n∑<br />
j=1<br />
)<br />
T j<br />
(D(D j f)(a)u)<br />
n∑ ( n∑<br />
)<br />
T j D i (D j f)(a)u i<br />
j=1<br />
n∑<br />
i=1<br />
n∑<br />
i=1<br />
i=1<br />
n∑<br />
)<br />
(D i D j f(a)u i ◦ π j<br />
j=1<br />
n∑<br />
D i D j f(a)(u i , v j ).<br />
Posons alors, pour ū ∈ E k , ¯v ∈ E l , u = (0, · · · , ū, · · · , 0), v = (0, · · · , ¯v, · · · , 0). On a alors<br />
et<br />
j=1<br />
D 2 f(a)(u, v) = D k D l f(ū, ¯v)<br />
D 2 f(a)(v, u) = D l D k f(¯v, ū).<br />
Comme D 2 f(a)(u, v) = D 2 f(a)(v, u), on a bien D k D l f(ū, ¯v) = D l D k f(¯v, ū).<br />
Comme cas particulier, on obtient que, pour tout 1 ≤ i ≤ n, D i D i f(a) ∈ L 2 (E i ; F ) est<br />
symétrique.<br />
Théorème 4.2.6 Soit f : U ⊂ E 1 × · · · × E n −→ F une application telle que les différentielles<br />
partielles D i D j f existent et sont continues en un point a ∈ U. Alors f est deux fois différentiable<br />
en a et, pour tout u, v ∈ E 1 × · · · × E n<br />
n∑ n∑<br />
D 2 f(a)(u, v) = D j D i f(a)(u j , v i ).<br />
i=1<br />
j=1<br />
78
Démonstration. On a Df = ∑ n<br />
i=1 T i ◦ D i f (voir la démonstration du Corollaire 4.2.3) et D i f<br />
est différentiable en tout x ∈ U car les différentielles partielles D j D i f existent et sont continues<br />
en a. Il résulte donc du Théorème 2.4.1 que Df est différentiable en a et donc que f est deux fois<br />
différentiable en a. La formule donnant D 2 f(a) a été démontrée dans le Corollaire 4.2.3.<br />
Remarque 4.2.1 Examinons le cas particulier E 1 = E 2 = · · · = E n = R, et F = R. Supposons<br />
que f est deux fois différentiable en a. On a<br />
∂f<br />
∂x i<br />
(x) = Df(x)(e i ) = ψ i (Df(x)),<br />
où ψ i : L(R n , R) −→ R est l’application linéaire définie par ψ i (A) = A(e i ). On a donc ∂f =<br />
∂x i<br />
ψ i ◦ Df, ce qui montre que ∂f est différentiable en a, donc les dérivées partielles secondes<br />
∂x i<br />
∂ 2 f<br />
(a) existent pour tout i, j ∈ [1, n]. Posant alors<br />
∂x j ∂x i<br />
g(x) = Df(x)(u) =<br />
n∑<br />
i=1<br />
∂f<br />
∂x i<br />
(a)u i .<br />
On a alors<br />
D 2 f(a)(u, v) = Dg(a)(v) =<br />
n∑<br />
i=1<br />
n∑<br />
j=1<br />
∂ 2 f<br />
∂x j ∂x i<br />
(a)u i v j = 〈H f (a), u〉,<br />
où H f (a) est alors la matrice Hessienne de f en a définie par<br />
Remarquons que<br />
Remarquons aussi que<br />
donc<br />
(H f (a)) ij = ∂2 f<br />
∂x j ∂x i<br />
(a).<br />
∂ 2 f<br />
∂x j ∂x i<br />
(a) = D 2 f(a)(e i , e j ) = D 2 f(a)(e j , e i ) =<br />
∂ 2 f<br />
D i D j f(a)(s, t) = st (a),<br />
∂x j ∂x i<br />
∂2 f<br />
∂x i ∂x j<br />
(a).<br />
‖D i D j f(b) − D i D j f(a)‖ L 2 (R;R) = ∥<br />
∂2 f<br />
(b) −<br />
∂2 f<br />
∥<br />
(a) ∥.<br />
∂x j ∂x i ∂x j ∂x i<br />
∂ 2 f<br />
Il en résulte que si les dérivées partielles secondes existent et sont continues en a alors les<br />
∂x j ∂x i<br />
différentielles partielles secondes existent au voisinage de a et sont continues en a. Le Théorème<br />
79
4.2.6 nous permet alors d’affirmer que f est deux fois différentiables en a et que l’on a alors en<br />
particulier<br />
∂ 2 f<br />
(a) =<br />
∂2 f<br />
(a).<br />
∂x j ∂x i ∂x i ∂x j<br />
Dans le cas où l’application f est définie sur un ouvert U de E 1 × · · · × E n , pour toute suite<br />
finie {i 1 , · · · , i p } ⊂ [1, n], on introduit par récurrence les différentielles partielles d’ordre p<br />
D i1 D i2 · · · D ip f(a) ∈ L p (E i1 × · · · × E ip , F ).<br />
On montre alors facilement par récurrence que si f est p fois différentiable en a on a pour tout<br />
(u 1 , · · · u p ) ∈ (E 1 × · · · × E n ) p<br />
D p f(a)(u 1 , · · · , u p ) =<br />
4.3 Formules de Taylor<br />
∑<br />
{i 1 ,···,i p}⊂[1,n]<br />
Commençons par démontrer le résultat suivant<br />
D i1 D i2 · · · D ip f(a)(u i1 , · · · , u ip ).<br />
Proposition 4.3.1 Soient I un intervalle ouvert, E, F , G des espaces normés, f : I −→ E,<br />
g : I −→ F deux fonctions p + 1 fois dérivables et soit [., .] : E × F −→ G une application<br />
bilinéaire continue. Alors<br />
( ∑<br />
p ′.<br />
[f, g (p+1) ] − (−1) p+1 [f (p+1) , g] = (−1) i [f (i) , g ]) (p−i)<br />
Démonstration. Par récurrence sur p. Pour p = 0 la formule se réduit à<br />
i=0<br />
[f, g ′ ] + [f ′ , g] = ([f, g]) ′<br />
qui est une conséquence de la formule donnant la différentielle d’une application bilinéaire et la<br />
dérivée d’une composée. Supposons le résultat vrai à l’ordre p − 1. On a<br />
( ∑<br />
p ) ′ ( ∑<br />
p−1<br />
(−1) i [f (i) , g (p−i) ] = (−1) i [f (i) , h (p−1−i) ] + (−1) p [f p , g]<br />
i=0<br />
avec h = g ′ . Appliquant l’hypothèse de récurrence, il vient<br />
i=0<br />
( ∑<br />
p ′<br />
(−1) i [f (i) , g ]) (p−i) = [f, h (p) ] − (−1) p [f (p) , h]+<br />
i=0<br />
) ′<br />
(−1) p [f (p+1) , g] + (−1) p [f (p) , h]<br />
80
d’où<br />
( ∑<br />
p ′<br />
(−1) i [f i , g ]) p−i = [f, g (p+1) ] − (−1) p+1 [f (p+1) , g]<br />
i=0<br />
On en déduit la formule de Taylor suivante<br />
Théorème 4.3.1<br />
a) FORMULE <strong>DE</strong> TAYLOR AVEC RESTE INTÉGRAL. Soient I un intervalle ouvert de R, f :<br />
I −→ E une fonction à valeurs dans un espace de Banach E qui est p + 1 fois continuement<br />
dérivable sur I. Alors, pour tout a, t ∈ I<br />
f(t) =<br />
p∑ (t − a) i<br />
f (i) (a) +<br />
i!<br />
i=0<br />
∫ t<br />
a<br />
(t − s) p<br />
f (p+1) (s)ds.<br />
p!<br />
b) FORMULE <strong>DE</strong> TAYLOR-LAGRANGE. Si l’on suppose seulement que f est p + 1 fois dérivable<br />
sur I et que<br />
sup ‖f (p+1) (s)‖ ≤ M < +∞<br />
s∈I<br />
alors<br />
∥<br />
∥f(t) −<br />
p∑ (t − a) i<br />
f (i) (a) ∥ ≤<br />
i!<br />
i=0<br />
|t − a|p+1<br />
(p + 1)! M.<br />
Démonstration. a) On applique la Proposition 4.3.1 avec g(s) =<br />
[x, t] = tx. On remarque que<br />
(t − s)p<br />
, F = R, G = E et<br />
p!<br />
g (i) i (t − s)p−i<br />
(s) = (−1)<br />
(p − i)!<br />
pour 0 ≤ i ≤ p,<br />
de telle sorte que<br />
g (p+1) (s) ≡ 0,<br />
(−1) i [f (i) , g (p−i) ] = (−1) i p−i (t − s)i<br />
(−1) f (i) p (t − s)i<br />
(s) = (−1) f (i) (s).<br />
i!<br />
i!<br />
Il vient alors, appliquant la Proposition 4.3.1,<br />
p+1 (t −<br />
(<br />
s)p<br />
∑<br />
p<br />
−(−1) f (p+1) p (t −<br />
)<br />
s)i<br />
′<br />
(s) = (−1) f (i) (s)<br />
p!<br />
i!<br />
i=0<br />
donc<br />
(t − s) p<br />
( ∑<br />
p<br />
f (p+1) (t − s) i<br />
′.<br />
(s) =<br />
f (s)) (i) (4.9)<br />
p!<br />
i!<br />
i=0<br />
81
Intégrant entre a et t, on obtient<br />
d’où le résultat.<br />
∫ t<br />
b) Posons ψ(s) = ∑ p<br />
i=0<br />
a<br />
(t − s) p<br />
f (p+1) (s) = f(t) −<br />
p!<br />
p∑<br />
i=0<br />
i<br />
(t − s)<br />
f (i) (s). D’après (4.9) on a<br />
i!<br />
ψ ′ (s) =<br />
(t − s)p<br />
f (p+1) (s).<br />
p!<br />
i<br />
(t − a)<br />
f (i) (a)<br />
i!<br />
Supposons t ≥ a, le cas t ≤ a se traîtant de manière analogue. Pour tout s ∈ I, on a<br />
Il en résulte que, pour s ∈ [a, t]<br />
‖ψ ′ (s)‖ ≤ M<br />
|t − s|p<br />
.<br />
p!<br />
avec g(s) = −M<br />
‖ψ ′ (t − s)p<br />
(s)‖ ≤ M<br />
p!<br />
= g ′ (s)<br />
(t − s)p+1<br />
. On applique alors le Théorème des accroissements finis et on obtient<br />
(p + 1)!<br />
d’où le résultat car ψ(t) = f(t) et ψ(a) = ∑ p<br />
i=0<br />
‖ψ(t) − ψ(a)‖ ≤ g(t) − g(a),<br />
i<br />
(t − a)<br />
f (i) (a).<br />
i!<br />
Dans le cas d’applications entre espaces normés, on a les formules de Taylor suivantes<br />
Théorème 4.3.2<br />
a) FORMULE <strong>DE</strong> TAYLOR AVEC RESTE INTÉGRAL. Soit f : U −→ F une application p + 1<br />
fois continuement différentiable définie sur un ouvert U d’un espace normé E à valeurs dans un<br />
espace de Banach F . Alors pour tout x ∈ U et h ∈ E tels que le segment [x, x + h] soit contenu<br />
dans U, on a<br />
p∑<br />
∫<br />
1<br />
1<br />
f(x + h) =<br />
i! Di f(x)h i (1 − s) p<br />
+<br />
D p+1 f(x + sh)h p+1 ds<br />
0 p!<br />
où h i = (h, · · · , h) ∈ E i .<br />
i=0<br />
b) FORMULE <strong>DE</strong> TAYLOR-LAGRANGE. Soit f : U −→ F une application p + 1 fois différentiable<br />
définie sur un ouvert U d’un espace normé E à valeurs dans un espace de Banach F . On<br />
suppose qu’il existe M ≥ 0 telle que ‖D p+1 f(z)‖ ≤ M pour tout z ∈ U. Alors pour tout x ∈ U<br />
et h ∈ E tels que le segment [x, x + h] soit contenu dans U, on a<br />
∥<br />
∥f(x + h) −<br />
p∑<br />
i=0<br />
1<br />
i! Di f(x)h i ∥ ∥∥ ≤ M<br />
‖h‖ p+1<br />
(p + 1)! .<br />
82
Démonstration. a) Remarquons qu’il existe η > 0 tel que x + sh ∈ U pour tout s ∈] − η, 1 + η[.<br />
Posons alors g(s) = f(x + sh), g est alors p + 1 fois continuement dérivable sur ] − η, 1 + η[<br />
et, utilisant la Proposition 4.1.5, b), on a g i (s) = D i f(x + sh)h i . On applique alors le Théorème<br />
4.3.1 avec a = 0 et t = 1 et on a le résultat.<br />
b) Posons g(t) = f(x + th), on a g (i) (t) = D i f(x + th)h i pour 1 ≤ i ≤ p + 1 (Proposition<br />
4.1.5, b)), d’où sup t∈[0,1] ‖g (p+1) (t)‖ ≤ M‖h‖ p+1 . On applique alors le Théorème 4.3.1, b) et on<br />
obtient que<br />
soit<br />
d’où le résultat.<br />
∥<br />
∥g(1) −<br />
∥<br />
∥f(x + h) −<br />
p∑<br />
i=0<br />
p∑<br />
i=0<br />
g (i) (0)<br />
i!<br />
∥ ≤ M‖h‖p+1<br />
(p + 1)!<br />
1<br />
i! Di f(x)h i ∥ ∥∥ ≤<br />
M‖h‖ p+1<br />
(p + 1)! ,<br />
Il est également possible d’obtenir une formule de Taylor sous des hypothèses plus faibles.<br />
Théorème 4.3.3 FORMULE <strong>DE</strong> TAYLOR-YOUNG. Soit f : U −→ F une application définie sur<br />
un ouvert U d’un espace normé E à valeurs dans un espace normé F que l’on suppose p fois<br />
différentiable en a ∈ U. Alors<br />
f(a + h) =<br />
p∑<br />
i=0<br />
1<br />
i! Di f(a)h i + ‖h‖ p ε(h)<br />
avec lim h→0 ε(h) = 0.<br />
Démonstration. On procède par récurrence. Le cas p = 1 est exactement la définition de la<br />
différentiabilité. Supposons la propriété vraie à l’ordre p − 1. Posons alors<br />
Posons<br />
g(z) = f(a + z) −<br />
p∑<br />
i=0<br />
1<br />
i! Di f(a)z i .<br />
ϕ i (z) = 1 i! Di f(a)z i = 1 i! (Di f(a) ◦ L)(z)<br />
avec L(z) = (z, · · · , z) ∈ E i . Utilisant le calcul de la différentielle d’une application multilinéaire<br />
continue (voir chapitre 2, exemple 2.1.4, c)), on a pour tout u ∈ E,<br />
Dϕ i (z)(u) =<br />
i∑<br />
k=1<br />
1<br />
i! (Di f(a)(z, · · · , u, · · · , z) =<br />
1<br />
(i − 1)! Di f(a)(z i−1 , u)<br />
car D i f(a) est symétrique. On a donc, utilisant la Proposition 4.2.1<br />
(D i−1 (Df)(a)(z i−1 ))(u) = D i f(a)(z i−1 , u)<br />
83
donc<br />
Il en résulte que<br />
Dϕ i (z) = D i−1 (Df)(a)(z i−1 ).<br />
Dg(z) = Df(a + z) −<br />
p−1<br />
∑<br />
j=0<br />
1<br />
j! Dj (Df)(a)(z j ).<br />
Par hypothèse de récurrence appliquée à Df, pour tout ε > 0, il existe η > 0 tel que ‖z‖ ≤ η<br />
implique<br />
‖Dg(z)‖ ≤ ε‖z‖ p−1 .<br />
Soit ‖h‖ ≤ η et soit θ(t) = g(th) pour tout t ∈ [0, 1]. On a θ ′ (t) = Dg(th)h donc ‖θ ′ (t)‖ ≤<br />
ε‖h‖ p−1 ‖h‖ = ε‖h‖ p . D’après le Théorème des accroissements finis, on a donc<br />
d’où le résultat.<br />
‖g(h)‖ = ‖g(h) − g(0)‖ = ‖θ(1) − θ(0)‖ ≤ ε‖h‖ p<br />
Remarque 4.3.1 Dans le cas d’une fonction f : U −→ R définie sur un ouvert U de R n , et deux<br />
fois différentiable en a, on a<br />
f(a) + Df(a)u + 1 2 D2 f(a)(u, u) = f(a) +<br />
n∑<br />
i=1<br />
∂f<br />
∂x i<br />
(a)u i +<br />
1<br />
( n∑ ∂ 2 f<br />
(a)(u<br />
2 ∂x 2 i ) 2 + 2<br />
i=1 i<br />
∑<br />
1≤i
4.4 Conditions d’Optimalité<br />
Définition 4.4.1 Soit f : U −→ R une fonction définie sur un ouvert U d’un espace topologique<br />
E.<br />
On dit que f admet un minimum (resp. maximum) local en a ∈ U s’il existe un voisinage V<br />
de a tel que<br />
f(x) ≥ f(a) (resp. f(x) ≤ f(a)) pour tout x ∈ V.<br />
Si<br />
f(x) > f(a) (resp. f(x) < f(a)) pour tout x ∈ V \ {a}<br />
on dit que l’extremum est strict. On dit que l’extremum est global si l’inégalité a lieu pour tout<br />
x ∈ U.<br />
Théorème 4.4.1<br />
a) Si f admet un extremum local en a ∈ U et si f est différentiable en a, alors<br />
Df(a) = 0.<br />
Si de plus f est deux fois différentiable en a alors pour tout h ∈ E<br />
D 2 f(a)(h, h)<br />
garde un signe constant (≥ 0 pour un minimum, ≤ 0 pour un maximum).<br />
b) On suppose que f est deux fois différentiable en a ∈ U, qu’il existe α > 0 tel que pour tout<br />
h ∈ E<br />
D 2 f(a)(h, h) ≥ α‖h‖ 2<br />
et que<br />
Alors f admet un minimum local strict en a.<br />
Df(a) = 0.<br />
Démonstration. a) On suppose que f admet un minimum local en a. Soit h ∈ E. Pour tout<br />
t ∈ R + assez petit on a donc<br />
f(a + th) − f(a) ≥ 0.<br />
Divisant par t et faisant tendre t vers 0 il vient Df(a)(h) ≥ 0. Changeant h en −h, on en déduit<br />
Df(a)(h) ≤ 0 soit<br />
Df(a)(h) = 0.<br />
Si f est deux fois différentiable en a, on a<br />
t 2 2 D2 f(a)(h, h) + t 2 ε(t) = f(a + th) − f(a) ≥ 0.<br />
Divisant par t 2 et faisant tendre t vers 0, il vient<br />
D 2 f(a)(h, h) ≥ 0.<br />
85
) D’après la formule de Taylor (Théorème 4.3.3), on a<br />
f(a + h) − f(a) = 1 2 D2 f(a)(h, h) + ‖h‖ 2 ε(h) ≥ 1 2 ‖h‖2 (α + ε(h))<br />
avec lim h→0 ε(h) = 0. Il existe alors η > 0 tel que |ε(h)| ≤ α/4 pour tout ‖h‖ ≤ η. On obtient<br />
alors pour tout ‖h‖ ≤ η<br />
f(a + h) − f(a) ≥ ‖h‖ 2 α/4,<br />
ce qui démontre bien le résultat annoncé.<br />
Dans le cas où f : U −→ R est une fonction convexe définie sur un ouvert convexe, on a une<br />
condition nécessaire et suffisante de minimalité.<br />
Théorème 4.4.2 f : U −→ R est une fonction convexe définie sur un ouvert convexe d’un espace<br />
normé. Alors les propriétés suivantes sont équivalentes pour a ∈ U tel que f soit différentiable en<br />
a :<br />
a) f(a) = min x∈U f(x)<br />
b) Df(a) = 0.<br />
Démonstration. Il suffit de démontrer que b) implique a). Pour tout x ∈ U et t ∈]0, 1], on a<br />
f(a + t(x − a)) ≤ tf(x) + (1 − t)f(a), donc<br />
faisant tendre t vers 0, il vient<br />
f(a + t(x − a)) − f(a)<br />
t<br />
≤ f(x) − f(a).<br />
pour tout x ∈ U, d’où le résultat.<br />
0 = Df(a)(x − a) ≤ f(x) − f(a),<br />
Remarque 4.4.1 Il découle du théorème précédent que si fonction convexe f : U −→ R admet<br />
un minimum local en a ∈ U, alors ce minimum est global.<br />
On peut aussi obtenir des conditions d’optimalité pour des problèmes avec contraintes c’est à<br />
dire pour un extremum local de f non plus sur U mais sur U ∩ M où M est une partie fermée de<br />
E. On donnera un résultat général de ce type dans le chapitre suivant. Dans le cas des fonctions<br />
convexes, on peut dès maintenant donner un résultat.<br />
Théorème 4.4.3 Soit U ⊂ X un ouvert d’un espace de Hilbert et soient f, g : U −→ R deux<br />
fonctions convexes. On suppose que<br />
a) f est différentiable sur U et il existe y ∈ U tel que f(y) < 0.<br />
b) ¯x ∈ S := {x ∈ U : f(x) ≤ 0} est tel que g(¯x) = inf x∈S g(x) et f est différentiable en ¯x.<br />
86
Alors il existe λ ≤ 0 tel que<br />
⎧<br />
⎨<br />
⎩<br />
λf(¯x) = 0.<br />
∇g(¯x) = λ∇f(¯x)<br />
Réciproquement, si ¯x ∈ S vérifie (4.10), alors g(¯x) = min x∈S g(x).<br />
Démonstration. On remarque que S est convexe, que son intérieur est non vide et que<br />
{x ∈ U : f(x) < 0} ⊂ int S.<br />
Si f(¯x) < 0, alors g a un minimum local en ¯x, donc ∇g(¯x) = 0 = 0∇f(¯x) avec 0f(¯x) = 0.<br />
(4.10)<br />
Supposons alors f(¯x) = 0. Si ∇g(¯x) = 0, on a la conclusion voulue. On peut donc supposer<br />
que ∇g(¯x) ≠ 0. Pour tout x ∈ S et t ∈]0, 1], on a ¯x + t(x − ¯x) ∈ S donc<br />
g(¯x + t(x − ¯x)) − g(¯x)<br />
t<br />
ce qui, par passage à la limite pour t ↓ 0 donne<br />
≥ 0,<br />
〈∇g(¯x), x − ¯x〉 ≥ 0 pour tout x ∈ S.<br />
Cela implique que 〈∇g(¯x), x − ¯x〉 > 0 pour tout x ∈ int S. Sinon, il existerait x 0 ∈ int S tel que<br />
〈∇g(¯x), x 0 − ¯x〉 ≤ 0, ce qui impliquerait 〈∇g(¯x), x 0 − ¯x〉 = 0 et<br />
〈∇g(¯x), x 0 〉 = 〈∇g(¯x), ¯x〉 ≤ 〈∇g(¯x), x〉 pour tout x ∈ int S.<br />
La fonction convexe 〈∇g(¯x), ·〉 aurait alors un minimum local, donc global (voir Remarque 4.4.1),<br />
ce qui impliquerait la contradiction ∇g(¯x) = 0. On en déduit que 〈∇g(¯x), x − ¯x〉 ≤ 0 implique<br />
x /∈ int S donc f(x) ≥ 0 = f(¯x). On obtient donc<br />
où<br />
f(x) ≥ f(¯x) pour tout x ∈ H ∩ U<br />
H = {x ∈ X : 〈∇g(¯x), x − ¯x〉 ≤ 0}.<br />
Soit alors u ∈ X tel que 〈∇g(¯x), u〉 ≤ 0. Comme ¯x + tu ∈ H ∩ U pour tout t > 0 assez<br />
f(¯x + tu) − f(¯x)<br />
petit, il vient ≥ 0 donc 〈∇f(¯x), u〉 ≥ 0. Il en résulte que 〈∇f(¯x), u〉 = 0 si<br />
t<br />
〈∇g(¯x), u〉 = 0, ce qui implique l’existence de λ ∈ R ∗ tel que ∇g(¯x) = λ∇f(¯x). On remarque<br />
enfin que λ < 0 car 〈∇f(¯x), u〉 ≥ 0 si 〈∇g(¯x), u〉 ≤ 0 et que λf(¯x) = 0.<br />
Réciproquement, supposons que (4.10) est vérifié. Si λ = 0, alors ∇g(¯x) = 0 donc ¯x réalise le<br />
minimum de g sur U donc sur S. Supposons donc λ ≠ 0 de telle sorte que f(¯x) = 0. On a alors,<br />
pour tout x ∈ S,<br />
0 ≥ f(x) − f(¯x) ≥ 〈∇f(¯x), x − ¯x〉,<br />
donc 〈∇g(¯x), x − ¯x〉 ≥ 0 car ∇g(¯x) = λ∇f(¯x) avec λ < 0. On a alors, pour tout x ∈ S,<br />
g(x) − g(¯x) ≥ 〈∇g(¯x), x − ¯x〉 ≥ 0.<br />
87
Chapitre 5<br />
Théorèmes d’Inversion et Applications<br />
Nous illustrons dans ce chapitre le principe qu’une application différentiable se comporte localement<br />
comme sa différentielle.<br />
5.1 Théorèmes d’inversion<br />
Commençons par donner quelques définitions<br />
Définition 5.1.1<br />
a) Une application f : E −→ F où E et F sont des espaces topologiques est un homéomorphisme<br />
si<br />
– f est bijective<br />
– f et f −1 sont continues.<br />
Autrement dit f est donc un homéomorphisme si et seulement<br />
– f est bijective,<br />
– f(U) est ouvert dans F pour tout ouvert U de E,<br />
– f −1 (V ) est ouvert dans E pour tout ouvert V de F.<br />
b) Soient U ⊂ E et, V ⊂ F des ouverts d’espaces de Banach E et F . On dit qu’une application<br />
f : U −→ V est un difféomorphisme si<br />
– f est bijective,<br />
– f et f −1 sont différentiables.<br />
c) On dit que f est un C r difféomorphisme si f est un difféomorphisme et si f et f −1 sont de<br />
classe C r .<br />
Remarque 5.1.1<br />
a) Une application bijective et continue n’est pas toujours un homéomorphisme. En effet, soit<br />
(E, d) un espace métrique dont la topologie n’est pas la topologie discrète et δ(x, y) la distance<br />
définie par<br />
{ 0 si x = y<br />
δ(x, y) =<br />
1 si x ≠ y.<br />
89
Considérons f : (E, δ) −→ (E, d) définie par f = I E . C’est une application continue bijective<br />
mais f −1 n’est pas continue car si X ⊂ E qui n’est pas ouvert pour (E, d) on a X est ouvert<br />
pour (E, δ) alors que f(X) = X n’est pas ouvert pour (E, d).<br />
b) On remarque qu’un difféomorphisme est un homéomorphisme. Mais la fonction f(x) =<br />
x 3 qui est un homéomorphisme différentiable de R dans R n’est pas un difféomorphisme car<br />
f −1 (y) = y 1/3 n’est pas différentiable en 0.<br />
c) On remarque également que si f : U −→ V est un difféomorphisme alors Df(x) ∈<br />
Isom(E, F ) pour tout x ∈ U. En effet, f et f −1 sont différentiables en x et y = f(x) et on a<br />
f ◦ f −1 = Id V ,<br />
f −1 ◦ f = Id U .<br />
Utilisant le résultat de dérivation d’une composée, on a<br />
et<br />
Df(x) ◦ Df −1 (y) = Id F<br />
Df −1 (y) ◦ Df(x) = Id E ,<br />
ce qui montre que bien que Df(x) est bijective et que Df −1 (y) = (Df(x)) −1 .<br />
Le résultat suivant est une étape vers le résultat principal de cette section à savoir le Théorème du<br />
difféomorphisme local 5.1.2.<br />
Théorème 5.1.1 THÉORÈME D’INVERSION LOCALE Soit f : U −→ F une application différentiable<br />
définie sur un ouvert U d’un espace de Banach et à valeurs dans un espace de Banach<br />
F . On suppose que Df est continue en a ∈ U et que Df(a) ∈ Isom (E, F ). Alors<br />
a) il existe des voisinages ouverts U ′ de a et V ′ de b = f(a) tels que f soit un homéomorphisme<br />
de U ′ dans V ′ .<br />
b) f −1 est Lipschitzienne sur V ′ , différentiable en b et on a Df −1 (b) = (Df(a)) −1 .<br />
Démonstration. Posons ψ = (Df(a)) −1 ∈ Isom (F, E), et r(x) = f(x) − b − Df(a)(x − a).<br />
Observons que pour y ∈ F et x ∈ U,<br />
y = f(x)<br />
⇐⇒ y = b + Df(a)(x − a) + r(x)<br />
⇐⇒ x = a + ψ(y − b − r(x))<br />
⇐⇒ x = F y (x)<br />
où F y (x) = a + ψ(y − b − r(x)). Choisissons η > 0 tel que<br />
‖Dr(x)‖ = ‖Df(x) − Df(a)‖ ≤ 1<br />
2‖ψ‖<br />
sur ¯B(a, η), de telle sorte que r(.) est<br />
1<br />
2‖ψ‖ -Lipschitzien sur ¯B(a, η) ; et soit y ∈ ¯B(b, δ) où δ =<br />
η<br />
2‖ψ‖ . Pour tout x ∈ ¯B(a, η) on a, notant que 0 = r(a)<br />
η<br />
‖F y (x) − a‖ ≤ ‖ψ‖(‖y − b‖ + ‖r(x)‖) ≤ ‖ψ‖(<br />
2‖ψ‖ + 1 ‖x − a‖) ≤ η.<br />
2‖ψ‖<br />
90
On a donc défini une application F y : ¯B(a, η) −→ ¯B(a, η). Pour tout x, z ∈ ¯B(a, η), on a<br />
‖F y (x) − F y (z)‖ ≤ ‖ψ‖‖r(x) − r(z)‖ ≤ ‖ψ‖ 1<br />
‖x − z‖<br />
‖x − z‖ = .<br />
2‖ψ‖ 2<br />
D’après le Théorème des applications contractantes de Banach, il existe un unique x ∈ ¯B(a, η) tel<br />
que f(x) = y noté x = g(y). Ceci montre l’existence d’une application g : ¯B(b, δ) −→ ¯B(a, η)<br />
telle que f(g(y)) = y pout tout y ∈ ¯B(b, δ). Notons que g(b) = a car F b (a) = a et que, pour tout<br />
y ∈ ¯B(b, δ), g(y) est l’unique x ∈ ¯B(a, η) tel que f(x) = y. Il en résulte que f est surjective de<br />
¯B(a, η) dans ¯B(b, δ). Considérons y, y ′ ∈ B(b, δ), on a<br />
‖g(y) − g(y ′ )‖ = ‖F y (g(y)) − F y ′(g(y ′ ))‖<br />
≤<br />
‖F y (g(y)) − F y (g(y ′ ))‖ + ‖F y (g(y ′ )) − F y ′(g(y ′ ))‖<br />
≤<br />
1 2 ‖(g(y) − (g(y′ )‖ + ‖ψ(y − y ′ )‖<br />
ce qui entraine<br />
‖g(y) − g(y ′ )‖ ≤ 2‖ψ‖‖y − y ′ ‖.<br />
Il en résulte que g est Lipschitzienne donc continue sur ¯B(b, δ) et que<br />
‖g(y) − a‖ = ‖g(y) − g(b)‖ < 2‖ψ‖δ = η<br />
si ‖y − b‖ < δ d’où g(B(b, δ)) ⊂ B(a, η) en notant, comme d’habitude, B(x, r) la boule ouverte<br />
de centre x et de rayon r. Posons alors V ′ = B(b, δ) et U ′ = g(B(b, δ)) ⊂ B(a, η). Pour tout<br />
y ∈ B(b, δ), on a g(y) = f −1 (y) ∩ B(a, η), donc U ′ = f −1 (B(b, δ)) ∩ B(a, η), ce qui montre<br />
que U ′ est ouvert. Remarquons que f(U ′ ) ⊂ V ′ et que f : U ′ −→ V ′ est surjective. Elle est<br />
aussi injective car si x, x ′ ∈ U ′ vérifient f(x) = f(x ′ ) = y, on a x ∈ B(a, η) donc g(y) = x<br />
et g(y) = x ′ d’où x = x ′ . On a donc montré que f : U ′ −→ V ′ est un homéomorphisme et que<br />
f −1 = g est Lipschitzienne sur V ′ .<br />
Il reste à prouver la différentiabilité de f −1 en b. Soit ε > 0 et 0 < α < η tel que ‖Dr(x)‖ ≤<br />
ε<br />
2‖ψ‖ 2<br />
ε<br />
sur B(a, α), de telle sorte que r(.) est -Lipschitzienne sur B(a, α). Posons β = α/2‖ψ‖.<br />
2‖ψ‖ 2<br />
Pour tout y ∈ B(b, β) on a<br />
‖g(y) − a‖ = ‖g(y) − g(b)‖ ≤ 2‖ψ‖‖y − b‖ ≤ 2‖ψ‖β = α<br />
donc g(B(b, β)) ⊂ B(a, α). Soit y ∈ B(b, β). On a<br />
d’où<br />
Il en résulte que<br />
g(y) = F y (g(y)) = a + ψ(y − b − r(g(y))),<br />
g(y) − g(b) − ψ(y − b) = −ψ(r(g(y))) = ψ(r(g(b))) − ψ(r(g(y))).<br />
‖g(y) − g(b) − ψ(y − b)‖ ≤ ‖ψ‖‖r(g(y)) − r(g(b))‖.<br />
91
Comme r(.) est Lipschitzienne de rapport ε/2‖ψ‖ 2 sur B(a, α), et comme g(y), g(b) ∈ B(a, α),<br />
il vient<br />
‖r(g(y) − r(g(b))‖ ≤<br />
On a donc pour tout y ∈ B(b, β)<br />
ε ‖g(y) − g(b)‖ ≤<br />
ε<br />
2‖ψ‖<br />
2<br />
2‖ψ‖‖y − b‖ ≤<br />
ε<br />
2‖ψ‖<br />
2<br />
‖g(y) − g(b) − ψ(y − b)‖ ≤ ‖ψ‖ ε ‖y − b‖ = ε‖y − b‖,<br />
‖ψ‖<br />
‖y − b‖.<br />
‖ψ‖<br />
ce qui montre bien que g et donc f −1 est différentiable en b avec Df −1 (b) = (Df(a)) −1 .<br />
On en déduit le<br />
Théorème 5.1.2 THÉORÈME DU DIFFÉOMORPHISME LOCAL<br />
Soit f : U −→ F une application de classe C r , r ≥ 1 définie sur un ouvert U d’un espace de<br />
Banach E et à valeurs dans un espace de Banach F . Soit a ∈ U tel que Df(a) ∈ Isom (E, F ).<br />
Alors, il existe des voisinages ouverts U ′ de a et V ′ de b = f(a) tels que f soit un C r difféomorphisme<br />
de U ′ dans V ′ .<br />
Démonstration. Comme Df(a) ∈ Isom (E, F ) qui est ouvert dans L(E, F ) et comme Df est<br />
continue en a, on peut supposer en diminuant U au besoin, que Df(x) ∈ Isom (E, F ) pour tout<br />
x ∈ U. Appliquant le Théorème 5.1.1, il existe des voisinages ouverts U ′ de a et V ′ de b = f(a)<br />
tels que f soit un homéomorphisme de U ′ dans V ′ et tel que f −1 soit différentiable en b avec<br />
Df −1 (b) = (Df(a)) −1 . On peut alors appliquer de nouveau le Théorème 5.1.1 pour tout x ∈ U ′ . Il<br />
en résulte que, pour tout y ∈ V ′ l’application f −1 est différentiable en y et Df −1 (y) = (Df(x)) −1 .<br />
L’application Df −1 est continue sur V ′ car<br />
Df −1 = Φ ◦ Df ◦ f −1<br />
où Φ : Isom (E, F ) −→ Isom (F, E) est définie par φ(u) = u −1 pour tout u ∈ Isom (E, F ).<br />
Notons que f −1 , Df sont continues ainsi que Φ qui est de classe C ∞ (voir chapitre 4, Théorème<br />
4.2.4). Il en résulte que f −1 est de classe C 1 sur V ′ . Supposons démontré que f −1 est de classe C s<br />
sur V ′ pour s ∈ [1, r − 1]. On a f −1 de classe C s ainsi que Df et Φ. D’après le Théorème 4.2.3<br />
du chapitre 2, on obtient donc que Df −1 est de classe C s sur V ′ d’où f −1 est de classe C s+1 . Le<br />
théorème est alors complètement démontré.<br />
Remarque 5.1.2 Si les hypothèses du théorème précédent sont vérifiées dans des espaces de dimension<br />
finie E = R n et F = R p , on a nécessairement n = p et l’hypothèse Df(a) ∈ Isom (E, F )<br />
se traduit par det(J f (a)) ≠ 0 où J f (a) est la matrice Jacobienne de f en a définie par<br />
avec f = (f 1 , . . . , f n ).<br />
J f (a) i,j = ∂f i<br />
∂x j<br />
(a)<br />
92
Le résultat suivant est une version globale du Théorème 5.1.1.<br />
Théorème 5.1.3 Soit f : U −→ F une application définie sur un ouvert U d’un espace de Banach<br />
E et à valeurs dans un espace de Banach F . On suppose que f est de classe C r . Alors, pour que<br />
f soit un C r difféomorphisme de U dans f(U) qui est alors ouvert, il faut et il suffit que f soit<br />
injective et que Df(x) ∈ Isom (E, F ) pour tout x ∈ U.<br />
Démonstration. Supposons que f est un C r difféomorphisme d’un ouvert U de E dans un ensemble<br />
V = f(U) de F . Il résulte de la Remarque 5.1.1, b) que Df(x) ∈ Isom (E, F ) pour tout<br />
x ∈ U. Montrons alors que V = f(U) est ouvert. Soit b = f(a) ∈ V avec a ∈ U. Il existe d’après<br />
le Théorème 5.1.1 des voisinage ouverts U ′ ⊂ U de a et V ′ de b tel que f soit un homéomorphisme<br />
de U ′ dans V ′ . On a alors V ′ ⊂ f(U) = V .<br />
Réciproquement Soit f : U −→ F une application injective de classe C r telle que Df(x) ∈<br />
Isom (E, F ) pour tout x ∈ U. Observons que f est bijective de U dans f(U). Par ailleurs f(U)<br />
est ouvert et f −1 est continue sur f(U). En effet, si on considère y = f(x) ∈ f(U) avec x ∈ U,<br />
il existe d’après le Théorème 5.1.1 des voisinages ouverts U ′ de x et V ′ de y tels que f soit un<br />
homéomorphisme de U ′ dans V ′ , ce qui implique que V ′ ⊂ f(U) et que f −1 est continue en y.<br />
L’application f est donc un homéomorphisme de U dans l’ouvert V = f(U). De plus, comme<br />
Df(x) ∈ Isom (E, F ), on peut appliquer le Théorème 5.1.2 qui nous assure que f −1 est r fois<br />
continuement différentiable au voisinage de y. Ce qui montre que f est un C r difféomorphisme de<br />
U dans l’ouvert f(U), d’où le résultat.<br />
Remarque 5.1.3 Il résulte du théorème précedent que si U ⊂ E et V ⊂ F sont des ouverts et si<br />
f : U −→ V est un C r difféomorphisme, alors pour tout ouvert Ũ ⊂ U, on a Ṽ = f(Ũ) est ouvert<br />
et f est un C r difféomorphisme de Ũ dans Ṽ .<br />
5.2 Théorème des Fonctions Implicites<br />
Théorème 5.2.1 Soient E, F , G des espaces de Banach, U ⊂ E × F un ouvert et f : U −→ G<br />
une application de classe C r . Soit (a, b) ∈ U tel que f(a, b) = 0 et tel que la différentielle partielle<br />
D 2 f(a, b) ∈ Isom (F, G). Alors,<br />
a) il existe des voisinages ouverts V de (a, b), A de a, il existe une application<br />
telle que, pour tout x ∈ A<br />
ϕ : A −→ F<br />
f(x, ϕ(x)) = 0.<br />
b) (x, y) ∈ V et f(x, y) = 0 ⇐⇒ x ∈ A et y = ϕ(x), autrement dit<br />
où S = {(x, y) ∈ U : f(x, y) = 0}.<br />
c) ϕ(.) est de classe C r sur A et<br />
S ∩ V = {(x, ϕ(x)) : x ∈ A},<br />
Dϕ(x) = −(D 2 f(x, ϕ(x))) −1 ◦ D 1 f(x, ϕ(x)).<br />
93
Démonstration. Comme Isom (F, G) est ouvert dans L(F, G) et comme D 2 f est continue, on a<br />
(D 2 f) −1 (Isom (F, G)) est un ouvert qui contient (a, b). On peut alors supposer que D 2 f(x, y) ∈<br />
Isom (F, G) pour tout (x, y) ∈ U. Définissons<br />
par<br />
h : U −→ E × G<br />
h(x, y) = (x, f(x, y)).<br />
pour tout (x, y) ∈ U. L’application h est de classe C r car h = (h 1 , h 2 ) avec h 1 et h 2 de classe C r .<br />
On a donc, pour tout (u, v) ∈ E × F<br />
Dh(x, y)(u, v) = (u, D 1 f(x, y)u + D 2 f(x, y)v).<br />
On observe que L = Dh(a, b) est bijective. En effet si (u, v) ∈ ker L, alors u = 0 et D 2 f(a, b)v =<br />
0 d’où v = 0. De plus, si on considère (u, w) ∈ E × G, on a L(u, v) = (u, w) où l’on a posé<br />
v = (D 2 f(a, b)) −1 (w − D 1 f(a, b)u). Observons que l’on a montré que<br />
(Dh(a, b)) −1 = (π E , D 2 f(a, b) ◦ (π G − D 1 f(a, b) ◦ π E )),<br />
ce qui implique que Dh(a, b) est un isomorphisme. On peut donc appliquer le Théorème 5.1.2 qui<br />
garantit l’existence d’un voisinage V ′ de (a, b) tel que h soit un C r difféomorphisme de V ′ dans<br />
l’ouvert W ′ = h(V ′ ) qui est un voisinage de h(a, b) = (a, 0). Il existe alors un voisinage ouvert<br />
A de a et un voisinage ouvert B de 0 dans G tels que A × B ⊂ W ’. Posons W = A × B et<br />
V = h −1 (W ). Il est clair que h est un C r difféomorphisme de V dans W . Pour tout x ∈ A, posons<br />
ϕ(x) = (π F ◦ h −1 )(x, 0).<br />
L’application ϕ est de classe C r comme composée de trois applications de ce type. Pour tout<br />
x ∈ A, on a h −1 (x, 0) = (x, ϕ(x)) donc (x, 0) = h(x, ϕ(x)) = (x, f(x, ϕ(x))) ce qui montre que<br />
f(x, ϕ(x)) = 0. De plus, si (x, y) ∈ V vérifie f(x, y) = 0 on a h(x, y) = (x, 0) = h(x, ϕ(x)) et<br />
(x, ϕ(x)) ∈ V ce qui implique y = ϕ(x) car h est injective sur V . Il reste alors à calculer Dϕ. On<br />
remarque pour ceci que pour tout x ∈ A on a f(x, ϕ(x)) = 0. Remarquons alors que f ◦ Φ = 0<br />
où Φ : A −→ V est définie par Φ(x) = (x, ϕ(x)). Il en résulte que, pour tout x ∈ A et pour tout<br />
u ∈ E, on a D(f ◦ Φ)(x)(u) = 0, d’où D 1 f(x, ϕ(x))(u) + D 2 (f, ϕ(x))(Dϕ(x)(u)) = 0. Il en<br />
résulte bien que<br />
Dϕ(x)(u) = −((D 2 f(x, ϕ(x))) −1 ◦ D 1 f(x, ϕ(x)))(u).<br />
Remarque 5.2.1 On vient de démontrer le Théorème des fonctions implicites à l’aide du Théorème<br />
du difféomorphisme local. On peut également faire l’inverse. En effet, étant donné f :<br />
U −→ F une application de classe C r , r ≥ 1 définie sur un ouvert U d’un espace de Banach<br />
E et à valeurs dans un espace de Banach F et a ∈ U tel que Df(a) ∈ Isom (E, F ), on définit<br />
94
g : U ×F → F par g(x, y) = f(x)−y. Posant b = f(a) on a D 1 g(a, b) = Df(a) ∈ Isom (E, F ).<br />
D’après le Théorème 5.2.1 il existe un voisinage ouvert V de (a, b), un voisinage ouvert B de b et<br />
une application ψ : B −→ X de classe C r telle que (x, y) ∈ V et g(x, y) = 0 si et seulement si<br />
y ∈ B et x = ψ(y). Posons<br />
A = {x ∈ X : (x, f(x)) ∈ V }.<br />
C’est un ensemble ouvert comme image réciproque d’un ouvert par une application continue et<br />
a ∈ A. On a alors que f est bijective de A dans B et f −1 = ψ sur B. En effet si x 1 , x 2 ∈ A vérifient<br />
f(x 1 ) = f(x 2 ) := y on a (x 1 , y), (x 2 , y) ∈ V et g(x 1 , y) = g(x 2 , y) = 0 donc x 1 = x 2 = ψ(y).<br />
Par ailleurs si y ∈ B, posant x = ψ(y) on a (x, y) ∈ V et f(x) = y donc x ∈ A. On a donc bien<br />
montré que f était un C r difféomorphisme de A dans B.<br />
5.3 Application : Multiplicateurs de Lagrange<br />
Théorème 5.3.1 Soient g : U −→ F une application de classe C 1 définie sur un ouvert U d’un<br />
espace de Banach E, à valeurs dans un espace de Banach F et f : U −→ R une fonction. On<br />
pose S = g −1 (0) et on suppose que a ∈ S est un extremum local de f sur S. On suppose aussi<br />
que f est différentiable en a et que :<br />
– Dg(a) ∈ L(E, F ) est surjective ;<br />
– ker Dg(a) admet un supplémentaire topologique (i.e. E = ker Dg(a) ⊕ Y avec projections<br />
continues).<br />
Alors, il existe λ ∈ F ∗ = L(F, R) unique tel que<br />
Df(a) = λ ◦ Dg(a).<br />
Démonstration. On pose X = ker Dg(a) et on considère un sous-espace vectoriel fermé Y ⊂ E<br />
tel que E = X⊕Y dont l’existence est garantie par l’hypothèse. Soit r > 0 tel que la boule ouverte<br />
B(a, 2r) soit contenue dans U. Posant V = X ∩ B(0, r) et W = Y ∩ B(0, r), on remarque que<br />
V et W sont des ouverts non vides de Y et de Y et que a + V + W ⊂ U, ce qui permet de définir<br />
une application h : V × W −→ F par h(v, w) = g(a + v + w). L’application h est de classe C 1<br />
comme composée d’une application de classe C 1 et d’une application affine continue. On a alors<br />
Dh(v, w) = Dg(a + v + w) ◦ l avec l : X × Y −→ E définie par l(h, k) = h + k pour tout<br />
(h, k) ∈ X × Y . Il en résulte que<br />
et<br />
D 1 h(v, w) = Dh(v, w) ◦ l(·, 0) = Dg(a + v + w) |X ,<br />
D 2 h(v, w) = Dh(v, w) ◦ l(0, ·) = Dg(a + v + w) |Y .<br />
On a h(0, 0) = 0. Comme E = ker Dg(a) ⊕ Y , on a ker Dg(a) |Y = ker Dg(a) ∩ Y = {0} donc<br />
Dg(a) |Y est injective. Par ailleurs, comme Dg(a) est surjective, tout élément w ∈ F s’écrit w =<br />
Dg(a)(u + v) avec (u, v) ∈ ker Dg(a) × Y , donc w = Dg(a) |Y (v), ce qui montre que Dg(a) |Y<br />
est aussi surjective. On obtient donc que D 2 h(0, 0) = Dg(a) |Y ∈ Isom (Y, F ) et h(0, 0) = 0.<br />
Utilisant le théorème des fonctions implicites, il existe un voisinage ouvert A de 0 dans X et une<br />
application ϕ : A −→ Y telle que<br />
g(a + v + ϕ(v)) = 0 pour tout v ∈ A,<br />
95
avec<br />
Dϕ(0) = −(D 2 h(0, 0)) −1 ◦ D 1 h(0, 0) = −(Dg(a) |Y ) −1 ◦ Dg(a) |X = 0,<br />
car Dg(a) |X = 0. Supposant que a est un minimum local de f sur S, on a, pour tout v dans un<br />
voisinage de 0,<br />
f(a + v + ϕ(v)) ≥ f(a) = f(a + 0 + ϕ(0)),<br />
ce qui implique que la fonction θ(v) = f(a + v + ϕ(v)) a un minimum local en 0, d’où<br />
0 = Dθ(0) = Df(a) ◦ (I X + Dϕ(0)) = Df(a) |X .<br />
Posons alors λ = Df(a) ◦ (Dg(a) |Y ) −1 ∈ L(F, R). On a, par définition :<br />
De plus<br />
Df(a) |Y = (λ ◦ Dg(a)) |Y .<br />
Df(a) |X = (λ ◦ Dg(a)) |X = 0,<br />
donc Df(a) = λ ◦ Dg(a) car E = X ⊕ Y . L’unicité de λ découle du fait que Df(a) = λ ◦ Dg(a)<br />
implique Df(a) |Y = (λ ◦ Dg(a)) |Y , d’où λ = Df(a) ◦ (Dg(a) |Y ) −1 .<br />
Remarque 5.3.1 a) Le théorème précédent reste vrai sans avoir à supposer que ker Dg(a) admet<br />
un supplémentaire topologique ; mais la démonstration dépasse alors le niveau de ce cours.<br />
b) Dans le cas où E est un espace de Hilbert, il est toujours vrai que ker Dg(a) admet un<br />
supplémentaire topologique (son orthogonal, par exemple).<br />
On en déduit le<br />
Corollaire 5.3.1 Soient U ⊂ R n un ouvert, g : U −→ R m une application de classe C 1 et<br />
f : U −→ R une fonction. On pose S = g −1 (0) et on suppose que a ∈ S est un extremum local<br />
de f sur S. On suppose aussi que f est différentiable en a et que :<br />
Alors, il existe λ ∈ R m unique tel que<br />
(∇g 1 (a), · · · , ∇g m (a)) sont linéairement indépendant.<br />
∇f(a) =<br />
m∑<br />
λ i ∇g i (a).<br />
i=1<br />
Démonstration. On a Dg(a)u = (〈∇g 1 (a), u〉, · · · , 〈∇g m (a), u〉) pour tout u ∈ R n , de telle sorte<br />
que Dg(a) T (v) = ∑ m<br />
i=1 v i∇g i (a) pour tout v ∈ R m . Comme (∇g 1 (a), · · · , ∇g m (a)) sont linéairement<br />
indépendant, il en résulte que Dg(a) T est injective donc Dg(a) est surjective. Par ailleurs<br />
ker Dg(a) admet un supplémentaire topologique (son orthogonal, par exemple). Appliquant le<br />
Théorème 5.3.1, il existe λ ∈ R m unique tel que Df(a)u = 〈λ, Dg(a)u〉 pour tout u ∈ R n , soit<br />
〈∇f(a), u〉 =<br />
m∑<br />
〈 ∑ m 〉<br />
λ i 〈∇g i (a), u〉 = λ i ∇g i (a), u ,<br />
i=1<br />
96<br />
i=1
d’où<br />
∇f(a) =<br />
m∑<br />
λ i ∇g i (a).<br />
i=1<br />
Remarque 5.3.2 La condition nécessaire donnée dans le Théorème 5.3.1 permet parfois de déterminer<br />
l’extremum.<br />
5.4 Introductions aux sous-variétés<br />
5.4.1 Immersion et submersion locale<br />
Pour m ≤ n on notera π l’application linéaire surjective π : R n −→ R m définie pour tout x ∈ R n<br />
par π(x 1 , · · · , x n ) = (x n−m+1 , · · · , x n ), et pour n ≤ m, on notera par j : R n −→ R m l’application<br />
linéaire injective définie pour tout x ∈ R m par<br />
j(x 1 , · · · , x n ) = (x 1 , · · · , x n , 0, · · · , 0).<br />
Théorème 5.4.1 IMMERSION. Soit U ⊂ R n un ouvert, soit g : U −→ R m une application de<br />
classe C r et soit a ∈ U tel que Dg(a) soit injective. Alors il existe des ouvert U ⊃ U ′ ∋ a,<br />
R m ⊃ V ∋ g(a) tels que g(U ′ ) ⊂ V et un C r -difféomorphisme f de V sur un ouvert f(V ) de R m<br />
tel que<br />
f(g(x)) = j(x) = (x 1 , · · · , x n , 0, · · · , 0) pour tout x ∈ U ′ ,<br />
de plus, on a<br />
f(V ) ∩ (R n × {0}) = f(g(U ′ )).<br />
Démonstration. Notons que n ≤ m car Dg(a) est injective et considérons un sous-espace vectoriel<br />
F de R m tel que R m = Dg(a)(R n ) ⊕ F de sorte que la dimension de F est m − n. Soit ψ un<br />
isomorphisme de R m−n dans F et soit h : U × R m−n −→ R m définie par h(x, y) = g(x) + ψ(y).<br />
L’application h est de classe C r et Dh(x, y)(u, v) = Dg(x)(u)+ψ(v) ce qui montre que Dh(a, 0)<br />
est surjective, donc bijective car Dh(a, 0) ∈ L(R m , R m ). Il existe donc des ouverts R n ⊃ U ′ ∋ a<br />
et R m−n ⊃ W ′ ∋ 0 tels que h soit un C r difféomorphisme de U ′ × W ′ dans un ouvert V ∋ g(a)<br />
de R m . Posant f = h −1 , on a g(U ′ ) ⊂ h(U ′ × W ′ ) = V , et, pour tout x ∈ U ′ , f(g(x)) =<br />
f(h(x, 0)) = (x, 0) = j(x). On a donc montré que f(g(U ′ )) ⊂ f(V ) ∩ (R n × {0}). Réciproquement,<br />
étant donné z = (z 1 , · · · , z n , 0) ∈ f(V ) ∩ (R n × {0}), on a donc x = (z 1 , · · · , z n ) ∈ U ′<br />
donc f(g(x)) = z donc z ∈ f(g(U ′ )).<br />
Théorème 5.4.2 SUBMERSION. Soit U ⊂ R n un ouvert, soit f : U −→ R m une application de<br />
classe C r et soit a ∈ U tel que Df(a) soit surjective. Alors il existe un ouvert U ⊃ U ′ ∋ a et un<br />
C r -difféomorphisme g de U ′ sur un ouvert g(U ′ ) de R n tel que<br />
π(g(x)) = f(x) pour tout x ∈ U ′ .<br />
97
De plus, si f(a) = 0, on a<br />
g(U ′ ∩ S) = g(U ′ ) ∩ (R n−m × {0}),<br />
où S = {x ∈ U : f(x) = 0}.<br />
Démonstration. Notons que m ≤ n car Df(a) est surjective et que dim(ker(Df(a))) = n−m. Il<br />
existe alors une application linéaire ψ : R n −→ R n−m telle que ψ |ker(Df(a)) soit injective (prendre<br />
une base (e 1 , · · · , e n−m ) de ker(Df(a)) et poser ψ(x) = (y 1 , · · · , y n−m ) coordonnées dans cette<br />
base de la projection orthogonale de x sur ker(Df(a))). Introduisons g : U −→ R n par g = (ψ, f)<br />
de telle sorte que g est de classe C r sur U et Dg(a) = (ψ, Df(a)). Soit u ∈ ker(Dg(a)), on<br />
a u ∈ ker(Df(a)) et ψ(u) = 0 donc u = 0, d’où Dg(a) est injective et alors bijective car<br />
Dg(a) ∈ L(R n , R n ). Il existe donc des ouverts U ⊃ U ′ ∋ a et R n ⊃ g(U ′ ) ∋ g(a) tels que g soit<br />
un C r -difféomorphisme U ′ dans g(U ′ ). Il est alors clair que f = π ◦g sur U ′ . Pour tout x ∈ S ∩U ′ ,<br />
on a alors g(x) = (ψ(x), f(x)) = (ψ(x), 0) donc g(U ′ ∩S) ⊂ g(U ′ )∩(R n−m ×{0}). Par ailleurs,<br />
si z ∈ g(U ′ ) ∩ (R n−m × {0}), alors z = g(x) avec x ∈ U ′ et z = (y, 0) avec y ∈ R n−m d’où<br />
(y, 0) = (ψ(x), f(x)), ce qui montre bien que x ∈ S donc z ∈ g(U ′ ∩ S).<br />
5.4.2 Définitions équivalentes des sous-variétés<br />
Définition 5.4.1 Une partie non vide S ⊂ R n est appelée sous-variété de classe C r et de dimension<br />
d ∈ N si, pour tout a ∈ S, il existe un ouvert V ∋ a et un C r -difféomorphisme f de V dans<br />
un ouvert W ∋ f(a) tel que<br />
f(V ∩ S) = f(V ) ∩ (R d × {0}).<br />
Exemple 5.4.1 a) Un ouvert de R n est une sous-variété de dimension n et de classe C ∞ (prendre<br />
f = I R n). On pourra démontrer en exercice que, réciproquement, toute sous-variété de dimension<br />
n est un ouvert de R n .<br />
b) Étant donnée une sous-variété S de dimension 0 et a ∈ S, alors S ∩ V = f(V ) ∩ {0} = {0}<br />
donc S ∩ V = {a}.<br />
c) Un sous-espace affine L ⊂ R n de dimension d est une sous-variété de dimension d. En effet,<br />
étant donné a ∈ L on considère une base (e 1 , · · · , e n ) de R n telle que (e 1 , · · · , e d ) soit une base<br />
de L − a, et on considère l’isomorphisme ϕ : R n −→ R n qui à x ∈ R n associe ses cooordonnées<br />
(x 1 , · · · , x n ) dans cette base. Posant f(x) = ϕ(x) − ϕ(a), on a f(L) = R d × {0}.<br />
Théorème 5.4.3 Considérons les propriétés suivantes relatives à une partie non vide S ⊂ R n .<br />
i) S est une sous-variété de classe C r et de dimension d.<br />
ii) Pour tout a ∈ S, il existe un ouvert R n ⊃ U ∋ a et une application h = (h 1 , · · · , h n−d ) : U −→<br />
R n−d de classe C r avec (∇h 1 (a), · · · , ∇h n−d (a)) linéairement indépendants (ce qui équivaut à<br />
dire que Dh(a) est surjective) telles que<br />
S ∩ U = h −1 (0).<br />
98
iii) Pour tout a ∈ S, il existe un ouvert R n ⊃ V ∋ a, un ouvert R d ⊃ W ∋ (a 1 , · · · , a d ) et une<br />
application g : W −→ R n−d de classe C r telle que, à une permutation près des coordonnées, on<br />
ait<br />
S ∩ V = {(z, g(z)) : z ∈ W }.<br />
iv) Pour tout a ∈ S, il existe des ouverts R n ⊃ V ∋ a, R d ⊃ Ω ∋ 0 et une application p : Ω −→<br />
R n de classe C r telle que<br />
p(0) = a, Dp(0) est injective et p est un homéomorphisme de Ω dans S ∩ V.<br />
Alors, ces quatres propriétés sont équivalentes.<br />
Démonstration. Montrons que i) =⇒ ii) =⇒ iii) =⇒ iv) =⇒ i).<br />
i) =⇒ ii). Définissons h = π◦f : V −→ R n−d avec π(y 1 , · · · , y n ) = (y d+1 , · · · , y n ). L’application<br />
h est de classe C r sur V et Dh(a) = π ◦ Df(a) est surjective car π est surjective et Df(a) est<br />
bijective. Pour x ∈ V , on a h(x) = 0. Réciproquement, si h(x) = 0, on a f(x) ∈ f(V )∩(R d ×{0})<br />
donc f(x) = f(z) avec z ∈ S donc x = z ∈ S car f est injective sur V . On a donc bien<br />
S ∩ V = h −1 (0).<br />
ii) =⇒ iii). Comme Dh(a) est surjective, il existe {i 1 , · · · , i n−d } ⊂ [1, n] tels que<br />
(Dh(a)e i1 , · · · , Dh(a)e in−d )<br />
soient linéairement indépendants. Quitte à permuter les coordonnées, on peut supposer que<br />
(Dh(a)e d+1 , · · · , Dh(a)e n )<br />
sont linéairement indépendants. Écrivant R n = R d × R n−d , on a, pour tout v ∈ R n−d ,<br />
D 2 h(a)(v) = Dh(a)(0, v) =<br />
n∑<br />
j=d+1<br />
v j Dh(a)(e j ),<br />
ce qui montre que D 2 h(a) ∈ L(R n−d , R n−d ) est injective donc bijective. Appliquant le Théorème<br />
des fonctions implicites, il existe des voisinages ouverts A de (a 1 , · · · , a d ) dans R d et V ⊂ U de a<br />
dans R n et une application g : A −→ R n−d de classe C r tels que<br />
h −1 (0) ∩ V = {(z, g(z)) : z ∈ A},<br />
soit<br />
S ∩ V = S ∩ U ∩ V = h −1 (0) ∩ V = {(z, g(z)) : z ∈ A}.<br />
iii) =⇒ iv). Posons Ω = W − â, où â = (a 1 , · · · , a d ), de telle sorte que g(â) = (a d+1 , · · · , a n ), et,<br />
pour tout t ∈ Ω, p(t) = (â + t, g(â + t)) d’où p(0) = (â, g(â)) = a. L’application p est de classe<br />
C r et Dp(0)(u) = (u, Dg(a)(u)) pour tout u ∈ R d ce qui montre que Dp(0) est injective. On a<br />
p(Ω) = S ∩ V.<br />
99
De plus, p étant injective est une bijection de Ω dans p(Ω) = S ∩ V . Enfin la bijection inverse est<br />
définie pour tout x ∈ S ∩ V par (x 1 − a 1 , · · · , x d − a d ) qui est continue, ce qui montre bien que p<br />
est un homéomorphisme de Ω dans S ∩ V .<br />
iv) =⇒ i). D’après le Théorème 5.4.1, il existe un ouvert ˆΩ ⊂ Ω contenant 0, un ouvert Ŵ ∋ a tel<br />
que p(ˆΩ) ⊂ Ŵ et un Cr -difféomorphisme f de Ŵ dans un ouvert f(Ŵ ) tels que<br />
f(p(ˆΩ)) = f(Ŵ ) ∩ (Rd × {0}).<br />
Comme ˆΩ est un ouvert et p un homéomorphisme, on obtient que p(ˆΩ) est un ouvert de S ∩ V .<br />
Il existe donc un ouvert ˆV ∋ a tel que p(ˆΩ) = ˆV ∩ S. Comme p(ˆΩ) ⊂ Ŵ , on peut supposer que<br />
ˆV ⊂ Ŵ . On a alors<br />
f( ˆV ∩ S) = f(p(ˆΩ)) = f(Ŵ ) ∩ (Rd × {0}) ⊃ f( ˆV ) ∩ (R d × {0}),<br />
et f( ˆV ∩ S) ⊂ f( ˆV ) et f( ˆV ∩ S) = f(p(ˆΩ)) ⊂ R d × {0} donc f( ˆV ∩ S) ⊂ f( ˆV ) ∩ (R d × {0}),<br />
d’où<br />
f( ˆV ∩ S) = f( ˆV ) ∩ (R d × {0}).<br />
Remarque 5.4.1 C’est un bon exercice de montrer d’autres implications que celles strictement<br />
nécessaires à la démonstration du théorème précédent.<br />
ii) =⇒ i). D’après le Théorème 5.4.2, il existe un ouvert V ⊃ V ′ ∋ a et un C r -difféomorphisme g<br />
de V ′ dans un ouvert g(V ′ ) de R n tel que π d (g(x)) = f(x) pour tout x ∈ V ′ avec π d (y 1 , · · · , y n ) =<br />
(y d+1 , · · · , y n ) et tel que g(V ′ ∩ S) = g(V ′ ) ∩ (R d × {0}).<br />
iii) =⇒ ii). Considérons l’ouvert ˆV = V ∩(W ×R d ). On vérifie immédiatement que a ∈ ˆV et que<br />
S ∩ ˆV = {(z, g(z)) : z ∈ W }. Introduisons l’application h : ˆV −→ R n−d par h(z, y) = y − g(z).<br />
On vérifie alors que<br />
h −1 (0) = ˆV ∩ S.<br />
De plus pour tout (w, v) ∈ R d × R n−d on a Dh(a)(w, v) = v − Dg(a 1 , · · · , a d )(w) donc<br />
v = Dh(a)(0, v) d’où Dh(a) est surjective, ce qui équivaut à ∇h 1 (a), · · · , ∇h m (a) linéairement<br />
indépendants.<br />
i) =⇒ iv). On peut supposer sans perte de généralité que f(a) = 0. Définissons<br />
π 0 (y 1 , · · · , y n ) = (y 1 , · · · , y d )<br />
et Ω = π 0 (f(V ) ∩ (R d × {0})). L’ensemble Ω est ouvert (vérification facile) et contient 0. Pour<br />
t ∈ Ω, on a (t, 0) ∈ f(V ), on peut donc poser p(t) = f −1 (t, 0). L’application ainsi définie est<br />
de classe C r et, pour tout w ∈ R d , on a Dp(0)(w) = Df −1 (0)(w, 0) = (Df(a)) −1 (w, 0), ce qui<br />
montre que Dp(0) est injective. Par ailleurs t ∈ Ω si et seulement si (t, 0) ∈ f(V ) ∩ (R d × {0})<br />
donc p(Ω) = S ∩ V . Enfin pour tout x ∈ S ∩ V , on a p −1 (x) = π 0 (f(x)) ce qui montre que p −1<br />
est continue, donc p est bien un homéomorphisme de Ω dans S ∩ V .<br />
100
iv) =⇒ iii). (C’est un peu moins facile). Comme Dp(0) est injective, on a Dp(0) T est surjective,<br />
ce qui implique que le sous-espace vectoriel engendré par ∇p 1 (0), · · · , ∇p n (0) est R d . Il existe<br />
donc i 1 , · · · , i d ∈ [1, n] tels que (∇p i1 (0), · · · , ∇p id (0)) est une base de R d . En permutant les coordonnées,<br />
on peut supposer que (∇p 1 (0), · · · , ∇p d (0)) est une base de R d , ce qui implique que<br />
l’application q : Ω −→ R d définie par q(t) = (p 1 (t), · · · , p d (t)) vérifie Dq(0) ∈ Isom (R d ).<br />
Il existe donc un ouvert ˆΩ ∋ 0 tel que q soit un C r -difféomorphisme de ˆΩ dans un ouvert<br />
R d ⊃ Ŵ ∋ â = (a 1, · · · , a d ). Comme p est un homéomorphisme de Ω dans S ∩ V , il existe<br />
un ouvert R n ⊃ ˆV ∋ a tel que p(ˆΩ) = S ∩ ˆV . Introduisons alors g : Ŵ −→ R n−d par<br />
g(ẑ) = (p d+1 (q −1 (ẑ), · · · , p n (q −1 (ẑ)). L’application g est de classe C r sur Ŵ et<br />
{(ẑ, g(ẑ)) : ẑ ∈ Ŵ } = S ∩ ˆV .<br />
En effet, si x ∈ S ∩ ˆV , alors x = p(t) pour un t ∈ ˆΩ et ẑ = (p 1 (t), · · · , p d (t)) ∈ Ŵ de telle sorte<br />
que<br />
x = (p 1 (t), · · · , p d (t), p d+1 (t), · · · , p n (t)) = (ẑ, g(ẑ)).<br />
Réciproquement, si x = (ẑ, g(ẑ)) pour ẑ ∈ Ŵ , alors t = q−1 (ẑ) ∈ ˆΩ, d’où<br />
donc x ∈ p(ˆΩ) = S ∩ ˆV .<br />
x = (p 1 (t), · · · , p d (t), p d+1 (t), · · · , p n (t)),<br />
iii) =⇒ i). Soit U l’ouvert de R n défini par U = W × R n−d et soit f : U −→ R n définie<br />
par f(y, z) = (y, g(y) − z). L’application f est de classe C r et, pour tout u = (v, w) ∈ R n ,<br />
on a Df(a)u = (v, Dg(â)v − w) où â = (a 1 , · · · , a d ). Il en résulte que Df(a) est injective<br />
donc bijective car Df(a) ∈ L(R n , R n ). D’après le Théorème du difféomorphisme local, il existe<br />
donc un ouvert ˆV ∋ a tel que ˆV ⊂ W × R n−d et tel que f soit un C r difféomorphisme de ˆV<br />
dans l’ouvert Ŵ = f( ˆV ). Étant donné x = (y, z) ∈ S ∩ ˆV , on a y ∈ W donc z = g(y) et<br />
f(x) = (y, 0) ∈ f( ˆV ) ∩ R d × {0}. Réciproquement, si x = (y, 0) ∈ f( ˆV ) ∩ R d × {0}, alors<br />
y ∈ W et il existe z ∈ R n−d tel que x = (y, g(y) − z) = (y, 0) d’où z = g(y) donc (y, z) ∈ S et<br />
x ∈ f(S ∩ ˆV ). On a donc bien<br />
5.4.3 Sous-espace tangent<br />
f(S ∩ ˆV ) = f( ˆV ) ∩ R d × {0}.<br />
Définition 5.4.2 Soit S ⊂ R n une sous-variété de classe C r et de dimension d. On dit que u ∈ R n<br />
est tangent à S en a ∈ S s’il existe η > 0 et une fonction ϕ :] − η, +η[−→ S dérivable en 0 telle<br />
que ϕ(0) = a et ϕ ′ (0) = u.<br />
Théorème 5.4.4 L’ensemble T a S des vecteurs tangents en a à une sous-variété S ∋ a de classe<br />
C r et de dimension d est un espace vectoriel de dimension d.<br />
Démonstration. Considérons le voisinage ouvert V de a et le C r -difféomorphisme f : V −→<br />
f(V ) tel que f(S ∩ V ) = f(V ) ∩ R d × {0}. On peut supposer que f(a) = 0. Soit alors v ∈ T a S<br />
et ϕ :] − η, +η[−→ S dérivable en 0 telle que ϕ(0) = a et ϕ ′ (0) = u. On peut supposer, quitte<br />
101
à diminuer η que ϕ(] − η, +η[) ⊂ S ∩ V . Définissant alors α :] − η, +η[−→ R d × {0} par<br />
α(t) = f(ϕ(t)), on a<br />
α ′ (0) = Df(ϕ(0))ϕ ′ (0) = Df(a)u,<br />
et α ′ (0) ∈ R d × {0} donc Df(a)u ∈ R d × {0}. Réciproquement, soit w ∈ R d × {0}. On a<br />
0 = f(a) ∈ f(V )∩R d ×{0} et f(V )∩R d ×{0} est un ouvert de R d ×{0} car f(V ) est un ouvert<br />
de R n . Il existe donc η > 0 tel que tw ∈ f(V )∩R d ×{0} = f(S∩V ) pour tout t ∈]−η, +η[. Posant<br />
ϕ(t) = f −1 (tw), on a ϕ :] − η, +η[−→ S ∩ V , ϕ(0) = a et ϕ ′ (0) = Df −1 (0)w = (Df(a)) −1 (w)<br />
et u = ϕ ′ (0) ∈ T a S. On a alors w = Df(a)u avec u ∈ T a S. On a donc montré que<br />
T a S = (Df(a)) −1 (R d × {0}).<br />
Comme (Df(a)) −1 est un isomorphisme et comme R d ×{0} est un espace vectoriel de dimension<br />
d, il en est de même pour T a S.<br />
on peut aussi calculer l’espace tangent T a S à l’aide des définitions équivalentes des sous-variétés<br />
données dans le théorème 5.4.4.<br />
Proposition 5.4.1 Dans le cas ii), on a<br />
T a S = ker Dh(a) = {u ∈ R n : 〈∇h i (a), u〉 = 0, i ∈ [1, n − d]}.<br />
Dans le cas iii), on a, posant â = (a 1 , · · · , a d ),<br />
T a S = {(v, Dg(â)v) : v ∈ R d }.<br />
Dans le cas iv), on a<br />
T a S = Dp(0)(R d ) = {Dp(0)v : v ∈ R d }.<br />
102