LICENCE DE MATHÉMATIQUES FONDAMENTALES Calcul ...

LICENCE DE MATHÉMATIQUES 

FONDAMENTALES 

Calcul Différentiel et Équations Différentielles 

D. Azé 

Université Paul Sabatier Toulouse 

2008

Table des matières 

1 Généralités sur les espaces normés 3 

1.1 Espaces vectoriels normés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 

1.2 Espaces de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 

1.3 Applications linéaires continues . . . . . . . . . . . . . . . . . . . . . . . . . . 8 

1.4 Normes équivalentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 

1.5 Applications multilinéaires continues . . . . . . . . . . . . . . . . . . . . . . . . 15 

1.6 Espaces de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 

2 Applications différentiables dans les espaces normés 29 

2.1 Définition d’une application différentiable . . . . . . . . . . . . . . . . . . . . . 29 

2.2 Opérations sur les applications différentiables . . . . . . . . . . . . . . . . . . . 35 

2.3 Applications à valeurs dans un produit d’espaces . . . . . . . . . . . . . . . . . 38 

2.4 Applications définies sur un produit d’espaces . . . . . . . . . . . . . . . . . . . 39 

3 Théorème des Accroissements Finis et Applications 47 

3.1 Théorème des Accroissements Finis . . . . . . . . . . . . . . . . . . . . . . . . 47 

3.2 Applications du Théorème des Accroissements Finis . . . . . . . . . . . . . . . 51 

3.3 Applications Strictement Différentiables . . . . . . . . . . . . . . . . . . . . . . 55 

3.4 Opérateurs de Nemicki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 

3.5 Primitives et Intégrales des Fonctions Réglées . . . . . . . . . . . . . . . . . . . 60 

4 Différentielles d’Ordre Supérieur 67 

4.1 Définition des Différentielles d’Ordre Supérieur . . . . . . . . . . . . . . . . . . 67 

4.2 Propriétés de Symétrie des Différentielles d’Ordre Supérieur . . . . . . . . . . . 71 

4.3 Formules de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 

4.4 Conditions d’Optimalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 

5 Théorèmes d’Inversion et Applications 89 

5.1 Théorèmes d’inversion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 

5.2 Théorème des Fonctions Implicites . . . . . . . . . . . . . . . . . . . . . . . . 93 

5.3 Application : Multiplicateurs de Lagrange . . . . . . . . . . . . . . . . . . . . . 95 

5.4 Introductions aux sous-variétés . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 

5.4.1 Immersion et submersion locale . . . . . . . . . . . . . . . . . . . . . . 97 

5.4.2 Définitions équivalentes des sous-variétés . . . . . . . . . . . . . . . . . 98 

1

5.4.3 Sous-espace tangent . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 

2

Chapitre 1 

Généralités sur les espaces normés 

1.1 Espaces vectoriels normés 

Le cadre naturel pour l’étude du calcul différentiel est celui des espaces vectoriels normés de 

dimension finie ou non. Commençons donc par rappeler les notions de base qui nous seront utiles 

dans la suite. 

Définition 1.1.1 Étant donné un espace vectoriel réel E, une norme est une fonction 

vérifiant 

i) ‖x‖ = 0 si et seulement si x = 0 ; 

‖ · ‖ : E → R + , 

ii) ‖λx‖ = |λ|‖x‖, pour tout λ ∈ R et x ∈ E ; 

iii) ‖x + y‖ ≤ ‖x‖ + ‖y‖, pour tout x, y ∈ E. 

À toute norme est associée une distance d(x, y) = ‖x − y‖. Un espace normé est un espace 

métrique et donc un espace topologique. Une partie U ⊂ E est ouverte si, pour tout a ∈ U, il 

existe r > 0 tel que ¯B(a, r) ⊂ U où ¯B(a, r) = {x ∈ E : ‖x − a‖ ≤ r}. Les boules ouvertes 

B(a, r) = {x ∈ E : ‖x − a‖ < r} sont des ouverts et tout ouvert est réunion d’une famille 

de boules ouvertes. Une partie F de E est fermée si son complémentaire est ouvert (les boules 

fermées sont des fermés). Une suite (x n ) d’éléments de E est dite converger vers x ∈ E si la suite 

réelle (‖x n − x‖) converge vers 0. On écrit alors x = lim x n ou x n → x. La limite, quand elle 

n→∞ 

existe, est unique ; elle est caractérisée par la propriété : 

pour tout ε > 0, il existe n 0 ∈ N tel que, pour tout n ≥ n 0 , ‖x n − x‖ ≤ ε. 

Les ensembles fermés F sont alors caractérisés par le fait que tout x ∈ E tel que pour tout r > 0, 

F ∩ B(x, r) ≠ ∅ appartient à F , ce qui équivaut à dire qu’ils contiennent toute limite d’une suite 

à valeurs dans F (le démontrer en exercice). 

3

Remarque 1.1.1 

et 

a) Pour tout x, y ∈ X on déduit des inégalités 

‖x‖ ≤ ‖x − y‖ + ‖y‖ 

‖y‖ ≤ ‖y − x‖ + ‖x‖ 

que l’on a, notant que ‖y − x‖ = ‖(−1)(x − y)‖ = ‖x − y‖, 

|‖x‖ − ‖y‖| ≤ ‖x − y‖. 

La fonction x ↦→ ‖x‖ est alors Lipschitzienne de constante 1, ce qui implique en particulier qu’elle 

est continue. 

b) Les applications (λ, x) ↦−→ λx et (x, y) ↦−→ x + y sont continues respectivement de R × E 

dans E et de E × E dans E. En effet si les suites (x n ), (y n ) et (λ n ) convergent respectivement 

vers x ∈ E, y ∈ E et λ ∈ R, on a 

‖(x n + y n ) − (x + y)‖ ≤ ‖x n − x‖ + ‖y n − y‖, 

‖λ n x n − λx‖ = ‖(λ n − λ)x n + λ(x n − x)‖ 

≤ 

≤ 

|λ n − λ|‖x n ‖ + |λ|‖x n − x‖ 

|λ n − λ|M + |λ|‖x n − x‖ 

où M = sup‖x n ‖ < +∞ car une suite convergente est bornée. Il en résulte bien que x + y = 

n∈N 

lim (x n + y n ) et que λx = lim λ n x n . 

n→∞ n→∞ 

c) Dans le cas où E = R n , on identifiera u ∈ R n à une matrice n × 1. Cela donne un sens 

au produit matriciel AX ∈ R n d’une matrice A ∈ M(m, n) par un vecteur X ∈ R n . Avec ces 

notations, le produit scalaire euclidien s’écrit, pour X, Y ∈ R n , 

〈X, Y 〉 = Y T X = 

n∑ 

X i Y i , 

i=1 

où Y T ∈ M(1, n) est la matrice uniligne transposée de Y ∈ M(n, 1). On prendra garde de 

ne pas confondre le scalaire Y T X avec Y X T qui est la matrice carrée de taille n définie par 

[Y X T ] ij = Y i X j . 

Étant donnée une famille finie d’espaces normés E 1 , · · · , E d dont les normes sont indifféremment 

dénotées par ‖·‖, on utilisera sur le produit cartésien E = E 1 ×· · ·×E d les normes suivantes 

(démontrer en exercice que ce sont bien des normes). 

Définition 1.1.2 On pose 

‖(x 1 , · · · , x d )‖ 1 = 

4 

d∑ 

‖x i ‖, 

i=1

et plus généralement pour 1 ≤ p < +∞ 

on pose aussi 

( d∑ ) 1/2, 

‖(x 1 , · · · , x d )‖ 2 = ‖x i ‖ 2 

i=1 

( d∑ ) 1 

‖(x 1 , · · · , x d )‖ p = ‖x i ‖ p p 

, 

i=1 

‖(x 1 , · · · , x d )‖ ∞ = sup ‖x i ‖. 

1≤i≤d 

C’est un exercice facile de montrer qu’une suite (x n ) n∈N dans E 1 × · · · × E d converge pour ces 

normes vers x si et seulement si les suites (x n i) n∈N convergent vers x i dans E i pour tout i ∈ [1, d]. 

1.2 Espaces de Banach 

Rappellons que dans un espace métrique (E, d), une suite (x n ) est dite de Cauchy si 

ce qui équivaut à 

lim d(x n, x m ) = 0, 

(m,n)→∞ 

pour tout ε > 0, il existe n 0 tel que pour tout m, n ≥ n 0 , d(x n , x m ) ≤ ε. 

L’espace métrique (E, d) est dit complet si toute suite de Cauchy est convergente. 

Définition 1.2.1 Un espace de Banach est un espace normé (E, ‖ · ‖) complet pour la distance 

associée à la norme ‖ · ‖. 

Exemple 1.2.1 

a) Considérons R d muni de l’une des normes ‖ · ‖ 1 , ‖ · ‖ 2 , ‖ · ‖ ∞ de la définition 1.1.2. On a, 

pour tout x ∈ R d , 

‖x‖ 2 ≤ ‖x‖ 1 ≤ n‖x‖ ∞ et ‖x‖ ∞ ≤ ‖x‖ 2 . 

Ces inégalités montrent que les suites convergentes sont les mêmes pour ces trois normes et qu’une 

suite converge si et seulement si les d suites de ses composantes convergent au sens usuel de R 

vers des limites qui sont alors les composantes de la limite. L’espace R d est alors de Banach pour 

ces trois normes (il est en fait complet pour toute norme comme on le verra dans la suite de ce 

chapitre). 

b) Plus généralement un produit fini d’espaces de Banach est de Banach pour les normes de la 

définition 1.1.2. 

c) Soit p un élément de R tel que 1 ≤ p ≤ ∞, on définit 

l p = {(x n ) n∈N ∗ ⊂ R : ‖x‖ p < +∞} 

5

où 

( ∑ ∞ ) 1/p 

‖x‖ p = |x n | p si 1 ≤ p < +∞, 

n=1 

‖x‖ ∞ = sup |x n | si p = +∞. 

n≥1 

Pour montrer que ‖ · ‖ p est une norme sur l p pour 1 ≤ p < +∞, il faut faire appel aux inégalités 

de Hölder et de Minkowski, le cas p = +∞ étant plus simple (voir T.D.). Montrons que l p est 

complet pour la norme ‖ · ‖ p . Remarquons que si (x n ) n∈N ∗ est une suite dans l p , chaque terme x n 

est une suite de nombres réels dont les termes sont notés (x n i ) i∈N ∗. On a donc un tableau infini à 

double entrée, 

x 1 1, · · · , x 1 i , · · · 

. 

x n 1, · · · , x n i , · · · 

. 

Traitons le cas où 1 ≤ p < +∞. Soit (x n ) n∈N ∗ une suite de Cauchy. Pour tout ε > 0, il existe 

n 0 ∈ N ∗ tel que, pour tout m, n ≥ n 0 , on ait 

∞∑ 

|x n i − x m i | p ≤ ε p . 

i=1 

Pour tout i ∈ N ∗ on obtient donc que la suite (x n i ) n∈N ∗ 

vers un réel x i . Pour tout N ∈ N ∗ , on a 

est de Cauchy dans R et converge donc 

N∑ 

|x n i − x m i | p ≤ 

i=1 

∞∑ 

|x n i − x m i | p ≤ ε p . 

i=1 

En faisant tendre m vers +∞, il vient 

N∑ 

|x n i − x i | p ≤ ε p (1.1) 

i=1 

ce qui implique que x n − x ∈ l p d’où x = x n − (x n − x) ∈ l p car l p est un espace vectoriel. Enfin, 

passant à la limite sur N dans l’inégalité 1.1, on obtient que pour tout n ≥ n 0 , 

‖x n − x‖ p ≤ ε, 

d’où le résultat. Dans le cas p = +∞, la démonstration est analogue. 

d) On se donne un espace métrique (X, d), un espace normé (Y, ‖ · ‖) et on considère l’ensemble 

C b (X, Y ) des applications de X dans Y qui sont continues et bornées (i.e. sup x∈X ‖f(x)‖ < 

+∞). On munit C b (X, Y ) de la norme 

‖f‖ ∞ = sup ‖f(x)‖. 

x∈X 

6

Quand Y = R, on notera simplement C b (X, R) = C b (X). C’est un exercice facile de montrer que 

(C b (X, Y ), ‖·‖ ∞ ) est un espace de Banach quand c’est le cas pour (Y, ‖·‖). Dans le cas particulier 

où X = N et Y = R, on retrouve l’exemple c) en remarquant que C b (N) = l ∞ car toute fonction 

définie sur N est continue ! 

e) L’ensemble C 1 ([0, 1]) des fonctions continuement dérivables sur [0, 1] est un espace de Banach 

muni de la norme 

‖f‖ C 1 = ‖f‖ ∞ + ‖f ′ ‖ ∞ 

est un espace de Banach (le démontrer en exercice). Plus généralement il en est de même de 

l’ensemble C m ([0, 1]) des fonctions m fois continuement dérivables sur [0, 1] avec m ∈ N ∗ muni 

de la norme 

‖f‖ C m = ‖f‖ ∞ + ‖f ′ ‖ ∞ + · · · + ‖f (m) ‖ ∞ . 

f) L’espace C([0, 1]) des fonctions continues sur [0,1] à valeurs réelles muni de la norme 

‖f‖ 1 = 

n’est pas un espace de Banach (le démontrer). 

∫ 1 

0 

|f(t)| dt 

Définition 1.2.2 Soit (E, ‖ · ‖) un espace normé et (x n ) une suite dans E. On pose, pour tout 

n ∈ N, S n = ∑ n 

i=0 x i. On dit que la série de terme général (x n ) converge s’il en est de même de 

la suite (S n ) et on pose 

∞∑ 

x i = lim S n . 

n→∞ 

i=0 

On dit que la série de terme général (x n ) est normalement convergente si la série de terme général 

(‖x n ‖) est convergente. 

Théorème 1.2.1 Dans un espace de Banach (E, ‖ · ‖), toute série normalement convergente est 

convergente et 

∞∑ ∥ ∥∥ ∑ ∞ 

∥ x n ≤ ‖x n ‖. 

Démonstration. Soit n > m, on a 

n=0 

n=0 

‖S n − S m ‖ = ‖x m+1 + · · · + x n ‖ ≤ T n − T m , 

où T n = ∑ n 

i=0 ‖x i‖. La suite (T n ) étant convergente est de Cauchy. Il en est donc de même de 

(S n ) qui est donc convergente. Par ailleurs passant à la limite quand n → +∞ dans l’inégalité 

‖S n ‖ ≤ T n on obtient que ‖S‖ ≤ ‖T ‖, d’où le résultat. 

7

1.3 Applications linéaires continues 

Théorème 1.3.1 Soient (E, ‖·‖) et (F, ‖·‖) deux espaces normés et f : E → F une application 

linéaire. Les propriétés suivantes sont équivalentes 

i) f continue sur E, 

ii) f continue en 0, 

iii) il existe M ≥ 0 tel que pour tout x ∈ E, ‖f(x)‖ ≤ M‖x‖. 

Démonstration. Il est clair que i) ⇒ ii) et que iii) ⇒ i) car, pour tout x, y ∈ X, 

‖f(x) − f(y)‖ = ‖f(x − y)‖ ≤ M‖x − y‖. 

Il reste à montrer que ii) ⇒ iii). De part la continuité de f en 0, il existe η > 0 tel que, pour tout 

z ∈ ¯B(0, η), 

‖f(z)‖ = ‖f(z) − f(0)‖ ≤ 1. 

Soit alors x ∈ E\{0}. Remarquant que z := 

η 

‖x‖ x ∈ ¯B(0, η), on obtient 

η 

‖f(x)‖ = ‖f(z)‖ ≤ 1, 

‖x‖ 

d’où 

‖f(x)‖ ≤ (1/η)‖x‖. 

On notera L(E, F ) l’ensemble des applications linéaires continues de E dans F . Si F = R, 

on note E ∗ = L(E, R) et on dit que E ∗ est le dual topologique de E. 

Remarque 1.3.1 On peut montrer, en utilisant le Théorème de Hahn-Banach, que pour tout espace 

normé (E, ‖ · ‖), E ∗ = L(E, R) ≠ {0}. On peut aussi montrer qu’il existe des applications 

linéaires non continues. 

Définition 1.3.1 Pour tout f ∈ L(E, F ), on pose : 

‖f‖ = inf{M ≥ 0 : pour tout x ∈ E, ‖f(x)‖ ≤ M‖x‖}. 

Cette définition a bien un sens car l’ensemble de réels dont on considère la borne inférieure est 

non vide (Théorème 1.3.1) et minoré par 0. 

Proposition 1.3.1 La fonction ‖.‖ définie ci-dessus est une norme sur L(E, F ) et l’on a, 

‖f(x)‖ 

‖f‖ = sup 

x≠0 ‖x‖ 

= sup ‖f(x)‖ = sup ‖f(x)‖. 

‖x‖≤1 

‖x‖=1 

8

Démonstration. Soit M ≥ 0 tel que ‖f(x)‖ ≤ M‖x‖ pour tout x ∈ E. On a donc pour tout 

x ≠ 0, 

‖f(x)‖ 

≤ M, 

‖x‖ 

d’où 

Passant à la borne inférieure sur M, il vient 

Soit alors ε tel que 0 < ε < ‖f‖, on a 

Il existe donc z ≠ 0 tel que 

Il vient alors 

d’où 

‖f(x)‖ 

sup 

x≠0 ‖x‖ 

‖f(x)‖ 

sup 

x≠0 ‖x‖ 

≤ M. 

≤ ‖f‖. 

‖f‖ − ε ∉ {M ≥ 0 : pour tout x ∈ E, ‖f(x)‖ ≤ M‖x‖}. 

‖f(z)‖ > (‖f‖ − ε)‖z‖. 

‖f(x)‖ 

sup 

x≠0 ‖x‖ 

en faisant tendre ε vers 0. On a donc bien 

≥ ‖f(z)‖ 

‖z‖ 

‖f(x)‖ 

sup 

x≠0 ‖x‖ 

> ‖f‖ − ε, 

≥ ‖f‖ 

‖f(x)‖ 

‖f‖ = sup 

x≠0 ‖x‖ , 

on a alors, notant que ‖f(x)‖ 

‖x‖ 

= f( x 

‖x‖ ) 

Par ailleurs 

‖f(x)‖ 

‖f‖ = sup 

x≠0 ‖x‖ 

≤ sup ‖f(z)‖. 

‖z‖=1 

sup ‖f(x)‖ ≤ ‖f‖ 

‖x‖≤1 

car ‖f(x)‖ ≤ ‖f‖‖x‖ pour tout x ∈ X. En résumé on a 

sup ‖f(x)‖ ≤ sup ‖f(x)‖ ≤ ‖f‖ ≤ sup ‖f(x)‖, 

‖x‖=1 

‖x‖≤1 

‖x‖=1 

d’où le résultat. Nous laissons alors au lecteur le soin de vérifier que la fonction ‖ · ‖ ainsi définie 

sur L(E, F ) est une norme. 

9


a) Pour montrer qu’une application linéaire est continue, il suffit donc de montrer qu’elle est 

bornée sur la boule unité de l’espace de départ. 

b) Ce qu’il faut retenir c’est que si une application linéaire de E dans F est telle qu’il existe 

M ≥ 0 telle que, pour tout x ∈ E, 

‖f(x)‖ ≤ M‖x‖, 

alors f est continue et ‖f‖ ≤ M. Notons également que pour tout f ∈ L(E, F ) et pour tout 

x ∈ E, on a 

‖f(x)‖ ≤ ‖f‖‖x‖, 

on en déduit aisément que, pour tout f ∈ L(E, F ), g ∈ L(F, G), on a 

En effet, pour tout x ∈ E avec ‖x‖ ≤ 1 

d’où 

‖g ◦ f‖ ≤ ‖g‖‖f‖. (1.2) 

‖g(f(x))‖ ≤ ‖g‖‖f(x)‖ ≤ ‖g‖‖f‖, 

‖g ◦ f‖ = sup ‖g(f(x))‖ ≤ ‖g‖‖f‖. 

‖x‖≤1 

L’inégalité 1.2 ne peut pas être remplacée par une égalité. En effet si f et g sont les projections 

orthogonales sur deux sous-espaces orthogonaux non réduits à {0} de R d , on a g ◦ f = 0 et 

‖f‖ = ‖g‖ = 1. 

Exemple 1.3.1 

a) Soit E = C([0, 1]) l’ensemble des fonctions continues définies sur [0, 1] muni de la norme 

‖f‖ ∞ = sup t∈[0,1] |f(t)|. L’application L : E −→ R définie par 

L(f) = 

∫ 1 

0 

f(t) dt 

est linéaire continue et ‖L‖ ≤ 1. En effet, pour tout f ∈ E 

|L(f)| ≤ ∣ 

∫ 1 

0 

f(t) dt∣ ≤ 

∫ 1 

0 

|f(t)| dt ≤ 

∫ 1 

0 

‖f‖ ∞ dt ≤ ‖f‖ ∞ . 

b) Soit 1 

1 

p + 1 q = 1. Soit y ∈ lq et L : l p −→ R définie pour tout x ∈ l p par 

L(x) = 

∞∑ 

x n y n . 

n=1 

La série définissant L(x) est convergente, L est linéaire et 

|L(x)| ≤ ‖y‖ q ‖x‖ p 

10

ce qui montre que L est linéaire et ‖L‖ ≤ ‖y‖ q (voir T.D.). 

c) Soient E, F , G des espaces normés et soient f ∈ L(E, F ), g ∈ L(F, G). Pour tout x ∈ E 

on a 

‖g(f(x))‖ ≤ ‖g‖‖f(x)‖ ≤ ‖f‖‖g‖‖x‖. 

il en résulte que g ◦ f ∈ L(E, G) et 

De plus les applications 

et 

‖g ◦ f‖ ≤ ‖g‖‖f‖. (1.3) 

L : L(E, F ) −→ L(E, G) 

f ↦−→ f ◦ g 

M : L(F, G) −→ L(E, G) 

g ↦−→ f ◦ g 

sont linéaires. Elles sont aussi continues car pour tout f ∈ L(E, F ), g ∈ L(F, G) il découle de 

(1.3) que 

‖L(f)‖ ≤ ‖g‖‖f‖ 

et 

‖M(g)‖ ≤ ‖f‖‖g‖. 

Théorème 1.3.2 Soient (E, ‖ · ‖) un espace normé et (F, ‖ · ‖) un espace de Banach. Alors 

L(E, F ) est un espace de Banach muni de la norme de la Définition 1.3.1. 

Démonstration. Soit (f n ) une suite de Cauchy dans L(E, F ). Pour tout ε > 0, il existe n 0 ∈ N 

tel que, pour tout m, n ≥ n 0 , 

‖f n − f m ‖ = sup ‖f n (x) − f m (x)‖ ≤ ε, (1.4) 

‖x‖≤1 

Pour tout x ∈ B = B(0, 1), la suite (f n (x)) est de Cauchy, elle converge donc vers un élément 

noté ϕ(x). Il existe donc une application 

ϕ : B → F 

telle que la restriction f n |B converge uniformément vers ϕ. Posons, pour tout x ∈ X\{0} 

f(x) = ‖x‖ϕ(x/‖x‖) et f(0) = 0. 

Pour tout x ≠ 0, il vient 

f n (x) = ‖x‖f n (x/‖x‖), 

11

d’où 

lim f n(x) = ‖x‖ϕ(x/‖x‖) = f(x). 

n→∞ 

Il est alors aisé de vérifier, en passant à la limite dans les égalités f n (λx) = λf n (x) et f n (x + y) = 

f n (x) + f n (y), que f est linéaire. Montrons que f est continue. En effet en prennant n = n 0 et en 

faisant tendre m vers l’infini dans (1.4) il vient 

d’où 

sup ‖f n0 (x) − f(x)‖ ≤ ε, 

‖x‖≤1 

sup ‖f(x)‖ ≤ ‖f n0 ‖ + ε, 

‖x‖≤1 

ce qui, compte tenu de la Remarque 1.3.2 a) montre la continuité de f. Enfin, revenant à 1.4, on a 

faisant tendre m vers l’infini, 

‖f n − f‖ = sup ‖f n (x) − f(x)‖ ≤ ε 

‖x‖≤1 

et ce, pour tout n ≥ n 0 , ce qui achève la démonstration. 

Définition 1.3.2 Soient E et F des espaces normés. On dit que f ∈ L(E, F ) est un isomorphisme 

si f est bijective et si f −1 ∈ L(F, E). On note alors Isom (E, F ) l’ensemble éventuellement vide 

des isomorphismes de E dans F . 


a) Si E est un espace de Banach et si F est isomorphe à E, alors F est un espace de Banach. 

En effet, il existe D > 0 telles que, pour tout y, y ′ ∈ F , 

‖f −1 (y) − f −1 (y ′ )‖ ≤ D‖y − y ′ ‖. 

Il en résulte que si (y n ) est de Cauchy dans F alors (f −1 (y n )) est de Cauchy dans E et converge 

donc vers un élément x ∈ E, ce qui implique la convergence de (y n ) vers y = f(x). 

b) Il est clair que la composée de deux isomorphismes est un isomorphisme. 

c) Il existe des applications linéaires continues et bijectives qui ne sont pas des isomorphismes. 

Cependant on a le résultat positif suivant que nous démontrerons dans le chapitre 4. 

Théorème 1.3.3 Soient E et F des espaces de Banach et soit f ∈ L(E, F ) telle que f est bijective. 

Alors f est un isomorphisme. 

Définition 1.3.3 On dit que f ∈ L(E, F ) est une isométrie si pour tout x ∈ E 

‖f(x)‖ = ‖x‖. 

12

Exemple 1.3.2 Soit E un espace normé. Pour tout h ∈ E on définit l’application 

ϕ h : 

R −→ E 

t ↦−→ th 

On a ϕ h ∈ L(R, E) et l’application ϕ qui à h associe ϕ h est un isomorphisme et une isométrie de 

E dans L(R, E). En effet 

‖ϕ h ‖ = max(‖ϕ h (1)‖, ‖ϕ h (−1)‖) = ‖ϕ h (1)‖ = ‖h‖. 

L’isométrie réciproque ψ : L(R, E) → E est définie par 

ψ(f) = f(1) pour tout f ∈ L(R, E). 

Dans la suite, on identifiera L(R, E) et E par cette isométrie. 

Le résultat suivant a d’importantes applications. 

Théorème 1.3.4 Soient E, F des espaces de Banach, alors Isom (E, F ) est ouvert (éventuellement 

vide) dans L(E, F ) et l’application u ↦−→ u −1 est continue sur Isom (E, F ). 

Démonstration. Soit v ∈ L(E) tel que ‖v‖ < 1. La série de terme général (v n ) est alors normalement 

convergente car ‖v n ‖ ≤ ‖v‖ n . Posons S n = ∑ n 

k=0 vk , on a 

v ◦ S n = S n ◦ v = S n+1 − I 

où I désigne l’application identique de E dans E. Il résulte alors de la continuité des applications 

u ↦−→ u ◦ v et u ↦−→ v ◦ u (voir Exemple (1.3.1), c)) que S = ∑ ∞ 

k=0 vk vérifie 

(I − v) ◦ S = S ◦ (I − v) = I, 

donc que I − v est bijective, c’est donc un isomorphisme d’après le Théorème 1.3.3. Soit alors 

u ∈ Isom (E, F ) et v ∈ L(E, F ). On a, 

v ∈ Isom(E, F ) → u −1 ◦ v ∈ Isom(E). 

Or u −1 ◦ v = I − w avec w = I − (u −1 ◦ v) = u −1 ◦ (u − v). On a, 

‖w‖ = ‖u −1 ◦ (u − v)‖ ≤ ‖u −1 ‖‖(u − v)‖. 

donc B(u, 1/‖u −1 ‖) ⊂ Isom (E, F ). Par ailleurs on a 

d’où 

On obtient alors 

‖v −1 − u −1 ‖ ≤ 

v −1 = (u ◦ (I − w)) −1 = (I − w) −1 ◦ u −1 , 

v −1 − u −1 = ((I − w) −1 − I) ◦ u −1 = 

∥ 

∞∑ ∥ 

w k ∥∥‖u −1 ‖ ≤ 

k=1 

∞∑ 

w k ◦ u −1 . 

k=1 

∞∑ 

‖w k ‖‖u −1 ‖ ≤ 

k=1 

Comme w tend vers 0 quand v tend vers u on a bien le résultat. 

‖w‖ 

1 − ‖w‖ ‖u‖−1 . 

13

1.4 Normes équivalentes 

Définition 1.4.1 Soit E un espace vectoriel muni de deux normes ‖ · ‖ 1 et ‖ · ‖ 2 . On dit que ces 

deux normes sont équivalentes si elles définissent la même topologie (i.e. si les suites convergentes 

et leurs limites sont les mêmes). Ceci équivaut à la continuité des applications linéaires : 

Il en résulte immédiatement le 

I : (E, ‖ · ‖ 1 ) → (E, ‖ · ‖ 2 ) 

I : (E, ‖ · ‖ 2 ) → (E, ‖ · ‖ 1 ). 

Théorème 1.4.1 Soient ‖ · ‖ 1 et ‖ · ‖ 2 deux normes sur un espace vectoriel E. Les propriétés 

suivantes sont équivalentes, 

i) ‖ · ‖ 1 et ‖ · ‖ 2 sont des normes équivalentes, 

ii) il existe a, b > 0 telles que, pour tout x ∈ E, 

‖x‖ 1 ≤ a‖x‖ 2 et ‖x‖ 2 ≤ b‖x‖ 1 . 

Démonstration. Elle résulte de la Définition 1.4.1 et du Théorème 1.3.2, remarquant que ii) 

équivaut à la continuité des applications linéaires 

I : (E, ‖ · ‖ 2 ) → (E, ‖ · ‖ 2 ) et I : (E, ‖ · ‖ 1 ) → (E, ‖ · ‖ 2 ). 

Dans le cas des espaces de dimension finie, on a 

Théorème 1.4.2 Toutes les normes sont équivalentes dans R d . 

Démonstration. Posons, pour tout x ∈ R d , ‖x‖ = ∑ d 

i=1 |x i| et considérons une norme ρ(.) sur 

R d . Pour tout i = 1, · · · , d définissons le vecteur e i = (0, · · · , 1, · · · , 0), dont toutes les composantes 

sont nulles sauf celle de rang i. Pour tout x, y ∈ R d on a 

( d∑ ) 

ρ(x − y) = ρ (x i − y i )e i 

≤ 

≤ 

i=1 

d∑ 

|x i − y i |ρ(e i ) 

i=1 

M‖x − y‖, 

où M = sup 1≤i≤d ρ(e i ). La fonction ρ(.) est donc continue, elle atteint alors sa borne inférieure 

sur le compact S = {x ∈ R d : ‖x‖ = 1}. Il existe donc m > 0 tels que, pour tout x ≠ 0, on a 

m ≤ ρ(x/‖x‖), 

d’où m‖x‖ ≤ ρ(x) ≤ M‖x‖, ce qui montre que les normes ‖ · ‖ et ρ(.) sont équivalentes. Soient 

alors ρ 1 et ρ 2 deux normes sur R d . Comme ρ 1 est équivalente à ‖ · ‖ et que ‖ · ‖ est équivalente à 

ρ 2 , on obtient que ρ 1 est équivalente à ρ 2 (le vérifier). 

14

Corollaire 1.4.1 

i) R d est un espace de Banach pour toute norme. 

ii) Toute application linéaire de R d dans un espace normé (F, ‖ · ‖) est continue. 

Démonstration. i) Résulte du fait qu’un espace de Banach l’est encore quand on remplace sa 

norme par une norme équivalente, du Théorème 1.4.2 et du fait que R d est complet muni de l’une 

de ses normes usuelles (voir Exemple 1.2.1 a)). 

ii) Exercice facile. 


a) Soit (E, ‖ · ‖) un espace vectoriel de dimension d rapporté à une base (u 1 , · · · , u d ). L’application 

d∑ 

ϕ(x 1 , · · · , x d ) = x i u i 

est bijective linéaire et continue (le démontrer) de R d dans E. La bijection réciproque ϕ −1 est aussi 

continue. En effet la fonction ‖ϕ(.)‖ qui est une norme sur R d est équivalente à la norme ‖ · ‖ ∞ . 

Il existe donc c > 0 tel que ‖ · ‖ ∞ ≤ c‖ϕ(.)‖, ce qui implique bien la continuité de ϕ −1 . Ainsi E 

est isomorphe à R d et le Théorème 1.4.2 ainsi que le Corollaire 1.4.1 sont vrais en remplaçant R d 

par un espace vectoriel E de dimension finie d. 

b) On peut montrer que la boule unité d’un espace normé de dimension infinie n’est jamais 

compacte (Théorème de F. Riesz). 

1.5 Applications multilinéaires continues 

Définition 1.5.1 Soient E 1 , · · · , E n , F des espaces vectoriels, on dit qu’une application 

i=1 

f : E 1 × · · · × E n −→ F 

est multilinéaire si, pour tout i ∈ [1, n], et pour tout a = (a 1 , · · · , a n ) ∈ E 1 × · · · × E n , les 

applications f i : E i → F définies par 

sont linéaires. 

f i (x) = f(a 1 , · · · , a i−1 , x, a i+1 , · · · , a n ) 

Théorème 1.5.1 Soient E 1 , · · · E n , F des espaces normés et soit une application multilinéaire 

f : E 1 × · · · × E n −→ F . On munit l’espace vectoriel E 1 × · · · × E n d’une norme définissant 

la topologie produit (par exemple l’une des normes équivalentes de la Définition 1.1.2). Alors, les 

deux propriétés suivantes sont équivalentes. 

i) f est continue sur E 1 × · · · × E n , 

ii) il existe M ≥ 0 telle que, pour tout x ∈ E 1 × · · · × E n , on a 

‖f(x)‖ ≤ M‖x 1 ‖ · · · ‖x n ‖. 

15

Démonstration. i) ⇒ ii). Comme f est continue en 0 et f(0) = 0, Il existe η > 0 tel que, 

‖x‖ = sup ‖x i ‖ ≤ η ⇒ ‖f(x)‖ ≤ 1. 

1≤i≤n 

Soit alors x ∈ (E 1 \{0}) × · · · × (E n \{0}). Posons y = η(x 1 /‖x 1 ‖, · · · ., x n /‖x n ‖), on a ‖y‖ ≤ η. 

Il en résulte ‖f(y)‖ ≤ 1, et donc 

‖f(x)‖ ≤ (1/η n )‖x 1 ‖ · · · .‖x n ‖. 

Enfin, si l’un des x i est nul l’inégalité ci-dessus est vérifiée avec 0 des deux côtés de l’inégalité. 

ii) ⇒ i). On procède par récurrence sur n. Soient x, h ∈ E 1 × · · · × E n . On a 

‖f(x + h) − f(x)‖ ≤ ‖f(x + h) − f(x + k)‖ + ‖f(x + k) − f(x)‖ 

où k = (0, h 2 , · · · , h n ). On a alors 

‖f(x + h) − f(x + k)‖ ≤ M‖h 1 ‖(‖x 2 ‖ + ‖h 2 ‖) · · · (‖x n ‖ + ‖h n ‖) 

≤ 

C‖h 1 ‖ 

dès que ‖h‖ ≤ 1. Par ailleurs l’application g : E 2 × · · · × E n −→ F définie par 

est telle que g ∈ L(E 2 × · · · × E n , F ) et vérifie 

g(z 2 , · · · , z n ) = f(x 1 , z 2 , · · · , z n ) 

‖g(z 2 , · · · , z n )‖ ≤ M ′ ‖z 2 ‖ · · · ‖z n ‖ avec M ′ = M‖x 1 ‖. 

De plus 

‖f(x + k) − f(x)‖ = ‖g(x 2 + h 2 , · · · , x n + h n ) − g(x 2 , · · · , x n )‖. 

On applique alors l’hypothèse de récurrence et on obtient l’existence de η > 0 tel que 

‖g(x 2 + h 2 , · · · , x n + h n ) − g(x 2 , · · · , x n )‖ ≤ ε/2 

pourvu que sup 2≤i≤n ‖h i ‖ ≤ η. Il en résulte que pour sup 1≤i≤n ‖h i ‖ ≤ max(η, ε/2C), on a 

‖f(x + h) − f(x)‖ ≤ C‖h 1 ‖ + ε/2 ≤ ε, 

ce qui démontre i). 

On note L(E 1 , · · · , E n ; F ) l’ensemble des applications multilinéaires continues de 

E 1 × · · · × E n dans F . Si E 1 = · · · = E n = E, on note L(E 1 , · · · , E n ; F ) = L n (E; F ). Nous 

laissons au lecteur le soin de démontrer que pour tout choix d’une norme sur E 1 × · · · × E n 

‖f‖ = sup ‖f(x)‖ 

‖x‖≤1 

16

est une norme sur L(E 1 , · · · , E n , F ), que 

‖f‖ = inf{M ∈ R + : pour tout x ∈ E 2 × · · · × E n , ‖f(x)‖ ≤ M‖x 1 ‖ · · · ‖x n ‖}, 

et que si F est de Banach, l’espace L(E 1 , · · · , E n ; F ) est un espace de Banach muni de cette norme 

(s’inspirer de la démonstration du Théorème 1.3.2). Enfin le lecteur démontrera que si E 1 , · · · , E n 

sont de dimension finie toute application multilinéaire définie sur E 1 × · · · × E n est continue. 

Le résultat suivant est fondamental pour l’étude des différentielles d’ordre supérieur. 

Théorème 1.5.2 L’application 

Φ : L m (E; L n (E; F )) → L n+m (E; F ) 

définie pour g ∈ L m (E; L n (E; F )) et (x 1 , · · · , x n+m ) ∈ E n+m par 

Φ(g)(x 1 , · · · , x n+1 ) = g(x 1 , · · · , x m )(x 2 , · · · , x n+1 ) 

est une isométrie de L m (E; L n (E; F )) dans L n+m (E; F ) et l’isométrie réciproque 

Ψ : L n+m (E; F ) → L m (E; L n (E; F )) 

est définie, pour tout f ∈ L n+m (E; F ), (z 1 , · · · , z m ) ∈ E m et (x 1 , · · · , x n ) ∈ E n par 

(Ψ(f)(z 1 , · · · , z m ))(x 1 , · · · , x n ) = f(z 1 , · · · , z m , x 1 , · · · , x n ). 

Démonstration. On a 

‖Φ(g)(x 1 , · · · , x n+m )‖ ≤ ‖g(x 1 , · · · , x m )‖ L n (E;F )‖x m+1 ‖ · · · ‖x n+1 ‖ 

≤ ‖g‖ L m (E;L n (E;F ))‖x 1 ‖ · · · ‖x m ‖ · ‖x 2 ‖ · · · ‖x n+1 ‖ 

ce qui montre que Φ(g) ∈ L n+m (E; F ) et 

‖Φ(g)‖ L n+m (E;F ) ≤ ‖g‖ L m (E;L n (E;F )). (1.5) 

Par ailleurs, pour tout (z 1 , · · · , z m ) ∈ E m , 

‖Ψ(f)(z 1 · · · , z m )(x 1 , · · · , x n )‖ ≤ ‖f‖ L n+m (E;F )‖z 1 ‖ · · · ‖z m ‖ · ‖x 1 ‖ · · · ‖x n ‖ 

ce qui montre que Ψ(f) ∈ L m (E; L n (E; F )) et 

‖Ψ(f)(z 1 , · · · , z m )‖ L n (E;F ) ≤ ‖f‖ L n+1 (E;F )‖z 1 ‖ · · · ‖z m ‖ 

d’où 

‖Ψ(f)‖ L m (E;L n (E;F )) ≤ ‖f‖ L n+m (E;F ). (1.6) 

Les applications Φ et Ψ sont donc linéaires continues. Il est clair qu’elles sont aussi réciproques 

l’une de l’autre. On a alors pour tout f ∈ L n+m (E; F ), g ∈ L m (E; L n (E; F )) 

‖f‖ L n+m (E;F ) = ‖(Φ ◦ Ψ)(f)‖ L n+m (E;F ) = ‖Φ(Ψ(f))‖ L n+m (E;F ) ≤ ‖Ψ(f)‖ L m (E;L n (E;F )) 

17

et 

‖g‖ L m (E;L n (E;F )) = ‖(Ψ ◦ Φ)(g)‖ L m (E;L n (E;F )) = ‖Ψ(Φ(g))‖ L m (E;L n (E;F )) ≤ ‖Φ(g)‖ L n+m (E;F ), 

ce qui combiné à (1.5) et (1.6) montre que 

‖Φ(g)‖ L n+m (E;F ) = ‖g‖ L m (E;L n (E;F )) 

et 

On a donc bien le résultat. 

‖Ψ(f)‖ L m (E;L n (E;F )) = ‖f‖ L n+m (E;F ). 

1.6 Espaces de Hilbert 

Définition 1.6.1 Un produit scalaire 〈., .〉 sur un espace vectoriel E est une fonction de E × E 

dans R qui est bilinéaire symétrique (〈x, y〉 = 〈y, x〉 pour tout x, y ∈ E) non dégénérée positive 

(〈x, x〉 ≥ 0 pour tout x ∈ E et 〈x, x〉 = 0 implique x = 0), E muni du produit scalaire 〈., .〉 est 

dit alors préhilbertien. 

Exemple 1.6.1 

a) Pour tout x, y ∈ R d on pose 

On définit ainsi un produit scalaire. 

〈x, y〉 = x 1 y 1 + · · · + x d y d . 

b) Soit l 2 défini dans l’exemple 1.2.1, c). Pour x, y ∈ l 2 , on a, pour tout N ∈ N, 

N∑ 

|x n y n | ≤ 

n=1 

≤ 

( ∑ N ) 1 ( ∑ N ) 

|x n | 2 2 1/2 

|y n | 2 

n=1 

n=1 

( ∑ ∞ ) 1 ( ∑ ∞ ) 

|x n | 2 2 1/2. 

|y n | 2 

n=1 

Il en résulte que ∑ ∞ 

n=1 |x ny n | < ∞. On pose alors 


〈x, y〉 = 

∞∑ 

x n y n . 

n=1 

c) Soit E = C([0, 1]) l’ensemble des fonctions continues définies sur l’intervalle [0, 1]. Pour 

tout f, g ∈ E posons 


〈f, g〉 = 

∫ 1 

0 

18 

n=1 

f(t)g(t) dt.

Théorème 1.6.1 INÉGALITÉ DE CAUCHY-SCHWARZ 

Soit (E, 〈., .〉) un espace préhilbertien. Alors pour tout x, y ∈ E, 

|〈x, y〉| 2 ≤ 〈x, x〉〈y, y〉 

avec égalité si et seulement si x et y sont colinéaires. 

Démonstration. On peut supposer que 〈y, y〉 > 0. Soit λ ∈ R, on a 

〈x + λy, x + λy〉 ≥ 0 

d’où 

λ 2 〈y, y〉 + 2λ〈x, y〉 + 〈x, x〉 ≥ 0. 

Le discriminant du trinôme du second degré est donc négatif ou nul, ce qui donne l’inégalité 

annoncée. Par ailleurs il est clair que l’inégalité est une égalité si y = µx. Réciproquement si x 

et y sont non colinéaires alors x + λy ≠ 0 pour tout λ ∈ R ce qui montre que le trinôme n’a 

pas de racine réelle. Il en résulte que son discriminant est strictement négatif, d’où |〈x, y〉| 2 < 

〈x, x〉〈y, y〉. 

Proposition 1.6.1 Soit (E, 〈., .〉) un espace préhilbertien. On définit alors une norme sur E en 

posant pour tout x ∈ E 

‖x‖ = 〈x, x〉 1/2 . 

Démonstration. La seule vérification non évidente est celle de l’inégalité triangulaire. Soient 

x, y ∈ E, on a, utilisant l’inégalité de Cauchy-Schwarz 

On a donc bien ‖x + y‖ ≤ ‖x‖ + ‖y‖. 

‖x + y‖ 2 = ‖x‖ 2 + ‖y‖ 2 + 2〈x, y〉 

≤ 

‖x‖ 2 + ‖y‖ 2 + 2‖x‖‖y‖ 

≤ (‖x‖ + ‖y‖) 2 . 


a) Théorème de Pythagore. Soit (E, 〈., .〉) un espace préhilbertien et soient x, y ∈ E tels que 

〈x, y〉 = 0. Alors 

‖x + y‖ 2 = ‖x‖ 2 + ‖y‖ 2 . 

En effet 

‖x + y‖ 2 = 〈x + y, x + y〉 

= 〈x, x〉 + 2〈x, y〉 + 〈y, y〉 

= 〈x, x〉 + 〈y, y〉 

= ‖x‖ 2 + ‖y‖ 2 . 

19

) Soit (E, 〈., .〉) un espace préhilbertien et soit a ∈ E. Définissons L a : E −→ R par 

L a (x) = 〈a, x〉 

pour tout x ∈ E. Utilisant l’inégalité de Cauchy-Schwarz, on a 

|L a (x)| ≤ ‖a‖‖x‖ 

ce qui montre que l’application linéaire L a est continue et que ‖L a ‖ ≤ ‖a‖. De plus |L a (a)| = 

‖a‖ 2 donc ‖L a ‖ ≥ ‖a‖ ce qui montre que ‖L a ‖ = ‖a‖. 

Définition 1.6.2 Un espace de Hilbert est un espace préhilbertien (H, 〈., .〉) qui est complet pour 

la norme définie dans la Proposition 1.6.1. 

Exemple 1.6.2 

a) L’espace Euclidien R d muni du produit scalaire usuel (exemple 1.6.1, a)) est un espace de 

Hilbert. 

b) Soit l 2 défini dans l’exemple 1.2.1, c) muni du produit scalaire 

〈x, y〉 = 

∞∑ 

x n y n . 

(exemple 1.6.1, b)). Alors l 2 est un espace de Hilbert pour ce produit scalaire. 

n=1 

c) L’espace E = C([0, 1]) muni du produit scalaire 

n’est pas un espace de Hilbert. 

〈f, g〉 = 

∫ 1 

0 

f(t)g(t) dt. 

Définition 1.6.3 Soit (E, d) un espace métrique, a ∈ E et soit B une partie non vide de E. La 

distance de a à la partie B est 

d(a, B) = inf{d(a, b) : b ∈ B}. 

On dit que b ∈ B est une projection de a sur B si 

d(a, b) = d(a, B). 

En général la projection n’existe pas et, s’il en existe, il peut en exister plusieurs. 

Définition 1.6.4 Une partie C d’un espace vectoriel E est dite convexe si, pour tout x, y ∈ C et 

pour tout λ ∈ [0, 1] 

λx + (1 − λ)y ∈ C. 

Dans le cas d’un espace préhilbertien il y a existence et unicité de la projection sur une partie 

convexe complète comme le montre le résultat fondamental suivant. 

20

Théorème 1.6.2 PROJECTION SUR UN CONVEXE COMPLET 

Soit C une partie convexe et complète d’un espace préhilbertien (E, 〈., .〉). Alors, pour tout 

x ∈ E, il existe y ∈ C unique tel que 

‖x − y‖ = d(x, C). 

Le vecteur p C (x) = y ∈ C est alors caractérisé par 

pour tout z ∈ C. 

〈x − p C (x), z − p C (x)〉 ≤ 0 

Démonstration. Remarquons que d(x, C) = d(0, C − x). Comme C − x est aussi convexe complet, 

on peut supposer que x = 0. Soit y n ∈ C tel que 

Pour tout x, z ∈ E, on a 

d’où 

On obtient alors 

‖y n ‖ ≤ d(0, C) + 1 n . 

‖x − z‖ 2 + ‖x + z‖ 2 = 2‖x‖ 2 + 2‖z‖ 2 , 

‖x − z‖ 2 = 2‖x‖ 2 + 2‖z‖ 2 − 4∥ x + z 

∥ 2 . 

2 

‖y m − y n ‖ 2 = 2‖y m ‖ 2 + 2‖y n ‖ 2 − 4∥ y m + y n 

∥ 2 . 

2 

Comme C est convexe, on a y m + y n 

∈ C donc 

2 

d(0, C) ≤ ∥ y m + y n ∥ 

∥. 

2 

Il en résulte que 

‖y m − y n ‖ 2 ≤ 2‖y m ‖ 2 + 2‖y n ‖ 2 − 4d 2 (0, C) 

≤ 4d(0, C)(1/m + 1/n) + 2/m 2 + 2/n 2 . 

La suite (y n ) est donc de Cauchy dans C qui est complet, elle converge donc vers un certain y ∈ C 

(C est fermé car C est complet). Passant à la limite dans l’inégalité ‖y n ‖ ≤ d(0, C) + 1/n, il vient 

‖y‖ ≤ d(0, C) et donc ‖y‖ = d(0, C) car ‖y‖ ≥ d(0, C). Montrons l’unicité de y. Si y 1 et y 2 sont 

solutions, on a 

‖y 1 − y 2 ‖ 2 ≤ 2‖y 1 ‖ 2 + 2‖y 2 ‖ 2 − 4d 2 (0, C) = 0 

donc y 1 = y 2 . Enfin, revenant au cas général, p C (x) est caractérisé par 

‖x − p C (x)‖ 2 ≤ ‖x − z‖ 2 pour tout z ∈ C. 

21

Soit y ∈ C et t ∈ [0, 1], on a z = p C (x) + t(y − p C (x)) ∈ C par convexité, d’où 

soit 

‖x − p C (x)‖ 2 ≤ ‖x − p C (x) − t(y − p C (x))‖ 2 

0 ≤ −2t〈x − p C (x), y − p C (x)〉 + t 2 ‖y − p C (x)‖ 2 . 

Divisant par t et faisant tendre t vers 0 on a bien 

〈x − p C (x), y − p C (x)〉 ≤ 0 

pour tout y ∈ C. Réciproquement, supposant que z ∈ C est tel que 〈x − z, y − z〉 ≤ 0 pour tout 

y ∈ C, il vient 

‖x − y‖ 2 = ‖x − z‖ 2 + ‖z − y‖ 2 − 〈x − z, y − z〉 

d’où 

pour tout y ∈ C, et donc z = p C (x). 

‖x − y‖ 2 ≥ ‖x − z‖ 2 

Proposition 1.6.2 Soit C une partie convexe et complète d’un espace préhilbertien (E, 〈., .〉). 

Alors, pour tout x 1 , x 2 ∈ E 

‖p C (x 1 ) − p C (x 1 )‖ ≤ ‖x 1 − x 2 ‖. 

Démonstration. Posons y 1 = p C (x 1 ) et y 2 = p C (x 2 ). On a 

〈x 1 − y 1 , y 2 − y 1 〉 ≤ 0 (1.7) 

et 

On a alors 

〈x 2 − y 2 , y 1 − y 2 〉 ≤ 0. (1.8) 

〈x 1 − x 2 , y 1 − y 2 〉 = 〈x 1 − y 1 , y 1 − y 2 〉 + 〈y 1 − y 2 , y 1 − y 2 〉 + 〈y 2 − x 2 , y 1 − y 2 〉. 

D’après (1.7) et (1.8), le premier et le troisième terme de l’inégalité précédente sont positifs ou 

nuls. Il en résulte que 

On a alors 

d’où 

ce qui achève la démonstration. 

〈x 1 − x 2 , y 1 − y 2 〉 ≥ 〈y 1 − y 2 , y 1 − y 2 〉 = ‖y 1 − y 2 ‖ 2 . 

‖x 1 − x 2 ‖‖y 1 − y 2 ‖ ≥ 〈x 1 − x 2 , y 1 − y 2 〉 ≥ ‖y 1 − y 2 ‖ 2 

‖y 1 − y 2 ‖ ≤ ‖x 1 − x 2 ‖ 

22

Définition 1.6.5 Soit (E, 〈., .〉) un espace préhilbertien et soient x, y ∈ E. On dit que x est 

orthogonal à y et on note x ⊥ y si 〈x, y〉 = 0. Étant donné F ⊂ E, on note 

Remarque 1.6.2 Remarquons que 

F ⊥ = {y ∈ E : 〈x, y〉 = 0, pour tout x ∈ F }. 

F ⊥ = ∩ x∈F Ker 〈x, .〉 

et que 〈x, .〉 est linéaire continue (voir Remarque (1.6.1), b)). On obtient alors que F ⊥ est fermé 

comme intersection de fermés. 

Dans le cas où C est un sous-espace vectoriel le Théorème 1.6.2 prend la forme suivante 

Théorème 1.6.3 PROJECTION SUR UN SOUS-ESPACE VECTORIEL COMPLET 

Soit F un sous-espace vectoriel complet d’un espace préhilbertien (E, 〈., .〉). Alors 

et 

E = F ⊕ F ⊥ 

p F ∈ L(E). 

Pour tout x ∈ E, p F (x) est l’unique vecteur de F tel que 

〈x − p F (x), y〉 = 0 pour tout y ∈ F. 

De plus, 

pour tout x ∈ E. 

‖p F (x)‖ ≤ ‖x‖ 

Démonstration. D’après le Théorème 1.6.2 p F (x) est l’unique vecteur de F tel que 

〈x − p F (x), y − p F (x)〉 ≤ 0 pour tout y ∈ F. 

Pour tout z ∈ F on a p F (x) + z ∈ F d’où 

〈x − p F (x), z〉 ≤ 0 pour tout z ∈ F 

ce qui implique, changeant z en −z que 

〈x − p F (x), z〉 = 0 pour tout z ∈ F 

donc x − p F (x) ∈ F ⊥ . Tout vecteur x ∈ E s’écrit alors 

x = p F (x) + x − p F (x) 

où 

p F (x) ∈ F et x − p F (x) ∈ F ⊥ . 

23

Comme F ∩ F ⊥ = {0}, on a bien E = F ⊕ F ⊥ . De plus p F (.) est la projection algébrique 

sur F parallèlement à F ⊥ , c’est donc une application linéaire. Remarquons alors que, d’après le 

Théorème de Pythagore 

‖x‖ 2 = ‖x − p F (x)‖ 2 + ‖p F (x)‖ 2 ≥ ‖p F (x)‖ 2 , 

ce qui montre que ‖p F (x)‖ ≤ ‖x‖ pour tout x ∈ E et que p F est continue. 

Voici un résultat très utile dans la pratique. 


Soit F un sous-espace vectoriel fermé d’un espace de Hilbert (H, 〈., .〉). Alors 

a) F ⊥⊥ = F . 

b) F = H ⇐⇒ F ⊥ = {0}. 

Démonstration. a) Observons que F ⊂ F ⊥⊥ et que F ⊥ est un sous-espace vectoriel fermé de 

E (F ⊥ = ⋂ x∈F 

ker 〈x, .〉 et ker 〈x, .〉 est fermé comme noyau d’une forme linéaire continue 

(Remarque 1.6.1, b))). Les sous-espaces vectoriels F et F ⊥ sont donc complets ce qui permet 

d’appliquer le Théorème 1.6.3. On a alors 

donc F = F ⊥⊥ . 

F ⊂ F ⊥⊥ 

E = F ⊕ F ⊥ 

E = F ⊥⊥ ⊕ F ⊥ 

b) Si F = H il est clair que F ⊥ = {0}. Réciproquement si F ⊥ = {0} on a H = F ⊕ {0} 

donc F = H. 

Définition 1.6.6 On dit qu’une famille de vecteurs (e i ) i∈I est orthogonale si 

〈e i , e j 〉 = 0 pour tout i, j ∈ I, i ≠ j. 

On dit que la famille orthogonale (e i ) i∈I est orthonormée si 

‖e i ‖ = 1 pour tout i ∈ I. 

Le résultat suivant dont la démonstration élémentaire est laissée au lecteur est d’une grande importance 

pratique. 

Proposition 1.6.3 Soit (e 1 , · · · , e n ) une famille orthononormée d’un espace préhilbertien (E, 〈., .〉), 

soit n ∈ N ∗ et λ 1 , · · · , λ n ∈ R. Posons x = ∑ n 

i=1 λ ie i , alors 

et 

λ i = 〈x, e i 〉 pour tout i ∈ [1, n], 

‖x‖ 2 = 

n∑ 

|λ i | 2 . 

i=1 

24

Théorème 1.6.4 Soit (E, 〈., .〉) un espace préhilbertien et soit (e 1 , · · · , e n ) une famille orthonormée. 

On pose 

E n = [e 1 , · · · , e n ] 

(sous-espace vectoriel engendré par e 1 , · · · , e n ). Alors pour tout x ∈ E, 

a) p En (x) = ∑ n 

i=1 〈x, e i〉e i , 

b) ‖x‖ 2 − d 2 (x, E n ) = ∑ n 

i=1 |〈x, e i〉| 2 . 

Démonstration. Remarquons qu’un sous-espace vectoriel de dimension finie est complet (voir 

Remarque 1.4.1). On peut donc appliquer le Théorème 1.6.3. On sait que p En (x) est caractérisé 

par 

〈x − p En (x), e i 〉 = 0 pour tout i ∈ [1, n]. 


De plus, on a 

et 

p En (x) = 

n∑ 

〈p En (x), e i 〉e i = 

i=1 

D’après le Théorème de Pythagore, il vient 

n∑ 

〈x, e i 〉e i . 

i=1 

x = x − p En (x) + p En (x) 

(x − p En (x)) ⊥ p En (x). 

‖x‖ 2 − ‖x − p En (x)‖ 2 = ‖p En (x)‖ 2 , 

ce qui montre bien que 

‖x‖ 2 − d 2 (x, E n ) = 

n∑ 

|〈x, e i 〉| 2 . 

i=1 

Théorème 1.6.5 INÉGALITÉ DE PARSEVAL-BESSEL 

Soit (E, 〈., .〉) un espace préhilbertien et (e i ) i∈N ∗ une famille orthonormée. Alors pour tout 

x ∈ E, la série de terme général (|〈x, e i 〉| 2 ) converge et 

∞∑ 

|〈x, e i 〉| 2 ≤ ‖x‖ 2 . 

i=1 

Démonstration. Pour tout n ∈ N ∗ , on a ‖p En (x)‖ 2 ≤ ‖x‖ 2 et, d’après le Théorème 1.6.4 et la 

Proposition 1.6.3 on a 

n∑ 

‖p En (x)‖ 2 = |〈x, e i 〉| 2 , 

d’où le résultat. 

i=1 

25

Définition 1.6.7 Soit (e n ) n∈N ∗ une famille de vecteurs d’un espace normé (E, ‖ · ‖). On dit que 

cette famille est totale si 

∞⋃ 

E = F n , 

n=1 

où F n = [e 1 , · · · , e n ]. Autrement dit, si pour tout x ∈ X et pour tout ε > 0, il existe n ≥ 1 et 

x n ∈ F n tel que ‖x − x n ‖ ≤ ε. De façon équivalente la famille (e n ) n∈N ∗ est totale si et seulement 

si pour tout x ∈ E, on a lim n→∞ d(x, E n ) = 0 (le démontrer). 

Proposition 1.6.4 Soit (H, 〈., .〉) un espace de Hilbert. Alors la famille (e n ) n∈N ∗ est totale si et 

seulement si 

{e n : n ∈ N ∗ } ⊥ = 0. 

Démonstration. On a 

( ⋃ ∞ ) ⊥ 

{e n : n ∈ N ∗ } ⊥ = F n . 

n=1 

En effet il est clair que 

( ⋃ ∞ ) ⊥ 

{e n : n ∈ N ∗ } ⊥ = F n , 

et l’orthogonal d’un sous espace vectoriel est égal à celui de son adhérence (le vérifier). On a donc 

∞⋃ 

F n = H 

n=1 

n=1 

si et seulement si 


( ⋃ ∞ ) ⊥ 

F n = {0}, 

n=1 

On a alors une caractérisation simple des familles totales. 

Proposition 1.6.5 Soit (H, 〈., .〉) un espace de Hilbert et (e i ) i∈N ∗ une famille orthonormée. Alors 

les propriétés suivantes sont équivalentes, 

i) la famille (e i ) i∈N ∗ est totale, 

ii) pour tout x ∈ H, ‖x‖ 2 = ∑ ∞ 

i=1 |〈x, e i〉| 2 , 

iii) pour tout x ∈ H, x = ∑ ∞ 

i=1 〈x, e i〉e i . 

26

Démonstration. i) ⇒ ii). Étant donné ε > 0, il existe n ∈ N ∗ et des réels λ 1 , · · · , λ n tels que 

∥ 

n∑ ∥ ∥∥ 

∥x − λ i e i ≤ ε. 

On a alors 

‖x‖ 2 − 

i=1 

i=1 

n∑ 

|〈x, e i 〉| 2 = ‖x − p En (x)‖ 2 ∥ 

≤ ∥x − 

n∑ ∥ ∥∥ 

2 

λ i e i ≤ ε 2 , 

d’où ‖x‖ 2 ≤ ∑ ∞ 

i=1 |〈x, e i〉| 2 + ε 2 ce qui implique bien ii) en faisant tendre ε vers 0. 

ii) ⇒ iii). On a x = (x − p En (x)) + p En (x) et x − p En (x) et p En (x) sont orthogonaux. On 

obtient donc 

‖x‖ 2 − ‖p En (x)‖ 2 = ‖x − p En (x)‖ 2 = d 2 (x, E n ) 

soit utilisant le Théorème (1.6.4) 

‖x‖ 2 − 

i=1 

n∑ 

|〈x, e i 〉| 2 = ‖x − p En (x)‖ 2 , 

i=1 

il en résulte que lim n→∞ p En (x) = x d’où le résultat car p En (x) = ∑ n 

i=1 〈x, e i〉e i . 

iii) ⇒ i). Évident. 

Exemple 1.6.3 Soit dans l 2 la famille (e i ) i∈N ∗ définie par e i n = δ i,n . Pour x ∈ l 2 , on a 〈x, e i 〉 = x i , 

la famille (e i ) i∈N ∗ est donc totale dans l 2 d’après la Proposition 1.6.5, ii). 

Soit alors (H, 〈., .〉) un espace de Hilbert et a ∈ H. L’application l a : H → R définie par 

l a = 〈a, .〉 est linéaire et on a 

|〈a, x〉| ≤ ‖a‖‖x‖ 

Il en résulte que l a est continue : l a ∈ H ∗ . Le résultat suivant montre que tous les éléments de H ∗ 

sont représentables de cette manière. 

Théorème 1.6.6 Soit (H, 〈., .〉 un espace de Hilbert. Alors l’application 

l 

: H −→ H ∗ 

est une isométrie surjective de H dans H ∗ . 

x ↦−→ l x 

Démonstration. Il est clair que l est linéaire. Soit ϕ ∈ H ∗ , si ϕ = 0 on a ϕ = l 0 . On peut donc 

supposer que ϕ ≠ 0. Le noyau F = ker ϕ est donc un hyperplan fermé de H. Il existe alors 

b ∈ F ⊥ tel que b ∉ F car dans le cas contraire on aurait F ⊥ ⊂ F et donc H = F ⊕ F ⊥ ⊂ F 

ce qui impliquerait la contradiction F = H. Remarquons alors que F ⊥ = [b] car H = F ⊕ [b], 

H = F ⊕ F ⊥ et [b] ⊂ F ⊥ . Comme ker l b = ker ϕ, il existe un réel λ tel que ϕ = λl b = l a avec 

a = λb. L’application l est alors linéaire et bijective de H dans H ∗ . De plus ‖l a (x)‖ ≤ ‖a‖‖x‖ 

pour tout x ∈ H et ‖l a (a)‖ = ‖a‖‖a‖, d’où ‖l a ‖ = ‖a‖. 

On identifiera le plus souvent H avec H ∗ par l’isométrie définie ci-dessus. 

27

Chapitre 2 

Applications différentiables dans les espaces 

normés 

2.1 Définition d’une application différentiable 

Dans toute la suite, E et F sont des espaces normés, U est un ouvert de E, f est une application 

de U dans F et a est un élément de U. 

Définition 2.1.1 On dit que l’application f : U −→ F est différentiable au point a ∈ U s’il existe 

ϕ ∈ L(E, F ) telle que pour tout ε > 0, il existe η > 0 tel que pour tout x ∈ B(a, η) 

On note alors Df(a) = ϕ. 

‖f(x) − f(a) − ϕ(x − a)‖ ≤ ε‖x − a‖. 


a) Pour simplifier l’écriture, on écrira souvent, h étant un vecteur de E, Df(a)h au lieu de 

Df(a)(h). 

b) La définition s’écrit de façon équivalente, posant R(x) = f(x) − f(a) − ϕ(x − a), 

où lim x→a 

R(x) 

‖x−a‖ 

= 0. Cela s’écrit aussi 

f(x) = f(a) + ϕ(x − a) + R(x), 

f(x) = f(a) + ϕ(x − a) + ‖x − a‖ε(x), 

où 

Cela équivaut bien sûr à 

où 

lim ε(x) = 0. 

x→a 

f(a + h) = f(a) + ϕ(h) + ‖h‖δ(h) 

lim δ(h) = 0. 

h→0 

29

On note parfois o(‖h‖) une fonction α(h) définie au voisinage de 0 et à valeurs dans un espace 

vectoriel normé telle que lim h→0 ‖h‖ −1 α(h) = 0. La différentibilité en a s’écrit alors 

f(a + h) = f(a) + ϕ(h) + o(‖h‖). 

c) Si f est différentiable en a, alors f est continue en a. En effet 

f(x) − f(a) = ϕ(x − a) + R(x), 

d’où utilisant la continuité en a de ϕ et le fait que lim x→a R(x) = 0, 

lim(f(x) − f(a)) = 0. 

x→a 

d) Si f est différentiable en a, alors pour tout h ∈ E, 

f(a + th) − f(a) 

Df(a)(h) = lim 

. (2.1) 

t→0 t 

En effet, f(a + th) − f(a) = tDf(a)(h) + ‖th‖ε(th). Il en résulte que 

f(a + th) − f(a) 

t 

= Df(a)(h) + ‖h‖ε(th), 

d’où le résultat. On remarque que cette propriété montre que la différentielle Df(a), quand elle 

existe, est unique. 

e) On note également que l’application f est différentiable en a si et seulement si il existe 

ϕ ∈ L(E, F ) telle que 

(f(x) − f(a) − ϕ(x − a)) 

lim 

= 0, 

x ≠→a ‖x − a‖ 

où x ≠→ a signifie x tend vers a et x ≠ a. 

f) Si f est différentiable en a et si une application g coincide avec f sur un voisinage de a, 

alors g est différentiable en a et Dg(a) = Df(a) (immédiat en utilisant (2.1)). 

g) La différentiabilité de f ne change pas quand on remplace les normes de E et F par des 

normes équivalentes (exercice facile). 

h) Si f : U −→ F est constante alors Df(x) = 0 pour tout x ∈ U, c’est immédiat. 

Définition 2.1.2 Soit f : I −→ E une fonction vectorielle définie sur un intervalle ouvert I de R. 

On dit que f est dérivable en t 0 ∈ I si la limite 

existe. On pose alors 

f(t) − f(t 0 ) 

lim 

t→t 0 t − t 0 

f ′ (t 0 ) = df 

dt (t 0) = lim 

t→t0 

f(t) − f(t 0 ) 

t − t 0 

. 

30

Théorème 2.1.1 Soit f : I −→ E une fonction vectorielle définie sur un intervalle ouvert I de 

R. Alors les deux propriétés suivantes sont équivalentes 

i) f est dérivable en t 0 ∈ I, 

ii) f est différentiable en t 0 ∈ I. 

De plus pour tout h ∈ R, on a 

Df(t 0 )(h) = h df 

dt (t 0), 

df 

dt (t 0) = Df(t 0 )(1). 

Démonstration. On sait (voir chap. 1, Exemple 1.3.2) que L(R, E) s’identifie à E quand on 

identifie ϕ ∈ L(R, E) avec le vecteur ϕ(1) et x ∈ E avec ϕ ∈ L(R, E) définie par ϕ(t) = tx. 

Remarquons que 

f(t) − f(t 0 ) 

lim 

= x 

t→t 0 t − t 0 

équivaut à 

avec lim 

h→0 

ε(h) = 0, ce qui démontre le théorème. 

f(t) − f(t 0 ) − (t − t 0 )x = (t − t 0 )ε(t − t 0 ) 

Exemple 2.1.1 

a) Soit (E, ‖.‖) un espace normé, alors la norme n’est pas différentiable en 0. Dans le cas 

contraire, on aurait (remarque 2.1.1, d)) pour tout h ∈ E 

D(‖.‖)(0)h = lim 

t→0 

‖th‖/t 

ce qui est absurde car le rapport ‖th‖/t a une limite à droite égale à ‖h‖ et une limite à gauche 

égale à −‖h‖ quand t tend vers 0. 

b) Soient E, F des espaces normés et soit f ∈ L(E, F ). Il découle de l’égalité, 

f(x) − f(a) − f(x − a) = 0 pour tout x, a ∈ E 

que, pour tout a ∈ E, f est différentiable en a ∈ E et que sa différentielle en a est Df(a) = f. 

c) Soit E, F , G des espaces normés, soit f ∈ L 2 (E, F ; G) une application bilinéaire continue 

et soient a, x ∈ E, b, y ∈ F . On a 

f(x, y) = f(a + (x − a), b + (y − b)) 

= f(a, b) + f(a, y − b) + f(x − a, b) + f(x − a, y − b). 

Notons que l’application linéaire L : E × F −→ G définie par 

L(u, v) = f(a, v) + f(u, b) pour tout (u, v) ∈ E × F 

31

est continue car 

‖L(u, v)‖ ≤ ‖f‖‖a‖‖v‖ + ‖f‖‖b‖‖u‖ ≤ (‖f‖‖a‖ + ‖f‖‖b‖)‖(u, v)‖ 

où ‖(u, v)‖ = sup(‖u‖, ‖v‖). Enfin 

ce qui montre que 

‖f(x − a, y − b)‖ ≤ ‖f‖‖x − a‖‖y − b‖ ≤ ‖f‖‖(x − a, y − b)‖ 2 , 

lim 

(x,y)→(a,b) 

f(x − a, y − b) 

‖(x − a, y − b)‖ = 0. 

Il en résulte que toute application bilinéaire continue f ∈ L 2 (E, F ; G) est différentiable sur E ×F 

et que pour tout (a, b) ∈ E × F , (u, v) ∈ E × F 

Df(a, b)(u, v) = f(a, v) + f(u, b). 

Plus généralement si E 1 , · · · , E m , G sont des espaces normés et si f ∈ L(E 1 , · · · , E m ; G) est 

une application multilinéaire continue, alors f est différentiable sur E 1 × · · · × E m et pour tout 

(a 1 , · · · , a m ), (u 1 , · · · , u m ) ∈ E 1 × · · · × E m on a 

Df(a 1 , · · · , a m )(u 1 , · · · , u m ) = f(u 1 , a 2 , · · · , a m ) + · · · + f(a 1 , · · · , a m−1 , u m ), 

(exercice facile et fastidieux ou voir Corollaire 2.4.3). 

d) Soit U un ouvert de R n , f : U −→ R une application et soit a ∈ U. On rappelle que la 

dérivée partielle 

∂f 

∂x i 

(a) 

est égale quand elle existe au nombre dérivé ϕ ′ (a i ) où ϕ i est la fonction de la variable réelle définie 

au voisinage de a i par ϕ i (z) = f(a 1 , · · · , z, · · · , a n ). En d’autre termes 

soit 

∂f f(a 1 , · · · , z, · · · , a n ) − f(a 1 , · · · , a n ) 

(a) = lim 

, 

∂x i z→ai z − a i 

∂f f(a 1 , · · · , a i + t, · · · , a n ) − f(a 1 , · · · , a n ) 

(a) = lim 

. 

∂x i t→0 t 

Autrement dit 

∂f f(a + te i ) − f(a) 

(a) = lim 

, 

∂x i t→0 t 

{ 

0 si j ≠ i 

∂f 

où (e i ) j = 

. Il résulte donc de (2.1) que si f est différentiable en a alors (a) 

1 si j = i ∂x i 

existe. On a de plus 

( n∑ ) 

Df(a)(h) = Df(a) h i e i = 

i=1 

n∑ 

Df(a)(e i )h i = 

i=1 

n∑ 

i=1 

∂f 

∂x i 

(a)h i . 

32

Autrement dit 

Df(a)(h) = 〈∇f(a), h〉 pour tout h ∈ R n 

⎛ 

∂f 

⎞ 

(a) 

∂x 

où 〈., .〉 désigne le produit scalaire usuel sur R n 1 et ∇f(a) = ⎜ 

⎝ . ⎟ est appelé le vecteur 

∂f 

⎠ 

(a) 

∂x n 

gradient de f en a. On montrera dans la suite que si pour tout i = 1, · · · , n la fonction ∂f 

∂x i 

(.) est 

définie au voisinage de a et continue en a alors f est différentiable en a et que sa différentiellle en 

a est définie par 

Df(a)(h) = 〈∇f(a), h〉. 

e) Plus généralement, si U ⊂ R n est un ouvert et si l’application 

Df(a)(h) = lim 

t→0 

f(a + th) − f(a) 

t 

f = (f 1 , · · · , f m ) : U −→ R m 

est différentiable en a. On montrera un peu plus loin que f 1 , · · · , f m sont alors différentiables en 

a. On a alors d’après (2.1), pour tout h ∈ R n , 

( 

= lim 

donc 

f 1 (a + th) − f(a) 

t→0 t 

Df(a)(h) = (〈∇f 1 (a), h〉, · · · , 〈∇f m (a), h〉), 

f m (a + th) − f(a) 

) 

, · · · , lim 

, 

t→0 t 

autrement dit 

Df(a)(h) = J f (a)h 

⎛ ⎞ 

∇f 1 (a) T 

où J f (a) est la matrice à m lignes et n colonnes dont les lignes sont ⎝ 

. 

⎠, autrement dit 

∇f m (a) T 

[J f (a)] ij = ∂f i 

∂x j 

(a) pour tout (i, j) ∈ [1, m] × [1, n]. 

On dit que J f (a) est la matrice Jacobienne de f en a. On montrera que si les dérivées partielles 

( ∂fi 

) 

(.) 

existent au voisinage de a et sont continues en a on montrera alors que f 

∂x j (i,j)∈[1,m]×[1,n] 

est différentiable en a et que Df(a) est donné, pour tout vecteur h ∈ R m par 

Df(a)(h) = J f (a)h. 

La notion de vecteur gradient s’étend au cadre des espaces de Hilbert 

Définition 2.1.3 Soit U un ouvert d’un espace de Hilbert E et soit f : E −→ R une application 

différentiable en a. On a Df(a) ∈ E ∗ , on désigne alors par ∇f(a) ∈ E l’unique vecteur fourni 

par le Théorème de Riesz, tel que 

Df(a)(h) = 〈∇f(a), h〉 pour tout h ∈ E. 

33

Définition 2.1.4 Soit f : U ⊂ E −→ F une application. On dit que f est de classe C 1 sur U si f 

est différentiable sur U et si l’application, x ↦−→ Df(x) est continue de U dans L(E, F ). 

Théorème 2.1.2 Soient E, F des espaces normés. Alors l’application 

I : Isom (E, F ) −→ Isom (F, E), 

définie par I(u) = u −1 est de classe C 1 et pour tout h ∈ L(E, F ), 

DI(u)(h) = −u −1 ◦ h ◦ u −1 . 

Démonstration. On sait que Isom (E, F ) est ouvert dans L(E, F ) (Chapitre 1, Théorème 1.3.4). 

On remarque que L(.) définie par L(h) = −u −1 ◦ h ◦ u −1 est linéaire ; L(.) est aussi continue car 

‖L(h)‖ ≤ ‖u −1 ‖‖u −1 ‖‖h‖. 

Soit u ∈ Isom (E, F ), on peut supposer que h est assez petit pour que u + h ∈ Isom (E, F ). On a 

alors 

I(u + h) − I(u) = (u + h) −1 − u −1 

= (u + h) −1 ◦ u ◦ u −1 − (u + h) −1 ◦ (u + h) ◦ u −1 

= (u + h) −1 ◦ (u − (u + h)) ◦ u −1 

= −(u + h) −1 ◦ h ◦ u −1 . 

Posons 

R(h) = I(u + h) − I(u) − L(h). 

On a donc 

Montrons alors que lim 

h→0 

‖h‖ −1 R(h) = 0. On a 

R(h) = −(u + h) −1 ◦ h ◦ u −1 + u −1 ◦ h ◦ u −1 

= (u −1 − (u + h) −1 ) ◦ h ◦ u −1 

‖R(h)‖ ≤ ‖(u −1 − (u + h) −1 )‖‖h‖‖u −1 ‖. 

Or d’après le Théorème 1.3.4 du chapitre 1, on sait que 

‖(u −1 − (u + h) −1 )‖ ≤ ε/‖u −1 ‖, 

pour h assez petit, ce qui prouve la différentiabilité de I(.) en u ∈ Isom (E, F ). 

Il reste à prouver que DI(.) est continue de Isom (E, F ) dans L(L(E, F ), L(F, E)). Posons 

pour tout v, w ∈ L(F, E) et h ∈ L(E, F ) 

Ψ(v, w)(h) = −v ◦ h ◦ w 

34

Il est clair que Ψ(v, w)(.) est linéaire de L(E, F ) dans L(F, E). Elle est aussi continue car 

‖Ψ(v, w)(h)‖ ≤ ‖v‖‖w‖‖h‖. 

Observons que l’application 

Ψ : L(F, E) × L(F, E) −→ L(L(E, F ), L(F, E)) 

ainsi définie est bilinéaire (évident) et continue car 

‖Ψ(v, w)‖ ≤ ‖v‖‖w‖. 

On a alors 

DI = Ψ ◦ (I, I) 

ce qui montre que DI est continue comme composée d’applications continues. 

2.2 Opérations sur les applications différentiables 

Le résultat suivant découle de la continuité des opérations 

(voir chapitre 1, Remarque 1.2). 

(λ, x) ↦→ λx et (x, y) ↦→ x + y 

Proposition 2.2.1 Soient f, g : U −→ F deux applications différentiables en a ∈ U et soit 

λ ∈ R. Alors les applications λf et f + g sont différentiables en a et l’on a 

D(λf)(a) = λDf(a), 

D(f + g)(a) = Df(a) + Dg(a). 

Le résultat suivant est très important en calcul différentiel et il est impératif de savoir l’appliquer 

sans hésitation. 

Théorème 2.2.1 Soient E, F , G des espaces normés U ⊂ E, V ⊂ F des ouverts et soient 

f : U −→ V différentiable en a ∈ U, g : V −→ G différentiable en b = f(a) ∈ V . Alors 

l’application g ◦ f est différentiable en a et 

D(g ◦ f)(a) = Dg(f(a)) ◦ Df(a). 

Démonstration. On a, 

f(x) = f(a) + Df(a)(x − a) + r 1 (x), 

g(y) = g(b) + Dg(b)(y − b) + r 2 (y), 

35

avec 

et 

On a donc 


où 

Il reste à montrer que 

Observons que 


lim 

x→a 

lim 

y→b 

r 1 (x) 

‖x − a‖ = 0 

r 2 (y) 

‖y − b‖ = 0. 

g(f(x)) = g(b) + Dg(b)(Df(a)(x − a) + r 1 (x)) + r 2 (f(x)). 

g(f(x)) = g(b) + (Dg(b) ◦ Df(a))(x − a) + R(x), 

R(x) = Dg(b)(r 1 (x)) + r 2 (y). 

lim 

x→a 

R(x) 

‖x − a‖ = 0. 

‖Dg(b)(r 1 (x))‖ ≤ ‖Dg(b)‖‖r 1 (x)‖, 

Dg(b)(r 1 (x)) 

lim 

x→a ‖x − a‖ 

= 0. 

r 1 (x) 

Par ailleurs, utilisant le fait que lim = 0, il existe α > 0 tel que 

x→a ‖x − a‖ 

‖r 1 (x)‖ ≤ ‖x − a‖ 

pour tout x tel que ‖x − a‖ ≤ α. Il vient, pour tout x ∈ B(a, α), 

‖f(x) − b‖ = ‖Df(a)(x − a) + r 1 (x)‖ 

≤ 

‖Df(a)(x − a)‖ + ‖r 1 (x)‖ 

≤ 

‖Df(a)‖‖(x − a)‖ + ‖r 1 (x)‖, 

donc 

Soit alors ε > 0, il existe η > 0 tel que 

‖f(x) − b‖ ≤ (‖Df(a)‖ + 1)‖x − a‖. (2.2) 

‖r 2 (y)‖ ≤ 

pour tout y tel que ‖y − b‖ ≤ η. Pour tout x tel que ‖x − a‖ ≤ min 

utilisant (2.2), 

ε 

‖y − b‖ (2.3) 

‖Df(a)‖ + 1 

‖f(x) − b‖ ≤ η, 

36 

( 

α, 

η 

) 

il vient, 

‖Df(a)‖ + 1)

et donc, utilisant (2.3), 

‖r 2 (f(x))‖ 


≤ 

≤ 

≤ 

ε 

‖f(x) − b‖ 

‖Df(a)‖ + 1 

ε 

(‖Df(a)‖ + 1)‖x − a‖ 

‖Df(a)‖ + 1 

ε‖x − a‖, 


a) Soit I ⊂ R un intervalle ouvert de R, soient E, F des espaces normés et soit x : I −→ E 

et f : U −→ F une application définie sur un ouvert U de E. On suppose que x(I) ⊂ U, que x(.) 

est dérivable en t ∈ I et que f est différentiable en x(t). Alors f ◦ x est dérivable en t et 

(f ◦ x) ′ (t) = Df(x(t))(x ′ (t)). 

b) Soit I ⊂ R un intervalle ouvert de R, soient E, F , G des espaces normés, soient x : I −→ E 

et y : I −→ F . Soit f ∈ L 2 (E, F ; G) une application bilinéaire continue. On suppose que x(.) et 

y(.) sont dérivables en t ∈ I. Posons z(t) = f(x(t), y(t)), alors z(.) est dérivable en t et 

z ′ (t) = f(x ′ (t), y(t)) + f(x(t), y ′ (t)). 

Démonstration. a) D’après le Théorème 2.2.1, f ◦ x est différentiable en t donc dérivable en t et 

(f ◦ x) ′ (t) = D(f ◦ x)(t)(1) = (Df(x(t)) ◦ Dx(t))(1) = Df(x(t)(x ′ (t)). 

b) On a z = f ◦ g où g(.) = (x(.), y(.)). D’après le Théorème 2.2.1 il résulte que 

Dz(t) = Df(x(t), y(t)) ◦ Dg(t). 

Appliquant le Théorème 2.3.1 de la section 2.3 on a 

Il vient alors 

z ′ (t) = Dz(t)(1) 

Dg(t) = (Dx(t), Dy(t)). 

= Df(x(t), y(t))(Dx(t)(1), Dy(t)(1)) 

= Df(x(t), y(t))(x ′ (t), y ′ (t)). 

Utilisant l’Exemple 2.1.1, c), on obtient bien le résultat. 

Exemple 2.2.1 Si (E, 〈·, ·〉) est un espace de Hilbert et x, y : I −→ E sont dérivables en t ∈ I, 

on déduit du corollaire précédent que 

(〈x(t), y(t)〉) ′ = 〈x ′ (t), y(t)〉 + 〈x(t), y ′ (t)〉. 

37

2.3 Applications à valeurs dans un produit d’espaces 

Soient F 1 , · · · , F m des espaces normés et F = F 1 ×· · ·×F m leur produit cartésien. On définit, 

pour tout i = 1, · · · , m 

p i : F −→ F i par p i (x 1 , · · · , x m ) = x i 

et 

u i : F i −→ F par u i (y) = (0, · · · , y, · · · , 0), 

où toutes les composantes sont nulles sauf celle de rang i qui est égale à y. On a p i ∈ L(F, F i ), 

u i ∈ L(F i , F ) (le démontrer) et, p i ◦ u i = I Fi . 

Théorème 2.3.1 Soit f : U −→ F = F 1 × · · · × F m une application définie sur un ouvert U d’un 

espace normé E à valeurs dans un produit d’espaces normé. Alors les propriétés suivantes sont 

équivalentes, 

i) f est différentiable en a ∈ U, 

ii) f 1 , · · · , f m sont différentiables en a où f = (f 1 , · · · , f m ). 

De plus pour tout h ∈ E, 

Df(a)(h) = 

m∑ 

(u i ◦ Df i (a))(h) = (Df 1 (a)(h), · · · , Df m (a)(h)). (2.4) 

i=1 

Démonstration. Comme f est différentiable en a, l’application f i = p i ◦ f est aussi différentiable 

en a pour tout i = 1, · · · m, d’après le Théorème 2.2.1. 

Réciproquement, supposons que f 1 , · · · , f m sont différentiables en a. Alors, pour tout i = 

1, · · · , m, u i ◦ f i est différentiable en a comme composée d’une application différentiable en 

a et d’une application différentiable sur F i . Il en résulte que f qui est égal à ∑ m 

i=1 u i ◦ f i est 

différentiable en a et que, utilisant de nouveau le Théorème 2.2.1 pour tout h ∈ E 


Df(a)(h) = 

= 

m∑ 

i=1 

m∑ 

i=1 

( 

) 

Du i (f i (a)) ◦ Df i (a) (h) 

( ) 

u i ◦ Df i (a) (h), 

Corollaire 2.3.1 Soit U un ouvert de R n et soit f : U −→ R m . Alors f est différentiable en a ∈ U 

si et seulement si f 1 , · · · , f m sont différentiables en a et on a, pour tout h ∈ R n , 

Df(a)(h) = J f (a)h, (2.5) 

38

⎛ ⎞ 

∇f 1 (a) T 

oú J f (a) = ⎝ 

. 

⎠ est la matrice m × n définie par [J f (a)] ij = ∂f i 

(a), soit 

∂x j 

∇f m (a) T 

⎛ 

J f (a) = ⎜ 

⎝ 

∂f 1 

∂x 1 

(a) · · · 

. · · · 

∂f m 

(a) · · · 

∂x 1 

∂f 

⎞ 

1 

(a) 

∂x n . ⎟ 

∂f 

⎠ . 

m 

(a) 

∂x n 

Démonstration. La première partie de la conclusion découle du Théorème 2.3.1. Utilisant ce 

même Théorème, il vient 

Df(a)(h) = (Df 1 (a)(h), · · · , Df m (a)(h)). 

Par ailleurs, pour i ∈ [1, m], on a ∂f i 

∂x j 

(a) = Df i (a)(e j ) où e j est le j eme vecteur de la base 

canonique de R n de telle sorte que 

Df i (a)(h) = 

n∑ 

h j Df i (a)(e j ) = 

j=1 

n∑ 

j=1 

h j 

∂f i 

∂x j 

(a) = 〈∇f i (a), h〉. 

On a donc bien 

⎛ 

⎞ 

〈∇f 1 (a), h〉 

Df(a)(h) = ⎝ 

. 

⎠ = J f (a)h. 

〈∇f m (a), h〉 

2.4 Applications définies sur un produit d’espaces 

Nous aurons besoin dans cette section de la Proposition 2.4.2 que nous démontrerons au chapitre 

suivant. Nous en donnons ici une autre démonstration basée sur la proposition suivante dont 

la démonstration fait appel au Théorème de Hahn-Banach. 

Proposition 2.4.1 Soit (E, ‖.‖) un espace normé. Alors pour tout x ∈ E on a 

‖x‖ = sup{|l(x)| : l ∈ E ∗ , ‖l‖ ≤ 1}. 

Proposition 2.4.2 Soit f : U ⊂ E −→ F une application différentiable définie sur un ouvert 

convexe d’un espace normé à valeurs dans un espace normé. On suppose qu’il existe M ∈ R + tel 

que 

sup ‖Df(x)‖ ≤ M. 

x∈U 

Alors pour tout x, z ∈ U 

‖f(z) − f(x)‖ ≤ M‖z − x‖. 

39

Démonstration. Soient x, z ∈ U et t ∈ [0, 1]. De part la convexité de U on a tx + (1 − t)z ∈ U. 

En fait il existe η > 0 tel que tx + (1 − t)z ∈ U pour tout t ∈ [−η, 1 + η] (choisir η > 0 tel que 

B(x, η‖x − z‖) ⊂ U et B(z, η‖x − z‖) ⊂ U). Soit l ∈ F ∗ telle que ‖l‖ ≤ 1. Posons pour tout 

t ∈ [−η, 1 + η] 

ϕ(t) = l(f(tx + (1 − t)z)) = l(f(α(t))). 

Utilisant la règle de différentiation des applications composées on obtient que ϕ est dérivable sur 

] − η, 1 + η[ et 

On a alors 

ϕ ′ (t) = Dl(f(α(t)))(Df(α(t))(α ′ (t))) = l(Df(tx + (1 − t)z))(x − z). 

|ϕ ′ (t)| ≤ ‖l‖‖(Df(tx + (1 − t)z)‖‖z − x‖ 

≤ 

≤ 

‖(Df(tx + (1 − t)z)‖‖z − x‖ 

M‖z − x‖. 

Utilisant le théorème des accroissements finis pour les fonctions d’une variable réelle il vient 

pout tout s, t ∈] − η, 1 + η[. On obtient alors 

On applique alors la Proposition 2.4.1 et il vient 

|ϕ(t) − ϕ(s)| ≤ M‖z − x‖|t − s| 

|l(f(z) − f(x))| = |ϕ(1) − ϕ(0)| ≤ M‖z − x‖. 

‖f(z) − f(x)‖ = sup{|l(f(z) − f(x))| : l ∈ F ∗ , ‖l‖ ≤ 1} ≤ M‖z − x‖. 

Soient E 1 , · · · , E n , F des espaces normés, U un ouvert du produit cartésien 

E = E 1 × · · · × E n , 

et f : U −→ F une application. Étant donné a ∈ U, on introduit, pour tout i = 1, · · · , n, 

l’application ϕ i définie par 

ϕ i (z) = f(a 1 , · · · , z, · · · , a n ), 

(dans (a 1 , · · · , z, · · · , a n ), les composantes de rang j ≠ i sont égales à a j , celle de rang i est égale 

à z). L’application ϕ i est définie sur un voisinage U i de a i et à valeurs dans F . 

Définition 2.4.1 Soient E 1 , · · · , E n , F des espaces normés, U un ouvert du produit cartésien 

E = E 1 × · · · × E n et f : U −→ F une application. On dit que f admet une différentielle 

partielle en a ∈ U par rapport à la ième variable si ϕ i est différentiable en a i . On pose alors 

On remarque que D i f(a) ∈ L(E i , F ). 

D i f(a) = Dϕ i (a). 

40

Proposition 2.4.3 Soit f : U ⊂ E −→ F où U est un ouvert de E = E 1 × · · · × E n . Supposons 

que f est différentiable en a. Alors pour tout i = 1, · · · , n, D i f(a) existe et pour tout h ∈ E i 

où u i (h) = (0, · · · , h, · · · , 0). 

Démonstration. Posons, pour z ∈ E i , 

v i (.) est définie dans un voisinage de a i et 

D i f(a)(h) = Df(a)(u i (h)), 

v i (z) = (a 1 , · · · , z, · · · , a n ), 

v i (z) − v i (a i ) = u i (z − a i ), 

ce qui montre que v i est différentiable en a i et que Dv i (a i ) = u i . D’après le Théorème 2.2.1, 

ϕ i = f ◦ v i est différentiable en a i et que, pour tout h ∈ E i 

( 

) 

Dϕ i (a i )(h) = Df(v i (a i )) ◦ Dv i (a i ) (h) = Df(a)(u i (h)), 


Le résultat suivant découle immédiatement de la Proposition 2.4.3 

Proposition 2.4.4 Soit f : U −→ R où U est un ouvert de R n . Alors il est équivalent de dire que 

f admet une différentielle partielle en a par rapport à la ième variable et que la dérivée partielle 

∂f 

∂x i 

(a) existe. De plus on a 

∂f 

∂x i 

(a) = Df(a)(e i ), 

et 

D i f(a)(h) = h ∂f 

∂x i 

(a), 

∂f 

∂x i 

(a) = D i f(a)(1). 

Il est faux en général que l’existence de différentielles partielles D i f(a), 1 ≤ i ≤ n, implique la 

différentiabilité de f en a. On a cependant le résultat suivant qui est très important. 

Théorème 2.4.1 Soit f : U ⊂ E 1 × · · · × E n −→ F et a ∈ U. On suppose que pour i = 1, · · · , n 

les différentielles partielles D i f(.) existent sur U et que les applications D i f : U −→ L(E i , F ) 

sont continues en a ∈ U. Alors f est différentiable en a et, 

Df(a)(h) = 

n∑ 

D i f(a)(h i ) pour tout h = (h 1 , · · · , h n ) ∈ E 1 × · · · × E n 

i=1 

41

Démonstration. On remarque que l’application 

L : E 1 × · · · × E n −→ F 

définie par L(h) = ∑ n 

i=1 D if(a)(h i ) est linéaire et continue. Posons 

R(x) = f(x) − f(a) − 

n∑ 

D i f(a)(x i − a i ). 

i=1 

On a 

Ce que l’on peut écrire 

où 

R(x) = f(x 1 , · · · , x n ) − f(a 1 , x 2 , · · · , x n ) − D 1 f(a)(x 1 − a 1 ) 

+ f(a 1 , x 2 , · · · x n ) − f(a 1 , a 2 , · · · , x n ) − D 2 f(a)(x 2 − a 2 ) 

. 

+ f(a 1 , · · · , a n−1 , x n ) − f(a 1 , · · · , a n ) − D n f(a)(x n − a n ). 

R(x) = g 1 (x 1 ) − g 1 (a 1 ) + · · · + g n (x n ) − g n (a n ), 

g 1 (z 1 ) = f(z 1 , x 2 , · · · , x n ) − D 1 f(a)(z 1 − a 1 ), 

g 2 (z 2 ) = f(a 1 , z 2 , x 3 , · · · , x n ) − D 2 f(a)(z 2 − a 2 ), 

. 

g n (z n ) = f(a 1 , · · · , a n−1 , z n ) − D n f(a)(z n − a n ). 

Les applications g i sont définies et différentiables dans un voisinage de a i pour tout x voisin de a. 

Par définition de la différentielle partielle, on a 

Munissons alors E de la norme 

Dg 1 (z 1 ) = D 1 f(z 1 , x 2 , · · · , x n ) − D 1 f(a 1 , · · · , a n ), 

Dg 2 (z 2 ) = D 2 f(a 1 , z 2 , x 3 , · · · , x n ) − D 2 f(a 1 , · · · , a n ), 

. 

Dg n (z n ) = D n f(a 1 , · · · , a n−1 , z n ) − D n f(a 1 , · · · , a n ). 

‖(u 1 , · · · , u n )‖ = sup ‖u i ‖. 

1≤i≤n 

Utilisant la continuité de l’application D 1 f, étant donné ε > 0, il existe η > 0 tel que, pour tout 

y ∈ B(a, η) et pour tout i ∈ [1, n], on ait 

‖D i f(y) − D i f(a)‖ ≤ ε. 

42

On obtient donc pour tout x ∈ B(a, η) et pour tout i ∈ [1, n], 

‖Dg i (z i )‖ ≤ ε pour tout z i ∈ B(a i , η). 

Appliquant alors la Proposition 2.4.2, il vient pour tout x ∈ B(a, η) et pour tout i ∈ [1, n], 

‖g i (x i ) − g i (a i )‖ ≤ ε‖x i − a i ‖, 

d’où 

‖R(x)‖ ≤ ε 


n∑ 

‖x i − a i ‖ = ε‖x − a‖ 1 , 

i=1 

Corollaire 2.4.1 Soit f : U ⊂ E 1 ×· · ·×E n −→ F . Alors f est de classe C 1 sur U si et seulement 

si les différentielles partielles D i f(.) existent, i = 1, · · · , n et sont continues sur U. 

Démonstration. Supposons f de classe C 1 . Alors D i f(x) existe pour tout i = 1, · · · , n et pour 

tout x ∈ U. Pour tout i ∈ [1, n], x, z ∈ U et pour tout v ∈ E i , on a 

‖(D i f(z) − D i f(x))(v)‖ = ‖(Df(z) − Df(x))(0, · · · , v, · · · , 0)‖ 

≤ 

‖Df(z) − Df(x)‖ L(E1 ×···×E n,F )‖v‖, 


‖D i f(z) − D i f(x)‖ L(Ei ,F ) ≤ ‖Df(z) − Df(x)‖ L(E1 ×···×E n,F ), 

d’où la continuité de D i f en tout x ∈ U. Réciproquement, d’après le Théorème 2.4.1 l’application 

f est différentiable sur U et pour tout x, z ∈ U, h ∈ E 1 × · · · × E n on a 

‖(Df(z) − Df(x))(h)‖ 

≤ 

≤ 

n∑ 

‖(D i f(z) − D i f(x))(h i )‖ 

i=1 

( n∑ 

i=1 

) 

‖(D i f(z) − D i f(x))‖ ‖h‖. 

On obtient donc 

‖(Df(z) − Df(x))‖ L(E1 ×···×E n,F ) ≤ 

n∑ 

‖(D i f(z) − D i f(x))‖ L(Ei ,F ) 

i=1 

ce qui montre bien la continuité de Df. 

43

Corollaire 2.4.2 Soit U un ouvert de R n et f : U −→ R m , f = (f 1 , · · · , f m ). 

a) On suppose que les dérivées partielles ∂f i 

∂x j 

, (i, j) ∈ [1, m] × [1, n] existent au voisinage 

d’un point a ∈ U et sont continues en a. Alors f est différentiable en a et pour tout h ∈ R n 

où J f (a) est la matrice (m, n) définie par 

Df(a)(h) = J f (a)h, 

(J f (a)) i,j = ∂f i 

∂x j 

(a). 

b) De plus si les dérivées partielles ∂f i 

∂x j 

, (i, j) ∈ [1, m] × [1, n] sont continues sur U alors f 

est de classe C 1 sur U. 

Démonstration. a) Utilisant la Proposition 2.4.4, on a, pour tout i ∈ [1, m], j ∈ [1, n], x ∈ U et 

h ∈ R, 

( ∂fi 

|(D j f i (x) − D j f i (a))(h)| = ∣ (x) − ∂f ) 

i 

(a) h∣ 

∂x j ∂x j 


= 

∣ ∂f i 

(x) − ∂f i ∣ 

(a) ∣|h|, 

∂x j ∂x j 

‖D j f i (x) − D j f i (a)‖ L(R,R) 

= ∣ ∂f i 

(x) − ∂f i ∣ 

(a) ∣. 

∂x j ∂x j 

Il en résulte que les applications D i f j sont continues en a. Utilisant les Théorèmes 2.3.1 et 2.4.1, 

on obtient bien que f est différentiable en a. Le calcul de Df(a)(h) découle alors du Corollaire 

2.3.1. 

b) Montrons que les différentielles partielles D i f, 1 ≤ i ≤ n sont continues. Pour tout u ∈ R 

et pour tout x ∈ U, on a, utilisant la Proposition 2.4.4 

D i f(x)(u) = Df(x)(ue i ) 

= (Df 1 (x)(ue i ), · · · , Df m (x)(ue i )) 

( ∂f1 

= u (x), · · · , ∂f ) 

m 

(x) . 

∂x i ∂x i 


( ‖D i f(z) − D i f(x)‖ L(R,R m ) = 

∂f1 

∥ (z) − ∂f 1 

(x), · · · , ∂f m 

(z) − ∂f )∥ 

m ∥∥∥ 

(x) . 

∂x i ∂x i ∂x i ∂x i 

Il suffit alors d’appliquer le Corollaire 2.4.1. 

44

Remarque 2.4.1 Dans le cas où m = 1 on peut aussi écrire 

où 

∇f(a) = 

Df(a)(h) = 〈∇f(a), h〉 

( ∂f 

(a), · · · , ∂f ) 

(a) . 

∂x 1 ∂x n 

Corollaire 2.4.3 Soient E 1 , · · · , E n , F des espaces normés et soit 

f ∈ L n (E 1 , · · · , E n ; F ) 

une application multilinéaire continue. Alors f est de classe C 1 sur E 1 × · · · × E n et pour tout 

x, h ∈ E 1 × · · · × E n 

Df(a)(h) = f(h 1 , x 2 , · · · , x n ) + · · · + f(x 1 , · · · , x n−1 , h n ). 

Démonstration. Soit a ∈ E 1 × · · · × E n et i ∈ [1, n]. L’application partielle 

ϕ i (z) = f(a 1 , · · · , z, · · · , a n ), 

est alors linéaire et continue de E i dans F . Elle est donc différentiable d’après l’Exemple 2.1.1, 

b) et 

D i f(a) = ϕ i . 

Montrons alors que, pour tout 1 ≤ i ≤ n, l’application D i f est continue sur E 1 × · · · × E n ce 

qui démontrera le résultat grâce au Corollaire 2.4.1. Il suffit de faire la démonstration pour i = 1. 

Pour tout x ∈ E 1 × · · · × E n on a 

où 

est définie pour tout z ∈ E 2 × · · · × E n par 

D 1 f(x) = Ψ(x 2 , · · · , x n ) 

Ψ : E 2 × · · · × E n −→ L(E 1 , F ) 

Ψ(z) = f(., z 2 , · · · , z n ). 

Remarquons que Ψ est multilinéaire et que pour tout u ∈ E 1 


‖ψ(z)(u)‖ ≤ ‖f‖‖z 2 ‖ · · · ‖z n ‖‖u‖. 

‖ψ(z)‖ L(E1 ,F ) ≤ ‖f‖‖z 2 ‖ · · · ‖z n ‖, 

donc d’après le Théorème 1.5.1 du Chapitre 1, Ψ est continue sur E 2 × · · · × E n ce qui implique 

que D 1 f est continue sur E 1 × · · · × E n . 

On a aussi le 

45

Corollaire 2.4.4 Soient f : U ⊂ E −→ R et g : U ⊂ E −→ R ∗ différentiables en a ∈ U. Alors 

l’application f g 

est différentiable en a, et, pour tout u ∈ E, 

( f 

) 

D (a)(u) = 

g 

g(a)Df(a)(u) − f(a)Dg(a)(u) 

g(a) 2 . 

Démonstration. On a f g = ϕ ◦ (f, g) avec ϕ : R × R∗ −→ R définie par ϕ(s, t) = s t . On a 

∂ϕ 

∂s (s, t) = 1 t 

et 

∂ϕ 

∂t (s, t) = − s t 2 . Ces dérivées partielles étant continues sur R × R∗ , on déduit du 

Corollaire 2.4.2 que ϕ est différentiable sur R × R ∗ . Il en résulte que f est différentiable en a, et 

g 

que, pour tout u ∈ E, 

( f 

) 

D (a)(u) = Dϕ(f(a), g(a))(Df(a)(u), Dg(a)(u)) = 1 

f(a) 

Df(a)(u) − 

g g(a) g(a) Dg(a)(u), 

2 


Remarquons que si, dans le corollaire précédent, E est un espace de HILBERT, on a alors 

( f 

) 

∇ (a) = 

g 

g(a)∇f(a) − f(a)∇g(a) 

g(a) 2 . 

46

Chapitre 3 

Théorème des Accroissements Finis et 

Applications 

3.1 Théorème des Accroissements Finis 

Définition 3.1.1 Soit f : I −→ E une fonction définie sur un intervalle I de R à valeurs dans 

un espace normé E, on dit que f est dérivable à droite (resp. à gauche) en t 0 ∈ I si le vecteur 

f(t) − f(t 0 ) 

a une limite à droite (resp. à gauche) en t 0 . On note f d ′ t − t (t 0) (resp. f g(t ′ 0 )) cette limite 

0 

à droite (resp. à gauche) quand elle existe. 

Le résultat suivant est connu sous le nom de Théorème des accroissements finis. 

Théorème 3.1.1 Soit E un espace normé et soient f : [a, b] −→ E, g : [a, b] −→ R des fonctions 

continues sur [a, b] et dérivables sur ]a, b[. On suppose que, pour tout t ∈]a, b[ 

‖f ′ (t)‖ ≤ g ′ (t). 

Alors 

‖f(b) − f(a)‖ ≤ g(b) − g(a). 

Démonstration. Montrons que l’on a 

‖f(v) − f(u)‖ ≤ g(v) − g(u) pour tout a 

ce qui donnera bien la conclusion du théorème en faisant tendre u vers a et v vers b, utilisant la 

continuité de f et g en a et b. Supposons le contraire, il existe donc a 

‖f(v) − f(u)‖ − (g(v) − g(u)) = η > 0. 

Définissons a 0 = u et b 0 = v. Comme 

∥ 

‖f(v) − f(u)‖ − (g(v) − g(u)) ≤ ∥f(v) − f( u + v 

( 

) ∥ − g(v) − g( u + v ) 

) + 

2 

2 

∥ 

∥f( u + v 

( 

) − f(u) ∥ − g( u + v ) 

) − g(u) 

2 

2 

47

on a 

∥ ∥∥f(v) − f( 

u + v 

2 

( 

) ∥ − 

ou bien 

∥ ∥∥f( u + v 

( 

) − f(u) ∥ − 

2 

Choisissons alors a 1 , b 1 ∈ {a 0 , b 0 } tels que 

g(v) − g( u + v 

2 

g( u + v 

2 

) 

) ≥ η 2 , 

) 

) − g(u) ≥ η 2 . 

‖f(b 1 ) − f(a 1 )‖ − (g(b 1 ) − g(a 1 )) ≥ η 2 . 

On construit alors par récurrence, une suite décroissantes d’intervalles [a n , b n ] tels que b n − a n = 

b 0 − a 0 

2 n et 

‖f(b n ) − f(a n )‖ − (g(b n ) − g(a n )) ≥ η 2 n . (3.1) 

Les suites (a n ) n∈N et (b n ) n∈N convergent alors vers une limite commune c ∈ [a 0 , b 0 ] ⊂]a, b[. 

Utilisant la dérivabilité de f et g en c, on a 

f(a n ) = f(c) + (a n − c)f ′ (c) + (a n − c)ε(a n − c) 

f(b n ) = f(c) + (b n − c)f ′ (c) + (b n − c)ε(b n − c) 

g(a n ) = g(c) + (a n − c)g ′ (c) + (a n − c)η(a n − c) 

(3.2) 

g(b n ) = g(c) + (b n − c)g ′ (c) + (b n − c)η(b n − c), 

avec lim h→0 ε(h) = 0 et lim h→0 η(h) = 0. Revenant à (3.1), et utilisant l’inégalité triangulaire, il 

vient 

‖f(b n ) − f(c)‖ + ‖f(c) − f(a n )‖ − (g(b n ) − g(c)) − (g(c) − g(a n )) ≥ η 2 n . 

On obtient donc, utilisant (3.2) et le fait que a n ≤ c ≤ b n , 

avec 

η 

2 n ≤ ‖f ′ (c)‖(b n − c + c − a n ) − g ′ (c)(b n − a n ) + r n 

r n = (b n − c)(‖ε(b n − c)‖ + |η(b n − c)|) + (c − a n )(‖ε(a n − c)‖ + |η(a n − c)|). 

Divisant par b n − a n , il vient 

η 

b 0 − a 0 

≤ ‖f ′ (c)‖ − g ′ (c) + (b n − a n ) −1 r n . 

Il existe δ > 0 tel que, pour tout |h| ≤ δ, on a ‖ε(h)‖ ≤ ε et ‖η(h)‖ ≤ ε. Pour tout n assez grand 

pour que b n − a n ≤ δ, on a alors b n − c ≤ b n − a n et c − a n ≤ b n − a n , de telle sorte que 

r n ≤ 4(b n − a n )ε, 

48

donc lim n→∞ (b n − a n ) −1 r n = 0. On arrive donc à la contradiction 

‖f ′ (c)‖ > g ′ (c). 

On peut en fait démontrer le résultat plus général suivant 

Théorème 3.1.2 Soient f : [a, b] −→ E, g : [a, b] −→ R des fonctions continues sur [a, b] et 

dérivables à droite sur ]a, b[ sauf éventuellement sur une partie au plus dénombrable D de ]a, b[. 

On suppose que, pour tout t ∈]a, b[\D, 

‖f ′ d(t)‖ ≤ g ′ d(t). 

Alors 

‖f(b) − f(a)‖ ≤ g(b) − g(a). 

Démonstration. Soit n ↦−→ ρ n une surjection de N sur D. Soit ε > 0, on va montrer que, pour 

tout t ∈ [a, b] 

‖f(t) − f(a)‖ ≤ g(t) − g(a) + ε(t − a + 2), 

ce qui démontrera bien le résultat en faisant t = b et en faisant tendre ε vers 0. Posons 

A = {a} ∪ {t ∈]a, b] : ψ(s) ≤ 0, ∀s ∈ [a, t[}, 

où 

ψ(s) = ‖f(s) − f(a)‖ − (g(s) − g(a)) − ε(s − a) − ε ∑ ρ n

On a donc 

‖f(s) − f(c)‖ ≤ ‖f d(c)‖(s ′ − c) + (s − c)ε/2, 

≤ g d(c)(s ′ − c) + (s − c)ε/2 

≤ g(s) − g(c) + ε(s − c). 

Comme ψ(c) ≤ 0, on a 

‖f(c) − f(a)‖ ≤ (g(c) − g(a)) + ε(c − a) + ε ∑ ρ n

Corollaire 3.1.1 Soit f : [a, b] −→ E une fonction continue sur [a, b] et dérivable à droite sur 

]a, b[ sauf éventuellement sur une partie au plus dénombrable D de ]a, b[. On suppose qu’il existe 

M ≥ 0 telle que, pour tout t ∈]a, b[\D, 

Alors 

‖f ′ d(t)‖ ≤ M. 

‖f(b) − f(a)‖ ≤ M(b − a). 

Démonstration. Il suffit d’appliquer le Théorème 3.1.2 avec g(t) = Mt. 


a) Le Théorème 3.1.2 et le Corollaire 3.1.1 sont vrais en remplaçant la dérivée à droite par la 

dérivée à gauche. 

b) Quand E ≠ R, il n’existe pas en général d’élément c ∈ [a, b] tel que f(b) − f(a) = 

f ′ (c)(b − a) (voir T.D.). 

3.2 Applications du Théorème des Accroissements Finis 

Le résultat très utile suivant montre qu’une fonction différentiable dont la différentielle est 

majorée en norme par une constante M sur un convexe est M-Lipschitzienne sur ce convexe. 

Corollaire 3.2.1 Soit U ⊂ E un ouvert d’un espace normé et soit f : U −→ F une application 

différentiable et soit C ⊂ U un convexe tel que sup y∈C ‖Df(y)‖ ≤ M. Alors, pour tout x, z ∈ C 

‖f(z) − f(x)‖ ≤ M‖x − z‖. 

Démonstration. Soient x, z ∈ C. Définissons pour tout t ∈ [0, 1] 

et 

u(t) = tx + (1 − t)z ∈ U 

ϕ(t) = f(u(t)). 

La fonction ϕ est continue sur [0, 1], à valeurs dans C, dérivable sur ]0, 1[ et sa dérivée est donnée, 

utilisant le Corollaire 2.2.1 du Chapitre 2 

Il en résulte que pour tout t ∈]0, 1[ 

ϕ ′ (t) = Df(u(t))u ′ (t) = Df(tx + (1 − t)z)(x − z). 

‖ϕ ′ (t)‖ ≤ M‖x − z‖ = g ′ (t) 

en posant g(t) = M‖x − z‖t. Le Théorème 3.1.1 implique que 

‖f(x) − f(z)‖ = ‖ϕ(1) − ϕ(0)‖ ≤ g(1) − g(0) = M‖x − z‖. 

Le résultat suivant est aussi utile 

51

Proposition 3.2.1 Foit U ⊂ E un ouvert d’un espace normé E et soit f : U −→ F une application 

différentiable que l’on suppose M-lipschitzienne sur U. Alors, 

‖Df(x)‖ ≤ M pour tout x ∈ U. 

Démonstration. Pour tout x ∈ U et u ∈ E, on sait que 

f(x + tu) − f(x) 

Df(x)(u) = lim 

, 

t→0 t 

donc 

∥ ∥∥ f(x + tu) − f(x) 

∥ 

‖Df(x)(u)‖ = lim 

∥. 

t→0 t 

Pour tout t assez petit, on a x + tu ∈ U de telle sorte que 

‖f(x + tu) − f(x)‖ ≤ M|t|‖u‖, 

d’où 

∥ ∥∥ f(x + tu) − f(x) 

‖Df(x)(u)‖ = lim 

∥ ≤ M‖u‖, 

t→0 t 

ce qui montre bien que ‖Df(x)‖ ≤ M pour tout x ∈ U. 

Le résultat suivant est important. 

Corollaire 3.2.2 Soit U ⊂ E un ouvert connexe d’un espace normé, soit f : U −→ F une 

application différentiable telle que Df(x) = 0 pour tout x ∈ U. Alors f est constante sur U. 

Démonstration. Pour tout a ∈ U il existe un ouvert convexe, à savoir une boule ouverte B(a, r) 

sur laquelle Df est nulle et donc sur laquelle f est constante (Corollaire 3.2.1). Considérons 

a 0 ∈ U et posons b 0 = f(a 0 ) et U 0 = f −1 (b 0 ). L’ensemble U 0 est fermé car f est continue. Soit 

a ∈ U 0 , il existe une boule ouverte B(a, r) telle que f(x) = f(a) = b 0 sur B(a, r). Il en résulte 

que U 0 est ouvert dans U. Comme U 0 est aussi fermé dans U et que U est connexe, on a U = U 0 


Une application utile du Théorème des accroissements finis est de donner une condition suffisante 

pour passer à la limite sur la différentielle d’une suite de fonctions différentiables. 

Théorème 3.2.1 Soit U ⊂ E un ouvert connexe d’un espace normé et soit f p : U −→ F , p ∈ N 

une suite d’applications différentiables à valeurs dans un espace de Banach F . On suppose que 

i) il existe x 0 ∈ U tel que la suite (f p (x 0 )) converge ; 

ii) il existe une fonction g : U −→ L(E, F ) telle que, pour tout a ∈ U il existe une boule 

ouverte B(a) contenant a telle que la suite de fonctions (Df p ) converge uniformément sur B(a) 

vers g, ce qui signifie 

( 

lim 

p→∞ 

sup 

y∈B(a) 

‖Df p (y) − g(y)‖ L(E,F ) 

) 

= 0. 

Alors il existe une application différentiable f : U −→ F telle que pour tout a ∈ U, la suite 

(f p ) converge uniformément vers f sur B(a) et l’on a Df = g sur U. 

52

Démonstration. Soient p, q ∈ N et a ∈ U. On définit 

h(x) = f p (x) − f p (a) − (f q (x) − f q (a)). 

On a Dh(x) = Df p (x) − Df q (x) et h(a) = 0. Appliquant le Corollaire 3.2.1 à l’application h et 

à l’ouvert convexe B(a), on a pour tout x ∈ B(a) et pour tout p, q ∈ N, 

‖f p (x) − f p (a) − (f q (x) − f q (a))‖ ≤ ‖Df p − Df q ‖ C(B(a),F ) ‖x − a‖. (3.4) 

avec ‖Df p − Df q ‖ C(B(a),F ) = sup y∈B(a) ‖Df p (y) − Df q (y)‖. La suite (f p (x) − f p (a)) est donc 

de Cauchy dans F . Il en résulte que les suites (f p (x)) et (f p (a)) convergent ou divergent simultanément. 

Ceci implique que l’ensemble A des x ∈ U tels que (f p (x)) converge est à la fois ouvert 

et fermé dans U. En effet, d’après ce qui précéde on a B(a) ⊂ A ou B(a) ⊂ U \ A suivant que 

a ∈ A ou a ∈ U \ A. L’ensemble A qui est non vide par hypothèse est donc égal à U car U est 

connexe. Notons que pour tout x ∈ U, f(x) = lim p→∞ f p (x). Soit r(a) > 0 le rayon de la boule 

B(a). D’après 3.4 on a, pour tout x ∈ B(a) et pour tout p, q ∈ N, 

‖f p (x) − f p (a) − (f q (x) − f q (a))‖ ≤ ‖Df p − Df q ‖ C(B(a),F ) r(a), 

d’où, faisant tendre q vers l’infini, et passant à la borne supérieure sur x ∈ B(a), 

sup ‖f p (x) − f p (a) − (f(x) − f(a))‖ ≤ ‖Df p − Dg‖ C(B(a),F ) r(a). 

x∈B(a) 

Il en résulte que la suite d’applications (f p − f p (a)) converge uniformément vers f − f(a) sur 

B(a), donc (f p ) converge uniformément vers f sur B(a). 

Il reste à démontrer que f est différentiable et que Df = g. Soit a ∈ U. Posons pour tout x ∈ U 

où 

R(x) = f(x) − f(a) − g(a)(x − a) = R 1 (x) + R 2 (x) + R 3 (x), 

R 1 (x) = f(x) − f(a) − (f p (x) − f p (a)), 

R 2 (x) = f p (x) − f p (a) − Df p (a)(x − a), 

R 3 (x) = (Df p (a) − g(a))(x − a). 

On sait que pour tout x ∈ B(a) et pour tout p ∈ N 

‖R 1 (x)‖ = ‖f p (x) − f p (a) − (f(x) − f(a))‖ ≤ sup ‖Df p (y) − g(y)‖‖x − a‖. 

y∈B(a) 

Étant donné ε > 0 il existe p 0 ∈ N tel que pour tout p ≥ p 0 

sup ‖Df p (y) − g(y)‖ ≤ ε/3, 

y∈B(a) 

ce qui implique que, pour tout x ∈ B(a) et pour tout p ≥ p 0 

‖R 1 (x)‖ ≤ ‖x − a‖ε/3, 

‖R 3 (x)‖ ≤ sup ‖Df p (y) − g(y)‖‖x − a‖ 

y∈B(a) 

≤ ‖x − a‖ε/3. 

53

Fixons alors p 0 (qui ne dépend que de ε). Utilisant la différentiabilité de f p0 en a, il existe η > 0 

tel que, pour tout x ∈ B(a, η) ⊂ B(a) 

On obtient donc, pour tout x ∈ B(a, η), 


‖f p0 (x) − f p0 (a) − Df p0 (a)(x − a)‖ ≤ ‖x − a‖ε/3. 

‖R(x)‖ ≤ ‖R 1 (x)‖ + ‖R 2 (x)‖ + ‖R 3 (x)‖ ≤ ε‖x − a‖, 

On peut écrire ce résultat pour des séries d’applications. 

Corollaire 3.2.3 Soit U ⊂ E un ouvert connexe d’un espace normé et soit u p : U −→ F une 

suite d’applications différentiables à valeurs dans un espace de Banach F . On suppose 

i) Il existe a ∈ U tel que la série de terme général (u p (a)) converge dans F . 

ii) La série de fonctions de terme général (Du p (.)) converge uniformément vers une application 

g : U −→ L(E, F ), ce qui signifie que 

( 

lim 

p→∞ 

sup 

y∈U 

∥ 

p∑ 

) Du k (y) − g(y) ∥ = 0. 

L(E,F ) 

k=0 

Alors la série d’applications de terme général (u p (.)) converge uniformément sur U et on a 

Dans le cas des fonctions on obtient : 

( ∑ ∞ ) 

D u k (x) = 

k=0 

∞∑ 

Du k x. 

Théorème 3.2.2 Soit I ⊂ R un intervalle ouvert, soient f p : I −→ F , p ∈ N une suite de 

fonctions dérivables à valeurs dans un espace de Banach F . On suppose que 

i) Il existe t 0 ∈ I tel que la suite (f p (t 0 )) converge. 

ii) Il existe une fonction g : I −→ F telle que, pour tout a ∈ I, il existe un intervalle 

ouvert I(a) contenant a tel que la suite de fonctions (f ′ p) converge uniformément vers une fonction 

g : I −→ F sur I(a). 

Alors il existe une fonction f : I −→ F telle que pour tout a ∈ I la suite de fonctions (f p ) 

converge uniformément vers f sur I(a) et l’on a 

k=0 

f ′ (t) = g(t) pour tout t ∈ I. 

54

3.3 Applications Strictement Différentiables 

Définition 3.3.1 Soit f : U −→ F une application définie sur un ouvert d’un espace normé E et 

à valeurs dans un espace normé F . On dit que f est strictement différentiable en a ∈ U s’il existe 

une application linéaire continue ϕ ∈ L(E, F ) telle que, pour tout ε > 0, il existe η > 0 tel que 

f − ϕ soit ε-Lipschitzienne sur B(a, η), ce qui signifie 

pour tout x, z ∈ B(a, η), ‖f(z) − f(x) − ϕ(z − x)‖ ≤ ε‖z − x‖. 

Une application strictement différentiable en a est différentiable en a et Df(a) = ϕ. Il suffit de 

remplacer x par a dans l’inégalité ci-dessus. 

Théorème 3.3.1 Soit f : U −→ F une application définie sur un ouvert d’un espace normé E et 

à valeurs dans un espace normé F . On suppose que f est différentiable sur U et que l’application 

Df est continue en a. Alors f est strictement différentiable en a. 

Démonstration. Posons g(x) = f(x) − f(a) − Df(a)(x − a). On a Dg(x) = Df(x) − Df(a). 

Utilisant la continuité de Df en a et pour tout ε > 0, il existe donc η > 0 tel que, pour tout 

y ∈ B(a, η) 

‖Dg(y)‖ ≤ ε. 

D’après le Corollaire 3.2.1 pour tout x, z ∈ B(a, η), on a 


‖f(z) − f(x) − Df(a)(z − x)‖ = ‖g(z) − g(x)‖ 

≤ 

≤ 

sup ‖Dg(y)‖ × ‖z − x‖ 

y∈B(a,η) 

ε‖z − x‖ 

Il existe des applications strictement différentiable en un point sans que la différentielle soit 

continue en 0. 

Exemple 3.3.1 Introduisons la fonction paire h :] − 1, 1[−→ R définie par 

⎧ 

⎨ 0 si x = 0 

h(x) = 

⎩ 

(n + 1) −1 si x ∈ [(n + 1) −1 , n −1 [ 

et posons pour x ∈] − 1, 1[ 

f(x) = 

∫ x 

0 

h(t) dt. 

Soit ε > 0 et n ∈ N ∗ tel que n + 1 −1 ≤ εn −1 . Comme |h(t)| ≤ ε sur ]−ε, ε[, f est ε-Lipschitzienne 

sur ] − ε, ε[ ce qui montre que f est strictement différentiable en 0 avec f ′ (0) = 0 alors que f 

n’est pas dérivable aux points x = n −1 . 

55

On a cependant la 

Proposition 3.3.1 Soit f : U −→ F une application définie sur un ouvert d’un espace normé E 

et à valeurs dans un espace normé F . On suppose que f est différentiable sur U et strictement 

différentiable en a ∈ U. Alors Df est continue en a. 

Démonstration. Soit ε > 0 et η > 0 tel que h = f − Df(a) soit ε-Lipschitzienne sur B(a, η). Il 

résulte de la Proposition 3.2.1 que ‖Dh(x)‖ = ‖Df(x) − Df(a)‖ ≤ ε pour tout x ∈ B(a, η). 

3.4 Opérateurs de Nemicki 

Soit U un ouvert d’un espace normé E, f : U −→ F une application continue à valeurs dans 

un espace normé F et I un intervalle compact de R. On note C(I, E) l’ensemble des fonctions 

continues de I dans E et l’on munit cet ensemble de la norme ‖.‖ ∞ de la convergence uniforme. 

On définit 

Ω = {x ∈ C(I, E) : x(I) ⊂ U} (3.5) 

et on introduit 

définie pour tout x ∈ Ω par 

N f : Ω −→ C(I, F ) 

N f (x) = f ◦ x. 

Théorème 3.4.1 L’ensemble Ω défini en 3.5 est ouvert dans C(I, E) et l’application N f est continue. 

Démonstration. a) Ω est ouvert. Soit x ∈ Ω. Pour tout z ∈ x(I), il existe η z > 0 tel que 

B(z, 2η z ) ⊂ U. Du fait de la compacité de x(I), il existe n ∈ N ∗ et z 1 , . . . , z n ∈ x(I) tels que 

Posons η = min 1≤i≤n η zi . On a 

x(I) ⊂ 

n⋃ 

B(z i , η zi ). 

i=1 

B(x, η) ⊂ Ω. 

En effet, soit z ∈ B(x, η) et t ∈ I. Il existe alors i ∈ [1, n] tel que x(t) ∈ B(z i , η zi ). On a 

‖z(t) − z i ‖ ≤ ‖z(t) − x(t)‖ + ‖x(t) − z i ‖ ≤ 2η zi , 

ce qui montre que z(t) ∈ B(z i , 2η zi ) ⊂ U. On a donc bien z ⊂ Ω. 

b) N f est continue. Soit x ∈ Ω et ε > 0. Pour tout z ∈ x(I), il existe η z > 0 tel que pour tout 

y ∈ B(z, 2η z ) on ait ‖f(y) − f(z)‖ ≤ ε/2. Du fait de la compacité de x(I), il existe n ∈ N ∗ et 

z 1 , . . . , z n ∈ x(I) tels que 

n⋃ 

x(I) ⊂ B(z i , η zi ). 

i=1 

56

Soit alors 0 < η ≤ min 1≤i≤n η zi assez petit pour que B(x, η) ⊂ Ω. Pour tout y ∈ B(x, η) et pour 

tout t ∈ I, il existe i ∈ [1, n] tel que x(t) ∈ B(z i , η zi ). On a 

‖y(t) − z i ‖ ≤ ‖y(t) − x(t)‖ + ‖x(t) − z i ‖ ≤ 2η zi , 

‖x(t) − z i ‖ ≤ 2η zi , 

d’où 

‖f(y(t) − f(x(t))‖ ≤ ‖f(y(t) − f(z i )‖ + ‖f(z i ) − f(x(t))‖ ≤ ε. 

On a alors 


‖N f (y) − N f (x)‖ ∞ = ‖f(y) − f(x)‖ ∞ = sup ‖f(y(t)) − f(x(t))‖ ≤ ε 

t∈I 

L’opérateur N f est alors appelé opérateur de Nemicki associé à f. On considère alors un ouvert 

U ⊂ R × E et f : U −→ F une application continue. On pose 

A = {x ∈ C(I, E) : (t, x(t)) ∈ U pour tout t ∈ I}. 

L’ensemble A est ouvert, (éventuellement vide). En effet on a A = L −1 (Ω) où 

Ω = {u ∈ C(I, R × E) : u(I)) ∈ U} 

et 

est définie par 

L : C(I, E) −→ C(I, R × E) 

L(x) = (Id R , x). 

Comme L est continue et Ω ouvert, il en est donc bien de même de A. Introduisons 

N f : A −→ C(I, F ) 

définie par 

N f (x) = (N f ◦ L)(x), 

à savoir N f (x) = f(·, x(·)). L’application N f est alors continue comme composée de deux applications 

continues. Etudions alors la différentiabilité de N f . 

Théorème 3.4.2 Soit f : U −→ F continue telle que D 2 f existe et est continue sur U. Alors 

l’application N f est de classe C 1 sur A et pour tout x ∈ A, h ∈ C(I, E), t ∈ I, 

) 

(DN f (x)(h) (t) = D 2 f(t, x(t))(h(t)). 

57

Démonstration. D’après le Théorème 3.4.1, l’application 

N D2 f : A −→ C(I, L(E, F )) 

définie par 

N D2 f = N D2 f ◦ L 

est continue. Soit x ∈ A. Pour tout ε > 0, il existe donc η > 0 tel que ‖y − x‖ ∞ ≤ η implique 

y ∈ A et 

‖N D2 f(y) − N D2 f(x)‖ ∞ = sup ‖D 2 f(t, y(t)) − D 2 f(t, x(t))‖ L(E,F ) ≤ ε. 

t∈I 

Soit h ∈ C(I, E) tel que ‖h‖ ∞ < η, soit t ∈ I. Posons 

ϕ t (ξ) = f(t, x(t) + ξ) − f(t, x(t)) − D 2 f(t, x(t))(ξ). 

Remarquons que ϕ t (ξ) est défini et différentiable sur B(0, η) avec 

Dϕ t (ξ) = D 2 f(t, x(t) + ξ) − D 2 f(t, x(t)). 

D’où 

sup ‖Dϕ t (ξ)‖ ≤ sup ‖D 2 f(t, x(t) + ξ) − D 2 f(t, x(t))‖ ≤ ε. 

‖ξ‖

(M est fini comme borne supérieure d’une fonction continue sur un compact). Il en résulte que 

‖L(h)‖ ≤ M‖h‖, 

ce qui montre que L ∈ L(C(I, E), C(I, F )) et donc que N f est différentiable en x. Reste à montrer 

que DN f est continue. Pour tout x, y, pour tout h ∈ C(I, E) et pout tout t ∈ I, on a 

de telle sorte que 

donc 

‖((DN f (y) − DN f (x))(h))(t)‖ ≤ ‖D 2 f(t, y(t)) − D 2 f(t, x(t))‖ L(E,F ) ‖h(t)‖, 

‖(DN f (y) − DN f (x))(h)‖ ∞ ≤ sup ‖D 2 f(t, y(t)) − D 2 f(t, x(t))‖ L(E,F ) ‖h‖ ∞ 

t∈I 

‖DN f (y) − DN f (x)‖ L(C(I,E),C(I,F )) ≤ sup ‖D 2 f(t, y(t)) − D 2 f(t, x(t))‖ L(E,F ) , 

t∈I 


‖DN f (y) − DN f (x)‖ L(C(I,E),C(I,F )) ≤ ‖N D2 f(y) − N D2 f(x)‖ ∞ , 

ce qui achève la démonstration car N D2 f est continue. 

Le Théorème 3.4.2 a de nombreuses applications. Citons le 

Théorème 3.4.3 Soit I = [a, b] un intervalle compact. Soit E un espace normé, U ⊂ R × E un 

ouvert et f : U −→ R n une application continue. On pose 

A = {x ∈ C(I, E) : (t, x(t)) ∈ U pour tout t ∈ I} 

et on définit une application I f : A −→ R n par 

Alors, 

a) I f est continue sur A. 

I f (x) = 

∫ b 

a 

f(t, x(t)) dt. 

b) Si de plus D 2 f existe et est continue sur U, l’application I f est de classe C 1 sur A et, pour 

x ∈ A et h ∈ C(I, E) 

(DI f (x))(h) = 

∫ b 

a 

D 2 f(t, x(t))h(t) dt. 

59

Démonstration. a) Définissons 

par 

I : C(I, R n ) −→ R n 

I(z) = 

∫ b 

a 

z(t) dt. 

Il est clair que I est linéaire continue et que I f = I ◦ N f . On obtient donc bien que I f est continue 

comme composée de deux applications continues. 

b) D’après le Théorème 3.4.2 l’application N f est continuement différentiable. Il en est donc 

de même de I f . Pour x ∈ A et h ∈ C(I, E), on a 

(DI f (x)h) = (I ◦ DN f (x))(h) = 

∫ b 

a 

D 2 f(t, x(t))(h(t)) dt. 

Remarque 3.4.1 Dans le cas où U ⊃ I × V où V est un ouvert de E, le Théorème 3.4.1 montre 

que l’ensemble Ω = {x ∈ C(I, E) : x(I) ⊂ V } est ouvert dans C(I, E). Comme A ⊃ Ω , il en 

résulte que A est non vide. 

3.5 Primitives et Intégrales des Fonctions Réglées 

Définition 3.5.1 

a) Soit I un intervalle d’extrémités éventuellement infinies a et b et f : I −→ E une fonction 

à valeurs dans un espace de Banach E. On dit que f est une fonction en escalier sur I s’il existe 

une suite finie a = t 0 < · · · < t n = b telle que f soit constante sur chacun des intervalles ]t i , t i+1 [ 

pour tout 0 ≤ i ≤ n − 1. 

b) On dit que f : I −→ E est une fonction réglée si elle admet une limite à droite et une limite 

à gauche en tout t ∈ I. (Une fonction en escalier est réglée, une fonction continue est réglée ainsi 

qu’une fonction monotone à valeurs dans R). 

Le résultat suivant caractérise l’ensemble des fonctions réglées sur un intervalle compact 

comme étant l’adhérence pour la topologie de la convergence uniforme de l’ensemble des fonctions 

en escalier 

Théorème 3.5.1 Soit I un intervalle compact et f : I −→ E une fonction à valeurs dans un 

espace de Banach E. Alors les deux propriétés suivantes sont équivalentes, 

i) f est une fonction réglée, 

ii) f est limite uniforme sur I d’une suite de fonctions en escalier. 

60

Démonstration 

i) =⇒ ii). Pour tout n ∈ N ∗ et pour tout t ∈ I il existe, par application du critère de Cauchy à 

droite et à gauche en t, un intervalle ouvert I(t) =]a(t), b(t)[ contenant t tel que 

‖f(s) − f(s ′ )‖ ≤ 1/n 

pour tout s, s ′ ∈ I∩]t, b(t)[ ou s, s ′ ∈ I∩]a(t), t)[. Par compacité il existe m ∈ N ∗ et t 1 , . . . , t m ∈ I 

tels que I ⊂ ⋃ m 

i=1 I(t i). Soit alors c 0 < c 1 < · · · < c k la suite telle que 

{c 0 , . . . , c k } = {a, b, t i , a(t i ), b(t i ) : 1 ≤ i ≤ m} ∩ I. 

Chaque c j appartient à un intervalle I(t i ). Si c j ∈]a(t i ), t i [ alors c j < c j+1 ≤ t i . Si c j ∈ [t i , b(t i )[, 

alors c j < c j+1 ≤ b(t i ). Dans tous les cas on a |f(s) − f(s ′ )| ≤ 1/n sur ]c j , c j+1 [∩I. Soit alors la 

fonction f n définie par 

f n (c j ) = f(c j ) si c j ∈ I, 

f n (t) = f(τ j ) si t ∈]c j , c j+1 [∩I où τ j ∈]c j , c j+1 [∩I. 

On a alors ‖f n − f‖ ∞ ≤ 1/n, d’où le résultat. 

ii) =⇒ i). Soit t ∈ I. Pour tout ɛ > 0 il existe n ∈ N tel que ‖f n − f‖ ∞ ≤ ɛ/3. La fonction f n 

étant en escalier, il existe η > 0 tel que f n prend des valeurs constantes sur chacun des intervalles 

]t, t + η[∩I et ]t − η, t[∩I. Pour tout s, s ′ ∈]t, t + η[∩I ou s, s ′ ∈]t − η, t[∩I, on a 

‖f(s ′ ) − f(s)‖ ≤ ‖f(s ′ ) − f n (s ′ )‖ + ‖f n (s ′ ) − f n (s)‖ + ‖f n (s ′ ) − f(s)‖ ≤ ɛ. 

Le critère de Cauchy est alors vérifié à droite et à gauche en t. Il en résulte bien l’existence de 

limites à droite et à gauche en t, l’espace E étant supposé complet. □ 

Définition 3.5.2 Soit I ⊂ R un intervalle et f : I −→ E une fonction à valeurs dans un espace 

de Banach E. On dit que la fonction continue Φ : I −→ E est une primitive de f dans I s’il existe 

une partie au plus dénombrable D ⊂ I telle que Φ soit dérivable sur I \ D et telle que Φ ′ = f 

sur I \ D. 

Proposition 3.5.1 Soit I ⊂ R un intervalle et f : I −→ E une fonction à valeurs dans un espace 

de Banach E. Alors si Φ 1 et Φ 2 sont deux primitives de f sur I, Φ 1 − Φ 2 est constante sur I. 


D’après la définition des primitives, il existe deux parties au plus dénombrables D 1 et D 2 de 

I telles que (Φ 1 − Φ 2 ) ′ = 0 sur I \ (D 1 ∪ D 2 ). Écrivons I comme réunion d’une suite croissante 

d’intervalles compacts I n . D’après le Corollaire 3.1.1 la fonction Φ 1 −Φ 2 est constante sur chaque 

I n donc sur I, (détaillez le raisonnement en exercice). □ 

Lemme 3.5.1 Soit I un intervalle compact de R et soit f : I −→ E une fonction en escalier, 

alors f admet une primitive sur I. 

61


Soient a 

0 ≤ i ≤ n − 1 f(t) = c i sur l’intervalle ]t i , t i+1 [. Posons F (t) = c 0 (t − t 0 ) pour t ∈ [t 0 , t 1 ] et pour 

1 ≤ i ≤ n − 1 et t ∈ [t i , t i+1 ] 

∑i−1 

F (t) = c i (t − x i ) + c k (t k+1 − t k ) 

Nous laissons au lecteur le soin de vérifier que F est continue et vérifie F ′ (t) = f(t) pour tout 

t ∈ I \ {t 0 , . . . , t n }. □ 

Théorème 3.5.2 Soit I ⊂ R un intervalle et f : I −→ E une fonction réglée à valeurs dans un 

espace de Banach E. Alors f admet une primitive Φ dans I. 


Remarquons que I s’écrit comme réunion croissante d’une suite (I n ) d’intervalles compacts. 

Soit t 0 ∈ int (I). Supposons démontré que f possède une primitive Φ n dans I n telle que Φ n (t 0 ) = 

0. On observe alors que si m ≥ n, on a Φ m | ∣ = Φ n . En effet ces deux primitives d’une même 

n 

fonction différent d’une constante d’après la Proposition 3.5.1. Comme elles sont égales en t 0 

elles coïncident sur I n . On définit alors sans ambiguïté une primitive Φ de f par Φ(t) = Φ n (t) si 

t ∈ I n . 

On peut donc supposer I compact. D’après le Théorème 3.5.1 f est limite uniforme dans I 

d’une suite de fonctions en escalier (f n ). Soit Φ n une primitive de f n et D n ⊂ I telle que Φ ′ n = f n 

sur I \ D n . Choisissons Φ n telle que Φ n (t 0 ) = 0 où t 0 ∈ I. On peut alors appliquer le Théorème 

3.2.2 qui nous permet de conclure que la suite (Φ n ) converge uniformément vers une fonction Φ 

telle que Φ ′ = f sur l’ensemble I \ D où D = ⋃ n≥0 D n est au plus dénombrable, ce qui achève 

la démonstration. □ 

On peut alors définir l’intégrale d’une fonction réglée définie sur un intervalle I et à valeurs 

dans un espace de Banach. Pour cette intégrale une primitive de fonction réglée est l’intégrale de 

sa dérivée. 

Théorème 3.5.3 THÉORÈME ET DÉFINITION 

Soit I ⊂ R un intervalle et f : I −→ E une fonction réglée à valeurs dans un espace de 

Banach E. On pose, pour tout a, b ∈ I (on ne suppose pas a ≤ b) 

∫ b 

a 

k=0 

f(t)dt = Φ(b) − Φ(a) 

où Φ est une primitive de f dont l’existence est garantie par le Théorème 3.5.2. On a alors 

∥ 

∫ b 

a 

f(t)dt∥ ≤ ∣ 

∫ b 

a 

∣ 

‖f(t)‖dt∣. 

62


La définition de ∫ b 

f(t)dt ne dépend pas de la primitive Φ car d’après la Proposition 3.5.1, 

a 

deux primitives d’une même fonction différent d’une constante. Pour démontrer l’inégalité 

∥ 

∫ b 

a 

f(t)dt∥ ≤ ∣ 

∫ b 

a 

‖f(t)‖dt∣ 

on suppose a ≤ b. Soit Φ la primitive de f telle que φ(a) = 0. On a, pour tout t ∈ [a, b] 

Φ(t) = 

∫ t 

a 

f(s)ds. 

Il existe alors une partie au plus dénombrable D ⊂ [a, b] telle que sur [a, b] \ D, 

Φ ′ (t) = f(t), 

d’où ‖Φ ′ (t)‖ = ‖f(t)‖. Remarquons que la fonction ‖f(.)‖ est réglée car la norme est continue. 

Il existe donc ∆ ⊂ [a, b] au plus dénombrable telle que G ′ (t) = ‖f(t)‖ où G(t) = ∫ t 

‖g(s)‖ds. 

a 

Pour t ∈ [a, b] \ (D ∪ ∆) on a donc 

D’après le Théorème 3.1.1 on obtient 

d’où 


‖Φ ′ (t)‖ ≤ G ′ (t). 

‖F (b) − F (a)‖ ≤ G(b) − G(a), 

∥ 

∫ b 

a 

f(t)dt∥ ≤ 

∫ b 

a 

‖f(t)‖dt. □ 

a) Soit I = [a, b], f : I −→ E une fonction en escalier à valeurs dans un espace de Banach 

E et soient a = t 0 < · · · < t n = b telle que f(t) = c i sur ]t i , t i+1 [. On sait que la fonction 

Φ : I −→ E définie par Φ(t) = c 0 (t − t 0 ) si t ∈ [t 0 , t 1 ] et 

∑i−1 

Φ(t) = c i (t − t i ) + c k (t k+1 − t k ) 

k=0 

si t ∈ [t i , t i+1 ] est une primitive de f sur [a, b]. On a donc 

∫ b 

a 

∑n−2 

f(t)dt = Φ(b) − Φ(a) = c n−1 (t n − t n−1 ) + c k (t k+1 − t k ) 

k=0 

d’où 

∫ b 

∑n−1 

f(t)dt = c k (t k+1 − t k ). 

a 

k=0 

63

) Il est important d’observer que si f : [a, b] −→ E est une fonction réglée, la fonction 

Φ : [a, b] → E définie par 

est une primitive de f sur [a, b]. 

Φ(t) = 

∫ t 

a 

f(s)ds 

c) Si f : I −→ E est continue on a, pour toute primitive Φ de f 

Φ ′ (t) = f(t) pour tout t ∈ I. 

En effet on peut supposer que Φ(t) = ∫ t 

t 0 

f(s)ds pour un certain t 0 ∈ I. Il en résulte donc que 

‖Φ(t + h) − Φ(t) − hf(t)‖ = 

≤ 

∥ 

∣ 

∫ t+h 

t 

∫ t+h 

t 

(f(s) − f(t))ds∥ 

∣ 

‖f(s) − f(t)‖ds∣. 

Etant donné ɛ > 0 il existe η > 0 tel que |s − t| ≤ η implique ‖f(s) − f(t)‖ ≤ ɛ. On a donc, pour 

|s − t| ≤ η 

∫ t+h 

‖Φ(t + h) − Φ(t) − hf(t)‖ ≤ ∣ ɛds∣ = ɛ|h|, 


Théorème 3.5.4 Soit I ⊂ R un intervalle et g : I −→ E une fonction à valeurs dans un espace 

de Banach E qui est primitive d’une fonction réglée. (Cela signifie que g est continue, qu’il existe 

une fonction réglée g ′ telle que la dérivée de g en t soit égale à g ′ (t) pour tout t ∈ I \ D où D ⊂ I 

est au plus dénombrable). Alors, pour tout t 0 , t ∈ I 


Comme g ′ est réglée, la fonction 

g(t) = g(t 0 ) + 

γ(t) = g(t 0 ) + 

∫ t 

t 

t 0 

g ′ (s)ds. 

∫ t 

t 0 

g ′ (s)ds 

est une primitive de g ′ sur [a, b]. Comme g est aussi une primitive de g ′ et que g(t 0 ) = γ(t 0 ) on a 

g(.) = γ(.) sur I, ce qui achève la démonstration. □ 

Nous laissons au lecteur le soin d’établir les règles de calcul pour cette intégrale. Nous donnons 

cependant le résultat utile suivant qui permet d’établir un lien entre l’intégrale de la limite et la 

limite des intégrales. 

64

Théorème 3.5.5 Soit I = [a, b] un intervalle compact et soit f n : I −→ F une suite de fonctions 

réglées à valeurs dans un espace de Banach F . On suppose que (f n ) converge uniformément vers 

f dans I. Alors f est réglée dans I et 

∫ b 

lim 

n→∞ 

a 

f n (t)dt = 

∫ b 

a 

f(t)dt. 


La fonction f est réglée. En effet, d’après le Théorème 3.5.1 pour tout n ∈ N, il existe une 

fonction ϕ n en escalier dans I telle que 

‖ϕ n − f n ‖ ≤ 1/n. 

La suite (ϕ n ) converge donc uniformément vers f dans I, ce qui montre, utilisant de nouveau le 

Théorème 3.5.1 que f est réglée dans I. On a alors 

∥ 

∫ b 

a 

d’où le résultat. □ 

f n (s)ds − 

∫ b 

a 

f(s)ds∥ ≤ 

∫ b 

a 

‖f n (s) − f(s)‖ds ≤ (b − a)‖f n − f‖ ∞ 

Théorème 3.5.6 Soient F , G des espaces de Banach, soit I = [a, b] un intervalle compact, soit 

f : I −→ F une fonction réglée et soit u ∈ L(F, G). Alors u ◦ f est réglée et 

( ∫ b 

u 

a 

) 

f(t)dt) = 

∫ b 

a 

u(f(t))dt. 


Le fait que u ◦ f soit réglée découle de la continuité de u. Supposons que f est en escalier, il 

en est alors de même de u ◦ f. On a alors 

∫ b 

a 

( ∫ b 

u 

a 

f(t)dt = 

) 

f(t)dt 

= 

= 

∑n−1 

c k (t k+1 − t k ), 

k=0 

n−1 

∑ 

u(c k )(t k+1 − t k ) 

k=0 

∫ b 

a 

u(f(t))dt. 

Revenons au cas général. Il existe une suite (f n ) de fonctions en escalier qui converge uniformément 

vers f sur I. Comme, pour tout n ∈ N et pour tout t ∈ I, on a 

‖u(f n (t)) − u(f(t))‖ ≤ ‖u‖‖f n (t)) − (f(t)‖, 

65

la suite de fonctions en escalier (u ◦ f n ) converge uniformément vers u ◦ f sur I. Utilisant le 

Théorème 3.5.5, il vient 

∫ b 

a 

( ∫ b 

u(f(t))dt = lim 

n→∞ 

= lim 

= u 

a 

u 

n→∞ 

a 

( ∫ b 

lim 

n→∞ 

a 

( ∫ b ) 

= u f(t)dt 

d’après le Théorème 3.5.5, d’où le résultat. □ 

Exemple 3.5.1 

a 

) 

u(f n (t))dt 

( ∫ b ) 

(f n (t))dt car f n est en escalier, 

) 

(f n (t))dt car u est continue, 

a) Dans le cas où F = R n , G = R, i ∈ [1, n], u(x 1 , . . . , x n ) = x i et f(t) = (f 1 (t), . . . , f n (t)), 

on a 

( ∫ b ) ∫ b 

f(t)dt = f i (t)dt, et donc 

a 

i a 

∫ b ( ∫ b 

∫ b ) 

f(t)dt = f 1 (t)dt, . . . , f n (t)dt . 

a 

a 

b) Dans le cas où u : L(E, F ) → F est définie par u(A) = A(h), h étant un élément fixé de 

E (vérifiez que u ∈ L(L(E, F ), F )) et si A : I → L(E, F ) est réglée, le Théorème 3.5.6 conduit 

à 

∫ b 

( ∫ b ) 

A(t)(h)dt = A(t)dt (h). 

a 

a 

a 

66

Chapitre 4 

Différentielles d’Ordre Supérieur 

4.1 Définition des Différentielles d’Ordre Supérieur 

Soit f : U −→ F différentiable sur U et a ∈ U. Il est naturel de s’intéresser à la différentiabilité 

en a de l’application 

Df : U −→ L(E, F ). 

Rappellons qu’étant donnés des espaces normés E et F et un entier p ∈ N, on désigne par 

L p (E; F ) l’ensemble des applications de E p dans F qui sont multilinéaires (i.e. linéaires par 

rapport à chaque variable) et continues. On définit alors par récurrence la différentielle d’ordre p 

d’une application f : U −→ F . 

Définition 4.1.1 Soit f : U −→ F et p ≥ 2 un entier. On dit que f est p fois différentiable en 

a ∈ U si D p−1 f(x) ∈ L p−1 (E; F ) existe dans un voisinage V ⊂ U de a et si l’application 

D p−1 f : V −→ L p−1 (E; F ) 

est différentiable en a. Pour tout u = (u 1 , · · · , u p ) ∈ E p on pose alors 

On a alors D p f(a) ∈ L p (E; F ). 

D p f(a)(u 1 , · · · , u p ) = (D(D p−1 f)(a)(u 1 ))(u 2 , · · · , u p ). 

On vérifie que cette définition est bien cohérente : on a D(D p−1 f)(a) ∈ L(E, L p−1 (E; F )), donc 

D(D p−1 f)(a)(u 1 ) ∈ L p−1 (E; F ) et (D(D p−1 f)(a)(u 1 ))(u 2 , · · · , u p ) ∈ F . Il est clair que D p f(a) 

est multilinéaire. Le fait que D p f(a) soit continue découle des inégalités suivantes 

‖D p f(a)(u 1 , · · · , u p )‖ ≤ ‖D(D p−1 f)(a)(u 1 )‖ L p−1 (E;F )‖u 2 ‖ · · · ‖u p ‖ 

≤ 

‖D(D p−1 f)(a)‖ L(E,L p−1 (E;F )‖u 1 ‖‖u 2 ‖ · · · ‖u p ‖. 

Remarque 4.1.1 On a vu au Théorème 1.5.2 que l’application 

Φ : L(E, L p−1 (E; F )) −→ L p (E; F ) 

définie pour g ∈ L(E, L p−1 (E; F )) et (x 1 , · · · , x p ) ∈ E p par 

Φ(g)(x 1 , · · · , x p ) = g(x 1 )(x 2 , · · · , x p ) 

67

est une isométrie linéaire de L(E, L p−1 (E; F )) dans L p (E; F ) et l’isométrie réciproque 

Ψ : L p (E; F ) → L(E, L p−1 (E; F )) 

est définie, pour tout f ∈ L p (E; F ), x ∈ E et (x 1 , · · · , x p−1 ) ∈ E p−1 par 

Ψ(f)(x)(x 1 , · · · , x p−1 ) = f(x, x 1 , · · · , x p−1 ). 

Avec ces notations, on a, si f est p fois différentiable en a, 

Ψ(D p f(a)) = D(D p−1 f)(a), (4.1) 

et 

Φ(D(D p−1 f)(a)) = D p f(a). (4.2) 

Si de plus f est p fois différentiable dans un voisinage V de a, alors 

D(D p−1 f) = Ψ ◦ D p f sur V, 

et 

D p f = Φ ◦ D(D p−1 f) sur V. 

Dans le cas où f est définie sur un intervalle ouvert de R, il est utile de faire le lien entre différentielle 

d’ordre p et dérivée d’ordre p. 

Définition 4.1.2 Soit f : I −→ E une fonction définie sur un intervalle ouvert I de R et p ∈ N ∗ . 

On dit que f est p fois dérivable en a ∈ I si f (p−1) existe au voisinage de a et est dérivable en a. 

On pose alors f (p) = (f (p−1) ) ′ . 

Proposition 4.1.1 Soit f : I −→ E une fonction définie sur un intervalle ouvert I de R. Alors 

f est p fois dérivable en a si et seulement si f est p fois différentiable en a. De plus pour tout 

(u 1 , · · · , u p ) ∈ R p on a 

D p f(a)(u 1 , · · · , u p ) = u 1 · · · u p f (p) (a) (4.3) 

et 

f (p) (a) = D p f(a)(1, · · · , 1). (4.4) 

Démonstration. Par récurrence sur p. Pour p = 1, c’est le Théorème 2.1.1 du Chapitre 2. Supposons 

le résultat à l’ordre p. Les relations (4.3) et (4.4) peuvent s’ecrire 

D p f = α ◦ f (p) et f (p) = e ◦ D p f, 

où α : E −→ L p (R; E) et e : L p (R; E) −→ E sont les applications linéaires continues définies 

pour tout x ∈ E, t 1 , · · · , t p ∈ R p , A ∈ L p (R; E) par α(x)(t 1 , · · · , t p ) = t 1 · · · t p x et e(A) = 

A(1, · · · , 1). Le résultat découle alors des Théorèmes 2.1.1 et 2.2.1 du chapitre 2. On obtient que 

D p f est différentiable en a et que 

D(D p f)(a) = α ◦ Df (p) (a), 

68

d’où 

D p+1 f(a)(u 1 , · · · , u p+1 ) = ((D(D p f)(a))(u 1 ))(u 2 , · · · , u p+1 ) 

= α(u 1 f (p+1) (u 2 , · · · , u p+1 ) 

et que f (p) est dérivable en a avec 

= u 1 · · · u p+1 f (p+1) (a), 

f (p+1) (a) = e((D p f) ′ (a)) 

= e(D(D p f)(a)(1)) 

= (D(D p f)(a)(1))(1, · · · , 1) 

= D p+1 f(a)(1, · · · , 1). 

Définition 4.1.3 On dit que f est de classe C p sur U si D p f existe sur U et si l’application 

D p f : U −→ L p (E; F ) est continue. On dit que f est de classe C ∞ si f est de classe C p pour tout 

p ∈ N ∗ . 

Un exemple simple de fonction de classe C ∞ est fourni par la : 

Proposition 4.1.2 Soit f ∈ L 2 (E, F ; G) une application bilinéaire continue, alors f est de classe 

C ∞ et D p f = 0 pour tout p > 2. 

Démonstration. On sait (voir chapitre 2, exemple 2.1.1, c)) que f est différentiable sur E × F et 

que pour tout (x 1 , x 2 ) ∈ E 2 , (u, v) ∈ E 2 

Df(x 1 , x 2 )(u, v) = f(x 1 , v) + f(u, x 2 ). 

Il en résulte aisément que Df : E × E −→ L(E × E, F ) est linéaire continue (le vérifier). On 

en déduit que D(Df)(x 1 , x 2 ) = Df pour tout (x 1 , x 2 ) ∈ E × F donc l’application D 2 f(.) est 

constante ce qui implique bien D p f = 0 pour p > 2. 

Proposition 4.1.3 Soient U ⊂ E, V ⊂ F des ouverts, soient f : U −→ V 2 fois différentiable en 

a ∈ U et g : V −→ G et g 2 fois différentiable en b = f(a). Alors g ◦ f est 2 fois différentiable en 

a. 

69

Démonstration. Définissons Φ : L(F, G) × L(E, F ) −→ L(E, G) par Φ(A, B) = A ◦ B. 

L’application Φ est bilinéaire et comme ‖Φ(A, B)‖ ≤ ‖A‖‖B‖, elle est continue. Utilisant le 

Théorème 2.2.1 du chapitre 2, on a, pour tout x voisin de a 

ce que l’on peut écrire 

D(g ◦ f)(x) = Dg(f(x)) ◦ Df(x), 

D(g ◦ f) = Φ ◦ Θ 

avec Θ = (Dg ◦ f, Df). On remarque que Θ est différentiable en a car ses deux composantes le 

sont, et que Φ est de classe C ∞ (voir Proposition 4.1.2). On obtient donc bien que D(g ◦ f) est 

différentiable en a donc g ◦ f est deux fois différentiable en a. 

Les propositions suivante sont utiles pour le calcul des différentielles d’ordre supérieur. 

Proposition 4.1.4 Soit f : U −→ F une application p fois différentiable en a ∈ U. Posons, pour 

x dans un voisinage de a et pour tout u 2 , · · · , u p ∈ E p−1 , 

g(x) = D p−1 f(x)(u 2 , · · · , u p ). 

Alors g est différentiable en a et, pour tout u 1 ∈ E, on a 

D p f(a)(u 1 , · · · , u p ) = Dg(a)(u 1 ). 

Démonstration. On a g = e ◦ D p−1 f où e : L p−1 (E; F ) −→ F est définie par e(A) = 

A(u 2 , · · · , u p ). L’application e est linéaire. De plus ‖e(A)‖ ≤ ‖A‖‖u 2 ‖ · · · ‖u p ‖ donc A est continue. 

Il en résulte que g est différentiable en a et que pour tout u 1 ∈ E 

Dg(a)(u 1 ) = e(D(D p−1 f)(a)(u 1 )) 

= (D(D p−1 )f(a)(u 1 ))(u 2 , · · · , u p ) 

= D p f(a)(u 1 , · · · , u p ). 

Proposition 4.1.5 a) Si f : U −→ F est p fois différentiable en a ∈ U, on a pour tout u ∈ E, 

v ∈ E p−1 , 

D p f(a)(u, v) = ϕ ′ (0), 

où ϕ(t) = D p−1 f(a + tu)(v). 

b) Si f est p fois différentiable en a + tu ∈ U avec u ∈ E et t ∈ R, alors 

où ψ(t) = f(a + tu). 

D p f(a + tu)(u, · · · , u) = ψ (p) (t), 

70

Démonstration. a) On a ϕ = (e ◦ g)(a + tu) avec e(A) = A(v) pour A ∈ L p−1 (E; F ) est linéaire 

et continue et g(x) = D p−1 f(x) donc g est différentiable an a et 

Dg(a)(u) = D p f(a)(u, ·). 

On obtient donc que e ◦ g est différentiable en a, donc ϕ est dérivable en 0 et 

ϕ ′ (0) = D(e ◦ g)(a)(u) = e(Dg(a)(u)) = D p f(a)(u, v). 

b) Remarquons que ψ est définie dans un intervalle ouvert contenant t. Pour p = 1, ψ est 

dérivable en t car f est différentiable en a + tu et t ↦−→ a + tu est dérivable sur R, et, d’après la 

règle de la différentielle d’une composée, on a 

ψ ′ (t) = Df(a + tu)(u). 

Supposons le résultat vrai pour p et considérons f supposée p + 1 fois différentiable en a + tu. Il 

en résulte que f est p fois différentiable dans un voisinage de a + tu. Par hypothèse de récurrence, 

on obtient donc que la fonction ψ est p fois dérivable au voisinage de t et que 

ψ (p) (s) = D p f(a + su)(u, · · · , u), 

pour tout s voisin de t. Posant g(x) = D p f(x)(u, · · · , u), on a donc 

ψ (p) (s) = g(a + su), 

et g est différentiable en a + tu d’après la Proposition 4.1.4. On obtient alors, utilisant de nouveau 

la Proposition 4.1.4, que 

ce qui donne le résultat au rang p + 1. 

ψ (p+1) (t) = Dg(a + su)(u) = D p+1 f(a + tu)(u, · · · , u). 

4.2 Propriétés de Symétrie des Différentielles d’Ordre Supérieur 

Le résultat suivant (Théorème de SCHWARZ) est fondamental. 

Théorème 4.2.1 Soit f : U −→ F une application deux fois différentiable en a ∈ U. Alors pour 

tout u, v ∈ E 

D 2 f(a)(u, v) = D 2 f(a)(v, u). 

Démonstration. Soit ε > 0, utilisant la définition de la différentiabilité de Df en a, il existe δ > 0 

tel que 

‖Df(a + w) − Df(a) − D(Df)(a)(w)‖ L(E,F ) ≤ ε‖w‖, 

71

pour tout w tel que ‖w‖ ≤ δ. Posons, pour tout ‖u‖ ≤ δ/2 et ‖v‖ ≤ δ/2, 

G u (v) = f(a + u + v) − f(a + v) − f(a + u) + f(a) − (D(Df)(a)(u))(v). 

On a DG u (v) = Df(a + u + v) − Df(a + v) − D(Df)(a)(u) donc 

DG u (v) = Df(a+u+v)−Df(a)−D(Df)(a)(u+v)−(Df(a+v)−Df(a)−D(Df)(a)(v)). 

On a donc 

‖DG u (v)‖ L(E,F ) ≤ ε(‖u‖ + ‖v‖) + ε‖v‖ ≤ 2ε(‖u‖ + ‖v‖). 

Utilisant le corollaire 3.2.1 avec C = ¯B(0, ‖v‖), il en résulte que, pour tout ‖u‖ ≤ δ/2 et ‖v‖ ≤ 

δ/2, 

‖G u (v)‖ = ‖G u (v) − G u (0)‖ ≤ ‖v‖ 

On a alors 

sup 

‖w‖≤‖v‖ 

‖DG u (w)‖ L(E,F ) ≤ 

2‖v‖ε(‖u‖ + ‖v‖) ≤ 2ε(‖u‖ + ‖v‖) 2 . 

f(a + u + v) − f(a + v) − f(a + u) + f(a) − (D(Df)(a)(u))(v) = o(‖u‖ + ‖v‖) 2 

Soient alors u, v ∈ E, pour tout t assez petit, on a donc 

d’où 

f(a + tu + tv) − f(a + tv) − f(a + tu) + f(a) − t 2 (D(Df)(a)(u))(v) = o(t 2 ), 

f(a + tu + tv) − f(a + tv) − f(a + tu) + f(a) 

(D(Df)(a)(u))(v) = lim 

. 

t→0 t 2 

Comme le membre de droite ne change pas quand on permute u et v, il en est de même du membre 

de gauche donc (D(Df)(a)(u))(v) = (D(Df)(a)(v))(u), soit D 2 f(a)(u, v) = D 2 f(a)(v, u). 

Les propriétés de symétrie de la différentielle seconde s’étendent aux différentiellles d’ordre p. 

Théorème 4.2.2 Soit f : U −→ F une application p fois différentiable en a ∈ U. Alors, pour 

tout (u 1 , · · · , u p ) ∈ E p et pour toute permutation σ de [1, · · · , p], on a 

D p f(a)(u σ(1) , · · · , u σ(p) ) = D p f(a)(u 1 , · · · , u p ). 

Démonstration. Il suffit de démontrer le résultat pour une transposition σ i,j 

⎧ 

⎨ k si k ∉ {i, j} 

σ i,j (k) = i si k = j, 

⎩ 

j si k = i 

car toute permutation de [1, p] est produit d’un nombre fini de telles transpositions. Procédons par 

récurrence sur p. Pour p = 2 le résultat est démontré (Théorème 4.2.1). Supposons alors le résultat 

vrai pour tout 2 ≤ k ≤ p − 1 avec p ≥ 3. 

72

Si {i, j} = {1, 2}. Soient (u 3 , · · · , u p ) ∈ E p−2 et soit g(x) = D p−2 f(x)(u 3 , · · · , u p ). L’application 

g définie au voisinage de a est 2 fois différentiable au voisinage de a grâce à la Proposition 

4.1.3 car g = e ◦ D p−2 f avec e : L p−2 (E; F ) −→ F linéaire continue définie par 

e(A) = A(u 3 , · · · , u p ). D’après la Proposition 4.1.4, on a pour tout u 2 ∈ E, 

et, appliquant de nouveau la Proposition 4.1.4, 

Dg(x)(u 2 ) = D p−1 f(x)(u 2 , · · · , u p ), 

D 2 g(a)(u 2 , u 1 ) = D p f(a)(u 1 , u 2 , · · · , u p ). 

D’après le Theorème 4.2.1, on obtient donc que D 2 g(a)(u 2 , u 1 ) = D 2 g(a)(u 1 , u 2 ), soit 

D p f(a)(u 1 , u 2 , · · · , u p ) = D p f(a)(u 2 , u 1 , · · · , u p ). (4.5) 

Si i, j ∈ {3, · · · , n}, on utilise de nouveau l’application 

Par hypothèse de récurrence, on a 

où σ = σ i,j . On obtient bien alors 

g(x) = D p−2 f(x)(u 3 , · · · , u p ). 

g(x) = D p−2 f(x)(u σ(3) , · · · , u σ(p) ), 

D p f(a)(u 1 , u 2 , u 3 , · · · , u p ) = D p f(a)(u σ(1) , u σ(2) , u σ(3) , · · · , u σ(p) ). 

Si i = 1, j ∈ {3, · · · , n}, on pose g(x) = D p−1 f(x)(u 2 , · · · , u j , · · · , u p ) et on a g(x) = 

D p−1 f(x)(u j , u 2 , · · · , u p ) par hypothèse de récurrence. On calcule alors Dg(a)(u 1 ) à l’aide des 

deux expressions de g et on obtient que l’on peut échanger j et 2. Ensuite on échange j et 1 comme 

dans (4.5) puis 1 et 2. Enfin si i = 2, j ∈ {3, · · · , n}, on peut échanger 1 et 2 comme dans (4.5) et 

on est ramené au cas précédent. 

La proposition suivante est importante. Si sa conclusion coule de source, il n’en est pas de même 

de sa démonstration. 

Proposition 4.2.1 Soient p, q ∈ N ∗ des entiers et soit f : U −→ F une application q + p fois 

différentiable en a ∈ U. Alors D p f est q fois différentiable en a, et pour tout (u 1 , · · · , u q ) ∈ E q et 

(v 1 , · · · , v p ) ∈ E p , on a 

(D q (D p f)(a)(u 1 , · · · , u q ))(v 1 , · · · , v p ) = D q+p f(a)(u 1 , · · · , u q , v 1 , · · · , v p ). 

Démonstration. Par récurrence sur q. Pour q = 1, c’est la définition de D p+1 f. Supposons la 

propriété vraie à l’ordre q et considérons f supposée q + 1 + p fois différentiable en a. Comme f 

est q + p fois différentiable au voisinage de a, l’ hypothèse de récurrence nous dit que 

(D q (D p f)(x)(u 1 , · · · , u q ))(v 1 , · · · , v p ) = D q+p f(x)(u 1 , · · · , u q , v 1 , · · · , v p ), 

73

pour tout x voisin de a. Cela s’écrit 

D q (D p f) = Ψ ◦ D q+p f, 

avec Ψ : L p+q (E; F ) −→ L q (E; L p (E; F )) linéaire continue (le vérifier) définie par 

(Ψ(A)(u 1 , · · · , u q ))(v 1 , · · · , v p ) = A(u 1 , · · · , u q , v 1 , · · · , v p ) 

pour tout A ∈ L p+q (E; F ), (u 1 , · · · , u q ) ∈ E q et (v 1 , · · · , v p ) ∈ E p . Comme Ψ et D q+p f sont 

différentiables en a, on obtient que D q (D p f) est différentiable en a donc D p f est q + 1 fois 

différentiable en a. 

Posant alors g(x) = D q+p f(x)(u 1 , · · · , u q , v 1 , · · · , v p ), on a, utilisant la Proposition 4.1.4 et la 

symétrie de D q+p+1 f(a) 

Dg(a)(u q+1 ) = D q+p+1 f(a)(u 1 , · · · , u q , u q+1 , v 1 , · · · , v p ), (4.6) 

pour tout u q+1 ∈ E. Par ailleurs, on a g = e ◦ Φ avec e : L p (E; F ) −→ F linéaire continue définie 

par e(A) = A(v 1 , · · · , v p ) et Φ : U −→ L p (E; F ) définie par Φ(x) = (D q (D p f)(x))(u 1 , · · · , u q ). 

On a alors, appliquant la Proposition 4.1.4 à D p f, et utilisant la symétrie des différentielles d’ordre 

supérieur, 

DΦ(a)(u q+1 ) = D q+1 (D p f)(a)(u 1 , · · · , u q , u q+1 ) 

et 

Dg(a)(u q+1 ) = e(DΦ(a)(u q+1 )) = (D q+1 (D p f)(a)(u 1 , · · · , u q , u q+1 ))(v 1 , · · · , v p ), 

ce qui joint à (4.6) montre la propriété au rang q + 1. 

Nous aurons besoin du résultat suivant. 

Proposition 4.2.2 Soit f : U −→ F 1 × · · · × F m avec f = (f 1 , · · · , f m ). 

a) On suppose que f 1 , · · · , f m sont p fois différentiables en a ∈ U. Alors f est p fois différentiable 

en a, et on a, pour tout (u 1 , · · · , u p ) ∈ E p , 

D p f(a)(u 1 , · · · , u p ) = (D p f 1 (a)(u 1 , · · · , u p ), · · · , D p f m (a)(u 1 , · · · , u p )). 

b) Si f 1 , · · · , f m sont de classe C p sur U, alors f est de classe C p sur U. 

Démonstration. a) par récurrence sur p. Pour p = 1, le résultat découle du Théorème 2.3.1. 

Supposons la propriété vraie à l’ordre p. On a D p f = (D p f 1 , · · · , D p f m ) au voisinage de a, et 

D p f 1 , · · · , D p f m sont différentiables en a. Appliquant de nouveau le Théorème 2.3.1 on obtient 

que f est p + 1 fois différentiable en a avec D p+1 f(a) = (D p+1 f 1 (a), · · · , D p+1 f m (a)) 

b) Démonstration analogue. 

74

Théorème 4.2.3 Soit f : U −→ V et g : V −→ G deux applications telles que f(U) ⊂ V où U 

et V sont des ouverts d’espaces normés E, F et G est un espace normé. 

a) Si f est p fois différentiable en a ∈ U et si g est p fois différentiable en b = f(a) ∈ V , alors 

g ◦ f est p fois différentiable en a. 

b) Si f est de classe C p sur U et si g est de classe C p sur V , alors g ◦ f est de classe C p sur U. 

Démonstration. a) Procédons par récurrence sur p. Pour p = 1 le résultat est vrai. Supposons le 

résultat vrai à l’ordre p − 1. On a, dans un voisinage W de a 

D(g ◦ f)(x) = Dg(f(x) ◦ Df(x) = Φ(A(x), B(x)) 

où A : U −→ L(F, G) et B : U −→ L(E, F ) sont définis par A(x) = (Dg ◦ f)(x), B(x) = 

Df(x) et 

Φ : L(F, G) × L(E, F ) −→ L(E, G) 

est définie par Φ(A, B) = A ◦ B. Or Dg et f sont p − 1 fois différentiables en a (utiliser la 

Proposition 4.2.1), donc il en est de même de A = Dg ◦ f, de B = Df (utiliser les Propriétés 

4.2.1 et 4.2.2) et de (A, B) (Proposition 4.2.2). Par ailleurs Φ est bilinéaire et continue car 

‖Φ(A, B)‖ ≤ ‖A‖‖B‖, elle est donc p−1 fois différentiable d’après la Proposition 4.1.2. L’hypothèse 

de récurrence nous permet de conclure que D(g◦f) = Φ◦(A, B) est p−1 fois différentiable 

en a donc g ◦ f est bien p fois différentiable en a (utiliser de nouveau les Propriétés 4.2.1 et 4.2.2). 

b) Même méthode que dans a). 

Théorème 4.2.4 Soient E et F des espaces de BANACH, alors l’application 

u ↦−→ I(u) = u −1 

de Isom(E, F ) dans Isom(F, E) est de classe C ∞ . 

Démonstration. On sait que Isom(E, F ) est ouvert dans L(E, F ), que I est de classe C 1 (chapitre 

2) et que pour tout h ∈ L(E, F ), on a DL(u)h = −u −1 ◦ h ◦ u −1 . Pour tout (v, w) ∈ L(F, E) × 

L(F, E), et pour tout h ∈ L(E, F ), posons 

ψ(v, w)(h) = v ◦ h ◦ w. 

L’application Ψ(v, w) est linéaire de L(E, F ) dans L(F, E), de plus 

‖ψ(v, w)(h)‖ ≤ ‖v‖‖h‖‖w‖. (4.7) 

On a donc Ψ(v, w) ∈ L(L(E, F ) × L(F, E)). L’application Ψ est alors bilinéaire de L(F, E) × 

L(F, E) dans L(L(E, F ) × L(F, E)), elle est de plus continue car 

‖ψ(v, w)‖ L(L(E,F )×L(F,E)) ≤ ‖v‖‖w‖ 

d’après (4.7). Par ailleurs 

DI(u) = Ψ(I(u), I(u)). 

75

Supposons que I soit de classe C p , il en est alors de même de l’application (I(.), I(.)) ainsi que 

de Ψ qui est bilinéaire continue. Utilisant le Théorème 4.2.3, b) on obtient que DI = Ψ ◦ (I, I) 

est de classe C p donc I est de classe C p+1 . Par récurrence, on a donc bien I de classe C ∞ . 

Comme application de la différentielle seconde, nous allons maintenant caractériser la convexité 

des fonctions deux fois différentiables. 

Définition 4.2.1 On dit qu’une fonction f : U −→ R définie sur un ouvert convexe U d’un espace 

normé E est convexe si, pour tout x, y ∈ x, y ∈ U et pour tout t ∈ [0, 1], on a 

f(ty + (1 − t)x) ≤ tf(y) + (1 − t)f(x). 

Théorème 4.2.5 Soit f : U −→ R définie sur un ouvert convexe U d’un espace normé E. On 

suppose que f est deux fois différentiable sur U. Alors f est convexe si et seulement si 

D 2 f(x)(u, u) ≥ 0 pour tout x ∈ X, u ∈ E. (4.8) 

Démonstration. Supposons f convexe, et soient x, y ∈ x, y ∈ U et t ∈]0, 1]. On a 

f(x + t(y − x)) ≤ tf(y) + (1 − t)f(x), 

donc 

f(x + t(y − x)) − f(x) 

t 

≤ f(y) − f(x), ce qui donne, faisant tendre t vers 0 

Df(x)(y − x) ≤ f(y) − f(x), 

ainsi donc 

d’où par addition 

Df(y)(x − y) ≤ f(x) − f(y), 

(Df(y) − Df(x))(y − x) ≥ 0 pour tout x, y ∈ U. 

Introduisons alors, pour x ∈ U et u ∈ E, la fonction ϕ(t) = Df(x + tu)(u) définie pour tout t 

voisin de 0. Pour 0 ≤ t, on a 

(Df(x + tu) − Df(x))(tu) ≥ 0 

donc ϕ(t) ≥ ϕ(0). Il en résulte que ϕ d (0) ≥ 0 donc D 2 f(x)(u, u) ≥ 0. Réciproquement, supposons 

(4.8). Pour tout x, y ∈ U et t ∈ [0, 1], posons ψ(t) = f(x + t(y − x)) − Df(x)(x + t(y − x)) 

de telle sorte que ψ ′ (t) = (Df(x + t(y − x)) − Df(x))(y − x) et 

ψ ′′ (t) = D 2 f(x + t(y − x))(y − x, y − x) ≥ 0. 

On a donc ψ ′ (t) ≥ ψ ′ (0) = 0, donc ψ(1) ≥ ψ(0), d’où 

Posant x t = x + t(y − x), t ∈ [0, 1], il vient 

f(y) − f(x) ≥ Df(x)(y − x) pour tout x, y ∈ U. 

f(y) ≥ f(x t ) + (1 − t)Df(x t )(y − x), 

76

et 

f(x) ≥ f(x t ) + tDf(x t )(y − x). 

Multipliant la première inégalité par t, la seconde par 1 − t et ajoutant, on obtient 

tf(y) + (1 − t)f(x) ≥ f(x t ), 

donc f est bien convexe. 

Dans le cas particulier où E = E 1 × · · · × E n , on rappelle que la différentiabilité de f en a ∈ U 

implique l’existence des différentielles partielles D j f(a) ∈ L(E j , F ). Si l’application D j f : 

U −→ L(E j , F ) est différentiable en a ∈ U on a pour tout 1 ≤ i ≤ n 

Pour tout u i ∈ E i et v j ∈ E j on pose alors 

D i D j f(a) ∈ L(E i , L(E j , F )). 

D i D j f(a)(u i , v j ) = 

( 

) 

D i D j f(a)(u i ) (v j ). 

On vérifie immédiatement que D i D j f(a) ∈ L 2 (E i , E j ; F ). On a alors 

Proposition 4.2.3 Soit f : U ⊂ E 1 × · · · × E n −→ F une application deux fois différentiable 

en a ∈ U. Alors les applications D i f, 1 ≤ i ≤ n sont différentiables en a et pour 1 ≤ i ≤ n, 

1 ≤ j ≤ n, et pour tout u, v ∈ E 1 × · · · × E n , on a 

D 2 f(a)(u, v) = 

n∑ n∑ 

D i D j f(a)(u i , v j ). 

i=1 j=1 

De plus, pour tout (ū, ¯v) ∈ E i × E j 

D j D i f(a)(¯v, ū) = D i D j f(a)(ū, ¯v). 

Démonstration. Pour tout x voisin de a et pour tout h ∈ E j , on a 

D j f(x)(h) = Df(x)(0, · · · , h, · · · , 0) = (Df(x) ◦ ϕ j )(h) 

où ϕ j est l’injection canonique de E j dans E 1 × · · · × E n . On a donc 

D j f = Φ j ◦ Df 

où Φ j ∈ L(L(E 1 × · · · × E n , F ), L(E j , F )) est définie par 

Φ j (A) = A ◦ ϕ j . 

Comme Df et Φ j sont différentiables en a il en est de même de D j f. Il en résulte que les différentielles 

partielles 

D i D j f(a) ∈ L(E i , L(E j , F )) 

77

existent pour tout i, j ∈ [1, n]. On remarque alors que 

n∑ 

Df = T j ◦ D j f 

où 

est définie par 

j=1 

T j ∈ L(L(E j , F )), L(E 1 × · · · × E n , F )) 

T j (A) = A ◦ π j 

avec π j (x 1 , · · · , x n ) = x j . On a alors pour 1 ≤ i ≤ n, 1 ≤ j ≤ n, et u, v ∈ E 1 × · · · × E n 

n∑ 

D(Df)(a) = T j ◦ D(D j f)(a) 

donc 

d’où 

D(Df)(a)(u) = 

= 

= 

D 2 f(a)(u, v) = 

j=1 

n∑ 

j=1 

) 

T j 

(D(D j f)(a)u) 

n∑ ( n∑ 

) 

T j D i (D j f)(a)u i 

j=1 

n∑ 

i=1 

n∑ 

i=1 

i=1 

n∑ 

) 

(D i D j f(a)u i ◦ π j 

j=1 

n∑ 

D i D j f(a)(u i , v j ). 

Posons alors, pour ū ∈ E k , ¯v ∈ E l , u = (0, · · · , ū, · · · , 0), v = (0, · · · , ¯v, · · · , 0). On a alors 

et 

j=1 

D 2 f(a)(u, v) = D k D l f(ū, ¯v) 

D 2 f(a)(v, u) = D l D k f(¯v, ū). 

Comme D 2 f(a)(u, v) = D 2 f(a)(v, u), on a bien D k D l f(ū, ¯v) = D l D k f(¯v, ū). 

Comme cas particulier, on obtient que, pour tout 1 ≤ i ≤ n, D i D i f(a) ∈ L 2 (E i ; F ) est 

symétrique. 

Théorème 4.2.6 Soit f : U ⊂ E 1 × · · · × E n −→ F une application telle que les différentielles 

partielles D i D j f existent et sont continues en un point a ∈ U. Alors f est deux fois différentiable 

en a et, pour tout u, v ∈ E 1 × · · · × E n 

n∑ n∑ 

D 2 f(a)(u, v) = D j D i f(a)(u j , v i ). 

i=1 

j=1 

78

Démonstration. On a Df = ∑ n 

i=1 T i ◦ D i f (voir la démonstration du Corollaire 4.2.3) et D i f 

est différentiable en tout x ∈ U car les différentielles partielles D j D i f existent et sont continues 

en a. Il résulte donc du Théorème 2.4.1 que Df est différentiable en a et donc que f est deux fois 

différentiable en a. La formule donnant D 2 f(a) a été démontrée dans le Corollaire 4.2.3. 

Remarque 4.2.1 Examinons le cas particulier E 1 = E 2 = · · · = E n = R, et F = R. Supposons 

que f est deux fois différentiable en a. On a 

∂f 

∂x i 

(x) = Df(x)(e i ) = ψ i (Df(x)), 

où ψ i : L(R n , R) −→ R est l’application linéaire définie par ψ i (A) = A(e i ). On a donc ∂f = 

∂x i 

ψ i ◦ Df, ce qui montre que ∂f est différentiable en a, donc les dérivées partielles secondes 

∂x i 

∂ 2 f 

(a) existent pour tout i, j ∈ [1, n]. Posant alors 

∂x j ∂x i 

g(x) = Df(x)(u) = 

n∑ 

i=1 

∂f 

∂x i 

(a)u i . 

On a alors 

D 2 f(a)(u, v) = Dg(a)(v) = 

n∑ 

i=1 

n∑ 

j=1 

∂ 2 f 

∂x j ∂x i 

(a)u i v j = 〈H f (a), u〉, 

où H f (a) est alors la matrice Hessienne de f en a définie par 

Remarquons que 

Remarquons aussi que 

donc 

(H f (a)) ij = ∂2 f 

∂x j ∂x i 

(a). 

∂ 2 f 

∂x j ∂x i 

(a) = D 2 f(a)(e i , e j ) = D 2 f(a)(e j , e i ) = 

∂ 2 f 

D i D j f(a)(s, t) = st (a), 

∂x j ∂x i 

∂2 f 

∂x i ∂x j 

(a). 

‖D i D j f(b) − D i D j f(a)‖ L 2 (R;R) = ∥ 

∂2 f 

(b) − 

∂2 f 

∥ 

(a) ∥. 

∂x j ∂x i ∂x j ∂x i 

∂ 2 f 

Il en résulte que si les dérivées partielles secondes existent et sont continues en a alors les 

∂x j ∂x i 

différentielles partielles secondes existent au voisinage de a et sont continues en a. Le Théorème 

79

4.2.6 nous permet alors d’affirmer que f est deux fois différentiables en a et que l’on a alors en 

particulier 

∂ 2 f 

(a) = 

∂2 f 

(a). 

∂x j ∂x i ∂x i ∂x j 

Dans le cas où l’application f est définie sur un ouvert U de E 1 × · · · × E n , pour toute suite 

finie {i 1 , · · · , i p } ⊂ [1, n], on introduit par récurrence les différentielles partielles d’ordre p 

D i1 D i2 · · · D ip f(a) ∈ L p (E i1 × · · · × E ip , F ). 

On montre alors facilement par récurrence que si f est p fois différentiable en a on a pour tout 

(u 1 , · · · u p ) ∈ (E 1 × · · · × E n ) p 

D p f(a)(u 1 , · · · , u p ) = 

4.3 Formules de Taylor 

∑ 

{i 1 ,···,i p}⊂[1,n] 

Commençons par démontrer le résultat suivant 

D i1 D i2 · · · D ip f(a)(u i1 , · · · , u ip ). 

Proposition 4.3.1 Soient I un intervalle ouvert, E, F , G des espaces normés, f : I −→ E, 

g : I −→ F deux fonctions p + 1 fois dérivables et soit [., .] : E × F −→ G une application 

bilinéaire continue. Alors 

( ∑ 

p ′. 

[f, g (p+1) ] − (−1) p+1 [f (p+1) , g] = (−1) i [f (i) , g ]) (p−i) 

Démonstration. Par récurrence sur p. Pour p = 0 la formule se réduit à 

i=0 

[f, g ′ ] + [f ′ , g] = ([f, g]) ′ 

qui est une conséquence de la formule donnant la différentielle d’une application bilinéaire et la 

dérivée d’une composée. Supposons le résultat vrai à l’ordre p − 1. On a 

( ∑ 

p ) ′ ( ∑ 

p−1 

(−1) i [f (i) , g (p−i) ] = (−1) i [f (i) , h (p−1−i) ] + (−1) p [f p , g] 

i=0 

avec h = g ′ . Appliquant l’hypothèse de récurrence, il vient 

i=0 

( ∑ 

p ′ 

(−1) i [f (i) , g ]) (p−i) = [f, h (p) ] − (−1) p [f (p) , h]+ 

i=0 

) ′ 

(−1) p [f (p+1) , g] + (−1) p [f (p) , h] 

80

d’où 

( ∑ 

p ′ 

(−1) i [f i , g ]) p−i = [f, g (p+1) ] − (−1) p+1 [f (p+1) , g] 

i=0 

On en déduit la formule de Taylor suivante 

Théorème 4.3.1 

a) FORMULE DE TAYLOR AVEC RESTE INTÉGRAL. Soient I un intervalle ouvert de R, f : 

I −→ E une fonction à valeurs dans un espace de Banach E qui est p + 1 fois continuement 

dérivable sur I. Alors, pour tout a, t ∈ I 

f(t) = 

p∑ (t − a) i 

f (i) (a) + 

i! 

i=0 

∫ t 

a 

(t − s) p 

f (p+1) (s)ds. 

p! 

b) FORMULE DE TAYLOR-LAGRANGE. Si l’on suppose seulement que f est p + 1 fois dérivable 

sur I et que 

sup ‖f (p+1) (s)‖ ≤ M < +∞ 

s∈I 

alors 

∥ 

∥f(t) − 

p∑ (t − a) i 

f (i) (a) ∥ ≤ 

i! 

i=0 

|t − a|p+1 

(p + 1)! M. 

Démonstration. a) On applique la Proposition 4.3.1 avec g(s) = 

[x, t] = tx. On remarque que 

(t − s)p 

, F = R, G = E et 

p! 

g (i) i (t − s)p−i 

(s) = (−1) 

(p − i)! 

pour 0 ≤ i ≤ p, 

de telle sorte que 

g (p+1) (s) ≡ 0, 

(−1) i [f (i) , g (p−i) ] = (−1) i p−i (t − s)i 

(−1) f (i) p (t − s)i 

(s) = (−1) f (i) (s). 

i! 

i! 

Il vient alors, appliquant la Proposition 4.3.1, 

p+1 (t − 

( 

s)p 

∑ 

p 

−(−1) f (p+1) p (t − 

) 

s)i 

′ 

(s) = (−1) f (i) (s) 

p! 

i! 

i=0 

donc 

(t − s) p 

( ∑ 

p 

f (p+1) (t − s) i 

′. 

(s) = 

f (s)) (i) (4.9) 

p! 

i! 

i=0 

81

Intégrant entre a et t, on obtient 


∫ t 

b) Posons ψ(s) = ∑ p 

i=0 

a 

(t − s) p 

f (p+1) (s) = f(t) − 

p! 

p∑ 

i=0 

i 

(t − s) 

f (i) (s). D’après (4.9) on a 

i! 

ψ ′ (s) = 

(t − s)p 

f (p+1) (s). 

p! 

i 

(t − a) 

f (i) (a) 

i! 

Supposons t ≥ a, le cas t ≤ a se traîtant de manière analogue. Pour tout s ∈ I, on a 

Il en résulte que, pour s ∈ [a, t] 

‖ψ ′ (s)‖ ≤ M 

|t − s|p 

. 

p! 

avec g(s) = −M 

‖ψ ′ (t − s)p 

(s)‖ ≤ M 

p! 

= g ′ (s) 

(t − s)p+1 

. On applique alors le Théorème des accroissements finis et on obtient 

(p + 1)! 

d’où le résultat car ψ(t) = f(t) et ψ(a) = ∑ p 

i=0 

‖ψ(t) − ψ(a)‖ ≤ g(t) − g(a), 

i 

(t − a) 

f (i) (a). 

i! 

Dans le cas d’applications entre espaces normés, on a les formules de Taylor suivantes 


a) FORMULE DE TAYLOR AVEC RESTE INTÉGRAL. Soit f : U −→ F une application p + 1 

fois continuement différentiable définie sur un ouvert U d’un espace normé E à valeurs dans un 

espace de Banach F . Alors pour tout x ∈ U et h ∈ E tels que le segment [x, x + h] soit contenu 

dans U, on a 

p∑ 

∫ 

1 

1 

f(x + h) = 

i! Di f(x)h i (1 − s) p 

+ 

D p+1 f(x + sh)h p+1 ds 

0 p! 

où h i = (h, · · · , h) ∈ E i . 

i=0 

b) FORMULE DE TAYLOR-LAGRANGE. Soit f : U −→ F une application p + 1 fois différentiable 

définie sur un ouvert U d’un espace normé E à valeurs dans un espace de Banach F . On 

suppose qu’il existe M ≥ 0 telle que ‖D p+1 f(z)‖ ≤ M pour tout z ∈ U. Alors pour tout x ∈ U 

et h ∈ E tels que le segment [x, x + h] soit contenu dans U, on a 

∥ 

∥f(x + h) − 

p∑ 

i=0 

1 

i! Di f(x)h i ∥ ∥∥ ≤ M 

‖h‖ p+1 

(p + 1)! . 

82

Démonstration. a) Remarquons qu’il existe η > 0 tel que x + sh ∈ U pour tout s ∈] − η, 1 + η[. 

Posons alors g(s) = f(x + sh), g est alors p + 1 fois continuement dérivable sur ] − η, 1 + η[ 

et, utilisant la Proposition 4.1.5, b), on a g i (s) = D i f(x + sh)h i . On applique alors le Théorème 

4.3.1 avec a = 0 et t = 1 et on a le résultat. 

b) Posons g(t) = f(x + th), on a g (i) (t) = D i f(x + th)h i pour 1 ≤ i ≤ p + 1 (Proposition 

4.1.5, b)), d’où sup t∈[0,1] ‖g (p+1) (t)‖ ≤ M‖h‖ p+1 . On applique alors le Théorème 4.3.1, b) et on 

obtient que 

soit 


∥ 

∥g(1) − 

∥ 

∥f(x + h) − 

p∑ 

i=0 

p∑ 

i=0 

g (i) (0) 

i! 

∥ ≤ M‖h‖p+1 

(p + 1)! 

1 

i! Di f(x)h i ∥ ∥∥ ≤ 

M‖h‖ p+1 

(p + 1)! , 

Il est également possible d’obtenir une formule de Taylor sous des hypothèses plus faibles. 

Théorème 4.3.3 FORMULE DE TAYLOR-YOUNG. Soit f : U −→ F une application définie sur 

un ouvert U d’un espace normé E à valeurs dans un espace normé F que l’on suppose p fois 

différentiable en a ∈ U. Alors 

f(a + h) = 

p∑ 

i=0 

1 

i! Di f(a)h i + ‖h‖ p ε(h) 

avec lim h→0 ε(h) = 0. 

Démonstration. On procède par récurrence. Le cas p = 1 est exactement la définition de la 

différentiabilité. Supposons la propriété vraie à l’ordre p − 1. Posons alors 

Posons 

g(z) = f(a + z) − 

p∑ 

i=0 

1 

i! Di f(a)z i . 

ϕ i (z) = 1 i! Di f(a)z i = 1 i! (Di f(a) ◦ L)(z) 

avec L(z) = (z, · · · , z) ∈ E i . Utilisant le calcul de la différentielle d’une application multilinéaire 

continue (voir chapitre 2, exemple 2.1.4, c)), on a pour tout u ∈ E, 

Dϕ i (z)(u) = 

i∑ 

k=1 

1 

i! (Di f(a)(z, · · · , u, · · · , z) = 

1 

(i − 1)! Di f(a)(z i−1 , u) 

car D i f(a) est symétrique. On a donc, utilisant la Proposition 4.2.1 

(D i−1 (Df)(a)(z i−1 ))(u) = D i f(a)(z i−1 , u) 

83

donc 


Dϕ i (z) = D i−1 (Df)(a)(z i−1 ). 

Dg(z) = Df(a + z) − 

p−1 

∑ 

j=0 

1 

j! Dj (Df)(a)(z j ). 

Par hypothèse de récurrence appliquée à Df, pour tout ε > 0, il existe η > 0 tel que ‖z‖ ≤ η 

implique 

‖Dg(z)‖ ≤ ε‖z‖ p−1 . 

Soit ‖h‖ ≤ η et soit θ(t) = g(th) pour tout t ∈ [0, 1]. On a θ ′ (t) = Dg(th)h donc ‖θ ′ (t)‖ ≤ 

ε‖h‖ p−1 ‖h‖ = ε‖h‖ p . D’après le Théorème des accroissements finis, on a donc 


‖g(h)‖ = ‖g(h) − g(0)‖ = ‖θ(1) − θ(0)‖ ≤ ε‖h‖ p 

Remarque 4.3.1 Dans le cas d’une fonction f : U −→ R définie sur un ouvert U de R n , et deux 

fois différentiable en a, on a 

f(a) + Df(a)u + 1 2 D2 f(a)(u, u) = f(a) + 

n∑ 

i=1 

∂f 

∂x i 

(a)u i + 

1 

( n∑ ∂ 2 f 

(a)(u 

2 ∂x 2 i ) 2 + 2 

i=1 i 

∑ 

1≤i

4.4 Conditions d’Optimalité 

Définition 4.4.1 Soit f : U −→ R une fonction définie sur un ouvert U d’un espace topologique 

E. 

On dit que f admet un minimum (resp. maximum) local en a ∈ U s’il existe un voisinage V 

de a tel que 

f(x) ≥ f(a) (resp. f(x) ≤ f(a)) pour tout x ∈ V. 

Si 

f(x) > f(a) (resp. f(x) < f(a)) pour tout x ∈ V \ {a} 

on dit que l’extremum est strict. On dit que l’extremum est global si l’inégalité a lieu pour tout 

x ∈ U. 


a) Si f admet un extremum local en a ∈ U et si f est différentiable en a, alors 

Df(a) = 0. 

Si de plus f est deux fois différentiable en a alors pour tout h ∈ E 

D 2 f(a)(h, h) 

garde un signe constant (≥ 0 pour un minimum, ≤ 0 pour un maximum). 

b) On suppose que f est deux fois différentiable en a ∈ U, qu’il existe α > 0 tel que pour tout 

h ∈ E 

D 2 f(a)(h, h) ≥ α‖h‖ 2 

et que 

Alors f admet un minimum local strict en a. 

Df(a) = 0. 

Démonstration. a) On suppose que f admet un minimum local en a. Soit h ∈ E. Pour tout 

t ∈ R + assez petit on a donc 

f(a + th) − f(a) ≥ 0. 

Divisant par t et faisant tendre t vers 0 il vient Df(a)(h) ≥ 0. Changeant h en −h, on en déduit 

Df(a)(h) ≤ 0 soit 

Df(a)(h) = 0. 

Si f est deux fois différentiable en a, on a 

t 2 2 D2 f(a)(h, h) + t 2 ε(t) = f(a + th) − f(a) ≥ 0. 

Divisant par t 2 et faisant tendre t vers 0, il vient 

D 2 f(a)(h, h) ≥ 0. 

85

) D’après la formule de Taylor (Théorème 4.3.3), on a 

f(a + h) − f(a) = 1 2 D2 f(a)(h, h) + ‖h‖ 2 ε(h) ≥ 1 2 ‖h‖2 (α + ε(h)) 

avec lim h→0 ε(h) = 0. Il existe alors η > 0 tel que |ε(h)| ≤ α/4 pour tout ‖h‖ ≤ η. On obtient 

alors pour tout ‖h‖ ≤ η 

f(a + h) − f(a) ≥ ‖h‖ 2 α/4, 

ce qui démontre bien le résultat annoncé. 

Dans le cas où f : U −→ R est une fonction convexe définie sur un ouvert convexe, on a une 

condition nécessaire et suffisante de minimalité. 

Théorème 4.4.2 f : U −→ R est une fonction convexe définie sur un ouvert convexe d’un espace 

normé. Alors les propriétés suivantes sont équivalentes pour a ∈ U tel que f soit différentiable en 

a : 

a) f(a) = min x∈U f(x) 

b) Df(a) = 0. 

Démonstration. Il suffit de démontrer que b) implique a). Pour tout x ∈ U et t ∈]0, 1], on a 

f(a + t(x − a)) ≤ tf(x) + (1 − t)f(a), donc 

faisant tendre t vers 0, il vient 

f(a + t(x − a)) − f(a) 

t 

≤ f(x) − f(a). 

pour tout x ∈ U, d’où le résultat. 

0 = Df(a)(x − a) ≤ f(x) − f(a), 

Remarque 4.4.1 Il découle du théorème précédent que si fonction convexe f : U −→ R admet 

un minimum local en a ∈ U, alors ce minimum est global. 

On peut aussi obtenir des conditions d’optimalité pour des problèmes avec contraintes c’est à 

dire pour un extremum local de f non plus sur U mais sur U ∩ M où M est une partie fermée de 

E. On donnera un résultat général de ce type dans le chapitre suivant. Dans le cas des fonctions 

convexes, on peut dès maintenant donner un résultat. 

Théorème 4.4.3 Soit U ⊂ X un ouvert d’un espace de Hilbert et soient f, g : U −→ R deux 

fonctions convexes. On suppose que 

a) f est différentiable sur U et il existe y ∈ U tel que f(y) < 0. 

b) ¯x ∈ S := {x ∈ U : f(x) ≤ 0} est tel que g(¯x) = inf x∈S g(x) et f est différentiable en ¯x. 

86

Alors il existe λ ≤ 0 tel que 

⎧ 

⎨ 

⎩ 

λf(¯x) = 0. 

∇g(¯x) = λ∇f(¯x) 

Réciproquement, si ¯x ∈ S vérifie (4.10), alors g(¯x) = min x∈S g(x). 

Démonstration. On remarque que S est convexe, que son intérieur est non vide et que 

{x ∈ U : f(x) < 0} ⊂ int S. 

Si f(¯x) < 0, alors g a un minimum local en ¯x, donc ∇g(¯x) = 0 = 0∇f(¯x) avec 0f(¯x) = 0. 

(4.10) 

Supposons alors f(¯x) = 0. Si ∇g(¯x) = 0, on a la conclusion voulue. On peut donc supposer 

que ∇g(¯x) ≠ 0. Pour tout x ∈ S et t ∈]0, 1], on a ¯x + t(x − ¯x) ∈ S donc 

g(¯x + t(x − ¯x)) − g(¯x) 

t 

ce qui, par passage à la limite pour t ↓ 0 donne 

≥ 0, 

〈∇g(¯x), x − ¯x〉 ≥ 0 pour tout x ∈ S. 

Cela implique que 〈∇g(¯x), x − ¯x〉 > 0 pour tout x ∈ int S. Sinon, il existerait x 0 ∈ int S tel que 

〈∇g(¯x), x 0 − ¯x〉 ≤ 0, ce qui impliquerait 〈∇g(¯x), x 0 − ¯x〉 = 0 et 

〈∇g(¯x), x 0 〉 = 〈∇g(¯x), ¯x〉 ≤ 〈∇g(¯x), x〉 pour tout x ∈ int S. 

La fonction convexe 〈∇g(¯x), ·〉 aurait alors un minimum local, donc global (voir Remarque 4.4.1), 

ce qui impliquerait la contradiction ∇g(¯x) = 0. On en déduit que 〈∇g(¯x), x − ¯x〉 ≤ 0 implique 

x /∈ int S donc f(x) ≥ 0 = f(¯x). On obtient donc 

où 

f(x) ≥ f(¯x) pour tout x ∈ H ∩ U 

H = {x ∈ X : 〈∇g(¯x), x − ¯x〉 ≤ 0}. 

Soit alors u ∈ X tel que 〈∇g(¯x), u〉 ≤ 0. Comme ¯x + tu ∈ H ∩ U pour tout t > 0 assez 

f(¯x + tu) − f(¯x) 

petit, il vient ≥ 0 donc 〈∇f(¯x), u〉 ≥ 0. Il en résulte que 〈∇f(¯x), u〉 = 0 si 

t 

〈∇g(¯x), u〉 = 0, ce qui implique l’existence de λ ∈ R ∗ tel que ∇g(¯x) = λ∇f(¯x). On remarque 

enfin que λ < 0 car 〈∇f(¯x), u〉 ≥ 0 si 〈∇g(¯x), u〉 ≤ 0 et que λf(¯x) = 0. 

Réciproquement, supposons que (4.10) est vérifié. Si λ = 0, alors ∇g(¯x) = 0 donc ¯x réalise le 

minimum de g sur U donc sur S. Supposons donc λ ≠ 0 de telle sorte que f(¯x) = 0. On a alors, 

pour tout x ∈ S, 

0 ≥ f(x) − f(¯x) ≥ 〈∇f(¯x), x − ¯x〉, 

donc 〈∇g(¯x), x − ¯x〉 ≥ 0 car ∇g(¯x) = λ∇f(¯x) avec λ < 0. On a alors, pour tout x ∈ S, 

g(x) − g(¯x) ≥ 〈∇g(¯x), x − ¯x〉 ≥ 0. 

87

Chapitre 5 

Théorèmes d’Inversion et Applications 

Nous illustrons dans ce chapitre le principe qu’une application différentiable se comporte localement 

comme sa différentielle. 

5.1 Théorèmes d’inversion 

Commençons par donner quelques définitions 

Définition 5.1.1 

a) Une application f : E −→ F où E et F sont des espaces topologiques est un homéomorphisme 

si 

– f est bijective 

– f et f −1 sont continues. 

Autrement dit f est donc un homéomorphisme si et seulement 

– f est bijective, 

– f(U) est ouvert dans F pour tout ouvert U de E, 

– f −1 (V ) est ouvert dans E pour tout ouvert V de F. 

b) Soient U ⊂ E et, V ⊂ F des ouverts d’espaces de Banach E et F . On dit qu’une application 

f : U −→ V est un difféomorphisme si 

– f est bijective, 

– f et f −1 sont différentiables. 

c) On dit que f est un C r difféomorphisme si f est un difféomorphisme et si f et f −1 sont de 

classe C r . 


a) Une application bijective et continue n’est pas toujours un homéomorphisme. En effet, soit 

(E, d) un espace métrique dont la topologie n’est pas la topologie discrète et δ(x, y) la distance 

définie par 

{ 0 si x = y 

δ(x, y) = 

1 si x ≠ y. 

89

Considérons f : (E, δ) −→ (E, d) définie par f = I E . C’est une application continue bijective 

mais f −1 n’est pas continue car si X ⊂ E qui n’est pas ouvert pour (E, d) on a X est ouvert 

pour (E, δ) alors que f(X) = X n’est pas ouvert pour (E, d). 

b) On remarque qu’un difféomorphisme est un homéomorphisme. Mais la fonction f(x) = 

x 3 qui est un homéomorphisme différentiable de R dans R n’est pas un difféomorphisme car 

f −1 (y) = y 1/3 n’est pas différentiable en 0. 

c) On remarque également que si f : U −→ V est un difféomorphisme alors Df(x) ∈ 

Isom(E, F ) pour tout x ∈ U. En effet, f et f −1 sont différentiables en x et y = f(x) et on a 

f ◦ f −1 = Id V , 

f −1 ◦ f = Id U . 

Utilisant le résultat de dérivation d’une composée, on a 

et 

Df(x) ◦ Df −1 (y) = Id F 

Df −1 (y) ◦ Df(x) = Id E , 

ce qui montre que bien que Df(x) est bijective et que Df −1 (y) = (Df(x)) −1 . 

Le résultat suivant est une étape vers le résultat principal de cette section à savoir le Théorème du 

difféomorphisme local 5.1.2. 

Théorème 5.1.1 THÉORÈME D’INVERSION LOCALE Soit f : U −→ F une application différentiable 

définie sur un ouvert U d’un espace de Banach et à valeurs dans un espace de Banach 

F . On suppose que Df est continue en a ∈ U et que Df(a) ∈ Isom (E, F ). Alors 

a) il existe des voisinages ouverts U ′ de a et V ′ de b = f(a) tels que f soit un homéomorphisme 

de U ′ dans V ′ . 

b) f −1 est Lipschitzienne sur V ′ , différentiable en b et on a Df −1 (b) = (Df(a)) −1 . 

Démonstration. Posons ψ = (Df(a)) −1 ∈ Isom (F, E), et r(x) = f(x) − b − Df(a)(x − a). 

Observons que pour y ∈ F et x ∈ U, 

y = f(x) 

⇐⇒ y = b + Df(a)(x − a) + r(x) 

⇐⇒ x = a + ψ(y − b − r(x)) 

⇐⇒ x = F y (x) 

où F y (x) = a + ψ(y − b − r(x)). Choisissons η > 0 tel que 

‖Dr(x)‖ = ‖Df(x) − Df(a)‖ ≤ 1 

2‖ψ‖ 

sur ¯B(a, η), de telle sorte que r(.) est 

1 

2‖ψ‖ -Lipschitzien sur ¯B(a, η) ; et soit y ∈ ¯B(b, δ) où δ = 

η 

2‖ψ‖ . Pour tout x ∈ ¯B(a, η) on a, notant que 0 = r(a) 

η 

‖F y (x) − a‖ ≤ ‖ψ‖(‖y − b‖ + ‖r(x)‖) ≤ ‖ψ‖( 

2‖ψ‖ + 1 ‖x − a‖) ≤ η. 

2‖ψ‖ 

90

On a donc défini une application F y : ¯B(a, η) −→ ¯B(a, η). Pour tout x, z ∈ ¯B(a, η), on a 

‖F y (x) − F y (z)‖ ≤ ‖ψ‖‖r(x) − r(z)‖ ≤ ‖ψ‖ 1 

‖x − z‖ 

‖x − z‖ = . 

2‖ψ‖ 2 

D’après le Théorème des applications contractantes de Banach, il existe un unique x ∈ ¯B(a, η) tel 

que f(x) = y noté x = g(y). Ceci montre l’existence d’une application g : ¯B(b, δ) −→ ¯B(a, η) 

telle que f(g(y)) = y pout tout y ∈ ¯B(b, δ). Notons que g(b) = a car F b (a) = a et que, pour tout 

y ∈ ¯B(b, δ), g(y) est l’unique x ∈ ¯B(a, η) tel que f(x) = y. Il en résulte que f est surjective de 

¯B(a, η) dans ¯B(b, δ). Considérons y, y ′ ∈ B(b, δ), on a 

‖g(y) − g(y ′ )‖ = ‖F y (g(y)) − F y ′(g(y ′ ))‖ 

≤ 

‖F y (g(y)) − F y (g(y ′ ))‖ + ‖F y (g(y ′ )) − F y ′(g(y ′ ))‖ 

≤ 

1 2 ‖(g(y) − (g(y′ )‖ + ‖ψ(y − y ′ )‖ 

ce qui entraine 

‖g(y) − g(y ′ )‖ ≤ 2‖ψ‖‖y − y ′ ‖. 

Il en résulte que g est Lipschitzienne donc continue sur ¯B(b, δ) et que 

‖g(y) − a‖ = ‖g(y) − g(b)‖ < 2‖ψ‖δ = η 

si ‖y − b‖ < δ d’où g(B(b, δ)) ⊂ B(a, η) en notant, comme d’habitude, B(x, r) la boule ouverte 

de centre x et de rayon r. Posons alors V ′ = B(b, δ) et U ′ = g(B(b, δ)) ⊂ B(a, η). Pour tout 

y ∈ B(b, δ), on a g(y) = f −1 (y) ∩ B(a, η), donc U ′ = f −1 (B(b, δ)) ∩ B(a, η), ce qui montre 

que U ′ est ouvert. Remarquons que f(U ′ ) ⊂ V ′ et que f : U ′ −→ V ′ est surjective. Elle est 

aussi injective car si x, x ′ ∈ U ′ vérifient f(x) = f(x ′ ) = y, on a x ∈ B(a, η) donc g(y) = x 

et g(y) = x ′ d’où x = x ′ . On a donc montré que f : U ′ −→ V ′ est un homéomorphisme et que 

f −1 = g est Lipschitzienne sur V ′ . 

Il reste à prouver la différentiabilité de f −1 en b. Soit ε > 0 et 0 < α < η tel que ‖Dr(x)‖ ≤ 

ε 

2‖ψ‖ 2 

ε 

sur B(a, α), de telle sorte que r(.) est -Lipschitzienne sur B(a, α). Posons β = α/2‖ψ‖. 

2‖ψ‖ 2 

Pour tout y ∈ B(b, β) on a 

‖g(y) − a‖ = ‖g(y) − g(b)‖ ≤ 2‖ψ‖‖y − b‖ ≤ 2‖ψ‖β = α 

donc g(B(b, β)) ⊂ B(a, α). Soit y ∈ B(b, β). On a 

d’où 


g(y) = F y (g(y)) = a + ψ(y − b − r(g(y))), 

g(y) − g(b) − ψ(y − b) = −ψ(r(g(y))) = ψ(r(g(b))) − ψ(r(g(y))). 

‖g(y) − g(b) − ψ(y − b)‖ ≤ ‖ψ‖‖r(g(y)) − r(g(b))‖. 

91

Comme r(.) est Lipschitzienne de rapport ε/2‖ψ‖ 2 sur B(a, α), et comme g(y), g(b) ∈ B(a, α), 

il vient 

‖r(g(y) − r(g(b))‖ ≤ 

On a donc pour tout y ∈ B(b, β) 

ε ‖g(y) − g(b)‖ ≤ 

ε 

2‖ψ‖ 

2 

2‖ψ‖‖y − b‖ ≤ 

ε 

2‖ψ‖ 

2 

‖g(y) − g(b) − ψ(y − b)‖ ≤ ‖ψ‖ ε ‖y − b‖ = ε‖y − b‖, 

‖ψ‖ 

‖y − b‖. 

‖ψ‖ 

ce qui montre bien que g et donc f −1 est différentiable en b avec Df −1 (b) = (Df(a)) −1 . 

On en déduit le 

Théorème 5.1.2 THÉORÈME DU DIFFÉOMORPHISME LOCAL 

Soit f : U −→ F une application de classe C r , r ≥ 1 définie sur un ouvert U d’un espace de 

Banach E et à valeurs dans un espace de Banach F . Soit a ∈ U tel que Df(a) ∈ Isom (E, F ). 

Alors, il existe des voisinages ouverts U ′ de a et V ′ de b = f(a) tels que f soit un C r difféomorphisme 

de U ′ dans V ′ . 

Démonstration. Comme Df(a) ∈ Isom (E, F ) qui est ouvert dans L(E, F ) et comme Df est 

continue en a, on peut supposer en diminuant U au besoin, que Df(x) ∈ Isom (E, F ) pour tout 

x ∈ U. Appliquant le Théorème 5.1.1, il existe des voisinages ouverts U ′ de a et V ′ de b = f(a) 

tels que f soit un homéomorphisme de U ′ dans V ′ et tel que f −1 soit différentiable en b avec 

Df −1 (b) = (Df(a)) −1 . On peut alors appliquer de nouveau le Théorème 5.1.1 pour tout x ∈ U ′ . Il 

en résulte que, pour tout y ∈ V ′ l’application f −1 est différentiable en y et Df −1 (y) = (Df(x)) −1 . 

L’application Df −1 est continue sur V ′ car 

Df −1 = Φ ◦ Df ◦ f −1 

où Φ : Isom (E, F ) −→ Isom (F, E) est définie par φ(u) = u −1 pour tout u ∈ Isom (E, F ). 

Notons que f −1 , Df sont continues ainsi que Φ qui est de classe C ∞ (voir chapitre 4, Théorème 

4.2.4). Il en résulte que f −1 est de classe C 1 sur V ′ . Supposons démontré que f −1 est de classe C s 

sur V ′ pour s ∈ [1, r − 1]. On a f −1 de classe C s ainsi que Df et Φ. D’après le Théorème 4.2.3 

du chapitre 2, on obtient donc que Df −1 est de classe C s sur V ′ d’où f −1 est de classe C s+1 . Le 

théorème est alors complètement démontré. 

Remarque 5.1.2 Si les hypothèses du théorème précédent sont vérifiées dans des espaces de dimension 

finie E = R n et F = R p , on a nécessairement n = p et l’hypothèse Df(a) ∈ Isom (E, F ) 

se traduit par det(J f (a)) ≠ 0 où J f (a) est la matrice Jacobienne de f en a définie par 

avec f = (f 1 , . . . , f n ). 

J f (a) i,j = ∂f i 

∂x j 

(a) 

92

Le résultat suivant est une version globale du Théorème 5.1.1. 

Théorème 5.1.3 Soit f : U −→ F une application définie sur un ouvert U d’un espace de Banach 

E et à valeurs dans un espace de Banach F . On suppose que f est de classe C r . Alors, pour que 

f soit un C r difféomorphisme de U dans f(U) qui est alors ouvert, il faut et il suffit que f soit 

injective et que Df(x) ∈ Isom (E, F ) pour tout x ∈ U. 

Démonstration. Supposons que f est un C r difféomorphisme d’un ouvert U de E dans un ensemble 

V = f(U) de F . Il résulte de la Remarque 5.1.1, b) que Df(x) ∈ Isom (E, F ) pour tout 

x ∈ U. Montrons alors que V = f(U) est ouvert. Soit b = f(a) ∈ V avec a ∈ U. Il existe d’après 

le Théorème 5.1.1 des voisinage ouverts U ′ ⊂ U de a et V ′ de b tel que f soit un homéomorphisme 

de U ′ dans V ′ . On a alors V ′ ⊂ f(U) = V . 

Réciproquement Soit f : U −→ F une application injective de classe C r telle que Df(x) ∈ 

Isom (E, F ) pour tout x ∈ U. Observons que f est bijective de U dans f(U). Par ailleurs f(U) 

est ouvert et f −1 est continue sur f(U). En effet, si on considère y = f(x) ∈ f(U) avec x ∈ U, 

il existe d’après le Théorème 5.1.1 des voisinages ouverts U ′ de x et V ′ de y tels que f soit un 

homéomorphisme de U ′ dans V ′ , ce qui implique que V ′ ⊂ f(U) et que f −1 est continue en y. 

L’application f est donc un homéomorphisme de U dans l’ouvert V = f(U). De plus, comme 

Df(x) ∈ Isom (E, F ), on peut appliquer le Théorème 5.1.2 qui nous assure que f −1 est r fois 

continuement différentiable au voisinage de y. Ce qui montre que f est un C r difféomorphisme de 

U dans l’ouvert f(U), d’où le résultat. 

Remarque 5.1.3 Il résulte du théorème précedent que si U ⊂ E et V ⊂ F sont des ouverts et si 

f : U −→ V est un C r difféomorphisme, alors pour tout ouvert Ũ ⊂ U, on a Ṽ = f(Ũ) est ouvert 

et f est un C r difféomorphisme de Ũ dans Ṽ . 

5.2 Théorème des Fonctions Implicites 

Théorème 5.2.1 Soient E, F , G des espaces de Banach, U ⊂ E × F un ouvert et f : U −→ G 

une application de classe C r . Soit (a, b) ∈ U tel que f(a, b) = 0 et tel que la différentielle partielle 

D 2 f(a, b) ∈ Isom (F, G). Alors, 

a) il existe des voisinages ouverts V de (a, b), A de a, il existe une application 

telle que, pour tout x ∈ A 

ϕ : A −→ F 

f(x, ϕ(x)) = 0. 

b) (x, y) ∈ V et f(x, y) = 0 ⇐⇒ x ∈ A et y = ϕ(x), autrement dit 

où S = {(x, y) ∈ U : f(x, y) = 0}. 

c) ϕ(.) est de classe C r sur A et 

S ∩ V = {(x, ϕ(x)) : x ∈ A}, 

Dϕ(x) = −(D 2 f(x, ϕ(x))) −1 ◦ D 1 f(x, ϕ(x)). 

93

Démonstration. Comme Isom (F, G) est ouvert dans L(F, G) et comme D 2 f est continue, on a 

(D 2 f) −1 (Isom (F, G)) est un ouvert qui contient (a, b). On peut alors supposer que D 2 f(x, y) ∈ 

Isom (F, G) pour tout (x, y) ∈ U. Définissons 

par 

h : U −→ E × G 

h(x, y) = (x, f(x, y)). 

pour tout (x, y) ∈ U. L’application h est de classe C r car h = (h 1 , h 2 ) avec h 1 et h 2 de classe C r . 

On a donc, pour tout (u, v) ∈ E × F 

Dh(x, y)(u, v) = (u, D 1 f(x, y)u + D 2 f(x, y)v). 

On observe que L = Dh(a, b) est bijective. En effet si (u, v) ∈ ker L, alors u = 0 et D 2 f(a, b)v = 

0 d’où v = 0. De plus, si on considère (u, w) ∈ E × G, on a L(u, v) = (u, w) où l’on a posé 

v = (D 2 f(a, b)) −1 (w − D 1 f(a, b)u). Observons que l’on a montré que 

(Dh(a, b)) −1 = (π E , D 2 f(a, b) ◦ (π G − D 1 f(a, b) ◦ π E )), 

ce qui implique que Dh(a, b) est un isomorphisme. On peut donc appliquer le Théorème 5.1.2 qui 

garantit l’existence d’un voisinage V ′ de (a, b) tel que h soit un C r difféomorphisme de V ′ dans 

l’ouvert W ′ = h(V ′ ) qui est un voisinage de h(a, b) = (a, 0). Il existe alors un voisinage ouvert 

A de a et un voisinage ouvert B de 0 dans G tels que A × B ⊂ W ’. Posons W = A × B et 

V = h −1 (W ). Il est clair que h est un C r difféomorphisme de V dans W . Pour tout x ∈ A, posons 

ϕ(x) = (π F ◦ h −1 )(x, 0). 

L’application ϕ est de classe C r comme composée de trois applications de ce type. Pour tout 

x ∈ A, on a h −1 (x, 0) = (x, ϕ(x)) donc (x, 0) = h(x, ϕ(x)) = (x, f(x, ϕ(x))) ce qui montre que 

f(x, ϕ(x)) = 0. De plus, si (x, y) ∈ V vérifie f(x, y) = 0 on a h(x, y) = (x, 0) = h(x, ϕ(x)) et 

(x, ϕ(x)) ∈ V ce qui implique y = ϕ(x) car h est injective sur V . Il reste alors à calculer Dϕ. On 

remarque pour ceci que pour tout x ∈ A on a f(x, ϕ(x)) = 0. Remarquons alors que f ◦ Φ = 0 

où Φ : A −→ V est définie par Φ(x) = (x, ϕ(x)). Il en résulte que, pour tout x ∈ A et pour tout 

u ∈ E, on a D(f ◦ Φ)(x)(u) = 0, d’où D 1 f(x, ϕ(x))(u) + D 2 (f, ϕ(x))(Dϕ(x)(u)) = 0. Il en 

résulte bien que 

Dϕ(x)(u) = −((D 2 f(x, ϕ(x))) −1 ◦ D 1 f(x, ϕ(x)))(u). 

Remarque 5.2.1 On vient de démontrer le Théorème des fonctions implicites à l’aide du Théorème 

du difféomorphisme local. On peut également faire l’inverse. En effet, étant donné f : 

U −→ F une application de classe C r , r ≥ 1 définie sur un ouvert U d’un espace de Banach 

E et à valeurs dans un espace de Banach F et a ∈ U tel que Df(a) ∈ Isom (E, F ), on définit 

94

g : U ×F → F par g(x, y) = f(x)−y. Posant b = f(a) on a D 1 g(a, b) = Df(a) ∈ Isom (E, F ). 

D’après le Théorème 5.2.1 il existe un voisinage ouvert V de (a, b), un voisinage ouvert B de b et 

une application ψ : B −→ X de classe C r telle que (x, y) ∈ V et g(x, y) = 0 si et seulement si 

y ∈ B et x = ψ(y). Posons 

A = {x ∈ X : (x, f(x)) ∈ V }. 

C’est un ensemble ouvert comme image réciproque d’un ouvert par une application continue et 

a ∈ A. On a alors que f est bijective de A dans B et f −1 = ψ sur B. En effet si x 1 , x 2 ∈ A vérifient 

f(x 1 ) = f(x 2 ) := y on a (x 1 , y), (x 2 , y) ∈ V et g(x 1 , y) = g(x 2 , y) = 0 donc x 1 = x 2 = ψ(y). 

Par ailleurs si y ∈ B, posant x = ψ(y) on a (x, y) ∈ V et f(x) = y donc x ∈ A. On a donc bien 

montré que f était un C r difféomorphisme de A dans B. 

5.3 Application : Multiplicateurs de Lagrange 

Théorème 5.3.1 Soient g : U −→ F une application de classe C 1 définie sur un ouvert U d’un 

espace de Banach E, à valeurs dans un espace de Banach F et f : U −→ R une fonction. On 

pose S = g −1 (0) et on suppose que a ∈ S est un extremum local de f sur S. On suppose aussi 

que f est différentiable en a et que : 

– Dg(a) ∈ L(E, F ) est surjective ; 

– ker Dg(a) admet un supplémentaire topologique (i.e. E = ker Dg(a) ⊕ Y avec projections 

continues). 

Alors, il existe λ ∈ F ∗ = L(F, R) unique tel que 

Df(a) = λ ◦ Dg(a). 

Démonstration. On pose X = ker Dg(a) et on considère un sous-espace vectoriel fermé Y ⊂ E 

tel que E = X⊕Y dont l’existence est garantie par l’hypothèse. Soit r > 0 tel que la boule ouverte 

B(a, 2r) soit contenue dans U. Posant V = X ∩ B(0, r) et W = Y ∩ B(0, r), on remarque que 

V et W sont des ouverts non vides de Y et de Y et que a + V + W ⊂ U, ce qui permet de définir 

une application h : V × W −→ F par h(v, w) = g(a + v + w). L’application h est de classe C 1 

comme composée d’une application de classe C 1 et d’une application affine continue. On a alors 

Dh(v, w) = Dg(a + v + w) ◦ l avec l : X × Y −→ E définie par l(h, k) = h + k pour tout 

(h, k) ∈ X × Y . Il en résulte que 

et 

D 1 h(v, w) = Dh(v, w) ◦ l(·, 0) = Dg(a + v + w) |X , 

D 2 h(v, w) = Dh(v, w) ◦ l(0, ·) = Dg(a + v + w) |Y . 

On a h(0, 0) = 0. Comme E = ker Dg(a) ⊕ Y , on a ker Dg(a) |Y = ker Dg(a) ∩ Y = {0} donc 

Dg(a) |Y est injective. Par ailleurs, comme Dg(a) est surjective, tout élément w ∈ F s’écrit w = 

Dg(a)(u + v) avec (u, v) ∈ ker Dg(a) × Y , donc w = Dg(a) |Y (v), ce qui montre que Dg(a) |Y 

est aussi surjective. On obtient donc que D 2 h(0, 0) = Dg(a) |Y ∈ Isom (Y, F ) et h(0, 0) = 0. 

Utilisant le théorème des fonctions implicites, il existe un voisinage ouvert A de 0 dans X et une 

application ϕ : A −→ Y telle que 

g(a + v + ϕ(v)) = 0 pour tout v ∈ A, 

95

avec 

Dϕ(0) = −(D 2 h(0, 0)) −1 ◦ D 1 h(0, 0) = −(Dg(a) |Y ) −1 ◦ Dg(a) |X = 0, 

car Dg(a) |X = 0. Supposant que a est un minimum local de f sur S, on a, pour tout v dans un 

voisinage de 0, 

f(a + v + ϕ(v)) ≥ f(a) = f(a + 0 + ϕ(0)), 

ce qui implique que la fonction θ(v) = f(a + v + ϕ(v)) a un minimum local en 0, d’où 

0 = Dθ(0) = Df(a) ◦ (I X + Dϕ(0)) = Df(a) |X . 

Posons alors λ = Df(a) ◦ (Dg(a) |Y ) −1 ∈ L(F, R). On a, par définition : 

De plus 

Df(a) |Y = (λ ◦ Dg(a)) |Y . 

Df(a) |X = (λ ◦ Dg(a)) |X = 0, 

donc Df(a) = λ ◦ Dg(a) car E = X ⊕ Y . L’unicité de λ découle du fait que Df(a) = λ ◦ Dg(a) 

implique Df(a) |Y = (λ ◦ Dg(a)) |Y , d’où λ = Df(a) ◦ (Dg(a) |Y ) −1 . 

Remarque 5.3.1 a) Le théorème précédent reste vrai sans avoir à supposer que ker Dg(a) admet 

un supplémentaire topologique ; mais la démonstration dépasse alors le niveau de ce cours. 

b) Dans le cas où E est un espace de Hilbert, il est toujours vrai que ker Dg(a) admet un 

supplémentaire topologique (son orthogonal, par exemple). 

On en déduit le 

Corollaire 5.3.1 Soient U ⊂ R n un ouvert, g : U −→ R m une application de classe C 1 et 

f : U −→ R une fonction. On pose S = g −1 (0) et on suppose que a ∈ S est un extremum local 

de f sur S. On suppose aussi que f est différentiable en a et que : 

Alors, il existe λ ∈ R m unique tel que 

(∇g 1 (a), · · · , ∇g m (a)) sont linéairement indépendant. 

∇f(a) = 

m∑ 

λ i ∇g i (a). 

i=1 

Démonstration. On a Dg(a)u = (〈∇g 1 (a), u〉, · · · , 〈∇g m (a), u〉) pour tout u ∈ R n , de telle sorte 

que Dg(a) T (v) = ∑ m 

i=1 v i∇g i (a) pour tout v ∈ R m . Comme (∇g 1 (a), · · · , ∇g m (a)) sont linéairement 

indépendant, il en résulte que Dg(a) T est injective donc Dg(a) est surjective. Par ailleurs 

ker Dg(a) admet un supplémentaire topologique (son orthogonal, par exemple). Appliquant le 

Théorème 5.3.1, il existe λ ∈ R m unique tel que Df(a)u = 〈λ, Dg(a)u〉 pour tout u ∈ R n , soit 

〈∇f(a), u〉 = 

m∑ 

〈 ∑ m 〉 

λ i 〈∇g i (a), u〉 = λ i ∇g i (a), u , 

i=1 

96 

i=1

d’où 

∇f(a) = 

m∑ 

λ i ∇g i (a). 

i=1 

Remarque 5.3.2 La condition nécessaire donnée dans le Théorème 5.3.1 permet parfois de déterminer 

l’extremum. 

5.4 Introductions aux sous-variétés 

5.4.1 Immersion et submersion locale 

Pour m ≤ n on notera π l’application linéaire surjective π : R n −→ R m définie pour tout x ∈ R n 

par π(x 1 , · · · , x n ) = (x n−m+1 , · · · , x n ), et pour n ≤ m, on notera par j : R n −→ R m l’application 

linéaire injective définie pour tout x ∈ R m par 

j(x 1 , · · · , x n ) = (x 1 , · · · , x n , 0, · · · , 0). 

Théorème 5.4.1 IMMERSION. Soit U ⊂ R n un ouvert, soit g : U −→ R m une application de 

classe C r et soit a ∈ U tel que Dg(a) soit injective. Alors il existe des ouvert U ⊃ U ′ ∋ a, 

R m ⊃ V ∋ g(a) tels que g(U ′ ) ⊂ V et un C r -difféomorphisme f de V sur un ouvert f(V ) de R m 

tel que 

f(g(x)) = j(x) = (x 1 , · · · , x n , 0, · · · , 0) pour tout x ∈ U ′ , 

de plus, on a 

f(V ) ∩ (R n × {0}) = f(g(U ′ )). 

Démonstration. Notons que n ≤ m car Dg(a) est injective et considérons un sous-espace vectoriel 

F de R m tel que R m = Dg(a)(R n ) ⊕ F de sorte que la dimension de F est m − n. Soit ψ un 

isomorphisme de R m−n dans F et soit h : U × R m−n −→ R m définie par h(x, y) = g(x) + ψ(y). 

L’application h est de classe C r et Dh(x, y)(u, v) = Dg(x)(u)+ψ(v) ce qui montre que Dh(a, 0) 

est surjective, donc bijective car Dh(a, 0) ∈ L(R m , R m ). Il existe donc des ouverts R n ⊃ U ′ ∋ a 

et R m−n ⊃ W ′ ∋ 0 tels que h soit un C r difféomorphisme de U ′ × W ′ dans un ouvert V ∋ g(a) 

de R m . Posant f = h −1 , on a g(U ′ ) ⊂ h(U ′ × W ′ ) = V , et, pour tout x ∈ U ′ , f(g(x)) = 

f(h(x, 0)) = (x, 0) = j(x). On a donc montré que f(g(U ′ )) ⊂ f(V ) ∩ (R n × {0}). Réciproquement, 

étant donné z = (z 1 , · · · , z n , 0) ∈ f(V ) ∩ (R n × {0}), on a donc x = (z 1 , · · · , z n ) ∈ U ′ 

donc f(g(x)) = z donc z ∈ f(g(U ′ )). 

Théorème 5.4.2 SUBMERSION. Soit U ⊂ R n un ouvert, soit f : U −→ R m une application de 

classe C r et soit a ∈ U tel que Df(a) soit surjective. Alors il existe un ouvert U ⊃ U ′ ∋ a et un 

C r -difféomorphisme g de U ′ sur un ouvert g(U ′ ) de R n tel que 

π(g(x)) = f(x) pour tout x ∈ U ′ . 

97

De plus, si f(a) = 0, on a 

g(U ′ ∩ S) = g(U ′ ) ∩ (R n−m × {0}), 

où S = {x ∈ U : f(x) = 0}. 

Démonstration. Notons que m ≤ n car Df(a) est surjective et que dim(ker(Df(a))) = n−m. Il 

existe alors une application linéaire ψ : R n −→ R n−m telle que ψ |ker(Df(a)) soit injective (prendre 

une base (e 1 , · · · , e n−m ) de ker(Df(a)) et poser ψ(x) = (y 1 , · · · , y n−m ) coordonnées dans cette 

base de la projection orthogonale de x sur ker(Df(a))). Introduisons g : U −→ R n par g = (ψ, f) 

de telle sorte que g est de classe C r sur U et Dg(a) = (ψ, Df(a)). Soit u ∈ ker(Dg(a)), on 

a u ∈ ker(Df(a)) et ψ(u) = 0 donc u = 0, d’où Dg(a) est injective et alors bijective car 

Dg(a) ∈ L(R n , R n ). Il existe donc des ouverts U ⊃ U ′ ∋ a et R n ⊃ g(U ′ ) ∋ g(a) tels que g soit 

un C r -difféomorphisme U ′ dans g(U ′ ). Il est alors clair que f = π ◦g sur U ′ . Pour tout x ∈ S ∩U ′ , 

on a alors g(x) = (ψ(x), f(x)) = (ψ(x), 0) donc g(U ′ ∩S) ⊂ g(U ′ )∩(R n−m ×{0}). Par ailleurs, 

si z ∈ g(U ′ ) ∩ (R n−m × {0}), alors z = g(x) avec x ∈ U ′ et z = (y, 0) avec y ∈ R n−m d’où 

(y, 0) = (ψ(x), f(x)), ce qui montre bien que x ∈ S donc z ∈ g(U ′ ∩ S). 

5.4.2 Définitions équivalentes des sous-variétés 

Définition 5.4.1 Une partie non vide S ⊂ R n est appelée sous-variété de classe C r et de dimension 

d ∈ N si, pour tout a ∈ S, il existe un ouvert V ∋ a et un C r -difféomorphisme f de V dans 

un ouvert W ∋ f(a) tel que 

f(V ∩ S) = f(V ) ∩ (R d × {0}). 

Exemple 5.4.1 a) Un ouvert de R n est une sous-variété de dimension n et de classe C ∞ (prendre 

f = I R n). On pourra démontrer en exercice que, réciproquement, toute sous-variété de dimension 

n est un ouvert de R n . 

b) Étant donnée une sous-variété S de dimension 0 et a ∈ S, alors S ∩ V = f(V ) ∩ {0} = {0} 

donc S ∩ V = {a}. 

c) Un sous-espace affine L ⊂ R n de dimension d est une sous-variété de dimension d. En effet, 

étant donné a ∈ L on considère une base (e 1 , · · · , e n ) de R n telle que (e 1 , · · · , e d ) soit une base 

de L − a, et on considère l’isomorphisme ϕ : R n −→ R n qui à x ∈ R n associe ses cooordonnées 

(x 1 , · · · , x n ) dans cette base. Posant f(x) = ϕ(x) − ϕ(a), on a f(L) = R d × {0}. 

Théorème 5.4.3 Considérons les propriétés suivantes relatives à une partie non vide S ⊂ R n . 

i) S est une sous-variété de classe C r et de dimension d. 

ii) Pour tout a ∈ S, il existe un ouvert R n ⊃ U ∋ a et une application h = (h 1 , · · · , h n−d ) : U −→ 

R n−d de classe C r avec (∇h 1 (a), · · · , ∇h n−d (a)) linéairement indépendants (ce qui équivaut à 

dire que Dh(a) est surjective) telles que 

S ∩ U = h −1 (0). 

98

iii) Pour tout a ∈ S, il existe un ouvert R n ⊃ V ∋ a, un ouvert R d ⊃ W ∋ (a 1 , · · · , a d ) et une 

application g : W −→ R n−d de classe C r telle que, à une permutation près des coordonnées, on 

ait 

S ∩ V = {(z, g(z)) : z ∈ W }. 

iv) Pour tout a ∈ S, il existe des ouverts R n ⊃ V ∋ a, R d ⊃ Ω ∋ 0 et une application p : Ω −→ 

R n de classe C r telle que 

p(0) = a, Dp(0) est injective et p est un homéomorphisme de Ω dans S ∩ V. 

Alors, ces quatres propriétés sont équivalentes. 

Démonstration. Montrons que i) =⇒ ii) =⇒ iii) =⇒ iv) =⇒ i). 

i) =⇒ ii). Définissons h = π◦f : V −→ R n−d avec π(y 1 , · · · , y n ) = (y d+1 , · · · , y n ). L’application 

h est de classe C r sur V et Dh(a) = π ◦ Df(a) est surjective car π est surjective et Df(a) est 

bijective. Pour x ∈ V , on a h(x) = 0. Réciproquement, si h(x) = 0, on a f(x) ∈ f(V )∩(R d ×{0}) 

donc f(x) = f(z) avec z ∈ S donc x = z ∈ S car f est injective sur V . On a donc bien 

S ∩ V = h −1 (0). 

ii) =⇒ iii). Comme Dh(a) est surjective, il existe {i 1 , · · · , i n−d } ⊂ [1, n] tels que 

(Dh(a)e i1 , · · · , Dh(a)e in−d ) 

soient linéairement indépendants. Quitte à permuter les coordonnées, on peut supposer que 

(Dh(a)e d+1 , · · · , Dh(a)e n ) 

sont linéairement indépendants. Écrivant R n = R d × R n−d , on a, pour tout v ∈ R n−d , 

D 2 h(a)(v) = Dh(a)(0, v) = 

n∑ 

j=d+1 

v j Dh(a)(e j ), 

ce qui montre que D 2 h(a) ∈ L(R n−d , R n−d ) est injective donc bijective. Appliquant le Théorème 

des fonctions implicites, il existe des voisinages ouverts A de (a 1 , · · · , a d ) dans R d et V ⊂ U de a 

dans R n et une application g : A −→ R n−d de classe C r tels que 

h −1 (0) ∩ V = {(z, g(z)) : z ∈ A}, 

soit 

S ∩ V = S ∩ U ∩ V = h −1 (0) ∩ V = {(z, g(z)) : z ∈ A}. 

iii) =⇒ iv). Posons Ω = W − â, où â = (a 1 , · · · , a d ), de telle sorte que g(â) = (a d+1 , · · · , a n ), et, 

pour tout t ∈ Ω, p(t) = (â + t, g(â + t)) d’où p(0) = (â, g(â)) = a. L’application p est de classe 

C r et Dp(0)(u) = (u, Dg(a)(u)) pour tout u ∈ R d ce qui montre que Dp(0) est injective. On a 

p(Ω) = S ∩ V. 

99

De plus, p étant injective est une bijection de Ω dans p(Ω) = S ∩ V . Enfin la bijection inverse est 

définie pour tout x ∈ S ∩ V par (x 1 − a 1 , · · · , x d − a d ) qui est continue, ce qui montre bien que p 

est un homéomorphisme de Ω dans S ∩ V . 

iv) =⇒ i). D’après le Théorème 5.4.1, il existe un ouvert ˆΩ ⊂ Ω contenant 0, un ouvert Ŵ ∋ a tel 

que p(ˆΩ) ⊂ Ŵ et un Cr -difféomorphisme f de Ŵ dans un ouvert f(Ŵ ) tels que 

f(p(ˆΩ)) = f(Ŵ ) ∩ (Rd × {0}). 

Comme ˆΩ est un ouvert et p un homéomorphisme, on obtient que p(ˆΩ) est un ouvert de S ∩ V . 

Il existe donc un ouvert ˆV ∋ a tel que p(ˆΩ) = ˆV ∩ S. Comme p(ˆΩ) ⊂ Ŵ , on peut supposer que 

ˆV ⊂ Ŵ . On a alors 

f( ˆV ∩ S) = f(p(ˆΩ)) = f(Ŵ ) ∩ (Rd × {0}) ⊃ f( ˆV ) ∩ (R d × {0}), 

et f( ˆV ∩ S) ⊂ f( ˆV ) et f( ˆV ∩ S) = f(p(ˆΩ)) ⊂ R d × {0} donc f( ˆV ∩ S) ⊂ f( ˆV ) ∩ (R d × {0}), 

d’où 

f( ˆV ∩ S) = f( ˆV ) ∩ (R d × {0}). 

Remarque 5.4.1 C’est un bon exercice de montrer d’autres implications que celles strictement 

nécessaires à la démonstration du théorème précédent. 

ii) =⇒ i). D’après le Théorème 5.4.2, il existe un ouvert V ⊃ V ′ ∋ a et un C r -difféomorphisme g 

de V ′ dans un ouvert g(V ′ ) de R n tel que π d (g(x)) = f(x) pour tout x ∈ V ′ avec π d (y 1 , · · · , y n ) = 

(y d+1 , · · · , y n ) et tel que g(V ′ ∩ S) = g(V ′ ) ∩ (R d × {0}). 

iii) =⇒ ii). Considérons l’ouvert ˆV = V ∩(W ×R d ). On vérifie immédiatement que a ∈ ˆV et que 

S ∩ ˆV = {(z, g(z)) : z ∈ W }. Introduisons l’application h : ˆV −→ R n−d par h(z, y) = y − g(z). 

On vérifie alors que 

h −1 (0) = ˆV ∩ S. 

De plus pour tout (w, v) ∈ R d × R n−d on a Dh(a)(w, v) = v − Dg(a 1 , · · · , a d )(w) donc 

v = Dh(a)(0, v) d’où Dh(a) est surjective, ce qui équivaut à ∇h 1 (a), · · · , ∇h m (a) linéairement 

indépendants. 

i) =⇒ iv). On peut supposer sans perte de généralité que f(a) = 0. Définissons 

π 0 (y 1 , · · · , y n ) = (y 1 , · · · , y d ) 

et Ω = π 0 (f(V ) ∩ (R d × {0})). L’ensemble Ω est ouvert (vérification facile) et contient 0. Pour 

t ∈ Ω, on a (t, 0) ∈ f(V ), on peut donc poser p(t) = f −1 (t, 0). L’application ainsi définie est 

de classe C r et, pour tout w ∈ R d , on a Dp(0)(w) = Df −1 (0)(w, 0) = (Df(a)) −1 (w, 0), ce qui 

montre que Dp(0) est injective. Par ailleurs t ∈ Ω si et seulement si (t, 0) ∈ f(V ) ∩ (R d × {0}) 

donc p(Ω) = S ∩ V . Enfin pour tout x ∈ S ∩ V , on a p −1 (x) = π 0 (f(x)) ce qui montre que p −1 

est continue, donc p est bien un homéomorphisme de Ω dans S ∩ V . 

100

iv) =⇒ iii). (C’est un peu moins facile). Comme Dp(0) est injective, on a Dp(0) T est surjective, 

ce qui implique que le sous-espace vectoriel engendré par ∇p 1 (0), · · · , ∇p n (0) est R d . Il existe 

donc i 1 , · · · , i d ∈ [1, n] tels que (∇p i1 (0), · · · , ∇p id (0)) est une base de R d . En permutant les coordonnées, 

on peut supposer que (∇p 1 (0), · · · , ∇p d (0)) est une base de R d , ce qui implique que 

l’application q : Ω −→ R d définie par q(t) = (p 1 (t), · · · , p d (t)) vérifie Dq(0) ∈ Isom (R d ). 

Il existe donc un ouvert ˆΩ ∋ 0 tel que q soit un C r -difféomorphisme de ˆΩ dans un ouvert 

R d ⊃ Ŵ ∋ â = (a 1, · · · , a d ). Comme p est un homéomorphisme de Ω dans S ∩ V , il existe 

un ouvert R n ⊃ ˆV ∋ a tel que p(ˆΩ) = S ∩ ˆV . Introduisons alors g : Ŵ −→ R n−d par 

g(ẑ) = (p d+1 (q −1 (ẑ), · · · , p n (q −1 (ẑ)). L’application g est de classe C r sur Ŵ et 

{(ẑ, g(ẑ)) : ẑ ∈ Ŵ } = S ∩ ˆV . 

En effet, si x ∈ S ∩ ˆV , alors x = p(t) pour un t ∈ ˆΩ et ẑ = (p 1 (t), · · · , p d (t)) ∈ Ŵ de telle sorte 

que 

x = (p 1 (t), · · · , p d (t), p d+1 (t), · · · , p n (t)) = (ẑ, g(ẑ)). 

Réciproquement, si x = (ẑ, g(ẑ)) pour ẑ ∈ Ŵ , alors t = q−1 (ẑ) ∈ ˆΩ, d’où 

donc x ∈ p(ˆΩ) = S ∩ ˆV . 

x = (p 1 (t), · · · , p d (t), p d+1 (t), · · · , p n (t)), 

iii) =⇒ i). Soit U l’ouvert de R n défini par U = W × R n−d et soit f : U −→ R n définie 

par f(y, z) = (y, g(y) − z). L’application f est de classe C r et, pour tout u = (v, w) ∈ R n , 

on a Df(a)u = (v, Dg(â)v − w) où â = (a 1 , · · · , a d ). Il en résulte que Df(a) est injective 

donc bijective car Df(a) ∈ L(R n , R n ). D’après le Théorème du difféomorphisme local, il existe 

donc un ouvert ˆV ∋ a tel que ˆV ⊂ W × R n−d et tel que f soit un C r difféomorphisme de ˆV 

dans l’ouvert Ŵ = f( ˆV ). Étant donné x = (y, z) ∈ S ∩ ˆV , on a y ∈ W donc z = g(y) et 

f(x) = (y, 0) ∈ f( ˆV ) ∩ R d × {0}. Réciproquement, si x = (y, 0) ∈ f( ˆV ) ∩ R d × {0}, alors 

y ∈ W et il existe z ∈ R n−d tel que x = (y, g(y) − z) = (y, 0) d’où z = g(y) donc (y, z) ∈ S et 

x ∈ f(S ∩ ˆV ). On a donc bien 

5.4.3 Sous-espace tangent 

f(S ∩ ˆV ) = f( ˆV ) ∩ R d × {0}. 

Définition 5.4.2 Soit S ⊂ R n une sous-variété de classe C r et de dimension d. On dit que u ∈ R n 

est tangent à S en a ∈ S s’il existe η > 0 et une fonction ϕ :] − η, +η[−→ S dérivable en 0 telle 

que ϕ(0) = a et ϕ ′ (0) = u. 

Théorème 5.4.4 L’ensemble T a S des vecteurs tangents en a à une sous-variété S ∋ a de classe 

C r et de dimension d est un espace vectoriel de dimension d. 

Démonstration. Considérons le voisinage ouvert V de a et le C r -difféomorphisme f : V −→ 

f(V ) tel que f(S ∩ V ) = f(V ) ∩ R d × {0}. On peut supposer que f(a) = 0. Soit alors v ∈ T a S 

et ϕ :] − η, +η[−→ S dérivable en 0 telle que ϕ(0) = a et ϕ ′ (0) = u. On peut supposer, quitte 

101

à diminuer η que ϕ(] − η, +η[) ⊂ S ∩ V . Définissant alors α :] − η, +η[−→ R d × {0} par 

α(t) = f(ϕ(t)), on a 

α ′ (0) = Df(ϕ(0))ϕ ′ (0) = Df(a)u, 

et α ′ (0) ∈ R d × {0} donc Df(a)u ∈ R d × {0}. Réciproquement, soit w ∈ R d × {0}. On a 

0 = f(a) ∈ f(V )∩R d ×{0} et f(V )∩R d ×{0} est un ouvert de R d ×{0} car f(V ) est un ouvert 

de R n . Il existe donc η > 0 tel que tw ∈ f(V )∩R d ×{0} = f(S∩V ) pour tout t ∈]−η, +η[. Posant 

ϕ(t) = f −1 (tw), on a ϕ :] − η, +η[−→ S ∩ V , ϕ(0) = a et ϕ ′ (0) = Df −1 (0)w = (Df(a)) −1 (w) 

et u = ϕ ′ (0) ∈ T a S. On a alors w = Df(a)u avec u ∈ T a S. On a donc montré que 

T a S = (Df(a)) −1 (R d × {0}). 

Comme (Df(a)) −1 est un isomorphisme et comme R d ×{0} est un espace vectoriel de dimension 

d, il en est de même pour T a S. 

on peut aussi calculer l’espace tangent T a S à l’aide des définitions équivalentes des sous-variétés 

données dans le théorème 5.4.4. 

Proposition 5.4.1 Dans le cas ii), on a 

T a S = ker Dh(a) = {u ∈ R n : 〈∇h i (a), u〉 = 0, i ∈ [1, n − d]}. 

Dans le cas iii), on a, posant â = (a 1 , · · · , a d ), 

T a S = {(v, Dg(â)v) : v ∈ R d }. 

Dans le cas iv), on a 

T a S = Dp(0)(R d ) = {Dp(0)v : v ∈ R d }. 

102

LICENCE DE MATHÉMATIQUES FONDAMENTALES Calcul ...

Create successful ePaper yourself

Delete template?

Save as template?