16.07.2014 Views

LICENCE DE MATHÉMATIQUES FONDAMENTALES Calcul ...

LICENCE DE MATHÉMATIQUES FONDAMENTALES Calcul ...

LICENCE DE MATHÉMATIQUES FONDAMENTALES Calcul ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>LICENCE</strong> <strong>DE</strong> <strong>MATHÉMATIQUES</strong><br />

<strong>FONDAMENTALES</strong><br />

<strong>Calcul</strong> Différentiel et Équations Différentielles<br />

D. Azé<br />

Université Paul Sabatier Toulouse<br />

2008


Table des matières<br />

1 Généralités sur les espaces normés 3<br />

1.1 Espaces vectoriels normés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />

1.2 Espaces de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5<br />

1.3 Applications linéaires continues . . . . . . . . . . . . . . . . . . . . . . . . . . 8<br />

1.4 Normes équivalentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />

1.5 Applications multilinéaires continues . . . . . . . . . . . . . . . . . . . . . . . . 15<br />

1.6 Espaces de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18<br />

2 Applications différentiables dans les espaces normés 29<br />

2.1 Définition d’une application différentiable . . . . . . . . . . . . . . . . . . . . . 29<br />

2.2 Opérations sur les applications différentiables . . . . . . . . . . . . . . . . . . . 35<br />

2.3 Applications à valeurs dans un produit d’espaces . . . . . . . . . . . . . . . . . 38<br />

2.4 Applications définies sur un produit d’espaces . . . . . . . . . . . . . . . . . . . 39<br />

3 Théorème des Accroissements Finis et Applications 47<br />

3.1 Théorème des Accroissements Finis . . . . . . . . . . . . . . . . . . . . . . . . 47<br />

3.2 Applications du Théorème des Accroissements Finis . . . . . . . . . . . . . . . 51<br />

3.3 Applications Strictement Différentiables . . . . . . . . . . . . . . . . . . . . . . 55<br />

3.4 Opérateurs de Nemicki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56<br />

3.5 Primitives et Intégrales des Fonctions Réglées . . . . . . . . . . . . . . . . . . . 60<br />

4 Différentielles d’Ordre Supérieur 67<br />

4.1 Définition des Différentielles d’Ordre Supérieur . . . . . . . . . . . . . . . . . . 67<br />

4.2 Propriétés de Symétrie des Différentielles d’Ordre Supérieur . . . . . . . . . . . 71<br />

4.3 Formules de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />

4.4 Conditions d’Optimalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85<br />

5 Théorèmes d’Inversion et Applications 89<br />

5.1 Théorèmes d’inversion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89<br />

5.2 Théorème des Fonctions Implicites . . . . . . . . . . . . . . . . . . . . . . . . 93<br />

5.3 Application : Multiplicateurs de Lagrange . . . . . . . . . . . . . . . . . . . . . 95<br />

5.4 Introductions aux sous-variétés . . . . . . . . . . . . . . . . . . . . . . . . . . . 97<br />

5.4.1 Immersion et submersion locale . . . . . . . . . . . . . . . . . . . . . . 97<br />

5.4.2 Définitions équivalentes des sous-variétés . . . . . . . . . . . . . . . . . 98<br />

1


5.4.3 Sous-espace tangent . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101<br />

2


Chapitre 1<br />

Généralités sur les espaces normés<br />

1.1 Espaces vectoriels normés<br />

Le cadre naturel pour l’étude du calcul différentiel est celui des espaces vectoriels normés de<br />

dimension finie ou non. Commençons donc par rappeler les notions de base qui nous seront utiles<br />

dans la suite.<br />

Définition 1.1.1 Étant donné un espace vectoriel réel E, une norme est une fonction<br />

vérifiant<br />

i) ‖x‖ = 0 si et seulement si x = 0 ;<br />

‖ · ‖ : E → R + ,<br />

ii) ‖λx‖ = |λ|‖x‖, pour tout λ ∈ R et x ∈ E ;<br />

iii) ‖x + y‖ ≤ ‖x‖ + ‖y‖, pour tout x, y ∈ E.<br />

À toute norme est associée une distance d(x, y) = ‖x − y‖. Un espace normé est un espace<br />

métrique et donc un espace topologique. Une partie U ⊂ E est ouverte si, pour tout a ∈ U, il<br />

existe r > 0 tel que ¯B(a, r) ⊂ U où ¯B(a, r) = {x ∈ E : ‖x − a‖ ≤ r}. Les boules ouvertes<br />

B(a, r) = {x ∈ E : ‖x − a‖ < r} sont des ouverts et tout ouvert est réunion d’une famille<br />

de boules ouvertes. Une partie F de E est fermée si son complémentaire est ouvert (les boules<br />

fermées sont des fermés). Une suite (x n ) d’éléments de E est dite converger vers x ∈ E si la suite<br />

réelle (‖x n − x‖) converge vers 0. On écrit alors x = lim x n ou x n → x. La limite, quand elle<br />

n→∞<br />

existe, est unique ; elle est caractérisée par la propriété :<br />

pour tout ε > 0, il existe n 0 ∈ N tel que, pour tout n ≥ n 0 , ‖x n − x‖ ≤ ε.<br />

Les ensembles fermés F sont alors caractérisés par le fait que tout x ∈ E tel que pour tout r > 0,<br />

F ∩ B(x, r) ≠ ∅ appartient à F , ce qui équivaut à dire qu’ils contiennent toute limite d’une suite<br />

à valeurs dans F (le démontrer en exercice).<br />

3


Remarque 1.1.1<br />

et<br />

a) Pour tout x, y ∈ X on déduit des inégalités<br />

‖x‖ ≤ ‖x − y‖ + ‖y‖<br />

‖y‖ ≤ ‖y − x‖ + ‖x‖<br />

que l’on a, notant que ‖y − x‖ = ‖(−1)(x − y)‖ = ‖x − y‖,<br />

|‖x‖ − ‖y‖| ≤ ‖x − y‖.<br />

La fonction x ↦→ ‖x‖ est alors Lipschitzienne de constante 1, ce qui implique en particulier qu’elle<br />

est continue.<br />

b) Les applications (λ, x) ↦−→ λx et (x, y) ↦−→ x + y sont continues respectivement de R × E<br />

dans E et de E × E dans E. En effet si les suites (x n ), (y n ) et (λ n ) convergent respectivement<br />

vers x ∈ E, y ∈ E et λ ∈ R, on a<br />

‖(x n + y n ) − (x + y)‖ ≤ ‖x n − x‖ + ‖y n − y‖,<br />

‖λ n x n − λx‖ = ‖(λ n − λ)x n + λ(x n − x)‖<br />

≤<br />

≤<br />

|λ n − λ|‖x n ‖ + |λ|‖x n − x‖<br />

|λ n − λ|M + |λ|‖x n − x‖<br />

où M = sup‖x n ‖ < +∞ car une suite convergente est bornée. Il en résulte bien que x + y =<br />

n∈N<br />

lim (x n + y n ) et que λx = lim λ n x n .<br />

n→∞ n→∞<br />

c) Dans le cas où E = R n , on identifiera u ∈ R n à une matrice n × 1. Cela donne un sens<br />

au produit matriciel AX ∈ R n d’une matrice A ∈ M(m, n) par un vecteur X ∈ R n . Avec ces<br />

notations, le produit scalaire euclidien s’écrit, pour X, Y ∈ R n ,<br />

〈X, Y 〉 = Y T X =<br />

n∑<br />

X i Y i ,<br />

i=1<br />

où Y T ∈ M(1, n) est la matrice uniligne transposée de Y ∈ M(n, 1). On prendra garde de<br />

ne pas confondre le scalaire Y T X avec Y X T qui est la matrice carrée de taille n définie par<br />

[Y X T ] ij = Y i X j .<br />

Étant donnée une famille finie d’espaces normés E 1 , · · · , E d dont les normes sont indifféremment<br />

dénotées par ‖·‖, on utilisera sur le produit cartésien E = E 1 ×· · ·×E d les normes suivantes<br />

(démontrer en exercice que ce sont bien des normes).<br />

Définition 1.1.2 On pose<br />

‖(x 1 , · · · , x d )‖ 1 =<br />

4<br />

d∑<br />

‖x i ‖,<br />

i=1


et plus généralement pour 1 ≤ p < +∞<br />

on pose aussi<br />

( d∑ ) 1/2,<br />

‖(x 1 , · · · , x d )‖ 2 = ‖x i ‖ 2<br />

i=1<br />

( d∑ ) 1<br />

‖(x 1 , · · · , x d )‖ p = ‖x i ‖ p p<br />

,<br />

i=1<br />

‖(x 1 , · · · , x d )‖ ∞ = sup ‖x i ‖.<br />

1≤i≤d<br />

C’est un exercice facile de montrer qu’une suite (x n ) n∈N dans E 1 × · · · × E d converge pour ces<br />

normes vers x si et seulement si les suites (x n i) n∈N convergent vers x i dans E i pour tout i ∈ [1, d].<br />

1.2 Espaces de Banach<br />

Rappellons que dans un espace métrique (E, d), une suite (x n ) est dite de Cauchy si<br />

ce qui équivaut à<br />

lim d(x n, x m ) = 0,<br />

(m,n)→∞<br />

pour tout ε > 0, il existe n 0 tel que pour tout m, n ≥ n 0 , d(x n , x m ) ≤ ε.<br />

L’espace métrique (E, d) est dit complet si toute suite de Cauchy est convergente.<br />

Définition 1.2.1 Un espace de Banach est un espace normé (E, ‖ · ‖) complet pour la distance<br />

associée à la norme ‖ · ‖.<br />

Exemple 1.2.1<br />

a) Considérons R d muni de l’une des normes ‖ · ‖ 1 , ‖ · ‖ 2 , ‖ · ‖ ∞ de la définition 1.1.2. On a,<br />

pour tout x ∈ R d ,<br />

‖x‖ 2 ≤ ‖x‖ 1 ≤ n‖x‖ ∞ et ‖x‖ ∞ ≤ ‖x‖ 2 .<br />

Ces inégalités montrent que les suites convergentes sont les mêmes pour ces trois normes et qu’une<br />

suite converge si et seulement si les d suites de ses composantes convergent au sens usuel de R<br />

vers des limites qui sont alors les composantes de la limite. L’espace R d est alors de Banach pour<br />

ces trois normes (il est en fait complet pour toute norme comme on le verra dans la suite de ce<br />

chapitre).<br />

b) Plus généralement un produit fini d’espaces de Banach est de Banach pour les normes de la<br />

définition 1.1.2.<br />

c) Soit p un élément de R tel que 1 ≤ p ≤ ∞, on définit<br />

l p = {(x n ) n∈N ∗ ⊂ R : ‖x‖ p < +∞}<br />

5


où<br />

( ∑ ∞ ) 1/p<br />

‖x‖ p = |x n | p si 1 ≤ p < +∞,<br />

n=1<br />

‖x‖ ∞ = sup |x n | si p = +∞.<br />

n≥1<br />

Pour montrer que ‖ · ‖ p est une norme sur l p pour 1 ≤ p < +∞, il faut faire appel aux inégalités<br />

de Hölder et de Minkowski, le cas p = +∞ étant plus simple (voir T.D.). Montrons que l p est<br />

complet pour la norme ‖ · ‖ p . Remarquons que si (x n ) n∈N ∗ est une suite dans l p , chaque terme x n<br />

est une suite de nombres réels dont les termes sont notés (x n i ) i∈N ∗. On a donc un tableau infini à<br />

double entrée,<br />

x 1 1, · · · , x 1 i , · · ·<br />

.<br />

x n 1, · · · , x n i , · · ·<br />

.<br />

Traitons le cas où 1 ≤ p < +∞. Soit (x n ) n∈N ∗ une suite de Cauchy. Pour tout ε > 0, il existe<br />

n 0 ∈ N ∗ tel que, pour tout m, n ≥ n 0 , on ait<br />

∞∑<br />

|x n i − x m i | p ≤ ε p .<br />

i=1<br />

Pour tout i ∈ N ∗ on obtient donc que la suite (x n i ) n∈N ∗<br />

vers un réel x i . Pour tout N ∈ N ∗ , on a<br />

est de Cauchy dans R et converge donc<br />

N∑<br />

|x n i − x m i | p ≤<br />

i=1<br />

∞∑<br />

|x n i − x m i | p ≤ ε p .<br />

i=1<br />

En faisant tendre m vers +∞, il vient<br />

N∑<br />

|x n i − x i | p ≤ ε p (1.1)<br />

i=1<br />

ce qui implique que x n − x ∈ l p d’où x = x n − (x n − x) ∈ l p car l p est un espace vectoriel. Enfin,<br />

passant à la limite sur N dans l’inégalité 1.1, on obtient que pour tout n ≥ n 0 ,<br />

‖x n − x‖ p ≤ ε,<br />

d’où le résultat. Dans le cas p = +∞, la démonstration est analogue.<br />

d) On se donne un espace métrique (X, d), un espace normé (Y, ‖ · ‖) et on considère l’ensemble<br />

C b (X, Y ) des applications de X dans Y qui sont continues et bornées (i.e. sup x∈X ‖f(x)‖ <<br />

+∞). On munit C b (X, Y ) de la norme<br />

‖f‖ ∞ = sup ‖f(x)‖.<br />

x∈X<br />

6


Quand Y = R, on notera simplement C b (X, R) = C b (X). C’est un exercice facile de montrer que<br />

(C b (X, Y ), ‖·‖ ∞ ) est un espace de Banach quand c’est le cas pour (Y, ‖·‖). Dans le cas particulier<br />

où X = N et Y = R, on retrouve l’exemple c) en remarquant que C b (N) = l ∞ car toute fonction<br />

définie sur N est continue !<br />

e) L’ensemble C 1 ([0, 1]) des fonctions continuement dérivables sur [0, 1] est un espace de Banach<br />

muni de la norme<br />

‖f‖ C 1 = ‖f‖ ∞ + ‖f ′ ‖ ∞<br />

est un espace de Banach (le démontrer en exercice). Plus généralement il en est de même de<br />

l’ensemble C m ([0, 1]) des fonctions m fois continuement dérivables sur [0, 1] avec m ∈ N ∗ muni<br />

de la norme<br />

‖f‖ C m = ‖f‖ ∞ + ‖f ′ ‖ ∞ + · · · + ‖f (m) ‖ ∞ .<br />

f) L’espace C([0, 1]) des fonctions continues sur [0,1] à valeurs réelles muni de la norme<br />

‖f‖ 1 =<br />

n’est pas un espace de Banach (le démontrer).<br />

∫ 1<br />

0<br />

|f(t)| dt<br />

Définition 1.2.2 Soit (E, ‖ · ‖) un espace normé et (x n ) une suite dans E. On pose, pour tout<br />

n ∈ N, S n = ∑ n<br />

i=0 x i. On dit que la série de terme général (x n ) converge s’il en est de même de<br />

la suite (S n ) et on pose<br />

∞∑<br />

x i = lim S n .<br />

n→∞<br />

i=0<br />

On dit que la série de terme général (x n ) est normalement convergente si la série de terme général<br />

(‖x n ‖) est convergente.<br />

Théorème 1.2.1 Dans un espace de Banach (E, ‖ · ‖), toute série normalement convergente est<br />

convergente et<br />

∞∑ ∥ ∥∥ ∑ ∞<br />

∥ x n ≤ ‖x n ‖.<br />

Démonstration. Soit n > m, on a<br />

n=0<br />

n=0<br />

‖S n − S m ‖ = ‖x m+1 + · · · + x n ‖ ≤ T n − T m ,<br />

où T n = ∑ n<br />

i=0 ‖x i‖. La suite (T n ) étant convergente est de Cauchy. Il en est donc de même de<br />

(S n ) qui est donc convergente. Par ailleurs passant à la limite quand n → +∞ dans l’inégalité<br />

‖S n ‖ ≤ T n on obtient que ‖S‖ ≤ ‖T ‖, d’où le résultat.<br />

7


1.3 Applications linéaires continues<br />

Théorème 1.3.1 Soient (E, ‖·‖) et (F, ‖·‖) deux espaces normés et f : E → F une application<br />

linéaire. Les propriétés suivantes sont équivalentes<br />

i) f continue sur E,<br />

ii) f continue en 0,<br />

iii) il existe M ≥ 0 tel que pour tout x ∈ E, ‖f(x)‖ ≤ M‖x‖.<br />

Démonstration. Il est clair que i) ⇒ ii) et que iii) ⇒ i) car, pour tout x, y ∈ X,<br />

‖f(x) − f(y)‖ = ‖f(x − y)‖ ≤ M‖x − y‖.<br />

Il reste à montrer que ii) ⇒ iii). De part la continuité de f en 0, il existe η > 0 tel que, pour tout<br />

z ∈ ¯B(0, η),<br />

‖f(z)‖ = ‖f(z) − f(0)‖ ≤ 1.<br />

Soit alors x ∈ E\{0}. Remarquant que z :=<br />

η<br />

‖x‖ x ∈ ¯B(0, η), on obtient<br />

η<br />

‖f(x)‖ = ‖f(z)‖ ≤ 1,<br />

‖x‖<br />

d’où<br />

‖f(x)‖ ≤ (1/η)‖x‖.<br />

On notera L(E, F ) l’ensemble des applications linéaires continues de E dans F . Si F = R,<br />

on note E ∗ = L(E, R) et on dit que E ∗ est le dual topologique de E.<br />

Remarque 1.3.1 On peut montrer, en utilisant le Théorème de Hahn-Banach, que pour tout espace<br />

normé (E, ‖ · ‖), E ∗ = L(E, R) ≠ {0}. On peut aussi montrer qu’il existe des applications<br />

linéaires non continues.<br />

Définition 1.3.1 Pour tout f ∈ L(E, F ), on pose :<br />

‖f‖ = inf{M ≥ 0 : pour tout x ∈ E, ‖f(x)‖ ≤ M‖x‖}.<br />

Cette définition a bien un sens car l’ensemble de réels dont on considère la borne inférieure est<br />

non vide (Théorème 1.3.1) et minoré par 0.<br />

Proposition 1.3.1 La fonction ‖.‖ définie ci-dessus est une norme sur L(E, F ) et l’on a,<br />

‖f(x)‖<br />

‖f‖ = sup<br />

x≠0 ‖x‖<br />

= sup ‖f(x)‖ = sup ‖f(x)‖.<br />

‖x‖≤1<br />

‖x‖=1<br />

8


Démonstration. Soit M ≥ 0 tel que ‖f(x)‖ ≤ M‖x‖ pour tout x ∈ E. On a donc pour tout<br />

x ≠ 0,<br />

‖f(x)‖<br />

≤ M,<br />

‖x‖<br />

d’où<br />

Passant à la borne inférieure sur M, il vient<br />

Soit alors ε tel que 0 < ε < ‖f‖, on a<br />

Il existe donc z ≠ 0 tel que<br />

Il vient alors<br />

d’où<br />

‖f(x)‖<br />

sup<br />

x≠0 ‖x‖<br />

‖f(x)‖<br />

sup<br />

x≠0 ‖x‖<br />

≤ M.<br />

≤ ‖f‖.<br />

‖f‖ − ε ∉ {M ≥ 0 : pour tout x ∈ E, ‖f(x)‖ ≤ M‖x‖}.<br />

‖f(z)‖ > (‖f‖ − ε)‖z‖.<br />

‖f(x)‖<br />

sup<br />

x≠0 ‖x‖<br />

en faisant tendre ε vers 0. On a donc bien<br />

≥ ‖f(z)‖<br />

‖z‖<br />

‖f(x)‖<br />

sup<br />

x≠0 ‖x‖<br />

> ‖f‖ − ε,<br />

≥ ‖f‖<br />

‖f(x)‖<br />

‖f‖ = sup<br />

x≠0 ‖x‖ ,<br />

on a alors, notant que ‖f(x)‖<br />

‖x‖<br />

= f( x<br />

‖x‖ )<br />

Par ailleurs<br />

‖f(x)‖<br />

‖f‖ = sup<br />

x≠0 ‖x‖<br />

≤ sup ‖f(z)‖.<br />

‖z‖=1<br />

sup ‖f(x)‖ ≤ ‖f‖<br />

‖x‖≤1<br />

car ‖f(x)‖ ≤ ‖f‖‖x‖ pour tout x ∈ X. En résumé on a<br />

sup ‖f(x)‖ ≤ sup ‖f(x)‖ ≤ ‖f‖ ≤ sup ‖f(x)‖,<br />

‖x‖=1<br />

‖x‖≤1<br />

‖x‖=1<br />

d’où le résultat. Nous laissons alors au lecteur le soin de vérifier que la fonction ‖ · ‖ ainsi définie<br />

sur L(E, F ) est une norme.<br />

9


Remarque 1.3.2<br />

a) Pour montrer qu’une application linéaire est continue, il suffit donc de montrer qu’elle est<br />

bornée sur la boule unité de l’espace de départ.<br />

b) Ce qu’il faut retenir c’est que si une application linéaire de E dans F est telle qu’il existe<br />

M ≥ 0 telle que, pour tout x ∈ E,<br />

‖f(x)‖ ≤ M‖x‖,<br />

alors f est continue et ‖f‖ ≤ M. Notons également que pour tout f ∈ L(E, F ) et pour tout<br />

x ∈ E, on a<br />

‖f(x)‖ ≤ ‖f‖‖x‖,<br />

on en déduit aisément que, pour tout f ∈ L(E, F ), g ∈ L(F, G), on a<br />

En effet, pour tout x ∈ E avec ‖x‖ ≤ 1<br />

d’où<br />

‖g ◦ f‖ ≤ ‖g‖‖f‖. (1.2)<br />

‖g(f(x))‖ ≤ ‖g‖‖f(x)‖ ≤ ‖g‖‖f‖,<br />

‖g ◦ f‖ = sup ‖g(f(x))‖ ≤ ‖g‖‖f‖.<br />

‖x‖≤1<br />

L’inégalité 1.2 ne peut pas être remplacée par une égalité. En effet si f et g sont les projections<br />

orthogonales sur deux sous-espaces orthogonaux non réduits à {0} de R d , on a g ◦ f = 0 et<br />

‖f‖ = ‖g‖ = 1.<br />

Exemple 1.3.1<br />

a) Soit E = C([0, 1]) l’ensemble des fonctions continues définies sur [0, 1] muni de la norme<br />

‖f‖ ∞ = sup t∈[0,1] |f(t)|. L’application L : E −→ R définie par<br />

L(f) =<br />

∫ 1<br />

0<br />

f(t) dt<br />

est linéaire continue et ‖L‖ ≤ 1. En effet, pour tout f ∈ E<br />

|L(f)| ≤ ∣<br />

∫ 1<br />

0<br />

f(t) dt∣ ≤<br />

∫ 1<br />

0<br />

|f(t)| dt ≤<br />

∫ 1<br />

0<br />

‖f‖ ∞ dt ≤ ‖f‖ ∞ .<br />

b) Soit 1 < p < +∞ et soit l p défini dans l’exemple 1.2.1 b). Soit 1 < q < +∞ tel que<br />

1<br />

p + 1 q = 1. Soit y ∈ lq et L : l p −→ R définie pour tout x ∈ l p par<br />

L(x) =<br />

∞∑<br />

x n y n .<br />

n=1<br />

La série définissant L(x) est convergente, L est linéaire et<br />

|L(x)| ≤ ‖y‖ q ‖x‖ p<br />

10


ce qui montre que L est linéaire et ‖L‖ ≤ ‖y‖ q (voir T.D.).<br />

c) Soient E, F , G des espaces normés et soient f ∈ L(E, F ), g ∈ L(F, G). Pour tout x ∈ E<br />

on a<br />

‖g(f(x))‖ ≤ ‖g‖‖f(x)‖ ≤ ‖f‖‖g‖‖x‖.<br />

il en résulte que g ◦ f ∈ L(E, G) et<br />

De plus les applications<br />

et<br />

‖g ◦ f‖ ≤ ‖g‖‖f‖. (1.3)<br />

L : L(E, F ) −→ L(E, G)<br />

f ↦−→ f ◦ g<br />

M : L(F, G) −→ L(E, G)<br />

g ↦−→ f ◦ g<br />

sont linéaires. Elles sont aussi continues car pour tout f ∈ L(E, F ), g ∈ L(F, G) il découle de<br />

(1.3) que<br />

‖L(f)‖ ≤ ‖g‖‖f‖<br />

et<br />

‖M(g)‖ ≤ ‖f‖‖g‖.<br />

Théorème 1.3.2 Soient (E, ‖ · ‖) un espace normé et (F, ‖ · ‖) un espace de Banach. Alors<br />

L(E, F ) est un espace de Banach muni de la norme de la Définition 1.3.1.<br />

Démonstration. Soit (f n ) une suite de Cauchy dans L(E, F ). Pour tout ε > 0, il existe n 0 ∈ N<br />

tel que, pour tout m, n ≥ n 0 ,<br />

‖f n − f m ‖ = sup ‖f n (x) − f m (x)‖ ≤ ε, (1.4)<br />

‖x‖≤1<br />

Pour tout x ∈ B = B(0, 1), la suite (f n (x)) est de Cauchy, elle converge donc vers un élément<br />

noté ϕ(x). Il existe donc une application<br />

ϕ : B → F<br />

telle que la restriction f n |B converge uniformément vers ϕ. Posons, pour tout x ∈ X\{0}<br />

f(x) = ‖x‖ϕ(x/‖x‖) et f(0) = 0.<br />

Pour tout x ≠ 0, il vient<br />

f n (x) = ‖x‖f n (x/‖x‖),<br />

11


d’où<br />

lim f n(x) = ‖x‖ϕ(x/‖x‖) = f(x).<br />

n→∞<br />

Il est alors aisé de vérifier, en passant à la limite dans les égalités f n (λx) = λf n (x) et f n (x + y) =<br />

f n (x) + f n (y), que f est linéaire. Montrons que f est continue. En effet en prennant n = n 0 et en<br />

faisant tendre m vers l’infini dans (1.4) il vient<br />

d’où<br />

sup ‖f n0 (x) − f(x)‖ ≤ ε,<br />

‖x‖≤1<br />

sup ‖f(x)‖ ≤ ‖f n0 ‖ + ε,<br />

‖x‖≤1<br />

ce qui, compte tenu de la Remarque 1.3.2 a) montre la continuité de f. Enfin, revenant à 1.4, on a<br />

faisant tendre m vers l’infini,<br />

‖f n − f‖ = sup ‖f n (x) − f(x)‖ ≤ ε<br />

‖x‖≤1<br />

et ce, pour tout n ≥ n 0 , ce qui achève la démonstration.<br />

Définition 1.3.2 Soient E et F des espaces normés. On dit que f ∈ L(E, F ) est un isomorphisme<br />

si f est bijective et si f −1 ∈ L(F, E). On note alors Isom (E, F ) l’ensemble éventuellement vide<br />

des isomorphismes de E dans F .<br />

Remarque 1.3.3<br />

a) Si E est un espace de Banach et si F est isomorphe à E, alors F est un espace de Banach.<br />

En effet, il existe D > 0 telles que, pour tout y, y ′ ∈ F ,<br />

‖f −1 (y) − f −1 (y ′ )‖ ≤ D‖y − y ′ ‖.<br />

Il en résulte que si (y n ) est de Cauchy dans F alors (f −1 (y n )) est de Cauchy dans E et converge<br />

donc vers un élément x ∈ E, ce qui implique la convergence de (y n ) vers y = f(x).<br />

b) Il est clair que la composée de deux isomorphismes est un isomorphisme.<br />

c) Il existe des applications linéaires continues et bijectives qui ne sont pas des isomorphismes.<br />

Cependant on a le résultat positif suivant que nous démontrerons dans le chapitre 4.<br />

Théorème 1.3.3 Soient E et F des espaces de Banach et soit f ∈ L(E, F ) telle que f est bijective.<br />

Alors f est un isomorphisme.<br />

Définition 1.3.3 On dit que f ∈ L(E, F ) est une isométrie si pour tout x ∈ E<br />

‖f(x)‖ = ‖x‖.<br />

12


Exemple 1.3.2 Soit E un espace normé. Pour tout h ∈ E on définit l’application<br />

ϕ h :<br />

R −→ E<br />

t ↦−→ th<br />

On a ϕ h ∈ L(R, E) et l’application ϕ qui à h associe ϕ h est un isomorphisme et une isométrie de<br />

E dans L(R, E). En effet<br />

‖ϕ h ‖ = max(‖ϕ h (1)‖, ‖ϕ h (−1)‖) = ‖ϕ h (1)‖ = ‖h‖.<br />

L’isométrie réciproque ψ : L(R, E) → E est définie par<br />

ψ(f) = f(1) pour tout f ∈ L(R, E).<br />

Dans la suite, on identifiera L(R, E) et E par cette isométrie.<br />

Le résultat suivant a d’importantes applications.<br />

Théorème 1.3.4 Soient E, F des espaces de Banach, alors Isom (E, F ) est ouvert (éventuellement<br />

vide) dans L(E, F ) et l’application u ↦−→ u −1 est continue sur Isom (E, F ).<br />

Démonstration. Soit v ∈ L(E) tel que ‖v‖ < 1. La série de terme général (v n ) est alors normalement<br />

convergente car ‖v n ‖ ≤ ‖v‖ n . Posons S n = ∑ n<br />

k=0 vk , on a<br />

v ◦ S n = S n ◦ v = S n+1 − I<br />

où I désigne l’application identique de E dans E. Il résulte alors de la continuité des applications<br />

u ↦−→ u ◦ v et u ↦−→ v ◦ u (voir Exemple (1.3.1), c)) que S = ∑ ∞<br />

k=0 vk vérifie<br />

(I − v) ◦ S = S ◦ (I − v) = I,<br />

donc que I − v est bijective, c’est donc un isomorphisme d’après le Théorème 1.3.3. Soit alors<br />

u ∈ Isom (E, F ) et v ∈ L(E, F ). On a,<br />

v ∈ Isom(E, F ) → u −1 ◦ v ∈ Isom(E).<br />

Or u −1 ◦ v = I − w avec w = I − (u −1 ◦ v) = u −1 ◦ (u − v). On a,<br />

‖w‖ = ‖u −1 ◦ (u − v)‖ ≤ ‖u −1 ‖‖(u − v)‖.<br />

donc B(u, 1/‖u −1 ‖) ⊂ Isom (E, F ). Par ailleurs on a<br />

d’où<br />

On obtient alors<br />

‖v −1 − u −1 ‖ ≤<br />

v −1 = (u ◦ (I − w)) −1 = (I − w) −1 ◦ u −1 ,<br />

v −1 − u −1 = ((I − w) −1 − I) ◦ u −1 =<br />

∥<br />

∞∑ ∥<br />

w k ∥∥‖u −1 ‖ ≤<br />

k=1<br />

∞∑<br />

w k ◦ u −1 .<br />

k=1<br />

∞∑<br />

‖w k ‖‖u −1 ‖ ≤<br />

k=1<br />

Comme w tend vers 0 quand v tend vers u on a bien le résultat.<br />

‖w‖<br />

1 − ‖w‖ ‖u‖−1 .<br />

13


1.4 Normes équivalentes<br />

Définition 1.4.1 Soit E un espace vectoriel muni de deux normes ‖ · ‖ 1 et ‖ · ‖ 2 . On dit que ces<br />

deux normes sont équivalentes si elles définissent la même topologie (i.e. si les suites convergentes<br />

et leurs limites sont les mêmes). Ceci équivaut à la continuité des applications linéaires :<br />

Il en résulte immédiatement le<br />

I : (E, ‖ · ‖ 1 ) → (E, ‖ · ‖ 2 )<br />

I : (E, ‖ · ‖ 2 ) → (E, ‖ · ‖ 1 ).<br />

Théorème 1.4.1 Soient ‖ · ‖ 1 et ‖ · ‖ 2 deux normes sur un espace vectoriel E. Les propriétés<br />

suivantes sont équivalentes,<br />

i) ‖ · ‖ 1 et ‖ · ‖ 2 sont des normes équivalentes,<br />

ii) il existe a, b > 0 telles que, pour tout x ∈ E,<br />

‖x‖ 1 ≤ a‖x‖ 2 et ‖x‖ 2 ≤ b‖x‖ 1 .<br />

Démonstration. Elle résulte de la Définition 1.4.1 et du Théorème 1.3.2, remarquant que ii)<br />

équivaut à la continuité des applications linéaires<br />

I : (E, ‖ · ‖ 2 ) → (E, ‖ · ‖ 2 ) et I : (E, ‖ · ‖ 1 ) → (E, ‖ · ‖ 2 ).<br />

Dans le cas des espaces de dimension finie, on a<br />

Théorème 1.4.2 Toutes les normes sont équivalentes dans R d .<br />

Démonstration. Posons, pour tout x ∈ R d , ‖x‖ = ∑ d<br />

i=1 |x i| et considérons une norme ρ(.) sur<br />

R d . Pour tout i = 1, · · · , d définissons le vecteur e i = (0, · · · , 1, · · · , 0), dont toutes les composantes<br />

sont nulles sauf celle de rang i. Pour tout x, y ∈ R d on a<br />

( d∑ )<br />

ρ(x − y) = ρ (x i − y i )e i<br />

≤<br />

≤<br />

i=1<br />

d∑<br />

|x i − y i |ρ(e i )<br />

i=1<br />

M‖x − y‖,<br />

où M = sup 1≤i≤d ρ(e i ). La fonction ρ(.) est donc continue, elle atteint alors sa borne inférieure<br />

sur le compact S = {x ∈ R d : ‖x‖ = 1}. Il existe donc m > 0 tels que, pour tout x ≠ 0, on a<br />

m ≤ ρ(x/‖x‖),<br />

d’où m‖x‖ ≤ ρ(x) ≤ M‖x‖, ce qui montre que les normes ‖ · ‖ et ρ(.) sont équivalentes. Soient<br />

alors ρ 1 et ρ 2 deux normes sur R d . Comme ρ 1 est équivalente à ‖ · ‖ et que ‖ · ‖ est équivalente à<br />

ρ 2 , on obtient que ρ 1 est équivalente à ρ 2 (le vérifier).<br />

14


Corollaire 1.4.1<br />

i) R d est un espace de Banach pour toute norme.<br />

ii) Toute application linéaire de R d dans un espace normé (F, ‖ · ‖) est continue.<br />

Démonstration. i) Résulte du fait qu’un espace de Banach l’est encore quand on remplace sa<br />

norme par une norme équivalente, du Théorème 1.4.2 et du fait que R d est complet muni de l’une<br />

de ses normes usuelles (voir Exemple 1.2.1 a)).<br />

ii) Exercice facile.<br />

Remarque 1.4.1<br />

a) Soit (E, ‖ · ‖) un espace vectoriel de dimension d rapporté à une base (u 1 , · · · , u d ). L’application<br />

d∑<br />

ϕ(x 1 , · · · , x d ) = x i u i<br />

est bijective linéaire et continue (le démontrer) de R d dans E. La bijection réciproque ϕ −1 est aussi<br />

continue. En effet la fonction ‖ϕ(.)‖ qui est une norme sur R d est équivalente à la norme ‖ · ‖ ∞ .<br />

Il existe donc c > 0 tel que ‖ · ‖ ∞ ≤ c‖ϕ(.)‖, ce qui implique bien la continuité de ϕ −1 . Ainsi E<br />

est isomorphe à R d et le Théorème 1.4.2 ainsi que le Corollaire 1.4.1 sont vrais en remplaçant R d<br />

par un espace vectoriel E de dimension finie d.<br />

b) On peut montrer que la boule unité d’un espace normé de dimension infinie n’est jamais<br />

compacte (Théorème de F. Riesz).<br />

1.5 Applications multilinéaires continues<br />

Définition 1.5.1 Soient E 1 , · · · , E n , F des espaces vectoriels, on dit qu’une application<br />

i=1<br />

f : E 1 × · · · × E n −→ F<br />

est multilinéaire si, pour tout i ∈ [1, n], et pour tout a = (a 1 , · · · , a n ) ∈ E 1 × · · · × E n , les<br />

applications f i : E i → F définies par<br />

sont linéaires.<br />

f i (x) = f(a 1 , · · · , a i−1 , x, a i+1 , · · · , a n )<br />

Théorème 1.5.1 Soient E 1 , · · · E n , F des espaces normés et soit une application multilinéaire<br />

f : E 1 × · · · × E n −→ F . On munit l’espace vectoriel E 1 × · · · × E n d’une norme définissant<br />

la topologie produit (par exemple l’une des normes équivalentes de la Définition 1.1.2). Alors, les<br />

deux propriétés suivantes sont équivalentes.<br />

i) f est continue sur E 1 × · · · × E n ,<br />

ii) il existe M ≥ 0 telle que, pour tout x ∈ E 1 × · · · × E n , on a<br />

‖f(x)‖ ≤ M‖x 1 ‖ · · · ‖x n ‖.<br />

15


Démonstration. i) ⇒ ii). Comme f est continue en 0 et f(0) = 0, Il existe η > 0 tel que,<br />

‖x‖ = sup ‖x i ‖ ≤ η ⇒ ‖f(x)‖ ≤ 1.<br />

1≤i≤n<br />

Soit alors x ∈ (E 1 \{0}) × · · · × (E n \{0}). Posons y = η(x 1 /‖x 1 ‖, · · · ., x n /‖x n ‖), on a ‖y‖ ≤ η.<br />

Il en résulte ‖f(y)‖ ≤ 1, et donc<br />

‖f(x)‖ ≤ (1/η n )‖x 1 ‖ · · · .‖x n ‖.<br />

Enfin, si l’un des x i est nul l’inégalité ci-dessus est vérifiée avec 0 des deux côtés de l’inégalité.<br />

ii) ⇒ i). On procède par récurrence sur n. Soient x, h ∈ E 1 × · · · × E n . On a<br />

‖f(x + h) − f(x)‖ ≤ ‖f(x + h) − f(x + k)‖ + ‖f(x + k) − f(x)‖<br />

où k = (0, h 2 , · · · , h n ). On a alors<br />

‖f(x + h) − f(x + k)‖ ≤ M‖h 1 ‖(‖x 2 ‖ + ‖h 2 ‖) · · · (‖x n ‖ + ‖h n ‖)<br />

≤<br />

C‖h 1 ‖<br />

dès que ‖h‖ ≤ 1. Par ailleurs l’application g : E 2 × · · · × E n −→ F définie par<br />

est telle que g ∈ L(E 2 × · · · × E n , F ) et vérifie<br />

g(z 2 , · · · , z n ) = f(x 1 , z 2 , · · · , z n )<br />

‖g(z 2 , · · · , z n )‖ ≤ M ′ ‖z 2 ‖ · · · ‖z n ‖ avec M ′ = M‖x 1 ‖.<br />

De plus<br />

‖f(x + k) − f(x)‖ = ‖g(x 2 + h 2 , · · · , x n + h n ) − g(x 2 , · · · , x n )‖.<br />

On applique alors l’hypothèse de récurrence et on obtient l’existence de η > 0 tel que<br />

‖g(x 2 + h 2 , · · · , x n + h n ) − g(x 2 , · · · , x n )‖ ≤ ε/2<br />

pourvu que sup 2≤i≤n ‖h i ‖ ≤ η. Il en résulte que pour sup 1≤i≤n ‖h i ‖ ≤ max(η, ε/2C), on a<br />

‖f(x + h) − f(x)‖ ≤ C‖h 1 ‖ + ε/2 ≤ ε,<br />

ce qui démontre i).<br />

On note L(E 1 , · · · , E n ; F ) l’ensemble des applications multilinéaires continues de<br />

E 1 × · · · × E n dans F . Si E 1 = · · · = E n = E, on note L(E 1 , · · · , E n ; F ) = L n (E; F ). Nous<br />

laissons au lecteur le soin de démontrer que pour tout choix d’une norme sur E 1 × · · · × E n<br />

‖f‖ = sup ‖f(x)‖<br />

‖x‖≤1<br />

16


est une norme sur L(E 1 , · · · , E n , F ), que<br />

‖f‖ = inf{M ∈ R + : pour tout x ∈ E 2 × · · · × E n , ‖f(x)‖ ≤ M‖x 1 ‖ · · · ‖x n ‖},<br />

et que si F est de Banach, l’espace L(E 1 , · · · , E n ; F ) est un espace de Banach muni de cette norme<br />

(s’inspirer de la démonstration du Théorème 1.3.2). Enfin le lecteur démontrera que si E 1 , · · · , E n<br />

sont de dimension finie toute application multilinéaire définie sur E 1 × · · · × E n est continue.<br />

Le résultat suivant est fondamental pour l’étude des différentielles d’ordre supérieur.<br />

Théorème 1.5.2 L’application<br />

Φ : L m (E; L n (E; F )) → L n+m (E; F )<br />

définie pour g ∈ L m (E; L n (E; F )) et (x 1 , · · · , x n+m ) ∈ E n+m par<br />

Φ(g)(x 1 , · · · , x n+1 ) = g(x 1 , · · · , x m )(x 2 , · · · , x n+1 )<br />

est une isométrie de L m (E; L n (E; F )) dans L n+m (E; F ) et l’isométrie réciproque<br />

Ψ : L n+m (E; F ) → L m (E; L n (E; F ))<br />

est définie, pour tout f ∈ L n+m (E; F ), (z 1 , · · · , z m ) ∈ E m et (x 1 , · · · , x n ) ∈ E n par<br />

(Ψ(f)(z 1 , · · · , z m ))(x 1 , · · · , x n ) = f(z 1 , · · · , z m , x 1 , · · · , x n ).<br />

Démonstration. On a<br />

‖Φ(g)(x 1 , · · · , x n+m )‖ ≤ ‖g(x 1 , · · · , x m )‖ L n (E;F )‖x m+1 ‖ · · · ‖x n+1 ‖<br />

≤ ‖g‖ L m (E;L n (E;F ))‖x 1 ‖ · · · ‖x m ‖ · ‖x 2 ‖ · · · ‖x n+1 ‖<br />

ce qui montre que Φ(g) ∈ L n+m (E; F ) et<br />

‖Φ(g)‖ L n+m (E;F ) ≤ ‖g‖ L m (E;L n (E;F )). (1.5)<br />

Par ailleurs, pour tout (z 1 , · · · , z m ) ∈ E m ,<br />

‖Ψ(f)(z 1 · · · , z m )(x 1 , · · · , x n )‖ ≤ ‖f‖ L n+m (E;F )‖z 1 ‖ · · · ‖z m ‖ · ‖x 1 ‖ · · · ‖x n ‖<br />

ce qui montre que Ψ(f) ∈ L m (E; L n (E; F )) et<br />

‖Ψ(f)(z 1 , · · · , z m )‖ L n (E;F ) ≤ ‖f‖ L n+1 (E;F )‖z 1 ‖ · · · ‖z m ‖<br />

d’où<br />

‖Ψ(f)‖ L m (E;L n (E;F )) ≤ ‖f‖ L n+m (E;F ). (1.6)<br />

Les applications Φ et Ψ sont donc linéaires continues. Il est clair qu’elles sont aussi réciproques<br />

l’une de l’autre. On a alors pour tout f ∈ L n+m (E; F ), g ∈ L m (E; L n (E; F ))<br />

‖f‖ L n+m (E;F ) = ‖(Φ ◦ Ψ)(f)‖ L n+m (E;F ) = ‖Φ(Ψ(f))‖ L n+m (E;F ) ≤ ‖Ψ(f)‖ L m (E;L n (E;F ))<br />

17


et<br />

‖g‖ L m (E;L n (E;F )) = ‖(Ψ ◦ Φ)(g)‖ L m (E;L n (E;F )) = ‖Ψ(Φ(g))‖ L m (E;L n (E;F )) ≤ ‖Φ(g)‖ L n+m (E;F ),<br />

ce qui combiné à (1.5) et (1.6) montre que<br />

‖Φ(g)‖ L n+m (E;F ) = ‖g‖ L m (E;L n (E;F ))<br />

et<br />

On a donc bien le résultat.<br />

‖Ψ(f)‖ L m (E;L n (E;F )) = ‖f‖ L n+m (E;F ).<br />

1.6 Espaces de Hilbert<br />

Définition 1.6.1 Un produit scalaire 〈., .〉 sur un espace vectoriel E est une fonction de E × E<br />

dans R qui est bilinéaire symétrique (〈x, y〉 = 〈y, x〉 pour tout x, y ∈ E) non dégénérée positive<br />

(〈x, x〉 ≥ 0 pour tout x ∈ E et 〈x, x〉 = 0 implique x = 0), E muni du produit scalaire 〈., .〉 est<br />

dit alors préhilbertien.<br />

Exemple 1.6.1<br />

a) Pour tout x, y ∈ R d on pose<br />

On définit ainsi un produit scalaire.<br />

〈x, y〉 = x 1 y 1 + · · · + x d y d .<br />

b) Soit l 2 défini dans l’exemple 1.2.1, c). Pour x, y ∈ l 2 , on a, pour tout N ∈ N,<br />

N∑<br />

|x n y n | ≤<br />

n=1<br />

≤<br />

( ∑ N ) 1 ( ∑ N )<br />

|x n | 2 2 1/2<br />

|y n | 2<br />

n=1<br />

n=1<br />

( ∑ ∞ ) 1 ( ∑ ∞ )<br />

|x n | 2 2 1/2.<br />

|y n | 2<br />

n=1<br />

Il en résulte que ∑ ∞<br />

n=1 |x ny n | < ∞. On pose alors<br />

On définit ainsi un produit scalaire.<br />

〈x, y〉 =<br />

∞∑<br />

x n y n .<br />

n=1<br />

c) Soit E = C([0, 1]) l’ensemble des fonctions continues définies sur l’intervalle [0, 1]. Pour<br />

tout f, g ∈ E posons<br />

On définit ainsi un produit scalaire.<br />

〈f, g〉 =<br />

∫ 1<br />

0<br />

18<br />

n=1<br />

f(t)g(t) dt.


Théorème 1.6.1 INÉGALITÉ <strong>DE</strong> CAUCHY-SCHWARZ<br />

Soit (E, 〈., .〉) un espace préhilbertien. Alors pour tout x, y ∈ E,<br />

|〈x, y〉| 2 ≤ 〈x, x〉〈y, y〉<br />

avec égalité si et seulement si x et y sont colinéaires.<br />

Démonstration. On peut supposer que 〈y, y〉 > 0. Soit λ ∈ R, on a<br />

〈x + λy, x + λy〉 ≥ 0<br />

d’où<br />

λ 2 〈y, y〉 + 2λ〈x, y〉 + 〈x, x〉 ≥ 0.<br />

Le discriminant du trinôme du second degré est donc négatif ou nul, ce qui donne l’inégalité<br />

annoncée. Par ailleurs il est clair que l’inégalité est une égalité si y = µx. Réciproquement si x<br />

et y sont non colinéaires alors x + λy ≠ 0 pour tout λ ∈ R ce qui montre que le trinôme n’a<br />

pas de racine réelle. Il en résulte que son discriminant est strictement négatif, d’où |〈x, y〉| 2 <<br />

〈x, x〉〈y, y〉.<br />

Proposition 1.6.1 Soit (E, 〈., .〉) un espace préhilbertien. On définit alors une norme sur E en<br />

posant pour tout x ∈ E<br />

‖x‖ = 〈x, x〉 1/2 .<br />

Démonstration. La seule vérification non évidente est celle de l’inégalité triangulaire. Soient<br />

x, y ∈ E, on a, utilisant l’inégalité de Cauchy-Schwarz<br />

On a donc bien ‖x + y‖ ≤ ‖x‖ + ‖y‖.<br />

‖x + y‖ 2 = ‖x‖ 2 + ‖y‖ 2 + 2〈x, y〉<br />

≤<br />

‖x‖ 2 + ‖y‖ 2 + 2‖x‖‖y‖<br />

≤ (‖x‖ + ‖y‖) 2 .<br />

Remarque 1.6.1<br />

a) Théorème de Pythagore. Soit (E, 〈., .〉) un espace préhilbertien et soient x, y ∈ E tels que<br />

〈x, y〉 = 0. Alors<br />

‖x + y‖ 2 = ‖x‖ 2 + ‖y‖ 2 .<br />

En effet<br />

‖x + y‖ 2 = 〈x + y, x + y〉<br />

= 〈x, x〉 + 2〈x, y〉 + 〈y, y〉<br />

= 〈x, x〉 + 〈y, y〉<br />

= ‖x‖ 2 + ‖y‖ 2 .<br />

19


) Soit (E, 〈., .〉) un espace préhilbertien et soit a ∈ E. Définissons L a : E −→ R par<br />

L a (x) = 〈a, x〉<br />

pour tout x ∈ E. Utilisant l’inégalité de Cauchy-Schwarz, on a<br />

|L a (x)| ≤ ‖a‖‖x‖<br />

ce qui montre que l’application linéaire L a est continue et que ‖L a ‖ ≤ ‖a‖. De plus |L a (a)| =<br />

‖a‖ 2 donc ‖L a ‖ ≥ ‖a‖ ce qui montre que ‖L a ‖ = ‖a‖.<br />

Définition 1.6.2 Un espace de Hilbert est un espace préhilbertien (H, 〈., .〉) qui est complet pour<br />

la norme définie dans la Proposition 1.6.1.<br />

Exemple 1.6.2<br />

a) L’espace Euclidien R d muni du produit scalaire usuel (exemple 1.6.1, a)) est un espace de<br />

Hilbert.<br />

b) Soit l 2 défini dans l’exemple 1.2.1, c) muni du produit scalaire<br />

〈x, y〉 =<br />

∞∑<br />

x n y n .<br />

(exemple 1.6.1, b)). Alors l 2 est un espace de Hilbert pour ce produit scalaire.<br />

n=1<br />

c) L’espace E = C([0, 1]) muni du produit scalaire<br />

n’est pas un espace de Hilbert.<br />

〈f, g〉 =<br />

∫ 1<br />

0<br />

f(t)g(t) dt.<br />

Définition 1.6.3 Soit (E, d) un espace métrique, a ∈ E et soit B une partie non vide de E. La<br />

distance de a à la partie B est<br />

d(a, B) = inf{d(a, b) : b ∈ B}.<br />

On dit que b ∈ B est une projection de a sur B si<br />

d(a, b) = d(a, B).<br />

En général la projection n’existe pas et, s’il en existe, il peut en exister plusieurs.<br />

Définition 1.6.4 Une partie C d’un espace vectoriel E est dite convexe si, pour tout x, y ∈ C et<br />

pour tout λ ∈ [0, 1]<br />

λx + (1 − λ)y ∈ C.<br />

Dans le cas d’un espace préhilbertien il y a existence et unicité de la projection sur une partie<br />

convexe complète comme le montre le résultat fondamental suivant.<br />

20


Théorème 1.6.2 PROJECTION SUR UN CONVEXE COMPLET<br />

Soit C une partie convexe et complète d’un espace préhilbertien (E, 〈., .〉). Alors, pour tout<br />

x ∈ E, il existe y ∈ C unique tel que<br />

‖x − y‖ = d(x, C).<br />

Le vecteur p C (x) = y ∈ C est alors caractérisé par<br />

pour tout z ∈ C.<br />

〈x − p C (x), z − p C (x)〉 ≤ 0<br />

Démonstration. Remarquons que d(x, C) = d(0, C − x). Comme C − x est aussi convexe complet,<br />

on peut supposer que x = 0. Soit y n ∈ C tel que<br />

Pour tout x, z ∈ E, on a<br />

d’où<br />

On obtient alors<br />

‖y n ‖ ≤ d(0, C) + 1 n .<br />

‖x − z‖ 2 + ‖x + z‖ 2 = 2‖x‖ 2 + 2‖z‖ 2 ,<br />

‖x − z‖ 2 = 2‖x‖ 2 + 2‖z‖ 2 − 4∥ x + z<br />

∥ 2 .<br />

2<br />

‖y m − y n ‖ 2 = 2‖y m ‖ 2 + 2‖y n ‖ 2 − 4∥ y m + y n<br />

∥ 2 .<br />

2<br />

Comme C est convexe, on a y m + y n<br />

∈ C donc<br />

2<br />

d(0, C) ≤ ∥ y m + y n ∥<br />

∥.<br />

2<br />

Il en résulte que<br />

‖y m − y n ‖ 2 ≤ 2‖y m ‖ 2 + 2‖y n ‖ 2 − 4d 2 (0, C)<br />

≤ 4d(0, C)(1/m + 1/n) + 2/m 2 + 2/n 2 .<br />

La suite (y n ) est donc de Cauchy dans C qui est complet, elle converge donc vers un certain y ∈ C<br />

(C est fermé car C est complet). Passant à la limite dans l’inégalité ‖y n ‖ ≤ d(0, C) + 1/n, il vient<br />

‖y‖ ≤ d(0, C) et donc ‖y‖ = d(0, C) car ‖y‖ ≥ d(0, C). Montrons l’unicité de y. Si y 1 et y 2 sont<br />

solutions, on a<br />

‖y 1 − y 2 ‖ 2 ≤ 2‖y 1 ‖ 2 + 2‖y 2 ‖ 2 − 4d 2 (0, C) = 0<br />

donc y 1 = y 2 . Enfin, revenant au cas général, p C (x) est caractérisé par<br />

‖x − p C (x)‖ 2 ≤ ‖x − z‖ 2 pour tout z ∈ C.<br />

21


Soit y ∈ C et t ∈ [0, 1], on a z = p C (x) + t(y − p C (x)) ∈ C par convexité, d’où<br />

soit<br />

‖x − p C (x)‖ 2 ≤ ‖x − p C (x) − t(y − p C (x))‖ 2<br />

0 ≤ −2t〈x − p C (x), y − p C (x)〉 + t 2 ‖y − p C (x)‖ 2 .<br />

Divisant par t et faisant tendre t vers 0 on a bien<br />

〈x − p C (x), y − p C (x)〉 ≤ 0<br />

pour tout y ∈ C. Réciproquement, supposant que z ∈ C est tel que 〈x − z, y − z〉 ≤ 0 pour tout<br />

y ∈ C, il vient<br />

‖x − y‖ 2 = ‖x − z‖ 2 + ‖z − y‖ 2 − 〈x − z, y − z〉<br />

d’où<br />

pour tout y ∈ C, et donc z = p C (x).<br />

‖x − y‖ 2 ≥ ‖x − z‖ 2<br />

Proposition 1.6.2 Soit C une partie convexe et complète d’un espace préhilbertien (E, 〈., .〉).<br />

Alors, pour tout x 1 , x 2 ∈ E<br />

‖p C (x 1 ) − p C (x 1 )‖ ≤ ‖x 1 − x 2 ‖.<br />

Démonstration. Posons y 1 = p C (x 1 ) et y 2 = p C (x 2 ). On a<br />

〈x 1 − y 1 , y 2 − y 1 〉 ≤ 0 (1.7)<br />

et<br />

On a alors<br />

〈x 2 − y 2 , y 1 − y 2 〉 ≤ 0. (1.8)<br />

〈x 1 − x 2 , y 1 − y 2 〉 = 〈x 1 − y 1 , y 1 − y 2 〉 + 〈y 1 − y 2 , y 1 − y 2 〉 + 〈y 2 − x 2 , y 1 − y 2 〉.<br />

D’après (1.7) et (1.8), le premier et le troisième terme de l’inégalité précédente sont positifs ou<br />

nuls. Il en résulte que<br />

On a alors<br />

d’où<br />

ce qui achève la démonstration.<br />

〈x 1 − x 2 , y 1 − y 2 〉 ≥ 〈y 1 − y 2 , y 1 − y 2 〉 = ‖y 1 − y 2 ‖ 2 .<br />

‖x 1 − x 2 ‖‖y 1 − y 2 ‖ ≥ 〈x 1 − x 2 , y 1 − y 2 〉 ≥ ‖y 1 − y 2 ‖ 2<br />

‖y 1 − y 2 ‖ ≤ ‖x 1 − x 2 ‖<br />

22


Définition 1.6.5 Soit (E, 〈., .〉) un espace préhilbertien et soient x, y ∈ E. On dit que x est<br />

orthogonal à y et on note x ⊥ y si 〈x, y〉 = 0. Étant donné F ⊂ E, on note<br />

Remarque 1.6.2 Remarquons que<br />

F ⊥ = {y ∈ E : 〈x, y〉 = 0, pour tout x ∈ F }.<br />

F ⊥ = ∩ x∈F Ker 〈x, .〉<br />

et que 〈x, .〉 est linéaire continue (voir Remarque (1.6.1), b)). On obtient alors que F ⊥ est fermé<br />

comme intersection de fermés.<br />

Dans le cas où C est un sous-espace vectoriel le Théorème 1.6.2 prend la forme suivante<br />

Théorème 1.6.3 PROJECTION SUR UN SOUS-ESPACE VECTORIEL COMPLET<br />

Soit F un sous-espace vectoriel complet d’un espace préhilbertien (E, 〈., .〉). Alors<br />

et<br />

E = F ⊕ F ⊥<br />

p F ∈ L(E).<br />

Pour tout x ∈ E, p F (x) est l’unique vecteur de F tel que<br />

〈x − p F (x), y〉 = 0 pour tout y ∈ F.<br />

De plus,<br />

pour tout x ∈ E.<br />

‖p F (x)‖ ≤ ‖x‖<br />

Démonstration. D’après le Théorème 1.6.2 p F (x) est l’unique vecteur de F tel que<br />

〈x − p F (x), y − p F (x)〉 ≤ 0 pour tout y ∈ F.<br />

Pour tout z ∈ F on a p F (x) + z ∈ F d’où<br />

〈x − p F (x), z〉 ≤ 0 pour tout z ∈ F<br />

ce qui implique, changeant z en −z que<br />

〈x − p F (x), z〉 = 0 pour tout z ∈ F<br />

donc x − p F (x) ∈ F ⊥ . Tout vecteur x ∈ E s’écrit alors<br />

x = p F (x) + x − p F (x)<br />

où<br />

p F (x) ∈ F et x − p F (x) ∈ F ⊥ .<br />

23


Comme F ∩ F ⊥ = {0}, on a bien E = F ⊕ F ⊥ . De plus p F (.) est la projection algébrique<br />

sur F parallèlement à F ⊥ , c’est donc une application linéaire. Remarquons alors que, d’après le<br />

Théorème de Pythagore<br />

‖x‖ 2 = ‖x − p F (x)‖ 2 + ‖p F (x)‖ 2 ≥ ‖p F (x)‖ 2 ,<br />

ce qui montre que ‖p F (x)‖ ≤ ‖x‖ pour tout x ∈ E et que p F est continue.<br />

Voici un résultat très utile dans la pratique.<br />

Corollaire 1.6.1<br />

Soit F un sous-espace vectoriel fermé d’un espace de Hilbert (H, 〈., .〉). Alors<br />

a) F ⊥⊥ = F .<br />

b) F = H ⇐⇒ F ⊥ = {0}.<br />

Démonstration. a) Observons que F ⊂ F ⊥⊥ et que F ⊥ est un sous-espace vectoriel fermé de<br />

E (F ⊥ = ⋂ x∈F<br />

ker 〈x, .〉 et ker 〈x, .〉 est fermé comme noyau d’une forme linéaire continue<br />

(Remarque 1.6.1, b))). Les sous-espaces vectoriels F et F ⊥ sont donc complets ce qui permet<br />

d’appliquer le Théorème 1.6.3. On a alors<br />

donc F = F ⊥⊥ .<br />

F ⊂ F ⊥⊥<br />

E = F ⊕ F ⊥<br />

E = F ⊥⊥ ⊕ F ⊥<br />

b) Si F = H il est clair que F ⊥ = {0}. Réciproquement si F ⊥ = {0} on a H = F ⊕ {0}<br />

donc F = H.<br />

Définition 1.6.6 On dit qu’une famille de vecteurs (e i ) i∈I est orthogonale si<br />

〈e i , e j 〉 = 0 pour tout i, j ∈ I, i ≠ j.<br />

On dit que la famille orthogonale (e i ) i∈I est orthonormée si<br />

‖e i ‖ = 1 pour tout i ∈ I.<br />

Le résultat suivant dont la démonstration élémentaire est laissée au lecteur est d’une grande importance<br />

pratique.<br />

Proposition 1.6.3 Soit (e 1 , · · · , e n ) une famille orthononormée d’un espace préhilbertien (E, 〈., .〉),<br />

soit n ∈ N ∗ et λ 1 , · · · , λ n ∈ R. Posons x = ∑ n<br />

i=1 λ ie i , alors<br />

et<br />

λ i = 〈x, e i 〉 pour tout i ∈ [1, n],<br />

‖x‖ 2 =<br />

n∑<br />

|λ i | 2 .<br />

i=1<br />

24


Théorème 1.6.4 Soit (E, 〈., .〉) un espace préhilbertien et soit (e 1 , · · · , e n ) une famille orthonormée.<br />

On pose<br />

E n = [e 1 , · · · , e n ]<br />

(sous-espace vectoriel engendré par e 1 , · · · , e n ). Alors pour tout x ∈ E,<br />

a) p En (x) = ∑ n<br />

i=1 〈x, e i〉e i ,<br />

b) ‖x‖ 2 − d 2 (x, E n ) = ∑ n<br />

i=1 |〈x, e i〉| 2 .<br />

Démonstration. Remarquons qu’un sous-espace vectoriel de dimension finie est complet (voir<br />

Remarque 1.4.1). On peut donc appliquer le Théorème 1.6.3. On sait que p En (x) est caractérisé<br />

par<br />

〈x − p En (x), e i 〉 = 0 pour tout i ∈ [1, n].<br />

Il en résulte que<br />

De plus, on a<br />

et<br />

p En (x) =<br />

n∑<br />

〈p En (x), e i 〉e i =<br />

i=1<br />

D’après le Théorème de Pythagore, il vient<br />

n∑<br />

〈x, e i 〉e i .<br />

i=1<br />

x = x − p En (x) + p En (x)<br />

(x − p En (x)) ⊥ p En (x).<br />

‖x‖ 2 − ‖x − p En (x)‖ 2 = ‖p En (x)‖ 2 ,<br />

ce qui montre bien que<br />

‖x‖ 2 − d 2 (x, E n ) =<br />

n∑<br />

|〈x, e i 〉| 2 .<br />

i=1<br />

Théorème 1.6.5 INÉGALITÉ <strong>DE</strong> PARSEVAL-BESSEL<br />

Soit (E, 〈., .〉) un espace préhilbertien et (e i ) i∈N ∗ une famille orthonormée. Alors pour tout<br />

x ∈ E, la série de terme général (|〈x, e i 〉| 2 ) converge et<br />

∞∑<br />

|〈x, e i 〉| 2 ≤ ‖x‖ 2 .<br />

i=1<br />

Démonstration. Pour tout n ∈ N ∗ , on a ‖p En (x)‖ 2 ≤ ‖x‖ 2 et, d’après le Théorème 1.6.4 et la<br />

Proposition 1.6.3 on a<br />

n∑<br />

‖p En (x)‖ 2 = |〈x, e i 〉| 2 ,<br />

d’où le résultat.<br />

i=1<br />

25


Définition 1.6.7 Soit (e n ) n∈N ∗ une famille de vecteurs d’un espace normé (E, ‖ · ‖). On dit que<br />

cette famille est totale si<br />

∞⋃<br />

E = F n ,<br />

n=1<br />

où F n = [e 1 , · · · , e n ]. Autrement dit, si pour tout x ∈ X et pour tout ε > 0, il existe n ≥ 1 et<br />

x n ∈ F n tel que ‖x − x n ‖ ≤ ε. De façon équivalente la famille (e n ) n∈N ∗ est totale si et seulement<br />

si pour tout x ∈ E, on a lim n→∞ d(x, E n ) = 0 (le démontrer).<br />

Proposition 1.6.4 Soit (H, 〈., .〉) un espace de Hilbert. Alors la famille (e n ) n∈N ∗ est totale si et<br />

seulement si<br />

{e n : n ∈ N ∗ } ⊥ = 0.<br />

Démonstration. On a<br />

( ⋃ ∞ ) ⊥<br />

{e n : n ∈ N ∗ } ⊥ = F n .<br />

n=1<br />

En effet il est clair que<br />

( ⋃ ∞ ) ⊥<br />

{e n : n ∈ N ∗ } ⊥ = F n ,<br />

et l’orthogonal d’un sous espace vectoriel est égal à celui de son adhérence (le vérifier). On a donc<br />

∞⋃<br />

F n = H<br />

n=1<br />

n=1<br />

si et seulement si<br />

d’où le résultat.<br />

( ⋃ ∞ ) ⊥<br />

F n = {0},<br />

n=1<br />

On a alors une caractérisation simple des familles totales.<br />

Proposition 1.6.5 Soit (H, 〈., .〉) un espace de Hilbert et (e i ) i∈N ∗ une famille orthonormée. Alors<br />

les propriétés suivantes sont équivalentes,<br />

i) la famille (e i ) i∈N ∗ est totale,<br />

ii) pour tout x ∈ H, ‖x‖ 2 = ∑ ∞<br />

i=1 |〈x, e i〉| 2 ,<br />

iii) pour tout x ∈ H, x = ∑ ∞<br />

i=1 〈x, e i〉e i .<br />

26


Démonstration. i) ⇒ ii). Étant donné ε > 0, il existe n ∈ N ∗ et des réels λ 1 , · · · , λ n tels que<br />

∥<br />

n∑ ∥ ∥∥<br />

∥x − λ i e i ≤ ε.<br />

On a alors<br />

‖x‖ 2 −<br />

i=1<br />

i=1<br />

n∑<br />

|〈x, e i 〉| 2 = ‖x − p En (x)‖ 2 ∥<br />

≤ ∥x −<br />

n∑ ∥ ∥∥<br />

2<br />

λ i e i ≤ ε 2 ,<br />

d’où ‖x‖ 2 ≤ ∑ ∞<br />

i=1 |〈x, e i〉| 2 + ε 2 ce qui implique bien ii) en faisant tendre ε vers 0.<br />

ii) ⇒ iii). On a x = (x − p En (x)) + p En (x) et x − p En (x) et p En (x) sont orthogonaux. On<br />

obtient donc<br />

‖x‖ 2 − ‖p En (x)‖ 2 = ‖x − p En (x)‖ 2 = d 2 (x, E n )<br />

soit utilisant le Théorème (1.6.4)<br />

‖x‖ 2 −<br />

i=1<br />

n∑<br />

|〈x, e i 〉| 2 = ‖x − p En (x)‖ 2 ,<br />

i=1<br />

il en résulte que lim n→∞ p En (x) = x d’où le résultat car p En (x) = ∑ n<br />

i=1 〈x, e i〉e i .<br />

iii) ⇒ i). Évident.<br />

Exemple 1.6.3 Soit dans l 2 la famille (e i ) i∈N ∗ définie par e i n = δ i,n . Pour x ∈ l 2 , on a 〈x, e i 〉 = x i ,<br />

la famille (e i ) i∈N ∗ est donc totale dans l 2 d’après la Proposition 1.6.5, ii).<br />

Soit alors (H, 〈., .〉) un espace de Hilbert et a ∈ H. L’application l a : H → R définie par<br />

l a = 〈a, .〉 est linéaire et on a<br />

|〈a, x〉| ≤ ‖a‖‖x‖<br />

Il en résulte que l a est continue : l a ∈ H ∗ . Le résultat suivant montre que tous les éléments de H ∗<br />

sont représentables de cette manière.<br />

Théorème 1.6.6 Soit (H, 〈., .〉 un espace de Hilbert. Alors l’application<br />

l<br />

: H −→ H ∗<br />

est une isométrie surjective de H dans H ∗ .<br />

x ↦−→ l x<br />

Démonstration. Il est clair que l est linéaire. Soit ϕ ∈ H ∗ , si ϕ = 0 on a ϕ = l 0 . On peut donc<br />

supposer que ϕ ≠ 0. Le noyau F = ker ϕ est donc un hyperplan fermé de H. Il existe alors<br />

b ∈ F ⊥ tel que b ∉ F car dans le cas contraire on aurait F ⊥ ⊂ F et donc H = F ⊕ F ⊥ ⊂ F<br />

ce qui impliquerait la contradiction F = H. Remarquons alors que F ⊥ = [b] car H = F ⊕ [b],<br />

H = F ⊕ F ⊥ et [b] ⊂ F ⊥ . Comme ker l b = ker ϕ, il existe un réel λ tel que ϕ = λl b = l a avec<br />

a = λb. L’application l est alors linéaire et bijective de H dans H ∗ . De plus ‖l a (x)‖ ≤ ‖a‖‖x‖<br />

pour tout x ∈ H et ‖l a (a)‖ = ‖a‖‖a‖, d’où ‖l a ‖ = ‖a‖.<br />

On identifiera le plus souvent H avec H ∗ par l’isométrie définie ci-dessus.<br />

27


Chapitre 2<br />

Applications différentiables dans les espaces<br />

normés<br />

2.1 Définition d’une application différentiable<br />

Dans toute la suite, E et F sont des espaces normés, U est un ouvert de E, f est une application<br />

de U dans F et a est un élément de U.<br />

Définition 2.1.1 On dit que l’application f : U −→ F est différentiable au point a ∈ U s’il existe<br />

ϕ ∈ L(E, F ) telle que pour tout ε > 0, il existe η > 0 tel que pour tout x ∈ B(a, η)<br />

On note alors Df(a) = ϕ.<br />

‖f(x) − f(a) − ϕ(x − a)‖ ≤ ε‖x − a‖.<br />

Remarque 2.1.1<br />

a) Pour simplifier l’écriture, on écrira souvent, h étant un vecteur de E, Df(a)h au lieu de<br />

Df(a)(h).<br />

b) La définition s’écrit de façon équivalente, posant R(x) = f(x) − f(a) − ϕ(x − a),<br />

où lim x→a<br />

R(x)<br />

‖x−a‖<br />

= 0. Cela s’écrit aussi<br />

f(x) = f(a) + ϕ(x − a) + R(x),<br />

f(x) = f(a) + ϕ(x − a) + ‖x − a‖ε(x),<br />

où<br />

Cela équivaut bien sûr à<br />

où<br />

lim ε(x) = 0.<br />

x→a<br />

f(a + h) = f(a) + ϕ(h) + ‖h‖δ(h)<br />

lim δ(h) = 0.<br />

h→0<br />

29


On note parfois o(‖h‖) une fonction α(h) définie au voisinage de 0 et à valeurs dans un espace<br />

vectoriel normé telle que lim h→0 ‖h‖ −1 α(h) = 0. La différentibilité en a s’écrit alors<br />

f(a + h) = f(a) + ϕ(h) + o(‖h‖).<br />

c) Si f est différentiable en a, alors f est continue en a. En effet<br />

f(x) − f(a) = ϕ(x − a) + R(x),<br />

d’où utilisant la continuité en a de ϕ et le fait que lim x→a R(x) = 0,<br />

lim(f(x) − f(a)) = 0.<br />

x→a<br />

d) Si f est différentiable en a, alors pour tout h ∈ E,<br />

f(a + th) − f(a)<br />

Df(a)(h) = lim<br />

. (2.1)<br />

t→0 t<br />

En effet, f(a + th) − f(a) = tDf(a)(h) + ‖th‖ε(th). Il en résulte que<br />

f(a + th) − f(a)<br />

t<br />

= Df(a)(h) + ‖h‖ε(th),<br />

d’où le résultat. On remarque que cette propriété montre que la différentielle Df(a), quand elle<br />

existe, est unique.<br />

e) On note également que l’application f est différentiable en a si et seulement si il existe<br />

ϕ ∈ L(E, F ) telle que<br />

(f(x) − f(a) − ϕ(x − a))<br />

lim<br />

= 0,<br />

x ≠→a ‖x − a‖<br />

où x ≠→ a signifie x tend vers a et x ≠ a.<br />

f) Si f est différentiable en a et si une application g coincide avec f sur un voisinage de a,<br />

alors g est différentiable en a et Dg(a) = Df(a) (immédiat en utilisant (2.1)).<br />

g) La différentiabilité de f ne change pas quand on remplace les normes de E et F par des<br />

normes équivalentes (exercice facile).<br />

h) Si f : U −→ F est constante alors Df(x) = 0 pour tout x ∈ U, c’est immédiat.<br />

Définition 2.1.2 Soit f : I −→ E une fonction vectorielle définie sur un intervalle ouvert I de R.<br />

On dit que f est dérivable en t 0 ∈ I si la limite<br />

existe. On pose alors<br />

f(t) − f(t 0 )<br />

lim<br />

t→t 0 t − t 0<br />

f ′ (t 0 ) = df<br />

dt (t 0) = lim<br />

t→t0<br />

f(t) − f(t 0 )<br />

t − t 0<br />

.<br />

30


Théorème 2.1.1 Soit f : I −→ E une fonction vectorielle définie sur un intervalle ouvert I de<br />

R. Alors les deux propriétés suivantes sont équivalentes<br />

i) f est dérivable en t 0 ∈ I,<br />

ii) f est différentiable en t 0 ∈ I.<br />

De plus pour tout h ∈ R, on a<br />

Df(t 0 )(h) = h df<br />

dt (t 0),<br />

df<br />

dt (t 0) = Df(t 0 )(1).<br />

Démonstration. On sait (voir chap. 1, Exemple 1.3.2) que L(R, E) s’identifie à E quand on<br />

identifie ϕ ∈ L(R, E) avec le vecteur ϕ(1) et x ∈ E avec ϕ ∈ L(R, E) définie par ϕ(t) = tx.<br />

Remarquons que<br />

f(t) − f(t 0 )<br />

lim<br />

= x<br />

t→t 0 t − t 0<br />

équivaut à<br />

avec lim<br />

h→0<br />

ε(h) = 0, ce qui démontre le théorème.<br />

f(t) − f(t 0 ) − (t − t 0 )x = (t − t 0 )ε(t − t 0 )<br />

Exemple 2.1.1<br />

a) Soit (E, ‖.‖) un espace normé, alors la norme n’est pas différentiable en 0. Dans le cas<br />

contraire, on aurait (remarque 2.1.1, d)) pour tout h ∈ E<br />

D(‖.‖)(0)h = lim<br />

t→0<br />

‖th‖/t<br />

ce qui est absurde car le rapport ‖th‖/t a une limite à droite égale à ‖h‖ et une limite à gauche<br />

égale à −‖h‖ quand t tend vers 0.<br />

b) Soient E, F des espaces normés et soit f ∈ L(E, F ). Il découle de l’égalité,<br />

f(x) − f(a) − f(x − a) = 0 pour tout x, a ∈ E<br />

que, pour tout a ∈ E, f est différentiable en a ∈ E et que sa différentielle en a est Df(a) = f.<br />

c) Soit E, F , G des espaces normés, soit f ∈ L 2 (E, F ; G) une application bilinéaire continue<br />

et soient a, x ∈ E, b, y ∈ F . On a<br />

f(x, y) = f(a + (x − a), b + (y − b))<br />

= f(a, b) + f(a, y − b) + f(x − a, b) + f(x − a, y − b).<br />

Notons que l’application linéaire L : E × F −→ G définie par<br />

L(u, v) = f(a, v) + f(u, b) pour tout (u, v) ∈ E × F<br />

31


est continue car<br />

‖L(u, v)‖ ≤ ‖f‖‖a‖‖v‖ + ‖f‖‖b‖‖u‖ ≤ (‖f‖‖a‖ + ‖f‖‖b‖)‖(u, v)‖<br />

où ‖(u, v)‖ = sup(‖u‖, ‖v‖). Enfin<br />

ce qui montre que<br />

‖f(x − a, y − b)‖ ≤ ‖f‖‖x − a‖‖y − b‖ ≤ ‖f‖‖(x − a, y − b)‖ 2 ,<br />

lim<br />

(x,y)→(a,b)<br />

f(x − a, y − b)<br />

‖(x − a, y − b)‖ = 0.<br />

Il en résulte que toute application bilinéaire continue f ∈ L 2 (E, F ; G) est différentiable sur E ×F<br />

et que pour tout (a, b) ∈ E × F , (u, v) ∈ E × F<br />

Df(a, b)(u, v) = f(a, v) + f(u, b).<br />

Plus généralement si E 1 , · · · , E m , G sont des espaces normés et si f ∈ L(E 1 , · · · , E m ; G) est<br />

une application multilinéaire continue, alors f est différentiable sur E 1 × · · · × E m et pour tout<br />

(a 1 , · · · , a m ), (u 1 , · · · , u m ) ∈ E 1 × · · · × E m on a<br />

Df(a 1 , · · · , a m )(u 1 , · · · , u m ) = f(u 1 , a 2 , · · · , a m ) + · · · + f(a 1 , · · · , a m−1 , u m ),<br />

(exercice facile et fastidieux ou voir Corollaire 2.4.3).<br />

d) Soit U un ouvert de R n , f : U −→ R une application et soit a ∈ U. On rappelle que la<br />

dérivée partielle<br />

∂f<br />

∂x i<br />

(a)<br />

est égale quand elle existe au nombre dérivé ϕ ′ (a i ) où ϕ i est la fonction de la variable réelle définie<br />

au voisinage de a i par ϕ i (z) = f(a 1 , · · · , z, · · · , a n ). En d’autre termes<br />

soit<br />

∂f f(a 1 , · · · , z, · · · , a n ) − f(a 1 , · · · , a n )<br />

(a) = lim<br />

,<br />

∂x i z→ai z − a i<br />

∂f f(a 1 , · · · , a i + t, · · · , a n ) − f(a 1 , · · · , a n )<br />

(a) = lim<br />

.<br />

∂x i t→0 t<br />

Autrement dit<br />

∂f f(a + te i ) − f(a)<br />

(a) = lim<br />

,<br />

∂x i t→0 t<br />

{<br />

0 si j ≠ i<br />

∂f<br />

où (e i ) j =<br />

. Il résulte donc de (2.1) que si f est différentiable en a alors (a)<br />

1 si j = i ∂x i<br />

existe. On a de plus<br />

( n∑ )<br />

Df(a)(h) = Df(a) h i e i =<br />

i=1<br />

n∑<br />

Df(a)(e i )h i =<br />

i=1<br />

n∑<br />

i=1<br />

∂f<br />

∂x i<br />

(a)h i .<br />

32


Autrement dit<br />

Df(a)(h) = 〈∇f(a), h〉 pour tout h ∈ R n<br />

⎛<br />

∂f<br />

⎞<br />

(a)<br />

∂x<br />

où 〈., .〉 désigne le produit scalaire usuel sur R n 1 et ∇f(a) = ⎜<br />

⎝ . ⎟ est appelé le vecteur<br />

∂f<br />

⎠<br />

(a)<br />

∂x n<br />

gradient de f en a. On montrera dans la suite que si pour tout i = 1, · · · , n la fonction ∂f<br />

∂x i<br />

(.) est<br />

définie au voisinage de a et continue en a alors f est différentiable en a et que sa différentiellle en<br />

a est définie par<br />

Df(a)(h) = 〈∇f(a), h〉.<br />

e) Plus généralement, si U ⊂ R n est un ouvert et si l’application<br />

Df(a)(h) = lim<br />

t→0<br />

f(a + th) − f(a)<br />

t<br />

f = (f 1 , · · · , f m ) : U −→ R m<br />

est différentiable en a. On montrera un peu plus loin que f 1 , · · · , f m sont alors différentiables en<br />

a. On a alors d’après (2.1), pour tout h ∈ R n ,<br />

(<br />

= lim<br />

donc<br />

f 1 (a + th) − f(a)<br />

t→0 t<br />

Df(a)(h) = (〈∇f 1 (a), h〉, · · · , 〈∇f m (a), h〉),<br />

f m (a + th) − f(a)<br />

)<br />

, · · · , lim<br />

,<br />

t→0 t<br />

autrement dit<br />

Df(a)(h) = J f (a)h<br />

⎛ ⎞<br />

∇f 1 (a) T<br />

où J f (a) est la matrice à m lignes et n colonnes dont les lignes sont ⎝<br />

.<br />

⎠, autrement dit<br />

∇f m (a) T<br />

[J f (a)] ij = ∂f i<br />

∂x j<br />

(a) pour tout (i, j) ∈ [1, m] × [1, n].<br />

On dit que J f (a) est la matrice Jacobienne de f en a. On montrera que si les dérivées partielles<br />

( ∂fi<br />

)<br />

(.)<br />

existent au voisinage de a et sont continues en a on montrera alors que f<br />

∂x j (i,j)∈[1,m]×[1,n]<br />

est différentiable en a et que Df(a) est donné, pour tout vecteur h ∈ R m par<br />

Df(a)(h) = J f (a)h.<br />

La notion de vecteur gradient s’étend au cadre des espaces de Hilbert<br />

Définition 2.1.3 Soit U un ouvert d’un espace de Hilbert E et soit f : E −→ R une application<br />

différentiable en a. On a Df(a) ∈ E ∗ , on désigne alors par ∇f(a) ∈ E l’unique vecteur fourni<br />

par le Théorème de Riesz, tel que<br />

Df(a)(h) = 〈∇f(a), h〉 pour tout h ∈ E.<br />

33


Définition 2.1.4 Soit f : U ⊂ E −→ F une application. On dit que f est de classe C 1 sur U si f<br />

est différentiable sur U et si l’application, x ↦−→ Df(x) est continue de U dans L(E, F ).<br />

Théorème 2.1.2 Soient E, F des espaces normés. Alors l’application<br />

I : Isom (E, F ) −→ Isom (F, E),<br />

définie par I(u) = u −1 est de classe C 1 et pour tout h ∈ L(E, F ),<br />

DI(u)(h) = −u −1 ◦ h ◦ u −1 .<br />

Démonstration. On sait que Isom (E, F ) est ouvert dans L(E, F ) (Chapitre 1, Théorème 1.3.4).<br />

On remarque que L(.) définie par L(h) = −u −1 ◦ h ◦ u −1 est linéaire ; L(.) est aussi continue car<br />

‖L(h)‖ ≤ ‖u −1 ‖‖u −1 ‖‖h‖.<br />

Soit u ∈ Isom (E, F ), on peut supposer que h est assez petit pour que u + h ∈ Isom (E, F ). On a<br />

alors<br />

I(u + h) − I(u) = (u + h) −1 − u −1<br />

= (u + h) −1 ◦ u ◦ u −1 − (u + h) −1 ◦ (u + h) ◦ u −1<br />

= (u + h) −1 ◦ (u − (u + h)) ◦ u −1<br />

= −(u + h) −1 ◦ h ◦ u −1 .<br />

Posons<br />

R(h) = I(u + h) − I(u) − L(h).<br />

On a donc<br />

Montrons alors que lim<br />

h→0<br />

‖h‖ −1 R(h) = 0. On a<br />

R(h) = −(u + h) −1 ◦ h ◦ u −1 + u −1 ◦ h ◦ u −1<br />

= (u −1 − (u + h) −1 ) ◦ h ◦ u −1<br />

‖R(h)‖ ≤ ‖(u −1 − (u + h) −1 )‖‖h‖‖u −1 ‖.<br />

Or d’après le Théorème 1.3.4 du chapitre 1, on sait que<br />

‖(u −1 − (u + h) −1 )‖ ≤ ε/‖u −1 ‖,<br />

pour h assez petit, ce qui prouve la différentiabilité de I(.) en u ∈ Isom (E, F ).<br />

Il reste à prouver que DI(.) est continue de Isom (E, F ) dans L(L(E, F ), L(F, E)). Posons<br />

pour tout v, w ∈ L(F, E) et h ∈ L(E, F )<br />

Ψ(v, w)(h) = −v ◦ h ◦ w<br />

34


Il est clair que Ψ(v, w)(.) est linéaire de L(E, F ) dans L(F, E). Elle est aussi continue car<br />

‖Ψ(v, w)(h)‖ ≤ ‖v‖‖w‖‖h‖.<br />

Observons que l’application<br />

Ψ : L(F, E) × L(F, E) −→ L(L(E, F ), L(F, E))<br />

ainsi définie est bilinéaire (évident) et continue car<br />

‖Ψ(v, w)‖ ≤ ‖v‖‖w‖.<br />

On a alors<br />

DI = Ψ ◦ (I, I)<br />

ce qui montre que DI est continue comme composée d’applications continues.<br />

2.2 Opérations sur les applications différentiables<br />

Le résultat suivant découle de la continuité des opérations<br />

(voir chapitre 1, Remarque 1.2).<br />

(λ, x) ↦→ λx et (x, y) ↦→ x + y<br />

Proposition 2.2.1 Soient f, g : U −→ F deux applications différentiables en a ∈ U et soit<br />

λ ∈ R. Alors les applications λf et f + g sont différentiables en a et l’on a<br />

D(λf)(a) = λDf(a),<br />

D(f + g)(a) = Df(a) + Dg(a).<br />

Le résultat suivant est très important en calcul différentiel et il est impératif de savoir l’appliquer<br />

sans hésitation.<br />

Théorème 2.2.1 Soient E, F , G des espaces normés U ⊂ E, V ⊂ F des ouverts et soient<br />

f : U −→ V différentiable en a ∈ U, g : V −→ G différentiable en b = f(a) ∈ V . Alors<br />

l’application g ◦ f est différentiable en a et<br />

D(g ◦ f)(a) = Dg(f(a)) ◦ Df(a).<br />

Démonstration. On a,<br />

f(x) = f(a) + Df(a)(x − a) + r 1 (x),<br />

g(y) = g(b) + Dg(b)(y − b) + r 2 (y),<br />

35


avec<br />

et<br />

On a donc<br />

Il en résulte que<br />

où<br />

Il reste à montrer que<br />

Observons que<br />

ce qui montre que<br />

lim<br />

x→a<br />

lim<br />

y→b<br />

r 1 (x)<br />

‖x − a‖ = 0<br />

r 2 (y)<br />

‖y − b‖ = 0.<br />

g(f(x)) = g(b) + Dg(b)(Df(a)(x − a) + r 1 (x)) + r 2 (f(x)).<br />

g(f(x)) = g(b) + (Dg(b) ◦ Df(a))(x − a) + R(x),<br />

R(x) = Dg(b)(r 1 (x)) + r 2 (y).<br />

lim<br />

x→a<br />

R(x)<br />

‖x − a‖ = 0.<br />

‖Dg(b)(r 1 (x))‖ ≤ ‖Dg(b)‖‖r 1 (x)‖,<br />

Dg(b)(r 1 (x))<br />

lim<br />

x→a ‖x − a‖<br />

= 0.<br />

r 1 (x)<br />

Par ailleurs, utilisant le fait que lim = 0, il existe α > 0 tel que<br />

x→a ‖x − a‖<br />

‖r 1 (x)‖ ≤ ‖x − a‖<br />

pour tout x tel que ‖x − a‖ ≤ α. Il vient, pour tout x ∈ B(a, α),<br />

‖f(x) − b‖ = ‖Df(a)(x − a) + r 1 (x)‖<br />

≤<br />

‖Df(a)(x − a)‖ + ‖r 1 (x)‖<br />

≤<br />

‖Df(a)‖‖(x − a)‖ + ‖r 1 (x)‖,<br />

donc<br />

Soit alors ε > 0, il existe η > 0 tel que<br />

‖f(x) − b‖ ≤ (‖Df(a)‖ + 1)‖x − a‖. (2.2)<br />

‖r 2 (y)‖ ≤<br />

pour tout y tel que ‖y − b‖ ≤ η. Pour tout x tel que ‖x − a‖ ≤ min<br />

utilisant (2.2),<br />

ε<br />

‖y − b‖ (2.3)<br />

‖Df(a)‖ + 1<br />

‖f(x) − b‖ ≤ η,<br />

36<br />

(<br />

α,<br />

η<br />

)<br />

il vient,<br />

‖Df(a)‖ + 1)


et donc, utilisant (2.3),<br />

‖r 2 (f(x))‖<br />

ce qui achève la démonstration.<br />

≤<br />

≤<br />

≤<br />

ε<br />

‖f(x) − b‖<br />

‖Df(a)‖ + 1<br />

ε<br />

(‖Df(a)‖ + 1)‖x − a‖<br />

‖Df(a)‖ + 1<br />

ε‖x − a‖,<br />

Corollaire 2.2.1<br />

a) Soit I ⊂ R un intervalle ouvert de R, soient E, F des espaces normés et soit x : I −→ E<br />

et f : U −→ F une application définie sur un ouvert U de E. On suppose que x(I) ⊂ U, que x(.)<br />

est dérivable en t ∈ I et que f est différentiable en x(t). Alors f ◦ x est dérivable en t et<br />

(f ◦ x) ′ (t) = Df(x(t))(x ′ (t)).<br />

b) Soit I ⊂ R un intervalle ouvert de R, soient E, F , G des espaces normés, soient x : I −→ E<br />

et y : I −→ F . Soit f ∈ L 2 (E, F ; G) une application bilinéaire continue. On suppose que x(.) et<br />

y(.) sont dérivables en t ∈ I. Posons z(t) = f(x(t), y(t)), alors z(.) est dérivable en t et<br />

z ′ (t) = f(x ′ (t), y(t)) + f(x(t), y ′ (t)).<br />

Démonstration. a) D’après le Théorème 2.2.1, f ◦ x est différentiable en t donc dérivable en t et<br />

(f ◦ x) ′ (t) = D(f ◦ x)(t)(1) = (Df(x(t)) ◦ Dx(t))(1) = Df(x(t)(x ′ (t)).<br />

b) On a z = f ◦ g où g(.) = (x(.), y(.)). D’après le Théorème 2.2.1 il résulte que<br />

Dz(t) = Df(x(t), y(t)) ◦ Dg(t).<br />

Appliquant le Théorème 2.3.1 de la section 2.3 on a<br />

Il vient alors<br />

z ′ (t) = Dz(t)(1)<br />

Dg(t) = (Dx(t), Dy(t)).<br />

= Df(x(t), y(t))(Dx(t)(1), Dy(t)(1))<br />

= Df(x(t), y(t))(x ′ (t), y ′ (t)).<br />

Utilisant l’Exemple 2.1.1, c), on obtient bien le résultat.<br />

Exemple 2.2.1 Si (E, 〈·, ·〉) est un espace de Hilbert et x, y : I −→ E sont dérivables en t ∈ I,<br />

on déduit du corollaire précédent que<br />

(〈x(t), y(t)〉) ′ = 〈x ′ (t), y(t)〉 + 〈x(t), y ′ (t)〉.<br />

37


2.3 Applications à valeurs dans un produit d’espaces<br />

Soient F 1 , · · · , F m des espaces normés et F = F 1 ×· · ·×F m leur produit cartésien. On définit,<br />

pour tout i = 1, · · · , m<br />

p i : F −→ F i par p i (x 1 , · · · , x m ) = x i<br />

et<br />

u i : F i −→ F par u i (y) = (0, · · · , y, · · · , 0),<br />

où toutes les composantes sont nulles sauf celle de rang i qui est égale à y. On a p i ∈ L(F, F i ),<br />

u i ∈ L(F i , F ) (le démontrer) et, p i ◦ u i = I Fi .<br />

Théorème 2.3.1 Soit f : U −→ F = F 1 × · · · × F m une application définie sur un ouvert U d’un<br />

espace normé E à valeurs dans un produit d’espaces normé. Alors les propriétés suivantes sont<br />

équivalentes,<br />

i) f est différentiable en a ∈ U,<br />

ii) f 1 , · · · , f m sont différentiables en a où f = (f 1 , · · · , f m ).<br />

De plus pour tout h ∈ E,<br />

Df(a)(h) =<br />

m∑<br />

(u i ◦ Df i (a))(h) = (Df 1 (a)(h), · · · , Df m (a)(h)). (2.4)<br />

i=1<br />

Démonstration. Comme f est différentiable en a, l’application f i = p i ◦ f est aussi différentiable<br />

en a pour tout i = 1, · · · m, d’après le Théorème 2.2.1.<br />

Réciproquement, supposons que f 1 , · · · , f m sont différentiables en a. Alors, pour tout i =<br />

1, · · · , m, u i ◦ f i est différentiable en a comme composée d’une application différentiable en<br />

a et d’une application différentiable sur F i . Il en résulte que f qui est égal à ∑ m<br />

i=1 u i ◦ f i est<br />

différentiable en a et que, utilisant de nouveau le Théorème 2.2.1 pour tout h ∈ E<br />

ce qui achève la démonstration.<br />

Df(a)(h) =<br />

=<br />

m∑<br />

i=1<br />

m∑<br />

i=1<br />

(<br />

)<br />

Du i (f i (a)) ◦ Df i (a) (h)<br />

( )<br />

u i ◦ Df i (a) (h),<br />

Corollaire 2.3.1 Soit U un ouvert de R n et soit f : U −→ R m . Alors f est différentiable en a ∈ U<br />

si et seulement si f 1 , · · · , f m sont différentiables en a et on a, pour tout h ∈ R n ,<br />

Df(a)(h) = J f (a)h, (2.5)<br />

38


⎛ ⎞<br />

∇f 1 (a) T<br />

oú J f (a) = ⎝<br />

.<br />

⎠ est la matrice m × n définie par [J f (a)] ij = ∂f i<br />

(a), soit<br />

∂x j<br />

∇f m (a) T<br />

⎛<br />

J f (a) = ⎜<br />

⎝<br />

∂f 1<br />

∂x 1<br />

(a) · · ·<br />

. · · ·<br />

∂f m<br />

(a) · · ·<br />

∂x 1<br />

∂f<br />

⎞<br />

1<br />

(a)<br />

∂x n . ⎟<br />

∂f<br />

⎠ .<br />

m<br />

(a)<br />

∂x n<br />

Démonstration. La première partie de la conclusion découle du Théorème 2.3.1. Utilisant ce<br />

même Théorème, il vient<br />

Df(a)(h) = (Df 1 (a)(h), · · · , Df m (a)(h)).<br />

Par ailleurs, pour i ∈ [1, m], on a ∂f i<br />

∂x j<br />

(a) = Df i (a)(e j ) où e j est le j eme vecteur de la base<br />

canonique de R n de telle sorte que<br />

Df i (a)(h) =<br />

n∑<br />

h j Df i (a)(e j ) =<br />

j=1<br />

n∑<br />

j=1<br />

h j<br />

∂f i<br />

∂x j<br />

(a) = 〈∇f i (a), h〉.<br />

On a donc bien<br />

⎛<br />

⎞<br />

〈∇f 1 (a), h〉<br />

Df(a)(h) = ⎝<br />

.<br />

⎠ = J f (a)h.<br />

〈∇f m (a), h〉<br />

2.4 Applications définies sur un produit d’espaces<br />

Nous aurons besoin dans cette section de la Proposition 2.4.2 que nous démontrerons au chapitre<br />

suivant. Nous en donnons ici une autre démonstration basée sur la proposition suivante dont<br />

la démonstration fait appel au Théorème de Hahn-Banach.<br />

Proposition 2.4.1 Soit (E, ‖.‖) un espace normé. Alors pour tout x ∈ E on a<br />

‖x‖ = sup{|l(x)| : l ∈ E ∗ , ‖l‖ ≤ 1}.<br />

Proposition 2.4.2 Soit f : U ⊂ E −→ F une application différentiable définie sur un ouvert<br />

convexe d’un espace normé à valeurs dans un espace normé. On suppose qu’il existe M ∈ R + tel<br />

que<br />

sup ‖Df(x)‖ ≤ M.<br />

x∈U<br />

Alors pour tout x, z ∈ U<br />

‖f(z) − f(x)‖ ≤ M‖z − x‖.<br />

39


Démonstration. Soient x, z ∈ U et t ∈ [0, 1]. De part la convexité de U on a tx + (1 − t)z ∈ U.<br />

En fait il existe η > 0 tel que tx + (1 − t)z ∈ U pour tout t ∈ [−η, 1 + η] (choisir η > 0 tel que<br />

B(x, η‖x − z‖) ⊂ U et B(z, η‖x − z‖) ⊂ U). Soit l ∈ F ∗ telle que ‖l‖ ≤ 1. Posons pour tout<br />

t ∈ [−η, 1 + η]<br />

ϕ(t) = l(f(tx + (1 − t)z)) = l(f(α(t))).<br />

Utilisant la règle de différentiation des applications composées on obtient que ϕ est dérivable sur<br />

] − η, 1 + η[ et<br />

On a alors<br />

ϕ ′ (t) = Dl(f(α(t)))(Df(α(t))(α ′ (t))) = l(Df(tx + (1 − t)z))(x − z).<br />

|ϕ ′ (t)| ≤ ‖l‖‖(Df(tx + (1 − t)z)‖‖z − x‖<br />

≤<br />

≤<br />

‖(Df(tx + (1 − t)z)‖‖z − x‖<br />

M‖z − x‖.<br />

Utilisant le théorème des accroissements finis pour les fonctions d’une variable réelle il vient<br />

pout tout s, t ∈] − η, 1 + η[. On obtient alors<br />

On applique alors la Proposition 2.4.1 et il vient<br />

|ϕ(t) − ϕ(s)| ≤ M‖z − x‖|t − s|<br />

|l(f(z) − f(x))| = |ϕ(1) − ϕ(0)| ≤ M‖z − x‖.<br />

‖f(z) − f(x)‖ = sup{|l(f(z) − f(x))| : l ∈ F ∗ , ‖l‖ ≤ 1} ≤ M‖z − x‖.<br />

Soient E 1 , · · · , E n , F des espaces normés, U un ouvert du produit cartésien<br />

E = E 1 × · · · × E n ,<br />

et f : U −→ F une application. Étant donné a ∈ U, on introduit, pour tout i = 1, · · · , n,<br />

l’application ϕ i définie par<br />

ϕ i (z) = f(a 1 , · · · , z, · · · , a n ),<br />

(dans (a 1 , · · · , z, · · · , a n ), les composantes de rang j ≠ i sont égales à a j , celle de rang i est égale<br />

à z). L’application ϕ i est définie sur un voisinage U i de a i et à valeurs dans F .<br />

Définition 2.4.1 Soient E 1 , · · · , E n , F des espaces normés, U un ouvert du produit cartésien<br />

E = E 1 × · · · × E n et f : U −→ F une application. On dit que f admet une différentielle<br />

partielle en a ∈ U par rapport à la ième variable si ϕ i est différentiable en a i . On pose alors<br />

On remarque que D i f(a) ∈ L(E i , F ).<br />

D i f(a) = Dϕ i (a).<br />

40


Proposition 2.4.3 Soit f : U ⊂ E −→ F où U est un ouvert de E = E 1 × · · · × E n . Supposons<br />

que f est différentiable en a. Alors pour tout i = 1, · · · , n, D i f(a) existe et pour tout h ∈ E i<br />

où u i (h) = (0, · · · , h, · · · , 0).<br />

Démonstration. Posons, pour z ∈ E i ,<br />

v i (.) est définie dans un voisinage de a i et<br />

D i f(a)(h) = Df(a)(u i (h)),<br />

v i (z) = (a 1 , · · · , z, · · · , a n ),<br />

v i (z) − v i (a i ) = u i (z − a i ),<br />

ce qui montre que v i est différentiable en a i et que Dv i (a i ) = u i . D’après le Théorème 2.2.1,<br />

ϕ i = f ◦ v i est différentiable en a i et que, pour tout h ∈ E i<br />

(<br />

)<br />

Dϕ i (a i )(h) = Df(v i (a i )) ◦ Dv i (a i ) (h) = Df(a)(u i (h)),<br />

d’où le résultat.<br />

Le résultat suivant découle immédiatement de la Proposition 2.4.3<br />

Proposition 2.4.4 Soit f : U −→ R où U est un ouvert de R n . Alors il est équivalent de dire que<br />

f admet une différentielle partielle en a par rapport à la ième variable et que la dérivée partielle<br />

∂f<br />

∂x i<br />

(a) existe. De plus on a<br />

∂f<br />

∂x i<br />

(a) = Df(a)(e i ),<br />

et<br />

D i f(a)(h) = h ∂f<br />

∂x i<br />

(a),<br />

∂f<br />

∂x i<br />

(a) = D i f(a)(1).<br />

Il est faux en général que l’existence de différentielles partielles D i f(a), 1 ≤ i ≤ n, implique la<br />

différentiabilité de f en a. On a cependant le résultat suivant qui est très important.<br />

Théorème 2.4.1 Soit f : U ⊂ E 1 × · · · × E n −→ F et a ∈ U. On suppose que pour i = 1, · · · , n<br />

les différentielles partielles D i f(.) existent sur U et que les applications D i f : U −→ L(E i , F )<br />

sont continues en a ∈ U. Alors f est différentiable en a et,<br />

Df(a)(h) =<br />

n∑<br />

D i f(a)(h i ) pour tout h = (h 1 , · · · , h n ) ∈ E 1 × · · · × E n<br />

i=1<br />

41


Démonstration. On remarque que l’application<br />

L : E 1 × · · · × E n −→ F<br />

définie par L(h) = ∑ n<br />

i=1 D if(a)(h i ) est linéaire et continue. Posons<br />

R(x) = f(x) − f(a) −<br />

n∑<br />

D i f(a)(x i − a i ).<br />

i=1<br />

On a<br />

Ce que l’on peut écrire<br />

où<br />

R(x) = f(x 1 , · · · , x n ) − f(a 1 , x 2 , · · · , x n ) − D 1 f(a)(x 1 − a 1 )<br />

+ f(a 1 , x 2 , · · · x n ) − f(a 1 , a 2 , · · · , x n ) − D 2 f(a)(x 2 − a 2 )<br />

.<br />

+ f(a 1 , · · · , a n−1 , x n ) − f(a 1 , · · · , a n ) − D n f(a)(x n − a n ).<br />

R(x) = g 1 (x 1 ) − g 1 (a 1 ) + · · · + g n (x n ) − g n (a n ),<br />

g 1 (z 1 ) = f(z 1 , x 2 , · · · , x n ) − D 1 f(a)(z 1 − a 1 ),<br />

g 2 (z 2 ) = f(a 1 , z 2 , x 3 , · · · , x n ) − D 2 f(a)(z 2 − a 2 ),<br />

.<br />

g n (z n ) = f(a 1 , · · · , a n−1 , z n ) − D n f(a)(z n − a n ).<br />

Les applications g i sont définies et différentiables dans un voisinage de a i pour tout x voisin de a.<br />

Par définition de la différentielle partielle, on a<br />

Munissons alors E de la norme<br />

Dg 1 (z 1 ) = D 1 f(z 1 , x 2 , · · · , x n ) − D 1 f(a 1 , · · · , a n ),<br />

Dg 2 (z 2 ) = D 2 f(a 1 , z 2 , x 3 , · · · , x n ) − D 2 f(a 1 , · · · , a n ),<br />

.<br />

Dg n (z n ) = D n f(a 1 , · · · , a n−1 , z n ) − D n f(a 1 , · · · , a n ).<br />

‖(u 1 , · · · , u n )‖ = sup ‖u i ‖.<br />

1≤i≤n<br />

Utilisant la continuité de l’application D 1 f, étant donné ε > 0, il existe η > 0 tel que, pour tout<br />

y ∈ B(a, η) et pour tout i ∈ [1, n], on ait<br />

‖D i f(y) − D i f(a)‖ ≤ ε.<br />

42


On obtient donc pour tout x ∈ B(a, η) et pour tout i ∈ [1, n],<br />

‖Dg i (z i )‖ ≤ ε pour tout z i ∈ B(a i , η).<br />

Appliquant alors la Proposition 2.4.2, il vient pour tout x ∈ B(a, η) et pour tout i ∈ [1, n],<br />

‖g i (x i ) − g i (a i )‖ ≤ ε‖x i − a i ‖,<br />

d’où<br />

‖R(x)‖ ≤ ε<br />

ce qui achève la démonstration.<br />

n∑<br />

‖x i − a i ‖ = ε‖x − a‖ 1 ,<br />

i=1<br />

Corollaire 2.4.1 Soit f : U ⊂ E 1 ×· · ·×E n −→ F . Alors f est de classe C 1 sur U si et seulement<br />

si les différentielles partielles D i f(.) existent, i = 1, · · · , n et sont continues sur U.<br />

Démonstration. Supposons f de classe C 1 . Alors D i f(x) existe pour tout i = 1, · · · , n et pour<br />

tout x ∈ U. Pour tout i ∈ [1, n], x, z ∈ U et pour tout v ∈ E i , on a<br />

‖(D i f(z) − D i f(x))(v)‖ = ‖(Df(z) − Df(x))(0, · · · , v, · · · , 0)‖<br />

≤<br />

‖Df(z) − Df(x)‖ L(E1 ×···×E n,F )‖v‖,<br />

ce qui montre que<br />

‖D i f(z) − D i f(x)‖ L(Ei ,F ) ≤ ‖Df(z) − Df(x)‖ L(E1 ×···×E n,F ),<br />

d’où la continuité de D i f en tout x ∈ U. Réciproquement, d’après le Théorème 2.4.1 l’application<br />

f est différentiable sur U et pour tout x, z ∈ U, h ∈ E 1 × · · · × E n on a<br />

‖(Df(z) − Df(x))(h)‖<br />

≤<br />

≤<br />

n∑<br />

‖(D i f(z) − D i f(x))(h i )‖<br />

i=1<br />

( n∑<br />

i=1<br />

)<br />

‖(D i f(z) − D i f(x))‖ ‖h‖.<br />

On obtient donc<br />

‖(Df(z) − Df(x))‖ L(E1 ×···×E n,F ) ≤<br />

n∑<br />

‖(D i f(z) − D i f(x))‖ L(Ei ,F )<br />

i=1<br />

ce qui montre bien la continuité de Df.<br />

43


Corollaire 2.4.2 Soit U un ouvert de R n et f : U −→ R m , f = (f 1 , · · · , f m ).<br />

a) On suppose que les dérivées partielles ∂f i<br />

∂x j<br />

, (i, j) ∈ [1, m] × [1, n] existent au voisinage<br />

d’un point a ∈ U et sont continues en a. Alors f est différentiable en a et pour tout h ∈ R n<br />

où J f (a) est la matrice (m, n) définie par<br />

Df(a)(h) = J f (a)h,<br />

(J f (a)) i,j = ∂f i<br />

∂x j<br />

(a).<br />

b) De plus si les dérivées partielles ∂f i<br />

∂x j<br />

, (i, j) ∈ [1, m] × [1, n] sont continues sur U alors f<br />

est de classe C 1 sur U.<br />

Démonstration. a) Utilisant la Proposition 2.4.4, on a, pour tout i ∈ [1, m], j ∈ [1, n], x ∈ U et<br />

h ∈ R,<br />

( ∂fi<br />

|(D j f i (x) − D j f i (a))(h)| = ∣ (x) − ∂f )<br />

i<br />

(a) h∣<br />

∂x j ∂x j<br />

ce qui montre que<br />

=<br />

∣ ∂f i<br />

(x) − ∂f i ∣<br />

(a) ∣|h|,<br />

∂x j ∂x j<br />

‖D j f i (x) − D j f i (a)‖ L(R,R)<br />

= ∣ ∂f i<br />

(x) − ∂f i ∣<br />

(a) ∣.<br />

∂x j ∂x j<br />

Il en résulte que les applications D i f j sont continues en a. Utilisant les Théorèmes 2.3.1 et 2.4.1,<br />

on obtient bien que f est différentiable en a. Le calcul de Df(a)(h) découle alors du Corollaire<br />

2.3.1.<br />

b) Montrons que les différentielles partielles D i f, 1 ≤ i ≤ n sont continues. Pour tout u ∈ R<br />

et pour tout x ∈ U, on a, utilisant la Proposition 2.4.4<br />

D i f(x)(u) = Df(x)(ue i )<br />

= (Df 1 (x)(ue i ), · · · , Df m (x)(ue i ))<br />

( ∂f1<br />

= u (x), · · · , ∂f )<br />

m<br />

(x) .<br />

∂x i ∂x i<br />

Il en résulte que<br />

( ‖D i f(z) − D i f(x)‖ L(R,R m ) =<br />

∂f1<br />

∥ (z) − ∂f 1<br />

(x), · · · , ∂f m<br />

(z) − ∂f )∥<br />

m ∥∥∥<br />

(x) .<br />

∂x i ∂x i ∂x i ∂x i<br />

Il suffit alors d’appliquer le Corollaire 2.4.1.<br />

44


Remarque 2.4.1 Dans le cas où m = 1 on peut aussi écrire<br />

où<br />

∇f(a) =<br />

Df(a)(h) = 〈∇f(a), h〉<br />

( ∂f<br />

(a), · · · , ∂f )<br />

(a) .<br />

∂x 1 ∂x n<br />

Corollaire 2.4.3 Soient E 1 , · · · , E n , F des espaces normés et soit<br />

f ∈ L n (E 1 , · · · , E n ; F )<br />

une application multilinéaire continue. Alors f est de classe C 1 sur E 1 × · · · × E n et pour tout<br />

x, h ∈ E 1 × · · · × E n<br />

Df(a)(h) = f(h 1 , x 2 , · · · , x n ) + · · · + f(x 1 , · · · , x n−1 , h n ).<br />

Démonstration. Soit a ∈ E 1 × · · · × E n et i ∈ [1, n]. L’application partielle<br />

ϕ i (z) = f(a 1 , · · · , z, · · · , a n ),<br />

est alors linéaire et continue de E i dans F . Elle est donc différentiable d’après l’Exemple 2.1.1,<br />

b) et<br />

D i f(a) = ϕ i .<br />

Montrons alors que, pour tout 1 ≤ i ≤ n, l’application D i f est continue sur E 1 × · · · × E n ce<br />

qui démontrera le résultat grâce au Corollaire 2.4.1. Il suffit de faire la démonstration pour i = 1.<br />

Pour tout x ∈ E 1 × · · · × E n on a<br />

où<br />

est définie pour tout z ∈ E 2 × · · · × E n par<br />

D 1 f(x) = Ψ(x 2 , · · · , x n )<br />

Ψ : E 2 × · · · × E n −→ L(E 1 , F )<br />

Ψ(z) = f(., z 2 , · · · , z n ).<br />

Remarquons que Ψ est multilinéaire et que pour tout u ∈ E 1<br />

Il en résulte que<br />

‖ψ(z)(u)‖ ≤ ‖f‖‖z 2 ‖ · · · ‖z n ‖‖u‖.<br />

‖ψ(z)‖ L(E1 ,F ) ≤ ‖f‖‖z 2 ‖ · · · ‖z n ‖,<br />

donc d’après le Théorème 1.5.1 du Chapitre 1, Ψ est continue sur E 2 × · · · × E n ce qui implique<br />

que D 1 f est continue sur E 1 × · · · × E n .<br />

On a aussi le<br />

45


Corollaire 2.4.4 Soient f : U ⊂ E −→ R et g : U ⊂ E −→ R ∗ différentiables en a ∈ U. Alors<br />

l’application f g<br />

est différentiable en a, et, pour tout u ∈ E,<br />

( f<br />

)<br />

D (a)(u) =<br />

g<br />

g(a)Df(a)(u) − f(a)Dg(a)(u)<br />

g(a) 2 .<br />

Démonstration. On a f g = ϕ ◦ (f, g) avec ϕ : R × R∗ −→ R définie par ϕ(s, t) = s t . On a<br />

∂ϕ<br />

∂s (s, t) = 1 t<br />

et<br />

∂ϕ<br />

∂t (s, t) = − s t 2 . Ces dérivées partielles étant continues sur R × R∗ , on déduit du<br />

Corollaire 2.4.2 que ϕ est différentiable sur R × R ∗ . Il en résulte que f est différentiable en a, et<br />

g<br />

que, pour tout u ∈ E,<br />

( f<br />

)<br />

D (a)(u) = Dϕ(f(a), g(a))(Df(a)(u), Dg(a)(u)) = 1<br />

f(a)<br />

Df(a)(u) −<br />

g g(a) g(a) Dg(a)(u),<br />

2<br />

d’où le résultat.<br />

Remarquons que si, dans le corollaire précédent, E est un espace de HILBERT, on a alors<br />

( f<br />

)<br />

∇ (a) =<br />

g<br />

g(a)∇f(a) − f(a)∇g(a)<br />

g(a) 2 .<br />

46


Chapitre 3<br />

Théorème des Accroissements Finis et<br />

Applications<br />

3.1 Théorème des Accroissements Finis<br />

Définition 3.1.1 Soit f : I −→ E une fonction définie sur un intervalle I de R à valeurs dans<br />

un espace normé E, on dit que f est dérivable à droite (resp. à gauche) en t 0 ∈ I si le vecteur<br />

f(t) − f(t 0 )<br />

a une limite à droite (resp. à gauche) en t 0 . On note f d ′ t − t (t 0) (resp. f g(t ′ 0 )) cette limite<br />

0<br />

à droite (resp. à gauche) quand elle existe.<br />

Le résultat suivant est connu sous le nom de Théorème des accroissements finis.<br />

Théorème 3.1.1 Soit E un espace normé et soient f : [a, b] −→ E, g : [a, b] −→ R des fonctions<br />

continues sur [a, b] et dérivables sur ]a, b[. On suppose que, pour tout t ∈]a, b[<br />

‖f ′ (t)‖ ≤ g ′ (t).<br />

Alors<br />

‖f(b) − f(a)‖ ≤ g(b) − g(a).<br />

Démonstration. Montrons que l’on a<br />

‖f(v) − f(u)‖ ≤ g(v) − g(u) pour tout a < u < v < b,<br />

ce qui donnera bien la conclusion du théorème en faisant tendre u vers a et v vers b, utilisant la<br />

continuité de f et g en a et b. Supposons le contraire, il existe donc a < u < v < b tels que<br />

‖f(v) − f(u)‖ − (g(v) − g(u)) = η > 0.<br />

Définissons a 0 = u et b 0 = v. Comme<br />

∥<br />

‖f(v) − f(u)‖ − (g(v) − g(u)) ≤ ∥f(v) − f( u + v<br />

(<br />

) ∥ − g(v) − g( u + v )<br />

) +<br />

2<br />

2<br />

∥<br />

∥f( u + v<br />

(<br />

) − f(u) ∥ − g( u + v )<br />

) − g(u)<br />

2<br />

2<br />

47


on a<br />

∥ ∥∥f(v) − f(<br />

u + v<br />

2<br />

(<br />

) ∥ −<br />

ou bien<br />

∥ ∥∥f( u + v<br />

(<br />

) − f(u) ∥ −<br />

2<br />

Choisissons alors a 1 , b 1 ∈ {a 0 , b 0 } tels que<br />

g(v) − g( u + v<br />

2<br />

g( u + v<br />

2<br />

)<br />

) ≥ η 2 ,<br />

)<br />

) − g(u) ≥ η 2 .<br />

‖f(b 1 ) − f(a 1 )‖ − (g(b 1 ) − g(a 1 )) ≥ η 2 .<br />

On construit alors par récurrence, une suite décroissantes d’intervalles [a n , b n ] tels que b n − a n =<br />

b 0 − a 0<br />

2 n et<br />

‖f(b n ) − f(a n )‖ − (g(b n ) − g(a n )) ≥ η 2 n . (3.1)<br />

Les suites (a n ) n∈N et (b n ) n∈N convergent alors vers une limite commune c ∈ [a 0 , b 0 ] ⊂]a, b[.<br />

Utilisant la dérivabilité de f et g en c, on a<br />

f(a n ) = f(c) + (a n − c)f ′ (c) + (a n − c)ε(a n − c)<br />

f(b n ) = f(c) + (b n − c)f ′ (c) + (b n − c)ε(b n − c)<br />

g(a n ) = g(c) + (a n − c)g ′ (c) + (a n − c)η(a n − c)<br />

(3.2)<br />

g(b n ) = g(c) + (b n − c)g ′ (c) + (b n − c)η(b n − c),<br />

avec lim h→0 ε(h) = 0 et lim h→0 η(h) = 0. Revenant à (3.1), et utilisant l’inégalité triangulaire, il<br />

vient<br />

‖f(b n ) − f(c)‖ + ‖f(c) − f(a n )‖ − (g(b n ) − g(c)) − (g(c) − g(a n )) ≥ η 2 n .<br />

On obtient donc, utilisant (3.2) et le fait que a n ≤ c ≤ b n ,<br />

avec<br />

η<br />

2 n ≤ ‖f ′ (c)‖(b n − c + c − a n ) − g ′ (c)(b n − a n ) + r n<br />

r n = (b n − c)(‖ε(b n − c)‖ + |η(b n − c)|) + (c − a n )(‖ε(a n − c)‖ + |η(a n − c)|).<br />

Divisant par b n − a n , il vient<br />

η<br />

b 0 − a 0<br />

≤ ‖f ′ (c)‖ − g ′ (c) + (b n − a n ) −1 r n .<br />

Il existe δ > 0 tel que, pour tout |h| ≤ δ, on a ‖ε(h)‖ ≤ ε et ‖η(h)‖ ≤ ε. Pour tout n assez grand<br />

pour que b n − a n ≤ δ, on a alors b n − c ≤ b n − a n et c − a n ≤ b n − a n , de telle sorte que<br />

r n ≤ 4(b n − a n )ε,<br />

48


donc lim n→∞ (b n − a n ) −1 r n = 0. On arrive donc à la contradiction<br />

‖f ′ (c)‖ > g ′ (c).<br />

On peut en fait démontrer le résultat plus général suivant<br />

Théorème 3.1.2 Soient f : [a, b] −→ E, g : [a, b] −→ R des fonctions continues sur [a, b] et<br />

dérivables à droite sur ]a, b[ sauf éventuellement sur une partie au plus dénombrable D de ]a, b[.<br />

On suppose que, pour tout t ∈]a, b[\D,<br />

‖f ′ d(t)‖ ≤ g ′ d(t).<br />

Alors<br />

‖f(b) − f(a)‖ ≤ g(b) − g(a).<br />

Démonstration. Soit n ↦−→ ρ n une surjection de N sur D. Soit ε > 0, on va montrer que, pour<br />

tout t ∈ [a, b]<br />

‖f(t) − f(a)‖ ≤ g(t) − g(a) + ε(t − a + 2),<br />

ce qui démontrera bien le résultat en faisant t = b et en faisant tendre ε vers 0. Posons<br />

A = {a} ∪ {t ∈]a, b] : ψ(s) ≤ 0, ∀s ∈ [a, t[},<br />

où<br />

ψ(s) = ‖f(s) − f(a)‖ − (g(s) − g(a)) − ε(s − a) − ε ∑ ρ n


On a donc<br />

‖f(s) − f(c)‖ ≤ ‖f d(c)‖(s ′ − c) + (s − c)ε/2,<br />

≤ g d(c)(s ′ − c) + (s − c)ε/2<br />

≤ g(s) − g(c) + ε(s − c).<br />

Comme ψ(c) ≤ 0, on a<br />

‖f(c) − f(a)‖ ≤ (g(c) − g(a)) + ε(c − a) + ε ∑ ρ n


Corollaire 3.1.1 Soit f : [a, b] −→ E une fonction continue sur [a, b] et dérivable à droite sur<br />

]a, b[ sauf éventuellement sur une partie au plus dénombrable D de ]a, b[. On suppose qu’il existe<br />

M ≥ 0 telle que, pour tout t ∈]a, b[\D,<br />

Alors<br />

‖f ′ d(t)‖ ≤ M.<br />

‖f(b) − f(a)‖ ≤ M(b − a).<br />

Démonstration. Il suffit d’appliquer le Théorème 3.1.2 avec g(t) = Mt.<br />

Remarque 3.1.1<br />

a) Le Théorème 3.1.2 et le Corollaire 3.1.1 sont vrais en remplaçant la dérivée à droite par la<br />

dérivée à gauche.<br />

b) Quand E ≠ R, il n’existe pas en général d’élément c ∈ [a, b] tel que f(b) − f(a) =<br />

f ′ (c)(b − a) (voir T.D.).<br />

3.2 Applications du Théorème des Accroissements Finis<br />

Le résultat très utile suivant montre qu’une fonction différentiable dont la différentielle est<br />

majorée en norme par une constante M sur un convexe est M-Lipschitzienne sur ce convexe.<br />

Corollaire 3.2.1 Soit U ⊂ E un ouvert d’un espace normé et soit f : U −→ F une application<br />

différentiable et soit C ⊂ U un convexe tel que sup y∈C ‖Df(y)‖ ≤ M. Alors, pour tout x, z ∈ C<br />

‖f(z) − f(x)‖ ≤ M‖x − z‖.<br />

Démonstration. Soient x, z ∈ C. Définissons pour tout t ∈ [0, 1]<br />

et<br />

u(t) = tx + (1 − t)z ∈ U<br />

ϕ(t) = f(u(t)).<br />

La fonction ϕ est continue sur [0, 1], à valeurs dans C, dérivable sur ]0, 1[ et sa dérivée est donnée,<br />

utilisant le Corollaire 2.2.1 du Chapitre 2<br />

Il en résulte que pour tout t ∈]0, 1[<br />

ϕ ′ (t) = Df(u(t))u ′ (t) = Df(tx + (1 − t)z)(x − z).<br />

‖ϕ ′ (t)‖ ≤ M‖x − z‖ = g ′ (t)<br />

en posant g(t) = M‖x − z‖t. Le Théorème 3.1.1 implique que<br />

‖f(x) − f(z)‖ = ‖ϕ(1) − ϕ(0)‖ ≤ g(1) − g(0) = M‖x − z‖.<br />

Le résultat suivant est aussi utile<br />

51


Proposition 3.2.1 Foit U ⊂ E un ouvert d’un espace normé E et soit f : U −→ F une application<br />

différentiable que l’on suppose M-lipschitzienne sur U. Alors,<br />

‖Df(x)‖ ≤ M pour tout x ∈ U.<br />

Démonstration. Pour tout x ∈ U et u ∈ E, on sait que<br />

f(x + tu) − f(x)<br />

Df(x)(u) = lim<br />

,<br />

t→0 t<br />

donc<br />

∥ ∥∥ f(x + tu) − f(x)<br />

∥<br />

‖Df(x)(u)‖ = lim<br />

∥.<br />

t→0 t<br />

Pour tout t assez petit, on a x + tu ∈ U de telle sorte que<br />

‖f(x + tu) − f(x)‖ ≤ M|t|‖u‖,<br />

d’où<br />

∥ ∥∥ f(x + tu) − f(x)<br />

‖Df(x)(u)‖ = lim<br />

∥ ≤ M‖u‖,<br />

t→0 t<br />

ce qui montre bien que ‖Df(x)‖ ≤ M pour tout x ∈ U.<br />

Le résultat suivant est important.<br />

Corollaire 3.2.2 Soit U ⊂ E un ouvert connexe d’un espace normé, soit f : U −→ F une<br />

application différentiable telle que Df(x) = 0 pour tout x ∈ U. Alors f est constante sur U.<br />

Démonstration. Pour tout a ∈ U il existe un ouvert convexe, à savoir une boule ouverte B(a, r)<br />

sur laquelle Df est nulle et donc sur laquelle f est constante (Corollaire 3.2.1). Considérons<br />

a 0 ∈ U et posons b 0 = f(a 0 ) et U 0 = f −1 (b 0 ). L’ensemble U 0 est fermé car f est continue. Soit<br />

a ∈ U 0 , il existe une boule ouverte B(a, r) telle que f(x) = f(a) = b 0 sur B(a, r). Il en résulte<br />

que U 0 est ouvert dans U. Comme U 0 est aussi fermé dans U et que U est connexe, on a U = U 0<br />

ce qui achève la démonstration.<br />

Une application utile du Théorème des accroissements finis est de donner une condition suffisante<br />

pour passer à la limite sur la différentielle d’une suite de fonctions différentiables.<br />

Théorème 3.2.1 Soit U ⊂ E un ouvert connexe d’un espace normé et soit f p : U −→ F , p ∈ N<br />

une suite d’applications différentiables à valeurs dans un espace de Banach F . On suppose que<br />

i) il existe x 0 ∈ U tel que la suite (f p (x 0 )) converge ;<br />

ii) il existe une fonction g : U −→ L(E, F ) telle que, pour tout a ∈ U il existe une boule<br />

ouverte B(a) contenant a telle que la suite de fonctions (Df p ) converge uniformément sur B(a)<br />

vers g, ce qui signifie<br />

(<br />

lim<br />

p→∞<br />

sup<br />

y∈B(a)<br />

‖Df p (y) − g(y)‖ L(E,F )<br />

)<br />

= 0.<br />

Alors il existe une application différentiable f : U −→ F telle que pour tout a ∈ U, la suite<br />

(f p ) converge uniformément vers f sur B(a) et l’on a Df = g sur U.<br />

52


Démonstration. Soient p, q ∈ N et a ∈ U. On définit<br />

h(x) = f p (x) − f p (a) − (f q (x) − f q (a)).<br />

On a Dh(x) = Df p (x) − Df q (x) et h(a) = 0. Appliquant le Corollaire 3.2.1 à l’application h et<br />

à l’ouvert convexe B(a), on a pour tout x ∈ B(a) et pour tout p, q ∈ N,<br />

‖f p (x) − f p (a) − (f q (x) − f q (a))‖ ≤ ‖Df p − Df q ‖ C(B(a),F ) ‖x − a‖. (3.4)<br />

avec ‖Df p − Df q ‖ C(B(a),F ) = sup y∈B(a) ‖Df p (y) − Df q (y)‖. La suite (f p (x) − f p (a)) est donc<br />

de Cauchy dans F . Il en résulte que les suites (f p (x)) et (f p (a)) convergent ou divergent simultanément.<br />

Ceci implique que l’ensemble A des x ∈ U tels que (f p (x)) converge est à la fois ouvert<br />

et fermé dans U. En effet, d’après ce qui précéde on a B(a) ⊂ A ou B(a) ⊂ U \ A suivant que<br />

a ∈ A ou a ∈ U \ A. L’ensemble A qui est non vide par hypothèse est donc égal à U car U est<br />

connexe. Notons que pour tout x ∈ U, f(x) = lim p→∞ f p (x). Soit r(a) > 0 le rayon de la boule<br />

B(a). D’après 3.4 on a, pour tout x ∈ B(a) et pour tout p, q ∈ N,<br />

‖f p (x) − f p (a) − (f q (x) − f q (a))‖ ≤ ‖Df p − Df q ‖ C(B(a),F ) r(a),<br />

d’où, faisant tendre q vers l’infini, et passant à la borne supérieure sur x ∈ B(a),<br />

sup ‖f p (x) − f p (a) − (f(x) − f(a))‖ ≤ ‖Df p − Dg‖ C(B(a),F ) r(a).<br />

x∈B(a)<br />

Il en résulte que la suite d’applications (f p − f p (a)) converge uniformément vers f − f(a) sur<br />

B(a), donc (f p ) converge uniformément vers f sur B(a).<br />

Il reste à démontrer que f est différentiable et que Df = g. Soit a ∈ U. Posons pour tout x ∈ U<br />

où<br />

R(x) = f(x) − f(a) − g(a)(x − a) = R 1 (x) + R 2 (x) + R 3 (x),<br />

R 1 (x) = f(x) − f(a) − (f p (x) − f p (a)),<br />

R 2 (x) = f p (x) − f p (a) − Df p (a)(x − a),<br />

R 3 (x) = (Df p (a) − g(a))(x − a).<br />

On sait que pour tout x ∈ B(a) et pour tout p ∈ N<br />

‖R 1 (x)‖ = ‖f p (x) − f p (a) − (f(x) − f(a))‖ ≤ sup ‖Df p (y) − g(y)‖‖x − a‖.<br />

y∈B(a)<br />

Étant donné ε > 0 il existe p 0 ∈ N tel que pour tout p ≥ p 0<br />

sup ‖Df p (y) − g(y)‖ ≤ ε/3,<br />

y∈B(a)<br />

ce qui implique que, pour tout x ∈ B(a) et pour tout p ≥ p 0<br />

‖R 1 (x)‖ ≤ ‖x − a‖ε/3,<br />

‖R 3 (x)‖ ≤ sup ‖Df p (y) − g(y)‖‖x − a‖<br />

y∈B(a)<br />

≤ ‖x − a‖ε/3.<br />

53


Fixons alors p 0 (qui ne dépend que de ε). Utilisant la différentiabilité de f p0 en a, il existe η > 0<br />

tel que, pour tout x ∈ B(a, η) ⊂ B(a)<br />

On obtient donc, pour tout x ∈ B(a, η),<br />

ce qui achève la démonstration.<br />

‖f p0 (x) − f p0 (a) − Df p0 (a)(x − a)‖ ≤ ‖x − a‖ε/3.<br />

‖R(x)‖ ≤ ‖R 1 (x)‖ + ‖R 2 (x)‖ + ‖R 3 (x)‖ ≤ ε‖x − a‖,<br />

On peut écrire ce résultat pour des séries d’applications.<br />

Corollaire 3.2.3 Soit U ⊂ E un ouvert connexe d’un espace normé et soit u p : U −→ F une<br />

suite d’applications différentiables à valeurs dans un espace de Banach F . On suppose<br />

i) Il existe a ∈ U tel que la série de terme général (u p (a)) converge dans F .<br />

ii) La série de fonctions de terme général (Du p (.)) converge uniformément vers une application<br />

g : U −→ L(E, F ), ce qui signifie que<br />

(<br />

lim<br />

p→∞<br />

sup<br />

y∈U<br />

∥<br />

p∑<br />

) Du k (y) − g(y) ∥ = 0.<br />

L(E,F )<br />

k=0<br />

Alors la série d’applications de terme général (u p (.)) converge uniformément sur U et on a<br />

Dans le cas des fonctions on obtient :<br />

( ∑ ∞ )<br />

D u k (x) =<br />

k=0<br />

∞∑<br />

Du k x.<br />

Théorème 3.2.2 Soit I ⊂ R un intervalle ouvert, soient f p : I −→ F , p ∈ N une suite de<br />

fonctions dérivables à valeurs dans un espace de Banach F . On suppose que<br />

i) Il existe t 0 ∈ I tel que la suite (f p (t 0 )) converge.<br />

ii) Il existe une fonction g : I −→ F telle que, pour tout a ∈ I, il existe un intervalle<br />

ouvert I(a) contenant a tel que la suite de fonctions (f ′ p) converge uniformément vers une fonction<br />

g : I −→ F sur I(a).<br />

Alors il existe une fonction f : I −→ F telle que pour tout a ∈ I la suite de fonctions (f p )<br />

converge uniformément vers f sur I(a) et l’on a<br />

k=0<br />

f ′ (t) = g(t) pour tout t ∈ I.<br />

54


3.3 Applications Strictement Différentiables<br />

Définition 3.3.1 Soit f : U −→ F une application définie sur un ouvert d’un espace normé E et<br />

à valeurs dans un espace normé F . On dit que f est strictement différentiable en a ∈ U s’il existe<br />

une application linéaire continue ϕ ∈ L(E, F ) telle que, pour tout ε > 0, il existe η > 0 tel que<br />

f − ϕ soit ε-Lipschitzienne sur B(a, η), ce qui signifie<br />

pour tout x, z ∈ B(a, η), ‖f(z) − f(x) − ϕ(z − x)‖ ≤ ε‖z − x‖.<br />

Une application strictement différentiable en a est différentiable en a et Df(a) = ϕ. Il suffit de<br />

remplacer x par a dans l’inégalité ci-dessus.<br />

Théorème 3.3.1 Soit f : U −→ F une application définie sur un ouvert d’un espace normé E et<br />

à valeurs dans un espace normé F . On suppose que f est différentiable sur U et que l’application<br />

Df est continue en a. Alors f est strictement différentiable en a.<br />

Démonstration. Posons g(x) = f(x) − f(a) − Df(a)(x − a). On a Dg(x) = Df(x) − Df(a).<br />

Utilisant la continuité de Df en a et pour tout ε > 0, il existe donc η > 0 tel que, pour tout<br />

y ∈ B(a, η)<br />

‖Dg(y)‖ ≤ ε.<br />

D’après le Corollaire 3.2.1 pour tout x, z ∈ B(a, η), on a<br />

d’où le résultat.<br />

‖f(z) − f(x) − Df(a)(z − x)‖ = ‖g(z) − g(x)‖<br />

≤<br />

≤<br />

sup ‖Dg(y)‖ × ‖z − x‖<br />

y∈B(a,η)<br />

ε‖z − x‖<br />

Il existe des applications strictement différentiable en un point sans que la différentielle soit<br />

continue en 0.<br />

Exemple 3.3.1 Introduisons la fonction paire h :] − 1, 1[−→ R définie par<br />

⎧<br />

⎨ 0 si x = 0<br />

h(x) =<br />

⎩<br />

(n + 1) −1 si x ∈ [(n + 1) −1 , n −1 [<br />

et posons pour x ∈] − 1, 1[<br />

f(x) =<br />

∫ x<br />

0<br />

h(t) dt.<br />

Soit ε > 0 et n ∈ N ∗ tel que n + 1 −1 ≤ εn −1 . Comme |h(t)| ≤ ε sur ]−ε, ε[, f est ε-Lipschitzienne<br />

sur ] − ε, ε[ ce qui montre que f est strictement différentiable en 0 avec f ′ (0) = 0 alors que f<br />

n’est pas dérivable aux points x = n −1 .<br />

55


On a cependant la<br />

Proposition 3.3.1 Soit f : U −→ F une application définie sur un ouvert d’un espace normé E<br />

et à valeurs dans un espace normé F . On suppose que f est différentiable sur U et strictement<br />

différentiable en a ∈ U. Alors Df est continue en a.<br />

Démonstration. Soit ε > 0 et η > 0 tel que h = f − Df(a) soit ε-Lipschitzienne sur B(a, η). Il<br />

résulte de la Proposition 3.2.1 que ‖Dh(x)‖ = ‖Df(x) − Df(a)‖ ≤ ε pour tout x ∈ B(a, η).<br />

3.4 Opérateurs de Nemicki<br />

Soit U un ouvert d’un espace normé E, f : U −→ F une application continue à valeurs dans<br />

un espace normé F et I un intervalle compact de R. On note C(I, E) l’ensemble des fonctions<br />

continues de I dans E et l’on munit cet ensemble de la norme ‖.‖ ∞ de la convergence uniforme.<br />

On définit<br />

Ω = {x ∈ C(I, E) : x(I) ⊂ U} (3.5)<br />

et on introduit<br />

définie pour tout x ∈ Ω par<br />

N f : Ω −→ C(I, F )<br />

N f (x) = f ◦ x.<br />

Théorème 3.4.1 L’ensemble Ω défini en 3.5 est ouvert dans C(I, E) et l’application N f est continue.<br />

Démonstration. a) Ω est ouvert. Soit x ∈ Ω. Pour tout z ∈ x(I), il existe η z > 0 tel que<br />

B(z, 2η z ) ⊂ U. Du fait de la compacité de x(I), il existe n ∈ N ∗ et z 1 , . . . , z n ∈ x(I) tels que<br />

Posons η = min 1≤i≤n η zi . On a<br />

x(I) ⊂<br />

n⋃<br />

B(z i , η zi ).<br />

i=1<br />

B(x, η) ⊂ Ω.<br />

En effet, soit z ∈ B(x, η) et t ∈ I. Il existe alors i ∈ [1, n] tel que x(t) ∈ B(z i , η zi ). On a<br />

‖z(t) − z i ‖ ≤ ‖z(t) − x(t)‖ + ‖x(t) − z i ‖ ≤ 2η zi ,<br />

ce qui montre que z(t) ∈ B(z i , 2η zi ) ⊂ U. On a donc bien z ⊂ Ω.<br />

b) N f est continue. Soit x ∈ Ω et ε > 0. Pour tout z ∈ x(I), il existe η z > 0 tel que pour tout<br />

y ∈ B(z, 2η z ) on ait ‖f(y) − f(z)‖ ≤ ε/2. Du fait de la compacité de x(I), il existe n ∈ N ∗ et<br />

z 1 , . . . , z n ∈ x(I) tels que<br />

n⋃<br />

x(I) ⊂ B(z i , η zi ).<br />

i=1<br />

56


Soit alors 0 < η ≤ min 1≤i≤n η zi assez petit pour que B(x, η) ⊂ Ω. Pour tout y ∈ B(x, η) et pour<br />

tout t ∈ I, il existe i ∈ [1, n] tel que x(t) ∈ B(z i , η zi ). On a<br />

‖y(t) − z i ‖ ≤ ‖y(t) − x(t)‖ + ‖x(t) − z i ‖ ≤ 2η zi ,<br />

‖x(t) − z i ‖ ≤ 2η zi ,<br />

d’où<br />

‖f(y(t) − f(x(t))‖ ≤ ‖f(y(t) − f(z i )‖ + ‖f(z i ) − f(x(t))‖ ≤ ε.<br />

On a alors<br />

d’où le résultat.<br />

‖N f (y) − N f (x)‖ ∞ = ‖f(y) − f(x)‖ ∞ = sup ‖f(y(t)) − f(x(t))‖ ≤ ε<br />

t∈I<br />

L’opérateur N f est alors appelé opérateur de Nemicki associé à f. On considère alors un ouvert<br />

U ⊂ R × E et f : U −→ F une application continue. On pose<br />

A = {x ∈ C(I, E) : (t, x(t)) ∈ U pour tout t ∈ I}.<br />

L’ensemble A est ouvert, (éventuellement vide). En effet on a A = L −1 (Ω) où<br />

Ω = {u ∈ C(I, R × E) : u(I)) ∈ U}<br />

et<br />

est définie par<br />

L : C(I, E) −→ C(I, R × E)<br />

L(x) = (Id R , x).<br />

Comme L est continue et Ω ouvert, il en est donc bien de même de A. Introduisons<br />

N f : A −→ C(I, F )<br />

définie par<br />

N f (x) = (N f ◦ L)(x),<br />

à savoir N f (x) = f(·, x(·)). L’application N f est alors continue comme composée de deux applications<br />

continues. Etudions alors la différentiabilité de N f .<br />

Théorème 3.4.2 Soit f : U −→ F continue telle que D 2 f existe et est continue sur U. Alors<br />

l’application N f est de classe C 1 sur A et pour tout x ∈ A, h ∈ C(I, E), t ∈ I,<br />

)<br />

(DN f (x)(h) (t) = D 2 f(t, x(t))(h(t)).<br />

57


Démonstration. D’après le Théorème 3.4.1, l’application<br />

N D2 f : A −→ C(I, L(E, F ))<br />

définie par<br />

N D2 f = N D2 f ◦ L<br />

est continue. Soit x ∈ A. Pour tout ε > 0, il existe donc η > 0 tel que ‖y − x‖ ∞ ≤ η implique<br />

y ∈ A et<br />

‖N D2 f(y) − N D2 f(x)‖ ∞ = sup ‖D 2 f(t, y(t)) − D 2 f(t, x(t))‖ L(E,F ) ≤ ε.<br />

t∈I<br />

Soit h ∈ C(I, E) tel que ‖h‖ ∞ < η, soit t ∈ I. Posons<br />

ϕ t (ξ) = f(t, x(t) + ξ) − f(t, x(t)) − D 2 f(t, x(t))(ξ).<br />

Remarquons que ϕ t (ξ) est défini et différentiable sur B(0, η) avec<br />

Dϕ t (ξ) = D 2 f(t, x(t) + ξ) − D 2 f(t, x(t)).<br />

D’où<br />

sup ‖Dϕ t (ξ)‖ ≤ sup ‖D 2 f(t, x(t) + ξ) − D 2 f(t, x(t))‖ ≤ ε.<br />

‖ξ‖


(M est fini comme borne supérieure d’une fonction continue sur un compact). Il en résulte que<br />

‖L(h)‖ ≤ M‖h‖,<br />

ce qui montre que L ∈ L(C(I, E), C(I, F )) et donc que N f est différentiable en x. Reste à montrer<br />

que DN f est continue. Pour tout x, y, pour tout h ∈ C(I, E) et pout tout t ∈ I, on a<br />

de telle sorte que<br />

donc<br />

‖((DN f (y) − DN f (x))(h))(t)‖ ≤ ‖D 2 f(t, y(t)) − D 2 f(t, x(t))‖ L(E,F ) ‖h(t)‖,<br />

‖(DN f (y) − DN f (x))(h)‖ ∞ ≤ sup ‖D 2 f(t, y(t)) − D 2 f(t, x(t))‖ L(E,F ) ‖h‖ ∞<br />

t∈I<br />

‖DN f (y) − DN f (x)‖ L(C(I,E),C(I,F )) ≤ sup ‖D 2 f(t, y(t)) − D 2 f(t, x(t))‖ L(E,F ) ,<br />

t∈I<br />

ce qui montre que<br />

‖DN f (y) − DN f (x)‖ L(C(I,E),C(I,F )) ≤ ‖N D2 f(y) − N D2 f(x)‖ ∞ ,<br />

ce qui achève la démonstration car N D2 f est continue.<br />

Le Théorème 3.4.2 a de nombreuses applications. Citons le<br />

Théorème 3.4.3 Soit I = [a, b] un intervalle compact. Soit E un espace normé, U ⊂ R × E un<br />

ouvert et f : U −→ R n une application continue. On pose<br />

A = {x ∈ C(I, E) : (t, x(t)) ∈ U pour tout t ∈ I}<br />

et on définit une application I f : A −→ R n par<br />

Alors,<br />

a) I f est continue sur A.<br />

I f (x) =<br />

∫ b<br />

a<br />

f(t, x(t)) dt.<br />

b) Si de plus D 2 f existe et est continue sur U, l’application I f est de classe C 1 sur A et, pour<br />

x ∈ A et h ∈ C(I, E)<br />

(DI f (x))(h) =<br />

∫ b<br />

a<br />

D 2 f(t, x(t))h(t) dt.<br />

59


Démonstration. a) Définissons<br />

par<br />

I : C(I, R n ) −→ R n<br />

I(z) =<br />

∫ b<br />

a<br />

z(t) dt.<br />

Il est clair que I est linéaire continue et que I f = I ◦ N f . On obtient donc bien que I f est continue<br />

comme composée de deux applications continues.<br />

b) D’après le Théorème 3.4.2 l’application N f est continuement différentiable. Il en est donc<br />

de même de I f . Pour x ∈ A et h ∈ C(I, E), on a<br />

(DI f (x)h) = (I ◦ DN f (x))(h) =<br />

∫ b<br />

a<br />

D 2 f(t, x(t))(h(t)) dt.<br />

Remarque 3.4.1 Dans le cas où U ⊃ I × V où V est un ouvert de E, le Théorème 3.4.1 montre<br />

que l’ensemble Ω = {x ∈ C(I, E) : x(I) ⊂ V } est ouvert dans C(I, E). Comme A ⊃ Ω , il en<br />

résulte que A est non vide.<br />

3.5 Primitives et Intégrales des Fonctions Réglées<br />

Définition 3.5.1<br />

a) Soit I un intervalle d’extrémités éventuellement infinies a et b et f : I −→ E une fonction<br />

à valeurs dans un espace de Banach E. On dit que f est une fonction en escalier sur I s’il existe<br />

une suite finie a = t 0 < · · · < t n = b telle que f soit constante sur chacun des intervalles ]t i , t i+1 [<br />

pour tout 0 ≤ i ≤ n − 1.<br />

b) On dit que f : I −→ E est une fonction réglée si elle admet une limite à droite et une limite<br />

à gauche en tout t ∈ I. (Une fonction en escalier est réglée, une fonction continue est réglée ainsi<br />

qu’une fonction monotone à valeurs dans R).<br />

Le résultat suivant caractérise l’ensemble des fonctions réglées sur un intervalle compact<br />

comme étant l’adhérence pour la topologie de la convergence uniforme de l’ensemble des fonctions<br />

en escalier<br />

Théorème 3.5.1 Soit I un intervalle compact et f : I −→ E une fonction à valeurs dans un<br />

espace de Banach E. Alors les deux propriétés suivantes sont équivalentes,<br />

i) f est une fonction réglée,<br />

ii) f est limite uniforme sur I d’une suite de fonctions en escalier.<br />

60


Démonstration<br />

i) =⇒ ii). Pour tout n ∈ N ∗ et pour tout t ∈ I il existe, par application du critère de Cauchy à<br />

droite et à gauche en t, un intervalle ouvert I(t) =]a(t), b(t)[ contenant t tel que<br />

‖f(s) − f(s ′ )‖ ≤ 1/n<br />

pour tout s, s ′ ∈ I∩]t, b(t)[ ou s, s ′ ∈ I∩]a(t), t)[. Par compacité il existe m ∈ N ∗ et t 1 , . . . , t m ∈ I<br />

tels que I ⊂ ⋃ m<br />

i=1 I(t i). Soit alors c 0 < c 1 < · · · < c k la suite telle que<br />

{c 0 , . . . , c k } = {a, b, t i , a(t i ), b(t i ) : 1 ≤ i ≤ m} ∩ I.<br />

Chaque c j appartient à un intervalle I(t i ). Si c j ∈]a(t i ), t i [ alors c j < c j+1 ≤ t i . Si c j ∈ [t i , b(t i )[,<br />

alors c j < c j+1 ≤ b(t i ). Dans tous les cas on a |f(s) − f(s ′ )| ≤ 1/n sur ]c j , c j+1 [∩I. Soit alors la<br />

fonction f n définie par<br />

f n (c j ) = f(c j ) si c j ∈ I,<br />

f n (t) = f(τ j ) si t ∈]c j , c j+1 [∩I où τ j ∈]c j , c j+1 [∩I.<br />

On a alors ‖f n − f‖ ∞ ≤ 1/n, d’où le résultat.<br />

ii) =⇒ i). Soit t ∈ I. Pour tout ɛ > 0 il existe n ∈ N tel que ‖f n − f‖ ∞ ≤ ɛ/3. La fonction f n<br />

étant en escalier, il existe η > 0 tel que f n prend des valeurs constantes sur chacun des intervalles<br />

]t, t + η[∩I et ]t − η, t[∩I. Pour tout s, s ′ ∈]t, t + η[∩I ou s, s ′ ∈]t − η, t[∩I, on a<br />

‖f(s ′ ) − f(s)‖ ≤ ‖f(s ′ ) − f n (s ′ )‖ + ‖f n (s ′ ) − f n (s)‖ + ‖f n (s ′ ) − f(s)‖ ≤ ɛ.<br />

Le critère de Cauchy est alors vérifié à droite et à gauche en t. Il en résulte bien l’existence de<br />

limites à droite et à gauche en t, l’espace E étant supposé complet. □<br />

Définition 3.5.2 Soit I ⊂ R un intervalle et f : I −→ E une fonction à valeurs dans un espace<br />

de Banach E. On dit que la fonction continue Φ : I −→ E est une primitive de f dans I s’il existe<br />

une partie au plus dénombrable D ⊂ I telle que Φ soit dérivable sur I \ D et telle que Φ ′ = f<br />

sur I \ D.<br />

Proposition 3.5.1 Soit I ⊂ R un intervalle et f : I −→ E une fonction à valeurs dans un espace<br />

de Banach E. Alors si Φ 1 et Φ 2 sont deux primitives de f sur I, Φ 1 − Φ 2 est constante sur I.<br />

Démonstration<br />

D’après la définition des primitives, il existe deux parties au plus dénombrables D 1 et D 2 de<br />

I telles que (Φ 1 − Φ 2 ) ′ = 0 sur I \ (D 1 ∪ D 2 ). Écrivons I comme réunion d’une suite croissante<br />

d’intervalles compacts I n . D’après le Corollaire 3.1.1 la fonction Φ 1 −Φ 2 est constante sur chaque<br />

I n donc sur I, (détaillez le raisonnement en exercice). □<br />

Lemme 3.5.1 Soit I un intervalle compact de R et soit f : I −→ E une fonction en escalier,<br />

alors f admet une primitive sur I.<br />

61


Démonstration<br />

Soient a < b les extrémités de I et soit t −1 = 0 et a = t 0 < · · · < t n = b telle que pour tout<br />

0 ≤ i ≤ n − 1 f(t) = c i sur l’intervalle ]t i , t i+1 [. Posons F (t) = c 0 (t − t 0 ) pour t ∈ [t 0 , t 1 ] et pour<br />

1 ≤ i ≤ n − 1 et t ∈ [t i , t i+1 ]<br />

∑i−1<br />

F (t) = c i (t − x i ) + c k (t k+1 − t k )<br />

Nous laissons au lecteur le soin de vérifier que F est continue et vérifie F ′ (t) = f(t) pour tout<br />

t ∈ I \ {t 0 , . . . , t n }. □<br />

Théorème 3.5.2 Soit I ⊂ R un intervalle et f : I −→ E une fonction réglée à valeurs dans un<br />

espace de Banach E. Alors f admet une primitive Φ dans I.<br />

Démonstration<br />

Remarquons que I s’écrit comme réunion croissante d’une suite (I n ) d’intervalles compacts.<br />

Soit t 0 ∈ int (I). Supposons démontré que f possède une primitive Φ n dans I n telle que Φ n (t 0 ) =<br />

0. On observe alors que si m ≥ n, on a Φ m | ∣ = Φ n . En effet ces deux primitives d’une même<br />

n<br />

fonction différent d’une constante d’après la Proposition 3.5.1. Comme elles sont égales en t 0<br />

elles coïncident sur I n . On définit alors sans ambiguïté une primitive Φ de f par Φ(t) = Φ n (t) si<br />

t ∈ I n .<br />

On peut donc supposer I compact. D’après le Théorème 3.5.1 f est limite uniforme dans I<br />

d’une suite de fonctions en escalier (f n ). Soit Φ n une primitive de f n et D n ⊂ I telle que Φ ′ n = f n<br />

sur I \ D n . Choisissons Φ n telle que Φ n (t 0 ) = 0 où t 0 ∈ I. On peut alors appliquer le Théorème<br />

3.2.2 qui nous permet de conclure que la suite (Φ n ) converge uniformément vers une fonction Φ<br />

telle que Φ ′ = f sur l’ensemble I \ D où D = ⋃ n≥0 D n est au plus dénombrable, ce qui achève<br />

la démonstration. □<br />

On peut alors définir l’intégrale d’une fonction réglée définie sur un intervalle I et à valeurs<br />

dans un espace de Banach. Pour cette intégrale une primitive de fonction réglée est l’intégrale de<br />

sa dérivée.<br />

Théorème 3.5.3 THÉORÈME ET DÉFINITION<br />

Soit I ⊂ R un intervalle et f : I −→ E une fonction réglée à valeurs dans un espace de<br />

Banach E. On pose, pour tout a, b ∈ I (on ne suppose pas a ≤ b)<br />

∫ b<br />

a<br />

k=0<br />

f(t)dt = Φ(b) − Φ(a)<br />

où Φ est une primitive de f dont l’existence est garantie par le Théorème 3.5.2. On a alors<br />

∥<br />

∫ b<br />

a<br />

f(t)dt∥ ≤ ∣<br />

∫ b<br />

a<br />

∣<br />

‖f(t)‖dt∣.<br />

62


Démonstration<br />

La définition de ∫ b<br />

f(t)dt ne dépend pas de la primitive Φ car d’après la Proposition 3.5.1,<br />

a<br />

deux primitives d’une même fonction différent d’une constante. Pour démontrer l’inégalité<br />

∥<br />

∫ b<br />

a<br />

f(t)dt∥ ≤ ∣<br />

∫ b<br />

a<br />

‖f(t)‖dt∣<br />

on suppose a ≤ b. Soit Φ la primitive de f telle que φ(a) = 0. On a, pour tout t ∈ [a, b]<br />

Φ(t) =<br />

∫ t<br />

a<br />

f(s)ds.<br />

Il existe alors une partie au plus dénombrable D ⊂ [a, b] telle que sur [a, b] \ D,<br />

Φ ′ (t) = f(t),<br />

d’où ‖Φ ′ (t)‖ = ‖f(t)‖. Remarquons que la fonction ‖f(.)‖ est réglée car la norme est continue.<br />

Il existe donc ∆ ⊂ [a, b] au plus dénombrable telle que G ′ (t) = ‖f(t)‖ où G(t) = ∫ t<br />

‖g(s)‖ds.<br />

a<br />

Pour t ∈ [a, b] \ (D ∪ ∆) on a donc<br />

D’après le Théorème 3.1.1 on obtient<br />

d’où<br />

Remarque 3.5.1<br />

‖Φ ′ (t)‖ ≤ G ′ (t).<br />

‖F (b) − F (a)‖ ≤ G(b) − G(a),<br />

∥<br />

∫ b<br />

a<br />

f(t)dt∥ ≤<br />

∫ b<br />

a<br />

‖f(t)‖dt. □<br />

a) Soit I = [a, b], f : I −→ E une fonction en escalier à valeurs dans un espace de Banach<br />

E et soient a = t 0 < · · · < t n = b telle que f(t) = c i sur ]t i , t i+1 [. On sait que la fonction<br />

Φ : I −→ E définie par Φ(t) = c 0 (t − t 0 ) si t ∈ [t 0 , t 1 ] et<br />

∑i−1<br />

Φ(t) = c i (t − t i ) + c k (t k+1 − t k )<br />

k=0<br />

si t ∈ [t i , t i+1 ] est une primitive de f sur [a, b]. On a donc<br />

∫ b<br />

a<br />

∑n−2<br />

f(t)dt = Φ(b) − Φ(a) = c n−1 (t n − t n−1 ) + c k (t k+1 − t k )<br />

k=0<br />

d’où<br />

∫ b<br />

∑n−1<br />

f(t)dt = c k (t k+1 − t k ).<br />

a<br />

k=0<br />

63


) Il est important d’observer que si f : [a, b] −→ E est une fonction réglée, la fonction<br />

Φ : [a, b] → E définie par<br />

est une primitive de f sur [a, b].<br />

Φ(t) =<br />

∫ t<br />

a<br />

f(s)ds<br />

c) Si f : I −→ E est continue on a, pour toute primitive Φ de f<br />

Φ ′ (t) = f(t) pour tout t ∈ I.<br />

En effet on peut supposer que Φ(t) = ∫ t<br />

t 0<br />

f(s)ds pour un certain t 0 ∈ I. Il en résulte donc que<br />

‖Φ(t + h) − Φ(t) − hf(t)‖ =<br />

≤<br />

∥<br />

∣<br />

∫ t+h<br />

t<br />

∫ t+h<br />

t<br />

(f(s) − f(t))ds∥<br />

∣<br />

‖f(s) − f(t)‖ds∣.<br />

Etant donné ɛ > 0 il existe η > 0 tel que |s − t| ≤ η implique ‖f(s) − f(t)‖ ≤ ɛ. On a donc, pour<br />

|s − t| ≤ η<br />

∫ t+h<br />

‖Φ(t + h) − Φ(t) − hf(t)‖ ≤ ∣ ɛds∣ = ɛ|h|,<br />

d’où le résultat.<br />

Théorème 3.5.4 Soit I ⊂ R un intervalle et g : I −→ E une fonction à valeurs dans un espace<br />

de Banach E qui est primitive d’une fonction réglée. (Cela signifie que g est continue, qu’il existe<br />

une fonction réglée g ′ telle que la dérivée de g en t soit égale à g ′ (t) pour tout t ∈ I \ D où D ⊂ I<br />

est au plus dénombrable). Alors, pour tout t 0 , t ∈ I<br />

Démonstration<br />

Comme g ′ est réglée, la fonction<br />

g(t) = g(t 0 ) +<br />

γ(t) = g(t 0 ) +<br />

∫ t<br />

t<br />

t 0<br />

g ′ (s)ds.<br />

∫ t<br />

t 0<br />

g ′ (s)ds<br />

est une primitive de g ′ sur [a, b]. Comme g est aussi une primitive de g ′ et que g(t 0 ) = γ(t 0 ) on a<br />

g(.) = γ(.) sur I, ce qui achève la démonstration. □<br />

Nous laissons au lecteur le soin d’établir les règles de calcul pour cette intégrale. Nous donnons<br />

cependant le résultat utile suivant qui permet d’établir un lien entre l’intégrale de la limite et la<br />

limite des intégrales.<br />

64


Théorème 3.5.5 Soit I = [a, b] un intervalle compact et soit f n : I −→ F une suite de fonctions<br />

réglées à valeurs dans un espace de Banach F . On suppose que (f n ) converge uniformément vers<br />

f dans I. Alors f est réglée dans I et<br />

∫ b<br />

lim<br />

n→∞<br />

a<br />

f n (t)dt =<br />

∫ b<br />

a<br />

f(t)dt.<br />

Démonstration<br />

La fonction f est réglée. En effet, d’après le Théorème 3.5.1 pour tout n ∈ N, il existe une<br />

fonction ϕ n en escalier dans I telle que<br />

‖ϕ n − f n ‖ ≤ 1/n.<br />

La suite (ϕ n ) converge donc uniformément vers f dans I, ce qui montre, utilisant de nouveau le<br />

Théorème 3.5.1 que f est réglée dans I. On a alors<br />

∥<br />

∫ b<br />

a<br />

d’où le résultat. □<br />

f n (s)ds −<br />

∫ b<br />

a<br />

f(s)ds∥ ≤<br />

∫ b<br />

a<br />

‖f n (s) − f(s)‖ds ≤ (b − a)‖f n − f‖ ∞<br />

Théorème 3.5.6 Soient F , G des espaces de Banach, soit I = [a, b] un intervalle compact, soit<br />

f : I −→ F une fonction réglée et soit u ∈ L(F, G). Alors u ◦ f est réglée et<br />

( ∫ b<br />

u<br />

a<br />

)<br />

f(t)dt) =<br />

∫ b<br />

a<br />

u(f(t))dt.<br />

Démonstration<br />

Le fait que u ◦ f soit réglée découle de la continuité de u. Supposons que f est en escalier, il<br />

en est alors de même de u ◦ f. On a alors<br />

∫ b<br />

a<br />

( ∫ b<br />

u<br />

a<br />

f(t)dt =<br />

)<br />

f(t)dt<br />

=<br />

=<br />

∑n−1<br />

c k (t k+1 − t k ),<br />

k=0<br />

n−1<br />

∑<br />

u(c k )(t k+1 − t k )<br />

k=0<br />

∫ b<br />

a<br />

u(f(t))dt.<br />

Revenons au cas général. Il existe une suite (f n ) de fonctions en escalier qui converge uniformément<br />

vers f sur I. Comme, pour tout n ∈ N et pour tout t ∈ I, on a<br />

‖u(f n (t)) − u(f(t))‖ ≤ ‖u‖‖f n (t)) − (f(t)‖,<br />

65


la suite de fonctions en escalier (u ◦ f n ) converge uniformément vers u ◦ f sur I. Utilisant le<br />

Théorème 3.5.5, il vient<br />

∫ b<br />

a<br />

( ∫ b<br />

u(f(t))dt = lim<br />

n→∞<br />

= lim<br />

= u<br />

a<br />

u<br />

n→∞<br />

a<br />

( ∫ b<br />

lim<br />

n→∞<br />

a<br />

( ∫ b )<br />

= u f(t)dt<br />

d’après le Théorème 3.5.5, d’où le résultat. □<br />

Exemple 3.5.1<br />

a<br />

)<br />

u(f n (t))dt<br />

( ∫ b )<br />

(f n (t))dt car f n est en escalier,<br />

)<br />

(f n (t))dt car u est continue,<br />

a) Dans le cas où F = R n , G = R, i ∈ [1, n], u(x 1 , . . . , x n ) = x i et f(t) = (f 1 (t), . . . , f n (t)),<br />

on a<br />

( ∫ b ) ∫ b<br />

f(t)dt = f i (t)dt, et donc<br />

a<br />

i a<br />

∫ b ( ∫ b<br />

∫ b )<br />

f(t)dt = f 1 (t)dt, . . . , f n (t)dt .<br />

a<br />

a<br />

b) Dans le cas où u : L(E, F ) → F est définie par u(A) = A(h), h étant un élément fixé de<br />

E (vérifiez que u ∈ L(L(E, F ), F )) et si A : I → L(E, F ) est réglée, le Théorème 3.5.6 conduit<br />

à<br />

∫ b<br />

( ∫ b )<br />

A(t)(h)dt = A(t)dt (h).<br />

a<br />

a<br />

a<br />

66


Chapitre 4<br />

Différentielles d’Ordre Supérieur<br />

4.1 Définition des Différentielles d’Ordre Supérieur<br />

Soit f : U −→ F différentiable sur U et a ∈ U. Il est naturel de s’intéresser à la différentiabilité<br />

en a de l’application<br />

Df : U −→ L(E, F ).<br />

Rappellons qu’étant donnés des espaces normés E et F et un entier p ∈ N, on désigne par<br />

L p (E; F ) l’ensemble des applications de E p dans F qui sont multilinéaires (i.e. linéaires par<br />

rapport à chaque variable) et continues. On définit alors par récurrence la différentielle d’ordre p<br />

d’une application f : U −→ F .<br />

Définition 4.1.1 Soit f : U −→ F et p ≥ 2 un entier. On dit que f est p fois différentiable en<br />

a ∈ U si D p−1 f(x) ∈ L p−1 (E; F ) existe dans un voisinage V ⊂ U de a et si l’application<br />

D p−1 f : V −→ L p−1 (E; F )<br />

est différentiable en a. Pour tout u = (u 1 , · · · , u p ) ∈ E p on pose alors<br />

On a alors D p f(a) ∈ L p (E; F ).<br />

D p f(a)(u 1 , · · · , u p ) = (D(D p−1 f)(a)(u 1 ))(u 2 , · · · , u p ).<br />

On vérifie que cette définition est bien cohérente : on a D(D p−1 f)(a) ∈ L(E, L p−1 (E; F )), donc<br />

D(D p−1 f)(a)(u 1 ) ∈ L p−1 (E; F ) et (D(D p−1 f)(a)(u 1 ))(u 2 , · · · , u p ) ∈ F . Il est clair que D p f(a)<br />

est multilinéaire. Le fait que D p f(a) soit continue découle des inégalités suivantes<br />

‖D p f(a)(u 1 , · · · , u p )‖ ≤ ‖D(D p−1 f)(a)(u 1 )‖ L p−1 (E;F )‖u 2 ‖ · · · ‖u p ‖<br />

≤<br />

‖D(D p−1 f)(a)‖ L(E,L p−1 (E;F )‖u 1 ‖‖u 2 ‖ · · · ‖u p ‖.<br />

Remarque 4.1.1 On a vu au Théorème 1.5.2 que l’application<br />

Φ : L(E, L p−1 (E; F )) −→ L p (E; F )<br />

définie pour g ∈ L(E, L p−1 (E; F )) et (x 1 , · · · , x p ) ∈ E p par<br />

Φ(g)(x 1 , · · · , x p ) = g(x 1 )(x 2 , · · · , x p )<br />

67


est une isométrie linéaire de L(E, L p−1 (E; F )) dans L p (E; F ) et l’isométrie réciproque<br />

Ψ : L p (E; F ) → L(E, L p−1 (E; F ))<br />

est définie, pour tout f ∈ L p (E; F ), x ∈ E et (x 1 , · · · , x p−1 ) ∈ E p−1 par<br />

Ψ(f)(x)(x 1 , · · · , x p−1 ) = f(x, x 1 , · · · , x p−1 ).<br />

Avec ces notations, on a, si f est p fois différentiable en a,<br />

Ψ(D p f(a)) = D(D p−1 f)(a), (4.1)<br />

et<br />

Φ(D(D p−1 f)(a)) = D p f(a). (4.2)<br />

Si de plus f est p fois différentiable dans un voisinage V de a, alors<br />

D(D p−1 f) = Ψ ◦ D p f sur V,<br />

et<br />

D p f = Φ ◦ D(D p−1 f) sur V.<br />

Dans le cas où f est définie sur un intervalle ouvert de R, il est utile de faire le lien entre différentielle<br />

d’ordre p et dérivée d’ordre p.<br />

Définition 4.1.2 Soit f : I −→ E une fonction définie sur un intervalle ouvert I de R et p ∈ N ∗ .<br />

On dit que f est p fois dérivable en a ∈ I si f (p−1) existe au voisinage de a et est dérivable en a.<br />

On pose alors f (p) = (f (p−1) ) ′ .<br />

Proposition 4.1.1 Soit f : I −→ E une fonction définie sur un intervalle ouvert I de R. Alors<br />

f est p fois dérivable en a si et seulement si f est p fois différentiable en a. De plus pour tout<br />

(u 1 , · · · , u p ) ∈ R p on a<br />

D p f(a)(u 1 , · · · , u p ) = u 1 · · · u p f (p) (a) (4.3)<br />

et<br />

f (p) (a) = D p f(a)(1, · · · , 1). (4.4)<br />

Démonstration. Par récurrence sur p. Pour p = 1, c’est le Théorème 2.1.1 du Chapitre 2. Supposons<br />

le résultat à l’ordre p. Les relations (4.3) et (4.4) peuvent s’ecrire<br />

D p f = α ◦ f (p) et f (p) = e ◦ D p f,<br />

où α : E −→ L p (R; E) et e : L p (R; E) −→ E sont les applications linéaires continues définies<br />

pour tout x ∈ E, t 1 , · · · , t p ∈ R p , A ∈ L p (R; E) par α(x)(t 1 , · · · , t p ) = t 1 · · · t p x et e(A) =<br />

A(1, · · · , 1). Le résultat découle alors des Théorèmes 2.1.1 et 2.2.1 du chapitre 2. On obtient que<br />

D p f est différentiable en a et que<br />

D(D p f)(a) = α ◦ Df (p) (a),<br />

68


d’où<br />

D p+1 f(a)(u 1 , · · · , u p+1 ) = ((D(D p f)(a))(u 1 ))(u 2 , · · · , u p+1 )<br />

= α(u 1 f (p+1) (u 2 , · · · , u p+1 )<br />

et que f (p) est dérivable en a avec<br />

= u 1 · · · u p+1 f (p+1) (a),<br />

f (p+1) (a) = e((D p f) ′ (a))<br />

= e(D(D p f)(a)(1))<br />

= (D(D p f)(a)(1))(1, · · · , 1)<br />

= D p+1 f(a)(1, · · · , 1).<br />

Définition 4.1.3 On dit que f est de classe C p sur U si D p f existe sur U et si l’application<br />

D p f : U −→ L p (E; F ) est continue. On dit que f est de classe C ∞ si f est de classe C p pour tout<br />

p ∈ N ∗ .<br />

Un exemple simple de fonction de classe C ∞ est fourni par la :<br />

Proposition 4.1.2 Soit f ∈ L 2 (E, F ; G) une application bilinéaire continue, alors f est de classe<br />

C ∞ et D p f = 0 pour tout p > 2.<br />

Démonstration. On sait (voir chapitre 2, exemple 2.1.1, c)) que f est différentiable sur E × F et<br />

que pour tout (x 1 , x 2 ) ∈ E 2 , (u, v) ∈ E 2<br />

Df(x 1 , x 2 )(u, v) = f(x 1 , v) + f(u, x 2 ).<br />

Il en résulte aisément que Df : E × E −→ L(E × E, F ) est linéaire continue (le vérifier). On<br />

en déduit que D(Df)(x 1 , x 2 ) = Df pour tout (x 1 , x 2 ) ∈ E × F donc l’application D 2 f(.) est<br />

constante ce qui implique bien D p f = 0 pour p > 2.<br />

Proposition 4.1.3 Soient U ⊂ E, V ⊂ F des ouverts, soient f : U −→ V 2 fois différentiable en<br />

a ∈ U et g : V −→ G et g 2 fois différentiable en b = f(a). Alors g ◦ f est 2 fois différentiable en<br />

a.<br />

69


Démonstration. Définissons Φ : L(F, G) × L(E, F ) −→ L(E, G) par Φ(A, B) = A ◦ B.<br />

L’application Φ est bilinéaire et comme ‖Φ(A, B)‖ ≤ ‖A‖‖B‖, elle est continue. Utilisant le<br />

Théorème 2.2.1 du chapitre 2, on a, pour tout x voisin de a<br />

ce que l’on peut écrire<br />

D(g ◦ f)(x) = Dg(f(x)) ◦ Df(x),<br />

D(g ◦ f) = Φ ◦ Θ<br />

avec Θ = (Dg ◦ f, Df). On remarque que Θ est différentiable en a car ses deux composantes le<br />

sont, et que Φ est de classe C ∞ (voir Proposition 4.1.2). On obtient donc bien que D(g ◦ f) est<br />

différentiable en a donc g ◦ f est deux fois différentiable en a.<br />

Les propositions suivante sont utiles pour le calcul des différentielles d’ordre supérieur.<br />

Proposition 4.1.4 Soit f : U −→ F une application p fois différentiable en a ∈ U. Posons, pour<br />

x dans un voisinage de a et pour tout u 2 , · · · , u p ∈ E p−1 ,<br />

g(x) = D p−1 f(x)(u 2 , · · · , u p ).<br />

Alors g est différentiable en a et, pour tout u 1 ∈ E, on a<br />

D p f(a)(u 1 , · · · , u p ) = Dg(a)(u 1 ).<br />

Démonstration. On a g = e ◦ D p−1 f où e : L p−1 (E; F ) −→ F est définie par e(A) =<br />

A(u 2 , · · · , u p ). L’application e est linéaire. De plus ‖e(A)‖ ≤ ‖A‖‖u 2 ‖ · · · ‖u p ‖ donc A est continue.<br />

Il en résulte que g est différentiable en a et que pour tout u 1 ∈ E<br />

Dg(a)(u 1 ) = e(D(D p−1 f)(a)(u 1 ))<br />

= (D(D p−1 )f(a)(u 1 ))(u 2 , · · · , u p )<br />

= D p f(a)(u 1 , · · · , u p ).<br />

Proposition 4.1.5 a) Si f : U −→ F est p fois différentiable en a ∈ U, on a pour tout u ∈ E,<br />

v ∈ E p−1 ,<br />

D p f(a)(u, v) = ϕ ′ (0),<br />

où ϕ(t) = D p−1 f(a + tu)(v).<br />

b) Si f est p fois différentiable en a + tu ∈ U avec u ∈ E et t ∈ R, alors<br />

où ψ(t) = f(a + tu).<br />

D p f(a + tu)(u, · · · , u) = ψ (p) (t),<br />

70


Démonstration. a) On a ϕ = (e ◦ g)(a + tu) avec e(A) = A(v) pour A ∈ L p−1 (E; F ) est linéaire<br />

et continue et g(x) = D p−1 f(x) donc g est différentiable an a et<br />

Dg(a)(u) = D p f(a)(u, ·).<br />

On obtient donc que e ◦ g est différentiable en a, donc ϕ est dérivable en 0 et<br />

ϕ ′ (0) = D(e ◦ g)(a)(u) = e(Dg(a)(u)) = D p f(a)(u, v).<br />

b) Remarquons que ψ est définie dans un intervalle ouvert contenant t. Pour p = 1, ψ est<br />

dérivable en t car f est différentiable en a + tu et t ↦−→ a + tu est dérivable sur R, et, d’après la<br />

règle de la différentielle d’une composée, on a<br />

ψ ′ (t) = Df(a + tu)(u).<br />

Supposons le résultat vrai pour p et considérons f supposée p + 1 fois différentiable en a + tu. Il<br />

en résulte que f est p fois différentiable dans un voisinage de a + tu. Par hypothèse de récurrence,<br />

on obtient donc que la fonction ψ est p fois dérivable au voisinage de t et que<br />

ψ (p) (s) = D p f(a + su)(u, · · · , u),<br />

pour tout s voisin de t. Posant g(x) = D p f(x)(u, · · · , u), on a donc<br />

ψ (p) (s) = g(a + su),<br />

et g est différentiable en a + tu d’après la Proposition 4.1.4. On obtient alors, utilisant de nouveau<br />

la Proposition 4.1.4, que<br />

ce qui donne le résultat au rang p + 1.<br />

ψ (p+1) (t) = Dg(a + su)(u) = D p+1 f(a + tu)(u, · · · , u).<br />

4.2 Propriétés de Symétrie des Différentielles d’Ordre Supérieur<br />

Le résultat suivant (Théorème de SCHWARZ) est fondamental.<br />

Théorème 4.2.1 Soit f : U −→ F une application deux fois différentiable en a ∈ U. Alors pour<br />

tout u, v ∈ E<br />

D 2 f(a)(u, v) = D 2 f(a)(v, u).<br />

Démonstration. Soit ε > 0, utilisant la définition de la différentiabilité de Df en a, il existe δ > 0<br />

tel que<br />

‖Df(a + w) − Df(a) − D(Df)(a)(w)‖ L(E,F ) ≤ ε‖w‖,<br />

71


pour tout w tel que ‖w‖ ≤ δ. Posons, pour tout ‖u‖ ≤ δ/2 et ‖v‖ ≤ δ/2,<br />

G u (v) = f(a + u + v) − f(a + v) − f(a + u) + f(a) − (D(Df)(a)(u))(v).<br />

On a DG u (v) = Df(a + u + v) − Df(a + v) − D(Df)(a)(u) donc<br />

DG u (v) = Df(a+u+v)−Df(a)−D(Df)(a)(u+v)−(Df(a+v)−Df(a)−D(Df)(a)(v)).<br />

On a donc<br />

‖DG u (v)‖ L(E,F ) ≤ ε(‖u‖ + ‖v‖) + ε‖v‖ ≤ 2ε(‖u‖ + ‖v‖).<br />

Utilisant le corollaire 3.2.1 avec C = ¯B(0, ‖v‖), il en résulte que, pour tout ‖u‖ ≤ δ/2 et ‖v‖ ≤<br />

δ/2,<br />

‖G u (v)‖ = ‖G u (v) − G u (0)‖ ≤ ‖v‖<br />

On a alors<br />

sup<br />

‖w‖≤‖v‖<br />

‖DG u (w)‖ L(E,F ) ≤<br />

2‖v‖ε(‖u‖ + ‖v‖) ≤ 2ε(‖u‖ + ‖v‖) 2 .<br />

f(a + u + v) − f(a + v) − f(a + u) + f(a) − (D(Df)(a)(u))(v) = o(‖u‖ + ‖v‖) 2<br />

Soient alors u, v ∈ E, pour tout t assez petit, on a donc<br />

d’où<br />

f(a + tu + tv) − f(a + tv) − f(a + tu) + f(a) − t 2 (D(Df)(a)(u))(v) = o(t 2 ),<br />

f(a + tu + tv) − f(a + tv) − f(a + tu) + f(a)<br />

(D(Df)(a)(u))(v) = lim<br />

.<br />

t→0 t 2<br />

Comme le membre de droite ne change pas quand on permute u et v, il en est de même du membre<br />

de gauche donc (D(Df)(a)(u))(v) = (D(Df)(a)(v))(u), soit D 2 f(a)(u, v) = D 2 f(a)(v, u).<br />

Les propriétés de symétrie de la différentielle seconde s’étendent aux différentiellles d’ordre p.<br />

Théorème 4.2.2 Soit f : U −→ F une application p fois différentiable en a ∈ U. Alors, pour<br />

tout (u 1 , · · · , u p ) ∈ E p et pour toute permutation σ de [1, · · · , p], on a<br />

D p f(a)(u σ(1) , · · · , u σ(p) ) = D p f(a)(u 1 , · · · , u p ).<br />

Démonstration. Il suffit de démontrer le résultat pour une transposition σ i,j<br />

⎧<br />

⎨ k si k ∉ {i, j}<br />

σ i,j (k) = i si k = j,<br />

⎩<br />

j si k = i<br />

car toute permutation de [1, p] est produit d’un nombre fini de telles transpositions. Procédons par<br />

récurrence sur p. Pour p = 2 le résultat est démontré (Théorème 4.2.1). Supposons alors le résultat<br />

vrai pour tout 2 ≤ k ≤ p − 1 avec p ≥ 3.<br />

72


Si {i, j} = {1, 2}. Soient (u 3 , · · · , u p ) ∈ E p−2 et soit g(x) = D p−2 f(x)(u 3 , · · · , u p ). L’application<br />

g définie au voisinage de a est 2 fois différentiable au voisinage de a grâce à la Proposition<br />

4.1.3 car g = e ◦ D p−2 f avec e : L p−2 (E; F ) −→ F linéaire continue définie par<br />

e(A) = A(u 3 , · · · , u p ). D’après la Proposition 4.1.4, on a pour tout u 2 ∈ E,<br />

et, appliquant de nouveau la Proposition 4.1.4,<br />

Dg(x)(u 2 ) = D p−1 f(x)(u 2 , · · · , u p ),<br />

D 2 g(a)(u 2 , u 1 ) = D p f(a)(u 1 , u 2 , · · · , u p ).<br />

D’après le Theorème 4.2.1, on obtient donc que D 2 g(a)(u 2 , u 1 ) = D 2 g(a)(u 1 , u 2 ), soit<br />

D p f(a)(u 1 , u 2 , · · · , u p ) = D p f(a)(u 2 , u 1 , · · · , u p ). (4.5)<br />

Si i, j ∈ {3, · · · , n}, on utilise de nouveau l’application<br />

Par hypothèse de récurrence, on a<br />

où σ = σ i,j . On obtient bien alors<br />

g(x) = D p−2 f(x)(u 3 , · · · , u p ).<br />

g(x) = D p−2 f(x)(u σ(3) , · · · , u σ(p) ),<br />

D p f(a)(u 1 , u 2 , u 3 , · · · , u p ) = D p f(a)(u σ(1) , u σ(2) , u σ(3) , · · · , u σ(p) ).<br />

Si i = 1, j ∈ {3, · · · , n}, on pose g(x) = D p−1 f(x)(u 2 , · · · , u j , · · · , u p ) et on a g(x) =<br />

D p−1 f(x)(u j , u 2 , · · · , u p ) par hypothèse de récurrence. On calcule alors Dg(a)(u 1 ) à l’aide des<br />

deux expressions de g et on obtient que l’on peut échanger j et 2. Ensuite on échange j et 1 comme<br />

dans (4.5) puis 1 et 2. Enfin si i = 2, j ∈ {3, · · · , n}, on peut échanger 1 et 2 comme dans (4.5) et<br />

on est ramené au cas précédent.<br />

La proposition suivante est importante. Si sa conclusion coule de source, il n’en est pas de même<br />

de sa démonstration.<br />

Proposition 4.2.1 Soient p, q ∈ N ∗ des entiers et soit f : U −→ F une application q + p fois<br />

différentiable en a ∈ U. Alors D p f est q fois différentiable en a, et pour tout (u 1 , · · · , u q ) ∈ E q et<br />

(v 1 , · · · , v p ) ∈ E p , on a<br />

(D q (D p f)(a)(u 1 , · · · , u q ))(v 1 , · · · , v p ) = D q+p f(a)(u 1 , · · · , u q , v 1 , · · · , v p ).<br />

Démonstration. Par récurrence sur q. Pour q = 1, c’est la définition de D p+1 f. Supposons la<br />

propriété vraie à l’ordre q et considérons f supposée q + 1 + p fois différentiable en a. Comme f<br />

est q + p fois différentiable au voisinage de a, l’ hypothèse de récurrence nous dit que<br />

(D q (D p f)(x)(u 1 , · · · , u q ))(v 1 , · · · , v p ) = D q+p f(x)(u 1 , · · · , u q , v 1 , · · · , v p ),<br />

73


pour tout x voisin de a. Cela s’écrit<br />

D q (D p f) = Ψ ◦ D q+p f,<br />

avec Ψ : L p+q (E; F ) −→ L q (E; L p (E; F )) linéaire continue (le vérifier) définie par<br />

(Ψ(A)(u 1 , · · · , u q ))(v 1 , · · · , v p ) = A(u 1 , · · · , u q , v 1 , · · · , v p )<br />

pour tout A ∈ L p+q (E; F ), (u 1 , · · · , u q ) ∈ E q et (v 1 , · · · , v p ) ∈ E p . Comme Ψ et D q+p f sont<br />

différentiables en a, on obtient que D q (D p f) est différentiable en a donc D p f est q + 1 fois<br />

différentiable en a.<br />

Posant alors g(x) = D q+p f(x)(u 1 , · · · , u q , v 1 , · · · , v p ), on a, utilisant la Proposition 4.1.4 et la<br />

symétrie de D q+p+1 f(a)<br />

Dg(a)(u q+1 ) = D q+p+1 f(a)(u 1 , · · · , u q , u q+1 , v 1 , · · · , v p ), (4.6)<br />

pour tout u q+1 ∈ E. Par ailleurs, on a g = e ◦ Φ avec e : L p (E; F ) −→ F linéaire continue définie<br />

par e(A) = A(v 1 , · · · , v p ) et Φ : U −→ L p (E; F ) définie par Φ(x) = (D q (D p f)(x))(u 1 , · · · , u q ).<br />

On a alors, appliquant la Proposition 4.1.4 à D p f, et utilisant la symétrie des différentielles d’ordre<br />

supérieur,<br />

DΦ(a)(u q+1 ) = D q+1 (D p f)(a)(u 1 , · · · , u q , u q+1 )<br />

et<br />

Dg(a)(u q+1 ) = e(DΦ(a)(u q+1 )) = (D q+1 (D p f)(a)(u 1 , · · · , u q , u q+1 ))(v 1 , · · · , v p ),<br />

ce qui joint à (4.6) montre la propriété au rang q + 1.<br />

Nous aurons besoin du résultat suivant.<br />

Proposition 4.2.2 Soit f : U −→ F 1 × · · · × F m avec f = (f 1 , · · · , f m ).<br />

a) On suppose que f 1 , · · · , f m sont p fois différentiables en a ∈ U. Alors f est p fois différentiable<br />

en a, et on a, pour tout (u 1 , · · · , u p ) ∈ E p ,<br />

D p f(a)(u 1 , · · · , u p ) = (D p f 1 (a)(u 1 , · · · , u p ), · · · , D p f m (a)(u 1 , · · · , u p )).<br />

b) Si f 1 , · · · , f m sont de classe C p sur U, alors f est de classe C p sur U.<br />

Démonstration. a) par récurrence sur p. Pour p = 1, le résultat découle du Théorème 2.3.1.<br />

Supposons la propriété vraie à l’ordre p. On a D p f = (D p f 1 , · · · , D p f m ) au voisinage de a, et<br />

D p f 1 , · · · , D p f m sont différentiables en a. Appliquant de nouveau le Théorème 2.3.1 on obtient<br />

que f est p + 1 fois différentiable en a avec D p+1 f(a) = (D p+1 f 1 (a), · · · , D p+1 f m (a))<br />

b) Démonstration analogue.<br />

74


Théorème 4.2.3 Soit f : U −→ V et g : V −→ G deux applications telles que f(U) ⊂ V où U<br />

et V sont des ouverts d’espaces normés E, F et G est un espace normé.<br />

a) Si f est p fois différentiable en a ∈ U et si g est p fois différentiable en b = f(a) ∈ V , alors<br />

g ◦ f est p fois différentiable en a.<br />

b) Si f est de classe C p sur U et si g est de classe C p sur V , alors g ◦ f est de classe C p sur U.<br />

Démonstration. a) Procédons par récurrence sur p. Pour p = 1 le résultat est vrai. Supposons le<br />

résultat vrai à l’ordre p − 1. On a, dans un voisinage W de a<br />

D(g ◦ f)(x) = Dg(f(x) ◦ Df(x) = Φ(A(x), B(x))<br />

où A : U −→ L(F, G) et B : U −→ L(E, F ) sont définis par A(x) = (Dg ◦ f)(x), B(x) =<br />

Df(x) et<br />

Φ : L(F, G) × L(E, F ) −→ L(E, G)<br />

est définie par Φ(A, B) = A ◦ B. Or Dg et f sont p − 1 fois différentiables en a (utiliser la<br />

Proposition 4.2.1), donc il en est de même de A = Dg ◦ f, de B = Df (utiliser les Propriétés<br />

4.2.1 et 4.2.2) et de (A, B) (Proposition 4.2.2). Par ailleurs Φ est bilinéaire et continue car<br />

‖Φ(A, B)‖ ≤ ‖A‖‖B‖, elle est donc p−1 fois différentiable d’après la Proposition 4.1.2. L’hypothèse<br />

de récurrence nous permet de conclure que D(g◦f) = Φ◦(A, B) est p−1 fois différentiable<br />

en a donc g ◦ f est bien p fois différentiable en a (utiliser de nouveau les Propriétés 4.2.1 et 4.2.2).<br />

b) Même méthode que dans a).<br />

Théorème 4.2.4 Soient E et F des espaces de BANACH, alors l’application<br />

u ↦−→ I(u) = u −1<br />

de Isom(E, F ) dans Isom(F, E) est de classe C ∞ .<br />

Démonstration. On sait que Isom(E, F ) est ouvert dans L(E, F ), que I est de classe C 1 (chapitre<br />

2) et que pour tout h ∈ L(E, F ), on a DL(u)h = −u −1 ◦ h ◦ u −1 . Pour tout (v, w) ∈ L(F, E) ×<br />

L(F, E), et pour tout h ∈ L(E, F ), posons<br />

ψ(v, w)(h) = v ◦ h ◦ w.<br />

L’application Ψ(v, w) est linéaire de L(E, F ) dans L(F, E), de plus<br />

‖ψ(v, w)(h)‖ ≤ ‖v‖‖h‖‖w‖. (4.7)<br />

On a donc Ψ(v, w) ∈ L(L(E, F ) × L(F, E)). L’application Ψ est alors bilinéaire de L(F, E) ×<br />

L(F, E) dans L(L(E, F ) × L(F, E)), elle est de plus continue car<br />

‖ψ(v, w)‖ L(L(E,F )×L(F,E)) ≤ ‖v‖‖w‖<br />

d’après (4.7). Par ailleurs<br />

DI(u) = Ψ(I(u), I(u)).<br />

75


Supposons que I soit de classe C p , il en est alors de même de l’application (I(.), I(.)) ainsi que<br />

de Ψ qui est bilinéaire continue. Utilisant le Théorème 4.2.3, b) on obtient que DI = Ψ ◦ (I, I)<br />

est de classe C p donc I est de classe C p+1 . Par récurrence, on a donc bien I de classe C ∞ .<br />

Comme application de la différentielle seconde, nous allons maintenant caractériser la convexité<br />

des fonctions deux fois différentiables.<br />

Définition 4.2.1 On dit qu’une fonction f : U −→ R définie sur un ouvert convexe U d’un espace<br />

normé E est convexe si, pour tout x, y ∈ x, y ∈ U et pour tout t ∈ [0, 1], on a<br />

f(ty + (1 − t)x) ≤ tf(y) + (1 − t)f(x).<br />

Théorème 4.2.5 Soit f : U −→ R définie sur un ouvert convexe U d’un espace normé E. On<br />

suppose que f est deux fois différentiable sur U. Alors f est convexe si et seulement si<br />

D 2 f(x)(u, u) ≥ 0 pour tout x ∈ X, u ∈ E. (4.8)<br />

Démonstration. Supposons f convexe, et soient x, y ∈ x, y ∈ U et t ∈]0, 1]. On a<br />

f(x + t(y − x)) ≤ tf(y) + (1 − t)f(x),<br />

donc<br />

f(x + t(y − x)) − f(x)<br />

t<br />

≤ f(y) − f(x), ce qui donne, faisant tendre t vers 0<br />

Df(x)(y − x) ≤ f(y) − f(x),<br />

ainsi donc<br />

d’où par addition<br />

Df(y)(x − y) ≤ f(x) − f(y),<br />

(Df(y) − Df(x))(y − x) ≥ 0 pour tout x, y ∈ U.<br />

Introduisons alors, pour x ∈ U et u ∈ E, la fonction ϕ(t) = Df(x + tu)(u) définie pour tout t<br />

voisin de 0. Pour 0 ≤ t, on a<br />

(Df(x + tu) − Df(x))(tu) ≥ 0<br />

donc ϕ(t) ≥ ϕ(0). Il en résulte que ϕ d (0) ≥ 0 donc D 2 f(x)(u, u) ≥ 0. Réciproquement, supposons<br />

(4.8). Pour tout x, y ∈ U et t ∈ [0, 1], posons ψ(t) = f(x + t(y − x)) − Df(x)(x + t(y − x))<br />

de telle sorte que ψ ′ (t) = (Df(x + t(y − x)) − Df(x))(y − x) et<br />

ψ ′′ (t) = D 2 f(x + t(y − x))(y − x, y − x) ≥ 0.<br />

On a donc ψ ′ (t) ≥ ψ ′ (0) = 0, donc ψ(1) ≥ ψ(0), d’où<br />

Posant x t = x + t(y − x), t ∈ [0, 1], il vient<br />

f(y) − f(x) ≥ Df(x)(y − x) pour tout x, y ∈ U.<br />

f(y) ≥ f(x t ) + (1 − t)Df(x t )(y − x),<br />

76


et<br />

f(x) ≥ f(x t ) + tDf(x t )(y − x).<br />

Multipliant la première inégalité par t, la seconde par 1 − t et ajoutant, on obtient<br />

tf(y) + (1 − t)f(x) ≥ f(x t ),<br />

donc f est bien convexe.<br />

Dans le cas particulier où E = E 1 × · · · × E n , on rappelle que la différentiabilité de f en a ∈ U<br />

implique l’existence des différentielles partielles D j f(a) ∈ L(E j , F ). Si l’application D j f :<br />

U −→ L(E j , F ) est différentiable en a ∈ U on a pour tout 1 ≤ i ≤ n<br />

Pour tout u i ∈ E i et v j ∈ E j on pose alors<br />

D i D j f(a) ∈ L(E i , L(E j , F )).<br />

D i D j f(a)(u i , v j ) =<br />

(<br />

)<br />

D i D j f(a)(u i ) (v j ).<br />

On vérifie immédiatement que D i D j f(a) ∈ L 2 (E i , E j ; F ). On a alors<br />

Proposition 4.2.3 Soit f : U ⊂ E 1 × · · · × E n −→ F une application deux fois différentiable<br />

en a ∈ U. Alors les applications D i f, 1 ≤ i ≤ n sont différentiables en a et pour 1 ≤ i ≤ n,<br />

1 ≤ j ≤ n, et pour tout u, v ∈ E 1 × · · · × E n , on a<br />

D 2 f(a)(u, v) =<br />

n∑ n∑<br />

D i D j f(a)(u i , v j ).<br />

i=1 j=1<br />

De plus, pour tout (ū, ¯v) ∈ E i × E j<br />

D j D i f(a)(¯v, ū) = D i D j f(a)(ū, ¯v).<br />

Démonstration. Pour tout x voisin de a et pour tout h ∈ E j , on a<br />

D j f(x)(h) = Df(x)(0, · · · , h, · · · , 0) = (Df(x) ◦ ϕ j )(h)<br />

où ϕ j est l’injection canonique de E j dans E 1 × · · · × E n . On a donc<br />

D j f = Φ j ◦ Df<br />

où Φ j ∈ L(L(E 1 × · · · × E n , F ), L(E j , F )) est définie par<br />

Φ j (A) = A ◦ ϕ j .<br />

Comme Df et Φ j sont différentiables en a il en est de même de D j f. Il en résulte que les différentielles<br />

partielles<br />

D i D j f(a) ∈ L(E i , L(E j , F ))<br />

77


existent pour tout i, j ∈ [1, n]. On remarque alors que<br />

n∑<br />

Df = T j ◦ D j f<br />

où<br />

est définie par<br />

j=1<br />

T j ∈ L(L(E j , F )), L(E 1 × · · · × E n , F ))<br />

T j (A) = A ◦ π j<br />

avec π j (x 1 , · · · , x n ) = x j . On a alors pour 1 ≤ i ≤ n, 1 ≤ j ≤ n, et u, v ∈ E 1 × · · · × E n<br />

n∑<br />

D(Df)(a) = T j ◦ D(D j f)(a)<br />

donc<br />

d’où<br />

D(Df)(a)(u) =<br />

=<br />

=<br />

D 2 f(a)(u, v) =<br />

j=1<br />

n∑<br />

j=1<br />

)<br />

T j<br />

(D(D j f)(a)u)<br />

n∑ ( n∑<br />

)<br />

T j D i (D j f)(a)u i<br />

j=1<br />

n∑<br />

i=1<br />

n∑<br />

i=1<br />

i=1<br />

n∑<br />

)<br />

(D i D j f(a)u i ◦ π j<br />

j=1<br />

n∑<br />

D i D j f(a)(u i , v j ).<br />

Posons alors, pour ū ∈ E k , ¯v ∈ E l , u = (0, · · · , ū, · · · , 0), v = (0, · · · , ¯v, · · · , 0). On a alors<br />

et<br />

j=1<br />

D 2 f(a)(u, v) = D k D l f(ū, ¯v)<br />

D 2 f(a)(v, u) = D l D k f(¯v, ū).<br />

Comme D 2 f(a)(u, v) = D 2 f(a)(v, u), on a bien D k D l f(ū, ¯v) = D l D k f(¯v, ū).<br />

Comme cas particulier, on obtient que, pour tout 1 ≤ i ≤ n, D i D i f(a) ∈ L 2 (E i ; F ) est<br />

symétrique.<br />

Théorème 4.2.6 Soit f : U ⊂ E 1 × · · · × E n −→ F une application telle que les différentielles<br />

partielles D i D j f existent et sont continues en un point a ∈ U. Alors f est deux fois différentiable<br />

en a et, pour tout u, v ∈ E 1 × · · · × E n<br />

n∑ n∑<br />

D 2 f(a)(u, v) = D j D i f(a)(u j , v i ).<br />

i=1<br />

j=1<br />

78


Démonstration. On a Df = ∑ n<br />

i=1 T i ◦ D i f (voir la démonstration du Corollaire 4.2.3) et D i f<br />

est différentiable en tout x ∈ U car les différentielles partielles D j D i f existent et sont continues<br />

en a. Il résulte donc du Théorème 2.4.1 que Df est différentiable en a et donc que f est deux fois<br />

différentiable en a. La formule donnant D 2 f(a) a été démontrée dans le Corollaire 4.2.3.<br />

Remarque 4.2.1 Examinons le cas particulier E 1 = E 2 = · · · = E n = R, et F = R. Supposons<br />

que f est deux fois différentiable en a. On a<br />

∂f<br />

∂x i<br />

(x) = Df(x)(e i ) = ψ i (Df(x)),<br />

où ψ i : L(R n , R) −→ R est l’application linéaire définie par ψ i (A) = A(e i ). On a donc ∂f =<br />

∂x i<br />

ψ i ◦ Df, ce qui montre que ∂f est différentiable en a, donc les dérivées partielles secondes<br />

∂x i<br />

∂ 2 f<br />

(a) existent pour tout i, j ∈ [1, n]. Posant alors<br />

∂x j ∂x i<br />

g(x) = Df(x)(u) =<br />

n∑<br />

i=1<br />

∂f<br />

∂x i<br />

(a)u i .<br />

On a alors<br />

D 2 f(a)(u, v) = Dg(a)(v) =<br />

n∑<br />

i=1<br />

n∑<br />

j=1<br />

∂ 2 f<br />

∂x j ∂x i<br />

(a)u i v j = 〈H f (a), u〉,<br />

où H f (a) est alors la matrice Hessienne de f en a définie par<br />

Remarquons que<br />

Remarquons aussi que<br />

donc<br />

(H f (a)) ij = ∂2 f<br />

∂x j ∂x i<br />

(a).<br />

∂ 2 f<br />

∂x j ∂x i<br />

(a) = D 2 f(a)(e i , e j ) = D 2 f(a)(e j , e i ) =<br />

∂ 2 f<br />

D i D j f(a)(s, t) = st (a),<br />

∂x j ∂x i<br />

∂2 f<br />

∂x i ∂x j<br />

(a).<br />

‖D i D j f(b) − D i D j f(a)‖ L 2 (R;R) = ∥<br />

∂2 f<br />

(b) −<br />

∂2 f<br />

∥<br />

(a) ∥.<br />

∂x j ∂x i ∂x j ∂x i<br />

∂ 2 f<br />

Il en résulte que si les dérivées partielles secondes existent et sont continues en a alors les<br />

∂x j ∂x i<br />

différentielles partielles secondes existent au voisinage de a et sont continues en a. Le Théorème<br />

79


4.2.6 nous permet alors d’affirmer que f est deux fois différentiables en a et que l’on a alors en<br />

particulier<br />

∂ 2 f<br />

(a) =<br />

∂2 f<br />

(a).<br />

∂x j ∂x i ∂x i ∂x j<br />

Dans le cas où l’application f est définie sur un ouvert U de E 1 × · · · × E n , pour toute suite<br />

finie {i 1 , · · · , i p } ⊂ [1, n], on introduit par récurrence les différentielles partielles d’ordre p<br />

D i1 D i2 · · · D ip f(a) ∈ L p (E i1 × · · · × E ip , F ).<br />

On montre alors facilement par récurrence que si f est p fois différentiable en a on a pour tout<br />

(u 1 , · · · u p ) ∈ (E 1 × · · · × E n ) p<br />

D p f(a)(u 1 , · · · , u p ) =<br />

4.3 Formules de Taylor<br />

∑<br />

{i 1 ,···,i p}⊂[1,n]<br />

Commençons par démontrer le résultat suivant<br />

D i1 D i2 · · · D ip f(a)(u i1 , · · · , u ip ).<br />

Proposition 4.3.1 Soient I un intervalle ouvert, E, F , G des espaces normés, f : I −→ E,<br />

g : I −→ F deux fonctions p + 1 fois dérivables et soit [., .] : E × F −→ G une application<br />

bilinéaire continue. Alors<br />

( ∑<br />

p ′.<br />

[f, g (p+1) ] − (−1) p+1 [f (p+1) , g] = (−1) i [f (i) , g ]) (p−i)<br />

Démonstration. Par récurrence sur p. Pour p = 0 la formule se réduit à<br />

i=0<br />

[f, g ′ ] + [f ′ , g] = ([f, g]) ′<br />

qui est une conséquence de la formule donnant la différentielle d’une application bilinéaire et la<br />

dérivée d’une composée. Supposons le résultat vrai à l’ordre p − 1. On a<br />

( ∑<br />

p ) ′ ( ∑<br />

p−1<br />

(−1) i [f (i) , g (p−i) ] = (−1) i [f (i) , h (p−1−i) ] + (−1) p [f p , g]<br />

i=0<br />

avec h = g ′ . Appliquant l’hypothèse de récurrence, il vient<br />

i=0<br />

( ∑<br />

p ′<br />

(−1) i [f (i) , g ]) (p−i) = [f, h (p) ] − (−1) p [f (p) , h]+<br />

i=0<br />

) ′<br />

(−1) p [f (p+1) , g] + (−1) p [f (p) , h]<br />

80


d’où<br />

( ∑<br />

p ′<br />

(−1) i [f i , g ]) p−i = [f, g (p+1) ] − (−1) p+1 [f (p+1) , g]<br />

i=0<br />

On en déduit la formule de Taylor suivante<br />

Théorème 4.3.1<br />

a) FORMULE <strong>DE</strong> TAYLOR AVEC RESTE INTÉGRAL. Soient I un intervalle ouvert de R, f :<br />

I −→ E une fonction à valeurs dans un espace de Banach E qui est p + 1 fois continuement<br />

dérivable sur I. Alors, pour tout a, t ∈ I<br />

f(t) =<br />

p∑ (t − a) i<br />

f (i) (a) +<br />

i!<br />

i=0<br />

∫ t<br />

a<br />

(t − s) p<br />

f (p+1) (s)ds.<br />

p!<br />

b) FORMULE <strong>DE</strong> TAYLOR-LAGRANGE. Si l’on suppose seulement que f est p + 1 fois dérivable<br />

sur I et que<br />

sup ‖f (p+1) (s)‖ ≤ M < +∞<br />

s∈I<br />

alors<br />

∥<br />

∥f(t) −<br />

p∑ (t − a) i<br />

f (i) (a) ∥ ≤<br />

i!<br />

i=0<br />

|t − a|p+1<br />

(p + 1)! M.<br />

Démonstration. a) On applique la Proposition 4.3.1 avec g(s) =<br />

[x, t] = tx. On remarque que<br />

(t − s)p<br />

, F = R, G = E et<br />

p!<br />

g (i) i (t − s)p−i<br />

(s) = (−1)<br />

(p − i)!<br />

pour 0 ≤ i ≤ p,<br />

de telle sorte que<br />

g (p+1) (s) ≡ 0,<br />

(−1) i [f (i) , g (p−i) ] = (−1) i p−i (t − s)i<br />

(−1) f (i) p (t − s)i<br />

(s) = (−1) f (i) (s).<br />

i!<br />

i!<br />

Il vient alors, appliquant la Proposition 4.3.1,<br />

p+1 (t −<br />

(<br />

s)p<br />

∑<br />

p<br />

−(−1) f (p+1) p (t −<br />

)<br />

s)i<br />

′<br />

(s) = (−1) f (i) (s)<br />

p!<br />

i!<br />

i=0<br />

donc<br />

(t − s) p<br />

( ∑<br />

p<br />

f (p+1) (t − s) i<br />

′.<br />

(s) =<br />

f (s)) (i) (4.9)<br />

p!<br />

i!<br />

i=0<br />

81


Intégrant entre a et t, on obtient<br />

d’où le résultat.<br />

∫ t<br />

b) Posons ψ(s) = ∑ p<br />

i=0<br />

a<br />

(t − s) p<br />

f (p+1) (s) = f(t) −<br />

p!<br />

p∑<br />

i=0<br />

i<br />

(t − s)<br />

f (i) (s). D’après (4.9) on a<br />

i!<br />

ψ ′ (s) =<br />

(t − s)p<br />

f (p+1) (s).<br />

p!<br />

i<br />

(t − a)<br />

f (i) (a)<br />

i!<br />

Supposons t ≥ a, le cas t ≤ a se traîtant de manière analogue. Pour tout s ∈ I, on a<br />

Il en résulte que, pour s ∈ [a, t]<br />

‖ψ ′ (s)‖ ≤ M<br />

|t − s|p<br />

.<br />

p!<br />

avec g(s) = −M<br />

‖ψ ′ (t − s)p<br />

(s)‖ ≤ M<br />

p!<br />

= g ′ (s)<br />

(t − s)p+1<br />

. On applique alors le Théorème des accroissements finis et on obtient<br />

(p + 1)!<br />

d’où le résultat car ψ(t) = f(t) et ψ(a) = ∑ p<br />

i=0<br />

‖ψ(t) − ψ(a)‖ ≤ g(t) − g(a),<br />

i<br />

(t − a)<br />

f (i) (a).<br />

i!<br />

Dans le cas d’applications entre espaces normés, on a les formules de Taylor suivantes<br />

Théorème 4.3.2<br />

a) FORMULE <strong>DE</strong> TAYLOR AVEC RESTE INTÉGRAL. Soit f : U −→ F une application p + 1<br />

fois continuement différentiable définie sur un ouvert U d’un espace normé E à valeurs dans un<br />

espace de Banach F . Alors pour tout x ∈ U et h ∈ E tels que le segment [x, x + h] soit contenu<br />

dans U, on a<br />

p∑<br />

∫<br />

1<br />

1<br />

f(x + h) =<br />

i! Di f(x)h i (1 − s) p<br />

+<br />

D p+1 f(x + sh)h p+1 ds<br />

0 p!<br />

où h i = (h, · · · , h) ∈ E i .<br />

i=0<br />

b) FORMULE <strong>DE</strong> TAYLOR-LAGRANGE. Soit f : U −→ F une application p + 1 fois différentiable<br />

définie sur un ouvert U d’un espace normé E à valeurs dans un espace de Banach F . On<br />

suppose qu’il existe M ≥ 0 telle que ‖D p+1 f(z)‖ ≤ M pour tout z ∈ U. Alors pour tout x ∈ U<br />

et h ∈ E tels que le segment [x, x + h] soit contenu dans U, on a<br />

∥<br />

∥f(x + h) −<br />

p∑<br />

i=0<br />

1<br />

i! Di f(x)h i ∥ ∥∥ ≤ M<br />

‖h‖ p+1<br />

(p + 1)! .<br />

82


Démonstration. a) Remarquons qu’il existe η > 0 tel que x + sh ∈ U pour tout s ∈] − η, 1 + η[.<br />

Posons alors g(s) = f(x + sh), g est alors p + 1 fois continuement dérivable sur ] − η, 1 + η[<br />

et, utilisant la Proposition 4.1.5, b), on a g i (s) = D i f(x + sh)h i . On applique alors le Théorème<br />

4.3.1 avec a = 0 et t = 1 et on a le résultat.<br />

b) Posons g(t) = f(x + th), on a g (i) (t) = D i f(x + th)h i pour 1 ≤ i ≤ p + 1 (Proposition<br />

4.1.5, b)), d’où sup t∈[0,1] ‖g (p+1) (t)‖ ≤ M‖h‖ p+1 . On applique alors le Théorème 4.3.1, b) et on<br />

obtient que<br />

soit<br />

d’où le résultat.<br />

∥<br />

∥g(1) −<br />

∥<br />

∥f(x + h) −<br />

p∑<br />

i=0<br />

p∑<br />

i=0<br />

g (i) (0)<br />

i!<br />

∥ ≤ M‖h‖p+1<br />

(p + 1)!<br />

1<br />

i! Di f(x)h i ∥ ∥∥ ≤<br />

M‖h‖ p+1<br />

(p + 1)! ,<br />

Il est également possible d’obtenir une formule de Taylor sous des hypothèses plus faibles.<br />

Théorème 4.3.3 FORMULE <strong>DE</strong> TAYLOR-YOUNG. Soit f : U −→ F une application définie sur<br />

un ouvert U d’un espace normé E à valeurs dans un espace normé F que l’on suppose p fois<br />

différentiable en a ∈ U. Alors<br />

f(a + h) =<br />

p∑<br />

i=0<br />

1<br />

i! Di f(a)h i + ‖h‖ p ε(h)<br />

avec lim h→0 ε(h) = 0.<br />

Démonstration. On procède par récurrence. Le cas p = 1 est exactement la définition de la<br />

différentiabilité. Supposons la propriété vraie à l’ordre p − 1. Posons alors<br />

Posons<br />

g(z) = f(a + z) −<br />

p∑<br />

i=0<br />

1<br />

i! Di f(a)z i .<br />

ϕ i (z) = 1 i! Di f(a)z i = 1 i! (Di f(a) ◦ L)(z)<br />

avec L(z) = (z, · · · , z) ∈ E i . Utilisant le calcul de la différentielle d’une application multilinéaire<br />

continue (voir chapitre 2, exemple 2.1.4, c)), on a pour tout u ∈ E,<br />

Dϕ i (z)(u) =<br />

i∑<br />

k=1<br />

1<br />

i! (Di f(a)(z, · · · , u, · · · , z) =<br />

1<br />

(i − 1)! Di f(a)(z i−1 , u)<br />

car D i f(a) est symétrique. On a donc, utilisant la Proposition 4.2.1<br />

(D i−1 (Df)(a)(z i−1 ))(u) = D i f(a)(z i−1 , u)<br />

83


donc<br />

Il en résulte que<br />

Dϕ i (z) = D i−1 (Df)(a)(z i−1 ).<br />

Dg(z) = Df(a + z) −<br />

p−1<br />

∑<br />

j=0<br />

1<br />

j! Dj (Df)(a)(z j ).<br />

Par hypothèse de récurrence appliquée à Df, pour tout ε > 0, il existe η > 0 tel que ‖z‖ ≤ η<br />

implique<br />

‖Dg(z)‖ ≤ ε‖z‖ p−1 .<br />

Soit ‖h‖ ≤ η et soit θ(t) = g(th) pour tout t ∈ [0, 1]. On a θ ′ (t) = Dg(th)h donc ‖θ ′ (t)‖ ≤<br />

ε‖h‖ p−1 ‖h‖ = ε‖h‖ p . D’après le Théorème des accroissements finis, on a donc<br />

d’où le résultat.<br />

‖g(h)‖ = ‖g(h) − g(0)‖ = ‖θ(1) − θ(0)‖ ≤ ε‖h‖ p<br />

Remarque 4.3.1 Dans le cas d’une fonction f : U −→ R définie sur un ouvert U de R n , et deux<br />

fois différentiable en a, on a<br />

f(a) + Df(a)u + 1 2 D2 f(a)(u, u) = f(a) +<br />

n∑<br />

i=1<br />

∂f<br />

∂x i<br />

(a)u i +<br />

1<br />

( n∑ ∂ 2 f<br />

(a)(u<br />

2 ∂x 2 i ) 2 + 2<br />

i=1 i<br />

∑<br />

1≤i


4.4 Conditions d’Optimalité<br />

Définition 4.4.1 Soit f : U −→ R une fonction définie sur un ouvert U d’un espace topologique<br />

E.<br />

On dit que f admet un minimum (resp. maximum) local en a ∈ U s’il existe un voisinage V<br />

de a tel que<br />

f(x) ≥ f(a) (resp. f(x) ≤ f(a)) pour tout x ∈ V.<br />

Si<br />

f(x) > f(a) (resp. f(x) < f(a)) pour tout x ∈ V \ {a}<br />

on dit que l’extremum est strict. On dit que l’extremum est global si l’inégalité a lieu pour tout<br />

x ∈ U.<br />

Théorème 4.4.1<br />

a) Si f admet un extremum local en a ∈ U et si f est différentiable en a, alors<br />

Df(a) = 0.<br />

Si de plus f est deux fois différentiable en a alors pour tout h ∈ E<br />

D 2 f(a)(h, h)<br />

garde un signe constant (≥ 0 pour un minimum, ≤ 0 pour un maximum).<br />

b) On suppose que f est deux fois différentiable en a ∈ U, qu’il existe α > 0 tel que pour tout<br />

h ∈ E<br />

D 2 f(a)(h, h) ≥ α‖h‖ 2<br />

et que<br />

Alors f admet un minimum local strict en a.<br />

Df(a) = 0.<br />

Démonstration. a) On suppose que f admet un minimum local en a. Soit h ∈ E. Pour tout<br />

t ∈ R + assez petit on a donc<br />

f(a + th) − f(a) ≥ 0.<br />

Divisant par t et faisant tendre t vers 0 il vient Df(a)(h) ≥ 0. Changeant h en −h, on en déduit<br />

Df(a)(h) ≤ 0 soit<br />

Df(a)(h) = 0.<br />

Si f est deux fois différentiable en a, on a<br />

t 2 2 D2 f(a)(h, h) + t 2 ε(t) = f(a + th) − f(a) ≥ 0.<br />

Divisant par t 2 et faisant tendre t vers 0, il vient<br />

D 2 f(a)(h, h) ≥ 0.<br />

85


) D’après la formule de Taylor (Théorème 4.3.3), on a<br />

f(a + h) − f(a) = 1 2 D2 f(a)(h, h) + ‖h‖ 2 ε(h) ≥ 1 2 ‖h‖2 (α + ε(h))<br />

avec lim h→0 ε(h) = 0. Il existe alors η > 0 tel que |ε(h)| ≤ α/4 pour tout ‖h‖ ≤ η. On obtient<br />

alors pour tout ‖h‖ ≤ η<br />

f(a + h) − f(a) ≥ ‖h‖ 2 α/4,<br />

ce qui démontre bien le résultat annoncé.<br />

Dans le cas où f : U −→ R est une fonction convexe définie sur un ouvert convexe, on a une<br />

condition nécessaire et suffisante de minimalité.<br />

Théorème 4.4.2 f : U −→ R est une fonction convexe définie sur un ouvert convexe d’un espace<br />

normé. Alors les propriétés suivantes sont équivalentes pour a ∈ U tel que f soit différentiable en<br />

a :<br />

a) f(a) = min x∈U f(x)<br />

b) Df(a) = 0.<br />

Démonstration. Il suffit de démontrer que b) implique a). Pour tout x ∈ U et t ∈]0, 1], on a<br />

f(a + t(x − a)) ≤ tf(x) + (1 − t)f(a), donc<br />

faisant tendre t vers 0, il vient<br />

f(a + t(x − a)) − f(a)<br />

t<br />

≤ f(x) − f(a).<br />

pour tout x ∈ U, d’où le résultat.<br />

0 = Df(a)(x − a) ≤ f(x) − f(a),<br />

Remarque 4.4.1 Il découle du théorème précédent que si fonction convexe f : U −→ R admet<br />

un minimum local en a ∈ U, alors ce minimum est global.<br />

On peut aussi obtenir des conditions d’optimalité pour des problèmes avec contraintes c’est à<br />

dire pour un extremum local de f non plus sur U mais sur U ∩ M où M est une partie fermée de<br />

E. On donnera un résultat général de ce type dans le chapitre suivant. Dans le cas des fonctions<br />

convexes, on peut dès maintenant donner un résultat.<br />

Théorème 4.4.3 Soit U ⊂ X un ouvert d’un espace de Hilbert et soient f, g : U −→ R deux<br />

fonctions convexes. On suppose que<br />

a) f est différentiable sur U et il existe y ∈ U tel que f(y) < 0.<br />

b) ¯x ∈ S := {x ∈ U : f(x) ≤ 0} est tel que g(¯x) = inf x∈S g(x) et f est différentiable en ¯x.<br />

86


Alors il existe λ ≤ 0 tel que<br />

⎧<br />

⎨<br />

⎩<br />

λf(¯x) = 0.<br />

∇g(¯x) = λ∇f(¯x)<br />

Réciproquement, si ¯x ∈ S vérifie (4.10), alors g(¯x) = min x∈S g(x).<br />

Démonstration. On remarque que S est convexe, que son intérieur est non vide et que<br />

{x ∈ U : f(x) < 0} ⊂ int S.<br />

Si f(¯x) < 0, alors g a un minimum local en ¯x, donc ∇g(¯x) = 0 = 0∇f(¯x) avec 0f(¯x) = 0.<br />

(4.10)<br />

Supposons alors f(¯x) = 0. Si ∇g(¯x) = 0, on a la conclusion voulue. On peut donc supposer<br />

que ∇g(¯x) ≠ 0. Pour tout x ∈ S et t ∈]0, 1], on a ¯x + t(x − ¯x) ∈ S donc<br />

g(¯x + t(x − ¯x)) − g(¯x)<br />

t<br />

ce qui, par passage à la limite pour t ↓ 0 donne<br />

≥ 0,<br />

〈∇g(¯x), x − ¯x〉 ≥ 0 pour tout x ∈ S.<br />

Cela implique que 〈∇g(¯x), x − ¯x〉 > 0 pour tout x ∈ int S. Sinon, il existerait x 0 ∈ int S tel que<br />

〈∇g(¯x), x 0 − ¯x〉 ≤ 0, ce qui impliquerait 〈∇g(¯x), x 0 − ¯x〉 = 0 et<br />

〈∇g(¯x), x 0 〉 = 〈∇g(¯x), ¯x〉 ≤ 〈∇g(¯x), x〉 pour tout x ∈ int S.<br />

La fonction convexe 〈∇g(¯x), ·〉 aurait alors un minimum local, donc global (voir Remarque 4.4.1),<br />

ce qui impliquerait la contradiction ∇g(¯x) = 0. On en déduit que 〈∇g(¯x), x − ¯x〉 ≤ 0 implique<br />

x /∈ int S donc f(x) ≥ 0 = f(¯x). On obtient donc<br />

où<br />

f(x) ≥ f(¯x) pour tout x ∈ H ∩ U<br />

H = {x ∈ X : 〈∇g(¯x), x − ¯x〉 ≤ 0}.<br />

Soit alors u ∈ X tel que 〈∇g(¯x), u〉 ≤ 0. Comme ¯x + tu ∈ H ∩ U pour tout t > 0 assez<br />

f(¯x + tu) − f(¯x)<br />

petit, il vient ≥ 0 donc 〈∇f(¯x), u〉 ≥ 0. Il en résulte que 〈∇f(¯x), u〉 = 0 si<br />

t<br />

〈∇g(¯x), u〉 = 0, ce qui implique l’existence de λ ∈ R ∗ tel que ∇g(¯x) = λ∇f(¯x). On remarque<br />

enfin que λ < 0 car 〈∇f(¯x), u〉 ≥ 0 si 〈∇g(¯x), u〉 ≤ 0 et que λf(¯x) = 0.<br />

Réciproquement, supposons que (4.10) est vérifié. Si λ = 0, alors ∇g(¯x) = 0 donc ¯x réalise le<br />

minimum de g sur U donc sur S. Supposons donc λ ≠ 0 de telle sorte que f(¯x) = 0. On a alors,<br />

pour tout x ∈ S,<br />

0 ≥ f(x) − f(¯x) ≥ 〈∇f(¯x), x − ¯x〉,<br />

donc 〈∇g(¯x), x − ¯x〉 ≥ 0 car ∇g(¯x) = λ∇f(¯x) avec λ < 0. On a alors, pour tout x ∈ S,<br />

g(x) − g(¯x) ≥ 〈∇g(¯x), x − ¯x〉 ≥ 0.<br />

87


Chapitre 5<br />

Théorèmes d’Inversion et Applications<br />

Nous illustrons dans ce chapitre le principe qu’une application différentiable se comporte localement<br />

comme sa différentielle.<br />

5.1 Théorèmes d’inversion<br />

Commençons par donner quelques définitions<br />

Définition 5.1.1<br />

a) Une application f : E −→ F où E et F sont des espaces topologiques est un homéomorphisme<br />

si<br />

– f est bijective<br />

– f et f −1 sont continues.<br />

Autrement dit f est donc un homéomorphisme si et seulement<br />

– f est bijective,<br />

– f(U) est ouvert dans F pour tout ouvert U de E,<br />

– f −1 (V ) est ouvert dans E pour tout ouvert V de F.<br />

b) Soient U ⊂ E et, V ⊂ F des ouverts d’espaces de Banach E et F . On dit qu’une application<br />

f : U −→ V est un difféomorphisme si<br />

– f est bijective,<br />

– f et f −1 sont différentiables.<br />

c) On dit que f est un C r difféomorphisme si f est un difféomorphisme et si f et f −1 sont de<br />

classe C r .<br />

Remarque 5.1.1<br />

a) Une application bijective et continue n’est pas toujours un homéomorphisme. En effet, soit<br />

(E, d) un espace métrique dont la topologie n’est pas la topologie discrète et δ(x, y) la distance<br />

définie par<br />

{ 0 si x = y<br />

δ(x, y) =<br />

1 si x ≠ y.<br />

89


Considérons f : (E, δ) −→ (E, d) définie par f = I E . C’est une application continue bijective<br />

mais f −1 n’est pas continue car si X ⊂ E qui n’est pas ouvert pour (E, d) on a X est ouvert<br />

pour (E, δ) alors que f(X) = X n’est pas ouvert pour (E, d).<br />

b) On remarque qu’un difféomorphisme est un homéomorphisme. Mais la fonction f(x) =<br />

x 3 qui est un homéomorphisme différentiable de R dans R n’est pas un difféomorphisme car<br />

f −1 (y) = y 1/3 n’est pas différentiable en 0.<br />

c) On remarque également que si f : U −→ V est un difféomorphisme alors Df(x) ∈<br />

Isom(E, F ) pour tout x ∈ U. En effet, f et f −1 sont différentiables en x et y = f(x) et on a<br />

f ◦ f −1 = Id V ,<br />

f −1 ◦ f = Id U .<br />

Utilisant le résultat de dérivation d’une composée, on a<br />

et<br />

Df(x) ◦ Df −1 (y) = Id F<br />

Df −1 (y) ◦ Df(x) = Id E ,<br />

ce qui montre que bien que Df(x) est bijective et que Df −1 (y) = (Df(x)) −1 .<br />

Le résultat suivant est une étape vers le résultat principal de cette section à savoir le Théorème du<br />

difféomorphisme local 5.1.2.<br />

Théorème 5.1.1 THÉORÈME D’INVERSION LOCALE Soit f : U −→ F une application différentiable<br />

définie sur un ouvert U d’un espace de Banach et à valeurs dans un espace de Banach<br />

F . On suppose que Df est continue en a ∈ U et que Df(a) ∈ Isom (E, F ). Alors<br />

a) il existe des voisinages ouverts U ′ de a et V ′ de b = f(a) tels que f soit un homéomorphisme<br />

de U ′ dans V ′ .<br />

b) f −1 est Lipschitzienne sur V ′ , différentiable en b et on a Df −1 (b) = (Df(a)) −1 .<br />

Démonstration. Posons ψ = (Df(a)) −1 ∈ Isom (F, E), et r(x) = f(x) − b − Df(a)(x − a).<br />

Observons que pour y ∈ F et x ∈ U,<br />

y = f(x)<br />

⇐⇒ y = b + Df(a)(x − a) + r(x)<br />

⇐⇒ x = a + ψ(y − b − r(x))<br />

⇐⇒ x = F y (x)<br />

où F y (x) = a + ψ(y − b − r(x)). Choisissons η > 0 tel que<br />

‖Dr(x)‖ = ‖Df(x) − Df(a)‖ ≤ 1<br />

2‖ψ‖<br />

sur ¯B(a, η), de telle sorte que r(.) est<br />

1<br />

2‖ψ‖ -Lipschitzien sur ¯B(a, η) ; et soit y ∈ ¯B(b, δ) où δ =<br />

η<br />

2‖ψ‖ . Pour tout x ∈ ¯B(a, η) on a, notant que 0 = r(a)<br />

η<br />

‖F y (x) − a‖ ≤ ‖ψ‖(‖y − b‖ + ‖r(x)‖) ≤ ‖ψ‖(<br />

2‖ψ‖ + 1 ‖x − a‖) ≤ η.<br />

2‖ψ‖<br />

90


On a donc défini une application F y : ¯B(a, η) −→ ¯B(a, η). Pour tout x, z ∈ ¯B(a, η), on a<br />

‖F y (x) − F y (z)‖ ≤ ‖ψ‖‖r(x) − r(z)‖ ≤ ‖ψ‖ 1<br />

‖x − z‖<br />

‖x − z‖ = .<br />

2‖ψ‖ 2<br />

D’après le Théorème des applications contractantes de Banach, il existe un unique x ∈ ¯B(a, η) tel<br />

que f(x) = y noté x = g(y). Ceci montre l’existence d’une application g : ¯B(b, δ) −→ ¯B(a, η)<br />

telle que f(g(y)) = y pout tout y ∈ ¯B(b, δ). Notons que g(b) = a car F b (a) = a et que, pour tout<br />

y ∈ ¯B(b, δ), g(y) est l’unique x ∈ ¯B(a, η) tel que f(x) = y. Il en résulte que f est surjective de<br />

¯B(a, η) dans ¯B(b, δ). Considérons y, y ′ ∈ B(b, δ), on a<br />

‖g(y) − g(y ′ )‖ = ‖F y (g(y)) − F y ′(g(y ′ ))‖<br />

≤<br />

‖F y (g(y)) − F y (g(y ′ ))‖ + ‖F y (g(y ′ )) − F y ′(g(y ′ ))‖<br />

≤<br />

1 2 ‖(g(y) − (g(y′ )‖ + ‖ψ(y − y ′ )‖<br />

ce qui entraine<br />

‖g(y) − g(y ′ )‖ ≤ 2‖ψ‖‖y − y ′ ‖.<br />

Il en résulte que g est Lipschitzienne donc continue sur ¯B(b, δ) et que<br />

‖g(y) − a‖ = ‖g(y) − g(b)‖ < 2‖ψ‖δ = η<br />

si ‖y − b‖ < δ d’où g(B(b, δ)) ⊂ B(a, η) en notant, comme d’habitude, B(x, r) la boule ouverte<br />

de centre x et de rayon r. Posons alors V ′ = B(b, δ) et U ′ = g(B(b, δ)) ⊂ B(a, η). Pour tout<br />

y ∈ B(b, δ), on a g(y) = f −1 (y) ∩ B(a, η), donc U ′ = f −1 (B(b, δ)) ∩ B(a, η), ce qui montre<br />

que U ′ est ouvert. Remarquons que f(U ′ ) ⊂ V ′ et que f : U ′ −→ V ′ est surjective. Elle est<br />

aussi injective car si x, x ′ ∈ U ′ vérifient f(x) = f(x ′ ) = y, on a x ∈ B(a, η) donc g(y) = x<br />

et g(y) = x ′ d’où x = x ′ . On a donc montré que f : U ′ −→ V ′ est un homéomorphisme et que<br />

f −1 = g est Lipschitzienne sur V ′ .<br />

Il reste à prouver la différentiabilité de f −1 en b. Soit ε > 0 et 0 < α < η tel que ‖Dr(x)‖ ≤<br />

ε<br />

2‖ψ‖ 2<br />

ε<br />

sur B(a, α), de telle sorte que r(.) est -Lipschitzienne sur B(a, α). Posons β = α/2‖ψ‖.<br />

2‖ψ‖ 2<br />

Pour tout y ∈ B(b, β) on a<br />

‖g(y) − a‖ = ‖g(y) − g(b)‖ ≤ 2‖ψ‖‖y − b‖ ≤ 2‖ψ‖β = α<br />

donc g(B(b, β)) ⊂ B(a, α). Soit y ∈ B(b, β). On a<br />

d’où<br />

Il en résulte que<br />

g(y) = F y (g(y)) = a + ψ(y − b − r(g(y))),<br />

g(y) − g(b) − ψ(y − b) = −ψ(r(g(y))) = ψ(r(g(b))) − ψ(r(g(y))).<br />

‖g(y) − g(b) − ψ(y − b)‖ ≤ ‖ψ‖‖r(g(y)) − r(g(b))‖.<br />

91


Comme r(.) est Lipschitzienne de rapport ε/2‖ψ‖ 2 sur B(a, α), et comme g(y), g(b) ∈ B(a, α),<br />

il vient<br />

‖r(g(y) − r(g(b))‖ ≤<br />

On a donc pour tout y ∈ B(b, β)<br />

ε ‖g(y) − g(b)‖ ≤<br />

ε<br />

2‖ψ‖<br />

2<br />

2‖ψ‖‖y − b‖ ≤<br />

ε<br />

2‖ψ‖<br />

2<br />

‖g(y) − g(b) − ψ(y − b)‖ ≤ ‖ψ‖ ε ‖y − b‖ = ε‖y − b‖,<br />

‖ψ‖<br />

‖y − b‖.<br />

‖ψ‖<br />

ce qui montre bien que g et donc f −1 est différentiable en b avec Df −1 (b) = (Df(a)) −1 .<br />

On en déduit le<br />

Théorème 5.1.2 THÉORÈME DU DIFFÉOMORPHISME LOCAL<br />

Soit f : U −→ F une application de classe C r , r ≥ 1 définie sur un ouvert U d’un espace de<br />

Banach E et à valeurs dans un espace de Banach F . Soit a ∈ U tel que Df(a) ∈ Isom (E, F ).<br />

Alors, il existe des voisinages ouverts U ′ de a et V ′ de b = f(a) tels que f soit un C r difféomorphisme<br />

de U ′ dans V ′ .<br />

Démonstration. Comme Df(a) ∈ Isom (E, F ) qui est ouvert dans L(E, F ) et comme Df est<br />

continue en a, on peut supposer en diminuant U au besoin, que Df(x) ∈ Isom (E, F ) pour tout<br />

x ∈ U. Appliquant le Théorème 5.1.1, il existe des voisinages ouverts U ′ de a et V ′ de b = f(a)<br />

tels que f soit un homéomorphisme de U ′ dans V ′ et tel que f −1 soit différentiable en b avec<br />

Df −1 (b) = (Df(a)) −1 . On peut alors appliquer de nouveau le Théorème 5.1.1 pour tout x ∈ U ′ . Il<br />

en résulte que, pour tout y ∈ V ′ l’application f −1 est différentiable en y et Df −1 (y) = (Df(x)) −1 .<br />

L’application Df −1 est continue sur V ′ car<br />

Df −1 = Φ ◦ Df ◦ f −1<br />

où Φ : Isom (E, F ) −→ Isom (F, E) est définie par φ(u) = u −1 pour tout u ∈ Isom (E, F ).<br />

Notons que f −1 , Df sont continues ainsi que Φ qui est de classe C ∞ (voir chapitre 4, Théorème<br />

4.2.4). Il en résulte que f −1 est de classe C 1 sur V ′ . Supposons démontré que f −1 est de classe C s<br />

sur V ′ pour s ∈ [1, r − 1]. On a f −1 de classe C s ainsi que Df et Φ. D’après le Théorème 4.2.3<br />

du chapitre 2, on obtient donc que Df −1 est de classe C s sur V ′ d’où f −1 est de classe C s+1 . Le<br />

théorème est alors complètement démontré.<br />

Remarque 5.1.2 Si les hypothèses du théorème précédent sont vérifiées dans des espaces de dimension<br />

finie E = R n et F = R p , on a nécessairement n = p et l’hypothèse Df(a) ∈ Isom (E, F )<br />

se traduit par det(J f (a)) ≠ 0 où J f (a) est la matrice Jacobienne de f en a définie par<br />

avec f = (f 1 , . . . , f n ).<br />

J f (a) i,j = ∂f i<br />

∂x j<br />

(a)<br />

92


Le résultat suivant est une version globale du Théorème 5.1.1.<br />

Théorème 5.1.3 Soit f : U −→ F une application définie sur un ouvert U d’un espace de Banach<br />

E et à valeurs dans un espace de Banach F . On suppose que f est de classe C r . Alors, pour que<br />

f soit un C r difféomorphisme de U dans f(U) qui est alors ouvert, il faut et il suffit que f soit<br />

injective et que Df(x) ∈ Isom (E, F ) pour tout x ∈ U.<br />

Démonstration. Supposons que f est un C r difféomorphisme d’un ouvert U de E dans un ensemble<br />

V = f(U) de F . Il résulte de la Remarque 5.1.1, b) que Df(x) ∈ Isom (E, F ) pour tout<br />

x ∈ U. Montrons alors que V = f(U) est ouvert. Soit b = f(a) ∈ V avec a ∈ U. Il existe d’après<br />

le Théorème 5.1.1 des voisinage ouverts U ′ ⊂ U de a et V ′ de b tel que f soit un homéomorphisme<br />

de U ′ dans V ′ . On a alors V ′ ⊂ f(U) = V .<br />

Réciproquement Soit f : U −→ F une application injective de classe C r telle que Df(x) ∈<br />

Isom (E, F ) pour tout x ∈ U. Observons que f est bijective de U dans f(U). Par ailleurs f(U)<br />

est ouvert et f −1 est continue sur f(U). En effet, si on considère y = f(x) ∈ f(U) avec x ∈ U,<br />

il existe d’après le Théorème 5.1.1 des voisinages ouverts U ′ de x et V ′ de y tels que f soit un<br />

homéomorphisme de U ′ dans V ′ , ce qui implique que V ′ ⊂ f(U) et que f −1 est continue en y.<br />

L’application f est donc un homéomorphisme de U dans l’ouvert V = f(U). De plus, comme<br />

Df(x) ∈ Isom (E, F ), on peut appliquer le Théorème 5.1.2 qui nous assure que f −1 est r fois<br />

continuement différentiable au voisinage de y. Ce qui montre que f est un C r difféomorphisme de<br />

U dans l’ouvert f(U), d’où le résultat.<br />

Remarque 5.1.3 Il résulte du théorème précedent que si U ⊂ E et V ⊂ F sont des ouverts et si<br />

f : U −→ V est un C r difféomorphisme, alors pour tout ouvert Ũ ⊂ U, on a Ṽ = f(Ũ) est ouvert<br />

et f est un C r difféomorphisme de Ũ dans Ṽ .<br />

5.2 Théorème des Fonctions Implicites<br />

Théorème 5.2.1 Soient E, F , G des espaces de Banach, U ⊂ E × F un ouvert et f : U −→ G<br />

une application de classe C r . Soit (a, b) ∈ U tel que f(a, b) = 0 et tel que la différentielle partielle<br />

D 2 f(a, b) ∈ Isom (F, G). Alors,<br />

a) il existe des voisinages ouverts V de (a, b), A de a, il existe une application<br />

telle que, pour tout x ∈ A<br />

ϕ : A −→ F<br />

f(x, ϕ(x)) = 0.<br />

b) (x, y) ∈ V et f(x, y) = 0 ⇐⇒ x ∈ A et y = ϕ(x), autrement dit<br />

où S = {(x, y) ∈ U : f(x, y) = 0}.<br />

c) ϕ(.) est de classe C r sur A et<br />

S ∩ V = {(x, ϕ(x)) : x ∈ A},<br />

Dϕ(x) = −(D 2 f(x, ϕ(x))) −1 ◦ D 1 f(x, ϕ(x)).<br />

93


Démonstration. Comme Isom (F, G) est ouvert dans L(F, G) et comme D 2 f est continue, on a<br />

(D 2 f) −1 (Isom (F, G)) est un ouvert qui contient (a, b). On peut alors supposer que D 2 f(x, y) ∈<br />

Isom (F, G) pour tout (x, y) ∈ U. Définissons<br />

par<br />

h : U −→ E × G<br />

h(x, y) = (x, f(x, y)).<br />

pour tout (x, y) ∈ U. L’application h est de classe C r car h = (h 1 , h 2 ) avec h 1 et h 2 de classe C r .<br />

On a donc, pour tout (u, v) ∈ E × F<br />

Dh(x, y)(u, v) = (u, D 1 f(x, y)u + D 2 f(x, y)v).<br />

On observe que L = Dh(a, b) est bijective. En effet si (u, v) ∈ ker L, alors u = 0 et D 2 f(a, b)v =<br />

0 d’où v = 0. De plus, si on considère (u, w) ∈ E × G, on a L(u, v) = (u, w) où l’on a posé<br />

v = (D 2 f(a, b)) −1 (w − D 1 f(a, b)u). Observons que l’on a montré que<br />

(Dh(a, b)) −1 = (π E , D 2 f(a, b) ◦ (π G − D 1 f(a, b) ◦ π E )),<br />

ce qui implique que Dh(a, b) est un isomorphisme. On peut donc appliquer le Théorème 5.1.2 qui<br />

garantit l’existence d’un voisinage V ′ de (a, b) tel que h soit un C r difféomorphisme de V ′ dans<br />

l’ouvert W ′ = h(V ′ ) qui est un voisinage de h(a, b) = (a, 0). Il existe alors un voisinage ouvert<br />

A de a et un voisinage ouvert B de 0 dans G tels que A × B ⊂ W ’. Posons W = A × B et<br />

V = h −1 (W ). Il est clair que h est un C r difféomorphisme de V dans W . Pour tout x ∈ A, posons<br />

ϕ(x) = (π F ◦ h −1 )(x, 0).<br />

L’application ϕ est de classe C r comme composée de trois applications de ce type. Pour tout<br />

x ∈ A, on a h −1 (x, 0) = (x, ϕ(x)) donc (x, 0) = h(x, ϕ(x)) = (x, f(x, ϕ(x))) ce qui montre que<br />

f(x, ϕ(x)) = 0. De plus, si (x, y) ∈ V vérifie f(x, y) = 0 on a h(x, y) = (x, 0) = h(x, ϕ(x)) et<br />

(x, ϕ(x)) ∈ V ce qui implique y = ϕ(x) car h est injective sur V . Il reste alors à calculer Dϕ. On<br />

remarque pour ceci que pour tout x ∈ A on a f(x, ϕ(x)) = 0. Remarquons alors que f ◦ Φ = 0<br />

où Φ : A −→ V est définie par Φ(x) = (x, ϕ(x)). Il en résulte que, pour tout x ∈ A et pour tout<br />

u ∈ E, on a D(f ◦ Φ)(x)(u) = 0, d’où D 1 f(x, ϕ(x))(u) + D 2 (f, ϕ(x))(Dϕ(x)(u)) = 0. Il en<br />

résulte bien que<br />

Dϕ(x)(u) = −((D 2 f(x, ϕ(x))) −1 ◦ D 1 f(x, ϕ(x)))(u).<br />

Remarque 5.2.1 On vient de démontrer le Théorème des fonctions implicites à l’aide du Théorème<br />

du difféomorphisme local. On peut également faire l’inverse. En effet, étant donné f :<br />

U −→ F une application de classe C r , r ≥ 1 définie sur un ouvert U d’un espace de Banach<br />

E et à valeurs dans un espace de Banach F et a ∈ U tel que Df(a) ∈ Isom (E, F ), on définit<br />

94


g : U ×F → F par g(x, y) = f(x)−y. Posant b = f(a) on a D 1 g(a, b) = Df(a) ∈ Isom (E, F ).<br />

D’après le Théorème 5.2.1 il existe un voisinage ouvert V de (a, b), un voisinage ouvert B de b et<br />

une application ψ : B −→ X de classe C r telle que (x, y) ∈ V et g(x, y) = 0 si et seulement si<br />

y ∈ B et x = ψ(y). Posons<br />

A = {x ∈ X : (x, f(x)) ∈ V }.<br />

C’est un ensemble ouvert comme image réciproque d’un ouvert par une application continue et<br />

a ∈ A. On a alors que f est bijective de A dans B et f −1 = ψ sur B. En effet si x 1 , x 2 ∈ A vérifient<br />

f(x 1 ) = f(x 2 ) := y on a (x 1 , y), (x 2 , y) ∈ V et g(x 1 , y) = g(x 2 , y) = 0 donc x 1 = x 2 = ψ(y).<br />

Par ailleurs si y ∈ B, posant x = ψ(y) on a (x, y) ∈ V et f(x) = y donc x ∈ A. On a donc bien<br />

montré que f était un C r difféomorphisme de A dans B.<br />

5.3 Application : Multiplicateurs de Lagrange<br />

Théorème 5.3.1 Soient g : U −→ F une application de classe C 1 définie sur un ouvert U d’un<br />

espace de Banach E, à valeurs dans un espace de Banach F et f : U −→ R une fonction. On<br />

pose S = g −1 (0) et on suppose que a ∈ S est un extremum local de f sur S. On suppose aussi<br />

que f est différentiable en a et que :<br />

– Dg(a) ∈ L(E, F ) est surjective ;<br />

– ker Dg(a) admet un supplémentaire topologique (i.e. E = ker Dg(a) ⊕ Y avec projections<br />

continues).<br />

Alors, il existe λ ∈ F ∗ = L(F, R) unique tel que<br />

Df(a) = λ ◦ Dg(a).<br />

Démonstration. On pose X = ker Dg(a) et on considère un sous-espace vectoriel fermé Y ⊂ E<br />

tel que E = X⊕Y dont l’existence est garantie par l’hypothèse. Soit r > 0 tel que la boule ouverte<br />

B(a, 2r) soit contenue dans U. Posant V = X ∩ B(0, r) et W = Y ∩ B(0, r), on remarque que<br />

V et W sont des ouverts non vides de Y et de Y et que a + V + W ⊂ U, ce qui permet de définir<br />

une application h : V × W −→ F par h(v, w) = g(a + v + w). L’application h est de classe C 1<br />

comme composée d’une application de classe C 1 et d’une application affine continue. On a alors<br />

Dh(v, w) = Dg(a + v + w) ◦ l avec l : X × Y −→ E définie par l(h, k) = h + k pour tout<br />

(h, k) ∈ X × Y . Il en résulte que<br />

et<br />

D 1 h(v, w) = Dh(v, w) ◦ l(·, 0) = Dg(a + v + w) |X ,<br />

D 2 h(v, w) = Dh(v, w) ◦ l(0, ·) = Dg(a + v + w) |Y .<br />

On a h(0, 0) = 0. Comme E = ker Dg(a) ⊕ Y , on a ker Dg(a) |Y = ker Dg(a) ∩ Y = {0} donc<br />

Dg(a) |Y est injective. Par ailleurs, comme Dg(a) est surjective, tout élément w ∈ F s’écrit w =<br />

Dg(a)(u + v) avec (u, v) ∈ ker Dg(a) × Y , donc w = Dg(a) |Y (v), ce qui montre que Dg(a) |Y<br />

est aussi surjective. On obtient donc que D 2 h(0, 0) = Dg(a) |Y ∈ Isom (Y, F ) et h(0, 0) = 0.<br />

Utilisant le théorème des fonctions implicites, il existe un voisinage ouvert A de 0 dans X et une<br />

application ϕ : A −→ Y telle que<br />

g(a + v + ϕ(v)) = 0 pour tout v ∈ A,<br />

95


avec<br />

Dϕ(0) = −(D 2 h(0, 0)) −1 ◦ D 1 h(0, 0) = −(Dg(a) |Y ) −1 ◦ Dg(a) |X = 0,<br />

car Dg(a) |X = 0. Supposant que a est un minimum local de f sur S, on a, pour tout v dans un<br />

voisinage de 0,<br />

f(a + v + ϕ(v)) ≥ f(a) = f(a + 0 + ϕ(0)),<br />

ce qui implique que la fonction θ(v) = f(a + v + ϕ(v)) a un minimum local en 0, d’où<br />

0 = Dθ(0) = Df(a) ◦ (I X + Dϕ(0)) = Df(a) |X .<br />

Posons alors λ = Df(a) ◦ (Dg(a) |Y ) −1 ∈ L(F, R). On a, par définition :<br />

De plus<br />

Df(a) |Y = (λ ◦ Dg(a)) |Y .<br />

Df(a) |X = (λ ◦ Dg(a)) |X = 0,<br />

donc Df(a) = λ ◦ Dg(a) car E = X ⊕ Y . L’unicité de λ découle du fait que Df(a) = λ ◦ Dg(a)<br />

implique Df(a) |Y = (λ ◦ Dg(a)) |Y , d’où λ = Df(a) ◦ (Dg(a) |Y ) −1 .<br />

Remarque 5.3.1 a) Le théorème précédent reste vrai sans avoir à supposer que ker Dg(a) admet<br />

un supplémentaire topologique ; mais la démonstration dépasse alors le niveau de ce cours.<br />

b) Dans le cas où E est un espace de Hilbert, il est toujours vrai que ker Dg(a) admet un<br />

supplémentaire topologique (son orthogonal, par exemple).<br />

On en déduit le<br />

Corollaire 5.3.1 Soient U ⊂ R n un ouvert, g : U −→ R m une application de classe C 1 et<br />

f : U −→ R une fonction. On pose S = g −1 (0) et on suppose que a ∈ S est un extremum local<br />

de f sur S. On suppose aussi que f est différentiable en a et que :<br />

Alors, il existe λ ∈ R m unique tel que<br />

(∇g 1 (a), · · · , ∇g m (a)) sont linéairement indépendant.<br />

∇f(a) =<br />

m∑<br />

λ i ∇g i (a).<br />

i=1<br />

Démonstration. On a Dg(a)u = (〈∇g 1 (a), u〉, · · · , 〈∇g m (a), u〉) pour tout u ∈ R n , de telle sorte<br />

que Dg(a) T (v) = ∑ m<br />

i=1 v i∇g i (a) pour tout v ∈ R m . Comme (∇g 1 (a), · · · , ∇g m (a)) sont linéairement<br />

indépendant, il en résulte que Dg(a) T est injective donc Dg(a) est surjective. Par ailleurs<br />

ker Dg(a) admet un supplémentaire topologique (son orthogonal, par exemple). Appliquant le<br />

Théorème 5.3.1, il existe λ ∈ R m unique tel que Df(a)u = 〈λ, Dg(a)u〉 pour tout u ∈ R n , soit<br />

〈∇f(a), u〉 =<br />

m∑<br />

〈 ∑ m 〉<br />

λ i 〈∇g i (a), u〉 = λ i ∇g i (a), u ,<br />

i=1<br />

96<br />

i=1


d’où<br />

∇f(a) =<br />

m∑<br />

λ i ∇g i (a).<br />

i=1<br />

Remarque 5.3.2 La condition nécessaire donnée dans le Théorème 5.3.1 permet parfois de déterminer<br />

l’extremum.<br />

5.4 Introductions aux sous-variétés<br />

5.4.1 Immersion et submersion locale<br />

Pour m ≤ n on notera π l’application linéaire surjective π : R n −→ R m définie pour tout x ∈ R n<br />

par π(x 1 , · · · , x n ) = (x n−m+1 , · · · , x n ), et pour n ≤ m, on notera par j : R n −→ R m l’application<br />

linéaire injective définie pour tout x ∈ R m par<br />

j(x 1 , · · · , x n ) = (x 1 , · · · , x n , 0, · · · , 0).<br />

Théorème 5.4.1 IMMERSION. Soit U ⊂ R n un ouvert, soit g : U −→ R m une application de<br />

classe C r et soit a ∈ U tel que Dg(a) soit injective. Alors il existe des ouvert U ⊃ U ′ ∋ a,<br />

R m ⊃ V ∋ g(a) tels que g(U ′ ) ⊂ V et un C r -difféomorphisme f de V sur un ouvert f(V ) de R m<br />

tel que<br />

f(g(x)) = j(x) = (x 1 , · · · , x n , 0, · · · , 0) pour tout x ∈ U ′ ,<br />

de plus, on a<br />

f(V ) ∩ (R n × {0}) = f(g(U ′ )).<br />

Démonstration. Notons que n ≤ m car Dg(a) est injective et considérons un sous-espace vectoriel<br />

F de R m tel que R m = Dg(a)(R n ) ⊕ F de sorte que la dimension de F est m − n. Soit ψ un<br />

isomorphisme de R m−n dans F et soit h : U × R m−n −→ R m définie par h(x, y) = g(x) + ψ(y).<br />

L’application h est de classe C r et Dh(x, y)(u, v) = Dg(x)(u)+ψ(v) ce qui montre que Dh(a, 0)<br />

est surjective, donc bijective car Dh(a, 0) ∈ L(R m , R m ). Il existe donc des ouverts R n ⊃ U ′ ∋ a<br />

et R m−n ⊃ W ′ ∋ 0 tels que h soit un C r difféomorphisme de U ′ × W ′ dans un ouvert V ∋ g(a)<br />

de R m . Posant f = h −1 , on a g(U ′ ) ⊂ h(U ′ × W ′ ) = V , et, pour tout x ∈ U ′ , f(g(x)) =<br />

f(h(x, 0)) = (x, 0) = j(x). On a donc montré que f(g(U ′ )) ⊂ f(V ) ∩ (R n × {0}). Réciproquement,<br />

étant donné z = (z 1 , · · · , z n , 0) ∈ f(V ) ∩ (R n × {0}), on a donc x = (z 1 , · · · , z n ) ∈ U ′<br />

donc f(g(x)) = z donc z ∈ f(g(U ′ )).<br />

Théorème 5.4.2 SUBMERSION. Soit U ⊂ R n un ouvert, soit f : U −→ R m une application de<br />

classe C r et soit a ∈ U tel que Df(a) soit surjective. Alors il existe un ouvert U ⊃ U ′ ∋ a et un<br />

C r -difféomorphisme g de U ′ sur un ouvert g(U ′ ) de R n tel que<br />

π(g(x)) = f(x) pour tout x ∈ U ′ .<br />

97


De plus, si f(a) = 0, on a<br />

g(U ′ ∩ S) = g(U ′ ) ∩ (R n−m × {0}),<br />

où S = {x ∈ U : f(x) = 0}.<br />

Démonstration. Notons que m ≤ n car Df(a) est surjective et que dim(ker(Df(a))) = n−m. Il<br />

existe alors une application linéaire ψ : R n −→ R n−m telle que ψ |ker(Df(a)) soit injective (prendre<br />

une base (e 1 , · · · , e n−m ) de ker(Df(a)) et poser ψ(x) = (y 1 , · · · , y n−m ) coordonnées dans cette<br />

base de la projection orthogonale de x sur ker(Df(a))). Introduisons g : U −→ R n par g = (ψ, f)<br />

de telle sorte que g est de classe C r sur U et Dg(a) = (ψ, Df(a)). Soit u ∈ ker(Dg(a)), on<br />

a u ∈ ker(Df(a)) et ψ(u) = 0 donc u = 0, d’où Dg(a) est injective et alors bijective car<br />

Dg(a) ∈ L(R n , R n ). Il existe donc des ouverts U ⊃ U ′ ∋ a et R n ⊃ g(U ′ ) ∋ g(a) tels que g soit<br />

un C r -difféomorphisme U ′ dans g(U ′ ). Il est alors clair que f = π ◦g sur U ′ . Pour tout x ∈ S ∩U ′ ,<br />

on a alors g(x) = (ψ(x), f(x)) = (ψ(x), 0) donc g(U ′ ∩S) ⊂ g(U ′ )∩(R n−m ×{0}). Par ailleurs,<br />

si z ∈ g(U ′ ) ∩ (R n−m × {0}), alors z = g(x) avec x ∈ U ′ et z = (y, 0) avec y ∈ R n−m d’où<br />

(y, 0) = (ψ(x), f(x)), ce qui montre bien que x ∈ S donc z ∈ g(U ′ ∩ S).<br />

5.4.2 Définitions équivalentes des sous-variétés<br />

Définition 5.4.1 Une partie non vide S ⊂ R n est appelée sous-variété de classe C r et de dimension<br />

d ∈ N si, pour tout a ∈ S, il existe un ouvert V ∋ a et un C r -difféomorphisme f de V dans<br />

un ouvert W ∋ f(a) tel que<br />

f(V ∩ S) = f(V ) ∩ (R d × {0}).<br />

Exemple 5.4.1 a) Un ouvert de R n est une sous-variété de dimension n et de classe C ∞ (prendre<br />

f = I R n). On pourra démontrer en exercice que, réciproquement, toute sous-variété de dimension<br />

n est un ouvert de R n .<br />

b) Étant donnée une sous-variété S de dimension 0 et a ∈ S, alors S ∩ V = f(V ) ∩ {0} = {0}<br />

donc S ∩ V = {a}.<br />

c) Un sous-espace affine L ⊂ R n de dimension d est une sous-variété de dimension d. En effet,<br />

étant donné a ∈ L on considère une base (e 1 , · · · , e n ) de R n telle que (e 1 , · · · , e d ) soit une base<br />

de L − a, et on considère l’isomorphisme ϕ : R n −→ R n qui à x ∈ R n associe ses cooordonnées<br />

(x 1 , · · · , x n ) dans cette base. Posant f(x) = ϕ(x) − ϕ(a), on a f(L) = R d × {0}.<br />

Théorème 5.4.3 Considérons les propriétés suivantes relatives à une partie non vide S ⊂ R n .<br />

i) S est une sous-variété de classe C r et de dimension d.<br />

ii) Pour tout a ∈ S, il existe un ouvert R n ⊃ U ∋ a et une application h = (h 1 , · · · , h n−d ) : U −→<br />

R n−d de classe C r avec (∇h 1 (a), · · · , ∇h n−d (a)) linéairement indépendants (ce qui équivaut à<br />

dire que Dh(a) est surjective) telles que<br />

S ∩ U = h −1 (0).<br />

98


iii) Pour tout a ∈ S, il existe un ouvert R n ⊃ V ∋ a, un ouvert R d ⊃ W ∋ (a 1 , · · · , a d ) et une<br />

application g : W −→ R n−d de classe C r telle que, à une permutation près des coordonnées, on<br />

ait<br />

S ∩ V = {(z, g(z)) : z ∈ W }.<br />

iv) Pour tout a ∈ S, il existe des ouverts R n ⊃ V ∋ a, R d ⊃ Ω ∋ 0 et une application p : Ω −→<br />

R n de classe C r telle que<br />

p(0) = a, Dp(0) est injective et p est un homéomorphisme de Ω dans S ∩ V.<br />

Alors, ces quatres propriétés sont équivalentes.<br />

Démonstration. Montrons que i) =⇒ ii) =⇒ iii) =⇒ iv) =⇒ i).<br />

i) =⇒ ii). Définissons h = π◦f : V −→ R n−d avec π(y 1 , · · · , y n ) = (y d+1 , · · · , y n ). L’application<br />

h est de classe C r sur V et Dh(a) = π ◦ Df(a) est surjective car π est surjective et Df(a) est<br />

bijective. Pour x ∈ V , on a h(x) = 0. Réciproquement, si h(x) = 0, on a f(x) ∈ f(V )∩(R d ×{0})<br />

donc f(x) = f(z) avec z ∈ S donc x = z ∈ S car f est injective sur V . On a donc bien<br />

S ∩ V = h −1 (0).<br />

ii) =⇒ iii). Comme Dh(a) est surjective, il existe {i 1 , · · · , i n−d } ⊂ [1, n] tels que<br />

(Dh(a)e i1 , · · · , Dh(a)e in−d )<br />

soient linéairement indépendants. Quitte à permuter les coordonnées, on peut supposer que<br />

(Dh(a)e d+1 , · · · , Dh(a)e n )<br />

sont linéairement indépendants. Écrivant R n = R d × R n−d , on a, pour tout v ∈ R n−d ,<br />

D 2 h(a)(v) = Dh(a)(0, v) =<br />

n∑<br />

j=d+1<br />

v j Dh(a)(e j ),<br />

ce qui montre que D 2 h(a) ∈ L(R n−d , R n−d ) est injective donc bijective. Appliquant le Théorème<br />

des fonctions implicites, il existe des voisinages ouverts A de (a 1 , · · · , a d ) dans R d et V ⊂ U de a<br />

dans R n et une application g : A −→ R n−d de classe C r tels que<br />

h −1 (0) ∩ V = {(z, g(z)) : z ∈ A},<br />

soit<br />

S ∩ V = S ∩ U ∩ V = h −1 (0) ∩ V = {(z, g(z)) : z ∈ A}.<br />

iii) =⇒ iv). Posons Ω = W − â, où â = (a 1 , · · · , a d ), de telle sorte que g(â) = (a d+1 , · · · , a n ), et,<br />

pour tout t ∈ Ω, p(t) = (â + t, g(â + t)) d’où p(0) = (â, g(â)) = a. L’application p est de classe<br />

C r et Dp(0)(u) = (u, Dg(a)(u)) pour tout u ∈ R d ce qui montre que Dp(0) est injective. On a<br />

p(Ω) = S ∩ V.<br />

99


De plus, p étant injective est une bijection de Ω dans p(Ω) = S ∩ V . Enfin la bijection inverse est<br />

définie pour tout x ∈ S ∩ V par (x 1 − a 1 , · · · , x d − a d ) qui est continue, ce qui montre bien que p<br />

est un homéomorphisme de Ω dans S ∩ V .<br />

iv) =⇒ i). D’après le Théorème 5.4.1, il existe un ouvert ˆΩ ⊂ Ω contenant 0, un ouvert Ŵ ∋ a tel<br />

que p(ˆΩ) ⊂ Ŵ et un Cr -difféomorphisme f de Ŵ dans un ouvert f(Ŵ ) tels que<br />

f(p(ˆΩ)) = f(Ŵ ) ∩ (Rd × {0}).<br />

Comme ˆΩ est un ouvert et p un homéomorphisme, on obtient que p(ˆΩ) est un ouvert de S ∩ V .<br />

Il existe donc un ouvert ˆV ∋ a tel que p(ˆΩ) = ˆV ∩ S. Comme p(ˆΩ) ⊂ Ŵ , on peut supposer que<br />

ˆV ⊂ Ŵ . On a alors<br />

f( ˆV ∩ S) = f(p(ˆΩ)) = f(Ŵ ) ∩ (Rd × {0}) ⊃ f( ˆV ) ∩ (R d × {0}),<br />

et f( ˆV ∩ S) ⊂ f( ˆV ) et f( ˆV ∩ S) = f(p(ˆΩ)) ⊂ R d × {0} donc f( ˆV ∩ S) ⊂ f( ˆV ) ∩ (R d × {0}),<br />

d’où<br />

f( ˆV ∩ S) = f( ˆV ) ∩ (R d × {0}).<br />

Remarque 5.4.1 C’est un bon exercice de montrer d’autres implications que celles strictement<br />

nécessaires à la démonstration du théorème précédent.<br />

ii) =⇒ i). D’après le Théorème 5.4.2, il existe un ouvert V ⊃ V ′ ∋ a et un C r -difféomorphisme g<br />

de V ′ dans un ouvert g(V ′ ) de R n tel que π d (g(x)) = f(x) pour tout x ∈ V ′ avec π d (y 1 , · · · , y n ) =<br />

(y d+1 , · · · , y n ) et tel que g(V ′ ∩ S) = g(V ′ ) ∩ (R d × {0}).<br />

iii) =⇒ ii). Considérons l’ouvert ˆV = V ∩(W ×R d ). On vérifie immédiatement que a ∈ ˆV et que<br />

S ∩ ˆV = {(z, g(z)) : z ∈ W }. Introduisons l’application h : ˆV −→ R n−d par h(z, y) = y − g(z).<br />

On vérifie alors que<br />

h −1 (0) = ˆV ∩ S.<br />

De plus pour tout (w, v) ∈ R d × R n−d on a Dh(a)(w, v) = v − Dg(a 1 , · · · , a d )(w) donc<br />

v = Dh(a)(0, v) d’où Dh(a) est surjective, ce qui équivaut à ∇h 1 (a), · · · , ∇h m (a) linéairement<br />

indépendants.<br />

i) =⇒ iv). On peut supposer sans perte de généralité que f(a) = 0. Définissons<br />

π 0 (y 1 , · · · , y n ) = (y 1 , · · · , y d )<br />

et Ω = π 0 (f(V ) ∩ (R d × {0})). L’ensemble Ω est ouvert (vérification facile) et contient 0. Pour<br />

t ∈ Ω, on a (t, 0) ∈ f(V ), on peut donc poser p(t) = f −1 (t, 0). L’application ainsi définie est<br />

de classe C r et, pour tout w ∈ R d , on a Dp(0)(w) = Df −1 (0)(w, 0) = (Df(a)) −1 (w, 0), ce qui<br />

montre que Dp(0) est injective. Par ailleurs t ∈ Ω si et seulement si (t, 0) ∈ f(V ) ∩ (R d × {0})<br />

donc p(Ω) = S ∩ V . Enfin pour tout x ∈ S ∩ V , on a p −1 (x) = π 0 (f(x)) ce qui montre que p −1<br />

est continue, donc p est bien un homéomorphisme de Ω dans S ∩ V .<br />

100


iv) =⇒ iii). (C’est un peu moins facile). Comme Dp(0) est injective, on a Dp(0) T est surjective,<br />

ce qui implique que le sous-espace vectoriel engendré par ∇p 1 (0), · · · , ∇p n (0) est R d . Il existe<br />

donc i 1 , · · · , i d ∈ [1, n] tels que (∇p i1 (0), · · · , ∇p id (0)) est une base de R d . En permutant les coordonnées,<br />

on peut supposer que (∇p 1 (0), · · · , ∇p d (0)) est une base de R d , ce qui implique que<br />

l’application q : Ω −→ R d définie par q(t) = (p 1 (t), · · · , p d (t)) vérifie Dq(0) ∈ Isom (R d ).<br />

Il existe donc un ouvert ˆΩ ∋ 0 tel que q soit un C r -difféomorphisme de ˆΩ dans un ouvert<br />

R d ⊃ Ŵ ∋ â = (a 1, · · · , a d ). Comme p est un homéomorphisme de Ω dans S ∩ V , il existe<br />

un ouvert R n ⊃ ˆV ∋ a tel que p(ˆΩ) = S ∩ ˆV . Introduisons alors g : Ŵ −→ R n−d par<br />

g(ẑ) = (p d+1 (q −1 (ẑ), · · · , p n (q −1 (ẑ)). L’application g est de classe C r sur Ŵ et<br />

{(ẑ, g(ẑ)) : ẑ ∈ Ŵ } = S ∩ ˆV .<br />

En effet, si x ∈ S ∩ ˆV , alors x = p(t) pour un t ∈ ˆΩ et ẑ = (p 1 (t), · · · , p d (t)) ∈ Ŵ de telle sorte<br />

que<br />

x = (p 1 (t), · · · , p d (t), p d+1 (t), · · · , p n (t)) = (ẑ, g(ẑ)).<br />

Réciproquement, si x = (ẑ, g(ẑ)) pour ẑ ∈ Ŵ , alors t = q−1 (ẑ) ∈ ˆΩ, d’où<br />

donc x ∈ p(ˆΩ) = S ∩ ˆV .<br />

x = (p 1 (t), · · · , p d (t), p d+1 (t), · · · , p n (t)),<br />

iii) =⇒ i). Soit U l’ouvert de R n défini par U = W × R n−d et soit f : U −→ R n définie<br />

par f(y, z) = (y, g(y) − z). L’application f est de classe C r et, pour tout u = (v, w) ∈ R n ,<br />

on a Df(a)u = (v, Dg(â)v − w) où â = (a 1 , · · · , a d ). Il en résulte que Df(a) est injective<br />

donc bijective car Df(a) ∈ L(R n , R n ). D’après le Théorème du difféomorphisme local, il existe<br />

donc un ouvert ˆV ∋ a tel que ˆV ⊂ W × R n−d et tel que f soit un C r difféomorphisme de ˆV<br />

dans l’ouvert Ŵ = f( ˆV ). Étant donné x = (y, z) ∈ S ∩ ˆV , on a y ∈ W donc z = g(y) et<br />

f(x) = (y, 0) ∈ f( ˆV ) ∩ R d × {0}. Réciproquement, si x = (y, 0) ∈ f( ˆV ) ∩ R d × {0}, alors<br />

y ∈ W et il existe z ∈ R n−d tel que x = (y, g(y) − z) = (y, 0) d’où z = g(y) donc (y, z) ∈ S et<br />

x ∈ f(S ∩ ˆV ). On a donc bien<br />

5.4.3 Sous-espace tangent<br />

f(S ∩ ˆV ) = f( ˆV ) ∩ R d × {0}.<br />

Définition 5.4.2 Soit S ⊂ R n une sous-variété de classe C r et de dimension d. On dit que u ∈ R n<br />

est tangent à S en a ∈ S s’il existe η > 0 et une fonction ϕ :] − η, +η[−→ S dérivable en 0 telle<br />

que ϕ(0) = a et ϕ ′ (0) = u.<br />

Théorème 5.4.4 L’ensemble T a S des vecteurs tangents en a à une sous-variété S ∋ a de classe<br />

C r et de dimension d est un espace vectoriel de dimension d.<br />

Démonstration. Considérons le voisinage ouvert V de a et le C r -difféomorphisme f : V −→<br />

f(V ) tel que f(S ∩ V ) = f(V ) ∩ R d × {0}. On peut supposer que f(a) = 0. Soit alors v ∈ T a S<br />

et ϕ :] − η, +η[−→ S dérivable en 0 telle que ϕ(0) = a et ϕ ′ (0) = u. On peut supposer, quitte<br />

101


à diminuer η que ϕ(] − η, +η[) ⊂ S ∩ V . Définissant alors α :] − η, +η[−→ R d × {0} par<br />

α(t) = f(ϕ(t)), on a<br />

α ′ (0) = Df(ϕ(0))ϕ ′ (0) = Df(a)u,<br />

et α ′ (0) ∈ R d × {0} donc Df(a)u ∈ R d × {0}. Réciproquement, soit w ∈ R d × {0}. On a<br />

0 = f(a) ∈ f(V )∩R d ×{0} et f(V )∩R d ×{0} est un ouvert de R d ×{0} car f(V ) est un ouvert<br />

de R n . Il existe donc η > 0 tel que tw ∈ f(V )∩R d ×{0} = f(S∩V ) pour tout t ∈]−η, +η[. Posant<br />

ϕ(t) = f −1 (tw), on a ϕ :] − η, +η[−→ S ∩ V , ϕ(0) = a et ϕ ′ (0) = Df −1 (0)w = (Df(a)) −1 (w)<br />

et u = ϕ ′ (0) ∈ T a S. On a alors w = Df(a)u avec u ∈ T a S. On a donc montré que<br />

T a S = (Df(a)) −1 (R d × {0}).<br />

Comme (Df(a)) −1 est un isomorphisme et comme R d ×{0} est un espace vectoriel de dimension<br />

d, il en est de même pour T a S.<br />

on peut aussi calculer l’espace tangent T a S à l’aide des définitions équivalentes des sous-variétés<br />

données dans le théorème 5.4.4.<br />

Proposition 5.4.1 Dans le cas ii), on a<br />

T a S = ker Dh(a) = {u ∈ R n : 〈∇h i (a), u〉 = 0, i ∈ [1, n − d]}.<br />

Dans le cas iii), on a, posant â = (a 1 , · · · , a d ),<br />

T a S = {(v, Dg(â)v) : v ∈ R d }.<br />

Dans le cas iv), on a<br />

T a S = Dp(0)(R d ) = {Dp(0)v : v ∈ R d }.<br />

102

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!