Systèmes Dynamiques Notes du cours de M2
Systèmes Dynamiques Notes du cours de M2
Systèmes Dynamiques Notes du cours de M2
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Systèmes</strong> <strong>Dynamiques</strong><br />
<strong>Notes</strong> <strong>du</strong> <strong>cours</strong> <strong>de</strong> <strong>M2</strong><br />
Raphaël KRIKORIAN<br />
Université Paris 6<br />
Année 2008-2009
Table <strong>de</strong>s matières<br />
1 Quelques Notions <strong>de</strong> Dynamique 7<br />
1.1 <strong>Systèmes</strong> dynamiques . . . . . . . . . . . . . . . . . . . . . . . 7<br />
2 Dynamique Topologique 9<br />
2.1 Récurrence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9<br />
2.2 Irré<strong>du</strong>ctibilité . . . . . . . . . . . . . . . . . . . . . . . . . . . 10<br />
2.2.1 Minimalité . . . . . . . . . . . . . . . . . . . . . . . . . 10<br />
2.2.2 Transitivité . . . . . . . . . . . . . . . . . . . . . . . . 11<br />
2.2.3 Mélange topologique . . . . . . . . . . . . . . . . . . . 13<br />
2.3 Décalages (ou shifts) . . . . . . . . . . . . . . . . . . . . . . . 13<br />
2.3.1 Shift <strong>de</strong> Bernoulli . . . . . . . . . . . . . . . . . . . . . 13<br />
2.3.2 Sous-shifts <strong>de</strong> type fini . . . . . . . . . . . . . . . . . . 14<br />
2.4 Application à la preuve <strong>du</strong> théorème <strong>de</strong> van <strong>de</strong>r Waer<strong>de</strong>n . . . 17<br />
3 Mesures Invariantes 21<br />
3.1 Ergodicité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />
3.1.1 Premiers exemples . . . . . . . . . . . . . . . . . . . . 25<br />
3.2 Les Théorèmes ergodiques . . . . . . . . . . . . . . . . . . . . 27<br />
3.2.1 Le point <strong>de</strong> vue spectral et le théorème <strong>de</strong> Von Neumann 27<br />
3.2.2 Convergence presque sûre . . . . . . . . . . . . . . . . 29<br />
3.3 Liens avec la dynamique topologique . . . . . . . . . . . . . . 31<br />
3.3.1 Existence <strong>de</strong> mesures ergodiques . . . . . . . . . . . . . 31<br />
3.3.2 Points génériques . . . . . . . . . . . . . . . . . . . . . 33<br />
3.3.3 Unique ergodicité . . . . . . . . . . . . . . . . . . . . . 33<br />
3.4 Mélange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38<br />
4 Homéomorphismes et difféomorphismes <strong>du</strong> cercle 43<br />
4.1 Homéomorphismes <strong>du</strong> cercle . . . . . . . . . . . . . . . . . . . 43<br />
4.1.1 Forme <strong>de</strong>s relevés d’un homéomorphisme <strong>du</strong> cercle . . . 43<br />
4.1.2 Nombre <strong>de</strong> rotation . . . . . . . . . . . . . . . . . . . . 45<br />
4.1.3 Le théorème <strong>de</strong> Poincaré . . . . . . . . . . . . . . . . . 48<br />
3
4 TABLE DES MATIÈRES<br />
4.2 Difféomorphismes <strong>du</strong> cercle . . . . . . . . . . . . . . . . . . . . 51<br />
4.2.1 Rappels sur les fractions continues . . . . . . . . . . . 51<br />
4.2.2 Théorème <strong>de</strong> Denjoy . . . . . . . . . . . . . . . . . . . 54<br />
4.2.3 Contre-exemples <strong>de</strong> Denjoy . . . . . . . . . . . . . . . 56<br />
4.2.4 Le Théorème d’Herman-Yoccoz . . . . . . . . . . . . . 57<br />
4.2.5 Théorème d’Arnold . . . . . . . . . . . . . . . . . . . . 57<br />
5 Hyperbolicité 59<br />
5.1 Point fixe hyperbolique d’un difféomorphisme . . . . . . . . . 59<br />
5.2 Stabilité structurelle <strong>de</strong>s automorphismes <strong>du</strong> tore . . . . . . . 63<br />
5.2.1 Forme <strong>de</strong>s homéomorphismes <strong>du</strong> tore . . . . . . . . . . 63<br />
5.2.2 Conjugaison topologique . . . . . . . . . . . . . . . . . 64<br />
5.3 Variétés stables et instables . . . . . . . . . . . . . . . . . . . 65<br />
6 Théorie spectrale 69<br />
6.1 Le théorème spectral . . . . . . . . . . . . . . . . . . . . . . . 70<br />
6.2 Transformations à spectre discret . . . . . . . . . . . . . . . . 72<br />
6.3 Mélange faible . . . . . . . . . . . . . . . . . . . . . . . . . . . 73<br />
6.4 Facteur <strong>de</strong> Kronecker . . . . . . . . . . . . . . . . . . . . . . . 77<br />
6.5 Couplages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78<br />
6.6 Mélange faible d’ordre supérieur . . . . . . . . . . . . . . . . . 79<br />
6.7 Argument <strong>de</strong> Hopf et Théorie spectrale . . . . . . . . . . . . . 80<br />
7 Entropie 83<br />
7.1 Entropie métrique . . . . . . . . . . . . . . . . . . . . . . . . . 83<br />
7.1.1 Entropie d’une partition finie . . . . . . . . . . . . . . 83<br />
7.1.2 Entropie d’une transformation . . . . . . . . . . . . . . 86<br />
7.1.3 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . 91<br />
7.1.4 Théorème <strong>de</strong> Shannon . . . . . . . . . . . . . . . . . . 92<br />
7.1.5 Entropie d’un facteur, d’un pro<strong>du</strong>it et d’une puissance 94<br />
A Calcul différentiel 97<br />
A.1 Théorèmes <strong>du</strong> Point Fixe . . . . . . . . . . . . . . . . . . . . . 97<br />
A.1.1 Théorème <strong>du</strong> Point Fixe pour les applications contractantes<br />
. . . . . . . . . . . . . . . . . . . . . . . . . . . 97<br />
A.2 Le théorème d’Inversion Locale et ses conséquences . . . . . . 100<br />
A.2.1 Difféomorphismes . . . . . . . . . . . . . . . . . . . . . 100<br />
A.2.2 Inversion locale . . . . . . . . . . . . . . . . . . . . . . 101<br />
A.2.3 Fonctions Implicites . . . . . . . . . . . . . . . . . . . 103<br />
A.2.4 Théorème <strong>du</strong> rang constant . . . . . . . . . . . . . . . 104<br />
A.3 Sous-variétés <strong>de</strong> R m . . . . . . . . . . . . . . . . . . . . . . . . 105
TABLE DES MATIÈRES 5<br />
A.3.1 Définition, exemples . . . . . . . . . . . . . . . . . . . 105<br />
A.3.2 Espace tangent . . . . . . . . . . . . . . . . . . . . . . 106<br />
A.3.3 Groupes et algèbres <strong>de</strong> Lie linéaires . . . . . . . . . . . 107<br />
A.3.4 Variétés . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6 TABLE DES MATIÈRES
Chapitre 1<br />
Quelques Notions <strong>de</strong> Dynamique<br />
1.1 <strong>Systèmes</strong> dynamiques<br />
Un système dynamique est la donnée d’un ensemble X (l’espace <strong>de</strong>s<br />
phases) et d’un groupe G agissant sur X. Bien souvent ce groupe est Z et on<br />
dit que le système dynamique est discret ou R et on parle alors <strong>de</strong> système<br />
dynamique continu. On peut considérer cependant <strong>de</strong>s dynamiques associées<br />
à <strong>de</strong>s groupes <strong>de</strong> Lie, par exemple SL(2, R). On peut également considérer<br />
l’action <strong>de</strong> semi-groupes sur G et on parle <strong>de</strong> dynamiques non-inversibles.<br />
Une action <strong>du</strong> groupe Z sur X est équivalente à l’itération d’une application<br />
bijective f : X → X ; plus généralement l’itération d’une application<br />
f : X → X non nécéssairement injective est équivalente à l’action <strong>du</strong> semigroupe<br />
N sur X. Ces exemples seront les principaux sujets d’étu<strong>de</strong> <strong>de</strong> ce<br />
<strong>cours</strong>.<br />
Une action <strong>de</strong> R sur X est équivalente à un groupe à un paramètre réel<br />
<strong>de</strong> bijections <strong>de</strong> X sur X.<br />
Pour obtenir <strong>de</strong>s objets d’étu<strong>de</strong> intéressants, il faut supposer que l’espace<br />
X et la dynamique sont munis <strong>de</strong> structure supplémentaires.<br />
Quand X est un espace muni d’une σ-algèbre B (et d’une mesure <strong>de</strong> probabilité<br />
µ ) et que f : X → X est une application mesurable, la dynamique est<br />
dite mesurable ;<br />
quand X est un espace topologique (muni d’une topologie U) et que l’action<br />
<strong>de</strong> Z est continue (ou l’application f : X → X est continue) on dit que l’on<br />
a à faire à un système dynamique topologique ;<br />
si X est une variété différentiable et f : X → X est <strong>de</strong> classe C k on dit que<br />
la dynamique est différentiable.<br />
L’objet <strong>de</strong> la théorie ergodique est l’étu<strong>de</strong> <strong>de</strong>s dynamiques mesurables.<br />
7
8 CHAPITRE 1. QUELQUES NOTIONS DE DYNAMIQUE<br />
Définition 1.1.1 Un système dynamique mesurable est la donnée d’un espace<br />
mesurable (X, B) et d’une application f : X → X mesurable : pour tout<br />
B ∈ B, f −1 (B) ∈ B. Si f est bijective et que f −1 est également mesurable on<br />
dit que la dynamique est inversible.<br />
Dans la pratique, nos espaces mesurables sont munis d’une mesure <strong>de</strong><br />
probabilité µ.<br />
Définition 1.1.2 Un système dynamique mesuré est la donnée <strong>du</strong>n espace<br />
mesuré (X, B, µ) et d’une application f : X 1 → X 2 où X −X 1 et X −X 2 sont<br />
µ-négligeables, f est mesurable et préserve la mesure µ : pour tout B ∈ B,<br />
µ(f −1 (B)) = µ(B). Si f est bijective et que f −1 est également mesurable on<br />
dit que la dynamique est inversible.<br />
Exercice Soit S : R/Z définie par Sx = 2x. Montrer que S est bien définie<br />
et montrer que pour tout entier n, x = p/(2 n − 1) (0 ≤ p < 2 n − 1) est<br />
un point périodique <strong>de</strong> pério<strong>de</strong> n. (Il s’agit <strong>de</strong> démontrer que les points<br />
x, Sx, . . . , S n−1 x sont distincts, ce qui revient à démontrer que (2 b −1)/(2 a −1)<br />
n’est pas entier si a ne divise pas b ; on pourra faire la division euclidienne<br />
b = qa + r).
Chapitre 2<br />
Dynamique Topologique<br />
Dans ce qui suit X est un espace métrique compact et f : X → X est<br />
une application continue.<br />
Ensembles invariants Un ensemble A ⊂ X est dit invariant si f(A) ⊂ A,<br />
fortement invariant si f(A) = A et complètement invariant si f −1 (A) = A.<br />
Quand f est un homéomorphisme, ces notions coinci<strong>de</strong>nt.<br />
2.1 Récurrence<br />
Point périodique Un point x ∈ X est périodique s’il existe n 0 ∈ N tel<br />
que f n 0<br />
(x) = x. Nous noterons P n (f) l’ensemble <strong>de</strong>s points fixes <strong>de</strong> f n : c’est<br />
un compact ; <strong>de</strong> même nous noterons P (f) = ⋃ n∈N P n(f).<br />
Point récurrent<br />
Un point x est dit récurrent ssi<br />
inf d(x, f n (x)) = 0.<br />
n≥1<br />
Ensembles α et ω-limite Si x ∈ X, l’ensemble <strong>de</strong>s points ω-limite <strong>de</strong> x est<br />
l’ensemble <strong>de</strong>s y ∈ X qui sont points d’accumulation <strong>de</strong> la suite (f n (x)) n≥0 .<br />
Si f est inversible on définit également l’ensemble α-limite <strong>de</strong> x qui est l’ensemble<br />
<strong>de</strong>s points d’accumulation <strong>de</strong> la suite (f n (x)) n≤0 . Si f est inversible,<br />
nous notons<br />
( ⋃<br />
)<br />
L(f) = Adh ω(x) ∪ P ∪ α(x) .<br />
x∈X<br />
9
10 CHAPITRE 2. DYNAMIQUE TOPOLOGIQUE<br />
Point non errant Un point x 0 est dit errant ssi il existe un voisinage U<br />
<strong>de</strong> x 0 tel que pour tout n ≥ 1, f n (U) ∩ U = ∅ ; un point est non-errant s’il<br />
n’est pas errant. On note Ω(f) l’ensemble <strong>de</strong>s points non errants.<br />
Point récurrent par chaînes Un point x est récurrent par chaîınes si<br />
et seulement si pour tout ɛ > 0 il existe une suite x i , 0 ≤ i ≤ n telle que<br />
x 0 = x = x n et telle que pour tout 0 ≤ i ≤ n − 1, on a d(x i+1 , f(x i )) ≤ ɛ.<br />
2.2 Irré<strong>du</strong>ctibilité<br />
2.2.1 Minimalité<br />
Notons F l’ensemble <strong>de</strong>s compacts non-vi<strong>de</strong>s K ⊂ X qui sont f-invariants.<br />
Un compact K est dit minimal s’il est minimal dans F pour l’inclusion (si<br />
L ⊂ K avec L compact et f(L) ⊂ L alors L = K). On dit que X est minimal<br />
s’il ne contient aucun compact non vi<strong>de</strong> invariant autre que lui-même.<br />
L’intérêt <strong>de</strong> cette notion rési<strong>de</strong> dans la proposition suivante :<br />
Proposition 2.2.1 Un compact K ⊂ X est minimal ssi pour tout x ∈ K,<br />
Adh(f n (x)) n∈N = K.<br />
Démonstration.— Supposons que K soit minimal. Alors pour tout x ∈ K<br />
le compact Adh(f n (x)) n∈N = K est f-invariant non vi<strong>de</strong> inclus dans K et<br />
égale donc K. Réciproquement si pour tout x ∈ K on a Adh(f n (x)) n∈N = K,<br />
alors si L ⊂ K est un compact invariant on a pour x ∈ L, et tout n ≥ 0,<br />
f n (x) ∈ L et partant K = Adh(f n (x)) n∈N ⊂ L c’est-à-dire L = K.<br />
Le principal rèsultat est :<br />
Théorème 2.2.1 Si (X, d) est un espace métrique compact et f : X → X<br />
est continue, il existe toujours un compact K ⊂ X minimal.<br />
✷<br />
Démonstration.—<br />
Nous aurons besoin pour la preuve <strong>du</strong> lemme <strong>de</strong> Zorn<br />
Lemme 2.2.1 (Zorn) Si F est un ensemble muni d’une relation d’ordre, il<br />
existe un sous-ensemble totalement ordonné et maximal pour cette propriété.<br />
Ainsi, (F, ⊂) contient un sous-ensemble totalement ordonné maximal G. Le<br />
compact K = ∩ K∈G L est f-invariant et minimal.<br />
✷
2.2. IRRÉDUCTIBILITÉ 11<br />
Définition 2.2.1 On dit que f est minimale sur X ou que X est minimale<br />
pour f si X est f-minimal.<br />
Remarque : Si f est minimale et si X est infini alors f n’admet pas d’orbite<br />
périodique.<br />
Exemples : a) Soit X = R/Z le tore et f(x) = x + α. Montrons que<br />
f est minimale si et seulement si α /∈ Q/Z. Si α = p/q il est clair que<br />
tout point est périodique (f q (x) = x mod 1). Réciproquement supposons α<br />
irrationnel : alors la suite nα est <strong>de</strong>nse sur T. En effet, la suite nα prend une<br />
infinité <strong>de</strong> valeurs sur le compact X et admet donc un point d’accumulation,<br />
disons x 0 , c’est-à-dire qu’il existe une suite n k strictement croissante telle<br />
que n k α converge vers x 0 . Ainsi, pour tout ɛ > 0, il existe N tel que, dès que<br />
n k > n l ≥ N, on a d(n k α, n l α) < ɛ soit : d(mα, 0) < ɛ où m = n k − n l . Il est<br />
facile <strong>de</strong> voir que si z ∈ T vérifie d(z, 0) < ɛ alors pour tout x ∈ T il existe<br />
r ∈ N tel que d(x, rz) < ɛ. Si on pose z = mα, on a ainsi d(x, (rm)α) < ɛ.<br />
Terminons la preuve <strong>de</strong> la minimalité : si x et y sont <strong>de</strong>ux points il existe<br />
r ′ ∈ N tel que d(y − x, r ′ α) < ɛ et donc d(y, x + r ′ α) < ɛ.<br />
b) Sur X = R/Z, f(x) = 2x n’est pas minimale car elle admet <strong>de</strong>s points<br />
périodiques (les k/2 n ).<br />
c) Un homéomorphisme <strong>de</strong> R n’est jamais minimal<br />
d) Un homéomorphisme <strong>de</strong> R 2 n’est jamais minimal (c’est une conséquence<br />
<strong>du</strong> théorème <strong>de</strong> translation <strong>de</strong> Brouwer : si un homéomorphisme <strong>de</strong> R 2 est<br />
sans point fixe alors tout point est errant).<br />
2.2.2 Transitivité<br />
Définition 2.2.2 On dit que f est transitive sur X si et seulement s’il existe<br />
un point x ∈ X tel que l’ensemble <strong>de</strong>s points d’accumulation <strong>de</strong> l’orbite positive<br />
<strong>de</strong> x soit <strong>de</strong>nse dans X. (Si f est inversible il est équivalent <strong>de</strong> dire que<br />
l’orbite <strong>de</strong> x est <strong>de</strong>nse dans X).<br />
Voici une proposition qui justifie la terminologie :<br />
Proposition 2.2.2 f est transitive sur X si et seulement si pour tous ouverts<br />
U et V <strong>de</strong> X il existe n tel que f −n (U) ∩ V ≠ ∅ (c’est-à-dire il existe<br />
un point <strong>de</strong> U qui visite un point <strong>de</strong> V ).<br />
Démonstration.— Supposons donc qu’il existe un point z ∈ X tel que l’ensemble<br />
<strong>de</strong>s points d’accumulation <strong>de</strong> l’orbite positive <strong>de</strong> z soit <strong>de</strong>nse et soient<br />
U, V <strong>de</strong>ux ouverts <strong>de</strong> X. Il existe donc n > m entiers positifs tels f m (z) ∈ U<br />
et f n−m (f m (z)) = f n (z) ∈ V . On a donc f m (z) ∈ U ∩ f −(n−m) (V ).
12 CHAPITRE 2. DYNAMIQUE TOPOLOGIQUE<br />
Réciproquement, supposons que pour tous ouverts U, V <strong>de</strong> X il existe n<br />
tel que U ∩ f −n (V ) ≠ ∅. Remarquons qu’en fait il existe une infinité <strong>de</strong> tels<br />
entiers n (pourquoi ). On en dé<strong>du</strong>it que pour tout N l’ouvert<br />
⋃<br />
n≥N<br />
f −n (B)<br />
est <strong>de</strong>nse. Puisque X est compact, pour tout p ≥ 1 il existe un recouvrement<br />
fini <strong>de</strong> X par <strong>de</strong>s boules ouvertes <strong>de</strong> rayon 1/p. Notons R p cet ensemble fini<br />
<strong>de</strong> boules <strong>de</strong> rayons 1/p. L’ensemble<br />
⋂<br />
⋂<br />
⋂<br />
⋃<br />
p≥1 B∈R p N≥0 n≥N<br />
f −n (B)<br />
est l’ensemble <strong>de</strong>s points dont l’orbite positive a un ensemble <strong>de</strong>nse <strong>de</strong> points<br />
d’accumulation. Mais, c’est une intersection dénombrable d’ouverts <strong>de</strong>nses et<br />
d’après la propriété <strong>de</strong> Baire (X est compact) c’est un ensemble <strong>de</strong>nse, donc<br />
en particulier non vi<strong>de</strong>.<br />
Remarque La preuve <strong>du</strong> théorème précé<strong>de</strong>nt montre que l’ensemble <strong>de</strong>s<br />
points z dont l’orbite est <strong>de</strong>nse est en fait un G δ -<strong>de</strong>nse <strong>de</strong> X.<br />
Exercice : a) Montrer que f est minimale si et seulement si pour tout ouvert<br />
U <strong>de</strong> X il existe N tel que<br />
X =<br />
N⋃<br />
f −i (U).<br />
b) Montrer que f est transitive si et seulement pour tout ouvert U,<br />
est <strong>de</strong>nse dans X.<br />
i=0<br />
∞⋃<br />
f −i (U)<br />
i=0<br />
c) Montrer que si f est transitive alors pour toute fonction continue φ : X →<br />
R φ ◦ f = φ implique que φ est constante. Que dire <strong>de</strong> la réciproque <br />
d) Montrer qu’une action isométrique est transitive si et seulement si elle est<br />
minimale.<br />
✷
2.3. DÉCALAGES (OU SHIFTS) 13<br />
2.2.3 Mélange topologique<br />
Définition 2.2.3 On dit que f est topologiquement mélangeante si pour tous<br />
ouverts U, V <strong>de</strong> X il existe N tel que pour tout n ≥ N f −N (U) ∩ V ≠ ∅.<br />
Remarque : Le mélange topologique, tout comme la minimalité entraîne la<br />
transitivité l’inverse étant faux.<br />
Exemples a) Sur X = R/Z, f(x) = 2x est topologiquement mélangeante<br />
(et donc transitive). En effet, il suffit <strong>de</strong> démontrer que pour tous intervalles<br />
dyadiques I et J, il existe N tel que pour tout n ≥ N f −n (I)∩J est non vi<strong>de</strong>.<br />
Or dès que n ≥ N, f −n (I) a une intersection non vi<strong>de</strong> avec tout intervalle<br />
dyadique <strong>de</strong> longueur 2 −N .<br />
b) Une translation T α sur R/Z n’est jamais faiblement mélangeante : si α est<br />
rationnel c’est clair car T α n’est pas transitive ; si α est irrationnel soient I<br />
et J <strong>de</strong>ux intervalles <strong>de</strong> longueur 1/4 par exemple et notons I 0 un intervalle<br />
<strong>de</strong> longueur 1/4 disjoint <strong>de</strong> J. Comme T α est minimale, on sait que Tα<br />
−n (I)<br />
sera pour une infinité <strong>de</strong> valeurs <strong>de</strong> n proche <strong>de</strong> I 0 et sera donc disjoint <strong>de</strong> J.<br />
c) L’application <strong>du</strong> tore R 2 /Z 2 définie par A(x, y) = (2x + y, x + y) est<br />
topologiquement mélangeante (mais pas minimale : elle admet une infinité<br />
<strong>de</strong> points périodiques).<br />
2.3 Décalages (ou shifts)<br />
2.3.1 Shift <strong>de</strong> Bernoulli<br />
Notons Σ = {0, 1} N , l’ensemble <strong>de</strong>s suites (x i ) i∈N , x i ∈ {0, 1}. On munit<br />
Σ <strong>de</strong> la distance ultra-métrique<br />
d(x, y) = 2 −m(x,y) , m(x, y) = inf{j : x j ≠ y j }.<br />
Les cylindres C(m; a 0 , . . . , a m ) = {(x j ) j∈N : x 0 = a 0 , . . . , x m = a m } est une<br />
base d’ouverts <strong>de</strong> la topologie définie par d. Le théorème <strong>de</strong> Tykhonov (ou<br />
encore un argument diagonal) montre que (Σ, d) est compact. On définit alors<br />
l’application <strong>de</strong> décalage ou shift σ par<br />
(σ(x)) i = x i+1 .<br />
Il est facile <strong>de</strong> voir que σ est continue sur (Σ, d).<br />
Proposition 2.3.1 L’application σ est faiblement mélangeante.
14 CHAPITRE 2. DYNAMIQUE TOPOLOGIQUE<br />
Démonstration.— Il suffit <strong>de</strong> démontrer que pour tous cylindres C =<br />
C(m; a 0 , . . . , a m ), C ′ = C(m ′ ; a ′ 0, . . . , a ′ m ′) il existe N tel que pour tout n ≥ N<br />
σ −n (C) ∩ C ′ ≠ ∅. Mais σ −n (C) est l’ensemble <strong>de</strong>s mots <strong>de</strong> la forme yaz où<br />
a = a 0 . . . a m et y est une suite quelconque <strong>de</strong> longueur n, et z ∈ Σ est<br />
également quelconque. Ainsi, si n ≥ m ′ , tout mot <strong>de</strong> la forme a ′ waz où<br />
a ′ = a ′ 0 . . . a ′ m et w <strong>de</strong> longueur n − ′<br />
m′ et z sont quelconques, appartient à<br />
σ −n (C) ∩ C ′ .<br />
On peut généraliser la construction et la proposition précé<strong>de</strong>nte au cas d’un<br />
shift sur un alphabet à r symboles.<br />
2.3.2 Sous-shifts <strong>de</strong> type fini<br />
Soit A = {1, . . . , r} un alphabet à r symboles et A une matrice r × r à<br />
coefficients dans {0, 1} telle que pour tout 1 ≤ i ≤ r il existe j et j ′ dans<br />
A tels (A) ij = 1 et (A) j ′ i = 1. On associe à A un graphe orienté tel que<br />
pour tous sommets i, j il existe au plus une flèche <strong>de</strong> i vers j et pour tout<br />
sommet i il existe une flèche arrivant en i et une flèche sortant <strong>de</strong> i (cette<br />
association (matrice,graphe) est alors bijective). Nous noterons Γ A le graphe<br />
orienté associé à A et ˜Γ A le graphe non-orienté associé à Γ A . Les hypothèses<br />
que nous avons faites sur A assure que le graphe non orienté ˜Γ A associé à A est<br />
connexe. En revanche, la connexité <strong>du</strong> graphe orienté n’est pas automatique.<br />
Définition 2.3.1 Le graphe orienté Γ A est dit fortement connexe si pour<br />
toute paire i, j dans l’alphabet A il existe un chemin allant <strong>de</strong> i à j (en<br />
suivant le sens <strong>de</strong>s flèches).<br />
Remarque : Le nombre <strong>de</strong> chemins <strong>de</strong> longueur r allant <strong>de</strong> i à j est le<br />
coefficient (A r ) ij . Le graphe Γ A est donc fortement connexe si et seulement<br />
si<br />
∀ i, j ∃r(i, j), (A r ) ij > 0.<br />
Nous noterons Σ A l’ensemble <strong>de</strong>s suites (x i ) i∈N <strong>de</strong> A N qui vérifient la<br />
condition <strong>de</strong> compatibilité suivante : pour tout i ≥ 0, A xi x 1+1<br />
= 1. Il est<br />
clair que Σ A est encore un espace compact quand on le munit <strong>de</strong> la distance<br />
in<strong>du</strong>ite par l’inclusion et que Σ A est un fermé invariant par σ.<br />
Théorème 2.3.1 Le système dynamique (Σ A , σ) est transitif si et seulement<br />
si le graphe Γ A est fortement connexe.<br />
Démonstration.— Remarquons déjà que si i, j ∈ A l’existence d’un chemin<br />
<strong>de</strong> i à j est équivalente au fait qu’il existe un entier n tel que U i ∩σ −n (U j ) ≠ ∅<br />
✷
2.3. DÉCALAGES (OU SHIFTS) 15<br />
où on note U i = {x : x 0 = i} U j = {x : x 0 = j}. On a donc clairement que si<br />
(Σ A , σ) est transitif alors Γ A est fortement connexe.<br />
Réciproquement, supposons le graphe Γ A fortement connexe. Pour démontrer<br />
la transitivité il suffit <strong>de</strong> prouver que pour tous cylindres C =<br />
C(m; a 0 , . . . , a m ) et C ′ = C(m ′ ; a ′ 0, . . . , a ′ m ′) il existe n tel que C ∩ σ−n (C ′ ) ≠<br />
∅. Notons a (resp. a ′ ) le mot a 0 , . . . , a m (resp. a ′ 0, . . . , a ′ m ′). On sait qu’il existe<br />
un chemin allant <strong>de</strong> la fin <strong>du</strong> mot a m <strong>de</strong> a au début <strong>du</strong> mot a ′ 0 <strong>de</strong> a ′ . On peut<br />
donc construire un mot b commençant par a m et terminant par a ′ 0. Alors tout<br />
mot aba ′ x est dans C et est tel que σ l (aba ′ x) ∈ C ′ pour l égal à la somme<br />
<strong>de</strong>s longueurs <strong>de</strong>s mots a et b.<br />
Caractérisons les sous-shifts <strong>de</strong> type fini topologiquement mélangeant :<br />
Théorème 2.3.2 Le système dynamique (Σ A , σ) est topologiquement mélangeant<br />
si et seulement si Γ A vérifie la propiété suivante : il existe un entier<br />
r > 0 tel que pour toute paire (i, j) il existe un chemin <strong>de</strong> longueur r allant<br />
<strong>de</strong> i à j (ce qui est équivalent à (A r ) ij > 0).<br />
Démonstration.— Le début <strong>de</strong> la preuve <strong>du</strong> théorème précé<strong>de</strong>nt montre que<br />
si (Σ A , σ) est topologiquement mélangeant, pour toute paire (i, j) il existe<br />
un entier N i,j tel que pour n ≥ N i,j , U i ∩ σ −n (U j ) ≠ ∅. Par conséquent si on<br />
pose r = max i, jN i,j on a bien l’existence d’un chemin <strong>de</strong> longueur r dans le<br />
graphe Γ A allant <strong>de</strong> i à j.<br />
Réciproquement, supposons que le graphe vérifie la propriété <strong>du</strong> théorème.<br />
Alors, A r a tous ses coefficients positifs strictement. Comme aucune<br />
ligne <strong>de</strong> A n’est nulle (et comme A est à coefficients positifs ou nuls), A r+1<br />
et plus généralement A k , k ≥ r a tous ses coefficients strictement positifs. Il<br />
existe donc <strong>de</strong>s chemins pour tout k ≥ r et toute paire i, j, <strong>de</strong>s chemins <strong>de</strong><br />
longueur k allant <strong>de</strong> i à j. Si on reprend la <strong>de</strong>uxième partie <strong>de</strong> la preuve <strong>du</strong><br />
théorème précé<strong>de</strong>nt, on voit que les mots <strong>de</strong> la forme aba ′ x où b est un mot<br />
<strong>de</strong> longueur k ≥ r sont dans C ∩ σ −k (C ′ ).<br />
Il existe en fait une décomposition <strong>de</strong>s sous-shifts <strong>de</strong> type fini transitifs<br />
en union disjointe <strong>de</strong> fermés ou la restriction d’une puissance <strong>de</strong> σ est topologiquement<br />
mélangeant.<br />
Théorème 2.3.3 Le système (Σ A , σ) est transitif si et seulement si il existe<br />
Σ 1 , . . . , Σ m fermés <strong>de</strong> Σ A disjoints et dont l’union est Σ A tels que<br />
a) pour tout 1 ≤ i < m on a σ(Σ i ) = Σ i+1 et σ(Σ m ) = Σ 1 ;<br />
b) σ m |Σ 1 est topologiquement mélangeant.<br />
✷<br />
✷
16 CHAPITRE 2. DYNAMIQUE TOPOLOGIQUE<br />
Démonstration.— Montrons déjà le sens direct. Notons Λ ij l’ensemble <strong>de</strong>s<br />
longueurs <strong>de</strong> chemins allant <strong>de</strong> i à j ; on a pour i, j, k ∈ A Λ ij + Λ jk ⊂ Λ ik .<br />
En particulier Λ 11 +Λ 11 ⊂ Λ 11 et si on note m le pgcd <strong>de</strong>s éléments <strong>de</strong> Λ 11 on<br />
peut dire que Λ 11 contient tous les multiples <strong>de</strong> m assez grands (Exercice).<br />
Définissons alors les sous-ensembles <strong>de</strong> A, I 1 , . . . , I m <strong>de</strong> la façon suivante :<br />
j appartient à I l si et seulement s’il existe un chemin allant <strong>de</strong> 1 à j <strong>de</strong><br />
longueurs congrue à l − 1 mo<strong>du</strong>lo m. On a alors,<br />
Lemme 2.3.1 Si i ∈ I l et j ∈ I l ′ tous les chemins allant <strong>de</strong> i à j sont <strong>de</strong><br />
longueurs congrues à l ′ − l mo<strong>du</strong>lo m<br />
Démonstration.— a) Démontrons déjà qu’il existe un chemin allant <strong>de</strong> i à<br />
1 <strong>de</strong> longueur congrue à −l mo<strong>du</strong>lo m. On sait qu’il existe un chemin allant<br />
<strong>de</strong> i à 1 dont on note s la longueur ; on peut donc construire un chemin<br />
allant <strong>de</strong> 1 à 1 en concaténant un chemin <strong>de</strong> longueur congrue à l mo<strong>du</strong>lo<br />
m et le chemin <strong>de</strong> longueur s. Comme tous les chemins allant <strong>de</strong> 1 à 1 sont<br />
<strong>de</strong> longueurs divisibles par m (par définition <strong>de</strong> m), s doit être congru à −l<br />
mo<strong>du</strong>lo m.<br />
b) Démontrons que tous les chemins allant <strong>de</strong> 1 à i ont une longueur congrue<br />
à l mo<strong>du</strong>lo m. En effet, étant donné un tel chemin <strong>de</strong> longueur t, puisqu’il en<br />
existe un autre allant <strong>de</strong> i à 1 <strong>de</strong> longueur congrue à −l mo<strong>du</strong>lo m, on peut<br />
en concaténant construire un chemin <strong>de</strong> 1 à 1 <strong>de</strong> longueur congrue à t − l<br />
mo<strong>du</strong>lo m. Mais un tel chemin a une longueur divisble par m si bien que t<br />
est congru à l mo<strong>du</strong>lo m.<br />
c) Comme tout chemin allant <strong>de</strong> i à i concaténé à un chemin allant <strong>de</strong> i à 1<br />
donne un chemin allant <strong>de</strong> i à 1, on dé<strong>du</strong>it <strong>de</strong> b) que tout chemin <strong>de</strong> i à i est<br />
<strong>de</strong> longueur congrue à 0 mo<strong>du</strong>lo m.<br />
d) D’après b), il existe un chemin allant <strong>de</strong> i à j <strong>de</strong> longueur congrue à l ′ − l<br />
mo<strong>du</strong>lo m (en concaténant via 1) et un autre <strong>de</strong> j à i <strong>de</strong> longueur congrue à<br />
l − l ′ mo<strong>du</strong>lo m. Pour tout chemin allant <strong>de</strong> i à j <strong>de</strong> longueur t on peut en<br />
concaténant en j construire un chemin <strong>de</strong> i à i <strong>de</strong> longueur congrue à t+l −l ′<br />
mo<strong>du</strong>lo m et comme cette longueur doit être un multiple <strong>de</strong> m d’après c) on<br />
a bien la conclusion <strong>du</strong> lemme.<br />
Définissons alors Σ l comme étant l’ensemble <strong>de</strong>s suites x = (x i ) i∈N <strong>de</strong> Σ A<br />
telles que x 0 ∈ I l . Automatiquement, x 1 ∈ I l+1 mod m car il existe un chemin<br />
<strong>de</strong> 1 à x 1 <strong>de</strong> longueur 1 + l (l <strong>de</strong> 1 à x 0 et 1 <strong>de</strong> x 0 à x 1 ) et <strong>de</strong> façon plus<br />
générale x k ∈ I l+k mod m . On a donc bien σ(Σ l ) = Σ l+1 mod m . Vérifions que<br />
σ m restreint à Σ 1 est topologiquement mélangeant. Pour cela on reprend la<br />
démonstration <strong>du</strong> théorème précé<strong>de</strong>nt : il suffit <strong>de</strong> démontrer que si a est un<br />
✷
2.4. APPLICATION À LA PREUVE DU THÉORÈME DE VAN DER WAERDEN17<br />
mot <strong>de</strong> longueur p commençant par une lettre <strong>de</strong> I 1 et a ′ un mot <strong>de</strong> longueur<br />
p ′ commençant par une lettre <strong>de</strong> I 1 , on peut construire pour tout entier km<br />
un mot compatible <strong>de</strong> la forme aba ′ x où b est un mot <strong>de</strong> longueur km. Or<br />
ceci est toujours possible dès que k est assez grand puisque Λ 11 contient tous<br />
les multiples <strong>de</strong> m assez grands.<br />
La réciproque est laissée en exercice au lecteur.<br />
✷<br />
2.4 Application à la preuve <strong>du</strong> théorème <strong>de</strong> van<br />
<strong>de</strong>r Waer<strong>de</strong>n<br />
Nous nous proposons <strong>de</strong> démontrer par <strong>de</strong>s métho<strong>de</strong>s <strong>de</strong> dynamique topologique<br />
le théorème suivant dû à van <strong>de</strong>r Waer<strong>de</strong>n :<br />
Théorème 2.4.1 (van <strong>de</strong>r Waer<strong>de</strong>n) Si Z = A 1 ∪ · · · ∪ A p est une partition<br />
<strong>de</strong> Z il existe i ∈ {1, . . . , p} tel que A i contienne <strong>de</strong>s progressions<br />
arithmétiques <strong>de</strong> longueur arbitraire i.e : pour tout r ∈ N il existe a, b ∈ Z<br />
tels que a, a + b, . . . , a + (r − 1)b appartiennent à A i .<br />
La preuve <strong>du</strong> théorème précé<strong>de</strong>nt est basée sur un théorème <strong>de</strong> récurrence<br />
multiple :<br />
Théorème 2.4.2 Si (X, d) est un espace métrique compact et T un homéomorphisme<br />
<strong>de</strong> X il existe x ∈ X tel que pour tout r ≥ 1<br />
inf max d(x, T in x) = 0.<br />
n≥1 1≤i≤r<br />
Démonstration.— La preuve se fait par récurrence sur r ≥ 1.<br />
i) Si r = 1 nous avons vu que le résultat est vrai : si K est un ensemble<br />
minimal <strong>de</strong> X, tout point x <strong>de</strong> K est d’orbite <strong>de</strong>nse dans K et en particulier<br />
r{ecurrent.<br />
ii) Notons K un ensemble minimal fixé et notons pour r ≥ 1, E r l’ensemble<br />
<strong>de</strong>s x ∈ K pour lesquels<br />
inf max d(x, T in x) = 0.<br />
n≥1 i≤r<br />
Lemme 2.4.1 Si E r est un G δ -<strong>de</strong>nse <strong>de</strong> K alors il en est <strong>de</strong> même <strong>de</strong> E r+1 .
18 CHAPITRE 2. DYNAMIQUE TOPOLOGIQUE<br />
Démonstration.— [<strong>du</strong> lemme 2.4.1]<br />
A) Remarquons tout d’abord que l’ensemble Ẽr <strong>de</strong>s x ∈ K pour lesquels<br />
T n x ∈ E r pour tout n ∈ Z, x ∈ E r est encore un G δ -<strong>de</strong>nse (c’est l’ensemble<br />
⋂<br />
n∈Z T −n (E r )). Définissons alors par récurrence les suites ɛ n <strong>de</strong> réels positifs<br />
et x n d’éléments <strong>de</strong> Ẽr <strong>de</strong> la fa¸on suivante : x 1 ∈ Ẽr et ɛ 1 étant choisis, il<br />
existe n 1 tel que<br />
max<br />
1≤i≤r d(x, T −in 1<br />
x 1 ) ≤ (1/2)ɛ 1 .<br />
On pose alors x 2 = T −(r+1)n 1<br />
x 1 et on choisit ɛ 2 suffisamment petit pour que<br />
ɛ 2 ≤ (1/2)ɛ 1 et pour que d(y, x 2 ) ≤ ɛ 2 implique d(T n 1(r+1) y, x 1 ) ≤ ɛ 1 .. Nous<br />
noterons<br />
x 2<br />
n 1<br />
−→ɛ1 x 1<br />
les relations<br />
max d(x 1, T in 1<br />
x 2 ) ≤ ɛ 1 /2.<br />
1≤i≤r+1<br />
Avec le choix que nous avons fait pour ɛ 2 il est clair que pour tout y tel que<br />
d(y, x 2 ) ≤ ɛ 2 on a<br />
y n 1<br />
−→ x 1 .<br />
ɛ1<br />
On sait qu’il existe n 2 tel que<br />
max<br />
1≤i≤r d(x, T −in 2<br />
x 2 ) ≤ (1/2)ɛ 2 ,<br />
et on pose x 3 = T −(r+1)n 2<br />
x 2 . On a bien<br />
n<br />
x<br />
2<br />
3 −→ x 2 ɛ2 /2<br />
et si ɛ 3 ≤ ɛ 2 /2 est choisi suffisamment petit on a<br />
y n 2<br />
−→ x 2 ɛ2<br />
pour tout y tel que d(y, x 3 ) ≤ ɛ 3 . On a donc pour un tel y<br />
y n 2 n<br />
−→ x<br />
1<br />
2 −→ɛ1 x 1 .<br />
ɛ2<br />
Par récurrence on construit <strong>de</strong>s suites infinies ɛ k , x k telles que<br />
· · · x k+1<br />
n k<br />
−→ɛk<br />
n 1<br />
n k−1<br />
x k −→ · · · −→ɛ1 x 1 .<br />
ɛk−1<br />
Comme K est compact, pour tout ɛ > 0 il existe x k , x l ∈ Ẽr avec k > l er<br />
d(x k , x l ) < ɛ tels que<br />
n k,l<br />
x k −→ɛl<br />
où n k,l = n k−1 + · · · + n l . En particulier, comme on peut choisir l tel que<br />
ɛ l < ɛ, on a prouvé le lemme suivant :<br />
x l
2.4. APPLICATION À LA PREUVE DU THÉORÈME DE VAN DER WAERDEN19<br />
Lemme 2.4.2 Pour tout ɛ > 0 il existe x ɛ ∈ Ẽr et n ɛ tels que<br />
x ɛ<br />
n ɛ<br />
−→ɛ x ɛ .<br />
B) Démontrons que l’on peut inverser l’ordre <strong>de</strong>s quantificateurs : Notons<br />
A ɛ l’ensemble <strong>de</strong>s x ∈ Ẽr pour lesquels il existe n ɛ tel que<br />
x −→ nɛ<br />
x.<br />
ɛ<br />
Cet ensemble est un ouvert <strong>de</strong> Ẽr ⊂ K et est donc un G δ <strong>de</strong> K. Démontrons<br />
qu’il est <strong>de</strong>nse dans K. Comme T est minimale sur K, pour tout y ∈ K et<br />
η > 0 il existe un entier N tel que tout point x <strong>de</strong> K se trouve après moins<br />
<strong>de</strong> N itérations dans B(y, η/2) (∃0 ≤ j ≤ N, T j x ∈ B(y, η/2)) et comme les<br />
applications T j , j ≤ N sont uniformément continues sur K on peut affirmer<br />
qu’il existe ɛ 0 tel que toute boule <strong>de</strong> rayon plus petit que ɛ 0 se trouve après<br />
au plus N itérations dans B(y, η). D’autre part, pour tout ɛ > 0 on sait qu’il<br />
existe un point x ɛ et n ɛ tel que<br />
x ɛ<br />
Ainsi, si ɛ ≤ ɛ 0 , il existe j ≤ N tel que,<br />
n ɛ<br />
−→ɛ x ɛ .<br />
T j x ɛ , T j (T nɛ x ɛ ), . . . , T j (T (r+1)nɛ x ɛ ) ∈ B(y, η).<br />
Puisque T j (T inɛ (x ɛ )) = T inɛ (T j (x ɛ )) on a démontré que z = T j x ɛ est dans<br />
B(y, η) ∩ Ẽr+1. Ceci démontre que A ɛ est <strong>de</strong>nse dans K et est donc un G δ -<br />
<strong>de</strong>nse.<br />
C) D’après le théorème <strong>de</strong> Baire<br />
∞⋂<br />
m=1<br />
A 1/m<br />
est donc également un G δ -<strong>de</strong>nse ; mais cet ensemble n’est rien d’autre que<br />
E r+1 . La preuve <strong>du</strong> lemme est terminée.<br />
Terminons la preuve <strong>du</strong> théorème 2.4.2. L’intersection<br />
E = ⋂ r≥1<br />
E r<br />
✷<br />
est un G δ -<strong>de</strong>nse d’après le théorème <strong>de</strong> Baire. Si x est dans E la conclusion<br />
<strong>du</strong> théorème 2.4.2 est vérifiée.<br />
✷
20 CHAPITRE 2. DYNAMIQUE TOPOLOGIQUE<br />
Preuve <strong>du</strong> théorème 2.4.1 Soit ω ∈ {1, . . . , p} Z la suite définie par ω i =<br />
k si i ∈ A k et notons X l’adhérence <strong>de</strong> l’orbite <strong>de</strong> ω sous l’action <strong>du</strong> décalage<br />
σ : {1, . . . , p} Z → {1, . . . , p} Z . L’application σ est un homéomorphisme <strong>de</strong><br />
X. Appliquons le théorème <strong>de</strong> récurrence multiple 2.4.2 à (X, σ) : il existe<br />
x ∈ X tel que pour tout r ≥ 1 et ɛ = 1/4 on peut trouver un entier b pour<br />
lequel<br />
max<br />
1≤i≤r d(x, T ib x) < (1/4).<br />
Notons i = x 0 . On dé<strong>du</strong>it <strong>de</strong> l’inégalité précé<strong>de</strong>nte que i = x 0 = (T b x) 0 =<br />
· · · = (T rb x) 0 . Comme x est dans l’adhérence <strong>de</strong> {σ k ω} k∈Z , il existe a tel que<br />
d(T a ω, x) < (1/4) et également<br />
max d(T a ω, T ib (T a ω)) < (1/4).<br />
1≤i≤r<br />
Ainsi, ω a = x 0 = i et ω a = ω a+b = · · · = ω a+rb . On a donc démontré que a, a+<br />
b, . . . , a + rb appartiennent à A i . Ceci termine la preuve <strong>du</strong> théorème 2.4.1.
Chapitre 3<br />
Mesures Invariantes<br />
Dans ce qui suit X est encore un espace métrique compact, B désigne la<br />
tribu borélienne <strong>de</strong> X (la plus petite tribu engendrée par les ouverts <strong>de</strong> X et<br />
f : X → X est une application continue.<br />
Définition 3.0.1 Une mesure <strong>de</strong> probabilité µ sur (X, B) est dite f-invariante<br />
si f ∗ µ = µ c’est-à-dire si pour tout A ∈ B<br />
µ(f −1 (A)) = µ(A).<br />
Nous noterons M f l’ensemble <strong>de</strong>s mesures <strong>de</strong> probabilité f-invariantes. De<br />
façon équivalente, µ est f-invariante si et seulement si pour toute fonction<br />
continue φ ∈ C(X), µ(φ ◦ f) = µ(φ)<br />
Exemple<br />
La mesure <strong>de</strong> Haar sur le tore R/Z est invariante par toute translation T α :<br />
x ↦→ x + α. Nous verrons plus loin que dans le cas où α est irrationnel, c’est<br />
l’unique mesure invariante par T α . En revanche, si α = p/q, toute orbite<br />
périodique porte une mesure invariante.<br />
La mesure <strong>de</strong> Haar sur le tore R/Z est invariante par l’application S : x ↦→<br />
2x. Il existe une infinité d’autres mesures invariantes, en particulier les mesures<br />
portées par les orbites périodiques. Si x est un point périodique <strong>de</strong><br />
pério<strong>de</strong> p, la mesure (δ x + · · · + δ S p−1 (x))/p est une mesure <strong>de</strong> probabilité<br />
S-invariante qui n’est pas équivalente à la mesure <strong>de</strong> Lebesgue.<br />
Exercice : Construire une dynamique sur [0, 1] (non continue) qui n’admet<br />
pas <strong>de</strong> mesure <strong>de</strong> probabilité invariante.<br />
L’ensemble M f sera muni <strong>de</strong> la topologie faible ∗ : une suite <strong>de</strong> mesures<br />
<strong>de</strong> probabilité µ n converge vers µ si pour toute fonction continue φ ∈ C(X),<br />
∫<br />
φdµn = 〈µ n , φ〉 = µ n (φ) converge vers ∫ φdµ = 〈µ, φ〉 = µ(φ).<br />
21
22 CHAPITRE 3. MESURES INVARIANTES<br />
La proposition qui suit montre que lorsque f est continue il existe toujours<br />
<strong>de</strong>s mesures f-invariantes sur X compact.<br />
Proposition 3.0.1 L’ensemble M f est non vi<strong>de</strong>, convexe et compact pour<br />
la topologie faible ∗ .<br />
Démonstration.— La convexité <strong>de</strong> M f est immédiate. Sa compacité pour<br />
la topologie faible ∗ résulte <strong>du</strong> fait que M f est fermé pour cette topologie<br />
et <strong>du</strong> fait que l’ensemble <strong>de</strong>s mesures <strong>de</strong> probabilités sur X compact est<br />
compact pour cette topologie. Il reste donc à démontrer qu’il existe une<br />
mesure <strong>de</strong> probabilité f-invariante : soit x ∈ X et considérons le barycentre<br />
<strong>de</strong>s mesures <strong>de</strong> Dirac :<br />
µ n = 1 ∑n−1<br />
δ<br />
n f (x). k<br />
On a pour φ ∈ C(X)<br />
k=0<br />
µ n (φ) = 1 ∑n−1<br />
φ(f k (x)).<br />
n<br />
k=0<br />
On peut extraire <strong>de</strong> la suite µ n une sous-suite µ nk qui converge pour la<br />
topologie faible ∗ vers une mesure <strong>de</strong> probabilité µ. Comme,<br />
µ n (φ ◦ f) = φ(f n (x)) − φ(x)<br />
n<br />
+ 1 ∑n−1<br />
φ(f k (x))<br />
n<br />
on a bien la conclusion en prenant n = n k et en faisant k → ∞.<br />
Savoir qu’une mesure est f-invariante donne <strong>de</strong>s renseignements précieux<br />
sur les propriétés <strong>de</strong> récurrence <strong>de</strong> f :<br />
Théorème 3.0.3 ( <strong>de</strong> récurrence <strong>de</strong> Poincaré) Si µ est une mesure f-<br />
invariante et A ∈ B un sous-ensemble <strong>de</strong> X <strong>de</strong> µ-mesure positive µ(A) > 0<br />
alors pour µ-presque tout point x <strong>de</strong> A il existe une suite infinie d’entiers n k<br />
telle que f n k (x) ∈ A.<br />
Démonstration.—<br />
dans A c’est-à-dire<br />
k=0<br />
Notons B l’ensemble <strong>de</strong>s x ∈ A qui ne reviennent jamais<br />
B = A ∩ ⋂ n≥1<br />
f −n (X − A).<br />
Nous allons démontrer que µ(B) = 0. Prouvons pour cela que les ensembles<br />
B, f −1 (B), . . . , f −k (B), . . . dont 2 à 2 disjoints. En effet pour j > i<br />
f −i (B) ∩ f −j (B) = f −i (B ∩ f −(j−i) (B));<br />
✷
or si un point x appartient à B ∩ f −(j−i) (B), son itéré f j−i (x) appartient à<br />
B donc à A ce qui contredit la définition <strong>de</strong> B puisque x est dans A et qu’un<br />
<strong>de</strong> ses itérés est dans A.<br />
Puisque les f −n (B), n ≥ 0 sont disjoints <strong>de</strong>ux à <strong>de</strong>ux on a<br />
∑<br />
n≥0<br />
µ(f −n (B)) = µ( ⋃ n≥0<br />
f −n (B));<br />
L’inégalité µ(B) > 0 est impossible puisque d’après l’invariance <strong>de</strong> µ par f<br />
le membre <strong>de</strong> gauche est infini, tandis que le membre <strong>de</strong> droite est inférieur<br />
ou égal à 1 (µ est une mesure <strong>de</strong> probabilité). Nous avons démontré que<br />
µ(B) = 0. D’après l’invariance <strong>de</strong> µ par f nous avons aussi µ(f −k (B)) = 0 et<br />
donc µ( ⋃ k≥0 f −k (B)) = 0. Mais cet ensemble contient les x ∈ A pour lesquels<br />
il existe k 0 tel que f k (x) /∈ A pour k ≥ k 0 . Le théorème est démontré.<br />
Corollaire 3.0.1 Si (X, d) est métrique compact, l’ensemble <strong>de</strong>s x ∈ X qui<br />
sont f-récurrents est <strong>de</strong> µ-mesure totale.<br />
Démonstration.— Notons U n , n ≥ 1 une base dénombrable <strong>de</strong> voisinage<br />
<strong>de</strong> X. Notons C n l’ensemble <strong>de</strong>s x ∈ U n qui ne sont pas récurrents dans U n .<br />
L’enemble <strong>de</strong>s points non récurrents <strong>de</strong> X est la réunion <strong>de</strong>s C n et comme<br />
d’après le théorème précé<strong>de</strong>nt chaque C n est <strong>de</strong> mesure nulle, le corollaire est<br />
démontré.<br />
23<br />
✷<br />
✷<br />
Exemples Translations sur les tores : Si T n = R n /Z n est le tore <strong>de</strong> dimension<br />
n, la mesure <strong>de</strong> Haar µ = dx 1 ∧ · · · ∧ dx n (on i<strong>de</strong>ntifie la forme<br />
volume avec une mesure) est l’unique mesure invariante par les translations<br />
T α , T α (x) = x + α, α ∈ T n .<br />
T : x ↦→ 2x sur [0, 1] : La mesure <strong>de</strong> Lebesgue λ est invariante par T puisque<br />
pour tout intervalle dyadique I = ([k/2 p , (k + 1)/2 p [, T −1 ([k/2 p , (k + 1)/2 p [)<br />
est l’union disjointe <strong>de</strong> [k/2 p+1 , (k + 1)/2 p+1 [ et <strong>de</strong> (1/2) + [k/2 p+1 , (k +<br />
1)/2 p+1 [. On a donc bien λ(T −1 (I) = λ(I) et comme les intervalles dyadiques<br />
engendrent la tribu borélienne, la propriété d’invariance s’etend à tous les<br />
boréliens.<br />
Décalage et sous-décalage <strong>de</strong> type fini : Si p ∈ [0, 1] on peut définir la mesure µ<br />
sur {0, 1} Z (muni <strong>de</strong> la tribu engendrée par les cylindres) <strong>de</strong> la façon suivante :<br />
pour tout cylindre C = C(ɛ 0 , . . . , ɛ n−1 ) on pose µ(C) = p r (1 − p) n−r où r est<br />
le nombre <strong>de</strong> ɛ i égaux à 1. Le théorème <strong>de</strong> Carathéodory (ou Kolmogorov)
24 CHAPITRE 3. MESURES INVARIANTES<br />
permet d’étendre cette mesure à la tribu borélienne toute entière. La mesure<br />
obtenue est clairement invariante par le shift σ (c’est clair sur les cylindres<br />
et on utilise la partie unicité <strong>du</strong> théorème <strong>de</strong> Carathéodory). Ceci fournit<br />
une famille entière <strong>de</strong> mesures invariantes par le décalage, les mesures <strong>de</strong><br />
Bernoulli. Ce ne sont pas les seules : chaque orbite périodique <strong>de</strong> σ définit<br />
naturellement une mesure σ-invariante : la moyenne <strong>de</strong>s mesures <strong>de</strong> Dirac<br />
portées par l’orbite périodique.<br />
Pour les sous-shifts <strong>de</strong> type fini sur un alphabet à r symboles et <strong>de</strong> matrice<br />
<strong>de</strong> transition A, la construction <strong>de</strong> mesures naturelles invariantes par σ se fait<br />
<strong>de</strong> la manière suivante : soit P ij (1 ≤ i, j ≤ r) les coefficients d’une matrice<br />
stochastique P :<br />
a) P ij ≥ 0<br />
b) ∑ r<br />
j=1 P ij = 1<br />
et faisons l’hypothèse que P est compatible avec A c’est-à-dire que A ij = 0<br />
si et seulement si P ij = 0 et supposons que A soit irré<strong>du</strong>ctible c’est-à-dire<br />
que (Σ A , σ) soit transitif.<br />
La condition b montre que le vecteur dont toutes les composantes valent<br />
1 est vecteur propre <strong>de</strong> P associé à la valeur propre 1. Par conséquent 1 est<br />
valeur propre <strong>de</strong> t P et il est possible <strong>de</strong> démontrer que l’espace propre correspondant<br />
est engendré par un vecteur dont tous les coefficeients p 1 , . . . , p r<br />
sont positifs ou nuls. On peut supposer que la somme p 1 + · · · + p r = 1. On<br />
a donc pour tout 1 ≤ j ≤ r<br />
r∑<br />
p i P ij = p j . (3.1)<br />
Pour tout cylindre C = C(ɛ 0 , . . . , ɛ n ) <strong>de</strong> Σ A définissons<br />
i=1<br />
µ(C) = p ɛ0 P ɛ0 ɛ 1<br />
· · · P ɛn−1 ɛ n<br />
.<br />
La condition b) garantit la cohérence au sens <strong>du</strong> théorème <strong>de</strong> Kolmogorov :<br />
µ(C(ɛ 0 , . . . , ɛ n−1 )) =<br />
r∑<br />
µ(C(ɛ 0 , . . . , ɛ n−1 , l)).<br />
l=1<br />
Par conséquent, on peut étendre µ en une mesure (<strong>de</strong> probabilité) à la tribu<br />
entière. L’invariance <strong>de</strong> µ par σ se fait sur les cylindres en utilisant (3.1) et<br />
µ(σ −1 (C(ɛ 0 , . . . , ɛ n ) =<br />
r∑<br />
µ(C(l, ɛ 0 , . . . , ɛ n )).<br />
l=1
3.1. ERGODICITÉ 25<br />
Automorphismes <strong>de</strong>s tores Si A ∈ SL(n, Z), l’application Ā <strong>de</strong> Rn /Z n dans<br />
lui même définie par Ā(x + Zn ) = Ax + Z n est inversible et s’appelle un<br />
automorphisme <strong>du</strong> tore T n . Puisque <strong>de</strong>t(A) = 1 on voit que la mesure <strong>de</strong><br />
Haar est invariante par Ā. Bien évi<strong>de</strong>mment ce n’est pas la seule puisque A<br />
admet une infinité <strong>de</strong> points périodiques.<br />
3.1 Ergodicité<br />
Définition 3.1.1 Un système dynamique (X, B, µ, T ) est dit ergodique ssi<br />
tout ensemble A ∈ B tel que µ(A∆T −1 (A)) = 0 est <strong>de</strong> µ mesure 0 ou 1.<br />
En d’autres termes, d’un point <strong>de</strong> vue mesurable, les seuls ensembles invariants<br />
sont ∅ ou X. On peut reformuler la définition précé<strong>de</strong>nte :<br />
Proposition 3.1.1 Le système dynamique (X, B, µ, T ) est ergodique si et<br />
seulement si les seules fonctions φ ∈ L ∞ (X, µ) vérifiant φ ◦ T = φ sont les<br />
fonctions constantes<br />
Démonstration.— Prouvons que si T est ergodique les seules fonctions<br />
invariantes par T sont les constantes : intro<strong>du</strong>isons E λ = {x ∈ X : φ(x) ≤ λ}.<br />
Comme φ ◦ T = φ on a φ 1 (E λ ) = E λ (µ p.p) et d’après l’ergodicité F φ (λ) :=<br />
µ(φ ≤ λ) ∈ {0, 1}. Comme la fonction <strong>de</strong> répartition F φ est croissante et<br />
continue à droite il existe λ 0 tel que pour tout λ ≥ λ 0 , µ(φ ≤ λ) = µ(φ =<br />
λ 0 ) = 1. Ainsi, φ est µ-p.p constante (égale à λ 0 ).<br />
La réciproque est claire (observer que φ = 1 A est T -invariante ssi A est<br />
un ensemble T -invariant).<br />
3.1.1 Premiers exemples<br />
Translation sur <strong>de</strong>s tores<br />
Si X = T et µ est la mesure <strong>de</strong> Haar, la transformation T : x ↦→ x + α<br />
est µ-ergodique si et seulement si α est irrationnel. En effet, soit φ est une<br />
fonction L ∞ telle que φ ◦ T = φ. Puisque φ est L 2 , on a l’i<strong>de</strong>ntité dans L 2<br />
✷<br />
φ(x) = ∑ k∈Z<br />
ˆφ(k)e 2πikx<br />
où les ˆφ(k) sont les coefficients <strong>de</strong> Fourier <strong>de</strong> φ. De l’unicité <strong>de</strong> la décomposition<br />
<strong>de</strong> Fourier et <strong>de</strong> l’i<strong>de</strong>ntité dans L 2 , φ ◦ T = φ on tire<br />
ˆφ(k)e 2πikα = ˆφ(k).
26 CHAPITRE 3. MESURES INVARIANTES<br />
Si α est irrationnel on a alors pour tout k ≠ 0 ˆφ(k) = 0 et par conséquent,<br />
φ est constante. Si α = p/q il existe clairement <strong>de</strong>s fonctions φ qui sont<br />
T -invariantes et qui ne sont pas constantes, par exemple φ(x) = e 2πiqx .<br />
On peut donner une <strong>de</strong>uxième preuve <strong>de</strong> ce résultat qui est plus géométrique<br />
et ne fait pas appel à la décomposition en série <strong>de</strong> Fourier. Si α = p/q<br />
(p ∧ q = 1) est rationnel, l’orbite <strong>de</strong> 0 est un ensemble discret. Il est clair<br />
qu’il existe un petit intervalle ouvert I contenant 0 et dont tous les itérés (qui<br />
sont au nombre <strong>de</strong> q) sont disjoints <strong>de</strong>ux à <strong>de</strong>ux. L’union <strong>de</strong> ces intervalles<br />
est un borélien <strong>de</strong> mesure <strong>de</strong> Haar différente <strong>de</strong> 0 et <strong>de</strong> 1 et invariant par T<br />
ce qui prouve que T n’est pas ergodique pour la mesure <strong>de</strong> Haar. Supposons<br />
à présent α irrationnel et faisons l’hypothèse qu’il existe un ensemble borélien<br />
A T -invariant, <strong>de</strong> mesure <strong>de</strong> Lebesgue comprise entre 0 et 1 strictement.<br />
D’après le théorème <strong>de</strong> <strong>de</strong>nsité <strong>de</strong> Lebesgue, presque tout point <strong>de</strong> A est un<br />
point <strong>de</strong> <strong>de</strong>nsité <strong>de</strong> A, ce qui signifie que pour Lebesgue presque tout x ∈ A<br />
on a<br />
Leb(]x − ɛ, x + ɛ[∩A)<br />
lim<br />
= 1.<br />
ɛ→0 2ɛ<br />
Soit x un point <strong>de</strong> <strong>de</strong>nsité et I =]x − ɛ, x + ɛ[ tel que Leb(]x−ɛ,x+ɛ[∩A) ≥ 1 − δ.<br />
2ɛ<br />
Comme T est une isométrie minimale, il est clair que l’on peut trouver une<br />
suite d’entiers n k , 0 ≤ k ≤ r telle que les T n k , 1 ≤ k ≤ r soient disjoints<br />
<strong>de</strong>ux à <strong>de</strong>ux et couvrent un ensemble <strong>de</strong> mesure plus gran<strong>de</strong> que 1 − δ. Dans<br />
chaque T n k I la proportion <strong>de</strong> points <strong>de</strong> A est supérieure à 1−δ puisque A est<br />
T -invariant , si bien que A ∩ ∪ 0≤k≤r T n k I a une mesure supérieure ou égale à<br />
(1 − δ) 2 . Par conséquent la mesure <strong>de</strong> A est supérieure ou égale à (1 − δ) 2 .<br />
Comme ceci vaut pour tout δ, on en dé<strong>du</strong>it que la mesure <strong>de</strong> A égale 1, ce<br />
qui est une contradiction.<br />
Exercice Montrer qu’une translation T α sur le tore <strong>de</strong> dimension n est ergodique<br />
pour la mesure <strong>de</strong> Haar, si et seulement si 〈k, α〉 ∈ Z, k ∈ Z entraîne<br />
k = 0.<br />
Ergodicité <strong>de</strong> x ↦→ 2x<br />
Démontrons que T : x ↦→ 2x est ergodique pour la mesure <strong>de</strong> Haar sur<br />
T. Soit φ une fonction T -invariante. Les coefficients <strong>de</strong> Fourier <strong>de</strong> φ vérifient<br />
ˆφ(2k) = ˆφ(k) si bien que ˆφ(2 p k) = ˆφ(k) pour tous entiers k, p. Si k ≠ 0<br />
lim p→∞ ˆφ(2 p k) = 0 car les coefficients <strong>de</strong> Fourier d’une fonction L 2 sont dans<br />
l 2 (Z) et donc ten<strong>de</strong>nt vers 0 à l’infini. Ainsi, φ est constante, ce qui prouve<br />
l’ergodicité.<br />
Exercice Démontrer que si X = T 2 , l’automorphisme <strong>du</strong> tore T (x, y) =<br />
(2x+y, x+y) préserve la mesure <strong>de</strong> Haar et est ergodique pour cette mesure.
3.2. LES THÉORÈMES ERGODIQUES 27<br />
Exercice Démontrer que le décalage est ergodique pour les mesures <strong>de</strong> Bernoulli.<br />
3.2 Les Théorèmes ergodiques<br />
3.2.1 Le point <strong>de</strong> vue spectral et le théorème <strong>de</strong> Von<br />
Neumann<br />
Considérons un système dynamique mesurable (X, B, T, µ). L’espace L 2 (X, B, µ)<br />
muni <strong>du</strong> pro<strong>du</strong>it scalaire<br />
∫<br />
〈φ, ψ〉 = φ ¯ψdµ, φ, ψ ∈ L 2 (X, B, µ)<br />
X<br />
est un espace <strong>de</strong> Hilbert. Le point <strong>de</strong> vue spectral consiste à étudier l’opérateur<br />
linéaire U T (que nous noterons souvent T ) agissant sur L 2 (X, B, µ) :<br />
Notons U ∗ l’adjoint <strong>de</strong> U défini par<br />
U T : L 2 (X, B, µ) → L 2 (X, B, µ)<br />
φ ↦→ φ ◦ T<br />
〈U ∗ φ, ψ〉 = 〈φ, Uψ〉;<br />
puisque T préserve µ il est facile <strong>de</strong> voir que U T est une isométrie c’est-à-dire<br />
préserve la norme (ou le pro<strong>du</strong>it scalaire) ‖U T φ‖ = ‖φ‖ et par conséquent<br />
U ∗ U = Id.<br />
Si en outre T est inversible T est unitaire c’est-à-dire que U ∗ = U −1 puisque,<br />
T préservant µ<br />
∫<br />
〈φ ◦ T, ψ〉 = (φ · ¯ψ ◦ T −1 ) ◦ T dµ = 〈φ, ψ ◦ T −1 〉.<br />
X<br />
Essayons <strong>de</strong> comprendre la situation quand T n’est pas inversible. La sigma<br />
algèbre T −1 B est incluse dans B et il est possible <strong>de</strong> définir l’espace L 2 (X, T −1 B, µ)<br />
<strong>de</strong>s fonctions T −1 B-mesurables qui sont L 2 pour la (restriction à T −1 B <strong>de</strong> la)<br />
mesure µ. C’est un sous-espace fermé <strong>de</strong> L 2 (X, B, µ) et on peut intro<strong>du</strong>ire la<br />
projection orthogonale P : L 2 (X, B, µ) → L 2 (X, T −1 B, µ) (rappelons qu’une<br />
projection orthogonale est caractérisée par P ∗ = P et P 2 = P ). Cette projection<br />
s’appelle l’espérance conditionnelle par rapport à la tribu T −1 B. On<br />
a le lemme facile suivant :
28 CHAPITRE 3. MESURES INVARIANTES<br />
Lemme 3.2.1 L’espace L 2 (X, T −1 B, µ) est l’ensemble <strong>de</strong>s fonctions φ ∈<br />
L 2 (X, B, µ) qui s’écrivent sous la forme φ = ψ ◦ T où ψ ∈ L 2 (X, B, µ).<br />
Démonstration.— Il est clair qu’une fonction <strong>de</strong> la forme φ = ψ ◦ T où ψ ∈<br />
L 2 (X, B, µ) est mesurable par rapport à la tribu T −1 B et appartient donc à<br />
L 2 (X, T −1 B, µ). Réciproquement, si une fonction φ est dans L 2 (X, T −1 B, µ),<br />
il est possible <strong>de</strong> trouver une suite <strong>de</strong> fonctions étagées φ n = ∑ i λ i,n1 Bi,n<br />
avec B i,n ∈ T −1 B convergeant µ-pp et L 2 vers φ. Les B i,n sont par définition<br />
<strong>de</strong> la forme T −1 A i,n et 1 T −1 A i,n<br />
= 1 1i,n ◦ T . Remarquons que<br />
‖ ∑ i<br />
λ i 1 T −1 C i<br />
‖ 2 = ∑ i<br />
|λ i | 2 µ(T −1 C i ) = ∑ i<br />
|λ i | 2 µ(T −1 C i ) = ‖ ∑ i<br />
λ i 1 Ci ‖ 2 .<br />
Ainsi, la suite φ n = ∑ i λ i,n1 Bi,n converge dans L 2 si et seulement si la suite<br />
ψ n = ∑ i λ i,n1 Ai,n converge dans L 2 . Notons ψ sa limite. Puisque φ n = ψ n ◦<br />
T = U T ψ n et que U T est continue dans L 2 on a φ = ψ ◦ T .<br />
Le lemme précé<strong>de</strong>nt montre que ImP = ImU. Comme P est un projecteur<br />
ker P = (ImP ) ⊥ et comme <strong>de</strong> façon générale (ImU) ⊥ = ker U ∗ on a<br />
ker P = ker U ∗ . L’opérateur UU ∗ est symétrique borné et vérifie (UU ∗ ) 2 =<br />
UU ∗ UU ∗ = UU ∗ (car U est une isométrie) si bien que UU ∗ est une projection<br />
orthogonale ; son noyau ker UU ∗ est ker U ∗ (exercice) i.e ker P . Cela suffit<br />
pour affirmer que UU ∗ = P . Nous avons donc démontré<br />
Lemme 3.2.2 On a U ∗ T U T = Id et U T U ∗ T = E(·|T −1 B).<br />
La tribu <strong>de</strong>s invariants Notons I la tribu constituée <strong>de</strong>s A ∈ B tels que<br />
T −1 A = A mod 0. L’espace L 2 (X, I, µ) est l’ensemble <strong>de</strong>s φ ∈ L 2 telles que<br />
φ ◦ T = φ (exercice). On définit comme précé<strong>de</strong>mment E(·|I) la projection<br />
orthogonale sur L 2 (X, I, µ). On peut énoncer le théorème <strong>de</strong> Von Neumann<br />
Théorème 3.2.1 Si (X, B, µ, T ) est un système dynamique, alors pour toute<br />
fonction φ ∈ L 2 (X, B, µ) la suite<br />
1<br />
n S nφ = 1 )<br />
(φ + φ ◦ T + · · · + φ ◦ T n−1<br />
n<br />
converge dans L 2 (X, B, µ) vers E(φ|I).<br />
Démonstration.— Nous allons démontrer que pour toute fonction φ ∈<br />
L 2 (X, B, µ) et tout ɛ > 0 il existe ψ ∈ L 2 (X, B, µ) et η ɛ ∈ L 2 (X, B, µ) tels<br />
que‖η ɛ ‖ < ɛ/2 et<br />
φ = ψ ɛ ◦ T − ψ ɛ + E(φ|I) + η ɛ .<br />
✷
3.2. LES THÉORÈMES ERGODIQUES 29<br />
Il suffit pour cela <strong>de</strong> démontrer que φ − E(φ|I) est dans l’adhérence L 2 <strong>de</strong><br />
U − I. Un calcul simple montre Im(I − U) ⊥ = ker(I − U ∗ ). Or, si U ∗ φ = φ<br />
on a P φ = UU ∗ φ = Uφ. Mais, ‖Uφ‖ = ‖φ‖ i.e ‖P φ‖ = ‖φ‖. Ceci n’est<br />
possible que si φ ∈ ImP c’est-à-dire si P φ = φ d’où l’on dé<strong>du</strong>it Uφ = φ.<br />
Réciproquement, si Uφ = φ on a φ = U ∗ Uφ = U ∗ φ. On a donc prouvé<br />
On a donc,<br />
Im(U − I) ⊥ = ker(U ∗ − I) = ker(U − I) = L 2 (X, I, µ).<br />
Im(U − I) = L 2 (X, I, µ) ⊥<br />
Mais par définition pour tout φ ∈ L 2 (X, B, µ), φ − E(φ|I) ∈ L 2 (X, I, µ) ⊥<br />
Concluons la preuve <strong>du</strong> théorème :<br />
mais ‖ 1 n S nη ɛ ‖ ≤ ɛ/2 si bien que<br />
1<br />
n S nφ = 1 n (φ ◦ T n − φ) + E(φ|I) + 1 n S nη ɛ ;<br />
‖ 1 n S nφ − E(φ|I)‖ ≤ 2‖ψ ɛ‖<br />
+ ‖η ɛ ‖<br />
n<br />
≤ ɛ<br />
si n est assez grand.<br />
✷<br />
3.2.2 Convergence presque sûre<br />
Théorème 3.2.2 a) Si (X, B, µ, T ) est un système dynamique, alors pour<br />
toute fonction φ ∈ L 1 (X, B, µ) la suite<br />
converge vers E(φ|I)<br />
i) µ-presque sûrement<br />
ii) dans L 1 (X, B, µ).<br />
1<br />
n S nφ = 1 )<br />
(φ + φ ◦ T + · · · + φ ◦ T n−1<br />
n<br />
b) Si T est inversible on a la même conclusion pour n → −∞.<br />
Démonstration.—<br />
Un ingrédient crucial <strong>de</strong> la preuve <strong>de</strong> ce théorème est le lemme suivant
30 CHAPITRE 3. MESURES INVARIANTES<br />
Lemme 3.2.3 (ergodique maximal <strong>de</strong> Hopf) Si φ est mesurable, notons<br />
Snφ(x) ∗ = max 1≤k≤n (S k φ(x)), E n = {x ∈ X : Snφ(x) ∗ ≥ 0} et E = ∪E n .<br />
Alors, ∫ φdµ ≥ 0.<br />
E<br />
Démonstration.—<br />
si bien que<br />
et<br />
On observe que<br />
−φ(x) + S ∗ n+1φ(x) = max(S ∗ nφ(T x), 0)<br />
φ(x) = S ∗ n+1φ(x) − (S ∗ nφ) + ◦ T (x)<br />
∫<br />
∫<br />
∫<br />
φdµ = (Sn+1φ)dµ ∗ − ((Snφ) ∗ ◦ T ) + dµ<br />
Sn+1 ∗ φ≥0 Sn+1 ∗ φ≥0 Sn+1 ∫<br />
∫<br />
∗ φ≥0<br />
≥ (Sn+1φ) ∗ + dµ − (Snφ) ∗ + ◦ T dµ<br />
∫X<br />
∫X<br />
≥ (Sn+1φ) ∗ + dµ − (Snφ) ∗ + dµ<br />
≥ 0<br />
X<br />
la <strong>de</strong>rnière inégalité provenant <strong>du</strong> fait que max(0, φ(x), . . . , S n−1 φ(x), S n φ(x)) ≥<br />
max(0, φ(x), . . . , S n−1 φ(x)). On a donc ∫ E n+1<br />
φdµ ≥ 0 pour tout n et on<br />
conclut par convergence dominée.<br />
Un corollaire <strong>du</strong> lemme précé<strong>de</strong>nt est le suivant : Si A ∈ B vérifie T −1 A =<br />
A alors ∫ φdµ ≥ 0. Démontrons à présent le théorème <strong>de</strong> Birkhoff : soit<br />
E∩A<br />
A α,β l’ensemble <strong>de</strong>s x ∈ X tels que<br />
lim inf<br />
n→∞<br />
1<br />
n S 1<br />
nφ(x) ≤ α < β ≤ lim sup<br />
n→∞ n S nφ(x)<br />
L’ensemble A α,β est T invariant. Le lemme <strong>de</strong> Hopf appliqué à α − φ et φ − β<br />
montre que (pourquoi )<br />
∫<br />
∫<br />
φ ≤ αµ(A α,β ), φ ≥ βµ(A α,β )<br />
A α,β A α,β<br />
ce qui n’est possible que si µ(A α,β ) = 0. Par conséquent, pour µ-presque<br />
1<br />
tout x ∈ X lim inf n→∞ S 1<br />
n nφ(x) = lim sup S n→∞ n nφ(x) et donc 1 S n nφ(x)<br />
converge.<br />
Nous avons donc montré l’existence d’une fonction ˜φ telle que pour µ-pp<br />
X<br />
lim<br />
n→∞<br />
1<br />
n S nφ(x) = ˜φ(x).<br />
✷
3.3. LIENS AVEC LA DYNAMIQUE TOPOLOGIQUE 31<br />
On a nécessairement ˜φ ◦ T = ˜φ et pour toute fonction ψ ∈ L ∞ (I) (i.e<br />
ψ ◦ T = ψ) on a ∫ ψ ˜φdµ = ∫ ψφdµ, c’est-à-dire que E(φ|I) = ˜φ.<br />
X X<br />
Prouvons à présent ii) : d’après le théorème <strong>de</strong> convergence dominée c’est<br />
évi<strong>de</strong>nt si φ est dans L ∞ (X, µ). Sinon, pour tout ɛ > 0 il existe φ ɛ ∈ L ∞ qui<br />
est ɛ-L 1 -proche <strong>de</strong> φ. Comme ‖E(φ − φ ɛ |I)‖ L 1 ≤ ɛ et que l’on a convergence<br />
L 1 <strong>de</strong> n −1 S n φ ɛ vers E(φ ɛ |I) on conclut aisément.<br />
✷<br />
Exercice Démontrer le point b) <strong>du</strong> théorème. (On pourra utiliser la convergence<br />
L 1 donnée par le théorème <strong>de</strong> Birkhoff.)<br />
3.3 Liens avec la dynamique topologique<br />
Dans cette section on suppose que (X, d) est un espace métrique compact.<br />
La tribu avec laquelle on travaille est la tribu borélienne.<br />
3.3.1 Existence <strong>de</strong> mesures ergodiques<br />
Définition 3.3.1 Si K est un ensemble convexe, on dit qu’un point x ∈ X<br />
est extrémal si x = tx 1 + (1 − t)x 2 , 0 < t < 1, x 1 ∈ K, x 2 ∈ K implique<br />
x = x 1 = x 2 .<br />
Notons M l’ensemble <strong>de</strong>s mesures invariantes T -invariantes. C’est un ensemble<br />
convexe non vi<strong>de</strong> et compact pour la topologie faible*. Le théorème<br />
suivant permet <strong>de</strong> caractériser les mesures T -invariantes ergodiques<br />
Théorème 3.3.1 Si (X, d) est un espace métrique compact et si T : X →<br />
X est continue, une mesure <strong>de</strong> probabilité T -invariante est ergodique si et<br />
seulement si elle est extrémale.<br />
Démonstration.— Supposons que µ est T -ergodique et qu’il existe une<br />
décomposition µ = tµ 1 + (1 − t)µ 2 , 0 < t < 1, µ 1 , µ 2 étant T -invariantes. La<br />
mesure µ 1 est absolument continue par rapport à la mesure µ et d’après le<br />
théorème <strong>de</strong> Radon-Nikodym, il existe une fonction f ∈ L 1 (µ), f ≥ 0 telle<br />
que dµ 1 = fdµ. Montrons que f est T -invariante. Observons que comme µ 1<br />
est T -invariante on a pour toute fonction φ ∈ L ∞<br />
∫<br />
∫<br />
φdµ 1 = φ ◦ T dµ 1
32 CHAPITRE 3. MESURES INVARIANTES<br />
c’est-à-dire<br />
∫<br />
∫<br />
φfdµ =<br />
φ ◦ T · fdµ<br />
et comme µ est T -invariante<br />
∫<br />
∫<br />
φ ◦ T · f ◦ T dµ =<br />
φ ◦ T · fdµ.<br />
Posons à présent φ = 1 f>λ . On a<br />
∫<br />
∫<br />
f ◦ T dµ =<br />
f◦T >λ<br />
et puisque µ est T -invariante<br />
∫<br />
∫<br />
(f − λ) + dµ =<br />
X<br />
On a donc pour tout λ<br />
f◦T >λ<br />
f◦T >λ<br />
fdµ<br />
∫<br />
(f ◦ T − λ) + dµ =<br />
{f > λ} = {f ◦ T > λ},<br />
f◦T >λ<br />
(f − λ)dµ.<br />
mo<strong>du</strong>lo un ensemble <strong>de</strong> µ-mesure nulle. Par conséquent, f = f ◦ T , µ-pp.<br />
La réciproque est plus facile à démontrer. Supposons que µ ne soit pas<br />
T -ergodique. Il existe donc un ensemble A dans la tribu, T -invariant et tel<br />
que 0 < µ(A) < 1. Si on pose µ 1 = µ(· ∩ A)/µ(A) et µ 2 = µ(· ∩ A c )/µ(A c ),<br />
on a µ = tµ 1 + (1 − t)µ 2 avec t = µ(A), ce qui contredit le fait que µ est un<br />
point extrémal.<br />
Un corollaire <strong>du</strong> théorème précé<strong>de</strong>nt est l’existence <strong>de</strong> mesure ergodique<br />
pour toute transformation continue sur un espace compact.<br />
Corollaire 3.3.1 Si (X, d) est un espace métrique compact et T : X → X<br />
une application continue, il existe une mesure qui est T -ergodique.<br />
Démonstration.— Ceci résulte <strong>du</strong> théorème <strong>de</strong> Krein-Milman qui affirme<br />
que tout compact, convexe d’un espace vectoriel topologique admet <strong>de</strong>s points<br />
extrémaux 1 . Dans le cas qui nous intéresse, on peut le démontrer directement.<br />
Choisissons (φ n ) n une suite <strong>de</strong> fonctions continues <strong>de</strong>nse dans C 0 (X).<br />
L’ensemble M 0 <strong>de</strong>s mesures <strong>de</strong> probabilités µ sur X telles que 〈µ, φ 0 〉 =<br />
sup ν∈M 〈ν, φ 0 〉 est non vi<strong>de</strong> puisque M est compact pour la topologie faible*<br />
1 et qu’il est l’enveloppe convexe <strong>de</strong> ses points extrémaux<br />
✷
3.3. LIENS AVEC LA DYNAMIQUE TOPOLOGIQUE 33<br />
et est un espace convexe compact pour la topologie faible*. Par récurrence on<br />
construit M p qui est l’ensemble non vi<strong>de</strong> convexe compact pour la topologie<br />
faible* constitué <strong>de</strong>s mesures ν ∈ M p−1 telles que 〈µ, φ p 〉 = sup ν∈Mp−1<br />
〈ν, φ p 〉.<br />
Notons M ∞ l’intersection <strong>de</strong>s M p , p ≥ 0. C’est toujours un ensemble non<br />
vi<strong>de</strong> convexe compact pour la topologie faible*. Démontrons qu’il est constitué<br />
<strong>de</strong> points extrémaux. Supposons par l’absur<strong>de</strong> que ce ne soit pas le cas<br />
et que l’on ait une écriture µ = tµ 1 + (1 − t)µ 2 avec 0 < t < 1. Il est facile<br />
<strong>de</strong> voir que pour tout p, 〈µ, φ p 〉 = 〈µ 1 , φ p 〉 = 〈µ 2 , φ p 〉 (utiliser la définition <strong>de</strong><br />
M p ) et comme la suite φ p est <strong>de</strong>nse dans C 0 (X) on a µ = µ 1 = µ 2 .<br />
✷<br />
3.3.2 Points génériques<br />
Supposons que (X, d) soit un espace métrique compact, et soient T une<br />
transformation mesurable sur X, µ une mesure T -invariante ergodique et<br />
(φ k ) k≥0 une suite <strong>de</strong> fonctions continues sur X <strong>de</strong>nse dans C 0 (X). Le Théorème<br />
<strong>de</strong> Birkhoff nous apprend qu’il existe un ensemble E k <strong>de</strong> µ-mesure 1<br />
tel que pour tout x ∈ E k , (1/n)S n φ k (x) converge vers ∫ φ X kdµ. L’ensemble<br />
E = ∩ k E k est <strong>de</strong> µ-mesure 1 et comme la suite <strong>de</strong>s φ k est C 0 -<strong>de</strong>nse dans<br />
C 0 (X), il est clair que pour toute φ ∈ C 0 (X) et tout x ∈ X, la suite<br />
(1/n)S n φ(x) converge également vers ∫ φdµ. On dit que l’ensemble E est<br />
X<br />
un ensemble générique pour (T, µ).<br />
Un corollaire <strong>du</strong> résultat précé<strong>de</strong>nt est le suivant :<br />
Corollaire 3.3.2 Si µ et ν sont <strong>de</strong>ux mesures <strong>de</strong> probabilité T -invariantes<br />
et ergodiques elles sont mutuellement singulières 2 ou égales.<br />
Démonstration.— Supposons que ce ne soit pas le cas. L’intersection E <strong>de</strong><br />
l’ensemble <strong>de</strong>s points réguliers <strong>de</strong> µ et <strong>de</strong> l’ensemble <strong>de</strong>s points réguliers <strong>de</strong> ν<br />
est alors <strong>de</strong> µ-mesure et <strong>de</strong> ν-mesure positive. Pour toute fonction continue<br />
φ et x ∈ E, on a donc convergence <strong>de</strong> (1/n)S n φ(x) vers ∫ φdµ et ∫ φdν.<br />
X X<br />
Par conséquent, µ = ν.<br />
✷<br />
3.3.3 Unique ergodicité<br />
Définition 3.3.2 On dit qu’un système dynamique (X, T, µ) est uniquement<br />
ergodique, si µ est l’unique mesure <strong>de</strong> probabilité invariante par T .<br />
2 pour tout borélien, µ(A) > 0 implique ν(A) = 0 et ν(A) > 0 implique µ(A) = 0
34 CHAPITRE 3. MESURES INVARIANTES<br />
Puisque l’ensemble <strong>de</strong>s mesures ergodiques est l’ensemble <strong>de</strong>s mesures extrémales<br />
on a<br />
Proposition 3.3.1 Si (X, T, µ) est uniquement ergodique, il est ergodique.<br />
Exemple : La translation R α : x ↦→ x+α sur le cercle R/Z avec α irrationnel<br />
admet la mesure <strong>de</strong> Lebesgue comme unique mesure invariante. En effet, si<br />
(R α ) ∗ µ = µ, on a (R n a ) ∗ µ = µ et comme la suite nα est <strong>de</strong>nse sur le cercle,<br />
il est facile <strong>de</strong> voir que pour tout β sur le cercle (R β ) ∗ µ = µ. Mais la mesure<br />
<strong>de</strong> Haar est l’unique mesure invariante par toute translation.<br />
Théorème 3.3.2 Soit (X, d) un espace métrique compact et T : X → X une<br />
transformation continue et µ une mesure T -invariante. Les trois propriétés<br />
suivantes sont équivalentes :<br />
i) µ est l’unique mesure <strong>de</strong> probabilité invariante par T ;<br />
ii) pour toute fonction φ ∈ C(X) et tout ɛ > 0 il existe <strong>de</strong>s fonctions ψ, η ∈<br />
C(X) telles que<br />
∫<br />
φ = ψ ◦ T − ψ + η + φdµ, ‖η‖ 0 ≤ ɛ;<br />
iii) pour toute fonction continue φ ∈ C(X), les moyennes <strong>de</strong> Birkhoff <strong>de</strong> φ,<br />
(1/n)S n φ(·) convergent uniformément vers ∫ X φdµ.<br />
Le fait que pour toute fonction continue φ ∈ C(X), les moyennes <strong>de</strong> Birkhoff<br />
<strong>de</strong> φ, (1/n)S n φ(·) convergent uniformément vers une constante est équivalent<br />
à l’unique ergodicité <strong>de</strong> (T, µ).<br />
Démonstration.—<br />
i) ⇔ ii) : Notons E l’ensemble <strong>de</strong>s fonctions continues <strong>de</strong> X <strong>de</strong> µ-intégrale<br />
nulle et F l’adhérence pour la topologie C 0 <strong>de</strong> l’ensemble <strong>de</strong>s fonctions <strong>de</strong> la<br />
forme ψ ◦ T − ψ. Si E ̸= F, le théorème <strong>de</strong> Hanh-Banach nous enseigne qu’il<br />
existe une forme linéaire non nulle Λ ∈ E ∗ dont la restriction à F est nulle.<br />
D’après le théorème <strong>de</strong> représentation <strong>de</strong> Riesz, il existe une mesure (réelle) ν<br />
telle que pour tout φ ∈ E, Λφ = ∫ φdν. Par conséquent, pour toute fonction<br />
X<br />
φ = ψ◦T −ψ où ψ est continue on a ∫ φdν = 0, et donc ∫ ψ◦T dν = ∫ ψdν.<br />
X X X<br />
On a donc T ∗ ν = ν. La mesure ν admet une écriture unique <strong>de</strong> la forme<br />
ν = ν + −ν − où ν ± sont <strong>de</strong>s mesures boréliennes positives telles que pour tout<br />
borélien A, ν ± (A) = ±ν(A ∩ E ± ), où E ± sont <strong>de</strong>s boréliens. Démontrons que<br />
ν ± sont T -invariantes. Déjà,<br />
ν + (T −1 E + ) ≥ ν(T −1 E + ) = ν(E + ) = ν + (E + )<br />
X
3.3. LIENS AVEC LA DYNAMIQUE TOPOLOGIQUE 35<br />
et donc ν + (T −1 E + ∆E + ) = 0. En outre,<br />
ν + (T −1 E + ) − ν − (T −1 E + ) = ν(T −1 E + ) = ν(E + ) = ν + (E + )<br />
et comme ν + (E + ) = ν + (T −1 E + ) on en dé<strong>du</strong>it ν − (T −1 E + ) = 0 et ν(T −1 E + ∆E + ) =<br />
0. Pour tout borélien A<br />
ν + (T −1 A) = ν(T −1 A ∩ E + ) = ν(T −1 A ∩ T −1 E + ) = ν(A ∩ E + ) = ν + (A)<br />
. On verrait <strong>de</strong> même que ν − est T -invariante. Comme par hypothèse (T, µ)<br />
est uniquement ergodique, on a ν + = µ. Mais alors, Λ est nulle sur E, ce qui<br />
est une contradiction.<br />
ii) ⇔ iii) : C’est clair.<br />
iii) ⇔ i) : Si ν est une mesure <strong>de</strong> probabilité T -invariante, ∫ ∫<br />
(1/n)S X nφdν =<br />
φdν. De la convergence uniforme <strong>de</strong>s moyennes <strong>de</strong> Birkhoff <strong>de</strong> φ vers<br />
∫X<br />
φdµ on dé<strong>du</strong>it µ = ν.<br />
✷<br />
X<br />
Skew-shift<br />
Pour α ∈ T irrationnel, notons T = T α : T 2 → T 2 défini par T (x, y) =<br />
(x + α, y + x). Les itérés <strong>de</strong> T se calculent aisément : pour n ≥ 0,<br />
T n (x, y) = (x + nα, y + nx + n(n − 1)α/2).<br />
Si m désigne la mesure <strong>de</strong> Lebesgue, il est clair que m est T -invariante puisque<br />
le jacobien <strong>de</strong> T est constant égal à 1. Démontrons que (T, m) est ergodique :<br />
si f est une fonction bornée T -invariante, il est facile <strong>de</strong> voir que ses coefficients<br />
<strong>de</strong> Fourier vérifient ˆf(k + l, l) = e 2πikα ˆf(k, l) ; comme ils sont dans<br />
l 2 (Z 2 ) on voit facilement que f est constante.<br />
Démontrons à présent<br />
Théorème 3.3.3 Si α est irrationnel, T α est uniquement ergodique.<br />
Démonstration.— Il suffit pour cela <strong>de</strong> démontrer que si ν est une mesure<br />
<strong>de</strong> probabilité T -invariante elle est égale à m. Si π : T 2 → T est la projection<br />
suivant la première variable, on voit que π ◦ T α = R α ◦ π où R α est la<br />
translation d’angle α sur T. On a donc (R α ) ∗ (π ∗ ν) = (π ∗ ν) et comme la<br />
mesure <strong>de</strong> Lebesgue est l’unique mesure invariante par R α (α est irrationnel)<br />
on a nécessairement π ∗ ν = Leb : ν se projette par le premier facteur sur la<br />
mesure <strong>de</strong> Lebesgue. Ainsi, pour tout borélien I ⊂ T, ν(π −1 I) = Leb(I).<br />
Notons E m (resp. E ν ) l’ensemble <strong>de</strong>s points m-génériques (resp. ν-générique)
36 CHAPITRE 3. MESURES INVARIANTES<br />
pour T . Le théorème <strong>de</strong> Fubini implique qu’il existe un ensemble I ⊂ T <strong>de</strong><br />
mesure <strong>de</strong> Lebesgue 1 tel que pour tout x ∈ I la mesure <strong>de</strong> Lebesgue <strong>de</strong> la<br />
fibre π −1 (x) ∩ E m égale 1.Si on note J l’ensemble <strong>de</strong>s x ∈ I pour lesquels<br />
π −1 (x) ∩ E ν = ∅, on a Leb 1 (J) = ν(π −1 (J)) = 0 ; en notant Ĩ = I − J on voit<br />
que ν(π −1 (Ĩ)) = 1 si bien que E −1<br />
ν = π (Ĩ) mod ν . Comme pour x ∈ Ĩ,<br />
π −1 (x) ∈ E m on a que pour tout (x, y) ∈ T 2 avec x ∈ Ĩ il existe une suite<br />
y n ∈ T convergeant vers y telle que chaque (x, y n ) est m-générique. On a<br />
donc pour toute fonction continue f : T 2 → R,<br />
lim<br />
N→∞<br />
1<br />
N<br />
N∑<br />
f(x + kα, y + kx + k(k − 1)α) = ˜f ν (x, y),<br />
k=0<br />
lim<br />
N→∞<br />
1<br />
N<br />
N∑<br />
∫<br />
f(x + kα, y n + kx + k(k − 1)α) =<br />
k=0<br />
et <strong>du</strong> fait <strong>de</strong> l’uniforme continuité <strong>de</strong> f<br />
fdm,<br />
lim sup<br />
N→∞<br />
1<br />
N<br />
N∑<br />
|f(x+kα, y+kx+k(k−1)α)−f(x+kα, y n +kx+k(k−1)α)| ≤ δ(|y−y n |),<br />
k=0<br />
où δ est une fonction tendant vers 0 en 0. Ceci démontre que pour tout x ∈ Ĩ,<br />
la fibre entière π −1 (x) est dans E m et donc que ν-presque tout point <strong>de</strong> E ν<br />
est appartient à E m . Mais ceci entraîne <strong>de</strong> façon claire que ν = m puisque le<br />
théorème <strong>de</strong> convergence dominée montre que pour toute fonction continue<br />
f, ∫ X fdν = ∫ X (1/n)S nfdν converge vers ∫ X fdm. ✷<br />
On peut donner une preuve qui s’inspire <strong>du</strong> point <strong>de</strong> vue spectral. Supposons<br />
que ν soit une mesure invariante par T et notons U : L 2 (T 2 , ν) → L 2 (T 2 , ν)<br />
l’opérateur unitaire 3 défini par Uf = f ◦ T . Pour r = (k, l) ∈ Z 2 notons<br />
ˆν(r) = 〈ν, e −r 〉 = ∫ T 2 e −2πi〈r,z〉 dz les coefficients <strong>de</strong> Fourier <strong>de</strong> ν (rappelons<br />
qu’une mesure est caractérisée par ses coefficients <strong>de</strong> Fourier).<br />
Si r ≠ 0 est fixé, les vecteurs (U n e r ) n≥1 sont <strong>de</strong>ux à <strong>de</strong>ux orthogonaux.<br />
En effet, 〈U n e r , U m e r 〉 = 〈U n−m e r , e r 〉. Comme Ue (k,l) = e 2πikα e (k+l,l) on voit<br />
que U (n−m) e r est <strong>de</strong> la forme e (k ′ ,l) (avec k ′ = k ssi n − m = 0), si bien que<br />
〈U n−m e r , e r 〉 = 〈e (k ′ ,0), e (k,0) 〉. Mais on a<br />
〈e (k ′ ,0), e (k,0) 〉 = 〈Ue (k ′ ,0), Ue (k,0) 〉 = e (2πi(k′ −k)α) 〈e (k ′ ,0), e (k,0) 〉<br />
3 on munit L 2 (X, ν) <strong>du</strong> pro<strong>du</strong>it hermitien 〈f, g〉 = ∫ T 2 f(z)ḡ(z)dν(z)
3.3. LIENS AVEC LA DYNAMIQUE TOPOLOGIQUE 37<br />
ce qui entraîne que 〈e (k ′ ,0), e (k,0) 〉 égale 0 si k ≠ k ′ et 1 sinon. On a donc bien<br />
démontré que les vecteurs (U n e r ) n≥1 sont <strong>de</strong>ux à <strong>de</strong>ux orthogonaux. Projetons<br />
le vecteur 1 sur l’espace engendré par les (U n e r ) n≥1 : d’après l’inégalité<br />
<strong>de</strong> Parseval-Bessel<br />
∑<br />
|〈U n e r , 1〉| 2 ≤ ‖1‖ 2 L 2 (ν) = 1.<br />
n≥0<br />
Mais, 〈U n e r , 1〉 = 〈U n e r , U n 1〉 = 〈e r , 1〉 = ˆν(−r). On a donc démontré que<br />
pour tout r ∈ Z 2 , ˆν(r) = 0 si r ≠ 0 et ˆν(0) = 1. Ces relations caractérisent<br />
la mesure <strong>de</strong> Lebesgue sur T 2 .<br />
Equirépartition<br />
Définition 3.3.3 Une suite (x n ) <strong>de</strong> points dans [0, 1] d<br />
pour tout pavé I ⊂ [0, 1] d on a<br />
est équirépartie si<br />
#{k ∈ {1, . . . , N} : x k ∈ I}<br />
lim<br />
N→∞<br />
N<br />
= vol d (I)<br />
Un critère d’équirépartition est le suivant (preuve laissée en exercice au lecteur).<br />
Théorème 3.3.4 Les propriétés suivantes sont équivalentes :<br />
i) La suite (x n ) est équirépartie ;<br />
ii) Pour toute fonction Riemann intégrable f sur [0, 1] d la suite 1 n<br />
∑ n<br />
k=1 f(x k)<br />
converge vers ∫ [0,1] d f(x)dx.<br />
iii) Pour toute fonction continue f sur [0, 1] d la suite 1 n<br />
∑ n<br />
k=1 f(x k) converge<br />
vers ∫ [0,1] d f(x)dx.<br />
iv) Pour tout polynôme trigonométrique P la suite 1 n<br />
∑ n<br />
k=1 P (x k) converge<br />
vers ∫ T d P (x)dx.<br />
Comme corollaire <strong>de</strong>s <strong>de</strong>ux sous-sections précé<strong>de</strong>ntes on a<br />
Corollaire 3.3.3 Si α est irrationnel, la suite n(n − 1)α/2 est équirépartie<br />
sur [0, 1]<br />
Démonstration.— Il suffit <strong>de</strong> poser f(x, y) = e 2πir y et d’appliquer les théorèmes<br />
3.3.2, 3.3.3, 3.3.4<br />
✷
38 CHAPITRE 3. MESURES INVARIANTES<br />
On peut démontrer par cette métho<strong>de</strong> que si P (n) est un polynôme dont<br />
le coefficient <strong>du</strong> monôme <strong>du</strong> plus haut <strong>de</strong>gré est irrationnel, alors la suite<br />
(P (n)) est équirépartie. On intro<strong>du</strong>ira pour cela T : T d → T d défini par<br />
T : (θ 1 , θ 2 , . . . , , θ d ) ↦→ (θ 1 + α, θ 2 + θ 1 , . . . , θ d + θ d−1 ),<br />
et on démontrera que l’unique mesure <strong>de</strong> probabilité T -invariante est la<br />
mesure <strong>de</strong> Lebesgue sur T 2 . Si P est <strong>de</strong> <strong>de</strong>gré d, on pose P d = P , et<br />
P j = P j+1 (X + 1) − P j+1 (X), j = N − 1, . . . , 0. On a P 0 (X) = α où on<br />
a noté α/N! le coefficient dominant <strong>de</strong> P . Si on pose θ n = P 1 (n), . . . , P d (n))<br />
on a T n θ 0 = θ n . On conclut alors comme précé<strong>de</strong>mment.<br />
3.4 Mélange<br />
Définition 3.4.1 Un système dynamique (X, A, T, m) est dit mélangeant si<br />
pour tous boréliens A, B ∈ A on a<br />
Il n’est pas difficile <strong>de</strong> prouver que<br />
lim m(T −n A ∩ B) = m(A)m(B).<br />
n→∞<br />
Proposition 3.4.1 Un système dynamique est mélangeant si et seulement<br />
si pour toutes fonctions f, g ∈ L 2 (X, m) on a<br />
∫<br />
∫ ∫<br />
f ◦ T n ḡdm = fdm ḡdm<br />
lim<br />
n→∞<br />
X<br />
Théorème 3.4.1 Si un système dynamique est mélangeant il est ergodique.<br />
Démonstration.— En effet, si A est un borélien T -invariant on a lim n→∞ m(T −n A∩<br />
A) = m(A)m(A) ce qui s’écrit m(A) = m(A) 2 et donc m(A) égale 0 ou 1.<br />
Dans un cadre probabiliste il s’agit <strong>de</strong> la loi <strong>du</strong> 0,1 <strong>de</strong> Kolmogorov.<br />
Un exemple important <strong>de</strong> systèmes mélangeants est fourni par les sousshifts<br />
<strong>de</strong> type fini.<br />
Théorème 3.4.2 (Perron-Frobenius) Si P ∈ M r (R) est une matrice stochastique<br />
irré<strong>du</strong>ctible 4 alors il existe une unique mesure stationnaire, c’està-dire<br />
un unique vecteur p ∈ R n à coordonnées positives et dont la somme<br />
<strong>de</strong>s composantes vaut 1 tel que µP = µ. En outre, si P est apériodique 5<br />
alors pour toute mesure <strong>de</strong> probabilité ν sur {1, . . . , r}, ν, lim n→∞ qP n = p.<br />
4 ce qui signifie que le graphe orienté <strong>de</strong> P est connexe<br />
5 ∃m ≥ 0, ∀i, j, (P m ) ij > 0<br />
X<br />
X<br />
✷
3.4. MÉLANGE 39<br />
Démonstration.— Supposons P irré<strong>du</strong>ctible, et faisons l’hypothèse qu’il<br />
existe <strong>de</strong>ux mesures <strong>de</strong> probabilités µ 1 , µ 2 différentes telles que µ 1 = µ 1 P<br />
et<br />
∑<br />
µ 2 = µ 2 P . Si on appelle x le vecteur ligne x = µ 1 − µ 2 on a x = xP et<br />
i∈E x i = 0 ; en particulier il existe <strong>de</strong>ux indices i, j tels que x i et x j sont <strong>de</strong><br />
signes opposés. Puisque la matrice P est irré<strong>du</strong>ctible il existe un exposant m<br />
tel que (P m ) ij > 0. Ecrivons x = xP m puis,<br />
∑<br />
|x j | = ∑ | ∑ x k (P m ) kj |<br />
j∈E j∈E k∈E<br />
≤ ∑ ∑<br />
|x k ||(P m ) kj |<br />
j∈E k∈E<br />
≤ ∑ ∑<br />
|x k |(P m ) kj<br />
k∈E j∈E<br />
≤ ∑ k∈E<br />
|x k |<br />
puisque la matrice P est stochastique ( ∑ j∈E (P m ) ij = 1). Or, cette <strong>de</strong>rnière<br />
inégalité est une égalité ; par conséquent dans la suite d’inégalités que nous<br />
avons écrites nous avions en fait déjà <strong>de</strong>s égalités. Il en résulte que pour tout<br />
j,<br />
|x j | = | ∑ x k (P m ) kj | = ∑ |x k |(P m ) kj ,<br />
k∈E<br />
k∈E<br />
ce qui n’est possible que si les |x k |(P m ) kj , sont tous <strong>de</strong> même signe quand k<br />
varie dans le sous-ensemble <strong>de</strong> E constitué <strong>de</strong>s k pour lesquels |x k |(P m ) kj est<br />
non nul. Puisque x i ≠ 0 et que par définition <strong>de</strong> m le coefficient (P m ) ij > 0,<br />
ceci entraîne que x j est <strong>de</strong> même signe que x i ce qui est une contradiction.<br />
Supposons à présent P apériodique. Notons M 0 l’ensemble <strong>de</strong>s vecteurs<br />
lignes x tels que ∑ i∈E x i = 0. Définissons pour x ∈ M 0 la norme suivante :<br />
‖x‖ = 1 ∑<br />
|x i | = ∑ i )<br />
2<br />
i∈E(x + .<br />
i∈E<br />
(Avec la notation z + = max(0, z)). L’application x ↦→ xP envoie M 0 dans<br />
lui même. On a le lemme suivant<br />
Lemme 3.4.1 Soit Q une matrice stochastique telle que α = min i,j∈E Q ij ><br />
0. Alors, Q est une (1 − α)-contraction : pour tout x ∈ M 0<br />
‖xQ‖ ≤ (1 − α)‖x‖.
40 CHAPITRE 3. MESURES INVARIANTES<br />
Démonstration.—<br />
On a<br />
‖xQ‖ =<br />
∑<br />
(xQ) i<br />
i:(xQ) i >0<br />
= ∑<br />
≤<br />
i:(xQ) i >0 k∈E<br />
∑<br />
∑<br />
x k (Q) ki<br />
∑<br />
i:(xQ) i >0 k:x k >0<br />
≤ ∑<br />
∑<br />
k:x k >0 i:(xQ) i >0<br />
|x k |(Q) ki |<br />
x k (Q) ki<br />
Comme xQ ∈ M 0 on a ∑ i∈E (xQ) i = 0 et l’ensemble <strong>de</strong>s i ∈ E pour lesquels<br />
(xQ) i > 0 n’est pas E tout entier. Par conséquent,<br />
∑<br />
(Q) ki −<br />
∑<br />
(Q) ki<br />
ki =<br />
i:(xQ) i >0(Q) ∑ i∈E<br />
= 1 − ∑<br />
Revenant aux inégalités précé<strong>de</strong>ntes<br />
i:(xQ) i ≤0<br />
≤ (1 − α).<br />
i:(xQ) i ≤0<br />
(Q) ki<br />
‖xQ‖ ≤ (1 − α)‖x‖.<br />
Puisque P est apériodique il existe un entier m tel que Q = P m soit à<br />
coefficients strictement positifs. L’application x ↦→ xP m <strong>de</strong> (M 0 , ‖ · ‖) dans<br />
lui même est donc une (1−α)-contraction et par conséquent pour tout entier<br />
l, ‖xP lm ‖ ≤ (1 − α) l ‖x‖. Si µ est l’unique mesure <strong>de</strong> probabilité stationnaire<br />
et ν une mesure <strong>de</strong> probabilité µ − ν ∈ M 0 et donc pour tous entiers l, c<br />
ce qui s’écrit (en utilisant µP n = µ)<br />
‖(µ − ν)P lm+c ‖ ≤ (1 − α) l ‖(µ − ν)P c ‖<br />
‖µ − νP lm+c ‖ ≤ (1 − α) l ‖(µ − ν)P c ‖.<br />
Comme tout entier n s’écrit <strong>de</strong> façon unique n = lm + c avec 0 ≤ c < m,<br />
l ≥ n/m (division euclidienne <strong>de</strong> n par m) et comme 0 ≤ (1 − α) < 1, la<br />
suite µ − νP n converge vers 0.<br />
Comme corollaire on obtient :<br />
✷<br />
✷
3.4. MÉLANGE 41<br />
Théorème 3.4.3 Si P est une matrice stochastique et A la matrice <strong>de</strong> transition<br />
associée à P (A i,j = 1 ssi P ij > 0) notons p l’unique mesure stationnaire<br />
telle que pP = p et m la mesure correspondante sur (Σ A , Bor). Le<br />
système dynamique (Σ A , Bor, σ, m) est mélangeant.<br />
Démonstration.— Il suffit <strong>de</strong> démontrer que pour tous cylindres C =<br />
C(ɛ 0 , . . . , ɛ n ), C ′ = C(ɛ ′ 0, . . . , ɛ ′ n ′) on a<br />
lim m(C ∩<br />
k→∞ σ−k C ′ ) = 0.<br />
Si k est assez grand (k ≥ n), C∩σ −k C ′ est le cylindre C ′′ = C(ɛ 0 , . . . , ɛ n , ∗, ɛ k , . . . , ɛ k+n ′)<br />
dont la m mesure vaut<br />
m(C ′′ ) = p ɛ0 P ɛ0 ɛ 1<br />
· · · P ɛn−1 ɛ n<br />
(P k−n ) ɛnɛ k<br />
P ɛk ɛ k+1 · · · P ɛk+n ′ −1 ɛ k+n ′<br />
= p ɛ0 P ɛ0 ɛ 1<br />
· · · P ɛn−1 ɛ n<br />
(P k−n ) ɛnɛ ′ 0 P ɛ ′ 0 ɛ′ 1 · · · P ɛ ′ n ′ −1 ɛ′ n ′<br />
Mais q j (P k−n ) ji converge vers p i quand k tend vers l’infini ; ainsi, quand k<br />
tend vers l’infini m(C ′′ ) tend vers<br />
p ɛ0 P ɛ0 ɛ 1<br />
· · · P ɛn−1 ɛ n<br />
p ɛ ′<br />
0<br />
P ɛ ′<br />
0 ɛ ′ 1 · · · P ɛ ′ n ′ −1 ɛ′ n ′<br />
qui vaut m(C)m(C ′ ).<br />
✷
42 CHAPITRE 3. MESURES INVARIANTES
Chapitre 4<br />
Homéomorphismes et<br />
difféomorphismes <strong>du</strong> cercle<br />
4.1 Homéomorphismes <strong>du</strong> cercle<br />
4.1.1 Forme <strong>de</strong>s relevés d’un homéomorphisme <strong>du</strong> cercle<br />
Nous entreprenons dans cette section l’étu<strong>de</strong> <strong>de</strong>s homéomorphismes <strong>du</strong><br />
cercle (ou plutôt <strong>du</strong> tore <strong>de</strong> dimension 1) T = R/Z = {x + Z : x ∈ R}.<br />
Nous notons π a projection canonique π : R → R/Z. On dit que x ∈ R est<br />
un relevé <strong>de</strong> ¯x ∈ R/Z si π(x) = ¯x. Si ¯x, ȳ ∈ R/Z admettent pour relevés<br />
respectifs x, y ∈ R nous posons d(x, y) = min k∈Z |x − y − k|. Il est facile <strong>de</strong><br />
voir que (R/Z, d) est un espace métrique complet compact. Par construction<br />
(R, π) est un revêtement <strong>de</strong> R/Z. Ceci permet <strong>de</strong> définir une orientation sur<br />
R/Z : nous dirons que ¯x, ȳ, ¯z sont ordonnés dans le sens direct s’il existe <strong>de</strong>s<br />
relevés x, y, z ∈ R tels que x < y < z < x + 1. On dit qu’une application<br />
continue f : R/Z → R/Z préserve l’orientation si pour tout triplé ordonné<br />
dans le sens direct (x, y, z) le triplet image (f(x), f(y), f(z)) est ordonné dans<br />
le sens direct.<br />
Exemple L’application <strong>de</strong> T dans lui même x ↦→ −x ne préserve pas l’orientation<br />
(elle la renverse).<br />
Comme [0, 1] est simplement connexe, pour tout chemin continu γ :<br />
[0, 1] → R/Z et tout ˜x ∈ π −1 (γ(0)) il existe un unique chemin continu<br />
˜γ : [0, 1] → R tel que ˜γ(0) = ˜x et qui relève γ : π ◦ ˜γ = γ. De la même<br />
façon, toute application continue g : R → R/Z se relève en une application<br />
continue G : R → R, tous les autres relèvement <strong>de</strong> g étant <strong>de</strong> la forme<br />
G(·) + k, k ∈ Z. Par conséquent si f : R/Z → R/Z est une application<br />
continue elle se relève en une application continue F : R → R (considérer<br />
43
44CHAPITRE 4. HOMÉOMORPHISMES ET DIFFÉOMORPHISMES DU CERCLE<br />
g = f ◦ π) toutes les autres applications relevant f étant <strong>de</strong> la forme F + k,<br />
k ∈ Z. On a ainsi<br />
π ◦ F = f ◦ π<br />
et Z étant discret, il existe un unique entier k ∈ Z tel que<br />
F (· + 1) = F (·) + k.<br />
Lemme 4.1.1 Une application f : R/Z → R/Z est un homéomorphisme<br />
préservant l’orientation si et seulement si il existe un relèvement F : R →<br />
R <strong>de</strong> f continu strictement monotone tel que F (· + 1) = F (·) + 1. Par<br />
conséquent il existe une fonction φ ∈ C 0 (R, R) qui est Z-périodique et telle<br />
que F = id + φ. Tout autre relèvement est <strong>de</strong> la forme id + φ + k où k ∈ Z.<br />
Démonstration.— Soit F un relèvement continu <strong>de</strong> f tel que F (x + 1) =<br />
F (x) + k, k ∈ Z. Comme f est injective F est strictement monotone (sinon<br />
on peut trouver <strong>de</strong>ux points x, y ∈ R x < y < x + 1 tels que F (x) =<br />
F (y) ; mais cela fournit <strong>de</strong>ux points distincts ¯x = π(x), ȳ = π(y) tels que<br />
f(¯x) = f(ȳ) contredisant l’injectivité <strong>de</strong> f). Ceci entraîne k ≠ 0 et par<br />
conséquent lim ±∞ F ∈ {−∞, ∞} si bien que F est un homéomorphisme<br />
<strong>de</strong> R. Comme f préserve l’orientation, F est strictement croissante et on<br />
a k > 0. Supposons l’entier k > 1. Alors, d’après le théorème <strong>de</strong>s valeurs<br />
intermédiaires, il existerait 0 < x < 1 tel que F (0) < F (x) = F (0) + 1 <<br />
F (1) = F (0) + k (F est nécessairement strictement croissante si p > 0).<br />
Mais ceci contredit l’injectivité <strong>de</strong> f = π ◦ F ◦ π. On a donc k = 1 et<br />
F (· + 1) = F (·) + 1. Il est alors clair que la fonction φ : x ↦→ F (x) − x est<br />
Z-périodique.<br />
✷<br />
Remarque Un critère pour qu’une application <strong>de</strong> la forme x + φ(x) où<br />
φ ∈ C 0 (R/Z) soit un homéomorphisme croissant <strong>de</strong> R est que |φ(x)−φ(y)| <<br />
|x − y| pour tous x, y. En particulier, si φ est dérivable et sup x∈R |φ ′ (x)| < 1<br />
ce sera le cas.<br />
Nous notons Homeo + (RZ) l’ensemble <strong>de</strong>s homéomorphismes <strong>de</strong> RZ préservant<br />
l’orientation et D 0 +(R/Z) l’ensemble <strong>de</strong>s homéomorphismes F <strong>de</strong> R<br />
croissants tels que x ↦→ F (x)−x est croissant. Ce <strong>de</strong>rnier espace s’i<strong>de</strong>ntifie naturellement<br />
à C 0 (R/Z) et nous définirons une distance d sur D 0 +(T) en posant<br />
d C 0(F, G) = sup x∈R |((F (x)−x)−(G(x)−x))|. Nous munirons Homeo + (R/Z)<br />
<strong>de</strong> la plus petite topologie qui rend l’application π : D 0 +(T) → Homeo + (T)<br />
continue : une base <strong>de</strong> voisinage <strong>de</strong> Homeo + (T) est l’ensemble <strong>de</strong>s V δ (f) où<br />
V δ (f) est {π ◦ (F + φ) : φ ∈ C 0 (T), ‖φ‖ C 0 < δ} où F est un relèvement <strong>de</strong> F .
4.1. HOMÉOMORPHISMES DU CERCLE 45<br />
4.1.2 Nombre <strong>de</strong> rotation<br />
Soit f un homéomorphisme <strong>du</strong> cercle et F (x) = x + φ(x) un relèvement<br />
(φ est 1-périodique). Remarquons que puisque φ est 1-périodique on peut<br />
considérer φ comme une application définie sur R/Z (exercice : vérifier).<br />
Le lemme et la remarque qui suivent sont à la base <strong>de</strong> la théorie <strong>du</strong> nombre<br />
<strong>de</strong> rotation<br />
Lemme 4.1.2 Si F (x) = x + φ(x) est le relèvement d’un homéomorphisme<br />
<strong>du</strong> cercle (préservant l’orientation) on a pour tout x, y ∈ R tels que |x − y| <<br />
1, l’inégalité |F (x) − F (y)| < 1.<br />
Démonstration.— Supposons en effet que x < y < x + 1. Comme F est<br />
strictement croissante et que F (x + 1) = F (x) + 1 on a F (x) < F (y) <<br />
F (x) + 1.<br />
Remarque : Si on note F n l’itéré n-ième <strong>de</strong> F on a<br />
∑n−1<br />
F n (x) − x = φ ◦ f k (x).<br />
k=0<br />
Le théorème fondamental <strong>de</strong> cette section est le suivant :<br />
Théorème 4.1.1 Les moyennes <strong>de</strong> Birkhoff <strong>de</strong> φ le long <strong>de</strong> f (ou F )<br />
✷<br />
F n (x) − x<br />
n<br />
= 1 ∑n−1<br />
φ ◦ f k (x)<br />
n<br />
k=0<br />
convergent uniformément vers un nombre ρ(F ). Pour toute mesure <strong>de</strong> probabilité<br />
µ sur R/Z invariante par f on a ρ(F ) = ∫ φdµ. Comme ρ(F + k) =<br />
R/Z<br />
ρ(F ) + k pour tout k ∈ Z on définit ρ(f) = ρ(F ) mod Z.<br />
Démonstration.— Considérons φ comme une application continue <strong>de</strong> R/Z<br />
sur R et soit µ une mesure <strong>de</strong> probabilité sur R/Z invariante par f. D’après<br />
le théorème <strong>de</strong> Birkhoff, on sait qu’il existe au moins un point x 0 ∈ R/Z pour<br />
lequel la somme <strong>de</strong> Birkhoff 1/n ∑ n−1<br />
k=0 φ ◦ f k (x 0 ) converge. Mais ceci signifie<br />
que (F n (x 0 ) − x 0 )/n converge vers un nombre ρ. Comme F n est un relevé <strong>de</strong><br />
f n on a |F n (x) − F n (y)| < 1 pourvu que |x − y| < 1. Par conséquent, pour<br />
tout x tel que |x − x 0 | < 1 on a<br />
1<br />
n |(F n (x) − x) − (F n (x 0 ) − x 0 )| ≤ 2 n ,
46CHAPITRE 4. HOMÉOMORPHISMES ET DIFFÉOMORPHISMES DU CERCLE<br />
ce qui prouve la convergence uniforme <strong>de</strong> 1 (F n (x) − x) vers un nombre ρ.<br />
n<br />
Pour i<strong>de</strong>ntifier ce <strong>de</strong>rnier, il suffit <strong>de</strong> constater que<br />
∫<br />
∫<br />
(F n (x) − x)dµ(x) = n φdµ<br />
R/Z<br />
pour obtenir que ρ = ∫ φdµ pour toute mesure <strong>de</strong> probabilité µ qui est<br />
R/Z<br />
f-invariante.<br />
Remarque On peut éviter le re<strong>cours</strong> au Théorème ergodique en observant<br />
que l’égalité ∫ (<br />
∫ )<br />
(F k (x) − x) − k φdµ dµ(x) = 0<br />
R/Z<br />
assure l’existence d’un point x k pour lequel F k (x k ) − x k = kρ.<br />
Remarque La remarque <strong>de</strong> la preuve précé<strong>de</strong>nt montre que pour tout k ∈ Z<br />
il existe un point x k tel que R −kρ ◦ f k admette x k comme point fixe.<br />
Propriétés <strong>du</strong> nombre <strong>de</strong> rotation<br />
Proposition 4.1.1 1) Si f, g ∈ Homeo + (R/Z) et h : R/Z est une semiconjugaison<br />
: f ◦ h = h ◦ g alors ρ(f) = ρ(g).<br />
2) L’application ρ : D 0 +(T) → R (resp. ρ : Homeo + (R/Z) → T) est continue.<br />
3) Si f, g ∈ Homeo + (T) commutent (f ◦g = g◦f) alors ρ(f ◦g) = ρ(f)◦ρ(g).<br />
4) Si F, G ∈ D 0 +(T) vérifient ∀x ∈ R F (x) ≤ G(x) alors ρ(F ) ≤ ρ(G).<br />
5) Si f ∈ Homeo + (T), ρ(f) = p/q ((p, q) ∈ Z × Z, p.g.c.d.(p, q) = 1) si et<br />
seulement si f admet un point périodique <strong>de</strong> pério<strong>de</strong> q.<br />
6) Si on note R λ : R → R l’application R λ (x) = x + λ alors l’application<br />
λ ↦→ ρ(R λ ◦ F ) est croissante au sens large et si ρ(f) /∈ Q alors ρ(R λ ◦ f) =<br />
ρ(f) implique λ = 0.<br />
Démonstration.—<br />
1) Soient F , G, H <strong>de</strong>s relèvements <strong>de</strong> f, g, h et φ, ψ, θ ∈ C 0 (T) tels que<br />
F (x) = x + φ(x), G(x) = x + ψ(x), H(x) = x + θ(x). La relation <strong>de</strong> semiconjugaison<br />
se relève sous la forme F ◦ H = H ◦ G + k où k est un entier<br />
que l’on peut supposer nul quitte à le retrancher à F . Il est facile <strong>de</strong> voir que<br />
pour tout entier n on a F n ◦ H = H ◦ G n si bien que<br />
R/Z<br />
R/Z<br />
✷<br />
F n (H(x)) − H(x)<br />
n<br />
= H(Gn (x)) − H(x)<br />
.<br />
n
4.1. HOMÉOMORPHISMES DU CERCLE 47<br />
Mais H(G n (x)) = G n (x) + θ(G n (x)), si bien que<br />
F n (H(x)) − H(x)<br />
n<br />
= Gn (x) − G(x) + (θ(G n (x)) − θ(x))<br />
.<br />
n<br />
Mais θ est bornée sur R et en faisant tendre n vers l’infini on obtient le<br />
résultat.<br />
2) On a vu que (F n − id)/n convergeait uniformément vers ρ(F ). Mais F ↦→<br />
(F n − id)/n est continue. Par conséquent (une limite uniforme <strong>de</strong> fonctions<br />
continues est continue) F ↦→ ρ(F ) est continue.<br />
3) On peut trouver <strong>de</strong>s relèvements tels que F ◦ G = G ◦ F . On a donc<br />
(F ◦ G) n = F n ◦ G n et<br />
(F ◦ G) n (x) − x<br />
n<br />
et donc<br />
‖ (F ◦ G)n − id<br />
n<br />
−(ρ(F )+ρ(G)) = ( F n (G n (x)) − G n (x)<br />
n<br />
−(ρ(F )+ρ(G))‖ 0 ≤ ‖ F n − id<br />
n<br />
−ρ(F ))+( Gn (x) − x<br />
−ρ(G))<br />
n<br />
−ρ(F ))|‖ 0 +‖ Gn − id<br />
−ρ(G))‖ 0 .<br />
n<br />
4) Si pour tout x F (x) ≤ G(x) alors comme F et G sont croissantes F (F (x)) ≤<br />
F (G(x)) ≤ G(G(x)) et plus généralement F n (x) ≤ G n (x).<br />
5) Si f admet un point périodique x <strong>de</strong> pério<strong>de</strong> q, il existe un relèvement F<br />
et un entier p tel que F q (˜x) = ˜x + p (˜x est un relèvement <strong>de</strong> x). On a donc<br />
F nq (x) − x = np et donc ρ(F ) = p/q. Réciproquement si ρ(f) = p/q alors il<br />
existe un relèvement F tel que ρ(F ) = p/q. On a vu (cf. la Remarque dans<br />
la preuve <strong>de</strong> l’existence <strong>du</strong> nombre <strong>de</strong> rotation) qu’il existait x ∈ R tel que<br />
F q (x) = x+q(p/q) = x+p. Par conséquent f q (x) = x. Démontrons que q est<br />
la plus petite pério<strong>de</strong>. Notons l cette plus petite pério<strong>de</strong> : il existe un entier m<br />
tels que F l (x) = x+m ; la division euclidienne <strong>de</strong> q par l, q = al+r, 0 ≤ r < l<br />
donne le résultat suivant ; x + p = F q (x) = F q−al (F al (x)) = F q−al (x + am) =<br />
F r (x) + am. Par conséquent F r (x) = x + p − am où 0 ≤ r < l ce qui<br />
contredit la minimalité <strong>de</strong> l si r est non nul. On a donc r = 0 c’est-à-dire<br />
q = al et p = am ; mais alors p et q ne sont pas premiers entre eux d’où une<br />
contradiction.<br />
6) Notons F λ = R λ ◦ F . La croissance résulte <strong>du</strong> point 4). Si ρ(F ) /∈ Q et<br />
λ > 0 alors il existe un rationnel p/q tel que (p/q) − (λ/2q) < ρ(F ) < p/q.<br />
En outre, on sait qu’il existe un x ∈ R pour lequel F q (x) = x + qρ(F ) et<br />
donc x + p − (λ/2) < F q (x) < x + p. Par conséquent, comme F, F λ sont<br />
croissantes et λ > 0, F q λ (x) = F λ(F q−1<br />
λ<br />
(x)) ≥ F λ (F q−1 (x)) = λ + F q (x),<br />
si bien que F q λ (x) ≥ x + p + (λ/2) et donc ρ(F q λ<br />
) ≥ p + (λ/2). On a donc<br />
ρ(F λ ) > p/q > ρ(F ).
48CHAPITRE 4. HOMÉOMORPHISMES ET DIFFÉOMORPHISMES DU CERCLE<br />
✷<br />
Exercice Démontrer qu’en général le nombre <strong>de</strong> rotation <strong>de</strong> la composition<br />
<strong>de</strong> <strong>de</strong>ux homéomorphismes <strong>du</strong> cercle préservant l’orientation n’est pas égal à<br />
la somme <strong>de</strong> leurs nombres <strong>de</strong> rotation. (Considérer une perturbation d’un<br />
difféomorphisme <strong>du</strong> cercle admettant un point fixe hyperbolique).<br />
4.1.3 Le théorème <strong>de</strong> Poincaré<br />
Une question centrale en systèmes dynamiques est <strong>de</strong> savoir si une dynamique<br />
donnée peut être conjuguée à une dynamique modèle plus simple. Dans<br />
le cas qui nous intéresse il s’agit <strong>de</strong> savoir si un homéomorphisme <strong>du</strong> cercle<br />
peut être conjugué à une rotation par un homéomorphisme. Comme nous<br />
allons le voir, ce n’est en général pas le cas mais on a le résultat important<br />
suivant dû à Poincaré. En fait, si ρ(f) /∈ Q on peut toujours semi-conjuguer<br />
f à une rotation.<br />
Théorème 4.1.2 Soit f ∈ Homeo + (T) tel que ρ(f) /∈ Q. Alors, il existe<br />
h : T → T continue surjective telle que f ◦ h = R ρ(f) ◦ h et h admet un<br />
relèvement <strong>de</strong> la forme H(x) = x + θ(x) croissant au sens large sur R avec<br />
θ ∈ C 0 (R/Z). En outre, si µ est une mesure <strong>de</strong> probabilité f-invariante et<br />
˜µ est un relèvement <strong>de</strong> µ à R (π ∗˜µ = µ) on peut choisir H(x) = ∫ x<br />
d˜µ(t). 0<br />
L’application h appartient à Homeo + (T) si et seulement si supp(µ) = T.<br />
Démonstration.— Soit µ une mesure <strong>de</strong> probabilité sur T invariante par f.<br />
Remarquons déjà que µ est sans atome car si ce n’était pas le cas l’orbite d’un<br />
atome serait nécessairement finie et donc f admettrait un point périodique ;<br />
or, cela est impossible car ρ(f) /∈ Q. On peut relever µ à R en posant pour<br />
tout borélien A <strong>de</strong> R ˜µ(A) = ∑ k∈Z<br />
µ(A ∩ [k, k + 1)). On a ˜µ(A + k) = ˜µ(A)<br />
pour tout borélien A <strong>de</strong> R et tout entier k. La mesure ˜µ ainsi obtenue est<br />
également F invariante si F est un relèvement <strong>de</strong> f. Posons H(x) = ∫ x<br />
d˜µ(t). 0<br />
Cette application est croissante au sens large puisque ˜µ est positive, elle est<br />
continue car ˜µ est sans atome et elle vérifie H(x + 1) = H(x) + 1 ; détaillons<br />
ce <strong>de</strong>rnier point : ˜µ([0, x + 1]) = ˜µ([0, x]) + ˜µ([x, x + 1]) ; mais si k est l’entier<br />
pour lequel x ≤ k < x + 1 on a ˜µ([x, x + 1]) = ˜µ([x, k]) + ˜µ([k, x + 1]) =<br />
˜µ([x, k])+˜µ([k−1, x]) = ˜µ([k−1, k]) = 1. Démontrons que H vérifie la relation<br />
<strong>de</strong> semi-conjugaison. On a H(F (x)) = ˜µ([0, F (x)]) = ˜µ([0, x]) + ˜µ([x, F (x)]).<br />
Comme<br />
˜µ([x, F (x)]) = −˜µ([0, x]) + ˜µ([0, F (0)]) + ˜µ([F (0), F (x)])
4.1. HOMÉOMORPHISMES DU CERCLE 49<br />
et comme ˜µ est F -invariante et que F est un homéomorphisme (monotone)<br />
on a ˜µ([F (0), F (x)]) = ˜µ([0, x]) si bien que<br />
H(F (x)) = F (x) + λ<br />
où λ = ˜µ([0, F (0)]). Mais comme le nombre <strong>de</strong> rotation est invariant par<br />
semi-conjugaison on dé<strong>du</strong>it <strong>de</strong> cela que λ = ρ(F ).<br />
L’application H est surjective puisque H(k) = k pour tout entier k et elle<br />
est strictement croissante si µ charge tout ouvert.<br />
✷<br />
Remarques 1) On dit que (T, R ρ(f) ) est un facteur <strong>de</strong> (T, f).<br />
2) Il est commo<strong>de</strong> <strong>de</strong> considérer que T = [0, 1]/ ∼ où ∼ est l’i<strong>de</strong>ntification<br />
<strong>de</strong> 0 et <strong>de</strong> 1 et <strong>de</strong> voir h comme une application continue croissante au sens<br />
large <strong>de</strong> [0, 1] dans lui même et telle que h(0) = 0, h(1) = 1.<br />
3) Supposons que le support <strong>de</strong> µ ne soit pas égal à T. Son complémentaire<br />
est un ouvert qui possè<strong>de</strong> ainsi un nombre dénombrable <strong>de</strong> composantes<br />
connexes. Si I est l’une d’entre elles h est constante sur I. Réciproquement,<br />
si I est un intervalle sur lequel h est constante alors I est inclus dans le<br />
support <strong>de</strong> µ<br />
4) Si I = (a, b), J = (c, d) sont <strong>de</strong>ux composantes connexes distinctes et si on<br />
suppose par exemple (a, b, c, d) bien ordonné on a b < c car sinon {b} serait un<br />
point isolé dans le support <strong>de</strong> µ et serait un atome. On a µ([b, c]) > 0 car sinon<br />
(a, d) serait inclus dans le support <strong>de</strong> µ et I ne serait pas une composante<br />
connexe <strong>du</strong> complémentaire <strong>de</strong> suppµ. On a donc h(c) = h(b) + µ([b, c]) ><br />
h(b). On voit donc que les composantes connexes <strong>de</strong> O µ sont in<strong>de</strong>xées par<br />
leurs h-hauteur.<br />
5) Notons O µ le complémentaire <strong>de</strong> suppµ. C’est un ouvert qui est invariant<br />
par f (puisque le support <strong>de</strong> µ est f-invariant). Si I est une composante<br />
connexe <strong>de</strong> O µ alors pour tout k ∈ Z, f k (I) est une composante connexe<br />
<strong>de</strong> I qui est toujours disjointe <strong>de</strong> I car h|f k (I) = h|I + kρ(f) mod 1 et<br />
ρ(f) /∈ Q. Par conséquent, toute composante connexe <strong>de</strong> O µ est un ensemble<br />
errant.<br />
6) Notons I µ l’ensemble dénombrable <strong>de</strong>s composantes connexes <strong>de</strong> O µ et D µ<br />
l’union <strong>de</strong>s ∂I, pour I variant dans I µ . Alors, D µ est un ensemble dénombrable<br />
et il est invariant par f puisque si x ∈ ∂I, I ∈ I µ on a f(I) ∈ I µ et<br />
x ∈ ∂(f(I)).<br />
Lemme 4.1.3 Soit h : [0, 1] → [0, 1], h(0) = 0, h(1) = 1 une application<br />
continue croissante. Notons O l’ouvert sur lequel h est localement constante,
50CHAPITRE 4. HOMÉOMORPHISMES ET DIFFÉOMORPHISMES DU CERCLE<br />
K son complémentaire, I l’ensemble <strong>de</strong>s composantes connexes <strong>de</strong> O et D<br />
l’union <strong>de</strong>s ∂I, I ∈ I. Alors, D est dénombrable, h|(K − D) est un homéomorphisme<br />
<strong>de</strong> K − D sur son image et h −1 ([0, 1] − h(D)) = K − D.<br />
Démonstration.— Comme I est dénombrable, il en est <strong>de</strong> même <strong>de</strong> D. Si<br />
h(x) = h(y) avec x, y ∈ K − D et x < y alors h|]x, y[ est constante et donc<br />
]x, y[ est inclus dans une composante connexe I <strong>de</strong> O. Mais comme x, y sont<br />
dans K ceci implique que x, y ∈ ∂I ⊂ D ce qui est une contradiction. Ainsi,<br />
h est injective sur K − D. Par ailleurs, si h(x) ∈ [0, 1] − h(D) alors h n’est<br />
pas constante sur un voisinage <strong>de</strong> x (sinon il existerait I composante connexe<br />
<strong>de</strong> O contenant x et h(x) = h|∂I ∈ h(D)) et donc x ∈ K et n’est pas dans<br />
D. On a donc h −1 ([0, 1] − h(D)) = K − D. Enfin, si h −1 (x n ) → h −1 (x) avec<br />
x n , x ∈ [0, 1] − h(D), on a x n → x (car h est continue).<br />
✷<br />
Minimal invariant<br />
Soit µ une probabilité invariante sur T par f ∈ Homeo + (T) et supposons<br />
que ρ(f) /∈ Q. Notons K µ le support <strong>de</strong> la mesure µ. C’est un ensemble<br />
compact <strong>de</strong> T qui est f-invariant.<br />
Proposition 4.1.2 Si K µ := suppµ ≠ T alors K µ est un ensemble <strong>de</strong> Cantor,<br />
c’est-à-dire est fermé, sans point isolé et d’intérieur vi<strong>de</strong>. En outre K µ<br />
est l’unique compact minimal invariant.<br />
Démonstration.— L’ensemble K µ est sans point isolé car sinon un tel point<br />
serait un atome <strong>de</strong> µ. Démontrons que K µ est minimal. Pour cela il suffit <strong>de</strong><br />
démontrer que si L est un compact invariant par f on a K µ ⊂ L. Le théorème<br />
<strong>de</strong> Poincaré montre que h µ (L) (resp. h µ (K µ )) est un compact <strong>de</strong> T invariant<br />
par R ρ : c’est donc T (R ρ est minimale). Comme h µ est injective sauf sur<br />
l’ensemble dénombrable D µ (cf. le Lemme 4.1.3), on a K µ −D µ ⊂ L. Comme<br />
K µ est sans point isolé et que D µ est dénombrable, on a K µ ⊂ L car K µ et L<br />
sont fermés, ce qui démontre que K µ est l’unique ensemble fermé f-invariant<br />
minimal. Ceci implique que K µ est d’intérieur vi<strong>de</strong> : en effet, si ce n’était<br />
pas le cas, sa frontière K µ − int(K µ ) serait un ensemble fermé f -invariant<br />
(comme f est un homéomorphisme l’intérieur d’un ensemble invariant est<br />
invariant) et K µ ne serait pas minimal.<br />
✷
4.2. DIFFÉOMORPHISMES DU CERCLE 51<br />
Unique ergodicité<br />
Théorème 4.1.3 Si f ∈ Homeo + (T) vérifie ρ(f) /∈ Q alors f est uniquement<br />
ergodique.<br />
Démonstration.— Soit h telle que h ◦ f = R ρ ◦ h et ν une mesure <strong>de</strong><br />
probabilité f invariante (on ne suppose pas que h(·) = ν([0, ·])).Comme<br />
h : (T, f) → (T, R ρ ) est un facteur, on voit que h ∗ ν est R ρ invariante et<br />
comme ρ est irrationnel h ∗ ν = Leb (R ρ est uniquement ergodique)<br />
Si h est un homéomorphisme on a donc ν = (h −1 ) ∗ Leb et ν est unique.<br />
Sinon, notons K le minimal invariant <strong>de</strong> f et D l’union <strong>de</strong>s extrémités <strong>de</strong>s<br />
composantes connexes <strong>de</strong> son complémentaire. Remarquons que suppν = K,<br />
car sinon il existerait un intervalle errant dans le support <strong>de</strong> ν, ce qui est<br />
impossible. Mais pour tout borélien A ⊂ R on a ν(A) = ν(K ∩ A) car<br />
K = suppν et comme D est dénombrable et que ν est sans atome ν(A) =<br />
ν((K ∩ A) − D). Comme h((K ∩ A) − D) ⊂ [0, 1] − h(D) on a d’après le<br />
Lemme 4.1.3 h −1 (h((K ∩ A) − D) = (K ∩ A) − D et comme h ∗ ν = Leb<br />
ν(A) = ν((K ∩ A) − D) = Leb(h((K ∩ A) − D)).<br />
Cette <strong>de</strong>rnière quantité ne dépend pas <strong>de</strong> ν, donc ν est unique.<br />
✷<br />
4.2 Difféomorphismes <strong>du</strong> cercle<br />
Nous donnons dans cette section un critère qui permet <strong>de</strong> déterminer<br />
quand la semi-conjugaison obtenue dans le théorème <strong>de</strong> Poincaré est en fait<br />
une conjugaison et quelle est la régularité que l’on peut espérer pour cette<br />
conjugaison.<br />
4.2.1 Rappels sur les fractions continues<br />
Soit 0 < α < 1 un nombre irrationnel et définissons par récurrence <strong>de</strong>ux<br />
suites (a n ), (α n ) (n ≥ 0) où les a n ≥ 1 sont <strong>de</strong>s entiers et les α n sont dans<br />
]0, 1[ :<br />
α n+1 = {α −1<br />
n }, a n+1 = [α −1<br />
n ], α 0 = α (4.1)
52CHAPITRE 4. HOMÉOMORPHISMES ET DIFFÉOMORPHISMES DU CERCLE<br />
({·}, [·] sont respectivement la partie fractionnaire et la partie entière). On a<br />
ainsi la représentation<br />
α =<br />
1<br />
.<br />
1<br />
a 1 +<br />
1<br />
a 2 +<br />
1<br />
· · · +<br />
a n + α n<br />
Nous noterons p n /q n (p n ∧ q n = 1) le rationnel<br />
p n<br />
q n<br />
=<br />
1<br />
.<br />
1<br />
a 1 +<br />
1<br />
a 2 +<br />
· · · + 1 a n<br />
On dit que p n /q n est la n-ième ré<strong>du</strong>ite <strong>de</strong> α. Remarquons que si on effectue<br />
la procé<strong>du</strong>re précé<strong>de</strong>nte avec p n /q n à la place <strong>de</strong> α on obtient <strong>de</strong>s ˜α k pour<br />
1 ≤ k ≤ n avec ˜α n = 0 tels que<br />
˜α k+1 = {˜α −1<br />
k }, a k+1 = [˜α −1<br />
k ], α 0 = p n /q n (4.2)<br />
Il est commo<strong>de</strong> d’intro<strong>du</strong>ire également les suites β n où<br />
Multipliant l’égalité α −1<br />
n<br />
ce qu’on peut écrire<br />
β n = α n · · · α 0 , β −1 = 1.<br />
= a n+1 + α n+1 par β n on voit que<br />
β n−1 = a n+1 β n + β n+1<br />
(−1) n+1 β n+1 = a n+1 (−1) n β n + (−1) n−1 β n−1<br />
ou encore ( )<br />
(−1) n+1 β n+1<br />
(−1) n =<br />
β n<br />
On a donc<br />
( )<br />
(−1) n β n<br />
(−1) n−1 =<br />
β n−1<br />
( ) ( )<br />
an+1 1 (−1) n β n<br />
1 0 (−1) n−1 β n−1<br />
( ) ( ( )<br />
an 1 a1 1 α<br />
· · ·<br />
1 0 1 0)<br />
−1
4.2. DIFFÉOMORPHISMES DU CERCLE 53<br />
Si on pose ˜β k = ˜α k · · · ˜α 0 on aura ˜β n = 0 et<br />
(<br />
)<br />
0<br />
(−1) n−1 =<br />
˜βn−1<br />
Notons P k , Q k ∈ N<br />
( )<br />
Qn P n<br />
:=<br />
Q n−1 P n−1<br />
( )<br />
an 1<br />
· · ·<br />
1 0<br />
( )<br />
an 1<br />
· · ·<br />
1 0<br />
(<br />
a1 1<br />
1 0<br />
) ⎛ ⎞<br />
p n<br />
⎝<br />
q<br />
⎠<br />
n<br />
−1<br />
( )<br />
a1 1<br />
1 0<br />
( )<br />
Qn P<br />
On a Q n P n−1 − Q n−1 P n = <strong>de</strong>t<br />
n<br />
= (−1)<br />
Q n−1 P n si bien que P n ∧ Q n =<br />
n−1<br />
1. Par conséquent comme 0 = Q n p n /q n − P n on voit que P n /Q n = p n /q n<br />
mais comme P n ∧ Q n = p n ∧ q n cela implique P n = p n et Q n = q n . On a donc<br />
démontré<br />
Lemme 4.2.1 Les suites p n , q n sont définies par les relations <strong>de</strong> récurrence<br />
{<br />
p n = a n p n−1 + p n−1 , p 0 = 1, p −1 = 0<br />
q n = a n q n−1 + q n−2 q 0 = a 1 , q −1 = 0<br />
Remarque Il est facile <strong>de</strong> voir que pour tout n ≥ 1 on a q n+1 > q n et<br />
tout n ≥ 2, q n ≥ 2 n/2 .<br />
Lemme 4.2.2 Pour tout n ≥ 1 on a<br />
α = p n + α n p n−1<br />
q n + α n q n−1<br />
Démonstration.—<br />
On a<br />
α − p n<br />
q n<br />
=<br />
(−1) n<br />
(q n+1 + α n+1 q n )q n<br />
|α − p n<br />
| ≤ 1 < 1 .<br />
q n q n+1 q n qn<br />
2<br />
p n + α n p n−1<br />
q n + α n q n−1<br />
= a np n−1 + p n−2 + α n p n−1<br />
a n q n−1 + q n−2 + α n q n−1<br />
= α−1 n−1p n−1 + p n−2<br />
αn−1q n−1 + q n−2<br />
= p n−1 + α n−1 p n−2<br />
q n−1 + α n−1 q n−2
54CHAPITRE 4. HOMÉOMORPHISMES ET DIFFÉOMORPHISMES DU CERCLE<br />
ce qui démontre la première égalité.<br />
On a<br />
α − p n<br />
= p n + α n p n−1<br />
− p n<br />
q n q n + α n q n−1 q n<br />
= α n(p n−1 q n − q n−1 p n )<br />
q n (q n + α n q n−1 )<br />
(−1) n<br />
=<br />
q n (α −1<br />
n q n + q n−1 )<br />
En utilisant le fait que αn<br />
−1 = α n+1 + a n+1 et la relation <strong>de</strong> récurrence <strong>de</strong>s q n<br />
on obtient la <strong>de</strong>uxième égalité.<br />
Enfin l’inégalité est immédiate.<br />
4.2.2 Théorème <strong>de</strong> Denjoy<br />
L’objet <strong>de</strong> cette section est la démonstration <strong>du</strong> théorème <strong>de</strong> Denjoy.<br />
Théorème 4.2.1 Soit f un homéomorphisme <strong>du</strong> cercle préservant l’orientation<br />
<strong>de</strong> nombre <strong>de</strong> rotation irrationnel. Supposons que f soit dérivable et que<br />
log(Df) (où Df(·) = f ′ est la dérivée <strong>de</strong> f) soit à variation bornée 1 . Alors,<br />
il existe un homéomorphisme h ∈ Homeo + (T) qui conjugue f à R ρ (f).<br />
Démonstration.— D’après le théorème <strong>de</strong> Poincaré, il s’agit <strong>de</strong> démontrer<br />
qu’il n’existe pas d’intervalles errants pour f. Cela est garanti par le lemme<br />
suivant :<br />
Lemme 4.2.3 (Inégalité <strong>de</strong> Denjoy) Sous les hypothèses <strong>du</strong> Théorème <strong>de</strong><br />
Denjoy on a l’inégalité <strong>de</strong> Denjoy : pour tout q ∈ N tel qu’il existe p ∈ N<br />
vérifiant |α − (p/q)| < 1/q 2 (donc pour toute ré<strong>du</strong>ite) et tout x ∈ T<br />
où V = V ar(log(Df)).<br />
e −V ≤ Df q (x) ≤ e V ,<br />
✷<br />
Démonstration.—<br />
Koksma :<br />
La preuve <strong>de</strong> ce lemme repose sur l’inégalité <strong>de</strong> Denjoy-<br />
1 Une fonction φ : [a, b] → R est à variation bornée s’il existe une constante C telle que<br />
pour tous a = x 0 < x 1 < · · · < x n < x n+1 = b on a ∑ n<br />
k=0 |φ(x k+1) − φ(x k )| ≤ C. On note<br />
alors V ar(φ) la plus petite constante C possible. Une fonction φ dont la dérivée est L 1 est<br />
automatiquement à variation bornée et V ar(φ) ≤ ‖φ ′ ‖ L 1
4.2. DIFFÉOMORPHISMES DU CERCLE 55<br />
Lemme 4.2.4 (Denjoy-Koksma) Soit f un homéomorhisme <strong>du</strong> cercle préservant<br />
l’orientation et µ une mesure <strong>de</strong> probabilité telle que F ∗ µ = µ. Alors<br />
pour toute fonction φ ∈ C 0 (T) à variation bornée, tout x ∈ T et tout q ∈ N<br />
tel qu’il existe p ∈ N vérifiant |α − (p/q)| < 1/q 2 on a<br />
q−1<br />
∑<br />
∫<br />
∣ φ(f i (x)) − q φdµ<br />
∣ ≤ V ar(φ).<br />
T<br />
i=0<br />
Démonstration.— Considérons x = 0, i<strong>de</strong>ntifions T avec [0, 1]/ ∼ et définissons<br />
q intervalles I k (x) = [x k , x k+1 [ (0 ≤ k ≤ q − 1) où 0 = x 0 < x 1 < . . . <<br />
x q−1 < x q = 1 sont définis par µ([x k , x k+1 ]) = (1/q) (on découpe donc le cercle<br />
en q parties d’égales µ-mesure). Supposons que (p/q) − (1/q 2 ) < ρ < p/q (sinon<br />
on considère f −1 ) ; on a pour tout 0 ≤ i ≤ q − 1<br />
ip<br />
q < iρ < ip q + 1 q .<br />
Notons que comme p et q sont premiers entre eux, p est inversible mo<strong>du</strong>lo<br />
q et l’ensemble {ip mod q, 0 ≤ i ≤ q − 1} a q éléments et est en bijection<br />
avec {k mod q, 0 ≤ k ≤ q − 1}. Nous noterons i ↦→ i(k) cette bijection et<br />
k ↦→ k(i) la bijection réciproque. Par conséquent, il y a un et un seul point<br />
<strong>de</strong> iρ mod Z (0 ≤ i ≤ q − 1) dans chaque intervalle I k ; nous noterons I k(i)<br />
l’intervalle contenant iρ mod Z. On a<br />
q−1<br />
∑<br />
∫<br />
∣ ∣∣∣<br />
q−1<br />
∣ φ(f i (x)) − q φ(t)dµ(t)<br />
∣ = ∑<br />
i=0<br />
T<br />
i=0<br />
q−1<br />
∑<br />
= q<br />
∣<br />
i=0<br />
q−1<br />
∑<br />
= q<br />
∣<br />
k=0<br />
q−1<br />
∫<br />
φ(f k(i) (x)) − q<br />
T<br />
φ(t)dµ(t)<br />
∣<br />
∫I k(i)<br />
(<br />
φ(f k(i) (x)) − φ(t)<br />
(<br />
)<br />
φ(f<br />
∫I i(k) (x)) − φ(t)<br />
k<br />
∣ ∑ ∣∣∣ ≤ max φ(f i(k) (x)) − φ(t)<br />
t∈I k<br />
∣<br />
k=0<br />
≤ V ar(φ).<br />
)<br />
dµ(t)<br />
∣<br />
dµ(t)<br />
∣<br />
Nous pouvons démontrer l’inégalité <strong>de</strong> Denjoy : appliquons l’inégalité <strong>de</strong><br />
Denjoy-Koksma à φ = log Df et observons que d’après la formule donnant<br />
✷
56CHAPITRE 4. HOMÉOMORPHISMES ET DIFFÉOMORPHISMES DU CERCLE<br />
la dérivée d’une composition on a<br />
q−1<br />
∑<br />
log Df q (x) = (log Df)(f k (x)).<br />
k=0<br />
On a donc<br />
∫<br />
∣ log Df q (x) − q<br />
T<br />
log(Df(t))dµ(t)<br />
∣ ≤ V ar(log(Df)).<br />
Si on avait ∫ log(Df(t))dµ(t) > 0 par exemple, alors log Df q (x) convergerait<br />
uniformément vers ∞ tout comme Df q (x). Mais comme ∫ 1<br />
|Df q (t)|dt<br />
T<br />
0<br />
est égal à 1 (c’est la longueur <strong>de</strong> l’image <strong>du</strong> cercle par f q ) on obtient une<br />
contradiction. De même ∫ log(Df(t))dµ(t) ne peut être négative : elle est<br />
T<br />
donc nulle et l’inégalité <strong>de</strong> Denjoy est alors claire.<br />
Démontrons enfin le théorème <strong>de</strong> Denjoy. On sait qu’il existe un homéomorphisme<br />
h qui semi-conjugue f et R ρ et que h est un homéomorphisme si<br />
et seulement si f n’admet pas d’intervalles errants. Supposons que I soit<br />
un intervalle errant. Alors, on a lim n→∞ |f qn (I)| = 0 (|J| est la longueur <strong>de</strong><br />
l’intervalle J). Mais d’après le théorème <strong>de</strong>s valeurs intermédiaires il existe<br />
z n ∈ I tel que<br />
|f qn (I)|<br />
= Df qn (z n ).<br />
|I|<br />
On doit donc avoir lim n→∞ Df qn (z n ) = 0 ce qui contredit l’inégalité <strong>de</strong> Denjoy.<br />
La semi-conjugaison h est donc un homéomorphisme.<br />
4.2.3 Contre-exemples <strong>de</strong> Denjoy<br />
Le théorème <strong>de</strong> Denjoy est en général faux si f est seulement C 1 :<br />
Théorème 4.2.2 Si α est un nombre irrationnel, il existe un difféomorphisme<br />
C 1 <strong>de</strong> T qui préserve l’orientation et qui admet un minimal invariant<br />
différent <strong>de</strong> T (f n’est donc pas topologiquement conjugué à R α ou à une<br />
rotation en général).<br />
Nous ne donnerons pas la preuve <strong>de</strong> ce résultat. Disons seulement que l’idée<br />
<strong>de</strong> la preuve est d’"ouvrir" le cercle (en rajoutant <strong>de</strong>s intervalles <strong>de</strong> longueurs<br />
variables) aux points R k α(0).<br />
✷<br />
✷
4.2. DIFFÉOMORPHISMES DU CERCLE 57<br />
4.2.4 Le Théorème d’Herman-Yoccoz<br />
Il est naturel <strong>de</strong> se <strong>de</strong>man<strong>de</strong>r si l’on ne peut pas obtenir dans le théorème<br />
<strong>de</strong> Denjoy une conjugaison plus régulière quitte à supposer f régulière (par<br />
exemple C ∞ ). C’est en général faux si l’on ne fait pas d’hypothèse sur le<br />
nombre <strong>de</strong> rotation <strong>de</strong> f.<br />
Définition 4.2.1 On dit que α est diophantien d’exposant σ ≥ 0 et <strong>de</strong><br />
constante γ (on note α ∈ CD(γ, σ)) si pour tous entiers (p, q) ∈ Z×(Z−{0})<br />
on a<br />
|α − p q | ≥ γ<br />
q 2+σ .<br />
Remarques 1) Il n’existe pas <strong>de</strong> nombre diophantien d’exposant σ < 0<br />
(pourquoi ).<br />
2) Il n’est pas difficile <strong>de</strong> démontrer que si σ > 0 et si on choisit γ suffisamment<br />
petit l’ensemble CD(γ, σ) est <strong>de</strong> mesure <strong>de</strong> Lebesgue positive.<br />
3) Si on définit CD(σ) = ⋃ γ>0<br />
CD(γ, σ) l’ensemble <strong>de</strong>s nombres diophantiens<br />
d’exposant σ > 0, alors cet ensemble est <strong>de</strong> mesure <strong>de</strong> Lebesgue totale.<br />
4) Si α ∈ CD(σ) avec σ = 0 on dit que α est <strong>de</strong> type constant. Il est<br />
équivalent <strong>de</strong> dire que les a i qui interviennent dans le développement en<br />
fractions continues <strong>de</strong> α sont bornés.<br />
5) Un nombre est diophantien (dans l’union <strong>de</strong>s CD(σ), σ ≥ 0) si et seulement<br />
si il existe une constante A > 0 telle que q i+1 ≤ q A i pour tout i.<br />
Théorème 4.2.3 Si f est un difféomorphisme <strong>de</strong> T préservant l’orientation,<br />
<strong>de</strong> classe C ∞ et tel que ρ(f) est diophantien, alors il existe un difféomorphisme<br />
<strong>de</strong> classe C ∞ qui conjugue f à R ρ(f) .<br />
Remarques 1) On peut en fait relier la régularité minimale <strong>de</strong> f requise pour<br />
que le théorème fournisse un conjugaison <strong>de</strong> classe au moins C 0 à l’exposant<br />
σ <strong>de</strong> ρ(f).<br />
2) Si α n’est pas diophantien, il existe <strong>de</strong>s difféomorphismes f <strong>de</strong> classe C ∞<br />
tels que ρ(f) = α qui ne sont pas linérisables (conjugués à <strong>de</strong>s rotations).<br />
4.2.5 Théorème d’Arnold
58CHAPITRE 4. HOMÉOMORPHISMES ET DIFFÉOMORPHISMES DU CERCLE
Chapitre 5<br />
Hyperbolicité<br />
5.1 Point fixe hyperbolique d’un difféomorphisme<br />
Soit (E, ‖ · ‖) un espace <strong>de</strong> Banach et A : E → E un opérateur linéaire<br />
continu et inversible (son inverse est donc continu). On dit que A est hyperbolique<br />
s’il existe une décomposition E s ⊕ E u et <strong>de</strong>s constantes positives<br />
C, ρ s , ρ u telles que pour tout v s ∈ E s (resp. v u ∈ E u ) et tout n ∈ N on a<br />
‖A n v s ‖ ≤ Ce −ρsn ‖v‖ (resp ; ‖A −n v u ‖ ≤ e −nρu ‖v‖ u .<br />
Quand E = R n est <strong>de</strong> dimension finie et A ∈ GL n (R), on peut démontrer<br />
que A est hyperbolique si et seulement si le σ(A), spectre <strong>de</strong> A (l’ensemble <strong>de</strong><br />
ses valeurs propres) a une intersection vi<strong>de</strong> avec le cercle unité {z ∈ C, |z| =<br />
1}. Dans ce cas,<br />
E s =<br />
⊕<br />
λ∈σ(A):|λ|1<br />
et on peut choisir ρ s < min λ∈σ(A):|λ|1 (log |λ|).<br />
C’est une conséquence <strong>du</strong> théorème <strong>de</strong> décomposition <strong>de</strong> Jordan (cf. Annexe<br />
B) Comme les valeurs propres d’une matrice dépen<strong>de</strong>nt <strong>de</strong> façon continue <strong>de</strong><br />
cette matrice on dé<strong>du</strong>it facilement le résultat suivant.<br />
Proposition 5.1.1 L’ensemble <strong>de</strong>s A ∈ GL(n, R) qui sont hyperboliques est<br />
un ouvert (le même résultat est vrai dans les Banach)<br />
Si A est hyperbolique, on dit qu’une norme est adaptée à A si pour tout<br />
v s ∈ E s (resp. v u ∈ E u ) on a ‖Av s ‖ ≤ e −ρs ‖v‖ (resp ; ‖A −1 v u ‖ ≤ e −ρu ‖v‖ u .<br />
Lemme 5.1.1 Si A est hyperbolique, il existe une norme A-adaptée (quitte<br />
à diminuer les valeurs <strong>de</strong> ρ s , ρ u ).<br />
59<br />
Γ λ ,
60 CHAPITRE 5. HYPERBOLICITÉ<br />
Démonstration.— Il suffit d’en construire une sur E s (et une sur E u ). Il<br />
suffit pour cela <strong>de</strong> définir pour v ∈ E s et ρ ′ s < ρ s<br />
‖v‖ ∗ =<br />
∞∑<br />
e ρ′k ‖A k v‖.<br />
k=0<br />
Cette somme converge <strong>du</strong> fait <strong>de</strong> la décroissance exponentielle <strong>de</strong>s termes <strong>de</strong><br />
la série. En outre,<br />
‖Av‖ ∗ =<br />
∞∑<br />
e ρ′k ‖A k+1 v‖ (5.1)<br />
k=0<br />
≤ e −ρ′<br />
∞<br />
∑<br />
l=1<br />
e ρ′l ‖A l v‖ (5.2)<br />
≤ e −ρ′ ‖v‖ ∗ (5.3)<br />
On procè<strong>de</strong> <strong>de</strong> la même manière pour définir ‖ · ‖ ∗ sur E u mais en itérant<br />
dans le passé.<br />
Définition 5.1.1 Soit f un difféomorphisme local <strong>de</strong> (R n , x 0 ) (on peut également<br />
travailler dans <strong>de</strong>s Banach). On dit que x 0 est un point fixe hyperbolique<br />
<strong>de</strong> f si f(x 0 ) = x 0 et si Df(x 0 ) est hyperbolique.<br />
Lemme 5.1.2 Soit A ∈ Gl(n, R) et ε > 0. Alors il existe une constante<br />
δ > 0 pour laquelle ce qui suit est vrai : si F : R n → R n est une application<br />
<strong>de</strong> classe C 1 telle que<br />
‖F ‖ 1 := sup<br />
x∈R n max(‖F (x)‖, ‖DF (x)‖) < δ,<br />
alors, l’application f = A + F est un difféomorphisme <strong>de</strong> R n et (A + F ) −1<br />
est <strong>de</strong> la forme A −1 + G où G : R n → R n est ε-lipschitizienne : pour tous<br />
x 1 , x 2 ∈ R n ‖G(x 1 ) − G(x 2 )‖ ≤ ε‖x 1 − x 2 ‖.<br />
Démonstration.— L’équation y = Ax+F (x) est équivalente à x = K y (x) :=<br />
A −1 y − A −1 F (x). ainsi, y étant donné, x est point fixe <strong>de</strong> K y . Or cette application<br />
K y : R n → R n est clairement k-contractante avec k = ‖F ‖ 1 ‖A −1 ‖ −1<br />
(pourvu que la constante <strong>de</strong> Lipschitz <strong>de</strong> F soit plus petite que ‖A −1 ‖ −1 ) et<br />
admet donc un unique point fixe x y . Comme la constante k est indépendante<br />
<strong>de</strong> y et que K y est continue par rapport à y, le point fixe x y dépend continûment<br />
<strong>de</strong> y. On a ainsi x = y + G(y) avec G continue. Montrons que G<br />
✷
5.1. POINT FIXE HYPERBOLIQUE D’UN DIFFÉOMORPHISME 61<br />
est Lipschitz. Pour y 1 , y 2 on a ‖x 1 − x 2 ‖ ≤ ‖A −1 (y 1 − y 2 )‖ + ‖F ‖ 1 ‖x 1 − x 2 ‖<br />
c’est-à-dire ‖x 1 − x 2 ‖ ≤ (‖A −1 ‖/(1 − ‖F ‖ 1 )‖y 1 − y 2 ‖.<br />
Théorème 5.1.1 (Hartman-Grobman) Si A est linéaire et hyperbolique<br />
alors il existe ε > 0 tel que pour toute application F : R n → R n <strong>de</strong> classe C 1<br />
et telle que ‖F ‖ 1 ≤ ε il existe un homéomorphisme h : R n → R n <strong>de</strong> la forme<br />
h(x) = x + H(x) avec ‖H‖ 0 < ∞ tel que<br />
A + F = h ◦ A ◦ h −1 .<br />
En outre, un tel h est unique si on le cherche sous la forme id + K avec<br />
‖K‖ 0 < ∞.<br />
La preuve <strong>de</strong> ce théorème passe par la preuve <strong>de</strong> la proposition plus<br />
générale suivante<br />
Lemme 5.1.3 Si A est linéaire et hyperbolique alors il existe ε > 0 tel que<br />
pour toutes applications F 1 , F 2 : R n → R n <strong>de</strong> classe C 1 et telle que ‖F i ‖ 1 ≤ ε<br />
(i = 1, 2) il existe un homéomorphisme h : R n → R n <strong>de</strong> la forme h(x) =<br />
x + H(x) avec ‖H‖ 0 < ∞ tel que<br />
A + F 2 = h ◦ (A + F 1 ) ◦ h −1 .<br />
En outre, un tel h est unique si on le cherche sous la forme id + K avec<br />
‖K‖ 0 < ∞.<br />
Démonstration.— On peut supposer que la norme <strong>de</strong> notre espace <strong>de</strong> Banach<br />
est A-adaptée. Si G : R n → R n on note G s , G u ses projections sur E s<br />
parallèlement à E u et sur E s parallèlement à E s . L’équation <strong>de</strong> conjugaison<br />
que nous voulons résoudre est équivalente à<br />
et en projetant sur E s , E u<br />
(A + F 2 ) ◦ (I + H) = (I + H) ◦ (A + F 1 ) (5.4)<br />
AH + F 2 ◦ (I + H) = F 1 + H ◦ (A + F 1 )<br />
A s H s + F 2,s ◦ (I + H) = F 1,s + H s ◦ (A + F 1 )<br />
A u H u + F 2,u ◦ (I + H) = F 1,u + H u ◦ (A + F 1 ).<br />
Puisque d’après le lemme 5.1.2 A + F 1 est inversible si la norme C 1 <strong>de</strong> F 1 est<br />
suffisamment petite, on peut récrire ce système sous la forme<br />
H s = A s H s ◦ (A + F 1 ) −1 + F 2,s ◦ (I + H) ◦ (A + F 1 ) −1 − F 1,s ◦ (A + F 1 ) −1<br />
(<br />
)<br />
H u = A −1<br />
u F 1,u + H u ◦ (A + F 1 ) − F 2,u ◦ (I + H)<br />
✷
62 CHAPITRE 5. HYPERBOLICITÉ<br />
Intro<strong>du</strong>isons alors l’espace <strong>de</strong> Banach (E, ‖ · ‖) <strong>de</strong>s paires (H s , H u ) avec<br />
H s , H u ∈ C 0 (R n , R n ) telles que ‖(H s , H u )‖ := max(‖H s ‖ C 0 (R n ), ‖H u ‖ C 0 (R n ))<br />
soit fini et l’application Φ : E → E définie par Φ(H s , H u ) = ( ˜H s , ˜H u ) où<br />
˜H s = A s H s ◦ (A + F 1 ) −1 + F 2,s ◦ (I + H) ◦ (A + F 1 ) −1 − F 1,s ◦ (A + F 1 ) −1<br />
(<br />
)<br />
˜H u = A −1<br />
u F 1,u + H u ◦ (A + F 1 ) − F 2,u ◦ (I + H) .<br />
Utilisant le fait que F 2,u est ‖F 2 ‖-lipschitzienne, on voit que l’application Φ<br />
est k-contractante avec<br />
k = min(ρ s + ‖F 2 ‖ 1 , ρ u (1 + ‖F 2 ‖ 1 ))<br />
On a bien 0 ≤ k < 1 si ‖F ‖ 2 est suffisamment petite. Par conséquent l’équation<br />
(5.4) a une unique solution <strong>de</strong> la forme I + H où H est <strong>de</strong> norme C 0 -<br />
bornée sur R n . Il n’est en revanche pas clair a priori que I + H est inversible.<br />
Ceci découle <strong>de</strong> la remarque suivante : Intervertissons les rôles <strong>de</strong> F 1 et F 2 :<br />
on obtient ˜H tel que<br />
(A + F 1 ) ◦ (I + ˜H) = (I + ˜H) ◦ (A + F 2 )<br />
et tenant compte <strong>de</strong> (5.4) on obtient<br />
(I + ˜H) ◦ (I + H) ◦ (A + F 1 ) = (A + F 1 ) ◦ (I + ˜H) ◦ (I + H). (5.5)<br />
L’application (I + ˜H) ◦ (I + H) est <strong>de</strong> la forme I + Ĥ où Ĥ est C0 -bornée sur<br />
R n et est <strong>de</strong> ce fait l’unique solution <strong>de</strong> (5.5). Mais I est également solution<br />
<strong>de</strong> cette équation : par conséquent (I + ˜H) ◦ (I + H) = I, ce qui démontre<br />
que I + H est un homéomorphisme.<br />
Le théorème précé<strong>de</strong>nt admet une version locale :<br />
Théorème 5.1.2 Si f : (R n , 0) est un difféomorphisme local <strong>de</strong> classe C 1<br />
tel que A = Df(0) est hyperbolique, alors il existe un homéomorphisme local<br />
h : (R n , 0) tel que sur un voisinage <strong>de</strong> 0<br />
f = h ◦ Df(0) ◦ h −1 .<br />
Démonstration.— L’idée <strong>de</strong> la preuve est <strong>de</strong> trouver une extension ˜f <strong>de</strong> f<br />
à R n tout entier qui reste un difféomorphisme C 1 <strong>de</strong> R n sur R n . Supposons<br />
que f soit défini sur une boule <strong>de</strong> centre 0 et <strong>de</strong> rayon 3δ. On conjugue tout<br />
✷
5.2. STABILITÉ STRUCTURELLE DES AUTOMORPHISMES DU TORE63<br />
d’abord f par une dilatation M δ : x ↦→ δx pour obtenir f δ = M −1<br />
δ<br />
◦ f ◦ M δ ;<br />
on a ainsi pour tout x dans la boule B(0, 3) <strong>de</strong> centre 0 et <strong>de</strong> rayon 3<br />
f δ (x) = 1 δ f(δx),<br />
Df δ(x) = Df(x).<br />
D’après le théorème <strong>de</strong>s accroissements finis<br />
|f δ (x) − Df(0)x| ≤ 3ε(δ)<br />
où ε(δ) = max x∈B(0,3δ) |Df(x) − Df(0)| tend vers 0 avec δ (f est C 1 ). Soit<br />
alors η une fonction <strong>de</strong> classe C ∞ qui vaut 0 sur B(0, 1) et 1 en <strong>de</strong>hors <strong>de</strong><br />
B(0, 2) et posons<br />
˜f δ (x) = Df(0)x + η(x)(f δ (x) − Df(0)x).<br />
Il est clair que sur la boule B(0, 1) on a ˜f δ (x) = f / d(x) et en <strong>de</strong>hors <strong>de</strong> la boule<br />
B(0, 2) ˜f δ (x) = Df(0)x. En outre, comme D ˜f δ (x) = Df(0) + Dη(x)(f δ (x) −<br />
Df(0)x)+η(x)(Df δ (x)−Df(0)) on voit que ‖ ˜f δ −Df(0)x‖ C 1 (R n ) ≤ 3ε(δ)‖η‖ C 1.<br />
Par conséquent, dès que δ est suffisamment petit, le théorème <strong>de</strong> Hartman-<br />
Grobman global s’applique à ˜f δ et il existe une conjugaison ˜h telle que<br />
˜f δ = ˜h ◦ Df(0) ◦ ˜h −1 . Cette relation est vraie sur B(0, 1) et on a donc<br />
f = h ◦ Df(0) ◦ h −1 où h = M δ ◦ ˜h ◦ M −1<br />
δ<br />
.<br />
5.2 Stabilité structurelle <strong>de</strong>s automorphismes<br />
<strong>du</strong> tore<br />
Nous appliquons les résultats <strong>de</strong> la section précé<strong>de</strong>nte à un exemple <strong>de</strong><br />
stabilité structurelle. Soit A ∈( SL(d, ) Z) telle que Spec(A) ∩ {|z| = 1} = ∅<br />
2 1<br />
(par exemple la matrice A = ). La matrice A est donc hyperbolique.<br />
1 1<br />
On a vu que A définissait un difféomorphisme T A <strong>de</strong> T d qui préserve la<br />
mesure <strong>de</strong> Haar sur T d . En outre, il est facile <strong>de</strong> voir par l’analyse <strong>de</strong> Fourier<br />
que (T A , Haar) est ergodique. Considérons à présent une perturbation f, C 1 -<br />
proche <strong>de</strong> T A (‖f − A‖ C 1 est petite). Le théorème que nous allons démontrer<br />
établit que f est C 0 -conjuguée à A.<br />
5.2.1 Forme <strong>de</strong>s homéomorphismes <strong>du</strong> tore<br />
Proposition 5.2.1 Soit f un homéomorphisme <strong>de</strong> T d . Alors, il existe une<br />
matrice A ∈ GL(d, Z) et une application φ : R d /Z d → R d continue elles que<br />
✷
64 CHAPITRE 5. HYPERBOLICITÉ<br />
F : R d → R d , F (x) = Ax + φ(x) est un relèvement <strong>de</strong> f (π ◦ F = f ◦ π où<br />
π : R d → T d est la projection canonique).<br />
Démonstration.— Soit F un relèvement continue <strong>de</strong> f. Pour tout entier<br />
k ∈ Z d , F (· + k) − F (·) prend <strong>de</strong>s valeurs entières et il existe donc l(k) ∈ Z d<br />
tel que F (·+k)−F (·) = l F (k). Il es facile <strong>de</strong> voir que l F (k+k ′ ) = l F (k)+l F (k ′ )<br />
pour tous k, k ′ ∈ Z d . En outre, si on note G un relevé <strong>de</strong> f −1 tel que G = F −1 ,<br />
il est facile <strong>de</strong> voir que l F ◦ l G = id. Par conséquent (Exercice) il existe une<br />
matrice A ∈ GL(d, /Z) telle que l F (k) = Ak pour tout k ∈ Z d . L’application<br />
F − l F est clairement Z d -périodique.<br />
Remarque La matrice A est l’action f ∗ <strong>de</strong> f sur H 1 (T d , Z).<br />
5.2.2 Conjugaison topologique<br />
Théorème 5.2.1 Si f est un difféomorphisme <strong>du</strong> tore T d <strong>de</strong> classe C 1 <strong>de</strong><br />
la forme f = A + φ où A ∈ GL(d, Z) est hyperbolique et ‖φ‖ C 1 (T d ) est<br />
suffisamment petite, alors il existe un homéomorphisme h <strong>de</strong> T d tel que<br />
f = h ◦ T A ◦ h −1 .<br />
Démonstration.— Soit F (x) = Ax + φ(x) un relèvement <strong>de</strong> f avec ϕ ∈<br />
C 1 (R d /Z d , R d ). On sait d’après la forme global <strong>du</strong> théorème d’Hartman-<br />
Grobman qu’il existe une application θ : R d → R d continue bornée, telle<br />
que H := id + θ soit un homéomorphisme <strong>de</strong> R d et telle que<br />
F = A + φ = (I + θ) −1 ◦ A ◦ (I + θ).<br />
Démontrons que θ est Z d -périodique. Comme φ est Z d -périodique, on voit<br />
que pour tout point x ∈ R d , tout k ∈ Z d et tout n ∈ Z<br />
F n (x + k) = F n (x) + A n k.<br />
Comme H(x) = x + θ(x) avec θ bornée par une constante disons M on a<br />
(<br />
)<br />
max ‖H(F n (x + k)) − F n (x + k)‖, ‖H(F n (x)) − F n (x)‖ ≤ M<br />
et d’après la relation <strong>de</strong> conjugaison<br />
(<br />
)<br />
max ‖A n (H(x + k)) − F n (x + k)‖, ‖A n (H(x)) − F n (x)‖ ≤ M<br />
ce qui entraîne<br />
‖A n (H(x + k) − H(x)) − (F n (x + k) − F n (x))‖ ≤ 2M<br />
✷
5.3. VARIÉTÉS STABLES ET INSTABLES 65<br />
c’est-à-dire<br />
‖A n (H(x + k) − H(x)) − A n k)‖ ≤ 2M.<br />
Par conséquent, pour tout n ∈ Z la suite A n (H(x+k)−H(x)−k) est bornée.<br />
Comme A est hyperbolique cela implique que<br />
H(x + k) = H(x) + k;<br />
comme cela est vrai pour tout k ∈ Z d , θ est bien Z d périodique et H passe<br />
au quotient par Z d : si on pose h = H ◦ π on a bien h ◦ f = T A ◦ h, et il est<br />
facile <strong>de</strong> voir que h est inversible (H l’est).<br />
✷<br />
5.3 Variétés stables et instables<br />
Nous supposerons dans la suite que A ∈ GL(n, R) est une matrice hyperbolique<br />
et nous noterons E s et E u ses espaces stables et instables et ρ s et ρ u<br />
<strong>de</strong>s exposants associés.<br />
Théorème 5.3.1 Soient A : R n une matrice hyperbolique et k ≥ 1. Il<br />
existe ε tel que pour toute application F : R n → R n <strong>de</strong> classe C k telle que<br />
‖F ‖ C k (R n ) ≤ ε, F (0) = 0, DF (0) = 0, l’ensemble W s <strong>de</strong>s points <strong>de</strong> R n tels<br />
que lim n→∞ d(f n (x), 0) = 0 (où f = A + F ) est le graphe d’une fonction<br />
S : E s → E u <strong>de</strong> classe C k telle que S(0) = 0 et DS(0)|E s = 0, c’est-à-dire<br />
que W s coïnci<strong>de</strong> avec {x s + S(x s ) : x s }. En outre, pour tout x ∈ W s on a<br />
pour tout 0 ≤ α < ρ<br />
d(f n (x), 0) ≤ C x e −nα .<br />
Démonstration.— On peut supposer que la norme <strong>de</strong> R n avec laquelle<br />
on travaille est A-adaptée. Intro<strong>du</strong>isons l’espace E <strong>de</strong>s couples <strong>de</strong> suites<br />
((s n ) n≥1 , (u n ) n≥0 )) où pour tout n ≥ 1, s n ∈ E s et tout n ≥ 0, u n ∈ E u .<br />
Posons pour α > 0,<br />
‖(s, u)‖ α = max(sup<br />
n≥1<br />
e nα |s n |, sup e nα |u n |),<br />
n≥0<br />
et notons E α l’ensemble <strong>de</strong>s (s, u) ∈ E tels que ‖(s, v)‖ α < ∞. Muni <strong>de</strong> ‖ · ‖ α<br />
c’est un espace <strong>de</strong> Banach. Notons Φ l’application Φ : E s × E α → E α qui à<br />
(t, (s, u)) associe la (˜s, ũ) définie par les relations suivantes : pour tout n ≥ 1<br />
˜s n+1 = A s s n + F s (s n , u n )<br />
u n+1 = A u ũ n + F u (s n , u n )
66 CHAPITRE 5. HYPERBOLICITÉ<br />
et<br />
˜s 1 = A s t + F s (t, u 0 )<br />
u 1 = A u ũ 0 + F u (t, u 0 )<br />
On a donc,<br />
˜s n = A s s n−1 + F s (s n−1 , u n−1 ) ˜s 1 = A s t + F s (t, u 0 )<br />
ũ n = A −1<br />
u (u n+1 − F u (s n , u n )) ũ 0 = A −1<br />
u (u 1 − F u (t, u 0 ))<br />
Remarquons que si Φ(t, (s, u)) = (s, u), cela signifie que pour tout n ≥ 1,<br />
(s n , u n ) = f n (t, u 0 ) et que (s n , u n ) est dans E α .<br />
Exercice Montrer que pour t fixé Φ(t, ·) est κ-contractante où κ := max(e α (ρ+<br />
‖DF ‖), ρ(e −α + ‖DF ‖)) < 1<br />
Exercice Montrer que Φ est C k et que la dérivée D 2 Φ(t, (u, v)) · (∆u, ∆v) =<br />
(∆ũ, ∆ṽ) où<br />
∆˜s n = A s ∆s n−1 + DF s (s n−1 , u n−1 ) · (∆s n−1 , ∆u n−1 )<br />
∆ũ n = A −1<br />
u (∆u n+1 − DF u (s n−1 , u n−1 ) · (∆s n , ∆u n ))<br />
∆˜s 1 = DF s (t, u 0 ) · (0, ∆u 0 )<br />
∆ũ 0 = A −1<br />
u (∆u 1 − DF u (t, u 0 ) · (0, ∆u 0 ))<br />
On a donc ‖D 2 Φ‖ ≤ max(e α (κ + ‖DF ‖), κ(e −α + ‖DF ‖)) < 1. Le théorème<br />
<strong>du</strong> point fixe à dépendance C k s’applique et permet <strong>de</strong> conclure la<br />
preuve <strong>du</strong> théorème.<br />
Comme corollaire <strong>du</strong> théorème précé<strong>de</strong>nt on obtient :<br />
Théorème 5.3.2 Si f : (R n , 0) est une application <strong>de</strong> classe C k telle que<br />
(f(0) = 0) Df(0) est hyperbolique, alors il existe <strong>de</strong>s voisinages <strong>de</strong> 0, V ⊂<br />
R n , V s ⊂ E s et V u ⊂ E u et <strong>de</strong>s applications S s : V s → E u , S u : V u → E s ,<br />
telles que S s,u (0) = 0 et DS s,u (0) = 0 et<br />
{(x s , x u ) ∈ V, lim<br />
n→∞<br />
f n (x) = 0} = {(x s , S s (x s ), x s ∈ V s }<br />
{(x s , x u ) ∈ V, lim<br />
n→−∞ f n (x) = 0} = {(S u (x u ), x u ), x u ∈ V u }.<br />
En outre, pour tout α < ρ, et tout x ∈ W s<br />
loc (resp. x ∈ W u<br />
loc ), ‖f n (x)‖ ≤<br />
C x e −nα pour tout n ≥ 0 (resp. n ≤ 0).<br />
✷
5.3. VARIÉTÉS STABLES ET INSTABLES 67<br />
Remarque : Si on considère <strong>de</strong>s perturbations f λ <strong>de</strong> classe C k <strong>du</strong> difféomorphisme<br />
précé<strong>de</strong>nt telles qu’en topologie C k , λ ↦→ f λ soit continue, alors,<br />
il existe au voisinage <strong>de</strong> 0 un unique point fixe x λ hyperbolique pour f λ et<br />
les variétés stable et instable associées à x λ dépen<strong>de</strong>nt continûment <strong>de</strong> λ en<br />
topologie C k . (Exercice : Le démontrer ; on pourra démontrer une version<br />
à <strong>de</strong>ux paramètres <strong>du</strong> théorème <strong>du</strong> point fixe).
68 CHAPITRE 5. HYPERBOLICITÉ
Chapitre 6<br />
Théorie spectrale<br />
Dans ce qui suit (X, B, µ, T ) est un système dynamique mesurable, X<br />
étant un espace <strong>de</strong> Lebesgue. L’idée <strong>de</strong> la théorie specrale est d’étudier ce système<br />
dynamique via les propriétés spectrales <strong>de</strong> l’isométrie U T : L 2 (X, µ) →<br />
L 2 (X, µ), φ ↦→ φ ◦ T . Nous supposerons dans la suite que T est inversible<br />
(T −1 étant B mesurable) <strong>de</strong> façon que U T est en fait un opérateur unitaire<br />
UT<br />
∗ = U −1<br />
T<br />
. On peut reformuler les notions d’ergodicité, <strong>de</strong> mélange ou <strong>de</strong><br />
mélange faible au moyen <strong>de</strong> U T . Si on note P la projection orthogonale <strong>de</strong><br />
L 2 (X, µ) sur ker(U T − Id) = L 2 (I, µ) (I étant la tribu <strong>de</strong>s invariants <strong>de</strong> T ) :<br />
i) (X, B, µ, T ) est ergodique si et seulement si, la tribu <strong>de</strong>s invariants I égale la<br />
tribu triviale {∅, X} ; d’après le théorème <strong>de</strong> Von Neumann ceci est équivalent<br />
au fait que pour tout φ ∈ L 2 (X, µ)<br />
1 ∑n−1<br />
lim UT k φ = P φ = 〈φ, 1〉1<br />
n→∞ n<br />
k=0<br />
au sens L 2 , où P est la projection orthogonale sur l’espace <strong>de</strong>s fonctions<br />
constantes. En fait, (X, B, µ, T ) est ergodique si et seulement si pour tout<br />
φ ∈ L 2 (X, µ), S n φ/n converge faiblement vers P φ : pour tout ψ ∈ L 2 (X, µ)<br />
1 ∑n−1<br />
lim 〈UT k φ, ψ〉 = 〈P φ, ψ〉.<br />
n→∞ n<br />
k=0<br />
ii) (X, B, µ, T ) est mélangeant si pour tous φ, ψ ∈ L 2 (X, µ)<br />
lim 〈U T n φ, ψ〉 = 〈φ, 1〉〈ψ, 1〉 = 〈P φ, ψ〉,<br />
n→∞<br />
(c’est-à-dire UT n φ converge faiblement vers P φ.<br />
69
70 CHAPITRE 6. THÉORIE SPECTRALE<br />
6.1 Le théorème spectral<br />
Le théorème fondamental est le suivant :<br />
Théorème 6.1.1 (Théorème spectral) Si H est un espace <strong>de</strong> Hilbert (séparable)<br />
et U : H → H un opérateur unitaire (U∗ = U −1 ) alors il existe<br />
a) r ∈ N ∪ {∞} et <strong>de</strong>s mesuresν i , 1 ≤ i ≤ r telles que ν 1 >> ν 2 >> . . .<br />
b) une isométrie bijective Λ entre H et E = ⊕ r<br />
i=1 L2 (S 1 , Bor, ν i ) qui conjugue<br />
U (qui agit sur H) à l’opérateurM z <strong>de</strong> multiplication par z (qui agit sur E) :<br />
si Λv = φ(·) alors (ΛHv)(z) = zφ(z).<br />
En outre cette décomposition est essentiellement unique : si (H, U) est<br />
isométriquement équivalent à ( ⊕˜r<br />
i=1 L2 (S 1 , Bor, ˜ν i ), M z ) avec ˜ν 1 >> ˜ν 2 >><br />
. . ., alors ˜r = r et ˜ν i est équivalente à ν i pour tout i.<br />
La démonstration <strong>du</strong> théorème spectral que nous ne ferons pas complètement<br />
repose sur les résultats suivants<br />
Théorème 6.1.2 (Existence <strong>de</strong>s mesures spectrales) 1) Pour tout x ∈<br />
H il existe une mesure <strong>de</strong> probabilité ν x telle que pour tout n ∈ Z<br />
∫<br />
∫<br />
〈U n x, x〉 = ˆν x (n) := z −n dν(z) =<br />
S 1<br />
R/Z<br />
e −2πinθ d˜ν(θ).<br />
2) Pour tout x ∈ H l’opérateur unitaire U restreint à l’espace cyclique<br />
C(x) = Adh{U k x, k ∈ Z} est isométriquement équivalent à l’opérateur <strong>de</strong><br />
multiplication M z agissant sur L 2 (S 1 , Bor(S 1 , ν).<br />
Démonstration.— 1) Nous travaillerons plutôt sur R/Z ≡ S 1 (on note<br />
z = e 2πiθ ). Posons pour ‖x‖ = 1<br />
Par définition ν N ≥ 0 et puisque<br />
ν N (θ) = 1 N<br />
ν N (θ) = 1 N−1<br />
∑<br />
∥ ∥∥∥ N ∥ (U k x)e<br />
2.<br />
2πikθ<br />
∑<br />
0≤k,l≤N−1<br />
= ‖x‖ 2 + 1 N<br />
k=0<br />
〈U k , U l x〉e 2πi(k−l)θ<br />
∑<br />
0≤k≠l≤N−1<br />
〈U k−l x, x〉e 2πi(k−l)θ
6.1. LE THÉORÈME SPECTRAL 71<br />
on voit que ∫ T ν(θ)dθ = 1. Ainsi la mesure ν N = ν N (θ)dθ est <strong>de</strong> probabilité.<br />
Le calcul précé<strong>de</strong>nt montre que<br />
ˆν N (n) = 1 N<br />
∑<br />
0≤k≠l≤N−1<br />
k−l=n<br />
= N − n<br />
N 〈U n x, x〉<br />
〈U k−l x, x〉<br />
et donc pour tout n ∈ Z, lim n→∞ ˆν N (n) = 〈U n x, x〉. Ceci implique que ν N<br />
converge faiblement vers une mesure <strong>de</strong> probabilité ν et que ˆν(n) = 〈U n x, x〉. 1<br />
2) Pour tout polynôme trigonométrique P on a ν(P ) = 〈P (U)x, x〉. Par<br />
ailleurs,<br />
‖P (U)x‖ 2 = 〈(P (U)) ∗ P (U)x, x〉<br />
= 〈 ¯P (U −1 )P (U)x, x〉<br />
= ν(Q) (Q(z) := ¯P (z −1 )P (z))<br />
= ν(|P | 2 )<br />
car pour z ∈ S 1 (|z| = 1) ¯P (z −1 )P (z) = |P | 2 (z). On a donc démontré que<br />
pour tout polynôme trigonométrique<br />
∫<br />
‖P (U)x‖ 2 = |P (z)| 2 dν(z).<br />
S 1<br />
Si P n (U)x est une suite <strong>de</strong> C(x) convergeant vers y ∈ C(x), la suite P n (U)x<br />
est <strong>de</strong> Cauchy et d’après l’inégalité précé<strong>de</strong>nte il en est <strong>de</strong> même <strong>de</strong> P n (·) ∈<br />
L 2 (S 1 , ν). Il existe donc φ ∈ L 2 (S 1 , ν) tel que lim n→∞ ‖P n −φ‖ L 2 (ν) = 0. Si Q n<br />
est une autre suite <strong>de</strong> polynôme trigonométrique telle que Q n (U)x converge<br />
vers y il est facile <strong>de</strong> voir que Q n qui est <strong>de</strong> Cauchy dans L 2 (S 1 , ν) converge<br />
également vers φ 2 . Si on pose Ly = φ il est facile <strong>de</strong> voir que L est linéaire<br />
et par définition ‖y‖ = ‖Ly‖ L 2 (S 1 ,ν).<br />
Proposition 6.1.1 Si x et y sont dans H, notons µ x et µ y <strong>de</strong>s mesures<br />
spectrales associées à x et y comme cela a été fait dans le théorème précé<strong>de</strong>nt.<br />
Alors,<br />
1 Pour tout polynôme trigonométrique la limite lim N→∞ ν N (P ) existe ; en outre, pour<br />
toutes fonctions continues φ, P : S 1 → C, on a |ν N (φ) − ν N ′(φ)| ≤ |ν N (P ) − ν N ′(P )| +<br />
sup S 1 |φ(z)−P (z)|. Par conséquent, pour toute fonction continue φ la suite ν N (φ) converge<br />
vers un réel ν(φ) ; d’après le théorème <strong>de</strong> Banach-Steinhaus ν est une mesure <strong>de</strong> probabilité.<br />
2 car ‖P n − Q n ‖ L2 (S 1 ,ν) converge vers 0<br />
✷
72 CHAPITRE 6. THÉORIE SPECTRALE<br />
a) si µ x ⊥ µ y alors C(x) + C(y) ⊂ C(x + y).<br />
b) si C(x) ⊂ C(y) alors µ x
6.3. MÉLANGE FAIBLE 73<br />
On dit qu’ils sont métriquement isomorphes s’il existe une application inversible<br />
h : (X 1 , B 1 , ν 1 ) → (X 2 , B 2 , ν 2 ) telle que<br />
T 2 = h ◦ T 1 ◦ h −1 .<br />
D’après le théorème spectral et la propriété précé<strong>de</strong>nte, <strong>de</strong>ux systèmes dynamiques<br />
ergodiques et à spectre discret sont spectralement isomorphe si et<br />
seulement si ils ont le même spectre.<br />
Théorème 6.2.1 Si <strong>de</strong>ux systèmes dynamiques à spectre discret sont ergodiques<br />
et spectralement isomorphes (ont le même spectre) alors ils sont<br />
mesurablement isomorphes.<br />
Théorème 6.2.2 Un système dynamique ergodique et à spectre discret est<br />
métriquement isomorphe à une translation sur un groupe abelien compact.<br />
6.3 Mélange faible<br />
Définition 6.3.1 On dit que (X, B, ν, T ) est faiblement mélangeant (en abrégé<br />
f.m.) si 1 est l’unique valeur propre <strong>de</strong> U T et si elle est simple (les seules<br />
fonctions propres sont les constantes).<br />
Ainsi, une transformation f.m est ergodique. Le théorème spectral permet <strong>de</strong><br />
caractériser les transformations faiblement mélangeante. :<br />
Théorème 6.3.1 Les assertions suivantes sont équivalentes :<br />
i) (X, B, µ, T ) est faiblement mélangeant ;<br />
ii) pour tous A, B ∈ B<br />
1<br />
lim<br />
n→∞ n<br />
∑n−1<br />
∣ µ(T −k A ∩ B) − µ(A)µ(B)<br />
∣ = 0;<br />
k=0<br />
iii) pour tous A, B ∈ B il existe un sous-ensemble N <strong>de</strong> N <strong>de</strong> <strong>de</strong>nsité 1 3 tel<br />
que<br />
lim µ(T −k A ∩ B) = µ(A)µ(B);<br />
n→∞<br />
n∈N<br />
iv) les mêmes assertions que ii) et iii) mais en remplaçant "tous A, B ∈ B<br />
par "pour tous A, B dans un ensemble engendrant la tribu B"<br />
3 un ensemble A ∈ N est <strong>de</strong> <strong>de</strong>nsité 1 si (1/n) ∑ n−1<br />
k=0 1 A(k) converge vers 1 quand n → ∞
74 CHAPITRE 6. THÉORIE SPECTRALE<br />
v) Pour toutes f, g ∈ L 2 (X, µ)<br />
1 ∑n−1<br />
(∫<br />
lim |〈U k f, g〉| 2 =<br />
n→∞ n<br />
k=0<br />
X<br />
)(∫ )<br />
fdµ ḡdµ .<br />
X<br />
Démonstration.— a) Nous allons d’abord démontrer i)ssiv).<br />
Supposons que i) soit vraie : par polarisation il suffit <strong>de</strong> démontrer que<br />
pour toute f ∈ L 2 (X, µ)<br />
1 ∑n−1<br />
(∫<br />
) 2<br />
lim |〈U k f, f〉| 2 = f(x)dµ(x)<br />
n→∞ n<br />
k=0<br />
et il est facile <strong>de</strong> voir qu’il suffit <strong>de</strong> démontrer ceci pour f telle que ∫ f(x)dµ(x) =<br />
X<br />
0. Utilisons le théorème spectral pour U restreinte à l’espace cyclique engendré<br />
par f : il existe une mesure <strong>de</strong> probabilité ν borélienne sur S 1 et une<br />
fonction φ ∈ L 2 (S 1 , ν) telles que pour tout k<br />
∫<br />
〈U k f, f〉 = z k φ(z) ¯φ(z)dν(z).<br />
S 1<br />
On a donc<br />
1 ∑n−1<br />
|〈U k f, f〉| 2 = 1 ∑n−1<br />
∫<br />
n<br />
n ∣ z k φ(z) ¯φ(z)dν(z)<br />
2<br />
∣<br />
k=0<br />
k=0<br />
S 1<br />
= 1 n−1<br />
∑<br />
∫<br />
2<br />
n ∣ z k dσ(z)<br />
∣<br />
S 1<br />
k=0<br />
n−1<br />
X<br />
= 1 ∑<br />
|ˆσ(k)| 2<br />
n<br />
k=0<br />
où µ est la mesure <strong>de</strong> probabilité dσ(z) = |φ(z)| 2 dν(z). Or, on a le théorème<br />
suivant :<br />
Théorème 6.3.2 (Wiener) Si σ est une mesure <strong>de</strong> probabilité sur S 1<br />
1 ∑n−1<br />
lim |ˆσ(k)| 2 =<br />
n→∞ n<br />
k=0<br />
∑<br />
a atome <strong>de</strong> σ<br />
|σ({a})| 2<br />
Démonstration.— En effet<br />
1 ∑n−1<br />
|ˆµ(k)| 2 = 1 ∑n−1<br />
(∫ )(∫<br />
)<br />
z k dσ(z) w −k dσ(w)<br />
n<br />
n<br />
k=0<br />
k=0<br />
S 1 S 1<br />
∫ ( 1 ∑n−1<br />
=<br />
(zw −1 )<br />
)d(σ k ⊗ σ)(z, w).<br />
S 1 ×S n 1<br />
k=0
6.3. MÉLANGE FAIBLE 75<br />
Or,<br />
n−1 ∣ 1 ∑ ∣∣∣<br />
∣ (zw −1 ) k ≤ 1 ∈ L 2<br />
n<br />
k=0<br />
converge simplement vers 1 ∆ (z, w) où ∆ est la diagonale z = w dans S 1 ×S 1 .<br />
Le théorème <strong>de</strong> convergence dominée montre donc que<br />
1 ∑n−1<br />
∫<br />
lim |ˆµ(k)| 2 = 1 ∆ (z, w)d(σ ⊗ σ)(z, w)<br />
n→∞ n<br />
k=0<br />
S 1 ×S<br />
∫<br />
1<br />
= σ({z})dσ(z)<br />
S 1 ∑<br />
= |σ({a})| 2<br />
a atome <strong>de</strong> σ<br />
Utilisant ce théorème <strong>de</strong> Wiener on voit que<br />
1 ∑n−1<br />
lim |〈U k f, f〉| 2 =<br />
n→∞ n<br />
X<br />
k=0<br />
∑<br />
a atome <strong>de</strong> ν<br />
|φ(a)| 2 |ν({a})| 2 .<br />
Mais, si ν({a}) > 0 cela signifie que a est valeur propre <strong>de</strong> U T restreint à<br />
C(f) (Pourquoi ) ; comme T est f.m a = 1 et la fonction propre associée<br />
est une constante non nulle. Ceci est impossible car toute fonction <strong>de</strong> C(f)<br />
est <strong>de</strong> µ moyenne nulle.<br />
L’implication réciproque est facile : si Uf = λf alors λ est <strong>de</strong> mo<strong>du</strong>le 1 (car<br />
U est une isométrie) et U k f = λ k f. Par conséquent,<br />
(∫ 2<br />
1 ∑n−1<br />
fdµ)<br />
= lim |〈U k f, f〉| 2 1 ∑n−1<br />
= lim λ 2k = 0.<br />
n→∞ n<br />
n→∞ n<br />
k=0<br />
b) Les autres implications découleront facilement <strong>du</strong> lemme important suivant.<br />
Lemme 6.3.1 Soit (a k ) une suite <strong>de</strong> réels positifs. On a<br />
(a)<br />
1 ∑n−1<br />
lim a k = 0<br />
n→∞ n<br />
si et seulement si : (b) la suite a k tend vers 0 le long d’un ensemble <strong>de</strong> <strong>de</strong>nsité<br />
1 : il existe Z ⊂ N <strong>de</strong> <strong>de</strong>nsité 1 tel que<br />
k=0<br />
lim a<br />
n→∞ n = 0.<br />
n∈Z<br />
k=0<br />
✷
76 CHAPITRE 6. THÉORIE SPECTRALE<br />
Démonstration.— Le fait que (b) implique (a) est trivial et laissé au lecteur.<br />
Montrons donc que (a) entraîne (b). Pour tout p ≥ 1 l’ensemble<br />
Z p = {k : a k ≥ 1 p }<br />
est <strong>de</strong> <strong>de</strong>nsité 0 (son complémentaire est <strong>de</strong> <strong>de</strong>nsité 1). Par conséquent il<br />
existe n p tel que pour tout n ≥ n p<br />
n<br />
1 ∑ p−1<br />
1 Zp (k) ≤ 1 n<br />
p .<br />
k=0<br />
Posons alors<br />
Z = ⋃ p≥1(Z p ∩ [n p , ∞[).<br />
Le long <strong>de</strong> Z c la suite a n tend vers 0 ; en effet, si n /∈ Z alors pour n ≥ n p<br />
on a a n ≤ (1/p). En outre, Z est <strong>de</strong> <strong>de</strong>nsité 0 : puisque les ensembles Z p<br />
croissent avec p, pour n ≥ 1, Z ∩ [0, n] ⊂ Z p où n p ≤ n < n p+1 . Donc,<br />
1 ∑n−1<br />
1 Z (k) ≤ 1 ∑n−1<br />
1 Zp (k) ≤ 1 n<br />
n<br />
p . k=0<br />
k=0<br />
✷<br />
Le fait que v) implique iii) se fait en utilisant le lemme précé<strong>de</strong>nt et en<br />
faisant dans v) f = 1 A − µ(A), g = 1 B − µ(B). L’équivalence <strong>de</strong> iii) et ii)<br />
est encore <strong>du</strong>e au lemme précé<strong>de</strong>nt. Montrons que iii) entraîne v) : Le lemme<br />
et iii) impliquent que v) a lieu pour f et g <strong>de</strong> la forme f = 1 A − µ(A),<br />
g = 1 B − µ(B) et donc v) a lieu pour f et g fonctions indicatrices puis<br />
fonctions simples puis L 2 . L’équivalence <strong>de</strong> iv) avec le reste est facile est<br />
laissée au lecteur.<br />
✷<br />
Exercice : Démontrer que T est faiblement mélangeante si pour tous A, B, C ∈<br />
B<br />
1 ∑n−1<br />
µ(A ∩ T −k B ∩ T −2k C) = µ(A)µ(B)µ(C).<br />
n<br />
k=0<br />
Le théorème précé<strong>de</strong>nt a pour conséquence le suivant :
6.4. FACTEUR DE KRONECKER 77<br />
Théorème 6.3.3 Les assertions suivantes sont équivalentes<br />
i) (X × X, B ⊗ B, µ ⊗ µ, T × T ) est ergodique<br />
ii) (X, B, µ, T ) est faiblement mélangeant<br />
iii) (X × X, B ⊗ B, µ ⊗ µ, T × T ) est faiblement mélangeant<br />
iv) pour tout (Y, C, ν, S) le système dynamique (X × Y, B ⊗ C, µ ⊗ ν, T × S)<br />
est ergodique.<br />
Démonstration.—<br />
Montrons que i) implique ii) : Si φ est une fonction propre <strong>de</strong> T <strong>de</strong> v.p λ,<br />
T φ = λφ on a T ¯φ = ¯barφ si bien que si on pose ψ = φ ⊗ ¯φ (ψ(x, y) =<br />
φ(x) ¯ψ(y)) on a (T × T )ψ = ¯λλψ. Or, |λ| = 1 (U T est une isométrie) si bien<br />
que ψ est constante (T × T est ergodique) et par conséquent φ est constante<br />
µ-pp (Pourquoi ).<br />
ii) implique iii) : soient A, B, C, D ∈ B et Z un ensemble <strong>de</strong> <strong>de</strong>nsité 1 sur<br />
lequel µ(T −k A ∩ C) → µ(A)µ(C) et µ(T −k B ∩ D) → µ(B)µ(D) . On a par<br />
définition <strong>de</strong> la mesure pro<strong>du</strong>it<br />
(µ ⊗ µ)((T −k A × T −k B) ∩ (C × D)) = µ(T −k A ∩ C)µ(T −k B ∩ D).<br />
et quand k ∈ Z cette <strong>de</strong>rnière quantité tend vers µ(A)µ(C)µ(B)µ(D) qui est<br />
(µ ⊗ µ)(A × B) · (µ ⊗ µ)(C × D)).<br />
iii) implique i) est immédiat.<br />
L’équivalence <strong>de</strong> iv) avec le reste se fait comme "ii) implique iii)".<br />
✷<br />
Remarque : Quand on étudie <strong>de</strong>s actions <strong>de</strong> groupes autres que Z on définit<br />
le faible mélange comme étant l’absence <strong>de</strong> sous-espaces vectoriels <strong>de</strong><br />
dimension finie invariants en <strong>de</strong>hors <strong>de</strong> l’ensemble <strong>de</strong>s constantes.<br />
6.4 Facteur <strong>de</strong> Kronecker<br />
Supposons que (X, B, µ, T ) soit ergodique et notons F l’adhérence dans<br />
L 2 (X, µ) <strong>de</strong> l’espace vectoriel engendré par les fonctions propres <strong>de</strong> U T .<br />
Notons par ailleurs K la tribu engendrée par les fonctions propres <strong>de</strong> U<br />
(c’est-à-dire engendrée par les {f > λ}, λ ∈ R, f fonction propre <strong>de</strong> U). Il<br />
est clair que F ⊂ L 2 (X, K). Démontrons l’inclusion réciproque. Remarquons<br />
que si f est une fonction propre <strong>de</strong> U <strong>de</strong> valeur propre associée λ alors<br />
f n est fonction propre <strong>de</strong> valeur propre λ n . Les valeurs propres <strong>de</strong> U sont<br />
simples, si bien que les fonctions f n , n ∈ Z sont <strong>de</strong>ux à <strong>de</strong>ux orthogonales
78 CHAPITRE 6. THÉORIE SPECTRALE<br />
dans L 2 (X, µ). Si P (z) = ∑ |k|≤N a kz k est un polynôme en z, z −1 on a donc<br />
‖P (f)‖ L 2 (µ) = ∑ |k|≤N |a k| 2 et donc<br />
∫<br />
‖P (f)‖ 2 L 2 (X,µ) = |P (z)| 2 dz.<br />
Si A est un borélien <strong>de</strong> T il existe une suite <strong>de</strong> tels polynômes trigonométriques<br />
P n qui converge vers 1 A dans L 2 (T, dz), si bien que 1 A ◦ f est limite<br />
dans L 2 (X, µ) <strong>de</strong> P n (f). Ceci démontre que toute fonction <strong>de</strong> L 2 (X, µ) <strong>de</strong> la<br />
forme 1 A ◦ f est dans F . Mais il est clair que L 2 (K, µ) est engendré par les<br />
1 A ◦ f quand A décrit les boréliens <strong>de</strong> T et f les fonctions propres <strong>de</strong> U.<br />
Notons à présent Λ le groupe abélien constitué <strong>de</strong>s valeurs propres <strong>de</strong> U et<br />
Γ son groupe <strong>du</strong>al, c’est-à-dire le groupe <strong>de</strong>s caractères <strong>de</strong> Λ.<br />
6.5 Couplages<br />
Etant donnés <strong>de</strong>ux systèmes dynamiques (X 1 , B 1 , µ 1 , T 1 ) et (X 2 , B 2 , µ 2 , T 2 ),<br />
on appelle couplage, toute mesure ν définie sur la tribu B = B 1 ⊗ B 2 , invariante<br />
par T 1 × T 2 : X 1 × X 2 → X 1 × X 2 et qui se projette sur le premier<br />
facteur sur µ 1 et sur le <strong>de</strong>uxième facteur sur µ 2 .<br />
Exemple a) La mesure pro<strong>du</strong>it ν = µ 1 ⊗ µ 2 définie par ν(A 1 × A 2 ) =<br />
µ 1 (A 1 )µ 2 (A 2 ) est toujours un couplage.<br />
b) Si (X i , B i , µ i , T i ) = (X, B, µ, T ), i = 1, 2, la mesure diagonale ∆(A 1 ×<br />
A 2 ) = µ(A 1 ∩ A 2 ) est un couplage.<br />
Définition 6.5.1 On dit que les systèmes dynamiques sont disjoints (X 1 , B 1 , µ 1 , T 1 )<br />
et (X 2 , B 2 , µ 2 , T 2 ) si le seul couplage qu’ils admettent est la mesure pro<strong>du</strong>it.<br />
On a alors la propriété suivante simple mais très utile :<br />
Proposition 6.5.1 L’i<strong>de</strong>ntité est toujours disjointe <strong>de</strong>s ergodiques : avec les<br />
notations précé<strong>de</strong>ntes, si T 1 = Id et si (X 2 , B 2 , µ 2 , T 2 ) est ergodique, alors le<br />
seul couplage possible est la mesure pro<strong>du</strong>it.<br />
Démonstration.— Soit ν est une<br />
∑<br />
mesure invariante par I × T 2 ; pour f ∈<br />
C(X 1 ), g ∈ C(X 2 ) la moyenne 1 n−1<br />
n k=0 f(x 1)g(T2 k x 2 ) converge pour tout<br />
x 1 ∈ X 1 et µ 2 -p.t x 2 ∈ X 2 vers f(x 1 ) ∫ X 2<br />
g(y)dµ 2 (y). En particulier, puisque<br />
(π 2 ) ∗ ν = µ 2 la convergence a lieu ν-p.p. et d’après le théorème <strong>de</strong> convergence<br />
dominée<br />
∫<br />
f(x 1 )g(x 2 )dν(x 1 , x 2 ) =<br />
X 1 ×X 2<br />
∫<br />
f(x 1 )dν(x 1 , x 2 )<br />
X 1 ×X 2<br />
∫<br />
g(x 2 )dµ 2 (x 2 ).<br />
X 2<br />
T
6.6. MÉLANGE FAIBLE D’ORDRE SUPÉRIEUR 79<br />
Comme (π 1 ) ∗ ν = µ 1 on a donc<br />
∫<br />
∫<br />
∫<br />
f(x 1 )g(x 2 )dν(x 1 , x 2 ) =<br />
X 1 ×X 2<br />
f(x 1 )dµ 1 (x 1 )<br />
X 1<br />
g(x 2 )dµ 2 (x 2 ),<br />
X 2<br />
ce qui prouve que ν est la mesure pro<strong>du</strong>it.<br />
✷<br />
Exercice On suppose que (X, B, µ, T ) est faiblement mélangeant.<br />
1) On note S = I ×T ×T 2 et ∆ la mesure diagonale sur (X 3 , B 3⊗ ) définie par<br />
∆(A × B × C) = µ(A ∩ B ∩ C). Soit λ une limite pour la topologie faible-∗<br />
<strong>de</strong> la suite (1/N) ∑ N<br />
k=0 (S ∗) k ∆. Démontrer que λ est un couplage <strong>de</strong> (I, µ) et<br />
(T × T 2 , µ ⊗ µ).<br />
2) En dé<strong>du</strong>ire que pour tous A, B, C ∈ A<br />
lim<br />
N→∞<br />
1<br />
N<br />
N∑<br />
µ(A ∩ T −k B ∩ T −2k C) = µ(A)µ(B)µ(C).<br />
k=0<br />
[Comme (T 2 , µ) est ergodique ((T, µ) est f.m) et que (T, µ) est f.m., on voit<br />
que (T × T 2 , µ ⊗ µ) est ergodique]<br />
3). Démontrer que pour tous A, B, C ∈ A il existe N ⊂ N <strong>de</strong> <strong>de</strong>nsité 1 tel<br />
que<br />
lim<br />
k→∞,N∈N µ(A ∩ T −k B ∩ T −2k C) = µ(A)µ(B)µ(C).<br />
[Appliquer le résultat <strong>du</strong> 2. à (T × T, µ ⊗ µ), A × A, B × B, C × C pour<br />
obtenir<br />
]<br />
lim<br />
N→∞<br />
1<br />
N<br />
N∑<br />
(<br />
2<br />
µ(A ∩ T −k B ∩ T −2k C) − µ(A)µ(B)µ(C))<br />
.<br />
k=0<br />
6.6 Mélange faible d’ordre supérieur<br />
B<br />
On dit qu’une transformation est p-mélangeante si pour tous A 1 , . . . , A p ∈<br />
lim µ(A 1 ∩ T −n A 2 · · · ∩ T −n(r−1) A p ) = µ(A 1 )µ(A 2 ) · · · µ(A p ).<br />
n→∞<br />
Une question toujours non résolue qui est l’objet <strong>de</strong> recherches actives est<br />
la suivante : le 2-mélange implique-t-il le 3-mélange Il est remarquable que
80 CHAPITRE 6. THÉORIE SPECTRALE<br />
l’analogue faible <strong>de</strong> cette question admette une réponse positive dont la démonstration<br />
est non triviale. On dit qu’une transformation est faiblement<br />
mélangeante d’ordre p si pour tous A 1 , . . . , A p ∈ B il existe un ensemble<br />
Z ⊂ N <strong>de</strong> <strong>de</strong>nsité 1 tel que<br />
lim µ(A<br />
n→∞ 1 ∩ T −n A 2 · · · ∩ T −n(r−1) A p ) = µ(A 1 )µ(A 2 ) · · · µ(A p ).<br />
n∈Z<br />
Il est équivalent <strong>de</strong> dire que pour tous A 1 , . . . , A p ∈ B<br />
n−1<br />
lim<br />
n→∞<br />
k=0<br />
On a<br />
∑<br />
|µ(A 1 ∩ T −k A 2 · · · ∩ T −k(r−1) A p ) − µ(A 1 )µ(A 2 ) · · · µ(A p )| = 0.<br />
Théorème 6.6.1 Si (X, B, µ, T ) est faiblement mélangeant alors pour tout<br />
p ≥ 3 il est faiblement mélangeant d’ordre p.<br />
Il est facile d’adapter la preuve <strong>de</strong> l’exercice <strong>de</strong> la section précé<strong>de</strong>nte pour<br />
démontrer ce résultat. On peut également en donner une preuve en utilisant<br />
la métho<strong>de</strong> <strong>de</strong> Van <strong>de</strong>r Corput.<br />
6.7 Argument <strong>de</strong> Hopf et Théorie spectrale<br />
Soit T un automorphisme ergodique <strong>du</strong> tore T 2 . Nous illustrons dans ce<br />
qui suit une métho<strong>de</strong> (<strong>du</strong>e à Martine Babillot) qui permet <strong>de</strong> démontrer<br />
qu’un tel automorphisme est mélangeant. Soit f une fonction continue sur<br />
T 2 <strong>de</strong> moyenne nulle. Il existe une suite n k d’entiers pour laquelle f ◦ T n k<br />
converge faiblement dans L 2 (T 2 ) vers une fonction <strong>de</strong> carré intégrable g et<br />
nous <strong>de</strong>vons démontrer que g est nulle. Supposons par l’absur<strong>de</strong> que g ne<br />
soit pas nulle. D’après le Théorème spectral, il existe une mesure ν sur le<br />
cercle et un isomorphisme unitaire V <strong>de</strong> {f ◦ T k : k ∈ Z} L2 (T 2 )<br />
sur L 2 (ν) tel<br />
que V (l ◦ T ) = zV (l). Notons φ = V (f), ψ = V (g) et A le sous-espace <strong>de</strong><br />
L 2 (ν) constitué <strong>de</strong>s limites faibles <strong>de</strong> la suite <strong>de</strong> fonctions z n φ(z), n → ±∞.<br />
Il est facile <strong>de</strong> voir que A est stable par conjugaison complexe et par pro<strong>du</strong>it.<br />
Posons alors θ = |ψ| 2 qui est non i<strong>de</strong>ntiquement nulle et dans A et posons<br />
h = V −1 (θ). Par définition il existe une suite n k → ∞ pour laquelle f ◦ T n k<br />
converge faiblement vers h et comme h est invariante par conjugaison il existe<br />
une suite n ′ k → ∞ telle que f ◦ T −n′ k converge faiblement vers h. D’après le<br />
Théorème <strong>de</strong> Banach-Sachs on sait que l’on peut extraire une sous-suite n ik <strong>de</strong><br />
n k telle que les moyennes <strong>de</strong> Cesaro M K := (1/K) ∑ K<br />
i=1 f ◦T n ik<br />
converge dans
6.7. ARGUMENT DE HOPF ET THÉORIE SPECTRALE 81<br />
L 2 (T 2 ) vers h. Il existe donc une sous-suite K p pour laquelle M Kp converge<br />
p.p vers h. Par un argument classique on voit que h est constante sur presque<br />
toute feuille stable <strong>de</strong> T et on voit <strong>de</strong> la même manière que h est constante<br />
sur presque toute feuille instable <strong>de</strong> T . On en dé<strong>du</strong>it que h est constante et<br />
comme h n’est pas i<strong>de</strong>ntiquement nulle cette constante est également nonnulle.<br />
Mais cela est une contradiction car comme f est <strong>de</strong> moyenne nulle,<br />
toute limite faible <strong>de</strong> la suite f ◦ T n doit être <strong>de</strong> moyenne nulle.<br />
Cet argument présent l’intérêt <strong>de</strong> donner une démonstration simple <strong>du</strong><br />
mélange <strong>du</strong> flot géodésique.
82 CHAPITRE 6. THÉORIE SPECTRALE
Chapitre 7<br />
Entropie<br />
La notion d’entropie métrique (resp. topologique) en théorie ergodique<br />
est un invariant très utile <strong>de</strong> conjugaison mesurable (resp. topologique).<br />
7.1 Entropie métrique<br />
Dans tout ce qui suit (X, B, µ, T ) est un système dynamique.<br />
7.1.1 Entropie d’une partition finie<br />
Si ξ est une partition mesurable finie <strong>de</strong> X c’est-à-dire si ξ est une partition<br />
finie <strong>de</strong> X en ensembles C i ∈ B, 1 ≤ i ≤ r (r = #ξ) <strong>de</strong> µ-mesure<br />
non-nulle 1 on définit l’entropie <strong>de</strong> la partition ξ par rapport à µ par<br />
H µ (ξ) = −<br />
r∑<br />
µ(C i ) log(µ(C i )).<br />
i=1<br />
Dans la suite nous omettrons souvent l’indice µ.<br />
Il est commo<strong>de</strong> d’intro<strong>du</strong>ire la fonction d’information définie pour tout<br />
x ∈ X par<br />
r∑<br />
I(ξ)(x) = − log(µ(C i ))1 Ci (x).<br />
On a<br />
i=1<br />
∫<br />
H µ (ξ) =<br />
X<br />
I(ξ)(x)dµ(x).<br />
Si ξ et η sont <strong>de</strong>ux partitions mesurables finies on intro<strong>du</strong>it la partition<br />
ξ ∨ η qui est la plus petite partition raffinant ξ et η (contenant les atomes <strong>de</strong><br />
1 Nous dirons que les C i sont les atomes <strong>de</strong> la partition ξ<br />
83
84 CHAPITRE 7. ENTROPIE<br />
ξ et <strong>de</strong> η) : c’est la partition dont les atomes sont les C i ∩ D j , C i ∈ ξ, D j ∈ η.<br />
Essayons <strong>de</strong> calculer l’entropie <strong>de</strong> la partition ξ ∨ η en fonction <strong>de</strong> celles <strong>de</strong><br />
ξ et <strong>de</strong> η :<br />
H(ξ ∨ η) = −<br />
∑<br />
µ(C i ∩ D j ) log(µ(C i ∩ D j ))<br />
C i ∈ξ,D j ∈η<br />
= − ∑<br />
C i ∈ξ,D j ∈η<br />
= − ∑<br />
C i ∈ξ,D j ∈η<br />
= H(η) − ∑<br />
µ(C i ∩ D j ) log(µ(C i |D j )µ(D j ))<br />
µ(C i ∩ D j ) log(µ(D j )) −<br />
C i ∈ξ,D j ∈η<br />
∑<br />
C i ∈ξ,D j ∈η<br />
µ(C i ∩ D j ) log(µ(C i |D j ))<br />
µ(C i ∩ D j ) log(µ(C i |D j ))<br />
où on a noté µ(C i |D j ) = µ(C i ∩ D j )/µ(D j ). Si on intro<strong>du</strong>it l’entropie conditionnelle<br />
H(ξ|η) <strong>de</strong> ξ par rapport à η<br />
H(ξ|η) = −<br />
∑<br />
µ(C i ∩ D j ) log(µ(C i |D j ))<br />
C i ∈ξ,D j ∈η<br />
on obtient la formule très importante<br />
Il est utile parfois d’écrire<br />
H µ (ξ ∨ η) = H µ (ξ|η) + H µ (η).<br />
H µ (ξ|η) = ∑ D j ∈η<br />
µ(D j )H µ(·|Dj )(ξ)<br />
où µ(·|D j ) est la mesure conditionnelle par rapport à D j (i.e µ(·|D j ) = µ(· ∩<br />
D j )/µ(D j )).<br />
A ce sta<strong>de</strong> il est pertinent d’intro<strong>du</strong>ire la fonction d’information conditionnelle.<br />
Supposons que ξ est une partition mesurable finie et que A est une<br />
sous-tribu <strong>de</strong> B ; dans la situation précé<strong>de</strong>nte, A sera la tribu ˆη engendrée par<br />
les atomes <strong>de</strong> la partition η. Intro<strong>du</strong>isons l’espérance conditionnelle E(·|A)<br />
par rapport à la tribu A ; dans le cas où A = ˆη on a pour toute fonction<br />
f ∈ L 1 (X, B, µ)<br />
E(f|A)(·) = ∑ ( ∫<br />
)<br />
1<br />
f(x)dµ(x) 1 Dj (·).<br />
µ(D j )<br />
D j ∈η<br />
D j<br />
Nous définissons alors<br />
I(ξ|A)(·) = − ∑ C i ∈ξ<br />
( )<br />
log E(1 Ci |A)(·) 1 Ci (·).
7.1. ENTROPIE MÉTRIQUE 85<br />
On définit alors l’entropie conditionelle <strong>de</strong> ξ par rapport à la tribu A<br />
∫<br />
H(ξ|A) = I(ξ|A)(x)dµ(x).<br />
Remarquons que puisque ∫ E(f|A)dµ = ∫ fdµ on a<br />
X X<br />
∫ ∑<br />
( ) )<br />
H(ξ|A) = − log E(1 Ci |A)(·) E(1 Ci |A)(·) dµ<br />
X(<br />
C i ∈ξ<br />
ou encore en notant φ(t) = −t log t<br />
∫<br />
∑<br />
H(ξ|A) =<br />
X<br />
X<br />
C i ∈ξ<br />
Dans la cas où A = ˆη on retrouve le résultat précé<strong>de</strong>nt.<br />
( )<br />
φ E(1 Ci |A)(·) dµ (7.1)<br />
Remarque : Si A = {∅, X} est la tribu triviale I(ξ|A)(·) = I(ξ)(·) tandis<br />
que si A = B on a I(ξ|A)(·) = 0 µ-pp. En effet, si A est la tribu triviale<br />
le résultat est clair tandis que si A = B on a E(1 Ci |A)(·) = 1 Ci (·) et donc<br />
I(ξ|A)(x) = ∑ C i ∈ξ φ(1 C i<br />
(x)) où φ(t) = −t log t (observer que φ(0) = φ(1) =<br />
0).<br />
Nous regroupons dans la proposition qui suit quelques propriétés utiles <strong>de</strong><br />
l’entropie :<br />
Proposition 7.1.1 Si ξ et η sont <strong>de</strong>s partitions mesurables finies<br />
1) H(ξ ∨ η) = H(η) + H(ξ|η) = H(ξ) + H(η|ξ) 2<br />
2) H(ξ ∨ η) ≤ H(ξ) + H(η).<br />
3) Si T : X → X est B-mesurable et préserve µ<br />
H(T −1 ξ|T −1 η) = H(ξ|η).<br />
4) Si ξ 1 < ξ 2 (ξ 2 est plus fine que ξ 1 3 ) alors H(ξ 1 |A) ≤ H(ξ 2 |A).<br />
5) Si A 1 ⊂ A 2 sont <strong>de</strong>s tribus, H(ξ|A 2 ) ≤ H(ξ|A 1 ) 4 . (En particulier H(ξ|η) ≤<br />
H(ξ).)<br />
6) On a toujours H(ξ) ≤ log(#ξ).<br />
2 et plus généralement H(ξ ∨ η|A) = H(η|A) + H(ξ|ˆη ∨ A) = H(ξ|A) + H(η|ˆξ ∨ A) :<br />
c’est facile à démontrer si A a un nombre fini d’atomes, plus délicat sinon.<br />
3 i.e. tout atome <strong>de</strong> ξ 2 est inclus dans un atome <strong>de</strong> ξ 1<br />
4 H(ξ|B) = 0, H(ξ|{∅, X}) = H(ξ)
86 CHAPITRE 7. ENTROPIE<br />
Démonstration.— Le point 1) a déjà été démontré. Le point 3) est évi<strong>de</strong>nt.<br />
Le 2) est un cas particulier <strong>de</strong> 5) qui repose sur l’inégalité <strong>de</strong> Jensen 5 et le<br />
fait que la fonction t ↦→ −t log t est concave : puisque A 1 ⊂ A 2 l’opérateur<br />
E(·|A 1 ) restreint à L 1 (A 2 ) est l’i<strong>de</strong>ntité si bien que d’après l’inégalité <strong>de</strong><br />
Jensen ( (<br />
) (<br />
)<br />
E φ E(1 Ci |A 2 )(·)<br />
)|A 1 ≤ φ E(1 Ci |A 1 )(·) ;<br />
comme<br />
∫<br />
X<br />
(<br />
) ∫ ( (<br />
)<br />
φ E(1 Ci |A 2 )(·) dµ = E φ E(1 Ci |A 2 )(·)<br />
)|A 1 dµ<br />
X<br />
l’égalité (7.1) permet <strong>de</strong> conclure la preuve <strong>de</strong> 5).<br />
Le point 4) (et son analogue conditionnel) se démontre en remarquant<br />
que puisque ξ 1 < ξ 2 on a ξ 1 ∨ ξ 2 = ξ 2 et donc,<br />
H(ξ 2 ) = H(ξ 1 ) + H(ξ 2 |ξ 1 ) ≥ H(ξ 1 ).<br />
Le point 6) est facile (utiliser la concavité <strong>de</strong> φ).<br />
✷<br />
Exercice Démontrer que<br />
I(T −1 ξ) = I(ξ) ◦ T et<br />
I(ξ ∨ η) = I(ξ|η) + I(η).<br />
7.1.2 Entropie d’une transformation<br />
Définition<br />
Nous sommes en mesure <strong>de</strong> définir l’entropie d’une transformation (T, µ).<br />
Théorème 7.1.1 Si (X, B, µ, T ) est un système dynamique et si ξ est une<br />
partition mesurable finie <strong>de</strong> X la suite H( ∨ n−1<br />
k=0 T −k ξ) est sous-additive et on<br />
note<br />
n−1<br />
1<br />
h µ (T, ξ) = lim<br />
n→∞ n H( ∨<br />
T −k ξ).<br />
(<br />
5 c’est-à-dire ) pour φ fonction concave, f ∈ L 1 (X, B, µ) et A sous-tribu <strong>de</strong> B on a<br />
φ E(f|A) ≥ E(φ ◦ f|A) ; cela se démontre facilement d’abord dans le cas où f est<br />
étagée<br />
k=0
7.1. ENTROPIE MÉTRIQUE 87<br />
Démonstration.— Notons ξ n = ∨ n−1<br />
k=0 T −k ξ. Puisque ξ n+m = ξ n ∨ ξ m on a<br />
d’après le 2 <strong>de</strong> la proposition 7.1.1<br />
H(ξ n+m ) ≤ H(ξ n ) + H(ξ m ).<br />
Définition 7.1.1 On définit l’entropie <strong>de</strong> (T, µ) comme étant<br />
h µ (T ) = sup h(T, ξ)<br />
ξ<br />
le sup étant pris sur toutes les partitions mesurables finies d’entropie finie.<br />
✷<br />
Exemples : Calculons l’entropie d’une translation rationnelle sur R/Z d’angle<br />
p/q. Pour toute partition mesurable finie ξ d’entropie finie, le nombre d’atomes<br />
<strong>de</strong> la partition ∨ n−1<br />
k=0 T −k ξ est inférieur à (#ξ) q et est donc borné. Par conséquent<br />
h(T, ξ) = 0 pour toute partition finie et donc h(T ) = 0.<br />
Notons le théorème suivant<br />
Théorème 7.1.2 Pour toute partition mesurable finie ξ<br />
ou encore<br />
Démonstration.—<br />
n−1<br />
∨<br />
h(T, ξ) = lim H(ξ| T −k ξ)<br />
n→∞<br />
h(T, ξ) = H(ξ|<br />
k=1<br />
∞∨<br />
T −k ξ).<br />
k=1<br />
Pour la première partie, il suffit d’écrire<br />
∨<br />
T −k ξ) = H(ξ ∨<br />
n−1<br />
H(<br />
k=0<br />
n−1<br />
∨<br />
k=1<br />
T −k ξ)<br />
n−1<br />
∨<br />
n−1<br />
∨<br />
= H(ξ| T −k ξ) + H( T −k ξ)<br />
k=1<br />
k=1<br />
k=1<br />
n−1<br />
∨<br />
n−2<br />
∨<br />
= H(ξ| T −k ξ) + H(T −1 T −k ξ)<br />
k=0<br />
n−1<br />
∨<br />
n−2<br />
∨<br />
= H(ξ| T −k ξ) + H( T −k ξ)<br />
k=1<br />
k=0
88 CHAPITRE 7. ENTROPIE<br />
où on a utilisé le 3) <strong>de</strong> la proposition 7.1.1. Si on itère la relation précé<strong>de</strong>nte<br />
on trouve que<br />
n−1<br />
∨<br />
n−1<br />
∨<br />
H(ξ| T −k ξ) = H(ξ|T −1 ξ)+· · ·+H(ξ|T −1 ξ ∨T −2 ξ)+· · ·+H(ξ| T −k ξ).<br />
k=0<br />
La suite H(ξ| ∨ n−1<br />
k=1 T −k ξ) est décroissante par rapport à k (cf. 5) <strong>de</strong> la proposition<br />
7.1.1 ) et par conséquent converge ; le théorème <strong>de</strong> Césaro 6 permet<br />
<strong>de</strong> conclure.<br />
La <strong>de</strong>uxième partie <strong>du</strong> théorème se démontre en utilisant le lemme suivant<br />
:<br />
k=1<br />
Lemme 7.1.1 Si les tribus A n v’érifient A n ↑ A, alors<br />
lim H(ξ|A n) = H(ξ|A).<br />
n→∞<br />
Démonstration.— D’après le théorème <strong>de</strong> convergence ( <strong>de</strong>s martingales )<br />
7 E(1 Ci |A n )(·) converge µ-p.p vers E(1 Ci |A)(·) et donc φ E(1 Ci |A n )(·)<br />
(<br />
)<br />
converge µ-p.p vers φ E(1 Ci |A n )(·) . Comme la fonction φ = −t log t est<br />
continue (donc bornée) sur [0, 1] les hypothèses <strong>du</strong> théorème <strong>de</strong> convergence<br />
dominée sont vérifiées et on a<br />
∫ (<br />
) ∫ ( )<br />
lim φ E(1 Ci |A n )(·) dµ = φ E(1 Ci |A)(·) dµ.<br />
n→∞<br />
X<br />
X<br />
Puisque ξ est finie et que<br />
∫<br />
H(ξ|A)(·) =<br />
∑<br />
X<br />
C i ∈ξ<br />
( )<br />
φ E(1 Ci |A)(·) dµ<br />
on a convergence µ-p.p <strong>de</strong> H(ξ|A n )(·) vers H(ξ|A)(·). L<br />
✷<br />
✷<br />
6 si a n converge alors la moyenne (a 1 + · · · + a n )/n converge vers la même limite<br />
7 Si f est une fonction L 1 (B, µ) E(f|A n ) converge L 1 et µ-p.p vers E(f|A).
7.1. ENTROPIE MÉTRIQUE 89<br />
Distance <strong>de</strong> Rokhlin<br />
Théorème 7.1.3 Si ξ et η sont <strong>de</strong>ux partitions mesurables finies on a toujours<br />
|h µ (T , ξ) − h µ (T , η)| ≤ H (ξ|η) + H (η|ξ).<br />
Démonstration.—<br />
En effet<br />
∨<br />
n−1<br />
H(<br />
k=0<br />
n−1<br />
∨<br />
T −k ξ) ≤ H(<br />
k=0<br />
n−1<br />
∨<br />
≤ H(<br />
k=0<br />
n−1<br />
∨<br />
≤ H(<br />
k=0<br />
n−1<br />
∨<br />
≤ H(<br />
k=0<br />
n−1<br />
∨<br />
≤ H(<br />
k=0<br />
T −k ξ ∨<br />
n−1<br />
∨<br />
k=0<br />
T −k η)<br />
n−1<br />
∨<br />
T −k η) + H(<br />
k=0<br />
n−1<br />
∑<br />
T −k η) +<br />
l=0<br />
n−1<br />
n−1<br />
∨<br />
T −k ξ|<br />
k=0<br />
n−1<br />
∨<br />
H(T −l ξ|<br />
k=0<br />
∑<br />
T −k η) + H(T −l ξ|T −l η)<br />
l=0<br />
n−1<br />
∑<br />
T −k η) + H(ξ|η)<br />
l=0<br />
n−1<br />
∨<br />
≤ H( T −k η) + nH(ξ|η).<br />
k=0<br />
Diviser par n and faire tendre n → ∞ donne<br />
h(T, ξ) − h(T, η) ≤ H(ξ|η).<br />
T −k η)<br />
T −k η)<br />
L’inégalité inverse est claire.<br />
✷<br />
Définition 7.1.2 La quantité d(ξ, η) = H(ξ|η)+H(η|ξ) définit une distance<br />
appelée distance <strong>de</strong> Rokhlin. Ainsi ξ ↦→ h(T, ξ) est 1-lipschitzienne.<br />
Mentionnons un corollaire très utile <strong>du</strong> théorème précé<strong>de</strong>nt :<br />
Théorème 7.1.4 Si ξ n est une suite <strong>de</strong> partition mesurables finies croissante<br />
telle que ˆξ n ↑ B alors<br />
lim<br />
n→∞ h(T, ξ n) = h(T ).
90 CHAPITRE 7. ENTROPIE<br />
Démonstration.—<br />
Remarquons que pour n ≤ m<br />
h(T, ξ m ) ≤ h(T, ξ n ) + H(ξ m |ξ n );<br />
mais comme ξ n < ξ m on a H(ξ m |ξ n ) = 0. Ainsi la suite h(T, ξ n ) est décroissante<br />
et admet donc une limite. En outre, on a vu que H(η|ξ n ) convergeait<br />
vers H(η|B) = 0. Comme<br />
on en dé<strong>du</strong>it que pour tout η<br />
h(T, η) ≤ h(T, ξ n ) + H(η|ξ n ),<br />
h(T, η) ≤ lim<br />
n→∞<br />
h(T, ξ n ),<br />
c’est-à-dire h(T ) ≤ lim n→∞ h(T, ξ n ). L’inégalité inverse est évi<strong>de</strong>nte.<br />
Générateur, générateur fort<br />
Définition 7.1.3 Si le système dynamique (T, µ) est inversible, on dit qu’une<br />
partition est un générateur pour T (resp. générateur fort) si B coïnci<strong>de</strong> avec la<br />
tribu engendrée par ∨ ∞<br />
k=−∞ T −k ξ (resp. ∨ ∞<br />
k=0 T −k ξ). Si T n’est pas inversible<br />
seule la définition d’un générateur fort (au sens précé<strong>de</strong>nt) est pertinente.<br />
Le théorème suivant permet <strong>de</strong> calculer facilement <strong>de</strong>s entropies :<br />
Théorème 7.1.5 Si ξ est un générateur (resp. générateur fort) pour T<br />
Démonstration.—<br />
∨<br />
n−1<br />
H(<br />
k=0<br />
Ecrivons,<br />
n−1<br />
∨<br />
T −k η) ≤ H(<br />
k=0<br />
m+n−1<br />
∨<br />
≤ H(<br />
h µ (T ) = h µ (T, ξ).<br />
k=0<br />
m+n−1<br />
∨<br />
≤ H(<br />
k=0<br />
T −k η ∨<br />
m+n−1<br />
∨<br />
k=0<br />
T −k ξ)<br />
n−1<br />
∨<br />
T −k ξ) + H(<br />
k=0<br />
n−1<br />
∑<br />
T −k ξ) +<br />
m+n−1<br />
∨<br />
≤ H( T −k ξ) +<br />
k=0<br />
m+n−1<br />
∨<br />
≤ H(<br />
k=0<br />
l=0<br />
∑n−1<br />
l=0<br />
n−1<br />
l=0<br />
m+n−1<br />
∨<br />
T −k η|<br />
k=0<br />
m+n−1<br />
∨<br />
H(T −l η|<br />
k=0<br />
m+l<br />
∨<br />
H(T −l η|<br />
k=l<br />
T −k ξ)<br />
T −k ξ)<br />
T −k ξ)<br />
∑ m∨<br />
T −k ξ) + H(η| T −k ξ).<br />
k=0<br />
✷
7.1. ENTROPIE MÉTRIQUE 91<br />
Or,<br />
lim H(η| ∨ m<br />
m→∞<br />
k=0<br />
T −k ξ) = 0<br />
puisque la tribu engendrée par ∨ m<br />
k=0 T −k ξ converge en croissant vers B. Par<br />
conséquent, si on choisit m assez grand pour que H(η| ∨ m<br />
k=0 T −k ξ) ≤ ɛ on a<br />
pour n assez grand<br />
n−1<br />
1<br />
n H( ∨<br />
T −k η) ≤ n + m<br />
n<br />
k=0<br />
Si on fait tendre n vers l’infini on obtient<br />
m+n−1<br />
1<br />
n + m H( ∨<br />
T −k ξ) + nɛ.<br />
h(T, η) ≤ h(T, ξ) + ɛ<br />
ceci pour tout ɛ et tout η. Par conséquent h(T ), qui est le sup <strong>de</strong>s h(T, η),<br />
égale h(T, ξ).<br />
Remarque :<br />
1) Si T est inversible et admet un générateur fort alors h(T ) = 0.<br />
2) Toute transformation d’entropie finie admet une partition génératrice finie<br />
qui a au plus [e h(T ) ] + 1 éléments. (Krieger).<br />
7.1.3 Exemples<br />
Entropie d’une translation sur un tore<br />
Calculons l’entropie d’une translation x ↦→ x + α sur R/Z par rapport à<br />
la mesure <strong>de</strong> Haar (qui est clairement invariante). On a déjà vu que h(T ) = 0<br />
si α est rationnel. Supposons donc α irrationnel.<br />
Première métho<strong>de</strong> : Soit ξ une partition finie en intervalles <strong>du</strong> cercle et notons<br />
A l’ensemble <strong>de</strong>s extrémités <strong>de</strong> ces intervalles. Un instant <strong>de</strong> réflexion<br />
montre que le joint ξ n := ∨ n−1<br />
k=0 T −k ξ est la partition en intervalles qui sont<br />
les composantes connexes <strong>du</strong> complémentaire <strong>de</strong> ⋃ n−1<br />
k=0 T k A dans le cercle.<br />
Ainsi, ξ n comporte au plus n#ξ atomes et donc<br />
h(T, ξ) = lim<br />
n→∞<br />
log(n#ξ)<br />
n<br />
k=0<br />
= 0.<br />
A présent, si ξ (m) est la partition en intervalles m-adiques il est clair que<br />
ξ (m) ↑ Bor et le théorème 7.1.4 permet <strong>de</strong> dire que h(T ) = 0.<br />
✷
92 CHAPITRE 7. ENTROPIE<br />
Deuxième métho<strong>de</strong> : On peut raisonner <strong>de</strong> la façon suivante ; la partition<br />
ξ = {[0, 1/2), [1/2, 1)} est génératrice quand α est irrationnel car pour tout<br />
m, la tribu engendrée par les intervalles m-adiques est incluse dans la tribu<br />
engendrée par les atomes <strong>du</strong> joint ∨ n−1<br />
k=0 T −k ξ pour n assez grand (le sup <strong>de</strong>s<br />
diamètres <strong>de</strong>s atomes tend vers 0). Il suffit donc <strong>de</strong> démontrer que h(T, ξ) = 0<br />
ce qui s’effectue comme précé<strong>de</strong>mment. On peut aussi procé<strong>de</strong>r <strong>de</strong> la façon<br />
suivante : h(T, ξ) = lim n→∞ H(ξ| ∨ ∞<br />
k=1 T −k ξ) = 0 car le joint précé<strong>de</strong>nt engendre<br />
la tribu borélienne.<br />
On peut généraliser les résultats précé<strong>de</strong>nts aux cas <strong>de</strong>s translations sur le<br />
tore T d . (Exercice).<br />
7.1.4 Théorème <strong>de</strong> Shannon<br />
Théorème 7.1.6 (Shannon-Mc-Millan-Breiman) Si T est µ ergodique<br />
et si ξ est une partition mesurable finie<br />
n−1<br />
1<br />
lim<br />
n→∞ n I( ∨<br />
T −k ξ)(·) = h(ξ, T )<br />
k=0<br />
la convergence précé<strong>de</strong>nte ayant lieu µ-p.s et L 1 (µ).<br />
Démonstration.— Notons B n = ∨ n−1<br />
k=1 T −k ξ pour n ∈ N ∪ {∞} et B 0 =<br />
{∅, X}. On a d’après l’exercice <strong>de</strong> l’exercice suivant la proposition 7.1.1<br />
∨<br />
n−1<br />
I(<br />
et par conséquent<br />
Posons<br />
n−1<br />
I(<br />
k=0<br />
n−1<br />
∨<br />
T −k ξ) = I(ξ|<br />
k=1<br />
n−1<br />
∨<br />
T −k ξ) + I(<br />
k=1<br />
T −k ξ)<br />
n−1<br />
∨<br />
n−2<br />
∨<br />
= I(ξ| T −k ξ) + I( T −k ξ) ◦ T<br />
k=1<br />
k=0<br />
∨<br />
T −k ξ) = I(ξ|B 0 ) ◦ T n + I(ξ|B 1 ) ◦ T n−1 + · · · + I(ξ|B n ).<br />
k=0<br />
g n (·) = |I(ξ|B n )(·) − I(ξ|B ∞ (·)|,<br />
G M (·) = sup g n (·).<br />
n≥M
7.1. ENTROPIE MÉTRIQUE 93<br />
On a vu que G M (·) → 0 µ-p.p et L 1 (µ) quand M → ∞. Pour M > 0 on a<br />
n∑<br />
n∑<br />
I n (x) = (I(ξ|B k ) − I(ξ|B ∞ )) ◦ T n−k (x) + I(ξ|B ∞ ) ◦ T n−k (x)<br />
k=0<br />
M−1<br />
∑<br />
≤ g k ◦ T n−k (x) +<br />
k=0<br />
k=0<br />
n∑<br />
G M ◦ T n−k (x) +<br />
k=M<br />
M−1<br />
∑<br />
n−M<br />
∑<br />
≤ g k ◦ T n−k (x) + G M ◦ T l (x) +<br />
k=0<br />
l=0<br />
n∑<br />
I(ξ|B ∞ ) ◦ T n−k (x)<br />
k=0<br />
n∑<br />
I(ξ|B ∞ ) ◦ T l (x)<br />
D’après le théorème <strong>de</strong> Birkhoff ( µ est ergodique) on a µ-p.s<br />
1<br />
n∑<br />
∫<br />
lim I(ξ|B ∞ ) ◦ T l (x) = I(ξ|B ∞ )dµ<br />
n→∞ n<br />
l=0<br />
X<br />
l=0<br />
= h(T, ξ)<br />
tandis que<br />
n−M<br />
1 ∑<br />
∫<br />
lim G M ◦ T l (x) = G M dµ ≤ ɛ M .<br />
n→∞ n<br />
l=0<br />
X<br />
Enfin on a µ-p.p 8<br />
M−1<br />
1 ∑<br />
lim g k ◦ T n−k (x) = 0.<br />
n→∞ n<br />
Au total, pour µ-presque tout x et tout M<br />
lim sup | 1 ∫<br />
n→∞ n I(ξ)(x) − h(T, ξ)| ≤ G M dµ ≤ ɛ M .<br />
X<br />
Comme ɛ M → 0 on a bien la conclusion.<br />
k=0<br />
Remarque : Le théorème précé<strong>de</strong>nt se reformule <strong>de</strong> la façon suivante ; si<br />
on note C ξ,n (x) l’atome <strong>de</strong> la partition ∨ n−1<br />
k=0 T −k ξ qui contient x, on a pour<br />
µ-p.t x<br />
1<br />
lim<br />
n→∞ n log µ(C ξ,n(x)) = −h(T, ξ).<br />
Il est facile <strong>de</strong> voir que pour tous α, β > 0 il existe un n 0 tel que pour tout<br />
n ≥ n 0 il existe C n ∈ X tel que : 1) µ(C n ) ≥ 1 α ; 2) C n admet une partition<br />
mesurable finie dont les atomes sont <strong>de</strong> µ-mesures comprises entre e −n(h+β)<br />
et e −n(h−β) et dont le nombre d’atome est dans [e n(h−β) , e n(h+β) ].<br />
8 si h est une fonction L 1 (µ), alors h ◦ T n /n converge µ − pp vers 0 (appliquer p.ex le<br />
théorème <strong>de</strong> Birkhoff à h et h ◦ T et faire la différence <strong>de</strong>s sommes ergodiques).<br />
✷
94 CHAPITRE 7. ENTROPIE<br />
7.1.5 Entropie d’un facteur, d’un pro<strong>du</strong>it et d’une puissance<br />
Théorème 7.1.7 Si (Y, B Y , S, ν) est un facteur <strong>de</strong> (X, B X , T, ν) on a<br />
h ν (S) ≤ h µ (T ).<br />
Démonstration.— Soit η une partition finie <strong>de</strong> Y et posons ξ = f −1 η où<br />
f : X → Y est la projection définissant le facteur. Il est facile <strong>de</strong> vérifier que<br />
et donc<br />
1<br />
n H µ(ξ ∨ . . . ∨ T −(n−1) ξ) = 1 n H ν(η ∨ . . . ∨ S −(n−1) η),<br />
h ν (S, η) = h µ (T, ξ) ≤ h µ (T ).<br />
Cette i<strong>de</strong>ntité étant vraie pour toute partition finie η on a la conclusion.<br />
Corollaire 7.1.1 Si (X, B X , T, µ) et (Y, B Y , S, ν) sont isomorphes h µ (T ) =<br />
h ν (S).<br />
Théorème 7.1.8 Si (X i , B i , µ i , T i ), i = 1, 2 sont <strong>de</strong>ux systèmes dynamiques<br />
alors le système pro<strong>du</strong>it (X 1 × X 2 , B 1 ⊗ B 2 , µ 1 ⊗ µ 2 , T 1 × T 2 ) vérifie<br />
h µ1 ⊗µ 2<br />
(T 1 × T 2 ) = h µ1 (T 1 ) + h µ2 (T 2 ).<br />
Démonstration.— Soient ξ (i) = {C (i)<br />
k } une partition mesurable finie <strong>de</strong> X i,<br />
i = 1, 2. Il est facile <strong>de</strong> voir que la partition ξ := ξ (1) ⊗ ξ (2) = {C (1)<br />
k<br />
× C (2)<br />
l<br />
}<br />
vérifie<br />
∨<br />
n−1<br />
∨<br />
n−1<br />
∨<br />
T −s ξ) = H( T −s ξ (1) ) + H( T −s ξ (2) ),<br />
n−1<br />
H(<br />
s=0<br />
et que par conséquent<br />
s=0<br />
s=0<br />
h(T 1 × T 2 , ξ (1) ⊗ ξ (2) ) = h(T 1 , ξ (1) ) + h(T 2 , ξ (2) ).<br />
Si à présent on choisit <strong>de</strong>ux suites <strong>de</strong> partitions ξ n<br />
(i) ↑ B i (ce qui est possible<br />
car on suppose que les espaces sont <strong>de</strong> Lebesgue) on aura aussi ξ n (1) ⊗ ξ n<br />
(2) ↑<br />
B 1 ⊗ B 2 . Le théorème 7.1.4 permet <strong>de</strong> conclure.<br />
Théorème 7.1.9 Pour m ∈ Z (m ∈ N si T n’est pas inversible) on a<br />
h µ (T m ) = |m|h µ (T ).<br />
✷<br />
✷
7.1. ENTROPIE MÉTRIQUE 95<br />
Démonstration.— Supposons m > 0. Soit ξ une partition mesurable finie<br />
et posons η m = ξ ∨ T −1 ξ ∨ · · · ∨ T m−1 ξ. On a<br />
∨<br />
nm−1<br />
H(<br />
k=0<br />
n−1<br />
∨<br />
T −k ξ) = H(<br />
l=0<br />
et divisant par n|m| et faisant n → ∞ on obtient<br />
(T m ) −l η m )<br />
h(T, ξ) = 1mh(T m , η m ).<br />
On a donc |m|h(T, ξ) ≤ h(T m ) et donc |m|h(T ) ≤ h(T m ). Démontrons l’inégalité<br />
inverse. Pour toute partition ξ<br />
h(T m , ξ) = lim<br />
n H(ξ ∨ T −m ξ ∨ · · · ∨ T −mn ξ)<br />
m<br />
≤ lim<br />
n→∞ mn H(ξ ∨ T −1 ∨ T −2 ξ · · · ∨ T −mn ξ)<br />
≤ mh(T, ξ),<br />
n→∞<br />
1<br />
ce qui termine la preuve <strong>du</strong> théorème.<br />
✷
96 CHAPITRE 7. ENTROPIE
Annexe A<br />
Calcul différentiel<br />
A.1 Théorèmes <strong>du</strong> Point Fixe<br />
Nous faisons auparavant quelques rappels sur <strong>de</strong>s théorèmes abstraits<br />
classiques.<br />
A.1.1<br />
Théorème <strong>du</strong> Point Fixe pour les applications<br />
contractantes<br />
Soit (A, d) un espace complet (c’est-à-dire un espace métrique dans lequel<br />
toute suite <strong>de</strong> Cauchy converge) . Nous disons que φ : A → A est<br />
ρ-contractante (0 ≤ ρ < 1) si pour tout x, y ∈ A,<br />
d(φ(x), φ(y)) ≤ ρ.d(x, y).<br />
Une application contractante est donc continue. Dans les applications que<br />
nous aurons à traiter A sera un ensemble fermé d’un espace <strong>de</strong> Banach E et<br />
on munira A <strong>de</strong> la distance,<br />
d(x, y) = ‖x − y‖ E ;<br />
une application ρ-contractante φ : A → A vérifie alors,<br />
‖φ(x) − φ(y)‖ E ≤ ρ.‖x − y‖ E ,<br />
(mais φ n’est pas nécessairement linéaire).<br />
Le théorème <strong>du</strong> Point Fixe <strong>de</strong> Picard est alors le suivant :<br />
Théorème A.1.1 (<strong>du</strong> point fixe <strong>de</strong> Picard) Avec les notations précé<strong>de</strong>ntes,<br />
soit φ : A → A une application ρ-contractante (0 ≤ ρ < 1). Alors φ admet<br />
un unique point fixe x ∈ A (i.e. φ(x) = x). Pour tout x 0 ∈ A la suite φ i (x 0 )<br />
converge vers x.<br />
97
98 ANNEXE A. CALCUL DIFFÉRENTIEL<br />
Démonstration.— Montrons déjà l’unicité par l’absur<strong>de</strong> : si φ(x 1 ) = x 1 , φ(x 2 ) =<br />
x 2 on a,<br />
d(x 1 , x 2 ) = d(φ(x 1 ), φ(x 2 )) ≤ ρd(x 1 , x 2 ),<br />
ce qui entraîne vu que 0 ≤ ρ < 1, d(x 1 , x 2 ) = 0.<br />
Montrons à présent l’existence. Choisissons x 0 ∈ A et posons x k = φ k (x)<br />
(où φ k désigne l’itéré k-ième <strong>de</strong> φ). Le fait que φ soit ρ-contractante montre<br />
que pour k ≥ 1,<br />
d(x k+1 , x k ) = d(φ(x k ), φ(x k−1 )) ≤ ρd(x k , x k−1 ),<br />
et par conséquent, en itérant cette inégalité,<br />
d(x k+1 , x k ) ≤ ρ k d(x 1 , x 0 ).<br />
L’inégalité triangulaire assure donc que pour tout p ≥ 1,<br />
d(x k+p , x k )<br />
≤<br />
≤ (<br />
≤<br />
p∑<br />
d(x k+j , x k+j−1 )<br />
j=1<br />
p∑<br />
ρ k+j )d(x 1 , x 0 )<br />
j=1<br />
ρ k . 1 − ρp<br />
1 − ρ d(x 1, x 0 )<br />
≤ ρ k d(x 1, x 0 )<br />
1 − ρ ,<br />
ce qui montre que la suite (x k ) est <strong>de</strong> Cauchy et converge donc vers un<br />
point x ∈ A. En faisant k → ∞ dans l’i<strong>de</strong>ntité φ(x k ) = x k+1 on obtient<br />
φ(x) = x, c’est-à-dire l’existence <strong>du</strong> point fixe et également la <strong>de</strong>rnière partie<br />
<strong>du</strong> théorème.<br />
Mentionnons une version à paramètre :<br />
Théorème A.1.2 Soient A un espace complet, L un espace métrique (non<br />
nécessairement complet) et 0 ≤ ρ < 1. Supposons que φ : A × L → A soit<br />
une application continue et que pour tout λ ∈ L l’application φ(·, λ) : A → A<br />
soit ρ-contractante. Alors, pour tout λ ∈ L il existe un unique point fixe x(λ)<br />
<strong>de</strong> φ(·, λ) et l’application x(·) : L → A est continue.<br />
Démonstration.— Définissons E comme étant l’ensemble <strong>de</strong>s fonctions continues<br />
<strong>de</strong> L dans A et munissons le <strong>de</strong> la norme <strong>de</strong> la convergence uniforme :<br />
✷
A.1. THÉORÈMES DU POINT FIXE 99<br />
c’est un espace complet. Définissons alors f : E → E, par f(x(·)) = φ(x(·), ·) :<br />
c’est une application ρ-contractante (c’est pratiquement immédiat, vue la définition<br />
<strong>de</strong> la convergence uniforme). Le théorème s’applique donc et fournit<br />
une unique application x(.) telle que f(x(·)) = x(·) c’est-à-dire, <strong>du</strong> fait <strong>de</strong> la<br />
définition <strong>de</strong> f la conclusion recherchée.<br />
Donnons enfin l’estimée suivante qui précise le théorème précé<strong>de</strong>nt :<br />
Proposition A.1.1 Si φ et ˜φ sont <strong>de</strong>ux applications ρ contractante <strong>de</strong> (A, d) →<br />
(A, d) admettant respectivement comme uniques points fixes x et ˜x on a,<br />
Démonstration.—<br />
d(x, ˜x) ≤ 1 d(φ(x), ˜φ(x)).<br />
1 − ρ<br />
Définissons ˜x n = ˜φ n (x) et majorons,<br />
d(x, ˜x n+1 ) = d(φ(x), ˜φ(˜x n ))<br />
≤ d(φ(x), ˜φ(x)) + d( ˜φ(x), ˜φ(˜x n ))<br />
≤ ɛ + ρd(x, ˜x n ),<br />
où on a noté ɛ = d(x, ˜φ(x)) = d(φ(x), ˜φ(x)). Si on note u n = d(x, ˜x n ), on a<br />
donc,<br />
ce qui est la conclusion.<br />
u n ≤ ɛ + ρɛ + ρ 2 ɛ + · · · + ρ n−1 ɛ<br />
ɛ<br />
≤<br />
1 − ρ ,<br />
Si l’on veut obtenir <strong>de</strong>s résultats sur la dépendance C k par rapport au<br />
paramètre, il faut faire <strong>de</strong>s hypothèses <strong>de</strong> différentiabilité sur φ. Cependant<br />
dans ce cadre il est souvent plus simple d’utiliser le théorème <strong>de</strong>s fonctions<br />
implicites que nous présentons plus loin.<br />
Théorème A.1.3 Soient A ⊂ E et L ⊂ F <strong>de</strong>s ouverts <strong>de</strong>s espace <strong>de</strong> Banach<br />
E et F et 0 ≤ ρ < 1. Supposons que φ : A × L → A soit <strong>de</strong> classe C k et que<br />
pour tout λ ∈ L l’application φ(·, λ) : A → A soit ρ-contractante. Si en outre<br />
κ :=<br />
sup ‖D 1 φ(x, λ)‖ < 1,<br />
(x,λ)∈A×L<br />
alors, pour tout λ ∈ L il existe un unique point fixe x(λ) <strong>de</strong> φ(·, λ) et l’application<br />
x(·) : L → A est C k . On a<br />
Dx(λ) = −(D 1 φ(x(λ), λ) − I) −1 D 2 φ(x(λ), λ).<br />
✷<br />
✷
100 ANNEXE A. CALCUL DIFFÉRENTIEL<br />
Démonstration.— Soit x 0 ∈ A et définissons par récurrence x 0 (λ) = x 0 et<br />
x n+1 (λ) = φ(x n (λ), λ). Les fonctions x n (λ) sont <strong>de</strong> classe C k et on a<br />
Dx n+1 (λ) = D 1 φ(x n (λ), λ)Dx n (λ) + D 2 φ(x n (λ), λ).<br />
Si on note u n = Dx n (λ), A n = D 1 φ(x n (λ), λ), b n = D 2 φ(x n (λ), λ), b =<br />
D 2 φ(x(λ), λ) On a u n+1 = A n u n + b n si bien que<br />
∑n−1<br />
u n = (A n−1 · · · A 1 )u 0 + (A n−1 · · · A k )b k + b n .<br />
k=1<br />
Comme ‖A n−1 · · · A k ‖ ≤ κ n , κ < 1, et puisque lim n→∞ ‖b n − b‖ = 0 (on a<br />
vu que x n (λ) converge vers x(λ)), la série précé<strong>de</strong>nte converge (Exercice :<br />
Pourquoi ). Ainsi Dx n (λ) converge au même titre que x n (λ). Par conséquent,<br />
λ ↦→ lim n→∞ x(λ) est dérivable. La convergence est en fait uniforme en λ<br />
d’après la proposition précé<strong>de</strong>nte et <strong>de</strong> ce fait x(·) est C 1 . Comme x(λ) =<br />
φ(x(λ), λ) on a Dx(λ) = −(D 1 φ(x(λ), λ) − I) −1 D 2 φ(x(λ), λ). Cette relation<br />
montre que x(·) est C k si φ l’est.<br />
A.2 Le théorème d’Inversion Locale et ses conséquences<br />
A.2.1<br />
Difféomorphismes<br />
Rappelons qu’un homéomorphisme f : U → V entre <strong>de</strong>ux ouverts U ⊂ E<br />
et V ⊂ F est une application continue <strong>de</strong> U dans F qui établit une bijection<br />
entre U et V et telle que son inverse f −1 : V → U est continue.<br />
Définition A.2.1 Nous dirons qu’un homéomorphisme f : U → V entre<br />
<strong>de</strong>ux ouverts U ⊂ E et V ⊂ F est un C k -difféomorphisme si f : U → V et<br />
f −1 : V → U sont <strong>de</strong> classe C k .<br />
Donnons le critère suivant pour déterminer si un homéomorphisme est un<br />
difféomorphisme :<br />
Proposition A.2.1 Avec les notations précé<strong>de</strong>ntes un homéomorphisme f :<br />
U → V est un C k -difféomorphisme si et seulement si f est <strong>de</strong> classe C k et<br />
si pour tout x ∈ U, Df(x) ∈ L c (E, F ) est une application linéaire continue<br />
inversible (dont l’inverse est continu). On a alors,<br />
∀y ∈ V, Df −1 (y) = [Df(f −1 (y))].<br />
✷
A.2. LE THÉORÈME D’INVERSION LOCALE ET SES CONSÉQUENCES101<br />
Démonstration.— Posons pour y = f(x) ∈ V , et h ∈ F suffisamment petit,<br />
x h = f −1 (y + h). On a alors,<br />
h = f(x h ) − f(x) = Df(x).h.(x h − x) + ‖x h − x‖ E ɛ(x h − x),<br />
où lim 0 ɛ = 0 et donc,<br />
‖x h − x‖ = (Df(x)) −1 .h + ‖x h − x‖(Df(x)) −1 .ɛ(x h − x);<br />
(A.1)<br />
comme x h tend vers x quand h tend vers 0 (puisque f −1 est continue) on a<br />
pour h suffisamment petit<br />
et donc,<br />
Au total,<br />
‖ɛ(x h − x)‖ ≤ 1 2 ‖(Df(x))−1 ‖ −1 ,<br />
‖x h − x‖ ≤ ‖(Df(x)) −1 ‖.‖h‖ + ‖x h − x‖‖(Df(x)) −1 ‖‖ɛ(x h − x)‖<br />
et l’égalité (A.1) montre que,<br />
≤ ‖(Df(x)) −1 ‖.‖h‖ + 1 2 ‖x h − x‖.<br />
‖x h − x‖ ≤ 2‖(Df(x)) −1 ‖.‖h‖,<br />
f −1 (y + h) − f −1 (y) = x h − x = (Df(x)) −1 .h + o(h),<br />
ce qui montre que f −1 est dérivable en y et que,<br />
Df −1 (y) = (Df(x)) −1 = [Df ◦ f −1 (y))] −1 .<br />
Cette <strong>de</strong>rnière égalité établit (en utilisant le théorème <strong>de</strong> composition et celui<br />
sur l’inversion) que f −1 est <strong>de</strong> classe C k .<br />
A.2.2<br />
Inversion locale<br />
Le théorème <strong>du</strong> point fixe précé<strong>de</strong>nt permet <strong>de</strong> démontrer le théorème<br />
fondamental suivant :<br />
Théorème A.2.1 (d’inversion locale) Soient E, F <strong>de</strong>ux espaces <strong>de</strong> Banach,<br />
f : E → F une application <strong>de</strong> classe C k (k ≥ 1) définie sur un<br />
voisinage <strong>de</strong> x 0 ∈ E <strong>de</strong> l’espace <strong>de</strong> Banach E et telle que f(x 0 ) = y 0 ∈ F .<br />
Supposons que Df(x 0 ) ∈ L(E, F ) soit inversible (et son inverse est donc<br />
continu) ; alors f est un difféomorphisme local d’un voisinage <strong>de</strong> x 0 sur un<br />
voisinage <strong>de</strong> y 0 .<br />
✷
102 ANNEXE A. CALCUL DIFFÉRENTIEL<br />
Démonstration.— Puisque [Df(x 0 )] −1 existe est continu, f réalisera un<br />
difféomorphisme d’un voisinage <strong>de</strong> x 0 sur un voisinage <strong>de</strong> y 0 si et seulement<br />
si,<br />
f 0 (·) = Df(0) −1 .(f(x 0 + ·) − y 0 ),<br />
réalise un difféomorphisme d’un voisinage <strong>de</strong> 0 ∈ E sur un voisinage <strong>de</strong><br />
0 ∈ E. Remarquons que f 0 est <strong>de</strong> classe C 1 et que l’on a,<br />
f(0) = 0<br />
Df 0 (0) = Id<br />
Posons alors pour u, v dans un voisinage <strong>de</strong> 0 ∈ E,<br />
˜f v (u) = v + (u − f 0 (u)),<br />
et observons que, f 0 (u) = v si et seulement si ˜fv (u) = u, c’est-à-dire si et<br />
seulement si f v admet u pour point fixe. Vérifions donc si f v est contractante<br />
dans un voisinage <strong>de</strong> 0 pour v suffisamment petit. Soient δ > 0 suffisamment<br />
petit et u 1 , u 2 dans la boule fermée B f (0, δ) <strong>de</strong> centre 0 et <strong>de</strong> rayon δ :<br />
‖ ˜f(u 1 ) − ˜f(u 2 )‖ = ‖(Id − f 0 )(u 1 ) − (Id − f 0 )(u 1 )‖,<br />
et d’après le théorème <strong>de</strong>s accroissements finis,<br />
‖(Id − f 0 )(u 1 ) − (Id − f 0 )(u 1 )‖ ≤<br />
sup ‖D(Id − f 0 )‖.‖u 1 − u 2 ‖;<br />
w∈B(0,δ)<br />
mais comme Df 0 (·) est continue sur un voisinage <strong>de</strong> 0 et que Df 0 (0) = Id<br />
on a, pourvu que δ soit assez petit,<br />
sup ‖D(Id − f 0 )(w)‖ ≤ 1<br />
w∈B f (0,δ)<br />
2 ,<br />
et l’application ˜f v est 1 2 -contractante sur B f(0, δ). On a en particulier (faire<br />
u 2 = 0),<br />
‖ ˜f(u 1 ) − v‖ ≤ 1 2 ‖u 1‖,<br />
et donc,<br />
‖ ˜f(u 1 )‖ ≤ ‖v‖ + 1 2 δ,<br />
ce qui prouve que si ‖v‖ ≤ δ/2, ˜f v envoit B f (0, δ) dans elle-même. Les conditions<br />
d’application <strong>du</strong> théorème <strong>du</strong> point fixe sont vérifiées et ˜f v admet donc<br />
un unique point fixe u v dans B f (0, δ).
A.2. LE THÉORÈME D’INVERSION LOCALE ET SES CONSÉQUENCES103<br />
En outre comme ˜f v (·) est continue en v, les hypothèses <strong>du</strong> théorème <strong>du</strong><br />
point fixe à paramètre sont vérifiées et on en dé<strong>du</strong>it que l’unique point fixe<br />
u v obtenu précé<strong>de</strong>mment dépend continument <strong>de</strong> v.<br />
Tout ceci montre que f réalise un homéomorphisme d’un voisinage <strong>de</strong><br />
x 0 sur un voisinage <strong>de</strong> y 0 et d’après la proposition A.2.1, f est donc un C k<br />
difféomorphisme d’un voisinage <strong>de</strong> x 0 sur un voisinage <strong>de</strong> y 0 .<br />
Nous illustrons la puissance <strong>du</strong> théorème d’inversion locale par la démonstration<br />
<strong>du</strong> théorème suivant : (Lemme <strong>de</strong> Morse) Si f : (R n , 0) → R est <strong>de</strong><br />
classe C 3 et est telle que A = D 2 f(0) est non dégénérée (i.e la forme quadratique<br />
D 2 f(0)(·, ·) est non dégénérée) alors il existe un difféomorphisme<br />
h : (R n , 0) → (R n , 0) tel que f ◦ h(x) = t xAx. Nous proposons la démonstration<br />
en exercice.<br />
Exercice a) Démontrer qu’il existe une application S <strong>de</strong> classe C 1 définie sur<br />
un voisinage <strong>de</strong> 0 ∈ R n et à valeurs dans l’espace <strong>de</strong>s matrices symétriques<br />
Sym n (R) telle que f(x) = t xAx + t xS(x)x avec S(0) = 0. (Utiliser Taylor<br />
intégral).<br />
b) Démontrer qu’il suffit <strong>de</strong> démontrer le résultat suivant : Soit A ∈ M n (R)<br />
une matrice symétrique non dégénérée et B ∈ R n la boule <strong>de</strong> centre 0 et<br />
<strong>de</strong> rayon 1. Il existe ε > 0 tel que si S ∈ C 1 (B, Sym n (R)) est <strong>de</strong> norme C 1<br />
plus petite que ε alors il existe ϕ ∈ C 1 (B, R n ) telle que t xAx + t xS(x)x =<br />
t (x + ϕ(x))A(x + ϕ(x)).<br />
c) On note E l’espace <strong>de</strong> Banach <strong>de</strong>s ϕ ∈ C 1 (B, R n ) telles que ϕ(0) = 0 et F<br />
l’espace <strong>de</strong> Banach <strong>de</strong>s S ∈ C 1 (B, Sym n (R)) telle que S(0) = 0. Intro<strong>du</strong>isons<br />
Φ : E → F , Φ(h)(x) = 2 t h(x)Ax + t h(x)Ah(x). Démontrer que Φ est un<br />
difféomorphisme local <strong>de</strong> (E, 0) → (F, 0).<br />
d) Conclure.<br />
Le corollaire suivant est également très utile :<br />
A.2.3<br />
Fonctions Implicites<br />
Théorème A.2.2 (<strong>de</strong>s fonctions implicites) Si f : E × F → E est C k ,<br />
vérifie f(x 0 , λ 0 ) = 0 et si D x f(x 0 , λ 0 ) ∈ L c (E, E) est inversible, alors l’ensemble<br />
<strong>de</strong>s solutions <strong>de</strong> f(x, λ) = 0 est dans un voisinage <strong>de</strong> (x 0 , λ 0 ) <strong>de</strong> la<br />
forme, (x(λ), λ) où λ → x(λ) est C k . On a alors ∂ λ x = −(D x f(x, λ)) −1 ◦D λ f.<br />
Démonstration.— On applique le théorème précé<strong>de</strong>nt à l’application définie<br />
sur un voisinage <strong>de</strong> (x 0 , λ 0 ) ∈ E × F à valeurs dans un voisinage <strong>de</strong><br />
(0, λ 0 ) i nE × F par φ(x, λ) = (f(x, λ), λ) qui est <strong>de</strong> classe C k . Calculons son<br />
✷
104 ANNEXE A. CALCUL DIFFÉRENTIEL<br />
application linéaire tangente Dφ(x 0 , λ 0 ) ∈ L c (E × F, E × F ) en (x 0 , λ 0 ). On<br />
a pour tout (∆x, ∆λ) ∈ E × F (nous utilisons une notation matricielle) :<br />
( ) ( )<br />
Dx f(x<br />
Dφ(x 0 , λ 0 ).(∆x, ∆λ) =<br />
0 , λ 0 ) D λ f(x 0 , λ 0 ) ∆x<br />
,<br />
0 Id F ∆λ<br />
qui a une forme trigonale et qui est inversible puisque par hypothèse D x f(x 0 , λ 0 ) ∈<br />
L c (E, E) l’est. On peut donc appliquer le théorème d’inversion locale : φ<br />
réalise un difféomorphisme <strong>de</strong> classe C k d’un voisinage <strong>de</strong> (x 0 , λ 0 ) dans un<br />
voisinage <strong>de</strong> (0, λ 0 ) et vue la forme <strong>de</strong> φ, le difféomorphisme inverse φ −1 est<br />
<strong>de</strong> la forme,<br />
φ −1 (y, λ) = (g(y, λ), λ),<br />
où g est <strong>de</strong> classe C k d’un voisinage <strong>de</strong> 0 à valeurs dans un voisinage <strong>de</strong> x 0 .<br />
On a donc,<br />
(x, λ) = (g(f(x, λ), λ), λ),<br />
pour tout (x, λ) dans un voisinage <strong>de</strong> (x 0 , λ 0 ) et par conséquent pour (x, λ)<br />
dans ce voisinage f(x, λ) = 0 si et seulement si,<br />
x = g(0, λ).<br />
Ceci termine la preuve <strong>du</strong> théorème <strong>de</strong>s fonctions implicites.<br />
✷<br />
A.2.4<br />
Théorème <strong>du</strong> rang constant<br />
Théorème A.2.3 Soient E un espace <strong>de</strong> Banach, F un espace <strong>de</strong> dimension<br />
finie m et x 0 ∈ E. Si f : (E, x 0 ) → (F, f(x 0 )) est une application <strong>de</strong> classe<br />
C k telle que pour tout x dans un voisinage <strong>de</strong> x 0 le rang <strong>de</strong> Df(x) (c’està-dire<br />
la dimension <strong>de</strong> ImDf(x)) est constant égal à p, alors, il existe <strong>de</strong>s<br />
difféomorphismes g : (R p ⊕ E ′ , 0) → (E, x 0 ) (E ′ étant un espace <strong>de</strong> Banach)<br />
et h : (F, f(x 0 )) → (R m , 0) tels que pour (t, s) ∈ R p ⊕ E ′<br />
h ◦ f ◦ g(t, s) = (t, 0 R m−p).<br />
Démonstration.— On peut supposer que F = R m et que x 0 = 0. Soit<br />
E ′ = ker Df(x 0 ). Puisque rgDf(x 0 ) est fini, il existe E ′′ ⊂ E <strong>de</strong> dimension<br />
finie égale à p tel que E = E ′ ⊕ E ′′ et tel que Df(x 0 ) restreinte à E ′′ soit<br />
un isomorphisme sur son image. Quitte à faire <strong>de</strong>s changements linéaires<br />
<strong>de</strong> coordonnées à la source et au but, on peut supposer que E ′′ = R p et<br />
Df(x 0 )·E = R p . Si on note f 1 , f 2 les projections <strong>de</strong> f respectivement sur R p ⊂<br />
F et sur son supplémentaire dans F on a que ∂ 1 f 1 (0, 0) est un isomorphisme
A.3. SOUS-VARIÉTÉS DE R M 105<br />
<strong>de</strong> E ′′ = R p sur R p ⊂ F . D’après le théorème d’inversion locale l’application<br />
ϕ : (u 1 , u 2 ) ↦→ (f 1 (u 1 , u 2 ), u 2 ) est donc un difféomorphisme local en (0, 0). Son<br />
inverse g est <strong>de</strong> la forme g : (t, u 2 ) ↦→ (u 1 (t, u 2 ), u 2 ) si bien que f 1 ◦g(t, u 2 ) = t.<br />
L’application f ◦ g est donc <strong>de</strong> la forme (t, u 2 ) ↦→ (t, f 2 ◦ g(t, u 2 )) et comme<br />
elle est <strong>de</strong> rang égal à p 1 pour tout (t, u 2 ) dans un voisinage <strong>de</strong> 0 on a<br />
nécessairement ∂ 2 (f 2 ◦ g)(t, u 2 ) = 0 2 pour tout (t, u 2 ) dans un voisinage <strong>de</strong> 0.<br />
Par conséquent f 2 ◦ g(t, u 2 ) ne dépend que <strong>de</strong> t. Si on pose ψ(t) = f 2 ◦ g(t, 0)<br />
alors l’application h : (t, u 2 ) ↦→ (t, u 2 − ψ(t)) est un difféomorphisme local et<br />
on a h ◦ f ◦ g(t, s) = (t, 0).<br />
✷<br />
A.3 Sous-variétés <strong>de</strong> R m<br />
A.3.1<br />
Définition, exemples<br />
Définition A.3.1 Soit M ⊂ R m . On dit que M est une sous-variété <strong>de</strong> R m<br />
<strong>de</strong> classe C k si pour tout x ∈ M il existe un entier p ≤ m, un voisinage<br />
ouvert U x ⊂ R m contenant x et un difféomorphisme <strong>de</strong> classe C k ϕ : U x →<br />
ϕ(U x ) ⊂ R m tel que l’image <strong>de</strong> M ∩ U x soit R p ⊕ {0} m−p . On dira que (U x , ϕ)<br />
est une carte en x.<br />
Il n’est pas difficile <strong>de</strong> voir que si M est connexe, l’entier p <strong>de</strong> la définition<br />
précé<strong>de</strong>nte ne dépend pas <strong>du</strong> point x ; on l’appelle la dimension <strong>de</strong> M et on<br />
note p = dimM.<br />
Exemple Soient H : R m → R une application lisse (C ∞ ) et c ∈ H(R m ) ⊂ R.<br />
Si pour tout x ∈ H −1 (c) on a DH(x) (qui est une forme linéaire sur R m )<br />
est non nulle, alors H −1 (c) est une sous-variété <strong>de</strong> dimension m − 1. C’est<br />
une conséquence <strong>du</strong> théorème d’inversion locale (par exemple). Exercice<br />
Démontrer le résultat précé<strong>de</strong>nt.<br />
La proposition suivante est un outil utile pour démontrer qu’un ensemble<br />
est une sous-variété.<br />
Proposition A.3.1 Les propositions suivantes sont équivalentes :<br />
(1) M est une sous-variété <strong>de</strong> R m <strong>de</strong> dimension p<br />
(2) M s’écrit localement comme un graphe : pour tout x ∈ M il existe un<br />
voisinage ouvert U x <strong>de</strong> x dans R m , une décomposition en sous-espaces<br />
1 D(f ◦ g) = Df ◦ g · Dg, Dg est un isomorphisme et Df ( <strong>de</strong> rang p )<br />
2 Ip 0<br />
la matrice bloc représentant D(f ◦ g) est <strong>de</strong> la forme<br />
∗ ∂ 2 (f 2 ◦ g)
106 ANNEXE A. CALCUL DIFFÉRENTIEL<br />
vectoriels R m = F 1 ⊕ F 2 , avec p := dim F 1 (dim F 2 = m − p) et une<br />
fonction S <strong>de</strong> classe C k S : F 1 ∩ U x → F 2 telle que M ∩ U x soit le<br />
graphe <strong>de</strong> S : S = {x 1 ⊕ x 2 ∈ U x , x 1 ∈ F 1 , x 2 ∈ F 2 : x 2 = S(x 1 )}<br />
(3) pour tout x ∈ M il existe un voisinage ouvert U x <strong>de</strong> x et <strong>de</strong>s fonctions<br />
<strong>de</strong> classe C k ϕ 1 , . . . , ϕ m−p définies sur U x et à valeurs réelles telles<br />
que : (a) M ∩ U x coïnci<strong>de</strong> avec l’ensemble <strong>de</strong>s x ∈ U x tels que ϕ 1 (x) =<br />
· · · = ϕ m−p (x) = 0 et (b) les formes linéaires dϕ 1 (x), . . . , dϕ m−p (x)<br />
sont linéairement indépendantes.<br />
Exercice Soit E, F <strong>de</strong>ux espaces vectoriels <strong>de</strong> dimensions finies et r ≤<br />
(dim E, dim F ). Démontrer que l’ensemble L r (E, F ) <strong>de</strong>s endomorphismes<br />
A ∈ L(E, F ) <strong>de</strong> rang r est une sous-variété <strong>de</strong> dimension (dim E −r)(dim F −<br />
r). [Indication : Soit Z 0 <strong>de</strong> rang r. On peut ( supposer, ) quitte à changer <strong>de</strong><br />
Ir 0<br />
base que A 0 est représenté par la matrice . Notons U l’ensemble <strong>de</strong>s<br />
0 0<br />
( ) A B<br />
Z ∈ L(E, F ) qui se représentent dans cette base sous la forme<br />
C D<br />
(A matrice r × r) avec <strong>de</strong>t A ≠ 0. C’est un voisinage ouvert <strong>de</strong> Z 0 . On a<br />
L r (E, F ) ∩ U = {Z : D = CA −1 B}]<br />
A.3.2<br />
Espace tangent<br />
Définition A.3.2 (Proposition et définition) Soient M une sous-variété<br />
<strong>de</strong> R m et x ∈ M. L’espace tangent T x M en x à M est le sous-espace vectoriel<br />
<strong>de</strong> R m qui a la propriété suivante : pour toute carte (resp. une carte) (U x , ϕ)<br />
en x, T x M := ImD(ϕ −1 )(x) · (R p ⊕ {0} m−p ).<br />
Exercice : Décrire localement l’espace tangent <strong>de</strong> T x M dans chacune <strong>de</strong>s<br />
représentations données par la proposition A.3.1.<br />
Exercice : Démontrer que l’espace tangent en v ∈ L r (E, F ) est l’espace<br />
vectoriel {w ∈ L(E, F ) : w(ker v) ⊂ Imv}.<br />
Définition A.3.3 (Proposition et définition) Soient M ⊂ R m et N ⊂<br />
R n <strong>de</strong>ux sous-variétés et f : M → N. On dit que f est <strong>de</strong> classe C k si pour<br />
tout x ∈ M et tout choix (resp. un choix) <strong>de</strong> cartes (U x , ϕ) et (V f(x) , ψ) en<br />
x ∈ M et f(x) ∈ N l’application f ϕ,ψ := ψ ◦ f ◦ ϕ −1 | R p ⊕{0} n−p est <strong>de</strong> classe<br />
C k . L’application linéaire, indépendante <strong>du</strong> choix <strong>de</strong>s cartes,<br />
Dψ −1 (ψ(f(x))) ◦ Df ϕ,ψ (ϕ(x)) ◦ Dϕ : T x M → T f(x) N<br />
est appelée application linéaire tangente <strong>de</strong> f en x.
A.3. SOUS-VARIÉTÉS DE R M 107<br />
A.3.3<br />
Groupes et algèbres <strong>de</strong> Lie linéaires<br />
Définition A.3.4 Un groupe <strong>de</strong> Lie linéaire est un sous-groupe fermé <strong>de</strong><br />
GL(n, R).<br />
Exemples : Il est facile <strong>de</strong> vérifier que les groupes suivants sont <strong>de</strong>s groupes<br />
<strong>de</strong> Lie :<br />
SL(n, R) = {A ∈ GL(n, R) : <strong>de</strong>t A = 1}<br />
SO(n, R) = {A ∈ GL(n, R) : t AA = I, <strong>de</strong>t A = 1}<br />
( ) 0<br />
Sp(2n, R) = {A ∈ GL(n, R) : t In<br />
AJA = J}, J =<br />
−I n 0<br />
Remarquons que le SL(n, R) est l’ensemble <strong>de</strong>s transformations linéaires qui<br />
préservent le volume <strong>de</strong> R n , SO(n, R) est l’ensemble <strong>de</strong>s transformations<br />
linéaires qui préservent l’orientation et la norme euclidienne sur R n q(v) = t vv<br />
(v est un vecteur colonne) et Sp(2n, R) est l’ensemble <strong>de</strong>s transformations<br />
linéaires <strong>de</strong> R 2n qui préservent la forme symplectique ω(v, w) = t vJw.<br />
On a alors le théorème non trivial suivant :<br />
Théorème A.3.1 Un groupe <strong>de</strong> Lie linéaire est une sous-variété <strong>de</strong> R n2 .<br />
Exercice Démontrer directement que les groupes SL(n, R), SO(n, R), Sp(2n, R)<br />
sont <strong>de</strong>s sous-variétés, calculer leurs dimensions et démontrer que<br />
T I SL(n, R) = {a ∈ M n (R) : Tr(a) = 0}<br />
T I SO(n, R) = {a ∈ M n (R) : t a + a = 0}<br />
T I Sp(2n, R) = {a ∈ M 2n (R) : t aJ + Ja = 0}.<br />
A.3.4<br />
Variétés<br />
Soit M une espace topologique. Etant donnés U un ouvert <strong>de</strong> M et ϕ :<br />
U → ϕ(U) ⊂ R n un homéomorphisme, on dit que (U, ϕ) est une carte locale.<br />
Définition A.3.5 Une variété <strong>de</strong> classe C k est un espace topologique M<br />
muni d’une famille A <strong>de</strong> cartes telle que : (a) les U (pour lesquels (U, ϕ) ∈ A)<br />
forment un recouvrement <strong>de</strong> M ; (b) pour toutes cartes (U, ϕ) et (V, ψ) <strong>de</strong> A<br />
l’application ϕ ◦ ψ −1 : ϕ(U) ∩ ψ(V ) → R n est un difféomorphisme local.
108 ANNEXE A. CALCUL DIFFÉRENTIEL<br />
Il est facile <strong>de</strong> voir que toute sous-variété <strong>de</strong> R m est une variété. En fait la<br />
réciproque est vraie : toute variété peut être vue (on dit plongée) comme une<br />
sous-variété d’un espace R p pourvu que p soit suffisamment grand (p ≥ 2n+1<br />
dans le cas <strong>de</strong>s variétés C ∞ ) ; c’est un théorème <strong>de</strong> Whitney.<br />
Exemples Le groupe (Z n , +) est un sous-groupe <strong>de</strong> (R n , +). Le quotient<br />
R n /Z n est par définition l’ensemble <strong>de</strong>s classes d’équivalence <strong>de</strong> la relation<br />
d’équivalence x ≡ y ssi x − y ∈ Z n , c’est-à-dire est l’ensemble R n /Z n =<br />
{x + Z n , x ∈ R n }. On note T n = R n /Z n , le tore <strong>de</strong> dimension n. C’est par<br />
construction un groupe abélien (x + Z n ) + (y + Z n ) = (x + y) + Z n . On peut<br />
canoniquement le munir d’une topologie <strong>de</strong> la façon suivante : un ouvert <strong>de</strong><br />
T n est un ensemble <strong>de</strong> la forme U + Z n = {u + Z n , u ∈ U} = {U + k, k ∈ Z n }<br />
où U est un ouvert <strong>de</strong> R n . Munissons à présent T n d’une structure <strong>de</strong> variété :<br />
l’ensemble <strong>de</strong>s V B = B +Z n ou B décrit l’ensemble <strong>de</strong>s boules <strong>de</strong> R n <strong>de</strong> rayon<br />
strictement plus petit que 1/2 est un recouvrement ouvert <strong>de</strong> T n . Pour un tel<br />
V B on définit ϕ B : V B → R n qui à tout point <strong>de</strong> la forme x + k x ∈ B, k ∈ Z n<br />
associe x. C’est une application qui est bien définie puisqu’un point <strong>de</strong> V B<br />
s’écrit <strong>de</strong> façon unique sous cette forme (le rayon <strong>de</strong> la boule est strictement<br />
plus petit que 1/2). Il est facile <strong>de</strong> voir que ϕ B est un homéomorphisme local<br />
et que si B et B ′ sont <strong>de</strong>ux boules <strong>de</strong> rayon strictement plus petits que 1/2<br />
l’application ϕ B ◦ ϕ −1<br />
B<br />
est <strong>de</strong> la forme x ↦→ x + k − k ′ . La famille (U ′<br />
B , ϕ B ) B<br />
est donc un atlas.<br />
Cette construction se généralise à <strong>de</strong>s situations plus générales (quotient d’un<br />
groupe <strong>de</strong> Lie par un sous-groupe fermé).<br />
Tout comme dans le cas <strong>de</strong>s sous-variétés, on peut définir la notion d’application<br />
différentiable entre <strong>de</strong>ux variétés M et N : il suffit d’adapter celle<br />
que l’on a donnée dans le cas <strong>de</strong>s sous-variétés. On peut également définir<br />
la notion d’espace tangent en un point d’une variété. Une définition possible<br />
repose sur le lemme suivant<br />
Lemme A.3.1 Soient γ 1 , γ 2 <strong>de</strong>ux applications <strong>de</strong> classe C 1 <strong>de</strong> ] − 1, 1[→<br />
M telles que γ 1 (0) = γ 2 (0) = x. Si dans une carte (U, ϕ), x ∈ U on a<br />
(ϕ −1 ◦ γ 1 ) ′ (0) = (ϕ −1 ◦ γ 2 ) ′ (0) alors dans tout autre carte (V, ψ) x ∈ V , on<br />
a (ψ −1 ◦ γ 1 ) ′ (0) = (ψ −1 ◦ γ 2 ) ′ (0). On écrit γ 1 ∼ γ 2 ; cette relation est une<br />
relation d’équivalence. En outre si γ 3 :] − 1, 1[→ M, γ 3 (0) = x est C 1 et si<br />
dans une carte (ϕ −1 ◦ γ 3 ) ′ (0) = (ϕ −1 ◦ γ 1 ) ′ (0) + (ϕ −1 ◦ γ 2 ) ′ (0) alors dans toute<br />
autre carte (ψ −1 ◦ γ 3 ) ′ (0) = (ψ −1 ◦ γ 1 ) ′ (0) + (ψ −1 ◦ γ 2 ) ′ (0).<br />
D’après le lemme, l’espace <strong>de</strong>s chemins γ :] − 1, 1[→ M tels que γ(0) = x<br />
quotienté par ∼ peut être muni d’une structure d’espace vectoriel. C’est ce<br />
que l’on appelle l’espace tangent en x à M que l’on note T x M.
A.3. SOUS-VARIÉTÉS DE R M 109<br />
Une autre façon <strong>de</strong> définir l’espace tangent T x M est la suivante : si A<br />
est l’atlas <strong>de</strong>s cartes, α = (U α , ϕ α ) et A x la sous-collection <strong>de</strong>s α tels que<br />
x ∈ U α , on considère dans l’espace vectoriel (R n ) Ax <strong>de</strong>s suites (v α ) α∈Ax (muni<br />
<strong>de</strong> la structure d’espace vectoriel pro<strong>du</strong>it) le sous-espace vectoriel <strong>de</strong>s suites<br />
(v α ) α∈Ax vérifiant la relation <strong>de</strong> compatibilité suivante : pour tous α, β, v β =<br />
D(ϕ β ◦ ϕ −1<br />
α )(ϕ a (x)) · v β . Il est facile <strong>de</strong> voir que c’est bien un sous-espace<br />
vectoriel.<br />
Définissons à présent l’espace tangent <strong>de</strong> la variété M comme l’union<br />
disjointe <strong>de</strong>s T x M où x varie dans M : T M = {(x, v) : x ∈ M, v ∈ T x M} et<br />
notons π : T M → M l’application qui à (x, v) ∈ T M associe x. Il est alors<br />
possible <strong>de</strong> définir une structure <strong>de</strong> variété différentielle sur T M compatible<br />
avec celle <strong>de</strong> M dans le sens où l’application π : T M → M soit différentiable.<br />
Exercice : Le faire.