10.01.2015 Views

Systèmes Dynamiques Notes du cours de M2

Systèmes Dynamiques Notes du cours de M2

Systèmes Dynamiques Notes du cours de M2

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Systèmes</strong> <strong>Dynamiques</strong><br />

<strong>Notes</strong> <strong>du</strong> <strong>cours</strong> <strong>de</strong> <strong>M2</strong><br />

Raphaël KRIKORIAN<br />

Université Paris 6<br />

Année 2008-2009


Table <strong>de</strong>s matières<br />

1 Quelques Notions <strong>de</strong> Dynamique 7<br />

1.1 <strong>Systèmes</strong> dynamiques . . . . . . . . . . . . . . . . . . . . . . . 7<br />

2 Dynamique Topologique 9<br />

2.1 Récurrence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9<br />

2.2 Irré<strong>du</strong>ctibilité . . . . . . . . . . . . . . . . . . . . . . . . . . . 10<br />

2.2.1 Minimalité . . . . . . . . . . . . . . . . . . . . . . . . . 10<br />

2.2.2 Transitivité . . . . . . . . . . . . . . . . . . . . . . . . 11<br />

2.2.3 Mélange topologique . . . . . . . . . . . . . . . . . . . 13<br />

2.3 Décalages (ou shifts) . . . . . . . . . . . . . . . . . . . . . . . 13<br />

2.3.1 Shift <strong>de</strong> Bernoulli . . . . . . . . . . . . . . . . . . . . . 13<br />

2.3.2 Sous-shifts <strong>de</strong> type fini . . . . . . . . . . . . . . . . . . 14<br />

2.4 Application à la preuve <strong>du</strong> théorème <strong>de</strong> van <strong>de</strong>r Waer<strong>de</strong>n . . . 17<br />

3 Mesures Invariantes 21<br />

3.1 Ergodicité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />

3.1.1 Premiers exemples . . . . . . . . . . . . . . . . . . . . 25<br />

3.2 Les Théorèmes ergodiques . . . . . . . . . . . . . . . . . . . . 27<br />

3.2.1 Le point <strong>de</strong> vue spectral et le théorème <strong>de</strong> Von Neumann 27<br />

3.2.2 Convergence presque sûre . . . . . . . . . . . . . . . . 29<br />

3.3 Liens avec la dynamique topologique . . . . . . . . . . . . . . 31<br />

3.3.1 Existence <strong>de</strong> mesures ergodiques . . . . . . . . . . . . . 31<br />

3.3.2 Points génériques . . . . . . . . . . . . . . . . . . . . . 33<br />

3.3.3 Unique ergodicité . . . . . . . . . . . . . . . . . . . . . 33<br />

3.4 Mélange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38<br />

4 Homéomorphismes et difféomorphismes <strong>du</strong> cercle 43<br />

4.1 Homéomorphismes <strong>du</strong> cercle . . . . . . . . . . . . . . . . . . . 43<br />

4.1.1 Forme <strong>de</strong>s relevés d’un homéomorphisme <strong>du</strong> cercle . . . 43<br />

4.1.2 Nombre <strong>de</strong> rotation . . . . . . . . . . . . . . . . . . . . 45<br />

4.1.3 Le théorème <strong>de</strong> Poincaré . . . . . . . . . . . . . . . . . 48<br />

3


4 TABLE DES MATIÈRES<br />

4.2 Difféomorphismes <strong>du</strong> cercle . . . . . . . . . . . . . . . . . . . . 51<br />

4.2.1 Rappels sur les fractions continues . . . . . . . . . . . 51<br />

4.2.2 Théorème <strong>de</strong> Denjoy . . . . . . . . . . . . . . . . . . . 54<br />

4.2.3 Contre-exemples <strong>de</strong> Denjoy . . . . . . . . . . . . . . . 56<br />

4.2.4 Le Théorème d’Herman-Yoccoz . . . . . . . . . . . . . 57<br />

4.2.5 Théorème d’Arnold . . . . . . . . . . . . . . . . . . . . 57<br />

5 Hyperbolicité 59<br />

5.1 Point fixe hyperbolique d’un difféomorphisme . . . . . . . . . 59<br />

5.2 Stabilité structurelle <strong>de</strong>s automorphismes <strong>du</strong> tore . . . . . . . 63<br />

5.2.1 Forme <strong>de</strong>s homéomorphismes <strong>du</strong> tore . . . . . . . . . . 63<br />

5.2.2 Conjugaison topologique . . . . . . . . . . . . . . . . . 64<br />

5.3 Variétés stables et instables . . . . . . . . . . . . . . . . . . . 65<br />

6 Théorie spectrale 69<br />

6.1 Le théorème spectral . . . . . . . . . . . . . . . . . . . . . . . 70<br />

6.2 Transformations à spectre discret . . . . . . . . . . . . . . . . 72<br />

6.3 Mélange faible . . . . . . . . . . . . . . . . . . . . . . . . . . . 73<br />

6.4 Facteur <strong>de</strong> Kronecker . . . . . . . . . . . . . . . . . . . . . . . 77<br />

6.5 Couplages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78<br />

6.6 Mélange faible d’ordre supérieur . . . . . . . . . . . . . . . . . 79<br />

6.7 Argument <strong>de</strong> Hopf et Théorie spectrale . . . . . . . . . . . . . 80<br />

7 Entropie 83<br />

7.1 Entropie métrique . . . . . . . . . . . . . . . . . . . . . . . . . 83<br />

7.1.1 Entropie d’une partition finie . . . . . . . . . . . . . . 83<br />

7.1.2 Entropie d’une transformation . . . . . . . . . . . . . . 86<br />

7.1.3 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . 91<br />

7.1.4 Théorème <strong>de</strong> Shannon . . . . . . . . . . . . . . . . . . 92<br />

7.1.5 Entropie d’un facteur, d’un pro<strong>du</strong>it et d’une puissance 94<br />

A Calcul différentiel 97<br />

A.1 Théorèmes <strong>du</strong> Point Fixe . . . . . . . . . . . . . . . . . . . . . 97<br />

A.1.1 Théorème <strong>du</strong> Point Fixe pour les applications contractantes<br />

. . . . . . . . . . . . . . . . . . . . . . . . . . . 97<br />

A.2 Le théorème d’Inversion Locale et ses conséquences . . . . . . 100<br />

A.2.1 Difféomorphismes . . . . . . . . . . . . . . . . . . . . . 100<br />

A.2.2 Inversion locale . . . . . . . . . . . . . . . . . . . . . . 101<br />

A.2.3 Fonctions Implicites . . . . . . . . . . . . . . . . . . . 103<br />

A.2.4 Théorème <strong>du</strong> rang constant . . . . . . . . . . . . . . . 104<br />

A.3 Sous-variétés <strong>de</strong> R m . . . . . . . . . . . . . . . . . . . . . . . . 105


TABLE DES MATIÈRES 5<br />

A.3.1 Définition, exemples . . . . . . . . . . . . . . . . . . . 105<br />

A.3.2 Espace tangent . . . . . . . . . . . . . . . . . . . . . . 106<br />

A.3.3 Groupes et algèbres <strong>de</strong> Lie linéaires . . . . . . . . . . . 107<br />

A.3.4 Variétés . . . . . . . . . . . . . . . . . . . . . . . . . . 107


6 TABLE DES MATIÈRES


Chapitre 1<br />

Quelques Notions <strong>de</strong> Dynamique<br />

1.1 <strong>Systèmes</strong> dynamiques<br />

Un système dynamique est la donnée d’un ensemble X (l’espace <strong>de</strong>s<br />

phases) et d’un groupe G agissant sur X. Bien souvent ce groupe est Z et on<br />

dit que le système dynamique est discret ou R et on parle alors <strong>de</strong> système<br />

dynamique continu. On peut considérer cependant <strong>de</strong>s dynamiques associées<br />

à <strong>de</strong>s groupes <strong>de</strong> Lie, par exemple SL(2, R). On peut également considérer<br />

l’action <strong>de</strong> semi-groupes sur G et on parle <strong>de</strong> dynamiques non-inversibles.<br />

Une action <strong>du</strong> groupe Z sur X est équivalente à l’itération d’une application<br />

bijective f : X → X ; plus généralement l’itération d’une application<br />

f : X → X non nécéssairement injective est équivalente à l’action <strong>du</strong> semigroupe<br />

N sur X. Ces exemples seront les principaux sujets d’étu<strong>de</strong> <strong>de</strong> ce<br />

<strong>cours</strong>.<br />

Une action <strong>de</strong> R sur X est équivalente à un groupe à un paramètre réel<br />

<strong>de</strong> bijections <strong>de</strong> X sur X.<br />

Pour obtenir <strong>de</strong>s objets d’étu<strong>de</strong> intéressants, il faut supposer que l’espace<br />

X et la dynamique sont munis <strong>de</strong> structure supplémentaires.<br />

Quand X est un espace muni d’une σ-algèbre B (et d’une mesure <strong>de</strong> probabilité<br />

µ ) et que f : X → X est une application mesurable, la dynamique est<br />

dite mesurable ;<br />

quand X est un espace topologique (muni d’une topologie U) et que l’action<br />

<strong>de</strong> Z est continue (ou l’application f : X → X est continue) on dit que l’on<br />

a à faire à un système dynamique topologique ;<br />

si X est une variété différentiable et f : X → X est <strong>de</strong> classe C k on dit que<br />

la dynamique est différentiable.<br />

L’objet <strong>de</strong> la théorie ergodique est l’étu<strong>de</strong> <strong>de</strong>s dynamiques mesurables.<br />

7


8 CHAPITRE 1. QUELQUES NOTIONS DE DYNAMIQUE<br />

Définition 1.1.1 Un système dynamique mesurable est la donnée d’un espace<br />

mesurable (X, B) et d’une application f : X → X mesurable : pour tout<br />

B ∈ B, f −1 (B) ∈ B. Si f est bijective et que f −1 est également mesurable on<br />

dit que la dynamique est inversible.<br />

Dans la pratique, nos espaces mesurables sont munis d’une mesure <strong>de</strong><br />

probabilité µ.<br />

Définition 1.1.2 Un système dynamique mesuré est la donnée <strong>du</strong>n espace<br />

mesuré (X, B, µ) et d’une application f : X 1 → X 2 où X −X 1 et X −X 2 sont<br />

µ-négligeables, f est mesurable et préserve la mesure µ : pour tout B ∈ B,<br />

µ(f −1 (B)) = µ(B). Si f est bijective et que f −1 est également mesurable on<br />

dit que la dynamique est inversible.<br />

Exercice Soit S : R/Z définie par Sx = 2x. Montrer que S est bien définie<br />

et montrer que pour tout entier n, x = p/(2 n − 1) (0 ≤ p < 2 n − 1) est<br />

un point périodique <strong>de</strong> pério<strong>de</strong> n. (Il s’agit <strong>de</strong> démontrer que les points<br />

x, Sx, . . . , S n−1 x sont distincts, ce qui revient à démontrer que (2 b −1)/(2 a −1)<br />

n’est pas entier si a ne divise pas b ; on pourra faire la division euclidienne<br />

b = qa + r).


Chapitre 2<br />

Dynamique Topologique<br />

Dans ce qui suit X est un espace métrique compact et f : X → X est<br />

une application continue.<br />

Ensembles invariants Un ensemble A ⊂ X est dit invariant si f(A) ⊂ A,<br />

fortement invariant si f(A) = A et complètement invariant si f −1 (A) = A.<br />

Quand f est un homéomorphisme, ces notions coinci<strong>de</strong>nt.<br />

2.1 Récurrence<br />

Point périodique Un point x ∈ X est périodique s’il existe n 0 ∈ N tel<br />

que f n 0<br />

(x) = x. Nous noterons P n (f) l’ensemble <strong>de</strong>s points fixes <strong>de</strong> f n : c’est<br />

un compact ; <strong>de</strong> même nous noterons P (f) = ⋃ n∈N P n(f).<br />

Point récurrent<br />

Un point x est dit récurrent ssi<br />

inf d(x, f n (x)) = 0.<br />

n≥1<br />

Ensembles α et ω-limite Si x ∈ X, l’ensemble <strong>de</strong>s points ω-limite <strong>de</strong> x est<br />

l’ensemble <strong>de</strong>s y ∈ X qui sont points d’accumulation <strong>de</strong> la suite (f n (x)) n≥0 .<br />

Si f est inversible on définit également l’ensemble α-limite <strong>de</strong> x qui est l’ensemble<br />

<strong>de</strong>s points d’accumulation <strong>de</strong> la suite (f n (x)) n≤0 . Si f est inversible,<br />

nous notons<br />

( ⋃<br />

)<br />

L(f) = Adh ω(x) ∪ P ∪ α(x) .<br />

x∈X<br />

9


10 CHAPITRE 2. DYNAMIQUE TOPOLOGIQUE<br />

Point non errant Un point x 0 est dit errant ssi il existe un voisinage U<br />

<strong>de</strong> x 0 tel que pour tout n ≥ 1, f n (U) ∩ U = ∅ ; un point est non-errant s’il<br />

n’est pas errant. On note Ω(f) l’ensemble <strong>de</strong>s points non errants.<br />

Point récurrent par chaînes Un point x est récurrent par chaîınes si<br />

et seulement si pour tout ɛ > 0 il existe une suite x i , 0 ≤ i ≤ n telle que<br />

x 0 = x = x n et telle que pour tout 0 ≤ i ≤ n − 1, on a d(x i+1 , f(x i )) ≤ ɛ.<br />

2.2 Irré<strong>du</strong>ctibilité<br />

2.2.1 Minimalité<br />

Notons F l’ensemble <strong>de</strong>s compacts non-vi<strong>de</strong>s K ⊂ X qui sont f-invariants.<br />

Un compact K est dit minimal s’il est minimal dans F pour l’inclusion (si<br />

L ⊂ K avec L compact et f(L) ⊂ L alors L = K). On dit que X est minimal<br />

s’il ne contient aucun compact non vi<strong>de</strong> invariant autre que lui-même.<br />

L’intérêt <strong>de</strong> cette notion rési<strong>de</strong> dans la proposition suivante :<br />

Proposition 2.2.1 Un compact K ⊂ X est minimal ssi pour tout x ∈ K,<br />

Adh(f n (x)) n∈N = K.<br />

Démonstration.— Supposons que K soit minimal. Alors pour tout x ∈ K<br />

le compact Adh(f n (x)) n∈N = K est f-invariant non vi<strong>de</strong> inclus dans K et<br />

égale donc K. Réciproquement si pour tout x ∈ K on a Adh(f n (x)) n∈N = K,<br />

alors si L ⊂ K est un compact invariant on a pour x ∈ L, et tout n ≥ 0,<br />

f n (x) ∈ L et partant K = Adh(f n (x)) n∈N ⊂ L c’est-à-dire L = K.<br />

Le principal rèsultat est :<br />

Théorème 2.2.1 Si (X, d) est un espace métrique compact et f : X → X<br />

est continue, il existe toujours un compact K ⊂ X minimal.<br />

✷<br />

Démonstration.—<br />

Nous aurons besoin pour la preuve <strong>du</strong> lemme <strong>de</strong> Zorn<br />

Lemme 2.2.1 (Zorn) Si F est un ensemble muni d’une relation d’ordre, il<br />

existe un sous-ensemble totalement ordonné et maximal pour cette propriété.<br />

Ainsi, (F, ⊂) contient un sous-ensemble totalement ordonné maximal G. Le<br />

compact K = ∩ K∈G L est f-invariant et minimal.<br />


2.2. IRRÉDUCTIBILITÉ 11<br />

Définition 2.2.1 On dit que f est minimale sur X ou que X est minimale<br />

pour f si X est f-minimal.<br />

Remarque : Si f est minimale et si X est infini alors f n’admet pas d’orbite<br />

périodique.<br />

Exemples : a) Soit X = R/Z le tore et f(x) = x + α. Montrons que<br />

f est minimale si et seulement si α /∈ Q/Z. Si α = p/q il est clair que<br />

tout point est périodique (f q (x) = x mod 1). Réciproquement supposons α<br />

irrationnel : alors la suite nα est <strong>de</strong>nse sur T. En effet, la suite nα prend une<br />

infinité <strong>de</strong> valeurs sur le compact X et admet donc un point d’accumulation,<br />

disons x 0 , c’est-à-dire qu’il existe une suite n k strictement croissante telle<br />

que n k α converge vers x 0 . Ainsi, pour tout ɛ > 0, il existe N tel que, dès que<br />

n k > n l ≥ N, on a d(n k α, n l α) < ɛ soit : d(mα, 0) < ɛ où m = n k − n l . Il est<br />

facile <strong>de</strong> voir que si z ∈ T vérifie d(z, 0) < ɛ alors pour tout x ∈ T il existe<br />

r ∈ N tel que d(x, rz) < ɛ. Si on pose z = mα, on a ainsi d(x, (rm)α) < ɛ.<br />

Terminons la preuve <strong>de</strong> la minimalité : si x et y sont <strong>de</strong>ux points il existe<br />

r ′ ∈ N tel que d(y − x, r ′ α) < ɛ et donc d(y, x + r ′ α) < ɛ.<br />

b) Sur X = R/Z, f(x) = 2x n’est pas minimale car elle admet <strong>de</strong>s points<br />

périodiques (les k/2 n ).<br />

c) Un homéomorphisme <strong>de</strong> R n’est jamais minimal<br />

d) Un homéomorphisme <strong>de</strong> R 2 n’est jamais minimal (c’est une conséquence<br />

<strong>du</strong> théorème <strong>de</strong> translation <strong>de</strong> Brouwer : si un homéomorphisme <strong>de</strong> R 2 est<br />

sans point fixe alors tout point est errant).<br />

2.2.2 Transitivité<br />

Définition 2.2.2 On dit que f est transitive sur X si et seulement s’il existe<br />

un point x ∈ X tel que l’ensemble <strong>de</strong>s points d’accumulation <strong>de</strong> l’orbite positive<br />

<strong>de</strong> x soit <strong>de</strong>nse dans X. (Si f est inversible il est équivalent <strong>de</strong> dire que<br />

l’orbite <strong>de</strong> x est <strong>de</strong>nse dans X).<br />

Voici une proposition qui justifie la terminologie :<br />

Proposition 2.2.2 f est transitive sur X si et seulement si pour tous ouverts<br />

U et V <strong>de</strong> X il existe n tel que f −n (U) ∩ V ≠ ∅ (c’est-à-dire il existe<br />

un point <strong>de</strong> U qui visite un point <strong>de</strong> V ).<br />

Démonstration.— Supposons donc qu’il existe un point z ∈ X tel que l’ensemble<br />

<strong>de</strong>s points d’accumulation <strong>de</strong> l’orbite positive <strong>de</strong> z soit <strong>de</strong>nse et soient<br />

U, V <strong>de</strong>ux ouverts <strong>de</strong> X. Il existe donc n > m entiers positifs tels f m (z) ∈ U<br />

et f n−m (f m (z)) = f n (z) ∈ V . On a donc f m (z) ∈ U ∩ f −(n−m) (V ).


12 CHAPITRE 2. DYNAMIQUE TOPOLOGIQUE<br />

Réciproquement, supposons que pour tous ouverts U, V <strong>de</strong> X il existe n<br />

tel que U ∩ f −n (V ) ≠ ∅. Remarquons qu’en fait il existe une infinité <strong>de</strong> tels<br />

entiers n (pourquoi ). On en dé<strong>du</strong>it que pour tout N l’ouvert<br />

⋃<br />

n≥N<br />

f −n (B)<br />

est <strong>de</strong>nse. Puisque X est compact, pour tout p ≥ 1 il existe un recouvrement<br />

fini <strong>de</strong> X par <strong>de</strong>s boules ouvertes <strong>de</strong> rayon 1/p. Notons R p cet ensemble fini<br />

<strong>de</strong> boules <strong>de</strong> rayons 1/p. L’ensemble<br />

⋂<br />

⋂<br />

⋂<br />

⋃<br />

p≥1 B∈R p N≥0 n≥N<br />

f −n (B)<br />

est l’ensemble <strong>de</strong>s points dont l’orbite positive a un ensemble <strong>de</strong>nse <strong>de</strong> points<br />

d’accumulation. Mais, c’est une intersection dénombrable d’ouverts <strong>de</strong>nses et<br />

d’après la propriété <strong>de</strong> Baire (X est compact) c’est un ensemble <strong>de</strong>nse, donc<br />

en particulier non vi<strong>de</strong>.<br />

Remarque La preuve <strong>du</strong> théorème précé<strong>de</strong>nt montre que l’ensemble <strong>de</strong>s<br />

points z dont l’orbite est <strong>de</strong>nse est en fait un G δ -<strong>de</strong>nse <strong>de</strong> X.<br />

Exercice : a) Montrer que f est minimale si et seulement si pour tout ouvert<br />

U <strong>de</strong> X il existe N tel que<br />

X =<br />

N⋃<br />

f −i (U).<br />

b) Montrer que f est transitive si et seulement pour tout ouvert U,<br />

est <strong>de</strong>nse dans X.<br />

i=0<br />

∞⋃<br />

f −i (U)<br />

i=0<br />

c) Montrer que si f est transitive alors pour toute fonction continue φ : X →<br />

R φ ◦ f = φ implique que φ est constante. Que dire <strong>de</strong> la réciproque <br />

d) Montrer qu’une action isométrique est transitive si et seulement si elle est<br />

minimale.<br />


2.3. DÉCALAGES (OU SHIFTS) 13<br />

2.2.3 Mélange topologique<br />

Définition 2.2.3 On dit que f est topologiquement mélangeante si pour tous<br />

ouverts U, V <strong>de</strong> X il existe N tel que pour tout n ≥ N f −N (U) ∩ V ≠ ∅.<br />

Remarque : Le mélange topologique, tout comme la minimalité entraîne la<br />

transitivité l’inverse étant faux.<br />

Exemples a) Sur X = R/Z, f(x) = 2x est topologiquement mélangeante<br />

(et donc transitive). En effet, il suffit <strong>de</strong> démontrer que pour tous intervalles<br />

dyadiques I et J, il existe N tel que pour tout n ≥ N f −n (I)∩J est non vi<strong>de</strong>.<br />

Or dès que n ≥ N, f −n (I) a une intersection non vi<strong>de</strong> avec tout intervalle<br />

dyadique <strong>de</strong> longueur 2 −N .<br />

b) Une translation T α sur R/Z n’est jamais faiblement mélangeante : si α est<br />

rationnel c’est clair car T α n’est pas transitive ; si α est irrationnel soient I<br />

et J <strong>de</strong>ux intervalles <strong>de</strong> longueur 1/4 par exemple et notons I 0 un intervalle<br />

<strong>de</strong> longueur 1/4 disjoint <strong>de</strong> J. Comme T α est minimale, on sait que Tα<br />

−n (I)<br />

sera pour une infinité <strong>de</strong> valeurs <strong>de</strong> n proche <strong>de</strong> I 0 et sera donc disjoint <strong>de</strong> J.<br />

c) L’application <strong>du</strong> tore R 2 /Z 2 définie par A(x, y) = (2x + y, x + y) est<br />

topologiquement mélangeante (mais pas minimale : elle admet une infinité<br />

<strong>de</strong> points périodiques).<br />

2.3 Décalages (ou shifts)<br />

2.3.1 Shift <strong>de</strong> Bernoulli<br />

Notons Σ = {0, 1} N , l’ensemble <strong>de</strong>s suites (x i ) i∈N , x i ∈ {0, 1}. On munit<br />

Σ <strong>de</strong> la distance ultra-métrique<br />

d(x, y) = 2 −m(x,y) , m(x, y) = inf{j : x j ≠ y j }.<br />

Les cylindres C(m; a 0 , . . . , a m ) = {(x j ) j∈N : x 0 = a 0 , . . . , x m = a m } est une<br />

base d’ouverts <strong>de</strong> la topologie définie par d. Le théorème <strong>de</strong> Tykhonov (ou<br />

encore un argument diagonal) montre que (Σ, d) est compact. On définit alors<br />

l’application <strong>de</strong> décalage ou shift σ par<br />

(σ(x)) i = x i+1 .<br />

Il est facile <strong>de</strong> voir que σ est continue sur (Σ, d).<br />

Proposition 2.3.1 L’application σ est faiblement mélangeante.


14 CHAPITRE 2. DYNAMIQUE TOPOLOGIQUE<br />

Démonstration.— Il suffit <strong>de</strong> démontrer que pour tous cylindres C =<br />

C(m; a 0 , . . . , a m ), C ′ = C(m ′ ; a ′ 0, . . . , a ′ m ′) il existe N tel que pour tout n ≥ N<br />

σ −n (C) ∩ C ′ ≠ ∅. Mais σ −n (C) est l’ensemble <strong>de</strong>s mots <strong>de</strong> la forme yaz où<br />

a = a 0 . . . a m et y est une suite quelconque <strong>de</strong> longueur n, et z ∈ Σ est<br />

également quelconque. Ainsi, si n ≥ m ′ , tout mot <strong>de</strong> la forme a ′ waz où<br />

a ′ = a ′ 0 . . . a ′ m et w <strong>de</strong> longueur n − ′<br />

m′ et z sont quelconques, appartient à<br />

σ −n (C) ∩ C ′ .<br />

On peut généraliser la construction et la proposition précé<strong>de</strong>nte au cas d’un<br />

shift sur un alphabet à r symboles.<br />

2.3.2 Sous-shifts <strong>de</strong> type fini<br />

Soit A = {1, . . . , r} un alphabet à r symboles et A une matrice r × r à<br />

coefficients dans {0, 1} telle que pour tout 1 ≤ i ≤ r il existe j et j ′ dans<br />

A tels (A) ij = 1 et (A) j ′ i = 1. On associe à A un graphe orienté tel que<br />

pour tous sommets i, j il existe au plus une flèche <strong>de</strong> i vers j et pour tout<br />

sommet i il existe une flèche arrivant en i et une flèche sortant <strong>de</strong> i (cette<br />

association (matrice,graphe) est alors bijective). Nous noterons Γ A le graphe<br />

orienté associé à A et ˜Γ A le graphe non-orienté associé à Γ A . Les hypothèses<br />

que nous avons faites sur A assure que le graphe non orienté ˜Γ A associé à A est<br />

connexe. En revanche, la connexité <strong>du</strong> graphe orienté n’est pas automatique.<br />

Définition 2.3.1 Le graphe orienté Γ A est dit fortement connexe si pour<br />

toute paire i, j dans l’alphabet A il existe un chemin allant <strong>de</strong> i à j (en<br />

suivant le sens <strong>de</strong>s flèches).<br />

Remarque : Le nombre <strong>de</strong> chemins <strong>de</strong> longueur r allant <strong>de</strong> i à j est le<br />

coefficient (A r ) ij . Le graphe Γ A est donc fortement connexe si et seulement<br />

si<br />

∀ i, j ∃r(i, j), (A r ) ij > 0.<br />

Nous noterons Σ A l’ensemble <strong>de</strong>s suites (x i ) i∈N <strong>de</strong> A N qui vérifient la<br />

condition <strong>de</strong> compatibilité suivante : pour tout i ≥ 0, A xi x 1+1<br />

= 1. Il est<br />

clair que Σ A est encore un espace compact quand on le munit <strong>de</strong> la distance<br />

in<strong>du</strong>ite par l’inclusion et que Σ A est un fermé invariant par σ.<br />

Théorème 2.3.1 Le système dynamique (Σ A , σ) est transitif si et seulement<br />

si le graphe Γ A est fortement connexe.<br />

Démonstration.— Remarquons déjà que si i, j ∈ A l’existence d’un chemin<br />

<strong>de</strong> i à j est équivalente au fait qu’il existe un entier n tel que U i ∩σ −n (U j ) ≠ ∅<br />


2.3. DÉCALAGES (OU SHIFTS) 15<br />

où on note U i = {x : x 0 = i} U j = {x : x 0 = j}. On a donc clairement que si<br />

(Σ A , σ) est transitif alors Γ A est fortement connexe.<br />

Réciproquement, supposons le graphe Γ A fortement connexe. Pour démontrer<br />

la transitivité il suffit <strong>de</strong> prouver que pour tous cylindres C =<br />

C(m; a 0 , . . . , a m ) et C ′ = C(m ′ ; a ′ 0, . . . , a ′ m ′) il existe n tel que C ∩ σ−n (C ′ ) ≠<br />

∅. Notons a (resp. a ′ ) le mot a 0 , . . . , a m (resp. a ′ 0, . . . , a ′ m ′). On sait qu’il existe<br />

un chemin allant <strong>de</strong> la fin <strong>du</strong> mot a m <strong>de</strong> a au début <strong>du</strong> mot a ′ 0 <strong>de</strong> a ′ . On peut<br />

donc construire un mot b commençant par a m et terminant par a ′ 0. Alors tout<br />

mot aba ′ x est dans C et est tel que σ l (aba ′ x) ∈ C ′ pour l égal à la somme<br />

<strong>de</strong>s longueurs <strong>de</strong>s mots a et b.<br />

Caractérisons les sous-shifts <strong>de</strong> type fini topologiquement mélangeant :<br />

Théorème 2.3.2 Le système dynamique (Σ A , σ) est topologiquement mélangeant<br />

si et seulement si Γ A vérifie la propiété suivante : il existe un entier<br />

r > 0 tel que pour toute paire (i, j) il existe un chemin <strong>de</strong> longueur r allant<br />

<strong>de</strong> i à j (ce qui est équivalent à (A r ) ij > 0).<br />

Démonstration.— Le début <strong>de</strong> la preuve <strong>du</strong> théorème précé<strong>de</strong>nt montre que<br />

si (Σ A , σ) est topologiquement mélangeant, pour toute paire (i, j) il existe<br />

un entier N i,j tel que pour n ≥ N i,j , U i ∩ σ −n (U j ) ≠ ∅. Par conséquent si on<br />

pose r = max i, jN i,j on a bien l’existence d’un chemin <strong>de</strong> longueur r dans le<br />

graphe Γ A allant <strong>de</strong> i à j.<br />

Réciproquement, supposons que le graphe vérifie la propriété <strong>du</strong> théorème.<br />

Alors, A r a tous ses coefficients positifs strictement. Comme aucune<br />

ligne <strong>de</strong> A n’est nulle (et comme A est à coefficients positifs ou nuls), A r+1<br />

et plus généralement A k , k ≥ r a tous ses coefficients strictement positifs. Il<br />

existe donc <strong>de</strong>s chemins pour tout k ≥ r et toute paire i, j, <strong>de</strong>s chemins <strong>de</strong><br />

longueur k allant <strong>de</strong> i à j. Si on reprend la <strong>de</strong>uxième partie <strong>de</strong> la preuve <strong>du</strong><br />

théorème précé<strong>de</strong>nt, on voit que les mots <strong>de</strong> la forme aba ′ x où b est un mot<br />

<strong>de</strong> longueur k ≥ r sont dans C ∩ σ −k (C ′ ).<br />

Il existe en fait une décomposition <strong>de</strong>s sous-shifts <strong>de</strong> type fini transitifs<br />

en union disjointe <strong>de</strong> fermés ou la restriction d’une puissance <strong>de</strong> σ est topologiquement<br />

mélangeant.<br />

Théorème 2.3.3 Le système (Σ A , σ) est transitif si et seulement si il existe<br />

Σ 1 , . . . , Σ m fermés <strong>de</strong> Σ A disjoints et dont l’union est Σ A tels que<br />

a) pour tout 1 ≤ i < m on a σ(Σ i ) = Σ i+1 et σ(Σ m ) = Σ 1 ;<br />

b) σ m |Σ 1 est topologiquement mélangeant.<br />

✷<br />


16 CHAPITRE 2. DYNAMIQUE TOPOLOGIQUE<br />

Démonstration.— Montrons déjà le sens direct. Notons Λ ij l’ensemble <strong>de</strong>s<br />

longueurs <strong>de</strong> chemins allant <strong>de</strong> i à j ; on a pour i, j, k ∈ A Λ ij + Λ jk ⊂ Λ ik .<br />

En particulier Λ 11 +Λ 11 ⊂ Λ 11 et si on note m le pgcd <strong>de</strong>s éléments <strong>de</strong> Λ 11 on<br />

peut dire que Λ 11 contient tous les multiples <strong>de</strong> m assez grands (Exercice).<br />

Définissons alors les sous-ensembles <strong>de</strong> A, I 1 , . . . , I m <strong>de</strong> la façon suivante :<br />

j appartient à I l si et seulement s’il existe un chemin allant <strong>de</strong> 1 à j <strong>de</strong><br />

longueurs congrue à l − 1 mo<strong>du</strong>lo m. On a alors,<br />

Lemme 2.3.1 Si i ∈ I l et j ∈ I l ′ tous les chemins allant <strong>de</strong> i à j sont <strong>de</strong><br />

longueurs congrues à l ′ − l mo<strong>du</strong>lo m<br />

Démonstration.— a) Démontrons déjà qu’il existe un chemin allant <strong>de</strong> i à<br />

1 <strong>de</strong> longueur congrue à −l mo<strong>du</strong>lo m. On sait qu’il existe un chemin allant<br />

<strong>de</strong> i à 1 dont on note s la longueur ; on peut donc construire un chemin<br />

allant <strong>de</strong> 1 à 1 en concaténant un chemin <strong>de</strong> longueur congrue à l mo<strong>du</strong>lo<br />

m et le chemin <strong>de</strong> longueur s. Comme tous les chemins allant <strong>de</strong> 1 à 1 sont<br />

<strong>de</strong> longueurs divisibles par m (par définition <strong>de</strong> m), s doit être congru à −l<br />

mo<strong>du</strong>lo m.<br />

b) Démontrons que tous les chemins allant <strong>de</strong> 1 à i ont une longueur congrue<br />

à l mo<strong>du</strong>lo m. En effet, étant donné un tel chemin <strong>de</strong> longueur t, puisqu’il en<br />

existe un autre allant <strong>de</strong> i à 1 <strong>de</strong> longueur congrue à −l mo<strong>du</strong>lo m, on peut<br />

en concaténant construire un chemin <strong>de</strong> 1 à 1 <strong>de</strong> longueur congrue à t − l<br />

mo<strong>du</strong>lo m. Mais un tel chemin a une longueur divisble par m si bien que t<br />

est congru à l mo<strong>du</strong>lo m.<br />

c) Comme tout chemin allant <strong>de</strong> i à i concaténé à un chemin allant <strong>de</strong> i à 1<br />

donne un chemin allant <strong>de</strong> i à 1, on dé<strong>du</strong>it <strong>de</strong> b) que tout chemin <strong>de</strong> i à i est<br />

<strong>de</strong> longueur congrue à 0 mo<strong>du</strong>lo m.<br />

d) D’après b), il existe un chemin allant <strong>de</strong> i à j <strong>de</strong> longueur congrue à l ′ − l<br />

mo<strong>du</strong>lo m (en concaténant via 1) et un autre <strong>de</strong> j à i <strong>de</strong> longueur congrue à<br />

l − l ′ mo<strong>du</strong>lo m. Pour tout chemin allant <strong>de</strong> i à j <strong>de</strong> longueur t on peut en<br />

concaténant en j construire un chemin <strong>de</strong> i à i <strong>de</strong> longueur congrue à t+l −l ′<br />

mo<strong>du</strong>lo m et comme cette longueur doit être un multiple <strong>de</strong> m d’après c) on<br />

a bien la conclusion <strong>du</strong> lemme.<br />

Définissons alors Σ l comme étant l’ensemble <strong>de</strong>s suites x = (x i ) i∈N <strong>de</strong> Σ A<br />

telles que x 0 ∈ I l . Automatiquement, x 1 ∈ I l+1 mod m car il existe un chemin<br />

<strong>de</strong> 1 à x 1 <strong>de</strong> longueur 1 + l (l <strong>de</strong> 1 à x 0 et 1 <strong>de</strong> x 0 à x 1 ) et <strong>de</strong> façon plus<br />

générale x k ∈ I l+k mod m . On a donc bien σ(Σ l ) = Σ l+1 mod m . Vérifions que<br />

σ m restreint à Σ 1 est topologiquement mélangeant. Pour cela on reprend la<br />

démonstration <strong>du</strong> théorème précé<strong>de</strong>nt : il suffit <strong>de</strong> démontrer que si a est un<br />


2.4. APPLICATION À LA PREUVE DU THÉORÈME DE VAN DER WAERDEN17<br />

mot <strong>de</strong> longueur p commençant par une lettre <strong>de</strong> I 1 et a ′ un mot <strong>de</strong> longueur<br />

p ′ commençant par une lettre <strong>de</strong> I 1 , on peut construire pour tout entier km<br />

un mot compatible <strong>de</strong> la forme aba ′ x où b est un mot <strong>de</strong> longueur km. Or<br />

ceci est toujours possible dès que k est assez grand puisque Λ 11 contient tous<br />

les multiples <strong>de</strong> m assez grands.<br />

La réciproque est laissée en exercice au lecteur.<br />

✷<br />

2.4 Application à la preuve <strong>du</strong> théorème <strong>de</strong> van<br />

<strong>de</strong>r Waer<strong>de</strong>n<br />

Nous nous proposons <strong>de</strong> démontrer par <strong>de</strong>s métho<strong>de</strong>s <strong>de</strong> dynamique topologique<br />

le théorème suivant dû à van <strong>de</strong>r Waer<strong>de</strong>n :<br />

Théorème 2.4.1 (van <strong>de</strong>r Waer<strong>de</strong>n) Si Z = A 1 ∪ · · · ∪ A p est une partition<br />

<strong>de</strong> Z il existe i ∈ {1, . . . , p} tel que A i contienne <strong>de</strong>s progressions<br />

arithmétiques <strong>de</strong> longueur arbitraire i.e : pour tout r ∈ N il existe a, b ∈ Z<br />

tels que a, a + b, . . . , a + (r − 1)b appartiennent à A i .<br />

La preuve <strong>du</strong> théorème précé<strong>de</strong>nt est basée sur un théorème <strong>de</strong> récurrence<br />

multiple :<br />

Théorème 2.4.2 Si (X, d) est un espace métrique compact et T un homéomorphisme<br />

<strong>de</strong> X il existe x ∈ X tel que pour tout r ≥ 1<br />

inf max d(x, T in x) = 0.<br />

n≥1 1≤i≤r<br />

Démonstration.— La preuve se fait par récurrence sur r ≥ 1.<br />

i) Si r = 1 nous avons vu que le résultat est vrai : si K est un ensemble<br />

minimal <strong>de</strong> X, tout point x <strong>de</strong> K est d’orbite <strong>de</strong>nse dans K et en particulier<br />

r{ecurrent.<br />

ii) Notons K un ensemble minimal fixé et notons pour r ≥ 1, E r l’ensemble<br />

<strong>de</strong>s x ∈ K pour lesquels<br />

inf max d(x, T in x) = 0.<br />

n≥1 i≤r<br />

Lemme 2.4.1 Si E r est un G δ -<strong>de</strong>nse <strong>de</strong> K alors il en est <strong>de</strong> même <strong>de</strong> E r+1 .


18 CHAPITRE 2. DYNAMIQUE TOPOLOGIQUE<br />

Démonstration.— [<strong>du</strong> lemme 2.4.1]<br />

A) Remarquons tout d’abord que l’ensemble Ẽr <strong>de</strong>s x ∈ K pour lesquels<br />

T n x ∈ E r pour tout n ∈ Z, x ∈ E r est encore un G δ -<strong>de</strong>nse (c’est l’ensemble<br />

⋂<br />

n∈Z T −n (E r )). Définissons alors par récurrence les suites ɛ n <strong>de</strong> réels positifs<br />

et x n d’éléments <strong>de</strong> Ẽr <strong>de</strong> la fa¸on suivante : x 1 ∈ Ẽr et ɛ 1 étant choisis, il<br />

existe n 1 tel que<br />

max<br />

1≤i≤r d(x, T −in 1<br />

x 1 ) ≤ (1/2)ɛ 1 .<br />

On pose alors x 2 = T −(r+1)n 1<br />

x 1 et on choisit ɛ 2 suffisamment petit pour que<br />

ɛ 2 ≤ (1/2)ɛ 1 et pour que d(y, x 2 ) ≤ ɛ 2 implique d(T n 1(r+1) y, x 1 ) ≤ ɛ 1 .. Nous<br />

noterons<br />

x 2<br />

n 1<br />

−→ɛ1 x 1<br />

les relations<br />

max d(x 1, T in 1<br />

x 2 ) ≤ ɛ 1 /2.<br />

1≤i≤r+1<br />

Avec le choix que nous avons fait pour ɛ 2 il est clair que pour tout y tel que<br />

d(y, x 2 ) ≤ ɛ 2 on a<br />

y n 1<br />

−→ x 1 .<br />

ɛ1<br />

On sait qu’il existe n 2 tel que<br />

max<br />

1≤i≤r d(x, T −in 2<br />

x 2 ) ≤ (1/2)ɛ 2 ,<br />

et on pose x 3 = T −(r+1)n 2<br />

x 2 . On a bien<br />

n<br />

x<br />

2<br />

3 −→ x 2 ɛ2 /2<br />

et si ɛ 3 ≤ ɛ 2 /2 est choisi suffisamment petit on a<br />

y n 2<br />

−→ x 2 ɛ2<br />

pour tout y tel que d(y, x 3 ) ≤ ɛ 3 . On a donc pour un tel y<br />

y n 2 n<br />

−→ x<br />

1<br />

2 −→ɛ1 x 1 .<br />

ɛ2<br />

Par récurrence on construit <strong>de</strong>s suites infinies ɛ k , x k telles que<br />

· · · x k+1<br />

n k<br />

−→ɛk<br />

n 1<br />

n k−1<br />

x k −→ · · · −→ɛ1 x 1 .<br />

ɛk−1<br />

Comme K est compact, pour tout ɛ > 0 il existe x k , x l ∈ Ẽr avec k > l er<br />

d(x k , x l ) < ɛ tels que<br />

n k,l<br />

x k −→ɛl<br />

où n k,l = n k−1 + · · · + n l . En particulier, comme on peut choisir l tel que<br />

ɛ l < ɛ, on a prouvé le lemme suivant :<br />

x l


2.4. APPLICATION À LA PREUVE DU THÉORÈME DE VAN DER WAERDEN19<br />

Lemme 2.4.2 Pour tout ɛ > 0 il existe x ɛ ∈ Ẽr et n ɛ tels que<br />

x ɛ<br />

n ɛ<br />

−→ɛ x ɛ .<br />

B) Démontrons que l’on peut inverser l’ordre <strong>de</strong>s quantificateurs : Notons<br />

A ɛ l’ensemble <strong>de</strong>s x ∈ Ẽr pour lesquels il existe n ɛ tel que<br />

x −→ nɛ<br />

x.<br />

ɛ<br />

Cet ensemble est un ouvert <strong>de</strong> Ẽr ⊂ K et est donc un G δ <strong>de</strong> K. Démontrons<br />

qu’il est <strong>de</strong>nse dans K. Comme T est minimale sur K, pour tout y ∈ K et<br />

η > 0 il existe un entier N tel que tout point x <strong>de</strong> K se trouve après moins<br />

<strong>de</strong> N itérations dans B(y, η/2) (∃0 ≤ j ≤ N, T j x ∈ B(y, η/2)) et comme les<br />

applications T j , j ≤ N sont uniformément continues sur K on peut affirmer<br />

qu’il existe ɛ 0 tel que toute boule <strong>de</strong> rayon plus petit que ɛ 0 se trouve après<br />

au plus N itérations dans B(y, η). D’autre part, pour tout ɛ > 0 on sait qu’il<br />

existe un point x ɛ et n ɛ tel que<br />

x ɛ<br />

Ainsi, si ɛ ≤ ɛ 0 , il existe j ≤ N tel que,<br />

n ɛ<br />

−→ɛ x ɛ .<br />

T j x ɛ , T j (T nɛ x ɛ ), . . . , T j (T (r+1)nɛ x ɛ ) ∈ B(y, η).<br />

Puisque T j (T inɛ (x ɛ )) = T inɛ (T j (x ɛ )) on a démontré que z = T j x ɛ est dans<br />

B(y, η) ∩ Ẽr+1. Ceci démontre que A ɛ est <strong>de</strong>nse dans K et est donc un G δ -<br />

<strong>de</strong>nse.<br />

C) D’après le théorème <strong>de</strong> Baire<br />

∞⋂<br />

m=1<br />

A 1/m<br />

est donc également un G δ -<strong>de</strong>nse ; mais cet ensemble n’est rien d’autre que<br />

E r+1 . La preuve <strong>du</strong> lemme est terminée.<br />

Terminons la preuve <strong>du</strong> théorème 2.4.2. L’intersection<br />

E = ⋂ r≥1<br />

E r<br />

✷<br />

est un G δ -<strong>de</strong>nse d’après le théorème <strong>de</strong> Baire. Si x est dans E la conclusion<br />

<strong>du</strong> théorème 2.4.2 est vérifiée.<br />


20 CHAPITRE 2. DYNAMIQUE TOPOLOGIQUE<br />

Preuve <strong>du</strong> théorème 2.4.1 Soit ω ∈ {1, . . . , p} Z la suite définie par ω i =<br />

k si i ∈ A k et notons X l’adhérence <strong>de</strong> l’orbite <strong>de</strong> ω sous l’action <strong>du</strong> décalage<br />

σ : {1, . . . , p} Z → {1, . . . , p} Z . L’application σ est un homéomorphisme <strong>de</strong><br />

X. Appliquons le théorème <strong>de</strong> récurrence multiple 2.4.2 à (X, σ) : il existe<br />

x ∈ X tel que pour tout r ≥ 1 et ɛ = 1/4 on peut trouver un entier b pour<br />

lequel<br />

max<br />

1≤i≤r d(x, T ib x) < (1/4).<br />

Notons i = x 0 . On dé<strong>du</strong>it <strong>de</strong> l’inégalité précé<strong>de</strong>nte que i = x 0 = (T b x) 0 =<br />

· · · = (T rb x) 0 . Comme x est dans l’adhérence <strong>de</strong> {σ k ω} k∈Z , il existe a tel que<br />

d(T a ω, x) < (1/4) et également<br />

max d(T a ω, T ib (T a ω)) < (1/4).<br />

1≤i≤r<br />

Ainsi, ω a = x 0 = i et ω a = ω a+b = · · · = ω a+rb . On a donc démontré que a, a+<br />

b, . . . , a + rb appartiennent à A i . Ceci termine la preuve <strong>du</strong> théorème 2.4.1.


Chapitre 3<br />

Mesures Invariantes<br />

Dans ce qui suit X est encore un espace métrique compact, B désigne la<br />

tribu borélienne <strong>de</strong> X (la plus petite tribu engendrée par les ouverts <strong>de</strong> X et<br />

f : X → X est une application continue.<br />

Définition 3.0.1 Une mesure <strong>de</strong> probabilité µ sur (X, B) est dite f-invariante<br />

si f ∗ µ = µ c’est-à-dire si pour tout A ∈ B<br />

µ(f −1 (A)) = µ(A).<br />

Nous noterons M f l’ensemble <strong>de</strong>s mesures <strong>de</strong> probabilité f-invariantes. De<br />

façon équivalente, µ est f-invariante si et seulement si pour toute fonction<br />

continue φ ∈ C(X), µ(φ ◦ f) = µ(φ)<br />

Exemple<br />

La mesure <strong>de</strong> Haar sur le tore R/Z est invariante par toute translation T α :<br />

x ↦→ x + α. Nous verrons plus loin que dans le cas où α est irrationnel, c’est<br />

l’unique mesure invariante par T α . En revanche, si α = p/q, toute orbite<br />

périodique porte une mesure invariante.<br />

La mesure <strong>de</strong> Haar sur le tore R/Z est invariante par l’application S : x ↦→<br />

2x. Il existe une infinité d’autres mesures invariantes, en particulier les mesures<br />

portées par les orbites périodiques. Si x est un point périodique <strong>de</strong><br />

pério<strong>de</strong> p, la mesure (δ x + · · · + δ S p−1 (x))/p est une mesure <strong>de</strong> probabilité<br />

S-invariante qui n’est pas équivalente à la mesure <strong>de</strong> Lebesgue.<br />

Exercice : Construire une dynamique sur [0, 1] (non continue) qui n’admet<br />

pas <strong>de</strong> mesure <strong>de</strong> probabilité invariante.<br />

L’ensemble M f sera muni <strong>de</strong> la topologie faible ∗ : une suite <strong>de</strong> mesures<br />

<strong>de</strong> probabilité µ n converge vers µ si pour toute fonction continue φ ∈ C(X),<br />

∫<br />

φdµn = 〈µ n , φ〉 = µ n (φ) converge vers ∫ φdµ = 〈µ, φ〉 = µ(φ).<br />

21


22 CHAPITRE 3. MESURES INVARIANTES<br />

La proposition qui suit montre que lorsque f est continue il existe toujours<br />

<strong>de</strong>s mesures f-invariantes sur X compact.<br />

Proposition 3.0.1 L’ensemble M f est non vi<strong>de</strong>, convexe et compact pour<br />

la topologie faible ∗ .<br />

Démonstration.— La convexité <strong>de</strong> M f est immédiate. Sa compacité pour<br />

la topologie faible ∗ résulte <strong>du</strong> fait que M f est fermé pour cette topologie<br />

et <strong>du</strong> fait que l’ensemble <strong>de</strong>s mesures <strong>de</strong> probabilités sur X compact est<br />

compact pour cette topologie. Il reste donc à démontrer qu’il existe une<br />

mesure <strong>de</strong> probabilité f-invariante : soit x ∈ X et considérons le barycentre<br />

<strong>de</strong>s mesures <strong>de</strong> Dirac :<br />

µ n = 1 ∑n−1<br />

δ<br />

n f (x). k<br />

On a pour φ ∈ C(X)<br />

k=0<br />

µ n (φ) = 1 ∑n−1<br />

φ(f k (x)).<br />

n<br />

k=0<br />

On peut extraire <strong>de</strong> la suite µ n une sous-suite µ nk qui converge pour la<br />

topologie faible ∗ vers une mesure <strong>de</strong> probabilité µ. Comme,<br />

µ n (φ ◦ f) = φ(f n (x)) − φ(x)<br />

n<br />

+ 1 ∑n−1<br />

φ(f k (x))<br />

n<br />

on a bien la conclusion en prenant n = n k et en faisant k → ∞.<br />

Savoir qu’une mesure est f-invariante donne <strong>de</strong>s renseignements précieux<br />

sur les propriétés <strong>de</strong> récurrence <strong>de</strong> f :<br />

Théorème 3.0.3 ( <strong>de</strong> récurrence <strong>de</strong> Poincaré) Si µ est une mesure f-<br />

invariante et A ∈ B un sous-ensemble <strong>de</strong> X <strong>de</strong> µ-mesure positive µ(A) > 0<br />

alors pour µ-presque tout point x <strong>de</strong> A il existe une suite infinie d’entiers n k<br />

telle que f n k (x) ∈ A.<br />

Démonstration.—<br />

dans A c’est-à-dire<br />

k=0<br />

Notons B l’ensemble <strong>de</strong>s x ∈ A qui ne reviennent jamais<br />

B = A ∩ ⋂ n≥1<br />

f −n (X − A).<br />

Nous allons démontrer que µ(B) = 0. Prouvons pour cela que les ensembles<br />

B, f −1 (B), . . . , f −k (B), . . . dont 2 à 2 disjoints. En effet pour j > i<br />

f −i (B) ∩ f −j (B) = f −i (B ∩ f −(j−i) (B));<br />


or si un point x appartient à B ∩ f −(j−i) (B), son itéré f j−i (x) appartient à<br />

B donc à A ce qui contredit la définition <strong>de</strong> B puisque x est dans A et qu’un<br />

<strong>de</strong> ses itérés est dans A.<br />

Puisque les f −n (B), n ≥ 0 sont disjoints <strong>de</strong>ux à <strong>de</strong>ux on a<br />

∑<br />

n≥0<br />

µ(f −n (B)) = µ( ⋃ n≥0<br />

f −n (B));<br />

L’inégalité µ(B) > 0 est impossible puisque d’après l’invariance <strong>de</strong> µ par f<br />

le membre <strong>de</strong> gauche est infini, tandis que le membre <strong>de</strong> droite est inférieur<br />

ou égal à 1 (µ est une mesure <strong>de</strong> probabilité). Nous avons démontré que<br />

µ(B) = 0. D’après l’invariance <strong>de</strong> µ par f nous avons aussi µ(f −k (B)) = 0 et<br />

donc µ( ⋃ k≥0 f −k (B)) = 0. Mais cet ensemble contient les x ∈ A pour lesquels<br />

il existe k 0 tel que f k (x) /∈ A pour k ≥ k 0 . Le théorème est démontré.<br />

Corollaire 3.0.1 Si (X, d) est métrique compact, l’ensemble <strong>de</strong>s x ∈ X qui<br />

sont f-récurrents est <strong>de</strong> µ-mesure totale.<br />

Démonstration.— Notons U n , n ≥ 1 une base dénombrable <strong>de</strong> voisinage<br />

<strong>de</strong> X. Notons C n l’ensemble <strong>de</strong>s x ∈ U n qui ne sont pas récurrents dans U n .<br />

L’enemble <strong>de</strong>s points non récurrents <strong>de</strong> X est la réunion <strong>de</strong>s C n et comme<br />

d’après le théorème précé<strong>de</strong>nt chaque C n est <strong>de</strong> mesure nulle, le corollaire est<br />

démontré.<br />

23<br />

✷<br />

✷<br />

Exemples Translations sur les tores : Si T n = R n /Z n est le tore <strong>de</strong> dimension<br />

n, la mesure <strong>de</strong> Haar µ = dx 1 ∧ · · · ∧ dx n (on i<strong>de</strong>ntifie la forme<br />

volume avec une mesure) est l’unique mesure invariante par les translations<br />

T α , T α (x) = x + α, α ∈ T n .<br />

T : x ↦→ 2x sur [0, 1] : La mesure <strong>de</strong> Lebesgue λ est invariante par T puisque<br />

pour tout intervalle dyadique I = ([k/2 p , (k + 1)/2 p [, T −1 ([k/2 p , (k + 1)/2 p [)<br />

est l’union disjointe <strong>de</strong> [k/2 p+1 , (k + 1)/2 p+1 [ et <strong>de</strong> (1/2) + [k/2 p+1 , (k +<br />

1)/2 p+1 [. On a donc bien λ(T −1 (I) = λ(I) et comme les intervalles dyadiques<br />

engendrent la tribu borélienne, la propriété d’invariance s’etend à tous les<br />

boréliens.<br />

Décalage et sous-décalage <strong>de</strong> type fini : Si p ∈ [0, 1] on peut définir la mesure µ<br />

sur {0, 1} Z (muni <strong>de</strong> la tribu engendrée par les cylindres) <strong>de</strong> la façon suivante :<br />

pour tout cylindre C = C(ɛ 0 , . . . , ɛ n−1 ) on pose µ(C) = p r (1 − p) n−r où r est<br />

le nombre <strong>de</strong> ɛ i égaux à 1. Le théorème <strong>de</strong> Carathéodory (ou Kolmogorov)


24 CHAPITRE 3. MESURES INVARIANTES<br />

permet d’étendre cette mesure à la tribu borélienne toute entière. La mesure<br />

obtenue est clairement invariante par le shift σ (c’est clair sur les cylindres<br />

et on utilise la partie unicité <strong>du</strong> théorème <strong>de</strong> Carathéodory). Ceci fournit<br />

une famille entière <strong>de</strong> mesures invariantes par le décalage, les mesures <strong>de</strong><br />

Bernoulli. Ce ne sont pas les seules : chaque orbite périodique <strong>de</strong> σ définit<br />

naturellement une mesure σ-invariante : la moyenne <strong>de</strong>s mesures <strong>de</strong> Dirac<br />

portées par l’orbite périodique.<br />

Pour les sous-shifts <strong>de</strong> type fini sur un alphabet à r symboles et <strong>de</strong> matrice<br />

<strong>de</strong> transition A, la construction <strong>de</strong> mesures naturelles invariantes par σ se fait<br />

<strong>de</strong> la manière suivante : soit P ij (1 ≤ i, j ≤ r) les coefficients d’une matrice<br />

stochastique P :<br />

a) P ij ≥ 0<br />

b) ∑ r<br />

j=1 P ij = 1<br />

et faisons l’hypothèse que P est compatible avec A c’est-à-dire que A ij = 0<br />

si et seulement si P ij = 0 et supposons que A soit irré<strong>du</strong>ctible c’est-à-dire<br />

que (Σ A , σ) soit transitif.<br />

La condition b montre que le vecteur dont toutes les composantes valent<br />

1 est vecteur propre <strong>de</strong> P associé à la valeur propre 1. Par conséquent 1 est<br />

valeur propre <strong>de</strong> t P et il est possible <strong>de</strong> démontrer que l’espace propre correspondant<br />

est engendré par un vecteur dont tous les coefficeients p 1 , . . . , p r<br />

sont positifs ou nuls. On peut supposer que la somme p 1 + · · · + p r = 1. On<br />

a donc pour tout 1 ≤ j ≤ r<br />

r∑<br />

p i P ij = p j . (3.1)<br />

Pour tout cylindre C = C(ɛ 0 , . . . , ɛ n ) <strong>de</strong> Σ A définissons<br />

i=1<br />

µ(C) = p ɛ0 P ɛ0 ɛ 1<br />

· · · P ɛn−1 ɛ n<br />

.<br />

La condition b) garantit la cohérence au sens <strong>du</strong> théorème <strong>de</strong> Kolmogorov :<br />

µ(C(ɛ 0 , . . . , ɛ n−1 )) =<br />

r∑<br />

µ(C(ɛ 0 , . . . , ɛ n−1 , l)).<br />

l=1<br />

Par conséquent, on peut étendre µ en une mesure (<strong>de</strong> probabilité) à la tribu<br />

entière. L’invariance <strong>de</strong> µ par σ se fait sur les cylindres en utilisant (3.1) et<br />

µ(σ −1 (C(ɛ 0 , . . . , ɛ n ) =<br />

r∑<br />

µ(C(l, ɛ 0 , . . . , ɛ n )).<br />

l=1


3.1. ERGODICITÉ 25<br />

Automorphismes <strong>de</strong>s tores Si A ∈ SL(n, Z), l’application Ā <strong>de</strong> Rn /Z n dans<br />

lui même définie par Ā(x + Zn ) = Ax + Z n est inversible et s’appelle un<br />

automorphisme <strong>du</strong> tore T n . Puisque <strong>de</strong>t(A) = 1 on voit que la mesure <strong>de</strong><br />

Haar est invariante par Ā. Bien évi<strong>de</strong>mment ce n’est pas la seule puisque A<br />

admet une infinité <strong>de</strong> points périodiques.<br />

3.1 Ergodicité<br />

Définition 3.1.1 Un système dynamique (X, B, µ, T ) est dit ergodique ssi<br />

tout ensemble A ∈ B tel que µ(A∆T −1 (A)) = 0 est <strong>de</strong> µ mesure 0 ou 1.<br />

En d’autres termes, d’un point <strong>de</strong> vue mesurable, les seuls ensembles invariants<br />

sont ∅ ou X. On peut reformuler la définition précé<strong>de</strong>nte :<br />

Proposition 3.1.1 Le système dynamique (X, B, µ, T ) est ergodique si et<br />

seulement si les seules fonctions φ ∈ L ∞ (X, µ) vérifiant φ ◦ T = φ sont les<br />

fonctions constantes<br />

Démonstration.— Prouvons que si T est ergodique les seules fonctions<br />

invariantes par T sont les constantes : intro<strong>du</strong>isons E λ = {x ∈ X : φ(x) ≤ λ}.<br />

Comme φ ◦ T = φ on a φ 1 (E λ ) = E λ (µ p.p) et d’après l’ergodicité F φ (λ) :=<br />

µ(φ ≤ λ) ∈ {0, 1}. Comme la fonction <strong>de</strong> répartition F φ est croissante et<br />

continue à droite il existe λ 0 tel que pour tout λ ≥ λ 0 , µ(φ ≤ λ) = µ(φ =<br />

λ 0 ) = 1. Ainsi, φ est µ-p.p constante (égale à λ 0 ).<br />

La réciproque est claire (observer que φ = 1 A est T -invariante ssi A est<br />

un ensemble T -invariant).<br />

3.1.1 Premiers exemples<br />

Translation sur <strong>de</strong>s tores<br />

Si X = T et µ est la mesure <strong>de</strong> Haar, la transformation T : x ↦→ x + α<br />

est µ-ergodique si et seulement si α est irrationnel. En effet, soit φ est une<br />

fonction L ∞ telle que φ ◦ T = φ. Puisque φ est L 2 , on a l’i<strong>de</strong>ntité dans L 2<br />

✷<br />

φ(x) = ∑ k∈Z<br />

ˆφ(k)e 2πikx<br />

où les ˆφ(k) sont les coefficients <strong>de</strong> Fourier <strong>de</strong> φ. De l’unicité <strong>de</strong> la décomposition<br />

<strong>de</strong> Fourier et <strong>de</strong> l’i<strong>de</strong>ntité dans L 2 , φ ◦ T = φ on tire<br />

ˆφ(k)e 2πikα = ˆφ(k).


26 CHAPITRE 3. MESURES INVARIANTES<br />

Si α est irrationnel on a alors pour tout k ≠ 0 ˆφ(k) = 0 et par conséquent,<br />

φ est constante. Si α = p/q il existe clairement <strong>de</strong>s fonctions φ qui sont<br />

T -invariantes et qui ne sont pas constantes, par exemple φ(x) = e 2πiqx .<br />

On peut donner une <strong>de</strong>uxième preuve <strong>de</strong> ce résultat qui est plus géométrique<br />

et ne fait pas appel à la décomposition en série <strong>de</strong> Fourier. Si α = p/q<br />

(p ∧ q = 1) est rationnel, l’orbite <strong>de</strong> 0 est un ensemble discret. Il est clair<br />

qu’il existe un petit intervalle ouvert I contenant 0 et dont tous les itérés (qui<br />

sont au nombre <strong>de</strong> q) sont disjoints <strong>de</strong>ux à <strong>de</strong>ux. L’union <strong>de</strong> ces intervalles<br />

est un borélien <strong>de</strong> mesure <strong>de</strong> Haar différente <strong>de</strong> 0 et <strong>de</strong> 1 et invariant par T<br />

ce qui prouve que T n’est pas ergodique pour la mesure <strong>de</strong> Haar. Supposons<br />

à présent α irrationnel et faisons l’hypothèse qu’il existe un ensemble borélien<br />

A T -invariant, <strong>de</strong> mesure <strong>de</strong> Lebesgue comprise entre 0 et 1 strictement.<br />

D’après le théorème <strong>de</strong> <strong>de</strong>nsité <strong>de</strong> Lebesgue, presque tout point <strong>de</strong> A est un<br />

point <strong>de</strong> <strong>de</strong>nsité <strong>de</strong> A, ce qui signifie que pour Lebesgue presque tout x ∈ A<br />

on a<br />

Leb(]x − ɛ, x + ɛ[∩A)<br />

lim<br />

= 1.<br />

ɛ→0 2ɛ<br />

Soit x un point <strong>de</strong> <strong>de</strong>nsité et I =]x − ɛ, x + ɛ[ tel que Leb(]x−ɛ,x+ɛ[∩A) ≥ 1 − δ.<br />

2ɛ<br />

Comme T est une isométrie minimale, il est clair que l’on peut trouver une<br />

suite d’entiers n k , 0 ≤ k ≤ r telle que les T n k , 1 ≤ k ≤ r soient disjoints<br />

<strong>de</strong>ux à <strong>de</strong>ux et couvrent un ensemble <strong>de</strong> mesure plus gran<strong>de</strong> que 1 − δ. Dans<br />

chaque T n k I la proportion <strong>de</strong> points <strong>de</strong> A est supérieure à 1−δ puisque A est<br />

T -invariant , si bien que A ∩ ∪ 0≤k≤r T n k I a une mesure supérieure ou égale à<br />

(1 − δ) 2 . Par conséquent la mesure <strong>de</strong> A est supérieure ou égale à (1 − δ) 2 .<br />

Comme ceci vaut pour tout δ, on en dé<strong>du</strong>it que la mesure <strong>de</strong> A égale 1, ce<br />

qui est une contradiction.<br />

Exercice Montrer qu’une translation T α sur le tore <strong>de</strong> dimension n est ergodique<br />

pour la mesure <strong>de</strong> Haar, si et seulement si 〈k, α〉 ∈ Z, k ∈ Z entraîne<br />

k = 0.<br />

Ergodicité <strong>de</strong> x ↦→ 2x<br />

Démontrons que T : x ↦→ 2x est ergodique pour la mesure <strong>de</strong> Haar sur<br />

T. Soit φ une fonction T -invariante. Les coefficients <strong>de</strong> Fourier <strong>de</strong> φ vérifient<br />

ˆφ(2k) = ˆφ(k) si bien que ˆφ(2 p k) = ˆφ(k) pour tous entiers k, p. Si k ≠ 0<br />

lim p→∞ ˆφ(2 p k) = 0 car les coefficients <strong>de</strong> Fourier d’une fonction L 2 sont dans<br />

l 2 (Z) et donc ten<strong>de</strong>nt vers 0 à l’infini. Ainsi, φ est constante, ce qui prouve<br />

l’ergodicité.<br />

Exercice Démontrer que si X = T 2 , l’automorphisme <strong>du</strong> tore T (x, y) =<br />

(2x+y, x+y) préserve la mesure <strong>de</strong> Haar et est ergodique pour cette mesure.


3.2. LES THÉORÈMES ERGODIQUES 27<br />

Exercice Démontrer que le décalage est ergodique pour les mesures <strong>de</strong> Bernoulli.<br />

3.2 Les Théorèmes ergodiques<br />

3.2.1 Le point <strong>de</strong> vue spectral et le théorème <strong>de</strong> Von<br />

Neumann<br />

Considérons un système dynamique mesurable (X, B, T, µ). L’espace L 2 (X, B, µ)<br />

muni <strong>du</strong> pro<strong>du</strong>it scalaire<br />

∫<br />

〈φ, ψ〉 = φ ¯ψdµ, φ, ψ ∈ L 2 (X, B, µ)<br />

X<br />

est un espace <strong>de</strong> Hilbert. Le point <strong>de</strong> vue spectral consiste à étudier l’opérateur<br />

linéaire U T (que nous noterons souvent T ) agissant sur L 2 (X, B, µ) :<br />

Notons U ∗ l’adjoint <strong>de</strong> U défini par<br />

U T : L 2 (X, B, µ) → L 2 (X, B, µ)<br />

φ ↦→ φ ◦ T<br />

〈U ∗ φ, ψ〉 = 〈φ, Uψ〉;<br />

puisque T préserve µ il est facile <strong>de</strong> voir que U T est une isométrie c’est-à-dire<br />

préserve la norme (ou le pro<strong>du</strong>it scalaire) ‖U T φ‖ = ‖φ‖ et par conséquent<br />

U ∗ U = Id.<br />

Si en outre T est inversible T est unitaire c’est-à-dire que U ∗ = U −1 puisque,<br />

T préservant µ<br />

∫<br />

〈φ ◦ T, ψ〉 = (φ · ¯ψ ◦ T −1 ) ◦ T dµ = 〈φ, ψ ◦ T −1 〉.<br />

X<br />

Essayons <strong>de</strong> comprendre la situation quand T n’est pas inversible. La sigma<br />

algèbre T −1 B est incluse dans B et il est possible <strong>de</strong> définir l’espace L 2 (X, T −1 B, µ)<br />

<strong>de</strong>s fonctions T −1 B-mesurables qui sont L 2 pour la (restriction à T −1 B <strong>de</strong> la)<br />

mesure µ. C’est un sous-espace fermé <strong>de</strong> L 2 (X, B, µ) et on peut intro<strong>du</strong>ire la<br />

projection orthogonale P : L 2 (X, B, µ) → L 2 (X, T −1 B, µ) (rappelons qu’une<br />

projection orthogonale est caractérisée par P ∗ = P et P 2 = P ). Cette projection<br />

s’appelle l’espérance conditionnelle par rapport à la tribu T −1 B. On<br />

a le lemme facile suivant :


28 CHAPITRE 3. MESURES INVARIANTES<br />

Lemme 3.2.1 L’espace L 2 (X, T −1 B, µ) est l’ensemble <strong>de</strong>s fonctions φ ∈<br />

L 2 (X, B, µ) qui s’écrivent sous la forme φ = ψ ◦ T où ψ ∈ L 2 (X, B, µ).<br />

Démonstration.— Il est clair qu’une fonction <strong>de</strong> la forme φ = ψ ◦ T où ψ ∈<br />

L 2 (X, B, µ) est mesurable par rapport à la tribu T −1 B et appartient donc à<br />

L 2 (X, T −1 B, µ). Réciproquement, si une fonction φ est dans L 2 (X, T −1 B, µ),<br />

il est possible <strong>de</strong> trouver une suite <strong>de</strong> fonctions étagées φ n = ∑ i λ i,n1 Bi,n<br />

avec B i,n ∈ T −1 B convergeant µ-pp et L 2 vers φ. Les B i,n sont par définition<br />

<strong>de</strong> la forme T −1 A i,n et 1 T −1 A i,n<br />

= 1 1i,n ◦ T . Remarquons que<br />

‖ ∑ i<br />

λ i 1 T −1 C i<br />

‖ 2 = ∑ i<br />

|λ i | 2 µ(T −1 C i ) = ∑ i<br />

|λ i | 2 µ(T −1 C i ) = ‖ ∑ i<br />

λ i 1 Ci ‖ 2 .<br />

Ainsi, la suite φ n = ∑ i λ i,n1 Bi,n converge dans L 2 si et seulement si la suite<br />

ψ n = ∑ i λ i,n1 Ai,n converge dans L 2 . Notons ψ sa limite. Puisque φ n = ψ n ◦<br />

T = U T ψ n et que U T est continue dans L 2 on a φ = ψ ◦ T .<br />

Le lemme précé<strong>de</strong>nt montre que ImP = ImU. Comme P est un projecteur<br />

ker P = (ImP ) ⊥ et comme <strong>de</strong> façon générale (ImU) ⊥ = ker U ∗ on a<br />

ker P = ker U ∗ . L’opérateur UU ∗ est symétrique borné et vérifie (UU ∗ ) 2 =<br />

UU ∗ UU ∗ = UU ∗ (car U est une isométrie) si bien que UU ∗ est une projection<br />

orthogonale ; son noyau ker UU ∗ est ker U ∗ (exercice) i.e ker P . Cela suffit<br />

pour affirmer que UU ∗ = P . Nous avons donc démontré<br />

Lemme 3.2.2 On a U ∗ T U T = Id et U T U ∗ T = E(·|T −1 B).<br />

La tribu <strong>de</strong>s invariants Notons I la tribu constituée <strong>de</strong>s A ∈ B tels que<br />

T −1 A = A mod 0. L’espace L 2 (X, I, µ) est l’ensemble <strong>de</strong>s φ ∈ L 2 telles que<br />

φ ◦ T = φ (exercice). On définit comme précé<strong>de</strong>mment E(·|I) la projection<br />

orthogonale sur L 2 (X, I, µ). On peut énoncer le théorème <strong>de</strong> Von Neumann<br />

Théorème 3.2.1 Si (X, B, µ, T ) est un système dynamique, alors pour toute<br />

fonction φ ∈ L 2 (X, B, µ) la suite<br />

1<br />

n S nφ = 1 )<br />

(φ + φ ◦ T + · · · + φ ◦ T n−1<br />

n<br />

converge dans L 2 (X, B, µ) vers E(φ|I).<br />

Démonstration.— Nous allons démontrer que pour toute fonction φ ∈<br />

L 2 (X, B, µ) et tout ɛ > 0 il existe ψ ∈ L 2 (X, B, µ) et η ɛ ∈ L 2 (X, B, µ) tels<br />

que‖η ɛ ‖ < ɛ/2 et<br />

φ = ψ ɛ ◦ T − ψ ɛ + E(φ|I) + η ɛ .<br />


3.2. LES THÉORÈMES ERGODIQUES 29<br />

Il suffit pour cela <strong>de</strong> démontrer que φ − E(φ|I) est dans l’adhérence L 2 <strong>de</strong><br />

U − I. Un calcul simple montre Im(I − U) ⊥ = ker(I − U ∗ ). Or, si U ∗ φ = φ<br />

on a P φ = UU ∗ φ = Uφ. Mais, ‖Uφ‖ = ‖φ‖ i.e ‖P φ‖ = ‖φ‖. Ceci n’est<br />

possible que si φ ∈ ImP c’est-à-dire si P φ = φ d’où l’on dé<strong>du</strong>it Uφ = φ.<br />

Réciproquement, si Uφ = φ on a φ = U ∗ Uφ = U ∗ φ. On a donc prouvé<br />

On a donc,<br />

Im(U − I) ⊥ = ker(U ∗ − I) = ker(U − I) = L 2 (X, I, µ).<br />

Im(U − I) = L 2 (X, I, µ) ⊥<br />

Mais par définition pour tout φ ∈ L 2 (X, B, µ), φ − E(φ|I) ∈ L 2 (X, I, µ) ⊥<br />

Concluons la preuve <strong>du</strong> théorème :<br />

mais ‖ 1 n S nη ɛ ‖ ≤ ɛ/2 si bien que<br />

1<br />

n S nφ = 1 n (φ ◦ T n − φ) + E(φ|I) + 1 n S nη ɛ ;<br />

‖ 1 n S nφ − E(φ|I)‖ ≤ 2‖ψ ɛ‖<br />

+ ‖η ɛ ‖<br />

n<br />

≤ ɛ<br />

si n est assez grand.<br />

✷<br />

3.2.2 Convergence presque sûre<br />

Théorème 3.2.2 a) Si (X, B, µ, T ) est un système dynamique, alors pour<br />

toute fonction φ ∈ L 1 (X, B, µ) la suite<br />

converge vers E(φ|I)<br />

i) µ-presque sûrement<br />

ii) dans L 1 (X, B, µ).<br />

1<br />

n S nφ = 1 )<br />

(φ + φ ◦ T + · · · + φ ◦ T n−1<br />

n<br />

b) Si T est inversible on a la même conclusion pour n → −∞.<br />

Démonstration.—<br />

Un ingrédient crucial <strong>de</strong> la preuve <strong>de</strong> ce théorème est le lemme suivant


30 CHAPITRE 3. MESURES INVARIANTES<br />

Lemme 3.2.3 (ergodique maximal <strong>de</strong> Hopf) Si φ est mesurable, notons<br />

Snφ(x) ∗ = max 1≤k≤n (S k φ(x)), E n = {x ∈ X : Snφ(x) ∗ ≥ 0} et E = ∪E n .<br />

Alors, ∫ φdµ ≥ 0.<br />

E<br />

Démonstration.—<br />

si bien que<br />

et<br />

On observe que<br />

−φ(x) + S ∗ n+1φ(x) = max(S ∗ nφ(T x), 0)<br />

φ(x) = S ∗ n+1φ(x) − (S ∗ nφ) + ◦ T (x)<br />

∫<br />

∫<br />

∫<br />

φdµ = (Sn+1φ)dµ ∗ − ((Snφ) ∗ ◦ T ) + dµ<br />

Sn+1 ∗ φ≥0 Sn+1 ∗ φ≥0 Sn+1 ∫<br />

∫<br />

∗ φ≥0<br />

≥ (Sn+1φ) ∗ + dµ − (Snφ) ∗ + ◦ T dµ<br />

∫X<br />

∫X<br />

≥ (Sn+1φ) ∗ + dµ − (Snφ) ∗ + dµ<br />

≥ 0<br />

X<br />

la <strong>de</strong>rnière inégalité provenant <strong>du</strong> fait que max(0, φ(x), . . . , S n−1 φ(x), S n φ(x)) ≥<br />

max(0, φ(x), . . . , S n−1 φ(x)). On a donc ∫ E n+1<br />

φdµ ≥ 0 pour tout n et on<br />

conclut par convergence dominée.<br />

Un corollaire <strong>du</strong> lemme précé<strong>de</strong>nt est le suivant : Si A ∈ B vérifie T −1 A =<br />

A alors ∫ φdµ ≥ 0. Démontrons à présent le théorème <strong>de</strong> Birkhoff : soit<br />

E∩A<br />

A α,β l’ensemble <strong>de</strong>s x ∈ X tels que<br />

lim inf<br />

n→∞<br />

1<br />

n S 1<br />

nφ(x) ≤ α < β ≤ lim sup<br />

n→∞ n S nφ(x)<br />

L’ensemble A α,β est T invariant. Le lemme <strong>de</strong> Hopf appliqué à α − φ et φ − β<br />

montre que (pourquoi )<br />

∫<br />

∫<br />

φ ≤ αµ(A α,β ), φ ≥ βµ(A α,β )<br />

A α,β A α,β<br />

ce qui n’est possible que si µ(A α,β ) = 0. Par conséquent, pour µ-presque<br />

1<br />

tout x ∈ X lim inf n→∞ S 1<br />

n nφ(x) = lim sup S n→∞ n nφ(x) et donc 1 S n nφ(x)<br />

converge.<br />

Nous avons donc montré l’existence d’une fonction ˜φ telle que pour µ-pp<br />

X<br />

lim<br />

n→∞<br />

1<br />

n S nφ(x) = ˜φ(x).<br />


3.3. LIENS AVEC LA DYNAMIQUE TOPOLOGIQUE 31<br />

On a nécessairement ˜φ ◦ T = ˜φ et pour toute fonction ψ ∈ L ∞ (I) (i.e<br />

ψ ◦ T = ψ) on a ∫ ψ ˜φdµ = ∫ ψφdµ, c’est-à-dire que E(φ|I) = ˜φ.<br />

X X<br />

Prouvons à présent ii) : d’après le théorème <strong>de</strong> convergence dominée c’est<br />

évi<strong>de</strong>nt si φ est dans L ∞ (X, µ). Sinon, pour tout ɛ > 0 il existe φ ɛ ∈ L ∞ qui<br />

est ɛ-L 1 -proche <strong>de</strong> φ. Comme ‖E(φ − φ ɛ |I)‖ L 1 ≤ ɛ et que l’on a convergence<br />

L 1 <strong>de</strong> n −1 S n φ ɛ vers E(φ ɛ |I) on conclut aisément.<br />

✷<br />

Exercice Démontrer le point b) <strong>du</strong> théorème. (On pourra utiliser la convergence<br />

L 1 donnée par le théorème <strong>de</strong> Birkhoff.)<br />

3.3 Liens avec la dynamique topologique<br />

Dans cette section on suppose que (X, d) est un espace métrique compact.<br />

La tribu avec laquelle on travaille est la tribu borélienne.<br />

3.3.1 Existence <strong>de</strong> mesures ergodiques<br />

Définition 3.3.1 Si K est un ensemble convexe, on dit qu’un point x ∈ X<br />

est extrémal si x = tx 1 + (1 − t)x 2 , 0 < t < 1, x 1 ∈ K, x 2 ∈ K implique<br />

x = x 1 = x 2 .<br />

Notons M l’ensemble <strong>de</strong>s mesures invariantes T -invariantes. C’est un ensemble<br />

convexe non vi<strong>de</strong> et compact pour la topologie faible*. Le théorème<br />

suivant permet <strong>de</strong> caractériser les mesures T -invariantes ergodiques<br />

Théorème 3.3.1 Si (X, d) est un espace métrique compact et si T : X →<br />

X est continue, une mesure <strong>de</strong> probabilité T -invariante est ergodique si et<br />

seulement si elle est extrémale.<br />

Démonstration.— Supposons que µ est T -ergodique et qu’il existe une<br />

décomposition µ = tµ 1 + (1 − t)µ 2 , 0 < t < 1, µ 1 , µ 2 étant T -invariantes. La<br />

mesure µ 1 est absolument continue par rapport à la mesure µ et d’après le<br />

théorème <strong>de</strong> Radon-Nikodym, il existe une fonction f ∈ L 1 (µ), f ≥ 0 telle<br />

que dµ 1 = fdµ. Montrons que f est T -invariante. Observons que comme µ 1<br />

est T -invariante on a pour toute fonction φ ∈ L ∞<br />

∫<br />

∫<br />

φdµ 1 = φ ◦ T dµ 1


32 CHAPITRE 3. MESURES INVARIANTES<br />

c’est-à-dire<br />

∫<br />

∫<br />

φfdµ =<br />

φ ◦ T · fdµ<br />

et comme µ est T -invariante<br />

∫<br />

∫<br />

φ ◦ T · f ◦ T dµ =<br />

φ ◦ T · fdµ.<br />

Posons à présent φ = 1 f>λ . On a<br />

∫<br />

∫<br />

f ◦ T dµ =<br />

f◦T >λ<br />

et puisque µ est T -invariante<br />

∫<br />

∫<br />

(f − λ) + dµ =<br />

X<br />

On a donc pour tout λ<br />

f◦T >λ<br />

f◦T >λ<br />

fdµ<br />

∫<br />

(f ◦ T − λ) + dµ =<br />

{f > λ} = {f ◦ T > λ},<br />

f◦T >λ<br />

(f − λ)dµ.<br />

mo<strong>du</strong>lo un ensemble <strong>de</strong> µ-mesure nulle. Par conséquent, f = f ◦ T , µ-pp.<br />

La réciproque est plus facile à démontrer. Supposons que µ ne soit pas<br />

T -ergodique. Il existe donc un ensemble A dans la tribu, T -invariant et tel<br />

que 0 < µ(A) < 1. Si on pose µ 1 = µ(· ∩ A)/µ(A) et µ 2 = µ(· ∩ A c )/µ(A c ),<br />

on a µ = tµ 1 + (1 − t)µ 2 avec t = µ(A), ce qui contredit le fait que µ est un<br />

point extrémal.<br />

Un corollaire <strong>du</strong> théorème précé<strong>de</strong>nt est l’existence <strong>de</strong> mesure ergodique<br />

pour toute transformation continue sur un espace compact.<br />

Corollaire 3.3.1 Si (X, d) est un espace métrique compact et T : X → X<br />

une application continue, il existe une mesure qui est T -ergodique.<br />

Démonstration.— Ceci résulte <strong>du</strong> théorème <strong>de</strong> Krein-Milman qui affirme<br />

que tout compact, convexe d’un espace vectoriel topologique admet <strong>de</strong>s points<br />

extrémaux 1 . Dans le cas qui nous intéresse, on peut le démontrer directement.<br />

Choisissons (φ n ) n une suite <strong>de</strong> fonctions continues <strong>de</strong>nse dans C 0 (X).<br />

L’ensemble M 0 <strong>de</strong>s mesures <strong>de</strong> probabilités µ sur X telles que 〈µ, φ 0 〉 =<br />

sup ν∈M 〈ν, φ 0 〉 est non vi<strong>de</strong> puisque M est compact pour la topologie faible*<br />

1 et qu’il est l’enveloppe convexe <strong>de</strong> ses points extrémaux<br />


3.3. LIENS AVEC LA DYNAMIQUE TOPOLOGIQUE 33<br />

et est un espace convexe compact pour la topologie faible*. Par récurrence on<br />

construit M p qui est l’ensemble non vi<strong>de</strong> convexe compact pour la topologie<br />

faible* constitué <strong>de</strong>s mesures ν ∈ M p−1 telles que 〈µ, φ p 〉 = sup ν∈Mp−1<br />

〈ν, φ p 〉.<br />

Notons M ∞ l’intersection <strong>de</strong>s M p , p ≥ 0. C’est toujours un ensemble non<br />

vi<strong>de</strong> convexe compact pour la topologie faible*. Démontrons qu’il est constitué<br />

<strong>de</strong> points extrémaux. Supposons par l’absur<strong>de</strong> que ce ne soit pas le cas<br />

et que l’on ait une écriture µ = tµ 1 + (1 − t)µ 2 avec 0 < t < 1. Il est facile<br />

<strong>de</strong> voir que pour tout p, 〈µ, φ p 〉 = 〈µ 1 , φ p 〉 = 〈µ 2 , φ p 〉 (utiliser la définition <strong>de</strong><br />

M p ) et comme la suite φ p est <strong>de</strong>nse dans C 0 (X) on a µ = µ 1 = µ 2 .<br />

✷<br />

3.3.2 Points génériques<br />

Supposons que (X, d) soit un espace métrique compact, et soient T une<br />

transformation mesurable sur X, µ une mesure T -invariante ergodique et<br />

(φ k ) k≥0 une suite <strong>de</strong> fonctions continues sur X <strong>de</strong>nse dans C 0 (X). Le Théorème<br />

<strong>de</strong> Birkhoff nous apprend qu’il existe un ensemble E k <strong>de</strong> µ-mesure 1<br />

tel que pour tout x ∈ E k , (1/n)S n φ k (x) converge vers ∫ φ X kdµ. L’ensemble<br />

E = ∩ k E k est <strong>de</strong> µ-mesure 1 et comme la suite <strong>de</strong>s φ k est C 0 -<strong>de</strong>nse dans<br />

C 0 (X), il est clair que pour toute φ ∈ C 0 (X) et tout x ∈ X, la suite<br />

(1/n)S n φ(x) converge également vers ∫ φdµ. On dit que l’ensemble E est<br />

X<br />

un ensemble générique pour (T, µ).<br />

Un corollaire <strong>du</strong> résultat précé<strong>de</strong>nt est le suivant :<br />

Corollaire 3.3.2 Si µ et ν sont <strong>de</strong>ux mesures <strong>de</strong> probabilité T -invariantes<br />

et ergodiques elles sont mutuellement singulières 2 ou égales.<br />

Démonstration.— Supposons que ce ne soit pas le cas. L’intersection E <strong>de</strong><br />

l’ensemble <strong>de</strong>s points réguliers <strong>de</strong> µ et <strong>de</strong> l’ensemble <strong>de</strong>s points réguliers <strong>de</strong> ν<br />

est alors <strong>de</strong> µ-mesure et <strong>de</strong> ν-mesure positive. Pour toute fonction continue<br />

φ et x ∈ E, on a donc convergence <strong>de</strong> (1/n)S n φ(x) vers ∫ φdµ et ∫ φdν.<br />

X X<br />

Par conséquent, µ = ν.<br />

✷<br />

3.3.3 Unique ergodicité<br />

Définition 3.3.2 On dit qu’un système dynamique (X, T, µ) est uniquement<br />

ergodique, si µ est l’unique mesure <strong>de</strong> probabilité invariante par T .<br />

2 pour tout borélien, µ(A) > 0 implique ν(A) = 0 et ν(A) > 0 implique µ(A) = 0


34 CHAPITRE 3. MESURES INVARIANTES<br />

Puisque l’ensemble <strong>de</strong>s mesures ergodiques est l’ensemble <strong>de</strong>s mesures extrémales<br />

on a<br />

Proposition 3.3.1 Si (X, T, µ) est uniquement ergodique, il est ergodique.<br />

Exemple : La translation R α : x ↦→ x+α sur le cercle R/Z avec α irrationnel<br />

admet la mesure <strong>de</strong> Lebesgue comme unique mesure invariante. En effet, si<br />

(R α ) ∗ µ = µ, on a (R n a ) ∗ µ = µ et comme la suite nα est <strong>de</strong>nse sur le cercle,<br />

il est facile <strong>de</strong> voir que pour tout β sur le cercle (R β ) ∗ µ = µ. Mais la mesure<br />

<strong>de</strong> Haar est l’unique mesure invariante par toute translation.<br />

Théorème 3.3.2 Soit (X, d) un espace métrique compact et T : X → X une<br />

transformation continue et µ une mesure T -invariante. Les trois propriétés<br />

suivantes sont équivalentes :<br />

i) µ est l’unique mesure <strong>de</strong> probabilité invariante par T ;<br />

ii) pour toute fonction φ ∈ C(X) et tout ɛ > 0 il existe <strong>de</strong>s fonctions ψ, η ∈<br />

C(X) telles que<br />

∫<br />

φ = ψ ◦ T − ψ + η + φdµ, ‖η‖ 0 ≤ ɛ;<br />

iii) pour toute fonction continue φ ∈ C(X), les moyennes <strong>de</strong> Birkhoff <strong>de</strong> φ,<br />

(1/n)S n φ(·) convergent uniformément vers ∫ X φdµ.<br />

Le fait que pour toute fonction continue φ ∈ C(X), les moyennes <strong>de</strong> Birkhoff<br />

<strong>de</strong> φ, (1/n)S n φ(·) convergent uniformément vers une constante est équivalent<br />

à l’unique ergodicité <strong>de</strong> (T, µ).<br />

Démonstration.—<br />

i) ⇔ ii) : Notons E l’ensemble <strong>de</strong>s fonctions continues <strong>de</strong> X <strong>de</strong> µ-intégrale<br />

nulle et F l’adhérence pour la topologie C 0 <strong>de</strong> l’ensemble <strong>de</strong>s fonctions <strong>de</strong> la<br />

forme ψ ◦ T − ψ. Si E ̸= F, le théorème <strong>de</strong> Hanh-Banach nous enseigne qu’il<br />

existe une forme linéaire non nulle Λ ∈ E ∗ dont la restriction à F est nulle.<br />

D’après le théorème <strong>de</strong> représentation <strong>de</strong> Riesz, il existe une mesure (réelle) ν<br />

telle que pour tout φ ∈ E, Λφ = ∫ φdν. Par conséquent, pour toute fonction<br />

X<br />

φ = ψ◦T −ψ où ψ est continue on a ∫ φdν = 0, et donc ∫ ψ◦T dν = ∫ ψdν.<br />

X X X<br />

On a donc T ∗ ν = ν. La mesure ν admet une écriture unique <strong>de</strong> la forme<br />

ν = ν + −ν − où ν ± sont <strong>de</strong>s mesures boréliennes positives telles que pour tout<br />

borélien A, ν ± (A) = ±ν(A ∩ E ± ), où E ± sont <strong>de</strong>s boréliens. Démontrons que<br />

ν ± sont T -invariantes. Déjà,<br />

ν + (T −1 E + ) ≥ ν(T −1 E + ) = ν(E + ) = ν + (E + )<br />

X


3.3. LIENS AVEC LA DYNAMIQUE TOPOLOGIQUE 35<br />

et donc ν + (T −1 E + ∆E + ) = 0. En outre,<br />

ν + (T −1 E + ) − ν − (T −1 E + ) = ν(T −1 E + ) = ν(E + ) = ν + (E + )<br />

et comme ν + (E + ) = ν + (T −1 E + ) on en dé<strong>du</strong>it ν − (T −1 E + ) = 0 et ν(T −1 E + ∆E + ) =<br />

0. Pour tout borélien A<br />

ν + (T −1 A) = ν(T −1 A ∩ E + ) = ν(T −1 A ∩ T −1 E + ) = ν(A ∩ E + ) = ν + (A)<br />

. On verrait <strong>de</strong> même que ν − est T -invariante. Comme par hypothèse (T, µ)<br />

est uniquement ergodique, on a ν + = µ. Mais alors, Λ est nulle sur E, ce qui<br />

est une contradiction.<br />

ii) ⇔ iii) : C’est clair.<br />

iii) ⇔ i) : Si ν est une mesure <strong>de</strong> probabilité T -invariante, ∫ ∫<br />

(1/n)S X nφdν =<br />

φdν. De la convergence uniforme <strong>de</strong>s moyennes <strong>de</strong> Birkhoff <strong>de</strong> φ vers<br />

∫X<br />

φdµ on dé<strong>du</strong>it µ = ν.<br />

✷<br />

X<br />

Skew-shift<br />

Pour α ∈ T irrationnel, notons T = T α : T 2 → T 2 défini par T (x, y) =<br />

(x + α, y + x). Les itérés <strong>de</strong> T se calculent aisément : pour n ≥ 0,<br />

T n (x, y) = (x + nα, y + nx + n(n − 1)α/2).<br />

Si m désigne la mesure <strong>de</strong> Lebesgue, il est clair que m est T -invariante puisque<br />

le jacobien <strong>de</strong> T est constant égal à 1. Démontrons que (T, m) est ergodique :<br />

si f est une fonction bornée T -invariante, il est facile <strong>de</strong> voir que ses coefficients<br />

<strong>de</strong> Fourier vérifient ˆf(k + l, l) = e 2πikα ˆf(k, l) ; comme ils sont dans<br />

l 2 (Z 2 ) on voit facilement que f est constante.<br />

Démontrons à présent<br />

Théorème 3.3.3 Si α est irrationnel, T α est uniquement ergodique.<br />

Démonstration.— Il suffit pour cela <strong>de</strong> démontrer que si ν est une mesure<br />

<strong>de</strong> probabilité T -invariante elle est égale à m. Si π : T 2 → T est la projection<br />

suivant la première variable, on voit que π ◦ T α = R α ◦ π où R α est la<br />

translation d’angle α sur T. On a donc (R α ) ∗ (π ∗ ν) = (π ∗ ν) et comme la<br />

mesure <strong>de</strong> Lebesgue est l’unique mesure invariante par R α (α est irrationnel)<br />

on a nécessairement π ∗ ν = Leb : ν se projette par le premier facteur sur la<br />

mesure <strong>de</strong> Lebesgue. Ainsi, pour tout borélien I ⊂ T, ν(π −1 I) = Leb(I).<br />

Notons E m (resp. E ν ) l’ensemble <strong>de</strong>s points m-génériques (resp. ν-générique)


36 CHAPITRE 3. MESURES INVARIANTES<br />

pour T . Le théorème <strong>de</strong> Fubini implique qu’il existe un ensemble I ⊂ T <strong>de</strong><br />

mesure <strong>de</strong> Lebesgue 1 tel que pour tout x ∈ I la mesure <strong>de</strong> Lebesgue <strong>de</strong> la<br />

fibre π −1 (x) ∩ E m égale 1.Si on note J l’ensemble <strong>de</strong>s x ∈ I pour lesquels<br />

π −1 (x) ∩ E ν = ∅, on a Leb 1 (J) = ν(π −1 (J)) = 0 ; en notant Ĩ = I − J on voit<br />

que ν(π −1 (Ĩ)) = 1 si bien que E −1<br />

ν = π (Ĩ) mod ν . Comme pour x ∈ Ĩ,<br />

π −1 (x) ∈ E m on a que pour tout (x, y) ∈ T 2 avec x ∈ Ĩ il existe une suite<br />

y n ∈ T convergeant vers y telle que chaque (x, y n ) est m-générique. On a<br />

donc pour toute fonction continue f : T 2 → R,<br />

lim<br />

N→∞<br />

1<br />

N<br />

N∑<br />

f(x + kα, y + kx + k(k − 1)α) = ˜f ν (x, y),<br />

k=0<br />

lim<br />

N→∞<br />

1<br />

N<br />

N∑<br />

∫<br />

f(x + kα, y n + kx + k(k − 1)α) =<br />

k=0<br />

et <strong>du</strong> fait <strong>de</strong> l’uniforme continuité <strong>de</strong> f<br />

fdm,<br />

lim sup<br />

N→∞<br />

1<br />

N<br />

N∑<br />

|f(x+kα, y+kx+k(k−1)α)−f(x+kα, y n +kx+k(k−1)α)| ≤ δ(|y−y n |),<br />

k=0<br />

où δ est une fonction tendant vers 0 en 0. Ceci démontre que pour tout x ∈ Ĩ,<br />

la fibre entière π −1 (x) est dans E m et donc que ν-presque tout point <strong>de</strong> E ν<br />

est appartient à E m . Mais ceci entraîne <strong>de</strong> façon claire que ν = m puisque le<br />

théorème <strong>de</strong> convergence dominée montre que pour toute fonction continue<br />

f, ∫ X fdν = ∫ X (1/n)S nfdν converge vers ∫ X fdm. ✷<br />

On peut donner une preuve qui s’inspire <strong>du</strong> point <strong>de</strong> vue spectral. Supposons<br />

que ν soit une mesure invariante par T et notons U : L 2 (T 2 , ν) → L 2 (T 2 , ν)<br />

l’opérateur unitaire 3 défini par Uf = f ◦ T . Pour r = (k, l) ∈ Z 2 notons<br />

ˆν(r) = 〈ν, e −r 〉 = ∫ T 2 e −2πi〈r,z〉 dz les coefficients <strong>de</strong> Fourier <strong>de</strong> ν (rappelons<br />

qu’une mesure est caractérisée par ses coefficients <strong>de</strong> Fourier).<br />

Si r ≠ 0 est fixé, les vecteurs (U n e r ) n≥1 sont <strong>de</strong>ux à <strong>de</strong>ux orthogonaux.<br />

En effet, 〈U n e r , U m e r 〉 = 〈U n−m e r , e r 〉. Comme Ue (k,l) = e 2πikα e (k+l,l) on voit<br />

que U (n−m) e r est <strong>de</strong> la forme e (k ′ ,l) (avec k ′ = k ssi n − m = 0), si bien que<br />

〈U n−m e r , e r 〉 = 〈e (k ′ ,0), e (k,0) 〉. Mais on a<br />

〈e (k ′ ,0), e (k,0) 〉 = 〈Ue (k ′ ,0), Ue (k,0) 〉 = e (2πi(k′ −k)α) 〈e (k ′ ,0), e (k,0) 〉<br />

3 on munit L 2 (X, ν) <strong>du</strong> pro<strong>du</strong>it hermitien 〈f, g〉 = ∫ T 2 f(z)ḡ(z)dν(z)


3.3. LIENS AVEC LA DYNAMIQUE TOPOLOGIQUE 37<br />

ce qui entraîne que 〈e (k ′ ,0), e (k,0) 〉 égale 0 si k ≠ k ′ et 1 sinon. On a donc bien<br />

démontré que les vecteurs (U n e r ) n≥1 sont <strong>de</strong>ux à <strong>de</strong>ux orthogonaux. Projetons<br />

le vecteur 1 sur l’espace engendré par les (U n e r ) n≥1 : d’après l’inégalité<br />

<strong>de</strong> Parseval-Bessel<br />

∑<br />

|〈U n e r , 1〉| 2 ≤ ‖1‖ 2 L 2 (ν) = 1.<br />

n≥0<br />

Mais, 〈U n e r , 1〉 = 〈U n e r , U n 1〉 = 〈e r , 1〉 = ˆν(−r). On a donc démontré que<br />

pour tout r ∈ Z 2 , ˆν(r) = 0 si r ≠ 0 et ˆν(0) = 1. Ces relations caractérisent<br />

la mesure <strong>de</strong> Lebesgue sur T 2 .<br />

Equirépartition<br />

Définition 3.3.3 Une suite (x n ) <strong>de</strong> points dans [0, 1] d<br />

pour tout pavé I ⊂ [0, 1] d on a<br />

est équirépartie si<br />

#{k ∈ {1, . . . , N} : x k ∈ I}<br />

lim<br />

N→∞<br />

N<br />

= vol d (I)<br />

Un critère d’équirépartition est le suivant (preuve laissée en exercice au lecteur).<br />

Théorème 3.3.4 Les propriétés suivantes sont équivalentes :<br />

i) La suite (x n ) est équirépartie ;<br />

ii) Pour toute fonction Riemann intégrable f sur [0, 1] d la suite 1 n<br />

∑ n<br />

k=1 f(x k)<br />

converge vers ∫ [0,1] d f(x)dx.<br />

iii) Pour toute fonction continue f sur [0, 1] d la suite 1 n<br />

∑ n<br />

k=1 f(x k) converge<br />

vers ∫ [0,1] d f(x)dx.<br />

iv) Pour tout polynôme trigonométrique P la suite 1 n<br />

∑ n<br />

k=1 P (x k) converge<br />

vers ∫ T d P (x)dx.<br />

Comme corollaire <strong>de</strong>s <strong>de</strong>ux sous-sections précé<strong>de</strong>ntes on a<br />

Corollaire 3.3.3 Si α est irrationnel, la suite n(n − 1)α/2 est équirépartie<br />

sur [0, 1]<br />

Démonstration.— Il suffit <strong>de</strong> poser f(x, y) = e 2πir y et d’appliquer les théorèmes<br />

3.3.2, 3.3.3, 3.3.4<br />


38 CHAPITRE 3. MESURES INVARIANTES<br />

On peut démontrer par cette métho<strong>de</strong> que si P (n) est un polynôme dont<br />

le coefficient <strong>du</strong> monôme <strong>du</strong> plus haut <strong>de</strong>gré est irrationnel, alors la suite<br />

(P (n)) est équirépartie. On intro<strong>du</strong>ira pour cela T : T d → T d défini par<br />

T : (θ 1 , θ 2 , . . . , , θ d ) ↦→ (θ 1 + α, θ 2 + θ 1 , . . . , θ d + θ d−1 ),<br />

et on démontrera que l’unique mesure <strong>de</strong> probabilité T -invariante est la<br />

mesure <strong>de</strong> Lebesgue sur T 2 . Si P est <strong>de</strong> <strong>de</strong>gré d, on pose P d = P , et<br />

P j = P j+1 (X + 1) − P j+1 (X), j = N − 1, . . . , 0. On a P 0 (X) = α où on<br />

a noté α/N! le coefficient dominant <strong>de</strong> P . Si on pose θ n = P 1 (n), . . . , P d (n))<br />

on a T n θ 0 = θ n . On conclut alors comme précé<strong>de</strong>mment.<br />

3.4 Mélange<br />

Définition 3.4.1 Un système dynamique (X, A, T, m) est dit mélangeant si<br />

pour tous boréliens A, B ∈ A on a<br />

Il n’est pas difficile <strong>de</strong> prouver que<br />

lim m(T −n A ∩ B) = m(A)m(B).<br />

n→∞<br />

Proposition 3.4.1 Un système dynamique est mélangeant si et seulement<br />

si pour toutes fonctions f, g ∈ L 2 (X, m) on a<br />

∫<br />

∫ ∫<br />

f ◦ T n ḡdm = fdm ḡdm<br />

lim<br />

n→∞<br />

X<br />

Théorème 3.4.1 Si un système dynamique est mélangeant il est ergodique.<br />

Démonstration.— En effet, si A est un borélien T -invariant on a lim n→∞ m(T −n A∩<br />

A) = m(A)m(A) ce qui s’écrit m(A) = m(A) 2 et donc m(A) égale 0 ou 1.<br />

Dans un cadre probabiliste il s’agit <strong>de</strong> la loi <strong>du</strong> 0,1 <strong>de</strong> Kolmogorov.<br />

Un exemple important <strong>de</strong> systèmes mélangeants est fourni par les sousshifts<br />

<strong>de</strong> type fini.<br />

Théorème 3.4.2 (Perron-Frobenius) Si P ∈ M r (R) est une matrice stochastique<br />

irré<strong>du</strong>ctible 4 alors il existe une unique mesure stationnaire, c’està-dire<br />

un unique vecteur p ∈ R n à coordonnées positives et dont la somme<br />

<strong>de</strong>s composantes vaut 1 tel que µP = µ. En outre, si P est apériodique 5<br />

alors pour toute mesure <strong>de</strong> probabilité ν sur {1, . . . , r}, ν, lim n→∞ qP n = p.<br />

4 ce qui signifie que le graphe orienté <strong>de</strong> P est connexe<br />

5 ∃m ≥ 0, ∀i, j, (P m ) ij > 0<br />

X<br />

X<br />


3.4. MÉLANGE 39<br />

Démonstration.— Supposons P irré<strong>du</strong>ctible, et faisons l’hypothèse qu’il<br />

existe <strong>de</strong>ux mesures <strong>de</strong> probabilités µ 1 , µ 2 différentes telles que µ 1 = µ 1 P<br />

et<br />

∑<br />

µ 2 = µ 2 P . Si on appelle x le vecteur ligne x = µ 1 − µ 2 on a x = xP et<br />

i∈E x i = 0 ; en particulier il existe <strong>de</strong>ux indices i, j tels que x i et x j sont <strong>de</strong><br />

signes opposés. Puisque la matrice P est irré<strong>du</strong>ctible il existe un exposant m<br />

tel que (P m ) ij > 0. Ecrivons x = xP m puis,<br />

∑<br />

|x j | = ∑ | ∑ x k (P m ) kj |<br />

j∈E j∈E k∈E<br />

≤ ∑ ∑<br />

|x k ||(P m ) kj |<br />

j∈E k∈E<br />

≤ ∑ ∑<br />

|x k |(P m ) kj<br />

k∈E j∈E<br />

≤ ∑ k∈E<br />

|x k |<br />

puisque la matrice P est stochastique ( ∑ j∈E (P m ) ij = 1). Or, cette <strong>de</strong>rnière<br />

inégalité est une égalité ; par conséquent dans la suite d’inégalités que nous<br />

avons écrites nous avions en fait déjà <strong>de</strong>s égalités. Il en résulte que pour tout<br />

j,<br />

|x j | = | ∑ x k (P m ) kj | = ∑ |x k |(P m ) kj ,<br />

k∈E<br />

k∈E<br />

ce qui n’est possible que si les |x k |(P m ) kj , sont tous <strong>de</strong> même signe quand k<br />

varie dans le sous-ensemble <strong>de</strong> E constitué <strong>de</strong>s k pour lesquels |x k |(P m ) kj est<br />

non nul. Puisque x i ≠ 0 et que par définition <strong>de</strong> m le coefficient (P m ) ij > 0,<br />

ceci entraîne que x j est <strong>de</strong> même signe que x i ce qui est une contradiction.<br />

Supposons à présent P apériodique. Notons M 0 l’ensemble <strong>de</strong>s vecteurs<br />

lignes x tels que ∑ i∈E x i = 0. Définissons pour x ∈ M 0 la norme suivante :<br />

‖x‖ = 1 ∑<br />

|x i | = ∑ i )<br />

2<br />

i∈E(x + .<br />

i∈E<br />

(Avec la notation z + = max(0, z)). L’application x ↦→ xP envoie M 0 dans<br />

lui même. On a le lemme suivant<br />

Lemme 3.4.1 Soit Q une matrice stochastique telle que α = min i,j∈E Q ij ><br />

0. Alors, Q est une (1 − α)-contraction : pour tout x ∈ M 0<br />

‖xQ‖ ≤ (1 − α)‖x‖.


40 CHAPITRE 3. MESURES INVARIANTES<br />

Démonstration.—<br />

On a<br />

‖xQ‖ =<br />

∑<br />

(xQ) i<br />

i:(xQ) i >0<br />

= ∑<br />

≤<br />

i:(xQ) i >0 k∈E<br />

∑<br />

∑<br />

x k (Q) ki<br />

∑<br />

i:(xQ) i >0 k:x k >0<br />

≤ ∑<br />

∑<br />

k:x k >0 i:(xQ) i >0<br />

|x k |(Q) ki |<br />

x k (Q) ki<br />

Comme xQ ∈ M 0 on a ∑ i∈E (xQ) i = 0 et l’ensemble <strong>de</strong>s i ∈ E pour lesquels<br />

(xQ) i > 0 n’est pas E tout entier. Par conséquent,<br />

∑<br />

(Q) ki −<br />

∑<br />

(Q) ki<br />

ki =<br />

i:(xQ) i >0(Q) ∑ i∈E<br />

= 1 − ∑<br />

Revenant aux inégalités précé<strong>de</strong>ntes<br />

i:(xQ) i ≤0<br />

≤ (1 − α).<br />

i:(xQ) i ≤0<br />

(Q) ki<br />

‖xQ‖ ≤ (1 − α)‖x‖.<br />

Puisque P est apériodique il existe un entier m tel que Q = P m soit à<br />

coefficients strictement positifs. L’application x ↦→ xP m <strong>de</strong> (M 0 , ‖ · ‖) dans<br />

lui même est donc une (1−α)-contraction et par conséquent pour tout entier<br />

l, ‖xP lm ‖ ≤ (1 − α) l ‖x‖. Si µ est l’unique mesure <strong>de</strong> probabilité stationnaire<br />

et ν une mesure <strong>de</strong> probabilité µ − ν ∈ M 0 et donc pour tous entiers l, c<br />

ce qui s’écrit (en utilisant µP n = µ)<br />

‖(µ − ν)P lm+c ‖ ≤ (1 − α) l ‖(µ − ν)P c ‖<br />

‖µ − νP lm+c ‖ ≤ (1 − α) l ‖(µ − ν)P c ‖.<br />

Comme tout entier n s’écrit <strong>de</strong> façon unique n = lm + c avec 0 ≤ c < m,<br />

l ≥ n/m (division euclidienne <strong>de</strong> n par m) et comme 0 ≤ (1 − α) < 1, la<br />

suite µ − νP n converge vers 0.<br />

Comme corollaire on obtient :<br />

✷<br />


3.4. MÉLANGE 41<br />

Théorème 3.4.3 Si P est une matrice stochastique et A la matrice <strong>de</strong> transition<br />

associée à P (A i,j = 1 ssi P ij > 0) notons p l’unique mesure stationnaire<br />

telle que pP = p et m la mesure correspondante sur (Σ A , Bor). Le<br />

système dynamique (Σ A , Bor, σ, m) est mélangeant.<br />

Démonstration.— Il suffit <strong>de</strong> démontrer que pour tous cylindres C =<br />

C(ɛ 0 , . . . , ɛ n ), C ′ = C(ɛ ′ 0, . . . , ɛ ′ n ′) on a<br />

lim m(C ∩<br />

k→∞ σ−k C ′ ) = 0.<br />

Si k est assez grand (k ≥ n), C∩σ −k C ′ est le cylindre C ′′ = C(ɛ 0 , . . . , ɛ n , ∗, ɛ k , . . . , ɛ k+n ′)<br />

dont la m mesure vaut<br />

m(C ′′ ) = p ɛ0 P ɛ0 ɛ 1<br />

· · · P ɛn−1 ɛ n<br />

(P k−n ) ɛnɛ k<br />

P ɛk ɛ k+1 · · · P ɛk+n ′ −1 ɛ k+n ′<br />

= p ɛ0 P ɛ0 ɛ 1<br />

· · · P ɛn−1 ɛ n<br />

(P k−n ) ɛnɛ ′ 0 P ɛ ′ 0 ɛ′ 1 · · · P ɛ ′ n ′ −1 ɛ′ n ′<br />

Mais q j (P k−n ) ji converge vers p i quand k tend vers l’infini ; ainsi, quand k<br />

tend vers l’infini m(C ′′ ) tend vers<br />

p ɛ0 P ɛ0 ɛ 1<br />

· · · P ɛn−1 ɛ n<br />

p ɛ ′<br />

0<br />

P ɛ ′<br />

0 ɛ ′ 1 · · · P ɛ ′ n ′ −1 ɛ′ n ′<br />

qui vaut m(C)m(C ′ ).<br />


42 CHAPITRE 3. MESURES INVARIANTES


Chapitre 4<br />

Homéomorphismes et<br />

difféomorphismes <strong>du</strong> cercle<br />

4.1 Homéomorphismes <strong>du</strong> cercle<br />

4.1.1 Forme <strong>de</strong>s relevés d’un homéomorphisme <strong>du</strong> cercle<br />

Nous entreprenons dans cette section l’étu<strong>de</strong> <strong>de</strong>s homéomorphismes <strong>du</strong><br />

cercle (ou plutôt <strong>du</strong> tore <strong>de</strong> dimension 1) T = R/Z = {x + Z : x ∈ R}.<br />

Nous notons π a projection canonique π : R → R/Z. On dit que x ∈ R est<br />

un relevé <strong>de</strong> ¯x ∈ R/Z si π(x) = ¯x. Si ¯x, ȳ ∈ R/Z admettent pour relevés<br />

respectifs x, y ∈ R nous posons d(x, y) = min k∈Z |x − y − k|. Il est facile <strong>de</strong><br />

voir que (R/Z, d) est un espace métrique complet compact. Par construction<br />

(R, π) est un revêtement <strong>de</strong> R/Z. Ceci permet <strong>de</strong> définir une orientation sur<br />

R/Z : nous dirons que ¯x, ȳ, ¯z sont ordonnés dans le sens direct s’il existe <strong>de</strong>s<br />

relevés x, y, z ∈ R tels que x < y < z < x + 1. On dit qu’une application<br />

continue f : R/Z → R/Z préserve l’orientation si pour tout triplé ordonné<br />

dans le sens direct (x, y, z) le triplet image (f(x), f(y), f(z)) est ordonné dans<br />

le sens direct.<br />

Exemple L’application <strong>de</strong> T dans lui même x ↦→ −x ne préserve pas l’orientation<br />

(elle la renverse).<br />

Comme [0, 1] est simplement connexe, pour tout chemin continu γ :<br />

[0, 1] → R/Z et tout ˜x ∈ π −1 (γ(0)) il existe un unique chemin continu<br />

˜γ : [0, 1] → R tel que ˜γ(0) = ˜x et qui relève γ : π ◦ ˜γ = γ. De la même<br />

façon, toute application continue g : R → R/Z se relève en une application<br />

continue G : R → R, tous les autres relèvement <strong>de</strong> g étant <strong>de</strong> la forme<br />

G(·) + k, k ∈ Z. Par conséquent si f : R/Z → R/Z est une application<br />

continue elle se relève en une application continue F : R → R (considérer<br />

43


44CHAPITRE 4. HOMÉOMORPHISMES ET DIFFÉOMORPHISMES DU CERCLE<br />

g = f ◦ π) toutes les autres applications relevant f étant <strong>de</strong> la forme F + k,<br />

k ∈ Z. On a ainsi<br />

π ◦ F = f ◦ π<br />

et Z étant discret, il existe un unique entier k ∈ Z tel que<br />

F (· + 1) = F (·) + k.<br />

Lemme 4.1.1 Une application f : R/Z → R/Z est un homéomorphisme<br />

préservant l’orientation si et seulement si il existe un relèvement F : R →<br />

R <strong>de</strong> f continu strictement monotone tel que F (· + 1) = F (·) + 1. Par<br />

conséquent il existe une fonction φ ∈ C 0 (R, R) qui est Z-périodique et telle<br />

que F = id + φ. Tout autre relèvement est <strong>de</strong> la forme id + φ + k où k ∈ Z.<br />

Démonstration.— Soit F un relèvement continu <strong>de</strong> f tel que F (x + 1) =<br />

F (x) + k, k ∈ Z. Comme f est injective F est strictement monotone (sinon<br />

on peut trouver <strong>de</strong>ux points x, y ∈ R x < y < x + 1 tels que F (x) =<br />

F (y) ; mais cela fournit <strong>de</strong>ux points distincts ¯x = π(x), ȳ = π(y) tels que<br />

f(¯x) = f(ȳ) contredisant l’injectivité <strong>de</strong> f). Ceci entraîne k ≠ 0 et par<br />

conséquent lim ±∞ F ∈ {−∞, ∞} si bien que F est un homéomorphisme<br />

<strong>de</strong> R. Comme f préserve l’orientation, F est strictement croissante et on<br />

a k > 0. Supposons l’entier k > 1. Alors, d’après le théorème <strong>de</strong>s valeurs<br />

intermédiaires, il existerait 0 < x < 1 tel que F (0) < F (x) = F (0) + 1 <<br />

F (1) = F (0) + k (F est nécessairement strictement croissante si p > 0).<br />

Mais ceci contredit l’injectivité <strong>de</strong> f = π ◦ F ◦ π. On a donc k = 1 et<br />

F (· + 1) = F (·) + 1. Il est alors clair que la fonction φ : x ↦→ F (x) − x est<br />

Z-périodique.<br />

✷<br />

Remarque Un critère pour qu’une application <strong>de</strong> la forme x + φ(x) où<br />

φ ∈ C 0 (R/Z) soit un homéomorphisme croissant <strong>de</strong> R est que |φ(x)−φ(y)| <<br />

|x − y| pour tous x, y. En particulier, si φ est dérivable et sup x∈R |φ ′ (x)| < 1<br />

ce sera le cas.<br />

Nous notons Homeo + (RZ) l’ensemble <strong>de</strong>s homéomorphismes <strong>de</strong> RZ préservant<br />

l’orientation et D 0 +(R/Z) l’ensemble <strong>de</strong>s homéomorphismes F <strong>de</strong> R<br />

croissants tels que x ↦→ F (x)−x est croissant. Ce <strong>de</strong>rnier espace s’i<strong>de</strong>ntifie naturellement<br />

à C 0 (R/Z) et nous définirons une distance d sur D 0 +(T) en posant<br />

d C 0(F, G) = sup x∈R |((F (x)−x)−(G(x)−x))|. Nous munirons Homeo + (R/Z)<br />

<strong>de</strong> la plus petite topologie qui rend l’application π : D 0 +(T) → Homeo + (T)<br />

continue : une base <strong>de</strong> voisinage <strong>de</strong> Homeo + (T) est l’ensemble <strong>de</strong>s V δ (f) où<br />

V δ (f) est {π ◦ (F + φ) : φ ∈ C 0 (T), ‖φ‖ C 0 < δ} où F est un relèvement <strong>de</strong> F .


4.1. HOMÉOMORPHISMES DU CERCLE 45<br />

4.1.2 Nombre <strong>de</strong> rotation<br />

Soit f un homéomorphisme <strong>du</strong> cercle et F (x) = x + φ(x) un relèvement<br />

(φ est 1-périodique). Remarquons que puisque φ est 1-périodique on peut<br />

considérer φ comme une application définie sur R/Z (exercice : vérifier).<br />

Le lemme et la remarque qui suivent sont à la base <strong>de</strong> la théorie <strong>du</strong> nombre<br />

<strong>de</strong> rotation<br />

Lemme 4.1.2 Si F (x) = x + φ(x) est le relèvement d’un homéomorphisme<br />

<strong>du</strong> cercle (préservant l’orientation) on a pour tout x, y ∈ R tels que |x − y| <<br />

1, l’inégalité |F (x) − F (y)| < 1.<br />

Démonstration.— Supposons en effet que x < y < x + 1. Comme F est<br />

strictement croissante et que F (x + 1) = F (x) + 1 on a F (x) < F (y) <<br />

F (x) + 1.<br />

Remarque : Si on note F n l’itéré n-ième <strong>de</strong> F on a<br />

∑n−1<br />

F n (x) − x = φ ◦ f k (x).<br />

k=0<br />

Le théorème fondamental <strong>de</strong> cette section est le suivant :<br />

Théorème 4.1.1 Les moyennes <strong>de</strong> Birkhoff <strong>de</strong> φ le long <strong>de</strong> f (ou F )<br />

✷<br />

F n (x) − x<br />

n<br />

= 1 ∑n−1<br />

φ ◦ f k (x)<br />

n<br />

k=0<br />

convergent uniformément vers un nombre ρ(F ). Pour toute mesure <strong>de</strong> probabilité<br />

µ sur R/Z invariante par f on a ρ(F ) = ∫ φdµ. Comme ρ(F + k) =<br />

R/Z<br />

ρ(F ) + k pour tout k ∈ Z on définit ρ(f) = ρ(F ) mod Z.<br />

Démonstration.— Considérons φ comme une application continue <strong>de</strong> R/Z<br />

sur R et soit µ une mesure <strong>de</strong> probabilité sur R/Z invariante par f. D’après<br />

le théorème <strong>de</strong> Birkhoff, on sait qu’il existe au moins un point x 0 ∈ R/Z pour<br />

lequel la somme <strong>de</strong> Birkhoff 1/n ∑ n−1<br />

k=0 φ ◦ f k (x 0 ) converge. Mais ceci signifie<br />

que (F n (x 0 ) − x 0 )/n converge vers un nombre ρ. Comme F n est un relevé <strong>de</strong><br />

f n on a |F n (x) − F n (y)| < 1 pourvu que |x − y| < 1. Par conséquent, pour<br />

tout x tel que |x − x 0 | < 1 on a<br />

1<br />

n |(F n (x) − x) − (F n (x 0 ) − x 0 )| ≤ 2 n ,


46CHAPITRE 4. HOMÉOMORPHISMES ET DIFFÉOMORPHISMES DU CERCLE<br />

ce qui prouve la convergence uniforme <strong>de</strong> 1 (F n (x) − x) vers un nombre ρ.<br />

n<br />

Pour i<strong>de</strong>ntifier ce <strong>de</strong>rnier, il suffit <strong>de</strong> constater que<br />

∫<br />

∫<br />

(F n (x) − x)dµ(x) = n φdµ<br />

R/Z<br />

pour obtenir que ρ = ∫ φdµ pour toute mesure <strong>de</strong> probabilité µ qui est<br />

R/Z<br />

f-invariante.<br />

Remarque On peut éviter le re<strong>cours</strong> au Théorème ergodique en observant<br />

que l’égalité ∫ (<br />

∫ )<br />

(F k (x) − x) − k φdµ dµ(x) = 0<br />

R/Z<br />

assure l’existence d’un point x k pour lequel F k (x k ) − x k = kρ.<br />

Remarque La remarque <strong>de</strong> la preuve précé<strong>de</strong>nt montre que pour tout k ∈ Z<br />

il existe un point x k tel que R −kρ ◦ f k admette x k comme point fixe.<br />

Propriétés <strong>du</strong> nombre <strong>de</strong> rotation<br />

Proposition 4.1.1 1) Si f, g ∈ Homeo + (R/Z) et h : R/Z est une semiconjugaison<br />

: f ◦ h = h ◦ g alors ρ(f) = ρ(g).<br />

2) L’application ρ : D 0 +(T) → R (resp. ρ : Homeo + (R/Z) → T) est continue.<br />

3) Si f, g ∈ Homeo + (T) commutent (f ◦g = g◦f) alors ρ(f ◦g) = ρ(f)◦ρ(g).<br />

4) Si F, G ∈ D 0 +(T) vérifient ∀x ∈ R F (x) ≤ G(x) alors ρ(F ) ≤ ρ(G).<br />

5) Si f ∈ Homeo + (T), ρ(f) = p/q ((p, q) ∈ Z × Z, p.g.c.d.(p, q) = 1) si et<br />

seulement si f admet un point périodique <strong>de</strong> pério<strong>de</strong> q.<br />

6) Si on note R λ : R → R l’application R λ (x) = x + λ alors l’application<br />

λ ↦→ ρ(R λ ◦ F ) est croissante au sens large et si ρ(f) /∈ Q alors ρ(R λ ◦ f) =<br />

ρ(f) implique λ = 0.<br />

Démonstration.—<br />

1) Soient F , G, H <strong>de</strong>s relèvements <strong>de</strong> f, g, h et φ, ψ, θ ∈ C 0 (T) tels que<br />

F (x) = x + φ(x), G(x) = x + ψ(x), H(x) = x + θ(x). La relation <strong>de</strong> semiconjugaison<br />

se relève sous la forme F ◦ H = H ◦ G + k où k est un entier<br />

que l’on peut supposer nul quitte à le retrancher à F . Il est facile <strong>de</strong> voir que<br />

pour tout entier n on a F n ◦ H = H ◦ G n si bien que<br />

R/Z<br />

R/Z<br />

✷<br />

F n (H(x)) − H(x)<br />

n<br />

= H(Gn (x)) − H(x)<br />

.<br />

n


4.1. HOMÉOMORPHISMES DU CERCLE 47<br />

Mais H(G n (x)) = G n (x) + θ(G n (x)), si bien que<br />

F n (H(x)) − H(x)<br />

n<br />

= Gn (x) − G(x) + (θ(G n (x)) − θ(x))<br />

.<br />

n<br />

Mais θ est bornée sur R et en faisant tendre n vers l’infini on obtient le<br />

résultat.<br />

2) On a vu que (F n − id)/n convergeait uniformément vers ρ(F ). Mais F ↦→<br />

(F n − id)/n est continue. Par conséquent (une limite uniforme <strong>de</strong> fonctions<br />

continues est continue) F ↦→ ρ(F ) est continue.<br />

3) On peut trouver <strong>de</strong>s relèvements tels que F ◦ G = G ◦ F . On a donc<br />

(F ◦ G) n = F n ◦ G n et<br />

(F ◦ G) n (x) − x<br />

n<br />

et donc<br />

‖ (F ◦ G)n − id<br />

n<br />

−(ρ(F )+ρ(G)) = ( F n (G n (x)) − G n (x)<br />

n<br />

−(ρ(F )+ρ(G))‖ 0 ≤ ‖ F n − id<br />

n<br />

−ρ(F ))+( Gn (x) − x<br />

−ρ(G))<br />

n<br />

−ρ(F ))|‖ 0 +‖ Gn − id<br />

−ρ(G))‖ 0 .<br />

n<br />

4) Si pour tout x F (x) ≤ G(x) alors comme F et G sont croissantes F (F (x)) ≤<br />

F (G(x)) ≤ G(G(x)) et plus généralement F n (x) ≤ G n (x).<br />

5) Si f admet un point périodique x <strong>de</strong> pério<strong>de</strong> q, il existe un relèvement F<br />

et un entier p tel que F q (˜x) = ˜x + p (˜x est un relèvement <strong>de</strong> x). On a donc<br />

F nq (x) − x = np et donc ρ(F ) = p/q. Réciproquement si ρ(f) = p/q alors il<br />

existe un relèvement F tel que ρ(F ) = p/q. On a vu (cf. la Remarque dans<br />

la preuve <strong>de</strong> l’existence <strong>du</strong> nombre <strong>de</strong> rotation) qu’il existait x ∈ R tel que<br />

F q (x) = x+q(p/q) = x+p. Par conséquent f q (x) = x. Démontrons que q est<br />

la plus petite pério<strong>de</strong>. Notons l cette plus petite pério<strong>de</strong> : il existe un entier m<br />

tels que F l (x) = x+m ; la division euclidienne <strong>de</strong> q par l, q = al+r, 0 ≤ r < l<br />

donne le résultat suivant ; x + p = F q (x) = F q−al (F al (x)) = F q−al (x + am) =<br />

F r (x) + am. Par conséquent F r (x) = x + p − am où 0 ≤ r < l ce qui<br />

contredit la minimalité <strong>de</strong> l si r est non nul. On a donc r = 0 c’est-à-dire<br />

q = al et p = am ; mais alors p et q ne sont pas premiers entre eux d’où une<br />

contradiction.<br />

6) Notons F λ = R λ ◦ F . La croissance résulte <strong>du</strong> point 4). Si ρ(F ) /∈ Q et<br />

λ > 0 alors il existe un rationnel p/q tel que (p/q) − (λ/2q) < ρ(F ) < p/q.<br />

En outre, on sait qu’il existe un x ∈ R pour lequel F q (x) = x + qρ(F ) et<br />

donc x + p − (λ/2) < F q (x) < x + p. Par conséquent, comme F, F λ sont<br />

croissantes et λ > 0, F q λ (x) = F λ(F q−1<br />

λ<br />

(x)) ≥ F λ (F q−1 (x)) = λ + F q (x),<br />

si bien que F q λ (x) ≥ x + p + (λ/2) et donc ρ(F q λ<br />

) ≥ p + (λ/2). On a donc<br />

ρ(F λ ) > p/q > ρ(F ).


48CHAPITRE 4. HOMÉOMORPHISMES ET DIFFÉOMORPHISMES DU CERCLE<br />

✷<br />

Exercice Démontrer qu’en général le nombre <strong>de</strong> rotation <strong>de</strong> la composition<br />

<strong>de</strong> <strong>de</strong>ux homéomorphismes <strong>du</strong> cercle préservant l’orientation n’est pas égal à<br />

la somme <strong>de</strong> leurs nombres <strong>de</strong> rotation. (Considérer une perturbation d’un<br />

difféomorphisme <strong>du</strong> cercle admettant un point fixe hyperbolique).<br />

4.1.3 Le théorème <strong>de</strong> Poincaré<br />

Une question centrale en systèmes dynamiques est <strong>de</strong> savoir si une dynamique<br />

donnée peut être conjuguée à une dynamique modèle plus simple. Dans<br />

le cas qui nous intéresse il s’agit <strong>de</strong> savoir si un homéomorphisme <strong>du</strong> cercle<br />

peut être conjugué à une rotation par un homéomorphisme. Comme nous<br />

allons le voir, ce n’est en général pas le cas mais on a le résultat important<br />

suivant dû à Poincaré. En fait, si ρ(f) /∈ Q on peut toujours semi-conjuguer<br />

f à une rotation.<br />

Théorème 4.1.2 Soit f ∈ Homeo + (T) tel que ρ(f) /∈ Q. Alors, il existe<br />

h : T → T continue surjective telle que f ◦ h = R ρ(f) ◦ h et h admet un<br />

relèvement <strong>de</strong> la forme H(x) = x + θ(x) croissant au sens large sur R avec<br />

θ ∈ C 0 (R/Z). En outre, si µ est une mesure <strong>de</strong> probabilité f-invariante et<br />

˜µ est un relèvement <strong>de</strong> µ à R (π ∗˜µ = µ) on peut choisir H(x) = ∫ x<br />

d˜µ(t). 0<br />

L’application h appartient à Homeo + (T) si et seulement si supp(µ) = T.<br />

Démonstration.— Soit µ une mesure <strong>de</strong> probabilité sur T invariante par f.<br />

Remarquons déjà que µ est sans atome car si ce n’était pas le cas l’orbite d’un<br />

atome serait nécessairement finie et donc f admettrait un point périodique ;<br />

or, cela est impossible car ρ(f) /∈ Q. On peut relever µ à R en posant pour<br />

tout borélien A <strong>de</strong> R ˜µ(A) = ∑ k∈Z<br />

µ(A ∩ [k, k + 1)). On a ˜µ(A + k) = ˜µ(A)<br />

pour tout borélien A <strong>de</strong> R et tout entier k. La mesure ˜µ ainsi obtenue est<br />

également F invariante si F est un relèvement <strong>de</strong> f. Posons H(x) = ∫ x<br />

d˜µ(t). 0<br />

Cette application est croissante au sens large puisque ˜µ est positive, elle est<br />

continue car ˜µ est sans atome et elle vérifie H(x + 1) = H(x) + 1 ; détaillons<br />

ce <strong>de</strong>rnier point : ˜µ([0, x + 1]) = ˜µ([0, x]) + ˜µ([x, x + 1]) ; mais si k est l’entier<br />

pour lequel x ≤ k < x + 1 on a ˜µ([x, x + 1]) = ˜µ([x, k]) + ˜µ([k, x + 1]) =<br />

˜µ([x, k])+˜µ([k−1, x]) = ˜µ([k−1, k]) = 1. Démontrons que H vérifie la relation<br />

<strong>de</strong> semi-conjugaison. On a H(F (x)) = ˜µ([0, F (x)]) = ˜µ([0, x]) + ˜µ([x, F (x)]).<br />

Comme<br />

˜µ([x, F (x)]) = −˜µ([0, x]) + ˜µ([0, F (0)]) + ˜µ([F (0), F (x)])


4.1. HOMÉOMORPHISMES DU CERCLE 49<br />

et comme ˜µ est F -invariante et que F est un homéomorphisme (monotone)<br />

on a ˜µ([F (0), F (x)]) = ˜µ([0, x]) si bien que<br />

H(F (x)) = F (x) + λ<br />

où λ = ˜µ([0, F (0)]). Mais comme le nombre <strong>de</strong> rotation est invariant par<br />

semi-conjugaison on dé<strong>du</strong>it <strong>de</strong> cela que λ = ρ(F ).<br />

L’application H est surjective puisque H(k) = k pour tout entier k et elle<br />

est strictement croissante si µ charge tout ouvert.<br />

✷<br />

Remarques 1) On dit que (T, R ρ(f) ) est un facteur <strong>de</strong> (T, f).<br />

2) Il est commo<strong>de</strong> <strong>de</strong> considérer que T = [0, 1]/ ∼ où ∼ est l’i<strong>de</strong>ntification<br />

<strong>de</strong> 0 et <strong>de</strong> 1 et <strong>de</strong> voir h comme une application continue croissante au sens<br />

large <strong>de</strong> [0, 1] dans lui même et telle que h(0) = 0, h(1) = 1.<br />

3) Supposons que le support <strong>de</strong> µ ne soit pas égal à T. Son complémentaire<br />

est un ouvert qui possè<strong>de</strong> ainsi un nombre dénombrable <strong>de</strong> composantes<br />

connexes. Si I est l’une d’entre elles h est constante sur I. Réciproquement,<br />

si I est un intervalle sur lequel h est constante alors I est inclus dans le<br />

support <strong>de</strong> µ<br />

4) Si I = (a, b), J = (c, d) sont <strong>de</strong>ux composantes connexes distinctes et si on<br />

suppose par exemple (a, b, c, d) bien ordonné on a b < c car sinon {b} serait un<br />

point isolé dans le support <strong>de</strong> µ et serait un atome. On a µ([b, c]) > 0 car sinon<br />

(a, d) serait inclus dans le support <strong>de</strong> µ et I ne serait pas une composante<br />

connexe <strong>du</strong> complémentaire <strong>de</strong> suppµ. On a donc h(c) = h(b) + µ([b, c]) ><br />

h(b). On voit donc que les composantes connexes <strong>de</strong> O µ sont in<strong>de</strong>xées par<br />

leurs h-hauteur.<br />

5) Notons O µ le complémentaire <strong>de</strong> suppµ. C’est un ouvert qui est invariant<br />

par f (puisque le support <strong>de</strong> µ est f-invariant). Si I est une composante<br />

connexe <strong>de</strong> O µ alors pour tout k ∈ Z, f k (I) est une composante connexe<br />

<strong>de</strong> I qui est toujours disjointe <strong>de</strong> I car h|f k (I) = h|I + kρ(f) mod 1 et<br />

ρ(f) /∈ Q. Par conséquent, toute composante connexe <strong>de</strong> O µ est un ensemble<br />

errant.<br />

6) Notons I µ l’ensemble dénombrable <strong>de</strong>s composantes connexes <strong>de</strong> O µ et D µ<br />

l’union <strong>de</strong>s ∂I, pour I variant dans I µ . Alors, D µ est un ensemble dénombrable<br />

et il est invariant par f puisque si x ∈ ∂I, I ∈ I µ on a f(I) ∈ I µ et<br />

x ∈ ∂(f(I)).<br />

Lemme 4.1.3 Soit h : [0, 1] → [0, 1], h(0) = 0, h(1) = 1 une application<br />

continue croissante. Notons O l’ouvert sur lequel h est localement constante,


50CHAPITRE 4. HOMÉOMORPHISMES ET DIFFÉOMORPHISMES DU CERCLE<br />

K son complémentaire, I l’ensemble <strong>de</strong>s composantes connexes <strong>de</strong> O et D<br />

l’union <strong>de</strong>s ∂I, I ∈ I. Alors, D est dénombrable, h|(K − D) est un homéomorphisme<br />

<strong>de</strong> K − D sur son image et h −1 ([0, 1] − h(D)) = K − D.<br />

Démonstration.— Comme I est dénombrable, il en est <strong>de</strong> même <strong>de</strong> D. Si<br />

h(x) = h(y) avec x, y ∈ K − D et x < y alors h|]x, y[ est constante et donc<br />

]x, y[ est inclus dans une composante connexe I <strong>de</strong> O. Mais comme x, y sont<br />

dans K ceci implique que x, y ∈ ∂I ⊂ D ce qui est une contradiction. Ainsi,<br />

h est injective sur K − D. Par ailleurs, si h(x) ∈ [0, 1] − h(D) alors h n’est<br />

pas constante sur un voisinage <strong>de</strong> x (sinon il existerait I composante connexe<br />

<strong>de</strong> O contenant x et h(x) = h|∂I ∈ h(D)) et donc x ∈ K et n’est pas dans<br />

D. On a donc h −1 ([0, 1] − h(D)) = K − D. Enfin, si h −1 (x n ) → h −1 (x) avec<br />

x n , x ∈ [0, 1] − h(D), on a x n → x (car h est continue).<br />

✷<br />

Minimal invariant<br />

Soit µ une probabilité invariante sur T par f ∈ Homeo + (T) et supposons<br />

que ρ(f) /∈ Q. Notons K µ le support <strong>de</strong> la mesure µ. C’est un ensemble<br />

compact <strong>de</strong> T qui est f-invariant.<br />

Proposition 4.1.2 Si K µ := suppµ ≠ T alors K µ est un ensemble <strong>de</strong> Cantor,<br />

c’est-à-dire est fermé, sans point isolé et d’intérieur vi<strong>de</strong>. En outre K µ<br />

est l’unique compact minimal invariant.<br />

Démonstration.— L’ensemble K µ est sans point isolé car sinon un tel point<br />

serait un atome <strong>de</strong> µ. Démontrons que K µ est minimal. Pour cela il suffit <strong>de</strong><br />

démontrer que si L est un compact invariant par f on a K µ ⊂ L. Le théorème<br />

<strong>de</strong> Poincaré montre que h µ (L) (resp. h µ (K µ )) est un compact <strong>de</strong> T invariant<br />

par R ρ : c’est donc T (R ρ est minimale). Comme h µ est injective sauf sur<br />

l’ensemble dénombrable D µ (cf. le Lemme 4.1.3), on a K µ −D µ ⊂ L. Comme<br />

K µ est sans point isolé et que D µ est dénombrable, on a K µ ⊂ L car K µ et L<br />

sont fermés, ce qui démontre que K µ est l’unique ensemble fermé f-invariant<br />

minimal. Ceci implique que K µ est d’intérieur vi<strong>de</strong> : en effet, si ce n’était<br />

pas le cas, sa frontière K µ − int(K µ ) serait un ensemble fermé f -invariant<br />

(comme f est un homéomorphisme l’intérieur d’un ensemble invariant est<br />

invariant) et K µ ne serait pas minimal.<br />


4.2. DIFFÉOMORPHISMES DU CERCLE 51<br />

Unique ergodicité<br />

Théorème 4.1.3 Si f ∈ Homeo + (T) vérifie ρ(f) /∈ Q alors f est uniquement<br />

ergodique.<br />

Démonstration.— Soit h telle que h ◦ f = R ρ ◦ h et ν une mesure <strong>de</strong><br />

probabilité f invariante (on ne suppose pas que h(·) = ν([0, ·])).Comme<br />

h : (T, f) → (T, R ρ ) est un facteur, on voit que h ∗ ν est R ρ invariante et<br />

comme ρ est irrationnel h ∗ ν = Leb (R ρ est uniquement ergodique)<br />

Si h est un homéomorphisme on a donc ν = (h −1 ) ∗ Leb et ν est unique.<br />

Sinon, notons K le minimal invariant <strong>de</strong> f et D l’union <strong>de</strong>s extrémités <strong>de</strong>s<br />

composantes connexes <strong>de</strong> son complémentaire. Remarquons que suppν = K,<br />

car sinon il existerait un intervalle errant dans le support <strong>de</strong> ν, ce qui est<br />

impossible. Mais pour tout borélien A ⊂ R on a ν(A) = ν(K ∩ A) car<br />

K = suppν et comme D est dénombrable et que ν est sans atome ν(A) =<br />

ν((K ∩ A) − D). Comme h((K ∩ A) − D) ⊂ [0, 1] − h(D) on a d’après le<br />

Lemme 4.1.3 h −1 (h((K ∩ A) − D) = (K ∩ A) − D et comme h ∗ ν = Leb<br />

ν(A) = ν((K ∩ A) − D) = Leb(h((K ∩ A) − D)).<br />

Cette <strong>de</strong>rnière quantité ne dépend pas <strong>de</strong> ν, donc ν est unique.<br />

✷<br />

4.2 Difféomorphismes <strong>du</strong> cercle<br />

Nous donnons dans cette section un critère qui permet <strong>de</strong> déterminer<br />

quand la semi-conjugaison obtenue dans le théorème <strong>de</strong> Poincaré est en fait<br />

une conjugaison et quelle est la régularité que l’on peut espérer pour cette<br />

conjugaison.<br />

4.2.1 Rappels sur les fractions continues<br />

Soit 0 < α < 1 un nombre irrationnel et définissons par récurrence <strong>de</strong>ux<br />

suites (a n ), (α n ) (n ≥ 0) où les a n ≥ 1 sont <strong>de</strong>s entiers et les α n sont dans<br />

]0, 1[ :<br />

α n+1 = {α −1<br />

n }, a n+1 = [α −1<br />

n ], α 0 = α (4.1)


52CHAPITRE 4. HOMÉOMORPHISMES ET DIFFÉOMORPHISMES DU CERCLE<br />

({·}, [·] sont respectivement la partie fractionnaire et la partie entière). On a<br />

ainsi la représentation<br />

α =<br />

1<br />

.<br />

1<br />

a 1 +<br />

1<br />

a 2 +<br />

1<br />

· · · +<br />

a n + α n<br />

Nous noterons p n /q n (p n ∧ q n = 1) le rationnel<br />

p n<br />

q n<br />

=<br />

1<br />

.<br />

1<br />

a 1 +<br />

1<br />

a 2 +<br />

· · · + 1 a n<br />

On dit que p n /q n est la n-ième ré<strong>du</strong>ite <strong>de</strong> α. Remarquons que si on effectue<br />

la procé<strong>du</strong>re précé<strong>de</strong>nte avec p n /q n à la place <strong>de</strong> α on obtient <strong>de</strong>s ˜α k pour<br />

1 ≤ k ≤ n avec ˜α n = 0 tels que<br />

˜α k+1 = {˜α −1<br />

k }, a k+1 = [˜α −1<br />

k ], α 0 = p n /q n (4.2)<br />

Il est commo<strong>de</strong> d’intro<strong>du</strong>ire également les suites β n où<br />

Multipliant l’égalité α −1<br />

n<br />

ce qu’on peut écrire<br />

β n = α n · · · α 0 , β −1 = 1.<br />

= a n+1 + α n+1 par β n on voit que<br />

β n−1 = a n+1 β n + β n+1<br />

(−1) n+1 β n+1 = a n+1 (−1) n β n + (−1) n−1 β n−1<br />

ou encore ( )<br />

(−1) n+1 β n+1<br />

(−1) n =<br />

β n<br />

On a donc<br />

( )<br />

(−1) n β n<br />

(−1) n−1 =<br />

β n−1<br />

( ) ( )<br />

an+1 1 (−1) n β n<br />

1 0 (−1) n−1 β n−1<br />

( ) ( ( )<br />

an 1 a1 1 α<br />

· · ·<br />

1 0 1 0)<br />

−1


4.2. DIFFÉOMORPHISMES DU CERCLE 53<br />

Si on pose ˜β k = ˜α k · · · ˜α 0 on aura ˜β n = 0 et<br />

(<br />

)<br />

0<br />

(−1) n−1 =<br />

˜βn−1<br />

Notons P k , Q k ∈ N<br />

( )<br />

Qn P n<br />

:=<br />

Q n−1 P n−1<br />

( )<br />

an 1<br />

· · ·<br />

1 0<br />

( )<br />

an 1<br />

· · ·<br />

1 0<br />

(<br />

a1 1<br />

1 0<br />

) ⎛ ⎞<br />

p n<br />

⎝<br />

q<br />

⎠<br />

n<br />

−1<br />

( )<br />

a1 1<br />

1 0<br />

( )<br />

Qn P<br />

On a Q n P n−1 − Q n−1 P n = <strong>de</strong>t<br />

n<br />

= (−1)<br />

Q n−1 P n si bien que P n ∧ Q n =<br />

n−1<br />

1. Par conséquent comme 0 = Q n p n /q n − P n on voit que P n /Q n = p n /q n<br />

mais comme P n ∧ Q n = p n ∧ q n cela implique P n = p n et Q n = q n . On a donc<br />

démontré<br />

Lemme 4.2.1 Les suites p n , q n sont définies par les relations <strong>de</strong> récurrence<br />

{<br />

p n = a n p n−1 + p n−1 , p 0 = 1, p −1 = 0<br />

q n = a n q n−1 + q n−2 q 0 = a 1 , q −1 = 0<br />

Remarque Il est facile <strong>de</strong> voir que pour tout n ≥ 1 on a q n+1 > q n et<br />

tout n ≥ 2, q n ≥ 2 n/2 .<br />

Lemme 4.2.2 Pour tout n ≥ 1 on a<br />

α = p n + α n p n−1<br />

q n + α n q n−1<br />

Démonstration.—<br />

On a<br />

α − p n<br />

q n<br />

=<br />

(−1) n<br />

(q n+1 + α n+1 q n )q n<br />

|α − p n<br />

| ≤ 1 < 1 .<br />

q n q n+1 q n qn<br />

2<br />

p n + α n p n−1<br />

q n + α n q n−1<br />

= a np n−1 + p n−2 + α n p n−1<br />

a n q n−1 + q n−2 + α n q n−1<br />

= α−1 n−1p n−1 + p n−2<br />

αn−1q n−1 + q n−2<br />

= p n−1 + α n−1 p n−2<br />

q n−1 + α n−1 q n−2


54CHAPITRE 4. HOMÉOMORPHISMES ET DIFFÉOMORPHISMES DU CERCLE<br />

ce qui démontre la première égalité.<br />

On a<br />

α − p n<br />

= p n + α n p n−1<br />

− p n<br />

q n q n + α n q n−1 q n<br />

= α n(p n−1 q n − q n−1 p n )<br />

q n (q n + α n q n−1 )<br />

(−1) n<br />

=<br />

q n (α −1<br />

n q n + q n−1 )<br />

En utilisant le fait que αn<br />

−1 = α n+1 + a n+1 et la relation <strong>de</strong> récurrence <strong>de</strong>s q n<br />

on obtient la <strong>de</strong>uxième égalité.<br />

Enfin l’inégalité est immédiate.<br />

4.2.2 Théorème <strong>de</strong> Denjoy<br />

L’objet <strong>de</strong> cette section est la démonstration <strong>du</strong> théorème <strong>de</strong> Denjoy.<br />

Théorème 4.2.1 Soit f un homéomorphisme <strong>du</strong> cercle préservant l’orientation<br />

<strong>de</strong> nombre <strong>de</strong> rotation irrationnel. Supposons que f soit dérivable et que<br />

log(Df) (où Df(·) = f ′ est la dérivée <strong>de</strong> f) soit à variation bornée 1 . Alors,<br />

il existe un homéomorphisme h ∈ Homeo + (T) qui conjugue f à R ρ (f).<br />

Démonstration.— D’après le théorème <strong>de</strong> Poincaré, il s’agit <strong>de</strong> démontrer<br />

qu’il n’existe pas d’intervalles errants pour f. Cela est garanti par le lemme<br />

suivant :<br />

Lemme 4.2.3 (Inégalité <strong>de</strong> Denjoy) Sous les hypothèses <strong>du</strong> Théorème <strong>de</strong><br />

Denjoy on a l’inégalité <strong>de</strong> Denjoy : pour tout q ∈ N tel qu’il existe p ∈ N<br />

vérifiant |α − (p/q)| < 1/q 2 (donc pour toute ré<strong>du</strong>ite) et tout x ∈ T<br />

où V = V ar(log(Df)).<br />

e −V ≤ Df q (x) ≤ e V ,<br />

✷<br />

Démonstration.—<br />

Koksma :<br />

La preuve <strong>de</strong> ce lemme repose sur l’inégalité <strong>de</strong> Denjoy-<br />

1 Une fonction φ : [a, b] → R est à variation bornée s’il existe une constante C telle que<br />

pour tous a = x 0 < x 1 < · · · < x n < x n+1 = b on a ∑ n<br />

k=0 |φ(x k+1) − φ(x k )| ≤ C. On note<br />

alors V ar(φ) la plus petite constante C possible. Une fonction φ dont la dérivée est L 1 est<br />

automatiquement à variation bornée et V ar(φ) ≤ ‖φ ′ ‖ L 1


4.2. DIFFÉOMORPHISMES DU CERCLE 55<br />

Lemme 4.2.4 (Denjoy-Koksma) Soit f un homéomorhisme <strong>du</strong> cercle préservant<br />

l’orientation et µ une mesure <strong>de</strong> probabilité telle que F ∗ µ = µ. Alors<br />

pour toute fonction φ ∈ C 0 (T) à variation bornée, tout x ∈ T et tout q ∈ N<br />

tel qu’il existe p ∈ N vérifiant |α − (p/q)| < 1/q 2 on a<br />

q−1<br />

∑<br />

∫<br />

∣ φ(f i (x)) − q φdµ<br />

∣ ≤ V ar(φ).<br />

T<br />

i=0<br />

Démonstration.— Considérons x = 0, i<strong>de</strong>ntifions T avec [0, 1]/ ∼ et définissons<br />

q intervalles I k (x) = [x k , x k+1 [ (0 ≤ k ≤ q − 1) où 0 = x 0 < x 1 < . . . <<br />

x q−1 < x q = 1 sont définis par µ([x k , x k+1 ]) = (1/q) (on découpe donc le cercle<br />

en q parties d’égales µ-mesure). Supposons que (p/q) − (1/q 2 ) < ρ < p/q (sinon<br />

on considère f −1 ) ; on a pour tout 0 ≤ i ≤ q − 1<br />

ip<br />

q < iρ < ip q + 1 q .<br />

Notons que comme p et q sont premiers entre eux, p est inversible mo<strong>du</strong>lo<br />

q et l’ensemble {ip mod q, 0 ≤ i ≤ q − 1} a q éléments et est en bijection<br />

avec {k mod q, 0 ≤ k ≤ q − 1}. Nous noterons i ↦→ i(k) cette bijection et<br />

k ↦→ k(i) la bijection réciproque. Par conséquent, il y a un et un seul point<br />

<strong>de</strong> iρ mod Z (0 ≤ i ≤ q − 1) dans chaque intervalle I k ; nous noterons I k(i)<br />

l’intervalle contenant iρ mod Z. On a<br />

q−1<br />

∑<br />

∫<br />

∣ ∣∣∣<br />

q−1<br />

∣ φ(f i (x)) − q φ(t)dµ(t)<br />

∣ = ∑<br />

i=0<br />

T<br />

i=0<br />

q−1<br />

∑<br />

= q<br />

∣<br />

i=0<br />

q−1<br />

∑<br />

= q<br />

∣<br />

k=0<br />

q−1<br />

∫<br />

φ(f k(i) (x)) − q<br />

T<br />

φ(t)dµ(t)<br />

∣<br />

∫I k(i)<br />

(<br />

φ(f k(i) (x)) − φ(t)<br />

(<br />

)<br />

φ(f<br />

∫I i(k) (x)) − φ(t)<br />

k<br />

∣ ∑ ∣∣∣ ≤ max φ(f i(k) (x)) − φ(t)<br />

t∈I k<br />

∣<br />

k=0<br />

≤ V ar(φ).<br />

)<br />

dµ(t)<br />

∣<br />

dµ(t)<br />

∣<br />

Nous pouvons démontrer l’inégalité <strong>de</strong> Denjoy : appliquons l’inégalité <strong>de</strong><br />

Denjoy-Koksma à φ = log Df et observons que d’après la formule donnant<br />


56CHAPITRE 4. HOMÉOMORPHISMES ET DIFFÉOMORPHISMES DU CERCLE<br />

la dérivée d’une composition on a<br />

q−1<br />

∑<br />

log Df q (x) = (log Df)(f k (x)).<br />

k=0<br />

On a donc<br />

∫<br />

∣ log Df q (x) − q<br />

T<br />

log(Df(t))dµ(t)<br />

∣ ≤ V ar(log(Df)).<br />

Si on avait ∫ log(Df(t))dµ(t) > 0 par exemple, alors log Df q (x) convergerait<br />

uniformément vers ∞ tout comme Df q (x). Mais comme ∫ 1<br />

|Df q (t)|dt<br />

T<br />

0<br />

est égal à 1 (c’est la longueur <strong>de</strong> l’image <strong>du</strong> cercle par f q ) on obtient une<br />

contradiction. De même ∫ log(Df(t))dµ(t) ne peut être négative : elle est<br />

T<br />

donc nulle et l’inégalité <strong>de</strong> Denjoy est alors claire.<br />

Démontrons enfin le théorème <strong>de</strong> Denjoy. On sait qu’il existe un homéomorphisme<br />

h qui semi-conjugue f et R ρ et que h est un homéomorphisme si<br />

et seulement si f n’admet pas d’intervalles errants. Supposons que I soit<br />

un intervalle errant. Alors, on a lim n→∞ |f qn (I)| = 0 (|J| est la longueur <strong>de</strong><br />

l’intervalle J). Mais d’après le théorème <strong>de</strong>s valeurs intermédiaires il existe<br />

z n ∈ I tel que<br />

|f qn (I)|<br />

= Df qn (z n ).<br />

|I|<br />

On doit donc avoir lim n→∞ Df qn (z n ) = 0 ce qui contredit l’inégalité <strong>de</strong> Denjoy.<br />

La semi-conjugaison h est donc un homéomorphisme.<br />

4.2.3 Contre-exemples <strong>de</strong> Denjoy<br />

Le théorème <strong>de</strong> Denjoy est en général faux si f est seulement C 1 :<br />

Théorème 4.2.2 Si α est un nombre irrationnel, il existe un difféomorphisme<br />

C 1 <strong>de</strong> T qui préserve l’orientation et qui admet un minimal invariant<br />

différent <strong>de</strong> T (f n’est donc pas topologiquement conjugué à R α ou à une<br />

rotation en général).<br />

Nous ne donnerons pas la preuve <strong>de</strong> ce résultat. Disons seulement que l’idée<br />

<strong>de</strong> la preuve est d’"ouvrir" le cercle (en rajoutant <strong>de</strong>s intervalles <strong>de</strong> longueurs<br />

variables) aux points R k α(0).<br />

✷<br />


4.2. DIFFÉOMORPHISMES DU CERCLE 57<br />

4.2.4 Le Théorème d’Herman-Yoccoz<br />

Il est naturel <strong>de</strong> se <strong>de</strong>man<strong>de</strong>r si l’on ne peut pas obtenir dans le théorème<br />

<strong>de</strong> Denjoy une conjugaison plus régulière quitte à supposer f régulière (par<br />

exemple C ∞ ). C’est en général faux si l’on ne fait pas d’hypothèse sur le<br />

nombre <strong>de</strong> rotation <strong>de</strong> f.<br />

Définition 4.2.1 On dit que α est diophantien d’exposant σ ≥ 0 et <strong>de</strong><br />

constante γ (on note α ∈ CD(γ, σ)) si pour tous entiers (p, q) ∈ Z×(Z−{0})<br />

on a<br />

|α − p q | ≥ γ<br />

q 2+σ .<br />

Remarques 1) Il n’existe pas <strong>de</strong> nombre diophantien d’exposant σ < 0<br />

(pourquoi ).<br />

2) Il n’est pas difficile <strong>de</strong> démontrer que si σ > 0 et si on choisit γ suffisamment<br />

petit l’ensemble CD(γ, σ) est <strong>de</strong> mesure <strong>de</strong> Lebesgue positive.<br />

3) Si on définit CD(σ) = ⋃ γ>0<br />

CD(γ, σ) l’ensemble <strong>de</strong>s nombres diophantiens<br />

d’exposant σ > 0, alors cet ensemble est <strong>de</strong> mesure <strong>de</strong> Lebesgue totale.<br />

4) Si α ∈ CD(σ) avec σ = 0 on dit que α est <strong>de</strong> type constant. Il est<br />

équivalent <strong>de</strong> dire que les a i qui interviennent dans le développement en<br />

fractions continues <strong>de</strong> α sont bornés.<br />

5) Un nombre est diophantien (dans l’union <strong>de</strong>s CD(σ), σ ≥ 0) si et seulement<br />

si il existe une constante A > 0 telle que q i+1 ≤ q A i pour tout i.<br />

Théorème 4.2.3 Si f est un difféomorphisme <strong>de</strong> T préservant l’orientation,<br />

<strong>de</strong> classe C ∞ et tel que ρ(f) est diophantien, alors il existe un difféomorphisme<br />

<strong>de</strong> classe C ∞ qui conjugue f à R ρ(f) .<br />

Remarques 1) On peut en fait relier la régularité minimale <strong>de</strong> f requise pour<br />

que le théorème fournisse un conjugaison <strong>de</strong> classe au moins C 0 à l’exposant<br />

σ <strong>de</strong> ρ(f).<br />

2) Si α n’est pas diophantien, il existe <strong>de</strong>s difféomorphismes f <strong>de</strong> classe C ∞<br />

tels que ρ(f) = α qui ne sont pas linérisables (conjugués à <strong>de</strong>s rotations).<br />

4.2.5 Théorème d’Arnold


58CHAPITRE 4. HOMÉOMORPHISMES ET DIFFÉOMORPHISMES DU CERCLE


Chapitre 5<br />

Hyperbolicité<br />

5.1 Point fixe hyperbolique d’un difféomorphisme<br />

Soit (E, ‖ · ‖) un espace <strong>de</strong> Banach et A : E → E un opérateur linéaire<br />

continu et inversible (son inverse est donc continu). On dit que A est hyperbolique<br />

s’il existe une décomposition E s ⊕ E u et <strong>de</strong>s constantes positives<br />

C, ρ s , ρ u telles que pour tout v s ∈ E s (resp. v u ∈ E u ) et tout n ∈ N on a<br />

‖A n v s ‖ ≤ Ce −ρsn ‖v‖ (resp ; ‖A −n v u ‖ ≤ e −nρu ‖v‖ u .<br />

Quand E = R n est <strong>de</strong> dimension finie et A ∈ GL n (R), on peut démontrer<br />

que A est hyperbolique si et seulement si le σ(A), spectre <strong>de</strong> A (l’ensemble <strong>de</strong><br />

ses valeurs propres) a une intersection vi<strong>de</strong> avec le cercle unité {z ∈ C, |z| =<br />

1}. Dans ce cas,<br />

E s =<br />

⊕<br />

λ∈σ(A):|λ|1<br />

et on peut choisir ρ s < min λ∈σ(A):|λ|1 (log |λ|).<br />

C’est une conséquence <strong>du</strong> théorème <strong>de</strong> décomposition <strong>de</strong> Jordan (cf. Annexe<br />

B) Comme les valeurs propres d’une matrice dépen<strong>de</strong>nt <strong>de</strong> façon continue <strong>de</strong><br />

cette matrice on dé<strong>du</strong>it facilement le résultat suivant.<br />

Proposition 5.1.1 L’ensemble <strong>de</strong>s A ∈ GL(n, R) qui sont hyperboliques est<br />

un ouvert (le même résultat est vrai dans les Banach)<br />

Si A est hyperbolique, on dit qu’une norme est adaptée à A si pour tout<br />

v s ∈ E s (resp. v u ∈ E u ) on a ‖Av s ‖ ≤ e −ρs ‖v‖ (resp ; ‖A −1 v u ‖ ≤ e −ρu ‖v‖ u .<br />

Lemme 5.1.1 Si A est hyperbolique, il existe une norme A-adaptée (quitte<br />

à diminuer les valeurs <strong>de</strong> ρ s , ρ u ).<br />

59<br />

Γ λ ,


60 CHAPITRE 5. HYPERBOLICITÉ<br />

Démonstration.— Il suffit d’en construire une sur E s (et une sur E u ). Il<br />

suffit pour cela <strong>de</strong> définir pour v ∈ E s et ρ ′ s < ρ s<br />

‖v‖ ∗ =<br />

∞∑<br />

e ρ′k ‖A k v‖.<br />

k=0<br />

Cette somme converge <strong>du</strong> fait <strong>de</strong> la décroissance exponentielle <strong>de</strong>s termes <strong>de</strong><br />

la série. En outre,<br />

‖Av‖ ∗ =<br />

∞∑<br />

e ρ′k ‖A k+1 v‖ (5.1)<br />

k=0<br />

≤ e −ρ′<br />

∞<br />

∑<br />

l=1<br />

e ρ′l ‖A l v‖ (5.2)<br />

≤ e −ρ′ ‖v‖ ∗ (5.3)<br />

On procè<strong>de</strong> <strong>de</strong> la même manière pour définir ‖ · ‖ ∗ sur E u mais en itérant<br />

dans le passé.<br />

Définition 5.1.1 Soit f un difféomorphisme local <strong>de</strong> (R n , x 0 ) (on peut également<br />

travailler dans <strong>de</strong>s Banach). On dit que x 0 est un point fixe hyperbolique<br />

<strong>de</strong> f si f(x 0 ) = x 0 et si Df(x 0 ) est hyperbolique.<br />

Lemme 5.1.2 Soit A ∈ Gl(n, R) et ε > 0. Alors il existe une constante<br />

δ > 0 pour laquelle ce qui suit est vrai : si F : R n → R n est une application<br />

<strong>de</strong> classe C 1 telle que<br />

‖F ‖ 1 := sup<br />

x∈R n max(‖F (x)‖, ‖DF (x)‖) < δ,<br />

alors, l’application f = A + F est un difféomorphisme <strong>de</strong> R n et (A + F ) −1<br />

est <strong>de</strong> la forme A −1 + G où G : R n → R n est ε-lipschitizienne : pour tous<br />

x 1 , x 2 ∈ R n ‖G(x 1 ) − G(x 2 )‖ ≤ ε‖x 1 − x 2 ‖.<br />

Démonstration.— L’équation y = Ax+F (x) est équivalente à x = K y (x) :=<br />

A −1 y − A −1 F (x). ainsi, y étant donné, x est point fixe <strong>de</strong> K y . Or cette application<br />

K y : R n → R n est clairement k-contractante avec k = ‖F ‖ 1 ‖A −1 ‖ −1<br />

(pourvu que la constante <strong>de</strong> Lipschitz <strong>de</strong> F soit plus petite que ‖A −1 ‖ −1 ) et<br />

admet donc un unique point fixe x y . Comme la constante k est indépendante<br />

<strong>de</strong> y et que K y est continue par rapport à y, le point fixe x y dépend continûment<br />

<strong>de</strong> y. On a ainsi x = y + G(y) avec G continue. Montrons que G<br />


5.1. POINT FIXE HYPERBOLIQUE D’UN DIFFÉOMORPHISME 61<br />

est Lipschitz. Pour y 1 , y 2 on a ‖x 1 − x 2 ‖ ≤ ‖A −1 (y 1 − y 2 )‖ + ‖F ‖ 1 ‖x 1 − x 2 ‖<br />

c’est-à-dire ‖x 1 − x 2 ‖ ≤ (‖A −1 ‖/(1 − ‖F ‖ 1 )‖y 1 − y 2 ‖.<br />

Théorème 5.1.1 (Hartman-Grobman) Si A est linéaire et hyperbolique<br />

alors il existe ε > 0 tel que pour toute application F : R n → R n <strong>de</strong> classe C 1<br />

et telle que ‖F ‖ 1 ≤ ε il existe un homéomorphisme h : R n → R n <strong>de</strong> la forme<br />

h(x) = x + H(x) avec ‖H‖ 0 < ∞ tel que<br />

A + F = h ◦ A ◦ h −1 .<br />

En outre, un tel h est unique si on le cherche sous la forme id + K avec<br />

‖K‖ 0 < ∞.<br />

La preuve <strong>de</strong> ce théorème passe par la preuve <strong>de</strong> la proposition plus<br />

générale suivante<br />

Lemme 5.1.3 Si A est linéaire et hyperbolique alors il existe ε > 0 tel que<br />

pour toutes applications F 1 , F 2 : R n → R n <strong>de</strong> classe C 1 et telle que ‖F i ‖ 1 ≤ ε<br />

(i = 1, 2) il existe un homéomorphisme h : R n → R n <strong>de</strong> la forme h(x) =<br />

x + H(x) avec ‖H‖ 0 < ∞ tel que<br />

A + F 2 = h ◦ (A + F 1 ) ◦ h −1 .<br />

En outre, un tel h est unique si on le cherche sous la forme id + K avec<br />

‖K‖ 0 < ∞.<br />

Démonstration.— On peut supposer que la norme <strong>de</strong> notre espace <strong>de</strong> Banach<br />

est A-adaptée. Si G : R n → R n on note G s , G u ses projections sur E s<br />

parallèlement à E u et sur E s parallèlement à E s . L’équation <strong>de</strong> conjugaison<br />

que nous voulons résoudre est équivalente à<br />

et en projetant sur E s , E u<br />

(A + F 2 ) ◦ (I + H) = (I + H) ◦ (A + F 1 ) (5.4)<br />

AH + F 2 ◦ (I + H) = F 1 + H ◦ (A + F 1 )<br />

A s H s + F 2,s ◦ (I + H) = F 1,s + H s ◦ (A + F 1 )<br />

A u H u + F 2,u ◦ (I + H) = F 1,u + H u ◦ (A + F 1 ).<br />

Puisque d’après le lemme 5.1.2 A + F 1 est inversible si la norme C 1 <strong>de</strong> F 1 est<br />

suffisamment petite, on peut récrire ce système sous la forme<br />

H s = A s H s ◦ (A + F 1 ) −1 + F 2,s ◦ (I + H) ◦ (A + F 1 ) −1 − F 1,s ◦ (A + F 1 ) −1<br />

(<br />

)<br />

H u = A −1<br />

u F 1,u + H u ◦ (A + F 1 ) − F 2,u ◦ (I + H)<br />


62 CHAPITRE 5. HYPERBOLICITÉ<br />

Intro<strong>du</strong>isons alors l’espace <strong>de</strong> Banach (E, ‖ · ‖) <strong>de</strong>s paires (H s , H u ) avec<br />

H s , H u ∈ C 0 (R n , R n ) telles que ‖(H s , H u )‖ := max(‖H s ‖ C 0 (R n ), ‖H u ‖ C 0 (R n ))<br />

soit fini et l’application Φ : E → E définie par Φ(H s , H u ) = ( ˜H s , ˜H u ) où<br />

˜H s = A s H s ◦ (A + F 1 ) −1 + F 2,s ◦ (I + H) ◦ (A + F 1 ) −1 − F 1,s ◦ (A + F 1 ) −1<br />

(<br />

)<br />

˜H u = A −1<br />

u F 1,u + H u ◦ (A + F 1 ) − F 2,u ◦ (I + H) .<br />

Utilisant le fait que F 2,u est ‖F 2 ‖-lipschitzienne, on voit que l’application Φ<br />

est k-contractante avec<br />

k = min(ρ s + ‖F 2 ‖ 1 , ρ u (1 + ‖F 2 ‖ 1 ))<br />

On a bien 0 ≤ k < 1 si ‖F ‖ 2 est suffisamment petite. Par conséquent l’équation<br />

(5.4) a une unique solution <strong>de</strong> la forme I + H où H est <strong>de</strong> norme C 0 -<br />

bornée sur R n . Il n’est en revanche pas clair a priori que I + H est inversible.<br />

Ceci découle <strong>de</strong> la remarque suivante : Intervertissons les rôles <strong>de</strong> F 1 et F 2 :<br />

on obtient ˜H tel que<br />

(A + F 1 ) ◦ (I + ˜H) = (I + ˜H) ◦ (A + F 2 )<br />

et tenant compte <strong>de</strong> (5.4) on obtient<br />

(I + ˜H) ◦ (I + H) ◦ (A + F 1 ) = (A + F 1 ) ◦ (I + ˜H) ◦ (I + H). (5.5)<br />

L’application (I + ˜H) ◦ (I + H) est <strong>de</strong> la forme I + Ĥ où Ĥ est C0 -bornée sur<br />

R n et est <strong>de</strong> ce fait l’unique solution <strong>de</strong> (5.5). Mais I est également solution<br />

<strong>de</strong> cette équation : par conséquent (I + ˜H) ◦ (I + H) = I, ce qui démontre<br />

que I + H est un homéomorphisme.<br />

Le théorème précé<strong>de</strong>nt admet une version locale :<br />

Théorème 5.1.2 Si f : (R n , 0) est un difféomorphisme local <strong>de</strong> classe C 1<br />

tel que A = Df(0) est hyperbolique, alors il existe un homéomorphisme local<br />

h : (R n , 0) tel que sur un voisinage <strong>de</strong> 0<br />

f = h ◦ Df(0) ◦ h −1 .<br />

Démonstration.— L’idée <strong>de</strong> la preuve est <strong>de</strong> trouver une extension ˜f <strong>de</strong> f<br />

à R n tout entier qui reste un difféomorphisme C 1 <strong>de</strong> R n sur R n . Supposons<br />

que f soit défini sur une boule <strong>de</strong> centre 0 et <strong>de</strong> rayon 3δ. On conjugue tout<br />


5.2. STABILITÉ STRUCTURELLE DES AUTOMORPHISMES DU TORE63<br />

d’abord f par une dilatation M δ : x ↦→ δx pour obtenir f δ = M −1<br />

δ<br />

◦ f ◦ M δ ;<br />

on a ainsi pour tout x dans la boule B(0, 3) <strong>de</strong> centre 0 et <strong>de</strong> rayon 3<br />

f δ (x) = 1 δ f(δx),<br />

Df δ(x) = Df(x).<br />

D’après le théorème <strong>de</strong>s accroissements finis<br />

|f δ (x) − Df(0)x| ≤ 3ε(δ)<br />

où ε(δ) = max x∈B(0,3δ) |Df(x) − Df(0)| tend vers 0 avec δ (f est C 1 ). Soit<br />

alors η une fonction <strong>de</strong> classe C ∞ qui vaut 0 sur B(0, 1) et 1 en <strong>de</strong>hors <strong>de</strong><br />

B(0, 2) et posons<br />

˜f δ (x) = Df(0)x + η(x)(f δ (x) − Df(0)x).<br />

Il est clair que sur la boule B(0, 1) on a ˜f δ (x) = f / d(x) et en <strong>de</strong>hors <strong>de</strong> la boule<br />

B(0, 2) ˜f δ (x) = Df(0)x. En outre, comme D ˜f δ (x) = Df(0) + Dη(x)(f δ (x) −<br />

Df(0)x)+η(x)(Df δ (x)−Df(0)) on voit que ‖ ˜f δ −Df(0)x‖ C 1 (R n ) ≤ 3ε(δ)‖η‖ C 1.<br />

Par conséquent, dès que δ est suffisamment petit, le théorème <strong>de</strong> Hartman-<br />

Grobman global s’applique à ˜f δ et il existe une conjugaison ˜h telle que<br />

˜f δ = ˜h ◦ Df(0) ◦ ˜h −1 . Cette relation est vraie sur B(0, 1) et on a donc<br />

f = h ◦ Df(0) ◦ h −1 où h = M δ ◦ ˜h ◦ M −1<br />

δ<br />

.<br />

5.2 Stabilité structurelle <strong>de</strong>s automorphismes<br />

<strong>du</strong> tore<br />

Nous appliquons les résultats <strong>de</strong> la section précé<strong>de</strong>nte à un exemple <strong>de</strong><br />

stabilité structurelle. Soit A ∈( SL(d, ) Z) telle que Spec(A) ∩ {|z| = 1} = ∅<br />

2 1<br />

(par exemple la matrice A = ). La matrice A est donc hyperbolique.<br />

1 1<br />

On a vu que A définissait un difféomorphisme T A <strong>de</strong> T d qui préserve la<br />

mesure <strong>de</strong> Haar sur T d . En outre, il est facile <strong>de</strong> voir par l’analyse <strong>de</strong> Fourier<br />

que (T A , Haar) est ergodique. Considérons à présent une perturbation f, C 1 -<br />

proche <strong>de</strong> T A (‖f − A‖ C 1 est petite). Le théorème que nous allons démontrer<br />

établit que f est C 0 -conjuguée à A.<br />

5.2.1 Forme <strong>de</strong>s homéomorphismes <strong>du</strong> tore<br />

Proposition 5.2.1 Soit f un homéomorphisme <strong>de</strong> T d . Alors, il existe une<br />

matrice A ∈ GL(d, Z) et une application φ : R d /Z d → R d continue elles que<br />


64 CHAPITRE 5. HYPERBOLICITÉ<br />

F : R d → R d , F (x) = Ax + φ(x) est un relèvement <strong>de</strong> f (π ◦ F = f ◦ π où<br />

π : R d → T d est la projection canonique).<br />

Démonstration.— Soit F un relèvement continue <strong>de</strong> f. Pour tout entier<br />

k ∈ Z d , F (· + k) − F (·) prend <strong>de</strong>s valeurs entières et il existe donc l(k) ∈ Z d<br />

tel que F (·+k)−F (·) = l F (k). Il es facile <strong>de</strong> voir que l F (k+k ′ ) = l F (k)+l F (k ′ )<br />

pour tous k, k ′ ∈ Z d . En outre, si on note G un relevé <strong>de</strong> f −1 tel que G = F −1 ,<br />

il est facile <strong>de</strong> voir que l F ◦ l G = id. Par conséquent (Exercice) il existe une<br />

matrice A ∈ GL(d, /Z) telle que l F (k) = Ak pour tout k ∈ Z d . L’application<br />

F − l F est clairement Z d -périodique.<br />

Remarque La matrice A est l’action f ∗ <strong>de</strong> f sur H 1 (T d , Z).<br />

5.2.2 Conjugaison topologique<br />

Théorème 5.2.1 Si f est un difféomorphisme <strong>du</strong> tore T d <strong>de</strong> classe C 1 <strong>de</strong><br />

la forme f = A + φ où A ∈ GL(d, Z) est hyperbolique et ‖φ‖ C 1 (T d ) est<br />

suffisamment petite, alors il existe un homéomorphisme h <strong>de</strong> T d tel que<br />

f = h ◦ T A ◦ h −1 .<br />

Démonstration.— Soit F (x) = Ax + φ(x) un relèvement <strong>de</strong> f avec ϕ ∈<br />

C 1 (R d /Z d , R d ). On sait d’après la forme global <strong>du</strong> théorème d’Hartman-<br />

Grobman qu’il existe une application θ : R d → R d continue bornée, telle<br />

que H := id + θ soit un homéomorphisme <strong>de</strong> R d et telle que<br />

F = A + φ = (I + θ) −1 ◦ A ◦ (I + θ).<br />

Démontrons que θ est Z d -périodique. Comme φ est Z d -périodique, on voit<br />

que pour tout point x ∈ R d , tout k ∈ Z d et tout n ∈ Z<br />

F n (x + k) = F n (x) + A n k.<br />

Comme H(x) = x + θ(x) avec θ bornée par une constante disons M on a<br />

(<br />

)<br />

max ‖H(F n (x + k)) − F n (x + k)‖, ‖H(F n (x)) − F n (x)‖ ≤ M<br />

et d’après la relation <strong>de</strong> conjugaison<br />

(<br />

)<br />

max ‖A n (H(x + k)) − F n (x + k)‖, ‖A n (H(x)) − F n (x)‖ ≤ M<br />

ce qui entraîne<br />

‖A n (H(x + k) − H(x)) − (F n (x + k) − F n (x))‖ ≤ 2M<br />


5.3. VARIÉTÉS STABLES ET INSTABLES 65<br />

c’est-à-dire<br />

‖A n (H(x + k) − H(x)) − A n k)‖ ≤ 2M.<br />

Par conséquent, pour tout n ∈ Z la suite A n (H(x+k)−H(x)−k) est bornée.<br />

Comme A est hyperbolique cela implique que<br />

H(x + k) = H(x) + k;<br />

comme cela est vrai pour tout k ∈ Z d , θ est bien Z d périodique et H passe<br />

au quotient par Z d : si on pose h = H ◦ π on a bien h ◦ f = T A ◦ h, et il est<br />

facile <strong>de</strong> voir que h est inversible (H l’est).<br />

✷<br />

5.3 Variétés stables et instables<br />

Nous supposerons dans la suite que A ∈ GL(n, R) est une matrice hyperbolique<br />

et nous noterons E s et E u ses espaces stables et instables et ρ s et ρ u<br />

<strong>de</strong>s exposants associés.<br />

Théorème 5.3.1 Soient A : R n une matrice hyperbolique et k ≥ 1. Il<br />

existe ε tel que pour toute application F : R n → R n <strong>de</strong> classe C k telle que<br />

‖F ‖ C k (R n ) ≤ ε, F (0) = 0, DF (0) = 0, l’ensemble W s <strong>de</strong>s points <strong>de</strong> R n tels<br />

que lim n→∞ d(f n (x), 0) = 0 (où f = A + F ) est le graphe d’une fonction<br />

S : E s → E u <strong>de</strong> classe C k telle que S(0) = 0 et DS(0)|E s = 0, c’est-à-dire<br />

que W s coïnci<strong>de</strong> avec {x s + S(x s ) : x s }. En outre, pour tout x ∈ W s on a<br />

pour tout 0 ≤ α < ρ<br />

d(f n (x), 0) ≤ C x e −nα .<br />

Démonstration.— On peut supposer que la norme <strong>de</strong> R n avec laquelle<br />

on travaille est A-adaptée. Intro<strong>du</strong>isons l’espace E <strong>de</strong>s couples <strong>de</strong> suites<br />

((s n ) n≥1 , (u n ) n≥0 )) où pour tout n ≥ 1, s n ∈ E s et tout n ≥ 0, u n ∈ E u .<br />

Posons pour α > 0,<br />

‖(s, u)‖ α = max(sup<br />

n≥1<br />

e nα |s n |, sup e nα |u n |),<br />

n≥0<br />

et notons E α l’ensemble <strong>de</strong>s (s, u) ∈ E tels que ‖(s, v)‖ α < ∞. Muni <strong>de</strong> ‖ · ‖ α<br />

c’est un espace <strong>de</strong> Banach. Notons Φ l’application Φ : E s × E α → E α qui à<br />

(t, (s, u)) associe la (˜s, ũ) définie par les relations suivantes : pour tout n ≥ 1<br />

˜s n+1 = A s s n + F s (s n , u n )<br />

u n+1 = A u ũ n + F u (s n , u n )


66 CHAPITRE 5. HYPERBOLICITÉ<br />

et<br />

˜s 1 = A s t + F s (t, u 0 )<br />

u 1 = A u ũ 0 + F u (t, u 0 )<br />

On a donc,<br />

˜s n = A s s n−1 + F s (s n−1 , u n−1 ) ˜s 1 = A s t + F s (t, u 0 )<br />

ũ n = A −1<br />

u (u n+1 − F u (s n , u n )) ũ 0 = A −1<br />

u (u 1 − F u (t, u 0 ))<br />

Remarquons que si Φ(t, (s, u)) = (s, u), cela signifie que pour tout n ≥ 1,<br />

(s n , u n ) = f n (t, u 0 ) et que (s n , u n ) est dans E α .<br />

Exercice Montrer que pour t fixé Φ(t, ·) est κ-contractante où κ := max(e α (ρ+<br />

‖DF ‖), ρ(e −α + ‖DF ‖)) < 1<br />

Exercice Montrer que Φ est C k et que la dérivée D 2 Φ(t, (u, v)) · (∆u, ∆v) =<br />

(∆ũ, ∆ṽ) où<br />

∆˜s n = A s ∆s n−1 + DF s (s n−1 , u n−1 ) · (∆s n−1 , ∆u n−1 )<br />

∆ũ n = A −1<br />

u (∆u n+1 − DF u (s n−1 , u n−1 ) · (∆s n , ∆u n ))<br />

∆˜s 1 = DF s (t, u 0 ) · (0, ∆u 0 )<br />

∆ũ 0 = A −1<br />

u (∆u 1 − DF u (t, u 0 ) · (0, ∆u 0 ))<br />

On a donc ‖D 2 Φ‖ ≤ max(e α (κ + ‖DF ‖), κ(e −α + ‖DF ‖)) < 1. Le théorème<br />

<strong>du</strong> point fixe à dépendance C k s’applique et permet <strong>de</strong> conclure la<br />

preuve <strong>du</strong> théorème.<br />

Comme corollaire <strong>du</strong> théorème précé<strong>de</strong>nt on obtient :<br />

Théorème 5.3.2 Si f : (R n , 0) est une application <strong>de</strong> classe C k telle que<br />

(f(0) = 0) Df(0) est hyperbolique, alors il existe <strong>de</strong>s voisinages <strong>de</strong> 0, V ⊂<br />

R n , V s ⊂ E s et V u ⊂ E u et <strong>de</strong>s applications S s : V s → E u , S u : V u → E s ,<br />

telles que S s,u (0) = 0 et DS s,u (0) = 0 et<br />

{(x s , x u ) ∈ V, lim<br />

n→∞<br />

f n (x) = 0} = {(x s , S s (x s ), x s ∈ V s }<br />

{(x s , x u ) ∈ V, lim<br />

n→−∞ f n (x) = 0} = {(S u (x u ), x u ), x u ∈ V u }.<br />

En outre, pour tout α < ρ, et tout x ∈ W s<br />

loc (resp. x ∈ W u<br />

loc ), ‖f n (x)‖ ≤<br />

C x e −nα pour tout n ≥ 0 (resp. n ≤ 0).<br />


5.3. VARIÉTÉS STABLES ET INSTABLES 67<br />

Remarque : Si on considère <strong>de</strong>s perturbations f λ <strong>de</strong> classe C k <strong>du</strong> difféomorphisme<br />

précé<strong>de</strong>nt telles qu’en topologie C k , λ ↦→ f λ soit continue, alors,<br />

il existe au voisinage <strong>de</strong> 0 un unique point fixe x λ hyperbolique pour f λ et<br />

les variétés stable et instable associées à x λ dépen<strong>de</strong>nt continûment <strong>de</strong> λ en<br />

topologie C k . (Exercice : Le démontrer ; on pourra démontrer une version<br />

à <strong>de</strong>ux paramètres <strong>du</strong> théorème <strong>du</strong> point fixe).


68 CHAPITRE 5. HYPERBOLICITÉ


Chapitre 6<br />

Théorie spectrale<br />

Dans ce qui suit (X, B, µ, T ) est un système dynamique mesurable, X<br />

étant un espace <strong>de</strong> Lebesgue. L’idée <strong>de</strong> la théorie specrale est d’étudier ce système<br />

dynamique via les propriétés spectrales <strong>de</strong> l’isométrie U T : L 2 (X, µ) →<br />

L 2 (X, µ), φ ↦→ φ ◦ T . Nous supposerons dans la suite que T est inversible<br />

(T −1 étant B mesurable) <strong>de</strong> façon que U T est en fait un opérateur unitaire<br />

UT<br />

∗ = U −1<br />

T<br />

. On peut reformuler les notions d’ergodicité, <strong>de</strong> mélange ou <strong>de</strong><br />

mélange faible au moyen <strong>de</strong> U T . Si on note P la projection orthogonale <strong>de</strong><br />

L 2 (X, µ) sur ker(U T − Id) = L 2 (I, µ) (I étant la tribu <strong>de</strong>s invariants <strong>de</strong> T ) :<br />

i) (X, B, µ, T ) est ergodique si et seulement si, la tribu <strong>de</strong>s invariants I égale la<br />

tribu triviale {∅, X} ; d’après le théorème <strong>de</strong> Von Neumann ceci est équivalent<br />

au fait que pour tout φ ∈ L 2 (X, µ)<br />

1 ∑n−1<br />

lim UT k φ = P φ = 〈φ, 1〉1<br />

n→∞ n<br />

k=0<br />

au sens L 2 , où P est la projection orthogonale sur l’espace <strong>de</strong>s fonctions<br />

constantes. En fait, (X, B, µ, T ) est ergodique si et seulement si pour tout<br />

φ ∈ L 2 (X, µ), S n φ/n converge faiblement vers P φ : pour tout ψ ∈ L 2 (X, µ)<br />

1 ∑n−1<br />

lim 〈UT k φ, ψ〉 = 〈P φ, ψ〉.<br />

n→∞ n<br />

k=0<br />

ii) (X, B, µ, T ) est mélangeant si pour tous φ, ψ ∈ L 2 (X, µ)<br />

lim 〈U T n φ, ψ〉 = 〈φ, 1〉〈ψ, 1〉 = 〈P φ, ψ〉,<br />

n→∞<br />

(c’est-à-dire UT n φ converge faiblement vers P φ.<br />

69


70 CHAPITRE 6. THÉORIE SPECTRALE<br />

6.1 Le théorème spectral<br />

Le théorème fondamental est le suivant :<br />

Théorème 6.1.1 (Théorème spectral) Si H est un espace <strong>de</strong> Hilbert (séparable)<br />

et U : H → H un opérateur unitaire (U∗ = U −1 ) alors il existe<br />

a) r ∈ N ∪ {∞} et <strong>de</strong>s mesuresν i , 1 ≤ i ≤ r telles que ν 1 >> ν 2 >> . . .<br />

b) une isométrie bijective Λ entre H et E = ⊕ r<br />

i=1 L2 (S 1 , Bor, ν i ) qui conjugue<br />

U (qui agit sur H) à l’opérateurM z <strong>de</strong> multiplication par z (qui agit sur E) :<br />

si Λv = φ(·) alors (ΛHv)(z) = zφ(z).<br />

En outre cette décomposition est essentiellement unique : si (H, U) est<br />

isométriquement équivalent à ( ⊕˜r<br />

i=1 L2 (S 1 , Bor, ˜ν i ), M z ) avec ˜ν 1 >> ˜ν 2 >><br />

. . ., alors ˜r = r et ˜ν i est équivalente à ν i pour tout i.<br />

La démonstration <strong>du</strong> théorème spectral que nous ne ferons pas complètement<br />

repose sur les résultats suivants<br />

Théorème 6.1.2 (Existence <strong>de</strong>s mesures spectrales) 1) Pour tout x ∈<br />

H il existe une mesure <strong>de</strong> probabilité ν x telle que pour tout n ∈ Z<br />

∫<br />

∫<br />

〈U n x, x〉 = ˆν x (n) := z −n dν(z) =<br />

S 1<br />

R/Z<br />

e −2πinθ d˜ν(θ).<br />

2) Pour tout x ∈ H l’opérateur unitaire U restreint à l’espace cyclique<br />

C(x) = Adh{U k x, k ∈ Z} est isométriquement équivalent à l’opérateur <strong>de</strong><br />

multiplication M z agissant sur L 2 (S 1 , Bor(S 1 , ν).<br />

Démonstration.— 1) Nous travaillerons plutôt sur R/Z ≡ S 1 (on note<br />

z = e 2πiθ ). Posons pour ‖x‖ = 1<br />

Par définition ν N ≥ 0 et puisque<br />

ν N (θ) = 1 N<br />

ν N (θ) = 1 N−1<br />

∑<br />

∥ ∥∥∥ N ∥ (U k x)e<br />

2.<br />

2πikθ<br />

∑<br />

0≤k,l≤N−1<br />

= ‖x‖ 2 + 1 N<br />

k=0<br />

〈U k , U l x〉e 2πi(k−l)θ<br />

∑<br />

0≤k≠l≤N−1<br />

〈U k−l x, x〉e 2πi(k−l)θ


6.1. LE THÉORÈME SPECTRAL 71<br />

on voit que ∫ T ν(θ)dθ = 1. Ainsi la mesure ν N = ν N (θ)dθ est <strong>de</strong> probabilité.<br />

Le calcul précé<strong>de</strong>nt montre que<br />

ˆν N (n) = 1 N<br />

∑<br />

0≤k≠l≤N−1<br />

k−l=n<br />

= N − n<br />

N 〈U n x, x〉<br />

〈U k−l x, x〉<br />

et donc pour tout n ∈ Z, lim n→∞ ˆν N (n) = 〈U n x, x〉. Ceci implique que ν N<br />

converge faiblement vers une mesure <strong>de</strong> probabilité ν et que ˆν(n) = 〈U n x, x〉. 1<br />

2) Pour tout polynôme trigonométrique P on a ν(P ) = 〈P (U)x, x〉. Par<br />

ailleurs,<br />

‖P (U)x‖ 2 = 〈(P (U)) ∗ P (U)x, x〉<br />

= 〈 ¯P (U −1 )P (U)x, x〉<br />

= ν(Q) (Q(z) := ¯P (z −1 )P (z))<br />

= ν(|P | 2 )<br />

car pour z ∈ S 1 (|z| = 1) ¯P (z −1 )P (z) = |P | 2 (z). On a donc démontré que<br />

pour tout polynôme trigonométrique<br />

∫<br />

‖P (U)x‖ 2 = |P (z)| 2 dν(z).<br />

S 1<br />

Si P n (U)x est une suite <strong>de</strong> C(x) convergeant vers y ∈ C(x), la suite P n (U)x<br />

est <strong>de</strong> Cauchy et d’après l’inégalité précé<strong>de</strong>nte il en est <strong>de</strong> même <strong>de</strong> P n (·) ∈<br />

L 2 (S 1 , ν). Il existe donc φ ∈ L 2 (S 1 , ν) tel que lim n→∞ ‖P n −φ‖ L 2 (ν) = 0. Si Q n<br />

est une autre suite <strong>de</strong> polynôme trigonométrique telle que Q n (U)x converge<br />

vers y il est facile <strong>de</strong> voir que Q n qui est <strong>de</strong> Cauchy dans L 2 (S 1 , ν) converge<br />

également vers φ 2 . Si on pose Ly = φ il est facile <strong>de</strong> voir que L est linéaire<br />

et par définition ‖y‖ = ‖Ly‖ L 2 (S 1 ,ν).<br />

Proposition 6.1.1 Si x et y sont dans H, notons µ x et µ y <strong>de</strong>s mesures<br />

spectrales associées à x et y comme cela a été fait dans le théorème précé<strong>de</strong>nt.<br />

Alors,<br />

1 Pour tout polynôme trigonométrique la limite lim N→∞ ν N (P ) existe ; en outre, pour<br />

toutes fonctions continues φ, P : S 1 → C, on a |ν N (φ) − ν N ′(φ)| ≤ |ν N (P ) − ν N ′(P )| +<br />

sup S 1 |φ(z)−P (z)|. Par conséquent, pour toute fonction continue φ la suite ν N (φ) converge<br />

vers un réel ν(φ) ; d’après le théorème <strong>de</strong> Banach-Steinhaus ν est une mesure <strong>de</strong> probabilité.<br />

2 car ‖P n − Q n ‖ L2 (S 1 ,ν) converge vers 0<br />


72 CHAPITRE 6. THÉORIE SPECTRALE<br />

a) si µ x ⊥ µ y alors C(x) + C(y) ⊂ C(x + y).<br />

b) si C(x) ⊂ C(y) alors µ x


6.3. MÉLANGE FAIBLE 73<br />

On dit qu’ils sont métriquement isomorphes s’il existe une application inversible<br />

h : (X 1 , B 1 , ν 1 ) → (X 2 , B 2 , ν 2 ) telle que<br />

T 2 = h ◦ T 1 ◦ h −1 .<br />

D’après le théorème spectral et la propriété précé<strong>de</strong>nte, <strong>de</strong>ux systèmes dynamiques<br />

ergodiques et à spectre discret sont spectralement isomorphe si et<br />

seulement si ils ont le même spectre.<br />

Théorème 6.2.1 Si <strong>de</strong>ux systèmes dynamiques à spectre discret sont ergodiques<br />

et spectralement isomorphes (ont le même spectre) alors ils sont<br />

mesurablement isomorphes.<br />

Théorème 6.2.2 Un système dynamique ergodique et à spectre discret est<br />

métriquement isomorphe à une translation sur un groupe abelien compact.<br />

6.3 Mélange faible<br />

Définition 6.3.1 On dit que (X, B, ν, T ) est faiblement mélangeant (en abrégé<br />

f.m.) si 1 est l’unique valeur propre <strong>de</strong> U T et si elle est simple (les seules<br />

fonctions propres sont les constantes).<br />

Ainsi, une transformation f.m est ergodique. Le théorème spectral permet <strong>de</strong><br />

caractériser les transformations faiblement mélangeante. :<br />

Théorème 6.3.1 Les assertions suivantes sont équivalentes :<br />

i) (X, B, µ, T ) est faiblement mélangeant ;<br />

ii) pour tous A, B ∈ B<br />

1<br />

lim<br />

n→∞ n<br />

∑n−1<br />

∣ µ(T −k A ∩ B) − µ(A)µ(B)<br />

∣ = 0;<br />

k=0<br />

iii) pour tous A, B ∈ B il existe un sous-ensemble N <strong>de</strong> N <strong>de</strong> <strong>de</strong>nsité 1 3 tel<br />

que<br />

lim µ(T −k A ∩ B) = µ(A)µ(B);<br />

n→∞<br />

n∈N<br />

iv) les mêmes assertions que ii) et iii) mais en remplaçant "tous A, B ∈ B<br />

par "pour tous A, B dans un ensemble engendrant la tribu B"<br />

3 un ensemble A ∈ N est <strong>de</strong> <strong>de</strong>nsité 1 si (1/n) ∑ n−1<br />

k=0 1 A(k) converge vers 1 quand n → ∞


74 CHAPITRE 6. THÉORIE SPECTRALE<br />

v) Pour toutes f, g ∈ L 2 (X, µ)<br />

1 ∑n−1<br />

(∫<br />

lim |〈U k f, g〉| 2 =<br />

n→∞ n<br />

k=0<br />

X<br />

)(∫ )<br />

fdµ ḡdµ .<br />

X<br />

Démonstration.— a) Nous allons d’abord démontrer i)ssiv).<br />

Supposons que i) soit vraie : par polarisation il suffit <strong>de</strong> démontrer que<br />

pour toute f ∈ L 2 (X, µ)<br />

1 ∑n−1<br />

(∫<br />

) 2<br />

lim |〈U k f, f〉| 2 = f(x)dµ(x)<br />

n→∞ n<br />

k=0<br />

et il est facile <strong>de</strong> voir qu’il suffit <strong>de</strong> démontrer ceci pour f telle que ∫ f(x)dµ(x) =<br />

X<br />

0. Utilisons le théorème spectral pour U restreinte à l’espace cyclique engendré<br />

par f : il existe une mesure <strong>de</strong> probabilité ν borélienne sur S 1 et une<br />

fonction φ ∈ L 2 (S 1 , ν) telles que pour tout k<br />

∫<br />

〈U k f, f〉 = z k φ(z) ¯φ(z)dν(z).<br />

S 1<br />

On a donc<br />

1 ∑n−1<br />

|〈U k f, f〉| 2 = 1 ∑n−1<br />

∫<br />

n<br />

n ∣ z k φ(z) ¯φ(z)dν(z)<br />

2<br />

∣<br />

k=0<br />

k=0<br />

S 1<br />

= 1 n−1<br />

∑<br />

∫<br />

2<br />

n ∣ z k dσ(z)<br />

∣<br />

S 1<br />

k=0<br />

n−1<br />

X<br />

= 1 ∑<br />

|ˆσ(k)| 2<br />

n<br />

k=0<br />

où µ est la mesure <strong>de</strong> probabilité dσ(z) = |φ(z)| 2 dν(z). Or, on a le théorème<br />

suivant :<br />

Théorème 6.3.2 (Wiener) Si σ est une mesure <strong>de</strong> probabilité sur S 1<br />

1 ∑n−1<br />

lim |ˆσ(k)| 2 =<br />

n→∞ n<br />

k=0<br />

∑<br />

a atome <strong>de</strong> σ<br />

|σ({a})| 2<br />

Démonstration.— En effet<br />

1 ∑n−1<br />

|ˆµ(k)| 2 = 1 ∑n−1<br />

(∫ )(∫<br />

)<br />

z k dσ(z) w −k dσ(w)<br />

n<br />

n<br />

k=0<br />

k=0<br />

S 1 S 1<br />

∫ ( 1 ∑n−1<br />

=<br />

(zw −1 )<br />

)d(σ k ⊗ σ)(z, w).<br />

S 1 ×S n 1<br />

k=0


6.3. MÉLANGE FAIBLE 75<br />

Or,<br />

n−1 ∣ 1 ∑ ∣∣∣<br />

∣ (zw −1 ) k ≤ 1 ∈ L 2<br />

n<br />

k=0<br />

converge simplement vers 1 ∆ (z, w) où ∆ est la diagonale z = w dans S 1 ×S 1 .<br />

Le théorème <strong>de</strong> convergence dominée montre donc que<br />

1 ∑n−1<br />

∫<br />

lim |ˆµ(k)| 2 = 1 ∆ (z, w)d(σ ⊗ σ)(z, w)<br />

n→∞ n<br />

k=0<br />

S 1 ×S<br />

∫<br />

1<br />

= σ({z})dσ(z)<br />

S 1 ∑<br />

= |σ({a})| 2<br />

a atome <strong>de</strong> σ<br />

Utilisant ce théorème <strong>de</strong> Wiener on voit que<br />

1 ∑n−1<br />

lim |〈U k f, f〉| 2 =<br />

n→∞ n<br />

X<br />

k=0<br />

∑<br />

a atome <strong>de</strong> ν<br />

|φ(a)| 2 |ν({a})| 2 .<br />

Mais, si ν({a}) > 0 cela signifie que a est valeur propre <strong>de</strong> U T restreint à<br />

C(f) (Pourquoi ) ; comme T est f.m a = 1 et la fonction propre associée<br />

est une constante non nulle. Ceci est impossible car toute fonction <strong>de</strong> C(f)<br />

est <strong>de</strong> µ moyenne nulle.<br />

L’implication réciproque est facile : si Uf = λf alors λ est <strong>de</strong> mo<strong>du</strong>le 1 (car<br />

U est une isométrie) et U k f = λ k f. Par conséquent,<br />

(∫ 2<br />

1 ∑n−1<br />

fdµ)<br />

= lim |〈U k f, f〉| 2 1 ∑n−1<br />

= lim λ 2k = 0.<br />

n→∞ n<br />

n→∞ n<br />

k=0<br />

b) Les autres implications découleront facilement <strong>du</strong> lemme important suivant.<br />

Lemme 6.3.1 Soit (a k ) une suite <strong>de</strong> réels positifs. On a<br />

(a)<br />

1 ∑n−1<br />

lim a k = 0<br />

n→∞ n<br />

si et seulement si : (b) la suite a k tend vers 0 le long d’un ensemble <strong>de</strong> <strong>de</strong>nsité<br />

1 : il existe Z ⊂ N <strong>de</strong> <strong>de</strong>nsité 1 tel que<br />

k=0<br />

lim a<br />

n→∞ n = 0.<br />

n∈Z<br />

k=0<br />


76 CHAPITRE 6. THÉORIE SPECTRALE<br />

Démonstration.— Le fait que (b) implique (a) est trivial et laissé au lecteur.<br />

Montrons donc que (a) entraîne (b). Pour tout p ≥ 1 l’ensemble<br />

Z p = {k : a k ≥ 1 p }<br />

est <strong>de</strong> <strong>de</strong>nsité 0 (son complémentaire est <strong>de</strong> <strong>de</strong>nsité 1). Par conséquent il<br />

existe n p tel que pour tout n ≥ n p<br />

n<br />

1 ∑ p−1<br />

1 Zp (k) ≤ 1 n<br />

p .<br />

k=0<br />

Posons alors<br />

Z = ⋃ p≥1(Z p ∩ [n p , ∞[).<br />

Le long <strong>de</strong> Z c la suite a n tend vers 0 ; en effet, si n /∈ Z alors pour n ≥ n p<br />

on a a n ≤ (1/p). En outre, Z est <strong>de</strong> <strong>de</strong>nsité 0 : puisque les ensembles Z p<br />

croissent avec p, pour n ≥ 1, Z ∩ [0, n] ⊂ Z p où n p ≤ n < n p+1 . Donc,<br />

1 ∑n−1<br />

1 Z (k) ≤ 1 ∑n−1<br />

1 Zp (k) ≤ 1 n<br />

n<br />

p . k=0<br />

k=0<br />

✷<br />

Le fait que v) implique iii) se fait en utilisant le lemme précé<strong>de</strong>nt et en<br />

faisant dans v) f = 1 A − µ(A), g = 1 B − µ(B). L’équivalence <strong>de</strong> iii) et ii)<br />

est encore <strong>du</strong>e au lemme précé<strong>de</strong>nt. Montrons que iii) entraîne v) : Le lemme<br />

et iii) impliquent que v) a lieu pour f et g <strong>de</strong> la forme f = 1 A − µ(A),<br />

g = 1 B − µ(B) et donc v) a lieu pour f et g fonctions indicatrices puis<br />

fonctions simples puis L 2 . L’équivalence <strong>de</strong> iv) avec le reste est facile est<br />

laissée au lecteur.<br />

✷<br />

Exercice : Démontrer que T est faiblement mélangeante si pour tous A, B, C ∈<br />

B<br />

1 ∑n−1<br />

µ(A ∩ T −k B ∩ T −2k C) = µ(A)µ(B)µ(C).<br />

n<br />

k=0<br />

Le théorème précé<strong>de</strong>nt a pour conséquence le suivant :


6.4. FACTEUR DE KRONECKER 77<br />

Théorème 6.3.3 Les assertions suivantes sont équivalentes<br />

i) (X × X, B ⊗ B, µ ⊗ µ, T × T ) est ergodique<br />

ii) (X, B, µ, T ) est faiblement mélangeant<br />

iii) (X × X, B ⊗ B, µ ⊗ µ, T × T ) est faiblement mélangeant<br />

iv) pour tout (Y, C, ν, S) le système dynamique (X × Y, B ⊗ C, µ ⊗ ν, T × S)<br />

est ergodique.<br />

Démonstration.—<br />

Montrons que i) implique ii) : Si φ est une fonction propre <strong>de</strong> T <strong>de</strong> v.p λ,<br />

T φ = λφ on a T ¯φ = ¯barφ si bien que si on pose ψ = φ ⊗ ¯φ (ψ(x, y) =<br />

φ(x) ¯ψ(y)) on a (T × T )ψ = ¯λλψ. Or, |λ| = 1 (U T est une isométrie) si bien<br />

que ψ est constante (T × T est ergodique) et par conséquent φ est constante<br />

µ-pp (Pourquoi ).<br />

ii) implique iii) : soient A, B, C, D ∈ B et Z un ensemble <strong>de</strong> <strong>de</strong>nsité 1 sur<br />

lequel µ(T −k A ∩ C) → µ(A)µ(C) et µ(T −k B ∩ D) → µ(B)µ(D) . On a par<br />

définition <strong>de</strong> la mesure pro<strong>du</strong>it<br />

(µ ⊗ µ)((T −k A × T −k B) ∩ (C × D)) = µ(T −k A ∩ C)µ(T −k B ∩ D).<br />

et quand k ∈ Z cette <strong>de</strong>rnière quantité tend vers µ(A)µ(C)µ(B)µ(D) qui est<br />

(µ ⊗ µ)(A × B) · (µ ⊗ µ)(C × D)).<br />

iii) implique i) est immédiat.<br />

L’équivalence <strong>de</strong> iv) avec le reste se fait comme "ii) implique iii)".<br />

✷<br />

Remarque : Quand on étudie <strong>de</strong>s actions <strong>de</strong> groupes autres que Z on définit<br />

le faible mélange comme étant l’absence <strong>de</strong> sous-espaces vectoriels <strong>de</strong><br />

dimension finie invariants en <strong>de</strong>hors <strong>de</strong> l’ensemble <strong>de</strong>s constantes.<br />

6.4 Facteur <strong>de</strong> Kronecker<br />

Supposons que (X, B, µ, T ) soit ergodique et notons F l’adhérence dans<br />

L 2 (X, µ) <strong>de</strong> l’espace vectoriel engendré par les fonctions propres <strong>de</strong> U T .<br />

Notons par ailleurs K la tribu engendrée par les fonctions propres <strong>de</strong> U<br />

(c’est-à-dire engendrée par les {f > λ}, λ ∈ R, f fonction propre <strong>de</strong> U). Il<br />

est clair que F ⊂ L 2 (X, K). Démontrons l’inclusion réciproque. Remarquons<br />

que si f est une fonction propre <strong>de</strong> U <strong>de</strong> valeur propre associée λ alors<br />

f n est fonction propre <strong>de</strong> valeur propre λ n . Les valeurs propres <strong>de</strong> U sont<br />

simples, si bien que les fonctions f n , n ∈ Z sont <strong>de</strong>ux à <strong>de</strong>ux orthogonales


78 CHAPITRE 6. THÉORIE SPECTRALE<br />

dans L 2 (X, µ). Si P (z) = ∑ |k|≤N a kz k est un polynôme en z, z −1 on a donc<br />

‖P (f)‖ L 2 (µ) = ∑ |k|≤N |a k| 2 et donc<br />

∫<br />

‖P (f)‖ 2 L 2 (X,µ) = |P (z)| 2 dz.<br />

Si A est un borélien <strong>de</strong> T il existe une suite <strong>de</strong> tels polynômes trigonométriques<br />

P n qui converge vers 1 A dans L 2 (T, dz), si bien que 1 A ◦ f est limite<br />

dans L 2 (X, µ) <strong>de</strong> P n (f). Ceci démontre que toute fonction <strong>de</strong> L 2 (X, µ) <strong>de</strong> la<br />

forme 1 A ◦ f est dans F . Mais il est clair que L 2 (K, µ) est engendré par les<br />

1 A ◦ f quand A décrit les boréliens <strong>de</strong> T et f les fonctions propres <strong>de</strong> U.<br />

Notons à présent Λ le groupe abélien constitué <strong>de</strong>s valeurs propres <strong>de</strong> U et<br />

Γ son groupe <strong>du</strong>al, c’est-à-dire le groupe <strong>de</strong>s caractères <strong>de</strong> Λ.<br />

6.5 Couplages<br />

Etant donnés <strong>de</strong>ux systèmes dynamiques (X 1 , B 1 , µ 1 , T 1 ) et (X 2 , B 2 , µ 2 , T 2 ),<br />

on appelle couplage, toute mesure ν définie sur la tribu B = B 1 ⊗ B 2 , invariante<br />

par T 1 × T 2 : X 1 × X 2 → X 1 × X 2 et qui se projette sur le premier<br />

facteur sur µ 1 et sur le <strong>de</strong>uxième facteur sur µ 2 .<br />

Exemple a) La mesure pro<strong>du</strong>it ν = µ 1 ⊗ µ 2 définie par ν(A 1 × A 2 ) =<br />

µ 1 (A 1 )µ 2 (A 2 ) est toujours un couplage.<br />

b) Si (X i , B i , µ i , T i ) = (X, B, µ, T ), i = 1, 2, la mesure diagonale ∆(A 1 ×<br />

A 2 ) = µ(A 1 ∩ A 2 ) est un couplage.<br />

Définition 6.5.1 On dit que les systèmes dynamiques sont disjoints (X 1 , B 1 , µ 1 , T 1 )<br />

et (X 2 , B 2 , µ 2 , T 2 ) si le seul couplage qu’ils admettent est la mesure pro<strong>du</strong>it.<br />

On a alors la propriété suivante simple mais très utile :<br />

Proposition 6.5.1 L’i<strong>de</strong>ntité est toujours disjointe <strong>de</strong>s ergodiques : avec les<br />

notations précé<strong>de</strong>ntes, si T 1 = Id et si (X 2 , B 2 , µ 2 , T 2 ) est ergodique, alors le<br />

seul couplage possible est la mesure pro<strong>du</strong>it.<br />

Démonstration.— Soit ν est une<br />

∑<br />

mesure invariante par I × T 2 ; pour f ∈<br />

C(X 1 ), g ∈ C(X 2 ) la moyenne 1 n−1<br />

n k=0 f(x 1)g(T2 k x 2 ) converge pour tout<br />

x 1 ∈ X 1 et µ 2 -p.t x 2 ∈ X 2 vers f(x 1 ) ∫ X 2<br />

g(y)dµ 2 (y). En particulier, puisque<br />

(π 2 ) ∗ ν = µ 2 la convergence a lieu ν-p.p. et d’après le théorème <strong>de</strong> convergence<br />

dominée<br />

∫<br />

f(x 1 )g(x 2 )dν(x 1 , x 2 ) =<br />

X 1 ×X 2<br />

∫<br />

f(x 1 )dν(x 1 , x 2 )<br />

X 1 ×X 2<br />

∫<br />

g(x 2 )dµ 2 (x 2 ).<br />

X 2<br />

T


6.6. MÉLANGE FAIBLE D’ORDRE SUPÉRIEUR 79<br />

Comme (π 1 ) ∗ ν = µ 1 on a donc<br />

∫<br />

∫<br />

∫<br />

f(x 1 )g(x 2 )dν(x 1 , x 2 ) =<br />

X 1 ×X 2<br />

f(x 1 )dµ 1 (x 1 )<br />

X 1<br />

g(x 2 )dµ 2 (x 2 ),<br />

X 2<br />

ce qui prouve que ν est la mesure pro<strong>du</strong>it.<br />

✷<br />

Exercice On suppose que (X, B, µ, T ) est faiblement mélangeant.<br />

1) On note S = I ×T ×T 2 et ∆ la mesure diagonale sur (X 3 , B 3⊗ ) définie par<br />

∆(A × B × C) = µ(A ∩ B ∩ C). Soit λ une limite pour la topologie faible-∗<br />

<strong>de</strong> la suite (1/N) ∑ N<br />

k=0 (S ∗) k ∆. Démontrer que λ est un couplage <strong>de</strong> (I, µ) et<br />

(T × T 2 , µ ⊗ µ).<br />

2) En dé<strong>du</strong>ire que pour tous A, B, C ∈ A<br />

lim<br />

N→∞<br />

1<br />

N<br />

N∑<br />

µ(A ∩ T −k B ∩ T −2k C) = µ(A)µ(B)µ(C).<br />

k=0<br />

[Comme (T 2 , µ) est ergodique ((T, µ) est f.m) et que (T, µ) est f.m., on voit<br />

que (T × T 2 , µ ⊗ µ) est ergodique]<br />

3). Démontrer que pour tous A, B, C ∈ A il existe N ⊂ N <strong>de</strong> <strong>de</strong>nsité 1 tel<br />

que<br />

lim<br />

k→∞,N∈N µ(A ∩ T −k B ∩ T −2k C) = µ(A)µ(B)µ(C).<br />

[Appliquer le résultat <strong>du</strong> 2. à (T × T, µ ⊗ µ), A × A, B × B, C × C pour<br />

obtenir<br />

]<br />

lim<br />

N→∞<br />

1<br />

N<br />

N∑<br />

(<br />

2<br />

µ(A ∩ T −k B ∩ T −2k C) − µ(A)µ(B)µ(C))<br />

.<br />

k=0<br />

6.6 Mélange faible d’ordre supérieur<br />

B<br />

On dit qu’une transformation est p-mélangeante si pour tous A 1 , . . . , A p ∈<br />

lim µ(A 1 ∩ T −n A 2 · · · ∩ T −n(r−1) A p ) = µ(A 1 )µ(A 2 ) · · · µ(A p ).<br />

n→∞<br />

Une question toujours non résolue qui est l’objet <strong>de</strong> recherches actives est<br />

la suivante : le 2-mélange implique-t-il le 3-mélange Il est remarquable que


80 CHAPITRE 6. THÉORIE SPECTRALE<br />

l’analogue faible <strong>de</strong> cette question admette une réponse positive dont la démonstration<br />

est non triviale. On dit qu’une transformation est faiblement<br />

mélangeante d’ordre p si pour tous A 1 , . . . , A p ∈ B il existe un ensemble<br />

Z ⊂ N <strong>de</strong> <strong>de</strong>nsité 1 tel que<br />

lim µ(A<br />

n→∞ 1 ∩ T −n A 2 · · · ∩ T −n(r−1) A p ) = µ(A 1 )µ(A 2 ) · · · µ(A p ).<br />

n∈Z<br />

Il est équivalent <strong>de</strong> dire que pour tous A 1 , . . . , A p ∈ B<br />

n−1<br />

lim<br />

n→∞<br />

k=0<br />

On a<br />

∑<br />

|µ(A 1 ∩ T −k A 2 · · · ∩ T −k(r−1) A p ) − µ(A 1 )µ(A 2 ) · · · µ(A p )| = 0.<br />

Théorème 6.6.1 Si (X, B, µ, T ) est faiblement mélangeant alors pour tout<br />

p ≥ 3 il est faiblement mélangeant d’ordre p.<br />

Il est facile d’adapter la preuve <strong>de</strong> l’exercice <strong>de</strong> la section précé<strong>de</strong>nte pour<br />

démontrer ce résultat. On peut également en donner une preuve en utilisant<br />

la métho<strong>de</strong> <strong>de</strong> Van <strong>de</strong>r Corput.<br />

6.7 Argument <strong>de</strong> Hopf et Théorie spectrale<br />

Soit T un automorphisme ergodique <strong>du</strong> tore T 2 . Nous illustrons dans ce<br />

qui suit une métho<strong>de</strong> (<strong>du</strong>e à Martine Babillot) qui permet <strong>de</strong> démontrer<br />

qu’un tel automorphisme est mélangeant. Soit f une fonction continue sur<br />

T 2 <strong>de</strong> moyenne nulle. Il existe une suite n k d’entiers pour laquelle f ◦ T n k<br />

converge faiblement dans L 2 (T 2 ) vers une fonction <strong>de</strong> carré intégrable g et<br />

nous <strong>de</strong>vons démontrer que g est nulle. Supposons par l’absur<strong>de</strong> que g ne<br />

soit pas nulle. D’après le Théorème spectral, il existe une mesure ν sur le<br />

cercle et un isomorphisme unitaire V <strong>de</strong> {f ◦ T k : k ∈ Z} L2 (T 2 )<br />

sur L 2 (ν) tel<br />

que V (l ◦ T ) = zV (l). Notons φ = V (f), ψ = V (g) et A le sous-espace <strong>de</strong><br />

L 2 (ν) constitué <strong>de</strong>s limites faibles <strong>de</strong> la suite <strong>de</strong> fonctions z n φ(z), n → ±∞.<br />

Il est facile <strong>de</strong> voir que A est stable par conjugaison complexe et par pro<strong>du</strong>it.<br />

Posons alors θ = |ψ| 2 qui est non i<strong>de</strong>ntiquement nulle et dans A et posons<br />

h = V −1 (θ). Par définition il existe une suite n k → ∞ pour laquelle f ◦ T n k<br />

converge faiblement vers h et comme h est invariante par conjugaison il existe<br />

une suite n ′ k → ∞ telle que f ◦ T −n′ k converge faiblement vers h. D’après le<br />

Théorème <strong>de</strong> Banach-Sachs on sait que l’on peut extraire une sous-suite n ik <strong>de</strong><br />

n k telle que les moyennes <strong>de</strong> Cesaro M K := (1/K) ∑ K<br />

i=1 f ◦T n ik<br />

converge dans


6.7. ARGUMENT DE HOPF ET THÉORIE SPECTRALE 81<br />

L 2 (T 2 ) vers h. Il existe donc une sous-suite K p pour laquelle M Kp converge<br />

p.p vers h. Par un argument classique on voit que h est constante sur presque<br />

toute feuille stable <strong>de</strong> T et on voit <strong>de</strong> la même manière que h est constante<br />

sur presque toute feuille instable <strong>de</strong> T . On en dé<strong>du</strong>it que h est constante et<br />

comme h n’est pas i<strong>de</strong>ntiquement nulle cette constante est également nonnulle.<br />

Mais cela est une contradiction car comme f est <strong>de</strong> moyenne nulle,<br />

toute limite faible <strong>de</strong> la suite f ◦ T n doit être <strong>de</strong> moyenne nulle.<br />

Cet argument présent l’intérêt <strong>de</strong> donner une démonstration simple <strong>du</strong><br />

mélange <strong>du</strong> flot géodésique.


82 CHAPITRE 6. THÉORIE SPECTRALE


Chapitre 7<br />

Entropie<br />

La notion d’entropie métrique (resp. topologique) en théorie ergodique<br />

est un invariant très utile <strong>de</strong> conjugaison mesurable (resp. topologique).<br />

7.1 Entropie métrique<br />

Dans tout ce qui suit (X, B, µ, T ) est un système dynamique.<br />

7.1.1 Entropie d’une partition finie<br />

Si ξ est une partition mesurable finie <strong>de</strong> X c’est-à-dire si ξ est une partition<br />

finie <strong>de</strong> X en ensembles C i ∈ B, 1 ≤ i ≤ r (r = #ξ) <strong>de</strong> µ-mesure<br />

non-nulle 1 on définit l’entropie <strong>de</strong> la partition ξ par rapport à µ par<br />

H µ (ξ) = −<br />

r∑<br />

µ(C i ) log(µ(C i )).<br />

i=1<br />

Dans la suite nous omettrons souvent l’indice µ.<br />

Il est commo<strong>de</strong> d’intro<strong>du</strong>ire la fonction d’information définie pour tout<br />

x ∈ X par<br />

r∑<br />

I(ξ)(x) = − log(µ(C i ))1 Ci (x).<br />

On a<br />

i=1<br />

∫<br />

H µ (ξ) =<br />

X<br />

I(ξ)(x)dµ(x).<br />

Si ξ et η sont <strong>de</strong>ux partitions mesurables finies on intro<strong>du</strong>it la partition<br />

ξ ∨ η qui est la plus petite partition raffinant ξ et η (contenant les atomes <strong>de</strong><br />

1 Nous dirons que les C i sont les atomes <strong>de</strong> la partition ξ<br />

83


84 CHAPITRE 7. ENTROPIE<br />

ξ et <strong>de</strong> η) : c’est la partition dont les atomes sont les C i ∩ D j , C i ∈ ξ, D j ∈ η.<br />

Essayons <strong>de</strong> calculer l’entropie <strong>de</strong> la partition ξ ∨ η en fonction <strong>de</strong> celles <strong>de</strong><br />

ξ et <strong>de</strong> η :<br />

H(ξ ∨ η) = −<br />

∑<br />

µ(C i ∩ D j ) log(µ(C i ∩ D j ))<br />

C i ∈ξ,D j ∈η<br />

= − ∑<br />

C i ∈ξ,D j ∈η<br />

= − ∑<br />

C i ∈ξ,D j ∈η<br />

= H(η) − ∑<br />

µ(C i ∩ D j ) log(µ(C i |D j )µ(D j ))<br />

µ(C i ∩ D j ) log(µ(D j )) −<br />

C i ∈ξ,D j ∈η<br />

∑<br />

C i ∈ξ,D j ∈η<br />

µ(C i ∩ D j ) log(µ(C i |D j ))<br />

µ(C i ∩ D j ) log(µ(C i |D j ))<br />

où on a noté µ(C i |D j ) = µ(C i ∩ D j )/µ(D j ). Si on intro<strong>du</strong>it l’entropie conditionnelle<br />

H(ξ|η) <strong>de</strong> ξ par rapport à η<br />

H(ξ|η) = −<br />

∑<br />

µ(C i ∩ D j ) log(µ(C i |D j ))<br />

C i ∈ξ,D j ∈η<br />

on obtient la formule très importante<br />

Il est utile parfois d’écrire<br />

H µ (ξ ∨ η) = H µ (ξ|η) + H µ (η).<br />

H µ (ξ|η) = ∑ D j ∈η<br />

µ(D j )H µ(·|Dj )(ξ)<br />

où µ(·|D j ) est la mesure conditionnelle par rapport à D j (i.e µ(·|D j ) = µ(· ∩<br />

D j )/µ(D j )).<br />

A ce sta<strong>de</strong> il est pertinent d’intro<strong>du</strong>ire la fonction d’information conditionnelle.<br />

Supposons que ξ est une partition mesurable finie et que A est une<br />

sous-tribu <strong>de</strong> B ; dans la situation précé<strong>de</strong>nte, A sera la tribu ˆη engendrée par<br />

les atomes <strong>de</strong> la partition η. Intro<strong>du</strong>isons l’espérance conditionnelle E(·|A)<br />

par rapport à la tribu A ; dans le cas où A = ˆη on a pour toute fonction<br />

f ∈ L 1 (X, B, µ)<br />

E(f|A)(·) = ∑ ( ∫<br />

)<br />

1<br />

f(x)dµ(x) 1 Dj (·).<br />

µ(D j )<br />

D j ∈η<br />

D j<br />

Nous définissons alors<br />

I(ξ|A)(·) = − ∑ C i ∈ξ<br />

( )<br />

log E(1 Ci |A)(·) 1 Ci (·).


7.1. ENTROPIE MÉTRIQUE 85<br />

On définit alors l’entropie conditionelle <strong>de</strong> ξ par rapport à la tribu A<br />

∫<br />

H(ξ|A) = I(ξ|A)(x)dµ(x).<br />

Remarquons que puisque ∫ E(f|A)dµ = ∫ fdµ on a<br />

X X<br />

∫ ∑<br />

( ) )<br />

H(ξ|A) = − log E(1 Ci |A)(·) E(1 Ci |A)(·) dµ<br />

X(<br />

C i ∈ξ<br />

ou encore en notant φ(t) = −t log t<br />

∫<br />

∑<br />

H(ξ|A) =<br />

X<br />

X<br />

C i ∈ξ<br />

Dans la cas où A = ˆη on retrouve le résultat précé<strong>de</strong>nt.<br />

( )<br />

φ E(1 Ci |A)(·) dµ (7.1)<br />

Remarque : Si A = {∅, X} est la tribu triviale I(ξ|A)(·) = I(ξ)(·) tandis<br />

que si A = B on a I(ξ|A)(·) = 0 µ-pp. En effet, si A est la tribu triviale<br />

le résultat est clair tandis que si A = B on a E(1 Ci |A)(·) = 1 Ci (·) et donc<br />

I(ξ|A)(x) = ∑ C i ∈ξ φ(1 C i<br />

(x)) où φ(t) = −t log t (observer que φ(0) = φ(1) =<br />

0).<br />

Nous regroupons dans la proposition qui suit quelques propriétés utiles <strong>de</strong><br />

l’entropie :<br />

Proposition 7.1.1 Si ξ et η sont <strong>de</strong>s partitions mesurables finies<br />

1) H(ξ ∨ η) = H(η) + H(ξ|η) = H(ξ) + H(η|ξ) 2<br />

2) H(ξ ∨ η) ≤ H(ξ) + H(η).<br />

3) Si T : X → X est B-mesurable et préserve µ<br />

H(T −1 ξ|T −1 η) = H(ξ|η).<br />

4) Si ξ 1 < ξ 2 (ξ 2 est plus fine que ξ 1 3 ) alors H(ξ 1 |A) ≤ H(ξ 2 |A).<br />

5) Si A 1 ⊂ A 2 sont <strong>de</strong>s tribus, H(ξ|A 2 ) ≤ H(ξ|A 1 ) 4 . (En particulier H(ξ|η) ≤<br />

H(ξ).)<br />

6) On a toujours H(ξ) ≤ log(#ξ).<br />

2 et plus généralement H(ξ ∨ η|A) = H(η|A) + H(ξ|ˆη ∨ A) = H(ξ|A) + H(η|ˆξ ∨ A) :<br />

c’est facile à démontrer si A a un nombre fini d’atomes, plus délicat sinon.<br />

3 i.e. tout atome <strong>de</strong> ξ 2 est inclus dans un atome <strong>de</strong> ξ 1<br />

4 H(ξ|B) = 0, H(ξ|{∅, X}) = H(ξ)


86 CHAPITRE 7. ENTROPIE<br />

Démonstration.— Le point 1) a déjà été démontré. Le point 3) est évi<strong>de</strong>nt.<br />

Le 2) est un cas particulier <strong>de</strong> 5) qui repose sur l’inégalité <strong>de</strong> Jensen 5 et le<br />

fait que la fonction t ↦→ −t log t est concave : puisque A 1 ⊂ A 2 l’opérateur<br />

E(·|A 1 ) restreint à L 1 (A 2 ) est l’i<strong>de</strong>ntité si bien que d’après l’inégalité <strong>de</strong><br />

Jensen ( (<br />

) (<br />

)<br />

E φ E(1 Ci |A 2 )(·)<br />

)|A 1 ≤ φ E(1 Ci |A 1 )(·) ;<br />

comme<br />

∫<br />

X<br />

(<br />

) ∫ ( (<br />

)<br />

φ E(1 Ci |A 2 )(·) dµ = E φ E(1 Ci |A 2 )(·)<br />

)|A 1 dµ<br />

X<br />

l’égalité (7.1) permet <strong>de</strong> conclure la preuve <strong>de</strong> 5).<br />

Le point 4) (et son analogue conditionnel) se démontre en remarquant<br />

que puisque ξ 1 < ξ 2 on a ξ 1 ∨ ξ 2 = ξ 2 et donc,<br />

H(ξ 2 ) = H(ξ 1 ) + H(ξ 2 |ξ 1 ) ≥ H(ξ 1 ).<br />

Le point 6) est facile (utiliser la concavité <strong>de</strong> φ).<br />

✷<br />

Exercice Démontrer que<br />

I(T −1 ξ) = I(ξ) ◦ T et<br />

I(ξ ∨ η) = I(ξ|η) + I(η).<br />

7.1.2 Entropie d’une transformation<br />

Définition<br />

Nous sommes en mesure <strong>de</strong> définir l’entropie d’une transformation (T, µ).<br />

Théorème 7.1.1 Si (X, B, µ, T ) est un système dynamique et si ξ est une<br />

partition mesurable finie <strong>de</strong> X la suite H( ∨ n−1<br />

k=0 T −k ξ) est sous-additive et on<br />

note<br />

n−1<br />

1<br />

h µ (T, ξ) = lim<br />

n→∞ n H( ∨<br />

T −k ξ).<br />

(<br />

5 c’est-à-dire ) pour φ fonction concave, f ∈ L 1 (X, B, µ) et A sous-tribu <strong>de</strong> B on a<br />

φ E(f|A) ≥ E(φ ◦ f|A) ; cela se démontre facilement d’abord dans le cas où f est<br />

étagée<br />

k=0


7.1. ENTROPIE MÉTRIQUE 87<br />

Démonstration.— Notons ξ n = ∨ n−1<br />

k=0 T −k ξ. Puisque ξ n+m = ξ n ∨ ξ m on a<br />

d’après le 2 <strong>de</strong> la proposition 7.1.1<br />

H(ξ n+m ) ≤ H(ξ n ) + H(ξ m ).<br />

Définition 7.1.1 On définit l’entropie <strong>de</strong> (T, µ) comme étant<br />

h µ (T ) = sup h(T, ξ)<br />

ξ<br />

le sup étant pris sur toutes les partitions mesurables finies d’entropie finie.<br />

✷<br />

Exemples : Calculons l’entropie d’une translation rationnelle sur R/Z d’angle<br />

p/q. Pour toute partition mesurable finie ξ d’entropie finie, le nombre d’atomes<br />

<strong>de</strong> la partition ∨ n−1<br />

k=0 T −k ξ est inférieur à (#ξ) q et est donc borné. Par conséquent<br />

h(T, ξ) = 0 pour toute partition finie et donc h(T ) = 0.<br />

Notons le théorème suivant<br />

Théorème 7.1.2 Pour toute partition mesurable finie ξ<br />

ou encore<br />

Démonstration.—<br />

n−1<br />

∨<br />

h(T, ξ) = lim H(ξ| T −k ξ)<br />

n→∞<br />

h(T, ξ) = H(ξ|<br />

k=1<br />

∞∨<br />

T −k ξ).<br />

k=1<br />

Pour la première partie, il suffit d’écrire<br />

∨<br />

T −k ξ) = H(ξ ∨<br />

n−1<br />

H(<br />

k=0<br />

n−1<br />

∨<br />

k=1<br />

T −k ξ)<br />

n−1<br />

∨<br />

n−1<br />

∨<br />

= H(ξ| T −k ξ) + H( T −k ξ)<br />

k=1<br />

k=1<br />

k=1<br />

n−1<br />

∨<br />

n−2<br />

∨<br />

= H(ξ| T −k ξ) + H(T −1 T −k ξ)<br />

k=0<br />

n−1<br />

∨<br />

n−2<br />

∨<br />

= H(ξ| T −k ξ) + H( T −k ξ)<br />

k=1<br />

k=0


88 CHAPITRE 7. ENTROPIE<br />

où on a utilisé le 3) <strong>de</strong> la proposition 7.1.1. Si on itère la relation précé<strong>de</strong>nte<br />

on trouve que<br />

n−1<br />

∨<br />

n−1<br />

∨<br />

H(ξ| T −k ξ) = H(ξ|T −1 ξ)+· · ·+H(ξ|T −1 ξ ∨T −2 ξ)+· · ·+H(ξ| T −k ξ).<br />

k=0<br />

La suite H(ξ| ∨ n−1<br />

k=1 T −k ξ) est décroissante par rapport à k (cf. 5) <strong>de</strong> la proposition<br />

7.1.1 ) et par conséquent converge ; le théorème <strong>de</strong> Césaro 6 permet<br />

<strong>de</strong> conclure.<br />

La <strong>de</strong>uxième partie <strong>du</strong> théorème se démontre en utilisant le lemme suivant<br />

:<br />

k=1<br />

Lemme 7.1.1 Si les tribus A n v’érifient A n ↑ A, alors<br />

lim H(ξ|A n) = H(ξ|A).<br />

n→∞<br />

Démonstration.— D’après le théorème <strong>de</strong> convergence ( <strong>de</strong>s martingales )<br />

7 E(1 Ci |A n )(·) converge µ-p.p vers E(1 Ci |A)(·) et donc φ E(1 Ci |A n )(·)<br />

(<br />

)<br />

converge µ-p.p vers φ E(1 Ci |A n )(·) . Comme la fonction φ = −t log t est<br />

continue (donc bornée) sur [0, 1] les hypothèses <strong>du</strong> théorème <strong>de</strong> convergence<br />

dominée sont vérifiées et on a<br />

∫ (<br />

) ∫ ( )<br />

lim φ E(1 Ci |A n )(·) dµ = φ E(1 Ci |A)(·) dµ.<br />

n→∞<br />

X<br />

X<br />

Puisque ξ est finie et que<br />

∫<br />

H(ξ|A)(·) =<br />

∑<br />

X<br />

C i ∈ξ<br />

( )<br />

φ E(1 Ci |A)(·) dµ<br />

on a convergence µ-p.p <strong>de</strong> H(ξ|A n )(·) vers H(ξ|A)(·). L<br />

✷<br />

✷<br />

6 si a n converge alors la moyenne (a 1 + · · · + a n )/n converge vers la même limite<br />

7 Si f est une fonction L 1 (B, µ) E(f|A n ) converge L 1 et µ-p.p vers E(f|A).


7.1. ENTROPIE MÉTRIQUE 89<br />

Distance <strong>de</strong> Rokhlin<br />

Théorème 7.1.3 Si ξ et η sont <strong>de</strong>ux partitions mesurables finies on a toujours<br />

|h µ (T , ξ) − h µ (T , η)| ≤ H (ξ|η) + H (η|ξ).<br />

Démonstration.—<br />

En effet<br />

∨<br />

n−1<br />

H(<br />

k=0<br />

n−1<br />

∨<br />

T −k ξ) ≤ H(<br />

k=0<br />

n−1<br />

∨<br />

≤ H(<br />

k=0<br />

n−1<br />

∨<br />

≤ H(<br />

k=0<br />

n−1<br />

∨<br />

≤ H(<br />

k=0<br />

n−1<br />

∨<br />

≤ H(<br />

k=0<br />

T −k ξ ∨<br />

n−1<br />

∨<br />

k=0<br />

T −k η)<br />

n−1<br />

∨<br />

T −k η) + H(<br />

k=0<br />

n−1<br />

∑<br />

T −k η) +<br />

l=0<br />

n−1<br />

n−1<br />

∨<br />

T −k ξ|<br />

k=0<br />

n−1<br />

∨<br />

H(T −l ξ|<br />

k=0<br />

∑<br />

T −k η) + H(T −l ξ|T −l η)<br />

l=0<br />

n−1<br />

∑<br />

T −k η) + H(ξ|η)<br />

l=0<br />

n−1<br />

∨<br />

≤ H( T −k η) + nH(ξ|η).<br />

k=0<br />

Diviser par n and faire tendre n → ∞ donne<br />

h(T, ξ) − h(T, η) ≤ H(ξ|η).<br />

T −k η)<br />

T −k η)<br />

L’inégalité inverse est claire.<br />

✷<br />

Définition 7.1.2 La quantité d(ξ, η) = H(ξ|η)+H(η|ξ) définit une distance<br />

appelée distance <strong>de</strong> Rokhlin. Ainsi ξ ↦→ h(T, ξ) est 1-lipschitzienne.<br />

Mentionnons un corollaire très utile <strong>du</strong> théorème précé<strong>de</strong>nt :<br />

Théorème 7.1.4 Si ξ n est une suite <strong>de</strong> partition mesurables finies croissante<br />

telle que ˆξ n ↑ B alors<br />

lim<br />

n→∞ h(T, ξ n) = h(T ).


90 CHAPITRE 7. ENTROPIE<br />

Démonstration.—<br />

Remarquons que pour n ≤ m<br />

h(T, ξ m ) ≤ h(T, ξ n ) + H(ξ m |ξ n );<br />

mais comme ξ n < ξ m on a H(ξ m |ξ n ) = 0. Ainsi la suite h(T, ξ n ) est décroissante<br />

et admet donc une limite. En outre, on a vu que H(η|ξ n ) convergeait<br />

vers H(η|B) = 0. Comme<br />

on en dé<strong>du</strong>it que pour tout η<br />

h(T, η) ≤ h(T, ξ n ) + H(η|ξ n ),<br />

h(T, η) ≤ lim<br />

n→∞<br />

h(T, ξ n ),<br />

c’est-à-dire h(T ) ≤ lim n→∞ h(T, ξ n ). L’inégalité inverse est évi<strong>de</strong>nte.<br />

Générateur, générateur fort<br />

Définition 7.1.3 Si le système dynamique (T, µ) est inversible, on dit qu’une<br />

partition est un générateur pour T (resp. générateur fort) si B coïnci<strong>de</strong> avec la<br />

tribu engendrée par ∨ ∞<br />

k=−∞ T −k ξ (resp. ∨ ∞<br />

k=0 T −k ξ). Si T n’est pas inversible<br />

seule la définition d’un générateur fort (au sens précé<strong>de</strong>nt) est pertinente.<br />

Le théorème suivant permet <strong>de</strong> calculer facilement <strong>de</strong>s entropies :<br />

Théorème 7.1.5 Si ξ est un générateur (resp. générateur fort) pour T<br />

Démonstration.—<br />

∨<br />

n−1<br />

H(<br />

k=0<br />

Ecrivons,<br />

n−1<br />

∨<br />

T −k η) ≤ H(<br />

k=0<br />

m+n−1<br />

∨<br />

≤ H(<br />

h µ (T ) = h µ (T, ξ).<br />

k=0<br />

m+n−1<br />

∨<br />

≤ H(<br />

k=0<br />

T −k η ∨<br />

m+n−1<br />

∨<br />

k=0<br />

T −k ξ)<br />

n−1<br />

∨<br />

T −k ξ) + H(<br />

k=0<br />

n−1<br />

∑<br />

T −k ξ) +<br />

m+n−1<br />

∨<br />

≤ H( T −k ξ) +<br />

k=0<br />

m+n−1<br />

∨<br />

≤ H(<br />

k=0<br />

l=0<br />

∑n−1<br />

l=0<br />

n−1<br />

l=0<br />

m+n−1<br />

∨<br />

T −k η|<br />

k=0<br />

m+n−1<br />

∨<br />

H(T −l η|<br />

k=0<br />

m+l<br />

∨<br />

H(T −l η|<br />

k=l<br />

T −k ξ)<br />

T −k ξ)<br />

T −k ξ)<br />

∑ m∨<br />

T −k ξ) + H(η| T −k ξ).<br />

k=0<br />


7.1. ENTROPIE MÉTRIQUE 91<br />

Or,<br />

lim H(η| ∨ m<br />

m→∞<br />

k=0<br />

T −k ξ) = 0<br />

puisque la tribu engendrée par ∨ m<br />

k=0 T −k ξ converge en croissant vers B. Par<br />

conséquent, si on choisit m assez grand pour que H(η| ∨ m<br />

k=0 T −k ξ) ≤ ɛ on a<br />

pour n assez grand<br />

n−1<br />

1<br />

n H( ∨<br />

T −k η) ≤ n + m<br />

n<br />

k=0<br />

Si on fait tendre n vers l’infini on obtient<br />

m+n−1<br />

1<br />

n + m H( ∨<br />

T −k ξ) + nɛ.<br />

h(T, η) ≤ h(T, ξ) + ɛ<br />

ceci pour tout ɛ et tout η. Par conséquent h(T ), qui est le sup <strong>de</strong>s h(T, η),<br />

égale h(T, ξ).<br />

Remarque :<br />

1) Si T est inversible et admet un générateur fort alors h(T ) = 0.<br />

2) Toute transformation d’entropie finie admet une partition génératrice finie<br />

qui a au plus [e h(T ) ] + 1 éléments. (Krieger).<br />

7.1.3 Exemples<br />

Entropie d’une translation sur un tore<br />

Calculons l’entropie d’une translation x ↦→ x + α sur R/Z par rapport à<br />

la mesure <strong>de</strong> Haar (qui est clairement invariante). On a déjà vu que h(T ) = 0<br />

si α est rationnel. Supposons donc α irrationnel.<br />

Première métho<strong>de</strong> : Soit ξ une partition finie en intervalles <strong>du</strong> cercle et notons<br />

A l’ensemble <strong>de</strong>s extrémités <strong>de</strong> ces intervalles. Un instant <strong>de</strong> réflexion<br />

montre que le joint ξ n := ∨ n−1<br />

k=0 T −k ξ est la partition en intervalles qui sont<br />

les composantes connexes <strong>du</strong> complémentaire <strong>de</strong> ⋃ n−1<br />

k=0 T k A dans le cercle.<br />

Ainsi, ξ n comporte au plus n#ξ atomes et donc<br />

h(T, ξ) = lim<br />

n→∞<br />

log(n#ξ)<br />

n<br />

k=0<br />

= 0.<br />

A présent, si ξ (m) est la partition en intervalles m-adiques il est clair que<br />

ξ (m) ↑ Bor et le théorème 7.1.4 permet <strong>de</strong> dire que h(T ) = 0.<br />


92 CHAPITRE 7. ENTROPIE<br />

Deuxième métho<strong>de</strong> : On peut raisonner <strong>de</strong> la façon suivante ; la partition<br />

ξ = {[0, 1/2), [1/2, 1)} est génératrice quand α est irrationnel car pour tout<br />

m, la tribu engendrée par les intervalles m-adiques est incluse dans la tribu<br />

engendrée par les atomes <strong>du</strong> joint ∨ n−1<br />

k=0 T −k ξ pour n assez grand (le sup <strong>de</strong>s<br />

diamètres <strong>de</strong>s atomes tend vers 0). Il suffit donc <strong>de</strong> démontrer que h(T, ξ) = 0<br />

ce qui s’effectue comme précé<strong>de</strong>mment. On peut aussi procé<strong>de</strong>r <strong>de</strong> la façon<br />

suivante : h(T, ξ) = lim n→∞ H(ξ| ∨ ∞<br />

k=1 T −k ξ) = 0 car le joint précé<strong>de</strong>nt engendre<br />

la tribu borélienne.<br />

On peut généraliser les résultats précé<strong>de</strong>nts aux cas <strong>de</strong>s translations sur le<br />

tore T d . (Exercice).<br />

7.1.4 Théorème <strong>de</strong> Shannon<br />

Théorème 7.1.6 (Shannon-Mc-Millan-Breiman) Si T est µ ergodique<br />

et si ξ est une partition mesurable finie<br />

n−1<br />

1<br />

lim<br />

n→∞ n I( ∨<br />

T −k ξ)(·) = h(ξ, T )<br />

k=0<br />

la convergence précé<strong>de</strong>nte ayant lieu µ-p.s et L 1 (µ).<br />

Démonstration.— Notons B n = ∨ n−1<br />

k=1 T −k ξ pour n ∈ N ∪ {∞} et B 0 =<br />

{∅, X}. On a d’après l’exercice <strong>de</strong> l’exercice suivant la proposition 7.1.1<br />

∨<br />

n−1<br />

I(<br />

et par conséquent<br />

Posons<br />

n−1<br />

I(<br />

k=0<br />

n−1<br />

∨<br />

T −k ξ) = I(ξ|<br />

k=1<br />

n−1<br />

∨<br />

T −k ξ) + I(<br />

k=1<br />

T −k ξ)<br />

n−1<br />

∨<br />

n−2<br />

∨<br />

= I(ξ| T −k ξ) + I( T −k ξ) ◦ T<br />

k=1<br />

k=0<br />

∨<br />

T −k ξ) = I(ξ|B 0 ) ◦ T n + I(ξ|B 1 ) ◦ T n−1 + · · · + I(ξ|B n ).<br />

k=0<br />

g n (·) = |I(ξ|B n )(·) − I(ξ|B ∞ (·)|,<br />

G M (·) = sup g n (·).<br />

n≥M


7.1. ENTROPIE MÉTRIQUE 93<br />

On a vu que G M (·) → 0 µ-p.p et L 1 (µ) quand M → ∞. Pour M > 0 on a<br />

n∑<br />

n∑<br />

I n (x) = (I(ξ|B k ) − I(ξ|B ∞ )) ◦ T n−k (x) + I(ξ|B ∞ ) ◦ T n−k (x)<br />

k=0<br />

M−1<br />

∑<br />

≤ g k ◦ T n−k (x) +<br />

k=0<br />

k=0<br />

n∑<br />

G M ◦ T n−k (x) +<br />

k=M<br />

M−1<br />

∑<br />

n−M<br />

∑<br />

≤ g k ◦ T n−k (x) + G M ◦ T l (x) +<br />

k=0<br />

l=0<br />

n∑<br />

I(ξ|B ∞ ) ◦ T n−k (x)<br />

k=0<br />

n∑<br />

I(ξ|B ∞ ) ◦ T l (x)<br />

D’après le théorème <strong>de</strong> Birkhoff ( µ est ergodique) on a µ-p.s<br />

1<br />

n∑<br />

∫<br />

lim I(ξ|B ∞ ) ◦ T l (x) = I(ξ|B ∞ )dµ<br />

n→∞ n<br />

l=0<br />

X<br />

l=0<br />

= h(T, ξ)<br />

tandis que<br />

n−M<br />

1 ∑<br />

∫<br />

lim G M ◦ T l (x) = G M dµ ≤ ɛ M .<br />

n→∞ n<br />

l=0<br />

X<br />

Enfin on a µ-p.p 8<br />

M−1<br />

1 ∑<br />

lim g k ◦ T n−k (x) = 0.<br />

n→∞ n<br />

Au total, pour µ-presque tout x et tout M<br />

lim sup | 1 ∫<br />

n→∞ n I(ξ)(x) − h(T, ξ)| ≤ G M dµ ≤ ɛ M .<br />

X<br />

Comme ɛ M → 0 on a bien la conclusion.<br />

k=0<br />

Remarque : Le théorème précé<strong>de</strong>nt se reformule <strong>de</strong> la façon suivante ; si<br />

on note C ξ,n (x) l’atome <strong>de</strong> la partition ∨ n−1<br />

k=0 T −k ξ qui contient x, on a pour<br />

µ-p.t x<br />

1<br />

lim<br />

n→∞ n log µ(C ξ,n(x)) = −h(T, ξ).<br />

Il est facile <strong>de</strong> voir que pour tous α, β > 0 il existe un n 0 tel que pour tout<br />

n ≥ n 0 il existe C n ∈ X tel que : 1) µ(C n ) ≥ 1 α ; 2) C n admet une partition<br />

mesurable finie dont les atomes sont <strong>de</strong> µ-mesures comprises entre e −n(h+β)<br />

et e −n(h−β) et dont le nombre d’atome est dans [e n(h−β) , e n(h+β) ].<br />

8 si h est une fonction L 1 (µ), alors h ◦ T n /n converge µ − pp vers 0 (appliquer p.ex le<br />

théorème <strong>de</strong> Birkhoff à h et h ◦ T et faire la différence <strong>de</strong>s sommes ergodiques).<br />


94 CHAPITRE 7. ENTROPIE<br />

7.1.5 Entropie d’un facteur, d’un pro<strong>du</strong>it et d’une puissance<br />

Théorème 7.1.7 Si (Y, B Y , S, ν) est un facteur <strong>de</strong> (X, B X , T, ν) on a<br />

h ν (S) ≤ h µ (T ).<br />

Démonstration.— Soit η une partition finie <strong>de</strong> Y et posons ξ = f −1 η où<br />

f : X → Y est la projection définissant le facteur. Il est facile <strong>de</strong> vérifier que<br />

et donc<br />

1<br />

n H µ(ξ ∨ . . . ∨ T −(n−1) ξ) = 1 n H ν(η ∨ . . . ∨ S −(n−1) η),<br />

h ν (S, η) = h µ (T, ξ) ≤ h µ (T ).<br />

Cette i<strong>de</strong>ntité étant vraie pour toute partition finie η on a la conclusion.<br />

Corollaire 7.1.1 Si (X, B X , T, µ) et (Y, B Y , S, ν) sont isomorphes h µ (T ) =<br />

h ν (S).<br />

Théorème 7.1.8 Si (X i , B i , µ i , T i ), i = 1, 2 sont <strong>de</strong>ux systèmes dynamiques<br />

alors le système pro<strong>du</strong>it (X 1 × X 2 , B 1 ⊗ B 2 , µ 1 ⊗ µ 2 , T 1 × T 2 ) vérifie<br />

h µ1 ⊗µ 2<br />

(T 1 × T 2 ) = h µ1 (T 1 ) + h µ2 (T 2 ).<br />

Démonstration.— Soient ξ (i) = {C (i)<br />

k } une partition mesurable finie <strong>de</strong> X i,<br />

i = 1, 2. Il est facile <strong>de</strong> voir que la partition ξ := ξ (1) ⊗ ξ (2) = {C (1)<br />

k<br />

× C (2)<br />

l<br />

}<br />

vérifie<br />

∨<br />

n−1<br />

∨<br />

n−1<br />

∨<br />

T −s ξ) = H( T −s ξ (1) ) + H( T −s ξ (2) ),<br />

n−1<br />

H(<br />

s=0<br />

et que par conséquent<br />

s=0<br />

s=0<br />

h(T 1 × T 2 , ξ (1) ⊗ ξ (2) ) = h(T 1 , ξ (1) ) + h(T 2 , ξ (2) ).<br />

Si à présent on choisit <strong>de</strong>ux suites <strong>de</strong> partitions ξ n<br />

(i) ↑ B i (ce qui est possible<br />

car on suppose que les espaces sont <strong>de</strong> Lebesgue) on aura aussi ξ n (1) ⊗ ξ n<br />

(2) ↑<br />

B 1 ⊗ B 2 . Le théorème 7.1.4 permet <strong>de</strong> conclure.<br />

Théorème 7.1.9 Pour m ∈ Z (m ∈ N si T n’est pas inversible) on a<br />

h µ (T m ) = |m|h µ (T ).<br />

✷<br />


7.1. ENTROPIE MÉTRIQUE 95<br />

Démonstration.— Supposons m > 0. Soit ξ une partition mesurable finie<br />

et posons η m = ξ ∨ T −1 ξ ∨ · · · ∨ T m−1 ξ. On a<br />

∨<br />

nm−1<br />

H(<br />

k=0<br />

n−1<br />

∨<br />

T −k ξ) = H(<br />

l=0<br />

et divisant par n|m| et faisant n → ∞ on obtient<br />

(T m ) −l η m )<br />

h(T, ξ) = 1mh(T m , η m ).<br />

On a donc |m|h(T, ξ) ≤ h(T m ) et donc |m|h(T ) ≤ h(T m ). Démontrons l’inégalité<br />

inverse. Pour toute partition ξ<br />

h(T m , ξ) = lim<br />

n H(ξ ∨ T −m ξ ∨ · · · ∨ T −mn ξ)<br />

m<br />

≤ lim<br />

n→∞ mn H(ξ ∨ T −1 ∨ T −2 ξ · · · ∨ T −mn ξ)<br />

≤ mh(T, ξ),<br />

n→∞<br />

1<br />

ce qui termine la preuve <strong>du</strong> théorème.<br />


96 CHAPITRE 7. ENTROPIE


Annexe A<br />

Calcul différentiel<br />

A.1 Théorèmes <strong>du</strong> Point Fixe<br />

Nous faisons auparavant quelques rappels sur <strong>de</strong>s théorèmes abstraits<br />

classiques.<br />

A.1.1<br />

Théorème <strong>du</strong> Point Fixe pour les applications<br />

contractantes<br />

Soit (A, d) un espace complet (c’est-à-dire un espace métrique dans lequel<br />

toute suite <strong>de</strong> Cauchy converge) . Nous disons que φ : A → A est<br />

ρ-contractante (0 ≤ ρ < 1) si pour tout x, y ∈ A,<br />

d(φ(x), φ(y)) ≤ ρ.d(x, y).<br />

Une application contractante est donc continue. Dans les applications que<br />

nous aurons à traiter A sera un ensemble fermé d’un espace <strong>de</strong> Banach E et<br />

on munira A <strong>de</strong> la distance,<br />

d(x, y) = ‖x − y‖ E ;<br />

une application ρ-contractante φ : A → A vérifie alors,<br />

‖φ(x) − φ(y)‖ E ≤ ρ.‖x − y‖ E ,<br />

(mais φ n’est pas nécessairement linéaire).<br />

Le théorème <strong>du</strong> Point Fixe <strong>de</strong> Picard est alors le suivant :<br />

Théorème A.1.1 (<strong>du</strong> point fixe <strong>de</strong> Picard) Avec les notations précé<strong>de</strong>ntes,<br />

soit φ : A → A une application ρ-contractante (0 ≤ ρ < 1). Alors φ admet<br />

un unique point fixe x ∈ A (i.e. φ(x) = x). Pour tout x 0 ∈ A la suite φ i (x 0 )<br />

converge vers x.<br />

97


98 ANNEXE A. CALCUL DIFFÉRENTIEL<br />

Démonstration.— Montrons déjà l’unicité par l’absur<strong>de</strong> : si φ(x 1 ) = x 1 , φ(x 2 ) =<br />

x 2 on a,<br />

d(x 1 , x 2 ) = d(φ(x 1 ), φ(x 2 )) ≤ ρd(x 1 , x 2 ),<br />

ce qui entraîne vu que 0 ≤ ρ < 1, d(x 1 , x 2 ) = 0.<br />

Montrons à présent l’existence. Choisissons x 0 ∈ A et posons x k = φ k (x)<br />

(où φ k désigne l’itéré k-ième <strong>de</strong> φ). Le fait que φ soit ρ-contractante montre<br />

que pour k ≥ 1,<br />

d(x k+1 , x k ) = d(φ(x k ), φ(x k−1 )) ≤ ρd(x k , x k−1 ),<br />

et par conséquent, en itérant cette inégalité,<br />

d(x k+1 , x k ) ≤ ρ k d(x 1 , x 0 ).<br />

L’inégalité triangulaire assure donc que pour tout p ≥ 1,<br />

d(x k+p , x k )<br />

≤<br />

≤ (<br />

≤<br />

p∑<br />

d(x k+j , x k+j−1 )<br />

j=1<br />

p∑<br />

ρ k+j )d(x 1 , x 0 )<br />

j=1<br />

ρ k . 1 − ρp<br />

1 − ρ d(x 1, x 0 )<br />

≤ ρ k d(x 1, x 0 )<br />

1 − ρ ,<br />

ce qui montre que la suite (x k ) est <strong>de</strong> Cauchy et converge donc vers un<br />

point x ∈ A. En faisant k → ∞ dans l’i<strong>de</strong>ntité φ(x k ) = x k+1 on obtient<br />

φ(x) = x, c’est-à-dire l’existence <strong>du</strong> point fixe et également la <strong>de</strong>rnière partie<br />

<strong>du</strong> théorème.<br />

Mentionnons une version à paramètre :<br />

Théorème A.1.2 Soient A un espace complet, L un espace métrique (non<br />

nécessairement complet) et 0 ≤ ρ < 1. Supposons que φ : A × L → A soit<br />

une application continue et que pour tout λ ∈ L l’application φ(·, λ) : A → A<br />

soit ρ-contractante. Alors, pour tout λ ∈ L il existe un unique point fixe x(λ)<br />

<strong>de</strong> φ(·, λ) et l’application x(·) : L → A est continue.<br />

Démonstration.— Définissons E comme étant l’ensemble <strong>de</strong>s fonctions continues<br />

<strong>de</strong> L dans A et munissons le <strong>de</strong> la norme <strong>de</strong> la convergence uniforme :<br />


A.1. THÉORÈMES DU POINT FIXE 99<br />

c’est un espace complet. Définissons alors f : E → E, par f(x(·)) = φ(x(·), ·) :<br />

c’est une application ρ-contractante (c’est pratiquement immédiat, vue la définition<br />

<strong>de</strong> la convergence uniforme). Le théorème s’applique donc et fournit<br />

une unique application x(.) telle que f(x(·)) = x(·) c’est-à-dire, <strong>du</strong> fait <strong>de</strong> la<br />

définition <strong>de</strong> f la conclusion recherchée.<br />

Donnons enfin l’estimée suivante qui précise le théorème précé<strong>de</strong>nt :<br />

Proposition A.1.1 Si φ et ˜φ sont <strong>de</strong>ux applications ρ contractante <strong>de</strong> (A, d) →<br />

(A, d) admettant respectivement comme uniques points fixes x et ˜x on a,<br />

Démonstration.—<br />

d(x, ˜x) ≤ 1 d(φ(x), ˜φ(x)).<br />

1 − ρ<br />

Définissons ˜x n = ˜φ n (x) et majorons,<br />

d(x, ˜x n+1 ) = d(φ(x), ˜φ(˜x n ))<br />

≤ d(φ(x), ˜φ(x)) + d( ˜φ(x), ˜φ(˜x n ))<br />

≤ ɛ + ρd(x, ˜x n ),<br />

où on a noté ɛ = d(x, ˜φ(x)) = d(φ(x), ˜φ(x)). Si on note u n = d(x, ˜x n ), on a<br />

donc,<br />

ce qui est la conclusion.<br />

u n ≤ ɛ + ρɛ + ρ 2 ɛ + · · · + ρ n−1 ɛ<br />

ɛ<br />

≤<br />

1 − ρ ,<br />

Si l’on veut obtenir <strong>de</strong>s résultats sur la dépendance C k par rapport au<br />

paramètre, il faut faire <strong>de</strong>s hypothèses <strong>de</strong> différentiabilité sur φ. Cependant<br />

dans ce cadre il est souvent plus simple d’utiliser le théorème <strong>de</strong>s fonctions<br />

implicites que nous présentons plus loin.<br />

Théorème A.1.3 Soient A ⊂ E et L ⊂ F <strong>de</strong>s ouverts <strong>de</strong>s espace <strong>de</strong> Banach<br />

E et F et 0 ≤ ρ < 1. Supposons que φ : A × L → A soit <strong>de</strong> classe C k et que<br />

pour tout λ ∈ L l’application φ(·, λ) : A → A soit ρ-contractante. Si en outre<br />

κ :=<br />

sup ‖D 1 φ(x, λ)‖ < 1,<br />

(x,λ)∈A×L<br />

alors, pour tout λ ∈ L il existe un unique point fixe x(λ) <strong>de</strong> φ(·, λ) et l’application<br />

x(·) : L → A est C k . On a<br />

Dx(λ) = −(D 1 φ(x(λ), λ) − I) −1 D 2 φ(x(λ), λ).<br />

✷<br />


100 ANNEXE A. CALCUL DIFFÉRENTIEL<br />

Démonstration.— Soit x 0 ∈ A et définissons par récurrence x 0 (λ) = x 0 et<br />

x n+1 (λ) = φ(x n (λ), λ). Les fonctions x n (λ) sont <strong>de</strong> classe C k et on a<br />

Dx n+1 (λ) = D 1 φ(x n (λ), λ)Dx n (λ) + D 2 φ(x n (λ), λ).<br />

Si on note u n = Dx n (λ), A n = D 1 φ(x n (λ), λ), b n = D 2 φ(x n (λ), λ), b =<br />

D 2 φ(x(λ), λ) On a u n+1 = A n u n + b n si bien que<br />

∑n−1<br />

u n = (A n−1 · · · A 1 )u 0 + (A n−1 · · · A k )b k + b n .<br />

k=1<br />

Comme ‖A n−1 · · · A k ‖ ≤ κ n , κ < 1, et puisque lim n→∞ ‖b n − b‖ = 0 (on a<br />

vu que x n (λ) converge vers x(λ)), la série précé<strong>de</strong>nte converge (Exercice :<br />

Pourquoi ). Ainsi Dx n (λ) converge au même titre que x n (λ). Par conséquent,<br />

λ ↦→ lim n→∞ x(λ) est dérivable. La convergence est en fait uniforme en λ<br />

d’après la proposition précé<strong>de</strong>nte et <strong>de</strong> ce fait x(·) est C 1 . Comme x(λ) =<br />

φ(x(λ), λ) on a Dx(λ) = −(D 1 φ(x(λ), λ) − I) −1 D 2 φ(x(λ), λ). Cette relation<br />

montre que x(·) est C k si φ l’est.<br />

A.2 Le théorème d’Inversion Locale et ses conséquences<br />

A.2.1<br />

Difféomorphismes<br />

Rappelons qu’un homéomorphisme f : U → V entre <strong>de</strong>ux ouverts U ⊂ E<br />

et V ⊂ F est une application continue <strong>de</strong> U dans F qui établit une bijection<br />

entre U et V et telle que son inverse f −1 : V → U est continue.<br />

Définition A.2.1 Nous dirons qu’un homéomorphisme f : U → V entre<br />

<strong>de</strong>ux ouverts U ⊂ E et V ⊂ F est un C k -difféomorphisme si f : U → V et<br />

f −1 : V → U sont <strong>de</strong> classe C k .<br />

Donnons le critère suivant pour déterminer si un homéomorphisme est un<br />

difféomorphisme :<br />

Proposition A.2.1 Avec les notations précé<strong>de</strong>ntes un homéomorphisme f :<br />

U → V est un C k -difféomorphisme si et seulement si f est <strong>de</strong> classe C k et<br />

si pour tout x ∈ U, Df(x) ∈ L c (E, F ) est une application linéaire continue<br />

inversible (dont l’inverse est continu). On a alors,<br />

∀y ∈ V, Df −1 (y) = [Df(f −1 (y))].<br />


A.2. LE THÉORÈME D’INVERSION LOCALE ET SES CONSÉQUENCES101<br />

Démonstration.— Posons pour y = f(x) ∈ V , et h ∈ F suffisamment petit,<br />

x h = f −1 (y + h). On a alors,<br />

h = f(x h ) − f(x) = Df(x).h.(x h − x) + ‖x h − x‖ E ɛ(x h − x),<br />

où lim 0 ɛ = 0 et donc,<br />

‖x h − x‖ = (Df(x)) −1 .h + ‖x h − x‖(Df(x)) −1 .ɛ(x h − x);<br />

(A.1)<br />

comme x h tend vers x quand h tend vers 0 (puisque f −1 est continue) on a<br />

pour h suffisamment petit<br />

et donc,<br />

Au total,<br />

‖ɛ(x h − x)‖ ≤ 1 2 ‖(Df(x))−1 ‖ −1 ,<br />

‖x h − x‖ ≤ ‖(Df(x)) −1 ‖.‖h‖ + ‖x h − x‖‖(Df(x)) −1 ‖‖ɛ(x h − x)‖<br />

et l’égalité (A.1) montre que,<br />

≤ ‖(Df(x)) −1 ‖.‖h‖ + 1 2 ‖x h − x‖.<br />

‖x h − x‖ ≤ 2‖(Df(x)) −1 ‖.‖h‖,<br />

f −1 (y + h) − f −1 (y) = x h − x = (Df(x)) −1 .h + o(h),<br />

ce qui montre que f −1 est dérivable en y et que,<br />

Df −1 (y) = (Df(x)) −1 = [Df ◦ f −1 (y))] −1 .<br />

Cette <strong>de</strong>rnière égalité établit (en utilisant le théorème <strong>de</strong> composition et celui<br />

sur l’inversion) que f −1 est <strong>de</strong> classe C k .<br />

A.2.2<br />

Inversion locale<br />

Le théorème <strong>du</strong> point fixe précé<strong>de</strong>nt permet <strong>de</strong> démontrer le théorème<br />

fondamental suivant :<br />

Théorème A.2.1 (d’inversion locale) Soient E, F <strong>de</strong>ux espaces <strong>de</strong> Banach,<br />

f : E → F une application <strong>de</strong> classe C k (k ≥ 1) définie sur un<br />

voisinage <strong>de</strong> x 0 ∈ E <strong>de</strong> l’espace <strong>de</strong> Banach E et telle que f(x 0 ) = y 0 ∈ F .<br />

Supposons que Df(x 0 ) ∈ L(E, F ) soit inversible (et son inverse est donc<br />

continu) ; alors f est un difféomorphisme local d’un voisinage <strong>de</strong> x 0 sur un<br />

voisinage <strong>de</strong> y 0 .<br />


102 ANNEXE A. CALCUL DIFFÉRENTIEL<br />

Démonstration.— Puisque [Df(x 0 )] −1 existe est continu, f réalisera un<br />

difféomorphisme d’un voisinage <strong>de</strong> x 0 sur un voisinage <strong>de</strong> y 0 si et seulement<br />

si,<br />

f 0 (·) = Df(0) −1 .(f(x 0 + ·) − y 0 ),<br />

réalise un difféomorphisme d’un voisinage <strong>de</strong> 0 ∈ E sur un voisinage <strong>de</strong><br />

0 ∈ E. Remarquons que f 0 est <strong>de</strong> classe C 1 et que l’on a,<br />

f(0) = 0<br />

Df 0 (0) = Id<br />

Posons alors pour u, v dans un voisinage <strong>de</strong> 0 ∈ E,<br />

˜f v (u) = v + (u − f 0 (u)),<br />

et observons que, f 0 (u) = v si et seulement si ˜fv (u) = u, c’est-à-dire si et<br />

seulement si f v admet u pour point fixe. Vérifions donc si f v est contractante<br />

dans un voisinage <strong>de</strong> 0 pour v suffisamment petit. Soient δ > 0 suffisamment<br />

petit et u 1 , u 2 dans la boule fermée B f (0, δ) <strong>de</strong> centre 0 et <strong>de</strong> rayon δ :<br />

‖ ˜f(u 1 ) − ˜f(u 2 )‖ = ‖(Id − f 0 )(u 1 ) − (Id − f 0 )(u 1 )‖,<br />

et d’après le théorème <strong>de</strong>s accroissements finis,<br />

‖(Id − f 0 )(u 1 ) − (Id − f 0 )(u 1 )‖ ≤<br />

sup ‖D(Id − f 0 )‖.‖u 1 − u 2 ‖;<br />

w∈B(0,δ)<br />

mais comme Df 0 (·) est continue sur un voisinage <strong>de</strong> 0 et que Df 0 (0) = Id<br />

on a, pourvu que δ soit assez petit,<br />

sup ‖D(Id − f 0 )(w)‖ ≤ 1<br />

w∈B f (0,δ)<br />

2 ,<br />

et l’application ˜f v est 1 2 -contractante sur B f(0, δ). On a en particulier (faire<br />

u 2 = 0),<br />

‖ ˜f(u 1 ) − v‖ ≤ 1 2 ‖u 1‖,<br />

et donc,<br />

‖ ˜f(u 1 )‖ ≤ ‖v‖ + 1 2 δ,<br />

ce qui prouve que si ‖v‖ ≤ δ/2, ˜f v envoit B f (0, δ) dans elle-même. Les conditions<br />

d’application <strong>du</strong> théorème <strong>du</strong> point fixe sont vérifiées et ˜f v admet donc<br />

un unique point fixe u v dans B f (0, δ).


A.2. LE THÉORÈME D’INVERSION LOCALE ET SES CONSÉQUENCES103<br />

En outre comme ˜f v (·) est continue en v, les hypothèses <strong>du</strong> théorème <strong>du</strong><br />

point fixe à paramètre sont vérifiées et on en dé<strong>du</strong>it que l’unique point fixe<br />

u v obtenu précé<strong>de</strong>mment dépend continument <strong>de</strong> v.<br />

Tout ceci montre que f réalise un homéomorphisme d’un voisinage <strong>de</strong><br />

x 0 sur un voisinage <strong>de</strong> y 0 et d’après la proposition A.2.1, f est donc un C k<br />

difféomorphisme d’un voisinage <strong>de</strong> x 0 sur un voisinage <strong>de</strong> y 0 .<br />

Nous illustrons la puissance <strong>du</strong> théorème d’inversion locale par la démonstration<br />

<strong>du</strong> théorème suivant : (Lemme <strong>de</strong> Morse) Si f : (R n , 0) → R est <strong>de</strong><br />

classe C 3 et est telle que A = D 2 f(0) est non dégénérée (i.e la forme quadratique<br />

D 2 f(0)(·, ·) est non dégénérée) alors il existe un difféomorphisme<br />

h : (R n , 0) → (R n , 0) tel que f ◦ h(x) = t xAx. Nous proposons la démonstration<br />

en exercice.<br />

Exercice a) Démontrer qu’il existe une application S <strong>de</strong> classe C 1 définie sur<br />

un voisinage <strong>de</strong> 0 ∈ R n et à valeurs dans l’espace <strong>de</strong>s matrices symétriques<br />

Sym n (R) telle que f(x) = t xAx + t xS(x)x avec S(0) = 0. (Utiliser Taylor<br />

intégral).<br />

b) Démontrer qu’il suffit <strong>de</strong> démontrer le résultat suivant : Soit A ∈ M n (R)<br />

une matrice symétrique non dégénérée et B ∈ R n la boule <strong>de</strong> centre 0 et<br />

<strong>de</strong> rayon 1. Il existe ε > 0 tel que si S ∈ C 1 (B, Sym n (R)) est <strong>de</strong> norme C 1<br />

plus petite que ε alors il existe ϕ ∈ C 1 (B, R n ) telle que t xAx + t xS(x)x =<br />

t (x + ϕ(x))A(x + ϕ(x)).<br />

c) On note E l’espace <strong>de</strong> Banach <strong>de</strong>s ϕ ∈ C 1 (B, R n ) telles que ϕ(0) = 0 et F<br />

l’espace <strong>de</strong> Banach <strong>de</strong>s S ∈ C 1 (B, Sym n (R)) telle que S(0) = 0. Intro<strong>du</strong>isons<br />

Φ : E → F , Φ(h)(x) = 2 t h(x)Ax + t h(x)Ah(x). Démontrer que Φ est un<br />

difféomorphisme local <strong>de</strong> (E, 0) → (F, 0).<br />

d) Conclure.<br />

Le corollaire suivant est également très utile :<br />

A.2.3<br />

Fonctions Implicites<br />

Théorème A.2.2 (<strong>de</strong>s fonctions implicites) Si f : E × F → E est C k ,<br />

vérifie f(x 0 , λ 0 ) = 0 et si D x f(x 0 , λ 0 ) ∈ L c (E, E) est inversible, alors l’ensemble<br />

<strong>de</strong>s solutions <strong>de</strong> f(x, λ) = 0 est dans un voisinage <strong>de</strong> (x 0 , λ 0 ) <strong>de</strong> la<br />

forme, (x(λ), λ) où λ → x(λ) est C k . On a alors ∂ λ x = −(D x f(x, λ)) −1 ◦D λ f.<br />

Démonstration.— On applique le théorème précé<strong>de</strong>nt à l’application définie<br />

sur un voisinage <strong>de</strong> (x 0 , λ 0 ) ∈ E × F à valeurs dans un voisinage <strong>de</strong><br />

(0, λ 0 ) i nE × F par φ(x, λ) = (f(x, λ), λ) qui est <strong>de</strong> classe C k . Calculons son<br />


104 ANNEXE A. CALCUL DIFFÉRENTIEL<br />

application linéaire tangente Dφ(x 0 , λ 0 ) ∈ L c (E × F, E × F ) en (x 0 , λ 0 ). On<br />

a pour tout (∆x, ∆λ) ∈ E × F (nous utilisons une notation matricielle) :<br />

( ) ( )<br />

Dx f(x<br />

Dφ(x 0 , λ 0 ).(∆x, ∆λ) =<br />

0 , λ 0 ) D λ f(x 0 , λ 0 ) ∆x<br />

,<br />

0 Id F ∆λ<br />

qui a une forme trigonale et qui est inversible puisque par hypothèse D x f(x 0 , λ 0 ) ∈<br />

L c (E, E) l’est. On peut donc appliquer le théorème d’inversion locale : φ<br />

réalise un difféomorphisme <strong>de</strong> classe C k d’un voisinage <strong>de</strong> (x 0 , λ 0 ) dans un<br />

voisinage <strong>de</strong> (0, λ 0 ) et vue la forme <strong>de</strong> φ, le difféomorphisme inverse φ −1 est<br />

<strong>de</strong> la forme,<br />

φ −1 (y, λ) = (g(y, λ), λ),<br />

où g est <strong>de</strong> classe C k d’un voisinage <strong>de</strong> 0 à valeurs dans un voisinage <strong>de</strong> x 0 .<br />

On a donc,<br />

(x, λ) = (g(f(x, λ), λ), λ),<br />

pour tout (x, λ) dans un voisinage <strong>de</strong> (x 0 , λ 0 ) et par conséquent pour (x, λ)<br />

dans ce voisinage f(x, λ) = 0 si et seulement si,<br />

x = g(0, λ).<br />

Ceci termine la preuve <strong>du</strong> théorème <strong>de</strong>s fonctions implicites.<br />

✷<br />

A.2.4<br />

Théorème <strong>du</strong> rang constant<br />

Théorème A.2.3 Soient E un espace <strong>de</strong> Banach, F un espace <strong>de</strong> dimension<br />

finie m et x 0 ∈ E. Si f : (E, x 0 ) → (F, f(x 0 )) est une application <strong>de</strong> classe<br />

C k telle que pour tout x dans un voisinage <strong>de</strong> x 0 le rang <strong>de</strong> Df(x) (c’està-dire<br />

la dimension <strong>de</strong> ImDf(x)) est constant égal à p, alors, il existe <strong>de</strong>s<br />

difféomorphismes g : (R p ⊕ E ′ , 0) → (E, x 0 ) (E ′ étant un espace <strong>de</strong> Banach)<br />

et h : (F, f(x 0 )) → (R m , 0) tels que pour (t, s) ∈ R p ⊕ E ′<br />

h ◦ f ◦ g(t, s) = (t, 0 R m−p).<br />

Démonstration.— On peut supposer que F = R m et que x 0 = 0. Soit<br />

E ′ = ker Df(x 0 ). Puisque rgDf(x 0 ) est fini, il existe E ′′ ⊂ E <strong>de</strong> dimension<br />

finie égale à p tel que E = E ′ ⊕ E ′′ et tel que Df(x 0 ) restreinte à E ′′ soit<br />

un isomorphisme sur son image. Quitte à faire <strong>de</strong>s changements linéaires<br />

<strong>de</strong> coordonnées à la source et au but, on peut supposer que E ′′ = R p et<br />

Df(x 0 )·E = R p . Si on note f 1 , f 2 les projections <strong>de</strong> f respectivement sur R p ⊂<br />

F et sur son supplémentaire dans F on a que ∂ 1 f 1 (0, 0) est un isomorphisme


A.3. SOUS-VARIÉTÉS DE R M 105<br />

<strong>de</strong> E ′′ = R p sur R p ⊂ F . D’après le théorème d’inversion locale l’application<br />

ϕ : (u 1 , u 2 ) ↦→ (f 1 (u 1 , u 2 ), u 2 ) est donc un difféomorphisme local en (0, 0). Son<br />

inverse g est <strong>de</strong> la forme g : (t, u 2 ) ↦→ (u 1 (t, u 2 ), u 2 ) si bien que f 1 ◦g(t, u 2 ) = t.<br />

L’application f ◦ g est donc <strong>de</strong> la forme (t, u 2 ) ↦→ (t, f 2 ◦ g(t, u 2 )) et comme<br />

elle est <strong>de</strong> rang égal à p 1 pour tout (t, u 2 ) dans un voisinage <strong>de</strong> 0 on a<br />

nécessairement ∂ 2 (f 2 ◦ g)(t, u 2 ) = 0 2 pour tout (t, u 2 ) dans un voisinage <strong>de</strong> 0.<br />

Par conséquent f 2 ◦ g(t, u 2 ) ne dépend que <strong>de</strong> t. Si on pose ψ(t) = f 2 ◦ g(t, 0)<br />

alors l’application h : (t, u 2 ) ↦→ (t, u 2 − ψ(t)) est un difféomorphisme local et<br />

on a h ◦ f ◦ g(t, s) = (t, 0).<br />

✷<br />

A.3 Sous-variétés <strong>de</strong> R m<br />

A.3.1<br />

Définition, exemples<br />

Définition A.3.1 Soit M ⊂ R m . On dit que M est une sous-variété <strong>de</strong> R m<br />

<strong>de</strong> classe C k si pour tout x ∈ M il existe un entier p ≤ m, un voisinage<br />

ouvert U x ⊂ R m contenant x et un difféomorphisme <strong>de</strong> classe C k ϕ : U x →<br />

ϕ(U x ) ⊂ R m tel que l’image <strong>de</strong> M ∩ U x soit R p ⊕ {0} m−p . On dira que (U x , ϕ)<br />

est une carte en x.<br />

Il n’est pas difficile <strong>de</strong> voir que si M est connexe, l’entier p <strong>de</strong> la définition<br />

précé<strong>de</strong>nte ne dépend pas <strong>du</strong> point x ; on l’appelle la dimension <strong>de</strong> M et on<br />

note p = dimM.<br />

Exemple Soient H : R m → R une application lisse (C ∞ ) et c ∈ H(R m ) ⊂ R.<br />

Si pour tout x ∈ H −1 (c) on a DH(x) (qui est une forme linéaire sur R m )<br />

est non nulle, alors H −1 (c) est une sous-variété <strong>de</strong> dimension m − 1. C’est<br />

une conséquence <strong>du</strong> théorème d’inversion locale (par exemple). Exercice<br />

Démontrer le résultat précé<strong>de</strong>nt.<br />

La proposition suivante est un outil utile pour démontrer qu’un ensemble<br />

est une sous-variété.<br />

Proposition A.3.1 Les propositions suivantes sont équivalentes :<br />

(1) M est une sous-variété <strong>de</strong> R m <strong>de</strong> dimension p<br />

(2) M s’écrit localement comme un graphe : pour tout x ∈ M il existe un<br />

voisinage ouvert U x <strong>de</strong> x dans R m , une décomposition en sous-espaces<br />

1 D(f ◦ g) = Df ◦ g · Dg, Dg est un isomorphisme et Df ( <strong>de</strong> rang p )<br />

2 Ip 0<br />

la matrice bloc représentant D(f ◦ g) est <strong>de</strong> la forme<br />

∗ ∂ 2 (f 2 ◦ g)


106 ANNEXE A. CALCUL DIFFÉRENTIEL<br />

vectoriels R m = F 1 ⊕ F 2 , avec p := dim F 1 (dim F 2 = m − p) et une<br />

fonction S <strong>de</strong> classe C k S : F 1 ∩ U x → F 2 telle que M ∩ U x soit le<br />

graphe <strong>de</strong> S : S = {x 1 ⊕ x 2 ∈ U x , x 1 ∈ F 1 , x 2 ∈ F 2 : x 2 = S(x 1 )}<br />

(3) pour tout x ∈ M il existe un voisinage ouvert U x <strong>de</strong> x et <strong>de</strong>s fonctions<br />

<strong>de</strong> classe C k ϕ 1 , . . . , ϕ m−p définies sur U x et à valeurs réelles telles<br />

que : (a) M ∩ U x coïnci<strong>de</strong> avec l’ensemble <strong>de</strong>s x ∈ U x tels que ϕ 1 (x) =<br />

· · · = ϕ m−p (x) = 0 et (b) les formes linéaires dϕ 1 (x), . . . , dϕ m−p (x)<br />

sont linéairement indépendantes.<br />

Exercice Soit E, F <strong>de</strong>ux espaces vectoriels <strong>de</strong> dimensions finies et r ≤<br />

(dim E, dim F ). Démontrer que l’ensemble L r (E, F ) <strong>de</strong>s endomorphismes<br />

A ∈ L(E, F ) <strong>de</strong> rang r est une sous-variété <strong>de</strong> dimension (dim E −r)(dim F −<br />

r). [Indication : Soit Z 0 <strong>de</strong> rang r. On peut ( supposer, ) quitte à changer <strong>de</strong><br />

Ir 0<br />

base que A 0 est représenté par la matrice . Notons U l’ensemble <strong>de</strong>s<br />

0 0<br />

( ) A B<br />

Z ∈ L(E, F ) qui se représentent dans cette base sous la forme<br />

C D<br />

(A matrice r × r) avec <strong>de</strong>t A ≠ 0. C’est un voisinage ouvert <strong>de</strong> Z 0 . On a<br />

L r (E, F ) ∩ U = {Z : D = CA −1 B}]<br />

A.3.2<br />

Espace tangent<br />

Définition A.3.2 (Proposition et définition) Soient M une sous-variété<br />

<strong>de</strong> R m et x ∈ M. L’espace tangent T x M en x à M est le sous-espace vectoriel<br />

<strong>de</strong> R m qui a la propriété suivante : pour toute carte (resp. une carte) (U x , ϕ)<br />

en x, T x M := ImD(ϕ −1 )(x) · (R p ⊕ {0} m−p ).<br />

Exercice : Décrire localement l’espace tangent <strong>de</strong> T x M dans chacune <strong>de</strong>s<br />

représentations données par la proposition A.3.1.<br />

Exercice : Démontrer que l’espace tangent en v ∈ L r (E, F ) est l’espace<br />

vectoriel {w ∈ L(E, F ) : w(ker v) ⊂ Imv}.<br />

Définition A.3.3 (Proposition et définition) Soient M ⊂ R m et N ⊂<br />

R n <strong>de</strong>ux sous-variétés et f : M → N. On dit que f est <strong>de</strong> classe C k si pour<br />

tout x ∈ M et tout choix (resp. un choix) <strong>de</strong> cartes (U x , ϕ) et (V f(x) , ψ) en<br />

x ∈ M et f(x) ∈ N l’application f ϕ,ψ := ψ ◦ f ◦ ϕ −1 | R p ⊕{0} n−p est <strong>de</strong> classe<br />

C k . L’application linéaire, indépendante <strong>du</strong> choix <strong>de</strong>s cartes,<br />

Dψ −1 (ψ(f(x))) ◦ Df ϕ,ψ (ϕ(x)) ◦ Dϕ : T x M → T f(x) N<br />

est appelée application linéaire tangente <strong>de</strong> f en x.


A.3. SOUS-VARIÉTÉS DE R M 107<br />

A.3.3<br />

Groupes et algèbres <strong>de</strong> Lie linéaires<br />

Définition A.3.4 Un groupe <strong>de</strong> Lie linéaire est un sous-groupe fermé <strong>de</strong><br />

GL(n, R).<br />

Exemples : Il est facile <strong>de</strong> vérifier que les groupes suivants sont <strong>de</strong>s groupes<br />

<strong>de</strong> Lie :<br />

SL(n, R) = {A ∈ GL(n, R) : <strong>de</strong>t A = 1}<br />

SO(n, R) = {A ∈ GL(n, R) : t AA = I, <strong>de</strong>t A = 1}<br />

( ) 0<br />

Sp(2n, R) = {A ∈ GL(n, R) : t In<br />

AJA = J}, J =<br />

−I n 0<br />

Remarquons que le SL(n, R) est l’ensemble <strong>de</strong>s transformations linéaires qui<br />

préservent le volume <strong>de</strong> R n , SO(n, R) est l’ensemble <strong>de</strong>s transformations<br />

linéaires qui préservent l’orientation et la norme euclidienne sur R n q(v) = t vv<br />

(v est un vecteur colonne) et Sp(2n, R) est l’ensemble <strong>de</strong>s transformations<br />

linéaires <strong>de</strong> R 2n qui préservent la forme symplectique ω(v, w) = t vJw.<br />

On a alors le théorème non trivial suivant :<br />

Théorème A.3.1 Un groupe <strong>de</strong> Lie linéaire est une sous-variété <strong>de</strong> R n2 .<br />

Exercice Démontrer directement que les groupes SL(n, R), SO(n, R), Sp(2n, R)<br />

sont <strong>de</strong>s sous-variétés, calculer leurs dimensions et démontrer que<br />

T I SL(n, R) = {a ∈ M n (R) : Tr(a) = 0}<br />

T I SO(n, R) = {a ∈ M n (R) : t a + a = 0}<br />

T I Sp(2n, R) = {a ∈ M 2n (R) : t aJ + Ja = 0}.<br />

A.3.4<br />

Variétés<br />

Soit M une espace topologique. Etant donnés U un ouvert <strong>de</strong> M et ϕ :<br />

U → ϕ(U) ⊂ R n un homéomorphisme, on dit que (U, ϕ) est une carte locale.<br />

Définition A.3.5 Une variété <strong>de</strong> classe C k est un espace topologique M<br />

muni d’une famille A <strong>de</strong> cartes telle que : (a) les U (pour lesquels (U, ϕ) ∈ A)<br />

forment un recouvrement <strong>de</strong> M ; (b) pour toutes cartes (U, ϕ) et (V, ψ) <strong>de</strong> A<br />

l’application ϕ ◦ ψ −1 : ϕ(U) ∩ ψ(V ) → R n est un difféomorphisme local.


108 ANNEXE A. CALCUL DIFFÉRENTIEL<br />

Il est facile <strong>de</strong> voir que toute sous-variété <strong>de</strong> R m est une variété. En fait la<br />

réciproque est vraie : toute variété peut être vue (on dit plongée) comme une<br />

sous-variété d’un espace R p pourvu que p soit suffisamment grand (p ≥ 2n+1<br />

dans le cas <strong>de</strong>s variétés C ∞ ) ; c’est un théorème <strong>de</strong> Whitney.<br />

Exemples Le groupe (Z n , +) est un sous-groupe <strong>de</strong> (R n , +). Le quotient<br />

R n /Z n est par définition l’ensemble <strong>de</strong>s classes d’équivalence <strong>de</strong> la relation<br />

d’équivalence x ≡ y ssi x − y ∈ Z n , c’est-à-dire est l’ensemble R n /Z n =<br />

{x + Z n , x ∈ R n }. On note T n = R n /Z n , le tore <strong>de</strong> dimension n. C’est par<br />

construction un groupe abélien (x + Z n ) + (y + Z n ) = (x + y) + Z n . On peut<br />

canoniquement le munir d’une topologie <strong>de</strong> la façon suivante : un ouvert <strong>de</strong><br />

T n est un ensemble <strong>de</strong> la forme U + Z n = {u + Z n , u ∈ U} = {U + k, k ∈ Z n }<br />

où U est un ouvert <strong>de</strong> R n . Munissons à présent T n d’une structure <strong>de</strong> variété :<br />

l’ensemble <strong>de</strong>s V B = B +Z n ou B décrit l’ensemble <strong>de</strong>s boules <strong>de</strong> R n <strong>de</strong> rayon<br />

strictement plus petit que 1/2 est un recouvrement ouvert <strong>de</strong> T n . Pour un tel<br />

V B on définit ϕ B : V B → R n qui à tout point <strong>de</strong> la forme x + k x ∈ B, k ∈ Z n<br />

associe x. C’est une application qui est bien définie puisqu’un point <strong>de</strong> V B<br />

s’écrit <strong>de</strong> façon unique sous cette forme (le rayon <strong>de</strong> la boule est strictement<br />

plus petit que 1/2). Il est facile <strong>de</strong> voir que ϕ B est un homéomorphisme local<br />

et que si B et B ′ sont <strong>de</strong>ux boules <strong>de</strong> rayon strictement plus petits que 1/2<br />

l’application ϕ B ◦ ϕ −1<br />

B<br />

est <strong>de</strong> la forme x ↦→ x + k − k ′ . La famille (U ′<br />

B , ϕ B ) B<br />

est donc un atlas.<br />

Cette construction se généralise à <strong>de</strong>s situations plus générales (quotient d’un<br />

groupe <strong>de</strong> Lie par un sous-groupe fermé).<br />

Tout comme dans le cas <strong>de</strong>s sous-variétés, on peut définir la notion d’application<br />

différentiable entre <strong>de</strong>ux variétés M et N : il suffit d’adapter celle<br />

que l’on a donnée dans le cas <strong>de</strong>s sous-variétés. On peut également définir<br />

la notion d’espace tangent en un point d’une variété. Une définition possible<br />

repose sur le lemme suivant<br />

Lemme A.3.1 Soient γ 1 , γ 2 <strong>de</strong>ux applications <strong>de</strong> classe C 1 <strong>de</strong> ] − 1, 1[→<br />

M telles que γ 1 (0) = γ 2 (0) = x. Si dans une carte (U, ϕ), x ∈ U on a<br />

(ϕ −1 ◦ γ 1 ) ′ (0) = (ϕ −1 ◦ γ 2 ) ′ (0) alors dans tout autre carte (V, ψ) x ∈ V , on<br />

a (ψ −1 ◦ γ 1 ) ′ (0) = (ψ −1 ◦ γ 2 ) ′ (0). On écrit γ 1 ∼ γ 2 ; cette relation est une<br />

relation d’équivalence. En outre si γ 3 :] − 1, 1[→ M, γ 3 (0) = x est C 1 et si<br />

dans une carte (ϕ −1 ◦ γ 3 ) ′ (0) = (ϕ −1 ◦ γ 1 ) ′ (0) + (ϕ −1 ◦ γ 2 ) ′ (0) alors dans toute<br />

autre carte (ψ −1 ◦ γ 3 ) ′ (0) = (ψ −1 ◦ γ 1 ) ′ (0) + (ψ −1 ◦ γ 2 ) ′ (0).<br />

D’après le lemme, l’espace <strong>de</strong>s chemins γ :] − 1, 1[→ M tels que γ(0) = x<br />

quotienté par ∼ peut être muni d’une structure d’espace vectoriel. C’est ce<br />

que l’on appelle l’espace tangent en x à M que l’on note T x M.


A.3. SOUS-VARIÉTÉS DE R M 109<br />

Une autre façon <strong>de</strong> définir l’espace tangent T x M est la suivante : si A<br />

est l’atlas <strong>de</strong>s cartes, α = (U α , ϕ α ) et A x la sous-collection <strong>de</strong>s α tels que<br />

x ∈ U α , on considère dans l’espace vectoriel (R n ) Ax <strong>de</strong>s suites (v α ) α∈Ax (muni<br />

<strong>de</strong> la structure d’espace vectoriel pro<strong>du</strong>it) le sous-espace vectoriel <strong>de</strong>s suites<br />

(v α ) α∈Ax vérifiant la relation <strong>de</strong> compatibilité suivante : pour tous α, β, v β =<br />

D(ϕ β ◦ ϕ −1<br />

α )(ϕ a (x)) · v β . Il est facile <strong>de</strong> voir que c’est bien un sous-espace<br />

vectoriel.<br />

Définissons à présent l’espace tangent <strong>de</strong> la variété M comme l’union<br />

disjointe <strong>de</strong>s T x M où x varie dans M : T M = {(x, v) : x ∈ M, v ∈ T x M} et<br />

notons π : T M → M l’application qui à (x, v) ∈ T M associe x. Il est alors<br />

possible <strong>de</strong> définir une structure <strong>de</strong> variété différentielle sur T M compatible<br />

avec celle <strong>de</strong> M dans le sens où l’application π : T M → M soit différentiable.<br />

Exercice : Le faire.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!