11.11.2014 Vues

Exposé du 18 mars 2003 `a l'ESIEA Le probl`eme de Monge par D ...

Exposé du 18 mars 2003 `a l'ESIEA Le probl`eme de Monge par D ...

Exposé du 18 mars 2003 `a l'ESIEA Le probl`eme de Monge par D ...

SHOW MORE
SHOW LESS

Transformez vos PDF en papier électronique et augmentez vos revenus !

Optimisez vos papiers électroniques pour le SEO, utilisez des backlinks puissants et du contenu multimédia pour maximiser votre visibilité et vos ventes.

Exposé <strong>du</strong> <strong>18</strong> <strong>mars</strong> <strong>2003</strong> à l’ESIEA<strong>Le</strong> problème <strong>de</strong> <strong>Monge</strong><strong>par</strong> D. FeyelHistoriqueEn 1781 <strong>Monge</strong> publie un célèbre mémoire [13] sur les déblais et les remblais :comment déplacer un tas <strong>de</strong> cailloux <strong>de</strong> la manière la plus économique ? C’est unproblème facile à poser, d’interprétation physico-géométrique évi<strong>de</strong>nte, et qui s’estrévélé peu à peu d’une très gran<strong>de</strong> richesse mathématique.Plus tard Ampère a été con<strong>du</strong>it à une question semblable à propos <strong>du</strong> passaged’un courant dans un milieu <strong>de</strong> con<strong>du</strong>ctivité variable, d’où le nom <strong>de</strong> l’équation<strong>de</strong> <strong>Monge</strong>-Ampère.On peut décrire les arrangements <strong>du</strong> déblai et <strong>du</strong> remblai <strong>par</strong> <strong>de</strong>s masses ayant<strong>de</strong>s <strong>de</strong>nsités : µ(dx) =f(x)dx et ν(dy) =g(y)dy telles que ∫ f(x)dx = ∫ g(y)dy.On peut alors présenter les choses ainsi : soit X l’espace IR m , et soit c(x, y) une“fonction <strong>de</strong> coût” en général ≥ 0 sur X 2 . Existe-t-il une application T : X → Xqui transporte le déblai µ(dx) = f(x)dx sur le remblai ν(dy) = g(y)dy etminimisant l’intégrale <strong>de</strong> coût∫∫c(x, T (x))µ(dx) = c(x, T (x))f(x)dx (1)XL’équation <strong>de</strong> transport (<strong>Monge</strong>-Ampère) s’écritXf(x) =g◦T (x)|J T (x)|Si elle existe, la solution T est dite transport optimal <strong>de</strong> µ sur ν. Bien sûr, les <strong>de</strong>uxmasses totales µ = ∫ f(x)dx et ν = ∫ g(y)dy doivent être égales.<strong>Le</strong> problème a été repris <strong>par</strong> Appell [1,2] en <strong>18</strong>97 et 1928, puis <strong>par</strong> Kantorovitch[11] en 1942. Ce <strong>de</strong>rnier a entièrement renouvelé la manière <strong>de</strong> poser le problème,qui est ainsi <strong>de</strong>venu le problème <strong>de</strong> <strong>Monge</strong>-Kantorovitch (en abrégé PMK). Noteraussi que <strong>Monge</strong> posait le problème pour le coût c(x, y) = |x − y|, alors queKantorovitch l’a posé pour le coût quadratique c(x, y) =|x − y| 2 .Dans les travaux les plus récents, le problème est posé pour <strong>de</strong>s coûts plus généraux,<strong>par</strong> exemple c(x, y) =|x − y| p ,etmême pour <strong>de</strong>s espaces métriques plus générauxque IR m (<strong>par</strong> exemple <strong>de</strong>s variétés riemanniennes).1


<strong>Le</strong> problème <strong>de</strong> <strong>Monge</strong>-Kantorovitch (PMK)On intro<strong>du</strong>it l’ensemble Γ(µ, ν) constitué <strong>de</strong>s mesures sur X 2 se projetant surµ et ν. C’est clairement un ensemble convexe compact en topologie étroite. Soitθ ∈ Γ(µ, ν), posons∫∫J(θ) = c(x, y)θ(dx, dy) ≤ +∞ (2)X 2On appelle alors problème <strong>de</strong> <strong>Monge</strong>-Kantorovitch (PMK) le problème consistantà chercher θ ∈ Γ(µ, ν) minimisant J <strong>de</strong> sorte que J(θ) < +∞. Remarquer qu’il sepeut que J ≡ +∞, auquel cas le problème est dégénéré.Evi<strong>de</strong>mment, ce problème <strong>de</strong> minimisation n’est pas a priori équivalent auproblème <strong>de</strong> <strong>Monge</strong> qui est un problème hautement non-linéaire. Kantorovitch leramène ainsi à un problème linéaire, la mesure θ minimisant J(θ), appelée mesureoptimale, existe <strong>par</strong> un simple argument <strong>de</strong> compacité. Comment utiliser θ pourrésoudre le problème <strong>de</strong> <strong>Monge</strong> ?Toute solution θ <strong>du</strong> PMK portée <strong>par</strong> le graphe d’une application T fournira unesolution <strong>du</strong> problème <strong>de</strong> <strong>Monge</strong>. Il restera encore à discuter <strong>de</strong> l’unicité.Rachev [15] a montré que sous certaines conditions, le problème général avaitune solution θ unique. De plus, selon Sudakov [17], pour certaines fonctionsc(x, y) (puissances d’une distance), θ est portée <strong>par</strong> le graphe d’une applicationT : X → X, cequirésout le problème initial <strong>de</strong> <strong>Monge</strong>.Nous nous occuperons ici <strong>du</strong> PMK historique, donc X =IR m et c(x, y) =|x − y| 2 .<strong>Le</strong> théorème <strong>de</strong> Rockafellar [16]Un ensemble A ⊂ X 2 est cycliquement monotone si pour toute suite finie(x i ,y i ) 1≤i≤n et pour toute permutation σ <strong>de</strong> {1, 2,...,n}, ona∑|x i − y i | 2 ≤ ∑ |x i − y σ(i) | 2iiou ce qui revient au même∑〈y i ,x i 〉≥ ∑ii〈y i ,x σ(i) 〉Exemple : le sous-différentiel d’une fonction convexe Φ. C’est l’ensemble ∂Φ <strong>de</strong>spoints (x, y) tels que l’on ait pour tout z〈y, z − x〉 ≤Φ(z) − Φ(x)2


Remarquer que l’on a nécessairement y = ∇Φ(x) en tout point x où Φ estdifférentiable.<strong>Le</strong> théorème <strong>de</strong> Rockafellar affirme que la réciproque est vraie : si un sous-ensembleA <strong>de</strong> X 2 est cycliquement monotone, alors il est inclus dans le sous-différentield’une fonction convexe Φ.Démonstration : On fixe un point (x 1 ,y 1 ) ∈ A. Onpose{}n−1∑Φ(x) = Sup 〈x − x n ,y n 〉 + 〈y i ,x i+1 − x i 〉le Sup étant éten<strong>du</strong> à toutes les suites (x i ,y i ) i≤n ∈ A. Il est clair que Φ(x) estconvexe ≤ +∞, et que Φ(x 1 ) ≤ 0 <strong>de</strong> sorte que Φ n’est pas la constante +∞. Laformule (3) implique pour tout x l’inégalitéi=1Φ(x) ≥〈x − x n ,y n 〉 +Φ(x n )donc 〈x − x n ,y n 〉≤Φ(x) − Φ(x n ), ce qui signifie justement que le point (x n ,y n )(arbitrairement pris dans A) ap<strong>par</strong>tient au sous-différentiel <strong>de</strong> Φ.Si Φ est finie sur un ensemble <strong>de</strong> mesure > 0, il existe un ouvert convexe U ≠Øtelle que Φ soit finie continue sur U et soit +∞ à l’extérieur. Dans U, Φ possè<strong>de</strong>un gradient ∇Φ en presque tout point, et A est inclus dans l’adhérence <strong>du</strong> graphe<strong>de</strong> ∇Φ.(3)La solution <strong>de</strong> McCann [12], (1995)Théorème <strong>de</strong> McCann : Toute mesure optimale θ est portée <strong>par</strong> un ensemblecycliquement monotone A et donc <strong>par</strong> le sous-différentiel d’une fonction convexenon-dégénérée Φ.Ça résout à la fois le problème <strong>de</strong> <strong>Monge</strong> et celui <strong>de</strong> <strong>Monge</strong>-Kantorovitch pourle coût |x − y| 2 . Il existe en effet un ensemble N négligeable tel que l’applicationT = ∇Φ soit définie sur U\N et soit une bijection <strong>de</strong> U\N sur son image. Alors θest l’image <strong>de</strong> µ <strong>par</strong> x → (x, T (x)), et ν est l’image <strong>de</strong> µ <strong>par</strong> T . De plus la mesureoptimale θ est unique : si θ 2 est une autre mesure optimale, θ ′ =(θ + θ 2 )/2 estaussi optimale, donc ne peut-être portée <strong>par</strong> un graphe que si c’est celui <strong>de</strong> T .Parsuite θ ′ = θ et θ 2 = θ.<strong>Le</strong> minimum J(θ) obtenu pour θ optimale se note d(µ, ν) 2 .Ondémontre facilementque d(µ, ν) est une distance (la distance <strong>de</strong> <strong>Monge</strong>-Kantorovitch-Wasserstein) surl’ensemble <strong>de</strong>s mesures <strong>de</strong> même masse totale.1 Remarque : Naturellement il existe aussi un unique transport optimal <strong>de</strong>ν sur µ, d’où une fonction convexe Ψ telle que S = ∇Ψ transporte ν sur µ.3


<strong>Le</strong>s considérations d’unicité montrent que S◦T (x) =xµ-presque <strong>par</strong>tout, et queT ◦S(y) =yν-presque <strong>par</strong>tout. On a aussiΦ(x)+Ψ(y) =〈x, y〉 θ − presque <strong>par</strong>tout2 Corollaire : Φ(x) et Ψ(y) sont conjuguées au sens <strong>de</strong> <strong>Le</strong>gendre.Cela signifie queΨ(y) = Supx∈IR m {〈x, y〉−Φ(x) },Φ(x) = Supy∈IR m {〈x, y〉−Ψ(y) } (4)Exemple : On prend X =IR m = IR, Φ(x) =|x| + x 2 /2, Ψ(y) =(|y|−1) 2 /2 pour|y| ≥1, Ψ(y) =0pour|y| ≤1. On constate que ∇Φ est le transport optimal <strong>de</strong>la mesure <strong>de</strong> <strong>Le</strong>besgue dx sur la mesure dy restreinte aux <strong>de</strong>mi-droites [1, +∞[ et] −∞, −1]. Il conviendrait en fait <strong>de</strong> remplacer la mesure dx <strong>par</strong> une mesure <strong>de</strong>masse finie.Inversement, si Φ et Ψ sont conjuguées <strong>de</strong> <strong>Le</strong>gendre, c’est-à-dire satisfont auxformules (4), alors T = ∇Φ est le transport optimal <strong>de</strong> µ sur ν, ceci quelle quesoit µ ayant une <strong>de</strong>nsité, pourvu que ν = T (µ). Ainsi le problème est étroitementlié àlathéorie <strong>de</strong>s fonctions convexes conjuguées. C’est d’ailleurs <strong>par</strong> ce biais quele problème avait été abordé <strong>par</strong> Kantorovitch [11] puis <strong>par</strong> Brenier [4].Inégalité <strong>de</strong> TalagrandOn se place dans X =IR m , et on suppose queµ(dx) =e −x2 /2 dx/(2π) m/2 , ν(dy) =L(y) e −y2 /2 dy/(2π) m/2alors∫d(µ, ν) 2 ≤ 2L(x) Log L(x)µ(dx)En effet, on a d’après <strong>Monge</strong>-Ampèree −x2 /2 = e −T (x)2/2 L◦T (x)J T (x)où le jacobien J T vautJ T (x) = <strong>de</strong>t ∇ 2 Φ ≤ exp(Trace(∇ 2 Φ − I)) = exp(∆Φ − m)l’inégalité résultant <strong>de</strong> la convexité <strong>de</strong> Φ, doncT (x) 2 − x 2 ≤ 2 Log L◦T (x) + 2(∆Φ − m)4


|T (x) − x| 2 ≤ 2 Log L◦T (x) + 2(∆Φ − m)+2x 2 − 2〈x, T (x)〉|T (x) − x| 2 ≤ 2 Log L◦T (x)+2(x 2 − m)+LΦoù L =∆− x∇ est l’opérateur d’Ornstein-Uhlenbeck. Par suite∫d(µ, ν) 2 ≤ 2 L Log LdµApplications1 o . On prend L(y) =1 B (y)/µ(B), donc ν(dy) =L(y)µ(dy). Soit T le transportoptimal <strong>de</strong> µ sur ν : il est presque sûrement à valeurs dans B. On a donc∫d(µ, ν) 2 1≤ 2 L Log Ldµ = 2 Logµ(B)On a d’autre <strong>par</strong>t |T (x) − x| ≥q(x) = Inf{|y − x| / y ∈ B}, donc∫q 2 dµ ≤ d(µ, ν) 2 1≤ 2 Logµ(B)2 o . On prend <strong>par</strong>eillement µ A =1 A µ/µ(A), µ B =1 B µ/µ(B), on ad(µ A ,µ B ) 2 ≤ 2[d(µ A ,µ) 2 + d(µ, µ B ) 2 ] ≤ 4 Log1µ(A)µ(B)Supposons que A et B soient à distance ≥ δ>0, alors si T est le transport optimal<strong>de</strong> µ A sur µ B ,onadonc|T (x) − x| ≥δ µ A − presque <strong>par</strong>toutδ 2 ≤ d(µ A ,µ B ) 2 ≤ 4 Log1µ(A)µ(B)⇒ µ(A)µ(B) ≤ e −δ2 /4Ces inégalités (isopérimétriques) sont indépendantes <strong>de</strong> la dimension, elles admettentdonc <strong>de</strong>s généralisations en dimension infinie [9,10].3 o . Pour t ∈ [0, 1], posonsΦ t (x) =(1− t)x 2 /2+tΦ(x),T t (x) =∇Φ t (x) =(1− t)x + t∇Φ(x)Soit µ t la mesure image <strong>de</strong> µ 0 = µ <strong>par</strong> le transport T t . On constate qued(µ 0 ,µ t ) ≤ (1−t)d(µ 0 ,µ 1 ), d(µ t ,µ 1 ) ≤ td(µ 0 ,µ 1 ). Ce sont donc <strong>de</strong>s égalités. Noter5


qu’il s’agit exactement <strong>du</strong> <strong>par</strong>amétrage <strong>du</strong> transport <strong>de</strong> µ 0 sur µ 1 , <strong>par</strong>amétrageproportionnel au temps. Noter aussi que la trajectoire d’un point x ne rencontrepas celle d’un point y ≠ x, sans quoi le transport ne serait pas optimal.ConclusionDes travaux récents (Caffarelli [6], Cor<strong>de</strong>iro-Erausquin [7], et alt.) montrentla gran<strong>de</strong> importance <strong>de</strong> cette notion <strong>de</strong> transport optimal. Elle fournit eneffet <strong>de</strong> nouvelles métho<strong>de</strong>s générales <strong>de</strong> démonstration pour un certain nombred’inégalités (Isopérimétrie, Sobolog, Otto-Villani [14], Bobkov-<strong>Le</strong>doux).Il est curieux <strong>de</strong> constater que le problème initial <strong>de</strong> <strong>Monge</strong> (avec le coût |x−y|) eststrictement plus difficile àrésoudre que le même problème pour le coût quadratique|x − y| 2 .Pour le calcul numérique approché <strong>de</strong> la solution, il y a peu <strong>de</strong> travaux. On pourracependant consulter un article récent <strong>de</strong> Benamou-Brenier [3].Certains auteurs ont généralisé la chose dans plusieurs directions : extension surle coût (avec application aux variétés riemanniennes), et extension <strong>de</strong> IR m àunespace <strong>de</strong> Hilbert, où à un espace <strong>de</strong> Banach réflexif. La métho<strong>de</strong> <strong>de</strong> McCann exige<strong>de</strong>s extensions <strong>du</strong> théorème <strong>de</strong> Rockafellar, et même <strong>de</strong>s modifications <strong>de</strong> la notion<strong>de</strong> convexité. Il semble que ces généralisations ne soient pas uniquement formelles.BIBLIOGRAPHIE[1] P. Appell Mémoire sur les déblais et les remblais <strong>de</strong>s systèmes continus oudiscontinus.Mémoires présentés <strong>par</strong> divers savants à l’Académie <strong>de</strong>s Sciences <strong>de</strong> l’Institut <strong>de</strong>France. Paris, I. N. 29, 1-208, (<strong>18</strong>87).[2] P. Appell <strong>Le</strong> problème géométrique <strong>de</strong>s déblais et <strong>de</strong>s remblais.Mémorial <strong>de</strong>s Sciences Mathématiques, fasc. XXVII, Paris (1928).[3] J.D. Benamou, Y. Brenier A Computational Fluid Mechanics solution to the<strong>Monge</strong>-Kantorovich mass transfer problem.Preprint (2001).[4] Y. Brenier Décomposition polaire et réarrangement monotone <strong>de</strong>s champs <strong>de</strong>vecteurs. CRAS Paris 305, série I, 805-808 (1987).[5] Y.Brenier Factorisation polaire et réarrangement <strong>de</strong>s fonctions à valeurs vectorielles.Séminaire <strong>du</strong> Collège <strong>de</strong> France, vol.XI (1989-91)[6] L. Caffarelli Monotonicity properties of optimal transportation and the FKG andrelated inequalities. Preprint (1999).6


[7] D. Cor<strong>de</strong>iro-Erausquin Some applications of mass transport to Gaussian typeinequalities. Preprint (2001).[8] D. Cor<strong>de</strong>iro-Erausquin, R.J. McCann, M. Schmuckenchläger A Riemannian interpolationinequality à la Borell, Brascamp et Lieb. Prépublication <strong>de</strong> Marne-La-Vallée, 17/2000 (2000).[9] D. Feyel, A.S. Ustünel Measure transport on Wiener space and the Girsanovtheorem. CRAS Paris, Série I 334, 1025-1028 (2002)[10] D. Feyel, A.S. Ustünel <strong>Monge</strong>-Kantorovitch measure transportation and <strong>Monge</strong>-Ampère equation on the Wiener space. A <strong>par</strong>aître au PTRF (<strong>2003</strong>).[11] L.V. Kantorovitch On the transfer of masses.Dokl. Acad. Nauk. SSSR 37, 227-229 (1942).[12] R.J. McCann Existence and uniqueness of monotone measure-preserving maps.Duke Math. J. 80, 309-323 (1995).[13] G. <strong>Monge</strong> Mémoire sur la théorie <strong>de</strong>s déblais et <strong>de</strong>s remblais.Histoire <strong>de</strong> l’Académie Royale <strong>de</strong>s Sciences, Paris (1781).[14] F. Otto, C. Villani Generalization of an inequality by Talagrand and links withthe logarithmic Sobolog inequality. J. Funct. Anal. 173, 361-400 (2000).[15] S.T. Rachev The <strong>Monge</strong>-Kantorovitch transference problem.Th. Prob. Appl. 49, 647-676 (1985).[16] R.T. Rockafellar Convex analysis.Princeton University Press (1972).[17] V. N. Sudakov Geometric problems in the theory of infinite dimensional probabilitydistributions.Proc. Steklov Inst. Math., 141, 1-178 (1979).[<strong>18</strong>] M. Talagrand Transportation cost for Gaussian and other pro<strong>du</strong>ct measure.Geom. Funct. Anal. 6, 587-600 (1996).D. FeyelUniversité d’Evry-Val-d’Essonnefeyel@maths.univ-evry.frL’auteur remercie les organisateurs <strong>du</strong> séminaire <strong>de</strong> l’ESIEA pour leur accueilchaleureux, l’intérêt qu’ils ont porté à cet exposé, et leur ai<strong>de</strong> dans la confection<strong>du</strong> manuscrit final.7

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!