1 Le calcul variationnel
1 Le calcul variationnel
1 Le calcul variationnel
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
1.1 Introduction.<br />
Dès que vous avez vu les bases de l’analyse, vous avez appris à répondre à la question<br />
suivante : comment trouver le point x pour lequel la fonction f(x) est maximum (ou<br />
minimum) ? f est une machine qui prend un nombre en entrée et produit un nombre en<br />
sortie. La question ci-dessus en réalité est celle de trouver un extremum local : un point<br />
qui produit la sortie la plus grande (ou la plus petite) que tous ses voisins immédiats.<br />
Nous savons que pour un tel point x∗,<br />
f ′ (x∗) = 0.<br />
Donnons nous maintenant une fonctionnelle L.Ceci est une machine qui prend une fonction<br />
en entrée et produit un nombre en sortie. Par exemple<br />
S(f) =<br />
∫ b<br />
a<br />
[<br />
f(x) 2 + f ′2 (x) ] dx (1.1)<br />
est une fonctionnelle qui prend une fonction, ajoute son carré et le carré de sa dérivée et<br />
les intègre entre deux bornes pour produire un nombre. Si on entre la fonction sin x dans<br />
cette machine, elle produit le nombre b − a. Si on y entre la fonction exp x, elle produit<br />
le nombre 2 exp(2b) − 2 exp(2a).<br />
<strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong> consiste à répondre à la question suivante : quelle est la fonction<br />
f qui produit la plus grande sortie S(f) ? La réponse que nous allons voir par la suite est<br />
que f doit satisfaire une équation différentielle qui est relié à la forme de la fonctionnelle<br />
S.<br />
Donnons deux exemples avant d’aller plus loin.<br />
Brachistochrone. L’exemple le plus important historiquement est celui du brachistochrone.<br />
Soit un point A(0, 0) situé dans le plan vertical, relié à un point B(x 1 , y 1 )<br />
par un toboggan dont la forme est donnée par la fonction y = f(x). On laisse un objet<br />
glisser sans frottement du point A le long du toboggan. Comment choisir la forme du<br />
toboggan, (la fonction f), pour que le temps d’arrivé au point B soit minimum ? Vous<br />
voyez qu’une fois qu’on se donne un toboggan, c’est à dire une fonction, en utilisant<br />
quelques notion de mécanique et de conservation d’énergie, on peut <strong>calcul</strong>er le temps<br />
de parcours, c’est à dire un scalaire. Essayons de mettre cela en forme. La vitesse de<br />
l’objet à l’ordonnée y vaut √ 2gy.L’élément d’arc ds = √ dx 2 + dy 2 = √ (1 + f ′ (x) 2 dx<br />
est parcouru en un temps dt = ds/v. <strong>Le</strong> temps total du parcours est donc<br />
∫<br />
√<br />
x1<br />
1 + f<br />
T =<br />
′ (x) 2<br />
dx<br />
2gf(x)<br />
0<br />
1
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
Et il faut trouver la fonction f qui minimise cette intégrale 1 . Ce problème avait été lancé<br />
comme un défi par un des frères Bernoulli vers 1690 (à peine dix ans après l’invention<br />
du <strong>calcul</strong> différentiel) à la communauté scientifiques. Tous les grands (Newton, <strong>Le</strong>ibnitz,<br />
l’autre Bernoulli, Hospital, ...) y répondirent. Euler (~1740) a trouvé une solution générale<br />
de ce genre de problème et Lagrange (~1780) les a généralisé à la mécanique.<br />
Mécanique analytique. Prenons une particule de masse m qui quitte le point x = 0<br />
au temps t = 0 et arrive à un autre point x = x 1 au temps t = t 1 . Cette particule est<br />
soumise à un potentiel V (x). <strong>Le</strong> mouvement de la particule est donné par la fonction<br />
x(t). La fonction x(t) qui minimise<br />
S =<br />
∫ t1<br />
0<br />
[<br />
(m/2)ẋ 2 (t) − V (x(t)) ] dt (1.2)<br />
est la trajectoire suivie par la particule. Ceci est une nouvelle formulation de la mécanique.<br />
Classiquement, nous résolvons l’équation différentielle F = ma où la fonction<br />
F (x) = −dV/dx et a = d 2 x/dt 2 pour remonter à la trajectoire x(t). Ici, la démarche<br />
est différente : de toute les trajectoires possibles qui relie (0, 0) à (t 1 , x 1 ), la particule<br />
choisit justement celle qui minimise l’intégrale (1.2). Comme si un dieu <strong>calcul</strong>ait le coût<br />
(qu’on appelle l’action S) de chaque trajectoire et choisissait la meilleure. Bien sûr, cette<br />
formulation de la mécanique et la formulation Newtonienne sont équivalente, bien que<br />
la formulation lagrangienne soit beaucoup plus profonde et pratique. Notez que la quantité<br />
dans l’intégrale n’est pas l’énergie totale, mais l’énergie cinétique moins l’énergie<br />
potentielle. On appelle cette quantité le Lagrangien.<br />
1.2 Calcul des variations.<br />
Formulons correctement notre problème (nous n’allons pas attaquer le cas le plus<br />
général pour l’instant). Soit la fonctionnelle<br />
S[f] =<br />
∫ b<br />
a<br />
L[f(t), f ′ (t), t]dt (1.3)<br />
Trouver la fonction f(t), avec les conditions f(a) = y 0 et f(b) = y 1 pour laquelle l’intégrale<br />
est un extremum.<br />
Traditionnellement, la fonction L qui se trouve sous l’intégrale est appelé le Lagrangien.<br />
C’est une fonction tout ce qu’il y a de plus normal. Par exemple, L(x, y) = x 2 + y 2 .<br />
Comme à un instant donné, f(t) et f ′ (t) sont des nombres, il est tout à fait légitime de<br />
<strong>calcul</strong>er L[f(t), f ′ (t)] qui dans ce cas, vaut f(t) 2 + f ′ (t) 2 comme l’expression que nous<br />
avions écrit dans (1.1). En plus, nous avons le droit de prendre les dérivées partielles de<br />
L : par exemple, dans ce cas, ∂L/∂x = 2x et ∂L/∂y = 2y. Il est usuel, si nous avions<br />
1. A première vue, il semble qu’il manque quelque à cette formulation : l’intégrale ne contient pas de<br />
référence à y 1 et nous n’exigeons apparemment pas que la particule finisse sa trajectoire à l’ordonné y 1.<br />
Nous y reviendrons plus tard, quand nous aborderons les contraines.<br />
2
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
y1<br />
y0<br />
f+εg<br />
g<br />
f<br />
a<br />
b<br />
Figure 1.1: Une fonction f et une variation g autour de cette fonction.<br />
noté L[f(t), f ′ (t)], de noter ces dérivées partielles par ∂L/∂f et ∂L/∂f ′ : cela veut juste<br />
dire “dérivée partielle par rapport au premier ou deuxième argument”. Dans ce cas, nous<br />
aurions eu par exemple ∂L/∂f ′ = 2f ′ (t). D’ailleurs, si vous remarquez, ∂L/∂f ′ est ici<br />
une fonction de t et on peut par exemple prendre sa dérivée par rapport au temps :<br />
d[∂L/∂f ′ ]/dt = 2f ′′ (t). Si au début, vous trouvez cette notation abrupte, remplacez f<br />
et f ′ avant les dérivations par x et y, et remettez les à leur place une fois les opérations<br />
terminées. Mais on prend vite l’habitude de ces notations. Notez également que l’on ne<br />
cherche pas n’importe quelle fonction, mais les fonctions qui prennent des valeurs bien<br />
déterminée (y 0 et y 1 ) aux bords a et b.<br />
Avant d’aller plus loin, revenons un instant au cas d’une fonction f(x) dont ont veut<br />
trouver l’extremum. Si nous connaissons la valeur de la fonction au point x, alors son<br />
accroissement quand on se déplace au point x + ɛ est donnée par<br />
df = f(x + ɛ) − f(x) = A(x)ɛ + termes d’ordres ɛ 2 + ...<br />
La première partie de l’accroissement (celle qui est importante quand ɛ est petit) est<br />
linéaire en ɛ : si nous avions pris un ɛ deux fois plus grand, nous aurions eu un accroissement<br />
deux fois plus grand également. La fonction A(x) est le coefficient de proportionnalité<br />
entre df et ɛ au point x, et nous avons plus l’habitude de la noter par f ′ (x). <strong>Le</strong><br />
point x est un extremum si le coefficient de proportionnalité f ′ (x) = 0, c’est à dire qu’en<br />
se déplaçant autour du point x, l’accroissement de f (à l’ordre 1 en ɛ ) est nulle.<br />
Nous n’avons qu’à suivre cette méthodologie pour trouver l’extremum de notre fonctionnelle<br />
S[f] : Nous allons ajouter la fonction ɛg(t) à la fonction f(t), et <strong>calcul</strong>er l’accroissement<br />
de la fonctionnelle dS = S[f + ɛg] − S[f]. Avec un peu de chance, cette<br />
accroissement comporte un terme linéaire en ɛ :<br />
dS = S[f + ɛg] − S[f] = A[f, g].ɛ + termes d’ordre ɛ 2 + ...<br />
où A[f, g] est un coefficient de proportionnalité qui dépend des fonctions f et g. Nous<br />
disons que f est un extremum si A[f, g] = 0 quelque soit g ! Cela est analogue à trou-<br />
3
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
ver l’extremum d’une fonction de plusieurs variables : le point (x ∗ , y ∗ , z ∗ , ...) est un extremum<br />
de la fonction f(x, y, z, ...) si en ce point, quelque soit le déplacement ( par<br />
exemple (dx, 0, 0, ...) ou (0, dy, dz, ...) ) la partie linéaire de l’accroissement est nulle. Une<br />
fonction, comme nous l’avons vu au chapitre 1, n’est finalement qu’un point dans un<br />
espace à dimension infini ; une fonctionnelle est comme une fonction d’une infinité de<br />
variable. Quelque soit g dans l’expression précédente veut simplement dire quelque soit<br />
le déplacement dans cet espace.<br />
Il faut prendre une précaution : nous ne cherchons que des fonctions pour lesquelles<br />
f(a) = y 0 et f(b) = y 1 . Comme f satisfait déjà à cette condition, pour que f + ɛg la<br />
fasse également, nous ne devons considérer que des fonctions g tel que g(a) = g(b) = 0.<br />
<strong>Le</strong>s fonctions g ne sont pas donc tout à fait quelconque. Nous obtenons :<br />
S[f + ɛg] =<br />
∫ b<br />
a<br />
= S[f] + ɛ<br />
L[f(t) + ɛg(t) , f ′ (t) + ɛg ′ (t)]dt (1.4)<br />
∫ b<br />
a<br />
∫<br />
∂L<br />
b<br />
∂f g(t)dt + ɛ ∂L<br />
∂f ′ g′ (t)dt + ...<br />
où nous avons simplement utilisé le fait que L(x + h, y + k) = L(x, y) + (∂L/∂x)h +<br />
(∂L/∂y)k + ... On peut déjà voir la partie linéaire apparaître. Nous pouvons mettre la<br />
deuxième intégrale un peu plus en forme en faisant une intégration par partie :<br />
∫ b<br />
a<br />
[ ]<br />
∂L<br />
∂L b ∫ b<br />
[ ]<br />
∂f ′ g′ (t)dt =<br />
∂f ′ g(t) d ∂L<br />
−<br />
a a dt ∂f ′ g(t)dt<br />
La première partie est nulle, puisque la fonction g vaut justement 0 sur les bords. En<br />
remettant ce qui reste dans l’expression (1.4), nous avons :<br />
dS = ɛ<br />
∫ b<br />
a<br />
{ ∂L<br />
∂f − d [ ]} ∂L<br />
dt ∂f ′ g(t)dt + ...<br />
L’intégrale est notre facteur de proportionnalité entre dS et ɛ. Si la fonction f est un<br />
extremum, alors l’intégrale doit être nulle quelque soit la fonction g. La seule possibilité<br />
est donc que f satisfasse à l’équation différentielle<br />
∂L<br />
∂f − d dt<br />
a<br />
[ ] ∂L<br />
∂f ′ = 0 (1.5)<br />
qui est appelé l’équation d’Euler-Lagrange. Notez que cette équation est homogène dimentionnellement.<br />
Faisons quelques exercices pour nous fixer les idées.<br />
Identité de Beltrami.<br />
d<br />
dt<br />
{<br />
f ′ ∂L<br />
∂f ′ − L }<br />
Evaluons l’expression<br />
′′ ∂L<br />
= f<br />
= f ′ ( d<br />
dt<br />
( ) ∂L<br />
∂f<br />
( )<br />
′<br />
∂L<br />
∂f ′ − ∂L<br />
∂f<br />
∂f ′ + f ′ d dt<br />
− ∂L<br />
∂f f ′ − ∂L<br />
∂f ′ f ′′ − ∂L<br />
∂t<br />
)<br />
− ∂L<br />
∂t<br />
4
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
Si L ne dépende pas explicitement de t, alors ∂L/∂t = 0 ; par ailleurs, l’expression entre<br />
parenthèse n’est que l’équation d’Euler-Lagrange et vaut zéro par construction. Nous en<br />
déduisons que si le Lagrangien ne dépend pas explicitement du temps, alors<br />
f ′ ∂L<br />
∂f ′ − L = Cte<br />
Ceci est appelé l’identité de Beltrami. En mécanique, ceci n’est rien d’autre que la conservation<br />
d’énergie (exercice : le démontrer) ; elle est cependant de portée plus générale et<br />
facilite grandement les <strong>calcul</strong>s dans les problèmes où la variable indépendante n’intervient<br />
pas explicitement, comme dans le problème du brachistochrone.<br />
Exemple : Mécanique et loi de Newton. En mécanique analytique d’un point matériel,<br />
le lagrangien est L = T − V , où T est l’énergie cinétique est V l’énergie potentiel. Si<br />
on se restreint au cas unidimensionnel où une particule est soumis à un potentiel V (x),<br />
alors pour la particule de trajectoire x(t),<br />
L(x, ẋ) = (1/2)mẋ 2 − V (x).<br />
<strong>Le</strong> premier terme de l’équation d’Euler-Lagrange est<br />
∂L<br />
∂x = −dV dx<br />
Comme nous l’avons mentionné ci-dessus, le seul terme qui dépend de la première variable<br />
x est V (x). Remplacer mentalement la deuxième variable ẋpar y dans l’expression<br />
du lagrangien avant la dérivation si cela vous dérange. La dérivation par rapport à la<br />
deuxième variable ( ẋ )donne<br />
∂L<br />
∂ẋ = mẋ<br />
et la dérivation par rapport au temps de cette dernière nous donne<br />
et l’équation d’E.L. s’écrit finalement<br />
d<br />
dt<br />
[ ∂L<br />
∂ẋ<br />
]<br />
= mẍ<br />
mẍ + dV/dx = 0<br />
Ce qui est bien sûr la même chose que l’équation de Newton F = ma.<br />
Allons un peu plus loin. Supposons que le potentiel est constant V (x) = Cte, s’est à<br />
dire que la particule se meut dans une région de l’espace où il n’est pas soumis à une force.<br />
On peut également dire que cette région de l’espace possède une symétrie d’invariance<br />
par translation : deux particules identiques placé à deux endroits différents de l’espace<br />
réagirait exactement de même ; dit encore autrement, nous n’avons aucune méthode pour<br />
déterminer où l’on se trouve dans l’espace. Dans ce cas, ∂L/∂x = 0, et l’équation d’E.L.<br />
s’écrit<br />
d<br />
dt<br />
[ ∂L<br />
∂ẋ<br />
]<br />
= 0<br />
5
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
ou encore la quantité p = ∂L/∂ẋ = Cte. Or, p n’est autre chose que la quantité du<br />
mouvement p = mẋ. Donc, symétrie d’invariance par translation dans l’espace nous<br />
impose la conservation de la quantité du mouvement. C’est un concept extrêmement<br />
profond 2 : à chaque symétrie du Lagrangien correspond une loi de conservation. La<br />
conservation de l’énergie est liée à la symétrie de translation dans le temps, la conservation<br />
du moment cinétique est associé à l’invariance par rotation autour d’un axe et ainsi<br />
de suite. En physique, une théorie n’est bien formé que si on peut la formuler sous<br />
forme <strong>variationnel</strong>le et chercher, par la symétrie sous-jacente du lagrangien, ses lois de<br />
conservation. Plus tard dans ce chapitre, nous verrons les formulations lagrangienne de<br />
l’électromagnétisme et de la mécanique quantique quand nous verrons comment traiter<br />
les champs.<br />
Plusieurs degrés de libertés et contraintes. Parfois, souvent, le lagrangien dépend de<br />
plusieurs fonctions. Par exemple, une particule dans l’espace habituel possède trois degrés<br />
de libertés x 1 , x 2 , x 3 et L = L(x 1 , x 2 , x 3 , x˙<br />
1 , x˙<br />
2 , x˙<br />
3 ). Si les x i sont les coordonnées cartésiennes,<br />
nous avons L = (m/2) ∑ i x2 i − V (r). La démarche ci-dessus peut-être répétée<br />
mot à mot pour démontrer que nous aurons une équation d’E.L. pour chaque degrés de<br />
liberté :<br />
∂L<br />
− d [ ] ∂L<br />
= 0 (1.6)<br />
∂x i dt ∂ẋ i<br />
L’approche lagrangienne ne dépend pas du choix de coordonnées, bien évidemment. Il<br />
suffit donc de pouvoir écrire l’énergie cinétique et potentielle pour déduire les équations<br />
du mouvement de façon automatique.<br />
Exemple 1 : mouvement dans un champ central. Il est facile de passer de l’expression<br />
de l’énergie cinétique en coordonnées cartésiennes (on pose m = 1) T = ẋ 2 + ẏ 2 + ż 2 aux<br />
coordonnées sphériques, T = ṙ 2 + r 2 ˙θ2 + r 2 sin 2 θ ˙φ 2 . L’énergie potentiel est V (r), ce qui<br />
donne le lagrangien<br />
L = ṙ 2 + r 2 ˙θ2 + r 2 sin 2 θ ˙φ 2 − V (r)<br />
En écrivant E.L. pour θ :<br />
4rṙ ˙θ + 2r 2 ¨θ − 2r 2 sin θ cos θ ˙φ 2 = 0 (1.7)<br />
Nous remarquons que nous avons une symétrie : si nous avions choisi nos axes pour que<br />
à t = 0, θ = π/2 et ˙θ = 0 ( ce qui revient à choisir le plan xy défini par le rayon vecteur<br />
de la particule et sa vitesse ), alors θ(t) = π/2 vérifie trivialement l’équation (1.7) : la<br />
particule reste dans le plan xy. <strong>Le</strong> lagrangien s’écrit plus simplement donc<br />
L = ṙ 2 + r 2 ˙φ2 − V (r)<br />
Nous remarquons que φ n’intervient pas dans le lagrangien, le moment associé à cette<br />
variable se conserve donc :<br />
p φ = ∂L<br />
∂ ˙φ = 2r2 ˙φ = cte<br />
2. Ceci s’appelle le théorème de Noether, du nom de la mathématicienne allemande qui l’a formulé<br />
vers 1912.<br />
6
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
Ceci n’est rien d’autre que la conservation du moment cinétique, comme nous l’avions<br />
annoncé ci-dessus. Finalement, il faut écrire l’E.L. pour r et résoudre les équations différentielles<br />
résultantes. <strong>Le</strong> lecteur trouvera la solution de ses équations dans les livres de<br />
mécanique.<br />
Exemple 2 : Pendule paramétrique. Soit un pendule de masse m = 1 restreint au plan<br />
xy (on suppose la gravité selon l’axe y) dont la longueur varie de façon périodique dans<br />
le temps : l = l(t). Quelle est son équation de mouvement ?<br />
<strong>Le</strong> système possède un seul degrés de liberté. Nous choisissons l’angle θ que fait le<br />
pendule avec l’axe y comme ce degrés. L’énergie cinétique est donnée par T = (ẋ 2 +ẏ 2 )/2.<br />
Comme x = l sin θ et y = l cos θ, T = ( ˙l 2 + l 2 ˙θ2 )/2. L’énergie potentiel est U = gy =<br />
−gl cos θ. Pour le premier terme de l’équation E.L., nous avons<br />
[ ]<br />
d ∂L<br />
dt ∂ ˙θ<br />
= d [ ]<br />
l 2 ˙θ<br />
dt<br />
= l 2 ¨θ + 2l ˙l ˙θ<br />
Comme par ailleurs, ∂L/∂θ = −∂U/∂θ = −gl sin θ, nous trouvons l’équation du mouvement<br />
:<br />
¨θ + 2<br />
(<br />
˙l/l<br />
)<br />
˙θ + (g/l) sin θ = 0<br />
Si l est constante, nous retrouvons l’équation classique d’un pendule. Si maintenant l<br />
oscille faiblement autour d’une position moyenne l = l 0 + l 1 sin ωt, l 0 ≫ l 1 , on peut<br />
démontrer qu’il y a phénomène de résonance si la fréquence d’excitation ω est le double<br />
de la fréquence propre Ω = √ g/l 0 ; la phase de l’oscillateur est alors bloquée (à 0 ou π) sur<br />
la phase de l’excitation. Ce procédé est largement utilisé dans les circuits électroniques.<br />
Vous avez sans doute remarqué avec quelle facilité l’on obtient les équations du mouvement.<br />
En aucun cas on ne doit chercher les forces des réactions des contraintes, comme<br />
dans le cas de la formulation Newtonienne. Il existe une interprétation géométrique extrêmement<br />
profonde de cette approche qui peut-être trouvé dans les livres de mécanique<br />
analytique. Nous ne continuerons pas plus le sujet ici.<br />
1.3 Formulation Lagrangienne et équation du mouvement<br />
d’un champ.<br />
Là où le <strong>calcul</strong> <strong>variationnel</strong> montre toute sa puissance est pour l’obtention d’équations<br />
d’évolution pour un champ : la hauteur d’une corde vibrante, le champ électromagnétique,<br />
le champ des contraintes élastique dans un solide, le champ des amplitudes en mécanique<br />
quantique. Peut importe le champ, il suffit de pouvoir formuler un lagrangien, c’est à dire<br />
l’énergie cinétique moins l’énergie potentielle, et le tour est joué. La différence par rapport<br />
à ce que nous avons développé ci-dessus est minime. Jusque là, nous avions considéré des<br />
lagrangiens fonctions de plusieurs x i , chacune de ces dernières fonction d’une variable<br />
t. Là, nous allons considérer des lagrangien fonction de plusieurs φ i , chacune de ces<br />
dernières fonction de plusieurs variable.<br />
7
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
Exemple fondamental. Pour fixer les idées, considérons le cas de la corde vibrante<br />
fixée à ces deux extrémités (x = 0 et x = L). A chaque instant t, la hauteur de la<br />
corde à la position x est donnée par φ(x, t). Étant donnée la forme de la corde à l’instant<br />
t 0 (φ(x, t 0 ) = y 0 (x) ) et t 1 (φ(x, t 1 ) = y 1 (x) ), quelle est l’évolution de la corde qui minimise<br />
l’action ? La trajectoire de la corde est alors la surface reliant y 0 (x) à y 1 (x) dans le temps.<br />
A un instant donnée t, l’énergie cinétique de la corde est donnée par la somme de<br />
l’énergie cinétique de tout ses points matériel,<br />
T =<br />
∫ L<br />
0<br />
ρ (∂φ/∂t) 2 dx<br />
et son énergie potentielle est l’énergie élastique des déformations<br />
V =<br />
∫ L<br />
0<br />
k (∂φ/∂x) 2 dx (1.8)<br />
où ρ est la densité de la ligne et k sa constante élastique. Notant c 2 = k/ρ, l’action (le<br />
coût d’une trajectoire φ(x, t) ) est<br />
S[φ] =<br />
∫ t1<br />
∫ L<br />
t 0<br />
0<br />
[<br />
(∂φ/∂t) 2 − c 2 (∂φ/∂x) 2] dxdt<br />
En considérant une variation ɛg(x, t) autour de la trajectoire φ(x, t), nous trouvons qu’à<br />
l’ordre 1 en ɛ, la variation de l’action est<br />
∫ t1<br />
S[φ + ɛg] − S[φ] = ɛ<br />
t 0<br />
∫ L<br />
0<br />
[ ∂φ ∂g<br />
∂t ∂t<br />
En faisant des intégration par partie, nous trouvons<br />
δS =<br />
∫ t1<br />
∫ L<br />
t 0<br />
0<br />
− c2<br />
∂φ<br />
∂x<br />
[ ∂ 2 ]<br />
φ<br />
∂t 2 − c2 ∂2 φ<br />
∂x 2 gdxdt<br />
∂g<br />
∂x<br />
]<br />
dxdt<br />
δS = 0 quelque soit la variation g que si le terme entre []est nul, c’est à dire<br />
∂ 2 φ<br />
∂t 2 − c2 ∂2 φ<br />
∂x 2 = 0<br />
qui est bien sûr l’équation d’onde bien connue.<br />
Equation générale du mouvement de champ. Nous pouvons maintenant généraliser<br />
cette approche par des <strong>calcul</strong>s aussi élémentaires que ceux ci-dessus, l’étape le plus technique<br />
étant une intégration par partie. Soit un domaine D dans un esapce à n dimensions,<br />
où nous cherchons à trouver l’extrémum de la fonctionnelle<br />
∫<br />
S[u] = L(u ,1 , ..., u ,n , u, x 1 , ...x n )d n x<br />
D<br />
8
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
où u ,i = ∂u/∂x i . La valeur de la fonction u(x 1 , ..., x n ) sur la frontière du domaine D<br />
étant fixé. L’équation d’Euler-Lagrange pour ce champ est donné par<br />
n∑<br />
i=1<br />
( )<br />
∂ ∂L<br />
− ∂L<br />
∂x i ∂u ,i ∂u = 0<br />
Remarquez que cette expression est une simple généralisation d’EL à une dimension :<br />
l’expression de dérivation de moment (d/dx)(∂L/∂u ′ ) est remplacée par la somme de<br />
toutes les dérivées partielles.<br />
Tenseur energie-impulsion. Nous pouvons pousser un peu plus loin. Nous avons vu<br />
l’égalité de Beltrami quand nous avons une fonction d’une variable et que le lagrangien<br />
ne dépend pas de la variable indépendante :<br />
{<br />
d<br />
y ′ ∂L }<br />
dx ∂y ′ − L = 0<br />
ou si nous voulions l’écrire avec nos notations sophistiquées<br />
{<br />
}<br />
d ∂L<br />
y ,x − L = 0<br />
dx ∂y ,x<br />
ou nous avons noté y ,x = y ′ = dy/dx. Si L représente le Lagrangien de la mécnaique<br />
analytique, le terme entre crochet rerpésente l’Hamiltonien, une quantité scalaire. Nous<br />
pouvons généraliser ce concept au lagrangien d’un champ u(x 1 , x 2 , ...x n ) qui ne dépend<br />
pas explicitement des variables indépendantes. En notant 3<br />
T ij = u ,i<br />
( ∂L<br />
∂u ,j<br />
)<br />
− δ ij L<br />
nous pouvons obtenir l’équivalent de l’identité de Beltrami pour un champ :<br />
n∑<br />
j=1<br />
∂T ij<br />
∂x j<br />
= 0<br />
la quantité T qui joue le rôle de l’Hamiltonian pour le champ est souvent appelé en<br />
physique le tenseur énergie-impulsion. <strong>Le</strong> lecteur interessé pourra consulter des livres de<br />
géométrie pour voir la signification générale de ce tenseur 4 .<br />
3. Rappelons que δ ij = 0 si i ≠ j et 1 sinon. Ceci est appelé le symbole de Kroneker<br />
4. Notons quand même que cela ressembe à une expression du genre divT = 0. Classiquement, la<br />
divergence est défini pour un vecteur et est fortement associée au flux de ce vecteur à travers une surface.<br />
Il n’est pas trop difficile de donner un sens au concept du flux d’un tenseur.<br />
9
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
Exercices.<br />
1. Pour une corde vibrante dans un champ de gravitation, nous devons ajouter le<br />
terme V g = ∫ I ρ′ φdx à l’énergie potentielle (1.8) où ρ ′ est le produit de la densité par<br />
l’accélaration de la gravité. Déduire l’équation du mouvement du champ dans ce cas.<br />
Même question si la corde se trouve dans un potentiel harmonique V h = ∫ I κφ2 dx.<br />
2. Calculer le tenseur energie-impulsion pour la corde vibrante sans potentiel extérieur.<br />
Que représente T tt ? Que veut dire l’identité de Beltrami dans ce cas ?<br />
Que représente alors T tx ?<br />
3. Déduire les équations du mouvements d’un champ dans un espace à n−dimension,<br />
où l’expression de l’énergie potentielle (interne) est donné par V = ∫ I k(∇φ)2 dr.<br />
Ceci généralise l’équation de la corde vibrante.<br />
4. Déduire l’équation du mouvement d’un champ dans un espace à n−dimension<br />
anisotrope, où l’expression de l’énergie potentielle (interne) est donné par<br />
∫<br />
∑ ∂φ ∂φ<br />
V = a ij dr<br />
∂x i ∂x j<br />
I<br />
i,j<br />
où pour les coefficients, nous pouvons supposer a ij = a ji (pourquoi ?). Ce genre<br />
d’expression se rencontre fréquemment dans des problèmes comme l’élasticité des<br />
cristaux, où les déformations dans les différentes directions ne sont pas équivalentes.<br />
1.4 Optimisation sous contraintes.<br />
1.4.1 <strong>Le</strong>s déplacements compatibles.<br />
Oublions pour l’instant le problème de l’extremum d’une fonctionnelle, et revenons au<br />
problème beaucoup plus simple de l’extremum d’une fonction de plusieurs variables. Soit<br />
la fonction f(x, y) dont nous cherchons l’extremum. Nous savons qu’au point extremum,<br />
les termes linéaires des variations doivent être nulle<br />
df = f(x + h, y + k) − f(x, y) =<br />
( ∂f<br />
∂x<br />
)<br />
h +<br />
( ) ∂f<br />
k + O(h 2 , k 2 )<br />
∂y<br />
et ceci quelque soit h, k : quelque soit la direction que l’on prend au point extremum, le<br />
terme linéaire de la variation doit être nulle.<br />
Supposons maintenant que nous ajoutons une contrainte : nous ne cherchons pas l’extremum<br />
absolu de f, mais un point x ∗ qui satisfasse en plus à la contrainte g(x, y) = 0.<br />
Par exemple, nous savons que le minimum de la fonction f(x, y) = x 2 + y 2 est le point<br />
(0, 0). Mais si nous contraignons notre point à se déplacer sur la courbe y = ax+b, b ≠ 0,<br />
le point (0, 0) n’est pas atteignable. On peut cependant chercher un point qui minimise f<br />
avec la contrainte donnée 5 . Dans le cas simple que nous somme en train de traiter ici, on<br />
peut résoudre une coordonnées par rapport à l’autre et ramener la fonction à une seule<br />
5. Imaginer que vous marchez en montagne sur un chemin, et vous vous intéressez au point le plus<br />
bas sur ce chemin et non pas en général.<br />
10
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
4<br />
g(x,y)=0<br />
2<br />
A<br />
0<br />
O<br />
−2<br />
−4<br />
−4 −2 0 2 4<br />
Figure 1.2: La fonction f(x, y) = x 2 + y 2 est représentée par ses courbes de niveau. <strong>Le</strong><br />
minimum absolu de cette fonction est le point O = (0, 0). <strong>Le</strong> point le “plus<br />
bas” de la fonction qui doit également appartenir à la courbe g(x, y) = 0<br />
est le point A.<br />
variable (degrés de liberté) : f(x) = x 2 + (ax + b) 2 et chercher maintenant le minimum<br />
de cette nouvelle fonction (où les contraintes ont été absorbées). En général cependant,<br />
la fonction contrainte g(x, y) = 0 est suffisamment compliquée pour qu’on ne puisse pas<br />
résoudre une des coordonnées par rapport aux autres.<br />
Revenons à la définition général : la variation linéaire de la fonction autour du point<br />
extremum (x ∗ , y ∗ ) doit être nulle quelque soit le déplacement (h, k) autour de ce point. En<br />
présence des contraintes, nous relâchons cette exigence : il faut que la variation linéaire<br />
autour du point (x ∗ , y ∗ ) soit nulle seulement pour les déplacement (h, k) compatible avec<br />
les contraintes 6 . <strong>Le</strong>s déplacements compatibles avec la contrainte g(x, y) = 0 sont données<br />
par<br />
(∂g/∂x)h + (∂g/∂y)k = 0<br />
Ceci nous donne une équation supplémentaire à considérer avec l’équation<br />
df = (∂f/∂x)h + (∂f/∂y)k = 0<br />
Nous sommes arrivés à un système de deux équations à deux inconnus linéaire. En résolvant<br />
k en fonction de h dans la première équation et en l’injectant dans la deuxième,<br />
et en exigeant maintenant que df soit nulle quelque soit h, nous obtenons 7<br />
(∂f/∂x)(∂g/∂y) − (∂f/∂y)(∂g/∂x) = 0 (1.9)<br />
Ceci est une condition supplémentaire sur l’extremum de la fonction f.<br />
6. En mécanique, cela est appelé la méthode des travaux virtuels<br />
7. On peut également dire que pour que le système Ah + Bk = 0, Ch + Dk = 0 ait une solution non<br />
trivial h = k = 0, il faut que le déterminant de la matrice<br />
( ) A B<br />
soit nulle.<br />
C<br />
D<br />
11
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
Exemple. Trouver l’extremum de la fonction f(x, y) = x 2 + y 2 avec la contrainte<br />
g(x, y) = −ax + y − b = 0. En écrivant la condition (1.9), nous obtenons<br />
(2x)1 − (2y)(−a) = 0<br />
ou autrement dit, x + ay = 0. En combinant cette équation avec la contrainte y = ax + b,<br />
nous trouvons les coordonnées du point extremum : x ∗ = −ab/(1 + a 2 ), y ∗ = b/(1 + a 2 ).<br />
1.4.2 <strong>Le</strong>s multiplicateurs de Lagrange.<br />
Lagrange a introduit une méthode équivalente à ce que nous venons de voir ci-dessus.<br />
Nous voulons optimiser f(x, y) avec la contrainte g(x, y) = 0. Lagrange introduit une<br />
variable supplémentaire, λ et considère maintenant le problème de l’optimisation (libre)<br />
de la fonction F (x, y, λ) = f(x, y) − λg(x, y). Cela nous donne<br />
∂F<br />
∂x = ∂f<br />
∂x − λ ∂g<br />
∂x = 0 (1.10)<br />
∂F<br />
= ∂f<br />
∂y ∂y − λ∂g ∂y = 0 (1.11)<br />
∂F<br />
∂λ<br />
= g(x, y) = 0 (1.12)<br />
L’équation (1.12) n’est rien d’autre que la contrainte et assure que la solution trouvée<br />
est bien conforme. <strong>Le</strong>s deux premières équations (1.10,1.11) ne sont rien d’autre que la<br />
condition (1.9) si on y élimine λ.<br />
Re-exemple. Minimisons la fonction f(x, y) = x 2 + y 2 avec la contrainte g(x, y) =<br />
−ax + y − b = 0. Nous introduisons la fonction F (x, y) = x 2 + y 2 − λ(−ax + y − b). Cela<br />
nous donne<br />
2x + λa = 0<br />
2y − λ = 0<br />
Ce qui bien sûr nous donne x+ay = 0. Nous trouvons à nouveau le même point optimum ;<br />
de plus, si on le souhaite, on peut trouver également λ ∗ = 2y ∗ = 2b/(1 + a 2 ).<br />
<strong>Le</strong> coefficient λ est appelé un multiplicateur de Lagrange. La méthode a une signification<br />
physique profonde : supposons que nous avons un point matériel dans le potentiel<br />
f(x, y) astreint à rester sur la courbe g(x, y). Au point x ∗ , le point (qui est stable) est<br />
soumis à une force non-nulle de la part du potentiel F = (∂ x f, ∂ y f). Pour qu’il puisse<br />
rester sur la position x ∗ , il faut que la courbe g(x, y) exerce une force de réaction sur le<br />
point qui vaut justement λ ∗ (∂ x g,∂ y g). Si on enlevait la contrainte mais qu’on soumettait<br />
le point matériel à cette force supplémentaire, il se mettrait exactement à la même<br />
position. 8<br />
8. Cette dualité force-contrainte a joué un grand rôle dans le développement de la mécanique, de<br />
sa formulation Newtonienne dans les années ~1680 à l’apparition du livre de mécanique analytique par<br />
Lagrange en ~1780. Lagrange était fier de n’avoir pas inclus une seule figure dans son livre. En mécanique,<br />
la méthode de Lagrange nous permet de <strong>calcul</strong>er une position d’équilibre sans <strong>calcul</strong>er explicitement les<br />
forces de réactions.<br />
12
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
1.4.3 Généralisation des multiplicateurs de Lagrange.<br />
<strong>Le</strong>s multiplicateurs de Lagrange se généralise de façon naturelle aux fonctions de n<br />
variables soumis à m contrainte. Pour optimiser la fonction f(x 1 , ...x n ) soumise aux<br />
contraintes g 1 (x 1 , ...x n ) = 0,...,g m (x 1 , ...x n ) = 0, nous considérons la nouvelle fonction F<br />
de n + m variable<br />
F (x 1 , ...x n ; λ 1 , ...λ m ) = f(x 1 , ...x n ) − λ 1 g 1 (x 1 , ...x n ) − ... − λ m g m (x 1 , ...x n )<br />
Nous chercherons l’extremum (sans contrainte) de la fonction F .<br />
Exercice. Démontrer le cas général, en suivant le chemin déjà tracé.<br />
La méthode des multiplicateurs de Lagrange se généralise très naturellement aux fonctionnelles.<br />
Si Nous devons trouver le minimum de la fonctionnelle S[y] = ∫ I L(y′ , y, x)dx<br />
avec la contrainte ∫ I g(y′ , y)dx = A, il nous suffit d’introduire la fonctionnelle<br />
∫<br />
S ′ {<br />
[y; λ] = L(y ′ , y, x) − λg(y ′ , y) }<br />
I<br />
et de chercher le minimum de cette fonctionnelle par les techniques habituelles du <strong>calcul</strong><br />
des variations ( expliquer pourquoi nous pouvons omettre la constante A) .<br />
Exemple : <strong>Le</strong> problème isopérimétrique. Trouver la courbe fermé de longueur donné<br />
qui maximise sa surface.<br />
Supposons 9 que nous pouvons représenter la courbe par une fonction R(θ). Nous cherchons<br />
à minimiser la fonctionnelle<br />
avec la contrainte<br />
S[R] =<br />
Considérons la nouvelle fonctionnelle<br />
S ′ [R(θ); λ] =<br />
∫ 2π<br />
0<br />
∫ 2π<br />
0<br />
∫ 2π<br />
0<br />
(1/2)R 2 (θ)dθ (1.13)<br />
R(θ)dθ = L (1.14)<br />
{<br />
(1/2)R 2 (θ) − λR(θ) } dθ<br />
<strong>Le</strong> terme entre {} (que nous continuons d’appeler le Lagrangien) ne contient même pas<br />
de dérivée de R ; l’équation d’Euler-Lagrange nous donne directement<br />
R − λ = 0<br />
c’est à dire R = λ = Cte. Ceci est bien un cercle. Pour trouver λ, nous utilisons la<br />
contrainte (1.14), qui nous donne λ = L/2π. La courbe qui minimise la surface est donc<br />
un cercle de rayon R = L/2π.<br />
9. Ceci est une très grosse supposition. <strong>Le</strong> lecteur a intérêt a tracer quelques courbes qui ne sont<br />
pas représentable par une fonction R(θ) pour se rendre compte de la simplification que nous assumons<br />
derrière cette supposition.<br />
13
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
Exemple : distribution d’énergie dans un système isolé. Soit un système isolé ayant<br />
N particule (N → +∞) et soit c(x) le nombre relatif de particule ayant une énergie dans<br />
l’intervalle [x, x + dx[. Comme le système est isolé, le nombre de particules et l’énergie<br />
totale sont conservés :<br />
∫ ∞<br />
0<br />
∫ ∞<br />
0<br />
c(x)dx = 1 (1.15)<br />
xc(x)dx = T (1.16)<br />
où nous appelons T l’énergie moyenne par particule : T = E 0 /N avec E 0 l’énergie totale<br />
du système. <strong>Le</strong> théorème H de Boltzmann nous apprend que la fonction c(x) doit être<br />
choisi de façon à ce que la quantité<br />
H [c] =<br />
∫ ∞<br />
0<br />
c(x). log [c(x)] dx (1.17)<br />
soit extremum. La quantité −H est souvent appelé entropie. Avec les deux contraintes<br />
(1.15,1.16), nous devons donc chercher l’extremum de la fonctionnelle<br />
H ′ [c; λ, µ] =<br />
∫ ∞<br />
0<br />
c(x). log [c(x)] dx − λ<br />
∫ ∞<br />
0<br />
c(x)dx − µ<br />
∫ ∞<br />
0<br />
xc(x)dx<br />
<strong>Le</strong> <strong>calcul</strong> est assez simple dans ce cas, puisque nous n’avons pas de dérivés dans la<br />
fonctionnelle. En cherchant la valeur de la fonctionnelle pour H ′ [c + ɛg; λ, µ] et en nous<br />
contentant d’ordre 1 en ɛ, nous trouvons<br />
H ′ [c + ɛg; λ, µ] = H ′ [c; λ, µ] + ɛ<br />
∫ ∞<br />
0<br />
(1 + log c − λ − µx) g(x)dx<br />
la fonction c(x) est un extremum de la fonctionnelle H ′ si les variations linéaires sont<br />
nulle ∀g, c’est à dire si<br />
log c = (λ − 1) + µx<br />
ou autrement dit c(x) = Ae −µx ; l’utilisation des deux contraintes nous donne A = −µ =<br />
1/T . Autrement dit,<br />
c(x) = (1/T )e −x/T<br />
1.4.4 Formulation <strong>variationnel</strong>le des systèmes Sturm-Liouville.<br />
Rappelons qu’un système Sturm-Liouville est une équation aux valeurs propres<br />
α(x)y ′′ + β(x)y ′ + γ(x)y = λy<br />
Nous avons mentionné (et insisté) que si nous trouvons un poids w(x) qui rend l’opérateur<br />
hermitien, alors les solutions des systèmes SL minimise une certaine fonctionnelle. Nous<br />
avons vu que si une telle fonction poids existe, alors elle doit obeïr à l’équation (αw) ′ =<br />
βw et le système peut alors s’écrire sous la forme alternative<br />
d (<br />
wαy<br />
′ ) + wγy = λwy<br />
dx<br />
14
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
Remarquer que cette forme ressemble furieusement à une équation Euler-Lagrange. On<br />
peut faire le chemin inverse : minimiser la fonctionnelle<br />
∫<br />
(<br />
S[y] = p(x)y ′2 + q(x)y 2) dx<br />
avec la contrainte<br />
∫<br />
I<br />
I<br />
w(x)y 2 dx = 1<br />
Comme on peut le voir, nous pouvons formellement identifier l’équation d’Euler-Lagrange<br />
du système ci-dessus à un système SL en posant p = wα, q = −wγ. A regarder de plus<br />
près, la formulation <strong>variationnel</strong>le d’un système SL, si on assimile la variable x au temps,<br />
ressemble beaucoup à un oscillateur harmonique avec une masse et une constante de<br />
ressort dépendant du temps. Ceci, comme nous l’avons mentionné, est le point de départ<br />
de l’approximation WKB.<br />
1.5 <strong>Le</strong>s conditions aux bords “naturelles”.<br />
Revenons à notre formulation initiale de problème d’éxtremum. Nous voulons trouver<br />
l’extremum de la fonctionnelle<br />
avec les conditions aux bords fixée<br />
S[y] =<br />
∫ b<br />
a<br />
L(y ′ , y, x)dx<br />
y(a) = y 0 ; y(b) = y 1<br />
Pour cela, nous avons écrit la variation de S en fonction d’une petite perturbation g(x)<br />
pour obtenir<br />
[ ] ∂L b ∫ b<br />
{ ∂L<br />
δS =<br />
∂y ′ g +<br />
a a ∂y − d }<br />
∂L<br />
dx ∂y ′ gdx<br />
et nous avons cherché dans quelles conditions, δS = 0 quelque soit g(x). Nos conditions<br />
aux bords nous ont imposées g(a) = g(b) = 0, donc le premier terme est nul ; le deuxième<br />
terme nous donne les équations d’E-L.<br />
Ceci dit, nous pouvons relacher nos contraintes, et ne pas<br />
exiger que y(a) = y 0 , y(b) = y 0 . <strong>Le</strong> problème serait alors :<br />
parmis toutes les courbes entre a et b, trouver celle qui extrémise<br />
la fonctionnelle. Dans ce cas, l’annulation de δS exige<br />
toujours l’annulation de l’intégrale, qui nous donnera comme<br />
d’habitude les équation d’Euler Lagrange, et l’annulation du<br />
terme de bord. Or, cette fois, comme les bords ne sont plus<br />
fixe, nous n’avons plus g(a) = g(b) = 0, pour annuler les<br />
termes de surface, nous devons exiger<br />
Figure 1.3: Bords libres<br />
∂L<br />
∂y ′ ∣<br />
∣∣∣x=a,b<br />
= 0<br />
15
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
ce qui nous fournit deux nouvelles conditions en remplacement des conditions y(a) = y 0 ,<br />
y(b) = y 0 .<br />
Pour illustrer ce principe, considérons un lagrangien qui contient des dérivées d’ordre<br />
2 : L = L(y ′′ , y ′ , y, x). Dans ce cas, la variation s’écrit<br />
[ ∂L<br />
δS =<br />
∂y ′ g − d<br />
]<br />
∂L ∂L b ∫ b<br />
{ ∂L<br />
g +<br />
dx ∂y ′′ ∂y ′′ g′ +<br />
a a ∂y − d<br />
}<br />
∂L<br />
dx ∂y ′ + d2 ∂L<br />
dx 2 ∂y ′′ gdx<br />
Pour une poutre élastique soumis à une charge f(x) par exmeple, l’énergie s’écrit<br />
E =<br />
∫ L<br />
0<br />
{<br />
By ′′2 − f(x)y } dx<br />
Si la poutre est encastrée (a), nous avons les conditions y(0) =<br />
y(L) = 0 et y ′ (0) = y ′ (L) = 0. Dans ce cas, le terme de bord est<br />
automatiquement nulle. Par contre, si la poutre est seulement posé<br />
(b), nous avons seulement y(0) = y(L) = 0. Pour trouver les deux<br />
autres conditions et annuler le terme de bord, nous devons avoir<br />
∂L/∂y ′′ = 0, c’est à dire y ′′ (0) = y ′′ (L) = 0. Nous laissons au lecteur<br />
le soin de trouver les conditions aux limites pour le cas (c).<br />
Dans les exemples ci-dessus, l’abscisse x était fixée sur les deux<br />
bords, y ayant la liberté de bouger le long d’une droite verticale. Figure 1.4: poutres<br />
Nous pouvons généraliser encore plus en relachant cette contrainte<br />
fixées.<br />
et permettre aux points sur les bords de se mouvoir le long d’une<br />
courbe quelconque. Nous laissons le soin au lecteur d’obtenir les conditions aux limites<br />
nécessaires dans ce cas. Un exemple typique est de trouver le chemin le plus court entre<br />
deux courbes f(x, y) = 0, g(x, y) = 0 sur une surface z = z(x, y) ; ou encore, pour les<br />
militaires, choisir le meilleur trajectoire pour lancer un missile air-air et abattre l’avion<br />
ennemie.<br />
(a)<br />
(b)<br />
(c)<br />
1.6 Détour : éléments de géométries non-euclidiennes.<br />
<strong>Le</strong> cinquième axiome d’Euclide est le suivant : “d’un point en dehors d’une droite, on<br />
ne peut tracer qu’une et une seule droite parallèle au premier”. Pendant deux millénaires,<br />
les mathémiticiens ont cru que ceci n’est pas un axiome, mais un théorème que l’on peut<br />
démontrer à partir des quatre premier axiomes. A partir de 1830, il est devenu claire<br />
que le cinquième mérite le titre d’axiome et qu’on peut tout a fait formuler d’autres<br />
géométries qui acceptent d’autres axiomes. Nous allons étudier une version simplifiée de<br />
la géométrie riemanienne. Pour cela, nous devons donner un sens précis au mot “droite” :<br />
nous le définirons dorénavent comme le chemin le plus court entre deux points ; il est<br />
plus habituel alors d’appeler cela une géodésique. Supposons que nous avons muni notre<br />
espace bidimensionnel d’un système de coordonnées (x 1 , x 2 ). La distance entre deux<br />
points infiniments voisins est définie par<br />
ds 2 = ∑ i,j<br />
g ij dx i dx j<br />
16
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
où g ij = g ij (x 1 , x 2 ) est appelé le tenseur métrique. Par exemple, si nous avons muni le<br />
plan euclidien de coordonées polaires, ds 2 = dr 2 +r 2 dθ 2 et nous avons (en posant x 1 = r,<br />
x 2 = θ), g 11 = 1, g 22 = x 2 , g 12 = g 21 = 0.<br />
Nous allons considérer dans la suite le cas très particulier où g 11 = 1, g i≠j = 0 et<br />
g 22 = g 2 (x), où g est une fonction quelconque 10 . <strong>Le</strong> prérimètre d’une courbe y(x) reliant<br />
deux points est donnée par<br />
l[y(x)] =<br />
∫ 2<br />
1<br />
√<br />
1 + g 2 (x)y ′2 dx<br />
et il est élémentaire de montrer, d’après les précédents paragraphes, que l’équation<br />
d’Euler-Lagrange nous donne immédiatement l’équation de la courbe :<br />
y ′ = a/g √ g 2 − a 2<br />
où a est une constante d’intégration. Dans le cas des coordonnées polaire par exemple où<br />
g(x) = x, nous pouvons intégrer l’équation ci-dessus 11 et obtenir l’équation d’une droite<br />
y = α + arccos(a/x) où a et α sont deux constante d’intégration. Pour vous convaincre<br />
que cela est effectivement le cas, Il suffit d’intepréter x comme r et y comme θ, faire un<br />
petit schéma et quelques manipulations d’angles .<br />
Prenons le cas plus intéressant pour nous de g(x) = sin(x). A nouveau, l’intégration<br />
s’effectue sans difficulté 12 et nous obtenons<br />
y = ψ + arccos (cos α cot x)<br />
où ψ et α sont deux constantes d’intégration. Nous voyons par exemple que pour α = π/2,<br />
nous avons une famille de droites données par y = Cte. Prenons la géodésique y = 0 et<br />
considérons le point P = (π/2, π/2) en dehors de cette droite. Toute les droites traversant<br />
ce point doivent avoir le paramètre ψ = 0. Il n’est pas alors difficile de voir que toute ces<br />
droites croisent la droite y = 0 au point cot x = 1/ cos α.<br />
Nous venons de démontrer dans ce cas que toutes les droites traversant P croisent une<br />
droite ne contenant pas P ; cela est très différent du cinquième axiome d’Euclide. <strong>Le</strong> cas<br />
que nous venons de traiter correpsond à la géométrie sphérique : sur la sphére unité, la<br />
distance entre deux points est donnée par ds 2 = dθ 2 + sin 2 θdφ 2 . Mais le point de vue<br />
de Rieman est beaucoup plus fondamental que cela : ce qui caractérise l’espace et qui<br />
lui donne sa substance est la donnée du tenseur métrique. <strong>Le</strong>s habitants de la surface<br />
de la sphère unité ne peuvent pas voir qu’ils sont sur une sphére. Ils peuvent par contre<br />
visionner les géodésiques (en suivant les trajets des faisceaux de lumière ) et déterminer<br />
la nature de leur espace en faisant des mesures par exemple de la somme des angles d’un<br />
triangle formé par trois géodésiques. C’est exactement dans ce cadre qu’Einstein a formulé<br />
sa théorie de gravité en 1917, où les masses confèrent de la courbure à l’espace-temps.<br />
10. Nous noterons par habitude les coordonnées (x, y) sans leur associer l’idée de coordonnées cartesiennes<br />
11. il suffit d’effectuer le changement de variable u = a/x<br />
12. Il suffit de poser u = cot x<br />
17
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
z<br />
r(z)<br />
y<br />
L<br />
a<br />
F<br />
x<br />
(a) (b) (c)<br />
Figure 1.5: (a) : surface minimum entre deux cercle ; (b) flambage d’une barre ; (c) pont<br />
suspendu à une chaînette.<br />
A ajouter.<br />
1. Discuter la Jauge dans le Lagragian et eventuellement le theorème de Noether.<br />
Problèmes.<br />
1. Surface minimum. Soit deux cercles concentriques de rayon à priori différents disposés<br />
l’un au dessus de l’autre à une hauteur h. Quelle est la forme de la surface d’aire<br />
minimum qui relie les deux cercles (fig. 1.5a) ?<br />
2. Energie de courbure. Comment faut-il écrire les équations d’Euler-Lagrange si le Lagrangien<br />
contient des dérivées secondes ? Plus spécifiquement, supposer que le Lagrangien<br />
est de la forme L = y ′′ (x) 2 + V (y). Généraliser ensuite au cas L = L(y ′′ , y ′ , y, x).<br />
3. Brachistochrone. Nous voulons minimiser<br />
∫<br />
√<br />
x1<br />
1 + y<br />
T =<br />
′2<br />
dx<br />
y<br />
0<br />
En utilisant l’identité de Beltrami, démontrer que la courbe y(x) doit obéir à l’équation<br />
−1<br />
y(1 + y ′2 ) = C<br />
où C est une constante. Résoudre cette équation du première ordre en démontrant d’abord<br />
que<br />
√ y<br />
dx = dy<br />
2a − y<br />
où nous avons posé 1/C 2 = 2a ; integrer cette dernière équation en posant y = a(1−cos θ).<br />
[Help : nous devons obtenir l’équation du cycloïde sous forme paramétrique.]<br />
18
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
4. Elasticité 1-d. Soit une barre dont on repère les points (avant deformation) par la coordonnées<br />
x. On appuie sur la barre parralèlelement à son axe ; les points de la barre se déplacent<br />
aux coordonnées x ′ (Figure 1.6). Nous appelons déplacement u(x) = x ′ −x la fonction<br />
qui traque cette quantité. L’énergie élastique stocké dans la barre est proportionnel<br />
au carré du gradient de ce terme :<br />
E =<br />
∫ L<br />
0<br />
(1/2)ku ′ (x) 2 dx<br />
où k est la constante élastique de la barre (qu’on appelle<br />
également le module d’Young). La force a effectué le travail<br />
W = F u(L). L’énergie totale de la barre s’écrit donc<br />
E =<br />
∫ L<br />
0<br />
{<br />
(1/2)ku ′ (x) 2 − F u ′ (x) } dx<br />
Démontrer alors que u(x) = ax où à est une constante à<br />
determiner. Déterminer a en utilisant les conditions aux bords<br />
naturelles (section 1.5). En déduite la loi d’élasticité de Hook<br />
Figure 1.6:<br />
F = Ku(L)<br />
Que vaut K ? quelle est sa dépendance en L ?<br />
5. Flambage d’une poutre. Appuyez sur une règle tenu verticalement sur une table ; au<br />
delà d’une certaine force, la règle flambe (fig.1.5b). Ceci est un problème extrêmement<br />
important de la résistance des matériaux et conditionne la conception des tours pour<br />
qu’ils ne s’écroulent pas (en flambant) sous leurs propres poids. Repérons la barre par<br />
son écart à la droite y(x). En supposant faible l’écart de la barre par rapport à la droite,<br />
l’énergie de courbure de la barre est donné par sa courbure locale B(y ′′ (x) ) 2 . Nous<br />
supposons l’extrémité de la courbe maintenu à y = 0, mais pouvant coulisser sur l’axe<br />
x et soumis à une force F . Pour trouver la configuration qui minimise l’énergie, nous<br />
devons donc trouver l’extremum de la fonctionnelle<br />
soumis à la contrainte<br />
S[y, a] =<br />
∫ a<br />
0<br />
∫ a<br />
0<br />
B(y ′′ (x) ) 2 dx − F (L − a)<br />
{<br />
(1 + (1/2)y<br />
′2 } dx = L<br />
Nous avons approximé ici l’élément de ligne ds = √ 1 + y ′2 par son développement de<br />
Taylor, en supposant les écarts à la ligne (et leurs dérivées) faible. Démontrez alors que<br />
pour F > F c , la poutre droite n’est plus la solution optimum ; <strong>calcul</strong>er F c .<br />
19
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
6. Flambage d’une poutre II. Nous pouvons formuler différement le problème de flambage,<br />
en intégrant directement la contrainte dans le Lagrangien. Pour cela il suffit d’utiliser<br />
un système de coordonnées plus adaptés que les coordonnées cartesienne. Reperons<br />
un point le long de la poutre par sa longueur d’arc à partir de l’origine s, et par l’angle<br />
de la tangente à la courbe en ce point avec l’axe horizontal θ(s). Ce nouveau système de<br />
coordonnées est reliée aux coordonnées cartesiennes par la relation<br />
dx = cos θds<br />
dy = sin θds<br />
La courbure de la courbe en un point est simplement donnée par dθ/ds. L’énergie s’écrit<br />
alors simplement<br />
∫ L<br />
S[θ] =<br />
{B ( θ ′) }<br />
2 + F cos θ ds − F L<br />
0<br />
Que l’on peut traiter par les équation d’EL sans contrainte : la longueur d’arc s gère<br />
automatiquement la constance de la longueur totale de la poutre. <strong>Le</strong>s coordonnées semiintrinsèque<br />
(s, θ) sont très utilisé en géométrie différentielle. Noter de plus la grande<br />
similarité de l’action à celle de l’oscillation d’une pendule dans le champs de la gravité.<br />
7. isopérimétrique II. Chercher la courbe sous forme paramétrique x = x(t), y = y(t)<br />
avec la condition supplémentaire x(1) = x(0) et y(1) = y(0). Ecrire tout au moins les<br />
équations d’Euler-Lagrange.<br />
8. Isopérimétrique III. Quelle est la courbe de surface donnée qui minimise son périmètre ?<br />
9. Equation de la chainette. Une chaîne y(x) est suspendu entre deux points distant<br />
de a. La longueur totale de la chaîne est L. Trouver l’équation de la chaîne. Help :<br />
A l’évidence, la chaîne doit minimiser l’énergie potentielle, avec une contrainte sur sa<br />
longueur. L’energie potentielle est de la forme ∫ ρyds ; on doit donc trouver le minimum<br />
de<br />
∫ a/2<br />
H ′ =<br />
{ρy √ 1 + y ′ (x) 2 − λ √ }<br />
1 + y ′ (x) 2 dx<br />
−a/2<br />
où λ est un multiplicateur de Lagrange. Obtenez également l’équation de la chaînette à<br />
laquelle on a suspendu un pont (fig.1.5c)<br />
10. Trajectoire complexe. Soit une fonction y(x) complexe (R → C) dont l’action est<br />
définie par<br />
∫<br />
S[y] = L(y, y ′ , y ∗ , y ∗′ ; x)dx<br />
I<br />
Comme par exemple L = y ′ y ∗′ + kyy ∗ . Obtenir les équations d’Euler-Lagrange de cette<br />
fonction. [Help : il faut démontrer que l’on peut considerer y et y ∗ comme deux composantes<br />
indépendantes, et obtenir une equation d’EL pour chacune].<br />
20
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
11. Equation de Schrodinger. Nous cherchons la fonction complexe ψ(x, t) qui optimise<br />
l’action associé au Lagrangien suivant<br />
L = iψ ∗ ∂ t ψ − a(∂ x ψ ∗ )(∂ x ψ) − V (r)ψ ∗ ψ<br />
Trouver l’équation d’Euler Lagrange auquel obéit la fonction ψ. Dans la formulation<br />
ci-dessus, ψ et ψ ∗ ne jouent pas le même rôle. Pouvez vous donner une version plus<br />
symétrique de ce Lagrangien ?<br />
12. Champs électromagnétique dans le vide. Nous définissons un champ A = (A 0 , A 1 , A 2 , A 3 )<br />
dans un espace à 4 dimensions que l’on repère à l’aide des coordonnées x = (x 0 , x 1 , x 2 , x 3 ) 13 .<br />
Comme nous sommes parfois trop habitué à la séparation en espace (3d) et en temps, nous<br />
dissocions parfois les expressions ci-dessus en donnant des noms différents aux différents<br />
composants : nous notons par exemple A = (φ, −A) où nous appelons φ le potentiel<br />
et A le potentiel vecteur ; de même, nous notons x = (t, x) où le premier composant<br />
est appelé temps et les trois autres l’espace. <strong>Le</strong>s équations d’électromagnétisme ont été<br />
formulé dans le cadre de cette séparation étrange et les différentes dérivées du champ<br />
ont reçu des noms différents. Par exemple, on appelle champ électrique le vecteur à 3<br />
dimensions<br />
E = −∂ t A − ∇φ<br />
et champ magnétique<br />
H = ∇ × A<br />
Revenons à notre formulation générale. <strong>Le</strong> tenseur électromagnétique est défini par<br />
F ik = ∂A k<br />
∂x i<br />
− ∂A i<br />
∂x k<br />
Ce tenseur est bien sûr anti-symétrique F ik = −F ki .<br />
1. Donner l’expression du tenseur F en fonction des champs E i et H k .<br />
2. Démontrer que pour trois indices i, j, k, la definition même du tenseur F impose<br />
∂F ij<br />
+ ∂F jk<br />
+ ∂F ki<br />
= 0<br />
∂x k ∂x i ∂x j<br />
démontrer que les seules équations non-triviales sont celles où i ≠ j ≠ l et cela<br />
nous donne 4 équations que nous pouvons regrouper en<br />
∇ × E = −∂ t H<br />
∇.H = 0<br />
qui ne sont rien d’autre que les deux premieres équations de Maxwell.<br />
13. Nous évitons pour l’instant les exposants et notons les coordonnées x i au lieu de x i<br />
21
1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />
Dans l’espace-temps reliativiste, la “distance” ds entre deux points voisins est donnée par<br />
ds 2 = dx 2 0 − (dx 2 1 + dx 2 2 + dx 2 3) =<br />
3∑<br />
ɛ i dx 2 i<br />
i=0<br />
où ɛ 0 = 1 et ɛ i≥1 = −1. Il existe une différence entre une des composantes et les trois<br />
autres quant au signe qu’il faut utiliser pour l’élément d’arc. Cette différence apparaît<br />
obligatoirement dans toutes les expressions des lois physiques. En particulier, toutes les<br />
expressions quadratiques auront une forme similaire à l’expression de l’élément d’arc. Par<br />
exemple, l’action du champs électromagnétique est donnée par l’intégrale sur un volume<br />
du Lagrangien suivant 14 :<br />
L = −<br />
3∑<br />
i,j=0<br />
ɛ i ɛ j F 2<br />
ij<br />
Remarquer la similarité entre cette formulation et la formulation de la théorie de l’élasticité,<br />
où le champs A représente le vecteur déplacement et le tenseur F ij le tenseur<br />
déformation. Ceci n’est pas un hasard ; Maxwell lui même imaginait l’ether comme un<br />
corps élastique et s’inspirait fortement de la théorie de l’élasticité.<br />
1. Déduire que l’on peut mettre le Lagrangien sous forme de L = E 2 − H 2<br />
2. Déduire les équations du champs<br />
3∑<br />
j=0<br />
ɛ i ɛ j<br />
∂F ij<br />
∂x j<br />
= 0<br />
3. Mettre ces équations sous la forme plus usuelle des deux autres équations de<br />
Maxwell :<br />
∇ × H = ∂ t E ; ∇.E = 0<br />
14. <strong>Le</strong> signe moins n’a pas de conséquence pour nos <strong>calcul</strong>s, mais assure que la solution trouvée est un<br />
minimum plutôt qu’un maximum de l’action.<br />
22