01.04.2015 Views

1 Le calcul variationnel

1 Le calcul variationnel

1 Le calcul variationnel

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

1.1 Introduction.<br />

Dès que vous avez vu les bases de l’analyse, vous avez appris à répondre à la question<br />

suivante : comment trouver le point x pour lequel la fonction f(x) est maximum (ou<br />

minimum) ? f est une machine qui prend un nombre en entrée et produit un nombre en<br />

sortie. La question ci-dessus en réalité est celle de trouver un extremum local : un point<br />

qui produit la sortie la plus grande (ou la plus petite) que tous ses voisins immédiats.<br />

Nous savons que pour un tel point x∗,<br />

f ′ (x∗) = 0.<br />

Donnons nous maintenant une fonctionnelle L.Ceci est une machine qui prend une fonction<br />

en entrée et produit un nombre en sortie. Par exemple<br />

S(f) =<br />

∫ b<br />

a<br />

[<br />

f(x) 2 + f ′2 (x) ] dx (1.1)<br />

est une fonctionnelle qui prend une fonction, ajoute son carré et le carré de sa dérivée et<br />

les intègre entre deux bornes pour produire un nombre. Si on entre la fonction sin x dans<br />

cette machine, elle produit le nombre b − a. Si on y entre la fonction exp x, elle produit<br />

le nombre 2 exp(2b) − 2 exp(2a).<br />

<strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong> consiste à répondre à la question suivante : quelle est la fonction<br />

f qui produit la plus grande sortie S(f) ? La réponse que nous allons voir par la suite est<br />

que f doit satisfaire une équation différentielle qui est relié à la forme de la fonctionnelle<br />

S.<br />

Donnons deux exemples avant d’aller plus loin.<br />

Brachistochrone. L’exemple le plus important historiquement est celui du brachistochrone.<br />

Soit un point A(0, 0) situé dans le plan vertical, relié à un point B(x 1 , y 1 )<br />

par un toboggan dont la forme est donnée par la fonction y = f(x). On laisse un objet<br />

glisser sans frottement du point A le long du toboggan. Comment choisir la forme du<br />

toboggan, (la fonction f), pour que le temps d’arrivé au point B soit minimum ? Vous<br />

voyez qu’une fois qu’on se donne un toboggan, c’est à dire une fonction, en utilisant<br />

quelques notion de mécanique et de conservation d’énergie, on peut <strong>calcul</strong>er le temps<br />

de parcours, c’est à dire un scalaire. Essayons de mettre cela en forme. La vitesse de<br />

l’objet à l’ordonnée y vaut √ 2gy.L’élément d’arc ds = √ dx 2 + dy 2 = √ (1 + f ′ (x) 2 dx<br />

est parcouru en un temps dt = ds/v. <strong>Le</strong> temps total du parcours est donc<br />

∫<br />

√<br />

x1<br />

1 + f<br />

T =<br />

′ (x) 2<br />

dx<br />

2gf(x)<br />

0<br />

1


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

Et il faut trouver la fonction f qui minimise cette intégrale 1 . Ce problème avait été lancé<br />

comme un défi par un des frères Bernoulli vers 1690 (à peine dix ans après l’invention<br />

du <strong>calcul</strong> différentiel) à la communauté scientifiques. Tous les grands (Newton, <strong>Le</strong>ibnitz,<br />

l’autre Bernoulli, Hospital, ...) y répondirent. Euler (~1740) a trouvé une solution générale<br />

de ce genre de problème et Lagrange (~1780) les a généralisé à la mécanique.<br />

Mécanique analytique. Prenons une particule de masse m qui quitte le point x = 0<br />

au temps t = 0 et arrive à un autre point x = x 1 au temps t = t 1 . Cette particule est<br />

soumise à un potentiel V (x). <strong>Le</strong> mouvement de la particule est donné par la fonction<br />

x(t). La fonction x(t) qui minimise<br />

S =<br />

∫ t1<br />

0<br />

[<br />

(m/2)ẋ 2 (t) − V (x(t)) ] dt (1.2)<br />

est la trajectoire suivie par la particule. Ceci est une nouvelle formulation de la mécanique.<br />

Classiquement, nous résolvons l’équation différentielle F = ma où la fonction<br />

F (x) = −dV/dx et a = d 2 x/dt 2 pour remonter à la trajectoire x(t). Ici, la démarche<br />

est différente : de toute les trajectoires possibles qui relie (0, 0) à (t 1 , x 1 ), la particule<br />

choisit justement celle qui minimise l’intégrale (1.2). Comme si un dieu <strong>calcul</strong>ait le coût<br />

(qu’on appelle l’action S) de chaque trajectoire et choisissait la meilleure. Bien sûr, cette<br />

formulation de la mécanique et la formulation Newtonienne sont équivalente, bien que<br />

la formulation lagrangienne soit beaucoup plus profonde et pratique. Notez que la quantité<br />

dans l’intégrale n’est pas l’énergie totale, mais l’énergie cinétique moins l’énergie<br />

potentielle. On appelle cette quantité le Lagrangien.<br />

1.2 Calcul des variations.<br />

Formulons correctement notre problème (nous n’allons pas attaquer le cas le plus<br />

général pour l’instant). Soit la fonctionnelle<br />

S[f] =<br />

∫ b<br />

a<br />

L[f(t), f ′ (t), t]dt (1.3)<br />

Trouver la fonction f(t), avec les conditions f(a) = y 0 et f(b) = y 1 pour laquelle l’intégrale<br />

est un extremum.<br />

Traditionnellement, la fonction L qui se trouve sous l’intégrale est appelé le Lagrangien.<br />

C’est une fonction tout ce qu’il y a de plus normal. Par exemple, L(x, y) = x 2 + y 2 .<br />

Comme à un instant donné, f(t) et f ′ (t) sont des nombres, il est tout à fait légitime de<br />

<strong>calcul</strong>er L[f(t), f ′ (t)] qui dans ce cas, vaut f(t) 2 + f ′ (t) 2 comme l’expression que nous<br />

avions écrit dans (1.1). En plus, nous avons le droit de prendre les dérivées partielles de<br />

L : par exemple, dans ce cas, ∂L/∂x = 2x et ∂L/∂y = 2y. Il est usuel, si nous avions<br />

1. A première vue, il semble qu’il manque quelque à cette formulation : l’intégrale ne contient pas de<br />

référence à y 1 et nous n’exigeons apparemment pas que la particule finisse sa trajectoire à l’ordonné y 1.<br />

Nous y reviendrons plus tard, quand nous aborderons les contraines.<br />

2


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

y1<br />

y0<br />

f+εg<br />

g<br />

f<br />

a<br />

b<br />

Figure 1.1: Une fonction f et une variation g autour de cette fonction.<br />

noté L[f(t), f ′ (t)], de noter ces dérivées partielles par ∂L/∂f et ∂L/∂f ′ : cela veut juste<br />

dire “dérivée partielle par rapport au premier ou deuxième argument”. Dans ce cas, nous<br />

aurions eu par exemple ∂L/∂f ′ = 2f ′ (t). D’ailleurs, si vous remarquez, ∂L/∂f ′ est ici<br />

une fonction de t et on peut par exemple prendre sa dérivée par rapport au temps :<br />

d[∂L/∂f ′ ]/dt = 2f ′′ (t). Si au début, vous trouvez cette notation abrupte, remplacez f<br />

et f ′ avant les dérivations par x et y, et remettez les à leur place une fois les opérations<br />

terminées. Mais on prend vite l’habitude de ces notations. Notez également que l’on ne<br />

cherche pas n’importe quelle fonction, mais les fonctions qui prennent des valeurs bien<br />

déterminée (y 0 et y 1 ) aux bords a et b.<br />

Avant d’aller plus loin, revenons un instant au cas d’une fonction f(x) dont ont veut<br />

trouver l’extremum. Si nous connaissons la valeur de la fonction au point x, alors son<br />

accroissement quand on se déplace au point x + ɛ est donnée par<br />

df = f(x + ɛ) − f(x) = A(x)ɛ + termes d’ordres ɛ 2 + ...<br />

La première partie de l’accroissement (celle qui est importante quand ɛ est petit) est<br />

linéaire en ɛ : si nous avions pris un ɛ deux fois plus grand, nous aurions eu un accroissement<br />

deux fois plus grand également. La fonction A(x) est le coefficient de proportionnalité<br />

entre df et ɛ au point x, et nous avons plus l’habitude de la noter par f ′ (x). <strong>Le</strong><br />

point x est un extremum si le coefficient de proportionnalité f ′ (x) = 0, c’est à dire qu’en<br />

se déplaçant autour du point x, l’accroissement de f (à l’ordre 1 en ɛ ) est nulle.<br />

Nous n’avons qu’à suivre cette méthodologie pour trouver l’extremum de notre fonctionnelle<br />

S[f] : Nous allons ajouter la fonction ɛg(t) à la fonction f(t), et <strong>calcul</strong>er l’accroissement<br />

de la fonctionnelle dS = S[f + ɛg] − S[f]. Avec un peu de chance, cette<br />

accroissement comporte un terme linéaire en ɛ :<br />

dS = S[f + ɛg] − S[f] = A[f, g].ɛ + termes d’ordre ɛ 2 + ...<br />

où A[f, g] est un coefficient de proportionnalité qui dépend des fonctions f et g. Nous<br />

disons que f est un extremum si A[f, g] = 0 quelque soit g ! Cela est analogue à trou-<br />

3


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

ver l’extremum d’une fonction de plusieurs variables : le point (x ∗ , y ∗ , z ∗ , ...) est un extremum<br />

de la fonction f(x, y, z, ...) si en ce point, quelque soit le déplacement ( par<br />

exemple (dx, 0, 0, ...) ou (0, dy, dz, ...) ) la partie linéaire de l’accroissement est nulle. Une<br />

fonction, comme nous l’avons vu au chapitre 1, n’est finalement qu’un point dans un<br />

espace à dimension infini ; une fonctionnelle est comme une fonction d’une infinité de<br />

variable. Quelque soit g dans l’expression précédente veut simplement dire quelque soit<br />

le déplacement dans cet espace.<br />

Il faut prendre une précaution : nous ne cherchons que des fonctions pour lesquelles<br />

f(a) = y 0 et f(b) = y 1 . Comme f satisfait déjà à cette condition, pour que f + ɛg la<br />

fasse également, nous ne devons considérer que des fonctions g tel que g(a) = g(b) = 0.<br />

<strong>Le</strong>s fonctions g ne sont pas donc tout à fait quelconque. Nous obtenons :<br />

S[f + ɛg] =<br />

∫ b<br />

a<br />

= S[f] + ɛ<br />

L[f(t) + ɛg(t) , f ′ (t) + ɛg ′ (t)]dt (1.4)<br />

∫ b<br />

a<br />

∫<br />

∂L<br />

b<br />

∂f g(t)dt + ɛ ∂L<br />

∂f ′ g′ (t)dt + ...<br />

où nous avons simplement utilisé le fait que L(x + h, y + k) = L(x, y) + (∂L/∂x)h +<br />

(∂L/∂y)k + ... On peut déjà voir la partie linéaire apparaître. Nous pouvons mettre la<br />

deuxième intégrale un peu plus en forme en faisant une intégration par partie :<br />

∫ b<br />

a<br />

[ ]<br />

∂L<br />

∂L b ∫ b<br />

[ ]<br />

∂f ′ g′ (t)dt =<br />

∂f ′ g(t) d ∂L<br />

−<br />

a a dt ∂f ′ g(t)dt<br />

La première partie est nulle, puisque la fonction g vaut justement 0 sur les bords. En<br />

remettant ce qui reste dans l’expression (1.4), nous avons :<br />

dS = ɛ<br />

∫ b<br />

a<br />

{ ∂L<br />

∂f − d [ ]} ∂L<br />

dt ∂f ′ g(t)dt + ...<br />

L’intégrale est notre facteur de proportionnalité entre dS et ɛ. Si la fonction f est un<br />

extremum, alors l’intégrale doit être nulle quelque soit la fonction g. La seule possibilité<br />

est donc que f satisfasse à l’équation différentielle<br />

∂L<br />

∂f − d dt<br />

a<br />

[ ] ∂L<br />

∂f ′ = 0 (1.5)<br />

qui est appelé l’équation d’Euler-Lagrange. Notez que cette équation est homogène dimentionnellement.<br />

Faisons quelques exercices pour nous fixer les idées.<br />

Identité de Beltrami.<br />

d<br />

dt<br />

{<br />

f ′ ∂L<br />

∂f ′ − L }<br />

Evaluons l’expression<br />

′′ ∂L<br />

= f<br />

= f ′ ( d<br />

dt<br />

( ) ∂L<br />

∂f<br />

( )<br />

′<br />

∂L<br />

∂f ′ − ∂L<br />

∂f<br />

∂f ′ + f ′ d dt<br />

− ∂L<br />

∂f f ′ − ∂L<br />

∂f ′ f ′′ − ∂L<br />

∂t<br />

)<br />

− ∂L<br />

∂t<br />

4


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

Si L ne dépende pas explicitement de t, alors ∂L/∂t = 0 ; par ailleurs, l’expression entre<br />

parenthèse n’est que l’équation d’Euler-Lagrange et vaut zéro par construction. Nous en<br />

déduisons que si le Lagrangien ne dépend pas explicitement du temps, alors<br />

f ′ ∂L<br />

∂f ′ − L = Cte<br />

Ceci est appelé l’identité de Beltrami. En mécanique, ceci n’est rien d’autre que la conservation<br />

d’énergie (exercice : le démontrer) ; elle est cependant de portée plus générale et<br />

facilite grandement les <strong>calcul</strong>s dans les problèmes où la variable indépendante n’intervient<br />

pas explicitement, comme dans le problème du brachistochrone.<br />

Exemple : Mécanique et loi de Newton. En mécanique analytique d’un point matériel,<br />

le lagrangien est L = T − V , où T est l’énergie cinétique est V l’énergie potentiel. Si<br />

on se restreint au cas unidimensionnel où une particule est soumis à un potentiel V (x),<br />

alors pour la particule de trajectoire x(t),<br />

L(x, ẋ) = (1/2)mẋ 2 − V (x).<br />

<strong>Le</strong> premier terme de l’équation d’Euler-Lagrange est<br />

∂L<br />

∂x = −dV dx<br />

Comme nous l’avons mentionné ci-dessus, le seul terme qui dépend de la première variable<br />

x est V (x). Remplacer mentalement la deuxième variable ẋpar y dans l’expression<br />

du lagrangien avant la dérivation si cela vous dérange. La dérivation par rapport à la<br />

deuxième variable ( ẋ )donne<br />

∂L<br />

∂ẋ = mẋ<br />

et la dérivation par rapport au temps de cette dernière nous donne<br />

et l’équation d’E.L. s’écrit finalement<br />

d<br />

dt<br />

[ ∂L<br />

∂ẋ<br />

]<br />

= mẍ<br />

mẍ + dV/dx = 0<br />

Ce qui est bien sûr la même chose que l’équation de Newton F = ma.<br />

Allons un peu plus loin. Supposons que le potentiel est constant V (x) = Cte, s’est à<br />

dire que la particule se meut dans une région de l’espace où il n’est pas soumis à une force.<br />

On peut également dire que cette région de l’espace possède une symétrie d’invariance<br />

par translation : deux particules identiques placé à deux endroits différents de l’espace<br />

réagirait exactement de même ; dit encore autrement, nous n’avons aucune méthode pour<br />

déterminer où l’on se trouve dans l’espace. Dans ce cas, ∂L/∂x = 0, et l’équation d’E.L.<br />

s’écrit<br />

d<br />

dt<br />

[ ∂L<br />

∂ẋ<br />

]<br />

= 0<br />

5


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

ou encore la quantité p = ∂L/∂ẋ = Cte. Or, p n’est autre chose que la quantité du<br />

mouvement p = mẋ. Donc, symétrie d’invariance par translation dans l’espace nous<br />

impose la conservation de la quantité du mouvement. C’est un concept extrêmement<br />

profond 2 : à chaque symétrie du Lagrangien correspond une loi de conservation. La<br />

conservation de l’énergie est liée à la symétrie de translation dans le temps, la conservation<br />

du moment cinétique est associé à l’invariance par rotation autour d’un axe et ainsi<br />

de suite. En physique, une théorie n’est bien formé que si on peut la formuler sous<br />

forme <strong>variationnel</strong>le et chercher, par la symétrie sous-jacente du lagrangien, ses lois de<br />

conservation. Plus tard dans ce chapitre, nous verrons les formulations lagrangienne de<br />

l’électromagnétisme et de la mécanique quantique quand nous verrons comment traiter<br />

les champs.<br />

Plusieurs degrés de libertés et contraintes. Parfois, souvent, le lagrangien dépend de<br />

plusieurs fonctions. Par exemple, une particule dans l’espace habituel possède trois degrés<br />

de libertés x 1 , x 2 , x 3 et L = L(x 1 , x 2 , x 3 , x˙<br />

1 , x˙<br />

2 , x˙<br />

3 ). Si les x i sont les coordonnées cartésiennes,<br />

nous avons L = (m/2) ∑ i x2 i − V (r). La démarche ci-dessus peut-être répétée<br />

mot à mot pour démontrer que nous aurons une équation d’E.L. pour chaque degrés de<br />

liberté :<br />

∂L<br />

− d [ ] ∂L<br />

= 0 (1.6)<br />

∂x i dt ∂ẋ i<br />

L’approche lagrangienne ne dépend pas du choix de coordonnées, bien évidemment. Il<br />

suffit donc de pouvoir écrire l’énergie cinétique et potentielle pour déduire les équations<br />

du mouvement de façon automatique.<br />

Exemple 1 : mouvement dans un champ central. Il est facile de passer de l’expression<br />

de l’énergie cinétique en coordonnées cartésiennes (on pose m = 1) T = ẋ 2 + ẏ 2 + ż 2 aux<br />

coordonnées sphériques, T = ṙ 2 + r 2 ˙θ2 + r 2 sin 2 θ ˙φ 2 . L’énergie potentiel est V (r), ce qui<br />

donne le lagrangien<br />

L = ṙ 2 + r 2 ˙θ2 + r 2 sin 2 θ ˙φ 2 − V (r)<br />

En écrivant E.L. pour θ :<br />

4rṙ ˙θ + 2r 2 ¨θ − 2r 2 sin θ cos θ ˙φ 2 = 0 (1.7)<br />

Nous remarquons que nous avons une symétrie : si nous avions choisi nos axes pour que<br />

à t = 0, θ = π/2 et ˙θ = 0 ( ce qui revient à choisir le plan xy défini par le rayon vecteur<br />

de la particule et sa vitesse ), alors θ(t) = π/2 vérifie trivialement l’équation (1.7) : la<br />

particule reste dans le plan xy. <strong>Le</strong> lagrangien s’écrit plus simplement donc<br />

L = ṙ 2 + r 2 ˙φ2 − V (r)<br />

Nous remarquons que φ n’intervient pas dans le lagrangien, le moment associé à cette<br />

variable se conserve donc :<br />

p φ = ∂L<br />

∂ ˙φ = 2r2 ˙φ = cte<br />

2. Ceci s’appelle le théorème de Noether, du nom de la mathématicienne allemande qui l’a formulé<br />

vers 1912.<br />

6


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

Ceci n’est rien d’autre que la conservation du moment cinétique, comme nous l’avions<br />

annoncé ci-dessus. Finalement, il faut écrire l’E.L. pour r et résoudre les équations différentielles<br />

résultantes. <strong>Le</strong> lecteur trouvera la solution de ses équations dans les livres de<br />

mécanique.<br />

Exemple 2 : Pendule paramétrique. Soit un pendule de masse m = 1 restreint au plan<br />

xy (on suppose la gravité selon l’axe y) dont la longueur varie de façon périodique dans<br />

le temps : l = l(t). Quelle est son équation de mouvement ?<br />

<strong>Le</strong> système possède un seul degrés de liberté. Nous choisissons l’angle θ que fait le<br />

pendule avec l’axe y comme ce degrés. L’énergie cinétique est donnée par T = (ẋ 2 +ẏ 2 )/2.<br />

Comme x = l sin θ et y = l cos θ, T = ( ˙l 2 + l 2 ˙θ2 )/2. L’énergie potentiel est U = gy =<br />

−gl cos θ. Pour le premier terme de l’équation E.L., nous avons<br />

[ ]<br />

d ∂L<br />

dt ∂ ˙θ<br />

= d [ ]<br />

l 2 ˙θ<br />

dt<br />

= l 2 ¨θ + 2l ˙l ˙θ<br />

Comme par ailleurs, ∂L/∂θ = −∂U/∂θ = −gl sin θ, nous trouvons l’équation du mouvement<br />

:<br />

¨θ + 2<br />

(<br />

˙l/l<br />

)<br />

˙θ + (g/l) sin θ = 0<br />

Si l est constante, nous retrouvons l’équation classique d’un pendule. Si maintenant l<br />

oscille faiblement autour d’une position moyenne l = l 0 + l 1 sin ωt, l 0 ≫ l 1 , on peut<br />

démontrer qu’il y a phénomène de résonance si la fréquence d’excitation ω est le double<br />

de la fréquence propre Ω = √ g/l 0 ; la phase de l’oscillateur est alors bloquée (à 0 ou π) sur<br />

la phase de l’excitation. Ce procédé est largement utilisé dans les circuits électroniques.<br />

Vous avez sans doute remarqué avec quelle facilité l’on obtient les équations du mouvement.<br />

En aucun cas on ne doit chercher les forces des réactions des contraintes, comme<br />

dans le cas de la formulation Newtonienne. Il existe une interprétation géométrique extrêmement<br />

profonde de cette approche qui peut-être trouvé dans les livres de mécanique<br />

analytique. Nous ne continuerons pas plus le sujet ici.<br />

1.3 Formulation Lagrangienne et équation du mouvement<br />

d’un champ.<br />

Là où le <strong>calcul</strong> <strong>variationnel</strong> montre toute sa puissance est pour l’obtention d’équations<br />

d’évolution pour un champ : la hauteur d’une corde vibrante, le champ électromagnétique,<br />

le champ des contraintes élastique dans un solide, le champ des amplitudes en mécanique<br />

quantique. Peut importe le champ, il suffit de pouvoir formuler un lagrangien, c’est à dire<br />

l’énergie cinétique moins l’énergie potentielle, et le tour est joué. La différence par rapport<br />

à ce que nous avons développé ci-dessus est minime. Jusque là, nous avions considéré des<br />

lagrangiens fonctions de plusieurs x i , chacune de ces dernières fonction d’une variable<br />

t. Là, nous allons considérer des lagrangien fonction de plusieurs φ i , chacune de ces<br />

dernières fonction de plusieurs variable.<br />

7


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

Exemple fondamental. Pour fixer les idées, considérons le cas de la corde vibrante<br />

fixée à ces deux extrémités (x = 0 et x = L). A chaque instant t, la hauteur de la<br />

corde à la position x est donnée par φ(x, t). Étant donnée la forme de la corde à l’instant<br />

t 0 (φ(x, t 0 ) = y 0 (x) ) et t 1 (φ(x, t 1 ) = y 1 (x) ), quelle est l’évolution de la corde qui minimise<br />

l’action ? La trajectoire de la corde est alors la surface reliant y 0 (x) à y 1 (x) dans le temps.<br />

A un instant donnée t, l’énergie cinétique de la corde est donnée par la somme de<br />

l’énergie cinétique de tout ses points matériel,<br />

T =<br />

∫ L<br />

0<br />

ρ (∂φ/∂t) 2 dx<br />

et son énergie potentielle est l’énergie élastique des déformations<br />

V =<br />

∫ L<br />

0<br />

k (∂φ/∂x) 2 dx (1.8)<br />

où ρ est la densité de la ligne et k sa constante élastique. Notant c 2 = k/ρ, l’action (le<br />

coût d’une trajectoire φ(x, t) ) est<br />

S[φ] =<br />

∫ t1<br />

∫ L<br />

t 0<br />

0<br />

[<br />

(∂φ/∂t) 2 − c 2 (∂φ/∂x) 2] dxdt<br />

En considérant une variation ɛg(x, t) autour de la trajectoire φ(x, t), nous trouvons qu’à<br />

l’ordre 1 en ɛ, la variation de l’action est<br />

∫ t1<br />

S[φ + ɛg] − S[φ] = ɛ<br />

t 0<br />

∫ L<br />

0<br />

[ ∂φ ∂g<br />

∂t ∂t<br />

En faisant des intégration par partie, nous trouvons<br />

δS =<br />

∫ t1<br />

∫ L<br />

t 0<br />

0<br />

− c2<br />

∂φ<br />

∂x<br />

[ ∂ 2 ]<br />

φ<br />

∂t 2 − c2 ∂2 φ<br />

∂x 2 gdxdt<br />

∂g<br />

∂x<br />

]<br />

dxdt<br />

δS = 0 quelque soit la variation g que si le terme entre []est nul, c’est à dire<br />

∂ 2 φ<br />

∂t 2 − c2 ∂2 φ<br />

∂x 2 = 0<br />

qui est bien sûr l’équation d’onde bien connue.<br />

Equation générale du mouvement de champ. Nous pouvons maintenant généraliser<br />

cette approche par des <strong>calcul</strong>s aussi élémentaires que ceux ci-dessus, l’étape le plus technique<br />

étant une intégration par partie. Soit un domaine D dans un esapce à n dimensions,<br />

où nous cherchons à trouver l’extrémum de la fonctionnelle<br />

∫<br />

S[u] = L(u ,1 , ..., u ,n , u, x 1 , ...x n )d n x<br />

D<br />

8


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

où u ,i = ∂u/∂x i . La valeur de la fonction u(x 1 , ..., x n ) sur la frontière du domaine D<br />

étant fixé. L’équation d’Euler-Lagrange pour ce champ est donné par<br />

n∑<br />

i=1<br />

( )<br />

∂ ∂L<br />

− ∂L<br />

∂x i ∂u ,i ∂u = 0<br />

Remarquez que cette expression est une simple généralisation d’EL à une dimension :<br />

l’expression de dérivation de moment (d/dx)(∂L/∂u ′ ) est remplacée par la somme de<br />

toutes les dérivées partielles.<br />

Tenseur energie-impulsion. Nous pouvons pousser un peu plus loin. Nous avons vu<br />

l’égalité de Beltrami quand nous avons une fonction d’une variable et que le lagrangien<br />

ne dépend pas de la variable indépendante :<br />

{<br />

d<br />

y ′ ∂L }<br />

dx ∂y ′ − L = 0<br />

ou si nous voulions l’écrire avec nos notations sophistiquées<br />

{<br />

}<br />

d ∂L<br />

y ,x − L = 0<br />

dx ∂y ,x<br />

ou nous avons noté y ,x = y ′ = dy/dx. Si L représente le Lagrangien de la mécnaique<br />

analytique, le terme entre crochet rerpésente l’Hamiltonien, une quantité scalaire. Nous<br />

pouvons généraliser ce concept au lagrangien d’un champ u(x 1 , x 2 , ...x n ) qui ne dépend<br />

pas explicitement des variables indépendantes. En notant 3<br />

T ij = u ,i<br />

( ∂L<br />

∂u ,j<br />

)<br />

− δ ij L<br />

nous pouvons obtenir l’équivalent de l’identité de Beltrami pour un champ :<br />

n∑<br />

j=1<br />

∂T ij<br />

∂x j<br />

= 0<br />

la quantité T qui joue le rôle de l’Hamiltonian pour le champ est souvent appelé en<br />

physique le tenseur énergie-impulsion. <strong>Le</strong> lecteur interessé pourra consulter des livres de<br />

géométrie pour voir la signification générale de ce tenseur 4 .<br />

3. Rappelons que δ ij = 0 si i ≠ j et 1 sinon. Ceci est appelé le symbole de Kroneker<br />

4. Notons quand même que cela ressembe à une expression du genre divT = 0. Classiquement, la<br />

divergence est défini pour un vecteur et est fortement associée au flux de ce vecteur à travers une surface.<br />

Il n’est pas trop difficile de donner un sens au concept du flux d’un tenseur.<br />

9


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

Exercices.<br />

1. Pour une corde vibrante dans un champ de gravitation, nous devons ajouter le<br />

terme V g = ∫ I ρ′ φdx à l’énergie potentielle (1.8) où ρ ′ est le produit de la densité par<br />

l’accélaration de la gravité. Déduire l’équation du mouvement du champ dans ce cas.<br />

Même question si la corde se trouve dans un potentiel harmonique V h = ∫ I κφ2 dx.<br />

2. Calculer le tenseur energie-impulsion pour la corde vibrante sans potentiel extérieur.<br />

Que représente T tt ? Que veut dire l’identité de Beltrami dans ce cas ?<br />

Que représente alors T tx ?<br />

3. Déduire les équations du mouvements d’un champ dans un espace à n−dimension,<br />

où l’expression de l’énergie potentielle (interne) est donné par V = ∫ I k(∇φ)2 dr.<br />

Ceci généralise l’équation de la corde vibrante.<br />

4. Déduire l’équation du mouvement d’un champ dans un espace à n−dimension<br />

anisotrope, où l’expression de l’énergie potentielle (interne) est donné par<br />

∫<br />

∑ ∂φ ∂φ<br />

V = a ij dr<br />

∂x i ∂x j<br />

I<br />

i,j<br />

où pour les coefficients, nous pouvons supposer a ij = a ji (pourquoi ?). Ce genre<br />

d’expression se rencontre fréquemment dans des problèmes comme l’élasticité des<br />

cristaux, où les déformations dans les différentes directions ne sont pas équivalentes.<br />

1.4 Optimisation sous contraintes.<br />

1.4.1 <strong>Le</strong>s déplacements compatibles.<br />

Oublions pour l’instant le problème de l’extremum d’une fonctionnelle, et revenons au<br />

problème beaucoup plus simple de l’extremum d’une fonction de plusieurs variables. Soit<br />

la fonction f(x, y) dont nous cherchons l’extremum. Nous savons qu’au point extremum,<br />

les termes linéaires des variations doivent être nulle<br />

df = f(x + h, y + k) − f(x, y) =<br />

( ∂f<br />

∂x<br />

)<br />

h +<br />

( ) ∂f<br />

k + O(h 2 , k 2 )<br />

∂y<br />

et ceci quelque soit h, k : quelque soit la direction que l’on prend au point extremum, le<br />

terme linéaire de la variation doit être nulle.<br />

Supposons maintenant que nous ajoutons une contrainte : nous ne cherchons pas l’extremum<br />

absolu de f, mais un point x ∗ qui satisfasse en plus à la contrainte g(x, y) = 0.<br />

Par exemple, nous savons que le minimum de la fonction f(x, y) = x 2 + y 2 est le point<br />

(0, 0). Mais si nous contraignons notre point à se déplacer sur la courbe y = ax+b, b ≠ 0,<br />

le point (0, 0) n’est pas atteignable. On peut cependant chercher un point qui minimise f<br />

avec la contrainte donnée 5 . Dans le cas simple que nous somme en train de traiter ici, on<br />

peut résoudre une coordonnées par rapport à l’autre et ramener la fonction à une seule<br />

5. Imaginer que vous marchez en montagne sur un chemin, et vous vous intéressez au point le plus<br />

bas sur ce chemin et non pas en général.<br />

10


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

4<br />

g(x,y)=0<br />

2<br />

A<br />

0<br />

O<br />

−2<br />

−4<br />

−4 −2 0 2 4<br />

Figure 1.2: La fonction f(x, y) = x 2 + y 2 est représentée par ses courbes de niveau. <strong>Le</strong><br />

minimum absolu de cette fonction est le point O = (0, 0). <strong>Le</strong> point le “plus<br />

bas” de la fonction qui doit également appartenir à la courbe g(x, y) = 0<br />

est le point A.<br />

variable (degrés de liberté) : f(x) = x 2 + (ax + b) 2 et chercher maintenant le minimum<br />

de cette nouvelle fonction (où les contraintes ont été absorbées). En général cependant,<br />

la fonction contrainte g(x, y) = 0 est suffisamment compliquée pour qu’on ne puisse pas<br />

résoudre une des coordonnées par rapport aux autres.<br />

Revenons à la définition général : la variation linéaire de la fonction autour du point<br />

extremum (x ∗ , y ∗ ) doit être nulle quelque soit le déplacement (h, k) autour de ce point. En<br />

présence des contraintes, nous relâchons cette exigence : il faut que la variation linéaire<br />

autour du point (x ∗ , y ∗ ) soit nulle seulement pour les déplacement (h, k) compatible avec<br />

les contraintes 6 . <strong>Le</strong>s déplacements compatibles avec la contrainte g(x, y) = 0 sont données<br />

par<br />

(∂g/∂x)h + (∂g/∂y)k = 0<br />

Ceci nous donne une équation supplémentaire à considérer avec l’équation<br />

df = (∂f/∂x)h + (∂f/∂y)k = 0<br />

Nous sommes arrivés à un système de deux équations à deux inconnus linéaire. En résolvant<br />

k en fonction de h dans la première équation et en l’injectant dans la deuxième,<br />

et en exigeant maintenant que df soit nulle quelque soit h, nous obtenons 7<br />

(∂f/∂x)(∂g/∂y) − (∂f/∂y)(∂g/∂x) = 0 (1.9)<br />

Ceci est une condition supplémentaire sur l’extremum de la fonction f.<br />

6. En mécanique, cela est appelé la méthode des travaux virtuels<br />

7. On peut également dire que pour que le système Ah + Bk = 0, Ch + Dk = 0 ait une solution non<br />

trivial h = k = 0, il faut que le déterminant de la matrice<br />

( ) A B<br />

soit nulle.<br />

C<br />

D<br />

11


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

Exemple. Trouver l’extremum de la fonction f(x, y) = x 2 + y 2 avec la contrainte<br />

g(x, y) = −ax + y − b = 0. En écrivant la condition (1.9), nous obtenons<br />

(2x)1 − (2y)(−a) = 0<br />

ou autrement dit, x + ay = 0. En combinant cette équation avec la contrainte y = ax + b,<br />

nous trouvons les coordonnées du point extremum : x ∗ = −ab/(1 + a 2 ), y ∗ = b/(1 + a 2 ).<br />

1.4.2 <strong>Le</strong>s multiplicateurs de Lagrange.<br />

Lagrange a introduit une méthode équivalente à ce que nous venons de voir ci-dessus.<br />

Nous voulons optimiser f(x, y) avec la contrainte g(x, y) = 0. Lagrange introduit une<br />

variable supplémentaire, λ et considère maintenant le problème de l’optimisation (libre)<br />

de la fonction F (x, y, λ) = f(x, y) − λg(x, y). Cela nous donne<br />

∂F<br />

∂x = ∂f<br />

∂x − λ ∂g<br />

∂x = 0 (1.10)<br />

∂F<br />

= ∂f<br />

∂y ∂y − λ∂g ∂y = 0 (1.11)<br />

∂F<br />

∂λ<br />

= g(x, y) = 0 (1.12)<br />

L’équation (1.12) n’est rien d’autre que la contrainte et assure que la solution trouvée<br />

est bien conforme. <strong>Le</strong>s deux premières équations (1.10,1.11) ne sont rien d’autre que la<br />

condition (1.9) si on y élimine λ.<br />

Re-exemple. Minimisons la fonction f(x, y) = x 2 + y 2 avec la contrainte g(x, y) =<br />

−ax + y − b = 0. Nous introduisons la fonction F (x, y) = x 2 + y 2 − λ(−ax + y − b). Cela<br />

nous donne<br />

2x + λa = 0<br />

2y − λ = 0<br />

Ce qui bien sûr nous donne x+ay = 0. Nous trouvons à nouveau le même point optimum ;<br />

de plus, si on le souhaite, on peut trouver également λ ∗ = 2y ∗ = 2b/(1 + a 2 ).<br />

<strong>Le</strong> coefficient λ est appelé un multiplicateur de Lagrange. La méthode a une signification<br />

physique profonde : supposons que nous avons un point matériel dans le potentiel<br />

f(x, y) astreint à rester sur la courbe g(x, y). Au point x ∗ , le point (qui est stable) est<br />

soumis à une force non-nulle de la part du potentiel F = (∂ x f, ∂ y f). Pour qu’il puisse<br />

rester sur la position x ∗ , il faut que la courbe g(x, y) exerce une force de réaction sur le<br />

point qui vaut justement λ ∗ (∂ x g,∂ y g). Si on enlevait la contrainte mais qu’on soumettait<br />

le point matériel à cette force supplémentaire, il se mettrait exactement à la même<br />

position. 8<br />

8. Cette dualité force-contrainte a joué un grand rôle dans le développement de la mécanique, de<br />

sa formulation Newtonienne dans les années ~1680 à l’apparition du livre de mécanique analytique par<br />

Lagrange en ~1780. Lagrange était fier de n’avoir pas inclus une seule figure dans son livre. En mécanique,<br />

la méthode de Lagrange nous permet de <strong>calcul</strong>er une position d’équilibre sans <strong>calcul</strong>er explicitement les<br />

forces de réactions.<br />

12


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

1.4.3 Généralisation des multiplicateurs de Lagrange.<br />

<strong>Le</strong>s multiplicateurs de Lagrange se généralise de façon naturelle aux fonctions de n<br />

variables soumis à m contrainte. Pour optimiser la fonction f(x 1 , ...x n ) soumise aux<br />

contraintes g 1 (x 1 , ...x n ) = 0,...,g m (x 1 , ...x n ) = 0, nous considérons la nouvelle fonction F<br />

de n + m variable<br />

F (x 1 , ...x n ; λ 1 , ...λ m ) = f(x 1 , ...x n ) − λ 1 g 1 (x 1 , ...x n ) − ... − λ m g m (x 1 , ...x n )<br />

Nous chercherons l’extremum (sans contrainte) de la fonction F .<br />

Exercice. Démontrer le cas général, en suivant le chemin déjà tracé.<br />

La méthode des multiplicateurs de Lagrange se généralise très naturellement aux fonctionnelles.<br />

Si Nous devons trouver le minimum de la fonctionnelle S[y] = ∫ I L(y′ , y, x)dx<br />

avec la contrainte ∫ I g(y′ , y)dx = A, il nous suffit d’introduire la fonctionnelle<br />

∫<br />

S ′ {<br />

[y; λ] = L(y ′ , y, x) − λg(y ′ , y) }<br />

I<br />

et de chercher le minimum de cette fonctionnelle par les techniques habituelles du <strong>calcul</strong><br />

des variations ( expliquer pourquoi nous pouvons omettre la constante A) .<br />

Exemple : <strong>Le</strong> problème isopérimétrique. Trouver la courbe fermé de longueur donné<br />

qui maximise sa surface.<br />

Supposons 9 que nous pouvons représenter la courbe par une fonction R(θ). Nous cherchons<br />

à minimiser la fonctionnelle<br />

avec la contrainte<br />

S[R] =<br />

Considérons la nouvelle fonctionnelle<br />

S ′ [R(θ); λ] =<br />

∫ 2π<br />

0<br />

∫ 2π<br />

0<br />

∫ 2π<br />

0<br />

(1/2)R 2 (θ)dθ (1.13)<br />

R(θ)dθ = L (1.14)<br />

{<br />

(1/2)R 2 (θ) − λR(θ) } dθ<br />

<strong>Le</strong> terme entre {} (que nous continuons d’appeler le Lagrangien) ne contient même pas<br />

de dérivée de R ; l’équation d’Euler-Lagrange nous donne directement<br />

R − λ = 0<br />

c’est à dire R = λ = Cte. Ceci est bien un cercle. Pour trouver λ, nous utilisons la<br />

contrainte (1.14), qui nous donne λ = L/2π. La courbe qui minimise la surface est donc<br />

un cercle de rayon R = L/2π.<br />

9. Ceci est une très grosse supposition. <strong>Le</strong> lecteur a intérêt a tracer quelques courbes qui ne sont<br />

pas représentable par une fonction R(θ) pour se rendre compte de la simplification que nous assumons<br />

derrière cette supposition.<br />

13


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

Exemple : distribution d’énergie dans un système isolé. Soit un système isolé ayant<br />

N particule (N → +∞) et soit c(x) le nombre relatif de particule ayant une énergie dans<br />

l’intervalle [x, x + dx[. Comme le système est isolé, le nombre de particules et l’énergie<br />

totale sont conservés :<br />

∫ ∞<br />

0<br />

∫ ∞<br />

0<br />

c(x)dx = 1 (1.15)<br />

xc(x)dx = T (1.16)<br />

où nous appelons T l’énergie moyenne par particule : T = E 0 /N avec E 0 l’énergie totale<br />

du système. <strong>Le</strong> théorème H de Boltzmann nous apprend que la fonction c(x) doit être<br />

choisi de façon à ce que la quantité<br />

H [c] =<br />

∫ ∞<br />

0<br />

c(x). log [c(x)] dx (1.17)<br />

soit extremum. La quantité −H est souvent appelé entropie. Avec les deux contraintes<br />

(1.15,1.16), nous devons donc chercher l’extremum de la fonctionnelle<br />

H ′ [c; λ, µ] =<br />

∫ ∞<br />

0<br />

c(x). log [c(x)] dx − λ<br />

∫ ∞<br />

0<br />

c(x)dx − µ<br />

∫ ∞<br />

0<br />

xc(x)dx<br />

<strong>Le</strong> <strong>calcul</strong> est assez simple dans ce cas, puisque nous n’avons pas de dérivés dans la<br />

fonctionnelle. En cherchant la valeur de la fonctionnelle pour H ′ [c + ɛg; λ, µ] et en nous<br />

contentant d’ordre 1 en ɛ, nous trouvons<br />

H ′ [c + ɛg; λ, µ] = H ′ [c; λ, µ] + ɛ<br />

∫ ∞<br />

0<br />

(1 + log c − λ − µx) g(x)dx<br />

la fonction c(x) est un extremum de la fonctionnelle H ′ si les variations linéaires sont<br />

nulle ∀g, c’est à dire si<br />

log c = (λ − 1) + µx<br />

ou autrement dit c(x) = Ae −µx ; l’utilisation des deux contraintes nous donne A = −µ =<br />

1/T . Autrement dit,<br />

c(x) = (1/T )e −x/T<br />

1.4.4 Formulation <strong>variationnel</strong>le des systèmes Sturm-Liouville.<br />

Rappelons qu’un système Sturm-Liouville est une équation aux valeurs propres<br />

α(x)y ′′ + β(x)y ′ + γ(x)y = λy<br />

Nous avons mentionné (et insisté) que si nous trouvons un poids w(x) qui rend l’opérateur<br />

hermitien, alors les solutions des systèmes SL minimise une certaine fonctionnelle. Nous<br />

avons vu que si une telle fonction poids existe, alors elle doit obeïr à l’équation (αw) ′ =<br />

βw et le système peut alors s’écrire sous la forme alternative<br />

d (<br />

wαy<br />

′ ) + wγy = λwy<br />

dx<br />

14


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

Remarquer que cette forme ressemble furieusement à une équation Euler-Lagrange. On<br />

peut faire le chemin inverse : minimiser la fonctionnelle<br />

∫<br />

(<br />

S[y] = p(x)y ′2 + q(x)y 2) dx<br />

avec la contrainte<br />

∫<br />

I<br />

I<br />

w(x)y 2 dx = 1<br />

Comme on peut le voir, nous pouvons formellement identifier l’équation d’Euler-Lagrange<br />

du système ci-dessus à un système SL en posant p = wα, q = −wγ. A regarder de plus<br />

près, la formulation <strong>variationnel</strong>le d’un système SL, si on assimile la variable x au temps,<br />

ressemble beaucoup à un oscillateur harmonique avec une masse et une constante de<br />

ressort dépendant du temps. Ceci, comme nous l’avons mentionné, est le point de départ<br />

de l’approximation WKB.<br />

1.5 <strong>Le</strong>s conditions aux bords “naturelles”.<br />

Revenons à notre formulation initiale de problème d’éxtremum. Nous voulons trouver<br />

l’extremum de la fonctionnelle<br />

avec les conditions aux bords fixée<br />

S[y] =<br />

∫ b<br />

a<br />

L(y ′ , y, x)dx<br />

y(a) = y 0 ; y(b) = y 1<br />

Pour cela, nous avons écrit la variation de S en fonction d’une petite perturbation g(x)<br />

pour obtenir<br />

[ ] ∂L b ∫ b<br />

{ ∂L<br />

δS =<br />

∂y ′ g +<br />

a a ∂y − d }<br />

∂L<br />

dx ∂y ′ gdx<br />

et nous avons cherché dans quelles conditions, δS = 0 quelque soit g(x). Nos conditions<br />

aux bords nous ont imposées g(a) = g(b) = 0, donc le premier terme est nul ; le deuxième<br />

terme nous donne les équations d’E-L.<br />

Ceci dit, nous pouvons relacher nos contraintes, et ne pas<br />

exiger que y(a) = y 0 , y(b) = y 0 . <strong>Le</strong> problème serait alors :<br />

parmis toutes les courbes entre a et b, trouver celle qui extrémise<br />

la fonctionnelle. Dans ce cas, l’annulation de δS exige<br />

toujours l’annulation de l’intégrale, qui nous donnera comme<br />

d’habitude les équation d’Euler Lagrange, et l’annulation du<br />

terme de bord. Or, cette fois, comme les bords ne sont plus<br />

fixe, nous n’avons plus g(a) = g(b) = 0, pour annuler les<br />

termes de surface, nous devons exiger<br />

Figure 1.3: Bords libres<br />

∂L<br />

∂y ′ ∣<br />

∣∣∣x=a,b<br />

= 0<br />

15


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

ce qui nous fournit deux nouvelles conditions en remplacement des conditions y(a) = y 0 ,<br />

y(b) = y 0 .<br />

Pour illustrer ce principe, considérons un lagrangien qui contient des dérivées d’ordre<br />

2 : L = L(y ′′ , y ′ , y, x). Dans ce cas, la variation s’écrit<br />

[ ∂L<br />

δS =<br />

∂y ′ g − d<br />

]<br />

∂L ∂L b ∫ b<br />

{ ∂L<br />

g +<br />

dx ∂y ′′ ∂y ′′ g′ +<br />

a a ∂y − d<br />

}<br />

∂L<br />

dx ∂y ′ + d2 ∂L<br />

dx 2 ∂y ′′ gdx<br />

Pour une poutre élastique soumis à une charge f(x) par exmeple, l’énergie s’écrit<br />

E =<br />

∫ L<br />

0<br />

{<br />

By ′′2 − f(x)y } dx<br />

Si la poutre est encastrée (a), nous avons les conditions y(0) =<br />

y(L) = 0 et y ′ (0) = y ′ (L) = 0. Dans ce cas, le terme de bord est<br />

automatiquement nulle. Par contre, si la poutre est seulement posé<br />

(b), nous avons seulement y(0) = y(L) = 0. Pour trouver les deux<br />

autres conditions et annuler le terme de bord, nous devons avoir<br />

∂L/∂y ′′ = 0, c’est à dire y ′′ (0) = y ′′ (L) = 0. Nous laissons au lecteur<br />

le soin de trouver les conditions aux limites pour le cas (c).<br />

Dans les exemples ci-dessus, l’abscisse x était fixée sur les deux<br />

bords, y ayant la liberté de bouger le long d’une droite verticale. Figure 1.4: poutres<br />

Nous pouvons généraliser encore plus en relachant cette contrainte<br />

fixées.<br />

et permettre aux points sur les bords de se mouvoir le long d’une<br />

courbe quelconque. Nous laissons le soin au lecteur d’obtenir les conditions aux limites<br />

nécessaires dans ce cas. Un exemple typique est de trouver le chemin le plus court entre<br />

deux courbes f(x, y) = 0, g(x, y) = 0 sur une surface z = z(x, y) ; ou encore, pour les<br />

militaires, choisir le meilleur trajectoire pour lancer un missile air-air et abattre l’avion<br />

ennemie.<br />

(a)<br />

(b)<br />

(c)<br />

1.6 Détour : éléments de géométries non-euclidiennes.<br />

<strong>Le</strong> cinquième axiome d’Euclide est le suivant : “d’un point en dehors d’une droite, on<br />

ne peut tracer qu’une et une seule droite parallèle au premier”. Pendant deux millénaires,<br />

les mathémiticiens ont cru que ceci n’est pas un axiome, mais un théorème que l’on peut<br />

démontrer à partir des quatre premier axiomes. A partir de 1830, il est devenu claire<br />

que le cinquième mérite le titre d’axiome et qu’on peut tout a fait formuler d’autres<br />

géométries qui acceptent d’autres axiomes. Nous allons étudier une version simplifiée de<br />

la géométrie riemanienne. Pour cela, nous devons donner un sens précis au mot “droite” :<br />

nous le définirons dorénavent comme le chemin le plus court entre deux points ; il est<br />

plus habituel alors d’appeler cela une géodésique. Supposons que nous avons muni notre<br />

espace bidimensionnel d’un système de coordonnées (x 1 , x 2 ). La distance entre deux<br />

points infiniments voisins est définie par<br />

ds 2 = ∑ i,j<br />

g ij dx i dx j<br />

16


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

où g ij = g ij (x 1 , x 2 ) est appelé le tenseur métrique. Par exemple, si nous avons muni le<br />

plan euclidien de coordonées polaires, ds 2 = dr 2 +r 2 dθ 2 et nous avons (en posant x 1 = r,<br />

x 2 = θ), g 11 = 1, g 22 = x 2 , g 12 = g 21 = 0.<br />

Nous allons considérer dans la suite le cas très particulier où g 11 = 1, g i≠j = 0 et<br />

g 22 = g 2 (x), où g est une fonction quelconque 10 . <strong>Le</strong> prérimètre d’une courbe y(x) reliant<br />

deux points est donnée par<br />

l[y(x)] =<br />

∫ 2<br />

1<br />

√<br />

1 + g 2 (x)y ′2 dx<br />

et il est élémentaire de montrer, d’après les précédents paragraphes, que l’équation<br />

d’Euler-Lagrange nous donne immédiatement l’équation de la courbe :<br />

y ′ = a/g √ g 2 − a 2<br />

où a est une constante d’intégration. Dans le cas des coordonnées polaire par exemple où<br />

g(x) = x, nous pouvons intégrer l’équation ci-dessus 11 et obtenir l’équation d’une droite<br />

y = α + arccos(a/x) où a et α sont deux constante d’intégration. Pour vous convaincre<br />

que cela est effectivement le cas, Il suffit d’intepréter x comme r et y comme θ, faire un<br />

petit schéma et quelques manipulations d’angles .<br />

Prenons le cas plus intéressant pour nous de g(x) = sin(x). A nouveau, l’intégration<br />

s’effectue sans difficulté 12 et nous obtenons<br />

y = ψ + arccos (cos α cot x)<br />

où ψ et α sont deux constantes d’intégration. Nous voyons par exemple que pour α = π/2,<br />

nous avons une famille de droites données par y = Cte. Prenons la géodésique y = 0 et<br />

considérons le point P = (π/2, π/2) en dehors de cette droite. Toute les droites traversant<br />

ce point doivent avoir le paramètre ψ = 0. Il n’est pas alors difficile de voir que toute ces<br />

droites croisent la droite y = 0 au point cot x = 1/ cos α.<br />

Nous venons de démontrer dans ce cas que toutes les droites traversant P croisent une<br />

droite ne contenant pas P ; cela est très différent du cinquième axiome d’Euclide. <strong>Le</strong> cas<br />

que nous venons de traiter correpsond à la géométrie sphérique : sur la sphére unité, la<br />

distance entre deux points est donnée par ds 2 = dθ 2 + sin 2 θdφ 2 . Mais le point de vue<br />

de Rieman est beaucoup plus fondamental que cela : ce qui caractérise l’espace et qui<br />

lui donne sa substance est la donnée du tenseur métrique. <strong>Le</strong>s habitants de la surface<br />

de la sphère unité ne peuvent pas voir qu’ils sont sur une sphére. Ils peuvent par contre<br />

visionner les géodésiques (en suivant les trajets des faisceaux de lumière ) et déterminer<br />

la nature de leur espace en faisant des mesures par exemple de la somme des angles d’un<br />

triangle formé par trois géodésiques. C’est exactement dans ce cadre qu’Einstein a formulé<br />

sa théorie de gravité en 1917, où les masses confèrent de la courbure à l’espace-temps.<br />

10. Nous noterons par habitude les coordonnées (x, y) sans leur associer l’idée de coordonnées cartesiennes<br />

11. il suffit d’effectuer le changement de variable u = a/x<br />

12. Il suffit de poser u = cot x<br />

17


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

z<br />

r(z)<br />

y<br />

L<br />

a<br />

F<br />

x<br />

(a) (b) (c)<br />

Figure 1.5: (a) : surface minimum entre deux cercle ; (b) flambage d’une barre ; (c) pont<br />

suspendu à une chaînette.<br />

A ajouter.<br />

1. Discuter la Jauge dans le Lagragian et eventuellement le theorème de Noether.<br />

Problèmes.<br />

1. Surface minimum. Soit deux cercles concentriques de rayon à priori différents disposés<br />

l’un au dessus de l’autre à une hauteur h. Quelle est la forme de la surface d’aire<br />

minimum qui relie les deux cercles (fig. 1.5a) ?<br />

2. Energie de courbure. Comment faut-il écrire les équations d’Euler-Lagrange si le Lagrangien<br />

contient des dérivées secondes ? Plus spécifiquement, supposer que le Lagrangien<br />

est de la forme L = y ′′ (x) 2 + V (y). Généraliser ensuite au cas L = L(y ′′ , y ′ , y, x).<br />

3. Brachistochrone. Nous voulons minimiser<br />

∫<br />

√<br />

x1<br />

1 + y<br />

T =<br />

′2<br />

dx<br />

y<br />

0<br />

En utilisant l’identité de Beltrami, démontrer que la courbe y(x) doit obéir à l’équation<br />

−1<br />

y(1 + y ′2 ) = C<br />

où C est une constante. Résoudre cette équation du première ordre en démontrant d’abord<br />

que<br />

√ y<br />

dx = dy<br />

2a − y<br />

où nous avons posé 1/C 2 = 2a ; integrer cette dernière équation en posant y = a(1−cos θ).<br />

[Help : nous devons obtenir l’équation du cycloïde sous forme paramétrique.]<br />

18


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

4. Elasticité 1-d. Soit une barre dont on repère les points (avant deformation) par la coordonnées<br />

x. On appuie sur la barre parralèlelement à son axe ; les points de la barre se déplacent<br />

aux coordonnées x ′ (Figure 1.6). Nous appelons déplacement u(x) = x ′ −x la fonction<br />

qui traque cette quantité. L’énergie élastique stocké dans la barre est proportionnel<br />

au carré du gradient de ce terme :<br />

E =<br />

∫ L<br />

0<br />

(1/2)ku ′ (x) 2 dx<br />

où k est la constante élastique de la barre (qu’on appelle<br />

également le module d’Young). La force a effectué le travail<br />

W = F u(L). L’énergie totale de la barre s’écrit donc<br />

E =<br />

∫ L<br />

0<br />

{<br />

(1/2)ku ′ (x) 2 − F u ′ (x) } dx<br />

Démontrer alors que u(x) = ax où à est une constante à<br />

determiner. Déterminer a en utilisant les conditions aux bords<br />

naturelles (section 1.5). En déduite la loi d’élasticité de Hook<br />

Figure 1.6:<br />

F = Ku(L)<br />

Que vaut K ? quelle est sa dépendance en L ?<br />

5. Flambage d’une poutre. Appuyez sur une règle tenu verticalement sur une table ; au<br />

delà d’une certaine force, la règle flambe (fig.1.5b). Ceci est un problème extrêmement<br />

important de la résistance des matériaux et conditionne la conception des tours pour<br />

qu’ils ne s’écroulent pas (en flambant) sous leurs propres poids. Repérons la barre par<br />

son écart à la droite y(x). En supposant faible l’écart de la barre par rapport à la droite,<br />

l’énergie de courbure de la barre est donné par sa courbure locale B(y ′′ (x) ) 2 . Nous<br />

supposons l’extrémité de la courbe maintenu à y = 0, mais pouvant coulisser sur l’axe<br />

x et soumis à une force F . Pour trouver la configuration qui minimise l’énergie, nous<br />

devons donc trouver l’extremum de la fonctionnelle<br />

soumis à la contrainte<br />

S[y, a] =<br />

∫ a<br />

0<br />

∫ a<br />

0<br />

B(y ′′ (x) ) 2 dx − F (L − a)<br />

{<br />

(1 + (1/2)y<br />

′2 } dx = L<br />

Nous avons approximé ici l’élément de ligne ds = √ 1 + y ′2 par son développement de<br />

Taylor, en supposant les écarts à la ligne (et leurs dérivées) faible. Démontrez alors que<br />

pour F > F c , la poutre droite n’est plus la solution optimum ; <strong>calcul</strong>er F c .<br />

19


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

6. Flambage d’une poutre II. Nous pouvons formuler différement le problème de flambage,<br />

en intégrant directement la contrainte dans le Lagrangien. Pour cela il suffit d’utiliser<br />

un système de coordonnées plus adaptés que les coordonnées cartesienne. Reperons<br />

un point le long de la poutre par sa longueur d’arc à partir de l’origine s, et par l’angle<br />

de la tangente à la courbe en ce point avec l’axe horizontal θ(s). Ce nouveau système de<br />

coordonnées est reliée aux coordonnées cartesiennes par la relation<br />

dx = cos θds<br />

dy = sin θds<br />

La courbure de la courbe en un point est simplement donnée par dθ/ds. L’énergie s’écrit<br />

alors simplement<br />

∫ L<br />

S[θ] =<br />

{B ( θ ′) }<br />

2 + F cos θ ds − F L<br />

0<br />

Que l’on peut traiter par les équation d’EL sans contrainte : la longueur d’arc s gère<br />

automatiquement la constance de la longueur totale de la poutre. <strong>Le</strong>s coordonnées semiintrinsèque<br />

(s, θ) sont très utilisé en géométrie différentielle. Noter de plus la grande<br />

similarité de l’action à celle de l’oscillation d’une pendule dans le champs de la gravité.<br />

7. isopérimétrique II. Chercher la courbe sous forme paramétrique x = x(t), y = y(t)<br />

avec la condition supplémentaire x(1) = x(0) et y(1) = y(0). Ecrire tout au moins les<br />

équations d’Euler-Lagrange.<br />

8. Isopérimétrique III. Quelle est la courbe de surface donnée qui minimise son périmètre ?<br />

9. Equation de la chainette. Une chaîne y(x) est suspendu entre deux points distant<br />

de a. La longueur totale de la chaîne est L. Trouver l’équation de la chaîne. Help :<br />

A l’évidence, la chaîne doit minimiser l’énergie potentielle, avec une contrainte sur sa<br />

longueur. L’energie potentielle est de la forme ∫ ρyds ; on doit donc trouver le minimum<br />

de<br />

∫ a/2<br />

H ′ =<br />

{ρy √ 1 + y ′ (x) 2 − λ √ }<br />

1 + y ′ (x) 2 dx<br />

−a/2<br />

où λ est un multiplicateur de Lagrange. Obtenez également l’équation de la chaînette à<br />

laquelle on a suspendu un pont (fig.1.5c)<br />

10. Trajectoire complexe. Soit une fonction y(x) complexe (R → C) dont l’action est<br />

définie par<br />

∫<br />

S[y] = L(y, y ′ , y ∗ , y ∗′ ; x)dx<br />

I<br />

Comme par exemple L = y ′ y ∗′ + kyy ∗ . Obtenir les équations d’Euler-Lagrange de cette<br />

fonction. [Help : il faut démontrer que l’on peut considerer y et y ∗ comme deux composantes<br />

indépendantes, et obtenir une equation d’EL pour chacune].<br />

20


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

11. Equation de Schrodinger. Nous cherchons la fonction complexe ψ(x, t) qui optimise<br />

l’action associé au Lagrangien suivant<br />

L = iψ ∗ ∂ t ψ − a(∂ x ψ ∗ )(∂ x ψ) − V (r)ψ ∗ ψ<br />

Trouver l’équation d’Euler Lagrange auquel obéit la fonction ψ. Dans la formulation<br />

ci-dessus, ψ et ψ ∗ ne jouent pas le même rôle. Pouvez vous donner une version plus<br />

symétrique de ce Lagrangien ?<br />

12. Champs électromagnétique dans le vide. Nous définissons un champ A = (A 0 , A 1 , A 2 , A 3 )<br />

dans un espace à 4 dimensions que l’on repère à l’aide des coordonnées x = (x 0 , x 1 , x 2 , x 3 ) 13 .<br />

Comme nous sommes parfois trop habitué à la séparation en espace (3d) et en temps, nous<br />

dissocions parfois les expressions ci-dessus en donnant des noms différents aux différents<br />

composants : nous notons par exemple A = (φ, −A) où nous appelons φ le potentiel<br />

et A le potentiel vecteur ; de même, nous notons x = (t, x) où le premier composant<br />

est appelé temps et les trois autres l’espace. <strong>Le</strong>s équations d’électromagnétisme ont été<br />

formulé dans le cadre de cette séparation étrange et les différentes dérivées du champ<br />

ont reçu des noms différents. Par exemple, on appelle champ électrique le vecteur à 3<br />

dimensions<br />

E = −∂ t A − ∇φ<br />

et champ magnétique<br />

H = ∇ × A<br />

Revenons à notre formulation générale. <strong>Le</strong> tenseur électromagnétique est défini par<br />

F ik = ∂A k<br />

∂x i<br />

− ∂A i<br />

∂x k<br />

Ce tenseur est bien sûr anti-symétrique F ik = −F ki .<br />

1. Donner l’expression du tenseur F en fonction des champs E i et H k .<br />

2. Démontrer que pour trois indices i, j, k, la definition même du tenseur F impose<br />

∂F ij<br />

+ ∂F jk<br />

+ ∂F ki<br />

= 0<br />

∂x k ∂x i ∂x j<br />

démontrer que les seules équations non-triviales sont celles où i ≠ j ≠ l et cela<br />

nous donne 4 équations que nous pouvons regrouper en<br />

∇ × E = −∂ t H<br />

∇.H = 0<br />

qui ne sont rien d’autre que les deux premieres équations de Maxwell.<br />

13. Nous évitons pour l’instant les exposants et notons les coordonnées x i au lieu de x i<br />

21


1 <strong>Le</strong> <strong>calcul</strong> <strong>variationnel</strong><br />

Dans l’espace-temps reliativiste, la “distance” ds entre deux points voisins est donnée par<br />

ds 2 = dx 2 0 − (dx 2 1 + dx 2 2 + dx 2 3) =<br />

3∑<br />

ɛ i dx 2 i<br />

i=0<br />

où ɛ 0 = 1 et ɛ i≥1 = −1. Il existe une différence entre une des composantes et les trois<br />

autres quant au signe qu’il faut utiliser pour l’élément d’arc. Cette différence apparaît<br />

obligatoirement dans toutes les expressions des lois physiques. En particulier, toutes les<br />

expressions quadratiques auront une forme similaire à l’expression de l’élément d’arc. Par<br />

exemple, l’action du champs électromagnétique est donnée par l’intégrale sur un volume<br />

du Lagrangien suivant 14 :<br />

L = −<br />

3∑<br />

i,j=0<br />

ɛ i ɛ j F 2<br />

ij<br />

Remarquer la similarité entre cette formulation et la formulation de la théorie de l’élasticité,<br />

où le champs A représente le vecteur déplacement et le tenseur F ij le tenseur<br />

déformation. Ceci n’est pas un hasard ; Maxwell lui même imaginait l’ether comme un<br />

corps élastique et s’inspirait fortement de la théorie de l’élasticité.<br />

1. Déduire que l’on peut mettre le Lagrangien sous forme de L = E 2 − H 2<br />

2. Déduire les équations du champs<br />

3∑<br />

j=0<br />

ɛ i ɛ j<br />

∂F ij<br />

∂x j<br />

= 0<br />

3. Mettre ces équations sous la forme plus usuelle des deux autres équations de<br />

Maxwell :<br />

∇ × H = ∂ t E ; ∇.E = 0<br />

14. <strong>Le</strong> signe moins n’a pas de conséquence pour nos <strong>calcul</strong>s, mais assure que la solution trouvée est un<br />

minimum plutôt qu’un maximum de l’action.<br />

22

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!