1 Le calcul variationnel

1 Le calcul variationnel 

1.1 Introduction. 

Dès que vous avez vu les bases de l’analyse, vous avez appris à répondre à la question 

suivante : comment trouver le point x pour lequel la fonction f(x) est maximum (ou 

minimum) ? f est une machine qui prend un nombre en entrée et produit un nombre en 

sortie. La question ci-dessus en réalité est celle de trouver un extremum local : un point 

qui produit la sortie la plus grande (ou la plus petite) que tous ses voisins immédiats. 

Nous savons que pour un tel point x∗, 

f ′ (x∗) = 0. 

Donnons nous maintenant une fonctionnelle L.Ceci est une machine qui prend une fonction 

en entrée et produit un nombre en sortie. Par exemple 

S(f) = 

∫ b 

a 

[ 

f(x) 2 + f ′2 (x) ] dx (1.1) 

est une fonctionnelle qui prend une fonction, ajoute son carré et le carré de sa dérivée et 

les intègre entre deux bornes pour produire un nombre. Si on entre la fonction sin x dans 

cette machine, elle produit le nombre b − a. Si on y entre la fonction exp x, elle produit 

le nombre 2 exp(2b) − 2 exp(2a). 

Le calcul variationnel consiste à répondre à la question suivante : quelle est la fonction 

f qui produit la plus grande sortie S(f) ? La réponse que nous allons voir par la suite est 

que f doit satisfaire une équation différentielle qui est relié à la forme de la fonctionnelle 

S. 

Donnons deux exemples avant d’aller plus loin. 

Brachistochrone. L’exemple le plus important historiquement est celui du brachistochrone. 

Soit un point A(0, 0) situé dans le plan vertical, relié à un point B(x 1 , y 1 ) 

par un toboggan dont la forme est donnée par la fonction y = f(x). On laisse un objet 

glisser sans frottement du point A le long du toboggan. Comment choisir la forme du 

toboggan, (la fonction f), pour que le temps d’arrivé au point B soit minimum ? Vous 

voyez qu’une fois qu’on se donne un toboggan, c’est à dire une fonction, en utilisant 

quelques notion de mécanique et de conservation d’énergie, on peut calculer le temps 

de parcours, c’est à dire un scalaire. Essayons de mettre cela en forme. La vitesse de 

l’objet à l’ordonnée y vaut √ 2gy.L’élément d’arc ds = √ dx 2 + dy 2 = √ (1 + f ′ (x) 2 dx 

est parcouru en un temps dt = ds/v. Le temps total du parcours est donc 

∫ 

√ 

x1 

1 + f 

T = 

′ (x) 2 

dx 

2gf(x) 

0 

1


Et il faut trouver la fonction f qui minimise cette intégrale 1 . Ce problème avait été lancé 

comme un défi par un des frères Bernoulli vers 1690 (à peine dix ans après l’invention 

du calcul différentiel) à la communauté scientifiques. Tous les grands (Newton, Leibnitz, 

l’autre Bernoulli, Hospital, ...) y répondirent. Euler (~1740) a trouvé une solution générale 

de ce genre de problème et Lagrange (~1780) les a généralisé à la mécanique. 

Mécanique analytique. Prenons une particule de masse m qui quitte le point x = 0 

au temps t = 0 et arrive à un autre point x = x 1 au temps t = t 1 . Cette particule est 

soumise à un potentiel V (x). Le mouvement de la particule est donné par la fonction 

x(t). La fonction x(t) qui minimise 

S = 

∫ t1 

0 

[ 

(m/2)ẋ 2 (t) − V (x(t)) ] dt (1.2) 

est la trajectoire suivie par la particule. Ceci est une nouvelle formulation de la mécanique. 

Classiquement, nous résolvons l’équation différentielle F = ma où la fonction 

F (x) = −dV/dx et a = d 2 x/dt 2 pour remonter à la trajectoire x(t). Ici, la démarche 

est différente : de toute les trajectoires possibles qui relie (0, 0) à (t 1 , x 1 ), la particule 

choisit justement celle qui minimise l’intégrale (1.2). Comme si un dieu calculait le coût 

(qu’on appelle l’action S) de chaque trajectoire et choisissait la meilleure. Bien sûr, cette 

formulation de la mécanique et la formulation Newtonienne sont équivalente, bien que 

la formulation lagrangienne soit beaucoup plus profonde et pratique. Notez que la quantité 

dans l’intégrale n’est pas l’énergie totale, mais l’énergie cinétique moins l’énergie 

potentielle. On appelle cette quantité le Lagrangien. 

1.2 Calcul des variations. 

Formulons correctement notre problème (nous n’allons pas attaquer le cas le plus 

général pour l’instant). Soit la fonctionnelle 

S[f] = 

∫ b 

a 

L[f(t), f ′ (t), t]dt (1.3) 

Trouver la fonction f(t), avec les conditions f(a) = y 0 et f(b) = y 1 pour laquelle l’intégrale 

est un extremum. 

Traditionnellement, la fonction L qui se trouve sous l’intégrale est appelé le Lagrangien. 

C’est une fonction tout ce qu’il y a de plus normal. Par exemple, L(x, y) = x 2 + y 2 . 

Comme à un instant donné, f(t) et f ′ (t) sont des nombres, il est tout à fait légitime de 

calculer L[f(t), f ′ (t)] qui dans ce cas, vaut f(t) 2 + f ′ (t) 2 comme l’expression que nous 

avions écrit dans (1.1). En plus, nous avons le droit de prendre les dérivées partielles de 

L : par exemple, dans ce cas, ∂L/∂x = 2x et ∂L/∂y = 2y. Il est usuel, si nous avions 

1. A première vue, il semble qu’il manque quelque à cette formulation : l’intégrale ne contient pas de 

référence à y 1 et nous n’exigeons apparemment pas que la particule finisse sa trajectoire à l’ordonné y 1. 

Nous y reviendrons plus tard, quand nous aborderons les contraines. 

2


y1 

y0 

f+εg 

g 

f 

a 

b 

Figure 1.1: Une fonction f et une variation g autour de cette fonction. 

noté L[f(t), f ′ (t)], de noter ces dérivées partielles par ∂L/∂f et ∂L/∂f ′ : cela veut juste 

dire “dérivée partielle par rapport au premier ou deuxième argument”. Dans ce cas, nous 

aurions eu par exemple ∂L/∂f ′ = 2f ′ (t). D’ailleurs, si vous remarquez, ∂L/∂f ′ est ici 

une fonction de t et on peut par exemple prendre sa dérivée par rapport au temps : 

d[∂L/∂f ′ ]/dt = 2f ′′ (t). Si au début, vous trouvez cette notation abrupte, remplacez f 

et f ′ avant les dérivations par x et y, et remettez les à leur place une fois les opérations 

terminées. Mais on prend vite l’habitude de ces notations. Notez également que l’on ne 

cherche pas n’importe quelle fonction, mais les fonctions qui prennent des valeurs bien 

déterminée (y 0 et y 1 ) aux bords a et b. 

Avant d’aller plus loin, revenons un instant au cas d’une fonction f(x) dont ont veut 

trouver l’extremum. Si nous connaissons la valeur de la fonction au point x, alors son 

accroissement quand on se déplace au point x + ɛ est donnée par 

df = f(x + ɛ) − f(x) = A(x)ɛ + termes d’ordres ɛ 2 + ... 

La première partie de l’accroissement (celle qui est importante quand ɛ est petit) est 

linéaire en ɛ : si nous avions pris un ɛ deux fois plus grand, nous aurions eu un accroissement 

deux fois plus grand également. La fonction A(x) est le coefficient de proportionnalité 

entre df et ɛ au point x, et nous avons plus l’habitude de la noter par f ′ (x). Le 

point x est un extremum si le coefficient de proportionnalité f ′ (x) = 0, c’est à dire qu’en 

se déplaçant autour du point x, l’accroissement de f (à l’ordre 1 en ɛ ) est nulle. 

Nous n’avons qu’à suivre cette méthodologie pour trouver l’extremum de notre fonctionnelle 

S[f] : Nous allons ajouter la fonction ɛg(t) à la fonction f(t), et calculer l’accroissement 

de la fonctionnelle dS = S[f + ɛg] − S[f]. Avec un peu de chance, cette 

accroissement comporte un terme linéaire en ɛ : 

dS = S[f + ɛg] − S[f] = A[f, g].ɛ + termes d’ordre ɛ 2 + ... 

où A[f, g] est un coefficient de proportionnalité qui dépend des fonctions f et g. Nous 

disons que f est un extremum si A[f, g] = 0 quelque soit g ! Cela est analogue à trou- 

3


ver l’extremum d’une fonction de plusieurs variables : le point (x ∗ , y ∗ , z ∗ , ...) est un extremum 

de la fonction f(x, y, z, ...) si en ce point, quelque soit le déplacement ( par 

exemple (dx, 0, 0, ...) ou (0, dy, dz, ...) ) la partie linéaire de l’accroissement est nulle. Une 

fonction, comme nous l’avons vu au chapitre 1, n’est finalement qu’un point dans un 

espace à dimension infini ; une fonctionnelle est comme une fonction d’une infinité de 

variable. Quelque soit g dans l’expression précédente veut simplement dire quelque soit 

le déplacement dans cet espace. 

Il faut prendre une précaution : nous ne cherchons que des fonctions pour lesquelles 

f(a) = y 0 et f(b) = y 1 . Comme f satisfait déjà à cette condition, pour que f + ɛg la 

fasse également, nous ne devons considérer que des fonctions g tel que g(a) = g(b) = 0. 

Les fonctions g ne sont pas donc tout à fait quelconque. Nous obtenons : 

S[f + ɛg] = 

∫ b 

a 

= S[f] + ɛ 

L[f(t) + ɛg(t) , f ′ (t) + ɛg ′ (t)]dt (1.4) 

∫ b 

a 

∫ 

∂L 

b 

∂f g(t)dt + ɛ ∂L 

∂f ′ g′ (t)dt + ... 

où nous avons simplement utilisé le fait que L(x + h, y + k) = L(x, y) + (∂L/∂x)h + 

(∂L/∂y)k + ... On peut déjà voir la partie linéaire apparaître. Nous pouvons mettre la 

deuxième intégrale un peu plus en forme en faisant une intégration par partie : 

∫ b 

a 

[ ] 

∂L 

∂L b ∫ b 

[ ] 

∂f ′ g′ (t)dt = 

∂f ′ g(t) d ∂L 

− 

a a dt ∂f ′ g(t)dt 

La première partie est nulle, puisque la fonction g vaut justement 0 sur les bords. En 

remettant ce qui reste dans l’expression (1.4), nous avons : 

dS = ɛ 

∫ b 

a 

{ ∂L 

∂f − d [ ]} ∂L 

dt ∂f ′ g(t)dt + ... 

L’intégrale est notre facteur de proportionnalité entre dS et ɛ. Si la fonction f est un 

extremum, alors l’intégrale doit être nulle quelque soit la fonction g. La seule possibilité 

est donc que f satisfasse à l’équation différentielle 

∂L 

∂f − d dt 

a 

[ ] ∂L 

∂f ′ = 0 (1.5) 

qui est appelé l’équation d’Euler-Lagrange. Notez que cette équation est homogène dimentionnellement. 

Faisons quelques exercices pour nous fixer les idées. 

Identité de Beltrami. 

d 

dt 

{ 

f ′ ∂L 

∂f ′ − L } 

Evaluons l’expression 

′′ ∂L 

= f 

= f ′ ( d 

dt 

( ) ∂L 

∂f 

( ) 

′ 

∂L 

∂f ′ − ∂L 

∂f 

∂f ′ + f ′ d dt 

− ∂L 

∂f f ′ − ∂L 

∂f ′ f ′′ − ∂L 

∂t 

) 

− ∂L 

∂t 

4


Si L ne dépende pas explicitement de t, alors ∂L/∂t = 0 ; par ailleurs, l’expression entre 

parenthèse n’est que l’équation d’Euler-Lagrange et vaut zéro par construction. Nous en 

déduisons que si le Lagrangien ne dépend pas explicitement du temps, alors 

f ′ ∂L 

∂f ′ − L = Cte 

Ceci est appelé l’identité de Beltrami. En mécanique, ceci n’est rien d’autre que la conservation 

d’énergie (exercice : le démontrer) ; elle est cependant de portée plus générale et 

facilite grandement les calculs dans les problèmes où la variable indépendante n’intervient 

pas explicitement, comme dans le problème du brachistochrone. 

Exemple : Mécanique et loi de Newton. En mécanique analytique d’un point matériel, 

le lagrangien est L = T − V , où T est l’énergie cinétique est V l’énergie potentiel. Si 

on se restreint au cas unidimensionnel où une particule est soumis à un potentiel V (x), 

alors pour la particule de trajectoire x(t), 

L(x, ẋ) = (1/2)mẋ 2 − V (x). 

Le premier terme de l’équation d’Euler-Lagrange est 

∂L 

∂x = −dV dx 

Comme nous l’avons mentionné ci-dessus, le seul terme qui dépend de la première variable 

x est V (x). Remplacer mentalement la deuxième variable ẋpar y dans l’expression 

du lagrangien avant la dérivation si cela vous dérange. La dérivation par rapport à la 

deuxième variable ( ẋ )donne 

∂L 

∂ẋ = mẋ 

et la dérivation par rapport au temps de cette dernière nous donne 

et l’équation d’E.L. s’écrit finalement 

d 

dt 

[ ∂L 

∂ẋ 

] 

= mẍ 

mẍ + dV/dx = 0 

Ce qui est bien sûr la même chose que l’équation de Newton F = ma. 

Allons un peu plus loin. Supposons que le potentiel est constant V (x) = Cte, s’est à 

dire que la particule se meut dans une région de l’espace où il n’est pas soumis à une force. 

On peut également dire que cette région de l’espace possède une symétrie d’invariance 

par translation : deux particules identiques placé à deux endroits différents de l’espace 

réagirait exactement de même ; dit encore autrement, nous n’avons aucune méthode pour 

déterminer où l’on se trouve dans l’espace. Dans ce cas, ∂L/∂x = 0, et l’équation d’E.L. 

s’écrit 

d 

dt 

[ ∂L 

∂ẋ 

] 

= 0 

5


ou encore la quantité p = ∂L/∂ẋ = Cte. Or, p n’est autre chose que la quantité du 

mouvement p = mẋ. Donc, symétrie d’invariance par translation dans l’espace nous 

impose la conservation de la quantité du mouvement. C’est un concept extrêmement 

profond 2 : à chaque symétrie du Lagrangien correspond une loi de conservation. La 

conservation de l’énergie est liée à la symétrie de translation dans le temps, la conservation 

du moment cinétique est associé à l’invariance par rotation autour d’un axe et ainsi 

de suite. En physique, une théorie n’est bien formé que si on peut la formuler sous 

forme variationnelle et chercher, par la symétrie sous-jacente du lagrangien, ses lois de 

conservation. Plus tard dans ce chapitre, nous verrons les formulations lagrangienne de 

l’électromagnétisme et de la mécanique quantique quand nous verrons comment traiter 

les champs. 

Plusieurs degrés de libertés et contraintes. Parfois, souvent, le lagrangien dépend de 

plusieurs fonctions. Par exemple, une particule dans l’espace habituel possède trois degrés 

de libertés x 1 , x 2 , x 3 et L = L(x 1 , x 2 , x 3 , x˙ 

1 , x˙ 

2 , x˙ 

3 ). Si les x i sont les coordonnées cartésiennes, 

nous avons L = (m/2) ∑ i x2 i − V (r). La démarche ci-dessus peut-être répétée 

mot à mot pour démontrer que nous aurons une équation d’E.L. pour chaque degrés de 

liberté : 

∂L 

− d [ ] ∂L 

= 0 (1.6) 

∂x i dt ∂ẋ i 

L’approche lagrangienne ne dépend pas du choix de coordonnées, bien évidemment. Il 

suffit donc de pouvoir écrire l’énergie cinétique et potentielle pour déduire les équations 

du mouvement de façon automatique. 

Exemple 1 : mouvement dans un champ central. Il est facile de passer de l’expression 

de l’énergie cinétique en coordonnées cartésiennes (on pose m = 1) T = ẋ 2 + ẏ 2 + ż 2 aux 

coordonnées sphériques, T = ṙ 2 + r 2 ˙θ2 + r 2 sin 2 θ ˙φ 2 . L’énergie potentiel est V (r), ce qui 

donne le lagrangien 

L = ṙ 2 + r 2 ˙θ2 + r 2 sin 2 θ ˙φ 2 − V (r) 

En écrivant E.L. pour θ : 

4rṙ ˙θ + 2r 2 ¨θ − 2r 2 sin θ cos θ ˙φ 2 = 0 (1.7) 

Nous remarquons que nous avons une symétrie : si nous avions choisi nos axes pour que 

à t = 0, θ = π/2 et ˙θ = 0 ( ce qui revient à choisir le plan xy défini par le rayon vecteur 

de la particule et sa vitesse ), alors θ(t) = π/2 vérifie trivialement l’équation (1.7) : la 

particule reste dans le plan xy. Le lagrangien s’écrit plus simplement donc 

L = ṙ 2 + r 2 ˙φ2 − V (r) 

Nous remarquons que φ n’intervient pas dans le lagrangien, le moment associé à cette 

variable se conserve donc : 

p φ = ∂L 

∂ ˙φ = 2r2 ˙φ = cte 

2. Ceci s’appelle le théorème de Noether, du nom de la mathématicienne allemande qui l’a formulé 

vers 1912. 

6


Ceci n’est rien d’autre que la conservation du moment cinétique, comme nous l’avions 

annoncé ci-dessus. Finalement, il faut écrire l’E.L. pour r et résoudre les équations différentielles 

résultantes. Le lecteur trouvera la solution de ses équations dans les livres de 

mécanique. 

Exemple 2 : Pendule paramétrique. Soit un pendule de masse m = 1 restreint au plan 

xy (on suppose la gravité selon l’axe y) dont la longueur varie de façon périodique dans 

le temps : l = l(t). Quelle est son équation de mouvement ? 

Le système possède un seul degrés de liberté. Nous choisissons l’angle θ que fait le 

pendule avec l’axe y comme ce degrés. L’énergie cinétique est donnée par T = (ẋ 2 +ẏ 2 )/2. 

Comme x = l sin θ et y = l cos θ, T = ( ˙l 2 + l 2 ˙θ2 )/2. L’énergie potentiel est U = gy = 

−gl cos θ. Pour le premier terme de l’équation E.L., nous avons 

[ ] 

d ∂L 

dt ∂ ˙θ 

= d [ ] 

l 2 ˙θ 

dt 

= l 2 ¨θ + 2l ˙l ˙θ 

Comme par ailleurs, ∂L/∂θ = −∂U/∂θ = −gl sin θ, nous trouvons l’équation du mouvement 

: 

¨θ + 2 

( 

˙l/l 

) 

˙θ + (g/l) sin θ = 0 

Si l est constante, nous retrouvons l’équation classique d’un pendule. Si maintenant l 

oscille faiblement autour d’une position moyenne l = l 0 + l 1 sin ωt, l 0 ≫ l 1 , on peut 

démontrer qu’il y a phénomène de résonance si la fréquence d’excitation ω est le double 

de la fréquence propre Ω = √ g/l 0 ; la phase de l’oscillateur est alors bloquée (à 0 ou π) sur 

la phase de l’excitation. Ce procédé est largement utilisé dans les circuits électroniques. 

Vous avez sans doute remarqué avec quelle facilité l’on obtient les équations du mouvement. 

En aucun cas on ne doit chercher les forces des réactions des contraintes, comme 

dans le cas de la formulation Newtonienne. Il existe une interprétation géométrique extrêmement 

profonde de cette approche qui peut-être trouvé dans les livres de mécanique 

analytique. Nous ne continuerons pas plus le sujet ici. 

1.3 Formulation Lagrangienne et équation du mouvement 

d’un champ. 

Là où le calcul variationnel montre toute sa puissance est pour l’obtention d’équations 

d’évolution pour un champ : la hauteur d’une corde vibrante, le champ électromagnétique, 

le champ des contraintes élastique dans un solide, le champ des amplitudes en mécanique 

quantique. Peut importe le champ, il suffit de pouvoir formuler un lagrangien, c’est à dire 

l’énergie cinétique moins l’énergie potentielle, et le tour est joué. La différence par rapport 

à ce que nous avons développé ci-dessus est minime. Jusque là, nous avions considéré des 

lagrangiens fonctions de plusieurs x i , chacune de ces dernières fonction d’une variable 

t. Là, nous allons considérer des lagrangien fonction de plusieurs φ i , chacune de ces 

dernières fonction de plusieurs variable. 

7


Exemple fondamental. Pour fixer les idées, considérons le cas de la corde vibrante 

fixée à ces deux extrémités (x = 0 et x = L). A chaque instant t, la hauteur de la 

corde à la position x est donnée par φ(x, t). Étant donnée la forme de la corde à l’instant 

t 0 (φ(x, t 0 ) = y 0 (x) ) et t 1 (φ(x, t 1 ) = y 1 (x) ), quelle est l’évolution de la corde qui minimise 

l’action ? La trajectoire de la corde est alors la surface reliant y 0 (x) à y 1 (x) dans le temps. 

A un instant donnée t, l’énergie cinétique de la corde est donnée par la somme de 

l’énergie cinétique de tout ses points matériel, 

T = 

∫ L 

0 

ρ (∂φ/∂t) 2 dx 

et son énergie potentielle est l’énergie élastique des déformations 

V = 

∫ L 

0 

k (∂φ/∂x) 2 dx (1.8) 

où ρ est la densité de la ligne et k sa constante élastique. Notant c 2 = k/ρ, l’action (le 

coût d’une trajectoire φ(x, t) ) est 

S[φ] = 

∫ t1 

∫ L 

t 0 

0 

[ 

(∂φ/∂t) 2 − c 2 (∂φ/∂x) 2] dxdt 

En considérant une variation ɛg(x, t) autour de la trajectoire φ(x, t), nous trouvons qu’à 

l’ordre 1 en ɛ, la variation de l’action est 

∫ t1 

S[φ + ɛg] − S[φ] = ɛ 

t 0 

∫ L 

0 

[ ∂φ ∂g 

∂t ∂t 

En faisant des intégration par partie, nous trouvons 

δS = 

∫ t1 

∫ L 

t 0 

0 

− c2 

∂φ 

∂x 

[ ∂ 2 ] 

φ 

∂t 2 − c2 ∂2 φ 

∂x 2 gdxdt 

∂g 

∂x 

] 

dxdt 

δS = 0 quelque soit la variation g que si le terme entre []est nul, c’est à dire 

∂ 2 φ 

∂t 2 − c2 ∂2 φ 

∂x 2 = 0 

qui est bien sûr l’équation d’onde bien connue. 

Equation générale du mouvement de champ. Nous pouvons maintenant généraliser 

cette approche par des calculs aussi élémentaires que ceux ci-dessus, l’étape le plus technique 

étant une intégration par partie. Soit un domaine D dans un esapce à n dimensions, 

où nous cherchons à trouver l’extrémum de la fonctionnelle 

∫ 

S[u] = L(u ,1 , ..., u ,n , u, x 1 , ...x n )d n x 

D 

8


où u ,i = ∂u/∂x i . La valeur de la fonction u(x 1 , ..., x n ) sur la frontière du domaine D 

étant fixé. L’équation d’Euler-Lagrange pour ce champ est donné par 

n∑ 

i=1 

( ) 

∂ ∂L 

− ∂L 

∂x i ∂u ,i ∂u = 0 

Remarquez que cette expression est une simple généralisation d’EL à une dimension : 

l’expression de dérivation de moment (d/dx)(∂L/∂u ′ ) est remplacée par la somme de 

toutes les dérivées partielles. 

Tenseur energie-impulsion. Nous pouvons pousser un peu plus loin. Nous avons vu 

l’égalité de Beltrami quand nous avons une fonction d’une variable et que le lagrangien 

ne dépend pas de la variable indépendante : 

{ 

d 

y ′ ∂L } 

dx ∂y ′ − L = 0 

ou si nous voulions l’écrire avec nos notations sophistiquées 

{ 

} 

d ∂L 

y ,x − L = 0 

dx ∂y ,x 

ou nous avons noté y ,x = y ′ = dy/dx. Si L représente le Lagrangien de la mécnaique 

analytique, le terme entre crochet rerpésente l’Hamiltonien, une quantité scalaire. Nous 

pouvons généraliser ce concept au lagrangien d’un champ u(x 1 , x 2 , ...x n ) qui ne dépend 

pas explicitement des variables indépendantes. En notant 3 

T ij = u ,i 

( ∂L 

∂u ,j 

) 

− δ ij L 

nous pouvons obtenir l’équivalent de l’identité de Beltrami pour un champ : 

n∑ 

j=1 

∂T ij 

∂x j 

= 0 

la quantité T qui joue le rôle de l’Hamiltonian pour le champ est souvent appelé en 

physique le tenseur énergie-impulsion. Le lecteur interessé pourra consulter des livres de 

géométrie pour voir la signification générale de ce tenseur 4 . 

3. Rappelons que δ ij = 0 si i ≠ j et 1 sinon. Ceci est appelé le symbole de Kroneker 

4. Notons quand même que cela ressembe à une expression du genre divT = 0. Classiquement, la 

divergence est défini pour un vecteur et est fortement associée au flux de ce vecteur à travers une surface. 

Il n’est pas trop difficile de donner un sens au concept du flux d’un tenseur. 

9


Exercices. 

1. Pour une corde vibrante dans un champ de gravitation, nous devons ajouter le 

terme V g = ∫ I ρ′ φdx à l’énergie potentielle (1.8) où ρ ′ est le produit de la densité par 

l’accélaration de la gravité. Déduire l’équation du mouvement du champ dans ce cas. 

Même question si la corde se trouve dans un potentiel harmonique V h = ∫ I κφ2 dx. 

2. Calculer le tenseur energie-impulsion pour la corde vibrante sans potentiel extérieur. 

Que représente T tt ? Que veut dire l’identité de Beltrami dans ce cas ? 

Que représente alors T tx ? 

3. Déduire les équations du mouvements d’un champ dans un espace à n−dimension, 

où l’expression de l’énergie potentielle (interne) est donné par V = ∫ I k(∇φ)2 dr. 

Ceci généralise l’équation de la corde vibrante. 

4. Déduire l’équation du mouvement d’un champ dans un espace à n−dimension 

anisotrope, où l’expression de l’énergie potentielle (interne) est donné par 

∫ 

∑ ∂φ ∂φ 

V = a ij dr 

∂x i ∂x j 

I 

i,j 

où pour les coefficients, nous pouvons supposer a ij = a ji (pourquoi ?). Ce genre 

d’expression se rencontre fréquemment dans des problèmes comme l’élasticité des 

cristaux, où les déformations dans les différentes directions ne sont pas équivalentes. 

1.4 Optimisation sous contraintes. 

1.4.1 Les déplacements compatibles. 

Oublions pour l’instant le problème de l’extremum d’une fonctionnelle, et revenons au 

problème beaucoup plus simple de l’extremum d’une fonction de plusieurs variables. Soit 

la fonction f(x, y) dont nous cherchons l’extremum. Nous savons qu’au point extremum, 

les termes linéaires des variations doivent être nulle 

df = f(x + h, y + k) − f(x, y) = 

( ∂f 

∂x 

) 

h + 

( ) ∂f 

k + O(h 2 , k 2 ) 

∂y 

et ceci quelque soit h, k : quelque soit la direction que l’on prend au point extremum, le 

terme linéaire de la variation doit être nulle. 

Supposons maintenant que nous ajoutons une contrainte : nous ne cherchons pas l’extremum 

absolu de f, mais un point x ∗ qui satisfasse en plus à la contrainte g(x, y) = 0. 

Par exemple, nous savons que le minimum de la fonction f(x, y) = x 2 + y 2 est le point 

(0, 0). Mais si nous contraignons notre point à se déplacer sur la courbe y = ax+b, b ≠ 0, 

le point (0, 0) n’est pas atteignable. On peut cependant chercher un point qui minimise f 

avec la contrainte donnée 5 . Dans le cas simple que nous somme en train de traiter ici, on 

peut résoudre une coordonnées par rapport à l’autre et ramener la fonction à une seule 

5. Imaginer que vous marchez en montagne sur un chemin, et vous vous intéressez au point le plus 

bas sur ce chemin et non pas en général. 

10


4 

g(x,y)=0 

2 

A 

0 

O 

−2 

−4 

−4 −2 0 2 4 

Figure 1.2: La fonction f(x, y) = x 2 + y 2 est représentée par ses courbes de niveau. Le 

minimum absolu de cette fonction est le point O = (0, 0). Le point le “plus 

bas” de la fonction qui doit également appartenir à la courbe g(x, y) = 0 

est le point A. 

variable (degrés de liberté) : f(x) = x 2 + (ax + b) 2 et chercher maintenant le minimum 

de cette nouvelle fonction (où les contraintes ont été absorbées). En général cependant, 

la fonction contrainte g(x, y) = 0 est suffisamment compliquée pour qu’on ne puisse pas 

résoudre une des coordonnées par rapport aux autres. 

Revenons à la définition général : la variation linéaire de la fonction autour du point 

extremum (x ∗ , y ∗ ) doit être nulle quelque soit le déplacement (h, k) autour de ce point. En 

présence des contraintes, nous relâchons cette exigence : il faut que la variation linéaire 

autour du point (x ∗ , y ∗ ) soit nulle seulement pour les déplacement (h, k) compatible avec 

les contraintes 6 . Les déplacements compatibles avec la contrainte g(x, y) = 0 sont données 

par 

(∂g/∂x)h + (∂g/∂y)k = 0 

Ceci nous donne une équation supplémentaire à considérer avec l’équation 

df = (∂f/∂x)h + (∂f/∂y)k = 0 

Nous sommes arrivés à un système de deux équations à deux inconnus linéaire. En résolvant 

k en fonction de h dans la première équation et en l’injectant dans la deuxième, 

et en exigeant maintenant que df soit nulle quelque soit h, nous obtenons 7 

(∂f/∂x)(∂g/∂y) − (∂f/∂y)(∂g/∂x) = 0 (1.9) 

Ceci est une condition supplémentaire sur l’extremum de la fonction f. 

6. En mécanique, cela est appelé la méthode des travaux virtuels 

7. On peut également dire que pour que le système Ah + Bk = 0, Ch + Dk = 0 ait une solution non 

trivial h = k = 0, il faut que le déterminant de la matrice 

( ) A B 

soit nulle. 

C 

D 

11


Exemple. Trouver l’extremum de la fonction f(x, y) = x 2 + y 2 avec la contrainte 

g(x, y) = −ax + y − b = 0. En écrivant la condition (1.9), nous obtenons 

(2x)1 − (2y)(−a) = 0 

ou autrement dit, x + ay = 0. En combinant cette équation avec la contrainte y = ax + b, 

nous trouvons les coordonnées du point extremum : x ∗ = −ab/(1 + a 2 ), y ∗ = b/(1 + a 2 ). 

1.4.2 Les multiplicateurs de Lagrange. 

Lagrange a introduit une méthode équivalente à ce que nous venons de voir ci-dessus. 

Nous voulons optimiser f(x, y) avec la contrainte g(x, y) = 0. Lagrange introduit une 

variable supplémentaire, λ et considère maintenant le problème de l’optimisation (libre) 

de la fonction F (x, y, λ) = f(x, y) − λg(x, y). Cela nous donne 

∂F 

∂x = ∂f 

∂x − λ ∂g 

∂x = 0 (1.10) 

∂F 

= ∂f 

∂y ∂y − λ∂g ∂y = 0 (1.11) 

∂F 

∂λ 

= g(x, y) = 0 (1.12) 

L’équation (1.12) n’est rien d’autre que la contrainte et assure que la solution trouvée 

est bien conforme. Les deux premières équations (1.10,1.11) ne sont rien d’autre que la 

condition (1.9) si on y élimine λ. 

Re-exemple. Minimisons la fonction f(x, y) = x 2 + y 2 avec la contrainte g(x, y) = 

−ax + y − b = 0. Nous introduisons la fonction F (x, y) = x 2 + y 2 − λ(−ax + y − b). Cela 

nous donne 

2x + λa = 0 

2y − λ = 0 

Ce qui bien sûr nous donne x+ay = 0. Nous trouvons à nouveau le même point optimum ; 

de plus, si on le souhaite, on peut trouver également λ ∗ = 2y ∗ = 2b/(1 + a 2 ). 

Le coefficient λ est appelé un multiplicateur de Lagrange. La méthode a une signification 

physique profonde : supposons que nous avons un point matériel dans le potentiel 

f(x, y) astreint à rester sur la courbe g(x, y). Au point x ∗ , le point (qui est stable) est 

soumis à une force non-nulle de la part du potentiel F = (∂ x f, ∂ y f). Pour qu’il puisse 

rester sur la position x ∗ , il faut que la courbe g(x, y) exerce une force de réaction sur le 

point qui vaut justement λ ∗ (∂ x g,∂ y g). Si on enlevait la contrainte mais qu’on soumettait 

le point matériel à cette force supplémentaire, il se mettrait exactement à la même 

position. 8 

8. Cette dualité force-contrainte a joué un grand rôle dans le développement de la mécanique, de 

sa formulation Newtonienne dans les années ~1680 à l’apparition du livre de mécanique analytique par 

Lagrange en ~1780. Lagrange était fier de n’avoir pas inclus une seule figure dans son livre. En mécanique, 

la méthode de Lagrange nous permet de calculer une position d’équilibre sans calculer explicitement les 

forces de réactions. 

12


1.4.3 Généralisation des multiplicateurs de Lagrange. 

Les multiplicateurs de Lagrange se généralise de façon naturelle aux fonctions de n 

variables soumis à m contrainte. Pour optimiser la fonction f(x 1 , ...x n ) soumise aux 

contraintes g 1 (x 1 , ...x n ) = 0,...,g m (x 1 , ...x n ) = 0, nous considérons la nouvelle fonction F 

de n + m variable 

F (x 1 , ...x n ; λ 1 , ...λ m ) = f(x 1 , ...x n ) − λ 1 g 1 (x 1 , ...x n ) − ... − λ m g m (x 1 , ...x n ) 

Nous chercherons l’extremum (sans contrainte) de la fonction F . 

Exercice. Démontrer le cas général, en suivant le chemin déjà tracé. 

La méthode des multiplicateurs de Lagrange se généralise très naturellement aux fonctionnelles. 

Si Nous devons trouver le minimum de la fonctionnelle S[y] = ∫ I L(y′ , y, x)dx 

avec la contrainte ∫ I g(y′ , y)dx = A, il nous suffit d’introduire la fonctionnelle 

∫ 

S ′ { 

[y; λ] = L(y ′ , y, x) − λg(y ′ , y) } 

I 

et de chercher le minimum de cette fonctionnelle par les techniques habituelles du calcul 

des variations ( expliquer pourquoi nous pouvons omettre la constante A) . 

Exemple : Le problème isopérimétrique. Trouver la courbe fermé de longueur donné 

qui maximise sa surface. 

Supposons 9 que nous pouvons représenter la courbe par une fonction R(θ). Nous cherchons 

à minimiser la fonctionnelle 

avec la contrainte 

S[R] = 

Considérons la nouvelle fonctionnelle 

S ′ [R(θ); λ] = 

∫ 2π 

0 

∫ 2π 

0 

∫ 2π 

0 

(1/2)R 2 (θ)dθ (1.13) 

R(θ)dθ = L (1.14) 

{ 

(1/2)R 2 (θ) − λR(θ) } dθ 

Le terme entre {} (que nous continuons d’appeler le Lagrangien) ne contient même pas 

de dérivée de R ; l’équation d’Euler-Lagrange nous donne directement 

R − λ = 0 

c’est à dire R = λ = Cte. Ceci est bien un cercle. Pour trouver λ, nous utilisons la 

contrainte (1.14), qui nous donne λ = L/2π. La courbe qui minimise la surface est donc 

un cercle de rayon R = L/2π. 

9. Ceci est une très grosse supposition. Le lecteur a intérêt a tracer quelques courbes qui ne sont 

pas représentable par une fonction R(θ) pour se rendre compte de la simplification que nous assumons 

derrière cette supposition. 

13


Exemple : distribution d’énergie dans un système isolé. Soit un système isolé ayant 

N particule (N → +∞) et soit c(x) le nombre relatif de particule ayant une énergie dans 

l’intervalle [x, x + dx[. Comme le système est isolé, le nombre de particules et l’énergie 

totale sont conservés : 

∫ ∞ 

0 

∫ ∞ 

0 

c(x)dx = 1 (1.15) 

xc(x)dx = T (1.16) 

où nous appelons T l’énergie moyenne par particule : T = E 0 /N avec E 0 l’énergie totale 

du système. Le théorème H de Boltzmann nous apprend que la fonction c(x) doit être 

choisi de façon à ce que la quantité 

H [c] = 

∫ ∞ 

0 

c(x). log [c(x)] dx (1.17) 

soit extremum. La quantité −H est souvent appelé entropie. Avec les deux contraintes 

(1.15,1.16), nous devons donc chercher l’extremum de la fonctionnelle 

H ′ [c; λ, µ] = 

∫ ∞ 

0 

c(x). log [c(x)] dx − λ 

∫ ∞ 

0 

c(x)dx − µ 

∫ ∞ 

0 

xc(x)dx 

Le calcul est assez simple dans ce cas, puisque nous n’avons pas de dérivés dans la 

fonctionnelle. En cherchant la valeur de la fonctionnelle pour H ′ [c + ɛg; λ, µ] et en nous 

contentant d’ordre 1 en ɛ, nous trouvons 

H ′ [c + ɛg; λ, µ] = H ′ [c; λ, µ] + ɛ 

∫ ∞ 

0 

(1 + log c − λ − µx) g(x)dx 

la fonction c(x) est un extremum de la fonctionnelle H ′ si les variations linéaires sont 

nulle ∀g, c’est à dire si 

log c = (λ − 1) + µx 

ou autrement dit c(x) = Ae −µx ; l’utilisation des deux contraintes nous donne A = −µ = 

1/T . Autrement dit, 

c(x) = (1/T )e −x/T 

1.4.4 Formulation variationnelle des systèmes Sturm-Liouville. 

Rappelons qu’un système Sturm-Liouville est une équation aux valeurs propres 

α(x)y ′′ + β(x)y ′ + γ(x)y = λy 

Nous avons mentionné (et insisté) que si nous trouvons un poids w(x) qui rend l’opérateur 

hermitien, alors les solutions des systèmes SL minimise une certaine fonctionnelle. Nous 

avons vu que si une telle fonction poids existe, alors elle doit obeïr à l’équation (αw) ′ = 

βw et le système peut alors s’écrire sous la forme alternative 

d ( 

wαy 

′ ) + wγy = λwy 

dx 

14


Remarquer que cette forme ressemble furieusement à une équation Euler-Lagrange. On 

peut faire le chemin inverse : minimiser la fonctionnelle 

∫ 

( 

S[y] = p(x)y ′2 + q(x)y 2) dx 

avec la contrainte 

∫ 

I 

I 

w(x)y 2 dx = 1 

Comme on peut le voir, nous pouvons formellement identifier l’équation d’Euler-Lagrange 

du système ci-dessus à un système SL en posant p = wα, q = −wγ. A regarder de plus 

près, la formulation variationnelle d’un système SL, si on assimile la variable x au temps, 

ressemble beaucoup à un oscillateur harmonique avec une masse et une constante de 

ressort dépendant du temps. Ceci, comme nous l’avons mentionné, est le point de départ 

de l’approximation WKB. 

1.5 Les conditions aux bords “naturelles”. 

Revenons à notre formulation initiale de problème d’éxtremum. Nous voulons trouver 

l’extremum de la fonctionnelle 

avec les conditions aux bords fixée 

S[y] = 

∫ b 

a 

L(y ′ , y, x)dx 

y(a) = y 0 ; y(b) = y 1 

Pour cela, nous avons écrit la variation de S en fonction d’une petite perturbation g(x) 

pour obtenir 

[ ] ∂L b ∫ b 

{ ∂L 

δS = 

∂y ′ g + 

a a ∂y − d } 

∂L 

dx ∂y ′ gdx 

et nous avons cherché dans quelles conditions, δS = 0 quelque soit g(x). Nos conditions 

aux bords nous ont imposées g(a) = g(b) = 0, donc le premier terme est nul ; le deuxième 

terme nous donne les équations d’E-L. 

Ceci dit, nous pouvons relacher nos contraintes, et ne pas 

exiger que y(a) = y 0 , y(b) = y 0 . Le problème serait alors : 

parmis toutes les courbes entre a et b, trouver celle qui extrémise 

la fonctionnelle. Dans ce cas, l’annulation de δS exige 

toujours l’annulation de l’intégrale, qui nous donnera comme 

d’habitude les équation d’Euler Lagrange, et l’annulation du 

terme de bord. Or, cette fois, comme les bords ne sont plus 

fixe, nous n’avons plus g(a) = g(b) = 0, pour annuler les 

termes de surface, nous devons exiger 

Figure 1.3: Bords libres 

∂L 

∂y ′ ∣ 

∣∣∣x=a,b 

= 0 

15


ce qui nous fournit deux nouvelles conditions en remplacement des conditions y(a) = y 0 , 

y(b) = y 0 . 

Pour illustrer ce principe, considérons un lagrangien qui contient des dérivées d’ordre 

2 : L = L(y ′′ , y ′ , y, x). Dans ce cas, la variation s’écrit 

[ ∂L 

δS = 

∂y ′ g − d 

] 

∂L ∂L b ∫ b 

{ ∂L 

g + 

dx ∂y ′′ ∂y ′′ g′ + 

a a ∂y − d 

} 

∂L 

dx ∂y ′ + d2 ∂L 

dx 2 ∂y ′′ gdx 

Pour une poutre élastique soumis à une charge f(x) par exmeple, l’énergie s’écrit 

E = 

∫ L 

0 

{ 

By ′′2 − f(x)y } dx 

Si la poutre est encastrée (a), nous avons les conditions y(0) = 

y(L) = 0 et y ′ (0) = y ′ (L) = 0. Dans ce cas, le terme de bord est 

automatiquement nulle. Par contre, si la poutre est seulement posé 

(b), nous avons seulement y(0) = y(L) = 0. Pour trouver les deux 

autres conditions et annuler le terme de bord, nous devons avoir 

∂L/∂y ′′ = 0, c’est à dire y ′′ (0) = y ′′ (L) = 0. Nous laissons au lecteur 

le soin de trouver les conditions aux limites pour le cas (c). 

Dans les exemples ci-dessus, l’abscisse x était fixée sur les deux 

bords, y ayant la liberté de bouger le long d’une droite verticale. Figure 1.4: poutres 

Nous pouvons généraliser encore plus en relachant cette contrainte 

fixées. 

et permettre aux points sur les bords de se mouvoir le long d’une 

courbe quelconque. Nous laissons le soin au lecteur d’obtenir les conditions aux limites 

nécessaires dans ce cas. Un exemple typique est de trouver le chemin le plus court entre 

deux courbes f(x, y) = 0, g(x, y) = 0 sur une surface z = z(x, y) ; ou encore, pour les 

militaires, choisir le meilleur trajectoire pour lancer un missile air-air et abattre l’avion 

ennemie. 

(a) 

(b) 

(c) 

1.6 Détour : éléments de géométries non-euclidiennes. 

Le cinquième axiome d’Euclide est le suivant : “d’un point en dehors d’une droite, on 

ne peut tracer qu’une et une seule droite parallèle au premier”. Pendant deux millénaires, 

les mathémiticiens ont cru que ceci n’est pas un axiome, mais un théorème que l’on peut 

démontrer à partir des quatre premier axiomes. A partir de 1830, il est devenu claire 

que le cinquième mérite le titre d’axiome et qu’on peut tout a fait formuler d’autres 

géométries qui acceptent d’autres axiomes. Nous allons étudier une version simplifiée de 

la géométrie riemanienne. Pour cela, nous devons donner un sens précis au mot “droite” : 

nous le définirons dorénavent comme le chemin le plus court entre deux points ; il est 

plus habituel alors d’appeler cela une géodésique. Supposons que nous avons muni notre 

espace bidimensionnel d’un système de coordonnées (x 1 , x 2 ). La distance entre deux 

points infiniments voisins est définie par 

ds 2 = ∑ i,j 

g ij dx i dx j 

16


où g ij = g ij (x 1 , x 2 ) est appelé le tenseur métrique. Par exemple, si nous avons muni le 

plan euclidien de coordonées polaires, ds 2 = dr 2 +r 2 dθ 2 et nous avons (en posant x 1 = r, 

x 2 = θ), g 11 = 1, g 22 = x 2 , g 12 = g 21 = 0. 

Nous allons considérer dans la suite le cas très particulier où g 11 = 1, g i≠j = 0 et 

g 22 = g 2 (x), où g est une fonction quelconque 10 . Le prérimètre d’une courbe y(x) reliant 

deux points est donnée par 

l[y(x)] = 

∫ 2 

1 

√ 

1 + g 2 (x)y ′2 dx 

et il est élémentaire de montrer, d’après les précédents paragraphes, que l’équation 

d’Euler-Lagrange nous donne immédiatement l’équation de la courbe : 

y ′ = a/g √ g 2 − a 2 

où a est une constante d’intégration. Dans le cas des coordonnées polaire par exemple où 

g(x) = x, nous pouvons intégrer l’équation ci-dessus 11 et obtenir l’équation d’une droite 

y = α + arccos(a/x) où a et α sont deux constante d’intégration. Pour vous convaincre 

que cela est effectivement le cas, Il suffit d’intepréter x comme r et y comme θ, faire un 

petit schéma et quelques manipulations d’angles . 

Prenons le cas plus intéressant pour nous de g(x) = sin(x). A nouveau, l’intégration 

s’effectue sans difficulté 12 et nous obtenons 

y = ψ + arccos (cos α cot x) 

où ψ et α sont deux constantes d’intégration. Nous voyons par exemple que pour α = π/2, 

nous avons une famille de droites données par y = Cte. Prenons la géodésique y = 0 et 

considérons le point P = (π/2, π/2) en dehors de cette droite. Toute les droites traversant 

ce point doivent avoir le paramètre ψ = 0. Il n’est pas alors difficile de voir que toute ces 

droites croisent la droite y = 0 au point cot x = 1/ cos α. 

Nous venons de démontrer dans ce cas que toutes les droites traversant P croisent une 

droite ne contenant pas P ; cela est très différent du cinquième axiome d’Euclide. Le cas 

que nous venons de traiter correpsond à la géométrie sphérique : sur la sphére unité, la 

distance entre deux points est donnée par ds 2 = dθ 2 + sin 2 θdφ 2 . Mais le point de vue 

de Rieman est beaucoup plus fondamental que cela : ce qui caractérise l’espace et qui 

lui donne sa substance est la donnée du tenseur métrique. Les habitants de la surface 

de la sphère unité ne peuvent pas voir qu’ils sont sur une sphére. Ils peuvent par contre 

visionner les géodésiques (en suivant les trajets des faisceaux de lumière ) et déterminer 

la nature de leur espace en faisant des mesures par exemple de la somme des angles d’un 

triangle formé par trois géodésiques. C’est exactement dans ce cadre qu’Einstein a formulé 

sa théorie de gravité en 1917, où les masses confèrent de la courbure à l’espace-temps. 

10. Nous noterons par habitude les coordonnées (x, y) sans leur associer l’idée de coordonnées cartesiennes 

11. il suffit d’effectuer le changement de variable u = a/x 

12. Il suffit de poser u = cot x 

17


z 

r(z) 

y 

L 

a 

F 

x 

(a) (b) (c) 

Figure 1.5: (a) : surface minimum entre deux cercle ; (b) flambage d’une barre ; (c) pont 

suspendu à une chaînette. 

A ajouter. 

1. Discuter la Jauge dans le Lagragian et eventuellement le theorème de Noether. 

Problèmes. 

1. Surface minimum. Soit deux cercles concentriques de rayon à priori différents disposés 

l’un au dessus de l’autre à une hauteur h. Quelle est la forme de la surface d’aire 

minimum qui relie les deux cercles (fig. 1.5a) ? 

2. Energie de courbure. Comment faut-il écrire les équations d’Euler-Lagrange si le Lagrangien 

contient des dérivées secondes ? Plus spécifiquement, supposer que le Lagrangien 

est de la forme L = y ′′ (x) 2 + V (y). Généraliser ensuite au cas L = L(y ′′ , y ′ , y, x). 

3. Brachistochrone. Nous voulons minimiser 

∫ 

√ 

x1 

1 + y 

T = 

′2 

dx 

y 

0 

En utilisant l’identité de Beltrami, démontrer que la courbe y(x) doit obéir à l’équation 

−1 

y(1 + y ′2 ) = C 

où C est une constante. Résoudre cette équation du première ordre en démontrant d’abord 

que 

√ y 

dx = dy 

2a − y 

où nous avons posé 1/C 2 = 2a ; integrer cette dernière équation en posant y = a(1−cos θ). 

[Help : nous devons obtenir l’équation du cycloïde sous forme paramétrique.] 

18


4. Elasticité 1-d. Soit une barre dont on repère les points (avant deformation) par la coordonnées 

x. On appuie sur la barre parralèlelement à son axe ; les points de la barre se déplacent 

aux coordonnées x ′ (Figure 1.6). Nous appelons déplacement u(x) = x ′ −x la fonction 

qui traque cette quantité. L’énergie élastique stocké dans la barre est proportionnel 

au carré du gradient de ce terme : 

E = 

∫ L 

0 

(1/2)ku ′ (x) 2 dx 

où k est la constante élastique de la barre (qu’on appelle 

également le module d’Young). La force a effectué le travail 

W = F u(L). L’énergie totale de la barre s’écrit donc 

E = 

∫ L 

0 

{ 

(1/2)ku ′ (x) 2 − F u ′ (x) } dx 

Démontrer alors que u(x) = ax où à est une constante à 

determiner. Déterminer a en utilisant les conditions aux bords 

naturelles (section 1.5). En déduite la loi d’élasticité de Hook 

Figure 1.6: 

F = Ku(L) 

Que vaut K ? quelle est sa dépendance en L ? 

5. Flambage d’une poutre. Appuyez sur une règle tenu verticalement sur une table ; au 

delà d’une certaine force, la règle flambe (fig.1.5b). Ceci est un problème extrêmement 

important de la résistance des matériaux et conditionne la conception des tours pour 

qu’ils ne s’écroulent pas (en flambant) sous leurs propres poids. Repérons la barre par 

son écart à la droite y(x). En supposant faible l’écart de la barre par rapport à la droite, 

l’énergie de courbure de la barre est donné par sa courbure locale B(y ′′ (x) ) 2 . Nous 

supposons l’extrémité de la courbe maintenu à y = 0, mais pouvant coulisser sur l’axe 

x et soumis à une force F . Pour trouver la configuration qui minimise l’énergie, nous 

devons donc trouver l’extremum de la fonctionnelle 

soumis à la contrainte 

S[y, a] = 

∫ a 

0 

∫ a 

0 

B(y ′′ (x) ) 2 dx − F (L − a) 

{ 

(1 + (1/2)y 

′2 } dx = L 

Nous avons approximé ici l’élément de ligne ds = √ 1 + y ′2 par son développement de 

Taylor, en supposant les écarts à la ligne (et leurs dérivées) faible. Démontrez alors que 

pour F > F c , la poutre droite n’est plus la solution optimum ; calculer F c . 

19


6. Flambage d’une poutre II. Nous pouvons formuler différement le problème de flambage, 

en intégrant directement la contrainte dans le Lagrangien. Pour cela il suffit d’utiliser 

un système de coordonnées plus adaptés que les coordonnées cartesienne. Reperons 

un point le long de la poutre par sa longueur d’arc à partir de l’origine s, et par l’angle 

de la tangente à la courbe en ce point avec l’axe horizontal θ(s). Ce nouveau système de 

coordonnées est reliée aux coordonnées cartesiennes par la relation 

dx = cos θds 

dy = sin θds 

La courbure de la courbe en un point est simplement donnée par dθ/ds. L’énergie s’écrit 

alors simplement 

∫ L 

S[θ] = 

{B ( θ ′) } 

2 + F cos θ ds − F L 

0 

Que l’on peut traiter par les équation d’EL sans contrainte : la longueur d’arc s gère 

automatiquement la constance de la longueur totale de la poutre. Les coordonnées semiintrinsèque 

(s, θ) sont très utilisé en géométrie différentielle. Noter de plus la grande 

similarité de l’action à celle de l’oscillation d’une pendule dans le champs de la gravité. 

7. isopérimétrique II. Chercher la courbe sous forme paramétrique x = x(t), y = y(t) 

avec la condition supplémentaire x(1) = x(0) et y(1) = y(0). Ecrire tout au moins les 

équations d’Euler-Lagrange. 

8. Isopérimétrique III. Quelle est la courbe de surface donnée qui minimise son périmètre ? 

9. Equation de la chainette. Une chaîne y(x) est suspendu entre deux points distant 

de a. La longueur totale de la chaîne est L. Trouver l’équation de la chaîne. Help : 

A l’évidence, la chaîne doit minimiser l’énergie potentielle, avec une contrainte sur sa 

longueur. L’energie potentielle est de la forme ∫ ρyds ; on doit donc trouver le minimum 

de 

∫ a/2 

H ′ = 

{ρy √ 1 + y ′ (x) 2 − λ √ } 

1 + y ′ (x) 2 dx 

−a/2 

où λ est un multiplicateur de Lagrange. Obtenez également l’équation de la chaînette à 

laquelle on a suspendu un pont (fig.1.5c) 

10. Trajectoire complexe. Soit une fonction y(x) complexe (R → C) dont l’action est 

définie par 

∫ 

S[y] = L(y, y ′ , y ∗ , y ∗′ ; x)dx 

I 

Comme par exemple L = y ′ y ∗′ + kyy ∗ . Obtenir les équations d’Euler-Lagrange de cette 

fonction. [Help : il faut démontrer que l’on peut considerer y et y ∗ comme deux composantes 

indépendantes, et obtenir une equation d’EL pour chacune]. 

20


11. Equation de Schrodinger. Nous cherchons la fonction complexe ψ(x, t) qui optimise 

l’action associé au Lagrangien suivant 

L = iψ ∗ ∂ t ψ − a(∂ x ψ ∗ )(∂ x ψ) − V (r)ψ ∗ ψ 

Trouver l’équation d’Euler Lagrange auquel obéit la fonction ψ. Dans la formulation 

ci-dessus, ψ et ψ ∗ ne jouent pas le même rôle. Pouvez vous donner une version plus 

symétrique de ce Lagrangien ? 

12. Champs électromagnétique dans le vide. Nous définissons un champ A = (A 0 , A 1 , A 2 , A 3 ) 

dans un espace à 4 dimensions que l’on repère à l’aide des coordonnées x = (x 0 , x 1 , x 2 , x 3 ) 13 . 

Comme nous sommes parfois trop habitué à la séparation en espace (3d) et en temps, nous 

dissocions parfois les expressions ci-dessus en donnant des noms différents aux différents 

composants : nous notons par exemple A = (φ, −A) où nous appelons φ le potentiel 

et A le potentiel vecteur ; de même, nous notons x = (t, x) où le premier composant 

est appelé temps et les trois autres l’espace. Les équations d’électromagnétisme ont été 

formulé dans le cadre de cette séparation étrange et les différentes dérivées du champ 

ont reçu des noms différents. Par exemple, on appelle champ électrique le vecteur à 3 

dimensions 

E = −∂ t A − ∇φ 

et champ magnétique 

H = ∇ × A 

Revenons à notre formulation générale. Le tenseur électromagnétique est défini par 

F ik = ∂A k 

∂x i 

− ∂A i 

∂x k 

Ce tenseur est bien sûr anti-symétrique F ik = −F ki . 

1. Donner l’expression du tenseur F en fonction des champs E i et H k . 

2. Démontrer que pour trois indices i, j, k, la definition même du tenseur F impose 

∂F ij 

+ ∂F jk 

+ ∂F ki 

= 0 

∂x k ∂x i ∂x j 

démontrer que les seules équations non-triviales sont celles où i ≠ j ≠ l et cela 

nous donne 4 équations que nous pouvons regrouper en 

∇ × E = −∂ t H 

∇.H = 0 

qui ne sont rien d’autre que les deux premieres équations de Maxwell. 

13. Nous évitons pour l’instant les exposants et notons les coordonnées x i au lieu de x i 

21


Dans l’espace-temps reliativiste, la “distance” ds entre deux points voisins est donnée par 

ds 2 = dx 2 0 − (dx 2 1 + dx 2 2 + dx 2 3) = 

3∑ 

ɛ i dx 2 i 

i=0 

où ɛ 0 = 1 et ɛ i≥1 = −1. Il existe une différence entre une des composantes et les trois 

autres quant au signe qu’il faut utiliser pour l’élément d’arc. Cette différence apparaît 

obligatoirement dans toutes les expressions des lois physiques. En particulier, toutes les 

expressions quadratiques auront une forme similaire à l’expression de l’élément d’arc. Par 

exemple, l’action du champs électromagnétique est donnée par l’intégrale sur un volume 

du Lagrangien suivant 14 : 

L = − 

3∑ 

i,j=0 

ɛ i ɛ j F 2 

ij 

Remarquer la similarité entre cette formulation et la formulation de la théorie de l’élasticité, 

où le champs A représente le vecteur déplacement et le tenseur F ij le tenseur 

déformation. Ceci n’est pas un hasard ; Maxwell lui même imaginait l’ether comme un 

corps élastique et s’inspirait fortement de la théorie de l’élasticité. 

1. Déduire que l’on peut mettre le Lagrangien sous forme de L = E 2 − H 2 

2. Déduire les équations du champs 

3∑ 

j=0 

ɛ i ɛ j 

∂F ij 

∂x j 

= 0 

3. Mettre ces équations sous la forme plus usuelle des deux autres équations de 

Maxwell : 

∇ × H = ∂ t E ; ∇.E = 0 

14. Le signe moins n’a pas de conséquence pour nos calculs, mais assure que la solution trouvée est un 

minimum plutôt qu’un maximum de l’action. 

22

1 Le calcul variationnel

Create successful ePaper yourself

Delete template?

Save as template?