F FUNZIONI IMPLICITE MASSIMI E MINIMI VINCOLATI F1. Il ...
F FUNZIONI IMPLICITE MASSIMI E MINIMI VINCOLATI F1. Il ...
F FUNZIONI IMPLICITE MASSIMI E MINIMI VINCOLATI F1. Il ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
F<br />
<strong>FUNZIONI</strong> <strong>IMPLICITE</strong><br />
<strong>MASSIMI</strong> E <strong>MINIMI</strong> <strong>VINCOLATI</strong><br />
(C. De Mitri)<br />
<strong>F1.</strong> <strong>Il</strong> problema della funzione implicita e il teorema del Dini<br />
Considerata l’equazione G(x,y) = 0, dove G è una funzione reale definita in un aperto<br />
A di IR 2 , per molteragioni può tornareutileesprimere una delle due variabiliinfunzione<br />
dell’altra, ad esempio la y in funzione della x. Per questo motivo ci domandiamo sotto<br />
quali condizioni si può star certi che esiste una funzione g, reale di una variabile reale,<br />
tale che l’equazione data sia equivalente all’equazione y = g(x) (1) .<br />
In altritermini, considerato l’insieme Γ = {(x,y)∈A/G(x,y)= 0}, che spesso, sia pure<br />
impropriamente, chiameremo “curva” di equazione G(x,y) = 0 (2) , vogliamo stabilire<br />
in quali casi esso è il grafico di una funzione della variabile x.<br />
Osserviamo che il luogo Γ è il cosiddetto “insieme di livello 0” della funzione G, e<br />
che le proprietà che stabiliremo per Γ saranno valide anche per l’“insieme di livello c”,<br />
Γc = {(x,y)∈A/G(x,y)= c}, qualunque sia c∈IR; infatti il luogo Γc è l’insieme di<br />
livello 0 della funzione G(x,y)−c, la quale ha appunto le stesse proprietà di G.<br />
Consideriamo ad esempio l’equazione x 2 + y 2 − 1 = 0. In questo caso la curva Γ è<br />
la circonferenza di centro (0,0) e raggio 1, la quale, considerata globalmente, non è il<br />
grafico di nessuna funzione del tipo y = g(x). Con ciò è appurato che, se pretendiamo<br />
una risoluzione a carattere globale, dobbiamo aspettarci qualche insuccesso anche in<br />
casi in cui la funzione G è un semplice polinomio di 2 o grado.<br />
Diverso è il risultato se l’approccio al problema è di tipo locale.<br />
Infatti, facendo ancora riferimento alla circonferenza, si vede che<br />
quasi ogni suo punto (x0,y0) (vanno esclusi solo i punti (±1,0))<br />
ammette un intorno I×J nel quale Γ è il grafico di una funzione<br />
y = g(x), nel senso che ∀x ∈ I ∃!y =: g(x) ∈ J tale che (x,y) ∈ Γ. Ciò si esprime<br />
dicendo che l’equazione G(x,y) = 0 definisce implic/te una funzione da I in J, oppure<br />
che la funzione y = g(x) è implic/te definita dall’equazione G(x,y) = 0 in I×J.<br />
(1) <strong>Il</strong> problema non è quello di determinare la funzione g, ma solo quello di stabilire se essa<br />
esiste. Un esempio che mostra la differenza fra i due problemi è rappresentato dall’equazione<br />
x−y−e y = 0: qui la funzione g esiste senz’altro (è l’inversa della funzione y → y+e y , che<br />
è invertibile), ma non la si può esplicitare sotto forma di espressione elementare.<br />
(2) <strong>Il</strong> fatto che il termine curva sia spesso inadeguato è provato da casi come i seguenti: x 2 +<br />
y 2 +1 = 0, (x 2 +y 2 )(y−1) = 0, (x−y)(x−y+1) = 0, |x|+|x−1|+|y|+|y−1|−2 = 0.<br />
1
Allo scopo di dare la massima generalità al problema in esame, facciamo un passo avanti<br />
e osserviamo che, se l’equazione è G(x,y,z) = 0, che rappresenta una “superficie” in<br />
IR 3 , si tratta di stabilire sotto quali condizioni è possibile, almeno sul piano teorico,<br />
esprimere una variabile in funzione delle altre due, ad esempio la variabile z in funzione<br />
delle variabili x ed y: z = g(x,y).<br />
<br />
G1(x,y,z) = 0<br />
Ed ancora, se l’equazione, o meglio il sistema è , che rappresenta una<br />
G2(x,y,z) = 0<br />
“curva” in IR 3 , il problemaè quello di poter esprimere ad esempio le variabili y e z in<br />
y = g1(x)<br />
funzione della variabile x:<br />
z = g2(x) .<br />
Si può allora concludere che, in generale, il problema è quello di passare dal sistema (1)<br />
⎧<br />
G1(x1,x2,...,xn,y1,y2,...,yk) = 0<br />
⎪⎨ G2(x1,x2,...,xn,y1,y2,...,yk) = 0<br />
⎧<br />
y1 = g1(x1,x2,...,xn)<br />
⎪⎨ y2 = g2(x1,x2,...,xn)<br />
····································<br />
⎪⎩ ····································<br />
Gk(x1,x2,...,xn,y1,y2,...,yk) = 0<br />
al sistema ····················· .<br />
⎪⎩ ·····················<br />
yk = gk(x1,x2,...,xn)<br />
<strong>Il</strong> teorema che segue riguarda appunto il problema nella sua forma più generale, riferi-<br />
to cioè ad una funzione G a k componenti di n+k variabili. Per maggiore semplicità<br />
useremo le notazioni: x = (x1,x2,...,xn), y = (y1,y2,...,yk), ∂G<br />
∂G<br />
∂y<br />
= ∂(G1,G2,...,Gk)<br />
∂(y1,y2,...,yk)<br />
; in sostanza ∂G<br />
∂x<br />
e ∂G<br />
∂y<br />
parte destra della matrice jacobiana di G, DG =<br />
∂G<br />
∂y<br />
∂x<br />
= ∂(G1,G2,...,Gk)<br />
∂(x1,x2,...,xn) ,<br />
sono rispettivamente la parte sinistra e la<br />
∂G<br />
∂x<br />
| ∂G<br />
∂y<br />
è quadrata, e quindi se ne potrà considerare il determinante |∂G<br />
∂y |.<br />
Possiamo fin da ora prevedere che nel teorema il determinante di ∂G<br />
∂y<br />
<br />
. Da notare che la matrice<br />
avrà un ruolo<br />
fondamentale. Infattiosserviamocheuncaso particolarenotevoledelproblema inesame<br />
si ha quando G(x,y) = M y − H(x), ossia quando il sistema è M y = H(x), con H<br />
funzione a k componenti definita in un aperto X di IR n , ed M matricequadrata d’ordine<br />
k: in tal caso risulta ∂G<br />
∂y<br />
= M, ed è noto (teorema di Cramer) che, se detM = 0, allora<br />
∀x∈X il sistema ammette una ed una sola soluzione y∈IR k . Evidentemente questo è<br />
uno dei casi in cui il problema ha esito positivo anche da un punto di vista globale.<br />
Teorema <strong>F1.</strong>1 (del Dini). Sia G : A → IR k , con A aperto di IR n+k e G∈C 1 (A). Sia<br />
(x0,y0)∈A con G(x0,y0) = 0. Se | ∂G<br />
∂y (x0,y0)| = 0, allora ∃I∈I(x0) ed ∃J∈I(y0),<br />
con I×J ⊆ A, tali che ∀x∈I ∃!y =: g(x)∈J tale che G(x,y) = 0, ossia tali (gli<br />
intorni I e J) che ∃!g : I → J tale che ∀x∈I G(x,g(x)) = 0. Inoltre g(x0) = y0.<br />
Infine g∈C 1 (I) e ∀x∈I Dg(x) = −[ ∂G<br />
∂y (x,g(x))]−1 · ∂G<br />
∂x (x,g(x)).<br />
(1) <strong>Il</strong> sistema rappresenta una varietà n–dimensionale in IR n+k , che si chiama anche curva nel<br />
caso n = 1 e ipersuperficie nel caso k = 1.<br />
2
•) <strong>Il</strong> caso delle equazioni in due variabili.<br />
Analizziamo più da vicino il caso n = k = 1, ossia quello dell’equazione G(x,y) = 0,<br />
con G funzione reale di due variabili reali.<br />
Teorema <strong>F1.</strong>2. Sia G : A → IR, con A aperto di IR 2 e G∈C 1 (A). Sia (x0,y0)∈A<br />
con G(x0,y0) = 0. Se Gy(x0,y0) = 0, allora ∃I∈I(x0) ed ∃J∈I(y0), con I×J ⊆ A,<br />
tali che ∀x∈I ∃!y =: g(x)∈J tale che G(x,y) = 0, ossia tali (gli intorni I e J) che<br />
∃!g : I → J tale che ∀x∈I G(x,g(x)) = 0. Inoltre g(x0) = y0. Infine g∈C 1 (I) e<br />
∀x∈I g ′ (x) = − Gx(x,g(x))<br />
Gy(x,g(x)) .<br />
Dim. Supponiamo Gy(x0,y0) > 0. Dal teorema della permanenza del segno applicato<br />
alla funzione Gy segue che ∃σ∈IR + tale che Qσ := [x0−σ, x0+σ]×[y0−σ, y0+σ] ⊆ A<br />
e ∀(x,y)∈Qσ Gy(x,y) > 0. Ne discende che, ∀x∈[x0−σ, x0+σ], la funzione G(x,·)<br />
è strett/te crescente in [y0−σ, y0+σ]. Ciò vale in particolare per la funzione G(x0,·),<br />
cosicché risulta G(x0,y0−σ) < G(x0,y0) < G(x0,y0+σ), ossia G(x0,y0−σ) < 0 e<br />
G(x0,y0+σ) > 0. Per il teorema della permanenza del segno applicato alla funzione G,<br />
∃δ(≤ σ)∈IR + tale che ∀x∈]x0−δ, x0+δ[ risulta<br />
G(x,y0−σ) < 0 e G(x,y0+σ) > 0. Allora, per ogni<br />
x∈]x0−δ, x0+δ[, per il teorema degli zeri applicato<br />
alla funzione G(x,·) e per la iniettività della stessa,<br />
∃!y =: g(x)∈]y0−σ, y0+σ[ tale che G(x,y) = 0.<br />
Con ciò è provata la prima parte della tesi, ove si<br />
assumano I =]x0−δ, x0+δ[ e J =]y0−σ, y0+σ[.<br />
Per costruzione risulta g(x0) = y0.<br />
Fissato x∈I, proviamoche ∃g ′ (x) = − Gx(x,g(x))<br />
Gy(x,g(x)) ; eatalescopo prendiamo h ∈ IR\{0}<br />
tale che x+h∈I. Per il teorema di Lagrange in due variabili, esiste (ξ,η) interno al<br />
segmento di estremi (x,g(x)) e (x+h,g(x+h)) tale che G(x+h,g(x+h))−G(x,g(x)) =<br />
Gx(ξ,η)h+Gy(ξ,η)(g(x+h)−g(x));ed’altraparte, percomeèdefinita g, sihache G(x+<br />
h,g(x+h))−G(x,g(x)) = 0−0 = 0. Nesegue, essendo Gy(ξ,η) = 0, che g(x+h)−g(x) =<br />
− Gx(ξ,η)<br />
h. Unaprimaconseguenza diquestauguaglianzaècherisulta |g(x+h)−g(x)| ≤<br />
Gy(ξ,η)<br />
max |Gx|<br />
I×J<br />
min I×J |Gy|<br />
|h|; da quisegueche g(x+h)−→ g(x), ossiache g ècontinua inx(cosicchég è<br />
h→0<br />
continua in I, data l’arbitrarietà di x), e ciò implica a sua volta che (ξ,η)−→ (x,g(x)),<br />
h→0<br />
dato che |ξ − x| < |h| e |η − g(x)| < |g(x + h) − g(x)|. Una seconda conseguenza<br />
dell’uguaglianza stabilita è che g(x+h)−g(x)<br />
= − Gx(ξ,η)<br />
, da cui discende, grazie anche<br />
alla continuità di Gx e Gy, che lim<br />
h→0<br />
h<br />
g(x+h)−g(x)<br />
h<br />
Con ciò è provato che ∀x∈I ∃g ′ (x) = − Gx(x,g(x))<br />
Gy(x,g(x))<br />
Gx, Gy e g, che g ′ ∈C 0 (I), ossia che g∈C 1 (I)<br />
3<br />
Gy(ξ,η)<br />
= lim (−<br />
h→0 Gx(ξ,η)<br />
Gy(ξ,η) ) = −Gx(x,g(x))<br />
Gy(x,g(x)) .<br />
, e da qui segue, per la continuità di
Esempio <strong>F1.</strong>1. Riprendiamo in esame l’equazione x 2 +y 2 −1 = 0. Posto G(x,y) =<br />
x 2 + y 2 − 1, si calcola che Gy(x,y) = 2y. Allora ogni punto (x0,y0) della curva Γ =<br />
{(x,y)∈IR 2 /x 2 + y 2 − 1 = 0}, con l’eccezione al più dei punti (±1,0), ammette un<br />
intorno nel quale Γ è grafico di una funzione y = g(x). La funzione in questo caso è<br />
anche facilmente esplicitabile, ed è y = √ 1−x 2 se y0 > 0, y = − √ 1−x 2 se y0 < 0.<br />
Invece nei punti (±1,0) l’ipotesi sulla Gy non è soddisfatta, e quindi il teorema è inapplicabile.<br />
Tuttavia risulta Gx(±1,0) = 0, sicché il teorema può essere applicato a<br />
variabili scambiate: ciascuno di questi punti ammette un intorno in cui Γ è grafico di<br />
una funzione x = h(y) (che è poi x = 1−y 2 per (1,0)e x = − 1−y 2 per (−1,0)).<br />
-) Come suggerito nel precedente esempio, scambiando il ruolo delle variabili si può<br />
dire che, se Gx(x0,y0) = 0, allora l’equazione G(x,y) = 0 definisce implicitamente una<br />
funzione x = h(y) di classe C 1 in un intorno di y0, avente derivata h ′ (y) = − Gy(h(y),y)<br />
Gx(h(y),y) .<br />
Riunendo i due casi trattati ne deduciamo che, posto Γ = {(x,y)∈A/G(x,y) = 0} e<br />
preso P0 = (x0,y0)∈Γ, se ∇G(P0) = (0,0), allora esiste un intorno di P0 in cui Γ è<br />
grafico di una funzione di classe C 1 del tipo y = g(x) o x = h(y), e quindi in ogni caso<br />
è sostegno di una curva regolare e semplice. Inoltre, la tangente a Γ in P0 ha equazione<br />
Gx(P0)(x−x0)+Gy(P0)(y −y0) = 0. Infatti, se la curva è del tipo y = g(x), è noto<br />
che la tangente è y = g(x0)+g ′ (x0)(x−x0), e da qui si passa alla<br />
equazione suddetta ricordando che g(x0) = y0 e g ′ (x0) = − Gx(P0)<br />
Gy(P0) ;<br />
e allo stesso risultato si arriva se si scambiano fra loro le variabili x<br />
ed y. Ponendo P = (x,y), l’equazione della tangente può mettersi<br />
nella forma ∇G(P0)·(P −P0) = 0, da cui si deduce che il vettore<br />
∇G(P0) è normale alla tangente, e quindi alla curva, nel punto P0.<br />
I punti P0 ∈Γ tali che ∇G(P0) = (0,0) si dicono punti regolari di Γ. Invece i punti<br />
P0∈Γ tali che ∇G(P0) = (0,0) si dicono punti singolari di Γ (relativamente a G): per<br />
essi non è garantita l’esistenza di un intorno nel quale Γ è il grafico di una funzione.<br />
-) Considerato un qualunque punto P0∈A con ∇G(P0) = (0,0), sapevamo già che la<br />
direzione del vettore ∇G(P0) è quella lungo la quale si ha il massimo incremento della<br />
funzione G. Ora abbiamo appreso in più che, se G(P0) = 0, se cioè P0 ∈Γ, che è la<br />
curva di livello 0 di G, allora ∇G(P0) è normale a Γ in P0.<br />
Più in generale, qualunque sia il valore G(P0), per P0 passa comunque una delle curve<br />
di livello di G, precisamente la curva Γc con c = G(P0). Se ∇G(P0) = (0,0), la curva<br />
Γc è regolare e semplice nell’intorno di P0, con tangente di equazione Gx(P0)(x−x0)+<br />
Gy(P0)(y−y0) = 0, eilvettore∇G(P0)ènormaleaΓc inP0. InfattiΓc nonèchelacurva<br />
di livello 0 della funzione H(P) = G(P)−c, per la quale risulta ∇H(P0) = ∇G(P0).<br />
Le curve Γc non sono altro che le curve equipotenziali del campo gradiente ∇G, così<br />
chiamate perché su ciacuna di esse il potenziale G è costante. In base a quanto stabilito,<br />
possiamo affermare che ogni campo gradiente risulta, in ogni punto in cui non è nullo,<br />
normale alla linea equipotenziale passante per quel punto.<br />
4
-) Se le ipotesi del teorema sono soddisfatte, e in particolare risulta Gy(x0,y0) = 0, così<br />
da esser certi che la funzione implicita y = g(x) esiste ed è di classe C 1 in un intorno di<br />
x0, la sua derivata y ′ può essere calcolata direttamente dall’uguaglianza G(x,y) = 0,<br />
ove si pensi y funzione di x. Si ricava infatti, grazie al teorema di derivazione della<br />
funzione composta, che Gx(x,y)+Gy(x,y)y ′ = 0, ossia appunto che y ′ = − Gx(x,y)<br />
Gy(x,y) .<br />
Dalla formula dimostrata g ′ (x) = − Gx(x,g(x))<br />
Gy(x,g(x)) , se ci si mette nell’ipotesi più forte che<br />
G∈C 2 (A), si deduce che g∈C 2 (I), e, a conti fatti, che<br />
g ′′ (x) = −<br />
2<br />
2<br />
Gxx(x,g(x))Gy (x,g(x))−2Gxy(x,g(x))Gx(x,g(x))Gy(x,g(x))+Gyy(x,g(x))G x (x,g(x))<br />
G3 y (x,g(x))<br />
.<br />
Ciò fa capire come sia possibile dimostrare, ragionando per induzione, che, ∀h∈IN, da<br />
G∈C h (A) segue che g∈C h (I), e che la derivata h-esima di g nel punto x è esprimibile<br />
in funzione delle derivate parziali fino all’ordine h di G nel punto (x,g(x)).<br />
La conoscenza delle derivate di g in x0, ricavate dalle derivate parziali di G in (x0,y0),<br />
consente di ricavare lo sviluppo di Taylor di g di punto iniziale x0; cosicché la funzione<br />
implicita, che spesso non è concretamente esplicitabile, potrà comunque essere<br />
conosciuta con una certa approssimazione in prossimità del punto x0.<br />
Esempio <strong>F1.</strong>2. Siano l’equazione xe y −y = 0 e, per cominciare, il punto (0,0).<br />
Posto G(x,y) = xe y −y, si vede che G∈C ∞ (IR 2 ), che G(0,0) = 0 eche Gy(0,0) = −1.<br />
Pertanto l’equazione definisce implicitamente in un intorno di (0,0)<br />
una funzione y = y(x), che è di classe C ∞ in un intorno del punto 0.<br />
E’ noto che y(0) = 0. Derivando rispetto ad x ambo i membri dell’equazione<br />
assegnata, dove si pensi y dipendente da x, si ricava che<br />
e y +xe y y ′ −y ′ = 0; da qui, ponendo x = 0 e y = 0, si deduce che<br />
y ′ (0) = 1. Derivando ulteriormente, sempre rispetto ad x, si trova<br />
che 2e y y ′ +xe y (y ′ ) 2 +xe y y ′′ −y ′′ = 0, e da qui, ponendo x = 0,<br />
y = 0 e y ′ = 1, si ottiene che y ′′ (0) = 2. Pertanto: y(x) = x+x 2 +o(x 2 ) per x → 0.<br />
Passiamo ora ad analizzare gli altri punti della curva Γ = {(x,y)∈IR 2 /G(x,y) = 0}.<br />
<br />
G(x,y) = 0<br />
Risolvendo il sistema<br />
Gy(x,y) = 0 , si trova che (e−1 ,1) è l’unico punto della curva<br />
nel quale il teorema<br />
<br />
del Dini è inapplicabile allo scopo di esprimere y in funzione di x.<br />
G(x,y) = 0<br />
Invece il sistema non ammette soluzioni, cosicché ogni punto della curva<br />
Gx(x,y) = 0<br />
possiede un intorno nel quale la stessa è grafico di una funzione di classe C1 del tipo<br />
x = x(y). Si riconosce anzi che in questo caso la curva Γ è anche globalmente grafico di<br />
una funzione della y, essendo Γ = {(x,y)∈IR 2 /x = ye−y } (1) .<br />
(1) Può capitareche un’intera curvasialocalmentegrafico di funzioni ad esempiodellavariabile<br />
y, senza che la stessa sia globalmente grafico di una funzione della variabile y; si pensi alla<br />
curva di equazione (x−y)(x−y +1) = 0.<br />
6
Esempio <strong>F1.</strong>3. Cosideriamo la curva Γ di equazione x 2 (x+1)−y 2 = 0.<br />
Posto G(x,y) = x2 (x + 1) − y2 , si vede che i punti (x,y) di Γ tali che Gy(x,y) = 0<br />
sono (0,0) e (−1,0), mentre i punti tali che Gx(x,y) = 0 sono (0,0) e (−2 2 ,± 3 3 √ 3 ).<br />
Ne consegue che (0,0) è l’unico punto singolare di Γ. Si può provare che<br />
non esiste alcun intorno del punto (0,0) nel quale Γ è grafico di una funzione<br />
della variabile x o della variabile y. In effetti, pur senza voler entrare<br />
nei dettagli, avvertiamo che, con l’aiuto delle derivate successive della<br />
funzione G in (0,0), questo punto singolare viene classificato come “nodo”,<br />
o “punto doppio a tangenti distinte”, dove con il termine “tangenti” in un simile punto<br />
P0 = (x0,y0) ci si riferisce alle due rette le cui equazioni si ottengono spezzando<br />
l’equazione Gxx(P0)(x − x0) 2 + 2Gxy(P0)(x − x0)(y − y0) + Gyy(P0)(y − y0) 2 = 0.<br />
Nel caso di questo esempio, l’equazione è 2x2 −2y2 = 0, ossia y = ±x.<br />
Esempio <strong>F1.</strong>4. <strong>Il</strong>punto (0,0)èsingolareanche per lacurva Γdi equazione x 2 −y 3 = 0.<br />
Tuttavia l’equazione può essere scritta, anche globalmente, nella forma<br />
y = g(x): risulta infatti Γ = {(x,y)∈IR 2 /y = 3√ x 2 }, dove però la<br />
funzione y = 3√ x 2 non è di classe C 1 in alcun intorno del punto 0.<br />
<strong>Il</strong> punto singolare (0,0) viene classificato come “punto cuspidale”.<br />
Qui l’equazione Gxx(P0)(x−x0) 2 +2Gxy(P0)(x−x0)(y −y0)+Gyy(P0)(y −y0) 2 = 0,<br />
di cui s’è detto nell’esempio precedente, è 2x 2 = 0, cosicché nel punto (0,0) si hanno<br />
due “tangenti” coincidenti, di equazione x = 0.<br />
Esempio <strong>F1.</strong>5. Consideriamo la curva Γ di equazione x3 +xy2−x 2−y 2 = 0.<br />
Posto G(x,y) = x3 +xy2−x 2−y 2 ⎧<br />
⎨G(x,y)<br />
= 0<br />
, si vede che il sistema Gy(x,y) = 0<br />
⎩<br />
Gx(x,y) = 0<br />
ammette come unica soluzione il punto (0,0), che dunque è l’unico punto<br />
singolare di Γ. Si riconosce che l’equazione può mettersi nella forma<br />
(x 2 +y 2 )(x−1) = 0, che si spezza in x 2 +y 2 = 0 e x−1 = 0; pertanto<br />
Γ è costituita dal punto (0,0) e dalla retta x = 1.<br />
<strong>Il</strong> punto singolare (0,0) viene classificato come “punto isolato”.<br />
Esempio <strong>F1.</strong>6. Interessante è il caso della funzione G(x,y) = (x 2 +y 2 −1) 2 .<br />
Si vede che, ∀(x,y)∈Γ, dove Γ è il luogo degli zeri di G, risulta ∇G(x,y) = (0,0),<br />
cosicché tutti i punti di Γ sono singolari relativamente a G. Eppure, in un opportuno<br />
intorno di ciascuno di essi, la curva Γ, che è la stessa circonferenza dell’Esempio <strong>F1.</strong>1,<br />
è grafico di una funzione di classe C 1 del tipo y = g(x) o x = h(y).<br />
Con ciò è evidenziato il fatto che il teorema del Dini stabilisce una condizione soltanto<br />
sufficiente e non anche necessaria per l’esistenza e la regolarità della funzione implicita.<br />
7
•) <strong>Il</strong> caso delle equazioni in tre variabili.<br />
Approfondiamo ora il caso n = 2, k = 1, ossia quello dell’equazione G(x,y,z) = 0, in<br />
ordine alla possibilità di esprimere z in funzione di x e di y.<br />
Teorema <strong>F1.</strong>3. Sia G : A → IR, con A aperto di IR 3 e G∈C 1 (A). Sia (x0,y0,z0)∈A<br />
con G(x0,y0,z0) = 0. Se Gz(x0,y0,z0) = 0, allora ∃I ∈ I(x0,y0) ed ∃J ∈ I(z0),<br />
con I×J ⊆ A, tali che ∀(x,y)∈I ∃!z =: g(x,y)∈J tale che G(x,y,z) = 0, ossia<br />
tali (gli intorni I e J) che ∃!g : I → J tale che ∀(x,y) ∈ I G(x,y,g(x,y)) = 0.<br />
Inoltre g(x0,y0) = z0. Infine g ∈ C 1 (I) e, ∀(x,y)∈I, gx(x,y) = − Gx(x,y,g(x,y))<br />
Gz(x,y,g(x,y)) e<br />
gy(x,y) = − Gy(x,y,g(x,y))<br />
Gz(x,y,g(x,y)) .<br />
Osserviamo che, se le ipotesi del teorema sono soddisfatte, le derivate parziali gx e gy<br />
possono essere calcolate direttamente dall’uguaglianza G(x,y,z) = 0, nella quale si<br />
pensi z dipendente da x e da y, ossia appunto z = g(x,y). Si ricava infatti, derivando<br />
amboimembriprimarispettoadxepoirispettoady,che Gx(x,y,z)+Gz(x,y,z)zx = 0<br />
e che Gy(x,y,z)+Gz(x,y,z)zy = 0, da cui si passa rispettivamente a zx = − Gx(x,y,z)<br />
Gz(x,y,z)<br />
ed a zy = − Gy(x,y,z)<br />
, in sostanziale accordo con le formule presentate nel teorema.<br />
Gz(x,y,z)<br />
<strong>Il</strong> teorema stabilisce in sostanza che, posto Σ = {(x,y,z)∈A/G(x,y,z) = 0}, che è la<br />
“superficiedilivello0”dellafunzioneG, econsiderato P0 = (x0,y0,z0)∈Σ, se Gz(P0) =<br />
0, allora l’insieme Σ è, in un intorno di P0, il grafico di una funzione di classe C 1 del tipo<br />
z = g(x,y). Analogamente, serisulta Gy(P0) = 0 o Gx(P0) = 0,alloraΣè, nell’intorno<br />
di P0, il grafico di una funzione di classe C1 rispettivamente del tipo y = h(x,z) e<br />
x = l(y,z), le cui derivate parziali son date dalle formule: hx(x,z) = − Gx(x,h(x,z),z)<br />
Gy(x,h(x,z),z) ,<br />
hz(x,z) = − Gz(x,h(x,z),z)<br />
Gy(x,h(x,z),z) , ly(y,z) = − Gy(l(y,z),y,z)<br />
Gx(l(y,z),y,z) , lz(y,z) = − Gz(l(y,z),y,z)<br />
Gx(l(y,z),y,z) .<br />
Pertanto, se ∇G(P0) = (0,0,0), allora l’insieme Σ è, in un intorno di P0, il sostegno di<br />
una superficie regolare. <strong>Il</strong> piano tangente a questa superficie nel punto P0 ha equazione<br />
Gx(P0)(x−x0)+Gy(P0)(y−y0)+Gz(P0)(z−z0) = 0. Infatti, se ad esempio la superficie<br />
si rappresenta nella forma z = g(x,y), è noto che il piano tangente ha equazione<br />
z = g(x0,y0)+gx(x0,y0)(x−x0)+gy(x0,y0)(y−y0), e da questa si passa all’equazione<br />
suddetta ricordando i valori in (x0,y0) di g, gx, gy stabiliti dal teorema. In modo<br />
analogo si ragiona negli altri due casi.<br />
Ponendo P = (x,y,z), l’equazione del piano tangente può essere<br />
riscritta nella forma ∇G(P0)·(P −P0) = 0, dalla quale si dedu-<br />
ce che il vettore ∇G(P0) è normale alla superficie Σ nel punto P0.<br />
Se ∇G(P0) = (0,0,0), diciamo che P0 è un punto regolare della superficie Σ; altrimenti<br />
si dice che P0 è un punto singolare di Σ (relativamente a G).<br />
8
Con un ragionamento analogo a quello seguito nella sezione precedente, riconosciamo<br />
che, considerato un qualunque punto P0 ∈ A con ∇G(P0) = (0,0,0), la superficie<br />
di livello passante per P0 è, nell’intorno di P0, il sostegno di una superficie regolare,<br />
rispetto alla quale il vettore ∇G(P0) risulta essere normale. Questa superficie non è<br />
altro che una superficie equipotenziale del campo vettoriale ∇G.<br />
Esempio <strong>F1.</strong>7. <strong>Il</strong> punto (0,0,0) è singolare per la superficie di equazione<br />
x 2 +y 2 −z 2 = 0, che una superficie conica le cui due falde hanno<br />
vertice nel suddetto punto: in questo caso non esiste alcun intorno del<br />
punto nel quale il luogo Σ sia il grafico di una funzione delle variabili<br />
(x,y) o (x,z) o (y,z).<br />
Interessante è anche il caso della superficie xy 2 +z 3 = 0, per la quale<br />
sono singolari tutti i punti dell’asse x. La superficie è il grafico della<br />
funzione z = − 3 xy 2 , che non è differenziabile nei punti degli assi x e y.<br />
Esempio <strong>F1.</strong>8. Consideriamo la superficie Σ = {(x,y,z)∈IR 3 /xz 2 −y 2 +2e z = 1}<br />
ed il suo punto P0 = (0,1,0).<br />
Posto G(x,y,z) = xz 2 −y 2 +2e z −1, si vede che Gx(P0) = 0, Gy(P0) = −2 e Gz(P0) =<br />
2, cosicché esiste il piano tangente a Σ in P0 ed ha equazione −2(y −1)+2z = 0.<br />
Poiché Gz(P0) = 0, la superficie Σ è, nell’intorno di P0, il grafico di una funzione<br />
z = g(x,y), definita in un intorno di (0,1) e tale che g(0,1) = 0. Inoltre risulta<br />
gx(0,1) = − Gx(P0)<br />
Gz(P0) = 0 e gy(0,1) = − Gy(P0)<br />
Gz(P0)<br />
Possiamo ritrovare le derivate parziali delle funzione implicita nel punto (0,1) procedendo<br />
nel seguente modo: per comodità indichiamo la funzione implicita con z =<br />
z(x,y); dall’equazione xz 2 −y 2 +2e z −1 = 0, derivando ambo i membri rispetto ad x,<br />
si ottiene z 2 +2xzzx +2e z zx = 0; da qui, ponendo x = 0, y = 1 e z = 0, si ricava che<br />
zx(0,1) = 0; in modo analogo si procede per ricavare che zy(0,1) = 1.<br />
Poiché Gy(P0) = 0, la superficie Σ è, nell’intorno di P0, il grafico di una funzione<br />
y = h(x,z), definita in un intorno di (0,0) e tale che h(0,0) = 1. Inoltre risulta<br />
hx(0,0) = − Gx(P0)<br />
Gy(P0) = 0 e hz(0,0) = − Gz(P0)<br />
= 1. Anche qui ritroviamo le derivate in<br />
Gy(P0)<br />
(0,0) della funzione implicita, che ora preferiamo indicare con y = y(x,z), ricavandole<br />
dall’equazione xz2−y2 +2ez −1 = 0 ove si pensi y funzione di x e di z: derivando ambo<br />
i membri rispetto ad x otteniamo z2−2yyx = 0, da cui, per x = 0, y = 1 e z = 0, si<br />
deduce che yx(0,0) = 0; in modo analogo si arriva ad ottenere che yz(0,0) = 1.<br />
Da notare che in questo caso la funzione h si può facilmente esplicitare; tenendo conto<br />
del segno di h(0,0), si ricava infatti che h(x,z) = √ xz2 +2ez −1.<br />
Infine, poiché Gx(P0) = 0, il Teorema <strong>F1.</strong>3 non è applicabile in ordine alla possibilità<br />
di esprimere x in funzione di y e di z nell’intorno di P0.<br />
9<br />
= 1.
•) <strong>Il</strong> caso dei sistemi di due equazioni in tre variabili.<br />
Consideriamo infine il caso n = 1, k = 2, ossia quello del sistema<br />
ordine alla possibilità di esprimere y e z in funzione di x.<br />
<br />
G1(x,y,z) = 0<br />
, in<br />
G2(x,y,z) = 0<br />
Teorema <strong>F1.</strong>4. Sia G = (G1,G2) : A → IR 2 , con A aperto di IR 3 e G∈C 1 (A). Sia<br />
(x0,y0,z0)∈A con G(x0,y0,z0) = 0. Se | ∂(G1,G2)<br />
∂(y,z) (x0,y0,z0)| = 0, allora ∃I ∈I(x0)<br />
ed ∃J ∈I(y0,z0), con I×J ⊆ A, tali che ∀x∈I ∃!(y,z) =: (g1(x),g2(x))∈J tale<br />
che G(x,y,z) = 0, ossia tali (gli intorni I e J) che ∃!g = (g1,g2) : I → J tale che<br />
∀x∈I G(x,g1(x),g2(x)) = 0. Inoltre g1(x0) = y0 e g2(x0) = z0. Infine g∈C 1 (I) e,<br />
∀x∈I, g ′ 1 (x) = −|∂(G 1 ,G 2 )<br />
∂(x,z) (x,g1(x),g2(x))|<br />
| ∂(G 1 ,G 2 )<br />
∂(y,z) (x,g1(x),g2(x))| e g′ 2 (x) = −|∂(G 1 ,G 2 )<br />
(x,g1(x),g2(x))|<br />
∂(y,x)<br />
| ∂(G1 ,G2 )<br />
(x,g1(x),g2(x))| ∂(y,z) .<br />
Anchequisuggeriamounmetodopraticopercalcolarelederivatedellefunzioni implicite<br />
g1 e g2, ammesso che le ipotesi del teorema siano soddisfatte: partendo dal sistema<br />
G1(x,y,z) = 0<br />
G2(x,y,z) = 0 , nel quale si pensi y = g1(x) e z = g2(x), si derivano ambo i membri<br />
delle due equazioni ottenendo<br />
e da qui si ricava che y ′ = − |∂(G 1 ,G 2 )<br />
∂(x,z) (x,y,z)|<br />
| ∂(G 1 ,G 2 )<br />
(G1)x(x,y,z)+(G1)y(x,y,z)y ′ +(G1)z(x,y,z)z ′ = 0<br />
(G2)x(x,y,z)+(G2)y(x,y,z)y ′ +(G2)z(x,y,z)z ′ = 0 ,<br />
∂(y,x) (x,y,z)|<br />
(x,y,z)| ∂(y,z) e z′ = − |∂(G 1 ,G2 )<br />
| ∂(G1 ,G2 )<br />
(x,y,z)| ∂(y,z) .<br />
<br />
G1(x,y,z) = 0<br />
<strong>Il</strong> teorema stabilisce in sostanza che, posto Γ = {(x,y,z)∈A/ }, che<br />
G2(x,y,z) = 0<br />
è la “curva di livello (0,0)” della funzione G, e considerato il punto P0 = (x0,y0,z0)∈Γ,<br />
se UG(P0) := | ∂(G1,G2)<br />
∂(y,z) (P0)| = 0, allora il sistema può mettersi, almeno in un intorno<br />
<br />
y = g1(x)<br />
di P0, nella forma<br />
z = g2(x) , con g1 e g2 funzioni di classe C1 in un intorno di x0.<br />
Analogheconsiderazioni si fanno nell’ipotesiche VG(P0):=| ∂(G1,G2)<br />
∂(z,x) (P0)|=0, o inquella<br />
che WG(P0):=| ∂(G1,G2)<br />
∂(x,y) (P0)|=0, scambiando opportunamente il ruolo delle variabili.<br />
Considerato che UG(P0),VG(P0),WG(P0) sono i minori d’ordine due, presi con segno<br />
alternato, della matrice jacobiana DG(P0) = ∂(G1,G2)<br />
∂(x,y,z) (P0), deduciamo che, se essa ha<br />
rango 2, l’insieme Γ è, nell’intorno di P0, il sostegno di una curva regolare e semplice.<br />
La tangente a questa curva in P0 ha la direzione del vettore (UG(P0),VG(P0),WG(P0)).<br />
Infatti, nell’ipotesi ad esempio che UG(P0) = 0, il vettore tangente in P0 alla curva<br />
y = g1(x)<br />
z = g2(x) èdatoda(1,g′ 1 (x0),g ′ 2 (x0)); equesto, inbasealleformuleg ′ 1 (x0) = VG(P0)<br />
UG(P0) e<br />
g ′ 2 (x0) = WG(P0)<br />
UG(P0)<br />
stabilitenel teorema, è parallelo al vettore (UG(P0),VG(P0),WG(P0)).<br />
10
Considerato poi che (UG(P0),VG(P0),WG(P0)) = ∇G1(P0)×∇G2(P0), ne ricaviamo<br />
che i vettori ∇G1(P0) e ∇G2(P0) sono normali alla curva Γ in P0.<br />
Un punto P0 di Γ è detto regolare se la matrice jacobiana DG(P0)<br />
ha rango 2, altrimenti è detto singolare (relativamente a G).<br />
Infine osserviamo, relativamente ad un punto regolare P0 della curva Γ ed alle equazioni<br />
G1(x,y,z) = 0 e G2(x,y,z) = 0 prese singolarmente, che, poiché risulta ∇G1(P0) =<br />
(0,0,0) e ∇G2(P0) = (0,0,0), in virtù del Teorema <strong>F1.</strong>3 queste equazioni rappre-<br />
sentano, in un intorno di P0, due superfici regolari; queste superfici evidentemente si<br />
intersecano lungo la curva Γ; infine esse non sono tra loro tangenti in P0, dato che i<br />
corrispondenti vettori normali ∇G1(P0) e ∇G2(P0) non sono fra loro paralleli.<br />
<br />
2 2 2 x +y +z = 2<br />
Esempio <strong>F1.</strong>9. Siano dati il sistema<br />
x2 +y2 −z = 0 ed il punto P0 = ( 1<br />
2 , √ 3<br />
2 ,1).<br />
Posto G1(x,y,z) = x2 +y2 +z2−2 e G2(x,y,z) = x2 +y2 <br />
G1(P0) = 0<br />
−z, si vede che<br />
G2(P0) = 0 ,<br />
ossia che G(P0) = 0 se G = (G1,G2).<br />
√<br />
1 3 2<br />
Inoltre si calcola che DG(P0) =<br />
1 √ <br />
, e da qui si ricavano i determinanti<br />
3 −1<br />
UG(P0) = −3 √ 3, VG(P0) = 3, WG(P0) = 0. Poiché essi non sono tutti nulli, possiamo<br />
affermare che il luogo Γ degli zeri della G è, nell’intorno di P0, il sostegno di una curva<br />
regolare e semplice, e che la tangente a Γ in P0 ha la direzione del vettore (−3 √ 3,3,0).<br />
Essendo in particolare UG(P0) = 0, il sistema definisce implicitamente la coppia di<br />
funzioni y = g1(x) e z = g2(x), ciascuna di classe C 1 in un intorno di x0 = 1<br />
2<br />
g1( 1<br />
2 ) = √ 3<br />
2 e g2( 1<br />
Le derivate g ′ 1 (1<br />
2 ) e g′ 2 (1<br />
2<br />
, e tali che<br />
2 ) = 1; inoltre risulta g′ 1( 1 VG(P0) 1<br />
2 ) = UG(P0) = −√ e g<br />
3 ′ 2( 1 WG(P0)<br />
2 ) = UG(P0) = 0.<br />
) potevano essere calcolate anche nel seguente modo: per<br />
comodità indichiamo le funzioni implicite con y = y(x) e z = z(x); derivando rispetto<br />
ad x ambo i membri di ciascuna delle due equazioni del sistema, otteniamo il sistema<br />
2x+2yy ′ +2zz ′ = 0<br />
2x+2yy ′ −z ′ = 0<br />
; questo, per x = 1<br />
2 , y = √ 3<br />
2 e z = 1, fornisce<br />
y ′ ( 1<br />
2<br />
z ′ ( 1<br />
2<br />
) = − 1<br />
√ 3<br />
) = 0<br />
Osserviamo che, con facili manipolazioni algebriche, il sistema assegnato può mettersi<br />
2 2<br />
nella forma<br />
x +y = 1<br />
, dalla quale è evidente che le funzioni g1(x) e g2(x) possono<br />
z = 1<br />
in questo caso essere anche esplicitate: g1(x) = √ 1−x 2 e g2(x) = 1.<br />
Concludiamo osservando che, essendo anche VG(P0) = 0, il teorema del Dini può essere<br />
applicato anche in ordine alla possibilità di esprimere, in un intorno di P0, le variabili x<br />
e z in funzione della variabile y, ossia di trasformare il sistema assegnato in un sistema<br />
x = h1(y)<br />
del tipo<br />
z = h2(y) ; sulle funzioni h1 ed h2 si possono poi fare considerazioni analoghe<br />
a quelle fatte per le funzioni g1 e g2.<br />
11<br />
.
Esempio <strong>F1.</strong>10. <strong>Il</strong> punto (0,2,0) è singolare per la curva<br />
Esso infatti è soluzione (l’unica) del sistema formato dalle cinque<br />
equazioni G1(x,y,z) = 0, G2(x,y,z) = 0, UG(x,y,z) = 0,<br />
VG(x,y,z) = 0, WG(x,y,z) = 0, dove si è posto<br />
G1(x,y,z) = x 2 +y 2 +z 2 −4 e G2(x,y,z) = x 2 +y 2 −2y.<br />
Da notare che il punto in questione è regolare sia per la superficie<br />
x 2 +y 2 +z 2 = 4<br />
x 2 +y 2 −2y = 0 .<br />
sferica x 2 +y 2 +z 2 = 4 sia per la superficie cilindrica x 2 +y 2 −2y = 0;<br />
esse si intersecano lungo la curva assegnata e sono tra loro tangenti nel punto assegnato.<br />
Tutto ciò risulta confermato dal fatto che ∇G1(0,2,0) = (0,2,0) e ∇G2(0,2,0) =<br />
(0,4,0), cosicché le due superfici hanno, nel punto (0,2,0), piano tangente comune, di<br />
equazione y = 2.<br />
Esempio <strong>F1.</strong>11. <strong>Il</strong> punto (0,0,0) è singolare per la curva<br />
Si riconosce anche che il punto in questione è regolare per cia-<br />
scuna delle superfici x 2 +y 2 −z = 0 e x 2 +y 2 +z 2 −2z = 0;<br />
esse si intersecano lungo la curva assegnata e sono tra loro tan-<br />
genti nel punto assegnato. Invero, posto G1(x,y,z) = x 2 +y 2 −z<br />
e G2(x,y,z) = x 2 +y 2 +z 2 −2z, si calcola che ∇G1(0,0,0) =<br />
(0,0,−1) e ∇G2(0,0,0) = (0,0,−2).<br />
x 2 +y 2 −z = 0<br />
x 2 +y 2 +z 2 −2z = 0 .<br />
Si vede inoltre facilmente che il sistema assegnato si spezza nei due seguenti sistemi:<br />
2 2 2 2 x +y = 1<br />
e<br />
x +y = 0<br />
; pertanto la curva assegnata è costituita dall’unione di<br />
z = 1 z = 0<br />
una circonferenza e del punto isolato (0,0,0).<br />
<br />
2 2 2 x +y −z = 0<br />
Esempio <strong>F1.</strong>12. <strong>Il</strong> punto (0,0,0) è singolare per la curva<br />
x2 +y2−2y = 0 .<br />
In verità non poteva essere altrimenti, dato che, com’è noto,<br />
il punto in questione è singolare già per la superficie conica<br />
x 2 +y 2 −z 2 = 0. Invero, posto P0 = (0,0,0) e G = (G1,G2),<br />
con G1(x,y,z) = x 2 +y 2 −z 2 e G2(x,y,z) = x 2 +y 2 −2y = 0,<br />
e considerato che ∇G1(P0) = (0,0,0), è evidente che la matrice<br />
jacobiana DG(P0) non può avere rango 2.<br />
12
•) <strong>Il</strong> caso dei sistemi di due equazioni in quattro variabili.<br />
Consideriamo infine il caso n = 2, k = 2, ossia quello del sistema<br />
in ordine alla possibilità di esprimere u e v in funzione di x e di y.<br />
G1(x,y,u,v)= 0<br />
G2(x,y,u,v)= 0 ,<br />
Ovviamente a questo caso non è possibile associare una interpretazione geometrica (1) .<br />
Teorema <strong>F1.</strong>5. Sia G = (G1,G2) : A → IR 2 , con A aperto di IR 4 e G∈C 1 (A). Sia<br />
(x0,y0,u0,v0) ∈ A con G(x0,y0,u0,v0) = 0. Se | ∂(G1,G2)<br />
∂(u,v) (x0,y0,u0,v0)| = 0, allora<br />
∃I ∈ I(x0,y0) ed ∃J ∈ I(u0,v0), con I×J ⊆ A, tali che ∀(x,y) ∈ I ∃!(u,v) =:<br />
(g1(x,y),g2(x,y))∈J tale che G(x,y,u,v)= 0, ossia tali (gli intorni I e J) che ∃!g =<br />
(g1,g2) : I → J tale che ∀(x,y)∈I G(x,y,g1(x,y),g2(x,y)) = 0.<br />
Inoltre g(x0,y0) = (u0,v0). Infine g∈C 1 (I) e, ∀(x,y)∈I, risulta:<br />
∂g1<br />
∂x (x,y) = −| ∂(G1 ,G2 )<br />
∂g2<br />
∂x (x,y) = −| ∂(G1 ,G2 )<br />
∂(x,v) (x,y,g1(x,y),g2(x,y))|<br />
| ∂(G 1 ,G 2 )<br />
∂(u,v) (x,y,g1(x,y),g2(x,y))|<br />
∂(u,x) (x,y,g1(x,y),g2(x,y))|<br />
| ∂(G 1 ,G 2 )<br />
∂(u,v) (x,y,g1(x,y),g2(x,y))|<br />
, ∂g1<br />
, ∂g2<br />
∂y (x,y) = −|∂(G 1 ,G 2 )<br />
∂y (x,y) = −|∂(G 1 ,G 2 )<br />
(x,y,g1(x,y),g2(x,y))|<br />
∂(y,v)<br />
| ∂(G1 ,G2 )<br />
(x,y,g1(x,y),g2(x,y))| ∂(u,v) ,<br />
(x,y,g1(x,y),g2(x,y))|<br />
∂(u,y)<br />
| ∂(G1 ,G2 )<br />
(x,y,g1(x,y),g2(x,y))| ∂(u,v) .<br />
Anchequisuggeriamounmetodopraticopercalcolarelederivatedellefunzioni implicite<br />
g1 e g2, ammesso che le ipotesi del teorema siano soddisfatte: partendo dal sistema<br />
<br />
G1(x,y,u,v) = 0<br />
G2(x,y,u,v) = 0 , nel quale si pensi u = g1(x,y) e v = g2(x,y), si derivano rispetto<br />
ad x ambo i membri delle due equazioni, ottenendo<br />
<br />
(G1)x(x,y,u,v)+(G1)u(x,y,u,v)ux+(G1)v(x,y,u,v)vx = 0<br />
, e da qui si ricava che<br />
(G2)x(x,y,u,v)+(G2)u(x,y,u,v)ux+(G2)v(x,y,u,v)vx = 0<br />
ux = − |∂(G 1 ,G2 )<br />
(x,y,g1(x,y),g2(x,y))|<br />
∂(x,v)<br />
| ∂(G1 ,G2 )<br />
(x,y,g1(x,y),g2(x,y))| ∂(u,v) e vx = − |∂(G 1 ,G2 )<br />
(x,y,g1(x,y),g2(x,y))|<br />
∂(u,x)<br />
| ∂(G1 ,G2 )<br />
(x,y,g1(x,y),g2(x,y))| ∂(u,v) ;<br />
se invece deriviamo rispetto ad y, otteniamo<br />
<br />
(G1)y(x,y,u,v)+(G1)u(x,y,u,v)uy +(G1)v(x,y,u,v)vy = 0<br />
, e da qui si ricava che<br />
(G2)y(x,y,u,v)+(G2)u(x,y,u,v)uy +(G2)v(x,y,u,v)vy = 0<br />
uy = − |∂(G 1 ,G 2 )<br />
∂(y,v) (x,y,g1(x,y),g2(x,y))|<br />
| ∂(G 1 ,G 2 )<br />
∂(u,v) (x,y,g1(x,y),g2(x,y))| e vy = − |∂(G 1 ,G 2 )<br />
∂(u,y) (x,y,g1(x,y),g2(x,y))|<br />
| ∂(G 1 ,G 2 )<br />
∂(u,v) (x,y,g1(x,y),g2(x,y))| .<br />
Quanto detto fin qui può essere ripetuto cambiando il ruolo delle variabili, ossia in<br />
ciascuna delle seguenti ipotesi: | ∂(G1,G2)<br />
∂(y,v) (P0)|=0, | ∂(G1,G2)<br />
∂(x,v) (P0)|=0, | ∂(G1,G2)<br />
∂(y,u) (P0)|=<br />
0, | ∂(G1,G2)<br />
∂(x,u) (P0)| = 0, | ∂(G1,G2)<br />
∂(x,y) (P0)| = 0, dove s’è posto P0 = (x0,y0,u0,v0) e dove si<br />
riconosceche questideterminanti, unitamentea | ∂(G1,G2)<br />
∂(u,v) (P0)| che comparenel teorema<br />
enunciato, sono tutti i minori d’ordine due della matrice jacobiana DG(P0).<br />
(1) <strong>Il</strong> sistema in oggetto rappresenta una varietà bidimensionale in IR 4 (n = k = 2).<br />
Le altre possibili varietà in IR 4 sono la curva (n = 1, k = 3) e la ipersuperficie (n = 3, k = 1).<br />
13
F2. Invertibilità delle funzioni da IR n in IR n<br />
Sia F : X → IR n , con X aperto connesso di IR n ed F ∈ C 1 (X). Ci poniamo il problema<br />
di stabilire sotto quali condizioni F è invertibile.<br />
<strong>Il</strong> problema è già risolto se n = 1, essendo noto che: se ∀x∈X F ′ (x) = 0, allora F è<br />
invertibile nell’intervallo X. Infatti il teorema degli zeri applicato ad F ′ assicura che F ′<br />
è ovunque positiva o ovunque negativa in X, cosicché F è strettamente monotona in X.<br />
Si sa anche che F −1 ∈C 1 (F(X)), e che ∀y∈F(X) (F −1 ) ′ (y) = 1<br />
F ′ (x) , con x = F−1 (y).<br />
Tornando ad n qualsiasi, un caso particolare notevole si ha con F : IR n → IR n lineare.<br />
Detta A la matrice associata ad F, ossia quella per cui F(x) = Ax ∀x∈IR n , è noto<br />
che, se detA = 0, allora ∀y ∈IR n ∃!x∈IR n tale che Ax = y (teorema di Cramer).<br />
Se ricordiamo che ∀x∈IR n Df(x) = A, il risultato esposto può essere espresso come<br />
segue: se ∀x∈IR n Jf(x) = 0, allora F è invertibile. Si sa inoltre che anche la funzione<br />
F −1 è lineare, e che la matrice ad essa associata è A −1 ; ne segue che F −1 ∈ C 1 (IR n ) e<br />
che ∀y∈IR n DF −1 (y) = [DF(x)] −1 , dove x = F −1 (y).<br />
Gli esempi trattatifanno pensare che, anche nel caso generale, una condizione sufficiente<br />
per l’invertibilità di F è che risulti JF(x) = 0 ∀x∈X.<br />
Ma le cose non stanno così, come dimostra l’esempio che segue.<br />
Esempio F2.1. Siano X = {(x1,x2)∈IR 2 /x1 > 0} ed F(x1,x2) = (x1cosx2, x1senx2)<br />
∀(x1,x2)∈X. Si vede che F ∈C 1 (X) eche JF(x1,x2) = x1 = 0 ∀(x1,x2)∈X. D’altra<br />
parte risulta F(x1,x2) = F(x1,x2+2kπ) ∀k∈Z, cosicché F non è invertibile in X.<br />
Si può comunque provare che, sempre nell’ipotesi JF(x) = 0 ∀x∈X, se F è invertibile,<br />
allora F −1 ∈ C 1 (F(X)) e ∀y ∈ F(X) DF −1 (y) = [DF(x)] −1 , con x = F −1 (y). In<br />
particolare, la formula per DF −1 (y) si ricava osservando che, essendo F◦F −1 = i F(X) ,<br />
deve aversi DF(x)DF −1 (y) = In, dove In è la matrice unitaria d’ordine n.<br />
A ben vedere, il problema dell’invertibilità di F, che evidentemente nel caso globale non<br />
èsemplice, può essere vistocome unparticolareproblema di funzione implicita: stabilire<br />
sotto quali condizioni, data l’equazione y = F(x), ossia l’equazione G(x,y) = 0 con<br />
G(x,y) = F(x)−y, è possibile, almeno sul piano teorico, esprimere x in funzione di y.<br />
Osservato allora che ∀(x,y)∈X×IR n risulta ∂G<br />
∂G (x,y) = DF(x) e ∂x ∂y (x,y) = −In, dal<br />
teorema del Dini applicato a G discende il seguente risultato, che, nella solita ipotesi su<br />
JF(x), garantisce quanto meno l’invertibilità locale di F.<br />
Teorema F2.1 (diinvertibilitàlocale). Sia F : X → IR n , conX apertoed F ∈ C 1 (X),<br />
e sia x0∈X. Se JF(x0) = 0, allora ∃I(⊆ X)∈I(x0) ed ∃J∈I(F(x0)) tali che ∀y∈J<br />
∃!x∈I tale che F(x) = y, ossia tali (gli intorni I e J) che F |I sia bigettiva fra I e J.<br />
Inoltresi ha (F |I) −1 ∈ C 1 (J) e ∀y∈J D(F |I) −1 (y) = [DF(x)] −1 , con x = (F |I) −1 (y).<br />
14
F3. Problemi di massimo e minimo vincolati<br />
Vogliamo affrontare il problema della determinazione dei valori massimo e minimo fra<br />
quelli che una data funzione assume sui punti di una data curva o di una data superficie.<br />
La funzione è spesso chiamata “funzione obiettivo”, la curva e la superficie son chiamate<br />
“vincoli”, gli estremi di cui s’è detto son chiamati “estremi vincolati”.<br />
Se si opera in IR 2 , il vincolo èuna curva, ossia un insieme di dimensione uno, individuato<br />
da un’uguaglianza del tipo G(x,y) = 0. Se invece si opera in IR 3 , il vincolo può essere<br />
ancora una curva, ossia ancora un insieme di dimensione uno, individuato da una coppia<br />
G1(x,y,z) = 0<br />
di uguaglianze del tipo ; oppure una superficie, ossia un insieme di<br />
G2(x,y,z) = 0<br />
dimensione due, individuato da una uguaglianza del tipo G(x,y,z) = 0.<br />
Considereremo solo casi in cui la funzione obiettivo e le funzioni che individuano il<br />
vincolo sono di classe C 1 ; inoltre, con l’eccezione di qualche esempio particolare, considereremo<br />
solo vincoli limitati e privi di punti singolari.<br />
All’inizio utilizzeremo il metodo della parametrizzazione del vincolo, in modo che il<br />
problema sia ricondotto, nel caso di curve, ad un problema di una sola variabile, il<br />
parametro t, e, nel caso di superfici, ad un problema di due variabili, i parametri u<br />
e v. In quest’ultimo caso, il problema cui ci si riconduce è quello di determinare gli<br />
estremi di una funzione su un dominio di IR 2 , individuato da disuguaglianze imposte ai<br />
parametri. Pertanto, per fare in modo che sotto questo punto di vista la trattazione<br />
sia completa, ci occuperemo anche di casi in cui la funzione obiettivo è da valutare su<br />
domini appunto di IR 2 ed anche di IR 3 , dunque su insiemi aventi la stessa dimensione<br />
dell’ambiente di cui fanno parte, che a volte vengono detti “vincoli di disuguaglianza”.<br />
Successivamente ci occuperemo del metodo dei moltiplicatori di Lagrange, considerando<br />
dapprima ilcaso incui ilvincolosia una curva inIR 2 , poiquellodella curva inIR 3 , quindi<br />
quello della superficie in IR 3 , per concludere con il caso generale del vincolo costituito<br />
da un insieme di dimensione m–k nello spazio IR m .<br />
Esempio F3.1. Unaparticelladimassamèvincolataamuoversi lungolacirconferenza<br />
Γ = {(x,y)∈IR 2 /x 2 +y 2 = 1} nel piano verticale xy, rimanendo ancorata<br />
al punto (1,0) mediante una molla ideale di costante elastica k.<br />
Vogliamo calcolare la posizione di equilibrio stabile della particella,<br />
soggetta alla forza di gravità e alla forza elastica.<br />
<strong>Il</strong> punto di equilibrio stabile è quello in cui l’energia potenziale<br />
è minima. L’energia potenziale della particella nel punto (x,y) è<br />
f(x,y) = mgy+ 1<br />
2 k[(x−1)2 +y 2 ]. <strong>Il</strong> problema è quello di calcolare il minimo di f su Γ.<br />
Poiché Γ è parametrizzata da γ ≡ (cost,sent), t∈[− π<br />
2<br />
, 3π<br />
2<br />
], i valori di f su Γ sono quelli<br />
che assume la funzione F(t) = f(γ(t)) = mgsent+k(1−cost) per t∈[− π<br />
2<br />
15<br />
, 3π<br />
2 ].
Si calcola che F ′ (t) = 0 ⇔ tgt = − mg<br />
k<br />
⇔ t = arctg −mg<br />
k =: t1 ∨ t = π +t1 =: t2.<br />
Dal confronto fra F(− π)<br />
= F(3π<br />
2 2 ) = k − mg, F(t1) = k − k2 +m2g 2 , F(t2) =<br />
k + k2 +m2g 2 (1) , si deduce che minF = F(t1) e maxF = F(t2).<br />
Essendo γ(t1) = P1 = (<br />
√ k<br />
k2 +m2g2 , √ −mg<br />
k2 +m2g2 ) e γ(t2)<br />
−k<br />
= P2 = ( √<br />
k2 +m2g2 ,<br />
√ mg<br />
k2 +m2g2 ),<br />
concludiamo che min Γ f=f(P1)=k − k 2 +m 2 g 2 e max Γ f=f(P2)=k+ k 2 +m 2 g 2 .<br />
Esempio F3.2. Calcoliamo gli estremi della funzione f(x,y) = 3x 2 − 2y 2 − 4x<br />
sull’insieme E = {(x,y)∈IR 2 /x 2 +2y 2 ≤ 1}.<br />
L’insieme E è un vincolo di disuguaglianza, la cui frontiera è il vincolo di uguaglianza<br />
Γ = {(x,y)∈IR 2 /x 2 +2y 2 = 1}. La risoluzione va divisa in due parti: ricerca dei punti<br />
stazionari interni ad E e ricerca dei punti stazionari vincolati a ∂E.<br />
Imponendo ∇f(x,y) = 0 si determina ( 2<br />
3 ,0), unico punto stazionario interno ad E.<br />
La frontiera Γ è parametrizzata da γ ≡ (cost, 1 √ sent), t∈[−π,π], cosicché i valori di<br />
2<br />
f su Γ sono quelli che assume la funzione F(t) = f(γ(t)) = 3cos 2 t−sen 2 t−4cost per<br />
t∈[−π,π]. Si calcola che F ′ (t) = 0 ⇔ t = ±π ∨ t = ± π<br />
3<br />
corrispondono i punti stazionari di f vincolati a Γ: (−1,0), ( 1<br />
2 ,±<br />
<br />
3<br />
8<br />
∨ t = 0; a questi valori di t<br />
), (1,0).<br />
Dalconfrontodeivaloridif neicinquepuntitrovatisievincechemin f = f( E 1<br />
2 ,±<br />
−2 e max f = f(−1,0) = 7.<br />
E<br />
Esempio F3.3. Calcoliamo i punti della curva Γ = {(x,y,z)∈IR 3 /<br />
per i quali è minima o massima la distanza dal punto (0,0,0).<br />
<br />
3<br />
8<br />
) =<br />
2x 2 +y 2 = 8<br />
2x−z +1 = 0 }<br />
Assumiamo come funzione obiettivo la funzione f(x,y,z) = x 2 +y 2 +z 2 , quadrato della<br />
distanza del punto (x,y,z) dal punto (0,0,0).<br />
Considerato che il vincolo Γ è parametrizzato da γ ≡ (2cost,2 √ 2sent,4cost+1), t∈<br />
[−π,π], introduciamo la funzione F(t) = f(γ(t)) = 12cos 2 t+8cost+9, con t∈[−π,π].<br />
Si calcola che F ′ (t) = 0 ⇔ t = ±π ∨ t = 0 ∨ t = ±arccos(− 1<br />
3 ), e si scopre che<br />
minF = F(±arccos(− 1 23<br />
3 )) = 3<br />
e maxF = F(0) = 29.<br />
Si conclude che i punti di Γ più vicini all’origine sono (− 2<br />
3 ,±8<br />
mentre il punto più lontano è (2,0,5), con distanza √ 29.<br />
3 ,−1 ), con distanza 3<br />
23<br />
3 ,<br />
Osserviamo che il problema poteva essere risolto eliminando una variabile: poiché su<br />
Γ risulta z = 2x + 1, i valori di f su Γ sono quelli che assume la funzione h(x,y) =<br />
f(x,y,2x+1) = 5x 2 +y 2 +4x+1 sul vincolo Γ1 = {(x,y)∈IR 2 /2x 2 +y 2 = 8}.<br />
(1) A ben vedere, i punti − π<br />
2<br />
e 3π<br />
2<br />
tali sarebbero se avessimo scelto di far variare t non in [− π<br />
2<br />
per il primo punto e in [0,2π] per il secondo.<br />
potevano essere trattati come comuni punti interni, dato che<br />
16<br />
3π , 2 ], bensì ad esempio in [−π,π]
Esempio F3.4. Calcoliamo gli estremi della funzione f(x,y,z) = √ 3x+ √ 3y−3 √ 2z<br />
sulla superficie Σ = {(x,y,z)∈IR 3 /x 2 +y 2 +z 2 = 2, z ≤ 1}.<br />
<strong>Il</strong> vincolo Σ è parametrizzato da φ ≡ ( √ 2cosucosv, √ 2cosusenv, √ 2senu), su E =<br />
[−π π , ]×[0,2π], cosicché i valori di f su Σ sono quelli che assume la funzione F(u,v) =<br />
2 4<br />
f(φ(u,v)) = √ 6(cosucosv+cosusenv− √ 6senu) sull’insieme E, che è un vincolo di<br />
disuguaglianza.<br />
Procedendo come nell’Esempio F3.2, dapprima si cercano i punti stazionari di F interni<br />
ad E, e si trova (− π<br />
3<br />
i valori di F son dati da r(v) = F(− π<br />
2<br />
π<br />
, 4 ). Quindi si considerano i punti della frontiera. Sul lato u = −π<br />
2<br />
,v) = 6 (il fatto che si tratti di valori costanti<br />
non sorprende, dal momento che ai punti di questo lato corrisponde un unico punto<br />
della superficie sferica). Sul lato u = π<br />
4<br />
i valori di F sono quelli della funzione s(v) =<br />
F( π<br />
4 ,v) = √ 3 cosv + √ 3 senv − 3 √ 2, di cui si calcola che i punti stazionari interni<br />
all’intervallo [0,2π] sono ( π<br />
4<br />
, π<br />
4<br />
) e (π<br />
4<br />
, 5<br />
4<br />
π). Passando ai lati v = 0 e v = 2π, si esamina<br />
la funzione t(u) = F(u,0) = F(u,2π) = √ 6 cosu−6 senu), di cui si calcola che l’unico<br />
punto stazionario interno all’intervallo [−π π , 2 2 ] è u = −arctg√6. Infine vanno considerati i valori che F assume nei quattro vertici del rettangolo E.<br />
Dal confronto dei valori di F nei punti trovati (1) deduciamo che min EF = F( π<br />
4<br />
5π<br />
, 4 ) =<br />
− √ 6−3 √ 2 e max F = F(− E π π<br />
3 , 4 ) = 4√3. Infine, tornando alla f, si conclude che min f = f(− Σ 1 √ ,−<br />
2 1 √ ,1) = −6 − 3<br />
2 √ 2 e<br />
max f = f(− Σ 1<br />
2 ,−1 2 , √ √2 3 ) = 4 √ 3.<br />
Esempio F3.5. Calcoliamo gli estremi della funzione f(x,y,z) = x 2 y−z sull’insieme<br />
E = {(x,y,z)∈IR 3 /z ≥ x 2 +y 2 , x 2 +y 2 +z 2 ≤ 2}.<br />
L’insieme E è un vincolo di disuguaglianza, cosicché il lavoro va diviso nella ricerca dei<br />
punti stazionari interni ad E e nella ricerca dei punti stazionari vincolati a ∂E.<br />
La frontiera ∂E a sua volta va considerata composta dalle seguenti parti: la superficie<br />
Σ1 = {(x,y,z)∈IR 3 /z = x 2 +y 2 , x 2 +y 2 < 1}, che richiede la determinazione dei punti<br />
stazionari di F1(x,y) = f(x,y,x 2 +y 2 ) sull’insieme B1 = {(x,y)∈IR 2 /x 2 + y 2 < 1};<br />
la superficie Σ2 = {(x,y,z)∈IR 3 /x 2 +y 2 +z 2 = 1, x 2 +y 2 < 1}, che richiede la deter-<br />
minazione dei punti stazionari di F2(u,v) = f( √ 2cosucosv, √ 2cosusenv, √ 2senu)<br />
sull’insieme B2 = {(u,v)∈IR 2 / π π < u ≤ , 0 ≤ v ≤ 2π}; la curva Γ = {(x,y,z)∈<br />
4 2<br />
IR 3 <br />
2 2<br />
/<br />
x +y = 1<br />
}, che richiede la determinazione dei punti stazionari di G(t) =<br />
z = 1<br />
f(cost,sent,1) sull’insieme D = [0,2π].<br />
(1)<br />
A ben vedere, i punti dei lati v = 0 e v = 2π potevano essere trattati come comuni punti<br />
interni, poiché tali sarebbero se avessimo scelto di far variare v non in [0,2π], bensì ad esempio<br />
in [−π,π] per il primo lato e in [π,3π] per il secondo. Un discorso analogo si può fare per il<br />
lato u = ± π<br />
2 , dato che anche la posizione dei poli dipende dalla scelta della parametrizzazione.<br />
17
F4. <strong>Il</strong> metodo dei moltiplicatori di Lagrange<br />
•) Estremi di funzioni di due variabili su vincoli unidimensionali.<br />
Siano f,G : A → IR, con A aperto di IR 2 ed f,G ∈ C 1 (A). Considerato l’insieme<br />
Γ = {(x,y)∈A/G(x,y) = 0}, che in questo contesto avrà il ruolo di vincolo, vogliamo<br />
riprendereilproblemadideterminare, seesistono, il min Γf edil max Γf,ossiagliestremi<br />
di f vincolati a Γ. Sappiamo già che, se Γ si rappresenta parametricamente mediante<br />
l’applicazione γ ≡ γ(t), t ∈ I, con I intervallo di IR, il problema può essere risolto<br />
riconducendolo a quello di ricercare gli estremi della funzione F(t) = f(γ(t)), t∈I , che<br />
è funzione di una sola variabile.<br />
Considerato anche che non sempre del vincolo Γ si riesce a dare una rappresentazione<br />
parametrica, è utile trovare un metodo che si possa applicare direttamente alla funzione<br />
G. A tale scopo, considerato P0 punto regolare di Γ, cerchiamo una opportuna condizione<br />
necessaria affinché P0 sia un punto di estremo relativo per f |Γ (punto di estremo<br />
relativo di f vincolato a Γ); infatti questa è a sua volta una condizione necessaria perché<br />
P0 sia punto di estremo assoluto per f |Γ .<br />
E’ noto che, essendo ∇G(P0) = (0,0), il vincolo Γ è, in un intorno di P0, il sostegno<br />
di una curva regolare e semplice, che indichiamo con γ ≡ γ(t), t∈I, dove I è un intervallo<br />
aperto di IR. Se si suppone che P0 sia punto di estremo relativo per f |Γ , allora<br />
t0 := γ −1 (P0) dovrà essere punto di estremo relativo per F = f◦γ (invero, supposto ad<br />
esempio che f(P) ≤ f(P0) ∀P ∈B ∩Γ, con B ⊆ A intorno di P0, considerato che, per<br />
la continuità di γ in t0, esiste J∈I(t0) tale che J ⊆ I e γ(J) ⊆ B, si ha che ∀t∈J<br />
f(γ(t)) ≤ f(P0) = f(γ(t0))), e dunque dovrà risultare F ′ (t0) = ∇f(P0)·γ ′ (t0) = 0 (1) ,<br />
come dire che il vettore ∇f(P0) dovrà essere nullo o comunque normale a Γ in P0.<br />
Ricordando infine che anche il vettore ∇G(P0) è normale a Γ in P0, concludiamo che<br />
∇f(P0) dovrà essere nullo o comunque parallelo a ∇G(P0), ossia che dovrà esistere<br />
λ0∈IR tale che ∇f(P0) = λ0∇G(P0).<br />
Con ciò è sostanzialmente provato il cosiddetto teorema dei moltiplicatori di Lagrange,<br />
che riportiamo qui di seguito. In esso sarà utilizzata la funzione, detta lagrangiana<br />
associata allefunzioni f e G, L : A×IR → IR, definita da L(x,y,λ) = f(x,y)−λG(x,y);<br />
il parametro λ prende il nome di moltiplicatore di Lagrange.<br />
Teorema F4.1. Siano f,G : A → IR, con A aperto di IR 2 ed f,G ∈ C 1 (A); sia<br />
Γ = {P ∈A/G(P) = 0}; sia infine P0∈Γ, con ∇G(P0) = 0. Se P0 è punto di estremo<br />
relativo per f |Γ , allora ∃λ0∈IR tale che ∇L(P0,λ0) = 0.<br />
(1)<br />
Indicato con w il versore tangente a Γ in P0, w = γ′ (t0)<br />
|γ ′ , qui si è provato che: condizione<br />
(t0)|<br />
necessaria affinché P0 sia punto di estremo relativo per f è che |Γ ∂f<br />
∂w (P0) = 0.<br />
18
Dim. Si ripete il ragionamento fatto sopra, e si giunge alla tesi osservando che, siccome<br />
∀P ∈A e ∀λ∈IR Lx(P,λ) = fx(P)−λGx(P), Ly(P,λ) = fy(P)−λGy(P), Lλ(P,λ) =<br />
−G(P), allora la condizione ∇L(P0,λ0) = (0,0,0) equivale alla coppia di condizioni<br />
G(P0) = 0, che è nelle ipotesi, e ∇f(P0)−λ0∇G(P0) = (0,0), che è già stata provata<br />
Pertanto, nell’ipotesi che f e G siano di classe C 1 nell’aperto A, i punti di estremo<br />
relativo di f vincolati a Γ vanno ricercati nelle seguenti due classi di punti: i punti<br />
singolari di Γ e i punti P regolari di Γ tali che ∇L(P,λ) sia nullo per qualche λ∈IR,<br />
ossia tali che (P,λ) sia punto stazionario per la funzione L. I punti di questa seconda<br />
classe si dicono punti stazionari di f vincolati a Γ; ed è importante ribadire che questi<br />
punti possono anche non essere di estremo relativo per f |Γ , dato che il teorema fornisce<br />
una condizione soltanto necessaria.<br />
Segnaliamoinfine cheinalcuniproblemi può accadere chelefunzioni f eGsianodefinite<br />
su un insieme E non aperto, e che qualche punto di Γ appartenga a ∂E; in questi casi<br />
il metodo dei moltiplicatori di Lagrange potrà essere applicato al vincolo Γ ∗ := Γ∩E o ,<br />
ossia alle funzioni f |E o e G |E o, e i punti di Γ\Γ ∗ dovranno essere considerati a parte.<br />
Esempio F4.1. Calcoliamo i punti della curva Γ = {(x,y)∈IR 2 /x 4 +y 4 +6xy−8 = 0}<br />
per i quali è minima o massima la distanza dall’origine.<br />
Si tratta di calcolare gli estremi della funzione f(x,y) = x 2 +y 2<br />
sull’insieme degli zeri di G(x,y) = x 4 +y 4 +6xy −8.<br />
Osserviamo dapprima che Γ è un insieme limitato. Infatti, per ogni<br />
(x,y)∈Γ si ha (x 2 +y 2 ) 2 = x 4 +y 4 +2x 2 y 2 ≤ 2(x 4 +y 4 ) ≤ 16−12xy ≤<br />
16 + 12|xy| ≤ 16 + 6(x 2 +y 2 ), ossia ρ 4 ≤ 16 + 6ρ 2 , ossia ancora ρ ≤ 2 √ 2, dove<br />
si è posto ρ = x 2 +y 2 ; dunque la curva Γ è contenuta nel cerchio di centro (0,0)<br />
e raggio 2 √ 2. Oppure si procede così: si interseca Γ con la retta y = mx, ottenendo<br />
i punti (±x(m),±y(m)), con x(m) = 2 √ <br />
2/ 3m+ √ 8m4 +9m2 +8 e y(m) =<br />
2 √ 2m/ 3m+ √ 8m 4 +9m 2 +8, si osserva che le funzioni x(m) ed y(m), m∈IR, sono<br />
limitate, e si conclude che la curva Γ è contenuta in un rettangolo.<br />
VerificatocheΓnonhapuntisingolari,introduciamolafunzionelagrangiana L(x,y,λ)=<br />
x2 +y2 −λ(x 4 +y4 ⎧<br />
+6xy−8) ed imponiamo che ∇L(x,y,λ) = 0, ottenendo il sistema<br />
⎨x−2λx<br />
⎩<br />
3 −3λy = 0<br />
y −2λy3 −3λx = 0<br />
x4 +y4 .<br />
+6xy −8 = 0<br />
Le soluzioni del sistema sono (±1,±1, 1 1<br />
5 ) e (∓2,±2, 5 ), cosicché i punti stazionari di f<br />
vincolatiaΓsonoquattro: (±1,±1)e(∓2,±2). Poiché f(±1,±1) = 2 e f(∓2,±2) = 8,<br />
concludiamo che i punti più vicini all’origine sono (±1,±1), a distanza √ 2, e quelli più<br />
lontani sono (∓2,±2), a distanza 2 √ 2.<br />
19
Esempio F4.2. La superficie di una scatola di forma cilindrica<br />
senza coperchio ha area uguale a 12π. Determiniamo il raggio di<br />
base x e l’altezza y tali che la capacità sia massima, ritenendo<br />
certo che la scatola di capacità massima esiste e non è degenere.<br />
Poiché il volume della scatola è πx 2 y, e l’area della superficie è<br />
πx 2 +2πxy, il problema è quello di determinare i valori di x ed y<br />
che rendono massima la funzione f(x,y) = x 2 y sul vincolo<br />
Γ = {(x,y)∈IR 2 /x 2 +2xy = 12, x,y > 0}.<br />
Posto G(x,y) = x 2 +2xy −12 e osservato che ∇G(x,y) = (0,0)<br />
nei punti di Γ, si introduce L(x,y,λ) = x 2 y −λ(x 2 +2xy −12)<br />
e si calcola che (2,2) è l’unico punto stazionario di f vincolato a Γ.<br />
Si conclude che la scatola di capacità massima ha raggio di base 2<br />
ed altezza 2.<br />
Esempio F4.3. Calcoliamo i punti della curva Γ = {(x,y)∈IR 2 /x 2 +2y 2 −2xy−1 = 0<br />
x,y ≥ 0} per i quali è minima o massima la somma delle distanze dagli assi.<br />
Si tratta di calcolare i punti di minimo e di massimo su Γ della fun-<br />
zione f(x,y) = x+y. Posto Γ ∗ = {(x,y)∈Γ/x,y > 0}, si vede che<br />
Γ ∗ è l’insieme degli zeri della funzione G(x,y) = x 2 +2y 2 −2xy −1<br />
nell’aperto A = {(x,y)∈IR 2 /x,y > 0}. Appurato che Γ ∗ non ha pun-<br />
ti singolari, si introduce la funzione L(x,y,λ) = f(x,y)−λG(x,y) e<br />
si calcola che il gradiente di L è nullo in corrispondenza del punto ( 3 √ 5 , 2<br />
√ 5 ) ∈ Γ ∗ .<br />
Dal confronto dei valori che f assume nel punto trovato e negli estremi (1,0) e (0, 1 √ )<br />
2<br />
di Γ, si scopre che min f = f(0, Γ 1 √ ) =<br />
2 1 √ e max f = f(<br />
2 Γ 3 √ ,<br />
5 2 √ ) =<br />
5 √ 5.<br />
Esempio F4.4. Per calcolare gli estremi della funzione f(x,y) = y 4 − x 2 + 3y sulla<br />
curva Γ = {(x,y)∈IR 2 /x 2 = y 3 }, un metodo efficace è quello di ricondursi allafunzione<br />
F(t) = f(γ(t)) = t 8 −t 6 +3t 2 , dove γ ≡ (t 3 ,t 2 ), t∈IR. Del resto la riduzione ad una<br />
sola variabile si può ottenere anche osservando che sui punti di Γ, dove x 2 = y 3 , i valori<br />
di f sono quelli della funzione h(y) = y 4 −y 3 +3y, y∈[0,+∞[.<br />
Volendo comunque applicare il metodo dei moltiplicatori di Lagrange,<br />
si osserva che il gradiente della lagrangiana L(x,y,λ) = y 4 −x 2 +3y−<br />
λ(x 2 −y 3 ) non è mai nullo in corrispondenza dei punti di Γ, cosicché<br />
il confronto risolutivo va fatto soltanto fra il valore di f nel punto (0,0), che è singolare<br />
per Γ, e il limite di f per (x,y) tendente all’infinito su Γ, dato che Γ non è limitato.<br />
In ogni caso si conclude che min Γ f = f(0,0) = 0, che f non ha massimo su Γ e che<br />
sup f = lim Γ (x,y)→∞ f (x,y) = lim<br />
|Γ y→+∞ (y4−y 3 +3y) = +∞.<br />
20
•) Estremi di funzioni di tre variabili su vincoli unidimensionali.<br />
Siano f,G1,G2 : A → IR, con A aperto di IR 3 ed f,G1,G2 ∈C 1 (A). Considerato il<br />
G1(x,y,z) = 0<br />
vincolo Γ = {(x,y,z)∈ A/ }, anche qui ci poniamo il problema di<br />
G2(x,y,z) = 0<br />
calcolare, se esistono, gli estremi di f vincolati a Γ, ossia il min Γ f ed il max Γ f . E<br />
anche qui ricordiamo che il problema è di facile soluzione se Γ viene rappresentato come<br />
il sostegno della curva γ ≡ γ(t), t∈I, poiché in tal caso si tratta di ricercare gli estremi<br />
della funzione di una sola variabile F(t) = f(γ(t)), t∈I .<br />
Ma ora proponiamoci di determinare un metodo che coinvolga direttamente le funzioni<br />
G1 e G2. Supponiamo allora che P0 sia un punto regolare di Γ e cerchiamo una condizione<br />
necessaria affinché P0 sia punto di estremo relativo per f (punto di estremo<br />
|Γ<br />
relativo di f vincolato a Γ).<br />
E’ noto che, poiché la matrice ∂(G1,G2)<br />
∂(x,y,z) (P0) ha rango 2, il vincolo Γ è, in un intorno di<br />
P0, il sostegno di una curva regolare e semplice γ ≡ γ(t), t∈I, con I intervallo aperto<br />
di IR, e che i vettori ∇G1(P0) e ∇G2(P0) individuano il piano normale a Γ in P0.<br />
Allora, considerato t0∈I tale che γ(t0) = P0, si ha che:<br />
(P0 èpunto diestremo relativoperf )=⇒ (t0 èpunto di estremo relativoper F = f◦γ)<br />
|Γ<br />
=⇒ (F ′ (t0) = ∇f(P0)·γ ′ (t0) = 0) =⇒ (∇f(P0) è nullo o comunque normale a Γ in<br />
P0) =⇒ (∇f(P0) è nullo o comunque complanare con i vettori ∇G1(P0) e ∇G2(P0))<br />
=⇒ (∃λ0,µ0∈IR tali che ∇f(P0) = λ0∇G1(P0)+µ0∇G2(P0)).<br />
Allo scopo di esprimere in modo più agevole il risultato ottenuto, introduciamo la funzione<br />
lagrangiana associata alle funzioni f, G1 e G2, ossia la funzione L : A×IR 2 → IR<br />
definita da L(x,y,z,λ,µ)= f(x,y,z)−λG1(x,y,z)−µG2(x,y,z), con i suoi due moltiplicatori<br />
λ e µ, ed osserviamo che la condizione alla quale siamo pervenuti, unitamente<br />
alla condizione che P0∈Γ, può essere espressa nella seguente forma: ∃λ0,µ0∈IR tali<br />
che ∇L(P0,λ0,µ0) = (0,0,0,0,0).<br />
Con ciò risulta sostanzialmente dimostrato il seguente<br />
Teorema F4.2. Siano: f : A → IR e G : A → IR 2 funzioni di classe C 1 in A aperto di<br />
IR 3 , Γ = {P∈A/G(P) = 0}, P0∈Γ tale che la matrice DG(P0) abbia rango 2. Se P0<br />
è punto di estremo relativo per f |Γ , allora ∃λ0,µ0∈IR tali che ∇L(P0,λ0,µ0) = 0.<br />
Pertanto, nell’ipotesi che f e G = (G1,G2) siano di classe C 1 nell’aperto A, i punti di<br />
estremo relativo di f vincolati a Γ vanno ricercati tra i punti singolari di Γ e tra i punti<br />
P regolari di Γ tali che ∇L(P,λ,µ) sia nullo per qualche coppia di valori reali λ e µ.<br />
Questi ultimi punti sono detti punti stazionari di f vincolati a Γ, e non è garantito che<br />
essi siano necessariamente punti di estremo relativo per f |Γ .<br />
Chiaramente anche qui vale la considerazione, fatta nella sezione precedente, relativa al<br />
caso in cui f e G sono definite in E non aperto e qualche punto di Γ appartiene a ∂E.<br />
21
Esempio F4.5. Determiniamo i punti della curva Γ = {(x,y,z)∈IR 3 /2x−z +1 = 0,<br />
2x 2 +y 2 = 8} aventi distanza minima o massima dall’origine (vedi l’Esempio F3.3).<br />
Si tratta di calcolare i punti di Γ nei quali è minima o massima la funzione f(x,y,z) =<br />
x 2 + y 2 + z 2 (1) . Si osserva che Γ è limitato; infatti, per ogni (x,y,z)∈Γ si ha che<br />
|x| ≤ 1<br />
√ 2<br />
2x 2 +y 2 = 1<br />
√2<br />
√ 8 = 2, |y| ≤ 2x 2 +y 2 = √ 8, |z| ≤ 2|x|+1 ≤ 5.<br />
Considerate le funzioni G1(x,y,z) = 2x−z+1 e G2(x,y,z) = 2x 2 +y 2 −8 ed osservato<br />
che Γ non ha punti singolari, si introduce la funzione L(x,y,z,λ,µ) = f(x,y,z) −<br />
λG1(x,y,z) − µG2(x,y,z) e si calcola che ∇L è nullo in corrispondenza dei punti<br />
3 ,−1 3 ). Dal confronto dei valori di f in questi punti si<br />
evince che min f = f(− Γ 2<br />
3 ,±8 3 ,−1 23 ) = 3 3 e max f = f(2,0,5) = 29.<br />
Γ<br />
(2,0,5), (−2,0,−3), (− 2<br />
3 ,±8<br />
•) Estremi di funzioni di tre variabili su vincoli bidimensionali.<br />
L’ultimo problema che vogliamo affrontare è quello della ricerca del min Σ f e del max Σ f<br />
(estremi di f vincolati a Σ), dove f : A → IR con A aperto di IR 3 e Σ = {(x,y,z)∈A/<br />
G(x,y,z) = 0} con G : A → IR, ed inoltre f,G∈C 1 (A).<br />
Se Σ si rappresenta parametricamente mediante l’applicazione φ ≡ φ(u,v), (u,v)∈D,<br />
con D ⊆ IR 2 , allora il problema si trasferisce alla funzione F(u,v) = f(φ(u,v)), (u,v)∈<br />
D, che è funzione di due variabili. Se ad esempio D è un dominio, la risoluzione del<br />
problema dovrà passare in genere attraverso la determinazione dei punti di estremo<br />
relativo di F interni a D e dei punti di estremo relativo di F vincolati a ∂D.<br />
Ma ora cerchiamo un metodo che coinvolga direttamente la funzione G; e, a tale scopo,<br />
fissiamo P0 punto regolare di Σ e cerchiamo una condizione necessaria affinché P0 sia<br />
punto di estremo relativo per f |Σ (punto di estremo relativo di f vincolato a Σ).<br />
Poiché ∇G(P0) = (0,0,0),ilvincoloΣè, inunintornodiP0, ilsostegnodiunasuperficie<br />
regolare φ ≡ φ(u,v), (u,v)∈B, con B aperto di IR 2 ; si sa inoltre che il vettore ∇G(P0)<br />
è normale a Σ in P0 e che, considerato (u0,v0)∈B tale che φ(u0,v0) = P0, i vettori<br />
φu(u0,v0) e φv(u0,v0) individuano il piano tangente a Σ in P0. Ne segue che:<br />
(P0 èpunto diestremo relativoper f |Σ )=⇒ ((u0,v0)èpunto diestremo relativoper F =<br />
f◦φ) =⇒ (Fu(u0,v0) = ∇f(P0)·φu(u0,v0) = 0 e Fv(u0,v0) = ∇f(P0)·φv(u0,v0) = 0)<br />
=⇒ (∇f(P0) è nullo o comunque normale a Σ in P0) =⇒ (∇f(P0) è nullo o comunque<br />
parallelo al vettore ∇G(P0)) =⇒ (∃λ0∈IR tale che ∇f(P0) = λ0∇G(P0)).<br />
(1) In verità la distanza dall’origine sarebbe x 2 +y 2 +z 2 , ma è noto che √ t è minima o<br />
massima quando il valore di t è rispett/te minimo o massimo.<br />
22
Introduciamo ora la funzione lagrangiana associata alle funzioni f e G, L : A×IR →<br />
IR, definita da L(x,y,z,λ) = f(x,y,z) − λG(x,y,z), con il suo moltiplicatore λ, ed<br />
osserviamo che la condizione alla quale siamo pervenuti, unitamente alla condizione che<br />
P0∈Σ, può essere espressa nella forma: ∃λ0∈IR tale che ∇L(P0,λ0) = (0,0,0,0).<br />
Sussiste pertanto il seguente<br />
Teorema F4.6. Siano f,G : A → IR, con A aperto di IR 3 ed f,G ∈ C 1 (A); sia<br />
Σ = {P∈A/G(P) = 0}; sia infine P0∈Σ, con ∇G(P0) = 0. Se P0 è punto di estremo<br />
relativo per f |Σ , allora ∃λ0∈IR tale che ∇L(P0,λ0) = 0.<br />
Pertanto si conclude che, nell’ipotesi che f e G siano di classe C 1 nell’aperto A, i punti<br />
di estremo relativo di f vincolati a Σ vanno ricercati fra i punti singolari di Σ e i punti<br />
P regolari di Σ tali che ∇L(P,λ) sia nullo per qualche λ∈IR. Questi ultimi punti si<br />
dicono punti stazionari di f vincolati a Σ, e non è detto che essi siano necessariamente<br />
punti di estremo relativo per f |Σ .<br />
Chiaramente anche qui vale la considerazione, fatta nelle sezioni precedenti, relativa al<br />
caso in cui f e G sono definite in E non aperto e qualche punto di Σ appartiene a ∂E.<br />
Esempio F4.6. Determiniamo i punti della superficie Σ = {(x,y,z)∈IR 3 /2x−z+1 =<br />
0, 2x 2 +y 2 ≤ 8} aventi distanza minima o massima dall’origine. In sostanza si tratta di<br />
calcolare i punti di Σ nei quali è massima o minima la funzione f(x,y,z) = x 2 +y 2 +z 2 .<br />
Posto Σ ∗ = {(x,y,z) ∈ Σ/2x 2 + y 2 < 8}, si vede che Σ ∗ è l’insieme degli zeri di<br />
G(x,y,z) = 2x−z +1 nell’aperto A = {(x,y,z)∈IR 3 /2x 2 +y 2 < 8}.<br />
Introdotta la funzione L(x,y,z,λ) = f(x,y,z)−λG(x,y,z), si trova<br />
che il gradiente di L è nullo in corrispondenza del punto (−2 1 ,0, 5 5 ).<br />
Detto Γ il bordo di Σ, Γ = Σ\Σ ∗ , si sa (dall’Esempio F4.5) che i pun-<br />
ti stazionari di f vincolati a Γ sono (2,0,5), (−2,0,−3), (− 2<br />
3 ,±8<br />
3 ,−1<br />
3 ).<br />
Dal confronto dei valori di f nei punti trovati si scopre che min Σ f = f(− 2<br />
5<br />
max Σf = f(2,0,5)= 29.<br />
1 1 ,0, 5 ) = 5 e<br />
Esempio F4.7. Calcoliamo minimo e massimo della funzione f(x,y,z) = x+y −2z<br />
sulla superficie Σ = {(x,y,z)∈IR 3 /x 2 +y 2 +z 2 = 6, x,y,z ≥ 0}.<br />
Dapprima si lavora sul vincolo Σ ∗ = {(x,y,z)∈Σ/x,y,z > 0}, che è<br />
la superficie assegnata privata del bordo: introdotta la lagrangiana<br />
L(x,y,z,λ) = x+y −2z −λ(x 2 +y 2 +z 2 −6), si scopre che non esistono<br />
punti stazionari vincolati a Σ ∗ .<br />
Si considera poi Γ ∗ 1 = {(x,y,z)∈Σ/z = 0, x,y > 0}, che è una parte del bordo di Σ.<br />
Ma qui il problema si può ridurre alle sole variabili x ed y: trovare i punti stazionari di<br />
f1(x,y) := f(x,y,0) vincolati a ζ ∗ 1 = {(x,y)∈IR 2 /x 2 +y 2 = 6, x,y > 0}. Introdotta<br />
la lagrangiana L(x,y,λ) = x+y −λ(x 2 +y 2 −6), si trova il punto ( √ 3, √ 3,0).<br />
23
In modo analogo si lavora su Γ ∗ 2 = {(x,y,z)∈Σ/y = 0, x,z > 0} e su Γ ∗ 3 = {(x,y,z)∈<br />
Σ/x = 0, y,z > 0}. Su queste curve non si trovano punti stazionari vincolati.<br />
Confrontando tra loro i valori che f assume nel punto trovato ( √ 3, √ 3,0) e nei vertici<br />
( √ 6,0,0), (0, √ 6,0) e (0,0, √ 6), si evince che min Σ f = f(0,0, √ 6) = −2 √ 6 e max Σ f =<br />
f( √ 3, √ 3,0) = 2 √ 3.<br />
Esempio F4.8. Calcoliamo il minimo ed il massimo della funzione f(x,y,z) = z−x 2 y<br />
nell’insieme Ω = {(x,y,z)∈IR 3 /z ≥ x 2 +y 2 , x 2 +y 2 +z 2 ≤ 2} (vedi l’Esempio F3.5).<br />
<strong>Il</strong>teoremadi Weierstrassgarantiscel’esistenza degliestremi richiesti. Inoltreosserviamo<br />
che Ω è un vincolo di disuguaglianza, ossia un sottoinsieme di IR 3 avente interno non<br />
vuoto. Pertanto la risoluzione del problema va divisa nelle seguenti parti:<br />
a) ricerca dei punti stazionari di f interni ad Ω: si impone che<br />
∇f(x,y,z) = (0,0,0), e non si trova nessuna soluzione;<br />
b) ricerca dei punti stazionari di f vincolati alla superficie<br />
Σ1 = {(x,y,z)∈IR 3 /z = x 2 +y 2 , x 2 +y 2 < 1}: si impone<br />
che ∇L(x,y,z,λ) = (0,0,0,0), con L(x,y,z,λ) = f(x,y,z)−<br />
λ(x 2 +y 2 −z), e si trova il punto (0,0,0);<br />
c) ricerca dei punti stazionari di f vincolati alla superficie Σ2 = {(x,y,z)∈IR 3 /x 2 +<br />
y 2 + z 2 = 2, z > 1}: si impone che ∇L(x,y,z,λ) = (0,0,0,0), con L(x,y,z,λ) =<br />
f(x,y,z)−λ(x 2 +y 2 +z 2 −2), e si trovano i punti (0,0, √ 2) e (±1/ √ 3,−1/ √ 6, √ 6/2);<br />
d) ricerca dei punti stazionari di f vincolati alla curva Γ = {(x,y,z)∈IR 3 /x 2 +y 2 =<br />
1, z = 1}, che è il bordo comune a Σ1 e Σ2: si impone che ∇L(x,y,z,λ,µ) =<br />
(0,0,0,0,0), con L(x,y,z,λ,µ) = f(x,y,z)−λ(x 2 +y 2 −1)−µ(z−1), e si trovano i<br />
punti (0,±1,1), (± 2/3,− 1/3,1) e (± 2/3, 1/3,1).<br />
Osservato che ∂Ω = Σ1 ∪ Σ2 ∪ Γ, concludiamo che gli estremi di f in Ω sono dati<br />
rispettivamentedalpiùpiccoloedalpiùgrandedei valoridi f nei punti cosìdeterminati,<br />
e sono: min Ωf = 0 = f(0,0,0) e max Ωf = √ 2 = f(0,0, √ 2).<br />
•) <strong>Il</strong> teorema dei moltiplicatori di Lagrange nel caso generale.<br />
I tre teoremi trattati nei paragrafi precedenti possono essere interpretati come casi<br />
particolari del teorema che segue, riferito ad una funzione di m variabili su un vincolo<br />
(m−k)–dimensionale contenuto in IR m , con k,m∈IN, k < m.<br />
Teorema F4.4 (dei moltiplicatori di Lagrange). Sia A un aperto di IR m e siano<br />
f ∈ C 1 (A,IR), e G ∈ C 1 (A,IR k ), con 1 ≤ k < m. Sia Γ = {P ∈A/G(P) = 0} e sia<br />
P0∈Γ tale che la matrice DG(P0) abbia rango k. Se P0 è punto di estremo relativo per<br />
f |Γ ,allora,consideratalafunzione L : A×IR k → IR definitada L(P,Λ) = f(P)−Λ·G(P),<br />
esiste Λ0∈IR k tale che ∇L(P0,Λ0) = 0.<br />
24