F FUNZIONI IMPLICITE MASSIMI E MINIMI VINCOLATI F1. Il ...

F 

FUNZIONI IMPLICITE 

MASSIMI E MINIMI VINCOLATI 

(C. De Mitri) 

F1. Il problema della funzione implicita e il teorema del Dini 

Considerata l’equazione G(x,y) = 0, dove G è una funzione reale definita in un aperto 

A di IR 2 , per molteragioni può tornareutileesprimere una delle due variabiliinfunzione 

dell’altra, ad esempio la y in funzione della x. Per questo motivo ci domandiamo sotto 

quali condizioni si può star certi che esiste una funzione g, reale di una variabile reale, 

tale che l’equazione data sia equivalente all’equazione y = g(x) (1) . 

In altritermini, considerato l’insieme Γ = {(x,y)∈A/G(x,y)= 0}, che spesso, sia pure 

impropriamente, chiameremo “curva” di equazione G(x,y) = 0 (2) , vogliamo stabilire 

in quali casi esso è il grafico di una funzione della variabile x. 

Osserviamo che il luogo Γ è il cosiddetto “insieme di livello 0” della funzione G, e 

che le proprietà che stabiliremo per Γ saranno valide anche per l’“insieme di livello c”, 

Γc = {(x,y)∈A/G(x,y)= c}, qualunque sia c∈IR; infatti il luogo Γc è l’insieme di 

livello 0 della funzione G(x,y)−c, la quale ha appunto le stesse proprietà di G. 

Consideriamo ad esempio l’equazione x 2 + y 2 − 1 = 0. In questo caso la curva Γ è 

la circonferenza di centro (0,0) e raggio 1, la quale, considerata globalmente, non è il 

grafico di nessuna funzione del tipo y = g(x). Con ciò è appurato che, se pretendiamo 

una risoluzione a carattere globale, dobbiamo aspettarci qualche insuccesso anche in 

casi in cui la funzione G è un semplice polinomio di 2 o grado. 

Diverso è il risultato se l’approccio al problema è di tipo locale. 

Infatti, facendo ancora riferimento alla circonferenza, si vede che 

quasi ogni suo punto (x0,y0) (vanno esclusi solo i punti (±1,0)) 

ammette un intorno I×J nel quale Γ è il grafico di una funzione 

y = g(x), nel senso che ∀x ∈ I ∃!y =: g(x) ∈ J tale che (x,y) ∈ Γ. Ciò si esprime 

dicendo che l’equazione G(x,y) = 0 definisce implic/te una funzione da I in J, oppure 

che la funzione y = g(x) è implic/te definita dall’equazione G(x,y) = 0 in I×J. 

(1) Il problema non è quello di determinare la funzione g, ma solo quello di stabilire se essa 

esiste. Un esempio che mostra la differenza fra i due problemi è rappresentato dall’equazione 

x−y−e y = 0: qui la funzione g esiste senz’altro (è l’inversa della funzione y → y+e y , che 

è invertibile), ma non la si può esplicitare sotto forma di espressione elementare. 

(2) Il fatto che il termine curva sia spesso inadeguato è provato da casi come i seguenti: x 2 + 

y 2 +1 = 0, (x 2 +y 2 )(y−1) = 0, (x−y)(x−y+1) = 0, |x|+|x−1|+|y|+|y−1|−2 = 0. 

1

Allo scopo di dare la massima generalità al problema in esame, facciamo un passo avanti 

e osserviamo che, se l’equazione è G(x,y,z) = 0, che rappresenta una “superficie” in 

IR 3 , si tratta di stabilire sotto quali condizioni è possibile, almeno sul piano teorico, 

esprimere una variabile in funzione delle altre due, ad esempio la variabile z in funzione 

delle variabili x ed y: z = g(x,y). 

 

G1(x,y,z) = 0 

Ed ancora, se l’equazione, o meglio il sistema è , che rappresenta una 

G2(x,y,z) = 0 

“curva” in IR 3 , il problemaè quello di poter esprimere ad esempio le variabili y e z in 

y = g1(x) 

funzione della variabile x: 

z = g2(x) . 

Si può allora concludere che, in generale, il problema è quello di passare dal sistema (1) 

⎧ 

G1(x1,x2,...,xn,y1,y2,...,yk) = 0 

⎪⎨ G2(x1,x2,...,xn,y1,y2,...,yk) = 0 

⎧ 

y1 = g1(x1,x2,...,xn) 

⎪⎨ y2 = g2(x1,x2,...,xn) 

···································· 

⎪⎩ ···································· 

Gk(x1,x2,...,xn,y1,y2,...,yk) = 0 

al sistema ····················· . 

⎪⎩ ····················· 

yk = gk(x1,x2,...,xn) 

Il teorema che segue riguarda appunto il problema nella sua forma più generale, riferi- 

to cioè ad una funzione G a k componenti di n+k variabili. Per maggiore semplicità 

useremo le notazioni: x = (x1,x2,...,xn), y = (y1,y2,...,yk), ∂G 

∂G 

∂y 

= ∂(G1,G2,...,Gk) 

∂(y1,y2,...,yk) 

; in sostanza ∂G 

∂x 

e ∂G 

∂y 

parte destra della matrice jacobiana di G, DG = 

∂G 

∂y 

∂x 

= ∂(G1,G2,...,Gk) 

∂(x1,x2,...,xn) , 

sono rispettivamente la parte sinistra e la 

∂G 

∂x 

| ∂G 

∂y 

è quadrata, e quindi se ne potrà considerare il determinante |∂G 

∂y |. 

Possiamo fin da ora prevedere che nel teorema il determinante di ∂G 

∂y 

 

. Da notare che la matrice 

avrà un ruolo 

fondamentale. Infattiosserviamocheuncaso particolarenotevoledelproblema inesame 

si ha quando G(x,y) = M y − H(x), ossia quando il sistema è M y = H(x), con H 

funzione a k componenti definita in un aperto X di IR n , ed M matricequadrata d’ordine 

k: in tal caso risulta ∂G 

∂y 

= M, ed è noto (teorema di Cramer) che, se detM = 0, allora 

∀x∈X il sistema ammette una ed una sola soluzione y∈IR k . Evidentemente questo è 

uno dei casi in cui il problema ha esito positivo anche da un punto di vista globale. 

Teorema F1.1 (del Dini). Sia G : A → IR k , con A aperto di IR n+k e G∈C 1 (A). Sia 

(x0,y0)∈A con G(x0,y0) = 0. Se | ∂G 

∂y (x0,y0)| = 0, allora ∃I∈I(x0) ed ∃J∈I(y0), 

con I×J ⊆ A, tali che ∀x∈I ∃!y =: g(x)∈J tale che G(x,y) = 0, ossia tali (gli 

intorni I e J) che ∃!g : I → J tale che ∀x∈I G(x,g(x)) = 0. Inoltre g(x0) = y0. 

Infine g∈C 1 (I) e ∀x∈I Dg(x) = −[ ∂G 

∂y (x,g(x))]−1 · ∂G 

∂x (x,g(x)). 

(1) Il sistema rappresenta una varietà n–dimensionale in IR n+k , che si chiama anche curva nel 

caso n = 1 e ipersuperficie nel caso k = 1. 

2

•) Il caso delle equazioni in due variabili. 

Analizziamo più da vicino il caso n = k = 1, ossia quello dell’equazione G(x,y) = 0, 

con G funzione reale di due variabili reali. 

Teorema F1.2. Sia G : A → IR, con A aperto di IR 2 e G∈C 1 (A). Sia (x0,y0)∈A 

con G(x0,y0) = 0. Se Gy(x0,y0) = 0, allora ∃I∈I(x0) ed ∃J∈I(y0), con I×J ⊆ A, 

tali che ∀x∈I ∃!y =: g(x)∈J tale che G(x,y) = 0, ossia tali (gli intorni I e J) che 

∃!g : I → J tale che ∀x∈I G(x,g(x)) = 0. Inoltre g(x0) = y0. Infine g∈C 1 (I) e 

∀x∈I g ′ (x) = − Gx(x,g(x)) 

Gy(x,g(x)) . 

Dim. Supponiamo Gy(x0,y0) > 0. Dal teorema della permanenza del segno applicato 

alla funzione Gy segue che ∃σ∈IR + tale che Qσ := [x0−σ, x0+σ]×[y0−σ, y0+σ] ⊆ A 

e ∀(x,y)∈Qσ Gy(x,y) > 0. Ne discende che, ∀x∈[x0−σ, x0+σ], la funzione G(x,·) 

è strett/te crescente in [y0−σ, y0+σ]. Ciò vale in particolare per la funzione G(x0,·), 

cosicché risulta G(x0,y0−σ) < G(x0,y0) < G(x0,y0+σ), ossia G(x0,y0−σ) < 0 e 

G(x0,y0+σ) > 0. Per il teorema della permanenza del segno applicato alla funzione G, 

∃δ(≤ σ)∈IR + tale che ∀x∈]x0−δ, x0+δ[ risulta 

G(x,y0−σ) < 0 e G(x,y0+σ) > 0. Allora, per ogni 

x∈]x0−δ, x0+δ[, per il teorema degli zeri applicato 

alla funzione G(x,·) e per la iniettività della stessa, 

∃!y =: g(x)∈]y0−σ, y0+σ[ tale che G(x,y) = 0. 

Con ciò è provata la prima parte della tesi, ove si 

assumano I =]x0−δ, x0+δ[ e J =]y0−σ, y0+σ[. 

Per costruzione risulta g(x0) = y0. 

Fissato x∈I, proviamoche ∃g ′ (x) = − Gx(x,g(x)) 

Gy(x,g(x)) ; eatalescopo prendiamo h ∈ IR\{0} 

tale che x+h∈I. Per il teorema di Lagrange in due variabili, esiste (ξ,η) interno al 

segmento di estremi (x,g(x)) e (x+h,g(x+h)) tale che G(x+h,g(x+h))−G(x,g(x)) = 

Gx(ξ,η)h+Gy(ξ,η)(g(x+h)−g(x));ed’altraparte, percomeèdefinita g, sihache G(x+ 

h,g(x+h))−G(x,g(x)) = 0−0 = 0. Nesegue, essendo Gy(ξ,η) = 0, che g(x+h)−g(x) = 

− Gx(ξ,η) 

h. Unaprimaconseguenza diquestauguaglianzaècherisulta |g(x+h)−g(x)| ≤ 

Gy(ξ,η) 

max |Gx| 

I×J 

min I×J |Gy| 

|h|; da quisegueche g(x+h)−→ g(x), ossiache g ècontinua inx(cosicchég è 

h→0 

continua in I, data l’arbitrarietà di x), e ciò implica a sua volta che (ξ,η)−→ (x,g(x)), 

h→0 

dato che |ξ − x| < |h| e |η − g(x)| < |g(x + h) − g(x)|. Una seconda conseguenza 

dell’uguaglianza stabilita è che g(x+h)−g(x) 

= − Gx(ξ,η) 

, da cui discende, grazie anche 

alla continuità di Gx e Gy, che lim 

h→0 

h 

g(x+h)−g(x) 

h 

Con ciò è provato che ∀x∈I ∃g ′ (x) = − Gx(x,g(x)) 

Gy(x,g(x)) 

Gx, Gy e g, che g ′ ∈C 0 (I), ossia che g∈C 1 (I) 

3 

Gy(ξ,η) 

= lim (− 

h→0 Gx(ξ,η) 

Gy(ξ,η) ) = −Gx(x,g(x)) 

Gy(x,g(x)) . 

, e da qui segue, per la continuità di

Esempio F1.1. Riprendiamo in esame l’equazione x 2 +y 2 −1 = 0. Posto G(x,y) = 

x 2 + y 2 − 1, si calcola che Gy(x,y) = 2y. Allora ogni punto (x0,y0) della curva Γ = 

{(x,y)∈IR 2 /x 2 + y 2 − 1 = 0}, con l’eccezione al più dei punti (±1,0), ammette un 

intorno nel quale Γ è grafico di una funzione y = g(x). La funzione in questo caso è 

anche facilmente esplicitabile, ed è y = √ 1−x 2 se y0 > 0, y = − √ 1−x 2 se y0 < 0. 

Invece nei punti (±1,0) l’ipotesi sulla Gy non è soddisfatta, e quindi il teorema è inapplicabile. 

Tuttavia risulta Gx(±1,0) = 0, sicché il teorema può essere applicato a 

variabili scambiate: ciascuno di questi punti ammette un intorno in cui Γ è grafico di 

una funzione x = h(y) (che è poi x = 1−y 2 per (1,0)e x = − 1−y 2 per (−1,0)). 

-) Come suggerito nel precedente esempio, scambiando il ruolo delle variabili si può 

dire che, se Gx(x0,y0) = 0, allora l’equazione G(x,y) = 0 definisce implicitamente una 

funzione x = h(y) di classe C 1 in un intorno di y0, avente derivata h ′ (y) = − Gy(h(y),y) 

Gx(h(y),y) . 

Riunendo i due casi trattati ne deduciamo che, posto Γ = {(x,y)∈A/G(x,y) = 0} e 

preso P0 = (x0,y0)∈Γ, se ∇G(P0) = (0,0), allora esiste un intorno di P0 in cui Γ è 

grafico di una funzione di classe C 1 del tipo y = g(x) o x = h(y), e quindi in ogni caso 

è sostegno di una curva regolare e semplice. Inoltre, la tangente a Γ in P0 ha equazione 

Gx(P0)(x−x0)+Gy(P0)(y −y0) = 0. Infatti, se la curva è del tipo y = g(x), è noto 

che la tangente è y = g(x0)+g ′ (x0)(x−x0), e da qui si passa alla 

equazione suddetta ricordando che g(x0) = y0 e g ′ (x0) = − Gx(P0) 

Gy(P0) ; 

e allo stesso risultato si arriva se si scambiano fra loro le variabili x 

ed y. Ponendo P = (x,y), l’equazione della tangente può mettersi 

nella forma ∇G(P0)·(P −P0) = 0, da cui si deduce che il vettore 

∇G(P0) è normale alla tangente, e quindi alla curva, nel punto P0. 

I punti P0 ∈Γ tali che ∇G(P0) = (0,0) si dicono punti regolari di Γ. Invece i punti 

P0∈Γ tali che ∇G(P0) = (0,0) si dicono punti singolari di Γ (relativamente a G): per 

essi non è garantita l’esistenza di un intorno nel quale Γ è il grafico di una funzione. 

-) Considerato un qualunque punto P0∈A con ∇G(P0) = (0,0), sapevamo già che la 

direzione del vettore ∇G(P0) è quella lungo la quale si ha il massimo incremento della 

funzione G. Ora abbiamo appreso in più che, se G(P0) = 0, se cioè P0 ∈Γ, che è la 

curva di livello 0 di G, allora ∇G(P0) è normale a Γ in P0. 

Più in generale, qualunque sia il valore G(P0), per P0 passa comunque una delle curve 

di livello di G, precisamente la curva Γc con c = G(P0). Se ∇G(P0) = (0,0), la curva 

Γc è regolare e semplice nell’intorno di P0, con tangente di equazione Gx(P0)(x−x0)+ 

Gy(P0)(y−y0) = 0, eilvettore∇G(P0)ènormaleaΓc inP0. InfattiΓc nonèchelacurva 

di livello 0 della funzione H(P) = G(P)−c, per la quale risulta ∇H(P0) = ∇G(P0). 

Le curve Γc non sono altro che le curve equipotenziali del campo gradiente ∇G, così 

chiamate perché su ciacuna di esse il potenziale G è costante. In base a quanto stabilito, 

possiamo affermare che ogni campo gradiente risulta, in ogni punto in cui non è nullo, 

normale alla linea equipotenziale passante per quel punto. 

4

-) Se le ipotesi del teorema sono soddisfatte, e in particolare risulta Gy(x0,y0) = 0, così 

da esser certi che la funzione implicita y = g(x) esiste ed è di classe C 1 in un intorno di 

x0, la sua derivata y ′ può essere calcolata direttamente dall’uguaglianza G(x,y) = 0, 

ove si pensi y funzione di x. Si ricava infatti, grazie al teorema di derivazione della 

funzione composta, che Gx(x,y)+Gy(x,y)y ′ = 0, ossia appunto che y ′ = − Gx(x,y) 

Gy(x,y) . 

Dalla formula dimostrata g ′ (x) = − Gx(x,g(x)) 

Gy(x,g(x)) , se ci si mette nell’ipotesi più forte che 

G∈C 2 (A), si deduce che g∈C 2 (I), e, a conti fatti, che 

g ′′ (x) = − 

2 

2 

Gxx(x,g(x))Gy (x,g(x))−2Gxy(x,g(x))Gx(x,g(x))Gy(x,g(x))+Gyy(x,g(x))G x (x,g(x)) 

G3 y (x,g(x)) 

. 

Ciò fa capire come sia possibile dimostrare, ragionando per induzione, che, ∀h∈IN, da 

G∈C h (A) segue che g∈C h (I), e che la derivata h-esima di g nel punto x è esprimibile 

in funzione delle derivate parziali fino all’ordine h di G nel punto (x,g(x)). 

La conoscenza delle derivate di g in x0, ricavate dalle derivate parziali di G in (x0,y0), 

consente di ricavare lo sviluppo di Taylor di g di punto iniziale x0; cosicché la funzione 

implicita, che spesso non è concretamente esplicitabile, potrà comunque essere 

conosciuta con una certa approssimazione in prossimità del punto x0. 

Esempio F1.2. Siano l’equazione xe y −y = 0 e, per cominciare, il punto (0,0). 

Posto G(x,y) = xe y −y, si vede che G∈C ∞ (IR 2 ), che G(0,0) = 0 eche Gy(0,0) = −1. 

Pertanto l’equazione definisce implicitamente in un intorno di (0,0) 

una funzione y = y(x), che è di classe C ∞ in un intorno del punto 0. 

E’ noto che y(0) = 0. Derivando rispetto ad x ambo i membri dell’equazione 

assegnata, dove si pensi y dipendente da x, si ricava che 

e y +xe y y ′ −y ′ = 0; da qui, ponendo x = 0 e y = 0, si deduce che 

y ′ (0) = 1. Derivando ulteriormente, sempre rispetto ad x, si trova 

che 2e y y ′ +xe y (y ′ ) 2 +xe y y ′′ −y ′′ = 0, e da qui, ponendo x = 0, 

y = 0 e y ′ = 1, si ottiene che y ′′ (0) = 2. Pertanto: y(x) = x+x 2 +o(x 2 ) per x → 0. 

Passiamo ora ad analizzare gli altri punti della curva Γ = {(x,y)∈IR 2 /G(x,y) = 0}. 

 

G(x,y) = 0 

Risolvendo il sistema 

Gy(x,y) = 0 , si trova che (e−1 ,1) è l’unico punto della curva 

nel quale il teorema 

 

del Dini è inapplicabile allo scopo di esprimere y in funzione di x. 

G(x,y) = 0 

Invece il sistema non ammette soluzioni, cosicché ogni punto della curva 

Gx(x,y) = 0 

possiede un intorno nel quale la stessa è grafico di una funzione di classe C1 del tipo 

x = x(y). Si riconosce anzi che in questo caso la curva Γ è anche globalmente grafico di 

una funzione della y, essendo Γ = {(x,y)∈IR 2 /x = ye−y } (1) . 

(1) Può capitareche un’intera curvasialocalmentegrafico di funzioni ad esempiodellavariabile 

y, senza che la stessa sia globalmente grafico di una funzione della variabile y; si pensi alla 

curva di equazione (x−y)(x−y +1) = 0. 

6

Esempio F1.3. Cosideriamo la curva Γ di equazione x 2 (x+1)−y 2 = 0. 

Posto G(x,y) = x2 (x + 1) − y2 , si vede che i punti (x,y) di Γ tali che Gy(x,y) = 0 

sono (0,0) e (−1,0), mentre i punti tali che Gx(x,y) = 0 sono (0,0) e (−2 2 ,± 3 3 √ 3 ). 

Ne consegue che (0,0) è l’unico punto singolare di Γ. Si può provare che 

non esiste alcun intorno del punto (0,0) nel quale Γ è grafico di una funzione 

della variabile x o della variabile y. In effetti, pur senza voler entrare 

nei dettagli, avvertiamo che, con l’aiuto delle derivate successive della 

funzione G in (0,0), questo punto singolare viene classificato come “nodo”, 

o “punto doppio a tangenti distinte”, dove con il termine “tangenti” in un simile punto 

P0 = (x0,y0) ci si riferisce alle due rette le cui equazioni si ottengono spezzando 

l’equazione Gxx(P0)(x − x0) 2 + 2Gxy(P0)(x − x0)(y − y0) + Gyy(P0)(y − y0) 2 = 0. 

Nel caso di questo esempio, l’equazione è 2x2 −2y2 = 0, ossia y = ±x. 

Esempio F1.4. Ilpunto (0,0)èsingolareanche per lacurva Γdi equazione x 2 −y 3 = 0. 

Tuttavia l’equazione può essere scritta, anche globalmente, nella forma 

y = g(x): risulta infatti Γ = {(x,y)∈IR 2 /y = 3√ x 2 }, dove però la 

funzione y = 3√ x 2 non è di classe C 1 in alcun intorno del punto 0. 

Il punto singolare (0,0) viene classificato come “punto cuspidale”. 

Qui l’equazione Gxx(P0)(x−x0) 2 +2Gxy(P0)(x−x0)(y −y0)+Gyy(P0)(y −y0) 2 = 0, 

di cui s’è detto nell’esempio precedente, è 2x 2 = 0, cosicché nel punto (0,0) si hanno 

due “tangenti” coincidenti, di equazione x = 0. 

Esempio F1.5. Consideriamo la curva Γ di equazione x3 +xy2−x 2−y 2 = 0. 

Posto G(x,y) = x3 +xy2−x 2−y 2 ⎧ 

⎨G(x,y) 

= 0 

, si vede che il sistema Gy(x,y) = 0 

⎩ 

Gx(x,y) = 0 

ammette come unica soluzione il punto (0,0), che dunque è l’unico punto 

singolare di Γ. Si riconosce che l’equazione può mettersi nella forma 

(x 2 +y 2 )(x−1) = 0, che si spezza in x 2 +y 2 = 0 e x−1 = 0; pertanto 

Γ è costituita dal punto (0,0) e dalla retta x = 1. 

Il punto singolare (0,0) viene classificato come “punto isolato”. 

Esempio F1.6. Interessante è il caso della funzione G(x,y) = (x 2 +y 2 −1) 2 . 

Si vede che, ∀(x,y)∈Γ, dove Γ è il luogo degli zeri di G, risulta ∇G(x,y) = (0,0), 

cosicché tutti i punti di Γ sono singolari relativamente a G. Eppure, in un opportuno 

intorno di ciascuno di essi, la curva Γ, che è la stessa circonferenza dell’Esempio F1.1, 

è grafico di una funzione di classe C 1 del tipo y = g(x) o x = h(y). 

Con ciò è evidenziato il fatto che il teorema del Dini stabilisce una condizione soltanto 

sufficiente e non anche necessaria per l’esistenza e la regolarità della funzione implicita. 

7

•) Il caso delle equazioni in tre variabili. 

Approfondiamo ora il caso n = 2, k = 1, ossia quello dell’equazione G(x,y,z) = 0, in 

ordine alla possibilità di esprimere z in funzione di x e di y. 

Teorema F1.3. Sia G : A → IR, con A aperto di IR 3 e G∈C 1 (A). Sia (x0,y0,z0)∈A 

con G(x0,y0,z0) = 0. Se Gz(x0,y0,z0) = 0, allora ∃I ∈ I(x0,y0) ed ∃J ∈ I(z0), 

con I×J ⊆ A, tali che ∀(x,y)∈I ∃!z =: g(x,y)∈J tale che G(x,y,z) = 0, ossia 

tali (gli intorni I e J) che ∃!g : I → J tale che ∀(x,y) ∈ I G(x,y,g(x,y)) = 0. 

Inoltre g(x0,y0) = z0. Infine g ∈ C 1 (I) e, ∀(x,y)∈I, gx(x,y) = − Gx(x,y,g(x,y)) 

Gz(x,y,g(x,y)) e 

gy(x,y) = − Gy(x,y,g(x,y)) 

Gz(x,y,g(x,y)) . 

Osserviamo che, se le ipotesi del teorema sono soddisfatte, le derivate parziali gx e gy 

possono essere calcolate direttamente dall’uguaglianza G(x,y,z) = 0, nella quale si 

pensi z dipendente da x e da y, ossia appunto z = g(x,y). Si ricava infatti, derivando 

amboimembriprimarispettoadxepoirispettoady,che Gx(x,y,z)+Gz(x,y,z)zx = 0 

e che Gy(x,y,z)+Gz(x,y,z)zy = 0, da cui si passa rispettivamente a zx = − Gx(x,y,z) 

Gz(x,y,z) 

ed a zy = − Gy(x,y,z) 

, in sostanziale accordo con le formule presentate nel teorema. 

Gz(x,y,z) 

Il teorema stabilisce in sostanza che, posto Σ = {(x,y,z)∈A/G(x,y,z) = 0}, che è la 

“superficiedilivello0”dellafunzioneG, econsiderato P0 = (x0,y0,z0)∈Σ, se Gz(P0) = 

0, allora l’insieme Σ è, in un intorno di P0, il grafico di una funzione di classe C 1 del tipo 

z = g(x,y). Analogamente, serisulta Gy(P0) = 0 o Gx(P0) = 0,alloraΣè, nell’intorno 

di P0, il grafico di una funzione di classe C1 rispettivamente del tipo y = h(x,z) e 

x = l(y,z), le cui derivate parziali son date dalle formule: hx(x,z) = − Gx(x,h(x,z),z) 

Gy(x,h(x,z),z) , 

hz(x,z) = − Gz(x,h(x,z),z) 

Gy(x,h(x,z),z) , ly(y,z) = − Gy(l(y,z),y,z) 

Gx(l(y,z),y,z) , lz(y,z) = − Gz(l(y,z),y,z) 

Gx(l(y,z),y,z) . 

Pertanto, se ∇G(P0) = (0,0,0), allora l’insieme Σ è, in un intorno di P0, il sostegno di 

una superficie regolare. Il piano tangente a questa superficie nel punto P0 ha equazione 

Gx(P0)(x−x0)+Gy(P0)(y−y0)+Gz(P0)(z−z0) = 0. Infatti, se ad esempio la superficie 

si rappresenta nella forma z = g(x,y), è noto che il piano tangente ha equazione 

z = g(x0,y0)+gx(x0,y0)(x−x0)+gy(x0,y0)(y−y0), e da questa si passa all’equazione 

suddetta ricordando i valori in (x0,y0) di g, gx, gy stabiliti dal teorema. In modo 

analogo si ragiona negli altri due casi. 

Ponendo P = (x,y,z), l’equazione del piano tangente può essere 

riscritta nella forma ∇G(P0)·(P −P0) = 0, dalla quale si dedu- 

ce che il vettore ∇G(P0) è normale alla superficie Σ nel punto P0. 

Se ∇G(P0) = (0,0,0), diciamo che P0 è un punto regolare della superficie Σ; altrimenti 

si dice che P0 è un punto singolare di Σ (relativamente a G). 

8

Con un ragionamento analogo a quello seguito nella sezione precedente, riconosciamo 

che, considerato un qualunque punto P0 ∈ A con ∇G(P0) = (0,0,0), la superficie 

di livello passante per P0 è, nell’intorno di P0, il sostegno di una superficie regolare, 

rispetto alla quale il vettore ∇G(P0) risulta essere normale. Questa superficie non è 

altro che una superficie equipotenziale del campo vettoriale ∇G. 

Esempio F1.7. Il punto (0,0,0) è singolare per la superficie di equazione 

x 2 +y 2 −z 2 = 0, che una superficie conica le cui due falde hanno 

vertice nel suddetto punto: in questo caso non esiste alcun intorno del 

punto nel quale il luogo Σ sia il grafico di una funzione delle variabili 

(x,y) o (x,z) o (y,z). 

Interessante è anche il caso della superficie xy 2 +z 3 = 0, per la quale 

sono singolari tutti i punti dell’asse x. La superficie è il grafico della 

funzione z = − 3 xy 2 , che non è differenziabile nei punti degli assi x e y. 

Esempio F1.8. Consideriamo la superficie Σ = {(x,y,z)∈IR 3 /xz 2 −y 2 +2e z = 1} 

ed il suo punto P0 = (0,1,0). 

Posto G(x,y,z) = xz 2 −y 2 +2e z −1, si vede che Gx(P0) = 0, Gy(P0) = −2 e Gz(P0) = 

2, cosicché esiste il piano tangente a Σ in P0 ed ha equazione −2(y −1)+2z = 0. 

Poiché Gz(P0) = 0, la superficie Σ è, nell’intorno di P0, il grafico di una funzione 

z = g(x,y), definita in un intorno di (0,1) e tale che g(0,1) = 0. Inoltre risulta 

gx(0,1) = − Gx(P0) 

Gz(P0) = 0 e gy(0,1) = − Gy(P0) 

Gz(P0) 

Possiamo ritrovare le derivate parziali delle funzione implicita nel punto (0,1) procedendo 

nel seguente modo: per comodità indichiamo la funzione implicita con z = 

z(x,y); dall’equazione xz 2 −y 2 +2e z −1 = 0, derivando ambo i membri rispetto ad x, 

si ottiene z 2 +2xzzx +2e z zx = 0; da qui, ponendo x = 0, y = 1 e z = 0, si ricava che 

zx(0,1) = 0; in modo analogo si procede per ricavare che zy(0,1) = 1. 

Poiché Gy(P0) = 0, la superficie Σ è, nell’intorno di P0, il grafico di una funzione 

y = h(x,z), definita in un intorno di (0,0) e tale che h(0,0) = 1. Inoltre risulta 

hx(0,0) = − Gx(P0) 

Gy(P0) = 0 e hz(0,0) = − Gz(P0) 

= 1. Anche qui ritroviamo le derivate in 

Gy(P0) 

(0,0) della funzione implicita, che ora preferiamo indicare con y = y(x,z), ricavandole 

dall’equazione xz2−y2 +2ez −1 = 0 ove si pensi y funzione di x e di z: derivando ambo 

i membri rispetto ad x otteniamo z2−2yyx = 0, da cui, per x = 0, y = 1 e z = 0, si 

deduce che yx(0,0) = 0; in modo analogo si arriva ad ottenere che yz(0,0) = 1. 

Da notare che in questo caso la funzione h si può facilmente esplicitare; tenendo conto 

del segno di h(0,0), si ricava infatti che h(x,z) = √ xz2 +2ez −1. 

Infine, poiché Gx(P0) = 0, il Teorema F1.3 non è applicabile in ordine alla possibilità 

di esprimere x in funzione di y e di z nell’intorno di P0. 

9 

= 1.

•) Il caso dei sistemi di due equazioni in tre variabili. 

Consideriamo infine il caso n = 1, k = 2, ossia quello del sistema 

ordine alla possibilità di esprimere y e z in funzione di x. 

 

G1(x,y,z) = 0 

, in 

G2(x,y,z) = 0 

Teorema F1.4. Sia G = (G1,G2) : A → IR 2 , con A aperto di IR 3 e G∈C 1 (A). Sia 

(x0,y0,z0)∈A con G(x0,y0,z0) = 0. Se | ∂(G1,G2) 

∂(y,z) (x0,y0,z0)| = 0, allora ∃I ∈I(x0) 

ed ∃J ∈I(y0,z0), con I×J ⊆ A, tali che ∀x∈I ∃!(y,z) =: (g1(x),g2(x))∈J tale 

che G(x,y,z) = 0, ossia tali (gli intorni I e J) che ∃!g = (g1,g2) : I → J tale che 

∀x∈I G(x,g1(x),g2(x)) = 0. Inoltre g1(x0) = y0 e g2(x0) = z0. Infine g∈C 1 (I) e, 

∀x∈I, g ′ 1 (x) = −|∂(G 1 ,G 2 ) 

∂(x,z) (x,g1(x),g2(x))| 

| ∂(G 1 ,G 2 ) 

∂(y,z) (x,g1(x),g2(x))| e g′ 2 (x) = −|∂(G 1 ,G 2 ) 

(x,g1(x),g2(x))| 

∂(y,x) 

| ∂(G1 ,G2 ) 

(x,g1(x),g2(x))| ∂(y,z) . 

Anchequisuggeriamounmetodopraticopercalcolarelederivatedellefunzioni implicite 

g1 e g2, ammesso che le ipotesi del teorema siano soddisfatte: partendo dal sistema 

G1(x,y,z) = 0 

G2(x,y,z) = 0 , nel quale si pensi y = g1(x) e z = g2(x), si derivano ambo i membri 

delle due equazioni ottenendo 

e da qui si ricava che y ′ = − |∂(G 1 ,G 2 ) 

∂(x,z) (x,y,z)| 

| ∂(G 1 ,G 2 ) 

(G1)x(x,y,z)+(G1)y(x,y,z)y ′ +(G1)z(x,y,z)z ′ = 0 

(G2)x(x,y,z)+(G2)y(x,y,z)y ′ +(G2)z(x,y,z)z ′ = 0 , 

∂(y,x) (x,y,z)| 

(x,y,z)| ∂(y,z) e z′ = − |∂(G 1 ,G2 ) 

| ∂(G1 ,G2 ) 

(x,y,z)| ∂(y,z) . 

 

G1(x,y,z) = 0 

Il teorema stabilisce in sostanza che, posto Γ = {(x,y,z)∈A/ }, che 

G2(x,y,z) = 0 

è la “curva di livello (0,0)” della funzione G, e considerato il punto P0 = (x0,y0,z0)∈Γ, 

se UG(P0) := | ∂(G1,G2) 

∂(y,z) (P0)| = 0, allora il sistema può mettersi, almeno in un intorno 

 

y = g1(x) 

di P0, nella forma 

z = g2(x) , con g1 e g2 funzioni di classe C1 in un intorno di x0. 

Analogheconsiderazioni si fanno nell’ipotesiche VG(P0):=| ∂(G1,G2) 

∂(z,x) (P0)|=0, o inquella 

che WG(P0):=| ∂(G1,G2) 

∂(x,y) (P0)|=0, scambiando opportunamente il ruolo delle variabili. 

Considerato che UG(P0),VG(P0),WG(P0) sono i minori d’ordine due, presi con segno 

alternato, della matrice jacobiana DG(P0) = ∂(G1,G2) 

∂(x,y,z) (P0), deduciamo che, se essa ha 

rango 2, l’insieme Γ è, nell’intorno di P0, il sostegno di una curva regolare e semplice. 

La tangente a questa curva in P0 ha la direzione del vettore (UG(P0),VG(P0),WG(P0)). 

Infatti, nell’ipotesi ad esempio che UG(P0) = 0, il vettore tangente in P0 alla curva 

y = g1(x) 

z = g2(x) èdatoda(1,g′ 1 (x0),g ′ 2 (x0)); equesto, inbasealleformuleg ′ 1 (x0) = VG(P0) 

UG(P0) e 

g ′ 2 (x0) = WG(P0) 

UG(P0) 

stabilitenel teorema, è parallelo al vettore (UG(P0),VG(P0),WG(P0)). 

10

Considerato poi che (UG(P0),VG(P0),WG(P0)) = ∇G1(P0)×∇G2(P0), ne ricaviamo 

che i vettori ∇G1(P0) e ∇G2(P0) sono normali alla curva Γ in P0. 

Un punto P0 di Γ è detto regolare se la matrice jacobiana DG(P0) 

ha rango 2, altrimenti è detto singolare (relativamente a G). 

Infine osserviamo, relativamente ad un punto regolare P0 della curva Γ ed alle equazioni 

G1(x,y,z) = 0 e G2(x,y,z) = 0 prese singolarmente, che, poiché risulta ∇G1(P0) = 

(0,0,0) e ∇G2(P0) = (0,0,0), in virtù del Teorema F1.3 queste equazioni rappre- 

sentano, in un intorno di P0, due superfici regolari; queste superfici evidentemente si 

intersecano lungo la curva Γ; infine esse non sono tra loro tangenti in P0, dato che i 

corrispondenti vettori normali ∇G1(P0) e ∇G2(P0) non sono fra loro paralleli. 

 

2 2 2 x +y +z = 2 

Esempio F1.9. Siano dati il sistema 

x2 +y2 −z = 0 ed il punto P0 = ( 1 

2 , √ 3 

2 ,1). 

Posto G1(x,y,z) = x2 +y2 +z2−2 e G2(x,y,z) = x2 +y2 

G1(P0) = 0 

−z, si vede che 

G2(P0) = 0 , 

ossia che G(P0) = 0 se G = (G1,G2). 

√ 

1 3 2 

Inoltre si calcola che DG(P0) = 

1 √ 

, e da qui si ricavano i determinanti 

3 −1 

UG(P0) = −3 √ 3, VG(P0) = 3, WG(P0) = 0. Poiché essi non sono tutti nulli, possiamo 

affermare che il luogo Γ degli zeri della G è, nell’intorno di P0, il sostegno di una curva 

regolare e semplice, e che la tangente a Γ in P0 ha la direzione del vettore (−3 √ 3,3,0). 

Essendo in particolare UG(P0) = 0, il sistema definisce implicitamente la coppia di 

funzioni y = g1(x) e z = g2(x), ciascuna di classe C 1 in un intorno di x0 = 1 

2 

g1( 1 

2 ) = √ 3 

2 e g2( 1 

Le derivate g ′ 1 (1 

2 ) e g′ 2 (1 

2 

, e tali che 

2 ) = 1; inoltre risulta g′ 1( 1 VG(P0) 1 

2 ) = UG(P0) = −√ e g 

3 ′ 2( 1 WG(P0) 

2 ) = UG(P0) = 0. 

) potevano essere calcolate anche nel seguente modo: per 

comodità indichiamo le funzioni implicite con y = y(x) e z = z(x); derivando rispetto 

ad x ambo i membri di ciascuna delle due equazioni del sistema, otteniamo il sistema 

2x+2yy ′ +2zz ′ = 0 

2x+2yy ′ −z ′ = 0 

; questo, per x = 1 

2 , y = √ 3 

2 e z = 1, fornisce 

y ′ ( 1 

2 

z ′ ( 1 

2 

) = − 1 

√ 3 

) = 0 

Osserviamo che, con facili manipolazioni algebriche, il sistema assegnato può mettersi 

2 2 

nella forma 

x +y = 1 

, dalla quale è evidente che le funzioni g1(x) e g2(x) possono 

z = 1 

in questo caso essere anche esplicitate: g1(x) = √ 1−x 2 e g2(x) = 1. 

Concludiamo osservando che, essendo anche VG(P0) = 0, il teorema del Dini può essere 

applicato anche in ordine alla possibilità di esprimere, in un intorno di P0, le variabili x 

e z in funzione della variabile y, ossia di trasformare il sistema assegnato in un sistema 

x = h1(y) 

del tipo 

z = h2(y) ; sulle funzioni h1 ed h2 si possono poi fare considerazioni analoghe 

a quelle fatte per le funzioni g1 e g2. 

11 

.

Esempio F1.10. Il punto (0,2,0) è singolare per la curva 

Esso infatti è soluzione (l’unica) del sistema formato dalle cinque 

equazioni G1(x,y,z) = 0, G2(x,y,z) = 0, UG(x,y,z) = 0, 

VG(x,y,z) = 0, WG(x,y,z) = 0, dove si è posto 

G1(x,y,z) = x 2 +y 2 +z 2 −4 e G2(x,y,z) = x 2 +y 2 −2y. 

Da notare che il punto in questione è regolare sia per la superficie 

x 2 +y 2 +z 2 = 4 

x 2 +y 2 −2y = 0 . 

sferica x 2 +y 2 +z 2 = 4 sia per la superficie cilindrica x 2 +y 2 −2y = 0; 

esse si intersecano lungo la curva assegnata e sono tra loro tangenti nel punto assegnato. 

Tutto ciò risulta confermato dal fatto che ∇G1(0,2,0) = (0,2,0) e ∇G2(0,2,0) = 

(0,4,0), cosicché le due superfici hanno, nel punto (0,2,0), piano tangente comune, di 

equazione y = 2. 


Si riconosce anche che il punto in questione è regolare per cia- 

scuna delle superfici x 2 +y 2 −z = 0 e x 2 +y 2 +z 2 −2z = 0; 

esse si intersecano lungo la curva assegnata e sono tra loro tan- 

genti nel punto assegnato. Invero, posto G1(x,y,z) = x 2 +y 2 −z 

e G2(x,y,z) = x 2 +y 2 +z 2 −2z, si calcola che ∇G1(0,0,0) = 

(0,0,−1) e ∇G2(0,0,0) = (0,0,−2). 

x 2 +y 2 −z = 0 

x 2 +y 2 +z 2 −2z = 0 . 

Si vede inoltre facilmente che il sistema assegnato si spezza nei due seguenti sistemi: 

2 2 2 2 x +y = 1 

e 

x +y = 0 

; pertanto la curva assegnata è costituita dall’unione di 

z = 1 z = 0 

una circonferenza e del punto isolato (0,0,0). 

 

2 2 2 x +y −z = 0 


x2 +y2−2y = 0 . 

In verità non poteva essere altrimenti, dato che, com’è noto, 

il punto in questione è singolare già per la superficie conica 

x 2 +y 2 −z 2 = 0. Invero, posto P0 = (0,0,0) e G = (G1,G2), 

con G1(x,y,z) = x 2 +y 2 −z 2 e G2(x,y,z) = x 2 +y 2 −2y = 0, 

e considerato che ∇G1(P0) = (0,0,0), è evidente che la matrice 

jacobiana DG(P0) non può avere rango 2. 

12

•) Il caso dei sistemi di due equazioni in quattro variabili. 

Consideriamo infine il caso n = 2, k = 2, ossia quello del sistema 

in ordine alla possibilità di esprimere u e v in funzione di x e di y. 

G1(x,y,u,v)= 0 

G2(x,y,u,v)= 0 , 

Ovviamente a questo caso non è possibile associare una interpretazione geometrica (1) . 

Teorema F1.5. Sia G = (G1,G2) : A → IR 2 , con A aperto di IR 4 e G∈C 1 (A). Sia 

(x0,y0,u0,v0) ∈ A con G(x0,y0,u0,v0) = 0. Se | ∂(G1,G2) 

∂(u,v) (x0,y0,u0,v0)| = 0, allora 

∃I ∈ I(x0,y0) ed ∃J ∈ I(u0,v0), con I×J ⊆ A, tali che ∀(x,y) ∈ I ∃!(u,v) =: 

(g1(x,y),g2(x,y))∈J tale che G(x,y,u,v)= 0, ossia tali (gli intorni I e J) che ∃!g = 

(g1,g2) : I → J tale che ∀(x,y)∈I G(x,y,g1(x,y),g2(x,y)) = 0. 

Inoltre g(x0,y0) = (u0,v0). Infine g∈C 1 (I) e, ∀(x,y)∈I, risulta: 

∂g1 

∂x (x,y) = −| ∂(G1 ,G2 ) 

∂g2 

∂x (x,y) = −| ∂(G1 ,G2 ) 

∂(x,v) (x,y,g1(x,y),g2(x,y))| 

| ∂(G 1 ,G 2 ) 

∂(u,v) (x,y,g1(x,y),g2(x,y))| 

∂(u,x) (x,y,g1(x,y),g2(x,y))| 

| ∂(G 1 ,G 2 ) 

∂(u,v) (x,y,g1(x,y),g2(x,y))| 

, ∂g1 

, ∂g2 

∂y (x,y) = −|∂(G 1 ,G 2 ) 

∂y (x,y) = −|∂(G 1 ,G 2 ) 

(x,y,g1(x,y),g2(x,y))| 

∂(y,v) 

| ∂(G1 ,G2 ) 

(x,y,g1(x,y),g2(x,y))| ∂(u,v) , 

(x,y,g1(x,y),g2(x,y))| 

∂(u,y) 

| ∂(G1 ,G2 ) 

(x,y,g1(x,y),g2(x,y))| ∂(u,v) . 

Anchequisuggeriamounmetodopraticopercalcolarelederivatedellefunzioni implicite 

g1 e g2, ammesso che le ipotesi del teorema siano soddisfatte: partendo dal sistema 

 

G1(x,y,u,v) = 0 

G2(x,y,u,v) = 0 , nel quale si pensi u = g1(x,y) e v = g2(x,y), si derivano rispetto 

ad x ambo i membri delle due equazioni, ottenendo 

 

(G1)x(x,y,u,v)+(G1)u(x,y,u,v)ux+(G1)v(x,y,u,v)vx = 0 

, e da qui si ricava che 

(G2)x(x,y,u,v)+(G2)u(x,y,u,v)ux+(G2)v(x,y,u,v)vx = 0 

ux = − |∂(G 1 ,G2 ) 

(x,y,g1(x,y),g2(x,y))| 

∂(x,v) 

| ∂(G1 ,G2 ) 

(x,y,g1(x,y),g2(x,y))| ∂(u,v) e vx = − |∂(G 1 ,G2 ) 

(x,y,g1(x,y),g2(x,y))| 

∂(u,x) 

| ∂(G1 ,G2 ) 

(x,y,g1(x,y),g2(x,y))| ∂(u,v) ; 

se invece deriviamo rispetto ad y, otteniamo 

 

(G1)y(x,y,u,v)+(G1)u(x,y,u,v)uy +(G1)v(x,y,u,v)vy = 0 

, e da qui si ricava che 

(G2)y(x,y,u,v)+(G2)u(x,y,u,v)uy +(G2)v(x,y,u,v)vy = 0 

uy = − |∂(G 1 ,G 2 ) 

∂(y,v) (x,y,g1(x,y),g2(x,y))| 

| ∂(G 1 ,G 2 ) 

∂(u,v) (x,y,g1(x,y),g2(x,y))| e vy = − |∂(G 1 ,G 2 ) 

∂(u,y) (x,y,g1(x,y),g2(x,y))| 

| ∂(G 1 ,G 2 ) 

∂(u,v) (x,y,g1(x,y),g2(x,y))| . 

Quanto detto fin qui può essere ripetuto cambiando il ruolo delle variabili, ossia in 

ciascuna delle seguenti ipotesi: | ∂(G1,G2) 

∂(y,v) (P0)|=0, | ∂(G1,G2) 

∂(x,v) (P0)|=0, | ∂(G1,G2) 

∂(y,u) (P0)|= 

0, | ∂(G1,G2) 

∂(x,u) (P0)| = 0, | ∂(G1,G2) 

∂(x,y) (P0)| = 0, dove s’è posto P0 = (x0,y0,u0,v0) e dove si 

riconosceche questideterminanti, unitamentea | ∂(G1,G2) 

∂(u,v) (P0)| che comparenel teorema 

enunciato, sono tutti i minori d’ordine due della matrice jacobiana DG(P0). 

(1) Il sistema in oggetto rappresenta una varietà bidimensionale in IR 4 (n = k = 2). 

Le altre possibili varietà in IR 4 sono la curva (n = 1, k = 3) e la ipersuperficie (n = 3, k = 1). 

13

F2. Invertibilità delle funzioni da IR n in IR n 

Sia F : X → IR n , con X aperto connesso di IR n ed F ∈ C 1 (X). Ci poniamo il problema 

di stabilire sotto quali condizioni F è invertibile. 

Il problema è già risolto se n = 1, essendo noto che: se ∀x∈X F ′ (x) = 0, allora F è 

invertibile nell’intervallo X. Infatti il teorema degli zeri applicato ad F ′ assicura che F ′ 

è ovunque positiva o ovunque negativa in X, cosicché F è strettamente monotona in X. 

Si sa anche che F −1 ∈C 1 (F(X)), e che ∀y∈F(X) (F −1 ) ′ (y) = 1 

F ′ (x) , con x = F−1 (y). 

Tornando ad n qualsiasi, un caso particolare notevole si ha con F : IR n → IR n lineare. 

Detta A la matrice associata ad F, ossia quella per cui F(x) = Ax ∀x∈IR n , è noto 

che, se detA = 0, allora ∀y ∈IR n ∃!x∈IR n tale che Ax = y (teorema di Cramer). 

Se ricordiamo che ∀x∈IR n Df(x) = A, il risultato esposto può essere espresso come 

segue: se ∀x∈IR n Jf(x) = 0, allora F è invertibile. Si sa inoltre che anche la funzione 

F −1 è lineare, e che la matrice ad essa associata è A −1 ; ne segue che F −1 ∈ C 1 (IR n ) e 

che ∀y∈IR n DF −1 (y) = [DF(x)] −1 , dove x = F −1 (y). 

Gli esempi trattatifanno pensare che, anche nel caso generale, una condizione sufficiente 

per l’invertibilità di F è che risulti JF(x) = 0 ∀x∈X. 

Ma le cose non stanno così, come dimostra l’esempio che segue. 

Esempio F2.1. Siano X = {(x1,x2)∈IR 2 /x1 > 0} ed F(x1,x2) = (x1cosx2, x1senx2) 

∀(x1,x2)∈X. Si vede che F ∈C 1 (X) eche JF(x1,x2) = x1 = 0 ∀(x1,x2)∈X. D’altra 

parte risulta F(x1,x2) = F(x1,x2+2kπ) ∀k∈Z, cosicché F non è invertibile in X. 

Si può comunque provare che, sempre nell’ipotesi JF(x) = 0 ∀x∈X, se F è invertibile, 

allora F −1 ∈ C 1 (F(X)) e ∀y ∈ F(X) DF −1 (y) = [DF(x)] −1 , con x = F −1 (y). In 

particolare, la formula per DF −1 (y) si ricava osservando che, essendo F◦F −1 = i F(X) , 

deve aversi DF(x)DF −1 (y) = In, dove In è la matrice unitaria d’ordine n. 

A ben vedere, il problema dell’invertibilità di F, che evidentemente nel caso globale non 

èsemplice, può essere vistocome unparticolareproblema di funzione implicita: stabilire 

sotto quali condizioni, data l’equazione y = F(x), ossia l’equazione G(x,y) = 0 con 

G(x,y) = F(x)−y, è possibile, almeno sul piano teorico, esprimere x in funzione di y. 

Osservato allora che ∀(x,y)∈X×IR n risulta ∂G 

∂G (x,y) = DF(x) e ∂x ∂y (x,y) = −In, dal 

teorema del Dini applicato a G discende il seguente risultato, che, nella solita ipotesi su 

JF(x), garantisce quanto meno l’invertibilità locale di F. 

Teorema F2.1 (diinvertibilitàlocale). Sia F : X → IR n , conX apertoed F ∈ C 1 (X), 

e sia x0∈X. Se JF(x0) = 0, allora ∃I(⊆ X)∈I(x0) ed ∃J∈I(F(x0)) tali che ∀y∈J 

∃!x∈I tale che F(x) = y, ossia tali (gli intorni I e J) che F |I sia bigettiva fra I e J. 

Inoltresi ha (F |I) −1 ∈ C 1 (J) e ∀y∈J D(F |I) −1 (y) = [DF(x)] −1 , con x = (F |I) −1 (y). 

14

F3. Problemi di massimo e minimo vincolati 

Vogliamo affrontare il problema della determinazione dei valori massimo e minimo fra 

quelli che una data funzione assume sui punti di una data curva o di una data superficie. 

La funzione è spesso chiamata “funzione obiettivo”, la curva e la superficie son chiamate 

“vincoli”, gli estremi di cui s’è detto son chiamati “estremi vincolati”. 

Se si opera in IR 2 , il vincolo èuna curva, ossia un insieme di dimensione uno, individuato 

da un’uguaglianza del tipo G(x,y) = 0. Se invece si opera in IR 3 , il vincolo può essere 

ancora una curva, ossia ancora un insieme di dimensione uno, individuato da una coppia 

G1(x,y,z) = 0 

di uguaglianze del tipo ; oppure una superficie, ossia un insieme di 

G2(x,y,z) = 0 

dimensione due, individuato da una uguaglianza del tipo G(x,y,z) = 0. 

Considereremo solo casi in cui la funzione obiettivo e le funzioni che individuano il 

vincolo sono di classe C 1 ; inoltre, con l’eccezione di qualche esempio particolare, considereremo 

solo vincoli limitati e privi di punti singolari. 

All’inizio utilizzeremo il metodo della parametrizzazione del vincolo, in modo che il 

problema sia ricondotto, nel caso di curve, ad un problema di una sola variabile, il 

parametro t, e, nel caso di superfici, ad un problema di due variabili, i parametri u 

e v. In quest’ultimo caso, il problema cui ci si riconduce è quello di determinare gli 

estremi di una funzione su un dominio di IR 2 , individuato da disuguaglianze imposte ai 

parametri. Pertanto, per fare in modo che sotto questo punto di vista la trattazione 

sia completa, ci occuperemo anche di casi in cui la funzione obiettivo è da valutare su 

domini appunto di IR 2 ed anche di IR 3 , dunque su insiemi aventi la stessa dimensione 

dell’ambiente di cui fanno parte, che a volte vengono detti “vincoli di disuguaglianza”. 

Successivamente ci occuperemo del metodo dei moltiplicatori di Lagrange, considerando 

dapprima ilcaso incui ilvincolosia una curva inIR 2 , poiquellodella curva inIR 3 , quindi 

quello della superficie in IR 3 , per concludere con il caso generale del vincolo costituito 

da un insieme di dimensione m–k nello spazio IR m . 

Esempio F3.1. Unaparticelladimassamèvincolataamuoversi lungolacirconferenza 

Γ = {(x,y)∈IR 2 /x 2 +y 2 = 1} nel piano verticale xy, rimanendo ancorata 

al punto (1,0) mediante una molla ideale di costante elastica k. 

Vogliamo calcolare la posizione di equilibrio stabile della particella, 

soggetta alla forza di gravità e alla forza elastica. 

Il punto di equilibrio stabile è quello in cui l’energia potenziale 

è minima. L’energia potenziale della particella nel punto (x,y) è 

f(x,y) = mgy+ 1 

2 k[(x−1)2 +y 2 ]. Il problema è quello di calcolare il minimo di f su Γ. 

Poiché Γ è parametrizzata da γ ≡ (cost,sent), t∈[− π 

2 

, 3π 

2 

], i valori di f su Γ sono quelli 

che assume la funzione F(t) = f(γ(t)) = mgsent+k(1−cost) per t∈[− π 

2 

15 

, 3π 

2 ].

Si calcola che F ′ (t) = 0 ⇔ tgt = − mg 

k 

⇔ t = arctg −mg 

k =: t1 ∨ t = π +t1 =: t2. 

Dal confronto fra F(− π) 

= F(3π 

2 2 ) = k − mg, F(t1) = k − k2 +m2g 2 , F(t2) = 

k + k2 +m2g 2 (1) , si deduce che minF = F(t1) e maxF = F(t2). 

Essendo γ(t1) = P1 = ( 

√ k 

k2 +m2g2 , √ −mg 

k2 +m2g2 ) e γ(t2) 

−k 

= P2 = ( √ 

k2 +m2g2 , 

√ mg 

k2 +m2g2 ), 

concludiamo che min Γ f=f(P1)=k − k 2 +m 2 g 2 e max Γ f=f(P2)=k+ k 2 +m 2 g 2 . 

Esempio F3.2. Calcoliamo gli estremi della funzione f(x,y) = 3x 2 − 2y 2 − 4x 

sull’insieme E = {(x,y)∈IR 2 /x 2 +2y 2 ≤ 1}. 

L’insieme E è un vincolo di disuguaglianza, la cui frontiera è il vincolo di uguaglianza 

Γ = {(x,y)∈IR 2 /x 2 +2y 2 = 1}. La risoluzione va divisa in due parti: ricerca dei punti 

stazionari interni ad E e ricerca dei punti stazionari vincolati a ∂E. 

Imponendo ∇f(x,y) = 0 si determina ( 2 

3 ,0), unico punto stazionario interno ad E. 

La frontiera Γ è parametrizzata da γ ≡ (cost, 1 √ sent), t∈[−π,π], cosicché i valori di 

2 

f su Γ sono quelli che assume la funzione F(t) = f(γ(t)) = 3cos 2 t−sen 2 t−4cost per 

t∈[−π,π]. Si calcola che F ′ (t) = 0 ⇔ t = ±π ∨ t = ± π 

3 

corrispondono i punti stazionari di f vincolati a Γ: (−1,0), ( 1 

2 ,± 

 

3 

8 

∨ t = 0; a questi valori di t 

), (1,0). 

Dalconfrontodeivaloridif neicinquepuntitrovatisievincechemin f = f( E 1 

2 ,± 

−2 e max f = f(−1,0) = 7. 

E 

Esempio F3.3. Calcoliamo i punti della curva Γ = {(x,y,z)∈IR 3 / 

per i quali è minima o massima la distanza dal punto (0,0,0). 

 

3 

8 

) = 

2x 2 +y 2 = 8 

2x−z +1 = 0 } 

Assumiamo come funzione obiettivo la funzione f(x,y,z) = x 2 +y 2 +z 2 , quadrato della 

distanza del punto (x,y,z) dal punto (0,0,0). 

Considerato che il vincolo Γ è parametrizzato da γ ≡ (2cost,2 √ 2sent,4cost+1), t∈ 

[−π,π], introduciamo la funzione F(t) = f(γ(t)) = 12cos 2 t+8cost+9, con t∈[−π,π]. 

Si calcola che F ′ (t) = 0 ⇔ t = ±π ∨ t = 0 ∨ t = ±arccos(− 1 

3 ), e si scopre che 

minF = F(±arccos(− 1 23 

3 )) = 3 

e maxF = F(0) = 29. 

Si conclude che i punti di Γ più vicini all’origine sono (− 2 

3 ,±8 

mentre il punto più lontano è (2,0,5), con distanza √ 29. 

3 ,−1 ), con distanza 3 

23 

3 , 

Osserviamo che il problema poteva essere risolto eliminando una variabile: poiché su 

Γ risulta z = 2x + 1, i valori di f su Γ sono quelli che assume la funzione h(x,y) = 

f(x,y,2x+1) = 5x 2 +y 2 +4x+1 sul vincolo Γ1 = {(x,y)∈IR 2 /2x 2 +y 2 = 8}. 

(1) A ben vedere, i punti − π 

2 

e 3π 

2 

tali sarebbero se avessimo scelto di far variare t non in [− π 

2 

per il primo punto e in [0,2π] per il secondo. 

potevano essere trattati come comuni punti interni, dato che 

16 

3π , 2 ], bensì ad esempio in [−π,π]

Esempio F3.4. Calcoliamo gli estremi della funzione f(x,y,z) = √ 3x+ √ 3y−3 √ 2z 

sulla superficie Σ = {(x,y,z)∈IR 3 /x 2 +y 2 +z 2 = 2, z ≤ 1}. 

Il vincolo Σ è parametrizzato da φ ≡ ( √ 2cosucosv, √ 2cosusenv, √ 2senu), su E = 

[−π π , ]×[0,2π], cosicché i valori di f su Σ sono quelli che assume la funzione F(u,v) = 

2 4 

f(φ(u,v)) = √ 6(cosucosv+cosusenv− √ 6senu) sull’insieme E, che è un vincolo di 

disuguaglianza. 

Procedendo come nell’Esempio F3.2, dapprima si cercano i punti stazionari di F interni 

ad E, e si trova (− π 

3 

i valori di F son dati da r(v) = F(− π 

2 

π 

, 4 ). Quindi si considerano i punti della frontiera. Sul lato u = −π 

2 

,v) = 6 (il fatto che si tratti di valori costanti 

non sorprende, dal momento che ai punti di questo lato corrisponde un unico punto 

della superficie sferica). Sul lato u = π 

4 

i valori di F sono quelli della funzione s(v) = 

F( π 

4 ,v) = √ 3 cosv + √ 3 senv − 3 √ 2, di cui si calcola che i punti stazionari interni 

all’intervallo [0,2π] sono ( π 

4 

, π 

4 

) e (π 

4 

, 5 

4 

π). Passando ai lati v = 0 e v = 2π, si esamina 

la funzione t(u) = F(u,0) = F(u,2π) = √ 6 cosu−6 senu), di cui si calcola che l’unico 

punto stazionario interno all’intervallo [−π π , 2 2 ] è u = −arctg√6. Infine vanno considerati i valori che F assume nei quattro vertici del rettangolo E. 

Dal confronto dei valori di F nei punti trovati (1) deduciamo che min EF = F( π 

4 

5π 

, 4 ) = 

− √ 6−3 √ 2 e max F = F(− E π π 

3 , 4 ) = 4√3. Infine, tornando alla f, si conclude che min f = f(− Σ 1 √ ,− 

2 1 √ ,1) = −6 − 3 

2 √ 2 e 

max f = f(− Σ 1 

2 ,−1 2 , √ √2 3 ) = 4 √ 3. 

Esempio F3.5. Calcoliamo gli estremi della funzione f(x,y,z) = x 2 y−z sull’insieme 

E = {(x,y,z)∈IR 3 /z ≥ x 2 +y 2 , x 2 +y 2 +z 2 ≤ 2}. 

L’insieme E è un vincolo di disuguaglianza, cosicché il lavoro va diviso nella ricerca dei 

punti stazionari interni ad E e nella ricerca dei punti stazionari vincolati a ∂E. 

La frontiera ∂E a sua volta va considerata composta dalle seguenti parti: la superficie 

Σ1 = {(x,y,z)∈IR 3 /z = x 2 +y 2 , x 2 +y 2 < 1}, che richiede la determinazione dei punti 

stazionari di F1(x,y) = f(x,y,x 2 +y 2 ) sull’insieme B1 = {(x,y)∈IR 2 /x 2 + y 2 < 1}; 

la superficie Σ2 = {(x,y,z)∈IR 3 /x 2 +y 2 +z 2 = 1, x 2 +y 2 < 1}, che richiede la deter- 

minazione dei punti stazionari di F2(u,v) = f( √ 2cosucosv, √ 2cosusenv, √ 2senu) 

sull’insieme B2 = {(u,v)∈IR 2 / π π 

4 2 

IR 3 

2 2 

/ 

x +y = 1 

}, che richiede la determinazione dei punti stazionari di G(t) = 

z = 1 

f(cost,sent,1) sull’insieme D = [0,2π]. 

(1) 

A ben vedere, i punti dei lati v = 0 e v = 2π potevano essere trattati come comuni punti 

interni, poiché tali sarebbero se avessimo scelto di far variare v non in [0,2π], bensì ad esempio 

in [−π,π] per il primo lato e in [π,3π] per il secondo. Un discorso analogo si può fare per il 

lato u = ± π 

2 , dato che anche la posizione dei poli dipende dalla scelta della parametrizzazione. 

17

F4. Il metodo dei moltiplicatori di Lagrange 

•) Estremi di funzioni di due variabili su vincoli unidimensionali. 

Siano f,G : A → IR, con A aperto di IR 2 ed f,G ∈ C 1 (A). Considerato l’insieme 

Γ = {(x,y)∈A/G(x,y) = 0}, che in questo contesto avrà il ruolo di vincolo, vogliamo 

riprendereilproblemadideterminare, seesistono, il min Γf edil max Γf,ossiagliestremi 

di f vincolati a Γ. Sappiamo già che, se Γ si rappresenta parametricamente mediante 

l’applicazione γ ≡ γ(t), t ∈ I, con I intervallo di IR, il problema può essere risolto 

riconducendolo a quello di ricercare gli estremi della funzione F(t) = f(γ(t)), t∈I , che 

è funzione di una sola variabile. 

Considerato anche che non sempre del vincolo Γ si riesce a dare una rappresentazione 

parametrica, è utile trovare un metodo che si possa applicare direttamente alla funzione 

G. A tale scopo, considerato P0 punto regolare di Γ, cerchiamo una opportuna condizione 

necessaria affinché P0 sia un punto di estremo relativo per f |Γ (punto di estremo 

relativo di f vincolato a Γ); infatti questa è a sua volta una condizione necessaria perché 

P0 sia punto di estremo assoluto per f |Γ . 

E’ noto che, essendo ∇G(P0) = (0,0), il vincolo Γ è, in un intorno di P0, il sostegno 

di una curva regolare e semplice, che indichiamo con γ ≡ γ(t), t∈I, dove I è un intervallo 

aperto di IR. Se si suppone che P0 sia punto di estremo relativo per f |Γ , allora 

t0 := γ −1 (P0) dovrà essere punto di estremo relativo per F = f◦γ (invero, supposto ad 

esempio che f(P) ≤ f(P0) ∀P ∈B ∩Γ, con B ⊆ A intorno di P0, considerato che, per 

la continuità di γ in t0, esiste J∈I(t0) tale che J ⊆ I e γ(J) ⊆ B, si ha che ∀t∈J 

f(γ(t)) ≤ f(P0) = f(γ(t0))), e dunque dovrà risultare F ′ (t0) = ∇f(P0)·γ ′ (t0) = 0 (1) , 

come dire che il vettore ∇f(P0) dovrà essere nullo o comunque normale a Γ in P0. 

Ricordando infine che anche il vettore ∇G(P0) è normale a Γ in P0, concludiamo che 

∇f(P0) dovrà essere nullo o comunque parallelo a ∇G(P0), ossia che dovrà esistere 

λ0∈IR tale che ∇f(P0) = λ0∇G(P0). 

Con ciò è sostanzialmente provato il cosiddetto teorema dei moltiplicatori di Lagrange, 

che riportiamo qui di seguito. In esso sarà utilizzata la funzione, detta lagrangiana 

associata allefunzioni f e G, L : A×IR → IR, definita da L(x,y,λ) = f(x,y)−λG(x,y); 

il parametro λ prende il nome di moltiplicatore di Lagrange. 

Teorema F4.1. Siano f,G : A → IR, con A aperto di IR 2 ed f,G ∈ C 1 (A); sia 

Γ = {P ∈A/G(P) = 0}; sia infine P0∈Γ, con ∇G(P0) = 0. Se P0 è punto di estremo 

relativo per f |Γ , allora ∃λ0∈IR tale che ∇L(P0,λ0) = 0. 

(1) 

Indicato con w il versore tangente a Γ in P0, w = γ′ (t0) 

|γ ′ , qui si è provato che: condizione 

(t0)| 

necessaria affinché P0 sia punto di estremo relativo per f è che |Γ ∂f 

∂w (P0) = 0. 

18

Dim. Si ripete il ragionamento fatto sopra, e si giunge alla tesi osservando che, siccome 

∀P ∈A e ∀λ∈IR Lx(P,λ) = fx(P)−λGx(P), Ly(P,λ) = fy(P)−λGy(P), Lλ(P,λ) = 

−G(P), allora la condizione ∇L(P0,λ0) = (0,0,0) equivale alla coppia di condizioni 

G(P0) = 0, che è nelle ipotesi, e ∇f(P0)−λ0∇G(P0) = (0,0), che è già stata provata 

Pertanto, nell’ipotesi che f e G siano di classe C 1 nell’aperto A, i punti di estremo 

relativo di f vincolati a Γ vanno ricercati nelle seguenti due classi di punti: i punti 

singolari di Γ e i punti P regolari di Γ tali che ∇L(P,λ) sia nullo per qualche λ∈IR, 

ossia tali che (P,λ) sia punto stazionario per la funzione L. I punti di questa seconda 

classe si dicono punti stazionari di f vincolati a Γ; ed è importante ribadire che questi 

punti possono anche non essere di estremo relativo per f |Γ , dato che il teorema fornisce 

una condizione soltanto necessaria. 

Segnaliamoinfine cheinalcuniproblemi può accadere chelefunzioni f eGsianodefinite 

su un insieme E non aperto, e che qualche punto di Γ appartenga a ∂E; in questi casi 

il metodo dei moltiplicatori di Lagrange potrà essere applicato al vincolo Γ ∗ := Γ∩E o , 

ossia alle funzioni f |E o e G |E o, e i punti di Γ\Γ ∗ dovranno essere considerati a parte. 

Esempio F4.1. Calcoliamo i punti della curva Γ = {(x,y)∈IR 2 /x 4 +y 4 +6xy−8 = 0} 

per i quali è minima o massima la distanza dall’origine. 

Si tratta di calcolare gli estremi della funzione f(x,y) = x 2 +y 2 

sull’insieme degli zeri di G(x,y) = x 4 +y 4 +6xy −8. 

Osserviamo dapprima che Γ è un insieme limitato. Infatti, per ogni 

(x,y)∈Γ si ha (x 2 +y 2 ) 2 = x 4 +y 4 +2x 2 y 2 ≤ 2(x 4 +y 4 ) ≤ 16−12xy ≤ 

16 + 12|xy| ≤ 16 + 6(x 2 +y 2 ), ossia ρ 4 ≤ 16 + 6ρ 2 , ossia ancora ρ ≤ 2 √ 2, dove 

si è posto ρ = x 2 +y 2 ; dunque la curva Γ è contenuta nel cerchio di centro (0,0) 

e raggio 2 √ 2. Oppure si procede così: si interseca Γ con la retta y = mx, ottenendo 

i punti (±x(m),±y(m)), con x(m) = 2 √ 

2/ 3m+ √ 8m4 +9m2 +8 e y(m) = 

2 √ 2m/ 3m+ √ 8m 4 +9m 2 +8, si osserva che le funzioni x(m) ed y(m), m∈IR, sono 

limitate, e si conclude che la curva Γ è contenuta in un rettangolo. 

VerificatocheΓnonhapuntisingolari,introduciamolafunzionelagrangiana L(x,y,λ)= 

x2 +y2 −λ(x 4 +y4 ⎧ 

+6xy−8) ed imponiamo che ∇L(x,y,λ) = 0, ottenendo il sistema 

⎨x−2λx 

⎩ 

3 −3λy = 0 

y −2λy3 −3λx = 0 

x4 +y4 . 

+6xy −8 = 0 

Le soluzioni del sistema sono (±1,±1, 1 1 

5 ) e (∓2,±2, 5 ), cosicché i punti stazionari di f 

vincolatiaΓsonoquattro: (±1,±1)e(∓2,±2). Poiché f(±1,±1) = 2 e f(∓2,±2) = 8, 

concludiamo che i punti più vicini all’origine sono (±1,±1), a distanza √ 2, e quelli più 

lontani sono (∓2,±2), a distanza 2 √ 2. 

19

Esempio F4.2. La superficie di una scatola di forma cilindrica 

senza coperchio ha area uguale a 12π. Determiniamo il raggio di 

base x e l’altezza y tali che la capacità sia massima, ritenendo 

certo che la scatola di capacità massima esiste e non è degenere. 

Poiché il volume della scatola è πx 2 y, e l’area della superficie è 

πx 2 +2πxy, il problema è quello di determinare i valori di x ed y 

che rendono massima la funzione f(x,y) = x 2 y sul vincolo 

Γ = {(x,y)∈IR 2 /x 2 +2xy = 12, x,y > 0}. 

Posto G(x,y) = x 2 +2xy −12 e osservato che ∇G(x,y) = (0,0) 

nei punti di Γ, si introduce L(x,y,λ) = x 2 y −λ(x 2 +2xy −12) 

e si calcola che (2,2) è l’unico punto stazionario di f vincolato a Γ. 

Si conclude che la scatola di capacità massima ha raggio di base 2 

ed altezza 2. 

Esempio F4.3. Calcoliamo i punti della curva Γ = {(x,y)∈IR 2 /x 2 +2y 2 −2xy−1 = 0 

x,y ≥ 0} per i quali è minima o massima la somma delle distanze dagli assi. 

Si tratta di calcolare i punti di minimo e di massimo su Γ della fun- 

zione f(x,y) = x+y. Posto Γ ∗ = {(x,y)∈Γ/x,y > 0}, si vede che 

Γ ∗ è l’insieme degli zeri della funzione G(x,y) = x 2 +2y 2 −2xy −1 

nell’aperto A = {(x,y)∈IR 2 /x,y > 0}. Appurato che Γ ∗ non ha pun- 

ti singolari, si introduce la funzione L(x,y,λ) = f(x,y)−λG(x,y) e 

si calcola che il gradiente di L è nullo in corrispondenza del punto ( 3 √ 5 , 2 

√ 5 ) ∈ Γ ∗ . 

Dal confronto dei valori che f assume nel punto trovato e negli estremi (1,0) e (0, 1 √ ) 

2 

di Γ, si scopre che min f = f(0, Γ 1 √ ) = 

2 1 √ e max f = f( 

2 Γ 3 √ , 

5 2 √ ) = 

5 √ 5. 

Esempio F4.4. Per calcolare gli estremi della funzione f(x,y) = y 4 − x 2 + 3y sulla 

curva Γ = {(x,y)∈IR 2 /x 2 = y 3 }, un metodo efficace è quello di ricondursi allafunzione 

F(t) = f(γ(t)) = t 8 −t 6 +3t 2 , dove γ ≡ (t 3 ,t 2 ), t∈IR. Del resto la riduzione ad una 

sola variabile si può ottenere anche osservando che sui punti di Γ, dove x 2 = y 3 , i valori 

di f sono quelli della funzione h(y) = y 4 −y 3 +3y, y∈[0,+∞[. 

Volendo comunque applicare il metodo dei moltiplicatori di Lagrange, 

si osserva che il gradiente della lagrangiana L(x,y,λ) = y 4 −x 2 +3y− 

λ(x 2 −y 3 ) non è mai nullo in corrispondenza dei punti di Γ, cosicché 

il confronto risolutivo va fatto soltanto fra il valore di f nel punto (0,0), che è singolare 

per Γ, e il limite di f per (x,y) tendente all’infinito su Γ, dato che Γ non è limitato. 

In ogni caso si conclude che min Γ f = f(0,0) = 0, che f non ha massimo su Γ e che 

sup f = lim Γ (x,y)→∞ f (x,y) = lim 

|Γ y→+∞ (y4−y 3 +3y) = +∞. 

20

•) Estremi di funzioni di tre variabili su vincoli unidimensionali. 

Siano f,G1,G2 : A → IR, con A aperto di IR 3 ed f,G1,G2 ∈C 1 (A). Considerato il 

G1(x,y,z) = 0 

vincolo Γ = {(x,y,z)∈ A/ }, anche qui ci poniamo il problema di 

G2(x,y,z) = 0 

calcolare, se esistono, gli estremi di f vincolati a Γ, ossia il min Γ f ed il max Γ f . E 

anche qui ricordiamo che il problema è di facile soluzione se Γ viene rappresentato come 

il sostegno della curva γ ≡ γ(t), t∈I, poiché in tal caso si tratta di ricercare gli estremi 

della funzione di una sola variabile F(t) = f(γ(t)), t∈I . 

Ma ora proponiamoci di determinare un metodo che coinvolga direttamente le funzioni 

G1 e G2. Supponiamo allora che P0 sia un punto regolare di Γ e cerchiamo una condizione 

necessaria affinché P0 sia punto di estremo relativo per f (punto di estremo 

|Γ 

relativo di f vincolato a Γ). 

E’ noto che, poiché la matrice ∂(G1,G2) 

∂(x,y,z) (P0) ha rango 2, il vincolo Γ è, in un intorno di 

P0, il sostegno di una curva regolare e semplice γ ≡ γ(t), t∈I, con I intervallo aperto 

di IR, e che i vettori ∇G1(P0) e ∇G2(P0) individuano il piano normale a Γ in P0. 

Allora, considerato t0∈I tale che γ(t0) = P0, si ha che: 

(P0 èpunto diestremo relativoperf )=⇒ (t0 èpunto di estremo relativoper F = f◦γ) 

|Γ 

=⇒ (F ′ (t0) = ∇f(P0)·γ ′ (t0) = 0) =⇒ (∇f(P0) è nullo o comunque normale a Γ in 

P0) =⇒ (∇f(P0) è nullo o comunque complanare con i vettori ∇G1(P0) e ∇G2(P0)) 

=⇒ (∃λ0,µ0∈IR tali che ∇f(P0) = λ0∇G1(P0)+µ0∇G2(P0)). 

Allo scopo di esprimere in modo più agevole il risultato ottenuto, introduciamo la funzione 

lagrangiana associata alle funzioni f, G1 e G2, ossia la funzione L : A×IR 2 → IR 

definita da L(x,y,z,λ,µ)= f(x,y,z)−λG1(x,y,z)−µG2(x,y,z), con i suoi due moltiplicatori 

λ e µ, ed osserviamo che la condizione alla quale siamo pervenuti, unitamente 

alla condizione che P0∈Γ, può essere espressa nella seguente forma: ∃λ0,µ0∈IR tali 

che ∇L(P0,λ0,µ0) = (0,0,0,0,0). 

Con ciò risulta sostanzialmente dimostrato il seguente 

Teorema F4.2. Siano: f : A → IR e G : A → IR 2 funzioni di classe C 1 in A aperto di 

IR 3 , Γ = {P∈A/G(P) = 0}, P0∈Γ tale che la matrice DG(P0) abbia rango 2. Se P0 

è punto di estremo relativo per f |Γ , allora ∃λ0,µ0∈IR tali che ∇L(P0,λ0,µ0) = 0. 

Pertanto, nell’ipotesi che f e G = (G1,G2) siano di classe C 1 nell’aperto A, i punti di 

estremo relativo di f vincolati a Γ vanno ricercati tra i punti singolari di Γ e tra i punti 

P regolari di Γ tali che ∇L(P,λ,µ) sia nullo per qualche coppia di valori reali λ e µ. 

Questi ultimi punti sono detti punti stazionari di f vincolati a Γ, e non è garantito che 

essi siano necessariamente punti di estremo relativo per f |Γ . 

Chiaramente anche qui vale la considerazione, fatta nella sezione precedente, relativa al 

caso in cui f e G sono definite in E non aperto e qualche punto di Γ appartiene a ∂E. 

21

Esempio F4.5. Determiniamo i punti della curva Γ = {(x,y,z)∈IR 3 /2x−z +1 = 0, 

2x 2 +y 2 = 8} aventi distanza minima o massima dall’origine (vedi l’Esempio F3.3). 

Si tratta di calcolare i punti di Γ nei quali è minima o massima la funzione f(x,y,z) = 

x 2 + y 2 + z 2 (1) . Si osserva che Γ è limitato; infatti, per ogni (x,y,z)∈Γ si ha che 

|x| ≤ 1 

√ 2 

2x 2 +y 2 = 1 

√2 

√ 8 = 2, |y| ≤ 2x 2 +y 2 = √ 8, |z| ≤ 2|x|+1 ≤ 5. 

Considerate le funzioni G1(x,y,z) = 2x−z+1 e G2(x,y,z) = 2x 2 +y 2 −8 ed osservato 

che Γ non ha punti singolari, si introduce la funzione L(x,y,z,λ,µ) = f(x,y,z) − 

λG1(x,y,z) − µG2(x,y,z) e si calcola che ∇L è nullo in corrispondenza dei punti 

3 ,−1 3 ). Dal confronto dei valori di f in questi punti si 

evince che min f = f(− Γ 2 

3 ,±8 3 ,−1 23 ) = 3 3 e max f = f(2,0,5) = 29. 

Γ 

(2,0,5), (−2,0,−3), (− 2 

3 ,±8 

•) Estremi di funzioni di tre variabili su vincoli bidimensionali. 

L’ultimo problema che vogliamo affrontare è quello della ricerca del min Σ f e del max Σ f 

(estremi di f vincolati a Σ), dove f : A → IR con A aperto di IR 3 e Σ = {(x,y,z)∈A/ 

G(x,y,z) = 0} con G : A → IR, ed inoltre f,G∈C 1 (A). 

Se Σ si rappresenta parametricamente mediante l’applicazione φ ≡ φ(u,v), (u,v)∈D, 

con D ⊆ IR 2 , allora il problema si trasferisce alla funzione F(u,v) = f(φ(u,v)), (u,v)∈ 

D, che è funzione di due variabili. Se ad esempio D è un dominio, la risoluzione del 

problema dovrà passare in genere attraverso la determinazione dei punti di estremo 

relativo di F interni a D e dei punti di estremo relativo di F vincolati a ∂D. 

Ma ora cerchiamo un metodo che coinvolga direttamente la funzione G; e, a tale scopo, 

fissiamo P0 punto regolare di Σ e cerchiamo una condizione necessaria affinché P0 sia 

punto di estremo relativo per f |Σ (punto di estremo relativo di f vincolato a Σ). 

Poiché ∇G(P0) = (0,0,0),ilvincoloΣè, inunintornodiP0, ilsostegnodiunasuperficie 

regolare φ ≡ φ(u,v), (u,v)∈B, con B aperto di IR 2 ; si sa inoltre che il vettore ∇G(P0) 

è normale a Σ in P0 e che, considerato (u0,v0)∈B tale che φ(u0,v0) = P0, i vettori 

φu(u0,v0) e φv(u0,v0) individuano il piano tangente a Σ in P0. Ne segue che: 

(P0 èpunto diestremo relativoper f |Σ )=⇒ ((u0,v0)èpunto diestremo relativoper F = 

f◦φ) =⇒ (Fu(u0,v0) = ∇f(P0)·φu(u0,v0) = 0 e Fv(u0,v0) = ∇f(P0)·φv(u0,v0) = 0) 

=⇒ (∇f(P0) è nullo o comunque normale a Σ in P0) =⇒ (∇f(P0) è nullo o comunque 

parallelo al vettore ∇G(P0)) =⇒ (∃λ0∈IR tale che ∇f(P0) = λ0∇G(P0)). 

(1) In verità la distanza dall’origine sarebbe x 2 +y 2 +z 2 , ma è noto che √ t è minima o 

massima quando il valore di t è rispett/te minimo o massimo. 

22

Introduciamo ora la funzione lagrangiana associata alle funzioni f e G, L : A×IR → 

IR, definita da L(x,y,z,λ) = f(x,y,z) − λG(x,y,z), con il suo moltiplicatore λ, ed 

osserviamo che la condizione alla quale siamo pervenuti, unitamente alla condizione che 

P0∈Σ, può essere espressa nella forma: ∃λ0∈IR tale che ∇L(P0,λ0) = (0,0,0,0). 

Sussiste pertanto il seguente 

Teorema F4.6. Siano f,G : A → IR, con A aperto di IR 3 ed f,G ∈ C 1 (A); sia 

Σ = {P∈A/G(P) = 0}; sia infine P0∈Σ, con ∇G(P0) = 0. Se P0 è punto di estremo 

relativo per f |Σ , allora ∃λ0∈IR tale che ∇L(P0,λ0) = 0. 

Pertanto si conclude che, nell’ipotesi che f e G siano di classe C 1 nell’aperto A, i punti 

di estremo relativo di f vincolati a Σ vanno ricercati fra i punti singolari di Σ e i punti 

P regolari di Σ tali che ∇L(P,λ) sia nullo per qualche λ∈IR. Questi ultimi punti si 

dicono punti stazionari di f vincolati a Σ, e non è detto che essi siano necessariamente 

punti di estremo relativo per f |Σ . 

Chiaramente anche qui vale la considerazione, fatta nelle sezioni precedenti, relativa al 

caso in cui f e G sono definite in E non aperto e qualche punto di Σ appartiene a ∂E. 

Esempio F4.6. Determiniamo i punti della superficie Σ = {(x,y,z)∈IR 3 /2x−z+1 = 

0, 2x 2 +y 2 ≤ 8} aventi distanza minima o massima dall’origine. In sostanza si tratta di 

calcolare i punti di Σ nei quali è massima o minima la funzione f(x,y,z) = x 2 +y 2 +z 2 . 

Posto Σ ∗ = {(x,y,z) ∈ Σ/2x 2 + y 2 < 8}, si vede che Σ ∗ è l’insieme degli zeri di 

G(x,y,z) = 2x−z +1 nell’aperto A = {(x,y,z)∈IR 3 /2x 2 +y 2 < 8}. 

Introdotta la funzione L(x,y,z,λ) = f(x,y,z)−λG(x,y,z), si trova 

che il gradiente di L è nullo in corrispondenza del punto (−2 1 ,0, 5 5 ). 

Detto Γ il bordo di Σ, Γ = Σ\Σ ∗ , si sa (dall’Esempio F4.5) che i pun- 

ti stazionari di f vincolati a Γ sono (2,0,5), (−2,0,−3), (− 2 

3 ,±8 

3 ,−1 

3 ). 

Dal confronto dei valori di f nei punti trovati si scopre che min Σ f = f(− 2 

5 

max Σf = f(2,0,5)= 29. 

1 1 ,0, 5 ) = 5 e 

Esempio F4.7. Calcoliamo minimo e massimo della funzione f(x,y,z) = x+y −2z 

sulla superficie Σ = {(x,y,z)∈IR 3 /x 2 +y 2 +z 2 = 6, x,y,z ≥ 0}. 

Dapprima si lavora sul vincolo Σ ∗ = {(x,y,z)∈Σ/x,y,z > 0}, che è 

la superficie assegnata privata del bordo: introdotta la lagrangiana 

L(x,y,z,λ) = x+y −2z −λ(x 2 +y 2 +z 2 −6), si scopre che non esistono 

punti stazionari vincolati a Σ ∗ . 

Si considera poi Γ ∗ 1 = {(x,y,z)∈Σ/z = 0, x,y > 0}, che è una parte del bordo di Σ. 

Ma qui il problema si può ridurre alle sole variabili x ed y: trovare i punti stazionari di 

f1(x,y) := f(x,y,0) vincolati a ζ ∗ 1 = {(x,y)∈IR 2 /x 2 +y 2 = 6, x,y > 0}. Introdotta 

la lagrangiana L(x,y,λ) = x+y −λ(x 2 +y 2 −6), si trova il punto ( √ 3, √ 3,0). 

23

In modo analogo si lavora su Γ ∗ 2 = {(x,y,z)∈Σ/y = 0, x,z > 0} e su Γ ∗ 3 = {(x,y,z)∈ 

Σ/x = 0, y,z > 0}. Su queste curve non si trovano punti stazionari vincolati. 

Confrontando tra loro i valori che f assume nel punto trovato ( √ 3, √ 3,0) e nei vertici 

( √ 6,0,0), (0, √ 6,0) e (0,0, √ 6), si evince che min Σ f = f(0,0, √ 6) = −2 √ 6 e max Σ f = 

f( √ 3, √ 3,0) = 2 √ 3. 

Esempio F4.8. Calcoliamo il minimo ed il massimo della funzione f(x,y,z) = z−x 2 y 

nell’insieme Ω = {(x,y,z)∈IR 3 /z ≥ x 2 +y 2 , x 2 +y 2 +z 2 ≤ 2} (vedi l’Esempio F3.5). 

Ilteoremadi Weierstrassgarantiscel’esistenza degliestremi richiesti. Inoltreosserviamo 

che Ω è un vincolo di disuguaglianza, ossia un sottoinsieme di IR 3 avente interno non 

vuoto. Pertanto la risoluzione del problema va divisa nelle seguenti parti: 

a) ricerca dei punti stazionari di f interni ad Ω: si impone che 

∇f(x,y,z) = (0,0,0), e non si trova nessuna soluzione; 

b) ricerca dei punti stazionari di f vincolati alla superficie 

Σ1 = {(x,y,z)∈IR 3 /z = x 2 +y 2 , x 2 +y 2 < 1}: si impone 

che ∇L(x,y,z,λ) = (0,0,0,0), con L(x,y,z,λ) = f(x,y,z)− 

λ(x 2 +y 2 −z), e si trova il punto (0,0,0); 

c) ricerca dei punti stazionari di f vincolati alla superficie Σ2 = {(x,y,z)∈IR 3 /x 2 + 

y 2 + z 2 = 2, z > 1}: si impone che ∇L(x,y,z,λ) = (0,0,0,0), con L(x,y,z,λ) = 

f(x,y,z)−λ(x 2 +y 2 +z 2 −2), e si trovano i punti (0,0, √ 2) e (±1/ √ 3,−1/ √ 6, √ 6/2); 

d) ricerca dei punti stazionari di f vincolati alla curva Γ = {(x,y,z)∈IR 3 /x 2 +y 2 = 

1, z = 1}, che è il bordo comune a Σ1 e Σ2: si impone che ∇L(x,y,z,λ,µ) = 

(0,0,0,0,0), con L(x,y,z,λ,µ) = f(x,y,z)−λ(x 2 +y 2 −1)−µ(z−1), e si trovano i 

punti (0,±1,1), (± 2/3,− 1/3,1) e (± 2/3, 1/3,1). 

Osservato che ∂Ω = Σ1 ∪ Σ2 ∪ Γ, concludiamo che gli estremi di f in Ω sono dati 

rispettivamentedalpiùpiccoloedalpiùgrandedei valoridi f nei punti cosìdeterminati, 

e sono: min Ωf = 0 = f(0,0,0) e max Ωf = √ 2 = f(0,0, √ 2). 

•) Il teorema dei moltiplicatori di Lagrange nel caso generale. 

I tre teoremi trattati nei paragrafi precedenti possono essere interpretati come casi 

particolari del teorema che segue, riferito ad una funzione di m variabili su un vincolo 

(m−k)–dimensionale contenuto in IR m , con k,m∈IN, k < m. 

Teorema F4.4 (dei moltiplicatori di Lagrange). Sia A un aperto di IR m e siano 

f ∈ C 1 (A,IR), e G ∈ C 1 (A,IR k ), con 1 ≤ k < m. Sia Γ = {P ∈A/G(P) = 0} e sia 

P0∈Γ tale che la matrice DG(P0) abbia rango k. Se P0 è punto di estremo relativo per 

f |Γ ,allora,consideratalafunzione L : A×IR k → IR definitada L(P,Λ) = f(P)−Λ·G(P), 

esiste Λ0∈IR k tale che ∇L(P0,Λ0) = 0. 

24

F FUNZIONI IMPLICITE MASSIMI E MINIMI VINCOLATI F1. Il ...

Create successful ePaper yourself

Delete template?

Save as template?