04.06.2013 Views

F FUNZIONI IMPLICITE MASSIMI E MINIMI VINCOLATI F1. Il ...

F FUNZIONI IMPLICITE MASSIMI E MINIMI VINCOLATI F1. Il ...

F FUNZIONI IMPLICITE MASSIMI E MINIMI VINCOLATI F1. Il ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

F<br />

<strong>FUNZIONI</strong> <strong>IMPLICITE</strong><br />

<strong>MASSIMI</strong> E <strong>MINIMI</strong> <strong>VINCOLATI</strong><br />

(C. De Mitri)<br />

<strong>F1.</strong> <strong>Il</strong> problema della funzione implicita e il teorema del Dini<br />

Considerata l’equazione G(x,y) = 0, dove G è una funzione reale definita in un aperto<br />

A di IR 2 , per molteragioni può tornareutileesprimere una delle due variabiliinfunzione<br />

dell’altra, ad esempio la y in funzione della x. Per questo motivo ci domandiamo sotto<br />

quali condizioni si può star certi che esiste una funzione g, reale di una variabile reale,<br />

tale che l’equazione data sia equivalente all’equazione y = g(x) (1) .<br />

In altritermini, considerato l’insieme Γ = {(x,y)∈A/G(x,y)= 0}, che spesso, sia pure<br />

impropriamente, chiameremo “curva” di equazione G(x,y) = 0 (2) , vogliamo stabilire<br />

in quali casi esso è il grafico di una funzione della variabile x.<br />

Osserviamo che il luogo Γ è il cosiddetto “insieme di livello 0” della funzione G, e<br />

che le proprietà che stabiliremo per Γ saranno valide anche per l’“insieme di livello c”,<br />

Γc = {(x,y)∈A/G(x,y)= c}, qualunque sia c∈IR; infatti il luogo Γc è l’insieme di<br />

livello 0 della funzione G(x,y)−c, la quale ha appunto le stesse proprietà di G.<br />

Consideriamo ad esempio l’equazione x 2 + y 2 − 1 = 0. In questo caso la curva Γ è<br />

la circonferenza di centro (0,0) e raggio 1, la quale, considerata globalmente, non è il<br />

grafico di nessuna funzione del tipo y = g(x). Con ciò è appurato che, se pretendiamo<br />

una risoluzione a carattere globale, dobbiamo aspettarci qualche insuccesso anche in<br />

casi in cui la funzione G è un semplice polinomio di 2 o grado.<br />

Diverso è il risultato se l’approccio al problema è di tipo locale.<br />

Infatti, facendo ancora riferimento alla circonferenza, si vede che<br />

quasi ogni suo punto (x0,y0) (vanno esclusi solo i punti (±1,0))<br />

ammette un intorno I×J nel quale Γ è il grafico di una funzione<br />

y = g(x), nel senso che ∀x ∈ I ∃!y =: g(x) ∈ J tale che (x,y) ∈ Γ. Ciò si esprime<br />

dicendo che l’equazione G(x,y) = 0 definisce implic/te una funzione da I in J, oppure<br />

che la funzione y = g(x) è implic/te definita dall’equazione G(x,y) = 0 in I×J.<br />

(1) <strong>Il</strong> problema non è quello di determinare la funzione g, ma solo quello di stabilire se essa<br />

esiste. Un esempio che mostra la differenza fra i due problemi è rappresentato dall’equazione<br />

x−y−e y = 0: qui la funzione g esiste senz’altro (è l’inversa della funzione y → y+e y , che<br />

è invertibile), ma non la si può esplicitare sotto forma di espressione elementare.<br />

(2) <strong>Il</strong> fatto che il termine curva sia spesso inadeguato è provato da casi come i seguenti: x 2 +<br />

y 2 +1 = 0, (x 2 +y 2 )(y−1) = 0, (x−y)(x−y+1) = 0, |x|+|x−1|+|y|+|y−1|−2 = 0.<br />

1


Allo scopo di dare la massima generalità al problema in esame, facciamo un passo avanti<br />

e osserviamo che, se l’equazione è G(x,y,z) = 0, che rappresenta una “superficie” in<br />

IR 3 , si tratta di stabilire sotto quali condizioni è possibile, almeno sul piano teorico,<br />

esprimere una variabile in funzione delle altre due, ad esempio la variabile z in funzione<br />

delle variabili x ed y: z = g(x,y).<br />

<br />

G1(x,y,z) = 0<br />

Ed ancora, se l’equazione, o meglio il sistema è , che rappresenta una<br />

G2(x,y,z) = 0<br />

“curva” in IR 3 , il problemaè quello di poter esprimere ad esempio le variabili y e z in<br />

y = g1(x)<br />

funzione della variabile x:<br />

z = g2(x) .<br />

Si può allora concludere che, in generale, il problema è quello di passare dal sistema (1)<br />

⎧<br />

G1(x1,x2,...,xn,y1,y2,...,yk) = 0<br />

⎪⎨ G2(x1,x2,...,xn,y1,y2,...,yk) = 0<br />

⎧<br />

y1 = g1(x1,x2,...,xn)<br />

⎪⎨ y2 = g2(x1,x2,...,xn)<br />

····································<br />

⎪⎩ ····································<br />

Gk(x1,x2,...,xn,y1,y2,...,yk) = 0<br />

al sistema ····················· .<br />

⎪⎩ ·····················<br />

yk = gk(x1,x2,...,xn)<br />

<strong>Il</strong> teorema che segue riguarda appunto il problema nella sua forma più generale, riferi-<br />

to cioè ad una funzione G a k componenti di n+k variabili. Per maggiore semplicità<br />

useremo le notazioni: x = (x1,x2,...,xn), y = (y1,y2,...,yk), ∂G<br />

∂G<br />

∂y<br />

= ∂(G1,G2,...,Gk)<br />

∂(y1,y2,...,yk)<br />

; in sostanza ∂G<br />

∂x<br />

e ∂G<br />

∂y<br />

parte destra della matrice jacobiana di G, DG =<br />

∂G<br />

∂y<br />

∂x<br />

= ∂(G1,G2,...,Gk)<br />

∂(x1,x2,...,xn) ,<br />

sono rispettivamente la parte sinistra e la<br />

∂G<br />

∂x<br />

| ∂G<br />

∂y<br />

è quadrata, e quindi se ne potrà considerare il determinante |∂G<br />

∂y |.<br />

Possiamo fin da ora prevedere che nel teorema il determinante di ∂G<br />

∂y<br />

<br />

. Da notare che la matrice<br />

avrà un ruolo<br />

fondamentale. Infattiosserviamocheuncaso particolarenotevoledelproblema inesame<br />

si ha quando G(x,y) = M y − H(x), ossia quando il sistema è M y = H(x), con H<br />

funzione a k componenti definita in un aperto X di IR n , ed M matricequadrata d’ordine<br />

k: in tal caso risulta ∂G<br />

∂y<br />

= M, ed è noto (teorema di Cramer) che, se detM = 0, allora<br />

∀x∈X il sistema ammette una ed una sola soluzione y∈IR k . Evidentemente questo è<br />

uno dei casi in cui il problema ha esito positivo anche da un punto di vista globale.<br />

Teorema <strong>F1.</strong>1 (del Dini). Sia G : A → IR k , con A aperto di IR n+k e G∈C 1 (A). Sia<br />

(x0,y0)∈A con G(x0,y0) = 0. Se | ∂G<br />

∂y (x0,y0)| = 0, allora ∃I∈I(x0) ed ∃J∈I(y0),<br />

con I×J ⊆ A, tali che ∀x∈I ∃!y =: g(x)∈J tale che G(x,y) = 0, ossia tali (gli<br />

intorni I e J) che ∃!g : I → J tale che ∀x∈I G(x,g(x)) = 0. Inoltre g(x0) = y0.<br />

Infine g∈C 1 (I) e ∀x∈I Dg(x) = −[ ∂G<br />

∂y (x,g(x))]−1 · ∂G<br />

∂x (x,g(x)).<br />

(1) <strong>Il</strong> sistema rappresenta una varietà n–dimensionale in IR n+k , che si chiama anche curva nel<br />

caso n = 1 e ipersuperficie nel caso k = 1.<br />

2


•) <strong>Il</strong> caso delle equazioni in due variabili.<br />

Analizziamo più da vicino il caso n = k = 1, ossia quello dell’equazione G(x,y) = 0,<br />

con G funzione reale di due variabili reali.<br />

Teorema <strong>F1.</strong>2. Sia G : A → IR, con A aperto di IR 2 e G∈C 1 (A). Sia (x0,y0)∈A<br />

con G(x0,y0) = 0. Se Gy(x0,y0) = 0, allora ∃I∈I(x0) ed ∃J∈I(y0), con I×J ⊆ A,<br />

tali che ∀x∈I ∃!y =: g(x)∈J tale che G(x,y) = 0, ossia tali (gli intorni I e J) che<br />

∃!g : I → J tale che ∀x∈I G(x,g(x)) = 0. Inoltre g(x0) = y0. Infine g∈C 1 (I) e<br />

∀x∈I g ′ (x) = − Gx(x,g(x))<br />

Gy(x,g(x)) .<br />

Dim. Supponiamo Gy(x0,y0) > 0. Dal teorema della permanenza del segno applicato<br />

alla funzione Gy segue che ∃σ∈IR + tale che Qσ := [x0−σ, x0+σ]×[y0−σ, y0+σ] ⊆ A<br />

e ∀(x,y)∈Qσ Gy(x,y) > 0. Ne discende che, ∀x∈[x0−σ, x0+σ], la funzione G(x,·)<br />

è strett/te crescente in [y0−σ, y0+σ]. Ciò vale in particolare per la funzione G(x0,·),<br />

cosicché risulta G(x0,y0−σ) < G(x0,y0) < G(x0,y0+σ), ossia G(x0,y0−σ) < 0 e<br />

G(x0,y0+σ) > 0. Per il teorema della permanenza del segno applicato alla funzione G,<br />

∃δ(≤ σ)∈IR + tale che ∀x∈]x0−δ, x0+δ[ risulta<br />

G(x,y0−σ) < 0 e G(x,y0+σ) > 0. Allora, per ogni<br />

x∈]x0−δ, x0+δ[, per il teorema degli zeri applicato<br />

alla funzione G(x,·) e per la iniettività della stessa,<br />

∃!y =: g(x)∈]y0−σ, y0+σ[ tale che G(x,y) = 0.<br />

Con ciò è provata la prima parte della tesi, ove si<br />

assumano I =]x0−δ, x0+δ[ e J =]y0−σ, y0+σ[.<br />

Per costruzione risulta g(x0) = y0.<br />

Fissato x∈I, proviamoche ∃g ′ (x) = − Gx(x,g(x))<br />

Gy(x,g(x)) ; eatalescopo prendiamo h ∈ IR\{0}<br />

tale che x+h∈I. Per il teorema di Lagrange in due variabili, esiste (ξ,η) interno al<br />

segmento di estremi (x,g(x)) e (x+h,g(x+h)) tale che G(x+h,g(x+h))−G(x,g(x)) =<br />

Gx(ξ,η)h+Gy(ξ,η)(g(x+h)−g(x));ed’altraparte, percomeèdefinita g, sihache G(x+<br />

h,g(x+h))−G(x,g(x)) = 0−0 = 0. Nesegue, essendo Gy(ξ,η) = 0, che g(x+h)−g(x) =<br />

− Gx(ξ,η)<br />

h. Unaprimaconseguenza diquestauguaglianzaècherisulta |g(x+h)−g(x)| ≤<br />

Gy(ξ,η)<br />

max |Gx|<br />

I×J<br />

min I×J |Gy|<br />

|h|; da quisegueche g(x+h)−→ g(x), ossiache g ècontinua inx(cosicchég è<br />

h→0<br />

continua in I, data l’arbitrarietà di x), e ciò implica a sua volta che (ξ,η)−→ (x,g(x)),<br />

h→0<br />

dato che |ξ − x| < |h| e |η − g(x)| < |g(x + h) − g(x)|. Una seconda conseguenza<br />

dell’uguaglianza stabilita è che g(x+h)−g(x)<br />

= − Gx(ξ,η)<br />

, da cui discende, grazie anche<br />

alla continuità di Gx e Gy, che lim<br />

h→0<br />

h<br />

g(x+h)−g(x)<br />

h<br />

Con ciò è provato che ∀x∈I ∃g ′ (x) = − Gx(x,g(x))<br />

Gy(x,g(x))<br />

Gx, Gy e g, che g ′ ∈C 0 (I), ossia che g∈C 1 (I)<br />

3<br />

Gy(ξ,η)<br />

= lim (−<br />

h→0 Gx(ξ,η)<br />

Gy(ξ,η) ) = −Gx(x,g(x))<br />

Gy(x,g(x)) .<br />

, e da qui segue, per la continuità di


Esempio <strong>F1.</strong>1. Riprendiamo in esame l’equazione x 2 +y 2 −1 = 0. Posto G(x,y) =<br />

x 2 + y 2 − 1, si calcola che Gy(x,y) = 2y. Allora ogni punto (x0,y0) della curva Γ =<br />

{(x,y)∈IR 2 /x 2 + y 2 − 1 = 0}, con l’eccezione al più dei punti (±1,0), ammette un<br />

intorno nel quale Γ è grafico di una funzione y = g(x). La funzione in questo caso è<br />

anche facilmente esplicitabile, ed è y = √ 1−x 2 se y0 > 0, y = − √ 1−x 2 se y0 < 0.<br />

Invece nei punti (±1,0) l’ipotesi sulla Gy non è soddisfatta, e quindi il teorema è inapplicabile.<br />

Tuttavia risulta Gx(±1,0) = 0, sicché il teorema può essere applicato a<br />

variabili scambiate: ciascuno di questi punti ammette un intorno in cui Γ è grafico di<br />

una funzione x = h(y) (che è poi x = 1−y 2 per (1,0)e x = − 1−y 2 per (−1,0)).<br />

-) Come suggerito nel precedente esempio, scambiando il ruolo delle variabili si può<br />

dire che, se Gx(x0,y0) = 0, allora l’equazione G(x,y) = 0 definisce implicitamente una<br />

funzione x = h(y) di classe C 1 in un intorno di y0, avente derivata h ′ (y) = − Gy(h(y),y)<br />

Gx(h(y),y) .<br />

Riunendo i due casi trattati ne deduciamo che, posto Γ = {(x,y)∈A/G(x,y) = 0} e<br />

preso P0 = (x0,y0)∈Γ, se ∇G(P0) = (0,0), allora esiste un intorno di P0 in cui Γ è<br />

grafico di una funzione di classe C 1 del tipo y = g(x) o x = h(y), e quindi in ogni caso<br />

è sostegno di una curva regolare e semplice. Inoltre, la tangente a Γ in P0 ha equazione<br />

Gx(P0)(x−x0)+Gy(P0)(y −y0) = 0. Infatti, se la curva è del tipo y = g(x), è noto<br />

che la tangente è y = g(x0)+g ′ (x0)(x−x0), e da qui si passa alla<br />

equazione suddetta ricordando che g(x0) = y0 e g ′ (x0) = − Gx(P0)<br />

Gy(P0) ;<br />

e allo stesso risultato si arriva se si scambiano fra loro le variabili x<br />

ed y. Ponendo P = (x,y), l’equazione della tangente può mettersi<br />

nella forma ∇G(P0)·(P −P0) = 0, da cui si deduce che il vettore<br />

∇G(P0) è normale alla tangente, e quindi alla curva, nel punto P0.<br />

I punti P0 ∈Γ tali che ∇G(P0) = (0,0) si dicono punti regolari di Γ. Invece i punti<br />

P0∈Γ tali che ∇G(P0) = (0,0) si dicono punti singolari di Γ (relativamente a G): per<br />

essi non è garantita l’esistenza di un intorno nel quale Γ è il grafico di una funzione.<br />

-) Considerato un qualunque punto P0∈A con ∇G(P0) = (0,0), sapevamo già che la<br />

direzione del vettore ∇G(P0) è quella lungo la quale si ha il massimo incremento della<br />

funzione G. Ora abbiamo appreso in più che, se G(P0) = 0, se cioè P0 ∈Γ, che è la<br />

curva di livello 0 di G, allora ∇G(P0) è normale a Γ in P0.<br />

Più in generale, qualunque sia il valore G(P0), per P0 passa comunque una delle curve<br />

di livello di G, precisamente la curva Γc con c = G(P0). Se ∇G(P0) = (0,0), la curva<br />

Γc è regolare e semplice nell’intorno di P0, con tangente di equazione Gx(P0)(x−x0)+<br />

Gy(P0)(y−y0) = 0, eilvettore∇G(P0)ènormaleaΓc inP0. InfattiΓc nonèchelacurva<br />

di livello 0 della funzione H(P) = G(P)−c, per la quale risulta ∇H(P0) = ∇G(P0).<br />

Le curve Γc non sono altro che le curve equipotenziali del campo gradiente ∇G, così<br />

chiamate perché su ciacuna di esse il potenziale G è costante. In base a quanto stabilito,<br />

possiamo affermare che ogni campo gradiente risulta, in ogni punto in cui non è nullo,<br />

normale alla linea equipotenziale passante per quel punto.<br />

4


-) Se le ipotesi del teorema sono soddisfatte, e in particolare risulta Gy(x0,y0) = 0, così<br />

da esser certi che la funzione implicita y = g(x) esiste ed è di classe C 1 in un intorno di<br />

x0, la sua derivata y ′ può essere calcolata direttamente dall’uguaglianza G(x,y) = 0,<br />

ove si pensi y funzione di x. Si ricava infatti, grazie al teorema di derivazione della<br />

funzione composta, che Gx(x,y)+Gy(x,y)y ′ = 0, ossia appunto che y ′ = − Gx(x,y)<br />

Gy(x,y) .<br />

Dalla formula dimostrata g ′ (x) = − Gx(x,g(x))<br />

Gy(x,g(x)) , se ci si mette nell’ipotesi più forte che<br />

G∈C 2 (A), si deduce che g∈C 2 (I), e, a conti fatti, che<br />

g ′′ (x) = −<br />

2<br />

2<br />

Gxx(x,g(x))Gy (x,g(x))−2Gxy(x,g(x))Gx(x,g(x))Gy(x,g(x))+Gyy(x,g(x))G x (x,g(x))<br />

G3 y (x,g(x))<br />

.<br />

Ciò fa capire come sia possibile dimostrare, ragionando per induzione, che, ∀h∈IN, da<br />

G∈C h (A) segue che g∈C h (I), e che la derivata h-esima di g nel punto x è esprimibile<br />

in funzione delle derivate parziali fino all’ordine h di G nel punto (x,g(x)).<br />

La conoscenza delle derivate di g in x0, ricavate dalle derivate parziali di G in (x0,y0),<br />

consente di ricavare lo sviluppo di Taylor di g di punto iniziale x0; cosicché la funzione<br />

implicita, che spesso non è concretamente esplicitabile, potrà comunque essere<br />

conosciuta con una certa approssimazione in prossimità del punto x0.<br />

Esempio <strong>F1.</strong>2. Siano l’equazione xe y −y = 0 e, per cominciare, il punto (0,0).<br />

Posto G(x,y) = xe y −y, si vede che G∈C ∞ (IR 2 ), che G(0,0) = 0 eche Gy(0,0) = −1.<br />

Pertanto l’equazione definisce implicitamente in un intorno di (0,0)<br />

una funzione y = y(x), che è di classe C ∞ in un intorno del punto 0.<br />

E’ noto che y(0) = 0. Derivando rispetto ad x ambo i membri dell’equazione<br />

assegnata, dove si pensi y dipendente da x, si ricava che<br />

e y +xe y y ′ −y ′ = 0; da qui, ponendo x = 0 e y = 0, si deduce che<br />

y ′ (0) = 1. Derivando ulteriormente, sempre rispetto ad x, si trova<br />

che 2e y y ′ +xe y (y ′ ) 2 +xe y y ′′ −y ′′ = 0, e da qui, ponendo x = 0,<br />

y = 0 e y ′ = 1, si ottiene che y ′′ (0) = 2. Pertanto: y(x) = x+x 2 +o(x 2 ) per x → 0.<br />

Passiamo ora ad analizzare gli altri punti della curva Γ = {(x,y)∈IR 2 /G(x,y) = 0}.<br />

<br />

G(x,y) = 0<br />

Risolvendo il sistema<br />

Gy(x,y) = 0 , si trova che (e−1 ,1) è l’unico punto della curva<br />

nel quale il teorema<br />

<br />

del Dini è inapplicabile allo scopo di esprimere y in funzione di x.<br />

G(x,y) = 0<br />

Invece il sistema non ammette soluzioni, cosicché ogni punto della curva<br />

Gx(x,y) = 0<br />

possiede un intorno nel quale la stessa è grafico di una funzione di classe C1 del tipo<br />

x = x(y). Si riconosce anzi che in questo caso la curva Γ è anche globalmente grafico di<br />

una funzione della y, essendo Γ = {(x,y)∈IR 2 /x = ye−y } (1) .<br />

(1) Può capitareche un’intera curvasialocalmentegrafico di funzioni ad esempiodellavariabile<br />

y, senza che la stessa sia globalmente grafico di una funzione della variabile y; si pensi alla<br />

curva di equazione (x−y)(x−y +1) = 0.<br />

6


Esempio <strong>F1.</strong>3. Cosideriamo la curva Γ di equazione x 2 (x+1)−y 2 = 0.<br />

Posto G(x,y) = x2 (x + 1) − y2 , si vede che i punti (x,y) di Γ tali che Gy(x,y) = 0<br />

sono (0,0) e (−1,0), mentre i punti tali che Gx(x,y) = 0 sono (0,0) e (−2 2 ,± 3 3 √ 3 ).<br />

Ne consegue che (0,0) è l’unico punto singolare di Γ. Si può provare che<br />

non esiste alcun intorno del punto (0,0) nel quale Γ è grafico di una funzione<br />

della variabile x o della variabile y. In effetti, pur senza voler entrare<br />

nei dettagli, avvertiamo che, con l’aiuto delle derivate successive della<br />

funzione G in (0,0), questo punto singolare viene classificato come “nodo”,<br />

o “punto doppio a tangenti distinte”, dove con il termine “tangenti” in un simile punto<br />

P0 = (x0,y0) ci si riferisce alle due rette le cui equazioni si ottengono spezzando<br />

l’equazione Gxx(P0)(x − x0) 2 + 2Gxy(P0)(x − x0)(y − y0) + Gyy(P0)(y − y0) 2 = 0.<br />

Nel caso di questo esempio, l’equazione è 2x2 −2y2 = 0, ossia y = ±x.<br />

Esempio <strong>F1.</strong>4. <strong>Il</strong>punto (0,0)èsingolareanche per lacurva Γdi equazione x 2 −y 3 = 0.<br />

Tuttavia l’equazione può essere scritta, anche globalmente, nella forma<br />

y = g(x): risulta infatti Γ = {(x,y)∈IR 2 /y = 3√ x 2 }, dove però la<br />

funzione y = 3√ x 2 non è di classe C 1 in alcun intorno del punto 0.<br />

<strong>Il</strong> punto singolare (0,0) viene classificato come “punto cuspidale”.<br />

Qui l’equazione Gxx(P0)(x−x0) 2 +2Gxy(P0)(x−x0)(y −y0)+Gyy(P0)(y −y0) 2 = 0,<br />

di cui s’è detto nell’esempio precedente, è 2x 2 = 0, cosicché nel punto (0,0) si hanno<br />

due “tangenti” coincidenti, di equazione x = 0.<br />

Esempio <strong>F1.</strong>5. Consideriamo la curva Γ di equazione x3 +xy2−x 2−y 2 = 0.<br />

Posto G(x,y) = x3 +xy2−x 2−y 2 ⎧<br />

⎨G(x,y)<br />

= 0<br />

, si vede che il sistema Gy(x,y) = 0<br />

⎩<br />

Gx(x,y) = 0<br />

ammette come unica soluzione il punto (0,0), che dunque è l’unico punto<br />

singolare di Γ. Si riconosce che l’equazione può mettersi nella forma<br />

(x 2 +y 2 )(x−1) = 0, che si spezza in x 2 +y 2 = 0 e x−1 = 0; pertanto<br />

Γ è costituita dal punto (0,0) e dalla retta x = 1.<br />

<strong>Il</strong> punto singolare (0,0) viene classificato come “punto isolato”.<br />

Esempio <strong>F1.</strong>6. Interessante è il caso della funzione G(x,y) = (x 2 +y 2 −1) 2 .<br />

Si vede che, ∀(x,y)∈Γ, dove Γ è il luogo degli zeri di G, risulta ∇G(x,y) = (0,0),<br />

cosicché tutti i punti di Γ sono singolari relativamente a G. Eppure, in un opportuno<br />

intorno di ciascuno di essi, la curva Γ, che è la stessa circonferenza dell’Esempio <strong>F1.</strong>1,<br />

è grafico di una funzione di classe C 1 del tipo y = g(x) o x = h(y).<br />

Con ciò è evidenziato il fatto che il teorema del Dini stabilisce una condizione soltanto<br />

sufficiente e non anche necessaria per l’esistenza e la regolarità della funzione implicita.<br />

7


•) <strong>Il</strong> caso delle equazioni in tre variabili.<br />

Approfondiamo ora il caso n = 2, k = 1, ossia quello dell’equazione G(x,y,z) = 0, in<br />

ordine alla possibilità di esprimere z in funzione di x e di y.<br />

Teorema <strong>F1.</strong>3. Sia G : A → IR, con A aperto di IR 3 e G∈C 1 (A). Sia (x0,y0,z0)∈A<br />

con G(x0,y0,z0) = 0. Se Gz(x0,y0,z0) = 0, allora ∃I ∈ I(x0,y0) ed ∃J ∈ I(z0),<br />

con I×J ⊆ A, tali che ∀(x,y)∈I ∃!z =: g(x,y)∈J tale che G(x,y,z) = 0, ossia<br />

tali (gli intorni I e J) che ∃!g : I → J tale che ∀(x,y) ∈ I G(x,y,g(x,y)) = 0.<br />

Inoltre g(x0,y0) = z0. Infine g ∈ C 1 (I) e, ∀(x,y)∈I, gx(x,y) = − Gx(x,y,g(x,y))<br />

Gz(x,y,g(x,y)) e<br />

gy(x,y) = − Gy(x,y,g(x,y))<br />

Gz(x,y,g(x,y)) .<br />

Osserviamo che, se le ipotesi del teorema sono soddisfatte, le derivate parziali gx e gy<br />

possono essere calcolate direttamente dall’uguaglianza G(x,y,z) = 0, nella quale si<br />

pensi z dipendente da x e da y, ossia appunto z = g(x,y). Si ricava infatti, derivando<br />

amboimembriprimarispettoadxepoirispettoady,che Gx(x,y,z)+Gz(x,y,z)zx = 0<br />

e che Gy(x,y,z)+Gz(x,y,z)zy = 0, da cui si passa rispettivamente a zx = − Gx(x,y,z)<br />

Gz(x,y,z)<br />

ed a zy = − Gy(x,y,z)<br />

, in sostanziale accordo con le formule presentate nel teorema.<br />

Gz(x,y,z)<br />

<strong>Il</strong> teorema stabilisce in sostanza che, posto Σ = {(x,y,z)∈A/G(x,y,z) = 0}, che è la<br />

“superficiedilivello0”dellafunzioneG, econsiderato P0 = (x0,y0,z0)∈Σ, se Gz(P0) =<br />

0, allora l’insieme Σ è, in un intorno di P0, il grafico di una funzione di classe C 1 del tipo<br />

z = g(x,y). Analogamente, serisulta Gy(P0) = 0 o Gx(P0) = 0,alloraΣè, nell’intorno<br />

di P0, il grafico di una funzione di classe C1 rispettivamente del tipo y = h(x,z) e<br />

x = l(y,z), le cui derivate parziali son date dalle formule: hx(x,z) = − Gx(x,h(x,z),z)<br />

Gy(x,h(x,z),z) ,<br />

hz(x,z) = − Gz(x,h(x,z),z)<br />

Gy(x,h(x,z),z) , ly(y,z) = − Gy(l(y,z),y,z)<br />

Gx(l(y,z),y,z) , lz(y,z) = − Gz(l(y,z),y,z)<br />

Gx(l(y,z),y,z) .<br />

Pertanto, se ∇G(P0) = (0,0,0), allora l’insieme Σ è, in un intorno di P0, il sostegno di<br />

una superficie regolare. <strong>Il</strong> piano tangente a questa superficie nel punto P0 ha equazione<br />

Gx(P0)(x−x0)+Gy(P0)(y−y0)+Gz(P0)(z−z0) = 0. Infatti, se ad esempio la superficie<br />

si rappresenta nella forma z = g(x,y), è noto che il piano tangente ha equazione<br />

z = g(x0,y0)+gx(x0,y0)(x−x0)+gy(x0,y0)(y−y0), e da questa si passa all’equazione<br />

suddetta ricordando i valori in (x0,y0) di g, gx, gy stabiliti dal teorema. In modo<br />

analogo si ragiona negli altri due casi.<br />

Ponendo P = (x,y,z), l’equazione del piano tangente può essere<br />

riscritta nella forma ∇G(P0)·(P −P0) = 0, dalla quale si dedu-<br />

ce che il vettore ∇G(P0) è normale alla superficie Σ nel punto P0.<br />

Se ∇G(P0) = (0,0,0), diciamo che P0 è un punto regolare della superficie Σ; altrimenti<br />

si dice che P0 è un punto singolare di Σ (relativamente a G).<br />

8


Con un ragionamento analogo a quello seguito nella sezione precedente, riconosciamo<br />

che, considerato un qualunque punto P0 ∈ A con ∇G(P0) = (0,0,0), la superficie<br />

di livello passante per P0 è, nell’intorno di P0, il sostegno di una superficie regolare,<br />

rispetto alla quale il vettore ∇G(P0) risulta essere normale. Questa superficie non è<br />

altro che una superficie equipotenziale del campo vettoriale ∇G.<br />

Esempio <strong>F1.</strong>7. <strong>Il</strong> punto (0,0,0) è singolare per la superficie di equazione<br />

x 2 +y 2 −z 2 = 0, che una superficie conica le cui due falde hanno<br />

vertice nel suddetto punto: in questo caso non esiste alcun intorno del<br />

punto nel quale il luogo Σ sia il grafico di una funzione delle variabili<br />

(x,y) o (x,z) o (y,z).<br />

Interessante è anche il caso della superficie xy 2 +z 3 = 0, per la quale<br />

sono singolari tutti i punti dell’asse x. La superficie è il grafico della<br />

funzione z = − 3 xy 2 , che non è differenziabile nei punti degli assi x e y.<br />

Esempio <strong>F1.</strong>8. Consideriamo la superficie Σ = {(x,y,z)∈IR 3 /xz 2 −y 2 +2e z = 1}<br />

ed il suo punto P0 = (0,1,0).<br />

Posto G(x,y,z) = xz 2 −y 2 +2e z −1, si vede che Gx(P0) = 0, Gy(P0) = −2 e Gz(P0) =<br />

2, cosicché esiste il piano tangente a Σ in P0 ed ha equazione −2(y −1)+2z = 0.<br />

Poiché Gz(P0) = 0, la superficie Σ è, nell’intorno di P0, il grafico di una funzione<br />

z = g(x,y), definita in un intorno di (0,1) e tale che g(0,1) = 0. Inoltre risulta<br />

gx(0,1) = − Gx(P0)<br />

Gz(P0) = 0 e gy(0,1) = − Gy(P0)<br />

Gz(P0)<br />

Possiamo ritrovare le derivate parziali delle funzione implicita nel punto (0,1) procedendo<br />

nel seguente modo: per comodità indichiamo la funzione implicita con z =<br />

z(x,y); dall’equazione xz 2 −y 2 +2e z −1 = 0, derivando ambo i membri rispetto ad x,<br />

si ottiene z 2 +2xzzx +2e z zx = 0; da qui, ponendo x = 0, y = 1 e z = 0, si ricava che<br />

zx(0,1) = 0; in modo analogo si procede per ricavare che zy(0,1) = 1.<br />

Poiché Gy(P0) = 0, la superficie Σ è, nell’intorno di P0, il grafico di una funzione<br />

y = h(x,z), definita in un intorno di (0,0) e tale che h(0,0) = 1. Inoltre risulta<br />

hx(0,0) = − Gx(P0)<br />

Gy(P0) = 0 e hz(0,0) = − Gz(P0)<br />

= 1. Anche qui ritroviamo le derivate in<br />

Gy(P0)<br />

(0,0) della funzione implicita, che ora preferiamo indicare con y = y(x,z), ricavandole<br />

dall’equazione xz2−y2 +2ez −1 = 0 ove si pensi y funzione di x e di z: derivando ambo<br />

i membri rispetto ad x otteniamo z2−2yyx = 0, da cui, per x = 0, y = 1 e z = 0, si<br />

deduce che yx(0,0) = 0; in modo analogo si arriva ad ottenere che yz(0,0) = 1.<br />

Da notare che in questo caso la funzione h si può facilmente esplicitare; tenendo conto<br />

del segno di h(0,0), si ricava infatti che h(x,z) = √ xz2 +2ez −1.<br />

Infine, poiché Gx(P0) = 0, il Teorema <strong>F1.</strong>3 non è applicabile in ordine alla possibilità<br />

di esprimere x in funzione di y e di z nell’intorno di P0.<br />

9<br />

= 1.


•) <strong>Il</strong> caso dei sistemi di due equazioni in tre variabili.<br />

Consideriamo infine il caso n = 1, k = 2, ossia quello del sistema<br />

ordine alla possibilità di esprimere y e z in funzione di x.<br />

<br />

G1(x,y,z) = 0<br />

, in<br />

G2(x,y,z) = 0<br />

Teorema <strong>F1.</strong>4. Sia G = (G1,G2) : A → IR 2 , con A aperto di IR 3 e G∈C 1 (A). Sia<br />

(x0,y0,z0)∈A con G(x0,y0,z0) = 0. Se | ∂(G1,G2)<br />

∂(y,z) (x0,y0,z0)| = 0, allora ∃I ∈I(x0)<br />

ed ∃J ∈I(y0,z0), con I×J ⊆ A, tali che ∀x∈I ∃!(y,z) =: (g1(x),g2(x))∈J tale<br />

che G(x,y,z) = 0, ossia tali (gli intorni I e J) che ∃!g = (g1,g2) : I → J tale che<br />

∀x∈I G(x,g1(x),g2(x)) = 0. Inoltre g1(x0) = y0 e g2(x0) = z0. Infine g∈C 1 (I) e,<br />

∀x∈I, g ′ 1 (x) = −|∂(G 1 ,G 2 )<br />

∂(x,z) (x,g1(x),g2(x))|<br />

| ∂(G 1 ,G 2 )<br />

∂(y,z) (x,g1(x),g2(x))| e g′ 2 (x) = −|∂(G 1 ,G 2 )<br />

(x,g1(x),g2(x))|<br />

∂(y,x)<br />

| ∂(G1 ,G2 )<br />

(x,g1(x),g2(x))| ∂(y,z) .<br />

Anchequisuggeriamounmetodopraticopercalcolarelederivatedellefunzioni implicite<br />

g1 e g2, ammesso che le ipotesi del teorema siano soddisfatte: partendo dal sistema<br />

G1(x,y,z) = 0<br />

G2(x,y,z) = 0 , nel quale si pensi y = g1(x) e z = g2(x), si derivano ambo i membri<br />

delle due equazioni ottenendo<br />

e da qui si ricava che y ′ = − |∂(G 1 ,G 2 )<br />

∂(x,z) (x,y,z)|<br />

| ∂(G 1 ,G 2 )<br />

(G1)x(x,y,z)+(G1)y(x,y,z)y ′ +(G1)z(x,y,z)z ′ = 0<br />

(G2)x(x,y,z)+(G2)y(x,y,z)y ′ +(G2)z(x,y,z)z ′ = 0 ,<br />

∂(y,x) (x,y,z)|<br />

(x,y,z)| ∂(y,z) e z′ = − |∂(G 1 ,G2 )<br />

| ∂(G1 ,G2 )<br />

(x,y,z)| ∂(y,z) .<br />

<br />

G1(x,y,z) = 0<br />

<strong>Il</strong> teorema stabilisce in sostanza che, posto Γ = {(x,y,z)∈A/ }, che<br />

G2(x,y,z) = 0<br />

è la “curva di livello (0,0)” della funzione G, e considerato il punto P0 = (x0,y0,z0)∈Γ,<br />

se UG(P0) := | ∂(G1,G2)<br />

∂(y,z) (P0)| = 0, allora il sistema può mettersi, almeno in un intorno<br />

<br />

y = g1(x)<br />

di P0, nella forma<br />

z = g2(x) , con g1 e g2 funzioni di classe C1 in un intorno di x0.<br />

Analogheconsiderazioni si fanno nell’ipotesiche VG(P0):=| ∂(G1,G2)<br />

∂(z,x) (P0)|=0, o inquella<br />

che WG(P0):=| ∂(G1,G2)<br />

∂(x,y) (P0)|=0, scambiando opportunamente il ruolo delle variabili.<br />

Considerato che UG(P0),VG(P0),WG(P0) sono i minori d’ordine due, presi con segno<br />

alternato, della matrice jacobiana DG(P0) = ∂(G1,G2)<br />

∂(x,y,z) (P0), deduciamo che, se essa ha<br />

rango 2, l’insieme Γ è, nell’intorno di P0, il sostegno di una curva regolare e semplice.<br />

La tangente a questa curva in P0 ha la direzione del vettore (UG(P0),VG(P0),WG(P0)).<br />

Infatti, nell’ipotesi ad esempio che UG(P0) = 0, il vettore tangente in P0 alla curva<br />

y = g1(x)<br />

z = g2(x) èdatoda(1,g′ 1 (x0),g ′ 2 (x0)); equesto, inbasealleformuleg ′ 1 (x0) = VG(P0)<br />

UG(P0) e<br />

g ′ 2 (x0) = WG(P0)<br />

UG(P0)<br />

stabilitenel teorema, è parallelo al vettore (UG(P0),VG(P0),WG(P0)).<br />

10


Considerato poi che (UG(P0),VG(P0),WG(P0)) = ∇G1(P0)×∇G2(P0), ne ricaviamo<br />

che i vettori ∇G1(P0) e ∇G2(P0) sono normali alla curva Γ in P0.<br />

Un punto P0 di Γ è detto regolare se la matrice jacobiana DG(P0)<br />

ha rango 2, altrimenti è detto singolare (relativamente a G).<br />

Infine osserviamo, relativamente ad un punto regolare P0 della curva Γ ed alle equazioni<br />

G1(x,y,z) = 0 e G2(x,y,z) = 0 prese singolarmente, che, poiché risulta ∇G1(P0) =<br />

(0,0,0) e ∇G2(P0) = (0,0,0), in virtù del Teorema <strong>F1.</strong>3 queste equazioni rappre-<br />

sentano, in un intorno di P0, due superfici regolari; queste superfici evidentemente si<br />

intersecano lungo la curva Γ; infine esse non sono tra loro tangenti in P0, dato che i<br />

corrispondenti vettori normali ∇G1(P0) e ∇G2(P0) non sono fra loro paralleli.<br />

<br />

2 2 2 x +y +z = 2<br />

Esempio <strong>F1.</strong>9. Siano dati il sistema<br />

x2 +y2 −z = 0 ed il punto P0 = ( 1<br />

2 , √ 3<br />

2 ,1).<br />

Posto G1(x,y,z) = x2 +y2 +z2−2 e G2(x,y,z) = x2 +y2 <br />

G1(P0) = 0<br />

−z, si vede che<br />

G2(P0) = 0 ,<br />

ossia che G(P0) = 0 se G = (G1,G2).<br />

√<br />

1 3 2<br />

Inoltre si calcola che DG(P0) =<br />

1 √ <br />

, e da qui si ricavano i determinanti<br />

3 −1<br />

UG(P0) = −3 √ 3, VG(P0) = 3, WG(P0) = 0. Poiché essi non sono tutti nulli, possiamo<br />

affermare che il luogo Γ degli zeri della G è, nell’intorno di P0, il sostegno di una curva<br />

regolare e semplice, e che la tangente a Γ in P0 ha la direzione del vettore (−3 √ 3,3,0).<br />

Essendo in particolare UG(P0) = 0, il sistema definisce implicitamente la coppia di<br />

funzioni y = g1(x) e z = g2(x), ciascuna di classe C 1 in un intorno di x0 = 1<br />

2<br />

g1( 1<br />

2 ) = √ 3<br />

2 e g2( 1<br />

Le derivate g ′ 1 (1<br />

2 ) e g′ 2 (1<br />

2<br />

, e tali che<br />

2 ) = 1; inoltre risulta g′ 1( 1 VG(P0) 1<br />

2 ) = UG(P0) = −√ e g<br />

3 ′ 2( 1 WG(P0)<br />

2 ) = UG(P0) = 0.<br />

) potevano essere calcolate anche nel seguente modo: per<br />

comodità indichiamo le funzioni implicite con y = y(x) e z = z(x); derivando rispetto<br />

ad x ambo i membri di ciascuna delle due equazioni del sistema, otteniamo il sistema<br />

2x+2yy ′ +2zz ′ = 0<br />

2x+2yy ′ −z ′ = 0<br />

; questo, per x = 1<br />

2 , y = √ 3<br />

2 e z = 1, fornisce<br />

y ′ ( 1<br />

2<br />

z ′ ( 1<br />

2<br />

) = − 1<br />

√ 3<br />

) = 0<br />

Osserviamo che, con facili manipolazioni algebriche, il sistema assegnato può mettersi<br />

2 2<br />

nella forma<br />

x +y = 1<br />

, dalla quale è evidente che le funzioni g1(x) e g2(x) possono<br />

z = 1<br />

in questo caso essere anche esplicitate: g1(x) = √ 1−x 2 e g2(x) = 1.<br />

Concludiamo osservando che, essendo anche VG(P0) = 0, il teorema del Dini può essere<br />

applicato anche in ordine alla possibilità di esprimere, in un intorno di P0, le variabili x<br />

e z in funzione della variabile y, ossia di trasformare il sistema assegnato in un sistema<br />

x = h1(y)<br />

del tipo<br />

z = h2(y) ; sulle funzioni h1 ed h2 si possono poi fare considerazioni analoghe<br />

a quelle fatte per le funzioni g1 e g2.<br />

11<br />

.


Esempio <strong>F1.</strong>10. <strong>Il</strong> punto (0,2,0) è singolare per la curva<br />

Esso infatti è soluzione (l’unica) del sistema formato dalle cinque<br />

equazioni G1(x,y,z) = 0, G2(x,y,z) = 0, UG(x,y,z) = 0,<br />

VG(x,y,z) = 0, WG(x,y,z) = 0, dove si è posto<br />

G1(x,y,z) = x 2 +y 2 +z 2 −4 e G2(x,y,z) = x 2 +y 2 −2y.<br />

Da notare che il punto in questione è regolare sia per la superficie<br />

x 2 +y 2 +z 2 = 4<br />

x 2 +y 2 −2y = 0 .<br />

sferica x 2 +y 2 +z 2 = 4 sia per la superficie cilindrica x 2 +y 2 −2y = 0;<br />

esse si intersecano lungo la curva assegnata e sono tra loro tangenti nel punto assegnato.<br />

Tutto ciò risulta confermato dal fatto che ∇G1(0,2,0) = (0,2,0) e ∇G2(0,2,0) =<br />

(0,4,0), cosicché le due superfici hanno, nel punto (0,2,0), piano tangente comune, di<br />

equazione y = 2.<br />

Esempio <strong>F1.</strong>11. <strong>Il</strong> punto (0,0,0) è singolare per la curva<br />

Si riconosce anche che il punto in questione è regolare per cia-<br />

scuna delle superfici x 2 +y 2 −z = 0 e x 2 +y 2 +z 2 −2z = 0;<br />

esse si intersecano lungo la curva assegnata e sono tra loro tan-<br />

genti nel punto assegnato. Invero, posto G1(x,y,z) = x 2 +y 2 −z<br />

e G2(x,y,z) = x 2 +y 2 +z 2 −2z, si calcola che ∇G1(0,0,0) =<br />

(0,0,−1) e ∇G2(0,0,0) = (0,0,−2).<br />

x 2 +y 2 −z = 0<br />

x 2 +y 2 +z 2 −2z = 0 .<br />

Si vede inoltre facilmente che il sistema assegnato si spezza nei due seguenti sistemi:<br />

2 2 2 2 x +y = 1<br />

e<br />

x +y = 0<br />

; pertanto la curva assegnata è costituita dall’unione di<br />

z = 1 z = 0<br />

una circonferenza e del punto isolato (0,0,0).<br />

<br />

2 2 2 x +y −z = 0<br />

Esempio <strong>F1.</strong>12. <strong>Il</strong> punto (0,0,0) è singolare per la curva<br />

x2 +y2−2y = 0 .<br />

In verità non poteva essere altrimenti, dato che, com’è noto,<br />

il punto in questione è singolare già per la superficie conica<br />

x 2 +y 2 −z 2 = 0. Invero, posto P0 = (0,0,0) e G = (G1,G2),<br />

con G1(x,y,z) = x 2 +y 2 −z 2 e G2(x,y,z) = x 2 +y 2 −2y = 0,<br />

e considerato che ∇G1(P0) = (0,0,0), è evidente che la matrice<br />

jacobiana DG(P0) non può avere rango 2.<br />

12


•) <strong>Il</strong> caso dei sistemi di due equazioni in quattro variabili.<br />

Consideriamo infine il caso n = 2, k = 2, ossia quello del sistema<br />

in ordine alla possibilità di esprimere u e v in funzione di x e di y.<br />

G1(x,y,u,v)= 0<br />

G2(x,y,u,v)= 0 ,<br />

Ovviamente a questo caso non è possibile associare una interpretazione geometrica (1) .<br />

Teorema <strong>F1.</strong>5. Sia G = (G1,G2) : A → IR 2 , con A aperto di IR 4 e G∈C 1 (A). Sia<br />

(x0,y0,u0,v0) ∈ A con G(x0,y0,u0,v0) = 0. Se | ∂(G1,G2)<br />

∂(u,v) (x0,y0,u0,v0)| = 0, allora<br />

∃I ∈ I(x0,y0) ed ∃J ∈ I(u0,v0), con I×J ⊆ A, tali che ∀(x,y) ∈ I ∃!(u,v) =:<br />

(g1(x,y),g2(x,y))∈J tale che G(x,y,u,v)= 0, ossia tali (gli intorni I e J) che ∃!g =<br />

(g1,g2) : I → J tale che ∀(x,y)∈I G(x,y,g1(x,y),g2(x,y)) = 0.<br />

Inoltre g(x0,y0) = (u0,v0). Infine g∈C 1 (I) e, ∀(x,y)∈I, risulta:<br />

∂g1<br />

∂x (x,y) = −| ∂(G1 ,G2 )<br />

∂g2<br />

∂x (x,y) = −| ∂(G1 ,G2 )<br />

∂(x,v) (x,y,g1(x,y),g2(x,y))|<br />

| ∂(G 1 ,G 2 )<br />

∂(u,v) (x,y,g1(x,y),g2(x,y))|<br />

∂(u,x) (x,y,g1(x,y),g2(x,y))|<br />

| ∂(G 1 ,G 2 )<br />

∂(u,v) (x,y,g1(x,y),g2(x,y))|<br />

, ∂g1<br />

, ∂g2<br />

∂y (x,y) = −|∂(G 1 ,G 2 )<br />

∂y (x,y) = −|∂(G 1 ,G 2 )<br />

(x,y,g1(x,y),g2(x,y))|<br />

∂(y,v)<br />

| ∂(G1 ,G2 )<br />

(x,y,g1(x,y),g2(x,y))| ∂(u,v) ,<br />

(x,y,g1(x,y),g2(x,y))|<br />

∂(u,y)<br />

| ∂(G1 ,G2 )<br />

(x,y,g1(x,y),g2(x,y))| ∂(u,v) .<br />

Anchequisuggeriamounmetodopraticopercalcolarelederivatedellefunzioni implicite<br />

g1 e g2, ammesso che le ipotesi del teorema siano soddisfatte: partendo dal sistema<br />

<br />

G1(x,y,u,v) = 0<br />

G2(x,y,u,v) = 0 , nel quale si pensi u = g1(x,y) e v = g2(x,y), si derivano rispetto<br />

ad x ambo i membri delle due equazioni, ottenendo<br />

<br />

(G1)x(x,y,u,v)+(G1)u(x,y,u,v)ux+(G1)v(x,y,u,v)vx = 0<br />

, e da qui si ricava che<br />

(G2)x(x,y,u,v)+(G2)u(x,y,u,v)ux+(G2)v(x,y,u,v)vx = 0<br />

ux = − |∂(G 1 ,G2 )<br />

(x,y,g1(x,y),g2(x,y))|<br />

∂(x,v)<br />

| ∂(G1 ,G2 )<br />

(x,y,g1(x,y),g2(x,y))| ∂(u,v) e vx = − |∂(G 1 ,G2 )<br />

(x,y,g1(x,y),g2(x,y))|<br />

∂(u,x)<br />

| ∂(G1 ,G2 )<br />

(x,y,g1(x,y),g2(x,y))| ∂(u,v) ;<br />

se invece deriviamo rispetto ad y, otteniamo<br />

<br />

(G1)y(x,y,u,v)+(G1)u(x,y,u,v)uy +(G1)v(x,y,u,v)vy = 0<br />

, e da qui si ricava che<br />

(G2)y(x,y,u,v)+(G2)u(x,y,u,v)uy +(G2)v(x,y,u,v)vy = 0<br />

uy = − |∂(G 1 ,G 2 )<br />

∂(y,v) (x,y,g1(x,y),g2(x,y))|<br />

| ∂(G 1 ,G 2 )<br />

∂(u,v) (x,y,g1(x,y),g2(x,y))| e vy = − |∂(G 1 ,G 2 )<br />

∂(u,y) (x,y,g1(x,y),g2(x,y))|<br />

| ∂(G 1 ,G 2 )<br />

∂(u,v) (x,y,g1(x,y),g2(x,y))| .<br />

Quanto detto fin qui può essere ripetuto cambiando il ruolo delle variabili, ossia in<br />

ciascuna delle seguenti ipotesi: | ∂(G1,G2)<br />

∂(y,v) (P0)|=0, | ∂(G1,G2)<br />

∂(x,v) (P0)|=0, | ∂(G1,G2)<br />

∂(y,u) (P0)|=<br />

0, | ∂(G1,G2)<br />

∂(x,u) (P0)| = 0, | ∂(G1,G2)<br />

∂(x,y) (P0)| = 0, dove s’è posto P0 = (x0,y0,u0,v0) e dove si<br />

riconosceche questideterminanti, unitamentea | ∂(G1,G2)<br />

∂(u,v) (P0)| che comparenel teorema<br />

enunciato, sono tutti i minori d’ordine due della matrice jacobiana DG(P0).<br />

(1) <strong>Il</strong> sistema in oggetto rappresenta una varietà bidimensionale in IR 4 (n = k = 2).<br />

Le altre possibili varietà in IR 4 sono la curva (n = 1, k = 3) e la ipersuperficie (n = 3, k = 1).<br />

13


F2. Invertibilità delle funzioni da IR n in IR n<br />

Sia F : X → IR n , con X aperto connesso di IR n ed F ∈ C 1 (X). Ci poniamo il problema<br />

di stabilire sotto quali condizioni F è invertibile.<br />

<strong>Il</strong> problema è già risolto se n = 1, essendo noto che: se ∀x∈X F ′ (x) = 0, allora F è<br />

invertibile nell’intervallo X. Infatti il teorema degli zeri applicato ad F ′ assicura che F ′<br />

è ovunque positiva o ovunque negativa in X, cosicché F è strettamente monotona in X.<br />

Si sa anche che F −1 ∈C 1 (F(X)), e che ∀y∈F(X) (F −1 ) ′ (y) = 1<br />

F ′ (x) , con x = F−1 (y).<br />

Tornando ad n qualsiasi, un caso particolare notevole si ha con F : IR n → IR n lineare.<br />

Detta A la matrice associata ad F, ossia quella per cui F(x) = Ax ∀x∈IR n , è noto<br />

che, se detA = 0, allora ∀y ∈IR n ∃!x∈IR n tale che Ax = y (teorema di Cramer).<br />

Se ricordiamo che ∀x∈IR n Df(x) = A, il risultato esposto può essere espresso come<br />

segue: se ∀x∈IR n Jf(x) = 0, allora F è invertibile. Si sa inoltre che anche la funzione<br />

F −1 è lineare, e che la matrice ad essa associata è A −1 ; ne segue che F −1 ∈ C 1 (IR n ) e<br />

che ∀y∈IR n DF −1 (y) = [DF(x)] −1 , dove x = F −1 (y).<br />

Gli esempi trattatifanno pensare che, anche nel caso generale, una condizione sufficiente<br />

per l’invertibilità di F è che risulti JF(x) = 0 ∀x∈X.<br />

Ma le cose non stanno così, come dimostra l’esempio che segue.<br />

Esempio F2.1. Siano X = {(x1,x2)∈IR 2 /x1 > 0} ed F(x1,x2) = (x1cosx2, x1senx2)<br />

∀(x1,x2)∈X. Si vede che F ∈C 1 (X) eche JF(x1,x2) = x1 = 0 ∀(x1,x2)∈X. D’altra<br />

parte risulta F(x1,x2) = F(x1,x2+2kπ) ∀k∈Z, cosicché F non è invertibile in X.<br />

Si può comunque provare che, sempre nell’ipotesi JF(x) = 0 ∀x∈X, se F è invertibile,<br />

allora F −1 ∈ C 1 (F(X)) e ∀y ∈ F(X) DF −1 (y) = [DF(x)] −1 , con x = F −1 (y). In<br />

particolare, la formula per DF −1 (y) si ricava osservando che, essendo F◦F −1 = i F(X) ,<br />

deve aversi DF(x)DF −1 (y) = In, dove In è la matrice unitaria d’ordine n.<br />

A ben vedere, il problema dell’invertibilità di F, che evidentemente nel caso globale non<br />

èsemplice, può essere vistocome unparticolareproblema di funzione implicita: stabilire<br />

sotto quali condizioni, data l’equazione y = F(x), ossia l’equazione G(x,y) = 0 con<br />

G(x,y) = F(x)−y, è possibile, almeno sul piano teorico, esprimere x in funzione di y.<br />

Osservato allora che ∀(x,y)∈X×IR n risulta ∂G<br />

∂G (x,y) = DF(x) e ∂x ∂y (x,y) = −In, dal<br />

teorema del Dini applicato a G discende il seguente risultato, che, nella solita ipotesi su<br />

JF(x), garantisce quanto meno l’invertibilità locale di F.<br />

Teorema F2.1 (diinvertibilitàlocale). Sia F : X → IR n , conX apertoed F ∈ C 1 (X),<br />

e sia x0∈X. Se JF(x0) = 0, allora ∃I(⊆ X)∈I(x0) ed ∃J∈I(F(x0)) tali che ∀y∈J<br />

∃!x∈I tale che F(x) = y, ossia tali (gli intorni I e J) che F |I sia bigettiva fra I e J.<br />

Inoltresi ha (F |I) −1 ∈ C 1 (J) e ∀y∈J D(F |I) −1 (y) = [DF(x)] −1 , con x = (F |I) −1 (y).<br />

14


F3. Problemi di massimo e minimo vincolati<br />

Vogliamo affrontare il problema della determinazione dei valori massimo e minimo fra<br />

quelli che una data funzione assume sui punti di una data curva o di una data superficie.<br />

La funzione è spesso chiamata “funzione obiettivo”, la curva e la superficie son chiamate<br />

“vincoli”, gli estremi di cui s’è detto son chiamati “estremi vincolati”.<br />

Se si opera in IR 2 , il vincolo èuna curva, ossia un insieme di dimensione uno, individuato<br />

da un’uguaglianza del tipo G(x,y) = 0. Se invece si opera in IR 3 , il vincolo può essere<br />

ancora una curva, ossia ancora un insieme di dimensione uno, individuato da una coppia<br />

G1(x,y,z) = 0<br />

di uguaglianze del tipo ; oppure una superficie, ossia un insieme di<br />

G2(x,y,z) = 0<br />

dimensione due, individuato da una uguaglianza del tipo G(x,y,z) = 0.<br />

Considereremo solo casi in cui la funzione obiettivo e le funzioni che individuano il<br />

vincolo sono di classe C 1 ; inoltre, con l’eccezione di qualche esempio particolare, considereremo<br />

solo vincoli limitati e privi di punti singolari.<br />

All’inizio utilizzeremo il metodo della parametrizzazione del vincolo, in modo che il<br />

problema sia ricondotto, nel caso di curve, ad un problema di una sola variabile, il<br />

parametro t, e, nel caso di superfici, ad un problema di due variabili, i parametri u<br />

e v. In quest’ultimo caso, il problema cui ci si riconduce è quello di determinare gli<br />

estremi di una funzione su un dominio di IR 2 , individuato da disuguaglianze imposte ai<br />

parametri. Pertanto, per fare in modo che sotto questo punto di vista la trattazione<br />

sia completa, ci occuperemo anche di casi in cui la funzione obiettivo è da valutare su<br />

domini appunto di IR 2 ed anche di IR 3 , dunque su insiemi aventi la stessa dimensione<br />

dell’ambiente di cui fanno parte, che a volte vengono detti “vincoli di disuguaglianza”.<br />

Successivamente ci occuperemo del metodo dei moltiplicatori di Lagrange, considerando<br />

dapprima ilcaso incui ilvincolosia una curva inIR 2 , poiquellodella curva inIR 3 , quindi<br />

quello della superficie in IR 3 , per concludere con il caso generale del vincolo costituito<br />

da un insieme di dimensione m–k nello spazio IR m .<br />

Esempio F3.1. Unaparticelladimassamèvincolataamuoversi lungolacirconferenza<br />

Γ = {(x,y)∈IR 2 /x 2 +y 2 = 1} nel piano verticale xy, rimanendo ancorata<br />

al punto (1,0) mediante una molla ideale di costante elastica k.<br />

Vogliamo calcolare la posizione di equilibrio stabile della particella,<br />

soggetta alla forza di gravità e alla forza elastica.<br />

<strong>Il</strong> punto di equilibrio stabile è quello in cui l’energia potenziale<br />

è minima. L’energia potenziale della particella nel punto (x,y) è<br />

f(x,y) = mgy+ 1<br />

2 k[(x−1)2 +y 2 ]. <strong>Il</strong> problema è quello di calcolare il minimo di f su Γ.<br />

Poiché Γ è parametrizzata da γ ≡ (cost,sent), t∈[− π<br />

2<br />

, 3π<br />

2<br />

], i valori di f su Γ sono quelli<br />

che assume la funzione F(t) = f(γ(t)) = mgsent+k(1−cost) per t∈[− π<br />

2<br />

15<br />

, 3π<br />

2 ].


Si calcola che F ′ (t) = 0 ⇔ tgt = − mg<br />

k<br />

⇔ t = arctg −mg<br />

k =: t1 ∨ t = π +t1 =: t2.<br />

Dal confronto fra F(− π)<br />

= F(3π<br />

2 2 ) = k − mg, F(t1) = k − k2 +m2g 2 , F(t2) =<br />

k + k2 +m2g 2 (1) , si deduce che minF = F(t1) e maxF = F(t2).<br />

Essendo γ(t1) = P1 = (<br />

√ k<br />

k2 +m2g2 , √ −mg<br />

k2 +m2g2 ) e γ(t2)<br />

−k<br />

= P2 = ( √<br />

k2 +m2g2 ,<br />

√ mg<br />

k2 +m2g2 ),<br />

concludiamo che min Γ f=f(P1)=k − k 2 +m 2 g 2 e max Γ f=f(P2)=k+ k 2 +m 2 g 2 .<br />

Esempio F3.2. Calcoliamo gli estremi della funzione f(x,y) = 3x 2 − 2y 2 − 4x<br />

sull’insieme E = {(x,y)∈IR 2 /x 2 +2y 2 ≤ 1}.<br />

L’insieme E è un vincolo di disuguaglianza, la cui frontiera è il vincolo di uguaglianza<br />

Γ = {(x,y)∈IR 2 /x 2 +2y 2 = 1}. La risoluzione va divisa in due parti: ricerca dei punti<br />

stazionari interni ad E e ricerca dei punti stazionari vincolati a ∂E.<br />

Imponendo ∇f(x,y) = 0 si determina ( 2<br />

3 ,0), unico punto stazionario interno ad E.<br />

La frontiera Γ è parametrizzata da γ ≡ (cost, 1 √ sent), t∈[−π,π], cosicché i valori di<br />

2<br />

f su Γ sono quelli che assume la funzione F(t) = f(γ(t)) = 3cos 2 t−sen 2 t−4cost per<br />

t∈[−π,π]. Si calcola che F ′ (t) = 0 ⇔ t = ±π ∨ t = ± π<br />

3<br />

corrispondono i punti stazionari di f vincolati a Γ: (−1,0), ( 1<br />

2 ,±<br />

<br />

3<br />

8<br />

∨ t = 0; a questi valori di t<br />

), (1,0).<br />

Dalconfrontodeivaloridif neicinquepuntitrovatisievincechemin f = f( E 1<br />

2 ,±<br />

−2 e max f = f(−1,0) = 7.<br />

E<br />

Esempio F3.3. Calcoliamo i punti della curva Γ = {(x,y,z)∈IR 3 /<br />

per i quali è minima o massima la distanza dal punto (0,0,0).<br />

<br />

3<br />

8<br />

) =<br />

2x 2 +y 2 = 8<br />

2x−z +1 = 0 }<br />

Assumiamo come funzione obiettivo la funzione f(x,y,z) = x 2 +y 2 +z 2 , quadrato della<br />

distanza del punto (x,y,z) dal punto (0,0,0).<br />

Considerato che il vincolo Γ è parametrizzato da γ ≡ (2cost,2 √ 2sent,4cost+1), t∈<br />

[−π,π], introduciamo la funzione F(t) = f(γ(t)) = 12cos 2 t+8cost+9, con t∈[−π,π].<br />

Si calcola che F ′ (t) = 0 ⇔ t = ±π ∨ t = 0 ∨ t = ±arccos(− 1<br />

3 ), e si scopre che<br />

minF = F(±arccos(− 1 23<br />

3 )) = 3<br />

e maxF = F(0) = 29.<br />

Si conclude che i punti di Γ più vicini all’origine sono (− 2<br />

3 ,±8<br />

mentre il punto più lontano è (2,0,5), con distanza √ 29.<br />

3 ,−1 ), con distanza 3<br />

23<br />

3 ,<br />

Osserviamo che il problema poteva essere risolto eliminando una variabile: poiché su<br />

Γ risulta z = 2x + 1, i valori di f su Γ sono quelli che assume la funzione h(x,y) =<br />

f(x,y,2x+1) = 5x 2 +y 2 +4x+1 sul vincolo Γ1 = {(x,y)∈IR 2 /2x 2 +y 2 = 8}.<br />

(1) A ben vedere, i punti − π<br />

2<br />

e 3π<br />

2<br />

tali sarebbero se avessimo scelto di far variare t non in [− π<br />

2<br />

per il primo punto e in [0,2π] per il secondo.<br />

potevano essere trattati come comuni punti interni, dato che<br />

16<br />

3π , 2 ], bensì ad esempio in [−π,π]


Esempio F3.4. Calcoliamo gli estremi della funzione f(x,y,z) = √ 3x+ √ 3y−3 √ 2z<br />

sulla superficie Σ = {(x,y,z)∈IR 3 /x 2 +y 2 +z 2 = 2, z ≤ 1}.<br />

<strong>Il</strong> vincolo Σ è parametrizzato da φ ≡ ( √ 2cosucosv, √ 2cosusenv, √ 2senu), su E =<br />

[−π π , ]×[0,2π], cosicché i valori di f su Σ sono quelli che assume la funzione F(u,v) =<br />

2 4<br />

f(φ(u,v)) = √ 6(cosucosv+cosusenv− √ 6senu) sull’insieme E, che è un vincolo di<br />

disuguaglianza.<br />

Procedendo come nell’Esempio F3.2, dapprima si cercano i punti stazionari di F interni<br />

ad E, e si trova (− π<br />

3<br />

i valori di F son dati da r(v) = F(− π<br />

2<br />

π<br />

, 4 ). Quindi si considerano i punti della frontiera. Sul lato u = −π<br />

2<br />

,v) = 6 (il fatto che si tratti di valori costanti<br />

non sorprende, dal momento che ai punti di questo lato corrisponde un unico punto<br />

della superficie sferica). Sul lato u = π<br />

4<br />

i valori di F sono quelli della funzione s(v) =<br />

F( π<br />

4 ,v) = √ 3 cosv + √ 3 senv − 3 √ 2, di cui si calcola che i punti stazionari interni<br />

all’intervallo [0,2π] sono ( π<br />

4<br />

, π<br />

4<br />

) e (π<br />

4<br />

, 5<br />

4<br />

π). Passando ai lati v = 0 e v = 2π, si esamina<br />

la funzione t(u) = F(u,0) = F(u,2π) = √ 6 cosu−6 senu), di cui si calcola che l’unico<br />

punto stazionario interno all’intervallo [−π π , 2 2 ] è u = −arctg√6. Infine vanno considerati i valori che F assume nei quattro vertici del rettangolo E.<br />

Dal confronto dei valori di F nei punti trovati (1) deduciamo che min EF = F( π<br />

4<br />

5π<br />

, 4 ) =<br />

− √ 6−3 √ 2 e max F = F(− E π π<br />

3 , 4 ) = 4√3. Infine, tornando alla f, si conclude che min f = f(− Σ 1 √ ,−<br />

2 1 √ ,1) = −6 − 3<br />

2 √ 2 e<br />

max f = f(− Σ 1<br />

2 ,−1 2 , √ √2 3 ) = 4 √ 3.<br />

Esempio F3.5. Calcoliamo gli estremi della funzione f(x,y,z) = x 2 y−z sull’insieme<br />

E = {(x,y,z)∈IR 3 /z ≥ x 2 +y 2 , x 2 +y 2 +z 2 ≤ 2}.<br />

L’insieme E è un vincolo di disuguaglianza, cosicché il lavoro va diviso nella ricerca dei<br />

punti stazionari interni ad E e nella ricerca dei punti stazionari vincolati a ∂E.<br />

La frontiera ∂E a sua volta va considerata composta dalle seguenti parti: la superficie<br />

Σ1 = {(x,y,z)∈IR 3 /z = x 2 +y 2 , x 2 +y 2 < 1}, che richiede la determinazione dei punti<br />

stazionari di F1(x,y) = f(x,y,x 2 +y 2 ) sull’insieme B1 = {(x,y)∈IR 2 /x 2 + y 2 < 1};<br />

la superficie Σ2 = {(x,y,z)∈IR 3 /x 2 +y 2 +z 2 = 1, x 2 +y 2 < 1}, che richiede la deter-<br />

minazione dei punti stazionari di F2(u,v) = f( √ 2cosucosv, √ 2cosusenv, √ 2senu)<br />

sull’insieme B2 = {(u,v)∈IR 2 / π π < u ≤ , 0 ≤ v ≤ 2π}; la curva Γ = {(x,y,z)∈<br />

4 2<br />

IR 3 <br />

2 2<br />

/<br />

x +y = 1<br />

}, che richiede la determinazione dei punti stazionari di G(t) =<br />

z = 1<br />

f(cost,sent,1) sull’insieme D = [0,2π].<br />

(1)<br />

A ben vedere, i punti dei lati v = 0 e v = 2π potevano essere trattati come comuni punti<br />

interni, poiché tali sarebbero se avessimo scelto di far variare v non in [0,2π], bensì ad esempio<br />

in [−π,π] per il primo lato e in [π,3π] per il secondo. Un discorso analogo si può fare per il<br />

lato u = ± π<br />

2 , dato che anche la posizione dei poli dipende dalla scelta della parametrizzazione.<br />

17


F4. <strong>Il</strong> metodo dei moltiplicatori di Lagrange<br />

•) Estremi di funzioni di due variabili su vincoli unidimensionali.<br />

Siano f,G : A → IR, con A aperto di IR 2 ed f,G ∈ C 1 (A). Considerato l’insieme<br />

Γ = {(x,y)∈A/G(x,y) = 0}, che in questo contesto avrà il ruolo di vincolo, vogliamo<br />

riprendereilproblemadideterminare, seesistono, il min Γf edil max Γf,ossiagliestremi<br />

di f vincolati a Γ. Sappiamo già che, se Γ si rappresenta parametricamente mediante<br />

l’applicazione γ ≡ γ(t), t ∈ I, con I intervallo di IR, il problema può essere risolto<br />

riconducendolo a quello di ricercare gli estremi della funzione F(t) = f(γ(t)), t∈I , che<br />

è funzione di una sola variabile.<br />

Considerato anche che non sempre del vincolo Γ si riesce a dare una rappresentazione<br />

parametrica, è utile trovare un metodo che si possa applicare direttamente alla funzione<br />

G. A tale scopo, considerato P0 punto regolare di Γ, cerchiamo una opportuna condizione<br />

necessaria affinché P0 sia un punto di estremo relativo per f |Γ (punto di estremo<br />

relativo di f vincolato a Γ); infatti questa è a sua volta una condizione necessaria perché<br />

P0 sia punto di estremo assoluto per f |Γ .<br />

E’ noto che, essendo ∇G(P0) = (0,0), il vincolo Γ è, in un intorno di P0, il sostegno<br />

di una curva regolare e semplice, che indichiamo con γ ≡ γ(t), t∈I, dove I è un intervallo<br />

aperto di IR. Se si suppone che P0 sia punto di estremo relativo per f |Γ , allora<br />

t0 := γ −1 (P0) dovrà essere punto di estremo relativo per F = f◦γ (invero, supposto ad<br />

esempio che f(P) ≤ f(P0) ∀P ∈B ∩Γ, con B ⊆ A intorno di P0, considerato che, per<br />

la continuità di γ in t0, esiste J∈I(t0) tale che J ⊆ I e γ(J) ⊆ B, si ha che ∀t∈J<br />

f(γ(t)) ≤ f(P0) = f(γ(t0))), e dunque dovrà risultare F ′ (t0) = ∇f(P0)·γ ′ (t0) = 0 (1) ,<br />

come dire che il vettore ∇f(P0) dovrà essere nullo o comunque normale a Γ in P0.<br />

Ricordando infine che anche il vettore ∇G(P0) è normale a Γ in P0, concludiamo che<br />

∇f(P0) dovrà essere nullo o comunque parallelo a ∇G(P0), ossia che dovrà esistere<br />

λ0∈IR tale che ∇f(P0) = λ0∇G(P0).<br />

Con ciò è sostanzialmente provato il cosiddetto teorema dei moltiplicatori di Lagrange,<br />

che riportiamo qui di seguito. In esso sarà utilizzata la funzione, detta lagrangiana<br />

associata allefunzioni f e G, L : A×IR → IR, definita da L(x,y,λ) = f(x,y)−λG(x,y);<br />

il parametro λ prende il nome di moltiplicatore di Lagrange.<br />

Teorema F4.1. Siano f,G : A → IR, con A aperto di IR 2 ed f,G ∈ C 1 (A); sia<br />

Γ = {P ∈A/G(P) = 0}; sia infine P0∈Γ, con ∇G(P0) = 0. Se P0 è punto di estremo<br />

relativo per f |Γ , allora ∃λ0∈IR tale che ∇L(P0,λ0) = 0.<br />

(1)<br />

Indicato con w il versore tangente a Γ in P0, w = γ′ (t0)<br />

|γ ′ , qui si è provato che: condizione<br />

(t0)|<br />

necessaria affinché P0 sia punto di estremo relativo per f è che |Γ ∂f<br />

∂w (P0) = 0.<br />

18


Dim. Si ripete il ragionamento fatto sopra, e si giunge alla tesi osservando che, siccome<br />

∀P ∈A e ∀λ∈IR Lx(P,λ) = fx(P)−λGx(P), Ly(P,λ) = fy(P)−λGy(P), Lλ(P,λ) =<br />

−G(P), allora la condizione ∇L(P0,λ0) = (0,0,0) equivale alla coppia di condizioni<br />

G(P0) = 0, che è nelle ipotesi, e ∇f(P0)−λ0∇G(P0) = (0,0), che è già stata provata<br />

Pertanto, nell’ipotesi che f e G siano di classe C 1 nell’aperto A, i punti di estremo<br />

relativo di f vincolati a Γ vanno ricercati nelle seguenti due classi di punti: i punti<br />

singolari di Γ e i punti P regolari di Γ tali che ∇L(P,λ) sia nullo per qualche λ∈IR,<br />

ossia tali che (P,λ) sia punto stazionario per la funzione L. I punti di questa seconda<br />

classe si dicono punti stazionari di f vincolati a Γ; ed è importante ribadire che questi<br />

punti possono anche non essere di estremo relativo per f |Γ , dato che il teorema fornisce<br />

una condizione soltanto necessaria.<br />

Segnaliamoinfine cheinalcuniproblemi può accadere chelefunzioni f eGsianodefinite<br />

su un insieme E non aperto, e che qualche punto di Γ appartenga a ∂E; in questi casi<br />

il metodo dei moltiplicatori di Lagrange potrà essere applicato al vincolo Γ ∗ := Γ∩E o ,<br />

ossia alle funzioni f |E o e G |E o, e i punti di Γ\Γ ∗ dovranno essere considerati a parte.<br />

Esempio F4.1. Calcoliamo i punti della curva Γ = {(x,y)∈IR 2 /x 4 +y 4 +6xy−8 = 0}<br />

per i quali è minima o massima la distanza dall’origine.<br />

Si tratta di calcolare gli estremi della funzione f(x,y) = x 2 +y 2<br />

sull’insieme degli zeri di G(x,y) = x 4 +y 4 +6xy −8.<br />

Osserviamo dapprima che Γ è un insieme limitato. Infatti, per ogni<br />

(x,y)∈Γ si ha (x 2 +y 2 ) 2 = x 4 +y 4 +2x 2 y 2 ≤ 2(x 4 +y 4 ) ≤ 16−12xy ≤<br />

16 + 12|xy| ≤ 16 + 6(x 2 +y 2 ), ossia ρ 4 ≤ 16 + 6ρ 2 , ossia ancora ρ ≤ 2 √ 2, dove<br />

si è posto ρ = x 2 +y 2 ; dunque la curva Γ è contenuta nel cerchio di centro (0,0)<br />

e raggio 2 √ 2. Oppure si procede così: si interseca Γ con la retta y = mx, ottenendo<br />

i punti (±x(m),±y(m)), con x(m) = 2 √ <br />

2/ 3m+ √ 8m4 +9m2 +8 e y(m) =<br />

2 √ 2m/ 3m+ √ 8m 4 +9m 2 +8, si osserva che le funzioni x(m) ed y(m), m∈IR, sono<br />

limitate, e si conclude che la curva Γ è contenuta in un rettangolo.<br />

VerificatocheΓnonhapuntisingolari,introduciamolafunzionelagrangiana L(x,y,λ)=<br />

x2 +y2 −λ(x 4 +y4 ⎧<br />

+6xy−8) ed imponiamo che ∇L(x,y,λ) = 0, ottenendo il sistema<br />

⎨x−2λx<br />

⎩<br />

3 −3λy = 0<br />

y −2λy3 −3λx = 0<br />

x4 +y4 .<br />

+6xy −8 = 0<br />

Le soluzioni del sistema sono (±1,±1, 1 1<br />

5 ) e (∓2,±2, 5 ), cosicché i punti stazionari di f<br />

vincolatiaΓsonoquattro: (±1,±1)e(∓2,±2). Poiché f(±1,±1) = 2 e f(∓2,±2) = 8,<br />

concludiamo che i punti più vicini all’origine sono (±1,±1), a distanza √ 2, e quelli più<br />

lontani sono (∓2,±2), a distanza 2 √ 2.<br />

19


Esempio F4.2. La superficie di una scatola di forma cilindrica<br />

senza coperchio ha area uguale a 12π. Determiniamo il raggio di<br />

base x e l’altezza y tali che la capacità sia massima, ritenendo<br />

certo che la scatola di capacità massima esiste e non è degenere.<br />

Poiché il volume della scatola è πx 2 y, e l’area della superficie è<br />

πx 2 +2πxy, il problema è quello di determinare i valori di x ed y<br />

che rendono massima la funzione f(x,y) = x 2 y sul vincolo<br />

Γ = {(x,y)∈IR 2 /x 2 +2xy = 12, x,y > 0}.<br />

Posto G(x,y) = x 2 +2xy −12 e osservato che ∇G(x,y) = (0,0)<br />

nei punti di Γ, si introduce L(x,y,λ) = x 2 y −λ(x 2 +2xy −12)<br />

e si calcola che (2,2) è l’unico punto stazionario di f vincolato a Γ.<br />

Si conclude che la scatola di capacità massima ha raggio di base 2<br />

ed altezza 2.<br />

Esempio F4.3. Calcoliamo i punti della curva Γ = {(x,y)∈IR 2 /x 2 +2y 2 −2xy−1 = 0<br />

x,y ≥ 0} per i quali è minima o massima la somma delle distanze dagli assi.<br />

Si tratta di calcolare i punti di minimo e di massimo su Γ della fun-<br />

zione f(x,y) = x+y. Posto Γ ∗ = {(x,y)∈Γ/x,y > 0}, si vede che<br />

Γ ∗ è l’insieme degli zeri della funzione G(x,y) = x 2 +2y 2 −2xy −1<br />

nell’aperto A = {(x,y)∈IR 2 /x,y > 0}. Appurato che Γ ∗ non ha pun-<br />

ti singolari, si introduce la funzione L(x,y,λ) = f(x,y)−λG(x,y) e<br />

si calcola che il gradiente di L è nullo in corrispondenza del punto ( 3 √ 5 , 2<br />

√ 5 ) ∈ Γ ∗ .<br />

Dal confronto dei valori che f assume nel punto trovato e negli estremi (1,0) e (0, 1 √ )<br />

2<br />

di Γ, si scopre che min f = f(0, Γ 1 √ ) =<br />

2 1 √ e max f = f(<br />

2 Γ 3 √ ,<br />

5 2 √ ) =<br />

5 √ 5.<br />

Esempio F4.4. Per calcolare gli estremi della funzione f(x,y) = y 4 − x 2 + 3y sulla<br />

curva Γ = {(x,y)∈IR 2 /x 2 = y 3 }, un metodo efficace è quello di ricondursi allafunzione<br />

F(t) = f(γ(t)) = t 8 −t 6 +3t 2 , dove γ ≡ (t 3 ,t 2 ), t∈IR. Del resto la riduzione ad una<br />

sola variabile si può ottenere anche osservando che sui punti di Γ, dove x 2 = y 3 , i valori<br />

di f sono quelli della funzione h(y) = y 4 −y 3 +3y, y∈[0,+∞[.<br />

Volendo comunque applicare il metodo dei moltiplicatori di Lagrange,<br />

si osserva che il gradiente della lagrangiana L(x,y,λ) = y 4 −x 2 +3y−<br />

λ(x 2 −y 3 ) non è mai nullo in corrispondenza dei punti di Γ, cosicché<br />

il confronto risolutivo va fatto soltanto fra il valore di f nel punto (0,0), che è singolare<br />

per Γ, e il limite di f per (x,y) tendente all’infinito su Γ, dato che Γ non è limitato.<br />

In ogni caso si conclude che min Γ f = f(0,0) = 0, che f non ha massimo su Γ e che<br />

sup f = lim Γ (x,y)→∞ f (x,y) = lim<br />

|Γ y→+∞ (y4−y 3 +3y) = +∞.<br />

20


•) Estremi di funzioni di tre variabili su vincoli unidimensionali.<br />

Siano f,G1,G2 : A → IR, con A aperto di IR 3 ed f,G1,G2 ∈C 1 (A). Considerato il<br />

G1(x,y,z) = 0<br />

vincolo Γ = {(x,y,z)∈ A/ }, anche qui ci poniamo il problema di<br />

G2(x,y,z) = 0<br />

calcolare, se esistono, gli estremi di f vincolati a Γ, ossia il min Γ f ed il max Γ f . E<br />

anche qui ricordiamo che il problema è di facile soluzione se Γ viene rappresentato come<br />

il sostegno della curva γ ≡ γ(t), t∈I, poiché in tal caso si tratta di ricercare gli estremi<br />

della funzione di una sola variabile F(t) = f(γ(t)), t∈I .<br />

Ma ora proponiamoci di determinare un metodo che coinvolga direttamente le funzioni<br />

G1 e G2. Supponiamo allora che P0 sia un punto regolare di Γ e cerchiamo una condizione<br />

necessaria affinché P0 sia punto di estremo relativo per f (punto di estremo<br />

|Γ<br />

relativo di f vincolato a Γ).<br />

E’ noto che, poiché la matrice ∂(G1,G2)<br />

∂(x,y,z) (P0) ha rango 2, il vincolo Γ è, in un intorno di<br />

P0, il sostegno di una curva regolare e semplice γ ≡ γ(t), t∈I, con I intervallo aperto<br />

di IR, e che i vettori ∇G1(P0) e ∇G2(P0) individuano il piano normale a Γ in P0.<br />

Allora, considerato t0∈I tale che γ(t0) = P0, si ha che:<br />

(P0 èpunto diestremo relativoperf )=⇒ (t0 èpunto di estremo relativoper F = f◦γ)<br />

|Γ<br />

=⇒ (F ′ (t0) = ∇f(P0)·γ ′ (t0) = 0) =⇒ (∇f(P0) è nullo o comunque normale a Γ in<br />

P0) =⇒ (∇f(P0) è nullo o comunque complanare con i vettori ∇G1(P0) e ∇G2(P0))<br />

=⇒ (∃λ0,µ0∈IR tali che ∇f(P0) = λ0∇G1(P0)+µ0∇G2(P0)).<br />

Allo scopo di esprimere in modo più agevole il risultato ottenuto, introduciamo la funzione<br />

lagrangiana associata alle funzioni f, G1 e G2, ossia la funzione L : A×IR 2 → IR<br />

definita da L(x,y,z,λ,µ)= f(x,y,z)−λG1(x,y,z)−µG2(x,y,z), con i suoi due moltiplicatori<br />

λ e µ, ed osserviamo che la condizione alla quale siamo pervenuti, unitamente<br />

alla condizione che P0∈Γ, può essere espressa nella seguente forma: ∃λ0,µ0∈IR tali<br />

che ∇L(P0,λ0,µ0) = (0,0,0,0,0).<br />

Con ciò risulta sostanzialmente dimostrato il seguente<br />

Teorema F4.2. Siano: f : A → IR e G : A → IR 2 funzioni di classe C 1 in A aperto di<br />

IR 3 , Γ = {P∈A/G(P) = 0}, P0∈Γ tale che la matrice DG(P0) abbia rango 2. Se P0<br />

è punto di estremo relativo per f |Γ , allora ∃λ0,µ0∈IR tali che ∇L(P0,λ0,µ0) = 0.<br />

Pertanto, nell’ipotesi che f e G = (G1,G2) siano di classe C 1 nell’aperto A, i punti di<br />

estremo relativo di f vincolati a Γ vanno ricercati tra i punti singolari di Γ e tra i punti<br />

P regolari di Γ tali che ∇L(P,λ,µ) sia nullo per qualche coppia di valori reali λ e µ.<br />

Questi ultimi punti sono detti punti stazionari di f vincolati a Γ, e non è garantito che<br />

essi siano necessariamente punti di estremo relativo per f |Γ .<br />

Chiaramente anche qui vale la considerazione, fatta nella sezione precedente, relativa al<br />

caso in cui f e G sono definite in E non aperto e qualche punto di Γ appartiene a ∂E.<br />

21


Esempio F4.5. Determiniamo i punti della curva Γ = {(x,y,z)∈IR 3 /2x−z +1 = 0,<br />

2x 2 +y 2 = 8} aventi distanza minima o massima dall’origine (vedi l’Esempio F3.3).<br />

Si tratta di calcolare i punti di Γ nei quali è minima o massima la funzione f(x,y,z) =<br />

x 2 + y 2 + z 2 (1) . Si osserva che Γ è limitato; infatti, per ogni (x,y,z)∈Γ si ha che<br />

|x| ≤ 1<br />

√ 2<br />

2x 2 +y 2 = 1<br />

√2<br />

√ 8 = 2, |y| ≤ 2x 2 +y 2 = √ 8, |z| ≤ 2|x|+1 ≤ 5.<br />

Considerate le funzioni G1(x,y,z) = 2x−z+1 e G2(x,y,z) = 2x 2 +y 2 −8 ed osservato<br />

che Γ non ha punti singolari, si introduce la funzione L(x,y,z,λ,µ) = f(x,y,z) −<br />

λG1(x,y,z) − µG2(x,y,z) e si calcola che ∇L è nullo in corrispondenza dei punti<br />

3 ,−1 3 ). Dal confronto dei valori di f in questi punti si<br />

evince che min f = f(− Γ 2<br />

3 ,±8 3 ,−1 23 ) = 3 3 e max f = f(2,0,5) = 29.<br />

Γ<br />

(2,0,5), (−2,0,−3), (− 2<br />

3 ,±8<br />

•) Estremi di funzioni di tre variabili su vincoli bidimensionali.<br />

L’ultimo problema che vogliamo affrontare è quello della ricerca del min Σ f e del max Σ f<br />

(estremi di f vincolati a Σ), dove f : A → IR con A aperto di IR 3 e Σ = {(x,y,z)∈A/<br />

G(x,y,z) = 0} con G : A → IR, ed inoltre f,G∈C 1 (A).<br />

Se Σ si rappresenta parametricamente mediante l’applicazione φ ≡ φ(u,v), (u,v)∈D,<br />

con D ⊆ IR 2 , allora il problema si trasferisce alla funzione F(u,v) = f(φ(u,v)), (u,v)∈<br />

D, che è funzione di due variabili. Se ad esempio D è un dominio, la risoluzione del<br />

problema dovrà passare in genere attraverso la determinazione dei punti di estremo<br />

relativo di F interni a D e dei punti di estremo relativo di F vincolati a ∂D.<br />

Ma ora cerchiamo un metodo che coinvolga direttamente la funzione G; e, a tale scopo,<br />

fissiamo P0 punto regolare di Σ e cerchiamo una condizione necessaria affinché P0 sia<br />

punto di estremo relativo per f |Σ (punto di estremo relativo di f vincolato a Σ).<br />

Poiché ∇G(P0) = (0,0,0),ilvincoloΣè, inunintornodiP0, ilsostegnodiunasuperficie<br />

regolare φ ≡ φ(u,v), (u,v)∈B, con B aperto di IR 2 ; si sa inoltre che il vettore ∇G(P0)<br />

è normale a Σ in P0 e che, considerato (u0,v0)∈B tale che φ(u0,v0) = P0, i vettori<br />

φu(u0,v0) e φv(u0,v0) individuano il piano tangente a Σ in P0. Ne segue che:<br />

(P0 èpunto diestremo relativoper f |Σ )=⇒ ((u0,v0)èpunto diestremo relativoper F =<br />

f◦φ) =⇒ (Fu(u0,v0) = ∇f(P0)·φu(u0,v0) = 0 e Fv(u0,v0) = ∇f(P0)·φv(u0,v0) = 0)<br />

=⇒ (∇f(P0) è nullo o comunque normale a Σ in P0) =⇒ (∇f(P0) è nullo o comunque<br />

parallelo al vettore ∇G(P0)) =⇒ (∃λ0∈IR tale che ∇f(P0) = λ0∇G(P0)).<br />

(1) In verità la distanza dall’origine sarebbe x 2 +y 2 +z 2 , ma è noto che √ t è minima o<br />

massima quando il valore di t è rispett/te minimo o massimo.<br />

22


Introduciamo ora la funzione lagrangiana associata alle funzioni f e G, L : A×IR →<br />

IR, definita da L(x,y,z,λ) = f(x,y,z) − λG(x,y,z), con il suo moltiplicatore λ, ed<br />

osserviamo che la condizione alla quale siamo pervenuti, unitamente alla condizione che<br />

P0∈Σ, può essere espressa nella forma: ∃λ0∈IR tale che ∇L(P0,λ0) = (0,0,0,0).<br />

Sussiste pertanto il seguente<br />

Teorema F4.6. Siano f,G : A → IR, con A aperto di IR 3 ed f,G ∈ C 1 (A); sia<br />

Σ = {P∈A/G(P) = 0}; sia infine P0∈Σ, con ∇G(P0) = 0. Se P0 è punto di estremo<br />

relativo per f |Σ , allora ∃λ0∈IR tale che ∇L(P0,λ0) = 0.<br />

Pertanto si conclude che, nell’ipotesi che f e G siano di classe C 1 nell’aperto A, i punti<br />

di estremo relativo di f vincolati a Σ vanno ricercati fra i punti singolari di Σ e i punti<br />

P regolari di Σ tali che ∇L(P,λ) sia nullo per qualche λ∈IR. Questi ultimi punti si<br />

dicono punti stazionari di f vincolati a Σ, e non è detto che essi siano necessariamente<br />

punti di estremo relativo per f |Σ .<br />

Chiaramente anche qui vale la considerazione, fatta nelle sezioni precedenti, relativa al<br />

caso in cui f e G sono definite in E non aperto e qualche punto di Σ appartiene a ∂E.<br />

Esempio F4.6. Determiniamo i punti della superficie Σ = {(x,y,z)∈IR 3 /2x−z+1 =<br />

0, 2x 2 +y 2 ≤ 8} aventi distanza minima o massima dall’origine. In sostanza si tratta di<br />

calcolare i punti di Σ nei quali è massima o minima la funzione f(x,y,z) = x 2 +y 2 +z 2 .<br />

Posto Σ ∗ = {(x,y,z) ∈ Σ/2x 2 + y 2 < 8}, si vede che Σ ∗ è l’insieme degli zeri di<br />

G(x,y,z) = 2x−z +1 nell’aperto A = {(x,y,z)∈IR 3 /2x 2 +y 2 < 8}.<br />

Introdotta la funzione L(x,y,z,λ) = f(x,y,z)−λG(x,y,z), si trova<br />

che il gradiente di L è nullo in corrispondenza del punto (−2 1 ,0, 5 5 ).<br />

Detto Γ il bordo di Σ, Γ = Σ\Σ ∗ , si sa (dall’Esempio F4.5) che i pun-<br />

ti stazionari di f vincolati a Γ sono (2,0,5), (−2,0,−3), (− 2<br />

3 ,±8<br />

3 ,−1<br />

3 ).<br />

Dal confronto dei valori di f nei punti trovati si scopre che min Σ f = f(− 2<br />

5<br />

max Σf = f(2,0,5)= 29.<br />

1 1 ,0, 5 ) = 5 e<br />

Esempio F4.7. Calcoliamo minimo e massimo della funzione f(x,y,z) = x+y −2z<br />

sulla superficie Σ = {(x,y,z)∈IR 3 /x 2 +y 2 +z 2 = 6, x,y,z ≥ 0}.<br />

Dapprima si lavora sul vincolo Σ ∗ = {(x,y,z)∈Σ/x,y,z > 0}, che è<br />

la superficie assegnata privata del bordo: introdotta la lagrangiana<br />

L(x,y,z,λ) = x+y −2z −λ(x 2 +y 2 +z 2 −6), si scopre che non esistono<br />

punti stazionari vincolati a Σ ∗ .<br />

Si considera poi Γ ∗ 1 = {(x,y,z)∈Σ/z = 0, x,y > 0}, che è una parte del bordo di Σ.<br />

Ma qui il problema si può ridurre alle sole variabili x ed y: trovare i punti stazionari di<br />

f1(x,y) := f(x,y,0) vincolati a ζ ∗ 1 = {(x,y)∈IR 2 /x 2 +y 2 = 6, x,y > 0}. Introdotta<br />

la lagrangiana L(x,y,λ) = x+y −λ(x 2 +y 2 −6), si trova il punto ( √ 3, √ 3,0).<br />

23


In modo analogo si lavora su Γ ∗ 2 = {(x,y,z)∈Σ/y = 0, x,z > 0} e su Γ ∗ 3 = {(x,y,z)∈<br />

Σ/x = 0, y,z > 0}. Su queste curve non si trovano punti stazionari vincolati.<br />

Confrontando tra loro i valori che f assume nel punto trovato ( √ 3, √ 3,0) e nei vertici<br />

( √ 6,0,0), (0, √ 6,0) e (0,0, √ 6), si evince che min Σ f = f(0,0, √ 6) = −2 √ 6 e max Σ f =<br />

f( √ 3, √ 3,0) = 2 √ 3.<br />

Esempio F4.8. Calcoliamo il minimo ed il massimo della funzione f(x,y,z) = z−x 2 y<br />

nell’insieme Ω = {(x,y,z)∈IR 3 /z ≥ x 2 +y 2 , x 2 +y 2 +z 2 ≤ 2} (vedi l’Esempio F3.5).<br />

<strong>Il</strong>teoremadi Weierstrassgarantiscel’esistenza degliestremi richiesti. Inoltreosserviamo<br />

che Ω è un vincolo di disuguaglianza, ossia un sottoinsieme di IR 3 avente interno non<br />

vuoto. Pertanto la risoluzione del problema va divisa nelle seguenti parti:<br />

a) ricerca dei punti stazionari di f interni ad Ω: si impone che<br />

∇f(x,y,z) = (0,0,0), e non si trova nessuna soluzione;<br />

b) ricerca dei punti stazionari di f vincolati alla superficie<br />

Σ1 = {(x,y,z)∈IR 3 /z = x 2 +y 2 , x 2 +y 2 < 1}: si impone<br />

che ∇L(x,y,z,λ) = (0,0,0,0), con L(x,y,z,λ) = f(x,y,z)−<br />

λ(x 2 +y 2 −z), e si trova il punto (0,0,0);<br />

c) ricerca dei punti stazionari di f vincolati alla superficie Σ2 = {(x,y,z)∈IR 3 /x 2 +<br />

y 2 + z 2 = 2, z > 1}: si impone che ∇L(x,y,z,λ) = (0,0,0,0), con L(x,y,z,λ) =<br />

f(x,y,z)−λ(x 2 +y 2 +z 2 −2), e si trovano i punti (0,0, √ 2) e (±1/ √ 3,−1/ √ 6, √ 6/2);<br />

d) ricerca dei punti stazionari di f vincolati alla curva Γ = {(x,y,z)∈IR 3 /x 2 +y 2 =<br />

1, z = 1}, che è il bordo comune a Σ1 e Σ2: si impone che ∇L(x,y,z,λ,µ) =<br />

(0,0,0,0,0), con L(x,y,z,λ,µ) = f(x,y,z)−λ(x 2 +y 2 −1)−µ(z−1), e si trovano i<br />

punti (0,±1,1), (± 2/3,− 1/3,1) e (± 2/3, 1/3,1).<br />

Osservato che ∂Ω = Σ1 ∪ Σ2 ∪ Γ, concludiamo che gli estremi di f in Ω sono dati<br />

rispettivamentedalpiùpiccoloedalpiùgrandedei valoridi f nei punti cosìdeterminati,<br />

e sono: min Ωf = 0 = f(0,0,0) e max Ωf = √ 2 = f(0,0, √ 2).<br />

•) <strong>Il</strong> teorema dei moltiplicatori di Lagrange nel caso generale.<br />

I tre teoremi trattati nei paragrafi precedenti possono essere interpretati come casi<br />

particolari del teorema che segue, riferito ad una funzione di m variabili su un vincolo<br />

(m−k)–dimensionale contenuto in IR m , con k,m∈IN, k < m.<br />

Teorema F4.4 (dei moltiplicatori di Lagrange). Sia A un aperto di IR m e siano<br />

f ∈ C 1 (A,IR), e G ∈ C 1 (A,IR k ), con 1 ≤ k < m. Sia Γ = {P ∈A/G(P) = 0} e sia<br />

P0∈Γ tale che la matrice DG(P0) abbia rango k. Se P0 è punto di estremo relativo per<br />

f |Γ ,allora,consideratalafunzione L : A×IR k → IR definitada L(P,Λ) = f(P)−Λ·G(P),<br />

esiste Λ0∈IR k tale che ∇L(P0,Λ0) = 0.<br />

24

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!