04.06.2013 Views

F FUNZIONI IMPLICITE MASSIMI E MINIMI VINCOLATI F1. Il ...

F FUNZIONI IMPLICITE MASSIMI E MINIMI VINCOLATI F1. Il ...

F FUNZIONI IMPLICITE MASSIMI E MINIMI VINCOLATI F1. Il ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

F<br />

<strong>FUNZIONI</strong> <strong>IMPLICITE</strong><br />

<strong>MASSIMI</strong> E <strong>MINIMI</strong> <strong>VINCOLATI</strong><br />

(C. De Mitri)<br />

<strong>F1.</strong> <strong>Il</strong> problema della funzione implicita e il teorema del Dini<br />

Considerata l’equazione G(x,y) = 0, dove G è una funzione reale definita in un aperto<br />

A di IR 2 , per molteragioni può tornareutileesprimere una delle due variabiliinfunzione<br />

dell’altra, ad esempio la y in funzione della x. Per questo motivo ci domandiamo sotto<br />

quali condizioni si può star certi che esiste una funzione g, reale di una variabile reale,<br />

tale che l’equazione data sia equivalente all’equazione y = g(x) (1) .<br />

In altritermini, considerato l’insieme Γ = {(x,y)∈A/G(x,y)= 0}, che spesso, sia pure<br />

impropriamente, chiameremo “curva” di equazione G(x,y) = 0 (2) , vogliamo stabilire<br />

in quali casi esso è il grafico di una funzione della variabile x.<br />

Osserviamo che il luogo Γ è il cosiddetto “insieme di livello 0” della funzione G, e<br />

che le proprietà che stabiliremo per Γ saranno valide anche per l’“insieme di livello c”,<br />

Γc = {(x,y)∈A/G(x,y)= c}, qualunque sia c∈IR; infatti il luogo Γc è l’insieme di<br />

livello 0 della funzione G(x,y)−c, la quale ha appunto le stesse proprietà di G.<br />

Consideriamo ad esempio l’equazione x 2 + y 2 − 1 = 0. In questo caso la curva Γ è<br />

la circonferenza di centro (0,0) e raggio 1, la quale, considerata globalmente, non è il<br />

grafico di nessuna funzione del tipo y = g(x). Con ciò è appurato che, se pretendiamo<br />

una risoluzione a carattere globale, dobbiamo aspettarci qualche insuccesso anche in<br />

casi in cui la funzione G è un semplice polinomio di 2 o grado.<br />

Diverso è il risultato se l’approccio al problema è di tipo locale.<br />

Infatti, facendo ancora riferimento alla circonferenza, si vede che<br />

quasi ogni suo punto (x0,y0) (vanno esclusi solo i punti (±1,0))<br />

ammette un intorno I×J nel quale Γ è il grafico di una funzione<br />

y = g(x), nel senso che ∀x ∈ I ∃!y =: g(x) ∈ J tale che (x,y) ∈ Γ. Ciò si esprime<br />

dicendo che l’equazione G(x,y) = 0 definisce implic/te una funzione da I in J, oppure<br />

che la funzione y = g(x) è implic/te definita dall’equazione G(x,y) = 0 in I×J.<br />

(1) <strong>Il</strong> problema non è quello di determinare la funzione g, ma solo quello di stabilire se essa<br />

esiste. Un esempio che mostra la differenza fra i due problemi è rappresentato dall’equazione<br />

x−y−e y = 0: qui la funzione g esiste senz’altro (è l’inversa della funzione y → y+e y , che<br />

è invertibile), ma non la si può esplicitare sotto forma di espressione elementare.<br />

(2) <strong>Il</strong> fatto che il termine curva sia spesso inadeguato è provato da casi come i seguenti: x 2 +<br />

y 2 +1 = 0, (x 2 +y 2 )(y−1) = 0, (x−y)(x−y+1) = 0, |x|+|x−1|+|y|+|y−1|−2 = 0.<br />

1


Allo scopo di dare la massima generalità al problema in esame, facciamo un passo avanti<br />

e osserviamo che, se l’equazione è G(x,y,z) = 0, che rappresenta una “superficie” in<br />

IR 3 , si tratta di stabilire sotto quali condizioni è possibile, almeno sul piano teorico,<br />

esprimere una variabile in funzione delle altre due, ad esempio la variabile z in funzione<br />

delle variabili x ed y: z = g(x,y).<br />

<br />

G1(x,y,z) = 0<br />

Ed ancora, se l’equazione, o meglio il sistema è , che rappresenta una<br />

G2(x,y,z) = 0<br />

“curva” in IR 3 , il problemaè quello di poter esprimere ad esempio le variabili y e z in<br />

y = g1(x)<br />

funzione della variabile x:<br />

z = g2(x) .<br />

Si può allora concludere che, in generale, il problema è quello di passare dal sistema (1)<br />

⎧<br />

G1(x1,x2,...,xn,y1,y2,...,yk) = 0<br />

⎪⎨ G2(x1,x2,...,xn,y1,y2,...,yk) = 0<br />

⎧<br />

y1 = g1(x1,x2,...,xn)<br />

⎪⎨ y2 = g2(x1,x2,...,xn)<br />

····································<br />

⎪⎩ ····································<br />

Gk(x1,x2,...,xn,y1,y2,...,yk) = 0<br />

al sistema ····················· .<br />

⎪⎩ ·····················<br />

yk = gk(x1,x2,...,xn)<br />

<strong>Il</strong> teorema che segue riguarda appunto il problema nella sua forma più generale, riferi-<br />

to cioè ad una funzione G a k componenti di n+k variabili. Per maggiore semplicità<br />

useremo le notazioni: x = (x1,x2,...,xn), y = (y1,y2,...,yk), ∂G<br />

∂G<br />

∂y<br />

= ∂(G1,G2,...,Gk)<br />

∂(y1,y2,...,yk)<br />

; in sostanza ∂G<br />

∂x<br />

e ∂G<br />

∂y<br />

parte destra della matrice jacobiana di G, DG =<br />

∂G<br />

∂y<br />

∂x<br />

= ∂(G1,G2,...,Gk)<br />

∂(x1,x2,...,xn) ,<br />

sono rispettivamente la parte sinistra e la<br />

∂G<br />

∂x<br />

| ∂G<br />

∂y<br />

è quadrata, e quindi se ne potrà considerare il determinante |∂G<br />

∂y |.<br />

Possiamo fin da ora prevedere che nel teorema il determinante di ∂G<br />

∂y<br />

<br />

. Da notare che la matrice<br />

avrà un ruolo<br />

fondamentale. Infattiosserviamocheuncaso particolarenotevoledelproblema inesame<br />

si ha quando G(x,y) = M y − H(x), ossia quando il sistema è M y = H(x), con H<br />

funzione a k componenti definita in un aperto X di IR n , ed M matricequadrata d’ordine<br />

k: in tal caso risulta ∂G<br />

∂y<br />

= M, ed è noto (teorema di Cramer) che, se detM = 0, allora<br />

∀x∈X il sistema ammette una ed una sola soluzione y∈IR k . Evidentemente questo è<br />

uno dei casi in cui il problema ha esito positivo anche da un punto di vista globale.<br />

Teorema <strong>F1.</strong>1 (del Dini). Sia G : A → IR k , con A aperto di IR n+k e G∈C 1 (A). Sia<br />

(x0,y0)∈A con G(x0,y0) = 0. Se | ∂G<br />

∂y (x0,y0)| = 0, allora ∃I∈I(x0) ed ∃J∈I(y0),<br />

con I×J ⊆ A, tali che ∀x∈I ∃!y =: g(x)∈J tale che G(x,y) = 0, ossia tali (gli<br />

intorni I e J) che ∃!g : I → J tale che ∀x∈I G(x,g(x)) = 0. Inoltre g(x0) = y0.<br />

Infine g∈C 1 (I) e ∀x∈I Dg(x) = −[ ∂G<br />

∂y (x,g(x))]−1 · ∂G<br />

∂x (x,g(x)).<br />

(1) <strong>Il</strong> sistema rappresenta una varietà n–dimensionale in IR n+k , che si chiama anche curva nel<br />

caso n = 1 e ipersuperficie nel caso k = 1.<br />

2


•) <strong>Il</strong> caso delle equazioni in due variabili.<br />

Analizziamo più da vicino il caso n = k = 1, ossia quello dell’equazione G(x,y) = 0,<br />

con G funzione reale di due variabili reali.<br />

Teorema <strong>F1.</strong>2. Sia G : A → IR, con A aperto di IR 2 e G∈C 1 (A). Sia (x0,y0)∈A<br />

con G(x0,y0) = 0. Se Gy(x0,y0) = 0, allora ∃I∈I(x0) ed ∃J∈I(y0), con I×J ⊆ A,<br />

tali che ∀x∈I ∃!y =: g(x)∈J tale che G(x,y) = 0, ossia tali (gli intorni I e J) che<br />

∃!g : I → J tale che ∀x∈I G(x,g(x)) = 0. Inoltre g(x0) = y0. Infine g∈C 1 (I) e<br />

∀x∈I g ′ (x) = − Gx(x,g(x))<br />

Gy(x,g(x)) .<br />

Dim. Supponiamo Gy(x0,y0) > 0. Dal teorema della permanenza del segno applicato<br />

alla funzione Gy segue che ∃σ∈IR + tale che Qσ := [x0−σ, x0+σ]×[y0−σ, y0+σ] ⊆ A<br />

e ∀(x,y)∈Qσ Gy(x,y) > 0. Ne discende che, ∀x∈[x0−σ, x0+σ], la funzione G(x,·)<br />

è strett/te crescente in [y0−σ, y0+σ]. Ciò vale in particolare per la funzione G(x0,·),<br />

cosicché risulta G(x0,y0−σ) < G(x0,y0) < G(x0,y0+σ), ossia G(x0,y0−σ) < 0 e<br />

G(x0,y0+σ) > 0. Per il teorema della permanenza del segno applicato alla funzione G,<br />

∃δ(≤ σ)∈IR + tale che ∀x∈]x0−δ, x0+δ[ risulta<br />

G(x,y0−σ) < 0 e G(x,y0+σ) > 0. Allora, per ogni<br />

x∈]x0−δ, x0+δ[, per il teorema degli zeri applicato<br />

alla funzione G(x,·) e per la iniettività della stessa,<br />

∃!y =: g(x)∈]y0−σ, y0+σ[ tale che G(x,y) = 0.<br />

Con ciò è provata la prima parte della tesi, ove si<br />

assumano I =]x0−δ, x0+δ[ e J =]y0−σ, y0+σ[.<br />

Per costruzione risulta g(x0) = y0.<br />

Fissato x∈I, proviamoche ∃g ′ (x) = − Gx(x,g(x))<br />

Gy(x,g(x)) ; eatalescopo prendiamo h ∈ IR\{0}<br />

tale che x+h∈I. Per il teorema di Lagrange in due variabili, esiste (ξ,η) interno al<br />

segmento di estremi (x,g(x)) e (x+h,g(x+h)) tale che G(x+h,g(x+h))−G(x,g(x)) =<br />

Gx(ξ,η)h+Gy(ξ,η)(g(x+h)−g(x));ed’altraparte, percomeèdefinita g, sihache G(x+<br />

h,g(x+h))−G(x,g(x)) = 0−0 = 0. Nesegue, essendo Gy(ξ,η) = 0, che g(x+h)−g(x) =<br />

− Gx(ξ,η)<br />

h. Unaprimaconseguenza diquestauguaglianzaècherisulta |g(x+h)−g(x)| ≤<br />

Gy(ξ,η)<br />

max |Gx|<br />

I×J<br />

min I×J |Gy|<br />

|h|; da quisegueche g(x+h)−→ g(x), ossiache g ècontinua inx(cosicchég è<br />

h→0<br />

continua in I, data l’arbitrarietà di x), e ciò implica a sua volta che (ξ,η)−→ (x,g(x)),<br />

h→0<br />

dato che |ξ − x| < |h| e |η − g(x)| < |g(x + h) − g(x)|. Una seconda conseguenza<br />

dell’uguaglianza stabilita è che g(x+h)−g(x)<br />

= − Gx(ξ,η)<br />

, da cui discende, grazie anche<br />

alla continuità di Gx e Gy, che lim<br />

h→0<br />

h<br />

g(x+h)−g(x)<br />

h<br />

Con ciò è provato che ∀x∈I ∃g ′ (x) = − Gx(x,g(x))<br />

Gy(x,g(x))<br />

Gx, Gy e g, che g ′ ∈C 0 (I), ossia che g∈C 1 (I)<br />

3<br />

Gy(ξ,η)<br />

= lim (−<br />

h→0 Gx(ξ,η)<br />

Gy(ξ,η) ) = −Gx(x,g(x))<br />

Gy(x,g(x)) .<br />

, e da qui segue, per la continuità di


Esempio <strong>F1.</strong>1. Riprendiamo in esame l’equazione x 2 +y 2 −1 = 0. Posto G(x,y) =<br />

x 2 + y 2 − 1, si calcola che Gy(x,y) = 2y. Allora ogni punto (x0,y0) della curva Γ =<br />

{(x,y)∈IR 2 /x 2 + y 2 − 1 = 0}, con l’eccezione al più dei punti (±1,0), ammette un<br />

intorno nel quale Γ è grafico di una funzione y = g(x). La funzione in questo caso è<br />

anche facilmente esplicitabile, ed è y = √ 1−x 2 se y0 > 0, y = − √ 1−x 2 se y0 < 0.<br />

Invece nei punti (±1,0) l’ipotesi sulla Gy non è soddisfatta, e quindi il teorema è inapplicabile.<br />

Tuttavia risulta Gx(±1,0) = 0, sicché il teorema può essere applicato a<br />

variabili scambiate: ciascuno di questi punti ammette un intorno in cui Γ è grafico di<br />

una funzione x = h(y) (che è poi x = 1−y 2 per (1,0)e x = − 1−y 2 per (−1,0)).<br />

-) Come suggerito nel precedente esempio, scambiando il ruolo delle variabili si può<br />

dire che, se Gx(x0,y0) = 0, allora l’equazione G(x,y) = 0 definisce implicitamente una<br />

funzione x = h(y) di classe C 1 in un intorno di y0, avente derivata h ′ (y) = − Gy(h(y),y)<br />

Gx(h(y),y) .<br />

Riunendo i due casi trattati ne deduciamo che, posto Γ = {(x,y)∈A/G(x,y) = 0} e<br />

preso P0 = (x0,y0)∈Γ, se ∇G(P0) = (0,0), allora esiste un intorno di P0 in cui Γ è<br />

grafico di una funzione di classe C 1 del tipo y = g(x) o x = h(y), e quindi in ogni caso<br />

è sostegno di una curva regolare e semplice. Inoltre, la tangente a Γ in P0 ha equazione<br />

Gx(P0)(x−x0)+Gy(P0)(y −y0) = 0. Infatti, se la curva è del tipo y = g(x), è noto<br />

che la tangente è y = g(x0)+g ′ (x0)(x−x0), e da qui si passa alla<br />

equazione suddetta ricordando che g(x0) = y0 e g ′ (x0) = − Gx(P0)<br />

Gy(P0) ;<br />

e allo stesso risultato si arriva se si scambiano fra loro le variabili x<br />

ed y. Ponendo P = (x,y), l’equazione della tangente può mettersi<br />

nella forma ∇G(P0)·(P −P0) = 0, da cui si deduce che il vettore<br />

∇G(P0) è normale alla tangente, e quindi alla curva, nel punto P0.<br />

I punti P0 ∈Γ tali che ∇G(P0) = (0,0) si dicono punti regolari di Γ. Invece i punti<br />

P0∈Γ tali che ∇G(P0) = (0,0) si dicono punti singolari di Γ (relativamente a G): per<br />

essi non è garantita l’esistenza di un intorno nel quale Γ è il grafico di una funzione.<br />

-) Considerato un qualunque punto P0∈A con ∇G(P0) = (0,0), sapevamo già che la<br />

direzione del vettore ∇G(P0) è quella lungo la quale si ha il massimo incremento della<br />

funzione G. Ora abbiamo appreso in più che, se G(P0) = 0, se cioè P0 ∈Γ, che è la<br />

curva di livello 0 di G, allora ∇G(P0) è normale a Γ in P0.<br />

Più in generale, qualunque sia il valore G(P0), per P0 passa comunque una delle curve<br />

di livello di G, precisamente la curva Γc con c = G(P0). Se ∇G(P0) = (0,0), la curva<br />

Γc è regolare e semplice nell’intorno di P0, con tangente di equazione Gx(P0)(x−x0)+<br />

Gy(P0)(y−y0) = 0, eilvettore∇G(P0)ènormaleaΓc inP0. InfattiΓc nonèchelacurva<br />

di livello 0 della funzione H(P) = G(P)−c, per la quale risulta ∇H(P0) = ∇G(P0).<br />

Le curve Γc non sono altro che le curve equipotenziali del campo gradiente ∇G, così<br />

chiamate perché su ciacuna di esse il potenziale G è costante. In base a quanto stabilito,<br />

possiamo affermare che ogni campo gradiente risulta, in ogni punto in cui non è nullo,<br />

normale alla linea equipotenziale passante per quel punto.<br />

4


-) Se le ipotesi del teorema sono soddisfatte, e in particolare risulta Gy(x0,y0) = 0, così<br />

da esser certi che la funzione implicita y = g(x) esiste ed è di classe C 1 in un intorno di<br />

x0, la sua derivata y ′ può essere calcolata direttamente dall’uguaglianza G(x,y) = 0,<br />

ove si pensi y funzione di x. Si ricava infatti, grazie al teorema di derivazione della<br />

funzione composta, che Gx(x,y)+Gy(x,y)y ′ = 0, ossia appunto che y ′ = − Gx(x,y)<br />

Gy(x,y) .<br />

Dalla formula dimostrata g ′ (x) = − Gx(x,g(x))<br />

Gy(x,g(x)) , se ci si mette nell’ipotesi più forte che<br />

G∈C 2 (A), si deduce che g∈C 2 (I), e, a conti fatti, che<br />

g ′′ (x) = −<br />

2<br />

2<br />

Gxx(x,g(x))Gy (x,g(x))−2Gxy(x,g(x))Gx(x,g(x))Gy(x,g(x))+Gyy(x,g(x))G x (x,g(x))<br />

G3 y (x,g(x))<br />

.<br />

Ciò fa capire come sia possibile dimostrare, ragionando per induzione, che, ∀h∈IN, da<br />

G∈C h (A) segue che g∈C h (I), e che la derivata h-esima di g nel punto x è esprimibile<br />

in funzione delle derivate parziali fino all’ordine h di G nel punto (x,g(x)).<br />

La conoscenza delle derivate di g in x0, ricavate dalle derivate parziali di G in (x0,y0),<br />

consente di ricavare lo sviluppo di Taylor di g di punto iniziale x0; cosicché la funzione<br />

implicita, che spesso non è concretamente esplicitabile, potrà comunque essere<br />

conosciuta con una certa approssimazione in prossimità del punto x0.<br />

Esempio <strong>F1.</strong>2. Siano l’equazione xe y −y = 0 e, per cominciare, il punto (0,0).<br />

Posto G(x,y) = xe y −y, si vede che G∈C ∞ (IR 2 ), che G(0,0) = 0 eche Gy(0,0) = −1.<br />

Pertanto l’equazione definisce implicitamente in un intorno di (0,0)<br />

una funzione y = y(x), che è di classe C ∞ in un intorno del punto 0.<br />

E’ noto che y(0) = 0. Derivando rispetto ad x ambo i membri dell’equazione<br />

assegnata, dove si pensi y dipendente da x, si ricava che<br />

e y +xe y y ′ −y ′ = 0; da qui, ponendo x = 0 e y = 0, si deduce che<br />

y ′ (0) = 1. Derivando ulteriormente, sempre rispetto ad x, si trova<br />

che 2e y y ′ +xe y (y ′ ) 2 +xe y y ′′ −y ′′ = 0, e da qui, ponendo x = 0,<br />

y = 0 e y ′ = 1, si ottiene che y ′′ (0) = 2. Pertanto: y(x) = x+x 2 +o(x 2 ) per x → 0.<br />

Passiamo ora ad analizzare gli altri punti della curva Γ = {(x,y)∈IR 2 /G(x,y) = 0}.<br />

<br />

G(x,y) = 0<br />

Risolvendo il sistema<br />

Gy(x,y) = 0 , si trova che (e−1 ,1) è l’unico punto della curva<br />

nel quale il teorema<br />

<br />

del Dini è inapplicabile allo scopo di esprimere y in funzione di x.<br />

G(x,y) = 0<br />

Invece il sistema non ammette soluzioni, cosicché ogni punto della curva<br />

Gx(x,y) = 0<br />

possiede un intorno nel quale la stessa è grafico di una funzione di classe C1 del tipo<br />

x = x(y). Si riconosce anzi che in questo caso la curva Γ è anche globalmente grafico di<br />

una funzione della y, essendo Γ = {(x,y)∈IR 2 /x = ye−y } (1) .<br />

(1) Può capitareche un’intera curvasialocalmentegrafico di funzioni ad esempiodellavariabile<br />

y, senza che la stessa sia globalmente grafico di una funzione della variabile y; si pensi alla<br />

curva di equazione (x−y)(x−y +1) = 0.<br />

6


Esempio <strong>F1.</strong>3. Cosideriamo la curva Γ di equazione x 2 (x+1)−y 2 = 0.<br />

Posto G(x,y) = x2 (x + 1) − y2 , si vede che i punti (x,y) di Γ tali che Gy(x,y) = 0<br />

sono (0,0) e (−1,0), mentre i punti tali che Gx(x,y) = 0 sono (0,0) e (−2 2 ,± 3 3 √ 3 ).<br />

Ne consegue che (0,0) è l’unico punto singolare di Γ. Si può provare che<br />

non esiste alcun intorno del punto (0,0) nel quale Γ è grafico di una funzione<br />

della variabile x o della variabile y. In effetti, pur senza voler entrare<br />

nei dettagli, avvertiamo che, con l’aiuto delle derivate successive della<br />

funzione G in (0,0), questo punto singolare viene classificato come “nodo”,<br />

o “punto doppio a tangenti distinte”, dove con il termine “tangenti” in un simile punto<br />

P0 = (x0,y0) ci si riferisce alle due rette le cui equazioni si ottengono spezzando<br />

l’equazione Gxx(P0)(x − x0) 2 + 2Gxy(P0)(x − x0)(y − y0) + Gyy(P0)(y − y0) 2 = 0.<br />

Nel caso di questo esempio, l’equazione è 2x2 −2y2 = 0, ossia y = ±x.<br />

Esempio <strong>F1.</strong>4. <strong>Il</strong>punto (0,0)èsingolareanche per lacurva Γdi equazione x 2 −y 3 = 0.<br />

Tuttavia l’equazione può essere scritta, anche globalmente, nella forma<br />

y = g(x): risulta infatti Γ = {(x,y)∈IR 2 /y = 3√ x 2 }, dove però la<br />

funzione y = 3√ x 2 non è di classe C 1 in alcun intorno del punto 0.<br />

<strong>Il</strong> punto singolare (0,0) viene classificato come “punto cuspidale”.<br />

Qui l’equazione Gxx(P0)(x−x0) 2 +2Gxy(P0)(x−x0)(y −y0)+Gyy(P0)(y −y0) 2 = 0,<br />

di cui s’è detto nell’esempio precedente, è 2x 2 = 0, cosicché nel punto (0,0) si hanno<br />

due “tangenti” coincidenti, di equazione x = 0.<br />

Esempio <strong>F1.</strong>5. Consideriamo la curva Γ di equazione x3 +xy2−x 2−y 2 = 0.<br />

Posto G(x,y) = x3 +xy2−x 2−y 2 ⎧<br />

⎨G(x,y)<br />

= 0<br />

, si vede che il sistema Gy(x,y) = 0<br />

⎩<br />

Gx(x,y) = 0<br />

ammette come unica soluzione il punto (0,0), che dunque è l’unico punto<br />

singolare di Γ. Si riconosce che l’equazione può mettersi nella forma<br />

(x 2 +y 2 )(x−1) = 0, che si spezza in x 2 +y 2 = 0 e x−1 = 0; pertanto<br />

Γ è costituita dal punto (0,0) e dalla retta x = 1.<br />

<strong>Il</strong> punto singolare (0,0) viene classificato come “punto isolato”.<br />

Esempio <strong>F1.</strong>6. Interessante è il caso della funzione G(x,y) = (x 2 +y 2 −1) 2 .<br />

Si vede che, ∀(x,y)∈Γ, dove Γ è il luogo degli zeri di G, risulta ∇G(x,y) = (0,0),<br />

cosicché tutti i punti di Γ sono singolari relativamente a G. Eppure, in un opportuno<br />

intorno di ciascuno di essi, la curva Γ, che è la stessa circonferenza dell’Esempio <strong>F1.</strong>1,<br />

è grafico di una funzione di classe C 1 del tipo y = g(x) o x = h(y).<br />

Con ciò è evidenziato il fatto che il teorema del Dini stabilisce una condizione soltanto<br />

sufficiente e non anche necessaria per l’esistenza e la regolarità della funzione implicita.<br />

7


•) <strong>Il</strong> caso delle equazioni in tre variabili.<br />

Approfondiamo ora il caso n = 2, k = 1, ossia quello dell’equazione G(x,y,z) = 0, in<br />

ordine alla possibilità di esprimere z in funzione di x e di y.<br />

Teorema <strong>F1.</strong>3. Sia G : A → IR, con A aperto di IR 3 e G∈C 1 (A). Sia (x0,y0,z0)∈A<br />

con G(x0,y0,z0) = 0. Se Gz(x0,y0,z0) = 0, allora ∃I ∈ I(x0,y0) ed ∃J ∈ I(z0),<br />

con I×J ⊆ A, tali che ∀(x,y)∈I ∃!z =: g(x,y)∈J tale che G(x,y,z) = 0, ossia<br />

tali (gli intorni I e J) che ∃!g : I → J tale che ∀(x,y) ∈ I G(x,y,g(x,y)) = 0.<br />

Inoltre g(x0,y0) = z0. Infine g ∈ C 1 (I) e, ∀(x,y)∈I, gx(x,y) = − Gx(x,y,g(x,y))<br />

Gz(x,y,g(x,y)) e<br />

gy(x,y) = − Gy(x,y,g(x,y))<br />

Gz(x,y,g(x,y)) .<br />

Osserviamo che, se le ipotesi del teorema sono soddisfatte, le derivate parziali gx e gy<br />

possono essere calcolate direttamente dall’uguaglianza G(x,y,z) = 0, nella quale si<br />

pensi z dipendente da x e da y, ossia appunto z = g(x,y). Si ricava infatti, derivando<br />

amboimembriprimarispettoadxepoirispettoady,che Gx(x,y,z)+Gz(x,y,z)zx = 0<br />

e che Gy(x,y,z)+Gz(x,y,z)zy = 0, da cui si passa rispettivamente a zx = − Gx(x,y,z)<br />

Gz(x,y,z)<br />

ed a zy = − Gy(x,y,z)<br />

, in sostanziale accordo con le formule presentate nel teorema.<br />

Gz(x,y,z)<br />

<strong>Il</strong> teorema stabilisce in sostanza che, posto Σ = {(x,y,z)∈A/G(x,y,z) = 0}, che è la<br />

“superficiedilivello0”dellafunzioneG, econsiderato P0 = (x0,y0,z0)∈Σ, se Gz(P0) =<br />

0, allora l’insieme Σ è, in un intorno di P0, il grafico di una funzione di classe C 1 del tipo<br />

z = g(x,y). Analogamente, serisulta Gy(P0) = 0 o Gx(P0) = 0,alloraΣè, nell’intorno<br />

di P0, il grafico di una funzione di classe C1 rispettivamente del tipo y = h(x,z) e<br />

x = l(y,z), le cui derivate parziali son date dalle formule: hx(x,z) = − Gx(x,h(x,z),z)<br />

Gy(x,h(x,z),z) ,<br />

hz(x,z) = − Gz(x,h(x,z),z)<br />

Gy(x,h(x,z),z) , ly(y,z) = − Gy(l(y,z),y,z)<br />

Gx(l(y,z),y,z) , lz(y,z) = − Gz(l(y,z),y,z)<br />

Gx(l(y,z),y,z) .<br />

Pertanto, se ∇G(P0) = (0,0,0), allora l’insieme Σ è, in un intorno di P0, il sostegno di<br />

una superficie regolare. <strong>Il</strong> piano tangente a questa superficie nel punto P0 ha equazione<br />

Gx(P0)(x−x0)+Gy(P0)(y−y0)+Gz(P0)(z−z0) = 0. Infatti, se ad esempio la superficie<br />

si rappresenta nella forma z = g(x,y), è noto che il piano tangente ha equazione<br />

z = g(x0,y0)+gx(x0,y0)(x−x0)+gy(x0,y0)(y−y0), e da questa si passa all’equazione<br />

suddetta ricordando i valori in (x0,y0) di g, gx, gy stabiliti dal teorema. In modo<br />

analogo si ragiona negli altri due casi.<br />

Ponendo P = (x,y,z), l’equazione del piano tangente può essere<br />

riscritta nella forma ∇G(P0)·(P −P0) = 0, dalla quale si dedu-<br />

ce che il vettore ∇G(P0) è normale alla superficie Σ nel punto P0.<br />

Se ∇G(P0) = (0,0,0), diciamo che P0 è un punto regolare della superficie Σ; altrimenti<br />

si dice che P0 è un punto singolare di Σ (relativamente a G).<br />

8


Con un ragionamento analogo a quello seguito nella sezione precedente, riconosciamo<br />

che, considerato un qualunque punto P0 ∈ A con ∇G(P0) = (0,0,0), la superficie<br />

di livello passante per P0 è, nell’intorno di P0, il sostegno di una superficie regolare,<br />

rispetto alla quale il vettore ∇G(P0) risulta essere normale. Questa superficie non è<br />

altro che una superficie equipotenziale del campo vettoriale ∇G.<br />

Esempio <strong>F1.</strong>7. <strong>Il</strong> punto (0,0,0) è singolare per la superficie di equazione<br />

x 2 +y 2 −z 2 = 0, che una superficie conica le cui due falde hanno<br />

vertice nel suddetto punto: in questo caso non esiste alcun intorno del<br />

punto nel quale il luogo Σ sia il grafico di una funzione delle variabili<br />

(x,y) o (x,z) o (y,z).<br />

Interessante è anche il caso della superficie xy 2 +z 3 = 0, per la quale<br />

sono singolari tutti i punti dell’asse x. La superficie è il grafico della<br />

funzione z = − 3 xy 2 , che non è differenziabile nei punti degli assi x e y.<br />

Esempio <strong>F1.</strong>8. Consideriamo la superficie Σ = {(x,y,z)∈IR 3 /xz 2 −y 2 +2e z = 1}<br />

ed il suo punto P0 = (0,1,0).<br />

Posto G(x,y,z) = xz 2 −y 2 +2e z −1, si vede che Gx(P0) = 0, Gy(P0) = −2 e Gz(P0) =<br />

2, cosicché esiste il piano tangente a Σ in P0 ed ha equazione −2(y −1)+2z = 0.<br />

Poiché Gz(P0) = 0, la superficie Σ è, nell’intorno di P0, il grafico di una funzione<br />

z = g(x,y), definita in un intorno di (0,1) e tale che g(0,1) = 0. Inoltre risulta<br />

gx(0,1) = − Gx(P0)<br />

Gz(P0) = 0 e gy(0,1) = − Gy(P0)<br />

Gz(P0)<br />

Possiamo ritrovare le derivate parziali delle funzione implicita nel punto (0,1) procedendo<br />

nel seguente modo: per comodità indichiamo la funzione implicita con z =<br />

z(x,y); dall’equazione xz 2 −y 2 +2e z −1 = 0, derivando ambo i membri rispetto ad x,<br />

si ottiene z 2 +2xzzx +2e z zx = 0; da qui, ponendo x = 0, y = 1 e z = 0, si ricava che<br />

zx(0,1) = 0; in modo analogo si procede per ricavare che zy(0,1) = 1.<br />

Poiché Gy(P0) = 0, la superficie Σ è, nell’intorno di P0, il grafico di una funzione<br />

y = h(x,z), definita in un intorno di (0,0) e tale che h(0,0) = 1. Inoltre risulta<br />

hx(0,0) = − Gx(P0)<br />

Gy(P0) = 0 e hz(0,0) = − Gz(P0)<br />

= 1. Anche qui ritroviamo le derivate in<br />

Gy(P0)<br />

(0,0) della funzione implicita, che ora preferiamo indicare con y = y(x,z), ricavandole<br />

dall’equazione xz2−y2 +2ez −1 = 0 ove si pensi y funzione di x e di z: derivando ambo<br />

i membri rispetto ad x otteniamo z2−2yyx = 0, da cui, per x = 0, y = 1 e z = 0, si<br />

deduce che yx(0,0) = 0; in modo analogo si arriva ad ottenere che yz(0,0) = 1.<br />

Da notare che in questo caso la funzione h si può facilmente esplicitare; tenendo conto<br />

del segno di h(0,0), si ricava infatti che h(x,z) = √ xz2 +2ez −1.<br />

Infine, poiché Gx(P0) = 0, il Teorema <strong>F1.</strong>3 non è applicabile in ordine alla possibilità<br />

di esprimere x in funzione di y e di z nell’intorno di P0.<br />

9<br />

= 1.


•) <strong>Il</strong> caso dei sistemi di due equazioni in tre variabili.<br />

Consideriamo infine il caso n = 1, k = 2, ossia quello del sistema<br />

ordine alla possibilità di esprimere y e z in funzione di x.<br />

<br />

G1(x,y,z) = 0<br />

, in<br />

G2(x,y,z) = 0<br />

Teorema <strong>F1.</strong>4. Sia G = (G1,G2) : A → IR 2 , con A aperto di IR 3 e G∈C 1 (A). Sia<br />

(x0,y0,z0)∈A con G(x0,y0,z0) = 0. Se | ∂(G1,G2)<br />

∂(y,z) (x0,y0,z0)| = 0, allora ∃I ∈I(x0)<br />

ed ∃J ∈I(y0,z0), con I×J ⊆ A, tali che ∀x∈I ∃!(y,z) =: (g1(x),g2(x))∈J tale<br />

che G(x,y,z) = 0, ossia tali (gli intorni I e J) che ∃!g = (g1,g2) : I → J tale che<br />

∀x∈I G(x,g1(x),g2(x)) = 0. Inoltre g1(x0) = y0 e g2(x0) = z0. Infine g∈C 1 (I) e,<br />

∀x∈I, g ′ 1 (x) = −|∂(G 1 ,G 2 )<br />

∂(x,z) (x,g1(x),g2(x))|<br />

| ∂(G 1 ,G 2 )<br />

∂(y,z) (x,g1(x),g2(x))| e g′ 2 (x) = −|∂(G 1 ,G 2 )<br />

(x,g1(x),g2(x))|<br />

∂(y,x)<br />

| ∂(G1 ,G2 )<br />

(x,g1(x),g2(x))| ∂(y,z) .<br />

Anchequisuggeriamounmetodopraticopercalcolarelederivatedellefunzioni implicite<br />

g1 e g2, ammesso che le ipotesi del teorema siano soddisfatte: partendo dal sistema<br />

G1(x,y,z) = 0<br />

G2(x,y,z) = 0 , nel quale si pensi y = g1(x) e z = g2(x), si derivano ambo i membri<br />

delle due equazioni ottenendo<br />

e da qui si ricava che y ′ = − |∂(G 1 ,G 2 )<br />

∂(x,z) (x,y,z)|<br />

| ∂(G 1 ,G 2 )<br />

(G1)x(x,y,z)+(G1)y(x,y,z)y ′ +(G1)z(x,y,z)z ′ = 0<br />

(G2)x(x,y,z)+(G2)y(x,y,z)y ′ +(G2)z(x,y,z)z ′ = 0 ,<br />

∂(y,x) (x,y,z)|<br />

(x,y,z)| ∂(y,z) e z′ = − |∂(G 1 ,G2 )<br />

| ∂(G1 ,G2 )<br />

(x,y,z)| ∂(y,z) .<br />

<br />

G1(x,y,z) = 0<br />

<strong>Il</strong> teorema stabilisce in sostanza che, posto Γ = {(x,y,z)∈A/ }, che<br />

G2(x,y,z) = 0<br />

è la “curva di livello (0,0)” della funzione G, e considerato il punto P0 = (x0,y0,z0)∈Γ,<br />

se UG(P0) := | ∂(G1,G2)<br />

∂(y,z) (P0)| = 0, allora il sistema può mettersi, almeno in un intorno<br />

<br />

y = g1(x)<br />

di P0, nella forma<br />

z = g2(x) , con g1 e g2 funzioni di classe C1 in un intorno di x0.<br />

Analogheconsiderazioni si fanno nell’ipotesiche VG(P0):=| ∂(G1,G2)<br />

∂(z,x) (P0)|=0, o inquella<br />

che WG(P0):=| ∂(G1,G2)<br />

∂(x,y) (P0)|=0, scambiando opportunamente il ruolo delle variabili.<br />

Considerato che UG(P0),VG(P0),WG(P0) sono i minori d’ordine due, presi con segno<br />

alternato, della matrice jacobiana DG(P0) = ∂(G1,G2)<br />

∂(x,y,z) (P0), deduciamo che, se essa ha<br />

rango 2, l’insieme Γ è, nell’intorno di P0, il sostegno di una curva regolare e semplice.<br />

La tangente a questa curva in P0 ha la direzione del vettore (UG(P0),VG(P0),WG(P0)).<br />

Infatti, nell’ipotesi ad esempio che UG(P0) = 0, il vettore tangente in P0 alla curva<br />

y = g1(x)<br />

z = g2(x) èdatoda(1,g′ 1 (x0),g ′ 2 (x0)); equesto, inbasealleformuleg ′ 1 (x0) = VG(P0)<br />

UG(P0) e<br />

g ′ 2 (x0) = WG(P0)<br />

UG(P0)<br />

stabilitenel teorema, è parallelo al vettore (UG(P0),VG(P0),WG(P0)).<br />

10


Considerato poi che (UG(P0),VG(P0),WG(P0)) = ∇G1(P0)×∇G2(P0), ne ricaviamo<br />

che i vettori ∇G1(P0) e ∇G2(P0) sono normali alla curva Γ in P0.<br />

Un punto P0 di Γ è detto regolare se la matrice jacobiana DG(P0)<br />

ha rango 2, altrimenti è detto singolare (relativamente a G).<br />

Infine osserviamo, relativamente ad un punto regolare P0 della curva Γ ed alle equazioni<br />

G1(x,y,z) = 0 e G2(x,y,z) = 0 prese singolarmente, che, poiché risulta ∇G1(P0) =<br />

(0,0,0) e ∇G2(P0) = (0,0,0), in virtù del Teorema <strong>F1.</strong>3 queste equazioni rappre-<br />

sentano, in un intorno di P0, due superfici regolari; queste superfici evidentemente si<br />

intersecano lungo la curva Γ; infine esse non sono tra loro tangenti in P0, dato che i<br />

corrispondenti vettori normali ∇G1(P0) e ∇G2(P0) non sono fra loro paralleli.<br />

<br />

2 2 2 x +y +z = 2<br />

Esempio <strong>F1.</strong>9. Siano dati il sistema<br />

x2 +y2 −z = 0 ed il punto P0 = ( 1<br />

2 , √ 3<br />

2 ,1).<br />

Posto G1(x,y,z) = x2 +y2 +z2−2 e G2(x,y,z) = x2 +y2 <br />

G1(P0) = 0<br />

−z, si vede che<br />

G2(P0) = 0 ,<br />

ossia che G(P0) = 0 se G = (G1,G2).<br />

√<br />

1 3 2<br />

Inoltre si calcola che DG(P0) =<br />

1 √ <br />

, e da qui si ricavano i determinanti<br />

3 −1<br />

UG(P0) = −3 √ 3, VG(P0) = 3, WG(P0) = 0. Poiché essi non sono tutti nulli, possiamo<br />

affermare che il luogo Γ degli zeri della G è, nell’intorno di P0, il sostegno di una curva<br />

regolare e semplice, e che la tangente a Γ in P0 ha la direzione del vettore (−3 √ 3,3,0).<br />

Essendo in particolare UG(P0) = 0, il sistema definisce implicitamente la coppia di<br />

funzioni y = g1(x) e z = g2(x), ciascuna di classe C 1 in un intorno di x0 = 1<br />

2<br />

g1( 1<br />

2 ) = √ 3<br />

2 e g2( 1<br />

Le derivate g ′ 1 (1<br />

2 ) e g′ 2 (1<br />

2<br />

, e tali che<br />

2 ) = 1; inoltre risulta g′ 1( 1 VG(P0) 1<br />

2 ) = UG(P0) = −√ e g<br />

3 ′ 2( 1 WG(P0)<br />

2 ) = UG(P0) = 0.<br />

) potevano essere calcolate anche nel seguente modo: per<br />

comodità indichiamo le funzioni implicite con y = y(x) e z = z(x); derivando rispetto<br />

ad x ambo i membri di ciascuna delle due equazioni del sistema, otteniamo il sistema<br />

2x+2yy ′ +2zz ′ = 0<br />

2x+2yy ′ −z ′ = 0<br />

; questo, per x = 1<br />

2 , y = √ 3<br />

2 e z = 1, fornisce<br />

y ′ ( 1<br />

2<br />

z ′ ( 1<br />

2<br />

) = − 1<br />

√ 3<br />

) = 0<br />

Osserviamo che, con facili manipolazioni algebriche, il sistema assegnato può mettersi<br />

2 2<br />

nella forma<br />

x +y = 1<br />

, dalla quale è evidente che le funzioni g1(x) e g2(x) possono<br />

z = 1<br />

in questo caso essere anche esplicitate: g1(x) = √ 1−x 2 e g2(x) = 1.<br />

Concludiamo osservando che, essendo anche VG(P0) = 0, il teorema del Dini può essere<br />

applicato anche in ordine alla possibilità di esprimere, in un intorno di P0, le variabili x<br />

e z in funzione della variabile y, ossia di trasformare il sistema assegnato in un sistema<br />

x = h1(y)<br />

del tipo<br />

z = h2(y) ; sulle funzioni h1 ed h2 si possono poi fare considerazioni analoghe<br />

a quelle fatte per le funzioni g1 e g2.<br />

11<br />

.


Esempio <strong>F1.</strong>10. <strong>Il</strong> punto (0,2,0) è singolare per la curva<br />

Esso infatti è soluzione (l’unica) del sistema formato dalle cinque<br />

equazioni G1(x,y,z) = 0, G2(x,y,z) = 0, UG(x,y,z) = 0,<br />

VG(x,y,z) = 0, WG(x,y,z) = 0, dove si è posto<br />

G1(x,y,z) = x 2 +y 2 +z 2 −4 e G2(x,y,z) = x 2 +y 2 −2y.<br />

Da notare che il punto in questione è regolare sia per la superficie<br />

x 2 +y 2 +z 2 = 4<br />

x 2 +y 2 −2y = 0 .<br />

sferica x 2 +y 2 +z 2 = 4 sia per la superficie cilindrica x 2 +y 2 −2y = 0;<br />

esse si intersecano lungo la curva assegnata e sono tra loro tangenti nel punto assegnato.<br />

Tutto ciò risulta confermato dal fatto che ∇G1(0,2,0) = (0,2,0) e ∇G2(0,2,0) =<br />

(0,4,0), cosicché le due superfici hanno, nel punto (0,2,0), piano tangente comune, di<br />

equazione y = 2.<br />

Esempio <strong>F1.</strong>11. <strong>Il</strong> punto (0,0,0) è singolare per la curva<br />

Si riconosce anche che il punto in questione è regolare per cia-<br />

scuna delle superfici x 2 +y 2 −z = 0 e x 2 +y 2 +z 2 −2z = 0;<br />

esse si intersecano lungo la curva assegnata e sono tra loro tan-<br />

genti nel punto assegnato. Invero, posto G1(x,y,z) = x 2 +y 2 −z<br />

e G2(x,y,z) = x 2 +y 2 +z 2 −2z, si calcola che ∇G1(0,0,0) =<br />

(0,0,−1) e ∇G2(0,0,0) = (0,0,−2).<br />

x 2 +y 2 −z = 0<br />

x 2 +y 2 +z 2 −2z = 0 .<br />

Si vede inoltre facilmente che il sistema assegnato si spezza nei due seguenti sistemi:<br />

2 2 2 2 x +y = 1<br />

e<br />

x +y = 0<br />

; pertanto la curva assegnata è costituita dall’unione di<br />

z = 1 z = 0<br />

una circonferenza e del punto isolato (0,0,0).<br />

<br />

2 2 2 x +y −z = 0<br />

Esempio <strong>F1.</strong>12. <strong>Il</strong> punto (0,0,0) è singolare per la curva<br />

x2 +y2−2y = 0 .<br />

In verità non poteva essere altrimenti, dato che, com’è noto,<br />

il punto in questione è singolare già per la superficie conica<br />

x 2 +y 2 −z 2 = 0. Invero, posto P0 = (0,0,0) e G = (G1,G2),<br />

con G1(x,y,z) = x 2 +y 2 −z 2 e G2(x,y,z) = x 2 +y 2 −2y = 0,<br />

e considerato che ∇G1(P0) = (0,0,0), è evidente che la matrice<br />

jacobiana DG(P0) non può avere rango 2.<br />

12


•) <strong>Il</strong> caso dei sistemi di due equazioni in quattro variabili.<br />

Consideriamo infine il caso n = 2, k = 2, ossia quello del sistema<br />

in ordine alla possibilità di esprimere u e v in funzione di x e di y.<br />

G1(x,y,u,v)= 0<br />

G2(x,y,u,v)= 0 ,<br />

Ovviamente a questo caso non è possibile associare una interpretazione geometrica (1) .<br />

Teorema <strong>F1.</strong>5. Sia G = (G1,G2) : A → IR 2 , con A aperto di IR 4 e G∈C 1 (A). Sia<br />

(x0,y0,u0,v0) ∈ A con G(x0,y0,u0,v0) = 0. Se | ∂(G1,G2)<br />

∂(u,v) (x0,y0,u0,v0)| = 0, allora<br />

∃I ∈ I(x0,y0) ed ∃J ∈ I(u0,v0), con I×J ⊆ A, tali che ∀(x,y) ∈ I ∃!(u,v) =:<br />

(g1(x,y),g2(x,y))∈J tale che G(x,y,u,v)= 0, ossia tali (gli intorni I e J) che ∃!g =<br />

(g1,g2) : I → J tale che ∀(x,y)∈I G(x,y,g1(x,y),g2(x,y)) = 0.<br />

Inoltre g(x0,y0) = (u0,v0). Infine g∈C 1 (I) e, ∀(x,y)∈I, risulta:<br />

∂g1<br />

∂x (x,y) = −| ∂(G1 ,G2 )<br />

∂g2<br />

∂x (x,y) = −| ∂(G1 ,G2 )<br />

∂(x,v) (x,y,g1(x,y),g2(x,y))|<br />

| ∂(G 1 ,G 2 )<br />

∂(u,v) (x,y,g1(x,y),g2(x,y))|<br />

∂(u,x) (x,y,g1(x,y),g2(x,y))|<br />

| ∂(G 1 ,G 2 )<br />

∂(u,v) (x,y,g1(x,y),g2(x,y))|<br />

, ∂g1<br />

, ∂g2<br />

∂y (x,y) = −|∂(G 1 ,G 2 )<br />

∂y (x,y) = −|∂(G 1 ,G 2 )<br />

(x,y,g1(x,y),g2(x,y))|<br />

∂(y,v)<br />

| ∂(G1 ,G2 )<br />

(x,y,g1(x,y),g2(x,y))| ∂(u,v) ,<br />

(x,y,g1(x,y),g2(x,y))|<br />

∂(u,y)<br />

| ∂(G1 ,G2 )<br />

(x,y,g1(x,y),g2(x,y))| ∂(u,v) .<br />

Anchequisuggeriamounmetodopraticopercalcolarelederivatedellefunzioni implicite<br />

g1 e g2, ammesso che le ipotesi del teorema siano soddisfatte: partendo dal sistema<br />

<br />

G1(x,y,u,v) = 0<br />

G2(x,y,u,v) = 0 , nel quale si pensi u = g1(x,y) e v = g2(x,y), si derivano rispetto<br />

ad x ambo i membri delle due equazioni, ottenendo<br />

<br />

(G1)x(x,y,u,v)+(G1)u(x,y,u,v)ux+(G1)v(x,y,u,v)vx = 0<br />

, e da qui si ricava che<br />

(G2)x(x,y,u,v)+(G2)u(x,y,u,v)ux+(G2)v(x,y,u,v)vx = 0<br />

ux = − |∂(G 1 ,G2 )<br />

(x,y,g1(x,y),g2(x,y))|<br />

∂(x,v)<br />

| ∂(G1 ,G2 )<br />

(x,y,g1(x,y),g2(x,y))| ∂(u,v) e vx = − |∂(G 1 ,G2 )<br />

(x,y,g1(x,y),g2(x,y))|<br />

∂(u,x)<br />

| ∂(G1 ,G2 )<br />

(x,y,g1(x,y),g2(x,y))| ∂(u,v) ;<br />

se invece deriviamo rispetto ad y, otteniamo<br />

<br />

(G1)y(x,y,u,v)+(G1)u(x,y,u,v)uy +(G1)v(x,y,u,v)vy = 0<br />

, e da qui si ricava che<br />

(G2)y(x,y,u,v)+(G2)u(x,y,u,v)uy +(G2)v(x,y,u,v)vy = 0<br />

uy = − |∂(G 1 ,G 2 )<br />

∂(y,v) (x,y,g1(x,y),g2(x,y))|<br />

| ∂(G 1 ,G 2 )<br />

∂(u,v) (x,y,g1(x,y),g2(x,y))| e vy = − |∂(G 1 ,G 2 )<br />

∂(u,y) (x,y,g1(x,y),g2(x,y))|<br />

| ∂(G 1 ,G 2 )<br />

∂(u,v) (x,y,g1(x,y),g2(x,y))| .<br />

Quanto detto fin qui può essere ripetuto cambiando il ruolo delle variabili, ossia in<br />

ciascuna delle seguenti ipotesi: | ∂(G1,G2)<br />

∂(y,v) (P0)|=0, | ∂(G1,G2)<br />

∂(x,v) (P0)|=0, | ∂(G1,G2)<br />

∂(y,u) (P0)|=<br />

0, | ∂(G1,G2)<br />

∂(x,u) (P0)| = 0, | ∂(G1,G2)<br />

∂(x,y) (P0)| = 0, dove s’è posto P0 = (x0,y0,u0,v0) e dove si<br />

riconosceche questideterminanti, unitamentea | ∂(G1,G2)<br />

∂(u,v) (P0)| che comparenel teorema<br />

enunciato, sono tutti i minori d’ordine due della matrice jacobiana DG(P0).<br />

(1) <strong>Il</strong> sistema in oggetto rappresenta una varietà bidimensionale in IR 4 (n = k = 2).<br />

Le altre possibili varietà in IR 4 sono la curva (n = 1, k = 3) e la ipersuperficie (n = 3, k = 1).<br />

13


F2. Invertibilità delle funzioni da IR n in IR n<br />

Sia F : X → IR n , con X aperto connesso di IR n ed F ∈ C 1 (X). Ci poniamo il problema<br />

di stabilire sotto quali condizioni F è invertibile.<br />

<strong>Il</strong> problema è già risolto se n = 1, essendo noto che: se ∀x∈X F ′ (x) = 0, allora F è<br />

invertibile nell’intervallo X. Infatti il teorema degli zeri applicato ad F ′ assicura che F ′<br />

è ovunque positiva o ovunque negativa in X, cosicché F è strettamente monotona in X.<br />

Si sa anche che F −1 ∈C 1 (F(X)), e che ∀y∈F(X) (F −1 ) ′ (y) = 1<br />

F ′ (x) , con x = F−1 (y).<br />

Tornando ad n qualsiasi, un caso particolare notevole si ha con F : IR n → IR n lineare.<br />

Detta A la matrice associata ad F, ossia quella per cui F(x) = Ax ∀x∈IR n , è noto<br />

che, se detA = 0, allora ∀y ∈IR n ∃!x∈IR n tale che Ax = y (teorema di Cramer).<br />

Se ricordiamo che ∀x∈IR n Df(x) = A, il risultato esposto può essere espresso come<br />

segue: se ∀x∈IR n Jf(x) = 0, allora F è invertibile. Si sa inoltre che anche la funzione<br />

F −1 è lineare, e che la matrice ad essa associata è A −1 ; ne segue che F −1 ∈ C 1 (IR n ) e<br />

che ∀y∈IR n DF −1 (y) = [DF(x)] −1 , dove x = F −1 (y).<br />

Gli esempi trattatifanno pensare che, anche nel caso generale, una condizione sufficiente<br />

per l’invertibilità di F è che risulti JF(x) = 0 ∀x∈X.<br />

Ma le cose non stanno così, come dimostra l’esempio che segue.<br />

Esempio F2.1. Siano X = {(x1,x2)∈IR 2 /x1 > 0} ed F(x1,x2) = (x1cosx2, x1senx2)<br />

∀(x1,x2)∈X. Si vede che F ∈C 1 (X) eche JF(x1,x2) = x1 = 0 ∀(x1,x2)∈X. D’altra<br />

parte risulta F(x1,x2) = F(x1,x2+2kπ) ∀k∈Z, cosicché F non è invertibile in X.<br />

Si può comunque provare che, sempre nell’ipotesi JF(x) = 0 ∀x∈X, se F è invertibile,<br />

allora F −1 ∈ C 1 (F(X)) e ∀y ∈ F(X) DF −1 (y) = [DF(x)] −1 , con x = F −1 (y). In<br />

particolare, la formula per DF −1 (y) si ricava osservando che, essendo F◦F −1 = i F(X) ,<br />

deve aversi DF(x)DF −1 (y) = In, dove In è la matrice unitaria d’ordine n.<br />

A ben vedere, il problema dell’invertibilità di F, che evidentemente nel caso globale non<br />

èsemplice, può essere vistocome unparticolareproblema di funzione implicita: stabilire<br />

sotto quali condizioni, data l’equazione y = F(x), ossia l’equazione G(x,y) = 0 con<br />

G(x,y) = F(x)−y, è possibile, almeno sul piano teorico, esprimere x in funzione di y.<br />

Osservato allora che ∀(x,y)∈X×IR n risulta ∂G<br />

∂G (x,y) = DF(x) e ∂x ∂y (x,y) = −In, dal<br />

teorema del Dini applicato a G discende il seguente risultato, che, nella solita ipotesi su<br />

JF(x), garantisce quanto meno l’invertibilità locale di F.<br />

Teorema F2.1 (diinvertibilitàlocale). Sia F : X → IR n , conX apertoed F ∈ C 1 (X),<br />

e sia x0∈X. Se JF(x0) = 0, allora ∃I(⊆ X)∈I(x0) ed ∃J∈I(F(x0)) tali che ∀y∈J<br />

∃!x∈I tale che F(x) = y, ossia tali (gli intorni I e J) che F |I sia bigettiva fra I e J.<br />

Inoltresi ha (F |I) −1 ∈ C 1 (J) e ∀y∈J D(F |I) −1 (y) = [DF(x)] −1 , con x = (F |I) −1 (y).<br />

14


F3. Problemi di massimo e minimo vincolati<br />

Vogliamo affrontare il problema della determinazione dei valori massimo e minimo fra<br />

quelli che una data funzione assume sui punti di una data curva o di una data superficie.<br />

La funzione è spesso chiamata “funzione obiettivo”, la curva e la superficie son chiamate<br />

“vincoli”, gli estremi di cui s’è detto son chiamati “estremi vincolati”.<br />

Se si opera in IR 2 , il vincolo èuna curva, ossia un insieme di dimensione uno, individuato<br />

da un’uguaglianza del tipo G(x,y) = 0. Se invece si opera in IR 3 , il vincolo può essere<br />

ancora una curva, ossia ancora un insieme di dimensione uno, individuato da una coppia<br />

G1(x,y,z) = 0<br />

di uguaglianze del tipo ; oppure una superficie, ossia un insieme di<br />

G2(x,y,z) = 0<br />

dimensione due, individuato da una uguaglianza del tipo G(x,y,z) = 0.<br />

Considereremo solo casi in cui la funzione obiettivo e le funzioni che individuano il<br />

vincolo sono di classe C 1 ; inoltre, con l’eccezione di qualche esempio particolare, considereremo<br />

solo vincoli limitati e privi di punti singolari.<br />

All’inizio utilizzeremo il metodo della parametrizzazione del vincolo, in modo che il<br />

problema sia ricondotto, nel caso di curve, ad un problema di una sola variabile, il<br />

parametro t, e, nel caso di superfici, ad un problema di due variabili, i parametri u<br />

e v. In quest’ultimo caso, il problema cui ci si riconduce è quello di determinare gli<br />

estremi di una funzione su un dominio di IR 2 , individuato da disuguaglianze imposte ai<br />

parametri. Pertanto, per fare in modo che sotto questo punto di vista la trattazione<br />

sia completa, ci occuperemo anche di casi in cui la funzione obiettivo è da valutare su<br />

domini appunto di IR 2 ed anche di IR 3 , dunque su insiemi aventi la stessa dimensione<br />

dell’ambiente di cui fanno parte, che a volte vengono detti “vincoli di disuguaglianza”.<br />

Successivamente ci occuperemo del metodo dei moltiplicatori di Lagrange, considerando<br />

dapprima ilcaso incui ilvincolosia una curva inIR 2 , poiquellodella curva inIR 3 , quindi<br />

quello della superficie in IR 3 , per concludere con il caso generale del vincolo costituito<br />

da un insieme di dimensione m–k nello spazio IR m .<br />

Esempio F3.1. Unaparticelladimassamèvincolataamuoversi lungolacirconferenza<br />

Γ = {(x,y)∈IR 2 /x 2 +y 2 = 1} nel piano verticale xy, rimanendo ancorata<br />

al punto (1,0) mediante una molla ideale di costante elastica k.<br />

Vogliamo calcolare la posizione di equilibrio stabile della particella,<br />

soggetta alla forza di gravità e alla forza elastica.<br />

<strong>Il</strong> punto di equilibrio stabile è quello in cui l’energia potenziale<br />

è minima. L’energia potenziale della particella nel punto (x,y) è<br />

f(x,y) = mgy+ 1<br />

2 k[(x−1)2 +y 2 ]. <strong>Il</strong> problema è quello di calcolare il minimo di f su Γ.<br />

Poiché Γ è parametrizzata da γ ≡ (cost,sent), t∈[− π<br />

2<br />

, 3π<br />

2<br />

], i valori di f su Γ sono quelli<br />

che assume la funzione F(t) = f(γ(t)) = mgsent+k(1−cost) per t∈[− π<br />

2<br />

15<br />

, 3π<br />

2 ].


Si calcola che F ′ (t) = 0 ⇔ tgt = − mg<br />

k<br />

⇔ t = arctg −mg<br />

k =: t1 ∨ t = π +t1 =: t2.<br />

Dal confronto fra F(− π)<br />

= F(3π<br />

2 2 ) = k − mg, F(t1) = k − k2 +m2g 2 , F(t2) =<br />

k + k2 +m2g 2 (1) , si deduce che minF = F(t1) e maxF = F(t2).<br />

Essendo γ(t1) = P1 = (<br />

√ k<br />

k2 +m2g2 , √ −mg<br />

k2 +m2g2 ) e γ(t2)<br />

−k<br />

= P2 = ( √<br />

k2 +m2g2 ,<br />

√ mg<br />

k2 +m2g2 ),<br />

concludiamo che min Γ f=f(P1)=k − k 2 +m 2 g 2 e max Γ f=f(P2)=k+ k 2 +m 2 g 2 .<br />

Esempio F3.2. Calcoliamo gli estremi della funzione f(x,y) = 3x 2 − 2y 2 − 4x<br />

sull’insieme E = {(x,y)∈IR 2 /x 2 +2y 2 ≤ 1}.<br />

L’insieme E è un vincolo di disuguaglianza, la cui frontiera è il vincolo di uguaglianza<br />

Γ = {(x,y)∈IR 2 /x 2 +2y 2 = 1}. La risoluzione va divisa in due parti: ricerca dei punti<br />

stazionari interni ad E e ricerca dei punti stazionari vincolati a ∂E.<br />

Imponendo ∇f(x,y) = 0 si determina ( 2<br />

3 ,0), unico punto stazionario interno ad E.<br />

La frontiera Γ è parametrizzata da γ ≡ (cost, 1 √ sent), t∈[−π,π], cosicché i valori di<br />

2<br />

f su Γ sono quelli che assume la funzione F(t) = f(γ(t)) = 3cos 2 t−sen 2 t−4cost per<br />

t∈[−π,π]. Si calcola che F ′ (t) = 0 ⇔ t = ±π ∨ t = ± π<br />

3<br />

corrispondono i punti stazionari di f vincolati a Γ: (−1,0), ( 1<br />

2 ,±<br />

<br />

3<br />

8<br />

∨ t = 0; a questi valori di t<br />

), (1,0).<br />

Dalconfrontodeivaloridif neicinquepuntitrovatisievincechemin f = f( E 1<br />

2 ,±<br />

−2 e max f = f(−1,0) = 7.<br />

E<br />

Esempio F3.3. Calcoliamo i punti della curva Γ = {(x,y,z)∈IR 3 /<br />

per i quali è minima o massima la distanza dal punto (0,0,0).<br />

<br />

3<br />

8<br />

) =<br />

2x 2 +y 2 = 8<br />

2x−z +1 = 0 }<br />

Assumiamo come funzione obiettivo la funzione f(x,y,z) = x 2 +y 2 +z 2 , quadrato della<br />

distanza del punto (x,y,z) dal punto (0,0,0).<br />

Considerato che il vincolo Γ è parametrizzato da γ ≡ (2cost,2 √ 2sent,4cost+1), t∈<br />

[−π,π], introduciamo la funzione F(t) = f(γ(t)) = 12cos 2 t+8cost+9, con t∈[−π,π].<br />

Si calcola che F ′ (t) = 0 ⇔ t = ±π ∨ t = 0 ∨ t = ±arccos(− 1<br />

3 ), e si scopre che<br />

minF = F(±arccos(− 1 23<br />

3 )) = 3<br />

e maxF = F(0) = 29.<br />

Si conclude che i punti di Γ più vicini all’origine sono (− 2<br />

3 ,±8<br />

mentre il punto più lontano è (2,0,5), con distanza √ 29.<br />

3 ,−1 ), con distanza 3<br />

23<br />

3 ,<br />

Osserviamo che il problema poteva essere risolto eliminando una variabile: poiché su<br />

Γ risulta z = 2x + 1, i valori di f su Γ sono quelli che assume la funzione h(x,y) =<br />

f(x,y,2x+1) = 5x 2 +y 2 +4x+1 sul vincolo Γ1 = {(x,y)∈IR 2 /2x 2 +y 2 = 8}.<br />

(1) A ben vedere, i punti − π<br />

2<br />

e 3π<br />

2<br />

tali sarebbero se avessimo scelto di far variare t non in [− π<br />

2<br />

per il primo punto e in [0,2π] per il secondo.<br />

potevano essere trattati come comuni punti interni, dato che<br />

16<br />

3π , 2 ], bensì ad esempio in [−π,π]


Esempio F3.4. Calcoliamo gli estremi della funzione f(x,y,z) = √ 3x+ √ 3y−3 √ 2z<br />

sulla superficie Σ = {(x,y,z)∈IR 3 /x 2 +y 2 +z 2 = 2, z ≤ 1}.<br />

<strong>Il</strong> vincolo Σ è parametrizzato da φ ≡ ( √ 2cosucosv, √ 2cosusenv, √ 2senu), su E =<br />

[−π π , ]×[0,2π], cosicché i valori di f su Σ sono quelli che assume la funzione F(u,v) =<br />

2 4<br />

f(φ(u,v)) = √ 6(cosucosv+cosusenv− √ 6senu) sull’insieme E, che è un vincolo di<br />

disuguaglianza.<br />

Procedendo come nell’Esempio F3.2, dapprima si cercano i punti stazionari di F interni<br />

ad E, e si trova (− π<br />

3<br />

i valori di F son dati da r(v) = F(− π<br />

2<br />

π<br />

, 4 ). Quindi si considerano i punti della frontiera. Sul lato u = −π<br />

2<br />

,v) = 6 (il fatto che si tratti di valori costanti<br />

non sorprende, dal momento che ai punti di questo lato corrisponde un unico punto<br />

della superficie sferica). Sul lato u = π<br />

4<br />

i valori di F sono quelli della funzione s(v) =<br />

F( π<br />

4 ,v) = √ 3 cosv + √ 3 senv − 3 √ 2, di cui si calcola che i punti stazionari interni<br />

all’intervallo [0,2π] sono ( π<br />

4<br />

, π<br />

4<br />

) e (π<br />

4<br />

, 5<br />

4<br />

π). Passando ai lati v = 0 e v = 2π, si esamina<br />

la funzione t(u) = F(u,0) = F(u,2π) = √ 6 cosu−6 senu), di cui si calcola che l’unico<br />

punto stazionario interno all’intervallo [−π π , 2 2 ] è u = −arctg√6. Infine vanno considerati i valori che F assume nei quattro vertici del rettangolo E.<br />

Dal confronto dei valori di F nei punti trovati (1) deduciamo che min EF = F( π<br />

4<br />

5π<br />

, 4 ) =<br />

− √ 6−3 √ 2 e max F = F(− E π π<br />

3 , 4 ) = 4√3. Infine, tornando alla f, si conclude che min f = f(− Σ 1 √ ,−<br />

2 1 √ ,1) = −6 − 3<br />

2 √ 2 e<br />

max f = f(− Σ 1<br />

2 ,−1 2 , √ √2 3 ) = 4 √ 3.<br />

Esempio F3.5. Calcoliamo gli estremi della funzione f(x,y,z) = x 2 y−z sull’insieme<br />

E = {(x,y,z)∈IR 3 /z ≥ x 2 +y 2 , x 2 +y 2 +z 2 ≤ 2}.<br />

L’insieme E è un vincolo di disuguaglianza, cosicché il lavoro va diviso nella ricerca dei<br />

punti stazionari interni ad E e nella ricerca dei punti stazionari vincolati a ∂E.<br />

La frontiera ∂E a sua volta va considerata composta dalle seguenti parti: la superficie<br />

Σ1 = {(x,y,z)∈IR 3 /z = x 2 +y 2 , x 2 +y 2 < 1}, che richiede la determinazione dei punti<br />

stazionari di F1(x,y) = f(x,y,x 2 +y 2 ) sull’insieme B1 = {(x,y)∈IR 2 /x 2 + y 2 < 1};<br />

la superficie Σ2 = {(x,y,z)∈IR 3 /x 2 +y 2 +z 2 = 1, x 2 +y 2 < 1}, che richiede la deter-<br />

minazione dei punti stazionari di F2(u,v) = f( √ 2cosucosv, √ 2cosusenv, √ 2senu)<br />

sull’insieme B2 = {(u,v)∈IR 2 / π π < u ≤ , 0 ≤ v ≤ 2π}; la curva Γ = {(x,y,z)∈<br />

4 2<br />

IR 3 <br />

2 2<br />

/<br />

x +y = 1<br />

}, che richiede la determinazione dei punti stazionari di G(t) =<br />

z = 1<br />

f(cost,sent,1) sull’insieme D = [0,2π].<br />

(1)<br />

A ben vedere, i punti dei lati v = 0 e v = 2π potevano essere trattati come comuni punti<br />

interni, poiché tali sarebbero se avessimo scelto di far variare v non in [0,2π], bensì ad esempio<br />

in [−π,π] per il primo lato e in [π,3π] per il secondo. Un discorso analogo si può fare per il<br />

lato u = ± π<br />

2 , dato che anche la posizione dei poli dipende dalla scelta della parametrizzazione.<br />

17


F4. <strong>Il</strong> metodo dei moltiplicatori di Lagrange<br />

•) Estremi di funzioni di due variabili su vincoli unidimensionali.<br />

Siano f,G : A → IR, con A aperto di IR 2 ed f,G ∈ C 1 (A). Considerato l’insieme<br />

Γ = {(x,y)∈A/G(x,y) = 0}, che in questo contesto avrà il ruolo di vincolo, vogliamo<br />

riprendereilproblemadideterminare, seesistono, il min Γf edil max Γf,ossiagliestremi<br />

di f vincolati a Γ. Sappiamo già che, se Γ si rappresenta parametricamente mediante<br />

l’applicazione γ ≡ γ(t), t ∈ I, con I intervallo di IR, il problema può essere risolto<br />

riconducendolo a quello di ricercare gli estremi della funzione F(t) = f(γ(t)), t∈I , che<br />

è funzione di una sola variabile.<br />

Considerato anche che non sempre del vincolo Γ si riesce a dare una rappresentazione<br />

parametrica, è utile trovare un metodo che si possa applicare direttamente alla funzione<br />

G. A tale scopo, considerato P0 punto regolare di Γ, cerchiamo una opportuna condizione<br />

necessaria affinché P0 sia un punto di estremo relativo per f |Γ (punto di estremo<br />

relativo di f vincolato a Γ); infatti questa è a sua volta una condizione necessaria perché<br />

P0 sia punto di estremo assoluto per f |Γ .<br />

E’ noto che, essendo ∇G(P0) = (0,0), il vincolo Γ è, in un intorno di P0, il sostegno<br />

di una curva regolare e semplice, che indichiamo con γ ≡ γ(t), t∈I, dove I è un intervallo<br />

aperto di IR. Se si suppone che P0 sia punto di estremo relativo per f |Γ , allora<br />

t0 := γ −1 (P0) dovrà essere punto di estremo relativo per F = f◦γ (invero, supposto ad<br />

esempio che f(P) ≤ f(P0) ∀P ∈B ∩Γ, con B ⊆ A intorno di P0, considerato che, per<br />

la continuità di γ in t0, esiste J∈I(t0) tale che J ⊆ I e γ(J) ⊆ B, si ha che ∀t∈J<br />

f(γ(t)) ≤ f(P0) = f(γ(t0))), e dunque dovrà risultare F ′ (t0) = ∇f(P0)·γ ′ (t0) = 0 (1) ,<br />

come dire che il vettore ∇f(P0) dovrà essere nullo o comunque normale a Γ in P0.<br />

Ricordando infine che anche il vettore ∇G(P0) è normale a Γ in P0, concludiamo che<br />

∇f(P0) dovrà essere nullo o comunque parallelo a ∇G(P0), ossia che dovrà esistere<br />

λ0∈IR tale che ∇f(P0) = λ0∇G(P0).<br />

Con ciò è sostanzialmente provato il cosiddetto teorema dei moltiplicatori di Lagrange,<br />

che riportiamo qui di seguito. In esso sarà utilizzata la funzione, detta lagrangiana<br />

associata allefunzioni f e G, L : A×IR → IR, definita da L(x,y,λ) = f(x,y)−λG(x,y);<br />

il parametro λ prende il nome di moltiplicatore di Lagrange.<br />

Teorema F4.1. Siano f,G : A → IR, con A aperto di IR 2 ed f,G ∈ C 1 (A); sia<br />

Γ = {P ∈A/G(P) = 0}; sia infine P0∈Γ, con ∇G(P0) = 0. Se P0 è punto di estremo<br />

relativo per f |Γ , allora ∃λ0∈IR tale che ∇L(P0,λ0) = 0.<br />

(1)<br />

Indicato con w il versore tangente a Γ in P0, w = γ′ (t0)<br />

|γ ′ , qui si è provato che: condizione<br />

(t0)|<br />

necessaria affinché P0 sia punto di estremo relativo per f è che |Γ ∂f<br />

∂w (P0) = 0.<br />

18


Dim. Si ripete il ragionamento fatto sopra, e si giunge alla tesi osservando che, siccome<br />

∀P ∈A e ∀λ∈IR Lx(P,λ) = fx(P)−λGx(P), Ly(P,λ) = fy(P)−λGy(P), Lλ(P,λ) =<br />

−G(P), allora la condizione ∇L(P0,λ0) = (0,0,0) equivale alla coppia di condizioni<br />

G(P0) = 0, che è nelle ipotesi, e ∇f(P0)−λ0∇G(P0) = (0,0), che è già stata provata<br />

Pertanto, nell’ipotesi che f e G siano di classe C 1 nell’aperto A, i punti di estremo<br />

relativo di f vincolati a Γ vanno ricercati nelle seguenti due classi di punti: i punti<br />

singolari di Γ e i punti P regolari di Γ tali che ∇L(P,λ) sia nullo per qualche λ∈IR,<br />

ossia tali che (P,λ) sia punto stazionario per la funzione L. I punti di questa seconda<br />

classe si dicono punti stazionari di f vincolati a Γ; ed è importante ribadire che questi<br />

punti possono anche non essere di estremo relativo per f |Γ , dato che il teorema fornisce<br />

una condizione soltanto necessaria.<br />

Segnaliamoinfine cheinalcuniproblemi può accadere chelefunzioni f eGsianodefinite<br />

su un insieme E non aperto, e che qualche punto di Γ appartenga a ∂E; in questi casi<br />

il metodo dei moltiplicatori di Lagrange potrà essere applicato al vincolo Γ ∗ := Γ∩E o ,<br />

ossia alle funzioni f |E o e G |E o, e i punti di Γ\Γ ∗ dovranno essere considerati a parte.<br />

Esempio F4.1. Calcoliamo i punti della curva Γ = {(x,y)∈IR 2 /x 4 +y 4 +6xy−8 = 0}<br />

per i quali è minima o massima la distanza dall’origine.<br />

Si tratta di calcolare gli estremi della funzione f(x,y) = x 2 +y 2<br />

sull’insieme degli zeri di G(x,y) = x 4 +y 4 +6xy −8.<br />

Osserviamo dapprima che Γ è un insieme limitato. Infatti, per ogni<br />

(x,y)∈Γ si ha (x 2 +y 2 ) 2 = x 4 +y 4 +2x 2 y 2 ≤ 2(x 4 +y 4 ) ≤ 16−12xy ≤<br />

16 + 12|xy| ≤ 16 + 6(x 2 +y 2 ), ossia ρ 4 ≤ 16 + 6ρ 2 , ossia ancora ρ ≤ 2 √ 2, dove<br />

si è posto ρ = x 2 +y 2 ; dunque la curva Γ è contenuta nel cerchio di centro (0,0)<br />

e raggio 2 √ 2. Oppure si procede così: si interseca Γ con la retta y = mx, ottenendo<br />

i punti (±x(m),±y(m)), con x(m) = 2 √ <br />

2/ 3m+ √ 8m4 +9m2 +8 e y(m) =<br />

2 √ 2m/ 3m+ √ 8m 4 +9m 2 +8, si osserva che le funzioni x(m) ed y(m), m∈IR, sono<br />

limitate, e si conclude che la curva Γ è contenuta in un rettangolo.<br />

VerificatocheΓnonhapuntisingolari,introduciamolafunzionelagrangiana L(x,y,λ)=<br />

x2 +y2 −λ(x 4 +y4 ⎧<br />

+6xy−8) ed imponiamo che ∇L(x,y,λ) = 0, ottenendo il sistema<br />

⎨x−2λx<br />

⎩<br />

3 −3λy = 0<br />

y −2λy3 −3λx = 0<br />

x4 +y4 .<br />

+6xy −8 = 0<br />

Le soluzioni del sistema sono (±1,±1, 1 1<br />

5 ) e (∓2,±2, 5 ), cosicché i punti stazionari di f<br />

vincolatiaΓsonoquattro: (±1,±1)e(∓2,±2). Poiché f(±1,±1) = 2 e f(∓2,±2) = 8,<br />

concludiamo che i punti più vicini all’origine sono (±1,±1), a distanza √ 2, e quelli più<br />

lontani sono (∓2,±2), a distanza 2 √ 2.<br />

19


Esempio F4.2. La superficie di una scatola di forma cilindrica<br />

senza coperchio ha area uguale a 12π. Determiniamo il raggio di<br />

base x e l’altezza y tali che la capacità sia massima, ritenendo<br />

certo che la scatola di capacità massima esiste e non è degenere.<br />

Poiché il volume della scatola è πx 2 y, e l’area della superficie è<br />

πx 2 +2πxy, il problema è quello di determinare i valori di x ed y<br />

che rendono massima la funzione f(x,y) = x 2 y sul vincolo<br />

Γ = {(x,y)∈IR 2 /x 2 +2xy = 12, x,y > 0}.<br />

Posto G(x,y) = x 2 +2xy −12 e osservato che ∇G(x,y) = (0,0)<br />

nei punti di Γ, si introduce L(x,y,λ) = x 2 y −λ(x 2 +2xy −12)<br />

e si calcola che (2,2) è l’unico punto stazionario di f vincolato a Γ.<br />

Si conclude che la scatola di capacità massima ha raggio di base 2<br />

ed altezza 2.<br />

Esempio F4.3. Calcoliamo i punti della curva Γ = {(x,y)∈IR 2 /x 2 +2y 2 −2xy−1 = 0<br />

x,y ≥ 0} per i quali è minima o massima la somma delle distanze dagli assi.<br />

Si tratta di calcolare i punti di minimo e di massimo su Γ della fun-<br />

zione f(x,y) = x+y. Posto Γ ∗ = {(x,y)∈Γ/x,y > 0}, si vede che<br />

Γ ∗ è l’insieme degli zeri della funzione G(x,y) = x 2 +2y 2 −2xy −1<br />

nell’aperto A = {(x,y)∈IR 2 /x,y > 0}. Appurato che Γ ∗ non ha pun-<br />

ti singolari, si introduce la funzione L(x,y,λ) = f(x,y)−λG(x,y) e<br />

si calcola che il gradiente di L è nullo in corrispondenza del punto ( 3 √ 5 , 2<br />

√ 5 ) ∈ Γ ∗ .<br />

Dal confronto dei valori che f assume nel punto trovato e negli estremi (1,0) e (0, 1 √ )<br />

2<br />

di Γ, si scopre che min f = f(0, Γ 1 √ ) =<br />

2 1 √ e max f = f(<br />

2 Γ 3 √ ,<br />

5 2 √ ) =<br />

5 √ 5.<br />

Esempio F4.4. Per calcolare gli estremi della funzione f(x,y) = y 4 − x 2 + 3y sulla<br />

curva Γ = {(x,y)∈IR 2 /x 2 = y 3 }, un metodo efficace è quello di ricondursi allafunzione<br />

F(t) = f(γ(t)) = t 8 −t 6 +3t 2 , dove γ ≡ (t 3 ,t 2 ), t∈IR. Del resto la riduzione ad una<br />

sola variabile si può ottenere anche osservando che sui punti di Γ, dove x 2 = y 3 , i valori<br />

di f sono quelli della funzione h(y) = y 4 −y 3 +3y, y∈[0,+∞[.<br />

Volendo comunque applicare il metodo dei moltiplicatori di Lagrange,<br />

si osserva che il gradiente della lagrangiana L(x,y,λ) = y 4 −x 2 +3y−<br />

λ(x 2 −y 3 ) non è mai nullo in corrispondenza dei punti di Γ, cosicché<br />

il confronto risolutivo va fatto soltanto fra il valore di f nel punto (0,0), che è singolare<br />

per Γ, e il limite di f per (x,y) tendente all’infinito su Γ, dato che Γ non è limitato.<br />

In ogni caso si conclude che min Γ f = f(0,0) = 0, che f non ha massimo su Γ e che<br />

sup f = lim Γ (x,y)→∞ f (x,y) = lim<br />

|Γ y→+∞ (y4−y 3 +3y) = +∞.<br />

20


•) Estremi di funzioni di tre variabili su vincoli unidimensionali.<br />

Siano f,G1,G2 : A → IR, con A aperto di IR 3 ed f,G1,G2 ∈C 1 (A). Considerato il<br />

G1(x,y,z) = 0<br />

vincolo Γ = {(x,y,z)∈ A/ }, anche qui ci poniamo il problema di<br />

G2(x,y,z) = 0<br />

calcolare, se esistono, gli estremi di f vincolati a Γ, ossia il min Γ f ed il max Γ f . E<br />

anche qui ricordiamo che il problema è di facile soluzione se Γ viene rappresentato come<br />

il sostegno della curva γ ≡ γ(t), t∈I, poiché in tal caso si tratta di ricercare gli estremi<br />

della funzione di una sola variabile F(t) = f(γ(t)), t∈I .<br />

Ma ora proponiamoci di determinare un metodo che coinvolga direttamente le funzioni<br />

G1 e G2. Supponiamo allora che P0 sia un punto regolare di Γ e cerchiamo una condizione<br />

necessaria affinché P0 sia punto di estremo relativo per f (punto di estremo<br />

|Γ<br />

relativo di f vincolato a Γ).<br />

E’ noto che, poiché la matrice ∂(G1,G2)<br />

∂(x,y,z) (P0) ha rango 2, il vincolo Γ è, in un intorno di<br />

P0, il sostegno di una curva regolare e semplice γ ≡ γ(t), t∈I, con I intervallo aperto<br />

di IR, e che i vettori ∇G1(P0) e ∇G2(P0) individuano il piano normale a Γ in P0.<br />

Allora, considerato t0∈I tale che γ(t0) = P0, si ha che:<br />

(P0 èpunto diestremo relativoperf )=⇒ (t0 èpunto di estremo relativoper F = f◦γ)<br />

|Γ<br />

=⇒ (F ′ (t0) = ∇f(P0)·γ ′ (t0) = 0) =⇒ (∇f(P0) è nullo o comunque normale a Γ in<br />

P0) =⇒ (∇f(P0) è nullo o comunque complanare con i vettori ∇G1(P0) e ∇G2(P0))<br />

=⇒ (∃λ0,µ0∈IR tali che ∇f(P0) = λ0∇G1(P0)+µ0∇G2(P0)).<br />

Allo scopo di esprimere in modo più agevole il risultato ottenuto, introduciamo la funzione<br />

lagrangiana associata alle funzioni f, G1 e G2, ossia la funzione L : A×IR 2 → IR<br />

definita da L(x,y,z,λ,µ)= f(x,y,z)−λG1(x,y,z)−µG2(x,y,z), con i suoi due moltiplicatori<br />

λ e µ, ed osserviamo che la condizione alla quale siamo pervenuti, unitamente<br />

alla condizione che P0∈Γ, può essere espressa nella seguente forma: ∃λ0,µ0∈IR tali<br />

che ∇L(P0,λ0,µ0) = (0,0,0,0,0).<br />

Con ciò risulta sostanzialmente dimostrato il seguente<br />

Teorema F4.2. Siano: f : A → IR e G : A → IR 2 funzioni di classe C 1 in A aperto di<br />

IR 3 , Γ = {P∈A/G(P) = 0}, P0∈Γ tale che la matrice DG(P0) abbia rango 2. Se P0<br />

è punto di estremo relativo per f |Γ , allora ∃λ0,µ0∈IR tali che ∇L(P0,λ0,µ0) = 0.<br />

Pertanto, nell’ipotesi che f e G = (G1,G2) siano di classe C 1 nell’aperto A, i punti di<br />

estremo relativo di f vincolati a Γ vanno ricercati tra i punti singolari di Γ e tra i punti<br />

P regolari di Γ tali che ∇L(P,λ,µ) sia nullo per qualche coppia di valori reali λ e µ.<br />

Questi ultimi punti sono detti punti stazionari di f vincolati a Γ, e non è garantito che<br />

essi siano necessariamente punti di estremo relativo per f |Γ .<br />

Chiaramente anche qui vale la considerazione, fatta nella sezione precedente, relativa al<br />

caso in cui f e G sono definite in E non aperto e qualche punto di Γ appartiene a ∂E.<br />

21


Esempio F4.5. Determiniamo i punti della curva Γ = {(x,y,z)∈IR 3 /2x−z +1 = 0,<br />

2x 2 +y 2 = 8} aventi distanza minima o massima dall’origine (vedi l’Esempio F3.3).<br />

Si tratta di calcolare i punti di Γ nei quali è minima o massima la funzione f(x,y,z) =<br />

x 2 + y 2 + z 2 (1) . Si osserva che Γ è limitato; infatti, per ogni (x,y,z)∈Γ si ha che<br />

|x| ≤ 1<br />

√ 2<br />

2x 2 +y 2 = 1<br />

√2<br />

√ 8 = 2, |y| ≤ 2x 2 +y 2 = √ 8, |z| ≤ 2|x|+1 ≤ 5.<br />

Considerate le funzioni G1(x,y,z) = 2x−z+1 e G2(x,y,z) = 2x 2 +y 2 −8 ed osservato<br />

che Γ non ha punti singolari, si introduce la funzione L(x,y,z,λ,µ) = f(x,y,z) −<br />

λG1(x,y,z) − µG2(x,y,z) e si calcola che ∇L è nullo in corrispondenza dei punti<br />

3 ,−1 3 ). Dal confronto dei valori di f in questi punti si<br />

evince che min f = f(− Γ 2<br />

3 ,±8 3 ,−1 23 ) = 3 3 e max f = f(2,0,5) = 29.<br />

Γ<br />

(2,0,5), (−2,0,−3), (− 2<br />

3 ,±8<br />

•) Estremi di funzioni di tre variabili su vincoli bidimensionali.<br />

L’ultimo problema che vogliamo affrontare è quello della ricerca del min Σ f e del max Σ f<br />

(estremi di f vincolati a Σ), dove f : A → IR con A aperto di IR 3 e Σ = {(x,y,z)∈A/<br />

G(x,y,z) = 0} con G : A → IR, ed inoltre f,G∈C 1 (A).<br />

Se Σ si rappresenta parametricamente mediante l’applicazione φ ≡ φ(u,v), (u,v)∈D,<br />

con D ⊆ IR 2 , allora il problema si trasferisce alla funzione F(u,v) = f(φ(u,v)), (u,v)∈<br />

D, che è funzione di due variabili. Se ad esempio D è un dominio, la risoluzione del<br />

problema dovrà passare in genere attraverso la determinazione dei punti di estremo<br />

relativo di F interni a D e dei punti di estremo relativo di F vincolati a ∂D.<br />

Ma ora cerchiamo un metodo che coinvolga direttamente la funzione G; e, a tale scopo,<br />

fissiamo P0 punto regolare di Σ e cerchiamo una condizione necessaria affinché P0 sia<br />

punto di estremo relativo per f |Σ (punto di estremo relativo di f vincolato a Σ).<br />

Poiché ∇G(P0) = (0,0,0),ilvincoloΣè, inunintornodiP0, ilsostegnodiunasuperficie<br />

regolare φ ≡ φ(u,v), (u,v)∈B, con B aperto di IR 2 ; si sa inoltre che il vettore ∇G(P0)<br />

è normale a Σ in P0 e che, considerato (u0,v0)∈B tale che φ(u0,v0) = P0, i vettori<br />

φu(u0,v0) e φv(u0,v0) individuano il piano tangente a Σ in P0. Ne segue che:<br />

(P0 èpunto diestremo relativoper f |Σ )=⇒ ((u0,v0)èpunto diestremo relativoper F =<br />

f◦φ) =⇒ (Fu(u0,v0) = ∇f(P0)·φu(u0,v0) = 0 e Fv(u0,v0) = ∇f(P0)·φv(u0,v0) = 0)<br />

=⇒ (∇f(P0) è nullo o comunque normale a Σ in P0) =⇒ (∇f(P0) è nullo o comunque<br />

parallelo al vettore ∇G(P0)) =⇒ (∃λ0∈IR tale che ∇f(P0) = λ0∇G(P0)).<br />

(1) In verità la distanza dall’origine sarebbe x 2 +y 2 +z 2 , ma è noto che √ t è minima o<br />

massima quando il valore di t è rispett/te minimo o massimo.<br />

22


Introduciamo ora la funzione lagrangiana associata alle funzioni f e G, L : A×IR →<br />

IR, definita da L(x,y,z,λ) = f(x,y,z) − λG(x,y,z), con il suo moltiplicatore λ, ed<br />

osserviamo che la condizione alla quale siamo pervenuti, unitamente alla condizione che<br />

P0∈Σ, può essere espressa nella forma: ∃λ0∈IR tale che ∇L(P0,λ0) = (0,0,0,0).<br />

Sussiste pertanto il seguente<br />

Teorema F4.6. Siano f,G : A → IR, con A aperto di IR 3 ed f,G ∈ C 1 (A); sia<br />

Σ = {P∈A/G(P) = 0}; sia infine P0∈Σ, con ∇G(P0) = 0. Se P0 è punto di estremo<br />

relativo per f |Σ , allora ∃λ0∈IR tale che ∇L(P0,λ0) = 0.<br />

Pertanto si conclude che, nell’ipotesi che f e G siano di classe C 1 nell’aperto A, i punti<br />

di estremo relativo di f vincolati a Σ vanno ricercati fra i punti singolari di Σ e i punti<br />

P regolari di Σ tali che ∇L(P,λ) sia nullo per qualche λ∈IR. Questi ultimi punti si<br />

dicono punti stazionari di f vincolati a Σ, e non è detto che essi siano necessariamente<br />

punti di estremo relativo per f |Σ .<br />

Chiaramente anche qui vale la considerazione, fatta nelle sezioni precedenti, relativa al<br />

caso in cui f e G sono definite in E non aperto e qualche punto di Σ appartiene a ∂E.<br />

Esempio F4.6. Determiniamo i punti della superficie Σ = {(x,y,z)∈IR 3 /2x−z+1 =<br />

0, 2x 2 +y 2 ≤ 8} aventi distanza minima o massima dall’origine. In sostanza si tratta di<br />

calcolare i punti di Σ nei quali è massima o minima la funzione f(x,y,z) = x 2 +y 2 +z 2 .<br />

Posto Σ ∗ = {(x,y,z) ∈ Σ/2x 2 + y 2 < 8}, si vede che Σ ∗ è l’insieme degli zeri di<br />

G(x,y,z) = 2x−z +1 nell’aperto A = {(x,y,z)∈IR 3 /2x 2 +y 2 < 8}.<br />

Introdotta la funzione L(x,y,z,λ) = f(x,y,z)−λG(x,y,z), si trova<br />

che il gradiente di L è nullo in corrispondenza del punto (−2 1 ,0, 5 5 ).<br />

Detto Γ il bordo di Σ, Γ = Σ\Σ ∗ , si sa (dall’Esempio F4.5) che i pun-<br />

ti stazionari di f vincolati a Γ sono (2,0,5), (−2,0,−3), (− 2<br />

3 ,±8<br />

3 ,−1<br />

3 ).<br />

Dal confronto dei valori di f nei punti trovati si scopre che min Σ f = f(− 2<br />

5<br />

max Σf = f(2,0,5)= 29.<br />

1 1 ,0, 5 ) = 5 e<br />

Esempio F4.7. Calcoliamo minimo e massimo della funzione f(x,y,z) = x+y −2z<br />

sulla superficie Σ = {(x,y,z)∈IR 3 /x 2 +y 2 +z 2 = 6, x,y,z ≥ 0}.<br />

Dapprima si lavora sul vincolo Σ ∗ = {(x,y,z)∈Σ/x,y,z > 0}, che è<br />

la superficie assegnata privata del bordo: introdotta la lagrangiana<br />

L(x,y,z,λ) = x+y −2z −λ(x 2 +y 2 +z 2 −6), si scopre che non esistono<br />

punti stazionari vincolati a Σ ∗ .<br />

Si considera poi Γ ∗ 1 = {(x,y,z)∈Σ/z = 0, x,y > 0}, che è una parte del bordo di Σ.<br />

Ma qui il problema si può ridurre alle sole variabili x ed y: trovare i punti stazionari di<br />

f1(x,y) := f(x,y,0) vincolati a ζ ∗ 1 = {(x,y)∈IR 2 /x 2 +y 2 = 6, x,y > 0}. Introdotta<br />

la lagrangiana L(x,y,λ) = x+y −λ(x 2 +y 2 −6), si trova il punto ( √ 3, √ 3,0).<br />

23


In modo analogo si lavora su Γ ∗ 2 = {(x,y,z)∈Σ/y = 0, x,z > 0} e su Γ ∗ 3 = {(x,y,z)∈<br />

Σ/x = 0, y,z > 0}. Su queste curve non si trovano punti stazionari vincolati.<br />

Confrontando tra loro i valori che f assume nel punto trovato ( √ 3, √ 3,0) e nei vertici<br />

( √ 6,0,0), (0, √ 6,0) e (0,0, √ 6), si evince che min Σ f = f(0,0, √ 6) = −2 √ 6 e max Σ f =<br />

f( √ 3, √ 3,0) = 2 √ 3.<br />

Esempio F4.8. Calcoliamo il minimo ed il massimo della funzione f(x,y,z) = z−x 2 y<br />

nell’insieme Ω = {(x,y,z)∈IR 3 /z ≥ x 2 +y 2 , x 2 +y 2 +z 2 ≤ 2} (vedi l’Esempio F3.5).<br />

<strong>Il</strong>teoremadi Weierstrassgarantiscel’esistenza degliestremi richiesti. Inoltreosserviamo<br />

che Ω è un vincolo di disuguaglianza, ossia un sottoinsieme di IR 3 avente interno non<br />

vuoto. Pertanto la risoluzione del problema va divisa nelle seguenti parti:<br />

a) ricerca dei punti stazionari di f interni ad Ω: si impone che<br />

∇f(x,y,z) = (0,0,0), e non si trova nessuna soluzione;<br />

b) ricerca dei punti stazionari di f vincolati alla superficie<br />

Σ1 = {(x,y,z)∈IR 3 /z = x 2 +y 2 , x 2 +y 2 < 1}: si impone<br />

che ∇L(x,y,z,λ) = (0,0,0,0), con L(x,y,z,λ) = f(x,y,z)−<br />

λ(x 2 +y 2 −z), e si trova il punto (0,0,0);<br />

c) ricerca dei punti stazionari di f vincolati alla superficie Σ2 = {(x,y,z)∈IR 3 /x 2 +<br />

y 2 + z 2 = 2, z > 1}: si impone che ∇L(x,y,z,λ) = (0,0,0,0), con L(x,y,z,λ) =<br />

f(x,y,z)−λ(x 2 +y 2 +z 2 −2), e si trovano i punti (0,0, √ 2) e (±1/ √ 3,−1/ √ 6, √ 6/2);<br />

d) ricerca dei punti stazionari di f vincolati alla curva Γ = {(x,y,z)∈IR 3 /x 2 +y 2 =<br />

1, z = 1}, che è il bordo comune a Σ1 e Σ2: si impone che ∇L(x,y,z,λ,µ) =<br />

(0,0,0,0,0), con L(x,y,z,λ,µ) = f(x,y,z)−λ(x 2 +y 2 −1)−µ(z−1), e si trovano i<br />

punti (0,±1,1), (± 2/3,− 1/3,1) e (± 2/3, 1/3,1).<br />

Osservato che ∂Ω = Σ1 ∪ Σ2 ∪ Γ, concludiamo che gli estremi di f in Ω sono dati<br />

rispettivamentedalpiùpiccoloedalpiùgrandedei valoridi f nei punti cosìdeterminati,<br />

e sono: min Ωf = 0 = f(0,0,0) e max Ωf = √ 2 = f(0,0, √ 2).<br />

•) <strong>Il</strong> teorema dei moltiplicatori di Lagrange nel caso generale.<br />

I tre teoremi trattati nei paragrafi precedenti possono essere interpretati come casi<br />

particolari del teorema che segue, riferito ad una funzione di m variabili su un vincolo<br />

(m−k)–dimensionale contenuto in IR m , con k,m∈IN, k < m.<br />

Teorema F4.4 (dei moltiplicatori di Lagrange). Sia A un aperto di IR m e siano<br />

f ∈ C 1 (A,IR), e G ∈ C 1 (A,IR k ), con 1 ≤ k < m. Sia Γ = {P ∈A/G(P) = 0} e sia<br />

P0∈Γ tale che la matrice DG(P0) abbia rango k. Se P0 è punto di estremo relativo per<br />

f |Γ ,allora,consideratalafunzione L : A×IR k → IR definitada L(P,Λ) = f(P)−Λ·G(P),<br />

esiste Λ0∈IR k tale che ∇L(P0,Λ0) = 0.<br />

24

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!