03.01.2015 Views

Note di Analisi Matematica 2 - Esercizi e Dispense - Università degli ...

Note di Analisi Matematica 2 - Esercizi e Dispense - Università degli ...

Note di Analisi Matematica 2 - Esercizi e Dispense - Università degli ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Annamaria Mazzia<br />

<strong>Note</strong> <strong>di</strong> <strong>Analisi</strong> <strong>Matematica</strong> 2<br />

Università <strong>degli</strong> Stu<strong>di</strong> <strong>di</strong> Padova<br />

corso <strong>di</strong> laurea in Ingegneria E<strong>di</strong>le-Architettura<br />

a.a. 2012-2013<br />

Questo lavoro è pubblicato sotto una Creative Commons Attribution-Noncommercial-No<br />

Derivative Works 2.5 Italy License,<br />

(http://creativecommons.org/licenses/by-nc-nd/2.5/it/)


In<strong>di</strong>ce<br />

In<strong>di</strong>ce<br />

iii<br />

1 Brevi richiami <strong>di</strong> analisi 1 1<br />

1.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1<br />

1.2 Identità trigonometriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1<br />

1.3 Regole su funzione esponenziale e logaritmica . . . . . . . . . . . . . . . . . . . . 2<br />

1.4 Derivate e integrali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2<br />

1.5 Altri teoremi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />

2 Funzioni reali <strong>di</strong> più variabili 7<br />

2.1 Lo spazio R n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />

2.2 Definizioni preliminari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8<br />

2.2.1 Come determinare il dominio <strong>di</strong> una funzione <strong>di</strong> due variabili . . . . . . 9<br />

2.2.2 Sui vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />

2.2.3 Intorno <strong>di</strong> un punto, insieme aperto, chiuso, frontiera... . . . . . . . . . . 13<br />

3 Limiti, continuità, <strong>di</strong>fferenziabilità <strong>di</strong> funzioni <strong>di</strong> più variabili 17<br />

3.1 Limite <strong>di</strong> una funzione <strong>di</strong> più variabili . . . . . . . . . . . . . . . . . . . . . . . . 17<br />

3.2 Continuità <strong>di</strong> una funzione <strong>di</strong> più variabili . . . . . . . . . . . . . . . . . . . . . . 21<br />

3.3 Derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22<br />

3.4 Interpretazione delle derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />

3.5 Derivate parziali <strong>di</strong> or<strong>di</strong>ne più elevato . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />

3.6 Differenziabilità <strong>di</strong> una funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />

3.7 Differenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27<br />

3.8 Derivata <strong>di</strong>rezionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28<br />

3.9 Derivazione nelle funzioni composte . . . . . . . . . . . . . . . . . . . . . . . . . 30<br />

3.10Piano tangente ad una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . 31<br />

3.11Formula <strong>di</strong> Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />

4 Massimi e minimi 35<br />

4.1 Forme quadratiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35<br />

4.2 Massimi e minimi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />

4.3 Ricerca <strong>di</strong> massimi e minimi relativi . . . . . . . . . . . . . . . . . . . . . . . . . 40<br />

4.4 Sui massimi e minimi assoluti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43<br />

4.5 Funzioni implicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45<br />

4.5.1 Equazione <strong>di</strong> una retta e vettore normale alla retta . . . . . . . . . . . . . 47<br />

4.6 Curve <strong>di</strong> livello . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49<br />

4.6.1 Significato del vettore gra<strong>di</strong>ente . . . . . . . . . . . . . . . . . . . . . . . . 50<br />

iii


INDICE<br />

4.7 Estremi vincolati e moltiplicatori <strong>di</strong> Lagrange . . . . . . . . . . . . . . . . . . . . 52<br />

5 Le curve 57<br />

5.1 Equazioni parametriche <strong>di</strong> una curva . . . . . . . . . . . . . . . . . . . . . . . . . 57<br />

5.2 Grafico <strong>di</strong> una curva parametrica . . . . . . . . . . . . . . . . . . . . . . . . . . . 61<br />

5.3 Parametrizzare una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63<br />

5.4 Tangente ad una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63<br />

5.5 Lunghezza <strong>di</strong> un arco <strong>di</strong> funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . 66<br />

5.6 Lunghezza <strong>di</strong> una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67<br />

5.7 La curva cicloide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70<br />

5.8 Sistema <strong>di</strong> coor<strong>di</strong>nate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71<br />

5.9 Curve in coor<strong>di</strong>nate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73<br />

5.9.1 La curva car<strong>di</strong>oide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74<br />

5.10Lunghezza <strong>di</strong> una curva polare . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74<br />

5.10.1Lunghezze <strong>di</strong> alcune curve . . . . . . . . . . . . . . . . . . . . . . . . . . . 75<br />

5.11Funzioni a valori vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79<br />

5.12Le curve riviste come funzioni vettoriali . . . . . . . . . . . . . . . . . . . . . . . 79<br />

5.13Retta tangente ad una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />

5.14Curve orientate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />

5.15Di nuovo sulla lunghezza <strong>di</strong> una curva . . . . . . . . . . . . . . . . . . . . . . . . 80<br />

5.16L’ascissa curvilinea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81<br />

6 Superfici parametriche 83<br />

6.1 Superfici parametriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83<br />

6.1.1 Sistema <strong>di</strong> coor<strong>di</strong>nate sferiche . . . . . . . . . . . . . . . . . . . . . . . . . 85<br />

6.2 Piano tangente a una superficie parametrica . . . . . . . . . . . . . . . . . . . . 87<br />

6.2.1 Equazione <strong>di</strong> un piano e vettore normale al piano . . . . . . . . . . . . . . 87<br />

7 Integrali 91<br />

7.1 Integrali <strong>di</strong>pendenti da parametri . . . . . . . . . . . . . . . . . . . . . . . . . . . 91<br />

7.1.1 Integrali <strong>di</strong>pendenti da parametri per funzioni <strong>di</strong> una sola variabile . . . 91<br />

7.1.2 Integrali <strong>di</strong>pendenti da parametri per funzioni <strong>di</strong> due variabili . . . . . . 92<br />

7.2 Richiamo sugli integrali semplici . . . . . . . . . . . . . . . . . . . . . . . . . . . 93<br />

7.3 Integrali doppi su domini rettangolari . . . . . . . . . . . . . . . . . . . . . . . . . 94<br />

7.4 Integrali iterati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96<br />

7.5 Integrali doppi su domini generali . . . . . . . . . . . . . . . . . . . . . . . . . . . 97<br />

7.6 Proprietà <strong>degli</strong> integrali doppi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101<br />

7.7 Cambiamento <strong>di</strong> variabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102<br />

7.7.1 Significato dello jacobiano . . . . . . . . . . . . . . . . . . . . . . . . . . . 103<br />

7.8 Area <strong>di</strong> un dominio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107<br />

7.9 Cenni su integrali tripli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108<br />

7.10Integrali curvilinei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109<br />

7.11Integrali <strong>di</strong> superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110<br />

7.11.1Area <strong>di</strong> una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110<br />

7.11.2Integrale <strong>di</strong> una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . 111<br />

7.12Soli<strong>di</strong> e superfici <strong>di</strong> rotazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113<br />

8 Equazioni <strong>di</strong>fferenziali or<strong>di</strong>narie 119<br />

8.1 Cosa è un’equazione <strong>di</strong>fferenziale . . . . . . . . . . . . . . . . . . . . . . . . . . 119<br />

8.2 Il problema <strong>di</strong> Cauchy in locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121<br />

8.3 Teorema <strong>di</strong> Cauchy (esistenza e unicità globale) . . . . . . . . . . . . . . . . . . . 122<br />

8.4 Definizioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123<br />

8.5 Equazioni <strong>di</strong>fferenziali lineari del primo or<strong>di</strong>ne . . . . . . . . . . . . . . . . . . . 123<br />

iv


In<strong>di</strong>ce<br />

8.6 Metodo <strong>di</strong> separazione delle variabili . . . . . . . . . . . . . . . . . . . . . . . . . 125<br />

8.7 Risoluzione <strong>di</strong> alcuni tipi <strong>di</strong> equazioni <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . 126<br />

8.8 Le equazioni <strong>di</strong>fferenziali lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127<br />

8.8.1 Cosa è uno spazio vettoriale . . . . . . . . . . . . . . . . . . . . . . . . . . 129<br />

8.9 L’equazione omogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130<br />

8.10L’equazione non omogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131<br />

8.11Equazioni lineari a coefficienti costanti . . . . . . . . . . . . . . . . . . . . . . . . 132<br />

8.12Metodo dei coefficienti indeterminati . . . . . . . . . . . . . . . . . . . . . . . . . 135<br />

9 Forme <strong>di</strong>fferenziali 139<br />

9.1 Introduzione alle forme <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . . . . . . . . . 139<br />

9.2 Integrali delle forme <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140<br />

9.3 Applicazione delle forme <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . . . . . . . . 143<br />

9.4 Teorema fondamentale per gli integrali curvilinei . . . . . . . . . . . . . . . . . . 144<br />

9.5 Forme <strong>di</strong>fferenziali lineari esatte . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144<br />

9.6 Le forme <strong>di</strong>fferenziali lineari chiuse . . . . . . . . . . . . . . . . . . . . . . . . . . 149<br />

Bibliografia 151<br />

v


CAPITOLO 1<br />

Brevi richiami <strong>di</strong> analisi 1<br />

La teoria attrae la pratica<br />

come il magnete attrae il ferro.<br />

Carl Friedrich Gauss<br />

1.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1<br />

1.2 Identità trigonometriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1<br />

1.3 Regole su funzione esponenziale e logaritmica . . . . . . . . . . . . . . . . . . . . . 2<br />

1.4 Derivate e integrali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2<br />

1.5 Altri teoremi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />

1.1 Introduzione<br />

Quando si descrivono teoremi, si danno definizioni o, semplicemente, si <strong>di</strong>scute <strong>di</strong><br />

matematica, è abbastanza usuale prendere in prestito lettere dell’alfabeto greco.<br />

È importante, quin<strong>di</strong>, saperle riconoscere e chiamarle in maniera corretta:<br />

A α Alfa N ν Nu<br />

B β Beta Ξ ξ Xi<br />

Γ γ Gamma O o Omicron<br />

∆ δ Delta Π π Pi<br />

E ɛ Epsilon P ρ Rho<br />

Z ζ Zeta Σ σ Sigma<br />

H η Eta T τ Tau<br />

Θ θ Theta Υ υ Upsilon<br />

I ι Iota Φ φ Fi<br />

K κ Kappa X χ Chi<br />

Λ λ Lambda Ψ ψ Psi<br />

M µ Mu Ω ω Omega<br />

1.2 Identità trigonometriche<br />

Nel seguito introduciamo alcune formule trigonometriche, con la notazione:<br />

G sin (x) ≡ seno(x), cos (x) ≡ coseno(x),<br />

sin (x)<br />

G tan (x) ≡ tangente(x) =<br />

cos (x) , sec (x) ≡ secante(x) = 1<br />

cos (x) ,<br />

1


1. BREVI RICHIAMI DI ANALISI 1<br />

cos (−θ) = cos (θ)<br />

cos ( π 2<br />

− θ) = sin (θ)<br />

sin<br />

cos ( π 2<br />

+ θ) = − sin (θ)<br />

sin<br />

cos (π − θ) = − cos (θ)<br />

cos (π + θ) = − cos (θ)<br />

cos (θ + φ) = cos (θ) cos (φ) − sin (θ) sin (φ)<br />

sin (2θ) = 2 sin (θ) cos (θ)<br />

sin 2 (θ) + cos 2 (θ) = 1<br />

sin (−θ) = − sin (θ)<br />

( π<br />

2<br />

− θ) = cos (θ)<br />

( π<br />

2<br />

+ θ) = cos (θ)<br />

sin (π − θ) = sin (θ)<br />

sin (π + θ) = − sin (θ)<br />

sin (θ + φ) = sin (θ) cos (φ) + cos (θ) sin (φ)<br />

cos (2θ) = cos 2 (θ) − sin 2 (θ)<br />

tan 2 (θ) + 1 = sec 2 (θ)<br />

1.3 Regole su funzione esponenziale e logaritmica<br />

Assumiano a, b ∈ R, con a > 0 e b > 0. Si ha:<br />

1 x = 1<br />

a x+y = a x a y<br />

a xy = (a x ) y<br />

a log a (x) = x a 0 = 1<br />

a x−y = a x /a y<br />

a x b x = (ab) x<br />

log a (xy) = log a (x) + log a (y) log a (x/y) = log a (x) − log a (y)<br />

log a (x y ) = y log a (x)<br />

log a (a x ) = x<br />

log b (x) = log a (x)<br />

log a (b)<br />

b x = a x log a (b)<br />

1.4 Derivate e integrali<br />

Siano f e g due funzioni <strong>di</strong>pendenti dalla variabile reale x mentre c ∈ R sia una costante.<br />

In<strong>di</strong>chiamo la derivata <strong>di</strong> f con il simbolo df<br />

dx o me<strong>di</strong>ante f ′ . Si ha:<br />

d (cf)<br />

d x = cf ′ regola della costante<br />

d (f + g)<br />

= d f<br />

d x + d g<br />

d x<br />

regola della somma<br />

d x<br />

d (f/g)<br />

= f ′ g − fg ′<br />

d x g 2 regola del quoziente<br />

d (fg)<br />

d x = fg′ + f ′ g regola del prodotto<br />

d f r<br />

d x = rf r−1 f ′<br />

regola della potenza<br />

Tra le regole <strong>di</strong> integrazione, invece, ricor<strong>di</strong>amo quella <strong>di</strong> integrazione per parti:<br />

∫<br />

∫<br />

fg ′ dx = fg − f ′ g dx<br />

Diamo ora una tabella delle derivate e <strong>degli</strong> integrali delle funzioni più note (per gli integrali<br />

lasciamo fuori la costante <strong>di</strong> integrazione), e con la simbologia arcsin(x) ≡ arcoseno(x),<br />

arccos(x) ≡ arcocoseno(x), cot(x) ≡ cotangente (x), arctan(x) ≡ arcotangente(x), arccot(x) ≡,<br />

arcocotangente(x).<br />

2


1.5. Altri teoremi<br />

f f ′ f f ′<br />

1<br />

ln(x)<br />

e x e x<br />

x<br />

sin (x) cos (x) cos (x) − sin (x)<br />

1<br />

tan (x)<br />

cos 2 (x) (= sec2 (x)) cot (x) − 1<br />

sin 2 (x)<br />

1<br />

1<br />

1<br />

1<br />

tan (x)<br />

− cot (x)<br />

cos (x)<br />

cos (x)<br />

sin (x)<br />

sin (x)<br />

1<br />

1<br />

arcsin (x) √ arccos (x) −√ 1 − x<br />

2<br />

1 − x<br />

2<br />

1<br />

arctan (x)<br />

1 + x 2 arccot(x) − 1<br />

1 + x 2<br />

f<br />

x r x r+1<br />

∫<br />

fd x f<br />

∫<br />

fd x<br />

r + 1 (r ≠ 1) x−1 ln |x|<br />

e x e x ln |x| x ln |x| − x<br />

sin (x) − cos (x) cos (x) sin (x)<br />

tan (x)<br />

1<br />

ln | |<br />

cos (x)<br />

cot (x) ln | sin (x)|<br />

1<br />

cos (x)<br />

1<br />

ln |<br />

cos (x) + tan (x)| 1<br />

sin (x)<br />

1<br />

ln | + cot (x)|<br />

sin (x)<br />

1<br />

cos 2 (x)<br />

tan (x)<br />

1<br />

sin 2 (x)<br />

− cot (x)<br />

tan (x)<br />

cos (x)<br />

1<br />

cos (x)<br />

cot (x)<br />

sin (x)<br />

− 1<br />

sin (x)<br />

arcsin (x) x arcsin (x) + √ 1 − x 2 arccos (x) x arccos (x) − √ 1 − x 2<br />

arctan (x) x arctan (x) − 1 2 ln (1 + x2 ) arccot(x) xarccot(x) − 1 2 ln (1 + x2 )<br />

1<br />

1<br />

√ arcsin (x)<br />

1 − x<br />

2<br />

1 + x 2 arctan (x)<br />

1.5 Altri teoremi<br />

Richiamiamo, nel seguito, alcuni teoremi.<br />

Utilizzeremo, inoltre, le seguenti notazioni per funzioni <strong>di</strong> una sola variabile definite in un<br />

insieme X ⊂ R. L’insieme delle funzioni continue in X verrà denotato con il simbolo C(X).<br />

L’insieme delle funzioni continue in X, che hanno le prime n derivate pure esse continue,<br />

sarà in<strong>di</strong>cato con C n (X).<br />

3


1. BREVI RICHIAMI DI ANALISI 1<br />

Teorema 1.5.1 (<strong>di</strong> Rolle) a<br />

Sia f ∈ C([a, b]) e <strong>di</strong>fferenziabile in ]a, b[.<br />

Se f(a) = f(b) = 0, allora esiste un punto<br />

ξ ∈]a, b[ tale che f ′ (ξ) = 0<br />

a Michel Rolle (1652- 1719) fu un matematico<br />

francese. È conosciuto per il teorema che porta il<br />

suo nome. Si deve a lui la notazione della ra<strong>di</strong>ce<br />

n-sima per mezzo del simbolo n√ x.<br />

Teorema 1.5.2 (del Valor Me<strong>di</strong>o) Sia<br />

f ∈ C([a, b]) e <strong>di</strong>fferenziabile in ]a, b[,<br />

allora esiste un punto ξ ∈]a, b[ tale che<br />

f ′ f(b) − f(a)<br />

(ξ) =<br />

b − a<br />

Teorema 1.5.3 (del Valore Interme<strong>di</strong>o)<br />

Sia f ∈ C([a, b]) e sia K un valore compreso<br />

tra f(a) e f(b). Allora esiste almeno un<br />

punto ξ ∈]a, b[ tale che f(ξ) = K.<br />

Quin<strong>di</strong> per funzioni continue, un valore compreso tra i due estremi dell’insieme <strong>di</strong><br />

definizione, è un valore assunto dalla funzione stessa (in uno o più punti).<br />

Come conseguenza <strong>di</strong> questo teorema, se f(a)f(b) < 0 (la funzione assume segno opposto<br />

agli estremi dell’intervallo [a, b]) allora esiste almeno un punto ξ tale che f(ξ) = 0, cioè esiste<br />

almeno una ra<strong>di</strong>ce dell’equazione f(x) = 0 nell’intervallo [a, b].<br />

Teorema 1.5.4 (Esistenza del punto fisso) Data una funzione g definita in [a, b], continua e<br />

tale che a ≤ g(x) ≤ b per ogni x ∈ [a, b], allora g ammette almeno un punto fisso.<br />

Dimostrazione. Dire che una funzione g ammette almeno un punto fisso, vuol <strong>di</strong>re che<br />

esiste almeno un punto ξ nel suo insieme <strong>di</strong> definizione, tale che g(ξ) = ξ.<br />

Dalle ipotesi del teorema, i valori della funzione g sono contenuti nell’intervallo [a, b] e, in<br />

particolare a ≤ g(a) ≤ b e a ≤ g(b) ≤ b. Definiamo, perciò, la funzione continua Φ(x) me<strong>di</strong>ante<br />

la relazione<br />

Φ(x) = g(x) − x<br />

Allora Φ(a) = g(a) − a > 0 e Φ(b) = g(b) − b < 0. Per il Teorema del Valore Interme<strong>di</strong>o esiste<br />

almeno un punto ξ ∈]a, b[ tale che Φ(ξ) = 0, vale a <strong>di</strong>re g(ξ) − ξ = 0, cioè g(ξ) = ξ. Esiste<br />

almeno un punto fisso per la funzione g. ✔<br />

4


1.5. Altri teoremi<br />

Teorema 1.5.5 (Esistenza e unicità del punto fisso) Data una funzione g <strong>di</strong> classe C 1 in<br />

[a, b], con a ≤ g(x) ≤ b per ogni x ∈ [a, b], e con |g ′ (x)| ≤ m < 1 per ogni x ∈ [a, b] allora esiste ed è<br />

unico il punto fisso della g in tale intervallo.<br />

Dimostrazione. L’esistenza <strong>di</strong> almeno un punto fisso è assicurata dal teorema precedente<br />

(le ipotesi del teorema precedente ci sono tutte). Supponiamo, allora, che esistano due<br />

punti fissi ξ e η, con ξ ≠ η, per la funzione g. Si ha<br />

|ξ − η| = |g(ξ) − g(η)|<br />

Applicando il teorema del Valor Me<strong>di</strong>o, esiste un punto c compreso tra ξ e η per cui<br />

|g(ξ) − g(η)| = |g ′ (c)(ξ − η)| ≤ |g ′ (c)||ξ − η|<br />

Ma per ipotesi |g ′ (c)| ≤ m < 1 da cui<br />

|ξ − η| ≤ m|ξ − η| < |ξ − η|<br />

Si arriva ad una contrad<strong>di</strong>zione. L’assurdo deriva dall’aver supposto ξ ≠ η. Quin<strong>di</strong> ξ = η e il<br />

punto fisso è unico. ✔<br />

Teorema 1.5.6 (del Valor Me<strong>di</strong>o del Calcolo Integrale) Se f ∈ C([a, b]) e g è integrabile in<br />

[a, b] e g(x) non cambia segno in [a, b], allora esiste un punto ξ ∈]a, b[ tale che<br />

∫ b<br />

a<br />

f(x)g(x) d x = f(ξ)<br />

∫ b<br />

a<br />

g(x) d x<br />

Per g ≡ 1, questo teorema ci dà il valore me<strong>di</strong>o della funzione f sull’intervallo [a, b], dato<br />

da f(ξ) = 1 ∫ b<br />

b − a<br />

a f(x) d x<br />

Teorema 1.5.7 (<strong>di</strong> Rolle generalizzato) Sia f ∈ C([a, b]) n volte <strong>di</strong>fferenziabile in ]a, b[. Se f<br />

si annulla in n + 1 punti <strong>di</strong>stinti x 0 , x 1 , . . . , x n in ]a, b[, allora esiste un punto ξ ∈]a, b[ in cui la<br />

derivata n-sima della f si annulla: f (n) (ξ) = 0.<br />

Teorema 1.5.8 (Formula <strong>di</strong> Taylor) 1<br />

Sia f ∈ C 2 ([a, b]) e sia x 0 un punto dell’intervallo [a, b]. Allora, per qualunque x ∈ [a, b] si può<br />

scrivere:<br />

f(x) = f(x 0 ) + f ′ (x 0 )(x − x 0 ) + (x − x 0) 2<br />

f ′′ (ξ x )<br />

2<br />

dove ξ x è un opportuno punto <strong>di</strong> [a, b] che si trova sul segmento in<strong>di</strong>viduato da x 0 e x.<br />

La formula appena scritta si <strong>di</strong>ce formula <strong>di</strong> Taylor <strong>di</strong> centro x 0 nel punto x.<br />

La formula <strong>di</strong> Taylor appena scritta si può generalizzare se la funzione f è derivabile n + 1<br />

volte. Si ha così la formula polinomiale <strong>di</strong> Taylor <strong>di</strong> centro x 0 :<br />

dove<br />

f(x) = f(x 0 ) + f ′ (x 0 )(x − x 0 ) + f ′′ (x 0 )<br />

2!<br />

R n (x) = f (n+1) (ξ x )<br />

(x − x 0 ) n+1<br />

(n + 1)!<br />

(x − x 0 ) 2 + . . . + f (n) (x 0 )<br />

(x − x 0 ) n + R n<br />

n!<br />

con ξ x un opportuno punto <strong>di</strong> [a, b] che si trova sul segmento in<strong>di</strong>viduato da x 0 e x.<br />

1 Brook Taylor (1685 - 1731) fu un matematico inglese che sviluppò quello che oggi è chiamato calcolo delle<br />

<strong>di</strong>fferenze finite. L’importanza del suo lavoro e, soprattutto, della formula conosciuta oggi con il suo nome, venne<br />

riconosciuta solo nel 1772 da Lagrange.<br />

5


CAPITOLO 2<br />

Funzioni reali <strong>di</strong> più variabili<br />

La facoltà che mette in moto<br />

l’invenzione matematica non è<br />

il ragionamento, bensì<br />

l’immaginazione.<br />

Augustus De Morgan<br />

(1806-1871)<br />

2.1 Lo spazio R n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />

2.2 Definizioni preliminari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8<br />

2.2.1 Come determinare il dominio <strong>di</strong> una funzione <strong>di</strong> due variabili . . . . . . . 9<br />

2.2.2 Sui vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />

2.2.3 Intorno <strong>di</strong> un punto, insieme aperto, chiuso, frontiera... . . . . . . . . . . . 13<br />

2.1 Lo spazio R n<br />

Dallo stu<strong>di</strong>o <strong>di</strong> funzioni reali <strong>di</strong> variabili reali f : R −→ R che alla variabile x ∈ R associa<br />

il valore f(x) ∈ R, passiamo a stu<strong>di</strong>are funzioni reali <strong>di</strong> più variabili: non c’è più una sola<br />

variabile x come variabile <strong>di</strong> input della nostra funzione, ma possiamo avere due o più<br />

variabili <strong>di</strong> input mentre il valore che assume la funzione rimane un valore reale (detto<br />

anche scalare).<br />

Se (x, y) è la coppia <strong>di</strong> variabili, ciascuna delle quali varia in R, possiamo definire una<br />

funzione f che alla coppia (x, y) associa il valore f(x, y).<br />

Analogamente, data la terna <strong>di</strong> variabili reali (x, y, z), si può definire una funzione f che,<br />

in corrispondenza <strong>di</strong> (x, y, z), assume il valore reale f(x, y, z),<br />

Il <strong>di</strong>scorso si può generalizzare con una n−nupla <strong>di</strong> valori (x 1 , x 2 , . . . , x n ) introducendo<br />

una funzione f che, per ogni n−nupla (x 1 , x 2 , . . . , x n ) associa il valore reale f(x 1 , x 2 , . . . , x n ).<br />

Introduciamo, dunque, lo spazio R n , dove n è un intero naturale, per definire lo spazio a<br />

n <strong>di</strong>mensioni.<br />

Un punto P ∈ R n è definito da una n−nupla or<strong>di</strong>nata <strong>di</strong> numeri reali (x 1 , x 2 , . . . , x n ).<br />

Ciascun valore x i , i = 1, 2, . . . , n, prende il nome <strong>di</strong> coor<strong>di</strong>nata i−sima del punto P . Data<br />

una funzione f definita in R n , possiamo scrivere f(x 1 , x 2 , . . . , x n ) o f(P ) per <strong>di</strong>re che stiamo<br />

valutando la funzione nel punto P .<br />

G Per n = 1 si ha lo spazio reale R. I punti che vi appartengono prendono anche il nome<br />

<strong>di</strong> scalari.<br />

G Per n = 2 si ha lo spazio R 2 e il generico punto è in<strong>di</strong>cato me<strong>di</strong>ante la coppia (x, y) (x<br />

prende il nome <strong>di</strong> ascissa del punto, mentre y è l’or<strong>di</strong>nata del punto).<br />

7


2. FUNZIONI REALI DI PIÙ VARIABILI<br />

Figura 2.1: Grafici delle tre funzioni f 1 , f 2 e f 3 .<br />

G Per n = 3 si ha lo spazio R 3 e il generico punto è in<strong>di</strong>cato me<strong>di</strong>ante la coppia (x, y, z),<br />

rispettivamente ascissa, or<strong>di</strong>nata e quota del punto.<br />

Esempi <strong>di</strong> funzioni <strong>di</strong> più variabili in R 2 sono:<br />

G f 1 (x, y) = x + y<br />

G f 2 (x, y) = |x| + |y|<br />

G f 3 (x, y) = (x + y) cos (x + y)<br />

Di queste funzioni è possibile fare il grafico: così come una funzione reale <strong>di</strong> una variabile<br />

reale genera una curva nello spazio R 2 una funzione reale <strong>di</strong> due variabili reali genera una<br />

superficie nello spazio R 3 .<br />

Per il grafico <strong>di</strong> funzioni reali <strong>di</strong> tre o più variabili reali il <strong>di</strong>scorso si complica perchè<br />

va fatto in uno spazio che ha una <strong>di</strong>mensione in più rispetto a quello <strong>di</strong> partenza (che non<br />

riusciamo quin<strong>di</strong> a visualizzare). In tal caso il grafico genera un’ipersuperficie. Esempi <strong>di</strong><br />

funzioni reali in R 3 sono:<br />

G f 1 (x, y, z) = x 3 + xyz + y 2 + z<br />

G f 2 (x, y, z) = sin (xyz)<br />

G f 3 (x, y, z) = e x+y+z<br />

2.2 Definizioni preliminari<br />

Come per le funzioni <strong>di</strong> una sola variabile reale (funzioni scalari) sono stati definiti e<br />

analizzati i concetti <strong>di</strong> continuità, <strong>di</strong>fferenziabilità, limite, integrale e derivata, anche per le<br />

funzioni <strong>di</strong> più variabili possono essere fatti gli analoghi stu<strong>di</strong>.<br />

A tale scopo, dobbiamo introdurre alcune definizioni (che valgono in generale per uno<br />

spazio R n ma che noi vedremo poi in particolare per gli spazi R 2 e R 3 )<br />

Definizione 2.2.1 Si definisce funzione <strong>di</strong> n variabili reali una legge che assegna un unico<br />

numero reale f(x 1 , x 2 , . . . , x n ) ∈ R a ciascun punto (x 1 , x 2 , . . . , x n ) contenuto in un sottoinsieme<br />

D(f) <strong>di</strong> R n . L’insieme dei punti D(f) prende il nome <strong>di</strong> insieme <strong>di</strong> definizione o dominio della<br />

funzione f. L’insieme <strong>di</strong> tutti i numeri reali f(x 1 , x 2 , . . . , x n ) al variare dei punti nel dominio<br />

prende il nome <strong>di</strong> insieme dei valori o codominio della f (o range, per usare il termine matematico<br />

inglese) e si denota con R(f) oppure con f(A) se il dominio della funzione è stato in<strong>di</strong>cato<br />

con l’insieme A.<br />

Per in<strong>di</strong>care una funzione f si possono usare le seguenti scritture:<br />

f : D(f) −→ R(f) dove D(f) ⊂ R n , R(f) ⊂ R<br />

f : A −→ B dove A ⊂ R n , B ⊂ R, f(A) ⊂ B<br />

Per funzioni <strong>di</strong> una variabile reale, è usuale in<strong>di</strong>care la funzione con la notazione y = f(x),<br />

dal momento che il valore della funzione viene rappresentato sull’asse delle y nel piano<br />

8


2.2. Definizioni preliminari<br />

Figura 2.2: Rappresentazione grafica <strong>di</strong> una generica funzione <strong>di</strong> due variabili reali f(x, y).<br />

cartesiano xy. Alla stessa maniera, è usuale in<strong>di</strong>care funzioni reali <strong>di</strong> due variabili reali<br />

me<strong>di</strong>ante la notazione z = f(x, y), visto che il valore <strong>di</strong> questa funzione viene rappresentato<br />

sull’asse delle z. Per quanto riguarda il grafico <strong>di</strong> una funzione f in R 2 , si può dare la<br />

seguente definizione:<br />

Definizione 2.2.2 Data una funzione f : D(f) −→ R(f) in R 2 , il grafico ad essa associato è<br />

dato dall’insieme<br />

{<br />

}<br />

G(f) = (x, y, z) ∈ R 3 : (x, y) ∈ D(f), z = f(x, y)<br />

In Figura 2.2 è rappresentato il grafico <strong>di</strong> una generica funzione <strong>di</strong> due variabili reali, nello<br />

spazio R 2 . I valori della funzione sono rappresentati sull’asse delle z, dove in rosso è rappresentato<br />

l’insieme dei valori della funzione R(f), mentre sul piano xy, in blu, è rappresentato<br />

l’insieme <strong>di</strong> definizione D(f). Generalmente, il dominio <strong>di</strong> una funzione <strong>di</strong> due variabili può<br />

essere o l’intero spazio R 2 o un suo sottoinsieme (come nella Figura 2.2).<br />

A volte, il dominio <strong>di</strong> una funzione non è specificato. Come capire qual è l’insieme dei<br />

punti per i quali la funzione f esiste Ci soffermiamo sul caso <strong>di</strong> una funzione definita in<br />

R 2 .<br />

2.2.1 Come determinare il dominio <strong>di</strong> una funzione <strong>di</strong> due variabili<br />

Come regola generale, se è data una funzione f(x, y) ma non vi è nessuna informazione sul<br />

dominio, allora il dominio sarà dato da tutti i punti del piano xy ad eccezione (o escludendo)<br />

quei punti (se ce ne sono) nei quali la funzione non può essere definita. Sono due le situazioni<br />

in cui una funzione f non può essere definita in un punto (x 0 , y 0 ): se il valore f(x 0 , y 0 ) non è<br />

un numero reale o se la funzione in (x 0 , y 0 ) assumerebbe valori ±∞.<br />

Ve<strong>di</strong>amo <strong>degli</strong> esempi.<br />

9


2. FUNZIONI REALI DI PIÙ VARIABILI<br />

(<br />

Figura 2.3: Grafico della funzione z = f(x, y) = 5 1 − x 4 − y )<br />

.<br />

8<br />

Esempio<br />

Es. 2.2.1 Sia data la funzione z = f(x, y) = x 3 + x 2 y. Questa funzione è ben definita per<br />

tutti i valori <strong>di</strong> x e y perchè qualunque sia la coppia (x, y), la funzione assume sempre<br />

valori reali. Quin<strong>di</strong> f è definita in tutto R 2 .<br />

Esempio<br />

(<br />

Es. 2.2.2 Sia ora z = f(x, y) = 5 1 − x 4 − y )<br />

per 0 ≤ x ≤ 2 e per 0 ≤ y ≤ 8 − 4x.<br />

8<br />

In tal caso la funzione è assegnata su uno specifico dominio, quin<strong>di</strong>, anche se la funzione<br />

è ben definita per tutti i valori <strong>di</strong> x e <strong>di</strong> y, il dominio in cui va stu<strong>di</strong>ata, in questo esempio,<br />

è quello dato, vale a <strong>di</strong>re per x ∈ [0, 2], e per y che varia nell’intervallo [0, 8] quando x = 0,<br />

mentre y = 0 quando x = 2. Ciò significa che l’insieme <strong>di</strong> definizione è dato dal triangolo<br />

<strong>di</strong> estremi (0, 0), (0, 8) e (2, 0) (si veda Figura 2.3).<br />

Esempio<br />

Es. 2.2.3 Ve<strong>di</strong>amo ora la funzione z = f(x, y) = √ 16 − x 2 − y 2 .<br />

Questa funzione è ben definita solo quando l’espressione sotto ra<strong>di</strong>ce è non negativa.<br />

Perciò il suo dominio è dato dai punti (x,y) che sod<strong>di</strong>sfano la con<strong>di</strong>zione<br />

16 − x 2 − y 2 ≥ 0 ⇐⇒ x 2 + y 2 ≤ 16<br />

Questa con<strong>di</strong>zione definisce il dominio: si tratta del cerchio <strong>di</strong> centro l’origine e raggio 4<br />

nel piano xy. Infatti √ x 2 + y 2 è la definizione <strong>di</strong> <strong>di</strong>stanza <strong>di</strong> un punto (x, y) dall’origine<br />

del piano, da cui la con<strong>di</strong>zione x 2 + y 2 ≤ 16 è equivalente a √ x 2 + y 2 ≤ 4 ovvero l’insieme<br />

dei punti la cui <strong>di</strong>stanza dall’origine è minore o uguale a 4, vale a <strong>di</strong>re il cerchio <strong>di</strong> centro<br />

l’origine e raggio 4. Il grafico <strong>di</strong> questa funzione è una semisfera nel semipiano per z ≥ 0.<br />

10


2.2. Definizioni preliminari<br />

Esempio<br />

Es. 2.2.4 Sia z = f(x, y) = 10 . In tal caso, il dominio non è specificato ma ci accorgiamo<br />

subito che la funzione, per essere definita, deve avere il denominatore <strong>di</strong>verso da<br />

x − y<br />

zero. Quin<strong>di</strong> la funzione non è definita per x = y. Il dominio della f è dunque tutto il<br />

piano xy privato della retta x = y.<br />

Per poter andare avanti nello stu<strong>di</strong>o delle funzioni, dobbiamo riprendere o generalizzare<br />

altri concetti <strong>di</strong> base. Incominciamo dai vettori.<br />

2.2.2 Sui vettori<br />

Un punto P ∈ R n può essere visto anche come vettore <strong>di</strong> R n . Abbiamo infatti la seguente<br />

definizione<br />

Definizione 2.2.3 Un vettore <strong>di</strong> R n è un’n−nupla or<strong>di</strong>nata <strong>di</strong> numeri reali.<br />

Un vettore lo si in<strong>di</strong>ca me<strong>di</strong>ante il simbolo ⃗x. Quin<strong>di</strong> ⃗x è definito me<strong>di</strong>ante (x 1 , x 2 , . . . , x n ).<br />

Una funzione che generalizza ai vettori il valore assoluto <strong>di</strong> un numero reale prende il<br />

nome <strong>di</strong> norma. Esistono <strong>di</strong>versi tipi <strong>di</strong> norme. Noi consideriamo la norma euclidea e la<br />

chiameremo brevemente norma o modulo. Abbiamo la seguente definizione.<br />

Definizione 2.2.4 Dato un vettore ⃗x ∈ R n , si definisce modulo (o norma euclidea <strong>di</strong> ⃗x) la<br />

quantità scalare data da<br />

∑<br />

|⃗x| = √ n (x i ) 2<br />

i=1<br />

(con il simbolo ∑ n<br />

i=1 (x i) 2 in<strong>di</strong>chiamo la somma (x 1 ) 2 + (x 2 ) 2 + . . . (x n ) 2 ).<br />

Definizione 2.2.5 Dati due vettori ⃗x e ⃗y in R n si definisce <strong>di</strong>stanza tra i due vettori la quantità<br />

|⃗x − ⃗y|.<br />

Geometricamente, la <strong>di</strong>stanza tra due vettori non è altro che la <strong>di</strong>stanza euclidea tra due<br />

punti.<br />

Esempio<br />

Es. 2.2.5 Siano dati i due vettori ⃗p = (7, 1) e ⃗q = (3, 4). La <strong>di</strong>stanza tra i due vettori è<br />

data da<br />

|⃗p − ⃗q| = √ (7 − 3) 2 + (1 − 4) 2 = √ 16 + 9 = √ 25 = 5<br />

Se ve<strong>di</strong>amo i due vettori come i punti del piano P e Q che hanno coor<strong>di</strong>nate rispettivamente<br />

(7, 1) e (3, 4) e vogliamo calcolare la <strong>di</strong>stanza tra i due punti, dobbiamo applicare<br />

esattamente la stessa formula (si veda Figura 2.4).<br />

Quin<strong>di</strong> due punti nello spazio R n possono essere visti come vettori e viceversa. Di conseguenza,<br />

in R 2 o R 3 , quella che per noi è la <strong>di</strong>stanza tra due punti P e Q, e che ricaviamo<br />

applicando il teorema <strong>di</strong> Pitagora, può essere vista come la <strong>di</strong>stanza tra i due vettori.<br />

Presi due punti P e Q in R n possiamo fare P + Q o P − Q considerandoli come vettori e<br />

quin<strong>di</strong> sommando o facendo la <strong>di</strong>fferenza delle componenti omonime dei punti-vettori. Tutte<br />

le operazioni che possiamo fare tra vettori si ripetono tra punti.<br />

11


2. FUNZIONI REALI DI PIÙ VARIABILI<br />

Figura 2.4: Distanza tra due vettori ⃗p e ⃗q o <strong>di</strong>stanza tra due punti P e Q.<br />

Figura 2.5: A sinistra: somma e <strong>di</strong>fferenza tra punti in R 2 . A destra: prodotto <strong>di</strong> uno scalare<br />

per un punto. I vettori αQ, βQ, γQ e δQ sono messi sfalsati per ragioni pratiche <strong>di</strong> visibilità<br />

ma sono sulla stessa linea.<br />

Esempio<br />

Es. 2.2.6 Siano dati i due punti <strong>di</strong> R n , P (p 1 , p 2 , . . . , p n ) e Q(q 1 , q 2 , . . . , q n ) (usiamo questa<br />

notazione per rappresentare il punto P (o Q) <strong>di</strong> coor<strong>di</strong>nate (p 1 , p 2 , . . . , p n ) (o (q 1 , q 2 , . . . , q n )).<br />

Allora il punto P + Q ha componenti (p 1 + q 1 , p 2 + q 2 , . . . , p n + q n ), mentre il punto P − Q è<br />

dato da (p 1 − q 1 , p 2 − q 2 , . . . , p n − q n ).<br />

Dato uno scalare α, il punto αP è dato da (αp 1 , αp 2 , . . . , αp n ).<br />

Si veda Figura 2.5 per vedere l’interpretazione geometrica lavorando tra vettori.<br />

Definizione 2.2.6 Dati due vettori ⃗x e ⃗y, si definisce prodotto scalare tra i due vettori il numero<br />

reale in<strong>di</strong>cato con il simbolo ⃗x · ⃗y dato da<br />

12<br />

⃗x · ⃗y =<br />

n∑<br />

x i y i<br />

i=1


2.2. Definizioni preliminari<br />

Figura 2.6: Intervallo aperto ]a 1 , a 2 ]×]b 1 , b 2 [<br />

Figura 2.7: Esempio <strong>di</strong> insieme limitato in R 2 .<br />

2.2.3 Intorno <strong>di</strong> un punto, insieme aperto, chiuso, frontiera...<br />

Definizione 2.2.7 Dati due punti <strong>di</strong> R n , A (a 1 , a 2 , . . . , a n ) e B (b 1 , b 2 , . . . , b n ), con a i < b i (per<br />

i = 1, 2, . . . , n), si definisce intervallo aperto <strong>di</strong> R n <strong>di</strong> vertici A e B l’insieme dato da<br />

T = {P ∈ R n <strong>di</strong> coor<strong>di</strong>nate (x 1 , x 2 , . . . , x n ) t. c. a i < x i < b i , i = 1, 2, . . . , n}<br />

In R 2 un intervallo aperto <strong>di</strong> vertici A e B è dato dal rettangolo i cui punti (x, y) sono<br />

presi, rispettivamente, negli intervalli aperti ]a 1 , a 2 [ e ]b 1 , b 2 [, che possiamo in<strong>di</strong>care come<br />

]a 1 , a 2 ]×]b 1 , b 2 [ (si veda Figura 2.6)<br />

Definizione 2.2.8 I ⊂ R n si definisce insieme limitato <strong>di</strong> R n se esiste un intervallo aperto che<br />

lo contiene.<br />

Passiamo ora a considerare l’intorno <strong>di</strong> un punto. In R sappiamo che vale la seguente<br />

definizione.<br />

Definizione 2.2.9 Dato x 0 ∈ R e ɛ > 0, l’insieme dei punti x sull’asse reale che hanno <strong>di</strong>stanza<br />

da x 0 minore <strong>di</strong> ɛ è un intervallo aperto <strong>di</strong> centro x 0 e raggio ɛ che prende il nome <strong>di</strong> intorno <strong>di</strong><br />

13


2. FUNZIONI REALI DI PIÙ VARIABILI<br />

x 0 . Se in<strong>di</strong>chiamo con A ɛ (x 0 ) questo insieme, possiamo <strong>di</strong>re che<br />

A ɛ (x 0 ) = {x ∈ R : |x − x 0 | < ɛ}<br />

Generalizziamo questa definizione in R n .<br />

Definizione 2.2.10 Dato P 0 ∈ R n e ɛ > 0, l’insieme dei punti P <strong>di</strong> R n che hanno <strong>di</strong>stanza da<br />

P 0 minore <strong>di</strong> ɛ prende il nome <strong>di</strong> intorno circolare <strong>di</strong> centro P 0 e raggio ɛ.<br />

In<strong>di</strong>chiamo con A ɛ (P 0 ) questo insieme, possiamo <strong>di</strong>re che<br />

A ɛ (P 0 ) = {P ∈ R n : |P − P 0 | < ɛ}<br />

G In R 2 , considerando P 0 (x 0 , y 0 ), e il generico punto P (x, y) si ha<br />

{<br />

A ɛ (P 0 ) = P (x, y) ∈ R 2 : √ }<br />

(x − x 0 ) 2 + (y − y 0 ) 2 < ɛ<br />

Osserviamo che l’equazione<br />

(x − x 0 ) 2 + (y − y 0 ) 2 = ɛ 2<br />

rappresenta l’equazione <strong>di</strong> una circonferenza <strong>di</strong> centro il punto (x 0 , y 0 ) e raggio ɛ. Quin<strong>di</strong><br />

l’intorno <strong>di</strong> (x 0 , y 0 ) è dato da tutti i punti contenuti all’interno della circonferenza (nel<br />

cerchio), ma non i punti che si trovano sulla circonferenza.<br />

G In R 3 , preso P 0 (x 0 , y 0 , z 0 ) e considerato P (x, y, z) il generico punto <strong>di</strong> R 3 , si ha<br />

{<br />

A ɛ (P 0 ) = P (x, y, z) ∈ R 3 : √ }<br />

(x − x 0 ) 2 + (y − y 0 ) 2 + (z − z 0 ) 2 < ɛ<br />

Dal momento che l’equazione<br />

(x − x 0 ) 2 + (y − y 0 ) 2 + (−z 0 ) 2 = ɛ 2<br />

rappresenta l’equazione della sfera <strong>di</strong> centro P 0 e raggio ɛ, l’intorno <strong>di</strong> P 0 è dato da tutti<br />

i punti che si trovano all’interno della sfera ma non sulla superficie della sfera.<br />

Ve<strong>di</strong>amo ora altre definizioni che saranno utili nel seguito.<br />

Definizione 2.2.11 Dato I ⊂ R n :<br />

G Diremo che un punto P 0 ∈ R n è un punto <strong>di</strong> frontiera <strong>di</strong> I se ogni intorno <strong>di</strong> P 0 contiene<br />

almeno un punto <strong>di</strong> I e un punto che non appartiene a I.<br />

G Diremo che un punto P 0<br />

∈ R n è un punto interno <strong>di</strong> I se esiste un intorno <strong>di</strong> P 0 tutto<br />

contenuto in I.<br />

G Diremo che I è un insieme chiuso se ciascun punto <strong>di</strong> frontiera <strong>di</strong> I appartiene a I.<br />

G Diremo che I è un insieme aperto se nessun punto <strong>di</strong> frontiera <strong>di</strong> I appartiene a I.<br />

G L’insieme interno <strong>di</strong> I è l’insieme dei punti interni <strong>di</strong> I che non sono <strong>di</strong> frontiera <strong>di</strong> I.<br />

G L’insieme <strong>di</strong> frontiera <strong>di</strong> I è l’insieme <strong>di</strong> tutti i punti <strong>di</strong> frontiera <strong>di</strong> I.<br />

G L’insieme esterno <strong>di</strong> I è l’insieme dei punti che non sono <strong>di</strong> I e che non sono <strong>di</strong> frontiera<br />

<strong>di</strong> I.<br />

Definizione 2.2.12 Dato I ⊂ R n :<br />

G Diremo che P 0 ∈ R n è punto <strong>di</strong> accumulazione <strong>di</strong> I se per ogni intorno <strong>di</strong> P 0 ci sono infiniti<br />

punti che appartengono a I.<br />

G Diremo che P 0 ∈ I è punto isolato <strong>di</strong> I se non è punto <strong>di</strong> accumulazione per I.<br />

14<br />

Esempi:<br />

G L’intorno circolare <strong>di</strong> un punto P 0 , A ɛ (P 0 ) è un insieme aperto perchè nessun punto<br />

della frontiera appartiene ad esso.


2.2. Definizioni preliminari<br />

Figura 2.8: Esempio in R 2 <strong>di</strong> punti interni, <strong>di</strong> frontiera, <strong>di</strong> intorno <strong>di</strong> un punto.<br />

G L’insieme che denotiamo con il simbolo C ɛ (P 0 ), dato da<br />

C ɛ (P 0 ) = {P ∈ R n : |P − P 0 | ≤ ɛ}<br />

è un insieme chiuso perchè ciascun punto della frontiera appartiene ad esso.<br />

G Gli insiemi R n e ∅ sono sia insiemi chiusi sia insiemi aperti per convenzione.<br />

Definizione 2.2.13 Dato un insieme I ⊂ R n<br />

dall’unione <strong>di</strong> I e della sua frontiera.<br />

si definisce chiusura <strong>di</strong> I l’insieme formato<br />

Ad esempio, l’insieme C ɛ (P 0 ) rappresenta la chiusura <strong>di</strong> A ɛ (P 0 ).<br />

Definizione 2.2.14 Se I ⊂ R n è chiuso e limitato, esso si <strong>di</strong>ce compatto.<br />

15


CAPITOLO 3<br />

Limiti, continuità, <strong>di</strong>fferenziabilità <strong>di</strong> funzioni<br />

<strong>di</strong> più variabili<br />

La mente che si apre ad una<br />

nuova idea non torna mai alla<br />

<strong>di</strong>mensione precedente.<br />

Albert Einstein (1879-1955)<br />

3.1 Limite <strong>di</strong> una funzione <strong>di</strong> più variabili . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />

3.2 Continuità <strong>di</strong> una funzione <strong>di</strong> più variabili . . . . . . . . . . . . . . . . . . . . . . . 21<br />

3.3 Derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22<br />

3.4 Interpretazione delle derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />

3.5 Derivate parziali <strong>di</strong> or<strong>di</strong>ne più elevato . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />

3.6 Differenziabilità <strong>di</strong> una funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />

3.7 Differenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27<br />

3.8 Derivata <strong>di</strong>rezionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28<br />

3.9 Derivazione nelle funzioni composte . . . . . . . . . . . . . . . . . . . . . . . . . . 30<br />

3.10Piano tangente ad una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31<br />

3.11Formula <strong>di</strong> Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />

3.1 Limite <strong>di</strong> una funzione <strong>di</strong> più variabili<br />

Il concetto <strong>di</strong> limite <strong>di</strong> una funzione <strong>di</strong> più variabili è molto simile a quello per funzioni <strong>di</strong><br />

una sola variabile.<br />

Consideriamo una funzione <strong>di</strong> due variabili, f(x, y). Diciamo che il limite della funzione<br />

f(x, y) è L per (x, y) che tende a (x 0 , y 0 ) e scriviamo<br />

lim f(x, y) = L<br />

(x,y)→(x 0,y 0)<br />

se tutti i punti <strong>di</strong> un qualunque intorno <strong>di</strong> (x 0 , y 0 ) (senza considerare il punto (x 0 , y 0 )) appartengono<br />

al dominio della funzione e se f(x, y) tende a L quando (x, y) tende a (x 0 , y 0 ). Più<br />

vicino è il punto (x, y) a (x 0 , y 0 ), più il valore della funzione tende al valore del limite.<br />

Formalmente, la definizione è la seguente.<br />

Definizione 3.1.1 Siano dati una funzione f : I −→ R, con I ⊂ R 2 , il punto P 0 (x 0 , y 0 ), punto <strong>di</strong><br />

accumulazione per I, e L ∈ R, allora <strong>di</strong>ciamo che<br />

lim<br />

(x,y)→(x 0,y 0) f(x, y) = L 17


3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />

se:<br />

G ciascun intorno <strong>di</strong> P 0 contiene punti del dominio <strong>di</strong> definizione della f (unica eccezione<br />

può essere data dal punto P 0 )<br />

G se e solo se, per ogni numero ɛ > 0, esiste un altro numero δ > 0 tale che<br />

se 0 < √ (x − x 0 ) 2 + (y − y 0 ) 2 < δ allora |f(x, y) − L| < ɛ<br />

qualunque sia il punto P (x, y) ∈ I.<br />

Dalla definizione segue che, qualunque sia il valore <strong>di</strong> ɛ piccolo a piacere, è possibile<br />

trovare un intorno A δ (P 0 ) tale che per ogni punto in questo intorno <strong>di</strong>verso da P 0<br />

(0 < √ (x − x 0 ) 2 + (y − y 0 ) 2 < δ), vale la relazione |f(x, y) − L| < ɛ, cioè il valore f(x, y) si<br />

trova in un intorno <strong>di</strong> L <strong>di</strong> raggio ɛ.<br />

La definizione <strong>di</strong> limite per funzioni <strong>di</strong> due variabili si estende facilmente a funzioni <strong>di</strong> più<br />

variabili.<br />

Definizione 3.1.2 Siano dati una funzione f : I −→ R, con I ⊂ R n , il punto P 0 (x 1 , x 2 , . . . , x n ),<br />

punto <strong>di</strong> accumulazione per I, e L ∈ R, allora <strong>di</strong>ciamo che<br />

lim f(P ) = L<br />

P →P 0<br />

se:<br />

G ciascun intorno <strong>di</strong> P 0 contiene punti del dominio <strong>di</strong> definizione della f (unica eccezione<br />

può essere data dal punto P 0 )<br />

G se e solo se, per ogni numero ɛ > 0, esiste un altro numero δ > 0 tale che<br />

se 0 < |P − P 0 | < δ allora |f(P ) − L| < ɛ<br />

qualunque sia il punto P ∈ I.<br />

Il limite <strong>di</strong> una funzione può valere anche ±∞ e si può anche parlare <strong>di</strong> limite per P che<br />

tende a infinito.<br />

Definizione 3.1.3 Data f : I −→ R, con I ⊂ R n e dato il punto P 0 <strong>di</strong> accumulazione per I si ha<br />

G lim P →P0 f(P ) = +∞ se per ogni valore M > 0, esiste δ > 0 tale che<br />

se 0 < |P − P 0 | < δ allora f(P ) > M<br />

G lim P →P0 f(P ) = −∞ se per ogni valore M > 0, esiste δ > 0 tale che<br />

se 0 < |P − P 0 | < δ allora f(P ) < −M<br />

G lim P →∞ f(P ) = L se per ogni valore ɛ > 0, esiste M > 0 tale che<br />

se |P | > M allora |f(P ) − L| < ɛ<br />

Alcune regole sui limiti che già conosciamo dalle funzioni scalari si estendono facilmente<br />

ai limiti <strong>di</strong> funzioni <strong>di</strong> più variabili. Ad esempio, date due funzioni f e g, se lim P →P0 f(P ) = L<br />

e lim P →P0 g(P ) = M con L, M ∈ R, si ha<br />

G lim P →P0 f(P ) ± lim P →P0 g(P ) = L ± M<br />

G lim P →P0 f(P )g(P ) = LM<br />

f(P )<br />

G lim P →P0<br />

g(P ) = L (questo si ha se M ≠ 0).<br />

M<br />

Anche per funzioni <strong>di</strong> più variabili vale il teorema del confronto (noto anche come teorema<br />

dei carabinieri in italiano o squeeze theorem in inglese)<br />

18


3.1. Limite <strong>di</strong> una funzione <strong>di</strong> più variabili<br />

Figura 3.1: Percorsi che possono essere fatti da (x, y) per tendere a (x 0 , y 0 ).<br />

Teorema 3.1.1 Se f(x, y) ≤ g(x, y) ≤ h(x, y) per (x, y) in un intorno <strong>di</strong> (x 0 , y 0 ) e se vale<br />

lim f(x, y) = lim g(x, y) = L<br />

(x,y)→(x 0,y 0) (x,y)→(x 0,y 0)<br />

allora anche<br />

lim g(x, y) = L.<br />

(x,y)→(x 0,y 0)<br />

Osserviamo adesso alcuni punti importanti:<br />

G Se esiste il limite <strong>di</strong> una funzione per P che tende a un punto P 0 , questo limite è unico.<br />

G Per funzioni <strong>di</strong> una sola variabile f(x), l’esistenza del limite lim x→x0 f(x) implica che la<br />

funzione si avvicina allo stesso numero finito per x che si avvicina a x 0 sia da sinistra<br />

sia da destra.<br />

G Per funzioni <strong>di</strong> due variabili (e il <strong>di</strong>scorso vale in maniera del tutto analogo anche per<br />

funzioni <strong>di</strong> tre e più variabili), il limite lim (x,y)→(x0,y 0) f(x, y) = L esiste solo se f(x, y)<br />

tende allo stesso numero L qualunque sia il percorso che fa (x, y) per avvicinarsi a<br />

(x 0 , y 0 ) nel piano cartesiano. Ciò significa che (x, y) può avvicinarsi a (x 0 , y 0 ) lungo<br />

qualunque curva che possiamo in<strong>di</strong>viduare nel piano xy e il limite deve valere sempre<br />

L (si veda Figura 3.1).<br />

Abbiamo perciò la seguente proposizione<br />

Proposizione 3.1.1 Data f : I −→ R, I ⊂ R 2 , e dato P 0 punto <strong>di</strong> accumulazione per I, se<br />

esiste il limite lim (x,y)→(x0,y 0) f(x, y) e tale limite vale L numero reale, allora lo stesso limite si<br />

deve avere per P che tende a P 0 su qualunque sottoinsieme <strong>di</strong> I che ha P 0 come punto <strong>di</strong><br />

accumulazione.<br />

Al contrario, se esistono anche solo due sottoinsiemi <strong>di</strong> I in cui esiste il limite della f per P<br />

che tende a P 0 , ma il valore del limite nei due sottoinsiemi non è lo stesso, allora non può<br />

esistere il limite della funzione sull’insieme I <strong>di</strong> partenza (proprio in virtù della proposizione<br />

precedente).<br />

Ve<strong>di</strong>amo <strong>degli</strong> esempi <strong>di</strong> calcolo del limite <strong>di</strong> funzioni <strong>di</strong> due variabili.<br />

19


3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />

Esempio<br />

Es. 3.1.1 Consideriamo i seguenti limiti:<br />

lim 3x −<br />

(x,y)→(2,2) y2 =<br />

lim<br />

(x,y)→(3,4) xy2 + x 2 y =<br />

In tutti questi esempi il limite esiste e coincide con il valore della funzione nel punto <strong>di</strong><br />

limite:<br />

lim 3x −<br />

(x,y)→(2,2) y2 = 6 − 4 = 2<br />

lim<br />

(x,y)→(3,4) xy2 + x 2 y = 48 + 36 = 84<br />

Per la prima funzione il risultato è banale perchè la funzione la possiamo vedere come<br />

somma <strong>di</strong> due funzioni scalari per le quali sappiamo calcolare facilmente il limite. La<br />

seconda funzione è data dalla somma <strong>di</strong> due funzioni, ciascuna delle quali può essere<br />

vista come il prodotto <strong>di</strong> una funzione nella sola variabile x e <strong>di</strong> una funzione nella sola<br />

variabile y. Quin<strong>di</strong> calcoliamo il limite <strong>di</strong> queste funzioni, applichiamo la regola sul limite<br />

<strong>di</strong> prodotto <strong>di</strong> funzioni e otteniamo il risultato.<br />

Esempio<br />

3xy<br />

Es. 3.1.2 Consideriamo ora lim (x,y)→(0,0)<br />

x 2 + y 2 .<br />

Questo limite non esiste perchè si trovano facilmente due strade <strong>di</strong>verse per fare tendere<br />

il punto (x, y) a (0, 0) attraverso le quali otteniamo due valori <strong>di</strong>versi del limite.<br />

Pren<strong>di</strong>amo il punto (x, y) sulla retta y = kx con k numero reale arbritrario, <strong>di</strong>verso da<br />

zero. Facciamo tendere dunque (x, kx) al punto (0, 0). Il limite <strong>di</strong>venta<br />

lim<br />

(x,kx)→(0,0)<br />

3xkx<br />

x 2 + (kx) 2 =<br />

lim<br />

(x,kx)→(0,0)<br />

3kx 2<br />

x 2 + k 2 x 2 =<br />

2k<br />

1 + k 2<br />

Questo valore del limite, che abbiamo ottenuto facilmente in quanto la funzione si è ridotta<br />

a funzione della sola variabile x, <strong>di</strong>pende da k, e quin<strong>di</strong> cambia al cambiare <strong>di</strong> k. Ciò<br />

significa che la funzione non può avere limite per (x, y) → 0.<br />

Osserviamo che la funzione data è un esempio <strong>di</strong> funzione che non è definita nel punto<br />

(0, 0) in quanto f(0, 0) = 0/0 è una forma indeterminata.<br />

Esempio<br />

Es. 3.1.3 Stu<strong>di</strong>amo ora lim (x,y)→(0,0)<br />

8xy 2<br />

x 2 + y 4 .<br />

Anche questa funzione è indeterminata in (0, 0).<br />

Proviamo a calcolare il limite sulle rette y = kx con k ∈ R, k ≠ 0. Otteniamo<br />

lim<br />

(x,kx)→(0,0)<br />

8k 2 x 3<br />

x 2 + k 4 x 4 = lim<br />

x→0<br />

8k 2 x<br />

1 + k 2 x 2 = 0<br />

Questo limite non <strong>di</strong>pende dunque dalla retta, in quanto non <strong>di</strong>pende da k.<br />

20


3.2. Continuità <strong>di</strong> una funzione <strong>di</strong> più variabili<br />

Ci verrebbe da concludere che allora il limite esiste e vale 0. Ma la risposta non sarebbe<br />

corretta perchè con le rette non abbiamo esaurito tutti i percorsi che può fare il punto<br />

per avvicinarsi a (0, 0).<br />

Proviamo ad avvicinarci a (0, 0) lungo la parabola x = ky 2 In tal caso abbiamo<br />

lim<br />

(ky 2 ,y)→(0,0)<br />

8ky 4<br />

k 2 y 4 + y 4 =<br />

8k<br />

k 2 + 1<br />

In questo caso, il limite <strong>di</strong>pende dalla curva x = ky 2 e il valore non è più 0 ma cambia<br />

al cambiare <strong>di</strong> k. Quin<strong>di</strong> il limite non esiste.<br />

Esempio<br />

Es. 3.1.4 Proviamo invece che<br />

lim<br />

(x,y)→(0,0)<br />

4x 2 y<br />

x 2 + y 2 = 0<br />

In tal caso, non conviene scegliere particolari curve per mostrare che il limite vale 0 perchè<br />

dovremmo <strong>di</strong>mostrare che qualunque sia il cammino per avvicinarsi a (0, 0) il limite è<br />

sempre quello e, quin<strong>di</strong>, dovremmo lavorare su infiniti percorsi! In tal caso, dobbiamo<br />

applicare la definizione <strong>di</strong> limite.<br />

Ora, poichè x 2 ≤ x 2 +y 2 x 2<br />

si ha<br />

x 2 + y 2 ≤ 1, mentre da y2 ≤ x 2 +y 2 , ricaviamo |y| ≤ √ x 2 + y 2 .<br />

Possiamo dunque <strong>di</strong>re che<br />

4x 2 y<br />

|<br />

x 2 + y 2 − 0| = | 4x 2 y<br />

x 2 + y 2 | ≤ |4y| ≤ 4√ x 2 + y 2<br />

Dalla definizione <strong>di</strong> limite, preso ɛ > 0, dobbiamo provare che esiste δ > 0 tale che per<br />

0 < √ x 2 + y 2 4x 2 y<br />

< δ, risulta |<br />

x 2 − 0| < ɛ.<br />

+ y2 Se scegliamo δ = ɛ/4, abbiamo:<br />

4x 2 y<br />

|<br />

x 2 + y 2 − 0| ≤ 4√ x 2 + y 2 < 4 ɛ 4 = ɛ<br />

4x 2 y<br />

Quin<strong>di</strong> abbiamo provato che |<br />

x 2 − 0| < ɛ, cioè il limite della nostra funzione per<br />

+ y2 (x, y) → (0, 0) vale esattamente 0.<br />

3.2 Continuità <strong>di</strong> una funzione <strong>di</strong> più variabili<br />

Definizione 3.2.1 Una funzione f : I −→ R, con I ⊂ R n è continua in P 0 (P 0 ∈ I e punto <strong>di</strong><br />

accumulazione per I), se<br />

lim f(P ) = f(P 0 )<br />

P →P 0<br />

Nel caso <strong>di</strong> funzioni <strong>di</strong> due variabili, si ha:<br />

Definizione 3.2.2 Una funzione f : I −→ R, con I ⊂ R 2 è continua in P 0 (x 0 , y 0 ) (P 0 ∈ I e punto<br />

<strong>di</strong> accumulazione per I), se<br />

lim f(x, y) = f(x 0, y 0 )<br />

(x,y)→(x 0,y 0)<br />

21


3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />

Definizione 3.2.3 Una funzione si <strong>di</strong>ce continua se è continua in ogni punto del suo insieme<br />

<strong>di</strong> definizione.<br />

Proposizione 3.2.1 Date due funzioni f e g continue in I ⊂ R 2 , allora<br />

f + g è continua;<br />

G fg è continua;<br />

G f è continua in tutti quei punti in g non si annulla;<br />

g<br />

G f ◦ g è continua (f ◦ g(x, y) = f(g(x, y)) funzione composta)<br />

Esempio<br />

Es. 3.2.1 lim (x,y)→(x0,y 0) x sin (xy) = x 0 sin (x 0 y 0 )<br />

La funzione f(x, y) = x sin (xy) è una funzione continua. Infatti la possiamo vedere come il<br />

prodotto della funzione x e della funzione sin (xy). La funzione sin (xy) la ve<strong>di</strong>amo come la<br />

funzione composta della funzione seno applicata al prodotto delle funzioni x e y. Poichè<br />

x e y sono funzioni continue anche il loro prodotto è una funzione continua. La funzione<br />

composta <strong>di</strong> funzioni continue è continua (quin<strong>di</strong> sin (xy) è continua) e il prodotto <strong>di</strong> x per<br />

sin (xy) dà ancora una funzione continua.<br />

Osserviamo che il concetto <strong>di</strong> continuità non è ovvio! Ci sono funzioni che ammettono<br />

limite per (x, y) che tende a (x 0 , y 0 ) ma il valore del limite non necessariamente è uguale al<br />

valore della funzione in (x 0 , y 0 ).<br />

Esempio<br />

Es. 3.2.2 La funzione definita come<br />

{<br />

0 se (x, y) ≠ (0, 0)<br />

f(x, y) =<br />

1 se (x, y) = (0, 0)<br />

ammette limite per (x, y) → (0, 0) ma il limite non è il valore della funzione in (0, 0). Questa<br />

funzione non è continua in (0, 0). Difatti lim (x,y)→(0,0) f(x, y) = 0 ≠ f(0, 0) dal momento che<br />

la funzione è <strong>di</strong> costante valore 0 ad eccezione del punto (0, 0) in cui vale 1. Questa<br />

funzione è <strong>di</strong>scontinua in (0, 0).<br />

3.3 Derivate parziali<br />

Esten<strong>di</strong>amo ora il concetto <strong>di</strong> derivata che abbiamo visto per funzioni <strong>di</strong> una sola<br />

variabile, introducendo le derivate parziali.<br />

Data una funzione <strong>di</strong> una sola variabile, f(x), la derivata prima f ′ (x) rappresenta la<br />

velocità <strong>di</strong> variazione della funzione al variare <strong>di</strong> x.<br />

Con le funzioni <strong>di</strong> più variabili, ci sono due casi da considerare: cosa fare se varia solo<br />

una variabile mentre le altre non variano cosa fare se varia più <strong>di</strong> una variabile<br />

Concentriamo ora la nostra attenzione facendo cambiare una variabile alla volta e<br />

lasciando le altre fisse.<br />

Partiamo con un esempio, lavorando con una funzione <strong>di</strong> due variabili.<br />

Esempio<br />

Es. 3.3.1 Sia data f(x, y) = 4x 3 y 5 . Determiniamo la velocità con cui la funzione cambia<br />

in un punto fissato (x 0 , y 0 ), se non facciamo variare la y mentre facciamo variare la x,<br />

e viceversa, determiniamo la velocità con cui cambia la funzione in (x 0 , y 0 ) fissando x e<br />

variando y.<br />

22


3.3. Derivate parziali<br />

Nel primo caso, in cui lasciamo y fissato mentre x varia, dal momento che siamo interessati<br />

alla velocità della funzione nel punto (x 0 , y 0 ), per y fissato, vuol <strong>di</strong>re che dobbiamo<br />

considerare la funzione per y = y 0 . Consideriamo quin<strong>di</strong> f(x, y 0 ) = 4x 3 (y 0 ) 5 . Adesso<br />

abbiamo una funzione <strong>di</strong> una sola variabile, la x. Possiamo quin<strong>di</strong> considerare la funzione<br />

g(x) = f(x, y 0 ) = 4x 3 (y 0 ) 5 . Di questa funzione in una sola variabile, sappiamo<br />

cosa dobbiamo fare se vogliamo determinare la velocità <strong>di</strong> cambiamento della funzione<br />

per x = x 0 : dobbiamo calcolare la derivata prima g ′ (x 0 ). Nell’esempio, abbiamo<br />

g ′ (x 0 ) = 12(x 0 ) 2 (y 0 ) 5 .<br />

Quello che abbiamo ottenuto prende il nome <strong>di</strong> derivata parziale <strong>di</strong> f(x, y) rispetto a x,<br />

nel punto (x 0 , y 0 ). Denotiamo questa derivata parziale con uno dei seguenti simboli:<br />

f x (x 0 , y 0 )<br />

∂f<br />

∂x (x 0, y 0 ) D x f(x 0 , y 0 )<br />

Al posto <strong>di</strong> (x 0 , y 0 ) si può scrivere anche P 0 intendendo per P 0 il punto <strong>di</strong> coor<strong>di</strong>nate<br />

(x 0 , y 0 ).<br />

Quin<strong>di</strong>, nel nostro esempio, f x (x 0 , y 0 ) = 12(x 0 ) 2 (y 0 ) 5 .<br />

Ve<strong>di</strong>amo ora cosa succede se lasciamo fissa la variabile x e variamo y. In tal caso,<br />

dobbiamo considerare la funzione h(y) = f(x 0 , y) = 4(x 0 ) 3 y 5 e calcolare la derivata prima<br />

<strong>di</strong> questa funzione che <strong>di</strong>pende dalla sola variabile y nel punto y 0 . Abbiamo h ′ (y 0 ) =<br />

20(x 0 ) 3 (y 0 ) 4 .<br />

Ciò che abbiamo ottenuto è la derivata parziale della f rispetto alla variabile y, nel<br />

punto (x 0 , y 0 ). In<strong>di</strong>chiamo questa derivata parziale con uno dei seguenti simboli:<br />

f y (x 0 , y 0 )<br />

∂f<br />

∂y (x 0, y 0 ) D y f(x 0 , y 0 )<br />

Quin<strong>di</strong>, per l’esempio considerato, f y (x 0 , y 0 ) = 20(x 0 ) 3 (y 0 ) 4 .<br />

Passiamo dunque alla definizione generale delle derivate parziali prime <strong>di</strong> una funzione<br />

<strong>di</strong> due variabili (considerando le derivate non più in (x 0 , y 0 ) ma nel generico punto (x, y)).<br />

Definizione 3.3.1 Data una funzione f(x, y), le derivate parziali prime rispetto alle variabili x<br />

e y sono date da:<br />

f(x + h, y) − f(x, y)<br />

(x, y) = lim<br />

h→0 h<br />

∂f<br />

∂x<br />

∂f<br />

(x, y) = lim<br />

∂y h→0<br />

f(x, y + h) − f(x, y)<br />

h<br />

Derivate per funzioni scalari e derivate per funzioni <strong>di</strong> due variabili<br />

f(x) =⇒ f ′ (x) = df<br />

dx<br />

f(x, y) =⇒ f x (x, y) = ∂f<br />

∂x<br />

&<br />

f y (x, y) = ∂f<br />

∂y<br />

Per calcolare le derivate parziali prime <strong>di</strong> una funzione bisogna fare questo ragionamento:<br />

se dobbiamo calcolare f x (x, y) dobbiamo trattare la variabile y come una costante e trattare la<br />

funzione come se <strong>di</strong>pendesse dalla sola x; se dobbiamo calcolare f y (x, y), dobbiamo trattare<br />

x come una costante e calcolare la derivata rispetto a y come se la funzione fosse <strong>di</strong>pendente<br />

dalla sola variabile y.<br />

23


3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />

Esempio<br />

Es. 3.3.2 Calcolare le derivate parziali prime della funzione f(x, y) = 3x 5 + 2 √ y − 10xy.<br />

Per calcolare la derivata f x (x, y) trattiamo la y come una costante, da cui f x (x, y) = 15x 4 −<br />

10y. Notiamo che la derivata rispetto a x <strong>di</strong> 2 √ y vale zero perchè la y è una costante.<br />

Al contrario, per calcolare f y (x, y) dobbiamo ora trattare x come una costante, da cui<br />

f y (x, y) = 1 √ y<br />

− 10x.<br />

3.4 Interpretazione delle derivate parziali<br />

Sono possibili due interpretazioni sul significato delle derivate parziali prime.<br />

G Se consideriamo la derivata parziale come la velocità <strong>di</strong> cambiamento della funzione<br />

allora f x (x, y) rappresenta la velocità <strong>di</strong> cambiamento della funzione al variare <strong>di</strong> x<br />

per y fissato, mentre f y (x, y) rappresenta la velocità <strong>di</strong> cambiamento della funzione al<br />

variare <strong>di</strong> y per x fissato. Quin<strong>di</strong> se f x (x 0 , y 0 ) > 0 vuol <strong>di</strong>re che la funzione è crescente<br />

in quel punto al variare <strong>di</strong> x, per y 0 fissato, mentre se f x (x 0 , y 0 ) < 0 vuol <strong>di</strong>re che la<br />

funzione è decrescente in quel punto al variare <strong>di</strong> x, per y 0 fissato. Stesso <strong>di</strong>scorso vale<br />

su f y (x 0 , y 0 ): se f y (x 0 , y 0 ) > 0 allora la funzione è crescente in quel punto al variare <strong>di</strong> y,<br />

per x 0 fissato, mentre se f y (x 0 , y 0 ) < 0 la funzione è decrescente in quel punto al variare<br />

<strong>di</strong> y, per x 0 fissato. È possibile che una funzione sia crescente fissato y e decrescente<br />

fissato x o viceversa.<br />

G L’altra interpretazione, geometrica, estende il concetto <strong>di</strong> pendenza della retta tangente<br />

che abbiamo per funzioni <strong>di</strong> una sola variabile, per cui f ′ (x 0 ) rappresenta la pendenza<br />

della retta tangente alla funzione f(x) nel punto x 0 . Nel caso <strong>di</strong> funzioni <strong>di</strong> due variabili,<br />

f x (x 0 , y 0 ) rappresenta la pendenza della traccia della funzione f(x, y) nel piano y = y 0 nel<br />

punto (x 0 , y 0 ) (in altre parole è la pendenza della retta tangente alla curva che si ottiene<br />

intersecando la superficie che rappresenta la funzione f(x, y), cioè il grafico della f, con<br />

il piano verticale y = y 0 ), mentre f y (x 0 , y 0 ) rappresenta la pendenza della traccia della<br />

funzione f(x, y) con il piano x = x 0 nel punto (x 0 , y 0 ).<br />

3.5 Derivate parziali <strong>di</strong> or<strong>di</strong>ne più elevato<br />

Così come per le funzioni <strong>di</strong> una sola variabile è possibile definire le derivate <strong>di</strong> or<strong>di</strong>ne<br />

più elevato (derivata seconda, terza, quarta, n-sima), anche per le funzioni <strong>di</strong> più variabili è<br />

possibile definire le derivate <strong>di</strong> or<strong>di</strong>ne più elevato. Ci soffermiamo al caso <strong>di</strong> funzioni <strong>di</strong> due<br />

variabili.<br />

Data una funzione f(x, y), dal momento che abbiamo due derivate parziali prime f x e<br />

f y , su ciascuna <strong>di</strong> queste funzioni possiamo pensare <strong>di</strong> applicare ancora la definizione<br />

<strong>di</strong> derivata parziale rispetto a x e rispetto a y, ottenendo, in tal modo, quattro possibili<br />

combinazioni.<br />

Abbiamo le seguenti scritture:<br />

(f x ) x = f xx = ∂ ( ) ∂f<br />

∂x ∂x<br />

(f x ) y = f xy = ∂ ( ) ∂f<br />

∂y ∂x<br />

= ∂2 f<br />

∂x 2<br />

= ∂2 f<br />

∂y∂x<br />

24


3.6. Differenziabilità <strong>di</strong> una funzione<br />

(f y ) x = f yx = ∂ ( ) ∂f<br />

∂x ∂y<br />

(f y ) y = f yy = ∂ ( ) ∂f<br />

∂y ∂y<br />

= ∂2 f<br />

∂x∂y<br />

= ∂2 f<br />

∂y 2<br />

Le derivate f xy e f yx sono dette anche derivate parziali miste perchè le derivate sono fatte<br />

rispetto a più <strong>di</strong> una variabile.<br />

Osserviamo che, dal punto <strong>di</strong> vista della notazione usata, quando l’in<strong>di</strong>ce della derivata<br />

parziale è posta in basso della funzione, per esempio f xy , dobbiamo derivare da sinistra verso<br />

destra: in questo caso prima facciamo la derivata rispetto a x e poi rispetto a y. Quando<br />

invece usiamo la notazione frazionale ( ∂2 f<br />

) la notazione è opposta: si va da destra verso<br />

∂y∂x<br />

sinistra. Nell’esempio, il risultato è lo stesso, prima si deriva rispetto a x e poi rispetto a y.<br />

Esempio<br />

Es. 3.5.1 Calcolare le derivate seconde <strong>di</strong> f(x, y) = sin (xy) − x 3 e 4y + 4y 2 .<br />

Prima <strong>di</strong> tutto calcoliamo le derivate parziali prime:<br />

f x (x, y) = y cos (xy) − 3x 2 e 4y<br />

f y (x, y) = x cos (xy) − 4x 3 e 4y + 8y<br />

Passiamo ora alle derivate seconde:<br />

f xx (x, y) = −y 2 sin (xy) − 6xe 4y<br />

f xy (x, y) = cos (xy) − xy sin (xy) − 12x 2 e 4y<br />

f yx (x, y) = cos (xy) − xy sin (xy) − 12x 2 e 4y<br />

f yy (x, y) = −x 2 sin (xy) − 16x 3 e 4y + 8<br />

Nell’esempio appena visto, le derivate parziali miste sono coincidenti. Si tratta <strong>di</strong> una<br />

“coincidenza” o no In realtà la funzione data gode <strong>di</strong> una proprietà importante che ci<br />

permette <strong>di</strong> avere questo risultato.<br />

Teorema 3.5.1 (<strong>di</strong> Clairaut-Schwarz) Data la funzione f definita in un insieme aperto A che<br />

contiene il punto (x 0 , y 0 ), se le funzioni f xy e f yx sono continue in A, allora<br />

f xy (x 0 , y 0 ) = f yx (x 0 , y 0 ).<br />

3.6 Differenziabilità <strong>di</strong> una funzione<br />

Prima <strong>di</strong> entrare a parlare <strong>di</strong> <strong>di</strong>fferenziabilità <strong>di</strong> una funzione,<br />

introduciamo una<br />

notazione per <strong>degli</strong> spazi <strong>di</strong> funzioni definite in un insieme aperto I ⊂ R 2 .<br />

G Si in<strong>di</strong>ca con C 0 (I) l’insieme delle funzioni continue in I (si <strong>di</strong>ce anche che la funzione<br />

è <strong>di</strong> classe C 0 ).<br />

G Si in<strong>di</strong>ca con C 1 (I) l’insieme delle funzioni definite in I le cui derivate parziali prime<br />

sono continue in I (si <strong>di</strong>ce anche che la funzione è <strong>di</strong> classe C 1 ).<br />

G Si in<strong>di</strong>ca con C 2 (I) l’insieme delle funzioni definite in I le cui derivate parziali prime e<br />

seconde sono continue in I (si <strong>di</strong>ce anche che la funzione è <strong>di</strong> classe C 2 ).<br />

25


3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />

Definizione 3.6.1 Sia data una funzione f : A −→ R con A ⊂ R 2 , A aperto, e un punto<br />

P 0 (x 0 , y 0 ) ∈ A. Diremo che f è <strong>di</strong>fferenziabile in P 0 se esistono due numeri reali λ e µ tali che<br />

f(x, y) − f(x 0 , y 0 ) − [λ(x − x 0 ) + µ(y − y 0 )]<br />

lim<br />

√ = 0<br />

(x,y)→(x 0,y 0)<br />

(x − x0 ) 2 + (y − y 0 ) 2<br />

In maniera del tutto equivalente si può <strong>di</strong>re che f è <strong>di</strong>fferenziabile se<br />

f(x, y) − f(x 0 , y 0 ) − [λ(x − x 0 ) + µ(y − y 0 )]<br />

è infinitesima <strong>di</strong> or<strong>di</strong>ne superiore rispetto all’infinitesimo √ (x − x 0 ) 2 + (y − y 0 ) 2 .<br />

Applicando la definizione <strong>di</strong> limite, <strong>di</strong>re che f è <strong>di</strong>fferenziabile in P 0 , vuol <strong>di</strong>re che, qualunque<br />

sia ɛ > 0 esiste δ > 0 tale che per ogni (x, y) ∈ A, con 0 < √ (x − x 0 ) 2 + (y − y 0 ) 2 < δ<br />

risulta<br />

|f(x, y) − f(x 0 , y 0 ) − [λ(x − x 0 ) + µ(y − y 0 )] | < ɛ √ (x − x 0 ) 2 + (y − y 0 ) 2<br />

In modo equivalente, possiamo anche <strong>di</strong>re che f è <strong>di</strong>fferenziabile in P 0 se esistono due<br />

numeri λ e µ e una funzione σ(x, y) definita in un intorno T <strong>di</strong> P 0 e infinitesima per (x, y) →<br />

(x 0 , y 0 ) tale che, per ogni (x, y) ∈ T , vale:<br />

f(x, y) − f(x 0 , y 0 ) = λ(x − x 0 ) + µ(y − y 0 ) + σ(x, y) √ (x − x 0 ) 2 + (y − y 0 ) 2 .<br />

Vale la seguente proposizione.<br />

Proposizione 3.6.1 Se f : A −→ R, con A ⊂ R 2 , A aperto, è <strong>di</strong>fferenziabile in P 0 ∈ A, allora<br />

esistono le derivate parziali prime <strong>di</strong> f in P 0 e vale: f x (P 0 ) = λ e f y (P 0 ) = µ.<br />

Dimostrazione. Sappiamo che la f è <strong>di</strong>fferenziabile, dobbiamo provare che f x (P 0 ) = λ e<br />

f y (P 0 ) = µ.<br />

Fissiamo la variabile y, prendendo y = y 0 . Dalla definizione <strong>di</strong> <strong>di</strong>fferenziabilità si ha:<br />

f(x, y 0 ) − f(x 0 , y 0 ) = λ(x − x 0 ) + |x − x 0 |σ(x, y 0 )<br />

con σ la funzione infinitesima definita prima. Il termine che moltiplica µ si annulla (abbiamo<br />

y 0 − y 0 ) come pure √ (x − x 0 ) 2 + (y − y 0 ) 2 si riduce a |x − x 0 | per y = y 0 .<br />

Divi<strong>di</strong>amo la relazione trovata per x − x 0 , ricavando<br />

f(x, y 0 ) − f(x 0 , y 0 )<br />

x − x 0<br />

= λ + |x − x 0|<br />

x − x 0<br />

σ(x, y 0 )<br />

Passando al limite per x → x 0 , poichè σ(x, y 0 ) è infinitesima e |x − x 0|<br />

x − x 0<br />

funzione |x − x 0|<br />

σ(x, y 0 ) è ancora infinitesima. Quin<strong>di</strong> si ha<br />

x − x 0<br />

f(x, y 0 ) − f(x 0 , y 0 )<br />

lim<br />

= λ<br />

x→x 0 x − x 0<br />

è limitata (vale ±1), la<br />

Il limite che abbiamo calcolato rappresenta la derivata prima della funzione f(x, y 0 ) che<br />

<strong>di</strong>pende dalla sola variabile x, nel punto x 0 : essa è, quin<strong>di</strong>, la derivata parziale prima della f<br />

rispetto a x. Abbiamo ottenuto che f x (x 0 , y 0 ) = λ.<br />

Con lo stesso ragionamento, si prova che f y (x 0 , y 0 ) = µ. Si deve far variare il punto (x, y)<br />

su una retta parallela all’asse y, per x = x 0 . In tal caso, la definizione <strong>di</strong> <strong>di</strong>fferenziabilità <strong>di</strong><br />

dà:<br />

26<br />

f(x 0 , y) − f(x 0 , y 0 ) = µ(y − y 0 ) + |y − y 0 |σ(x 0 , y)


3.7. Differenziale<br />

Dividendo per y − y 0 si ha<br />

f(x 0 , y) − f(x 0 , y 0 )<br />

y − y 0<br />

= µ + |y − y 0|<br />

y − y 0<br />

σ(x 0 , y)<br />

Passando al limite per y → y 0 si ha che |y − y 0|<br />

y − y 0<br />

σ(x 0 , y) → 0 e quin<strong>di</strong><br />

f(x 0 , y) − f(x 0 , y 0 )<br />

lim<br />

= µ<br />

y→y 0 y − y 0<br />

vale a <strong>di</strong>re f y (x 0 , y 0 ) = µ.<br />

Quin<strong>di</strong> se f è <strong>di</strong>fferenziabile in P 0 , la f ammette le derivate parziali prime in P 0 e vale<br />

f(x, y) − f(x 0 , y 0 ) = f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) + σ(x, y) √ (x − x 0 ) 2 + (y − y 0 ) 2 .<br />

✔<br />

Come conseguenza, una funzione <strong>di</strong>fferenziabile in P 0 è continua in P 0 .<br />

Proposizione 3.6.2 Sia f : A −→ R, con A aperto <strong>di</strong> R 2 . Sia f <strong>di</strong>fferenziabile in P 0 ∈ A, allora<br />

f è continua in P 0 .<br />

Dimostrazione. Poichè f è <strong>di</strong>fferenziabile in P 0 , esiste una funzione infinitesima per<br />

(x, y) → (x 0 , y 0 ) , σ(x, y) , tale che<br />

cioè<br />

f(x, y) − f(x 0 , y 0 ) = f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) + σ(x, y) √ (x − x 0 ) 2 + (y − y 0 ) 2 .<br />

Per (x, y) → (x 0 , y 0 ) il secondo membro della relazione appena scritta tende a zero, quin<strong>di</strong><br />

lim f(x, y) − f(x 0, y 0 ) = 0<br />

(x,y)→(x 0,y 0)<br />

lim f(x, y) = f(x 0, y 0 )<br />

(x,y)→(x 0,y 0)<br />

La f è continua in P 0 . ✔<br />

Teorema 3.6.1 Se f ∈ C 1 (A), con A aperto <strong>di</strong> R 2 , allora f è <strong>di</strong>fferenziabile in A.<br />

3.7 Differenziale<br />

Ricor<strong>di</strong>amo ora il concetto <strong>di</strong> <strong>di</strong>fferenziale <strong>di</strong> una funzione <strong>di</strong> una sola variabile.<br />

Definizione 3.7.1 Data una funzione f(x) e assumendo che la derivata f ′ (x) = df<br />

dx<br />

un punto x, il <strong>di</strong>fferenziale totale df della funzione è dato da<br />

( ) df<br />

df = dx = f ′ (x)dx.<br />

dx<br />

esiste in<br />

La quantità df può essere interpretata come il cambiamento infinitesimale del valore della<br />

funzione f(x) quando x cambia <strong>di</strong> una quantità infinitesima dx. Per esprimere questo da un<br />

punto <strong>di</strong> vista formale, consideriamo l’incremento ∆f = f(x + ∆x) − f(x) che rappresenta<br />

l’incremento sulla f quando x è incrementato <strong>di</strong> una quantità finita ∆x.<br />

27


3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />

Applicando il teorema del valor me<strong>di</strong>o, possiamo riscrivere<br />

∆f = f ′ (x + θ∆x)∆x, dove θ ∈ (0, 1).<br />

Ora passando al limite per ∆x → dx, ∆f → df, essendo df un incremento infinitesimale.<br />

Dal momento che dx è molto piccolo, possiamo <strong>di</strong>re che dx ≪ x e quin<strong>di</strong> x + θdx ≈ x da cui<br />

df = f ′ (x)dx.<br />

Ritroviamo la formula data per il <strong>di</strong>fferenziale df.<br />

Qualcosa <strong>di</strong> simile si ritrova nelle funzioni <strong>di</strong> due variabili.<br />

Definizione 3.7.2 Data f(x, y) funzione <strong>di</strong> due variabili, con derivate parziali prime continue,<br />

si definisce <strong>di</strong>fferenziale totale della f<br />

( ) ( )<br />

∂f ∂f<br />

df = dx + dy = f x dx + f y dy.<br />

∂x ∂y<br />

Il <strong>di</strong>fferenziale df rappresenta la variazione della f quando le variabili x e y cambiano <strong>di</strong> una<br />

quantità infinitesima dx e dy.<br />

Per arrivare a questa formula, definiamo ∆f la variazione che si ha variando x e y <strong>di</strong> una<br />

quantità ∆x e ∆y rispettivamente.<br />

∆f = f(x + ∆x, y + ∆y) − f(x, y)<br />

aggiungiamo e sottraiamo f(x, y + ∆y)<br />

f(x + ∆x, y + ∆y) − f(x, y + ∆y) + f(x, y + ∆y) − f(x, y)<br />

} {{ } } {{ }<br />

incremento con y+∆y fissato incremento con x fissato<br />

Abbiamo sud<strong>di</strong>viso ∆f in due pezzi, il primo contenente una variazione solo in x e l’altro<br />

contenente una variazione solo in y. Applicando il teorema del valor me<strong>di</strong>o come prima,<br />

otteniamo<br />

∆f = f x (x + θ 1 ∆x, y + ∆y)∆x + f y (x, y + θ 2 ∆y)∆y con θ 1 , θ 2 ∈ (0, 1).<br />

Per ∆x → dx e per ∆y → dy, con dx e dy incrementi infinitesimali (da cui dx ≪ x e dy ≪ y),<br />

risulta che ∆f → f, ricavando l’espressione df = f x dx + f y dy.<br />

3.8 Derivata <strong>di</strong>rezionale<br />

La derivata <strong>di</strong>rezionale <strong>di</strong> una funzione permette <strong>di</strong> calcolare la velocità <strong>di</strong> variazione<br />

della funzione in una assegnata <strong>di</strong>rezione. Le derivate parziali rispetto a x e rispetto a y<br />

rappresentano la velocità <strong>di</strong> variazione lungo le <strong>di</strong>rezioni x e y rispettivamente. Supponiamo<br />

ora <strong>di</strong> voler calcolare come cambia una funzione f(x, y) nel punto (x 0 , y 0 ), lungo la <strong>di</strong>rezione<br />

<strong>di</strong> un arbitrario vettore unitario ⃗v <strong>di</strong> componenti α 1 e α 2 . Dire che ⃗v è unitario, significa che<br />

la norma euclidea del vettore vale uno, cioè (α 1 ) 2 + (α 2 ) 2 = 1.<br />

Geometricamente, se consideriamo la superficie <strong>di</strong> equazione z = f(x, y) (il grafico della<br />

f), il piano verticale che passa attraverso il punto (x 0 , y 0 , f(x 0 , y 0 )), nella <strong>di</strong>rezione data da<br />

⃗v, interseca la superficie in una curva. La pendenza della tangente alla curva nel punto<br />

(x 0 , y 0 , f(x 0 , y 0 )) rappresenta la velocità <strong>di</strong> variazione della f nella <strong>di</strong>rezione ⃗v, cioè la derivata<br />

<strong>di</strong>rezionale della f lungo ⃗v.<br />

Al fine <strong>di</strong> calcolare questa derivata <strong>di</strong>rezionale, consideriamo un punto P (x, y) che si trova<br />

sul piano xy lungo la retta passante per P 0 (x 0 , y 0 ) e avente <strong>di</strong>rezione data da ⃗v. La retta si<br />

28


3.8. Derivata <strong>di</strong>rezionale<br />

può scrivere come P = P 0 + h⃗v con h scalare. Ciò significa che le coor<strong>di</strong>nate del punto P si<br />

possono scrivere come<br />

x = x 0 + hα 1 y = y 0 + hα 2<br />

La variazione della f tra il punto P e il punto P 0 è data da f(x 0 + hα 1 , y 0 + hα 2 ) − f(x 0 , y 0 ).<br />

Definizione 3.8.1 Definiamo derivata <strong>di</strong>rezionale della f lungo la <strong>di</strong>rezione ⃗v il limite, se<br />

esiste ed è finito,<br />

f(x 0 + hα 1 , y 0 + hα 2 ) − f(x 0 , y 0 )<br />

lim<br />

h→0<br />

h<br />

Questo limite si in<strong>di</strong>ca in modo equivalente tramite la scrittura ∂f<br />

∂⃗v (x 0, y 0 ) o D ⃗v f(P 0 ).<br />

Dalla definizione data, risulta evidente che se ⃗v = ⃗i in<strong>di</strong>cando con ⃗i il versore unitario<br />

dell’asse x, <strong>di</strong> componenti (1, 0), allora D ⃗v f(P 0 ) = f x (P 0 ), mentre se ⃗v = ⃗j il versore unitario<br />

dell’asse y, <strong>di</strong> componenti (0, 1), allora D ⃗v f(P 0 ) = f y (P 0 ). Quin<strong>di</strong> le derivate parziali rispetto<br />

a x e rispetto a y sono un caso particolare <strong>di</strong> derivate <strong>di</strong>rezionali.<br />

Vale il seguente teorema, detto formula del gra<strong>di</strong>ente perchè la derivata <strong>di</strong>rezionale, sotto<br />

determinate con<strong>di</strong>zioni, è legata al gra<strong>di</strong>ente della funzione assegnata.<br />

Definizione 3.8.2 Data una funzione f che ammette derivate parziali in P 0 , il vettore in<strong>di</strong>cato<br />

con il simbolo ⃗ ∇f(P 0 ) o grad f(P 0 ) prende il nome <strong>di</strong> gra<strong>di</strong>ente della funzione in P 0 e ha come<br />

componenti le derivate parziali prime della f in P 0 :<br />

⃗∇f(P 0 ) = (f x (P 0 ), f y (P 0 )).<br />

Teorema 3.8.1 (Formula del gra<strong>di</strong>ente) Data f : A −→ R con A ⊂ R 2 , se f è <strong>di</strong>fferenziabile<br />

in P 0 (x 0 , y 0 ) allora f ammette derivata <strong>di</strong>rezionale lungo una qualsiasi <strong>di</strong>rezione unitaria<br />

⃗v(α 1 , α 2 ) e risulta<br />

∂f<br />

∂⃗v (P 0) = f x (P 0 )α 1 + f y (P 0 )α 2<br />

Quin<strong>di</strong> la derivata <strong>di</strong>rezionale si può vedere come il prodotto scalare tra il gra<strong>di</strong>ente della<br />

funzione in P 0 e il vettore ⃗v.<br />

∂f<br />

∂⃗v (P 0) = ⃗ ∇f(P 0 ) · ⃗v<br />

Dimostrazione.<br />

Poichè f è <strong>di</strong>fferenziabile, vale<br />

f(x, y) − f(x 0 , y 0 ) = f x (P 0 )(x − x 0 ) + f y (P 0 )(y − y 0 ) + σ(x, y) √ (x − x 0 ) 2 + (y − y 0 ) 2<br />

dove σ è una funzione infinitesima per (x, y) → (x 0 , y 0 ).<br />

Poichè devo calcolare la derivata <strong>di</strong>rezionale, considero come punto (x, y) il punto che si<br />

trova sulla retta passante per (x 0 , y 0 ) e avente <strong>di</strong>rezione data dal vettore ⃗v. Quin<strong>di</strong>, come<br />

prima, x = x 0 + hα 1 e y = y 0 + hα 2 .<br />

Sostituendo nella formula della <strong>di</strong>fferenziabilità si ricava:<br />

f(x 0 +hα 1 , y 0 +hα 2 )−f(x 0 , y 0 ) = f x (P 0 )(hα 1 )+f y (P 0 )(hα 2 )+σ(x 0 +hα 1 , y 0 +hα 2 ) √ h 2 (α 1 ) 2 + h 2 (α 2 ) 2<br />

Divi<strong>di</strong>amo ambo i membri per h, ricordando anche che, poichè il vettore è unitario, si ha<br />

√<br />

h2 (α 1 ) 2 + h 2 (α 2 ) 2 = |h| √ (α 1 ) 2 + (α 2 ) 2 = |h|. Quin<strong>di</strong> si ottiene:<br />

f(x 0 + hα 1 , y 0 + hα 2 ) − f(x 0 , y 0 )<br />

h<br />

= f x (P 0 )α 1 + f y (P 0 )α 2 + |h|<br />

h σ(x 0 + hα 1 , y 0 + hα 2 )<br />

29


3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />

Passando al limite per h → 0, a primo membro si ha proprio il limite della definizione <strong>di</strong><br />

derivata <strong>di</strong>rezionale lungo ⃗v, mentre a secondo membro si ottiene f x (P 0 )α 1 + f y (P 0 )α 2 in<br />

quanto la quantità |h|<br />

h σ(x 0 + hα 1 , y 0 + hα 2 ) tende a 0 poichè è prodotto <strong>di</strong> un infinitesimo (la<br />

funzione σ) per la costante |h|<br />

h = ±1).<br />

Si ricava quin<strong>di</strong> l’asserto. ✔<br />

3.9 Derivazione nelle funzioni composte<br />

Per funzioni scalari, è frequente avere a che fare con funzioni del tipo y = f(x) dove però<br />

x è a sua volta funzione <strong>di</strong> un’altra variabile t, x = g(t).<br />

Se scriviamo F (t) = f(g(t)), sappiamo che F ′ (t) = f ′ (g(t))g ′ (t): applichiamo la regola <strong>di</strong><br />

derivazione sulle funzioni composte.<br />

C’è una notazione alternativa a questa: da y = f(x) con x = g(t), abbiamo<br />

dy<br />

dt = dy dx<br />

dx dt .<br />

Per funzioni <strong>di</strong> più variabili, abbiamo <strong>di</strong>versi casi da considerare. Ne consideriamo i<br />

principali.<br />

G Primo caso: Sia z = f(x, y) con x = g(t) e y = h(t). Supponiamo che la f sia una<br />

funzione <strong>di</strong>fferenziabile <strong>di</strong> (x, y) e che g e h siano funzioni <strong>di</strong>fferenziabili <strong>di</strong> t. Allora z è<br />

una funzione <strong>di</strong>fferenziabile <strong>di</strong> t e si ha<br />

30<br />

dz<br />

dt = ∂f dx<br />

∂x dt + ∂f dy<br />

∂y dt<br />

Osserviamo che la derivata <strong>di</strong> z rispetto a t è una derivata totale.<br />

Esempio<br />

Es. 3.9.1 Sia z = f(x, y) = x 3 y + 3xy 2 con x = sin (2t) e y = cos (t). Calcoliamo dz<br />

dt<br />

applicando la formula. Poichè ∂f<br />

∂x = 3x2 y + 3y 2 , ∂f<br />

∂y = x3 + 6xy, dx = 2 cos (2t) e<br />

dt<br />

dy<br />

= − sin (t), ricaviamo:<br />

dt<br />

dz<br />

dt = (3x2 y + 3y 2 )2 cos (2t) + (x 3 + 6xy)(− sin (t))<br />

A questo punto abbiamo calcolato la derivata. Per completare, dobbiamo scrivere x<br />

e y in funzione <strong>di</strong> t:<br />

dz<br />

dt = (3 sin2 (2t) cos (t) + 3 cos 2 (t))2 cos (2t) + (sin 3 (2t) + 6 sin (2t) cos (t)(− sin (t))<br />

e sistemando meglio i termini a destra ricaviamo<br />

dz<br />

dt = 6(sin2 (2t) cos (2t) cos (t)+cos 2 (t) cos (2t))−(sin 2 (2t) sin (t)+6 sin (2t) sin (t) cos (t)).<br />

G Secondo caso: : z = f(x, y) con x = g(s, t) e y = h(s, t). Le funzioni f, g e h siano<br />

<strong>di</strong>fferenziabili. In questo caso possiamo calcolare le derivate parziali della f rispetto a s<br />

e t. Otteniamo<br />

∂z<br />

∂s = ∂f ∂x<br />

∂x ∂s + ∂f ∂y<br />

∂y ∂s<br />

∂z<br />

∂t = ∂f ∂x<br />

∂x ∂t + ∂f ∂y<br />

∂y ∂t


3.10. Piano tangente ad una superficie<br />

Esempio<br />

Es. 3.9.2 Sia z = f(x, y) = e 2x sin (y) con x = st e y = s 2 t.<br />

In tal caso, applicando la formula abbiamo:<br />

∂z<br />

∂s = 2e2x sin (y)t + e 2x cos (y)(2s) = 2e 2st (t sin (s 2 t) + s cos (s 2 t))<br />

∂z<br />

∂t = 2e2x sin (y)s + e 2x cos (y)s 2 = se 2st (2 sin (s 2 t) + s cos (s 2 t))<br />

3.10 Piano tangente ad una superficie<br />

Per funzioni <strong>di</strong> una variabile, se facciamo uno zoom intorno ad un punto del grafico <strong>di</strong><br />

una funzione <strong>di</strong>fferenziabile, il grafico si <strong>di</strong>scosta <strong>di</strong> poco dalla sua retta tangente in quel<br />

punto e possiamo approssimare la funzione, in un intorno del punto, tramite l’equazione <strong>di</strong><br />

una retta.<br />

Un <strong>di</strong>scorso simile si può sviluppare per funzioni <strong>di</strong> due variabili. Qui lo zoom si deve<br />

fare intorno ad un punto della superficie che rappresenta il grafico <strong>di</strong> una funzione <strong>di</strong>fferenziabile.<br />

E il grafico si <strong>di</strong>scosterà poco da un piano (il suo piano tangente in quel punto),<br />

così che potremo approssimare la funzione, in un intorno del punto, tramite l’equazione del<br />

piano tangente.<br />

Sia S la superficie dell’equazione z = f(x, y), con f <strong>di</strong>fferenziabile e <strong>di</strong> classe C 1 . Sia<br />

P 0 (x 0 , y 0 , f(x 0 , y 0 ) un punto <strong>di</strong> S. Consideriamo le curve che intersecano i piani verticali<br />

y = y 0 e x = x 0 sulla superficie S. Il punto <strong>di</strong> intersezione della due curve è proprio il punto<br />

P 0 . Siano T 1 e T 2 le rette tangenti alle due curve nel punto P 0 (le pendenze <strong>di</strong> queste rette<br />

sono date dalle derivate parziali rispetto a x e y). Allora il piano tangente alla superficie<br />

S nel punto P 0 è definito come il piano che contiente entrambe le rette tangenti T 1 e T 2 .<br />

Possiamo pensare a questo piano tangente come il piano in cui ci sono tutte le possibili<br />

rette tangenti per P 0 alle curve che giacciono su S e passano attraverso P 0 (considerando le<br />

derivate <strong>di</strong>rezionali). Il piano tangente è quin<strong>di</strong> il piano che più approssima la superficie S<br />

intorno al punto P 0 .<br />

Un piano passante per il punto P 0 ha equazione nella forma<br />

a(x − x 0 ) + b(y − y 0 ) + c(z − f(x 0 , y 0 )) = 0<br />

Dividendo per c e ponendo A = −a/c e B = −b/c, possiamo scrivere<br />

z − f(x 0 , y 0 ) = A(x − x 0 ) + B(y − y 0 )<br />

Se questa equazione deve rappresentare l’equazione del piano tangente a P 0 sulla superficie,<br />

vuol <strong>di</strong>re che l’intersezione con il piano y = y 0 deve essere la retta tangente T 1 . Ponendo<br />

y = y 0 , l’equazione si riduce a<br />

z − f(x 0 , y 0 ) = A(x − x 0 ), y = y 0<br />

Ora questa è l’equazione <strong>di</strong> una retta che ha pendenza A. Ma la pendenza della tangente T 1<br />

è f x (x 0 , y 0 ). Perciò A = f x (x 0 , y 0 ).<br />

Allo stesso modo, considerando il piano x = x 0 , il piano tangente si riduce a<br />

z − f(x 0 , y 0 ) = B(y − y 0 ), x = x 0<br />

che rappresenta la retta tangente T 2 con pendenza B = f y (x 0 , y 0 ).<br />

Quin<strong>di</strong> l’equazione del piano tangente è data da<br />

z − f(x 0 , y 0 ) = f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ).<br />

31


3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI<br />

3.11 Formula <strong>di</strong> Taylor<br />

Quando si considerano funzioni scalari <strong>di</strong>fferenziabili e continue, la formula <strong>di</strong> Taylor è<br />

utile per approssimare la funzione in un intorno <strong>di</strong> un punto. Data la funzione f(x) e x 0 un<br />

punto che appartiene all’insieme <strong>di</strong> definizione della f, possiamo scrivere:<br />

f(x) = f(x 0 ) + f ′ (x 0 )(x − x 0 ) + (x − x 0) 2<br />

f ′′ (ξ x )<br />

2<br />

dove ξ x è un punto che si trova nell’insieme <strong>di</strong> definizione della f ed è compreso tra x e x 0 .<br />

La formula appena scritta prende il nome <strong>di</strong> formula <strong>di</strong> Taylor <strong>di</strong> centro x 0 e permette <strong>di</strong><br />

approssimare la funzione f(x) in un intorno <strong>di</strong> x 0 utlizzando i valori della funzione in x 0 . Il<br />

polinomio T 1 (x) = f(x 0 ) + f ′ (x 0 )(x − x 0 ) è il polinomio <strong>di</strong> Taylor <strong>di</strong> primo grado. In questo caso<br />

rappresenta la retta tangente alla funzione f nel punto x 0 . Se noi approssiamo f(x) me<strong>di</strong>ante<br />

il polinomio <strong>di</strong> Taylor <strong>di</strong> primo grado, commettiamo un errore dato da R 1 (x) = (x − x 0) 2<br />

f ′′ (ξ x ),<br />

2<br />

che possiamo maggiorare, in valore assoluto, considerando M = max |f ′′ (x)| per x che varia<br />

nell’insieme <strong>di</strong> definizione della f, ottenendo | (x − x 0) 2<br />

f ′′ (ξ x )| ≤ |M (x − x 0) 2<br />

|, un errore del<br />

2<br />

2<br />

secondo or<strong>di</strong>ne.<br />

In generale, il polinomio <strong>di</strong> Taylor <strong>di</strong> grado n è dato da<br />

T n (x) = f(x 0 ) + f ′ (x 0 )(x − x 0 ) + f ′′ (x 0 )<br />

2!<br />

(x − x 0 ) 2 + f (3) (x 0 )<br />

3!<br />

(x − x 0 ) 3 + . . . + f (n) (x 0 )<br />

(x − x 0 ) n<br />

n!<br />

Se approssimiamo f(x) con il polinomio <strong>di</strong> Taylor T n (x), l’errore che si commette è <strong>di</strong> or<strong>di</strong>ne<br />

n + 1, poichè vale R n (x) = f (n+1) (ξ x )<br />

(x − x 0 ) n+1 .<br />

(n + 1)!<br />

Nel caso <strong>di</strong> funzioni <strong>di</strong> più variabili, il polinomio <strong>di</strong> Taylor deve considerare le derivate<br />

parziali della funzioni.<br />

Teorema 3.11.1 Consideriamo una funzione f(x, y) <strong>di</strong> classe C 2 . Allora per ogni punto P 0<br />

nell’insieme <strong>di</strong> definizione della f, vale la formula <strong>di</strong> Taylor data da<br />

f(x, y) = f(x 0 , y 0 ) + f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 )<br />

+ 1 2 f xx(ξ x , η y )(x − x 0 ) 2 + f xy (ξ x , η y )(x − x 0 )(y − y 0 ) + 1 2 f yy(ξ x , η y )(y − y 0 ) 2<br />

dove Q(ξ x , η y ) è un opportuno punto che si trova sul segmento <strong>di</strong> estremi P e P 0 .<br />

Se approssimiamo la funzione f(x, y) con il polinomio <strong>di</strong> Taylor <strong>di</strong> primo grado dato da<br />

T 1 (x, y) = f(x 0 , y 0 ) + f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 )<br />

commettiamo un errore dato da<br />

R 1 (x) = 1 2 f xx(ξ x , η y )(x − x 0 ) 2 + xy (ξ x , η y )(x − x 0 )(y − y 0 ) + 1 2 f yy(ξ x , η y )(y − y 0 ) 2<br />

che è un errore del secondo or<strong>di</strong>ne (abbiamo infatti le potenze (x − x 0 ) 2 , (x − x 0 )(y − y 0 ),<br />

(y − y 0 ) 2 ).<br />

Osserviamo che il polinomio <strong>di</strong> Taylor T 1 (x, y) altro non è che l’equazione del piano<br />

tangente alla superficie della funzione f(x, y) nel punto (x 0 , y 0 , f(x 0 , y 0 )).<br />

Se consideriamo il polinomio <strong>di</strong> Taylor <strong>di</strong> or<strong>di</strong>ne zero per approssimare la funzione f(x, y),<br />

abbiamo il cosidetto teorema <strong>di</strong> Lagrange.<br />

32


3.11. Formula <strong>di</strong> Taylor<br />

Teorema 3.11.2 (<strong>di</strong> Lagrange) Data f : A −→ R con A ⊂ R 2 , f <strong>di</strong> classe C 1 , e dato P 0 (x 0 , y 0 ) ∈<br />

A, si ha<br />

f(x, y) = f(x 0 , y 0 ) + f x (ξ x , η y )(x − x 0 ) + f y (ξ x , η y )(y − y 0 )<br />

dove Q(ξ x , η y ) è un opportuno punto che si trova sul segmento <strong>di</strong> estremi P e P 0 .<br />

33


CAPITOLO 4<br />

Massimi e minimi<br />

La maggior parte delle idee<br />

fondamentali della scienza<br />

sono essenzialmente semplici,<br />

e possono, come una regola,<br />

essere espresse in un<br />

linguaggio comprensibile a<br />

tutti.<br />

Albert Einstein (1879-1955)<br />

4.1 Forme quadratiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35<br />

4.2 Massimi e minimi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />

4.3 Ricerca <strong>di</strong> massimi e minimi relativi . . . . . . . . . . . . . . . . . . . . . . . . . . 40<br />

4.4 Sui massimi e minimi assoluti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43<br />

4.5 Funzioni implicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45<br />

4.5.1 Equazione <strong>di</strong> una retta e vettore normale alla retta . . . . . . . . . . . . . . 47<br />

4.6 Curve <strong>di</strong> livello . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49<br />

4.6.1 Significato del vettore gra<strong>di</strong>ente . . . . . . . . . . . . . . . . . . . . . . . . . 50<br />

4.7 Estremi vincolati e moltiplicatori <strong>di</strong> Lagrange . . . . . . . . . . . . . . . . . . . . . 52<br />

4.1 Forme quadratiche<br />

Prima <strong>di</strong> passare a definire i massimi e minimi <strong>di</strong> una funzione <strong>di</strong> più variabili, ci conviene<br />

introdurre il concetto <strong>di</strong> forma quadratica perchè ci servirà per poter calcolare i massimi e i<br />

minimi.<br />

Nello spazio R 2 , una forma quadratica è un polinomio omogeneo <strong>di</strong> secondo grado nelle<br />

variabili x e y. Ad esempio, F (x, y) = 3x 2 + 5xy + 2y 2 o F (x, y) = x 2 + 10xy − 7y 2 sono forme<br />

quadratiche.<br />

Una forma quadratica si può scrivere utilizzando prodotti <strong>di</strong> matrici e vettori come<br />

F (x, y) = ( x y ) ( ) ( )<br />

a 11 a 12 x<br />

a 21 a 22 y<br />

dove il vettore <strong>di</strong> componenti ( (x, y) ) è scritto prima come vettore riga e poi come vettore<br />

a11 a<br />

colonna. La matrice A =<br />

12<br />

è la matrice dei coefficienti della forma quadratica.<br />

a 21 a 22<br />

Eseguendo il prodotto <strong>di</strong> A con il vettore colonna (x, y) otteniamo:<br />

( ) ( ) ( )<br />

a11 a 12 x a11 x + a<br />

=<br />

12 y<br />

a 22 y a 21 x + a 22 y<br />

a 21<br />

35


4. MASSIMI E MINIMI<br />

Dobbiamo poi moltiplicare il vettore riga (x, y) per il vettore colonna appena ottenuto (facendo<br />

un prodotto scalare tra vettori) ricavando:<br />

( ) ( )<br />

a x y 11 x + a 12 y<br />

= x(a<br />

a 21 x + a 22 y<br />

11 x + a 12 y) + y(a 21 x + a 22 y) = a 11 x 2 + a 12 xy + a 21 xy + a 22 y 2<br />

In definitiva, abbiamo F (x, y) = a 11 x 2 + (a 12 + a 21 )xy + a 22 y 2 .<br />

La matrice dei coefficienti della forma quadratica si può scrivere come una matrice simmetrica<br />

(con a 12 = a 21 ). Se così non fosse, la si può rendere simmetrica prendendo come<br />

coefficiente <strong>di</strong> riga 1 e colonna 2 (e <strong>di</strong> riga 2 e colonna( 1) la semisomma ) dei valori a 12 e a 21<br />

a12 + a 21<br />

della matrice non simmetrica: vale infatti a 12 + a 21 = 2<br />

.<br />

2<br />

Esempio<br />

Es. 4.1.1 Sia F (x, y) = x 2 + 10xy − 7y 2 . Possiamo scrivere questa forma quadratica in<br />

forma matriciale ponendo A in forma non simmetrica:<br />

F (x, y) = ( x y ) ( ( )<br />

1 2 x<br />

8 −7)<br />

y<br />

oppure possiamo scrivere A in forma simmetrica prendendo come valore per gli elementi<br />

extra <strong>di</strong>agonali la semisomma dei corrispondenti elementi della matrice non simmetrica<br />

F (x, y) = ( x y ) ( ( )<br />

1 5 x<br />

5 −7)<br />

y<br />

In entrambi i casi, il risultato è sempre lo stesso, la forma quadratica F (x, y) = x 2 +10xy −<br />

7y 2 .<br />

In generale, una forma quadratica in R 2 viene rappresentata utilizzando una matrice<br />

simmetrica nella forma<br />

F (x, y) = ( x y ) ( ( )<br />

a b x<br />

b c)<br />

y<br />

da cui<br />

F (x, y) = ax 2 + 2bxy + cy 2 .<br />

Nel caso dello spazio R n<br />

seguente.<br />

si generalizza la definizione <strong>di</strong> forma quadratica nel modo<br />

Definizione 4.1.1 Una forma quadratica in R n è un polinomio omogeneo <strong>di</strong> secondo grado<br />

nelle n variabili x 1 , x 2 , . . . , x n , a coefficienti reali. Una forma quadratica si può scrivere come<br />

F (x 1 , x 2 , . . . , x n ) =<br />

n∑<br />

a ij x i x j<br />

i,j=1<br />

In forma matriciale si può scrivere come<br />

⎛<br />

⎞<br />

a 11 a 12 . . . a<br />

⎛ ⎞<br />

1n<br />

F (x 1 , x 2 , . . . , x n ) = ( x 1<br />

)<br />

a 21 a 22 . . . a 2n<br />

x 1 x 2 . . . x n ⎜<br />

⎟ ⎜x 2<br />

⎟<br />

⎝ . . . . . . ⎠ ⎝. . . ⎠<br />

a n1 a n2 . . . a nn<br />

x n<br />

36


4.1. Forme quadratiche<br />

Se la matrice della forma quadratica non è simmetrica la si può rendere simmetrica come<br />

abbiamo visto in R 2 .<br />

Torniamo ora a considerare forme quadratiche in R 2 visto che lavoreremo soprattutto in<br />

questo spazio.<br />

Definizione 4.1.2 Una forma quadratica F (x, y) si <strong>di</strong>ce<br />

G definita positiva se, per ogni (x, y) ≠ (0, 0), F (x, y) > 0;<br />

G semidefinita positiva se, per ogni (x, y) ≠ (0, 0), F (x, y) ≥ 0;<br />

G definita negativa se, per ogni (x, y) ≠ (0, 0), F (x, y) < 0;<br />

G semidefinita negativa se, per ogni (x, y) ≠ (0, 0), F (x, y) ≤ 0;<br />

G indefinita se esistono almeno due punti (x 1 , y 1 ) e (x 2 , y 2 ) tali che F (x 1 , y 1 ) > 0 e F (x 2 , y 2 ) <<br />

0.<br />

Come fare a capire se una forma quadratica è definita positiva, negativa o indefinita<br />

Abbiamo il seguente teorema.<br />

Teorema 4.1.1 Data la forma quadrata F (x, y) = ax 2 + 2bxy + cy 2 :<br />

G se det(A) = ac − b 2 > 0 e a > 0 allora F (x, y) è definita positiva;<br />

G se det(A) = ac − b 2 > 0 e a < 0 allora F (x, y) è definita negativa;<br />

G se det(A) = ac − b 2 < 0 allora F (x, y) è indefinita.<br />

Vale anche il viceversa:<br />

G se F (x, y) è definita positiva allora det(A) = ac − b 2 > 0 e a > 0;<br />

G se F (x, y) è definita negativa allora det(A) = ac − b 2 > 0 e a < 0;<br />

G se F (x, y) è indefinita allora det(A) = ac − b 2 < 0.<br />

Dimostrazione. Ricor<strong>di</strong>amo innanzitutto che det(A) rappresenta il determinante della<br />

matrice A che caratterizza la forma quadratica e che vale det(A) = ac − b 2 .<br />

Scriviamo ora la forma quadratica mettendo in evidenza il coefficiente a e aggiungendo e<br />

sottraendo b2<br />

a 2 y2 , otteniamo:<br />

F (x, y) = ax 2 + 2bxy + cy 2<br />

= a<br />

(x 2 + 2 b a xy + c )<br />

a y2<br />

= a<br />

(x 2 + 2 b b2<br />

xy +<br />

a a 2 y2 − b2<br />

a 2 y2 + c )<br />

a y2<br />

Osserviamo che x 2 + 2 b b2<br />

xy +<br />

a a 2 y2 = (x + b a y)2 . Inoltre − b2<br />

a 2 y2 + c a y2 =<br />

Abbiamo dunque<br />

F (x, y) = a<br />

((x + b )<br />

ac −<br />

a y)2 b2<br />

+<br />

a 2 y 2<br />

ac − b2<br />

a 2 y 2 .<br />

La forma quadratica è dunque data dal prodotto <strong>di</strong> a per la somma <strong>di</strong> due termini: il termine<br />

(x + b ac −<br />

a y)2 b2<br />

è il quadrato <strong>di</strong> un binomio ed è sempre positivo; il termine<br />

a 2 y 2 può essere<br />

positivo o negativo a seconda del segno <strong>di</strong> ac − b 2 .<br />

Se a > 0 e ac − b 2 > 0 allora la forma quadratica è sempre maggiore <strong>di</strong> zero e quin<strong>di</strong> è<br />

definita positiva.<br />

Se a < 0 e ac − b 2 > 0, la forma quadratica è definita negativa.<br />

Se invece ac − b 2 < 0 possiamo avere valori <strong>di</strong> (x, y) per cui la forma quadratica è positiva<br />

e altri valori per cui la forma quadratica è negativa.<br />

37


4. MASSIMI E MINIMI<br />

Viceversa, supponiamo che la F sia definita positiva, negativa o indefinita. Mettiamo in<br />

evidenza il termine y 2 nella forma quadratica. Si ha<br />

(<br />

)<br />

F (x, y) = y 2 a x2<br />

y 2 + 2bx y + c<br />

Poniamo t = x y<br />

in modo da poter scrivere<br />

F (x, y) = y 2 (at 2 + 2bt + c)<br />

Supponiamo che la forma quadratica sia definita positiva: vuol <strong>di</strong>re che y 2 (at 2 + 2bt + c) > 0<br />

per ogni coppia (x, y) ≠ (0, 0), quin<strong>di</strong> deve essere at 2 + 2bt + c > 0 per ogni t: questo si ha con<br />

a > 0 e con il <strong>di</strong>scriminante dell’equazione <strong>di</strong> secondo grado in t negativo, cioè 4b 2 − 4ac < 0,<br />

vale a <strong>di</strong>re ac − b 2 > 0.<br />

Se invece la forma quadratica è definita negativa, vuol <strong>di</strong>re che at 2 + 2bt + c < 0 per ogni<br />

valore <strong>di</strong> t, quin<strong>di</strong> deve essere a < 0 e il <strong>di</strong>scriminante negativo, quin<strong>di</strong> ancora ac − b 2 > 0.<br />

Se invece la forma quadratica è indefinita, possiamo avere sia valori positivi che valori<br />

negativi, perciò il <strong>di</strong>scriminante dell’equazione <strong>di</strong> secondo grado in t deve essere positivo,<br />

cioè ac − b 2 < 0. 1 ✔<br />

Nel caso <strong>di</strong> forme quadratiche in R n , l’analogo teorema per vedere se una forma quadratica<br />

è definita positiva, negativa o indefinita è dato dal teorema <strong>di</strong> Sylvester, che considera i<br />

determinanti <strong>di</strong> tutti i minori principali delle matrice A che definisce la forma quadratica.<br />

Definizione 4.1.3 Data A matrice <strong>di</strong> n righe e n colonne, si definisce minore principale <strong>di</strong><br />

or<strong>di</strong>ne k e si in<strong>di</strong>ca con A k la matrice che si forma dalla matrice A prendendo le prime k righe<br />

e k colonne della matrice stessa.<br />

⎛<br />

Quin<strong>di</strong> A 1 = (a 11 ), A 2 =<br />

( )<br />

a11 a 12<br />

, A<br />

a 21 a k =<br />

22<br />

⎞<br />

a 11 a 12 . . . a 1k<br />

a 21 a 22 . . . a 2k<br />

⎜<br />

⎟<br />

⎝ . . . . . . ⎠ .<br />

a k1 a k2 . . . a kk<br />

Teorema 4.1.2 (<strong>di</strong> Sylvester) Data una forma quadratica in R n , F (x 1 , x 2 , . . . , x n ) =<br />

∑ n<br />

i,j=1 a ijx i x j , allora<br />

G F è definita positiva se e solo se det(A k ) > 0 per ogni k = 1, 2, . . . , n;<br />

G F è definita negativa se e solo se (−1) k det(A k ) > 0 per ogni k = 1, 2, . . . , n.<br />

1 Per la seconda parte <strong>di</strong> questo teorema ci siamo rifatti alle note proprietà:<br />

G ax 2 + bx + c = 0<br />

– se ∆ = b 2 − 4ac < 0 ⇒ non esistono ra<strong>di</strong>ci reali all’equazione;<br />

– se ∆ = 0 ⇒ le ra<strong>di</strong>ci sono coincidenti x 1 = x 2 = −b<br />

2a ;<br />

– se ∆ > 0 ⇒ esistono due ra<strong>di</strong>ci reali e <strong>di</strong>stinte date da −b ± √ ∆<br />

.<br />

2a<br />

G ax 2 + bx + c > 0, a > 0<br />

– se ∆ = b 2 − 4ac < 0 ⇒ l’insieme delle soluzioni che sod<strong>di</strong>sfano la <strong>di</strong>sequazione data è tutto R<br />

– se ∆ = 0 ⇒ l’insieme delle soluzioni è tutto R privato della ra<strong>di</strong>ce dell’equazione ax 2 + bx + c = 0<br />

– se ∆ > 0 ⇒ l’insieme delle soluzioni è dato dai valori esterni all’intervallo delle due ra<strong>di</strong>ci dell’equazione<br />

<strong>di</strong> secondo grado.<br />

G ax 2 + bx + c < 0, a > 0<br />

– se ∆ ≤ 0 ⇒ non ci sono soluzioni per questa <strong>di</strong>sequazione;<br />

– se ∆ > 0 ⇒ l’insieme delle soluzioni è dato dai valori interni all’intervallo delle due ra<strong>di</strong>ci dell’equazione.<br />

38


4.2. Massimi e minimi<br />

4.2 Massimi e minimi<br />

Per funzioni scalari, le derivate della funzione aiutano a capire e a trovare i suoi valori<br />

massimi e minimi e i punti in cui la funzione assume tali valori. Per funzioni <strong>di</strong> due variabili,<br />

sono <strong>di</strong> aiuto le derivate parziali.<br />

Definizione 4.2.1 Sia data una funzione <strong>di</strong> due variabili f(x, y) definita in un sottoinsieme<br />

I ⊂ R 2 .<br />

G Se esiste un punto P 0 (x 0 , y 0 ) tale che per ogni P (x, y) ∈ I, risulta<br />

f(x, y) ≤ f(x 0 , y 0 )<br />

allora P 0 si <strong>di</strong>ce punto <strong>di</strong> massimo assoluto per la funzione f e il valore f(x 0 , y 0 ) si <strong>di</strong>ce<br />

massimo assoluto della funzione.<br />

G Se esiste un punto P 0 (x 0 , y 0 ) tale che per ogni P (x, y) ∈ I, P ≠ P 0 risulta<br />

f(x, y) < f(x 0 , y 0 )<br />

allora P 0 si <strong>di</strong>ce punto <strong>di</strong> massimo assoluto proprio per la funzione f e il valore f(x 0 , y 0 )<br />

si <strong>di</strong>ce massimo assoluto proprio della funzione.<br />

Cambiando il segno alle <strong>di</strong>seguaglianze abbiamo la definizione <strong>di</strong> minimo assoluto e minimo<br />

assoluto proprio.<br />

G Se esiste un punto P 0 (x 0 , y 0 ) tale che per ogni P (x, y) ∈ I, risulta<br />

f(x, y) ≥ f(x 0 , y 0 )<br />

allora P 0 si <strong>di</strong>ce punto <strong>di</strong> minimo assoluto per la funzione f e il valore f(x 0 , y 0 ) si <strong>di</strong>ce<br />

minimo assoluto della funzione.<br />

G Se esiste un punto P 0 (x 0 , y 0 ) tale che per ogni P (x, y) ∈ I, P ≠ P 0 risulta<br />

f(x, y) > f(x 0 , y 0 )<br />

allora P 0 si <strong>di</strong>ce punto <strong>di</strong> minimo assoluto proprio per la funzione f e il valore f(x 0 , y 0 ) si<br />

<strong>di</strong>ce minimo assoluto proprio della funzione.<br />

Se queste definizioni valgono non in tutto l’insieme <strong>di</strong> definizione della funzione f ma localmente,<br />

in un intorno <strong>di</strong> P 0 , allora si ottengono le definizioni <strong>di</strong> punto <strong>di</strong> massimo (o minimo)<br />

relativo (o relativo proprio).<br />

Definizione 4.2.2 Sia data una funzione <strong>di</strong> due variabili f(x, y) definita in un sottoinsieme<br />

I ⊂ R 2 .<br />

G Se esiste un punto P 0 (x 0 , y 0 ) e un intorno <strong>di</strong> centro P 0 e opportuno raggio r tale che per<br />

ogni P (x, y) ∈ A r (P 0 ), risulta<br />

f(x, y) ≤ f(x 0 , y 0 )<br />

allora P 0 si <strong>di</strong>ce punto <strong>di</strong> massimo relativo per la funzione f e il valore f(x 0 , y 0 ) si <strong>di</strong>ce<br />

massimo relativo della funzione.<br />

G Se esiste un punto P 0 (x 0 , y 0 ) e un intorno <strong>di</strong> centro P 0 e opportuno raggio r tale che per<br />

ogni P (x, y) ∈ A r (P 0 ), P ≠ P 0 , risulta<br />

f(x, y) < f(x 0 , y 0 )<br />

allora P 0 si <strong>di</strong>ce punto <strong>di</strong> massimo relativo proprio per la funzione f e il valore f(x 0 , y 0 ) si<br />

<strong>di</strong>ce massimo relativo della funzione.<br />

39


4. MASSIMI E MINIMI<br />

Cambiando il segno alle <strong>di</strong>seguaglianze abbiamo la definizione <strong>di</strong> minimo relativo e minimo<br />

relativo proprio.<br />

Definizione 4.2.3 I valori massimo e minimo (assoluti o relativi) assunti dalla funzione si<br />

chiamano anche estremi (assoluti e relativi) della funzione.<br />

Un punto <strong>di</strong> estremo relativo interno all’insieme <strong>di</strong> definizione della funzione f si chiama<br />

punto <strong>di</strong> estremo relativo interno.<br />

Teorema 4.2.1 Se una funzione f : I −→ R, con I ⊂ R 2 , I aperto, f ∈ C 1 (I), ammette un<br />

punto <strong>di</strong> massimo o minimo relativo interno nel punto P 0 (x 0 , y 0 ) allora esistono le derivate<br />

parziali della f in P 0 e vale f x (P 0 ) = f y (P 0 ) = 0<br />

Dimostrazione. Sia P 0 (x 0 , y 0 ) un punto <strong>di</strong> massimo (o minimo) relativo interno. Poniamo<br />

g(x) = f(x, y 0 ). Come conseguenza la funzione g ammette in x = x 0 un punto <strong>di</strong> massimo (o<br />

minimo) relativo interno e, quin<strong>di</strong>, g ′ (x 0 ) = 0. Ma g ′ (x 0 ) = f x (x 0 , y 0 ). Perciò vale f x (x 0 , y 0 ) = 0.<br />

Allo stesso modo, posto h(y) = f(x 0 , y), si ha che y 0 è punto <strong>di</strong> massimo (o minimo) relativo<br />

interno per la funzione h, da cui h ′ (y 0 ) = 0. Ma h ′ (y 0 ) = f y (x 0 , y 0 ) e quin<strong>di</strong> f y (x 0 , y 0 ) = 0. ✔<br />

Perciò, se P 0 è un punto <strong>di</strong> estremo relativo interno per la funzione f, necessariamente il<br />

gra<strong>di</strong>ente della f in P 0 è il vettore nullo:<br />

⃗∇(f)(P 0 ) = (00).<br />

Non vale il viceversa, tuttavia se dobbiamo cercare i punti <strong>di</strong> massimo e minimo relativo<br />

interni all’insieme <strong>di</strong> definizione <strong>di</strong> una funzione, dobbiamo analizzare quei punti che hanno<br />

il gra<strong>di</strong>ente nullo perchè tra questi ci saranno i punti <strong>di</strong> massimo e minimo relativi. Se<br />

l’insieme <strong>di</strong> definizione della funzione è un insieme aperto, i punti <strong>di</strong> massimo e minimo<br />

relativo sono tutti punti interni all’insieme <strong>di</strong> definizione.<br />

Vale la seguente definizione.<br />

Definizione 4.2.4 Un punto P 0 (x 0 , y 0 ) tale che ∇(f)(P ⃗ 0 ) = (00) si <strong>di</strong>ce punto critico (o<br />

stazionario) della funzione f.<br />

4.3 Ricerca <strong>di</strong> massimi e minimi relativi<br />

Per capire se una funzione ha un punto <strong>di</strong> massimo o minimo relativo in un suo punto<br />

critico, viene in aiuto il cosiddetto test sulle derivate seconde. A tale scopo introduciamo la<br />

seguente definizione.<br />

Definizione 4.3.1 Data una funzione f ∈ C 2 (I), con I ⊂ R 2 , I aperto, e dato un punto P 0 ∈ I,<br />

si definisce hessiano della f in P 0 il determinante H f (P 0 ) della matrice<br />

( )<br />

fxx (P 0 ) f xy (P 0 )<br />

f xy (P 0 ) f yy (P 0 )<br />

Poichè la funzione è <strong>di</strong> classe C 2 , vale f xy = f yx .<br />

Quin<strong>di</strong><br />

H f (P 0 ) =<br />

∣ f xx(P 0 ) f xy (P 0 )<br />

f xy (P 0 ) f yy (P 0 ) ∣ = f xx(P 0 )f yy (P 0 ) − (f xy (P 0 )) 2<br />

Teorema 4.3.1 (Test sulle derivate seconde) Data una funzione f ∈ C 2 (I), con I ⊂ R 2 , I<br />

aperto, e dato P 0 punto critico per f, avente come hessiano H f (P 0 ) = f xx (P 0 )f yy (P 0 )−(f xy (P 0 )) 2 ,<br />

si ha:<br />

40


4.3. Ricerca <strong>di</strong> massimi e minimi relativi<br />

G se H f (P 0 ) > 0 e f xx (P 0 ) > 0, allora P 0 è un punto <strong>di</strong> minimo relativo interno proprio e f(P 0 )<br />

è un valore <strong>di</strong> minimo relativo;<br />

G se H f (P 0 ) > 0 e f xx (P 0 ) < 0, allora P 0 è un punto <strong>di</strong> massimo relativo interno proprio e<br />

f(P 0 ) è un valore <strong>di</strong> massimo relativo;<br />

G se H f (P 0 ) < 0 allora P 0 non è nè punto <strong>di</strong> massimo nè punto <strong>di</strong> minimo relativo e si chiama<br />

punto <strong>di</strong> sella.<br />

Osserviamo che se vale H f (P 0 ) = 0, P 0 può essere punto <strong>di</strong> minimo, massimo o <strong>di</strong> sella: bisogna<br />

indagare caso per caso.<br />

Dimostrazione. Per <strong>di</strong>mostrare questo teorema, applichiamo la formula <strong>di</strong> Taylor <strong>di</strong><br />

centro P 0 alla funzione f:<br />

f(x, y) = f(x 0 , y 0 ) + f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 )<br />

+ 1 2 f xx(ξ x , η y )(x − x 0 ) 2 + f xy (ξ x , η y )(x − x 0 )(y − y 0 ) + 1 2 f yy(ξ x , η y )(y − y 0 ) 2<br />

Considerando x = x 0 + h e y = y 0 + k, poichè P 0 è un punto critico, la formula si riduce a<br />

f(x 0 + h, y 0 + k) = f(x 0 , y 0 ) + 1 2 f xx(ξ x , η y )h 2 + f xy (ξ x , η y )hk + 1 2 f yy(ξ x , η y )k 2<br />

= f(x 0 , y 0 ) + 1 2<br />

(<br />

fxx (ξ x , η y )h 2 + 2f xy (ξ x , η y )hk + f yy (ξ x , η y )k 2)<br />

dove (ξ x , η y ) è un punto che non conosciamo, sul segmento <strong>di</strong> estremi P e P 0 .<br />

In un opportuno intorno <strong>di</strong> P 0 , per il teorema della permanenza del segno, se vale<br />

f xx (x 0 , y 0 ) > 0 vale anche f xx (x, y) > 0 nell’intorno <strong>di</strong> P 0 . Alla stessa maniera, sempre per<br />

lo stesso teorema sulla permanenza del segno, se H f (P 0 ) > 0 anche H f (P ) > 0 nell’intorno <strong>di</strong><br />

P 0 .<br />

Supponiamo, allora <strong>di</strong> trovarci nelle ipotesi in cui H f (P 0 ) > 0 e f xx (P 0 ) > 0. Allora la forma<br />

quadratica data da<br />

F 0 (h, k) = f xx (P 0 )h 2 + 2f xy (P 0 )hk + f yy (P 0 )k 2<br />

ha il determinante della matrice ad essa associata che vale det(A) = f xx (P 0 )f yy (P 0 )−(f xy (P 0 )) 2<br />

cioè det(A) = H f (P 0 ). Poichè per ipotesi, H f (P 0 ) > 0 e f xx (P 0 ) > 0, allora la forma quadratica<br />

è definita positiva. La stessa cosa vale per la forma quadratica definita in un opportuno<br />

intorno <strong>di</strong> P 0 , considerando il punto (ξ x , η x ) della formula <strong>di</strong> Taylor: la forma quadratica<br />

data da F ξ,η (h, k) = f xx (ξ x , η y )h 2 +2f xy (ξ x , η y )hk +f yy (ξ x , η y )k 2 è una forma quadratica positiva,<br />

cioè F ξ,η (h, k) > 0. Riprendendo la formula <strong>di</strong> Taylor, in un intorno <strong>di</strong> P 0 risulta quin<strong>di</strong><br />

da cui<br />

cioè<br />

f(x, y) = f(x 0 , y 0 ) + 1 2 F ξ,η(h, k)<br />

f(x, y) − f(x 0 , y 0 ) = 1 2 F ξ,η(h, k) > 0<br />

f(x, y) > f(x 0 , y 0 ).<br />

Il punto P 0 è perciò un punto <strong>di</strong> minimo relativo proprio.<br />

Analogamente si provano gli altri due casi: se l’hessiano in P 0 è positivo e f xx (P 0 ) < 0<br />

allora la forma quadratica associata è definita negativa e, dalla formula <strong>di</strong> Taylor, risulta<br />

che P 0 è un punto <strong>di</strong> massimo relativo. Se invece l’hessiano è negativo, la forma quadratica<br />

41


4. MASSIMI E MINIMI<br />

Figura 4.1: Grafico della funzione f(x, y) = x 4 + y 4 − 4xy + 2.<br />

associata è indefinita e quin<strong>di</strong> P 0 non può essere nè <strong>di</strong> massimo nè <strong>di</strong> minimo, ma è un<br />

punto <strong>di</strong> sella. ✔<br />

Esempio<br />

Es. 4.3.1 Calcolare i punti <strong>di</strong> massimo e minimo relativo e i corrispondenti valori <strong>di</strong><br />

massimo e minimo della funzione f(x, y) = x 4 + y 4 − 4xy + 2.<br />

Calcoliamo i punti critici della funzione calcolando le derivate parziali prime e ponendole<br />

uguali a zero:<br />

{<br />

f x (x, y) = 4x 3 − 4y = 0<br />

f y (x, y) = 4y 3 − 4x = 0<br />

Dalla prima equazione abbiamo y = x 3 e sostituendo nella seconda equazione ricaviamo<br />

0 = 4(x 9 −x) = 4x(x 8 −1) = 4x(x 4 −1)(x 4 +1) = 4x(x 2 −1)(x 2 +1)(x 4 +1) = 4x(x−1)(x+1)(x 2 +1)(x 4 +1)<br />

Le ra<strong>di</strong>ci reali sono tre x = 0, x = 1, x = −1, che, insieme alla relazione y = x 3 , ci danno i<br />

tre punti critici P 0 (0, 0), P 1 (1, 1) e P 2 (−1, −1).<br />

Per ciascuno <strong>di</strong> questi punti critici applichiamo il teorema del test sulle derivate seconde.<br />

In questo caso le derivate parziali seconde sono:<br />

f xx = 12x 2 , f xy = −4, f yy = 12y 2<br />

Per il punto P 0 abbiamo H f (P 0 ) = −16 < 0, quin<strong>di</strong> possiamo <strong>di</strong>re subito che P 0 è un punto<br />

<strong>di</strong> sella.<br />

Per P 1 si ha H f (P 1 ) = 128 > 0, f xx (P 1 ) = 12 > 0, quin<strong>di</strong> P 1 è un punto <strong>di</strong> minimo relativo<br />

interno proprio con valore minimo f(P 1 ) = 0.<br />

Per P 2 vale H f (P 2 ) = 128 > 0, f xx (P 2 ) = 12 > 0, quin<strong>di</strong> P 2 è un altro punto <strong>di</strong> minimo<br />

relativo interno proprio con valore minimo f(P 2 ) = 0.<br />

In Figura 4.1 possiamo osservare come P 1 e P 2 siano punti <strong>di</strong> minimo mentre P 0 è un<br />

punto <strong>di</strong> sella.<br />

42


4.4. Sui massimi e minimi assoluti<br />

Figura 4.2: Grafico della funzione f(x, y) = 2y 2 .<br />

Esempio<br />

Es. 4.3.2 Consideriamo ora la funzione f(x, y) = 2y 2 e cerchiamo i punti <strong>di</strong> massimo e<br />

minimo relativo. Per i punti critici, imponiamo che il gra<strong>di</strong>ente della funzione sia uguale<br />

a zero, quin<strong>di</strong><br />

{<br />

f x = 0<br />

f y = 4y = 0<br />

La f x vale sempre zero perchè la f non <strong>di</strong>pende da x, Dalla seconda equazione ricaviamo<br />

y = 0, da cui i punti critici della funzione sono tutti i punti <strong>di</strong> coor<strong>di</strong>nate (x, 0), cioè tutti i<br />

punti dell’asse delle x.<br />

An<strong>di</strong>amo a calcolare l’Hessiano in questi punti. Poichè f xx = 0, f xy = 0, e f yy = 4, segue<br />

che H f (x, 0) = 0. Quin<strong>di</strong> il teorema sul test delle derivate seconde non ci può <strong>di</strong>re nulla.<br />

In tal caso, dobbiamo vedere come è fatta la funzione e cercare <strong>di</strong> capire cosa succede in<br />

un intorno <strong>di</strong> questi punti critici.<br />

Fissato x = x 0 , per il punto (x 0 , 0), in un suo qualunque intorno vale f(x, y) = 2y 2 ≥ 0 =<br />

f(x 0 , 0) (posso prendere anche un punto che ha y = 0 ma x ≠ x 0 ). Si conclude quin<strong>di</strong><br />

che (x 0 , 0) è un punto <strong>di</strong> minimo relativo. Questo vale per tutti i punti (x, 0), che sono,<br />

dunque, tutti punti <strong>di</strong> minimo relativo (non proprio). Si veda la Figura 4.2 per confrontare<br />

i risultati.<br />

4.4 Sui massimi e minimi assoluti<br />

Per funzioni scalari, il teorema <strong>di</strong> Weierstrass assicura che se una funzione è continua in<br />

un intervallo chiuso e limitato allora essa ammette massimo e minimo (assoluti).<br />

Lo stesso teorema vale anche per funzioni <strong>di</strong> più variabili.<br />

Teorema 4.4.1 (<strong>di</strong> Weierstrass) Data una funzione continua f : I −→ R, con I ⊂ R 2 , I<br />

insieme chiuso e limitato (quin<strong>di</strong> compatto), la f ammette massimo e minimo (assoluti) in I.<br />

43


4. MASSIMI E MINIMI<br />

Questo teorema è utile per trovare massimi e minimi assoluti <strong>di</strong> una funzione continua<br />

in un insieme compatto I. Si può applicare questo metodo:<br />

1. si calcola il valore della f nei punti critici della f che si trovano all’interno <strong>di</strong> I;<br />

2. si stu<strong>di</strong>a la funzione sulla frontiera <strong>di</strong> I e si cercano i valori estremi della f sulla<br />

frontiera;<br />

3. il più grande dei valori trovati ai passi 1 e 2 rappresenta il valore assoluto massimo della<br />

funzione; il più piccolo dei valori trovati rappresenta il valore minimo assoluto della<br />

funzione. I corrispondenti punti sono rispettivamente i punti <strong>di</strong> massimo e minimo<br />

assoluti della funzione.<br />

Osserviamo, quin<strong>di</strong>, che la procedura per trovare i valori estremi assoluti <strong>di</strong> una funzione,<br />

in un insieme compatto, è <strong>di</strong>versa dalla procedura per trovare gli estremi relativi <strong>di</strong> una<br />

funzione me<strong>di</strong>ante il test delle derivate seconde.<br />

A volte, si cercano sia gli estremi assoluti sia gli estremi relativi <strong>di</strong> una funzione e, in<br />

questo caso, vanno seguite entrambe le strade.<br />

Esempio<br />

Es. 4.4.1 Si devono trovare gli estremi assoluti della funzione f(x, y) = x 2 − 4xy + 4y sul<br />

rettangolo D = {(x, y) : 0 ≤ x ≤ 2, 0 ≤ y ≤ 4}.<br />

L’insieme D è un insieme chiuso e limitato (il rettangolo <strong>di</strong> vertici A(0, 0), B(2, 0), C(2, 4),<br />

D(0, 4)), la funzione è polinomiale, perciò continua. Ci troviamo nelle ipotesi del teorema<br />

<strong>di</strong> Weierstrass, quin<strong>di</strong> esistono il massimo e il minimo assoluti della funzione in D.<br />

Cerchiamo i punti critici interni: da f x = 2x − 4y e f y = −4x + 4, ponendo queste derivate<br />

uguali a zero abbiamo il sistema <strong>di</strong> equazioni<br />

{<br />

2x − 4y = 0<br />

4 − 4x = 0<br />

Dalla seconda equazione ricaviamo x = 1, da cui, nella prima, 4y = 2, cioè y = 1 2 . Otteniamo<br />

il punto critico P 0 (1, 1 2 ). Il punto P 0 si trova all’interno dell’insieme D (se così non fosse<br />

non lo dovremmo prendere in considerazione). Calcoliamo f(P 0 ) = 1. Non dobbiamo vedere<br />

se questo è un punto <strong>di</strong> massimo o minimo relativo (non è richiesto), quin<strong>di</strong> passiamo<br />

a vedere cosa succede alla funzione sulla frontiera (se invece dovessimo calcolare anche<br />

gli estremi relativi, a questo punto dovremmo applicare il test della derivata seconda). La<br />

frontiera dell’insieme I è dato dall’unione dei segmenti AB, BC, CD e DA.<br />

Il segmento AB ha equazione y = 0 con 0 ≤ x ≤ 2. Su questo segmento la funzione f si<br />

riduce ad una funzione della sola variabile x, g(x) = f(x, 0) = x 2 , con 0 ≤ x ≤ 2. Si vede<br />

facilmente (poichè g ′ (x) = 2x ≥ 0 nell’intervallo dato) che la g è una funzione crescente<br />

in [0, 2]: il suo valore minimo si ha per x = 0 (g(0) = 0) e il suo valore massimo per x = 2<br />

(g(2) = 4). Quin<strong>di</strong> dal segmento AB dobbiamo ricordare i punti A e B dove la funzione<br />

vale 0 e 4 rispettivamente.<br />

Il segmento BC ha equazione x = 2 con 0 ≤ y ≤ 4. Qui la funzione si riduce a h(y) =<br />

f(2, y) = 4−8y +4y = 4−4y nell’intervallo [0, 4]. La funzione è decrescente (h ′ (y) = −4 < 0),<br />

quin<strong>di</strong> assume valore massimo in 0 (h(0) = 4) e minimo in 4 (h(4) = −12). Per y = 0<br />

ritroviamo il punto B, per y = 4 troviamo il vertice C.<br />

Sul segmento CD, <strong>di</strong> equazione y = 4, con 0 ≤ x ≤ 2, la funzione <strong>di</strong>venta g(x) = f(x, 4) =<br />

x 2 − 16x + 16 per x ∈ [0, 2]. La derivata g ′ (x) = 2x − 16 si annulla per x = 8 che è un punto<br />

all’esterno dell’intervallo in cui deve variare la x (se fosse all’interno avremmo trovato<br />

un punto critico da considerare ai fini del calcolo <strong>degli</strong> estremi della f). Si ha g ′ (x) < 0<br />

per 2x − 16 < 0 cioè x < 8: quin<strong>di</strong> nell’intervallo [0, 2] la g è decrescente e assume valore<br />

massimo in 0 (g(0) = 16) e valore minimo in 2 (g(2) = −12). Per x = 0 abbiamo il vertice D,<br />

per x = 2 ritroviamo C.<br />

44


4.5. Funzioni implicite<br />

Figura 4.3: Grafico della funzione f(x, y) = x 2 − 4xy + 4y nell’insieme compatto [0, 2] × [0, 4].<br />

Arriviamo infine al segmento AD dato dall’equazione x = 0, per 0 ≤ y ≤ 4. La funzione<br />

<strong>di</strong>venta h(y) = f(0, y) = 4y. La funzione è crescente e assume valore minimo e massimo<br />

rispettivamente agli estremi 0 e 4. Ritroviamo i punti A e D.<br />

Quin<strong>di</strong> i valori da confrontare sono: P 1 (1, 1 2 ) dove f(P 1) = 1, A dove f(A) = 0, B con<br />

f(B) = 4, C dove f(C) = −12, e D con f(D) = 16.<br />

Dal confronto segue che il massimo assoluto vale 16 e punto <strong>di</strong> massimo assoluto è D,<br />

mentre il minimo assoluto è −12 con punto <strong>di</strong> minimo assoluto C.<br />

4.5 Funzioni implicite<br />

Nello stu<strong>di</strong>are funzioni scalari, abbiamo visto funzioni del tipo y = f(x): la variabile y è<br />

funzione esplicita della variabile y:<br />

y = sin (x), y = √ x 3 + 2, y = ln x + 4, . . . . . .<br />

Ma ci sono anche funzioni che sono definite implicitamente da una relazione tra x e y<br />

come, ad esempio,<br />

x 2 + y 2 = 9 o x 3 + y 3 = 12xy o xye xy2 + 3ye −x = 0 o . . .<br />

In alcuni casi è possibile risolvere questo tipo <strong>di</strong> equazioni scrivendo y come una funzione<br />

esplicita (o più funzioni esplicite) <strong>di</strong> x.<br />

Nel caso <strong>di</strong> x 2 + y 2 = 9, si ottiene y = ± √ √ 9 − x 2 , quin<strong>di</strong> due troviamo due funzioni f(x) =<br />

9 − x2 e g(x) = − √ 9 − x 2 . I grafici della f e della g sono rispettivamente il semicerchio<br />

superiore e inferiore della circonferenza x 2 + y 2 = 9 e, insieme, ci danno il grafico <strong>di</strong> tutta la<br />

circonferenza.<br />

Non è altrettanto facile trovare un’espressione esplicita <strong>di</strong> y come funzione <strong>di</strong> x nel caso<br />

<strong>di</strong> x 3 + y 3 = 12xy: potremmo usare la formula per trovare le ra<strong>di</strong>ci <strong>di</strong> un polinomio <strong>di</strong> terzo<br />

45


4. MASSIMI E MINIMI<br />

grado (supponendo x costante). Ma le formule sono talmente complicate che non le scriviamo<br />

neanche! Ci accontentiamo <strong>di</strong> sapere che è possibile risolvere il problema.<br />

Per la funzione xye xy2 + 3ye −x = 0 non riusciamo a trovare una formula esplicita che ci<br />

permetta <strong>di</strong> scrivere y in funzione <strong>di</strong> x o viceversa x come funzione <strong>di</strong> y.<br />

Si ha quin<strong>di</strong> questo problema: data un’equazione f(x, y) = 0 è possibile scrivere y = g(x)<br />

tale che f(x, g(x)) = 0 In tal caso <strong>di</strong>remo che la y = g(x) è definita implicitamente dalla f. Si<br />

ha la seguente definizione.<br />

Definizione 4.5.1 Data una funzione f(x, y) definita in un sottoinsieme <strong>di</strong> R 2 , <strong>di</strong>ciamo che<br />

la funzione y = g(x) definita in un intervallo <strong>di</strong> R è definita implicitamente dall’equazione<br />

f(x, y) = 0 se, per ogni x che appartiene all’intervallo <strong>di</strong> definizione della g, si ha che<br />

G il punto (x, g(x)) appartiene all’insieme <strong>di</strong> definizione della f;<br />

G f(x, g(x)) = 0.<br />

Dire f(x, y) = 0 vuol <strong>di</strong>re intersecare il grafico della superficie della funzione f con il piano<br />

z = 0, cioè con il piano xy, ricavandone quin<strong>di</strong> una curva. Per tutti quei punti per cui<br />

(x, g(x)) ∈ I e f(x, g(x)) = 0 il grafico della g coincide con il grafico della curva f(x, y) = 0.<br />

Per capire se esiste una funzione g definita implicitamente dalla f e se è unica, si ha il<br />

seguente teorema.<br />

Teorema 4.5.1 (delle funzioni implicite o teorema <strong>di</strong> Dini) Sia data una funzione f :<br />

I −→ R con I ⊂ R 2 , I aperto, f ∈ C 1 (I). Sia P 0 (x 0 , y 0 ) ∈ I tale che f(x 0 , y 0 ) = 0 e f y (x 0 , y 0 ) ≠ 0.<br />

Allora esiste un’unica funzione y = g(x) definita in un opportuno intorno <strong>di</strong> x 0 (]x 0 − ɛ, x 0 + ɛ[),<br />

<strong>di</strong> classe C 1 , tale che, per ogni x ∈]x 0 − ɛ, x 0 + ɛ[ risulta<br />

G y 0 = g(x 0 )<br />

G (x, g(x)) ∈ I<br />

G f(x, g(x)) = 0<br />

G g ′ (x) = − f x(x, g(x))<br />

f y (x, g(x)) .<br />

La formula della derivata prima <strong>di</strong> g si ottiene applicando le regole <strong>di</strong> derivazione per le<br />

funzioni composte. Poichè f y (x 0 , y 0 ) ≠ 0, per il teorema della permanenza del segno si ha<br />

f y (x, g(x)) ≠ 0 in un intorno <strong>di</strong> (x 0 , y 0 ). Deriviamo ambo i membri dell’equazione f(x, g(x)) = 0<br />

rispetto alla variabile x (è come se avessimo x = t, y = g(x) = g(t) ma continuiamo a chiamare<br />

la variabile t con x). Abbiamo<br />

df<br />

dx = 0<br />

Ma (considerando che dx<br />

dx = 1)<br />

Dunque<br />

df<br />

dx = f x(x, g(x)) + f y (x, g(x))g ′ (x).<br />

f x (x, g(x)) + f y (x, g(x))g ′ (x) = 0<br />

Poichè, per l’ipotesi f y (x 0 , y 0 ) ≠ 0 (quin<strong>di</strong> anche f y (x, g(x)) ≠ 0) possiamo <strong>di</strong>videre tutto per f y<br />

ricavando<br />

g ′ (x) = − f x(x, g(x))<br />

f y (x, g(x))<br />

Osserviamo che il teorema <strong>di</strong> Dini dà una con<strong>di</strong>zione sufficiente ma non necessaria per<br />

l’esistenza e unicità delle funzioni implicite.<br />

46


4.5. Funzioni implicite<br />

Come conseguenza del teorema, possiamo ricavare l’equazione della retta tangente alla<br />

funzione y = g(x) definita implicitamente dalla f nel punto x 0 . Infatti l’equazione della retta<br />

tangente in x 0 per la funzione g è data da<br />

y − g(x 0 ) = g ′ (x 0 )(x − x 0 ) cioè y − y 0 = − f x(x 0 , y 0 )<br />

f y (x 0 , y 0 ) (x − x 0)<br />

Moltiplicando ambo i membri per f y (x 0 , y 0 ) troviamo<br />

f y (x 0 , y 0 )(y − y 0 ) = −f x (x 0 , y 0 )(x − x 0 ) da cui f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) = 0<br />

Quest’ultima relazione <strong>di</strong>ce che il gra<strong>di</strong>ente della f in (x 0 , y 0 ) è ortogonale alla retta<br />

tangente alla curva f(x, y) = 0 in P 0 .<br />

4.5.1 Equazione <strong>di</strong> una retta e vettore normale alla retta<br />

Facciamo un breve richiamo <strong>di</strong> geometria analitica per comprendere meglio che la<br />

relazione<br />

f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) = 0<br />

scritta prima significa <strong>di</strong>re che il gra<strong>di</strong>ente della f in (x 0 , y 0 ) è ortogonale alla retta tangente<br />

a f(x, y) = 0 in P 0 .<br />

Sia assegnata una retta nello spazio R 2 e sia P 0 = (x 0 , y 0 ) un punto che giace sulla retta.<br />

Sia ⃗n = (a, b) (n sta per normale) un vettore ortogonale (normale, perpen<strong>di</strong>colare) alla<br />

retta: il vettore è detto vettore normale.<br />

Sia dato un altro generico punto P = (x, y) sulla retta.<br />

In<strong>di</strong>chiamo con ⃗r e ⃗r 0 i vettori che ci in<strong>di</strong>cano i due punti P e P 0 rispettivamente (si veda<br />

figura 4.4). Il segmento P P 0 è dato dal vettore ⃗r − ⃗r 0 .<br />

Figura 4.4: retta nel piano<br />

Ora, poichè ⃗n è ortogonale alla retta, esso è ortogonale al vettore ⃗r − ⃗r 0 , cioè il prodotto<br />

scalare tra i due vettori è nullo:<br />

⃗n · (⃗r − ⃗r 0 ) = 0<br />

Poichè ⃗r − ⃗r 0 = (x − x 0 , y − y 0 ), il prodotto scalare <strong>di</strong>venta<br />

a(x − x 0 ) + b(y − y 0 ) = 0<br />

47


4. MASSIMI E MINIMI<br />

Questa che abbiamo scritto rappresenta l’equazione della retta passante 2 per P e P 0 .<br />

Quin<strong>di</strong>, data l’equazione <strong>di</strong> una retta nella forma a(x − x 0 ) + b(y − y 0 ) = 0 il vettore che ha<br />

come componenti i due coefficienti a e b, rappresenta il vettore normale alla retta: ⃗n = (a, b).<br />

3<br />

Riprendendo la retta f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) = 0, questa retta rappresenta la<br />

retta tangente a y = g(x) nel punto x 0 . Poichè il grafico della g coincide con il grafico della<br />

curva f(x, y) = 0 nell’intorno <strong>di</strong> x 0 , vuole <strong>di</strong>re che la retta è tangente alla curva f(x, g(x)) = 0<br />

in (x 0 , y 0 ). Il gra<strong>di</strong>ente della f in (x 0 , y 0 ) è dunque ortogonale alla tangente a questa curva.<br />

Dallo stu<strong>di</strong>o <strong>di</strong> g ′ e, eventualmente <strong>di</strong> g ′′ (che si ottiene applicando nuovamente la formula<br />

<strong>di</strong> derivazione delle funzioni composte) possiamo ottenere informazioni sulla funzione g e,<br />

quin<strong>di</strong>, anche su f(x, y) = 0 nell’intorno <strong>di</strong> un punto (x 0 , y 0 ). Lo ve<strong>di</strong>amo con un esempio.<br />

Esempio<br />

Es. 4.5.1 Sia data la funzione f(x, y) = xe 4y + 3y − 1.<br />

Si vuol vedere se nel punto<br />

P 0 (x 0 , y 0 ) = (0, 1 ) sono verificate le ipotesi del teorema <strong>di</strong> Dini e, in caso affermativo,<br />

3<br />

se la funzione y = g(x) definita implicitamente da f(x, y) = 0 è una funzione crescente o<br />

decrescente, concava o convessa in un intorno <strong>di</strong> x 0 .<br />

Calcoliamo f(0, 1 3 ) = 0 + 1 − 1 = 0. Inoltre f y(x, y) = 4xe 4y + 3 e f y (0, 1 3 ) = 3 ≠ 0.<br />

L’altra derivata parziale è f x = e 4y . Le derivate parziali sono continue, quin<strong>di</strong> f ∈ C 1 .<br />

Siamo nelle ipotesi del teorema <strong>di</strong> Dini, quin<strong>di</strong> esiste un’unica funzione y = g(x) definita<br />

in un intorno <strong>di</strong> x 0 = 0 tale che (x, g(x)) appartiente all’insieme <strong>di</strong> definizione della f,<br />

f(x, g(x)) = 0 e g ′ (x) = − f x(x, g(x))<br />

f y (x, g(x)) .<br />

Per vedere se la funzione è crescente o decrescente, calcoliamo g ′ (0). Poichè f x (0, 1 3 ) = e4/3<br />

e f y (0, 1 3 ) = 3, risulta g′ (0) = − e4/3<br />

< 0. Quin<strong>di</strong> la g è decrescente in un intorno <strong>di</strong> 0.<br />

3<br />

Per calcolare g ′′ (0) (e capire quin<strong>di</strong> se la g è convessa o concava) torniamo all’equazione<br />

f x (x, g(x)) + f y (x, g(x))g ′ (x) = 0<br />

e deriviamo ancora rispetto a x, ottenendo<br />

f xx (x, g(x))+f xy (x, g(x))g ′ (x)+f yx (x, g(x))g ′ (x)+f yy (x, g(x))(g ′ (x)) 2 +f y (x, g(x))g ′′ (x) = 0<br />

Nelle ipotesi (verificate in questo esempio) <strong>di</strong> derivate parziali seconde continue, vale<br />

f xy = f yx . Inoltre, f y (x, g(x)) ≠ 0 quin<strong>di</strong><br />

g ′′ (x) = − f xx(x, g(x)) + 2f xy (x, g(x))g ′ (x) + f yy (x, g(x))(g ′ (x)) 2<br />

f y (x, g(x))<br />

2 Spesso troviamo l’equazione scritta nella forma<br />

o ancora<br />

ax + by = d dove d = ax 0 + by 0<br />

y = mx + d dove m = − a b , d = a b x 0 + y 0<br />

3 ⃗n = (−m, 1), se usiamo la rappresentazione della retta me<strong>di</strong>ante y = mx + d.<br />

48


4.6. Curve <strong>di</strong> livello<br />

Adesso possiamo calcolare g ′′ (0). Abbiamo f xx = 0, f xy = 4e 4y , f yy = 16xe 4y , da cui<br />

f xx (P 0 ) = 0, f xy (P 0 ) = 4e 4/3 , f yy = 0, quin<strong>di</strong><br />

8e 4/3 (− e4/3<br />

g ′′ (0) = − 3 )<br />

> 0<br />

3<br />

La funzione è convessa in un intorno <strong>di</strong> 0.<br />

Osserviamo che, se f(x 0 , y 0 ) = 0 e f y (x 0 , y 0 ) = 0, non possiamo applicare il teorema <strong>di</strong><br />

Dini. Tuttavia, se, oltre a f(x 0 , y 0 ) = 0, si ha f x (x 0 , y 0 ) ≠ 0, si può applicare il teorema <strong>di</strong> Dini,<br />

scambiando il ruolo <strong>di</strong> x e y. Si ha la seguente formulazione<br />

Teorema 4.5.2 (<strong>di</strong> Dini, scambiando il ruolo <strong>di</strong> x e y) Sia data una funzione f : I −→ R<br />

con I ⊂ R 2 , I aperto, f ∈ C 1 (I). Sia P 0 (x 0 , y 0 ) ∈ I tale che f(x 0 , y 0 ) = 0 e f x (x 0 , y 0 ) ≠ 0. Allora<br />

esiste un’unica funzione x = h(y) definita in un opportuno intorno <strong>di</strong> y 0 (]y 0 − ɛ, y 0 + ɛ[), <strong>di</strong> classe<br />

C 1 , tale che, per ogni y ∈]y 0 − ɛ, y 0 + ɛ[ risulta<br />

G x 0 = h(y 0 )<br />

G (h(y), y) ∈ I<br />

G f(h(y), y) = 0<br />

G h ′ (y) = − f y(h(y), y)<br />

f x (h(y), y) .<br />

Possiamo lavorare sulla funzione h così come abbiamo fatto per la funzione g per calcolare<br />

l’equazione della retta tangente o la sua derivata seconda.<br />

4.6 Curve <strong>di</strong> livello<br />

Un metodo per visualizzare una funzione <strong>di</strong> due variabili è quello usato per <strong>di</strong>segnare le<br />

mappe geografiche, dove i punti che hanno la stessa altezza sono uniti insieme in modo da<br />

formare le cosiddette curve <strong>di</strong> livello o linee isometriche (contour lines).<br />

Definizione 4.6.1 Si definiscono curve <strong>di</strong> livello <strong>di</strong> una funzione f <strong>di</strong> due variabili, tutte le<br />

curve <strong>di</strong> equazioni f(x, y) = c con c costante che appartiene all’insieme dei valori della f.<br />

La curva <strong>di</strong> livello f(x, y) = c è quin<strong>di</strong> l’insieme <strong>di</strong> tutti i punti del dominio della f in cui la<br />

funzione assume il valore assegnato c. Mostra, quin<strong>di</strong>, dove il grafico della f ha altezza c.<br />

In Figura 4.5 troviamo un esempio <strong>di</strong> applicazione delle curve <strong>di</strong> livello per rappresentare<br />

la temperatura in Europa. Ciascuna curva rappresenta un valore <strong>di</strong>verso <strong>di</strong> temperatura.<br />

Per funzioni matematiche, un esempio <strong>di</strong> curve <strong>di</strong> livello si vede in Figura 4.6 dove, a sinistra,<br />

vi è la superficie data da z = √ x 2 + y 2 mentre, a destra, sono rappresentate le sue curve <strong>di</strong><br />

livello.<br />

Proposizione 4.6.1 Dato un valore c e P 0 = (x 0 , y 0 ) tale che f(x 0 , y 0 ) = c nell’ipotesi che P 0<br />

non sia critico per la f, allora il gra<strong>di</strong>ente ⃗ ∇(f)(P 0 ) è ortogonale alla curva <strong>di</strong> livello f(x, y) = c<br />

in P 0 .<br />

Dimostrazione. Per la <strong>di</strong>mostrazione, ci riconduciamo al teorema <strong>di</strong> Dini delle funzioni<br />

implicite, considerando F (x, y) = f(x, y) − c.<br />

Per ipotesi P 0 non è punto critico, quin<strong>di</strong> almeno una delle due derivate parziali è non<br />

nulla in P 0 . Consideriamo il caso in cui f y (x 0 , y 0 ) ≠ 0.<br />

Allora F (x 0 , y 0 ) = 0, mentre F y (x, y) = f y (x, y) da cui F y (x 0 , y 0 ) = f y (x 0 , y 0 )<br />

49


4. MASSIMI E MINIMI<br />

Figura 4.5: Curve <strong>di</strong> livello nelle mappe <strong>di</strong> meteorologia.<br />

Figura 4.6: Superficie f(x, y) = √ x 2 + y 2 (a sinistra) e le sue curve <strong>di</strong> livello (a destra).<br />

Essendo sod<strong>di</strong>sfatte le ipotesi del teorema <strong>di</strong> Dini, esiste un’unica funzione definita implicitamente<br />

dalla F , y = g(x). Allora l’equazione della retta tangente alla F in P 0 ha<br />

equazione<br />

F x (x 0 , y 0 )(x − x 0 ) + F y (x 0 , y 0 )(y − y 0 ) = 0<br />

Con lo stesso ragionamento fatto prima F x (x, y) = f x (x, y) da cui ricaviamo<br />

f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) = 0<br />

Quin<strong>di</strong> il vettore ⃗ ∇f(P 0 ) è un vettore perpen<strong>di</strong>colare (normale) alla retta tangente alla<br />

curva f(x, y) = c nel punto P 0 . ✔<br />

4.6.1 Significato del vettore gra<strong>di</strong>ente<br />

Consideriamo una funzione f <strong>di</strong>fferenziabile. Da quanto abbiamo appena visto, il vettore<br />

gra<strong>di</strong>ente nel punto P 0 (x 0 , y 0 ), ⃗ ∇f(P 0 ), è perpen<strong>di</strong>colare alla retta tangente alla curva f(x, y) =<br />

50


4.6. Curve <strong>di</strong> livello<br />

Figura 4.7: Sul prodotto scalare.<br />

c che passa per P 0 . Più brevemente, possiamo <strong>di</strong>re che è perpen<strong>di</strong>colare alla curva <strong>di</strong> livello.<br />

Il vettore gra<strong>di</strong>ente fornisce anche informazioni sulla <strong>di</strong>rezione <strong>di</strong> massima crescita della<br />

funzione f. Infatti, dal momento che la derivata <strong>di</strong>rezionale <strong>di</strong>ce la velocità <strong>di</strong> cambiamento<br />

della f in quella <strong>di</strong>rezione, noi possiamo calcolare la derivata <strong>di</strong>rezionale della f in P 0 lungo<br />

tutte le possibili <strong>di</strong>rezioni e vedere qual è il valore massimo e per quale <strong>di</strong>rezione si ottiene.<br />

Per la formula del gra<strong>di</strong>ente, si ha (considerando ⃗v vettore unitario)<br />

∂f(P 0 )<br />

∂⃗v<br />

= ⃗ ∇f(P 0 ) · ⃗v = | ⃗ ∇f(P 0 )||⃗v| cos θ = | ⃗ ∇f(P 0 )| cos θ<br />

dove θ è l’angolo in<strong>di</strong>viduato dai vettori ∇f(P ⃗ 0 ) e ⃗v. Osserviamo che il prodotto scalare<br />

scritto in questa maniera è del tutto equivalente alla formula che abbiamo dato utilizzando<br />

le componenti dei vettori. 4 Poichè il massimo valore <strong>di</strong> cos θ è 1 e questo si ha quando θ = 0,<br />

vuol <strong>di</strong>re che il valore massimo della derivata <strong>di</strong>rezionale ∂f(P 0)<br />

vale | ∇f(P<br />

∂⃗v<br />

⃗ 0 )| e si ha quando<br />

θ = 0 cioè quando ⃗v ha la stessa <strong>di</strong>rezione <strong>di</strong> ∇f(P ⃗ 0 ).<br />

4 Proviamo che, dati due vettori ⃗a = (a 1 , a 2 ) e ⃗ b = (b 1 , b 2 ), il prodotto scalare ⃗a · ⃗b = a 1 b 1 + a 2 b 2 si può scrivere,<br />

in modo del tutto equivalente come ⃗a ·⃗b = |⃗a|| ⃗ b| cos θ con θ l’angolo in<strong>di</strong>viduato dai due vettori ⃗a e ⃗ b.<br />

A tal proposito ricor<strong>di</strong>amo il teorema <strong>di</strong> Carnot (o del coseno) per cui dato un triangolo qualsiasi e dati due lati<br />

(che scriviamo come vettori) ⃗a e ⃗ b che formano un angolo θ, per il terzo lato ⃗c vale<br />

|⃗c| 2 = |⃗a| 2 + | ⃗ b| 2 − 2|⃗a|| ⃗ b| cos θ<br />

dove |⃗a|, | ⃗ b|, |⃗c| sono i moduli dei tre vettori (cioè le lunghezze dei lati del triangolo).<br />

Se consideriamo il vettore ⃗a + ⃗ b, applicando sia la regola del parallelogramma sia il teorema <strong>di</strong> Carnot, tenendo<br />

conto che adesso l’angolo compreso tra i due lati è π − θ (si veda Figura 4.7) e che cos (π − θ) = − cos θ, si ha<br />

|⃗a + ⃗ b| 2 = |⃗a| 2 + | ⃗ b| 2 − 2|⃗a|| ⃗ b| cos (π − θ) = |⃗a| 2 + | ⃗ b| 2 + 2|⃗a|| ⃗ b| cos θ<br />

Da questa relazione ricaviamo<br />

|⃗a|| ⃗ b| cos θ = 1 “|⃗a + ⃗ b| 2 − |⃗a| 2 − | ⃗ b| 2”<br />

2<br />

Scrivendo in modo esplicito i moduli dei vettori, |⃗a+ ⃗ b| 2 = (a 1 +b 1 ) 2 +(a 2 +b 2 ) 2 , |⃗a| 2 = (a 1 ) 2 +(a 2 ) 2 e | ⃗ b| 2 = (b 1 ) 2 +(b 2 ) 2 ,<br />

e sostituendo, si ha proprio<br />

|⃗a|| ⃗ b| cos θ = a 1 b 1 + a 2 b 2<br />

Quin<strong>di</strong> il prodotto scalare può essere scritto sia in un modo che nell’altro.<br />

51


4. MASSIMI E MINIMI<br />

4.7 Estremi vincolati e moltiplicatori <strong>di</strong> Lagrange<br />

In molti problemi che <strong>di</strong>scendono da applicazioni pratiche, si cerca il massimo o il minimo<br />

<strong>di</strong> una funzione soggetta ad una particolare con<strong>di</strong>zione che viene chiamata vincolo. Si <strong>di</strong>ce,<br />

allora, che si cercano gli estremi vincolati.<br />

Esempio<br />

Es. 4.7.1 Si deve costruire una scatola <strong>di</strong> cartone, priva <strong>di</strong> coperchio, utilizzando 12m 2<br />

(metri quadrati) <strong>di</strong> cartone. Si vuole costruire una scatola con il massimo volume<br />

possibile.<br />

Il volume della scatola è dato da V = xyz (dove x, y, e z rappresentano lunghezza,<br />

larghezza e altezza della scatola).<br />

La superficie della scatola (che non ha coperchio) è data da 2xz + 2yz + xy = 12 (12 dai<br />

12m 2 <strong>di</strong> cartone a <strong>di</strong>sposizione).<br />

La superficie rappresenta il vincolo per la funzione volume <strong>di</strong> cui vogliamo calcolare il<br />

massimo. Questo esempio può essere risolto in modo semplice andando a scrivere z in<br />

funzione <strong>di</strong> x e y dalla relazione 2xz + 2yz + xy = 12:<br />

z =<br />

12 − xy<br />

2(x + y)<br />

La funzione V <strong>di</strong>venta una funzione <strong>di</strong> due variabili<br />

12 − xy<br />

V = xyz = xy<br />

2(x + y) = 12xy − x2 y 2<br />

2(x + y)<br />

Cerchiamo, <strong>di</strong> questa funzione, gli estremi relativi e tra questi ve<strong>di</strong>amo se c’è una soluzione<br />

fisicamente accettabile (x e y rappresentano delle lunghezze e devono essere<br />

positive).<br />

Troveremo (lo si faccia per esercizio) che V ha il suo valore massimo per x = y = 2, da cui<br />

z = 1.<br />

Tuttavia, questa strada non è sempre percorribile. Perciò ve<strong>di</strong>amo cosa si deve fare, in<br />

generale, quando si cercano punti <strong>di</strong> massimo o minimo <strong>di</strong> una funzione soggetta a un<br />

vincolo.<br />

Ve<strong>di</strong>amo il caso in cui dobbiamo cercare i valori estremi <strong>di</strong> una funzione f(x, y) soggetta<br />

al vincolo espresso dall’equazione g(x, y) = c. In maniera del tutto equivalente, possiamo <strong>di</strong>re<br />

che dobbiamo cercare i valori estremi della f(x, y) quando il punto (x, y) deve appartenere<br />

alla curva <strong>di</strong> livello g(x, y) = c. In Figura 4.8 ve<strong>di</strong>amo la curva g(x, y) = c e delle curve <strong>di</strong> livello<br />

della funzione f(x, y). Queste curve <strong>di</strong> livello hanno equazione f(x, y) = k con k = 7, 8, 9, 10, 11.<br />

Se vogliamo cercare il massimo della f(x, y) soggetta al vincolo g(x, y) = c, dobbiamo cercare il<br />

più grande valore <strong>di</strong> k tale che la curva <strong>di</strong> livello f(x, y) = k interseca g(x, y) = c. Dalla Figura,<br />

si può vedere che questo accade quando le due curve si toccano appena l’una con l’altra,<br />

cioè quando hanno in comune una retta tangente. Ciò significa che le normali alle rette<br />

tangenti sia a g(x, y) = c sia a f(x, y) = k, nel punto (x 0 , y 0 ), che è il punto in cui g(x, y) = c<br />

e f(x, y) = k si incontrano, sono identiche. Ricordando che il vettore normale alla retta<br />

tangente ad una funzione f(x, y) è il gra<strong>di</strong>ente della f, vuol <strong>di</strong>re che ∇f(x ⃗ 0 , y 0 ) e ∇g(x ⃗ 0 , y 0 )<br />

sono vettori paralleli, cioè le loro componenti <strong>di</strong>fferiscono <strong>di</strong> una costante. Seguiremo questo<br />

approccio per il metodo dei moltiplicatori <strong>di</strong> Lagrange.<br />

Teorema 4.7.1 Data una funzione f ∈ C 1 (I), con I ⊂ R 2 aperto, con<strong>di</strong>zione necessaria affinchè<br />

P 0 (x 0 , y 0 ) ∈ I sia un punto <strong>di</strong> massimo o minimo relativo della f soggetta al vincolo<br />

g(x, y) = c è che<br />

G g(x 0 , y 0 ) = c<br />

52


4.7. Estremi vincolati e moltiplicatori <strong>di</strong> Lagrange<br />

Figura 4.8: Sul prodotto scalare.<br />

G la matrice<br />

(<br />

fx (P 0 )<br />

)<br />

f y (P 0 )<br />

g x (P 0 ) g y (P 0 )<br />

abbia determinante nullo: f x (P 0 )g y (P 0 ) − g x (P 0 )f y (P 0 ) = 0<br />

Proposizione 4.7.1 Se P 0 (x 0 , y 0 ) è un estremo vincolato della funzione f soggetta al vincolo<br />

g(x, y) = c e se P 0 è punto interno all’insieme <strong>di</strong> definizione della f e non è punto critico nè per<br />

la f nè per la g, allora g(x, y) = c e f(x, y) = f(x 0 , y 0 ) hanno in P 0 la stessa retta tangente.<br />

Dimostrazione. Se scriviamo le equazioni delle rette tangenti a f(x, y) = f(x 0 , y 0 ) e<br />

alla curva g(x, y) = c nel punto P 0 , abbiamo f x (P 0 )(x − x 0 ) + f y (P 0 )(y − y 0 ) = 0 e g x (P 0 )(x −<br />

x 0 ) + g y (P 0 )(y − y 0 ) = 0. Poichè P 0 è un estemo vincolato, vale la con<strong>di</strong>zione f x (P 0 )g y (P 0 ) −<br />

g x (P 0 )f y (P 0 ) = 0, ma questa relazione rappresenta una con<strong>di</strong>zione <strong>di</strong> parallelismo tra le due<br />

rette tangenti. 5 ✔<br />

Il vincolo si può anche rappresentare come una funzione Φ(x, y) = 0 (caso particolare:<br />

Φ(x, y) = g(x, y) − c). Il teorema si riscrive in maniera del tutto analoga.<br />

La matrice<br />

( )<br />

fx (P 0 ) f y (P 0 )<br />

g x (P 0 ) g y (P 0 )<br />

prende il nome <strong>di</strong> matrice jacobiana della f e della g. Vale infatti la seguente definizione.<br />

Definizione 4.7.1 Date le due funzioni f 1 (x, y) e f 2 (x, y) si definisce matrice jacobiana, la<br />

matrice<br />

⎛ ⎞<br />

∂f 1 ∂f 1<br />

∂(f 1 , f 2 ) ⎜<br />

=<br />

∂x ∂y ⎟<br />

⎝ ⎠<br />

∂(x, y)<br />

∂f 2<br />

∂x<br />

∂f 2<br />

∂y<br />

Si definisce jacobiano, il determinante della matrice jacobiana.<br />

Osserviamo che il teorema che abbiamo enunciato prima è un teorema che ci dà una<br />

con<strong>di</strong>zione necessaria ma non sufficiente.<br />

5 Ricor<strong>di</strong>amo che, date due rette ax + by + c = 0 e a ′ x + b ′ y + c ′ = 0 la con<strong>di</strong>zione <strong>di</strong> parallelismo è a a ′ = b b ′ ovvero<br />

ab ′ − a ′ b = 0.<br />

53


4. MASSIMI E MINIMI<br />

Figura 4.9: Curve <strong>di</strong> livello della funzione f(x, y) = x 2 + 4y 2 e il vincolo x 2 + y 2 = 1.<br />

Il metodo dei moltiplicatori <strong>di</strong> Lagrange ci permette <strong>di</strong> trovare gli estremi <strong>di</strong> una funzione<br />

f(x, y) soggetta al vincolo Φ(x, y) = 0 (sempre che il problema ammetta soluzione). Per<br />

applicare questo metodo deve essere ∇Φ(x, ⃗ y) ≠ 0.<br />

Abbiamo detto che, se P 0 è un punto <strong>di</strong> estremo vincolato, il gra<strong>di</strong>ente della f e della<br />

funzione <strong>di</strong> vincolo sono tra loro paralleli, cioè le componenti dei due vettori gra<strong>di</strong>ente<br />

<strong>di</strong>fferiscono per una costante. Introduciamo questa costante me<strong>di</strong>ante la variabile λ detta<br />

moltiplicatore <strong>di</strong> Lagrange: vuol <strong>di</strong>re che f x (x 0 , y 0 ) = λΦ x (x 0 , y 0 ) e f y (x 0 , y 0 ) = λΦ y (x 0 , y 0 ).<br />

Ora, per capire chi possa essere (x 0 , y 0 ), definiamo la funzione H(x, y, λ) = f(x, y)+λΦ(x, y),<br />

che <strong>di</strong>pende dalle variabili x, y e λ. Il metodo dei moltiplicatori <strong>di</strong> Lagrange consiste dei<br />

seguenti passi:<br />

1. risolviamo il sistema <strong>di</strong> equazioni dato da<br />

⃗∇H(x, y, λ) = 0<br />

vale a <strong>di</strong>re:<br />

⎧<br />

⎪⎨ f x (x, y) + λΦ x (x, y) = 0<br />

f y (x, y) + λΦ y (x, y) = 0<br />

⎪⎩<br />

Φ(x, y) = 0<br />

(a meno del segno ritroviamo la con<strong>di</strong>zione <strong>di</strong> parallelismo detta prima);<br />

2. valutiamo la funzione f nella/e soluzione/i trovate e identifichiamo i valori <strong>di</strong> massimo<br />

e minimo, (se esistono).<br />

Esempio<br />

Es. 4.7.2 Si devono cercare i valori estremi della funzione f(x, y) = x 2 + 4y 2 sul cerchio<br />

x 2 + y 2 = 1.<br />

In questo caso il vincolo è dato dall’equazione della circonferenza. Applichiamo il metodo<br />

dei moltiplicatori <strong>di</strong> Lagrange, introducendo la funzione H(x, y, λ) = x 2 +4y 2 +λ(x 2 +y 2 −1)<br />

54


4.7. Estremi vincolati e moltiplicatori <strong>di</strong> Lagrange<br />

Il sistema da risolvere è<br />

⎧<br />

⎪⎨ 2x + 2λx = 0<br />

8y + 2λy = 0<br />

⎪⎩<br />

x 2 + y 2 = 1<br />

Dalla prima equazione ricaviamo x = 0 e λ = −1 mentre dalla seconda otteniano y = 0<br />

e λ = −4. Sostituendo x = 0 nella terza equazione (il vincolo) abbiamo y 2 = 1 da cui y =<br />

±1. Sostituendo y = 0 nel vincolo ricaviamo x = ±1. Il valore <strong>di</strong> λ non ci interessa perchè<br />

abbiamo trovato tutti i punti (x, y) che verificano il sistema <strong>di</strong> equazioni. Abbiamo<br />

P 0 (0, 1), P 1 (0, −1), P 2 (1, 0) e P 3 (−1, 0). Calcoliamo la f in questi punti: f(P 0 ) = f(P 1 ) = 4,<br />

f(P 2 ) = f(P 3 ) = 1. Il valore massimo sul vincolo è dato da 4, nei punti P 0 e P 1 . Il<br />

valore minimo sul vincolo è dato da 1 nei punti P 2 e P 3 . Controllando la Figura 4.9<br />

dove ci sono le curve <strong>di</strong> livello della f e la circonferenza, si può vedere come i valori<br />

trovati applicando il metodo dei moltiplicatori <strong>di</strong> Lagrange siano effettivamente quelli<br />

che corrispondono a punti <strong>di</strong> massimo e minimo della f sul vincolo, in quanto le rette<br />

tangenti alla curva <strong>di</strong> livello e alla circonferenza, nei punti trovati, coincidono.<br />

55


CAPITOLO 5<br />

Le curve<br />

A quelli che non conoscono la<br />

matematica è <strong>di</strong>fficile<br />

percepire, come una<br />

sensazione reale, la bellezza, la<br />

profonda bellezza della Natura.<br />

Se volete conoscere la Natura,<br />

apprezzarla, è necessario<br />

comprendere il linguaggio che<br />

essa parla.<br />

Richard Phillips Feynman<br />

(1919-1988)<br />

5.1 Equazioni parametriche <strong>di</strong> una curva . . . . . . . . . . . . . . . . . . . . . . . . . . 57<br />

5.2 Grafico <strong>di</strong> una curva parametrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61<br />

5.3 Parametrizzare una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63<br />

5.4 Tangente ad una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63<br />

5.5 Lunghezza <strong>di</strong> un arco <strong>di</strong> funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66<br />

5.6 Lunghezza <strong>di</strong> una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67<br />

5.7 La curva cicloide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70<br />

5.8 Sistema <strong>di</strong> coor<strong>di</strong>nate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71<br />

5.9 Curve in coor<strong>di</strong>nate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73<br />

5.9.1 La curva car<strong>di</strong>oide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74<br />

5.10Lunghezza <strong>di</strong> una curva polare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74<br />

5.10.1Lunghezze <strong>di</strong> alcune curve . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75<br />

5.11Funzioni a valori vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79<br />

5.12Le curve riviste come funzioni vettoriali . . . . . . . . . . . . . . . . . . . . . . . . 79<br />

5.13Retta tangente ad una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />

5.14Curve orientate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />

5.15Di nuovo sulla lunghezza <strong>di</strong> una curva . . . . . . . . . . . . . . . . . . . . . . . . . 80<br />

5.16L’ascissa curvilinea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81<br />

5.1 Equazioni parametriche <strong>di</strong> una curva<br />

Supponiamo che una particella si muova lungo una curva γ come quella mostrata in Figura<br />

5.1. Non riusciamo a descrivere la curva me<strong>di</strong>ante un’equazione della forma y = f(x)<br />

(cioè attraverso il grafico <strong>di</strong> una funzione) perchè ci sono <strong>di</strong>verse rette verticali che intersecano<br />

la curva più <strong>di</strong> una volta (mentre per una funzione del tipo y = f(x), ad ogni valore <strong>di</strong><br />

57


5. LE CURVE<br />

Figura 5.1: Una particella che si muove su una curva γ.<br />

x deve corrispondere un solo valore f(x)). Tuttavia, possiamo pensare alle coor<strong>di</strong>nate (x, y)<br />

della particella che si muove lungo la curva come funzioni del tempo t in modo da poter<br />

scrivere x = f(t) e y = g(t). Questa coppia <strong>di</strong> funzioni ci permette <strong>di</strong> descrivere la curva e <strong>di</strong><br />

dare la definizione <strong>di</strong> curva sotto forma <strong>di</strong> equazioni parametriche.<br />

Definizione 5.1.1 Se x e y sono entrambe funzioni <strong>di</strong> una terza variabile t (t è detto<br />

parametro), le equazioni<br />

x = f(t),<br />

y = g(t)<br />

sono dette equazioni parametriche.<br />

Ogni valore <strong>di</strong> t determina un punto (x, y): al variare <strong>di</strong> t varia il punto (x, y) che, sul piano<br />

cartesiano, descrive una curva γ, che chiamiamo curva parametrica.<br />

Il parametro t non rappresenta necessariamente il tempo e quin<strong>di</strong> si può anche utilizzare<br />

un’altra lettera per rappresentare il parametro. Poichè, in molte applicazioni, t denota il<br />

tempo, ci è più facile vedere (x, y) = (f(t), g(t)) come la posizione della particella al tempo t.<br />

Esempio<br />

Es. 5.1.1 Proviamo a fare il grafico per capire quale curva è rappresentata me<strong>di</strong>ante le<br />

equazioni parametriche<br />

{<br />

x = t 2 + t<br />

y = 2t − 1<br />

Ciascun valore <strong>di</strong> t dà un punto della curva. Perciò consideriamo <strong>di</strong>versi valori <strong>di</strong> t e i<br />

corrispondenti punti che si ottengono:<br />

t x y<br />

-2 2 -5<br />

-1 0 -3<br />

-1/2 -1/4 -2<br />

0 0 -1<br />

1 2 1<br />

In Figura 5.2 abbiamo messo su un piano cartesiano i punti (x, y) che si ottengono per<br />

molti valori del parametro t e li abbiamo uniti in modo da ottenere il grafico <strong>di</strong> una curva.<br />

58


5.1. Equazioni parametriche <strong>di</strong> una curva<br />

Figura 5.2: Curva data da x = t 2 + t, y = 2t − 1<br />

Osserviamo che una particella, la cui posizione è data dalle equazioni parametriche<br />

x = f(t), y = g(t), si muove lungo la curva nella <strong>di</strong>rezione <strong>di</strong> t crescente. Ciò significa che<br />

una curva parametrica ha una <strong>di</strong>rezione, un orientamento dato da valori crescenti<br />

<strong>di</strong> t. Sul grafico la <strong>di</strong>rezione del movimento della curva è in<strong>di</strong>cata me<strong>di</strong>ante freccette.<br />

Inoltre, osserviamo che a valori <strong>di</strong> t equi<strong>di</strong>stanti non corrispondono, sulla curva, punti<br />

equi<strong>di</strong>stanti: ciò è dovuto al fatto che la particella rallenta o aumenta la sua velocità al<br />

variare <strong>di</strong> t.<br />

Dalla Figura 5.2, appare evidente che la curva tracciata dalla particella è una parabola.<br />

In effetti, se eliminiamo il parametro t dalle due equazioni parametriche, ricaviamo proprio<br />

l’equazione <strong>di</strong> una parabola. Per far ciò, dalla seconda equazione y = 2t − 1 ricaviamo<br />

t = 1 (y + 1) e sostituiamo il valore trovato per t nell’equazione in x. Troviamo<br />

2<br />

( ) 2 1<br />

x =<br />

2 (y + 1) + 1 2 (y + 1) = 1 4 y2 + y + 3 4<br />

Riconosciamo l’equazione <strong>di</strong> una parabola.<br />

Nell’esempio, t può variare in tutto R. Se invece t deve variare in un intervallo finito,<br />

allora anche la curva risente <strong>degli</strong> effetti del parametro.<br />

Esempio<br />

Es. 5.1.2 Consideriamo le equazioni parametriche della curva precedente, ma con t ∈<br />

[−1, 1]:<br />

x = t 2 + t y = 2t − 1 − 1 ≤ t ≤ 1<br />

Abbiamo solo una porzione della curva che abbiamo <strong>di</strong>segnata prima (si veda Figura 5.3).<br />

59


5. LE CURVE<br />

Figura 5.3: Curva data da x = t 2 + t, y = 2t − 1, con −1<br />

Definizione 5.1.2 La curva <strong>di</strong> equazioni parametriche<br />

x = f(t), y = g(t), t 0 ≤ t ≤ t f<br />

ha punto iniziale (f(t 0 , g(t 0 )) e punto finale (f(t f ), g(t f )).<br />

Esempio<br />

Es. 5.1.3 Cerchiamo <strong>di</strong> capire qual è la curva rappresentata dalle equazioni<br />

parametriche x = cos t, y = sin t, con 0 ≤ t ≤ 2π.<br />

Se facciamo un grafico con le coppie <strong>di</strong> punti (x, y) al variare <strong>di</strong> t, otteniamo il grafico<br />

<strong>di</strong> una circonferenza. Ne abbiamo conferma eliminando il parametro t. Questa volta<br />

sfruttiamo le relazioni trigonometriche osservando che<br />

x 2 + y 2 = cos 2 t + sin 2 t = 1<br />

Quin<strong>di</strong> la circonferenza ha centro nell’origine e raggio 1.<br />

In questo esempio il parametro t può essere interpretato come l’angolo in ra<strong>di</strong>anti. Al<br />

variare <strong>di</strong> t in [0, 2π], il punto (x, y) = (cos t, sin t) si muove sulla circonferenza in <strong>di</strong>rezione<br />

antioraria partendo dal punto (1, 0) e ritornando allo stesso punto.<br />

Esempio<br />

Es. 5.1.4 Ve<strong>di</strong>amo ora la curva rappresentata dalle equazioni parametriche x = sin 4t ,<br />

y = cos 4t, con 0 ≤ t ≤ 2π.<br />

Di nuovo, da x 2 + y 2 = sin 2 4t + cos 2 4t = 1 ritroviamo l’equazione della circonferenza <strong>di</strong><br />

centro l’origine e raggio 1.<br />

Questa volta, però, il punto iniziale della curva si ha in (sin 0, cos 0) = (0, 1). Per valori <strong>di</strong> t<br />

crescenti, la particella si muove in <strong>di</strong>rezione oraria lungo la circonferenza e la percorre 4<br />

volte (il punto (0, 1) si ha per t = 0, π/2, π, 3π/2, 2π.<br />

60


5.2. Grafico <strong>di</strong> una curva parametrica<br />

Quin<strong>di</strong> la stessa curva può essere rappresentata in mo<strong>di</strong> <strong>di</strong>versi. Conviene perciò fare la<br />

<strong>di</strong>stinzione tra curva, come insieme <strong>di</strong> punti, da curva parametrica, come insieme <strong>di</strong> punti<br />

tracciati in modo particolare.<br />

5.2 Grafico <strong>di</strong> una curva parametrica<br />

Per fare il grafico <strong>di</strong> un’equazione della forma x = g(y) possiamo usare le equazioni<br />

parametriche<br />

x = g(t), y = t.<br />

Alla stessa maniera le curve <strong>di</strong> equazioni y = f(x) (le familiari funzioni <strong>di</strong> una variabile reale),<br />

possono essere viste come curve <strong>di</strong> equazioni parametriche<br />

x = t,<br />

y = f(t).<br />

In generale, data una curva parametrica <strong>di</strong> equazioni x = f(t), y = g(t), con t 0 ≤ t ≤ t f , per<br />

farne il grafico possiamo far variare t nell’intervallo assegnato (o per valori crescenti in R) e<br />

vedere dove giacciono, sul piano cartesiano, i corrispondenti punti (x, y), in modo da avere<br />

l’orientamento della curva.<br />

A volte conviene eliminare il parametro t per capire <strong>di</strong> che curva si tratta.<br />

Altre volte la curva è talmente complicata che conviene affidarsi a programmi <strong>di</strong> grafica<br />

al calcolatore per poterla visualizzare.<br />

Esempio<br />

Es. 5.2.1 Consideriamo il caso <strong>di</strong> una curva data da<br />

x = a cos (αt) y = b cos (αt) 0 ≤ t ≤ 2π<br />

dove a, b, α sono delle costanti.<br />

Visto che le funzioni sono trigonometriche, conviene sfruttare relazioni della trigonometria<br />

per capire <strong>di</strong> che curva si tratta.<br />

Facciamo un cambio <strong>di</strong> variabile ponendo u = αt. Allora le equazioni <strong>di</strong>ventano<br />

x = a cos u y = b sin u 0 ≤ u ≤ 2απ<br />

Possiamo scrivere<br />

1 = cos 2 u + sin 2 u = x2<br />

a 2 + y2<br />

b 2<br />

trovando l’equazione <strong>di</strong> un’ellisse avente come centro l’origine (se a > b l’ellisse è orizzontale<br />

con l’asse maggiore sull’asse delle x, viceversa se a < b l’ellisse è verticale con<br />

l’asse maggiore sull’asse delle y, se invece a = b l’ellisse si riduce ad una circonferenza<br />

<strong>di</strong> raggio a).<br />

L’ellisse, per u ∈ [0, 2π] viene percorsa tutta. Ma adesso u varia fino a 2απ, il che vuol <strong>di</strong>re<br />

che la curva viene percorsa α volte dal parametro u: è come un circuito <strong>di</strong> formula 1 da<br />

ripetere per un numero α <strong>di</strong> giri.<br />

61


5. LE CURVE<br />

Figura 5.4: curva x = 4 cos (3t)<br />

y = 1 + cos 2 (3t)<br />

Esempio<br />

Es. 5.2.2 Il cammino <strong>di</strong> una particella è dato da<br />

x = 4 cos (3t)<br />

y = 1 + cos 2 (3t)<br />

Proviamo a descrivere questo cammino cercando <strong>di</strong> capire dove variano x e y e in<strong>di</strong>viduando<br />

l’intervallo in cui varia t per percorrere la curva solo una volta (nel caso in cui<br />

possa percorrerla più <strong>di</strong> una volta).<br />

Per eliminare il parametro t, sfruttiamo il fatto che le due equazioni parametriche hanno<br />

solo coseni, ricavando cos (3t) dalla prima equazione e sostituendo nella seconda:<br />

cos (3t) = x 4<br />

( x<br />

) 2 x 2<br />

y = 1 + = 1 +<br />

4 16<br />

Ricaviamo una parabola. Inoltre<br />

−1 ≤ cos (3t) ≤ 1 =⇒ −4 ≤ 4 cos (3t) ≤ 4 =⇒ −4 ≤ x ≤ 4<br />

0 ≤ cos 2 (3t) ≤ 1 =⇒ 1 ≤ 1 + cos 2 (3t) ≤ 2 =⇒ 1 ≤ y ≤ 2<br />

Proviamo ora per alcuni valori <strong>di</strong> t cosa si ricava per x e y:<br />

t x y<br />

0 4 2<br />

π/2 0 1<br />

π -4 2<br />

3π/2 0 1<br />

2π 4 2<br />

L’arco <strong>di</strong> parabola viene ripetuto più volte come un pendolo.<br />

Dagli esempi visti possiamo osservare che ci sono curve i cui punti (x, y) sono dati da un<br />

62


5.3. Parametrizzare una curva<br />

solo valore del parametro t, in altri casi lo stesso punto viene ripetuto per <strong>di</strong>versi valori <strong>di</strong> t.<br />

Abbiamo le seguenti definizioni<br />

Definizione 5.2.1 Data una curva <strong>di</strong> equazioni parametriche x = f(t), y = g(t),<br />

G se un punto (x, y) si ottiene me<strong>di</strong>ante un solo valore del parametro t, allora il punto è detto<br />

semplice;<br />

G se un punto (x, y) si ottiene me<strong>di</strong>ante più valori del parametro t, allora il punto è detto<br />

multiplo.<br />

Definizione 5.2.2 Una curva è chiusa se è definita per t ∈ [t 0 , t f ] e (x(t 0 ), y(t 0 )) = (x(t f ), y(t f )):<br />

il punto sulla curva che si ha per il valore iniziale del parametro t coincide con il punto sulla<br />

curva che si ha per il valore finale <strong>di</strong> t.<br />

5.3 Parametrizzare una curva<br />

A volte, data una curva come equazione in x e y, vogliamo parametrizzarla.<br />

Il caso più interessante è quello <strong>di</strong> un’ellisse (e quin<strong>di</strong>, come caso particolare, un cerchio):<br />

x 2<br />

a 2 + y2<br />

b 2 = 1<br />

Come equazioni parametriche, possiamo considerare<br />

x = a cos (t) y = b sin (t) 0 ≤ t ≤ 2π<br />

In tal caso l’ellisse parte dal punto (a, 0) e vi termina dopo aver percorso l’ellisse in senso<br />

antiorario.<br />

Una curva può essere parametrizzata in vari mo<strong>di</strong>, comunque. L’ellisse precedente, ad<br />

esempio, può essere parametrizzata come<br />

x = a cos (αt)<br />

x = a sin (αt)<br />

x = a cos (αt)<br />

y = b sin (αt)<br />

y = b cos (αt)<br />

y = −b sin (αt)<br />

La presenza della costante α ci <strong>di</strong>ce quante volte viene percorsa l’ellisse. Le ultime due<br />

equazioni parametriche ci danno la curva percorsa in senso orario (sempre partendo da<br />

t = 0).<br />

5.4 Tangente ad una curva<br />

Assegnate le equazioni parametriche <strong>di</strong> una curva<br />

x = x(t) y = y(t) t 0 ≤ t ≤ t f<br />

vogliamo ricavare una formula per la pendenza delle rette tangenti alla curva in ciascun suo<br />

punto.<br />

Nel caso <strong>di</strong> una funzione y = F (x), la retta tangente a F per x = a è data dall’equazione<br />

p(x) = m(x − a) + F (a), dove m = F ′ (a) = dy<br />

dx | x=a<br />

Per la curva parametrica, se riusciamo a calcolare la derivata della y in funzione <strong>di</strong> x,<br />

possiamo utilizzare la formula appena scritta per ricavare l’equazione della tangente alla<br />

63


5. LE CURVE<br />

curva in un generico punto (x, y) della curva. Noi però abbiamo y in funzione del parametro<br />

t e non <strong>di</strong> x.<br />

Supponiamo <strong>di</strong> avere (ma non abbiamo) una funzione y = F (x) che ci permetta <strong>di</strong> scrivere<br />

la curva non più in forma parametrica, eliminando cioè il parametro t. In realtà noi sappiamo<br />

che y = y(t) e x = x(t), quin<strong>di</strong> sostituendo abbiamo<br />

y(t) = y = F (x) = F (x(t)) =⇒ y(t) = F (x(t))<br />

Deriviamo rispetto a t:<br />

dy<br />

dt<br />

dF (x(t)) dx<br />

=<br />

dx dt<br />

A noi serve una formula per dy<br />

dF (x)<br />

ovvero per per avere la retta tangente. Dalla relazione<br />

dx dx<br />

precedente, nell’ipotesi in cui dx<br />

dt ≠ 0 ricaviamo<br />

dy dF (x(t))<br />

= =<br />

dx dx<br />

dy<br />

dt<br />

dx<br />

dt<br />

Abbiamo trovato, in questo modo, la pendenza della retta tangente alla curva scritta<br />

come y = F (x). Se vogliamo avere la tangente alla curva scritta invece come x = H(y), basta<br />

scambiare il ruolo della x con la y. L’equazione della retta tangente nel punto f(a) è del tipo<br />

p(y) = m(y − f(a)) + H ′ (f(a))<br />

con m = H ′ (f(a)) = dx<br />

dy | y=f(a). In maniera del tutto analoga a quanto visto prima, si ricava<br />

dx<br />

dx<br />

dy = dt<br />

dy<br />

dt<br />

per dy<br />

dt ≠ 0<br />

Esempio<br />

Es. 5.4.1 Troviamo la tangente alla curva parametrica data dalle equazioni<br />

x = t 5 − 4t 3 y = t 2<br />

nel punto (0, 4).<br />

Vedremo, in questo caso, che troveremo più <strong>di</strong> una retta tangente al punto assegnato (e<br />

ne capiremo presto il motivo).<br />

Per prima cosa applichiamo la formula data prima:<br />

dy<br />

dy<br />

dx = dt<br />

dx<br />

dt<br />

=<br />

2t<br />

5t 4 − 12t 2 = 2<br />

5t 3 − 12t<br />

64


5.4. Tangente ad una curva<br />

Figura 5.5: rette tangenti al punto (0.4) della curva x = t 5 − 4t 3 y = t 2<br />

Attenzione, adesso, perchè la derivata è in termini <strong>di</strong> t ma noi dobbiamo calcolare la<br />

tangente in un punto assegnato in<strong>di</strong>viduato dalle coor<strong>di</strong>nate (x, y) = (0, 4). Dobbiamo<br />

quin<strong>di</strong> determinare per quale/i valore/i <strong>di</strong> t si ottiene questo punto.<br />

Per la curva e il punto dati, deve quin<strong>di</strong> valere<br />

{<br />

x = t 5 − 4t 3 = 0<br />

y = t 2 = 4<br />

=⇒<br />

{<br />

t 3 (t 2 − 4) = 0 → t = 0, t = ±2<br />

t 2 = 4 → t = ±2<br />

Le soluzioni accettabili per le due equazioni sono t = ±2.<br />

Per t = −2 la pendenza della retta tangente risulta<br />

m = dy<br />

dx | t=−2 = − 1 8<br />

e quin<strong>di</strong> la retta tangente è<br />

y = 4 − 1 8 x<br />

Per t = 2 invece si ha<br />

m = dy<br />

dx | t=2 = 1 8<br />

e la retta tangente è<br />

y = 4 + 1 8 x<br />

Perchè due rette tangenti nel punto (0, 4) Perchè la curva ”gira“ attorno al punto (0, 4)<br />

e quin<strong>di</strong> abbiamo due rette tangenti (si veda Figura 5.5).<br />

65


5. LE CURVE<br />

Possiamo avere anche tangenti orizzontali o verticali, in un determinato punto <strong>di</strong> una<br />

curva, a seconda che la derivata <strong>di</strong> y o x rispetto a t sia nulla:<br />

G si ha una tangente orizzontale quando dy<br />

dt = 0 e dx<br />

dt ≠ 0<br />

G si ha una tangente verticale quando dx<br />

dt = 0 e dy<br />

dt ≠ 0.<br />

Possiamo anche scrivere le equazioni della retta tangente ad una curva parametrica in<br />

forma parametrica. Dato il punto P 0 = (x 0 , y 0 ) = (x(t 0 ), y(t 0 ), i valori delle derivate dx(t 0)<br />

,<br />

dt<br />

dy(t 0 )<br />

rappresentano i valori delle tangenti alla curva, componente per componente. L’equazione<br />

della retta tangente a P 0 , scritta in forma parametrica, deve passare per P 0 e<br />

dt<br />

avere come <strong>di</strong>rezione quella data dal vettore ⃗v che ha come componenti le due derivate<br />

⃗v = ( dx(t 0)<br />

, dy(t 0)<br />

). Scritta in forma vettoriale, la retta tangente deve essere della forma<br />

dt dt<br />

⃗r t = P 0 + t⃗v<br />

dove P 0 è inteso come un vettore, t è il parametro al variare del quale abbiamo i punti della<br />

retta, ⃗v è il vettore che dà la <strong>di</strong>rezione della retta. In forma parametrica abbiamo<br />

⃗r t = (x 0 + t dx(t 0)<br />

dt<br />

, y 0 + t dy(t 0)<br />

)<br />

dt<br />

Osserviamo che, dalle equazioni della tangente x = x 0 + t dx(t 0)<br />

, y = y 0 t dy(t 0)<br />

, se dalla<br />

dt<br />

dt<br />

prima equazione ricaviamo t in funzione <strong>di</strong> x e sostituiamo nella seconda equazione, troviamo<br />

l’equazione della retta tangente che abbiamo ricavato prima.<br />

5.5 Lunghezza <strong>di</strong> un arco <strong>di</strong> funzione<br />

Prima <strong>di</strong> capire come si calcola la lunghezza <strong>di</strong> una curva parametrica, partiamo dal voler<br />

calcolare la lunghezza <strong>di</strong> un arco <strong>di</strong> funzione: data una funzione continua y = f(x) vogliamo<br />

determinare la lunghezza dell’arco della curva data dalla funzione nell’intervallo [a, b].<br />

Per prima cosa, <strong>di</strong>amo una stima approssimata della lunghezza <strong>di</strong> questa curva: <strong>di</strong>vi<strong>di</strong>amo<br />

l’intervallo [a, b] in n parti uguali <strong>di</strong> ampiezza ∆x ottenendo sulla curva n + 1 punti<br />

P i , i = 0, 1, 2, . . . , n. Possiamo quin<strong>di</strong> approssimare la curva me<strong>di</strong>ante una serie <strong>di</strong> segmenti<br />

congiungenti questi punti. Ve<strong>di</strong>amo in figura 5.6 un esempio con n = 9. Poichè la lunghezza<br />

<strong>di</strong> ciascuno dei segmenti congiungenti P i−1 e P i altro non è che la <strong>di</strong>stanza euclidea tra i due<br />

punti |P i − P i−1 |, la curva sarà dunque approssimata da<br />

L ≈<br />

n∑<br />

|P i−1 − P i |<br />

i=1<br />

Prendendo valori <strong>di</strong> n sempre più gran<strong>di</strong> noi avremo valori via via più accurati. Passando al<br />

limite per n → ∞ avremo la lunghezza dell’arco <strong>di</strong> curva:<br />

L = lim<br />

n→∞<br />

i=1<br />

n∑<br />

|P i−1 − P i |<br />

Ora, ciascuno punto P i ha coor<strong>di</strong>nate del tipo (x i , f(x i )), da cui<br />

|P i−1 − P i | = √ (x i − x i−1 ) 2 + (f(x i ) − f(x i−1 )) 2<br />

Dal teorema del valor me<strong>di</strong>o sappiamo che f(x i ) − f(x i−1 ) = f ′ (ξ i )(x i − x i−1 ) dove ξ i è un<br />

punto che non conosciamo all’interno dell’intervallo [x i−1 , x i ]. Ricordando che abbiamo <strong>di</strong>viso<br />

66


5.6. Lunghezza <strong>di</strong> una curva<br />

Figura 5.6: Approssimazione della lunghezza <strong>di</strong> un arco <strong>di</strong> funzione me<strong>di</strong>ante segmenti <strong>di</strong><br />

retta<br />

l’intervallo [a, b] <strong>di</strong> partenza in n parti uguali, si ha x i − x i−1 = ∆x da cui, f(x i ) − f(x i−1 ) =<br />

f ′ (ξ i )∆x da cui la lunghezza del segmento si può anche scrivere come<br />

|P i−1 − P i | = √ ∆x 2 + (f ′ (ξ i )∆x) 2 = √ (1 + f ′ (ξ i ) 2 )∆x 2 = √ (1 + f ′ (ξ i ) 2 )∆x<br />

Inserendo questa formula nel limite che fornisce la lunghezza dell’arco <strong>di</strong> curva si ha<br />

L = lim<br />

n→∞<br />

i=1<br />

n∑ √<br />

1 + f<br />

′<br />

(ξ i ) 2 ∆x<br />

Usando la definizione dell’integrale definito, questo limite non è nient’altro che un<br />

integrale e, precisamente,<br />

L =<br />

∫ b<br />

a<br />

√<br />

1 + f<br />

′<br />

(x) 2 dx<br />

In maniera equivalente, poichè y = f(x) possiamo riscrivere<br />

√<br />

∫ b<br />

( ) 2 dy<br />

L = 1 + dx<br />

dx<br />

a<br />

Se, invece, abbiamo una funzione scritta in funzione <strong>di</strong> y, vale a <strong>di</strong>re x = h(y) con c ≤ y ≤ d,<br />

la stessa formula <strong>di</strong>venta:<br />

√<br />

∫ d<br />

( ) 2 dx<br />

L = 1 + dy<br />

dy<br />

c<br />

5.6 Lunghezza <strong>di</strong> una curva<br />

Così come abbiamo trovato una formula per calcolare la lunghezza <strong>di</strong> un arco <strong>di</strong> una<br />

funzione y = f(x) o x = h(y), in maniera del tutto analoga, possiamo misurare la lunghezza<br />

<strong>di</strong> una curva.<br />

Sia data una curva in forma parametrica come<br />

x = x(t) y = y(t) t 0 ≤ t ≤ t f<br />

67


5. LE CURVE<br />

Assumiamo che dx ≥ 0: ciò significa che la curva è attraversata solo una volta, da sinistra<br />

dt<br />

verso destra, per t che aumenta nell’intervallo [t 0 , t f ]. La curva, quin<strong>di</strong>, è semplice.<br />

Supponiamo, come per la tangente, <strong>di</strong> poter scrivere y = F (x) o x = H(y) anche se, in<br />

realtà, x = x(t) e y = y(t). Applicando le formule viste per l’arco <strong>di</strong> una funzione alla curva<br />

scritta non in forma parametrica noi dobbiamo applicare una delle due formule:<br />

L =<br />

L =<br />

∫ b<br />

a<br />

∫ d<br />

c<br />

√<br />

√<br />

1 +<br />

1 +<br />

( ) 2 dy<br />

dx se y = f(x), a ≤ x ≤ b<br />

dx<br />

( ) 2 dx<br />

dy se x = h(y), c ≤ y ≤ d<br />

dy<br />

Se lavoriamo considerando y = F (x), poichè x = x(t), operiamo un cambio <strong>di</strong> variabile<br />

per calcolare l’integrale: si ha dx = dx(t) dt (o equivalentemente, se consideriamo x = H(y),<br />

dt<br />

dy = dy<br />

dy dx<br />

dt), mentre per le derivate (o ) ci riconduciamo alle formule viste per la tangente.<br />

dt dx dy<br />

Quin<strong>di</strong> la formula per trovare la lunghezza dell’arco <strong>di</strong> una curva o, più semplicemente, la<br />

lunghezza <strong>di</strong> una curva, <strong>di</strong>venta:<br />

L =<br />

∫ tf<br />

⎛<br />

√ √√√√√<br />

⎜<br />

1 + ⎝<br />

t 0<br />

dy<br />

dt<br />

dx<br />

dt<br />

⎞<br />

2<br />

⎟<br />

⎠<br />

dx<br />

dt dt = ∫ tf<br />

√ √√√√√√√ ( dy<br />

dt<br />

1 + (<br />

t 0 dx<br />

dt<br />

) 2<br />

) 2<br />

dx<br />

dt dt<br />

Semplificando l’espressione sotto ra<strong>di</strong>ce otteniamo<br />

√<br />

∫ tf (dx ) 2 ( ) 2<br />

1<br />

dy dx<br />

L =<br />

t 0 dx<br />

+<br />

dt dt dt dt<br />

∣ dt ∣<br />

Nell’ipotesi fatta per cui dx è positiva possiamo semplificare ancora ottenendo<br />

dt<br />

√<br />

∫ tf (dx ) 2 ( ) 2 dy<br />

L =<br />

+ dt<br />

dt dt<br />

t 0<br />

Osserviamo che, nel caso in cui è dy ≥ 0, usando la formula per x in funzione <strong>di</strong> y, si<br />

dt<br />

ottiene<br />

L =<br />

∫ tf<br />

⎛<br />

√ √√√√√<br />

⎜<br />

1 + ⎝<br />

t 0<br />

dx<br />

dt<br />

dy<br />

dt<br />

⎞<br />

2<br />

⎟<br />

⎠<br />

dy<br />

dt dt<br />

da cui si arriva alla stessa formula.<br />

Se invece non rappresentiamo la curva me<strong>di</strong>ante la forma y = F (x) o x = H(y), arriviamo<br />

allo stesso risultato utilizzando un’approssimazione poligonale. Divi<strong>di</strong>amo l’intervall [t 0 , t f ] in<br />

n sottointervalli <strong>di</strong> stessa ampiezza ∆t. Chiamiamo t 0 , t 1 , t 2 , . . . , t n = t f i punti finali <strong>di</strong> questi<br />

68


5.6. Lunghezza <strong>di</strong> una curva<br />

sottointervalli e in<strong>di</strong>chiamo con (x i , y i ) i punti che si ottengono sulla curva con il parametro<br />

t i . Quin<strong>di</strong> x i = x(t i ) e y i = y(t i ). In<strong>di</strong>chiamo con P i i punti sul piano cartesiano che hanno<br />

coor<strong>di</strong>nate date da (x i , y i ).<br />

I punti P i si trovano sulla curva γ e possiamo tracciare una poligonale con vertici dati da<br />

P i , che approssima la curva γ. Con lo stesso <strong>di</strong>scorso fatto per trovare la lunghezza <strong>di</strong> un<br />

arco <strong>di</strong> funzione, la lunghezza della curva γ è data dal limite delle lunghezze dei segmenti<br />

P i−1 P i = |P i−1 − P i |<br />

Ora<br />

L ≈<br />

n∑<br />

|P i−1 − P i |<br />

i=1<br />

|P i−1 − P i | = √ (x i − x i−1 ) 2 + (y i − y i−1 ) 2 = √ (x(t i ) − x(t i−1 )) 2 + (yt i ) − y(t i−1 )) 2<br />

Applichiamo il teorema del Valor Me<strong>di</strong>o alla funzione x(t) nell’intervallo [t i−1 , t i ]:<br />

x(t i ) − x(t i−1 ) = x ′ (t ∗ i )∆t<br />

dove t ∗ i è un punto opportuno che si trova all’interno dell’intervallo [t i−1, t i ]. Analogamente,<br />

applicando lo stesso teorema alla funzione y(t) si ha<br />

y(t i ) − y(t i−1 ) = y ′ (t ∗∗<br />

i )∆t<br />

con t ∗∗<br />

i punto opportuno che si trova all’interno dell’intervallo [t i−1 , t i ]. Di conseguenza<br />

√<br />

√<br />

|P i−1 − P i | = [x ′ (t ∗ i )∆t]2 + [y ′ (t ∗∗<br />

i )∆t] 2 = [x ′ (t ∗ i )]2 + [y ′ (t ∗∗<br />

i )] 2 ∆t<br />

Sostituendo nell’espressione data per L e passando al limite per n → +∞ si ha<br />

L =<br />

lim<br />

n→+∞<br />

i=1<br />

n∑<br />

|P i−1 − P i | = lim<br />

n∑ √<br />

n→+∞<br />

i=1<br />

[x ′ (t ∗ i )]2 + [y ′ (t ∗∗<br />

i<br />

)] 2 ∆t<br />

Questo limite ci ricorda un integrale (così come abbiamo fatto per la lunghezza dell’arco <strong>di</strong><br />

una funzione) anche se non è esattamente lo stesso in quanto abbiamo due punti t ∗ i e t ∗∗<br />

i<br />

che sono <strong>di</strong>versi. Si può provare, tuttavia, che se x(t) e y(t) sono funzioni continue, il limite<br />

scritto prima è lo stesso che si avrebbe con i due punti t ∗ i e t ∗∗<br />

i coincidenti. Quin<strong>di</strong> si può<br />

passare all’integrale<br />

L =<br />

∫ tf<br />

t 0<br />

√<br />

[x ′ (t)] 2 + [y ′ (t)] 2 dt<br />

Se, al posto <strong>di</strong> x ′ (t) scriviamo dx<br />

dt e, al posto <strong>di</strong> y′ (t) scriviamo dy<br />

dt<br />

prima per la lunghezza <strong>di</strong> una curva.<br />

Riassumiamo questo risultato nel teorema.<br />

otteniamo la formula vista<br />

Teorema 5.6.1 Se una curva γ è descritta tramite equazioni parametriche x = x(t) e y = y(t),<br />

con t 0 ≤ t ≤ t f , e x ′ (t) e y ′ (t) sono funzioni continue e γ è una curva semplice (percorsa solo<br />

una volta per t crescente da t 0 a t f ), allora la lunghezza della curva è data da:<br />

L =<br />

∫ tf<br />

t 0<br />

√ (dx ) 2<br />

+<br />

dt<br />

( ) 2 dy<br />

dt<br />

dt<br />

69


5. LE CURVE<br />

Figura 5.7: cicloide<br />

Esempio<br />

Es. 5.6.1 Vogliamo determinare la lunghezza della curva<br />

x = 3 sin (t) y = 3 cos (t) 0 ≤ t ≤ 2π<br />

Riconosciamo un cerchio <strong>di</strong> centro l’origine e raggio 3.<br />

Per applicare la formula ci serve calcolare dx<br />

dt e dy<br />

dt :<br />

dx<br />

dt<br />

= 3 cos (t)<br />

dy<br />

dt<br />

= −3 sin (t)<br />

Dobbiamo quin<strong>di</strong> calcolare l’integrale<br />

L =<br />

= 3<br />

∫ 2π<br />

0<br />

∫ 2π<br />

0<br />

√<br />

9 cos 2 (t) + 9 sin 2 (t)dt =<br />

∫ 2π<br />

√<br />

∫ 2π<br />

1dt = 3 dt = 3 · 2π = 6π<br />

0<br />

0<br />

√<br />

3 cos 2 (t) + sin 2 (t)dt =<br />

La lunghezza della curva è esattamente la lunghezza della circonferenza! In questo caso<br />

abbiamo una verifica imme<strong>di</strong>ata del risultato che abbiamo ottenuto.<br />

5.7 La curva cicloide<br />

La curva tracciata da un punto P sulla circonferenza <strong>di</strong> un cerchio quando il cerchio<br />

rotola su una linea retta è detta cicloide (si veda Figura 5.7). Per rappresentare questa curva<br />

scegliamo come parametro l’angolo <strong>di</strong> rotazione θ con cui si muove il cerchio. Per θ = 0 il<br />

punto P si trova all’origine <strong>degli</strong> assi cartesiani. Se il cerchio rotola <strong>di</strong> un angolo θ, poichè la<br />

circonferenza rimane sempre in contatto con la linea retta data dall’asse delle x, la <strong>di</strong>stanza<br />

del punto <strong>di</strong> contatto tra circonferenza e asse delle x (punto che chiamiamo T ) dall’origine<br />

coincide con la lunghezza dell’arco P T dove P è il punto che osserviamo quando il cerchio<br />

rotola (si veda la Figura 5.8):<br />

OT = arc(P T )<br />

L’angolo <strong>di</strong> rotazione θ è sotteso all’arco <strong>di</strong> estremi P e T . Poichè la lunghezza <strong>di</strong><br />

un arco è proporzionale all’ampiezza dell’angolo, considerando che all’angolo centrale 2π<br />

corrispondenza la lunghezza della circonferenza 2πr, possiamo scrivere<br />

θ<br />

2π = arc(P T )<br />

2πr<br />

Da questa relazione otteniamo arc(P T ) = rθ, da cui OT = rθ.<br />

70


5.8. Sistema <strong>di</strong> coor<strong>di</strong>nate polari<br />

Figura 5.8: Considerazioni geometriche sul punto P della circonferenza quando il cerchio<br />

rotola lungo l’asse x.<br />

Figura 5.9: Rappresentazione grafica della curva cicloide per r = 2 e 0 ≤ θ ≤ 2π (a sinistra) e<br />

0 ≤ θ ≤ 8π (a destra).<br />

Questo risultato ci serve per trovare le coor<strong>di</strong>nate del punto P . Si ha infatti (aiutandoci<br />

con la Figura 5.8):<br />

x = OT − P Q<br />

y = CT − CQ<br />

Considerando il triangolo rettangolo <strong>di</strong> vertici P , Q e il centro della circonferenza C, il lato<br />

CP = r mentre i lati P Q e CQ sono dati dalle formule trigonometriche<br />

P Q = CP sin θ = r sin θ,<br />

CQ = CP cos θ = r cos θ<br />

. Il lato CT vale r. Inserendo queste relazioni nelle espressioni precedenti troviamo<br />

x = OT − P Q = rθ − r sin θ = r(θ − sin θ)<br />

y = CT − CQ = r − r cos θ = r(1 − cos θ)<br />

Abbiamo trovato, dunque, che le equazioni parametriche della curva cicloide sono date da<br />

x = r(θ − sin θ), y = r(1 − cos θ)<br />

Osserviamo che, sebbene queste equazioni le abbiamo ricavate considerando 0 < θ < π/2,<br />

esse sono valide anche per altri valori <strong>di</strong> θ. Un arco completo della curva cicloide è dato dalla<br />

rotazione completa della circonferenza e si ha, quin<strong>di</strong>, per θ ∈ [0, 2π].<br />

5.8 Sistema <strong>di</strong> coor<strong>di</strong>nate polari<br />

Siamo abituati a rappresentare un punto nel piano utilizzando le coor<strong>di</strong>nate cartesiane.<br />

Vi è tuttavia un altro sistema <strong>di</strong> coor<strong>di</strong>nate (introdotto da Newton) che può essere conve-<br />

71


5. LE CURVE<br />

Figura 5.10: Coor<strong>di</strong>nate polari.<br />

Figura 5.11: Passaggio da coor<strong>di</strong>nate polari a coor<strong>di</strong>nate cartesiane.<br />

niente per molti scopi, tra cui quello <strong>di</strong> rappresentare alcune curve parametriche. Questo<br />

sistema prende il nome <strong>di</strong> sistema <strong>di</strong> coor<strong>di</strong>nate polari.<br />

Scegliamo un punto nel piano che chiamiamo polo o origine (lo in<strong>di</strong>chiamo con O). Dall’origine<br />

tracciamo una semiretta chiamata asse polare (in genere questo asse è tracciato<br />

orizzontalmente, a destra del punto O e corrisponde al semiasse positivo dell’asse delle x<br />

del sistema cartesiano). Se P è un qualunque altro punto in questo piano, tracciamo il segmento,<br />

<strong>di</strong> lunghezza r, che unisce P all’origine e consideriamo l’angolo θ (<strong>di</strong> solito espresso<br />

in ra<strong>di</strong>anti) tra l’asse polare e il segmento OP . Il punto P viene rappresentato dalla coppia<br />

or<strong>di</strong>nata (r, θ) e r, θ sono le coor<strong>di</strong>nate polari del punto P (si veda Figura 5.10). Si usa la<br />

convenzione che un angolo è positivo se misurato in senso antiorario rispetto all’asse polare.<br />

Inoltre il punto (0, θ) rappresenta l’origine, qualunque sia θ.<br />

Si estende il sistema <strong>di</strong> coor<strong>di</strong>nate polari a valori <strong>di</strong> r negativi, con la convenzione che il<br />

punto del tipo (−r, θ) giace sulla stessa linea del punto (r, θ) e alla stessa <strong>di</strong>stanza |r| da O,<br />

ma sul lato opposto rispetto a (r, θ). Dire (−r, θ) è la stessa cosa <strong>di</strong> (r, θ + π). Come conseguenza,<br />

un punto nel sistema <strong>di</strong> coor<strong>di</strong>nate polari può avere più <strong>di</strong> una rappresentazione.<br />

Dal momento che una completa rotazione antioraria è data dall’angolo 2π, si ha che il punto<br />

(r, θ) può essere rappresentato anche come (r, θ + 2nπ), e (−r, θ + (2n + 1)π) con n intero.<br />

Per passare dalla rappresentazione in coor<strong>di</strong>nate polari al sistema <strong>di</strong> coor<strong>di</strong>nate cartesiane,<br />

basta osservare che l’origine del sistema polare corrisponde all’origine del sistema cartesiano,<br />

l’asse polare corrisponde all’asse delle x e, <strong>di</strong> conseguenza, il punto P <strong>di</strong> coor<strong>di</strong>nate<br />

polari (r, θ), ha coor<strong>di</strong>nate cartesiane x e y date da<br />

x = r cos θ,<br />

y = r sin θ<br />

(si veda Figura 5.11: abbiamo applicato le relazioni trigonometriche che legano i lati <strong>di</strong><br />

un triangolo rettangolo all’angolo compreso tra ipotenusa e uno dei due cateti). Viceversa,<br />

dato un punto P in coor<strong>di</strong>nate cartesiane, per trovare i valori <strong>di</strong> r e θ delle corrispondenti<br />

72


5.9. Curve in coor<strong>di</strong>nate polari<br />

Figura 5.12: Punto (1, −1) in coor<strong>di</strong>nate polari e cartesiane.<br />

coor<strong>di</strong>nate polari, possiamo sfruttare le relazioni<br />

r 2 = x 2 + y 2 , e tan θ = y x<br />

che ricaviamo dalle relazioni precedenti. Poichè tan θ = tan (θ + π), dobbiamo prestare attenzione<br />

a scegliere il valore <strong>di</strong> θ che permette <strong>di</strong> avere, nel piano polare, lo stesso punto del<br />

piano cartesiano.<br />

Esempio<br />

Es. 5.8.1 Convertiamo il punto (2, π/4) da coor<strong>di</strong>nate polari a coor<strong>di</strong>nate cartesiane. Da<br />

x = r cos θ e y = r sin θ, sostituendo i valori <strong>di</strong> r e θ otteniamo x = 2 cos (π/4) = 2 √<br />

2<br />

= √ 2 e<br />

y = 2 sin (π/4) = 2 √<br />

2<br />

= √ 2. In coor<strong>di</strong>nate cartesiane abbiamo il punto ( √ 2, √ 2).<br />

Esempio<br />

Es. 5.8.2 Rappresentiamo in coor<strong>di</strong>nate polari il punto dato in coor<strong>di</strong>nate cartesiane<br />

(1, −1).<br />

Scegliamo la rappresentazione con r > 0 andando a considerare la ra<strong>di</strong>ce positiva <strong>di</strong><br />

x 2 + y 2 . Quin<strong>di</strong> r = √ 1 + 1 = √ 2.<br />

Abbiamo da risolvere l’equazione tan θ = y x = −1.<br />

Sia θ = 3π 4 + 2nπ sia θ = −π + 2nπ con n intero (n = 0, 1, . . .) hanno come tangente il<br />

4<br />

valore −1. Scegliamo il valore <strong>di</strong> θ che ci permette (insieme a r = √ 2) <strong>di</strong> avere il punto<br />

P posizionato nel corretto quadrante: dobbiamo scegliere θ = − π 4 + 2nπ. Pren<strong>di</strong>amo<br />

θ = − π 4 . Il punto in coor<strong>di</strong>nate polari dato da (√ 2, − π ) corrisponde a (1, −1) in coor<strong>di</strong>nate<br />

4<br />

cartesiane. Se considerassimo il punto ( √ 2, 3π 4<br />

(si veda Figura 5.12 per un confronto).<br />

) avremmo, in coor<strong>di</strong>nate cartesiane (−1, 1)<br />

5.9 Curve in coor<strong>di</strong>nate polari<br />

Un’equazione polare del tipo r = f(θ) o, più in generale, F (r, θ) = 0 ha come grafico<br />

l’insieme <strong>di</strong> tutti i punti P <strong>di</strong> coor<strong>di</strong>nate polari (r, θ), che sod<strong>di</strong>sfano l’equazione. Possiamo<br />

dunque avere delle curve rappresentate me<strong>di</strong>ante coor<strong>di</strong>nate polari.<br />

73


5. LE CURVE<br />

Esempio<br />

Es. 5.9.1 La curva <strong>di</strong> equazione polare r = 4 è data da tutti i punti (r, θ) con r = 4. Dal<br />

momento che r rappresenta la <strong>di</strong>stanza dei punti dal polo (l’origine del piano polare), la<br />

curva data rappresenta il cerchio <strong>di</strong> centro il polo O e raggio 4.<br />

Esempio<br />

Es. 5.9.2 La curva polare θ = π/5 consiste <strong>di</strong> tutti i punti (r, θ) con θ = π/5 ra<strong>di</strong>anti.<br />

Abbiamo quin<strong>di</strong> una retta che passa per O e che forma un angolo <strong>di</strong> π/5 ra<strong>di</strong>anti con<br />

l’asse polare.<br />

Esempio<br />

Es. 5.9.3 Troviamo le equazioni cartesiane della curva polare r = 2 cos θ.<br />

Se proviamo a fare il grafico della curva sul piano polare, al variare <strong>di</strong> θ, ci accorgiamo<br />

che il grafico rappresenta una circonferenza.<br />

Per passare a coor<strong>di</strong>nate cartesiane, da x = r cos θ abbiamo cos θ = x/r quin<strong>di</strong> r = 2 cos θ =<br />

2x/r, cioè r 2 = 2x ma r 2 = x 2 +y 2 , da cui x 2 +y 2 = 2x o ancora x 2 +y 2 −2x = 0. Aggiungendo<br />

e sottraendo 1 abbiamo<br />

x 2 + y 2 − 2x + 1 − 1 = 0 cioè (x − 1) 2 + y 2 = 1<br />

Abbiamo l’equazione della circonferenza <strong>di</strong> centro (1, 0) e raggio 1.<br />

5.9.1 La curva car<strong>di</strong>oide<br />

Stu<strong>di</strong>amo ora la curva car<strong>di</strong>oide, chiamata in questo modo perchè a forma <strong>di</strong> cuore, data<br />

dall’equazione r = 1 + sin θ.<br />

Per farne il grafico, facciamo prima <strong>di</strong> tutto il grafico, in coor<strong>di</strong>nate cartesiane, della<br />

funzione r = 1 + sin θ (si veda Figura 5.13, a sinistra), che altro non è che la funzione sin a<br />

cui è aggiunta un’unità. Per θ che varia da 0 a π/2, r cresce da 1 a 2. Ma r rappresenta<br />

la <strong>di</strong>stanza dal polo in coor<strong>di</strong>nate polari, perció nel grafico in coor<strong>di</strong>nate polari dobbiamo<br />

far variare r da 1 a 2 (in<strong>di</strong>chiamo con ➀ questa porzione <strong>di</strong> curva). Per θ che varia da π/2<br />

a π, r decresce da 2 a 1 perciò nella corrispondente curva polare dobbiamo rappresentare<br />

questa decrescita (in<strong>di</strong>cata nella regione ➁). Per θ ∈ [π, 3π/2] r decresce da 1 a 0 e si ha la<br />

corrispondente portione ➂ della curva polare. Infine, per θ ∈ [3π/2, 2π] r aumenta da 0 a 1,<br />

come mostrato nella porzione ➃.<br />

Se θ dovesse andare oltre 2π, la curva ripercorrebbe lo stesso percorso.<br />

5.10 Lunghezza <strong>di</strong> una curva polare<br />

Se vogliamo calcolare la lunghezza <strong>di</strong> una curva in coor<strong>di</strong>nate polari, la formula che<br />

abbiamo dato per la lunghezza <strong>di</strong> una curva parametrica si semplifica. Infatti, se passiamo a<br />

coor<strong>di</strong>nate cartesiane, le equazioni che caratterizzano la curva polare r = f(θ) con θ 0 ≤ θ ≤ θ f<br />

sono date da<br />

x = r cos θ = f(θ) cos θ,<br />

y = r sin θ = f(θ) sin θ<br />

Quin<strong>di</strong> x e y sono funzioni <strong>di</strong> θ. Assumendo che f ′ sia una funzione continua, la lunghezza<br />

della curva è data dalla formula<br />

√<br />

∫ θf (dx ) 2 ( ) 2 dy<br />

L =<br />

+ dθ<br />

dθ dθ<br />

74<br />

θ 0


5.10. Lunghezza <strong>di</strong> una curva polare<br />

Figura 5.13: Car<strong>di</strong>oide.<br />

Si ha (considerando che x e y sono date dal prodotto <strong>di</strong> due funzioni):<br />

dx<br />

dθ = f ′ (θ) cos θ − f(θ) sin θ = dr cos θ − r sin θ<br />

dθ<br />

dy<br />

dθ = f ′ (θ) sin θ + f(θ) cos θ = dr sin θ + r cos θ<br />

dθ<br />

Sfruttando il fatto che cos 2 θ + sin 2 θ = 1 si ha<br />

( ) 2 ( ) 2 ( ) 2 dx dy dr<br />

+ = cos 2 θ + r 2 sin 2 θ − 2r dr cos θ sin θ+<br />

dθ dθ dθ<br />

dθ<br />

( ) 2 dr<br />

+ sin 2 θ + r 2 cos 2 θ + 2r dr cos θ sin θ<br />

dθ<br />

dθ<br />

( ) 2 dr<br />

= (cos 2 θ + sin 2 θ) + r 2 (cos 2 θ + sin 2 θ)+<br />

dθ<br />

− 2r dr<br />

dr<br />

cos θ sin θ + 2r cos θ sin θ<br />

dθ dθ<br />

( ) 2 dr<br />

= + r 2<br />

dθ<br />

Andando a sostituire nell’integrale che dà la lunghezza della curva si ha<br />

√<br />

∫ θf<br />

( ) 2 dr<br />

L = r 2 + dθ<br />

dθ<br />

θ 0<br />

Abbiamo trovato una formula semplificata per la lunghezza della curva polare.<br />

5.10.1 Lunghezze <strong>di</strong> alcune curve<br />

La curva car<strong>di</strong>oide<br />

Calcoliamo la lunghezza della curva car<strong>di</strong>oide r = 1 + sin θ con θ ∈ [0, 2π].<br />

Poichè dr = cos θ la lunghezza della curva è data dall’integrale<br />

dθ<br />

∫ 2π √<br />

∫ 2π √<br />

L = (1 + sin θ)2 + cos 2 θdθ = 1 + sin 2 θ + 2 sin θ + cos 2 θdθ<br />

=<br />

0<br />

∫ 2π<br />

0<br />

0<br />

∫<br />

√ 2π √ √<br />

2 + 2 sin θdθ = 2 1 + sin θdθ<br />

0<br />

75


5. LE CURVE<br />

Per calcolare questo integrale moltiplichiamo e <strong>di</strong>vi<strong>di</strong>amo per √ 1 − sin θ ricavando<br />

L = √ 2<br />

= √ 2<br />

∫ 2π<br />

0<br />

∫ 2π<br />

0<br />

√<br />

√ 1 − sin θ<br />

1 + sin θ √ dθ = √ ∫ 2π<br />

2<br />

1 − sin θ 0<br />

√<br />

cos2 θ<br />

√ dθ = √ ∫ 2π<br />

| cos θ|<br />

2 √ dθ<br />

1 − sin θ 0 1 − sin θ<br />

√<br />

1 − sin 2 θ<br />

√<br />

1 − sin θ<br />

dθ<br />

Abbiamo un integrale che <strong>di</strong>pende dal valore assoluto <strong>di</strong> cos θ: poichè cos θ è positivo per<br />

0 ≤ θ ≤ π/2 e per 3π/2 ≤ θ ≤ 2π, mentre è negativo per π/2 ≤ θ ≤ 3π/2, l’integrale si spezza nei<br />

tre integrali<br />

L = √ ∫ 2π<br />

| cos θ|<br />

2 √ dθ =<br />

1 − sin θ<br />

= √ 2<br />

0<br />

∫ π/2<br />

Osserviamo che<br />

∫<br />

cos θ<br />

√ dθ 1 − sin θ<br />

0<br />

cos θ<br />

√ dθ − √ ∫ 3π/2<br />

2<br />

1 − sin θ π/2<br />

cos θ<br />

√ dθ + √ ∫ 2π<br />

2<br />

1 − sin θ 3π/2<br />

cos θ<br />

√<br />

1 − sin θ<br />

dθ<br />

si può risolvere facendo il cambiamento <strong>di</strong> variabile u = sin θ da cui du = cos θdθ ricavando<br />

∫<br />

∫<br />

∫<br />

1<br />

−1<br />

D(1 − u)<br />

√ du = − √ du = − √ du = −2 √ 1 − u + costante<br />

1 − u 1 − u 1 − u<br />

Abbiamo considerato che la derivata <strong>di</strong> 1 − u vale −1 (l’abbiamo in<strong>di</strong>cata con D(1 − u) e che<br />

∫<br />

x n dx = xn+1<br />

n + 1 + costante.<br />

Ritornando a L e sostituendo quanto abbiamo trovato nei tre integrali, abbiamo<br />

L = √ [ ∣∣∣−2 √ ∣ ∣∣<br />

θ=π/2<br />

∣<br />

2 1 − sin θ − ∣−2 √ 1 − sin θ∣ θ=3π/2<br />

∣<br />

+ ∣−2 √ ]<br />

1 − sin θ∣ θ=2π<br />

θ=0<br />

θ=π/2<br />

θ=3π/2<br />

= √ 2 [( −2 √ 1 − 1 + 2 √ 1 − 0 ) − ( −2 √ 1 + 1 + 2 √ 1 − 1 ) + ( −2 √ 1 − 0 + 2 √ 1 + 1 )]<br />

= √ (<br />

2 2 + 2 √ 2 − 2 + 2 √ )<br />

2<br />

= √ (<br />

2 4 √ )<br />

2 = 8<br />

La lunghezza della curva car<strong>di</strong>oide vale 8.<br />

La spirale <strong>di</strong> Archimede<br />

La spirale <strong>di</strong> Archimede è una curva la cui equazione polare è ρ(θ) = kθ con k parametro<br />

assegnato, positivo e θ che varia nell’intervallo [0, θ f ] (si veda figura 5.14 per vedere cosa<br />

succede aumentando θ f ).<br />

Per calcolare la lunghezza <strong>di</strong> questa curva, poichè dρ = k si ha<br />

dθ<br />

L =<br />

∫ θf<br />

0<br />

√<br />

∫ θf √<br />

k2 + (kθ) 2 dθ = k 1 + θ2 dθ<br />

L’integrale da risolvere non è imme<strong>di</strong>ato nè semplice.<br />

0<br />

76


5.10. Lunghezza <strong>di</strong> una curva polare<br />

Figura 5.14: Spirale <strong>di</strong> Archimede con k = 2 e θ f = 2π (a sinistra) e θ f = 10π (a destra)<br />

Per capire come si arriva al risultato, ve<strong>di</strong>amo nei dettagli la sua risoluzione (specie perchè<br />

si tratta <strong>di</strong> un integrale che può capitare <strong>di</strong> incontrare anche in altre occasioni). 1<br />

Calcoliamo quin<strong>di</strong> l’integrale ∫ √ 1 + x 2 dx (per semplicità consideriamo l’integrale<br />

indefinito e usiamo x al posto <strong>di</strong> θ).<br />

Facciamo un cambiamento <strong>di</strong> variabile ponendo x = tan u. Sappiamo che D(tan u) =<br />

1<br />

cos 2 u . La funzione 1<br />

viene chiamiata anche secante (trigonometrica) e in<strong>di</strong>cata con il<br />

cos u<br />

simbolo sec u (sec u = 1 ). Per semplicità useremo anche noi questa terminologia.<br />

cos u<br />

Consideriamo, inoltre, queste relazioni che useremo nel seguito:<br />

G 1 + tan 2 u = 1 + sin2 u<br />

cos 2 u = cos2 u + sin 2 u<br />

cos 2 = 1<br />

u cos 2 u = sec2 u<br />

1<br />

G D(sec u) = D(<br />

cos u ) = sin u<br />

cos 2 u = tan u = tan u sec u<br />

cos u<br />

1<br />

Tornando all’integrale, da x = tan u si ha dx = D(tan u)du =<br />

cos 2 u du = sec2 udu.<br />

Sostituendo si ha<br />

I =<br />

∫ √1<br />

+ x2 dx =<br />

∫ √<br />

1 + tan 2 u sec 2 udu<br />

Per la relazione 1 + tan 2 u = sec 2 u si ha<br />

I =<br />

∫ √sec2<br />

u sec 2 udu<br />

Poichè u = arctan x, si ha −π/2 ≤ u ≤ π/2 e in questo intervallo cos u ≥ 0 da cui sec u ≥ 0,<br />

quin<strong>di</strong> √ sec u = sec u. Allora<br />

∫ √sec2<br />

∫<br />

I = u sec 2 udu = sec 3 udu<br />

L’integrale in sec 3 u si risolve riconducendosi all’integrale <strong>di</strong> sec u. Risolviamo prima quest’ultimo<br />

integrale (usando <strong>degli</strong> accorgimenti: come vedete, la strada per risolvere l’integrale<br />

<strong>di</strong> partenza è molto lunga).<br />

∫<br />

∫<br />

sec udu =<br />

=<br />

sec u + tan u<br />

sec u<br />

sec u + tan u du<br />

∫ sec 2 u + sec u tan u<br />

du<br />

sec u + tan u<br />

1 Se ci dovesse capitare <strong>di</strong> risolvere un esercizio arrivando ad un integrale del genere, dovremo ricordarci che<br />

esiste tutta questa lunga procedura che ci apprestiamo a descrivere per giungere alla formula finale (e quin<strong>di</strong><br />

torneremo su questi appunti per ricordarci quale sia il risultato dell’integrale).<br />

77


5. LE CURVE<br />

A questo punto si fa un cambiamento <strong>di</strong> variabile (ancora!), ponendo w = sec u + tan u (l’espressione<br />

al denominatore della funzione integranda), da cui dw = D(sec u + tan u)du =<br />

(sec u tan u + sec 2 u)du (ritroviamo l’espressione al numeratore della funzione integranda), da<br />

cui<br />

∫ sec 2 ∫<br />

u + sec u tan u 1<br />

du = dw = ln |w| + costante<br />

sec u + tan u<br />

w<br />

= ln | sec u + tan u| + costante<br />

Torniamo ora all’integrale <strong>di</strong> sec 3 u riscrivendo <strong>di</strong>versamente la funzione integranda:<br />

sec 3 u = sec3 u<br />

2<br />

= sec3 u<br />

2<br />

= sec3 u<br />

2<br />

= sec3 u<br />

2<br />

+ sec3 u<br />

2<br />

+ sec2 u sec u<br />

2<br />

+ (tan2 u + 1) sec u<br />

2<br />

+ tan2 u sec u<br />

+ sec u<br />

2 2<br />

= sec3 + tan 2 u sec u<br />

2<br />

+ sec u<br />

2<br />

Per calcolare l’integrale <strong>di</strong> sec 3 u dobbiamo integrare i due termini della somma in cui<br />

abbiamo scomposto sec 3 u. Del secondo termine sappiamo già quanto vale l’integrale. Per il<br />

primo, basta osservare che<br />

D(sec u tan u) = D(sec u) tan u + sec uD(tan u)<br />

= sec u tan u tan u + sec u sec 2 u<br />

= sec u tan 2 u + sec 3 u<br />

Ma allora<br />

∫ sec u tan 2 u + sec 3 ∫<br />

u 1<br />

du =<br />

2<br />

2 D(sec u tan u)du = 1 sec u tan u + costante<br />

2<br />

Ritornando all’integrale <strong>di</strong> prima e mettendo insieme i vari pezzi si ha<br />

∫<br />

sec 3 udu = 1 (sec u tan u + ln | sec u + tan u|) + costante<br />

2<br />

Quin<strong>di</strong> (finalmente siamo arrivati alla conclusione!!!!):<br />

∫ √1 ∫<br />

+ x2 dx = sec 3 udu = 1 (sec u tan u + ln | sec u + tan u|) + costante<br />

2<br />

Per tornare alla variabile originale x, da x = tan u si ha u = arctan x, da cui (sfruttando le<br />

proprietà viste prima <strong>di</strong> sec u e tan u) sec u = √ 1 + tan 2 u = √ 1 + x 2 . Perciò, sostituendo<br />

∫ √1<br />

+ x2 dx = 1 (<br />

x √ 1 + x<br />

2 2 + ln | √ )<br />

1 + x 2 + x| + costante<br />

Sappiamo ora calcolare la lunghezza della spirale <strong>di</strong> Archimede.<br />

Tornando alla formula<br />

∫ θf √<br />

L = k 1 + θ2 dθ<br />

abbiamo<br />

78<br />

L = k<br />

0<br />

[ 1<br />

(<br />

θ √ 1 + θ<br />

2 2 + ln | √ ) ] θ f<br />

1 + θ 2 + θ| = k √<br />

√<br />

)<br />

(θ f 1 + (θ f )<br />

0<br />

2<br />

2 + ln | 1 + (θ f ) 2 + θ f |


5.11. Funzioni a valori vettoriali<br />

5.11 Funzioni a valori vettoriali<br />

Abbiamo visto che una curva può essere rappresentata me<strong>di</strong>ante due equazioni parametriche<br />

che in<strong>di</strong>viduano l’ascissa e l’or<strong>di</strong>nata <strong>di</strong> ogni suo punto (se avessimo una curva nello<br />

spazio 3D avremmo tre equazioni, una per x, una per y, una per z).<br />

Queste equazioni sono un esempio <strong>di</strong> funzione a valori vettoriali. Nel caso della curva in<br />

2D possiamo definire una funzione f definita nell’insieme [t 0 , t f ] e a valori in R 2 : f : [t 0 , t f ] →<br />

R 2 tale che f = (x(t), y(t)) Al parametro t è associato il punto (x(t), y(t)), che possiamo vedere<br />

anche come un vettore <strong>di</strong> R 2 .<br />

Più in generale<br />

Definizione 5.11.1 f : I → R n con I ⊂ R k , (k, n interi) è una funzione vettoriale.<br />

Se la funzione vettoriale è data da f(t) = (f 1 (t), f 2 (t), . . . , f n (t)), possiamo calcolare la sua<br />

derivata, che è il vettore che ha come componenti le derivate delle componenti della funzione:<br />

f ′ (t) = (f 1(t), ′ f 2(t), ′ . . . , f n(t)). ′ Di questo vettore possiamo calcolare il modulo (che è una<br />

funzione <strong>di</strong> t): |f ′ (t)| = √ ∑ n<br />

i=1 (f i ′(t))2 .<br />

Nel caso 2D, se f(t) = (x(t), y(t)), si ha f ′ (t) = ( dx<br />

dt , dy<br />

dt ) e |f ′ (t)| =<br />

5.12 Le curve riviste come funzioni vettoriali<br />

Definizione 5.12.1<br />

f : [a, b] → R n<br />

G Si <strong>di</strong>ce curva <strong>di</strong> R n ogni applicazione<br />

√ (dx ) 2<br />

+<br />

dt<br />

( ) 2 dy<br />

dt<br />

G Si <strong>di</strong>ce sostegno (oppure traccia o traiettoria) della curva l’insieme f([a, b]) (il codominio<br />

della funzione).<br />

G Un curva f si <strong>di</strong>ce <strong>di</strong> classe C k se f è <strong>di</strong> classe C k ([a, b]) (cioè se ogni sua componente è <strong>di</strong><br />

classe C k ).<br />

La curva rappresentata dalla f viene detta anche curva γ.<br />

Definizione 5.12.2 Una curva γ si <strong>di</strong>ce regolare se<br />

1. la f è <strong>di</strong> classe C 1 ([a, b])<br />

2. ∀t ∈]a, b[: |f ′ (t)| > 0<br />

3. Se la f è una corrispondenza biunivoca tra [a, b] e f([a, b]) (si può avere una sola eccezione<br />

se la curva è chiusa, per cui f(a) = f(b))<br />

Definizione 5.12.3 Due funzioni vettoriali f : [a, b] → R n e g : [α, β] → R n rappresentanto la<br />

stessa curva γ se esiste una funzione Φ : [α, β] → [a, b], <strong>di</strong> classe C 1 e Φ ′ (u) > 0 ∀u ∈ [α, β], tale<br />

che Φ(α) = a Φ(β) = b<br />

G ∀u ∈ [α, β] : g(u) = (f ◦ Φ)(u) = f(Φ(u))<br />

Definizione 5.12.4 Una curva si <strong>di</strong>ce generalmente regolare o regolare a tratti se<br />

1. f è continua<br />

2. esiste un numero finito <strong>di</strong> punti a = t 0 < t 1 < . . . < t r = b tali che la f ristretta a ciascun<br />

sottointervallo [t i−1 , t i ], i = 1, 2, . . . , r rappresenti una curva regolare<br />

79


5. LE CURVE<br />

Esempio<br />

Es. 5.12.1 La curva data da<br />

x = t y = |t| − 1 ≤ t ≤ 1<br />

non è regolare perchè non è derivabile per t = 0, ma la curva è generalmente regolare<br />

perchè ristretta a [−1, 0] e [0, 1] è regolare.<br />

5.13 Retta tangente ad una curva<br />

Definizione 5.13.1 Data una curva γ <strong>di</strong> classe C 1 , data dalla funzione vettoriale<br />

f : [a, b] → R n<br />

sia t p ∈]a, b[, con f ′ (t p ) ≠ 0.<br />

Si definisce retta tangente alla curva γ nel punto f(t p ) la retta passante per f(t p ) e avente<br />

come <strong>di</strong>rezione quella del vettore f ′ (t p ):<br />

⃗r t = f(t p ) + tf ′ (t p )<br />

t ∈ R<br />

Nel caso 2D ritroviamo la retta che avevamo introdotto a pag. 66:<br />

⃗r t = (x(t p ) + dx(t p)<br />

dt<br />

t, y(t p ) + dy(t p)<br />

t)<br />

dt<br />

Definizione 5.13.2 Il vettore f ′ (t p ) si <strong>di</strong>ce vettore tangente alla curva γ in f(t p ).<br />

In R 2 il vettore tangente si in<strong>di</strong>ca anche come<br />

f ′ (t p ) = x ′ (t)⃗i + y ′ (t)⃗j<br />

5.14 Curve orientate<br />

L’orientamento naturale <strong>di</strong> una curva è quello dato da valori crescenti <strong>di</strong> t. Per <strong>di</strong>re che<br />

la curva ha l’orientamento naturale la si in<strong>di</strong>ca come +γ.<br />

L’orientamento <strong>di</strong> una curva può essere data dal versore<br />

τ(t) = f ′ (t)<br />

|f ′ (t)|<br />

Definizione 5.14.1 Data una curva γ <strong>di</strong> classe C 1 , data da f : [a, b] → R n si chiama curva<br />

opposta la curva Γ data da F : [−b, −a] → R n per la quale F(u) = f(−u)<br />

La curva orientata +Γ ha orientamento naturale opposto a quello della curva +γ. Proprio<br />

per questo motivo, si può in<strong>di</strong>care con −γ la curva opposta +Γ.<br />

5.15 Di nuovo sulla lunghezza <strong>di</strong> una curva<br />

Diamo qualche cenno su come si arriva alla lunghezza <strong>di</strong> una curva.<br />

Data una curva γ <strong>di</strong> classe C 0 , sia data una sud<strong>di</strong>visione dell’intervallo [a, b] me<strong>di</strong>ante i<br />

punti a = t 0 < t 1 < . . . < t r = b. Si consideri la poligonale che congiunge i punti f(t i ). Si<br />

<strong>di</strong>ce lunghezza della curva γ l’estremo superiore dell’insieme costituito dalle lunghezze delle<br />

80


5.16. L’ascissa curvilinea<br />

poligonali così create, considerando tutte le possibili sud<strong>di</strong>visioni dell’intervallo [a, b] fatte<br />

con un numero finito <strong>di</strong> punti.<br />

Una curva che ha lunghezza finita si <strong>di</strong>ce rettificabile.<br />

Una curva regolare è rettificabile e la sua lunghezza è data da<br />

L =<br />

∫ b<br />

a<br />

|f ′ (t)|dt<br />

Osserviamo che questa formula è esattamente quella che abbiamo ricavato in precedenza.<br />

Per una curva regolare a tratti si ha un’analoga definizione, considerando la somma delle<br />

lunghezze delle curve regolari <strong>di</strong> cui è composta.<br />

Proposizione 5.15.1 L’integrale che fornisce la lunghezza <strong>di</strong> una curva non cambia se si<br />

considera la curva opposta a quella data o se si considera la curva me<strong>di</strong>ante rappresentazioni<br />

equivalenti.<br />

5.16 L’ascissa curvilinea<br />

Data una curva regolare orientata +γ data da f : [a, b] → R n si definisca la funzione reale<br />

s(t) data da<br />

{∫ t<br />

a |f ′ (u)|du per t ≠ a<br />

s(t) =<br />

0 per t = a<br />

Questa funzione rappresenta la lunghezza dell’arco <strong>di</strong> curva tra f(a) e f(t) ed è detta ascissa<br />

curvilinea. È una funzione crescente poichè s ′ (t) = |f ′ (t)| > 0 (essendo la curva regolare).<br />

La sua inversa è una funzione Φ(s) tale che Φ(s) = t e tale che ∀s ∈ [0, L] (dove L è la<br />

lunghezza della curva γ) si ha Φ(0) = a, Φ(L) = b e Φ ′ (s) > 0.<br />

Ma, allora, f è equivalente alla funzione g = f ◦ Φ. La funzione g <strong>di</strong>pende dall’ascissa<br />

curvilinea s.<br />

La rappresentazione <strong>di</strong> una curva me<strong>di</strong>ante l’ascissa curvilinea non <strong>di</strong>pende dalla<br />

rappresentazione parametrica da cui si è partiti.<br />

Proposizione 5.16.1 La derivata <strong>di</strong> g ha modulo unitario (o norma unitaria).<br />

Dimostrazione.<br />

|g ′ (s)| = |(f ◦ Φ) ′ (s)| = |f ′ (Φ(s))Φ ′ (s)| = |f ′ (Φ(s))|Φ ′ (s)<br />

Non abbiamo considerato il modulo <strong>di</strong> Φ ′ (s) essendo questa funzione positiva e scalare.<br />

Poichè Φ è la funzione inversa <strong>di</strong> s, per la derivata vale Φ ′ 1<br />

(s) =<br />

s ′ (la derivata della<br />

(Φ(s))<br />

inversa <strong>di</strong> una funzione è uguale al reciproco della derivata della funzione stessa), andando<br />

a sostituire, si trova:<br />

|g ′ (s)| = 1<br />

✔<br />

Considerando il <strong>di</strong>fferenziale dell’ascissa curvilinea si ha la cosiddetta lunghezza dell’arco<br />

elementare:<br />

ds = |f ′ (t)|dt<br />

81


CAPITOLO 6<br />

Superfici parametriche<br />

Secondo alcuni autorevoli testi<br />

<strong>di</strong> tecnica aeronautica, il<br />

calabrone non può volare, a<br />

causa della forma e del peso<br />

del proprio corpo in rapporto<br />

alla superficie alare. Ma il<br />

calabrone non lo sa e perciò<br />

continua a volare.<br />

Igor Ivanovich Sikorsky<br />

(1889-1972)<br />

6.1 Superfici parametriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83<br />

6.1.1 Sistema <strong>di</strong> coor<strong>di</strong>nate sferiche . . . . . . . . . . . . . . . . . . . . . . . . . . 85<br />

6.2 Piano tangente a una superficie parametrica . . . . . . . . . . . . . . . . . . . . . 87<br />

6.2.1 Equazione <strong>di</strong> un piano e vettore normale al piano . . . . . . . . . . . . . . . 87<br />

6.1 Superfici parametriche<br />

Così come una curva è stata rappresentata in forma parametrica, anche una superficie<br />

può essere rappresentata in forma parametrica me<strong>di</strong>ante tre funzioni (una per x, una per y,<br />

una per z) <strong>di</strong>pendenti da due parametri, dette equazioni parametriche della superficie<br />

x = x(u, v) y = y(u, v) z = z(u, v).<br />

Alla stessa maniera con cui abbiamo visto le equazioni <strong>di</strong> una curva parametrica come<br />

una funzione vettoriale, anche una superficie parametrica può essere vista come una<br />

funzione vettoriale che <strong>di</strong>pende da due variabili ⃗r : R 2 −→ R 3 , tale che<br />

⃗r(u, v) = (x(u, v), y(u, v), z(u, v))<br />

La funzione vettoriale è definita su una regione D del piano uv e l’insieme dei punti<br />

(x, y, z) ∈ R 3 , che sono i valori della funzione vettoriale, prende il nome <strong>di</strong> superficie<br />

parametrica S.<br />

83


6. SUPERFICI PARAMETRICHE<br />

Figura 6.1: Cilindro <strong>di</strong> equazioni x = 4 cos u, y = v, z = 4 sin u.<br />

Figura 6.2: Cilindro <strong>di</strong> equazioni x = 4 cos u, y = v, z = 4 sin u con 0 ≤ u ≤ π/4, 0 ≤ v ≤ 1.<br />

Esempio<br />

Es. 6.1.1 Sia data la superficie <strong>di</strong> equazioni parametriche<br />

x = 4 cos u, y = v, z = 4 sin u<br />

Cerchiamo <strong>di</strong> capire <strong>di</strong> quale superficie si tratta.<br />

Da x 2 + z 2 = 16 cos 2 u + 16 sin 2 u = 16 deduciamo che sezioni verticali parallele al piano<br />

xz, vale a <strong>di</strong>re per y costante, sono tutte circonferenze <strong>di</strong> raggio 4. Dal momento che<br />

l’equazione parametrica per y è proprio y = v, e v ∈ R, la superficie è un cilindro circolare<br />

<strong>di</strong> raggio 4 il cui asse è l’asse delle y (si veda Figura 6.1).<br />

Esempio<br />

Es. 6.1.2 Nell’esempio <strong>di</strong> prima, non c’erano limitazioni ai parametri u e v. Se invece<br />

poniamo delle limitazioni avremo una porzione <strong>di</strong> cilindro. Facciamo variare u in [0, π/4]<br />

e v in [0, 1]. In Figura 6.2 possiamo osservare la superficie che otteniamo.<br />

84


6.1. Superfici parametriche<br />

Figura 6.3: Rappresentazione delle coor<strong>di</strong>nate sferiche.<br />

Se una superficie parametrica S è data dalla funzione vettoriale ⃗r(u, v), è utile definire due<br />

famiglie <strong>di</strong> curve che si trovano sulla superficie: una famiglia <strong>di</strong> curve che si ha considerando<br />

u costante e l’altra che si ha considerando v costante. Queste due famiglie corrispondono a<br />

linee verticali e orizzontali nel piano uv.<br />

Prendendo u = u 0 , la funzione vettoriale ⃗r(u 0 , v) <strong>di</strong>venta una funzione vettoriale <strong>di</strong>pendente<br />

dal solo parametro v e definisce una curva γ 1 che giace sulla superficie S. Analogamente,<br />

per v = v 0 , si ha la curva γ 2 data da ⃗r(u, v 0 ) sulla superficie S.<br />

Le due curve prendono il nome <strong>di</strong> curve coor<strong>di</strong>nate o curve <strong>di</strong> griglia. I grafici che abbiamo<br />

fatto per visualizzare le superfici <strong>degli</strong> esempi precedenti mostrano queste curve coor<strong>di</strong>nate.<br />

6.1.1 Sistema <strong>di</strong> coor<strong>di</strong>nate sferiche<br />

Per visualizzare il grafico delle superfici, a volte è utile rappresentare le superfici in un<br />

sistema <strong>di</strong> coor<strong>di</strong>nate che non è quello cartesiano. Ve<strong>di</strong>amo nel dettaglio il sistema <strong>di</strong> coor<strong>di</strong>nate<br />

sferiche, dove un punto P che ha coor<strong>di</strong>nate (x, y, z) nello spazio cartesiano viene<br />

rappresentato in coor<strong>di</strong>nate sferiche me<strong>di</strong>ante (ρ, θ, φ) (si veda Figura 6.3): ρ rappresenta la<br />

<strong>di</strong>stanza del punto P dall’origine dello spazio cartesiano (ρ = √ x 2 + y 2 + z 2 ), θ rappresenta<br />

l’angolo che si ha tra la proiezione del punto P sul piano xy e l’asse positivo dell’asse x (in<br />

altri termini, è la coor<strong>di</strong>nata polare θ della proiezione <strong>di</strong> P sul piano xy), mentre φ è l’angolo<br />

tra l’asse positivo dell’asse z e il segmento OP . Quin<strong>di</strong> ρ ≥ 0 e 0 ≤ φ ≤ π. Questo sistema <strong>di</strong><br />

coor<strong>di</strong>nate è utile in presenza <strong>di</strong> simmetrie intorno all’origine.<br />

La relazione tra coor<strong>di</strong>nate cartesiane e coor<strong>di</strong>nate sferiche, tiene conto delle relazioni<br />

trigonometriche. In Figura 6.4 ve<strong>di</strong>amo i due triangoli rettangoli OP Q e OP P ′ . Il triangolo<br />

OP Q ha i lati OQ e OP <strong>di</strong> lunghezza z e ρ rispettivamente, e, per le relazioni sui lati e angoli<br />

<strong>di</strong> un triangolo rettangolo vale z = ρ cos φ. Il triangolo OP P ′ ha uno dei suoi cateti, in<strong>di</strong>cato<br />

con r, che è dato dalla proiezione <strong>di</strong> OP sul piano xy. Vale r = ρ sin φ. Le coor<strong>di</strong>nate x e y<br />

sono cateti del triangolo che si forma sul piano xy e che ha come ipotenusa proprio r, da cui<br />

x = r cos θ e y = r sin θ, vale a <strong>di</strong>re x = ρ sin φcosθ e y = ρ sin φ sin θ.<br />

Riassumendo, le coor<strong>di</strong>nate sferiche <strong>di</strong> P sono date da<br />

x = ρ sin φ cos θ, y = ρ sin φ sin θ, z = ρ cos φ<br />

Viceversa, considerando la formula della <strong>di</strong>stanza <strong>di</strong> un punto P dall’origine e sosituendo i<br />

85


6. SUPERFICI PARAMETRICHE<br />

Figura 6.4: Relazione tra coor<strong>di</strong>nate cartesiane e sferiche.<br />

Figura 6.5: Superficie sferica. Il grafico è fatto usando coor<strong>di</strong>nate cartesiane (a sinistra) e<br />

coor<strong>di</strong>nate sferiche (a destra).<br />

valori appena trovati si ricava:<br />

√<br />

x2 + y 2 + z 2 =<br />

√<br />

ρ 2 sin 2 φ cos 2 θ + ρ 2 sin 2 φ sin 2 θ + ρ 2 cos 2 φ = ρ<br />

Esempio<br />

Es. 6.1.3 L’equazione <strong>di</strong> una sfera <strong>di</strong> centro l’origine e raggio r è data da x 2 +y 2 +z 2 = r 2 .<br />

Possiamo descrivere la sfera usando equazioni parametriche del tipo<br />

x = x, y = y, z = ± √ r 2 − x 2 − y 2<br />

Osserviamo che abbiamo due funzioni per z. Usando queste equazioni e unendo i grafici,<br />

otteniamo la sfera che si vede in Figura 6.5 a sinistra: parti della sfera non sono rappresentate<br />

ma ci sono dei buchi, perchè x e y sono fatti variare in un dominio rettangolare e,<br />

in corrispondenza dei buchi abbiamo delle ra<strong>di</strong>ci quadrate <strong>di</strong> valori negativi! Se usiamo<br />

invece coor<strong>di</strong>nate sferiche, i punti hanno coor<strong>di</strong>nate con ρ = r, da cui,<br />

x = r sin φ cos θ, y = r sin φ sin θ, z = r cos φ, 0 ≤ φ ≤ π, 0 ≤ θ ≤ 2π<br />

86


6.2. Piano tangente a una superficie parametrica<br />

Il grafico della sfera usando le coor<strong>di</strong>nate sferiche è in Figura 6.5 a destra. Osserviamo<br />

come la superficie sia ben rappresentata. In questo caso le curve coor<strong>di</strong>nate<br />

per φ costante sono delle circonferenze <strong>di</strong> valore costante (che corrispondono ai noti<br />

paralleli che si stu<strong>di</strong>ano in geografia). Per θ costante abbiamo invece i meri<strong>di</strong>ani<br />

(semicirconferenze perchè 0 ≤ φ ≤ π) che collegano polo nord e polo sud.<br />

6.2 Piano tangente a una superficie parametrica<br />

Data una superficie parametrica S <strong>di</strong> equazione ⃗r(u, v) = (x(u, v), y(u, v), z(u, v)), vogliamo<br />

calcolare l’equazione del piano tangente alla superficie in un punto P 0 (x 0 , y 0 , z 0 ) che vi<br />

appartiene. Esiste quin<strong>di</strong> una coppia <strong>di</strong> valori (u 0 , v 0 ) tale che P 0 = ⃗r(u 0 , v 0 ).<br />

Per calcolare il piano tangente, facciamo questo tipo <strong>di</strong> ragionamento. Fissando u =<br />

u 0 , le equazioni parametriche della superficie <strong>di</strong>ventano ⃗r(u 0 , v) = (x(u 0 , v), y(u 0 , v), z(u 0 , v)):<br />

abbiamo una funzione vettoriale che <strong>di</strong>pende dalla sola variabile v e che definisce una curva<br />

parametrica γ 1 nello spazio R 3 . Questa curva giace sulla superficie S.<br />

Scriviamo le equazioni parametriche della retta tangente a questa curva (si veda pag. 80),<br />

considerando che quella che è la derivata della funzione x(u 0 , v) rispetto a v nel punto v = v 0<br />

altro non è che la derivata parziale della funzione x(u, v) rispetto a v nel punto (u 0 , v 0 ) (stesso<br />

<strong>di</strong>scorso vale per y e per z). Otteniamo<br />

retta ⃗ tv = (x 0 + t ∂x(u 0, v 0 )<br />

∂v<br />

, y 0 + t ∂y(u 0, v 0 )<br />

∂v<br />

, z 0 + t ∂z(u 0, v 0 )<br />

)<br />

∂v<br />

Abbiamo chiamato questa retta con retta ⃗ tv perchè è la retta tangente alla curva che <strong>di</strong>pende<br />

dalla variabile v poichè u = u 0 costante. Di conseguenza, la pendenza <strong>di</strong> questa retta, vale a<br />

<strong>di</strong>re, la tangente alla curva γ 1 nel punto x(u 0 , v 0 ), y(u 0 , v 0 ) è data dal vettore<br />

⃗r tv = ( ∂x(u 0, v 0 )<br />

∂v<br />

, ∂y(u 0, v 0 )<br />

∂v<br />

, ∂z(u 0, v 0 )<br />

)<br />

∂v<br />

Allo stesso modo, possiamo fissare v = v 0 e considerare che le equazioni parametriche della<br />

superficie, in questo caso, si riducono alle equazioni parametriche <strong>di</strong> una curva nello<br />

spazio R 3 che <strong>di</strong>pendono dalla variabile u. Analogamente, possiamo scrivere le equazioni<br />

parametriche della retta tangente a questa curva nel punto P 0 , ottenendo<br />

retta ⃗ tu = (x 0 + t ∂x(u 0, v 0 )<br />

∂u<br />

, y 0 + t ∂y(u 0, v 0 )<br />

∂u<br />

La pendenza <strong>di</strong> questa retta è data dal vettore<br />

⃗r tu = ( ∂x(u 0, v 0 )<br />

∂u<br />

, ∂y(u 0, v 0 )<br />

∂u<br />

, ∂z(u 0, v 0 )<br />

)<br />

∂u<br />

, z 0 + t ∂z(u 0, v 0 )<br />

)<br />

∂u<br />

Una volta ottenute queste due rette, il piano tangente alla superficie è il piano in<strong>di</strong>viduato<br />

dalle <strong>di</strong>rezioni <strong>di</strong> queste due rette, cioè dai due vettori ⃗r tu e ⃗r tv . Consideriamo dei brevi<br />

richiami sulle equazioni <strong>di</strong> un piano in R 3 .<br />

6.2.1 Equazione <strong>di</strong> un piano e vettore normale al piano<br />

Supponiamo <strong>di</strong> avere un punto P 0 = (x 0 , y 0 , z 0 ) su un piano nello spazio R 3 . Supponiamo<br />

<strong>di</strong> avere anche un vettore ⃗n che è normale a questo piano:<br />

Assumiamo <strong>di</strong> conoscere un altro generico punto P = (x, y, z) che giace sul piano.<br />

In<strong>di</strong>chiamo con ⃗r e ⃗r 0 i vettori che ci in<strong>di</strong>cano i due punti P e P 0 rispettivamente (si<br />

veda figura 6.6). Possiamo costruire il vettore ⃗r − ⃗r 0 che giace interamente nel piano. Per<br />

87


6. SUPERFICI PARAMETRICHE<br />

Figura 6.6: piano nello spazio<br />

semplicità, nella figura 6.6 abbiamo messo sul piano il vettore ⃗n (anche se esso potrebbe<br />

stare da tutt’altra parte). Ora, poichè ⃗n è ortogonale al piano, esso è ortogonale ad ogni<br />

vettore che giace nel piano. In particolare esso è ortogonale al vettore ⃗r − ⃗r 0 . Vale dunque:<br />

⃗n · (⃗r − ⃗r 0 ) = 0<br />

Se ⃗n è un vettore <strong>di</strong> componenti (a, b, c), poichè ⃗r − ⃗r 0 = (x − x 0 , y − y 0 , z − z 0 ), il prodotto<br />

scalare <strong>di</strong>venta<br />

a(x − x 0 ) + b(y − y 0 ) + c(z − z 0 ) = 0<br />

Questa è l’equazione scalare del piano. Spesso troviamo l’equazione scritta nella forma<br />

ax + by + cz = d dove d = ax 0 + by 0 + cz 0<br />

Osserviamo quin<strong>di</strong> che, data l’equazione <strong>di</strong> un piano possiamo ricavare facilmente un vettore<br />

normale al piano: esso è dato da ⃗n = (a, b, c).<br />

Ora, dati due vettori ⃗a e ⃗ b in R 3 , il prodotto vettoriale ⃗a × ⃗ b è un vettore che punta nella<br />

<strong>di</strong>rezione perpen<strong>di</strong>colare al piano in<strong>di</strong>viduato dai due vettori ⃗a e ⃗ b, mentre la sua lunghezza<br />

è data da<br />

|⃗a × ⃗ b| = |⃗a|| ⃗ b| sin θ<br />

dove θ è l’angolo compreso dai due vettori (0 ≤ θ ≤ π). Da questa formula deduciamo che<br />

se i due vettori sono paralleli allora il loro prodotto vettoriale è nullo e viceversa. Come<br />

interpretazione geometrica si ha che la lunghezza del prodotto vettoriale rappresenta l’area<br />

del parallelogramma in<strong>di</strong>viduato dai vettori ⃗a e ⃗ b. Per trovare le componenti del prodotto<br />

vettoriale si ha la formula legata al determinante della matrice che ha sulla prima riga i<br />

versori dell’asse delle x, delle y e delle z rispettivamente, sulla seconda riga le componenti<br />

del vettore ⃗a e sulla terza riga le componenti del vettore ⃗ b. Si calcola il determinante della<br />

matrice rispetto alla prima riga in modo da avere come risultato un vettore. Sia ⃗a = (a 1 , a 2 , a 3 )<br />

e ⃗ b = (b 1 , b 2 , b 3 ). I versori unitari dei tre assi siano dati da ⃗i, ⃗j, ⃗ k. Il prodotto vettoriale ⃗a × ⃗ b è<br />

dato da<br />

∣ ⃗a × ⃗ ⃗i ⃗j ⃗ k ∣∣∣∣∣ b =<br />

a 1 a 2 a 3 =⃗i<br />

∣ a ∣ 2 a 3∣∣∣<br />

− ⃗j<br />

∣<br />

b 2 b 3<br />

∣ a ∣ 1 a 3∣∣∣<br />

+<br />

b 1 b ⃗ k<br />

3<br />

∣ a ∣<br />

1 a 2∣∣∣<br />

b 1 b 2<br />

b 1 b 2 b 3<br />

88<br />

=⃗i(a 2 b 3 − b 2 a 3 ) − ⃗j(a 1 b 3 − b 1 a 3 ) + ⃗ k(a 1 b 2 − b 1 a 2 )<br />

= (a 2 b 3 − b 2 a 3 , b 1 a 3 − a 1 b 3 , a 1 b 2 − b 1 a 2 )


6.2. Piano tangente a una superficie parametrica<br />

Quin<strong>di</strong> se abbiamo due vettori ⃗a e ⃗ b che si trovano sul piano <strong>di</strong> cui vogliamo scrivere l’equazione,<br />

il loro prodotto vettoriale è il vettore normale al piano e può essere utilizzato per<br />

scrivere l’equazione del piano tangente.<br />

Tornando al piano tangente ad una superficie parametrica in un punto P 0 , poichè abbiamo<br />

trovato i due vettori tangenti ⃗r tu e ⃗r tv che si trovano sul piano tangente alla superficie,<br />

allora il piano tangente è in<strong>di</strong>viduato dal vettore ⃗n = ⃗r tu × ⃗r tv (i due vettori non devono essere<br />

tangenti tra loro).<br />

Esempio<br />

Es. 6.2.1 Sia data la superficie <strong>di</strong> equazioni parametriche<br />

x = 2u 2 , y = 3v 2 , z = 3u + 5v<br />

Vogliamo trovare l’equazione del piano tangente alla superficie nel punto P 0 (2, 3, 8).<br />

Notiamo che questo punto si ha per u = v = 1.<br />

Calcoliamo i due vettori tangenti ⃗r tu e ⃗r tv .<br />

Poichè<br />

∂x<br />

∂u = 4u,<br />

∂y<br />

∂u = 0,<br />

∂z<br />

∂u = 3<br />

valutando queste derivate in (1, 1) abbiamo<br />

⃗r tu = (4, 0, 3)<br />

Analogamente, poichè<br />

∂x<br />

∂v = 0,<br />

∂y<br />

∂v = 6v,<br />

∂z<br />

∂v = 5<br />

valutando queste derivate in (1, 1) abbiamo<br />

⃗r tv = (0, 6, 5)<br />

Il prodotto vettoriale è<br />

⃗i ⃗j ⃗ k<br />

⃗r tu × ⃗r tv =<br />

4 0 3<br />

∣0 6 5∣ = (−18) ⃗i − (12)⃗j + (24) ⃗ k = (−18, −12, 24)<br />

Quin<strong>di</strong> il piano tangente è dato da<br />

a(x − x 0 ) + b(y − y 0 ) + c(z − z 0 ) = 0<br />

dove (a, b, c) = (−18, −12, 24) e (x 0 , y 0 , z 0 ) = (2, 3, 8) = P 0 , da cui<br />

o ancora<br />

−18(x − 2) − 12(y − 3) + 24(z − 8) = 0<br />

−18x + 36 − 12y + 36 + 24z − 192 = 0 =⇒ 24z − 12y − 18x − 120 = 0 =⇒ 2z − y − 1.5x − 10 = 0<br />

89


CAPITOLO 7<br />

Integrali<br />

Compito della scienza non è<br />

aprire una porta all’infinito<br />

sapere, ma porre una barriera<br />

all’infinita ignoranza.<br />

Galileo Galilei (1564-1642)<br />

7.1 Integrali <strong>di</strong>pendenti da parametri . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91<br />

7.1.1 Integrali <strong>di</strong>pendenti da parametri per funzioni <strong>di</strong> una sola variabile . . . . 91<br />

7.1.2 Integrali <strong>di</strong>pendenti da parametri per funzioni <strong>di</strong> due variabili . . . . . . . 92<br />

7.2 Richiamo sugli integrali semplici . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93<br />

7.3 Integrali doppi su domini rettangolari . . . . . . . . . . . . . . . . . . . . . . . . . . 94<br />

7.4 Integrali iterati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96<br />

7.5 Integrali doppi su domini generali . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97<br />

7.6 Proprietà <strong>degli</strong> integrali doppi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101<br />

7.7 Cambiamento <strong>di</strong> variabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102<br />

7.7.1 Significato dello jacobiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103<br />

7.8 Area <strong>di</strong> un dominio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107<br />

7.9 Cenni su integrali tripli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108<br />

7.10Integrali curvilinei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109<br />

7.11Integrali <strong>di</strong> superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110<br />

7.11.1Area <strong>di</strong> una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110<br />

7.11.2Integrale <strong>di</strong> una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111<br />

7.12Soli<strong>di</strong> e superfici <strong>di</strong> rotazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113<br />

7.1 Integrali <strong>di</strong>pendenti da parametri<br />

Analizziamo brevemente gli integrali <strong>di</strong>pendenti da parametri, vedendo il caso in cui la<br />

funzione integranda <strong>di</strong>pende da una sola variabile e il caso in cui <strong>di</strong>pende da due variabili.<br />

7.1.1 Integrali <strong>di</strong>pendenti da parametri per funzioni <strong>di</strong> una sola variabile<br />

Se f : I −→ R con I ⊂ R è una funzione continua, fissato x 0 ∈ I si può definire la funzione<br />

F (x) =<br />

∫ x<br />

x 0<br />

f(t)dt<br />

Questa funzione prende il nome <strong>di</strong> funzione integrale della f <strong>di</strong> punto iniziale x 0 .<br />

91


7. INTEGRALI<br />

Proposizione 7.1.1 Se G è una primitiva della f (quin<strong>di</strong> G ′ = f) si ha<br />

F (x) =<br />

∫ x<br />

x 0<br />

f(t)dt = G(x) − G(x 0 )<br />

La funzione F è a sua volta una primitiva <strong>di</strong> f.<br />

Dimostrazione. Infatti F ′ (x) = d ( ∫ x<br />

dx<br />

x 0<br />

f(t)dt)<br />

= d(G(x) − g(x 0))<br />

= f(x). ✔<br />

dx<br />

7.1.2 Integrali <strong>di</strong>pendenti da parametri per funzioni <strong>di</strong> due variabili<br />

Se f : I −→ R con I ⊂ R 2 è una funzione continua, si può definire la funzione<br />

F (y 0 , y 1 , x) =<br />

∫ y1<br />

y 0<br />

f(x, y)dy<br />

Quin<strong>di</strong>, fissato un certo valore <strong>di</strong> x, calcoliamo l’integrale della funzione f(x, y), come funzione<br />

che <strong>di</strong>pende solo da y, per y 0 ≤ y ≤ y 1 . Al variare <strong>di</strong> x varia l’integrale. E l’integrale varia<br />

anche al variare <strong>di</strong> y 0 e y 1 , perciò è una funzione che <strong>di</strong>pende da tre variabili, y 0 , y 1 e x.<br />

La F è una funzione continua.<br />

Proposizione 7.1.2 Se f è continua, la F è derivabile rispetto a y 0 e y 1 e vale<br />

∂F<br />

∂y 1<br />

= f(x, y 1 )<br />

∂F<br />

∂y 0<br />

= −f(x, y 0 )<br />

Dimostrazione.<br />

La prima relazione segue dal fatto che, poichè stiamo facendo la derivata rispetto a y 1 (che<br />

è il secondo estremo dell’intervallo <strong>di</strong> integrazione), posso considerare la F come funzione<br />

integrale <strong>di</strong> una funzione <strong>di</strong>pendente da una sola variabile. In particolare, fissati x e y 0 ,<br />

considero la funzione g(y) = f(x, y) e<br />

F 1 (y 1 ) = F (y 0 , y 1 , x) =<br />

∫ y1<br />

y 0<br />

g(y)dy<br />

Mi riconduco dunque al caso visto prima, da cui F ′ 1(y 1 ) = g(y 1 ). Ma g(y 1 ) = f(x, y 1 ) e F ′ 1(y 1 )<br />

altro non è che la derivata della funzione F per y 0 e x fissati, quin<strong>di</strong> F ′ 1(y 1 ) = ∂F (y 0, y 1 , x)<br />

∂y 1<br />

Ricaviamo dunque<br />

∂F (y 0 , y 1 , x)<br />

∂y 1<br />

= f(x, y 1 )<br />

Per trovare la seconda formula che abbiamo scritto nella proposizione, basta ricordare<br />

che ∫ b<br />

a g(x)dx = − ∫ a<br />

g(x)dx da cui<br />

b<br />

∫ y1<br />

∫ y0<br />

f(x, y)dy = − f(x, y)dy<br />

y 0<br />

y 1<br />

92


7.2. Richiamo sugli integrali semplici<br />

Utilizzando questa formula e il risultato precendente, e scambiando il ruolo <strong>di</strong> y 0 e y 1<br />

troviamo che vale 1<br />

∂F (y 0 , y 1 , x)<br />

∂y 0<br />

= −f(x, y 0 )<br />

✔<br />

Si può pensare, della F <strong>di</strong> voler calcolare anche la derivata parziale rispetto alla x. In tal<br />

caso vale la relazione<br />

∫<br />

∂F<br />

y1<br />

∂x = ∂f(x, y)<br />

dy<br />

y 0<br />

∂x<br />

Valgono inoltre le seguenti proposizioni<br />

Proposizione 7.1.3 Se f è <strong>di</strong> classe C 1 anche F è <strong>di</strong> classe C 1 .<br />

Se si fa variare y in un certo intervallo definito da due funzioni <strong>di</strong>pendenti da x: α(x) ≤<br />

y ≤ β(x), con α e β funzioni <strong>di</strong> classe C 0 , possiamo definire la funzione<br />

F (x) =<br />

∫ β(x)<br />

α(x)<br />

f(x, y)dy<br />

Proposizione 7.1.4 Se le funzioni f, α e β sono <strong>di</strong> classe C 1 allora anche la funzione F (x) =<br />

∫ β(x)<br />

α(x) f(x, y)dy è <strong>di</strong> classe C1 e vale<br />

∫ β(x)<br />

F ′ (x) = f(x, β(x))β ′ (x) − f(x, α(x))α ′ (x) +<br />

α(x)<br />

Dimostrazione. Ve<strong>di</strong>amo F (x) = F (α(x), β(x), x).<br />

Allora, per la derivazione delle funzioni composte:<br />

F ′ (x) =<br />

∂F<br />

∂α(x) α′ (x) +<br />

∂F<br />

∂β(x) β′ (x) + ∂F<br />

∂x<br />

∂f(x, y)<br />

dy<br />

∂x<br />

Applicando i risultati già visti per ciascuna <strong>di</strong> queste derivate parziali, ritroviamo l’asserto.<br />

✔<br />

7.2 Richiamo sugli integrali semplici<br />

Prima <strong>di</strong> vedere cosa sono gli integrali multipli (doppi o tripli), rive<strong>di</strong>amo brevemente cosa<br />

è un integrale definito <strong>di</strong> una funzione che <strong>di</strong>pende da una sola variabile:<br />

∫ b<br />

a<br />

f(x)dx<br />

1 Possiamo pensare <strong>di</strong> riscrivere la F come F (y 0 , y 1 , x) = R y 1<br />

y f(x, y)dy = − R y 0<br />

0 y f(x, y)dy = −G(y<br />

1<br />

1 , y 0 , x) dove<br />

G(y 1 , y 0 , x) = R y 0<br />

y f(x, y)dy<br />

1<br />

Di G (avendo scambiato il ruolo <strong>di</strong> y 0 e y 1 ) sappiamo qual è la derivata rispetto a y 0 (secondo estremo <strong>di</strong><br />

integrazione):<br />

Allora<br />

∂G<br />

∂y 0<br />

= f(x, y 0 )<br />

∂F (y 0 , y 1 , x)<br />

∂y 0<br />

Ritroviamo dunque l’asserto.<br />

= − ∂G<br />

∂y 0<br />

= −f(x, y 0 )<br />

93


7. INTEGRALI<br />

Figura 7.1:<br />

Come si arriva alla definizione <strong>di</strong> ∫ b<br />

a f(x)dx.<br />

dove a ≤ x ≤ b. Per integrali <strong>di</strong> questo tipo, <strong>di</strong>ciamo che stiamo integrando la funzione f(x)<br />

nell’intervallo [a, b]. I punti a e b si <strong>di</strong>cono estremi dell’intervallo <strong>di</strong> integrazione.<br />

Il concetto <strong>di</strong> integrale <strong>di</strong> una funzione si deriva considerando l’area che si trova sotto la<br />

curva definita da y = f(x) nell’intervallo [a, b] (supponiamo per semplicità che la funzione f<br />

sia positiva, ma il concetto si generalizza a funzioni negative o che hanno valori sia positivi<br />

che negativi... il valore <strong>di</strong> un integrale può essere sia positivo che negativo, a seconda della<br />

funzione da integrare).<br />

Per calcolare l’area sottesa dalla funzione y = f(x) possiamo pensare <strong>di</strong> <strong>di</strong>videre l’intervallo<br />

[a, b] in n parti uguali, in modo da avere n sottointervalli <strong>di</strong> ampiezza ∆x. In ciascuno<br />

<strong>di</strong> questi sottointervalli scegliamo un punto x ∗ i (ad esempio il punto me<strong>di</strong>o <strong>di</strong> ciascuno dei<br />

sottointervalli) e consideriamo il rettangolo <strong>di</strong> ampiezza ∆x e altezza f(x ∗ i ) (si veda Figura<br />

7.1). Ciascuno <strong>di</strong> questi rettangoli ha area pari a f(x ∗ i )∆x, quin<strong>di</strong> l’integrale può essere<br />

approssimato me<strong>di</strong>ante la somma delle aree <strong>di</strong> ciascun rettangolo:<br />

∫ b<br />

a<br />

f(x)dx ≈ f(x ∗ 1)∆x + f(x ∗ 2)∆x + . . . + f(x ∗ n)∆x)<br />

Per ottenere l’area esatta della nostra funzione, facciamo il limite per n che tende<br />

all’infinito.<br />

∫ b<br />

a<br />

f(x)dx = lim<br />

n→∞<br />

i=1<br />

n∑<br />

f(x ∗ i )∆x<br />

7.3 Integrali doppi su domini rettangolari<br />

Ve<strong>di</strong>amo ora cosa accade se abbiamo una funzione <strong>di</strong> due variabili f(x, y). Se per funzioni<br />

<strong>di</strong> una sola variabile integriamo su un intervallo (un sottoinsieme <strong>di</strong> R), per funzioni <strong>di</strong> due<br />

variabili ha senso integrare su una regione <strong>di</strong> R 2 .<br />

Assumiamo <strong>di</strong> avere una regione <strong>di</strong> R 2 data dal rettangolo D = [a, b] × [c, d]. Ciò vuol <strong>di</strong>re<br />

che a ≤ x ≤ b mentre c ≤ y ≤ d.<br />

Sia, inoltre, f(x, y) ≥ 0 per ogni coppia <strong>di</strong> punti (x, y) ∈ D, anche se quanto <strong>di</strong>remo ora si<br />

può estendere al caso più generale <strong>di</strong> funzioni che assumono valori sia positivi che negativi.<br />

La domanda che ci poniamo è la seguente: qual è il volume della regione che si trova<br />

sotto il grafico della funzione f(x, y) e sopra il piano xy (si veda Figura 7.2)<br />

Per prima cosa cerchiamo <strong>di</strong> approssimare il volume (in maniera analoga a quanto abbiamo<br />

fatto per l’area nel caso <strong>di</strong> funzioni <strong>di</strong> una sola variabile). Per far ciò <strong>di</strong>vi<strong>di</strong>amo l’intervallo<br />

[a, b] in n parti uguali e l’intervallo [c, d] in m parti uguali, in modo da <strong>di</strong>videre D in tanti<br />

94


7.3. Integrali doppi su domini rettangolari<br />

Figura 7.2: Grafico <strong>di</strong> una funzione f(x, y) sul rettangolo D.<br />

Figura 7.3:<br />

Sud<strong>di</strong>visione del rettangolo D in tanti rettangolini.<br />

rettangolini (ne abbiamo n × m) e, in ciascuno <strong>di</strong> questi, scegliamo un punto <strong>di</strong> coor<strong>di</strong>nate<br />

(x ∗ i , y∗ j ) (si veda Figura 7.3).<br />

Su ciascuno <strong>di</strong> questi rettangolini, costruiamo una colonnina (un parallelogramma) <strong>di</strong><br />

altezza data da f(x ∗ i , y∗ j ). Ciascuno dei parallelogrammi ha un volume dato da f(x∗ i , y∗ j )∆x∆y.<br />

Approssiamo il volume V che si trova sotto il grafico della funzione f(x, y) sommando i<br />

volumi <strong>di</strong> ciascun parallelogramma<br />

V ≈<br />

n∑<br />

i=1 j=1<br />

m∑<br />

f(x ∗ i , yj ∗ )∆x∆y<br />

Prendendo sud<strong>di</strong>visioni lungo l’asse x e y via via più raffinate, facendo cioè tendere<br />

all’infinito n e m noi avremo una stima via via più accurata del volume V , vale a <strong>di</strong>re<br />

V =<br />

lim<br />

n∑<br />

n,m→∞<br />

i=1 j=1<br />

m∑<br />

f(x ∗ i , yj ∗ )∆x∆y<br />

A questo punto abbiamo la definizione <strong>di</strong> integrale doppio (si noti la somiglianza con la<br />

definizione data per integrale definito per funzioni <strong>di</strong> una singola variabile).<br />

95


7. INTEGRALI<br />

In<strong>di</strong>chiamo, infatti come integrale doppio della funzione f sul dominio dato dal rettangolo<br />

D proprio il volume V :<br />

∫∫<br />

D<br />

f(x, y)dA =<br />

lim<br />

7.4 Integrali iterati<br />

n∑<br />

n,m→∞<br />

i=1 j=1<br />

m∑<br />

f(x ∗ i , yj ∗ )∆x∆y.<br />

Supponiamo che f sia una funzione continua nel rettangolo D = [a, b]×[c, d]. Utilizziamo la<br />

notazione ∫ d<br />

f(x, y)dy per <strong>di</strong>re che x è costante e si integra la funzione rispetto alla variabile y<br />

c<br />

per y che varia da c a d. Una volta che abbiamo calcolato questo integrale, avremo un valore<br />

che <strong>di</strong>pende dal valore <strong>di</strong> x, quin<strong>di</strong> questo integrale definisce una funzione <strong>di</strong> x:<br />

A(x) =<br />

∫ d<br />

c<br />

f(x, y)dy<br />

Adesso integriamo A rispetto a x, per x che varia in [a, b], ottenendo<br />

∫ b ∫ [<br />

b ∫ ]<br />

d<br />

A(x)dx = f(x, y)dy dx<br />

a<br />

a<br />

c<br />

L’integrale scritto a destra dell’equazione precedente prende il nome <strong>di</strong> integrale iterato. Di<br />

solito non si mettono le parentesi ma si scrive <strong>di</strong>rettamente ∫ b ∫ d<br />

f(x, y)dydx: quin<strong>di</strong> prima<br />

a c<br />

integriamo rispetto a y da c a d e poi integriamo rispetto a x da a a b.<br />

Alla stessa maniera si può definire l’integrale iterato dato da<br />

∫ d ∫ b<br />

∫ [<br />

d ∫ ]<br />

b<br />

f(x, y)dxdy = f(x, y)dx dy<br />

c<br />

a<br />

c<br />

a<br />

In questo caso, prima integriamo rispetto alla variabile x da a a b e poi integriamo rispetto a<br />

y da c a d.<br />

Esempio<br />

Es. 7.4.1 Valutiamo ∫ 4 ∫ 3<br />

0 2 xy2 dydx.<br />

Dobbiamo prima integrare rispetto alla variabile y, considerando x costante, ottenendo<br />

∫ 3<br />

2<br />

xy 2 dy =<br />

] 3 [x y3<br />

3<br />

2<br />

= x 33<br />

3 − x23 3 = 19 3 x<br />

Il valore che abbiamo ottenuto corrisponde alla funzione A(x) introdotta prima.<br />

Integriamo questa funzione per x che varia da 0 a 4. Otteniamo<br />

∫ 4 ∫ 3<br />

0<br />

2<br />

xy 2 dydx =<br />

=<br />

∫ 4<br />

0<br />

∫ 4<br />

0<br />

[∫ 3<br />

2<br />

]<br />

xy 2 dy dx<br />

[<br />

19 19<br />

3 xdx = 3<br />

x 2 ] 4<br />

= 19<br />

2<br />

0<br />

3 8 = 152<br />

3<br />

96


7.5. Integrali doppi su domini generali<br />

Esempio<br />

Es. 7.4.2 Proviamo ora a calcolare ∫ 3 ∫ 4<br />

2 0 xy2 dxdy.<br />

Questa volta dobbiamo integrare prima rispetto a x e poi rispetto a y. Abbiamo<br />

∫ 3 ∫ 4<br />

2<br />

0<br />

xy 2 dxdy =<br />

∫ 3<br />

2<br />

∫ 3<br />

[∫ 4<br />

0<br />

]<br />

xy 2 dx dy<br />

[ ] x<br />

2 4<br />

=<br />

2 2 y2 dy<br />

0<br />

∫ 3<br />

] 3<br />

= 8y 2 dy =<br />

[8 y3<br />

2<br />

3<br />

2<br />

= 8( 33<br />

3 − 23<br />

3 ) = 152<br />

3<br />

Osserviamo come abbiamo ottenuto lo stesso risultato scambiando l’or<strong>di</strong>ne <strong>di</strong><br />

integrazione. Si ha infatti il seguente teorema.<br />

Teorema 7.4.1 (<strong>di</strong> Fubini) Se f(x, y) è una funzione continua su D = [a, b] × [c, d] allora:<br />

o,<br />

∫∫<br />

f(x, y)dA =<br />

∫ b ∫ d<br />

f(x, y)dydx =<br />

∫ d ∫ b<br />

D<br />

a c<br />

c a<br />

∫∫<br />

f(x, y)dA =<br />

∫ b<br />

( ∫ )<br />

d<br />

f(x, y)dy dx =<br />

∫ d<br />

D<br />

a c<br />

c a<br />

f(x, y)dxdy<br />

( ∫ )<br />

b<br />

f(x, y)dx dy<br />

Quin<strong>di</strong> abbiamo due strade equivalenti per calcolare un integrale doppio <strong>di</strong> una funzione<br />

continua su un dominio rettangolare, riconducendoci a integrali <strong>di</strong> una sola variabile che<br />

sappiamo calcolare. Riassumendo:<br />

G nel primo caso<br />

∫∫<br />

∫ b ∫ d<br />

∫ (<br />

b ∫ )<br />

d<br />

f(x, y)dA = f(x, y)dydx = f(x, y)dy dx<br />

D<br />

a<br />

c<br />

a<br />

noi prima calcoliamo l’integrale che sta all’interno (tra parentesi tonde), vale a <strong>di</strong>re,<br />

∫ d<br />

f(x, y)dy considerando x come una costante e integrando rispetto alla variabile y. Come<br />

risultato avremo una funzione che <strong>di</strong>pende solo da x e sarà questa che poi andremo<br />

c<br />

a integrare tra a e b rispetto alla variabile x;<br />

G nel secondo caso<br />

∫∫<br />

∫ d ∫ b<br />

∫ (<br />

d ∫ )<br />

b<br />

f(x, y)dA = f(x, y)dxdy = f(x, y)dx dy<br />

D<br />

c<br />

a<br />

c<br />

an<strong>di</strong>amo prima a calcolare l’integrale ∫ b<br />

f(x, y)dx rispetto a x, considerando y come una<br />

a<br />

costante e poi andremo a integrare il risultato ottenuto rispetto a y nell’intervallo [c, d].<br />

7.5 Integrali doppi su domini generali<br />

A <strong>di</strong>fferenza <strong>degli</strong> integrali <strong>di</strong> funzioni <strong>di</strong> una sola variabile, in cui il dominio <strong>di</strong> integrazione<br />

è sempre un intervallo, per integrali <strong>di</strong> funzioni <strong>di</strong> due variabili, il dominio <strong>di</strong> integrazione<br />

c<br />

a<br />

97


7. INTEGRALI<br />

Figura 7.4:<br />

Dominio normale rispetto all’asse x (sinistra) e rispetto all’asse y (destra).<br />

non si riduce ad un rettangolo ma può avere una forma più generale. Consideriamo il caso<br />

in cui il dominio <strong>di</strong> integrazione sia un insieme limitato D (perciò esiste un rettangolo R che<br />

lo contiene).<br />

In tal caso l’integrale <strong>di</strong> una funzione f(x, y) sul dominio R si può ricondurre all’integrale<br />

<strong>di</strong> una funzione F (x, y) sul rettangolo R così definita:<br />

{<br />

f(x, y) se (x, y) appartiene a D<br />

F (x, y) =<br />

0 se (x, y) appartiene a R ma non a D<br />

Allora<br />

∫∫<br />

D<br />

∫∫<br />

f(x, y)dA =<br />

R<br />

F (x, y)dA<br />

Da un punto <strong>di</strong> vista pratico, come calcolare questo integrale La frontiera dell’insieme<br />

D deve potersi esprimere me<strong>di</strong>ante funzioni continue <strong>di</strong> x o <strong>di</strong> y. Ci sono due casi da<br />

considerare (si vedano Figure 7.4 e 7.5 per <strong>degli</strong> esempi)<br />

1. Caso 1: l’insieme D è dato da<br />

{<br />

}<br />

D = (x, y) ∈ R 2 t. c. a ≤ x ≤ b, g 1 (x) ≤ y ≤ g 2 (x)<br />

Si <strong>di</strong>ce che il dominio è normale rispetto all’asse x.<br />

2. Caso 2: l’insieme D è dato da<br />

{<br />

}<br />

D = (x, y) ∈ R 2 t. c. h 1 (y) ≤ x ≤ h 2 (y), c ≤ y ≤ d<br />

Si <strong>di</strong>ce che il dominio è normale rispetto all’asse y.<br />

Se il dominio è normale rispetto all’asse x, vuol <strong>di</strong>re che prendendo una retta x = x 0<br />

con a ≤ x 0 ≤ b, (normale dunque all’asse x), i valori <strong>di</strong> y che sono compresi tra g 1 (x 0 ) e<br />

g 2 (x 0 ) giacciono tutti all’interno del dominio <strong>di</strong> integrazione. Analogamente, nel caso in cui<br />

il dominio sia normale rispetto all’asse y, prendendo la retta y = y 0 normale all’asse y, con<br />

c ≤ y 0 ≤ d, si ha che tutti i punti <strong>di</strong> or<strong>di</strong>nata y 0 e <strong>di</strong> ascissa compresa tra h 1 (y 0 ) e h 2 (y 0 ) sono<br />

all’interno del dominio <strong>di</strong> integrazione.<br />

In questi casi, il teorema <strong>di</strong> Fubini applicato al rettangolo R in cui uno dei due lati<br />

corrisponde con l’intervallo [a, b] o [c, d] a seconda che il dominio sia normale rispetto all’asse<br />

x o y, si riduce ad un integrale iterato in cui gli estremi dell’integrale interno (da calcolare<br />

per primo) sono dati proprio dalle due funzioni g 1 , g 2 , o h 1 , h 2 che delimitano la frontiera <strong>di</strong><br />

D, in quanto all’esterno la funzione F è nulla. Si ha il seguente teorema.<br />

Teorema 7.5.1 (<strong>di</strong> Fubini) Data una funzione f(x, y) da integrare su un dominio D,<br />

98


7.5. Integrali doppi su domini generali<br />

}<br />

Figura 7.5: A sinitra: D =<br />

{(x, y) ∈ R 2 : 1 ≤ y ≤ 2, y ≤ x ≤ y 3 . Il dominio è normale rispetto<br />

{<br />

all’asse y. A destra: D = (x, y) ∈ R 2 : 0 ≤ x ≤ 1, x 3 ≤ y ≤ √ }<br />

x . Il dominio è normale rispetto<br />

all’asse x.<br />

Figura 7.6: Dominio dato dal triangolo <strong>di</strong> vertici (0, 3), (1, 1) e (5, 3)<br />

G nel caso in cui il dominio <strong>di</strong> integrazione è normale rispetto all’asse x (Caso 1) si ha:<br />

∫∫<br />

∫ b ∫ g2(x)<br />

f(x, y)dA = f(x, y)dydx<br />

D<br />

a<br />

g 1(x)<br />

G nel caso in cui il dominio <strong>di</strong> integrazione è normale rispetto all’asse y (Caso 2) si ha:<br />

∫∫<br />

∫ d ∫ h2(y)<br />

f(x, y)dA =<br />

f(x, y)dxdy<br />

D<br />

c<br />

h 1(y)<br />

Esaminiamo il Caso 1 (il <strong>di</strong>scorso si ripete analogo per il Caso 2). Noi calcoliamo prima<br />

l’integrale interno ∫ g 2(x)<br />

g 1(x)<br />

f(x, y)dy considerando x come costante, rispetto alla variabile y. Il<br />

risultato ora <strong>di</strong>pende da x in quanto gli estremi <strong>di</strong> integrazione sono funzioni <strong>di</strong> x. Una volta<br />

ottenuto questo integrale, integriamo il risultato rispetto alla variabile x con estremi a e b.<br />

A volte, un dominio può essere considerato normale sia rispetto all’asse x sia rispetto<br />

all’asse y. Altre volte può essere visto come unione <strong>di</strong> due domini. A seconda dell’integrale<br />

che si deve fare, conviene scegliere <strong>di</strong> vederlo in un modo piuttosto che in un altro.<br />

99


7. INTEGRALI<br />

Esempio<br />

Es. 7.5.1 Nel caso del triangolo mostrato in Figura 7.6, il dominio può essere visto come<br />

l’unione <strong>di</strong> due domini normali rispetto all’asse x, oppure come un dominio normale<br />

rispetto all’asse y.<br />

Nel primo caso, D = D 1 ∪ D 2 , in quanto la funzione g 1 (x) varia a seconda <strong>di</strong> dove si trovi<br />

x:<br />

D 1 = {(x, y) t.c. 0 ≤ x ≤ 1, −2x + 3 ≤ y ≤ 3}<br />

{<br />

1<br />

D 2 = (x, y) t.c. 1 ≤ x ≤ 5,<br />

2 x + 1 }<br />

2 ≤ y ≤ 3<br />

Se riscriviamo le equazioni delle due rette y = −2x + 3 e y = 1 2 x + 1 2<br />

in funzione <strong>di</strong> x<br />

otteniamo, dalla prima, x = − 1 2 y + 3 , e dalla seconda x = 2y − 1, e possiamo scrivere<br />

2<br />

l’insieme D come<br />

D =<br />

{(x, y) t.c. − 1 2 y + 3 }<br />

2 ≤ x ≤ 2y − 1, 1 ≤ y ≤ 3<br />

Esempio<br />

Es. 7.5.2 Calcoliamo ∫∫ D x2 dA dove D è l’insieme delimitato dalle parabole y = 3x 2 e<br />

y = x 2 + 2. Prima <strong>di</strong> tutta facciamo un grafico dell’insieme D (si veda Figura 7.7). I punti<br />

<strong>di</strong> intersezione delle due parabole si hanno per 3x 2 = x 2 + 2 cioè 2x 2 − 2 = vale a <strong>di</strong>re per<br />

x = ±1. Si vede facilmente che il dominio è normale rispetto all’asse x: basta considerare<br />

−1 ≤ x ≤ 1 e 3x 2 ≤ y ≤ x 2 + 2. Infatti la curva che delimita la porzione inferiore della<br />

frontiera dell’insieme è data da y = 3x 2 mentre la porzione superiore della frontiera è<br />

y = x 2 + 2. L’integrale <strong>di</strong>venta<br />

∫∫<br />

D<br />

x 2 ydA =<br />

=<br />

=<br />

=<br />

∫ 1 ∫ x 2 +2<br />

−1<br />

∫ 1<br />

−1<br />

∫ 1<br />

−1<br />

∫ 1<br />

−1<br />

3x 2<br />

x 2 dydx<br />

[<br />

x 2 y ] y=x 2 +2<br />

y=3x 2<br />

x 2 (x 2 + 2 − 3x 2 )dx<br />

2x 2 − 2x 4 dx =<br />

] 1 [2 x3<br />

3 − 2x5 = 2 2 5<br />

−1<br />

3 − 22 5 = 8 15<br />

Esempio<br />

Es. 7.5.3 Sia da calcolare l’integrale ∫ 1 ∫ 1<br />

0 y sin x2 dxdy. Se cerchiamo <strong>di</strong> valutare l’integrale<br />

così come ci è stato presentato, abbiamo la <strong>di</strong>fficoltà <strong>di</strong> dover valutare ∫ sin x 2 dx.<br />

Si tratta, infatti, <strong>di</strong> uno <strong>di</strong> quegli integrali impossibili da valutare me<strong>di</strong>ante funzioni elementari!<br />

Ci conviene allora cambiare l’or<strong>di</strong>ne <strong>di</strong> integrazione. Cerchiamo allora <strong>di</strong> capire<br />

come { è fatto il dominio <strong>di</strong> integrazione } D. Da come è scritto l’integrale, risulta<br />

D = (x, y) ∈ R 2 : 0 ≤ y ≤ 1, y ≤ x ≤ 1 . Facciamo il grafico (si veda Figura 7.8). Questo<br />

dominio lo possiamo vedere come normale rispetto all’asse x prendendo 0 ≤ x ≤ 1 e<br />

0 ≤ y ≤ x.<br />

100


7.6. Proprietà <strong>degli</strong> integrali doppi<br />

Figura 7.7: Dominio <strong>di</strong> integrazione delimitato dalle parabole y = 3x 2 e y = x ∗ 2 + 2.<br />

Figura 7.8: Dominio <strong>di</strong> integrazione dell’integrale ∫ 1 ∫ 1<br />

0 y sin x2 dxdy.<br />

Quin<strong>di</strong><br />

∫ 1 ∫ 1<br />

0<br />

y<br />

∫∫<br />

sin x 2 dxdy =<br />

=<br />

=<br />

= 1 2<br />

D<br />

∫ 1 ∫ x<br />

0<br />

∫ 1<br />

sin x 2 dA<br />

0<br />

0<br />

∫ 1<br />

sin x 2 dydx =<br />

x sin x 2 dx = 1 2<br />

0<br />

∫ 1<br />

0<br />

∫ 1<br />

d(x 2 )<br />

dx sin x2 dx = 1 2<br />

0<br />

[<br />

y sin x<br />

2 ] y=x<br />

y=0 dx<br />

2x sin x 2 dx<br />

[<br />

− cos x<br />

2 ] 1<br />

0 = 1 (1 − cos 1)<br />

2<br />

7.6 Proprietà <strong>degli</strong> integrali doppi<br />

Assumendo che i seguenti integrali esistano, ve<strong>di</strong>amone brevemente alcune proprietà:<br />

G ∫∫ D (f(x, y) + g(x, y)) dA = ∫∫ D f(x, y)dA + ∫∫ D g(x, y)dA 101


7. INTEGRALI<br />

Figura 7.9: Esempio <strong>di</strong> trasformazione globalmente invertibile dall’insieme S del piano uv<br />

all’insieme R del piano xy.<br />

G ∫∫ D cf(x, y)dA = c ∫∫ f(x, y)dA, essendo c una costante.<br />

D<br />

G Se f(x, y) ≥ g(x, y) per tutti i punti (x, y) in D, allora ∫∫ D f(x, y)dA ≥ ∫∫ g(x, y)dA.<br />

D<br />

G Se D = D 1 ∪ D 2 , dove D 1 e D 2 sono domini che non si sovrappongono ma possono avere<br />

al più solo punti della frontiera in comune, allora<br />

∫∫<br />

f(x, y)dA =<br />

D<br />

∫∫<br />

f(x, y)dA +<br />

D 1<br />

∫∫<br />

f(x, y)dA<br />

D 2<br />

G Considerando la funzione <strong>di</strong> valore costante 1 si ha<br />

∫∫<br />

1dA = area(D)<br />

D<br />

dove area(D) è l’area dell’insieme D (torneremo su questo punto più avanti).<br />

G Se m ≤ f(x, y) ≤ M per tutti i punti (x, y) in D, allora<br />

∫∫<br />

m area(D) ≤ f(x, y)dA ≤ M area(D)<br />

7.7 Cambiamento <strong>di</strong> variabili<br />

D<br />

A volte, il calcolo <strong>di</strong> un integrale si può semplificare operando un cambiamento <strong>di</strong> variabili.<br />

A tale scopo, per il calcolo <strong>di</strong> integrali doppi, consideriamo un cambiamento <strong>di</strong><br />

variabili dato da una trasformazione T che permette <strong>di</strong> passare dal piano uv al piano xy:<br />

T (u, v) = (x, y) dove x e y sono legate a u e v me<strong>di</strong>ante equazioni del tipo<br />

x = x(u, v), y = y(u, v)<br />

Questa trasformazione può essere vista come una funzione vettoriale ⃗r = (x(u, v), y(u, v)).<br />

L’ipotesi fondamentale, allo scopo <strong>di</strong> calcolare un integrale doppio, è che la trasformazione<br />

ci permetta <strong>di</strong> ottenere tutti i punti del dominio <strong>di</strong> integrazione.<br />

Una trasformazione T è dunque una funzione in cui sia il dominio che il codominio sono<br />

sottoinsiemi <strong>di</strong> R 2 . Se T (u 1 , v 1 ) = (x 1 , y 1 ) allora il punto (x 1 , y 1 ) è l’immagine del punto (u 1 , v 1 )<br />

me<strong>di</strong>ante la trasformazione. Se la trasformazione è una corrispondenza biunivoca tra l’insieme<br />

<strong>di</strong> definizione e il codominio della trasformazione, allora si può definire la trasformazione<br />

inversa T −1 e si <strong>di</strong>ce che la trasformazione è globalmente invertibile (si veda Figura 7.9).<br />

Definizione 7.7.1 Una trasformazione x = x(u, v) y = y(u, v) definita in un insieme aperto <strong>di</strong><br />

R 2 si <strong>di</strong>ce regolare se<br />

1. è <strong>di</strong> classe C 1<br />

2. è globalmente invertibile<br />

102


7.7. Cambiamento <strong>di</strong> variabili<br />

Figura 7.10: Trasformazione dell’elemento S nel piano uv nell’elemento R nel piano xy.<br />

3. in ogni punto (u, v) lo jacobiano risulta <strong>di</strong>verso da zero 2<br />

∣ ∣∣∣∣∣∣∣∣ ∂x<br />

∂(x, y)<br />

∣∂(u, v) ∣ = ∂u<br />

∂y<br />

∂u<br />

∂x<br />

∂v<br />

= ∂x ∂y<br />

∂y<br />

∂u ∂v − ∂y ∂x<br />

∂u ∂v ≠ 0<br />

∣<br />

∂v<br />

Un esempio <strong>di</strong> trasformazione regolare è dato dalle coor<strong>di</strong>nate polari<br />

x = x(ρ, θ) = ρ cos (θ) y = y(ρ, θ) = ρ sin (θ) con ρ > 0 e 0 ≤ θ ≤ 2π.<br />

Cerchiamo <strong>di</strong> capire, ora, come un cambiamento <strong>di</strong> variabili agisca sul calcolo <strong>di</strong> un<br />

integrale doppio. Ricor<strong>di</strong>amo che, nel caso <strong>di</strong> un integrale <strong>di</strong> una funzione scalare il cambiamento<br />

<strong>di</strong> variabile porta alla tecnica della sostituzione: data una funzione f(x) da integrare<br />

in [a, b] si ha<br />

∫ b<br />

a<br />

f(x)dx =<br />

∫ d<br />

c<br />

f(g(u))g ′ (u)du<br />

dove x = g(u), a = g(c), b = g(d). Nel caso <strong>di</strong> funzioni <strong>di</strong> due variabili, cosa si fa e per quale<br />

motivo<br />

7.7.1 Significato dello jacobiano<br />

Consideriamo un rettangolino S nel piano uv il cui angolo in basso a sinistra è dato dal<br />

punto (u 0 , v 0 ), e <strong>di</strong> <strong>di</strong>mensioni ∆u e ∆v. L’immagine della regione S attraverso la trasformazione<br />

regolare T sia la regione R del piano xy. Uno dei punti della frontiera sia proprio<br />

l’immagine del punto (u 0 , v 0 ), cioè (x 0 , y 0 ) = T (u 0 , v 0 ). Si veda la Figura 7.10.<br />

La trasformazione T sia data me<strong>di</strong>ante due equazioni parametriche del tipo x = x(u, v) e<br />

y = y(u, v) che possiamo vedere come una funzione vettoriale ⃗r(u, v) = (x(u, v), y(u, v)). Il lato<br />

del rettangolino <strong>di</strong> S che si ha per v = v 0 viene trasformato in R me<strong>di</strong>ante la curva ⃗r(u, v 0 )<br />

(che <strong>di</strong>pende ora solo dal parametro u). Di questa curva il vettore tangente in u = u 0 (quin<strong>di</strong><br />

al punto (x 0 , y 0 )) è dato da ⃗r tu = ( ∂x(u 0, v 0 )<br />

, ∂y(u 0, v 0 )<br />

).<br />

∂u ∂u<br />

Alla stessa maniera, troviamo che il vettore tangente alla curva ⃗r(u 0 , v) nel punto v = v 0 è<br />

dato da ⃗r tv = ( ∂x(u 0, v 0 )<br />

, ∂y(u 0, v 0 )<br />

).<br />

∂v ∂v<br />

2 Si rimanda alla definizione 4.7.1 per ricordare cosa è lo jacobiano.<br />

103


7. INTEGRALI<br />

Figura 7.11: Approssimazione <strong>di</strong> R me<strong>di</strong>ante i vettori secanti.<br />

La regione R = T (S) può essere approssimata dal parallelogramma dato dai vettori secanti<br />

(si veda Figura 7.11) dati da<br />

⃗a = ⃗r(u 0 + ∆u, v 0 ) − ⃗r(u 0 , v 0 ) ⃗ b = ⃗r(u0 , v 0 + ∆v) − ⃗r(u 0 , v 0 )<br />

Ricordando che ∂⃗r(u 0, v 0 )<br />

⃗r(u 0 + ∆u, v 0 ) − ⃗r(u 0 , v 0 )<br />

= lim ∆u→0 , e ricordando che la derivata<br />

∂u<br />

∆u<br />

parziale <strong>di</strong> una funzione vettoriale è data dalle derivate parziali delle singole componenti<br />

della funzione vettoriale, ricaviamo l’approssimazione<br />

⃗a = ⃗r(u 0 + ∆u, v 0 ) − ⃗r(u 0 , v 0 ) ≈ ∆u ∂⃗r<br />

∂u<br />

ma, per quanto detto prima, ∂⃗r<br />

∂u = ⃗r tu, da cui<br />

⃗a = ⃗r(u 0 + ∆u, v 0 ) − ⃗r(u 0 , v 0 ) ≈ ∆u⃗r tu .<br />

Con analogo ragionamento arriviamo all’approssimazione<br />

⃗ b = ⃗r(u0 , v 0 + ∆v) − ⃗r(u 0 , v 0 ) ≈ ∆v⃗r tv .<br />

Quin<strong>di</strong> l’area della regione R può essere approssimata attraverso dall’area del parallelogramma<br />

<strong>di</strong> lati ⃗a e ⃗ b cioè ∆u⃗r tu e ∆v⃗r tv . L’area del parallelogramma determinato da due vettori<br />

è dato dal modulo del prodotto vettoriale dei due vettori stessi. Quin<strong>di</strong> l’area <strong>di</strong> R si può<br />

approssimare tramite |(∆u⃗r tu ) × (∆v⃗r tv )|. Si ha, quin<strong>di</strong>,<br />

area(R) ≈ |⃗a × ⃗ b| = |(∆u⃗r tu ) × (∆v⃗r tv )| = |⃗r tu × ⃗r tv |∆u∆v<br />

Calcoliamo il prodotto vettoriale<br />

⃗i ⃗j ⃗ k<br />

∂x ∂y<br />

⃗r tu × ⃗r tv =<br />

∂u ∂u 0<br />

∂x ∂y<br />

∣ 0∣<br />

∂v ∂v<br />

I sottodeterminanti delle componenti rispetto a x e a y sono nulli, da cui<br />

∂x ∂y<br />

⃗r tu × ⃗r tv = ⃗ ∂u ∂u<br />

k<br />

= ∂x ∂y<br />

⃗ k( ∂x ∂y<br />

∂u ∂v − ∂x ∂y<br />

∂v ∂u )<br />

∣ ∣<br />

∂v ∂v<br />

104


7.7. Cambiamento <strong>di</strong> variabili<br />

Figura 7.12: Cambio <strong>di</strong> variabili per il calcolo <strong>di</strong> integrali doppi: trasformazione della regione<br />

S nella regione R me<strong>di</strong>ante la trasformazione regolare T .<br />

Ritroviamo lo jacobiano delle due funzioni x e y rispetto a u e v:<br />

∂(x, y)<br />

∣∂(u, v) ∣ . Perciò, area(R) ≈<br />

∂(x, y)<br />

∣∂(u, v) ∣ ∆u∆v.<br />

∫∫ Supponiamo, ora, <strong>di</strong> dover calcolare l’integrale <strong>di</strong> una funzione f(x, y) su un dominio R<br />

f(x, y)dA. Sia data una trasformazione regolare che trasforma un insieme S del piano uv<br />

R<br />

nella regione R. Sud<strong>di</strong>vi<strong>di</strong>amo il dominio R in elementini R ij , ciascuno dei quali è immagine<br />

<strong>di</strong> un rettangolino S ij <strong>di</strong> S. Su ciascuno <strong>di</strong> questi elementini R ij consideriamo un punto <strong>di</strong><br />

coor<strong>di</strong>nate (x i , y j ) che è immagine, me<strong>di</strong>ante la trasformazione T , del punto (u i , v j ) che si<br />

trova sull’angolo in basso a sinistra del rettangolino S ij (si veda la Figura 7.12). Allora l’area<br />

∆R ij può essere approssimata me<strong>di</strong>ante la relazione<br />

∆R ij ≈<br />

∂(x, y)<br />

∣∂(u, v) ∣ ∆u∆v<br />

dove ∆u e ∆v sono i lati del rettangolino S ij , mentre lo jacobiano è valutato in (u i , v j ). Allora<br />

∫∫<br />

m∑ n∑<br />

f(x, y)dA ≈ f(x i , y j )∆R ij<br />

R<br />

≈<br />

i=1 j=1<br />

m∑<br />

i=1 j=1<br />

n∑<br />

f(x(u i , v j ), y(u i , v j ))<br />

∂(x, y)<br />

∣∂(u, v) ∣ ∆u∆v<br />

A questo punto osserviamo che<br />

m∑ n∑<br />

∫∫<br />

f(x(u i , v j ), y(u i , v j ))<br />

∂(x, y)<br />

∣∂(u, v) ∣ ∆u∆v ≈<br />

i=1 j=1<br />

S<br />

f(x(u, v), y(u, v)<br />

∂(x, y)<br />

∣∂(u, v) ∣ dudv<br />

Si arriva perciò al seguente teorema (che non <strong>di</strong>mostriamo, però tutti i <strong>di</strong>scorsi appena<br />

fatti ci portano a intuire che il risultato non può che essere così!).<br />

Teorema 7.7.1 Sia data una trasformazione regolare T della regione S del piano uv alla regione<br />

R del piano xy. Inoltre sia assegnata una funzione f continua in R. Supponiamo che le<br />

regioni R e S siano domini normali rispetto all’asse x o y. Allora<br />

∫∫<br />

∫∫<br />

f(x, y)dA = f(x(u, v), y(u, v)<br />

∂(x, y)<br />

∣<br />

∣∂(u, v)<br />

R<br />

S<br />

∣ dudv 105


7. INTEGRALI<br />

Figura 7.13: Aree corrispondenti nel piano θρ e nel piano xy.<br />

Figura 7.14: Insiemi S e R per il calcolo dell’integrale ∫∫ 4x + 8ydA.<br />

R<br />

Esempio<br />

Es. 7.7.1 Consideriamo il caso della trasformazione data dalle coor<strong>di</strong>nate polari, per cui<br />

x(ρ, θ) = ρ cos (θ) e y(ρ, θ) = ρ sin (θ).<br />

Il rettangolino ∆θ∆ρ viene trasformato in una specie <strong>di</strong> rettangolino con i lati curvi.<br />

Il <strong>di</strong>segno mostrato in figura 7.13 è stato realizzato facendo variare θ nell’intervallino<br />

[ 2π 3 , 2π + 0.5] e ρ in [0.5, 0.75].<br />

3<br />

Lo jacobiano <strong>di</strong> questa trasformazione è dato da<br />

∣ ∂(x, y)<br />

∣∣∣ ∣ ∂(ρ, θ) ∣ = cos (θ) −ρ sin (θ)<br />

sin (θ) ρ cos (θ) ∣ = ρ cos2 (θ) + ρ sin 2 (θ) = ρ<br />

Perciò, se facciamo un cambiamento <strong>di</strong> variabili utilizzando coor<strong>di</strong>nate polari si ha:<br />

∫∫<br />

∫∫<br />

f(x, y)dA = f(ρ cos (θ), ρ sin (θ))ρ dρdθ<br />

R<br />

S<br />

106


7.8. Area <strong>di</strong> un dominio<br />

Esempio<br />

Es. 7.7.2 Sia da calcolare ∫∫ 4x + 8ydA dove R è il parallelogramma <strong>di</strong> vertici A(−1, 3),<br />

R<br />

B(1, −3), C(3, −1) e D(1, 5). Si applichi la trasformazione x = 1 4 (u + v), y = 1 (v − 4u).<br />

4<br />

Il parallelogramma R è rappresentato in Figura 7.14. Se scriviamo le equazioni dei lati del<br />

parallelogramma si trova facilmente che la retta per AB è data dall’equazione y + 3x = 0,<br />

la retta per CD è data da y + 3x = 8, la retta per BC è x − y = 4 e infine quella per AD è<br />

x − y = −4.<br />

Da queste relazioni, si vede che ponendo u = x−y e v = y +3x, si ricava la trasformazione<br />

assegnata x = 1 4 (u + v), y = 1 (v − 4u). Inoltre si vede che R è l’immagine del rettangolo S<br />

4<br />

delimitato dalle linee u = 4, u = −4, v = 0 e v = 8.<br />

Se calcoliamo lo jacobiano delle funzioni x e y rispetto a u e v otteniamo<br />

Allora<br />

∫∫<br />

∣ ∣∣∣∣∣∣∣ 1<br />

∂(x, y)<br />

∣∂(u, v) ∣ = 4<br />

1<br />

4<br />

R<br />

−3<br />

4<br />

1<br />

4<br />

∫∫<br />

4x + 8ydA =<br />

= 1 4<br />

= 1 4<br />

= 1 4<br />

∣<br />

(4 1 4 (u + v) + 81 4 (v − 3u) ) 1<br />

4 dudv = ∫∫<br />

S<br />

∫ 4 ∫ 8<br />

−4<br />

∫ 4<br />

0<br />

(3v − 5u)dvdu = 1 4<br />

−4(96 − 40u)du = 1 4<br />

∫ 4<br />

−4<br />

S<br />

[ 3<br />

2 v2 − 5uv] v=8<br />

[<br />

96u − 20u<br />

2 ] u=4<br />

u=−4 = 192<br />

(u + v + 2v − 6u) 1 4 dudv<br />

du<br />

v=0<br />

7.8 Area <strong>di</strong> un dominio<br />

Dagli integrali doppi si può ricavare un’altra considerazione geometrica, sull’area del<br />

dominio <strong>di</strong> integrazione. Come abbiamo già visto tra le proprietà <strong>degli</strong> integrali doppi, si ha<br />

∫∫<br />

area(D) = dA<br />

D<br />

Proviamo a <strong>di</strong>mostrare questo risultato, supponendo che D sia un dominio normale rispetto<br />

all’asse x, da cui a ≤ x ≤ b e g 1 (x) ≤ y ≤ g 2 (y). L’area compresa tra le curve g 2 (x) e<br />

g 1 (x), vale a <strong>di</strong>re l’area <strong>di</strong> D, può essere calcolata proprio come la <strong>di</strong>fferenze <strong>degli</strong> integrali<br />

delle due funzioni, tramite l’integrale<br />

area(D) =<br />

∫ b<br />

a<br />

(g 2 (x) − g 1 (x))dx<br />

D’altra parte, dalla definizione <strong>di</strong> integrale doppio, considerando la funzione f(x, y) = 1,<br />

107


7. INTEGRALI<br />

Figura 7.15: Area <strong>di</strong> D come integrale doppio<br />

abbiamo<br />

∫∫<br />

D<br />

dxdy =<br />

=<br />

∫ b ∫ g2(x)<br />

a<br />

∫ b<br />

a<br />

(<br />

g 1(x)<br />

dy)dx<br />

(g 2 (x) − g 1 (x))dx<br />

e, per quanto abbiamo appena visto<br />

= area(D)<br />

7.9 Cenni su integrali tripli<br />

L’estensione del concetto <strong>di</strong> integrale <strong>di</strong> una funzione <strong>di</strong>pendente da due variabili ad una<br />

funzione <strong>di</strong>pendente da tre variabili porta al cosiddetto integrale triplo: ∫∫∫ f(x, y, z)dV .<br />

E<br />

Il caso più semplice si ha quando il dominio <strong>di</strong> integrazione E è rappresentato da un<br />

parallelepipedo [a, b] × [c, d] × [r, s].<br />

Allora si ha:<br />

∫∫∫<br />

∫ s ∫ d ∫ b<br />

f(x, y, z)dV =<br />

f(x, y, z)dxdydz<br />

E<br />

=<br />

=<br />

= .<br />

r c a<br />

∫ b ∫ d ∫ s<br />

a c r<br />

∫ d ∫ s ∫ b<br />

c<br />

r<br />

a<br />

f(x, y, z)dzdydx<br />

f(x, y, z)dxdzdy<br />

Abbiamo 6 <strong>di</strong>verse possibilità <strong>di</strong> integrazione, prima rispetto a x, poi rispetto a y, poi rispetto<br />

a z, oppure lungo y, x, z, o ancora... (tutte le possibili combinazioni che si hanno scambiando<br />

l’or<strong>di</strong>ne delle tre variabili). Il risultato che si ottiene non cambia (consideriamo l’integrale <strong>di</strong><br />

funzioni continue, in modo da estendere il teorema <strong>di</strong> Fubini).<br />

108


7.10. Integrali curvilinei<br />

Si ha, inoltre, che il volume <strong>di</strong> una regione tri<strong>di</strong>mensionale E è dato da un integrale triplo<br />

e, precisamente<br />

∫∫∫<br />

volume(E) = dV<br />

E<br />

Se la regione <strong>di</strong> integrazione E è più generale, le tecniche <strong>di</strong> integrazione sono estese su<br />

tre possibili tipi <strong>di</strong> dominio:<br />

1. Primo caso: E = {(x, y, z) t.c. (x, y) ∈ D, u 1 (x, y) ≤ z ≤ u 2 (x, y)}, dove D è un regione nel<br />

piano xy (che a sua volta può essere visto come un dominio normale rispetto all’asse x o<br />

rispetto all’asse y). La regione E viene detta normale rispetto al piano xy e l’integrazione<br />

per fili.<br />

∫∫∫<br />

∫∫ [ ∫ ]<br />

u2(x,y)<br />

f(x, y, z)dV =<br />

f(x, y, z)dz dA<br />

E<br />

D<br />

u 1(x,y)<br />

2. Secondo caso: E = {(x, y, z) t.c. (y, z) ∈ D, u 1 (y, z) ≤ x ≤ u 2 (y, z)}, dove D è un regione<br />

nel piano yz (che a sua volta può essere visto come un dominio normale rispetto all’asse<br />

y o rispetto all’asse z). La regione E viene detta normale rispetto al piano yz. Se si riesce<br />

a vedere l’insieme D come normale rispetto all’asse z allora si parla <strong>di</strong> integrazione per<br />

strati o per sezione.<br />

∫∫∫<br />

∫∫ [ ∫ ]<br />

u2(y,z)<br />

f(x, y, z)dV =<br />

f(x, y, z)dx dA<br />

E<br />

D<br />

u 1(y,z)<br />

3. Secondo caso: E = {(x, y, z) t.c. (x, z) ∈ D, u 1 (x, z) ≤ y ≤ u 2 (x, z)}, dove D è un regione<br />

nel piano xz (che a sua volta può essere visto come un dominio normale rispetto all’asse<br />

x o rispetto all’asse z). La regione E viene detta normale rispetto al piano xz. Se l’insieme<br />

D lo si può vedere come normale rispetto all’asse z allora si parla <strong>di</strong> integrazione<br />

per strati o per sezione.<br />

∫∫∫<br />

∫∫ [ ∫ ]<br />

u2(x,z)<br />

f(x, y, z)dV =<br />

f(x, y, z)dy dA<br />

E<br />

7.10 Integrali curvilinei<br />

D<br />

u 1(x,z)<br />

Un integrale curvilineo (o <strong>di</strong> linea) ha lo scopo <strong>di</strong> integrare una funzione <strong>di</strong> due (o tre)<br />

variabili su un insieme <strong>di</strong> integrazione dato da una curva γ.<br />

Ci soffermiamo al caso bi<strong>di</strong>mensionale (quin<strong>di</strong> funzioni <strong>di</strong> due variabili e curve nel piano<br />

xy).<br />

Consideriamo una curva γ regolare (la funzione vettoriale f che la rappresenta è continua<br />

e la sua derivata è <strong>di</strong>versa da zero per ogni valore del parametro t.) Quin<strong>di</strong> f(t) = (x(t), y(t))<br />

con a ≤ t ≤ b.<br />

∫ L’integrale curvilineo <strong>di</strong> una funzione g(x, y) lungo la curva γ si denota con il simbolo<br />

g(x, y)ds dove ds rappresenta il <strong>di</strong>fferenziale dell’ascissa curvilinea, dovuto al fatto che ci<br />

γ<br />

stiamo muovendo lungo la curva e<br />

√<br />

non su l’asse delle x o delle y.<br />

(dx ) 2 ( ) 2 dy<br />

Ricor<strong>di</strong>amo che ds = |f ′ (t)|dt = + dt<br />

dt dt<br />

Allora, andando a sostituire nell’integrale curvilineo e considerando la curva scritta in<br />

forma parametrica si ha:<br />

√<br />

∫<br />

∫ b<br />

(dx ) 2 ( ) 2 dy<br />

g(x, y)ds = g(x(t), y(t)) + dt<br />

dt dt<br />

γ<br />

a<br />

109


7. INTEGRALI<br />

Per g(x, y) = 1 si ottiene la lunghezza della curva.<br />

Esempio<br />

Es. 7.10.1 Vogliamo calcolare ∫ γ (4+xy2 )ds dove γ è la porzione <strong>di</strong> circonferenza <strong>di</strong> centro<br />

nell’origine e raggio unitario che si ha −1 ≤ x ≤ 0.<br />

Scriviamo le equazioni parametriche della curva γ:<br />

x = cos t, y = sin t,<br />

L’integrale da calcolare <strong>di</strong>venta<br />

∫<br />

γ<br />

(4 + xy 3 )ds =<br />

=<br />

∫ 3π/2<br />

π/2<br />

∫ 3π/2<br />

π/2<br />

π<br />

2 ≤ t ≤ 3 2 π<br />

√<br />

(4 + cos t sin 2 t) sin 2 t + cos 2 tdt<br />

(4 + D(sin t) sin 2 t)dt =<br />

[ ] 3π/2<br />

4t + sin3 t<br />

= 4π − 2 3<br />

π/2<br />

3<br />

Se la curva è regolare a tratti, l’integrale curvilineo si scrive come somma <strong>degli</strong> integrali<br />

curvilinei su ciascun tratto <strong>di</strong> curva regolare <strong>di</strong> cui è composta. In pratica se γ = γ 1 ∪γ 2 . . .∪γ n<br />

con n numero intero, allora<br />

∫<br />

g(x, y)ds =<br />

γ<br />

∫<br />

g(x, y)ds +<br />

γ 1<br />

∫<br />

g(x, y)ds + . . . +<br />

γ 2<br />

∫<br />

g(x, y)ds.<br />

γ n<br />

Ogni curva ha un suo orientamento.<br />

cambia l’integrale curvilineo<br />

Se cambiamo la <strong>di</strong>rezione <strong>di</strong> moto della curva,<br />

Proposizione 7.10.1 Se si cambia l’orientamento <strong>di</strong> una curva, passando dalla curva +γ alla<br />

curva −γ l’integrale curvilineo non cambia:<br />

∫<br />

∫<br />

g(x, y)ds = g(x, y)ds<br />

γ<br />

−γ<br />

Se +γ è data dalle equazioni parametriche (x(t), y(t)) con a ≤ t ≤ b, (primo punto A =<br />

(x(a), y(a)), ultimo punto B = (x(b), y(b))), la curva −γ ha equazioni (x(−t), y(−t)) con t che<br />

varia in [−b, −a], (primo punto (x(b), y(b)) = B, ultimo punto (x(a), y(a)) = A). Le curve sono le<br />

stesse a parte l’orientamento, ma questo non influisce sul risultato dell’integrale curvilineo.<br />

7.11 Integrali <strong>di</strong> superficie<br />

Cerchiamo ora <strong>di</strong> integrare una funzione su una superficie S nello spazio tri<strong>di</strong>mensionale.<br />

7.11.1 Area <strong>di</strong> una superficie<br />

Per capire le formule che scriveremo nel seguito, deriviamo la formula che permette<br />

<strong>di</strong> calcolare l’area <strong>di</strong> una superficie data da equazioni parametriche x = x(u, v), y =<br />

y(u, v), z = z(u, v), equazioni che possiamo scrivere tramite la funzione vettoriale ⃗r(u, v) =<br />

(x(u, v), y(u, v), z(u, v)).<br />

Con un <strong>di</strong>scorso del tutto simile a quanto abbiamo visto nella sezione 7.7 sul cambiamento<br />

<strong>di</strong> variabile, chiamando però adesso D come l’insieme in cui varia (u, v) e S la superficie parametrica,<br />

sud<strong>di</strong>videndo D in rettangolini D ij , in S si hanno i corrispondenti elementini S ij .<br />

Inoltre, se (u i , v j ) è il vertice in basso a sinistra <strong>di</strong> D ij , il punto P ij (x(u i , v j ), y(u i , v j ), z(u i , v j ))<br />

è il corrispondente punto su S ij . L’area dell’elementino S ij può essere approssimata me<strong>di</strong>ante<br />

il parallelogramma <strong>di</strong> lati ∆u⃗r u (u i , v j ) e ∆v⃗r v (u i , v j ) dove ⃗r u e ⃗r v rappresentano la<br />

110


7.11. Integrali <strong>di</strong> superficie<br />

derivata <strong>di</strong> ⃗r rispetto alle variabili u e v, rispettivamente. Il <strong>di</strong>scorso da fare è del tutto analogo<br />

a quanto abbiamo visto nella sezione 7.7. L’area del parallelogramma, che approssima<br />

l’area dell’elementino, è dunque uguale al modulo del prodotto vettoriale <strong>di</strong> ∆u⃗r u (u i , v j ) e<br />

∆v⃗r v (u i , v j ).<br />

L’area della superficie sarà dunque data dalla somma <strong>di</strong> tutte queste aree, facendo tendere<br />

a infinito il numero <strong>degli</strong> elementini in cui sud<strong>di</strong>vi<strong>di</strong>amo la superficie. Si ha infatti la<br />

definizione<br />

Definizione 7.11.1 Data una superficie S <strong>di</strong> equazione ⃗r(u, v) = (x(u, v), y(u, v), z(u, v)), con<br />

(u, v) ∈ D, allora l’area della superficie è data da<br />

∫∫<br />

area(S) = |⃗r u × ⃗r v |dA<br />

D<br />

dove ⃗r u = ( ∂x<br />

∂u , ∂y<br />

∂u , ∂z<br />

∂u ) e ⃗r v = ( ∂x<br />

∂v , ∂y<br />

∂v , ∂z<br />

∂v ).<br />

Nel caso in cui la superficie è data da una funzione z = f(x, y), possiamo ricondurci al<br />

caso precedente considerando ⃗r(u, v) = ⃗r(x, y) = (x, y, f(x, y)).<br />

In tal caso<br />

∣<br />

⃗i ⃗j ⃗ k<br />

∣<br />

1 0<br />

⃗r u × ⃗r v =<br />

∣0 1<br />

∂f<br />

∂x<br />

∂f<br />

∣<br />

∂y<br />

√ (∂f ) 2<br />

Perciò |⃗r u × ⃗r v | = +<br />

∂x<br />

∫∫<br />

A(S) =<br />

D<br />

√ (∂f ) 2<br />

+<br />

∂x<br />

= (− ∂f<br />

∂x , −∂f ∂y , 1)<br />

( ) 2 ∂f<br />

+ 1 e l’area della superficie è<br />

∂y<br />

( ) 2 ∂f<br />

+ 1dA<br />

∂y<br />

7.11.2 Integrale <strong>di</strong> una superficie<br />

Siamo ora in grado <strong>di</strong> capire la formula da applicare nel caso in cui bisogna calcolare<br />

l’integrale <strong>di</strong> una funzione g su una superficie S.<br />

L’area dell’elementino dS si riconduce alla formula dell’area <strong>di</strong> una superficie che abbiamo<br />

appena visto. Perciò, se la superficie S è data me<strong>di</strong>ante una funzione z = f(x, y), con (x, y) ∈<br />

D ⊂ R 2 , l’integrale <strong>di</strong> superficie <strong>di</strong> una funzione g(x, y, z) sulla superficie S è dato da<br />

∫∫<br />

S<br />

∫∫<br />

g(x, y, z)dS =<br />

D<br />

√ (∂f ) 2<br />

g(x, y, f(x, y)) +<br />

∂x<br />

( ) 2 ∂f<br />

+ 1dA<br />

∂y<br />

Dobbiamo prestare molta attenzione a questo tipo <strong>di</strong> integrali perchè l’integrale a destra è<br />

un integrale doppio mentre l’integrale a sinistra è un integrale <strong>di</strong> superficie. Quin<strong>di</strong> il calcolo<br />

<strong>di</strong> un integrale <strong>di</strong> superficie si riconduce ad un integrale doppio.<br />

La superficie potrebbe essere scritta come y = f(x, z) o x = f(y, z). La definizione <strong>di</strong><br />

integrale <strong>di</strong> superficie è analoga (con le dovute sostituzioni) a quella appena scritta.<br />

Se la superficie, invece, è scritta in forma parametrica :<br />

x = x(u, v) y = y(u, v) z = z(u, v) (u, v) ∈ I<br />

111


7. INTEGRALI<br />

allora si ha<br />

∫∫<br />

∫∫<br />

g(x, y, z)dS = g(x(u, v), y(u, v), z(u, v))|⃗r u × ⃗r v |dA<br />

S<br />

I<br />

dove |⃗r u ×⃗r v | rappresenta il modulo del prodotto vettoriale dei vettori che si hanno derivando<br />

parzialmente rispetto a u e rispetto a v le equazioni parametriche della superficie, in modo<br />

da poter avere l’area dell’elementino <strong>di</strong> superficie dS.<br />

Quin<strong>di</strong><br />

⃗i ⃗j ⃗ k<br />

∂y ∂z<br />

∂x ∂z<br />

∂x ∂y<br />

∂x ∂y ∂z<br />

∂u ∂u<br />

∂u ∂u<br />

⃗n = ⃗r u × ⃗r v =<br />

∂u ∂u ∂u<br />

=⃗i<br />

− ⃗j<br />

+ ∂y ∂z<br />

∂x ∂z<br />

⃗ ∂u ∂u<br />

k<br />

∂x ∂y<br />

∣ ∣ ∣ ∣ ∣ ∣<br />

∂x ∂y ∂z<br />

∂v ∂v ∂v ∂v ∂v ∂v<br />

∣<br />

∣<br />

∂v ∂v ∂v<br />

scambiamo le colonne del sottodeterminante relativo a ⃗j<br />

∂y ∂z<br />

∂z ∂x<br />

∂x ∂y<br />

∂u ∂u<br />

∂u ∂u<br />

=⃗i<br />

+ ⃗j<br />

+ ∂y ∂z<br />

∂z ∂x<br />

⃗ ∂u ∂u<br />

k<br />

∂x ∂y<br />

∣ ∣ ∣ ∣ ∣ ∣<br />

∂v ∂v ∂v ∂v ∂v ∂v<br />

osserviamo che i sottodeterminanti sono <strong>degli</strong> jacobiani<br />

=⃗i<br />

∂(y, z)<br />

∣∂(u, v) ∣ + ⃗j<br />

∂(z, x)<br />

∣∂(u, v) ∣ + ⃗ k<br />

∂(x, y)<br />

∣∂(u, v) ∣<br />

Chiamando con n 1 , n 2 e n 3 le componenti del vettore normale appena ottenuto, n 1 =<br />

∂(y, z)<br />

∣∂(u, v) ∣ , n 2 =<br />

∂(z, x)<br />

∣∂(u, v) ∣ e n 3 =<br />

∂(x, y)<br />

∣∂(u, v) ∣ , il modulo <strong>di</strong> ⃗n è dato da |⃗n| = √ (n 1 ) 2 + (n 2 ) 2 + (n 3 ) 2 .<br />

Quin<strong>di</strong><br />

∫∫<br />

∫∫<br />

g(x, y, z)dS = g(x(u, v), y(u, v), z(u, v))|⃗r u × ⃗r v |dA<br />

S<br />

D<br />

∫∫<br />

= g(x(u, v), y(u, v), z(u, v)) √ (n 1 ) 2 + (n 2 ) 2 + (n 3 ) 2 dA<br />

D<br />

Se g(x, y, z) = 1 l’integrale <strong>di</strong> superficie ci fa ritrovare l’area della superficie.<br />

Esempio<br />

Es. 7.11.1 Calcoliamo l’integrale <strong>di</strong> superficie I = ∫∫ yzdS dove S è la superficie <strong>di</strong><br />

S<br />

equazioni parametriche x = u 2 , y = u sin (v), z = u cos (v), con 0 ≤ u ≤ 1 e 0 ≤ v ≤ π/2.<br />

L’integrale da calcolare <strong>di</strong>venta l’integrale doppio<br />

∫∫<br />

I =<br />

D<br />

u sin (v)u cos (v)|⃗r u × ⃗r v |dudv =<br />

∫ 1 ∫ π/2<br />

0<br />

0<br />

u 2 sin (v) cos (v)|⃗r u × ⃗r v |dvdu<br />

Calcoliamo il modulo del prodotto vettoriale. Abbiamo<br />

⃗i ⃗j ⃗ k<br />

⃗r u × ⃗r v =<br />

2u sin (v) cos (v)<br />

∣ 0 u cos (v) −u sin (v) ∣ = . . . = ⃗i(−u) + ⃗j(2u 2 sin (v)) + ⃗ k(2u 2 cos (v))<br />

112


7.12. Soli<strong>di</strong> e superfici <strong>di</strong> rotazione<br />

Perciò, quando calcoliamo il modulo, abbiamo (consideriamo anche 0 ≤ u ≤ 1):<br />

√<br />

|⃗r u × ⃗r v | = u 2 + 4u 4 sin 2 (v) + 4u 4 cos 2 (v) = u √ 1 + 4u 2<br />

L’integrale è<br />

I =<br />

∫ 1 ∫ π/2<br />

0<br />

0<br />

u 2 sin (v) cos (v)u √ 1 + 4u 2 dvdu =<br />

∫ 1 ∫ π/2<br />

0<br />

0<br />

u 3√ 1 + 4u 2 sin (v) cos (v)dvdu<br />

Osserviamo che abbiamo funzioni che <strong>di</strong>pendono solo da v e funzioni che <strong>di</strong>pendono<br />

solo da u, perciò le funzioni che <strong>di</strong>pendono solo da u, le possiamo portare fuori<br />

dall’integrale in v, ricavando<br />

Ora<br />

I =<br />

∫ π/2<br />

0<br />

∫ 1<br />

0<br />

u 3√ ∫ π/2<br />

1 + 4u 2 sin (v) cos (v)dvdu<br />

0<br />

sin (v) cos (v)dv =<br />

∫ π/2<br />

0<br />

sin (v)D(sin (v))dv = sin2 (v)<br />

2<br />

Andando a sostituire nell’integrale doppio abbiamo<br />

I = 1 2<br />

∫ 1<br />

0<br />

u 3√ 1 + 4u 2 du<br />

Facciamo un cambiamento <strong>di</strong> variabili ponendo t = 1+4u 2 da cui u 2 = t − 1 e 2udu = dt<br />

4<br />

4 ,<br />

ovvero udu = dt . Inoltre, per u = 0 si ha t = 1 e per u = 1 si ha t = 5. Quin<strong>di</strong><br />

8<br />

I = 1 2<br />

= 1<br />

64<br />

= 1<br />

64<br />

∫ 1<br />

0<br />

∫ 5<br />

u 2√ 1 + 4u 2 udu = 1 2<br />

(t √ t − √ t)dt = 1<br />

1<br />

64<br />

2<br />

∣5 t5/2 − 2 ∣ ∣∣∣<br />

5<br />

3 t3/2<br />

1<br />

∫ 5<br />

1<br />

∫ 5<br />

1<br />

t − 1√ dt t<br />

4 8<br />

(t 3/2 − t 1/2 )dt<br />

= . . . = 5√ 5<br />

48 + 1<br />

240<br />

∣<br />

π/2<br />

0<br />

= 1 2<br />

7.12 Soli<strong>di</strong> e superfici <strong>di</strong> rotazione<br />

Ve<strong>di</strong>amo da un punto <strong>di</strong> vista matematico i concetti <strong>di</strong> massa e baricentro (usualmente<br />

visti in fisica). Ci serviranno successivamente per calcolare il volume <strong>di</strong> un solido o l’area<br />

<strong>di</strong> una superficie ottenuti, rispettivamente, me<strong>di</strong>ante rotazione <strong>di</strong> una superficie o <strong>di</strong> una<br />

curva attorno ad uno <strong>degli</strong> assi.<br />

Ci limitiamo a vedere le definizioni <strong>di</strong> massa, momenti e baricentro, per il caso<br />

bi<strong>di</strong>mensionale.<br />

Definizione 7.12.1 Si definisce massa <strong>di</strong> un oggetto piano che riempe una regione C, con<br />

densità data da µ(x, y) (funzione continua), la quantià m data da<br />

∫∫<br />

m = µ(x, y)dxdy<br />

C<br />

113


7. INTEGRALI<br />

Se un oggetto piano riempe una regione C con densità µ(x, y) (continua), i suoi momenti<br />

sono dati da<br />

∫∫<br />

M x = yµ(x, y)dxdy<br />

C<br />

∫∫<br />

M y = xµ(x, y)dxdy<br />

C<br />

Il baricentro (o centro <strong>di</strong> massa) dell’oggetto è il punto (x, y) dato da (m essendo la massa)<br />

x = M ∫∫<br />

y<br />

m = C xµ(x, y)dxdy<br />

∫∫<br />

µ(x, y)dxdy<br />

C<br />

y = M ∫∫<br />

x<br />

m = C yµ(x, y)dxdy<br />

∫∫<br />

µ(x, y)dxdy<br />

C<br />

Nel caso <strong>di</strong> una curva piana γ, omogenea e con densità µ ≡ 1, si ha:<br />

G la massa m è data da<br />

∫<br />

m = ds =⇒ m = L (la lunghezza della curva)<br />

γ<br />

G i momenti sono<br />

∫<br />

∫<br />

M x = yds M y =<br />

G il baricentro ha coor<strong>di</strong>nate<br />

x = M y<br />

L<br />

= 1 ∫<br />

xds<br />

L<br />

γ<br />

γ<br />

γ<br />

xds<br />

y = M x<br />

L<br />

= 1 L<br />

∫<br />

γ<br />

Definiamo, a questo punto, il solido <strong>di</strong> rotazione.<br />

Sia D un insieme del piano (x, y), chiuso e limitato (e integrabile). Per semplicità i valori<br />

<strong>di</strong> y siano positivi.<br />

Una rotazione del piano (x, y) intorno all’asse x (o y) fa sì che l’insieme D generi un solido<br />

I nello spazio (x, y, z), che chiamiamo solido <strong>di</strong> rotazione.<br />

Per calcolare il volume <strong>di</strong> un solido <strong>di</strong> rotazione si ha il<br />

Teorema 7.12.1 (Primo teorema <strong>di</strong> Gul<strong>di</strong>no) Il volume dell’insieme I, solido <strong>di</strong> rotazione ottenuto<br />

dall’insieme D è uguale all’area <strong>di</strong> D per la lunghezza della circonferenza descritta nella<br />

rotazione dal baricentro <strong>di</strong> D.<br />

Supponendo che la rotazione sia fatta attorno all’asse x, il raggio della circonferenza descritta<br />

dal baricentro è data dall’or<strong>di</strong>nata del baricentro (si considera µ ≡ 1). Quin<strong>di</strong><br />

yds<br />

volume(I) = area(D) × lunghezza della circonferenza<br />

volume(I) = area(D) × 2π raggio della circonferenza<br />

volume(I) = area(D)2π y<br />

∫∫<br />

D<br />

volume(I) = area(D)2π ∫∫<br />

ydxdy<br />

D<br />

∫∫<br />

dxdy<br />

D<br />

volume(I) = area(D)2π<br />

ydxdy<br />

area(D)<br />

∫∫<br />

= 2π ydxdy<br />

D<br />

114


7.12. Soli<strong>di</strong> e superfici <strong>di</strong> rotazione<br />

Figura 7.16: Insieme D da cui calcolare il volume del solido <strong>di</strong> rotazione attorno all’asse x.<br />

Se la rotazione <strong>di</strong> D avviene attorno all’asse y, il volume del solido <strong>di</strong> rotazione è data da<br />

∫∫<br />

volume(I) = 2π xdxdy<br />

D<br />

perchè la circonferenza descritta dal baricentro ha raggio dato da x.<br />

Definiamo, ora, la superficie <strong>di</strong> rotazione.<br />

Sia γ una curva generalmente regolare del piano (x, y). Sia y > 0. Consideriamo l’asse<br />

z ortogonale in (0, 0) al piano (x, y). Una rotazione del piano (x, y) intorno all’asse x (o y) fa<br />

sì che la curva γ generi una superficie S nello spazio (x, y, z), che chiamiamo superficie <strong>di</strong><br />

rotazione.<br />

Per misurare l’area <strong>di</strong> una superficie <strong>di</strong> rotazione si ha il<br />

Teorema 7.12.2 (Secondo teorema <strong>di</strong> Gul<strong>di</strong>no) L’area della superficie <strong>di</strong> rotazione S generata<br />

dalla curva γ è uguale alla lunghezza della curva per la lunghezza della circonferenza<br />

descritta nella rotazione dal baricentro <strong>di</strong> γ.<br />

Sia γ data da equazioni parametriche x = x(t), y = y(t) con t ∈ [a, b] e <strong>di</strong> lunghezza L.<br />

La superficie sia ottenuta me<strong>di</strong>ante rotazione attorno all’asse x. Allora la circonferenza ha<br />

raggio y con y = 1 ∫<br />

L<br />

γ yds = 1 ∫ b<br />

L<br />

a y(t)√ (x ′ (t)) 2 + (y ′ (t)) 2 dt. Allora<br />

area(S) = lunghezza della curva × lunghezza della circonferenza<br />

area(S) = L2π y<br />

area(S) = L2π 1 L<br />

area(S) = 2π<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

y(t) √ (x ′ (t)) 2 + (y ′ (t)) 2 dt<br />

y(t) √ (x ′ (t)) 2 + (y ′ (t)) 2 dt<br />

Se la rotazione avviene attorno all’asse y invece si ha<br />

area(S) = 2π<br />

∫ b<br />

a<br />

x(t) √ (x ′ (t)) 2 + (y ′ (t)) 2 dt<br />

115


7. INTEGRALI<br />

Esempio<br />

Es. 7.12.1 Calcoliamo il volume del solido <strong>di</strong> rotazione ottenuto dalla rotazione completa<br />

attorno all’asse x dell’insieme<br />

{<br />

D = (x, y) ∈ R 2 : x 2 + y 2 ≤ 3 }<br />

4 , x2 ≥ y, y ≥ 0, x ≥ 0<br />

Per calcolare questo integrale dobbiamo applicare il primo teorema <strong>di</strong> Gul<strong>di</strong>no. Il volume<br />

richiesto sarà dato da<br />

∫∫<br />

V = 2π ydxdy<br />

D<br />

L’insieme D è dato dalla regione compresa al <strong>di</strong> sotto della parabola y = x 2 e all’interno<br />

della circonferenza con centro nell’origine e raggio r = √ 3/2, che si trova nel primo<br />

quadrante (si veda Figura 7.16).<br />

Cerchiamo i punti <strong>di</strong> intersezione tra la parabola e la circonferenza risolvendo il sistema<br />

⎧<br />

⎨y = x 2<br />

⎩x 2 + y 2 = 3 4<br />

Sostituendo y = x 2 nella seconda equazione si ha x 2 + x 4 = 3 . Con la sostituzione<br />

4<br />

t = x 2 l’equazione <strong>di</strong>venta t 2 + t − 3 4 = 0 da cui t = −1 ± √ 1 + 3<br />

= −1 ± 2 : quin<strong>di</strong><br />

2<br />

2<br />

le due ra<strong>di</strong>ci sono t = 1 2 e t = −3 2 . Ritornando a x2 = t, si ha come soluzione del<br />

primo quadrante il punto x = √ 1 e y = 1 . Per calcolare l’integrale, possiamo vedere il<br />

2 2<br />

dominio <strong>di</strong> integrazione come normale rispetto all’asse x, considerando l’unione <strong>di</strong> due<br />

insiemi, il primo dato da 0 ≤ x ≤ √ 1 , e 0 ≤ y ≤ x 2 , e il secondo dato da √ 1 ≤ x ≤ 3 2 2 2 e<br />

0 ≤ y ≤<br />

√<br />

3<br />

4 − x2 .<br />

Quin<strong>di</strong> l’integrale da calcolare va spezzato in due integrali su questi domini. Oppure,<br />

si può vedere il dominio <strong>di</strong> integrazione normale rispetto all’asse y, con 0 ≤ y ≤ 1 2 e<br />

√ y ≤ x ≤<br />

√<br />

3<br />

4 − y2 .<br />

In tal caso l’integrale <strong>di</strong>venta<br />

Si ha<br />

V =<br />

V =<br />

∫ 1/2<br />

0<br />

∫ 1/2<br />

0<br />

= − 1 2<br />

∫ √ 3<br />

4 −y2<br />

√ y<br />

ydxdy<br />

y(√<br />

3<br />

4 − y2 − √ y)dy =<br />

∫ 1/2<br />

0<br />

(−2y)√<br />

3<br />

4 − y2 dy −<br />

∫ 1/2<br />

0<br />

∫ 1/2<br />

0<br />

y√<br />

3<br />

4 − y2 dy −<br />

y 3/2 dy = − 1 2<br />

∫ 1/2<br />

0<br />

∫ 1/2<br />

0<br />

y √ ydy<br />

D( 3 4 − y2 )<br />

√<br />

3<br />

4 − y2 dy − 2 5 y5/2 ∣ ∣∣∣<br />

1/2<br />

0<br />

116


7.12. Soli<strong>di</strong> e superfici <strong>di</strong> rotazione<br />

= − 1 2<br />

Esempio<br />

∣<br />

2<br />

∣∣∣<br />

1/2<br />

3 (3 4 − y2 ) 3/2<br />

0<br />

− 1<br />

10 √ 2 = −1 3 (1 2 )3/2 + 1 3 (3 4 )3/2 − 1<br />

10 √ 2<br />

= − 1<br />

√<br />

3<br />

6 √ 2 + 8 − 1<br />

10 √ 2 = − 4<br />

√ √ √<br />

3 2 3<br />

14 √ 2 + 8 = − 7 + 8<br />

Es. 7.12.2 L’arco <strong>di</strong> parabola y = x 2 per 1 ≤ x ≤ 2 è ruotato attorno all’asse y. Vogliamo<br />

trovare l’area della superficie <strong>di</strong> rotazione. In questo caso dobbiamo applicare il secondo<br />

teorema <strong>di</strong> Gul<strong>di</strong>no, vedendo la parabola come la curva <strong>di</strong> coor<strong>di</strong>nate parametriche x = x,<br />

y = x 2 , per cui<br />

Quin<strong>di</strong><br />

area(S) = 2π<br />

∫ 2<br />

1<br />

∫ 2<br />

area(S) = 2π<br />

1<br />

x √ 1 + 4x 2 dx.<br />

8x<br />

8<br />

= 1 4 π 2(1 + 4x2 ) 3/2<br />

3<br />

√<br />

1 + 4x2 dx = 1 ∫ 2<br />

4 π D(1 + 4x 2 ) √ 1 + 4x 2 dx<br />

∣<br />

= 1 6 π(17√ 17 − 5 √ 5)<br />

2<br />

1<br />

= 1 6 π(173/2 − 5 3/2 )<br />

1<br />

117


CAPITOLO 8<br />

Equazioni <strong>di</strong>fferenziali or<strong>di</strong>narie<br />

L’ignoranza per la matematica<br />

viene considerato un fatto<br />

positivo, a un certo livello della<br />

classe sociale. Eppure la<br />

matematica ha determinato la<br />

<strong>di</strong>rezione e il contenuto <strong>di</strong><br />

buona parte del pensiero<br />

filosofico, ha <strong>di</strong>strutto e<br />

ricostruito dottrine religiose,<br />

ha costituito il nerbo <strong>di</strong> teorie<br />

economiche e sociali, ha<br />

plasmato i principali stili<br />

pittorici, musicali,<br />

architettonici e letterari.<br />

Morris Kline (1908-1992)<br />

8.1 Cosa è un’equazione <strong>di</strong>fferenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . 119<br />

8.2 Il problema <strong>di</strong> Cauchy in locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121<br />

8.3 Teorema <strong>di</strong> Cauchy (esistenza e unicità globale) . . . . . . . . . . . . . . . . . . . . 122<br />

8.4 Definizioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123<br />

8.5 Equazioni <strong>di</strong>fferenziali lineari del primo or<strong>di</strong>ne . . . . . . . . . . . . . . . . . . . . 123<br />

8.6 Metodo <strong>di</strong> separazione delle variabili . . . . . . . . . . . . . . . . . . . . . . . . . . 125<br />

8.7 Risoluzione <strong>di</strong> alcuni tipi <strong>di</strong> equazioni <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . 126<br />

8.8 Le equazioni <strong>di</strong>fferenziali lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127<br />

8.8.1 Cosa è uno spazio vettoriale . . . . . . . . . . . . . . . . . . . . . . . . . . . 129<br />

8.9 L’equazione omogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130<br />

8.10L’equazione non omogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131<br />

8.11Equazioni lineari a coefficienti costanti . . . . . . . . . . . . . . . . . . . . . . . . . 132<br />

8.12Metodo dei coefficienti indeterminati . . . . . . . . . . . . . . . . . . . . . . . . . . 135<br />

8.1 Cosa è un’equazione <strong>di</strong>fferenziale<br />

Un’equazione <strong>di</strong>fferenziale è un’equazione che coinvolge una funzione incognita y = y(x)<br />

(che <strong>di</strong>pende dalla sola variabile x) e le sue derivate. Usualmente si parla <strong>di</strong> equazione <strong>di</strong>fferenziale<br />

or<strong>di</strong>naria 1 in quanto la funzione incognita, essendo funzione <strong>di</strong> una sola variabile,<br />

ammette derivate or<strong>di</strong>narie e non derivate parziali.<br />

1 In inglese si <strong>di</strong>ce: Or<strong>di</strong>nary Differential Equation, da cui la sigla ODE.<br />

119


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

Un esempio <strong>di</strong> equazione <strong>di</strong>fferenziale lineare è dato da<br />

y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y = b(x)<br />

dove i coefficienti a 0 (x), a 1 (x), . . . , a n−1 (x) e b(x) sono assegnate funzioni continue che <strong>di</strong>pendono<br />

dalla variabile x, mentre y è la funzione incognita e compare insieme alle sue derivate<br />

fino a quella <strong>di</strong> or<strong>di</strong>ne n. Usiamo infatti la notazione y (n) per in<strong>di</strong>care dn y<br />

dx n .<br />

Se nell’equazione <strong>di</strong>fferenziale compaiono le derivate <strong>di</strong> y fino all’or<strong>di</strong>ne n, allora si <strong>di</strong>ce<br />

che l’equazione <strong>di</strong>fferenziale ha or<strong>di</strong>ne (o grado) n. Bisogna quin<strong>di</strong> vedere l’or<strong>di</strong>ne più elevato<br />

della derivata che appare nell’equazione per capire l’or<strong>di</strong>ne dell’equazione <strong>di</strong>fferenziale.<br />

Per n = 1, l’equazione <strong>di</strong>fferenziale <strong>di</strong> prima <strong>di</strong>venta<br />

y ′ + a(x)y = b(x)<br />

Per n = 2 si ha, invece,<br />

y ′′ + a 1 (x)y ′ + a 0 (x)y = b(x)<br />

Il caso più generale <strong>di</strong> un’equazione <strong>di</strong>fferenziale <strong>di</strong> or<strong>di</strong>ne n è dato da un’equazione che<br />

ha come variabili x, la funzione incognita y e le sue derivate fino all’or<strong>di</strong>ne n, me<strong>di</strong>ante una<br />

funzione continua F (in genere non lineare):<br />

F (x, y, y ′ , . . . , y (n) ) = 0<br />

L’esempio <strong>di</strong> prima, <strong>di</strong> equazione <strong>di</strong>fferenziale lineare, ha come F la funzione<br />

F (x, y, y ′ , . . . , y (n) ) = y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y − b(x)<br />

Risolvere un’equazione <strong>di</strong>fferenziale (si <strong>di</strong>ce anche integrare un’equazione <strong>di</strong>fferenziale)<br />

vuol <strong>di</strong>re cercare le possibili (ve ne possono essere più <strong>di</strong> una) funzioni del tipo y = y(x)<br />

definite per x che varia in un opportuno intervallo [a, b], continue e derivabili n volte in [a, b]<br />

in modo che sia sod<strong>di</strong>sfatta l’equazione <strong>di</strong>fferenziale data.<br />

Le funzioni y = y(x) che sod<strong>di</strong>sfano l’equazione <strong>di</strong>fferenziale si <strong>di</strong>cono soluzioni o integrali<br />

dell’equazione <strong>di</strong>fferenziale.<br />

Se un’equazione <strong>di</strong>fferenziale può essere scritta nella forma<br />

y (n) = f(x, y, y ′ , . . . , y (n−1) )<br />

con f funzione continua allora si <strong>di</strong>ce che l’equazione <strong>di</strong>fferenziale è in forma normale.<br />

Esempio<br />

Es. 8.1.1 Data f, funzione continua in [a, b], si vuole risolvere<br />

y ′ (x) = f(x) ∀x ∈ [a, b]<br />

Questo problema equivale a quello <strong>di</strong> trovare una primitiva della funzione f, una<br />

funzione, cioè, la cui derivata coincide con f.<br />

Ogni funzione della forma y(x) = F (x) + y 0 con y 0 costante e F una primitiva <strong>di</strong> f è<br />

soluzione del problema assegnato, ovvero dell’equazione <strong>di</strong>fferenziale. Come primitiva<br />

<strong>di</strong> f, dal teorema fondamentale del calcolo integrale, sappiamo che possiamo scrivere<br />

F (x) = ∫ x<br />

x 0<br />

f(t)dt dove x 0 è un numero reale fissato in [a, b]. Quin<strong>di</strong> y(x) = ∫ x<br />

x 0<br />

f(t)dt + y 0 è<br />

soluzione del problema dato.<br />

120


8.2. Il problema <strong>di</strong> Cauchy in locale<br />

L’esempio che abbiamo descritto ora è molto particolare. Infatti si ha che la soluzione<br />

y(x) per x = x 0 vale proprio la costante y 0 :<br />

y(x 0 ) =<br />

∫ x0<br />

x 0<br />

f(t)dt + y 0 = y 0<br />

In questo caso, si <strong>di</strong>ce che y(x) è soluzione del problema <strong>di</strong> Cauchy dato da<br />

{<br />

y ′ (x) = f(x)<br />

y(x 0 ) = y 0<br />

dove y(x 0 ) = y 0 rappresenta la con<strong>di</strong>zione iniziale e x 0 il punto iniziale da cui far partire<br />

la soluzione al problema.<br />

Ve<strong>di</strong>amo dunque cosa è un problema <strong>di</strong> Cauchy.<br />

8.2 Il problema <strong>di</strong> Cauchy in locale<br />

Partiamo dal considerare l’equazione <strong>di</strong>fferenziale<br />

y ′ = f(x, y)<br />

Se la f è non lineare, è ragionevole aspettarsi che le soluzioni dell’equazioni <strong>di</strong>fferenziale<br />

siano definite non in un intervallo assegnato a priori ma solo in un intorno <strong>di</strong> un punto<br />

iniziale assegnato.<br />

Fissati, dunque, x 0 e y 0 , supponiamo che:<br />

1. la f sia definita in un intorno rettangolare I × J del punto (x 0 , y 0 ) del tipo (siano a e b<br />

assegnati)<br />

{<br />

}<br />

I × J = (x, y) ∈ R 2 t.c x 0 − a ≤ x ≤ x 0 + a, y 0 − b ≤ y ≤ y 0 + b<br />

2. la f sia continua in I × J<br />

3. la derivata parziale della f rispetto a y, ∂f , sia continua in I × J.<br />

∂y<br />

Sotto queste ipotesi esiste un intorno <strong>di</strong> x 0 , [x 0 − δ, x 0 + δ] ed un’unica funzione y = y(x)<br />

derivabile in [x 0 − δ, x 0 + δ] che è soluzione del problema <strong>di</strong> Cauchy dato da<br />

{<br />

y ′ (x) = f(x, y)<br />

y(x 0 ) = y 0<br />

Abbiamo appena stabilito una formulazione del teorema <strong>di</strong> Cauchy <strong>di</strong> esistenza e unicità<br />

locale (in piccolo).<br />

Teorema 8.2.1 (Teorema <strong>di</strong> Cauchy (in piccolo) per equazioni <strong>di</strong>fferenziali del primo or<strong>di</strong>ne)<br />

Sia f = f(x, y) una funzione reale definita nell’intervallo I × J (definito in precedenza). Se f<br />

e la sua derivata ∂f sono funzioni continue in I × J, allora esiste un numero δ > 0 ed esiste<br />

∂y<br />

una ed una sola funzione y = y(x) derivabile in [x 0 − δ, x 0 + δ], soluzione in tale intervallo del<br />

problema <strong>di</strong> Cauchy<br />

{<br />

y ′ (x) = f(x, y)<br />

y(x 0 ) = y 0<br />

121


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

Per equazioni <strong>di</strong>fferenziali <strong>di</strong> or<strong>di</strong>ne n, il problema <strong>di</strong> Cauchy prevede con<strong>di</strong>zioni iniziali<br />

non solo sulla funzione incognita y ma anche sulle sue derivate fino a quella <strong>di</strong> or<strong>di</strong>ne n − 1.<br />

Consideriamo, infatti, un punto (x 0 , y 0 , y 0, ′ y 0 ′′ , . . . , y (n−1)<br />

0 ) ∈ R × R n . Sia I l’intervallo [x 0 −<br />

a, x 0 + a] (con a ∈ R), e J sia un intorno <strong>di</strong> R n del punto Y 0 = (y 0 , y 0, ′ y 0 ′′ , . . . , y (n−1)<br />

0 ), quin<strong>di</strong><br />

J = {Y ∈ R n t.c. |Y − Y 0 | ≤ b}<br />

dove b ∈ R√<br />

e |Y − Y 0 | è il modulo del vettore Y − Y 0 (quin<strong>di</strong> se Y = (y 1 , y 2 , y 3 , . . . , y n ) si ha<br />

|Y − Y 0 | = (y 0 − y 1 ) 2 + (y 0 ′ − y 2) 2 + . . . (y (n−1)<br />

0 − y n ) 2 ).<br />

Vale il seguente teorema.<br />

Teorema 8.2.2 (Teorema <strong>di</strong> Cauchy in piccolo per eq. <strong>di</strong>fferenziali <strong>di</strong> or<strong>di</strong>ne n) Sia f =<br />

f(x, y 1 , y 2 , y 3 , . . . , y n ) una funzione definita per x ∈ I e (y 1 , y 2 , . . . , y n ) ∈ J (I e J definiti prima).<br />

Sia f continua insieme alle derivate parziali fatte rispetto a y 1 , y 2 , . . . , y n . Allora esiste un<br />

numero reale δ > 0 ed una ed una sola funzione y(x), derivabile n volte in [x 0 − δ, x 0 + δ], che è<br />

soluzione del seguente problema <strong>di</strong> Cauchy:<br />

⎧<br />

y (n) = f(x, y, y ′ , y ′′ , . . . , y (n−1) )<br />

y(x 0 ) = y 0<br />

⎪⎨ y ′ (x 0 ) = y 0<br />

′<br />

y ′′ (x 0 ) = y 0<br />

′′<br />

.<br />

⎪⎩<br />

y (n−1) (x 0 ) = y (n−1)<br />

0<br />

Con il teorema <strong>di</strong> Cauchy <strong>di</strong> esistenza e unicità locale, sono date delle con<strong>di</strong>zioni sufficienti<br />

per risolvere localmente, in piccolo, il problema <strong>di</strong> Cauchy, determinando una soluzione<br />

in un intorno del punto iniziale x 0 .<br />

8.3 Teorema <strong>di</strong> Cauchy (esistenza e unicità globale)<br />

A volte è importante stabilire l’esistenza della soluzione del problema <strong>di</strong> Cauchy per un’equazione<br />

<strong>di</strong>fferenziale or<strong>di</strong>naria in un intervallo prefissato (quin<strong>di</strong> non in un intorno <strong>di</strong> x 0 ),<br />

cioè assegnato a priori, in cui l’equazione <strong>di</strong>fferenziale è definita.<br />

Per stabilire delle con<strong>di</strong>zioni sufficienti per risolvere globalmente, o in grande, il problema<br />

<strong>di</strong> Cauchy, occorre avere con<strong>di</strong>zioni più restrittive sulla funzione f.<br />

Nel caso <strong>di</strong> un’equazione <strong>di</strong>fferenziale del primo or<strong>di</strong>ne, si hanno queste con<strong>di</strong>zioni:<br />

1. f(x, y) è definita in una striscia verticale <strong>di</strong> R 2 data da<br />

{<br />

}<br />

[a, b] × R = (x, y) ∈ R 2 t.c. x ∈ [a, b], y ∈ R<br />

2. f è continua<br />

3. la derivata parziale <strong>di</strong> f rispetto a y è continua e limitata, quin<strong>di</strong><br />

∣<br />

∂f(x, y)<br />

∂y<br />

∣ ≤ L per ogni<br />

(x, y) ∈ [a, b] × R, con L numero reale positivo.<br />

In queste ipotesi, esiste una ed una sola funzione y(x) che risolve il problema <strong>di</strong> Cauchy<br />

{<br />

y ′ (x) = f(x, y)<br />

y(x 0 ) = y 0<br />

Possiamo enunciare il teorema:<br />

122


8.4. Definizioni<br />

Teorema 8.3.1 (Teorema <strong>di</strong> esistenza e unicità globale (caso <strong>di</strong> eq. <strong>di</strong>ff. del primo or<strong>di</strong>ne))<br />

∂f(x, y)<br />

Se f = f(x, y) è continua in [a, b] × R e la sua derivata è continua e limitata in [a, b] × R,<br />

∂y<br />

allora per ogni x 0 ∈]a, b[ e per ogni y 0 ∈ R esiste una ed una sola funzione y = y(x), derivabile<br />

in [a, b] che risolve su tutto l’intervallo [a, b] il problema <strong>di</strong> Cauchy<br />

{<br />

y ′ (x) = f(x, y)<br />

y(x 0 ) = y 0<br />

Per equazioni <strong>di</strong>fferenziali <strong>di</strong> or<strong>di</strong>ne n il teorema precedente si generalizza considerando<br />

funzioni f = f(x, y 1 , y 2 , y 3 , . . . , y n ) = f(x, Y ) definite nella striscia [a, b] × R n con<br />

{<br />

}<br />

[a, b] × R n = (x, Y ) = (x, y 1 , y 2 , y 3 , . . . , y n ) ∈ R n+1 , con x ∈ [a, b], y 1 ∈ R, . . . , y n ∈ R<br />

Teorema 8.3.2 (Teorema <strong>di</strong> esistenza e unicità globale (caso <strong>di</strong> eq. <strong>di</strong>ff. <strong>di</strong> or<strong>di</strong>ne n))<br />

Se f = f(x, y 1 , y 2 , y 3 , . . . , y n ) è continua in [a, b] × R n e le derivate parziali fatte rispetto a y 1 ,<br />

y 2 , . . . , y n sono continue e limitate in [a, b] × R n , allora per ogni x 0 ∈]a, b[ e per ogni punto <strong>di</strong> R n<br />

dato da (y 0 , y 0, ′ . . . , y (n−1)<br />

0 ) esiste una ed una sola funzione y(x), derivabile n volte in [a, b], che<br />

è soluzione del seguente problema <strong>di</strong> Cauchy:<br />

⎧<br />

y (n) = f(x, y, y ′ , y ′′ , . . . , y (n−1) )<br />

y(x 0 ) = y 0<br />

⎪⎨ y ′ (x 0 ) = y 0<br />

′<br />

y ′′ (x 0 ) = y 0<br />

′′<br />

.<br />

⎪⎩<br />

y (n−1) (x 0 ) = y (n−1)<br />

0<br />

8.4 Definizioni<br />

Consideriamo ora un’equazione <strong>di</strong>fferenziale del primo or<strong>di</strong>ne e introduciamo le seguenti<br />

definizioni.<br />

G Per integrale generale si intende l’insieme delle soluzioni dell’equazione <strong>di</strong>fferenziale<br />

che varia al variare <strong>di</strong> una costante c: qualunque sia la coppia (x 0 , y 0 ) si può stabilire il<br />

valore della costante c tale che y(c, x 0 ) = y 0 .<br />

G Per integrale particolare si intende invece una soluzione particolare dell’equazione<br />

<strong>di</strong>fferenziale: fissata una coppia (x 0 , y 0 ) esiste una costante c tale che y(c, x 0 ) = y 0 .<br />

G Si ha invece un integrale singolare se, data una coppia (x 0 , y 0 ), non esiste una costante c<br />

tale che y(c, x 0 ) = y 0 , vale a <strong>di</strong>re che per quella coppia <strong>di</strong> dati, la soluzione dell’equazione<br />

<strong>di</strong>fferenziale non rientra in un integrale particolare.<br />

8.5 Equazioni <strong>di</strong>fferenziali lineari del primo or<strong>di</strong>ne<br />

Sia y ′ = f(x, y) con f funzione lineare in y, del tipo f(x, y) = b(x) − a(x)y.<br />

Si ha, quin<strong>di</strong>, per l’equazione <strong>di</strong>fferenziale:<br />

y ′ = f(x, y) =⇒ y ′ = b(x) − a(x)y =⇒ y ′ + a(x)y = b(x)<br />

Ve<strong>di</strong>amo ora tutti i passaggi per trovare l’integrale generale <strong>di</strong> questa equazione<br />

<strong>di</strong>fferenziale.<br />

1. Sia A(x) = ∫ a(x)dx una primitiva <strong>di</strong> a(x). Poniamo m(x) = e A(x) .<br />

123


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

2. Moltiplichiamo l’equazione <strong>di</strong>fferenziale per m(x), ottenendo:<br />

m(x)y ′ (x) + m(x)a(x)y(x) = m(x)b(x) (8.1)<br />

3. Consideriamo ora la derivata <strong>di</strong> m(x). Si ha<br />

dm(x)<br />

dx<br />

= deA(x)<br />

dx<br />

A(x) dA(x)<br />

= e = m(x) dA(x)<br />

dx<br />

dx<br />

ma essendo A(x) una primitiva <strong>di</strong> a(x) vuole <strong>di</strong>re che dA(x)<br />

dx<br />

dm(x)<br />

dx<br />

= m(x)a(x)<br />

= a(x), da cui si ricava<br />

4. Facciamo ora la derivata <strong>di</strong> y(x)m(x). Abbiamo da fare la derivata <strong>di</strong> un prodotto <strong>di</strong><br />

funzioni, da cui<br />

d(y(x)m(x))<br />

dx<br />

= dy(x)<br />

dx<br />

m(x) + y(x)dm(x) dx<br />

La derivata <strong>di</strong> m(x) l’abbiamo appena ricavata, la derivata <strong>di</strong> y(x) è y ′ (x), da cui<br />

d(y(x)m(x))<br />

dx<br />

= m(x)y ′ (x) + m(x)a(x)y(x)<br />

Abbiamo trovato il primo membro dell’equazione 8.1.<br />

5. Possiamo quin<strong>di</strong> riscrivere l’equazione 8.1 come<br />

d(y(x)m(x))<br />

dx<br />

= m(x)b(x)<br />

6. Integrando ambo i membri dell’equazione e <strong>di</strong>videndo poi per m(x) (<strong>di</strong>versa da zero<br />

perche è e A(x) ) si ha<br />

∫ ∫<br />

dy(x)m(x)<br />

dx = m(x)b(x)dx + costante<br />

dx<br />

∫<br />

y(x)m(x) = m(x)b(x)dx + costante<br />

y(x) = 1 (∫<br />

)<br />

m(x)b(x)dx + costante<br />

m(x)<br />

7. Riscrivendo la funzione m(x) come e A(x) si ha<br />

(∫<br />

)<br />

y(x) = e −A(x) e A(x) b(x)dx + costante<br />

L’integrale è generale perchè <strong>di</strong>pende da una costante.<br />

Osserviamo, inoltre, che se a(x) e b(x) sono continue in un certo intervallo [a, b], allora il<br />

problema <strong>di</strong> Cauchy che possiamo associare a questa equazione <strong>di</strong>fferenziale si può risolvere<br />

globalmente in [a, b]×R poichè valgono le ipotesi del teorema <strong>di</strong> esistenza e unicità globale (la<br />

funzione f = b(x)−a(x)y è continua e la derivata ∂f = −a(x) è continua e limitata (poichè a(x)<br />

∂y<br />

<strong>di</strong>pende solo da x ed è continua in un intervallo chiuso allora ammette minimo e massimo,<br />

cioè è limitata).<br />

124


8.6. Metodo <strong>di</strong> separazione delle variabili<br />

Esempio<br />

Es. 8.5.1 Risolviamo l’equazione <strong>di</strong>fferenziale y ′ + 4xy = x. In questo esempio a(x) = 4x<br />

e b(x) = x. Applichiamo il proce<strong>di</strong>mento appena descritto.<br />

G A(x) = ∫ a(x)dx = ∫ 4xdx = 2x 2 da cui m(x) = e 2x2 .<br />

G Moltiplichiamo l’equazione <strong>di</strong>fferenziale per m(x) ricavando:<br />

e 2x2 y ′ (x) + e 2x2 4xy(x) = e 2x2 x<br />

G Abbiamo allora<br />

dy(x)e 2x2<br />

dx<br />

= e 2x2 x<br />

G Integrando ambo i membri e <strong>di</strong>videndo poi per e 2x2 si ha<br />

∫<br />

y(x) = e −2x2 e 2x2 xdx<br />

Dobbiamo quin<strong>di</strong> calcolare ∫ e 2x2 xdx: considerando che la derivata dell’esponente è<br />

4x, basta moltiplicare e <strong>di</strong>videre per 4 ottenendo:<br />

∫<br />

e 2x2 xdx = 1 ∫<br />

4xe 2x2 dx = 1 ∫<br />

D(2x 2 )e 2x2 dx = 1 + costante<br />

4<br />

4<br />

4 e2x2<br />

Quin<strong>di</strong><br />

y(x) = e −2x2 ( 1 4 e2x2 + costante) = 1 4 + Ce−2x2<br />

dove C rappresenta la costante.<br />

8.6 Metodo <strong>di</strong> separazione delle variabili<br />

Se un’equazione <strong>di</strong>fferenziale del primo or<strong>di</strong>ne può essere scritta nella forma<br />

y ′ (x) = p(x)q(y)<br />

con p(x) e q(y) continue, allora l’equazione si <strong>di</strong>ce a variabili separabili.<br />

Ve<strong>di</strong>amo come si risolve questa equazione nel caso in cui q(y) ≠ 0 per ogni y. In tal caso,<br />

possiamo <strong>di</strong>videre ambo i membri per q(y), ottenendo<br />

y ′ (x)<br />

q(y) = p(x)<br />

Integriamo ambo i membri dell’equazione rispetto a x, ricavando:<br />

∫<br />

y ′ ∫<br />

(x)<br />

q(y(x)) dx = p(x)dx (8.2)<br />

In modo equivalente possiamo scrivere anche<br />

∫<br />

∫<br />

1<br />

q(y) dy = p(x)dx<br />

125


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

Sia Q(y) una primitiva <strong>di</strong><br />

dQ(y(x))<br />

dx<br />

= dQ(y(x))<br />

dy<br />

1<br />

e P una primitiva <strong>di</strong> p. Vuol <strong>di</strong>re che<br />

q(y)<br />

dy<br />

dx = 1<br />

q(y(x)) y′ (x),<br />

dP (x)<br />

mentre = p(x). Tornando alla relazione 8.2, poichè abbiamo trovato le primitive <strong>di</strong><br />

dx<br />

ciascuno dei due integrali, si ha<br />

Q(y(x)) = P (x) + costante<br />

Se è possibile esplicitare la y allora abbiamo una forma esplicita della soluzione (e questo<br />

lo si ha se la Q è invertibile), altrimenti abbiamo una forma implicita della soluzione me<strong>di</strong>ante<br />

la relazione Q(y(x)) − P (x) = costante.<br />

Esempio<br />

Es. 8.6.1 Sia da risolvere il problema <strong>di</strong> Cauchy, y ′ = x2<br />

con la con<strong>di</strong>zione iniziale y(0) =<br />

y2 4.<br />

Risolviamo prima l’equazione <strong>di</strong>fferenziale, applicando il metodo <strong>di</strong> separazione delle<br />

variabili (p(x) = x 2 , q(y) = 1 ). Separando le variabili infatti, abbiamo da risolvere:<br />

y2 ovvero<br />

∫ ∫<br />

y 2 dy = x 2 dx<br />

y 3<br />

3 = x3<br />

3 + costante<br />

Risolvendo ora per y (che è funzione <strong>di</strong> x) otteniamo:<br />

y(x) = (x 3 + 3costante) 1/3<br />

Poichè la costante è arbitraria possiamo scrivere C = 3costante ricavando<br />

y(x) = (x 3 + C) 1/3<br />

Imponiamo ora la con<strong>di</strong>zione iniziale y(0) = 4. Deve essere 4 = (C) 1/3 da cui C = 4 3 = 64.<br />

Quin<strong>di</strong> la soluzione del problema è data da y(x) = (x + 64) 1/3 .<br />

8.7 Risoluzione <strong>di</strong> alcuni tipi <strong>di</strong> equazioni <strong>di</strong>fferenziali<br />

G Sia data un’equazione <strong>di</strong>fferenziale del secondo or<strong>di</strong>ne, in cui manca il termine in y:<br />

F (x, y ′ , y ′′ ) = 0<br />

In tal caso, si pone z(x) = y ′ (x), da cui z ′ (x) = y ′′ (x).<br />

trasformata <strong>di</strong>venta:<br />

F (x, z, z ′ ) = 0<br />

L’equazione <strong>di</strong>fferenziale<br />

Abbiamo un’equazione <strong>di</strong>fferenziale del primo or<strong>di</strong>ne nella incognita z. Una volta trovata<br />

z soluzione dell’equazione <strong>di</strong>fferenziale, quin<strong>di</strong> z = z(x, cost 1 ), si ricava y cercando<br />

una primitiva <strong>di</strong> z:<br />

∫<br />

y(x) = z(x, cost 1 )dx + cost 2<br />

126


8.8. Le equazioni <strong>di</strong>fferenziali lineari<br />

G Se l’equazione <strong>di</strong>fferenziale del secondo or<strong>di</strong>ne non <strong>di</strong>pende esplicitamente da x<br />

F (y, y ′ , y ′′ ) = 0<br />

allora si pensa y come variabile in<strong>di</strong>pendente e si si pone z(y) = y ′ .<br />

Allora (considerando che y è funzione <strong>di</strong> x e z è funzione <strong>di</strong> y):<br />

y ′′ = dy′<br />

dx = dz(y)<br />

dx<br />

= dz dy<br />

dy dx = z′ z<br />

Quin<strong>di</strong> l’equazione <strong>di</strong>fferenziale <strong>di</strong>venta<br />

F (y, z, z ′ z) = 0<br />

Se si trova un’integrale generale <strong>di</strong> questa equazione, z = z(y, cost), allora, per trovare<br />

y, dalla relazione y ′ = z(y, cost) si ricava la soluzione y osservando che questa che<br />

abbiamo appena scritto è un’equazione <strong>di</strong>fferenziale a variabili separabili.<br />

G Ci sono molti altri casi <strong>di</strong> equazioni <strong>di</strong>fferenziali non lineari che presentano una forma<br />

particolare e che possono essere risolte me<strong>di</strong>ante tecniche ad hoc. Non stiamo però a<br />

stu<strong>di</strong>arle in questa sede.<br />

8.8 Le equazioni <strong>di</strong>fferenziali lineari<br />

Ripren<strong>di</strong>amo l’esempio visto quando abbiamo introdotto le equazioni <strong>di</strong>fferenziali:<br />

y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y = b(x)<br />

dove i coefficienti a 0 (x), a 1 (x), . . . , a n−1 (x) e b(x) sono assegnate funzioni continue, che <strong>di</strong>pendono<br />

dalla variabile x, mentre y è la funzione incognita e compare insieme alle sue derivate<br />

fino a quella <strong>di</strong> or<strong>di</strong>ne n.<br />

Un’equazione <strong>di</strong>fferenziale scritta in questa forma, prende il nome <strong>di</strong> equazione<br />

<strong>di</strong>fferenziale lineare, perchè è lineare rispetto a y e alle sue derivate.<br />

G Se ciascuna funzione a i (x), per i = 0, 2, . . . , n−1 è costante rispetto alla variabile x, allora<br />

l’equazione <strong>di</strong>fferenziale prende il nome <strong>di</strong> equazione <strong>di</strong>fferenziale lineare a coefficienti<br />

costanti.<br />

G Se b(x) = 0 per ogni valore <strong>di</strong> x, allora l’equazione si <strong>di</strong>ce equazione <strong>di</strong>fferenziale<br />

omogenea.<br />

G Se b(x) ≠ 0 allora l’equazione si <strong>di</strong>ce equazione <strong>di</strong>fferenziale non omogenea.<br />

L’equazione che si ha ponendo b(x) ≡ 0 si <strong>di</strong>ce equazione omogenea associata<br />

all’equazione <strong>di</strong> partenza in cui b(x) ≠ 0.<br />

Per quanto riguarda il problema <strong>di</strong> Cauchy associato ad un’equazione <strong>di</strong>fferenziale lineare<br />

<strong>di</strong> or<strong>di</strong>ne n, vale il seguente teorema.<br />

Teorema 8.8.1 Se le funzioni a 0 (x), a 1 (x), . . . , a n−1 (x) sono continue in un intervallo [a, b], allora<br />

il problema <strong>di</strong> Cauchy<br />

⎧<br />

y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y = b(x)y(x 0 ) = y 0<br />

y ⎪⎨<br />

′ (x 0 ) = y 0<br />

′<br />

y ′′ (x 0 ) = y 0<br />

′′<br />

.<br />

⎪⎩<br />

y (n−1) (x 0 ) = y (n−1)<br />

0<br />

ammette sempre un’unica soluzione y(x) qualunque sia il punto (x 0 , y 0 , y ′ 0, . . . , y (n−1)<br />

0 ) associato<br />

alle con<strong>di</strong>zioni iniziali.<br />

127


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

Dimostrazione.<br />

Infatti, l’equazione <strong>di</strong>fferenziale si può scrivere come<br />

y (n) = f(x, y, y ′ , . . . , y (n−1) )<br />

con f(x, y, y ′ , . . . , y (n−1) ) = b(x) − a n−1 (x)y (n−1) − . . . − a 1 (x)y ′ − a 0 (x)y.<br />

Riscrivendo la f come una funzione <strong>di</strong>pendente da x e da un punto Y = (y 1 , y 2 , . . . , y n ),<br />

(quin<strong>di</strong> f(x, Y ) = b(x) − a n−1 (x)y n − . . . a 1 (x)y 2 − a 0 (x)y 1 ) si ha che<br />

∂f<br />

∂y i<br />

= −a i−1 (x)<br />

Quin<strong>di</strong> ciascuna derivata è una funzione continua e limitata in [a, b] per cui sono sod<strong>di</strong>sfatte<br />

le ipotesi del teorema <strong>di</strong> Cauchy in grande, qualcunque sia il punto iniziale assegnato.<br />

✔<br />

Per provare alcune proprietà generali delle equazioni <strong>di</strong>fferenziali lineari, conviene introdurre<br />

alcune notazioni. La prima consiste nel vedere l’equazione <strong>di</strong>fferenziale come il<br />

risultato <strong>di</strong> un operatore L applicato alla funzione y(x).<br />

Introduciamo dunque l’operatore L che agisce su una funzione f(x) nel modo seguente:<br />

L(f) = f (n) + a n−1 (x)f (n−1) + a n−2 (x)f (n−2) + . . . + a 0 (x)f<br />

Introducendo i simboli D e D n per in<strong>di</strong>care la derivata prima e la derivata n-sima rispetto<br />

a x, D = d<br />

dx , Dn = dn<br />

, l’operatore L si può scrivere come<br />

dxn L = D n + a n−1 (x)D n−1 + a n−2 (x)D n−2 + . . . + a 0 (x)<br />

Allora l’equazione <strong>di</strong>fferenziale lineare<br />

y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y = b(x)<br />

può essere scritta come<br />

L(y) = b(x)<br />

Difatti:<br />

L(y) = (D n + a n−1 (x)D n−1 + a n−2 (x)D n−2 + . . . + a 0 (x))y<br />

= D n (y) + a n−1 (x)D n−1 (y) + . . . + a 0 (x)y<br />

= y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y<br />

Usando l’operatore L, è facile dedurre, facendo uso delle proprietà delle derivate, che vale:<br />

1. L(y 1 + y 2 ) = L(y 1 ) + L(y 2 )<br />

2. L(αy) = αL(y), dove α è una costante.<br />

Queste due proprietà <strong>di</strong>cono che L è un operatore lineare.<br />

Quin<strong>di</strong>, dato l’operatore L appena definito:<br />

G L(y) = b(x) è un’equazione <strong>di</strong>fferenziale lineare non omogenea. La funzione b(x) prende<br />

il nome <strong>di</strong> termine noto dell’equazione <strong>di</strong>fferenziale.<br />

G L(y) = 0 è l’equazione <strong>di</strong>fferenziale omogenea (il termine noto vale zero) associata<br />

all’equazione <strong>di</strong>fferenziale precedente, in quanto l’operatore L è lo stesso.<br />

Possiamo stabilire questo risultato.<br />

Teorema 8.8.2 Se y 1 , y 2 , . . . , y m sono un numero finito m <strong>di</strong> soluzioni dell’equazione <strong>di</strong>fferenziale<br />

lineare omogenea L(y) = 0, allora anche ogni funzione data da c 1 y 1 + c 2 y 2 + . . . + c m y m ,<br />

con c 1 , c 2 , . . . , c m costanti <strong>di</strong> R, è soluzione <strong>di</strong> L(y) = 0,<br />

128


8.8. Le equazioni <strong>di</strong>fferenziali lineari<br />

Dimostrazione. La <strong>di</strong>mostrazione segue dal fatto che L è un operatore lineare. Da<br />

L(y 1 ) = 0, L(y 2 ) = 0, . . . L(y m ) = 0, e applicando la linearità <strong>di</strong> L, si ha<br />

✔<br />

L(c 1 y 1 + c 2 y 2 + . . . + c m y m ) = L(c 1 y 1 ) + L(c 2 y 2 ) + . . . L(c m y m )<br />

= c 1 L(y 1 ) + c 2 L(y 2 ) + . . . + c m L(y m )<br />

= 0<br />

Teorema 8.8.3 Data l’equazione <strong>di</strong>fferenziale L(y) = 0 con le funzioni a 0 (x), a 1 (x), . . . , a n−1 (x)<br />

continue in un intervallo [a, b], allora per ogni x 0 ∈]a, b[, la funzione identicamente nulla è l’unica<br />

soluzione del problema <strong>di</strong> Cauchy L(y) = 0 con con<strong>di</strong>zioni iniziali date da<br />

y(x 0 ) = 0, y ′ (x 0 ) = 0, . . . , y (n−1) (x 0 ) = 0<br />

Dimostrazione. La <strong>di</strong>mostrazione segue dal teorema <strong>di</strong> esistenza ed unicità del problema<br />

<strong>di</strong> Cauchy, considerando che la funzione nulla risolve l’equazione <strong>di</strong>fferenziale con le<br />

con<strong>di</strong>zioni iniziali tutte nulle. ✔<br />

Chiamiamo con il simbolo N l’insieme delle soluzioni <strong>di</strong> un’equazione <strong>di</strong>fferenziale lineare<br />

omogenea data me<strong>di</strong>ante l’operatore L. Questo insieme prende il nome <strong>di</strong> spazio nullo<br />

dell’operatore L. L’insieme N è uno spazio vettoriale sul campo dei reali.<br />

8.8.1 Cosa è uno spazio vettoriale<br />

Consideriamo un insieme N (non necessariamente quello <strong>di</strong> prima), costituito da funzioni<br />

reali definite in R. Sia 0 lo zero <strong>di</strong> N, vale a <strong>di</strong>re la funzione identicamente nulla.<br />

N è uno spazio vettoriale (sui reali), se:<br />

G è possibile definire un’operazione interna + sugli elementi dell’insieme N, chiamata<br />

somma, che gode della proprietà associativa e commutativa, per la quale esiste<br />

l’elemento neutro (lo zero), e ogni elemento ha l’opposto.<br />

G è possibile definire un’operazione esterna · <strong>degli</strong> elementi <strong>di</strong> N sui reali, chiamata<br />

prodotto per la quale<br />

– per ogni c 1 e c 2 in R e per ogni f in N, si ha (c 1 c 2 ) · f = c 1 · (c 2 · f)<br />

– per ogni c 1 e c 2 in R e per ogni f in N, si ha (c 1 + c 2 ) · f = (c 1 · f) + (c 2 · f)<br />

– per ogni c in R e per ogni f e g in N, si ha c · (f + g) = c · f + c · g<br />

– per ogni f in N, si ha 1 · f = f<br />

Un elemento dello spazio vettoriale prende il nome <strong>di</strong> vettore.<br />

Siano ora y 1 , y 2 , . . . , y n n elementi dello spazio vettoriale N. Si <strong>di</strong>ce combinazione lineare<br />

dei vettori y 1 , y 2 , . . . , y n me<strong>di</strong>ante i coefficienti c 1 , c 2 , . . . , c n <strong>di</strong> R, il vettore dato da<br />

c 1 y 1 + c 2 y 2 + . . . c n y n .<br />

Gli n vettori y 1 , y 2 , . . . , y n si <strong>di</strong>cono linearmente in<strong>di</strong>pendenti se l’unica combinazione<br />

lineare dei vettori y 1 , y 2 , . . . , y n che produce il vettore nullo è data da coefficienti tutti nulli:<br />

c 1 y 1 + c 2 y 2 + . . . c n y n = 0 ⇐⇒ c 1 = c 2 = . . . = c n = 0<br />

Se uno spazio vettoriale ha n vettori linearmente in<strong>di</strong>pendenti allora si <strong>di</strong>ce che lo spazio<br />

ha <strong>di</strong>mensione n. I vettori linearmente in<strong>di</strong>pendenti costituiscono una base dello spazio.<br />

Ogni funzione dello spazio può essere ottenuta me<strong>di</strong>ante una combinazione lineare della<br />

base, cioè dei suoi vettori linearmente in<strong>di</strong>pendenti.<br />

129


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

8.9 L’equazione omogenea<br />

Torniamo all’equazione <strong>di</strong>fferenziale omogenea L(y) = 0 e cerchiamo <strong>di</strong> caratterizzare le<br />

sue soluzioni.<br />

Sia L(y) = y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y e sia data l’equazione <strong>di</strong>fferenziale<br />

L(y) = 0.<br />

Siano y 1 , y 2 , . . . , y n n integrali particolari, per x ∈ [a, b], dell’equazione <strong>di</strong>fferenziale omogenea.<br />

Per capire se questi integrali sono linearmente in<strong>di</strong>pendenti, abbiamo bisogno <strong>di</strong> introdurre<br />

il cosiddetto determinante wronskiano o, semplicemente, il wronskiano delle funzioni<br />

y 1 , y 2 , . . . , y n , che è dato dalla funzione w(x) definita per x ∈ [a, b] me<strong>di</strong>ante il determinante<br />

y 1 (x) y 2 (x) . . . y n (x)<br />

y 1(x) ′ y 2(x) ′ . . . y ′ n(x)<br />

w(x) =<br />

y 1 ′′ (x) y 2 ′′ (x) . . . y n(x)<br />

′′<br />

. . . . . .<br />

∣y (n−1)<br />

1 (x) y (n−1)<br />

2 (x) . . . y n<br />

(n−1) (x) ∣<br />

Teorema 8.9.1 Sia dato l’operatore L definito tramite le n funzioni a 0 (x), a 1 (x), . . . , a n−1 (x),<br />

continue in un intervallo aperto ]a, b[⊂ R. Siano y 1 (x), y 2 (x), . . . , y n (x) n funzioni <strong>di</strong>verse da zero<br />

che sod<strong>di</strong>sfano l’equazione <strong>di</strong>fferenziale:<br />

L(y 1 ) = L(y 2 ) = · · · = L(y n ) = 0<br />

Con<strong>di</strong>zione necessaria e sufficiente affinchè le n soluzioni siano linearmente in<strong>di</strong>pendenti è<br />

che sia <strong>di</strong>verso da zero per ogni valore <strong>di</strong> x ∈]a, b[, il wronskiano w(x).<br />

Teorema 8.9.2 Lo spazio delle funzioni che sono soluzione dell’equazione omogenea L(y) = 0<br />

(lo spazio nullo N) ha <strong>di</strong>mensione n, ovvero, l’equazione omogenea L(y) = 0 ammette sempre<br />

un sistema <strong>di</strong> n integrali linearmente in<strong>di</strong>pendenti.<br />

Dimostrazione.<br />

Si fissi x 0 ∈ R e si considerino gli n problemi <strong>di</strong> Cauchy<br />

(1)L(y) = 0, y(x 0 ) = 1, y ′ (x 0 ) = 0, y ′′ (x 0 ) = 0, . . . y (n−1) (x 0 ) = 0<br />

(2)L(y) = 0, y(x 0 ) = 0, y ′ (x 0 ) = 1, y ′′ (x 0 ) = 0, . . . y (n−1) (x 0 ) = 0<br />

(3)L(y) = 0, y(x 0 ) = 0, y ′ (x 0 ) = 0, y ′′ (x 0 ) = 1, . . . y (n−1) (x 0 ) = 0<br />

.<br />

(n)L(y) = 0, y(x 0 ) = 0, y ′ (x 0 ) = 0, y ′′ (x 0 ) = 0, . . . y (n−1) (x 0 ) = 1<br />

Quin<strong>di</strong> l’i-mo problema <strong>di</strong> Cauchy ha con<strong>di</strong>zioni iniziali tutte nulle, eccetto la derivata<br />

y (i−1) che in x 0 vale 1.<br />

Per ciascuno <strong>di</strong> questi problemi <strong>di</strong> Cauchy, la soluzione esiste ed è unica (per il teorema<br />

<strong>di</strong> esistenza e unicità visto prima).<br />

Consideriamo ora il wronskiano delle n funzioni y i (per i = 1, 2, . . . , n) che sono soluzioni<br />

<strong>di</strong> questi problemi <strong>di</strong> Cauchy:<br />

130<br />

w(x) =<br />

∣<br />

y 1 (x) y 2 (x) . . . y n (x)<br />

y 1(x) ′ y 2(x) ′ . . . y n(x)<br />

′ y 1 ′′ (x) y 2 ′′ (x) . . . y n(x)<br />

′′<br />

. . . . . .<br />

1 (x) y (n−1)<br />

2 (x) . . . y n<br />

(n−1) (x) ∣<br />

y (n−1)


8.10. L’equazione non omogenea<br />

Valutiamo w(x) per x = x 0 . Si ha<br />

1 0 . . . 0<br />

0 1 . . . 0<br />

w(x 0 ) =<br />

. . . . . .<br />

∣0 0 . . . 1∣<br />

Risulta che w(x 0 ) è il determinante della matrice identità, che ha uno sugli elementi della<br />

<strong>di</strong>agonale principale e zero altrove. Il determinante <strong>di</strong> questa matrice vale 1, quin<strong>di</strong> è <strong>di</strong>verso<br />

da zero.<br />

Poichè x 0 è stato scelto in modo arbitrario in R, vuole <strong>di</strong>re che le n soluzioni dell’equazioni<br />

<strong>di</strong>fferenziali sono linearmente in<strong>di</strong>pendenti (in base al teorema 8.9.1).<br />

Abbiamo trovato dunque n funzioni linearmente in<strong>di</strong>pendenti che risolvono l’equazione<br />

omogenea L(y) = 0. Queste n funzioni costituiscono una base per lo spazio delle soluzioni<br />

dell’equazione L(y) = 0. ✔<br />

Definizione 8.9.1 Una n-pla <strong>di</strong> funzioni y 1 , y 2 , . . . , y n che sono soluzioni linearmente in<strong>di</strong>pendenti<br />

<strong>di</strong> L(y) = 0 prende il nome <strong>di</strong> sistema fondamentale <strong>di</strong> integrali <strong>di</strong> L(y) =<br />

0.<br />

Se conosciamo n soluzioni linearmente in<strong>di</strong>pendenti <strong>di</strong> L(y) = 0, la generica soluzione<br />

<strong>di</strong> L(y) = 0 è data da una combinazione lineare delle soluzioni linearmente in<strong>di</strong>pendenti.<br />

Questa generica soluzione prende il nome <strong>di</strong> integrale generale. Si ha il seguente teorema<br />

Teorema 8.9.3 (Sull’integrale generale <strong>di</strong> un’equazione omogenea) Dato un sistema fondamentale<br />

<strong>di</strong> integrali y 1 , y 2 , . . . , y n dell’equazione <strong>di</strong>fferenziale omogenea L(y) = 0, l’integrale<br />

generale è dato dalle combinazioni lineari<br />

y = c 1 y 1 + c 2 y 2 + . . . c n y n<br />

con c 1 , c 2 , . . . , c n costanti <strong>di</strong> R.<br />

8.10 L’equazione non omogenea<br />

Sia data ora un’equazione <strong>di</strong>fferenziale non omogenea<br />

L(y) = b(x)<br />

.<br />

Sappiamo che ad essa possiamo associare l’equazione <strong>di</strong>fferenziale omogenea<br />

L(y) = 0<br />

Se conosciamo un integrale particolare dell’equazione non omogenea, y, e conosciamo<br />

l’integrale generale dell’equazione omogenea associata, y, allora l’integrale generale dell’equazione<br />

non omogenea, che in<strong>di</strong>chiamo con η, è dato dalla somma <strong>di</strong> y e <strong>di</strong> y. Vale infatti il<br />

seguente teorema.<br />

Teorema 8.10.1 Dato y integrale particolare <strong>di</strong> L(y) = b(x), e dato l’integrale generale y <strong>di</strong><br />

L(y) = 0, allora l’integrale generale <strong>di</strong> L(y) = b(x) è dato da<br />

η = y + y<br />

131


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

Dimostrazione.<br />

Consideriamo η = y + y. Si ha<br />

L(η) = L(y + y)<br />

applicando la linearità <strong>di</strong> L<br />

= L(y) + L(y)<br />

ma L(y) = 0 e L(y) = b(x)<br />

= b(x)<br />

Quin<strong>di</strong> η è soluzione dell’equazione <strong>di</strong>fferenziale L(y) = b(x).<br />

Supponiamo che y ∗ sia un altro integrale particolare <strong>di</strong>verso da y, per l’equazione non<br />

omogenea, L(y ∗ ) = b(x), allora y ∗ = y ∗ − y risulta un integrale dell’omogenea associata, in<br />

quanto<br />

L(y ∗ ) = L(y ∗ − y) = L(y ∗ ) − L(y) = b(x) − b(x) = 0<br />

Quin<strong>di</strong> y ∗ si può scrivere come combinazione lineare <strong>di</strong> un sistema fondamentale <strong>di</strong> integrali<br />

dell’equazione omogenea, tramite dei coefficienti c 1 , c 2 , . . . , c n . Perciò y ∗ = y ∗ + y rientra come<br />

caso particolare (perchè y ∗ è caratterizzato da specifici coefficienti) dell’integrale generale<br />

η = y + y, cioè η = y + y è l’unico modo per rappresentare l’integrale generale dell’equazione<br />

non omogenea. ✔<br />

Quin<strong>di</strong> l’integrale generale dell’equazione <strong>di</strong>fferenziale L(y) = b(x), conoscendo n integrali<br />

linearmente in<strong>di</strong>pendenti dell’equazione omogenea associata, e un integrale particolare y<br />

della non omogenea, è dato da dato da<br />

y = c 1 y 1 + c 2 y 2 + . . . , c n y n + y<br />

8.11 Equazioni lineari a coefficienti costanti<br />

Data l’equazione <strong>di</strong>fferenziale<br />

y (n) + a n−1 (x)y (n−1) + . . . + a 1 (x)y ′ + a 0 (x)y = b(x)<br />

se a 0 (x) ≡ a 0 , a 1 (x) ≡ a 1 , . . . , a n−1 (x) = a n−1 , tutte le funzioni sono costanti in x, allora<br />

l’equazione <strong>di</strong>fferenziale prende il nome <strong>di</strong> equazione <strong>di</strong>fferenziale a coefficienti costanti:<br />

y (n) + a n−1 y (n−1) + . . . + a 1 y ′ + a 0 y = b(x)<br />

Per trovare l’integrale generale dell’equazione lineare a coefficienti costanti, si considera<br />

la cosiddetta equazione caratteristica, che si ricava dall’equazione <strong>di</strong>fferenziale omogenea<br />

associata, sostituendo alle derivate della funzione incognita le potenze della variabile z:<br />

P (z) = z n + a n−1 z n−1 + . . . + a 1 z + a 0 = 0<br />

Quin<strong>di</strong> a y (n) sostituiamo z n , a y (n−1) sostituiamo z n−1 m fino ad arrivare a y che sostituiamo<br />

con z 0 = 1. Il polinomio P (z) prende il nome <strong>di</strong> polimonio caratteristico. Si cercano le ra<strong>di</strong>ci<br />

del polinomio caratteristico, cioè i valori <strong>di</strong> z per cui P (z) = 0 e da queste ra<strong>di</strong>ci è possibile<br />

risalire (vedremo ora in che modo) all’integrale generale dell’equazione <strong>di</strong>fferenziale lineare<br />

omogenea. Occorre poi trovare un integrale particolare per l’equazione non omogenea.<br />

Ricor<strong>di</strong>amo che un polinomio <strong>di</strong> grado n ammette n ra<strong>di</strong>ci: queste ra<strong>di</strong>ci possono essere<br />

reali o complesse, e possono essere con molteplicità semplice o <strong>di</strong> un certo grado, ma tali<br />

che la somma dei gra<strong>di</strong> <strong>di</strong> ciascuna ra<strong>di</strong>ce <strong>di</strong>a il grado del polinomio. Ve<strong>di</strong>amo dei semplici<br />

esempi.<br />

132


8.11. Equazioni lineari a coefficienti costanti<br />

Esempio<br />

Es. 8.11.1 Consideriamo un polinomio <strong>di</strong> secondo grado. Sappiamo che, dato un polinomio<br />

<strong>di</strong> secondo grado P (z) = az 2 + bz + c, per trovare le ra<strong>di</strong>ci del polinomio, cioè quei<br />

valori <strong>di</strong> z per cui P (z) = 0 si ha la formula z = −b ± √ b 2 − 4ac<br />

, dove la quantità sotto<br />

2a<br />

ra<strong>di</strong>ce, b 2 − 4ac prende il nome <strong>di</strong> <strong>di</strong>scrimante e viene in<strong>di</strong>cato con il simbolo ∆.<br />

GSe ∆ = b 2 − 4ac > 0 si hanno due ra<strong>di</strong>ci reali <strong>di</strong>stinte.<br />

Esempio: P (z) = z 2 − 5z − 6.<br />

In questo caso ∆ = 25 + 24 = 49, da cui z = 5 ± 7<br />

2 . Si hanno due ra<strong>di</strong>ci <strong>di</strong>stinte: z 1 = 6 e<br />

z 2 = −1.<br />

GSe ∆ = b 2 − 4ac = 0 si hanno due ra<strong>di</strong>ci reali coincidenti (una ra<strong>di</strong>ce da contarsi due<br />

volte, o con molteplicità due).<br />

Esempio: P (z) = z 2 − 2z + 1. Qui ∆ = 4 − 4 = 0. Si ricava facilmente, o applicando la<br />

formula, o riconoscendo che P (z) = (z − 1) 2 , che la ra<strong>di</strong>ce è z = 1 da contarsi due volte,<br />

cioè z = 1 è una ra<strong>di</strong>ce con molteplicità doppia.<br />

GSe ∆ = b 2 − 4ac < 0, non si hanno ra<strong>di</strong>ci reali ma nel campo complesso, introducendo<br />

l’unità immaginaria i = √ −1, per cui √ b 2 − 4ac = √ (−1)(4ac − b 2 ) = i √ 4ac − b 2 , essendo<br />

ora 4ac − b 2 > 0.<br />

Esempio: P (z) = z 2 + 2z + 3. In questo caso ∆ = 4 − 12 = −8 Sotto ra<strong>di</strong>ce ho −8, quin<strong>di</strong> le<br />

ra<strong>di</strong>ci sono complesse.<br />

z = −2 ± i2√ 2<br />

2<br />

= −1 ± i √ 2<br />

Trovo due ra<strong>di</strong>ci z 1 = −1 + i √ 2 e z 2 = −1 − i √ 2.<br />

Queste due ra<strong>di</strong>ci sono complesse e coniugate, perchè la parte immaginaria delle due<br />

ra<strong>di</strong>ci è una l’opposta dell’altra.<br />

Un numero complesso, infatti, si può vedere come z = a + ib, con a e b numeri reali e i<br />

l’unità immaginaria. Il coniugato <strong>di</strong> z = a + ib è dato da z = a − ib.<br />

Per determinare l’integrale generale <strong>di</strong> un’equazione <strong>di</strong>fferenziale omogenea si vanno a<br />

cercare le ra<strong>di</strong>ci del polinomio caratteristico. Supponiamo che il polimonio caratteristico<br />

abbia n ra<strong>di</strong>ci reali tutte <strong>di</strong>stinte tra <strong>di</strong> loro, γ 1 , γ 2 , . . . , γ n , allora le funzioni y(x) = e γix<br />

sono soluzioni particolari dell’equazione <strong>di</strong>fferenziale. Infatti da y(x) = e γx si ha y ′ = γe γx ,<br />

y ′′ = γ 2 e γx , . . . , y (n) = γ n e γx . Se an<strong>di</strong>amo a sostituire nell’equazione <strong>di</strong>fferenziale, ricaviamo<br />

L(y) = L(e γx )<br />

= γ n e γx + a n−1 γ n−1 e γx + . . . + a 1 γe γx + a 0 e γx<br />

metto in evidenza e γx<br />

= (γ n + a n−1 γ n−1 + . . . + a 1 γ + a 0 )e γx<br />

= P (γ)e γx<br />

ma γ è ra<strong>di</strong>ce dell’equazione caratteristica<br />

= 0<br />

Quin<strong>di</strong> y = e γx è soluzione dell’equazione <strong>di</strong>fferenziale lineare omogenea.<br />

In genere, però, un polinomio <strong>di</strong> grado n può avere ra<strong>di</strong>ci reali che si ripetono (che hanno<br />

una certa molteplicità), o ra<strong>di</strong>ci reali insieme a ra<strong>di</strong>ci complesse e coniugate (e anche queste<br />

ra<strong>di</strong>ci possono avere una certa molteplicità).<br />

Per ricavare l’integrale generale <strong>di</strong> un’equazione lineare omogenea, viene in aiuto il<br />

seguente teorema.<br />

133


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

Teorema 8.11.1 Siano γ 1 , γ 2 , . . . , γ h h ra<strong>di</strong>ci reali del polinomio caratteristico, ciascuna delle<br />

quali ha rispettivamente molteplicità r 1 , . . . , r h mentre siano α 1 ± iβ 1 , α 2 ± iβ 2 , . . . , α l ± iβ k 2k<br />

ra<strong>di</strong>ci complesse e coniugate con molteplicità, rispettivamente, s 1 , s 2 , . . . , s k .<br />

La molteplicità delle ra<strong>di</strong>ci è tale che r 1 + r 2 + . . . + r h + 2(s 1 + s 2 + . . . + s k ) = n.<br />

Allora le n funzioni<br />

e γpx , xe γpx , . . . x rp−1 e γpx , per p = 1, 2, . . . , h<br />

e αqx cos (β q x), e αqx sin (β q x), xe αqx cos (β q x), xe αqx sin (β q x), . . . ,<br />

x sq−1 e αqx cos (β q x), x sq−1 e αqx sin (β q x), per q = 1, 2, . . . , k<br />

sono n soluzioni reali dell’equazione <strong>di</strong>fferenziale omogenea linearmente in<strong>di</strong>pendenti.<br />

Scritto in forma meno compatta, vuol <strong>di</strong>re che se l’equazione caratteristica ha n ra<strong>di</strong>ci,<br />

in parte reale e in parte complesse coniugate, così come sono state descritte nel teorema, si<br />

hanno le seguenti soluzioni per l’equazione lineare:<br />

G dalle ra<strong>di</strong>ci reali del polinomio caratteristico si hanno i seguenti integrali:<br />

e γ1x xe γ1x x 2 e γ1x . . . x r1−1 e γ1x<br />

e γ2x xe γ2x x 2 e γ2x . . . x r2−1 e γ2x<br />

e γ3x xe γ3x x 2 e γ3x . . . x r3−1 e γ3x<br />

. . . . . . .<br />

e γ hx<br />

xe γ hx<br />

x 2 e γ hx<br />

. . . x rh−1 e γ hx<br />

G dalle ra<strong>di</strong>ci complesse e coniugate del polinomio caratteristico si hanno i seguenti<br />

integrali:<br />

e α1x cos (β 1 x) e α1x sin (β 1 x) xe α1x cos (β 1 x) xe α1x sin (β 1 x)<br />

x 2 e α1x cos (β 1 x) x 2 e α1x sin (β 1 x) . . . . . .<br />

. . . . . . x s1−1 e α1x cos (β 1 x) x s1−1 e α1x sin (β 1 x)<br />

e α2x cos (β 2 x) e α2x sin (β 2 x) xe α2x cos (β 2 x) xe α2x sin (β 2 x)<br />

x 2 e α2x cos (β 2 x) x 2 e α2x sin (β 2 x) . . . . . .<br />

. . . . . . x s2−1 e α2x cos (β 2 x) x s2−1 e α2x sin (β 2 x)<br />

e α3x cos (β 3 x) e α3x sin (β 3 x) xe α3x cos (β 3 x) xe α3x sin (β 3 x)<br />

x 2 e α3x cos (β 3 x) x 2 e α3x sin (β 3 x) . . . . . .<br />

. . . . . . x s3−1 e α3x cos (β 3 x) x s3−1 e α3x sin (β 3 x)<br />

.<br />

.<br />

.<br />

.<br />

e αkx cos (β k x) e αkx sin (β k x) xe αkx cos (β k x) xe αkx sin (β k x)<br />

x 2 e αkx cos (β k x) x 2 e αkx sin (β k x) . . . . . .<br />

. . . . . . x sk−1 e αkx cos (β k x) x sk−1 e αkx sin (β k x)<br />

L’integrale generale è dato da una combinazione lineare <strong>di</strong> tutte queste soluzioni particolari.<br />

Quin<strong>di</strong> l’integrale generale dell’equazione <strong>di</strong>fferenziale omogenea è dato dalle combinazioni<br />

lineari delle soluzioni linearmente in<strong>di</strong>pendenti trovate.<br />

Esempio<br />

Es. 8.11.2 Sia data l’equazione lineare omogenea y ′′ − 4y = 0.<br />

L’equazione caratteristica è data da P (z) = z 2 − 4 = 0<br />

Le ra<strong>di</strong>ci <strong>di</strong> questa equazione sono date da z 1 = 2, z 2 = −2. Sono due ra<strong>di</strong>ci reali, con<br />

molteplicità uno.<br />

L’integrale generale dell’equazione <strong>di</strong>fferenziale è dunque dato da<br />

y(x) = c 1 e 2x + c 2 e −2x<br />

134


8.12. Metodo dei coefficienti indeterminati<br />

Esempio<br />

Es. 8.11.3 Sia ora y ′′ + 2y ′ + y = 0. Ora l’equazione caratteristica è data da P (z) =<br />

z 2 + 2z + 1 = 0, che ha come ra<strong>di</strong>ci z = −1 con molteplicità doppia.<br />

In tal caso l’integrale generale è dato da<br />

Esempio<br />

y(x) = c 1 e −x + c 2 xe −x<br />

Es. 8.11.4 Sia data l’equazione <strong>di</strong>fferenziale y ′′ + 2y ′ + 3 = 0. Adesso si ha, per l’equazione<br />

caratteristica, P (z) = z 2 + 2z + 3 = 0 che ha due ra<strong>di</strong>ci complesse e coniugate<br />

z 1 = −1 + i √ 2 e z 2 = −1 − i √ 2. La parte reale è a = −1 la parte complessa è b = √ 2, quin<strong>di</strong><br />

l’integrale generale è<br />

y(x) = c 1 e −x cos ( √ 2x) + c 2 e −x sin ( √ 2x)<br />

Se, invece, interessa la soluzione generale dell’equazione <strong>di</strong>fferenziale non omogenea,<br />

dobbiamo trovare, oltre all’integrale generale dell’omogenea associata, anche un integrale<br />

particolare dell’equazione non omogenea visto che l’integrale generale è dato dalla somma<br />

dell’integrale generale dell’omogenea associata e dell’integrale particolare della non<br />

omogenea (in base al teorema 8.10.1).<br />

Il problema <strong>di</strong> trovare l’integrale generale <strong>di</strong> un’equazione <strong>di</strong>fferenziale non omogenea<br />

L(y) = b(x) si riconduce alla soluzione <strong>di</strong> due problemi:<br />

1. trovare l’integrale generale dell’equazione omogenea associata L(y) = 0<br />

2. trovare un integrale particolare dell’equazione non omogenea L(y) = b(x)<br />

8.12 Metodo dei coefficienti indeterminati<br />

Per alcune funzioni b(x) è possibile trovare l’integrale particolare in modo abbastanza<br />

semplice, applicando il cosiddetto metodo dei coefficienti indeterminati. Ecco un elenco <strong>di</strong><br />

possibili casi per b(x).<br />

G Sia b(x) = P (x), un polinomio <strong>di</strong> grado p. Se nell’equazione <strong>di</strong>fferenziale, a 0 ≠ 0 , allora<br />

come soluzione particolare si ha y = Q(x), dove Q(x) è un polinomio <strong>di</strong> grado al più<br />

p (si va a cercare un polinomio dello stesso grado del termine noto che sia soluzione<br />

particolare dell’equazione non omogenea).<br />

G Se b(x) = P (x) polinomio <strong>di</strong> grado p, ma a 0 = a 1 = . . . = a r−1 = 0 con r − 1 ≤ n − 1<br />

(ciò equivale a <strong>di</strong>re che nell’equazione caratteristica associata si ha la ra<strong>di</strong>ce z = 0 con<br />

molteplicità r) allora si ha come soluzione particolare y = x r Q(x) polinomio <strong>di</strong> grado al<br />

più p.<br />

G Sia b(x) = e αx P (x) con α ∈ R e P (x) polinomio <strong>di</strong> grado p,<br />

– Se α non è ra<strong>di</strong>ce dell’eq. caratteristica, allora y = e αx Q(x), con Q(x) polinomio <strong>di</strong><br />

grado al più p.<br />

– Se α è ra<strong>di</strong>ce dell’eq. caratteristica, con molteplicità r, allora y = x r e αx Q(x) con<br />

Q(x) polinomio <strong>di</strong> grado al più p.<br />

G Sia b(x) = e αx cos(βx)P (x) oppure b(x) = e αx sin(βx)P (x) oppure b(x) = e αx (cos(βx) +<br />

sin(βx))P (x), con α, β ∈ R e P (x) polinomio <strong>di</strong> grado p<br />

– Se α ± iβ non è ra<strong>di</strong>ce dell’eq. caratteristica, allora y = e αx (cos(βx)Q 1 (x) +<br />

sin(βx)Q 2 (x)) con Q 1 e Q 2 polinomi <strong>di</strong> grado al più p.<br />

– Se α ± iβ è ra<strong>di</strong>ce dell’eq. caratteristica con molteplicità r, allora y =<br />

x r e αx (cos(βx)Q 1 (x) + sin(βx)Q 2 (x)) con Q 1 e Q 2 polinomi <strong>di</strong> grado al più p.<br />

Se il termine noto b(x) è dato dalla somma <strong>di</strong> funzioni, ciascuna delle quali si può ricondurre<br />

ad uno dei casi descritti sopra, allora l’integrale particolare è dato dalla somma <strong>degli</strong><br />

integrali particolari delle equazioni <strong>di</strong>fferenziali non omogenee legate a ciascun addendo<br />

135


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

della funzione <strong>di</strong> partenza. Infatti, se il termine noto è dato dalla somma <strong>di</strong> m funzioni,<br />

b(x) = b 1 (x)+b 2 (x)+. . .+b m (x), possiamo considerare sia l’equazione <strong>di</strong>fferenziale L(y) = b(x),<br />

sia le m equazioni <strong>di</strong>fferenziali L(y) = b 1 (x), L(y) = b 2 (x), . . . L(y) = b m (x).<br />

Siano y 1 , y 2 , . . . , y m m soluzioni particolari <strong>di</strong> queste m equazioni <strong>di</strong>fferenziali, allora vale<br />

L(y 1 + y 2 + . . . y m ) = L(y 1 ) + L(y 2 ) + . . . + L(y m )<br />

b 1 (x) + b 2 (x) + . . . + b m (x)<br />

= b(x)<br />

Quin<strong>di</strong> y = y 1 + y 2 + . . . + y m è soluzione dell’equazione <strong>di</strong>fferenziale L(y) = b(x).<br />

Ve<strong>di</strong>amo <strong>degli</strong> esempi sulla risoluzioni <strong>di</strong> equazioni <strong>di</strong>fferenziali non omogenee.<br />

Esempio<br />

Es. 8.12.1 Si voglia risolvere l’equazione <strong>di</strong>fferenziale<br />

y ′′ + y = 3x 2<br />

Per prima cosa risolviamo l’omogenea associata y ′′ + y = 0. L’equazione caratteristica è :<br />

z 2 + 1 = 0, da cui z = ±i: abbiamo due ra<strong>di</strong>ci complesse e coniugate. L’integrale generale<br />

è, dunque: y = c 1 cos (x) + c 2 sin (x).<br />

Cerchiamo ora un integrale particolare. Ve<strong>di</strong>amo che b(x) = 3x 2 , è un polinomio <strong>di</strong> secondo<br />

grado, e il coefficiente a 0 dell’equazione <strong>di</strong>fferenziale è <strong>di</strong>verso da zero. Quin<strong>di</strong><br />

l’integrale particolare deve essere un polinomio <strong>di</strong> secondo grado, del tipo y = ax 2 +bx+c,<br />

con a, b, c da determinare andando a sostituire y nell’equazione <strong>di</strong>fferenziale. Infatti deve<br />

essere<br />

y ′′ + y = 3x 2<br />

Da y = ax 2 + bx + c, si ha y ′ = 2ax + b e y ′′ = 2a. Andando a sostituire nell’equazione<br />

<strong>di</strong>fferenziale si ricava:<br />

2a + ax 2 + bx + c = 3x 2<br />

Ora i termini che hanno le stesse potenze <strong>di</strong> x a primo e a secondo membro vanno<br />

eguagliati:<br />

⎧<br />

⎪⎨ ax 2 = 3x 2<br />

bx = 0<br />

⎪⎩<br />

2a + c = 0<br />

Risolviamo questo sistema <strong>di</strong> 3 equazioni in 3 incognite, ottenendo a = 3, b = 0, c = −2a =<br />

−6. Perciò l’integrale particolare è dato da y = 3x 2 − 6.<br />

L’integrale generale dell’equazione <strong>di</strong>fferenziale non omogenea vale dunque: y =<br />

c 1 cos (x) + c 2 sin (x) + 3x 2 − 6.<br />

Esempio<br />

Es. 8.12.2 Sia da risolvere l’equazione <strong>di</strong>fferenziale<br />

y ′′ + 3y ′ + 2y = x + x 3 − e −x sin (2x)<br />

Per prima cosa cerchiamo le soluzioni dell’equazione omogenea associata. L’equazione<br />

caratteristica è : z 2 + 3z + 2 = 0, da cui le ra<strong>di</strong>ci reali z 1 = −1 e z 2 = −2. L’integrale<br />

generale dell’omogenea è dunque y = c 1 e −x + c 2 e −2x .<br />

136


8.12. Metodo dei coefficienti indeterminati<br />

Consideriamo ora il termine noto b(x) = x+x 3 −e −x sin (2x). Osserviamo come il termine<br />

noto possa essere visto come somma del polinomio P (x) = x + x 3 e della funzione<br />

−e −x sin (2x).<br />

Cerchiamo dunque un integrale particolare per l’equazione <strong>di</strong>fferenziale<br />

y ′′ + 3y ′ + 2y = x + x 3<br />

e un integrale particolare per l’equazione <strong>di</strong>fferenziale<br />

y ′′ + 3y ′ + 2y = −e −x sin (2x)<br />

Per il primo integrale, ve<strong>di</strong>amo che il termine noto è un polinomio <strong>di</strong> terzo grado e<br />

che il coefficiente a 0 ≠ 0, quin<strong>di</strong> l’integrale particolare è un polinomio <strong>di</strong> terzo grado<br />

y = ax 3 + bx 2 + cx + d. Derivando, si ha y ′ = 3ax 2 + 2bx + c e y ′′ = 6ax + 2b. Andando a<br />

sostituire nell’equazione <strong>di</strong>fferenziale si ha<br />

6ax + 2b + 3(3ax 2 + 2bx + c) + 2(ax 3 + bx 2 + cx + d) = x + x 3<br />

Raccogliendo i termini con le stesse potenze <strong>di</strong> x a primo membro, abbiamo<br />

2ax 3 + (9a + 2b)x 2 + (6a + 6b + 2c)x + 2b + 3c + 2d = x + x 3<br />

Uguagliando i termini con le stesse potenze a primo e a secondo membro si ha:<br />

⎧<br />

2a = 1<br />

⎪⎨<br />

9a + 2b = 0<br />

6a + 6b + 2c = 1<br />

⎪⎩<br />

2b + 3c + 2d = 0<br />

Otteniamo a = 1/2, b = − 9 2 a = −9 1 − 6a − 6b<br />

, c =<br />

4 2<br />

y = x3<br />

2 − 9 4 x2 + 23 4 x − 51<br />

8 .<br />

= 23 4<br />

, d =<br />

−2b − 3c<br />

2<br />

= − 51 , da cui<br />

8<br />

Passiamo ora a trovare un integrale particolare per la seconda equazione <strong>di</strong>fferenziale<br />

che abbiamo ricavato che ha come termine noto la funzione −e −x sin (2x). Riconducendoci<br />

allo schema che abbiamo fatto per i vari casi <strong>di</strong> termini noto, questo si<br />

riconduce alla funzione del tipo e αx sin (βx)P (x), dove α = −1, β = 2, P (x) = −1 (polinomio<br />

<strong>di</strong> grado 0). Poichè −1 ± i2 non è ra<strong>di</strong>ce dell’equazione caratteristica (che ha<br />

nel nostro caso solo ra<strong>di</strong>ci reali), dobbiamo cercare un integrale particolare del tipo<br />

y = e −x (cos (2x)a + sin (2x)b) (devono essere Q 1 eQ 2<br />

costanti).<br />

Allora,<br />

y ′ = −e −x (a cos (2x) + b sin (2x)) + e −x (−2a sin (2x) + 2b cos (2x))<br />

= e −x ((2b − a) cos (2x) − (b + 2a) sin (2x))<br />

polinomi <strong>di</strong> grado zero, cioè delle<br />

y ′′ = −e −x ((2b − a) cos (2x) − (b + 2a) sin (2x))+<br />

e −x (−2(2b − a) sin (2x) − 2(b + 2a) cos (2x))<br />

= e −x ((−4b − 3a) cos (2x) + (4a − 3b) sin (2x))<br />

137


8. EQUAZIONI DIFFERENZIALI ORDINARIE<br />

Andando a sostituire nell’equazione <strong>di</strong>fferenziale, si ottiene:<br />

e −x ((−4b − 3a) cos (2x) + (4a − 3b) sin (2x))+<br />

3(e −x ((2b − a) cos (2x) − (b + 2a) sin (2x))+<br />

2(e −x (a cos (2x) + b sin (2x)) = −e −x sin (2x)<br />

Si può semplificare l’equazione <strong>di</strong>videndo ambo i membri per e −x .<br />

termini in sin (2x) e cos (2x) si ha:<br />

Raccogliendo i<br />

(2b − 4a) cos (2x) + (−4b − 2a) sin (2x) = − sin (2x)<br />

Quin<strong>di</strong>:<br />

{<br />

2b − 4a = 0<br />

−4b − 2a = −1<br />

Risolvendo il sistema si trova a = 1<br />

10 e b = 1 5 da cui y = e−x ( 1<br />

10 cos (2x) + 1 sin (2x)).<br />

5<br />

Concludendo, l’integrale generale dell’equazione <strong>di</strong>fferenziale non omogenea da cui<br />

siamo partiti è dato da:<br />

y = c 1 exp −x + c 2 exp −2x + x3<br />

2 − 9 4 x2 + 23 4 x − 51 8 + e−x ( 1<br />

10 cos (2x) + 1 sin (2x))<br />

5<br />

Se si ha un problema <strong>di</strong> Cauchy, si risolve prima l’equazione <strong>di</strong>fferenziale cercando un<br />

integrale generale. Successivamente, le costanti vengono determinate in base alle con<strong>di</strong>zioni<br />

iniziali date dal problema.<br />

138


CAPITOLO 9<br />

Forme <strong>di</strong>fferenziali<br />

Nel campo della matematica,<br />

se trovo un nuovo approccio a<br />

un problema, ci può essere<br />

sempre un altro matematico<br />

che sostiene <strong>di</strong> aver trovato<br />

una soluzione migliore, o<br />

semplicemente più elegante.<br />

Negli scacchi se qualcuno<br />

sostiene <strong>di</strong> essere più bravo <strong>di</strong><br />

me, io gli posso sempre dare<br />

scaccomatto.<br />

Emanuel Lasker (1868-1941)<br />

9.1 Introduzione alle forme <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . . . . . . . . . . 139<br />

9.2 Integrali delle forme <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140<br />

9.3 Applicazione delle forme <strong>di</strong>fferenziali . . . . . . . . . . . . . . . . . . . . . . . . . . 143<br />

9.4 Teorema fondamentale per gli integrali curvilinei . . . . . . . . . . . . . . . . . . . 144<br />

9.5 Forme <strong>di</strong>fferenziali lineari esatte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144<br />

9.6 Le forme <strong>di</strong>fferenziali lineari chiuse . . . . . . . . . . . . . . . . . . . . . . . . . . . 149<br />

9.1 Introduzione alle forme <strong>di</strong>fferenziali<br />

Consideriamo una curva regolare γ nel piano data da equazioni parametriche<br />

x = x(t), y = y(t), a ≤ t ≤ b<br />

Sia data una funzione f(x, y) <strong>di</strong>pendente da due variabili. Possiamo pensare <strong>di</strong> integrare la<br />

funzione f sulla curva γ rispetto a x o rispetto a y (quin<strong>di</strong> non sull’arco <strong>di</strong> curva, ds, ma in<br />

dx o dy).<br />

Si ha l’integrale curvilineo <strong>di</strong> f rispetto a x dato da<br />

∫<br />

γ<br />

f(x, y)dx =<br />

∫ b<br />

a<br />

f(x(t), y(t))x ′ (t)dt<br />

Si ha l’integrale curvilineo <strong>di</strong> f rispetto a y dato da<br />

∫<br />

γ<br />

f(x, y)dy =<br />

∫ b<br />

a<br />

f(x(t), y(t))y ′ (t)dt<br />

139


9. FORME DIFFERENZIALI<br />

Infatti poichè x = x(t), allora dx = x ′ (t)dt. Analogo è il ragionamento per la y.<br />

Spesso questi due integrali appaiono insieme: se X e Y sono due funzioni nelle variabili<br />

x e y e se γ è una curva (data da equazioni parametriche come in precedenza), allora<br />

∫<br />

∫ b<br />

Xdx + Y dy = X(x, y)dx + Y (x, y)dy<br />

γ<br />

=<br />

=<br />

a<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

X(x(t), y(t))x ′ (t)dt + Y (x(t), y(t))y ′ (t)dt<br />

(X(x(t), y(t))x ′ (t) + Y (x(t), y(t))y ′ (t)) dt<br />

L’espressione che abbiamo scritto come funzione integranda Xdx + Y dy prende il nome <strong>di</strong><br />

forma <strong>di</strong>fferenziale.<br />

Possiamo dare allora la seguente definizione<br />

Definizione 9.1.1 Date X e Y due funzioni definite in I ⊂ R 2 , si chiama forma <strong>di</strong>fferenziale<br />

lineare ω (o forma lineare) l’espressione<br />

ω = Xdx + Y dy = X(x, y)dx + Y (x, y)dy<br />

Le funzioni X e Y si chiamano coefficienti della forma <strong>di</strong>fferenziale.<br />

Se i coefficienti sono <strong>di</strong> classe C p , la forma <strong>di</strong>fferenziale si <strong>di</strong>ce <strong>di</strong> classe C p .<br />

Per una forma <strong>di</strong>fferenziale, si possono definire le seguenti operazioni:<br />

G dato un vettore r = (r 1 , r 2 ) e (x, y) ∈ I, il prodotto scalare tra ω e r è:<br />

ω · r = X(x, y)r 1 + Y (x, y)r 2<br />

G dato uno scalare c ∈ R e una funzione f definita in I e a valori in R si definisce la<br />

moltiplicazione della forma <strong>di</strong>fferenziale per c e per f nel modo seguente:<br />

cω = cXdx + cY dy<br />

fω = (fX)dx + (fY )dy<br />

G Date due forme <strong>di</strong>fferenziali ω 1 e ω 2 , si definisce ad<strong>di</strong>zione <strong>di</strong> ω 1 e <strong>di</strong> ω 2 la seguente<br />

forma:<br />

ω 1 + ω 2 = (X 1 dx + Y 1 dy) + (X 2 dx + Y 2 dy) = (X 1 + X 2 )dx + (Y 1 + Y 2 )dy<br />

Con queste operazione, l’insieme delle forme <strong>di</strong>fferenziali lineari, definite in un insieme I ⊂ R,<br />

è uno spazio vettoriale.<br />

Consideriamo, ora, il <strong>di</strong>fferenziale <strong>di</strong> una funzione f(x, y). Si ha df = f x dx+f y dy. Quin<strong>di</strong> il<br />

<strong>di</strong>fferenziale <strong>di</strong> una funzione f si può vedere come una forma <strong>di</strong>fferenziale lineare. Non vale,<br />

ovviamente, il viceversa: data una forma lineare, non è detto che ci sia una funzione f il cui<br />

<strong>di</strong>fferenziale coincida con la forma lineare stessa.<br />

9.2 Integrali delle forme <strong>di</strong>fferenziali<br />

Abbiamo introdotto le forme <strong>di</strong>fferenziali introducendo <strong>degli</strong> integrali curvilinei fatti rispetto<br />

a x e rispetto a y. Le forme <strong>di</strong>fferenziali, infatti, vengono utilizzate in integrali<br />

curvilinei.<br />

Data una curva regolare γ con il suo orientamento naturale, quin<strong>di</strong> una curva +γ, che<br />

puó essere scritta in forma parametrica tramite le equazioni<br />

140<br />

x = x(t), y = y(t), a ≤ t ≤ b


9.2. Integrali delle forme <strong>di</strong>fferenziali<br />

si definisce integrale curvilineo (o <strong>di</strong> linea) della forma <strong>di</strong>fferenziale ω sulla curva +γ,<br />

l’integrale<br />

∫ ∫<br />

∫ b<br />

ω = Xdx + Y dy = (X(x(t), y(t)x ′ (t) + Y (x(t), y(t))y ′ (t)) dt<br />

+γ<br />

+γ<br />

a<br />

Se scriviamo le equazioni parametriche della curva usando una funzione vettoriale f =<br />

(x(t), y(t)), l’integrale <strong>di</strong> prima può essere scritto come<br />

∫ ∫ b<br />

ω = ω(f(t)) · f ′ (t)dt<br />

+γ<br />

a<br />

Difatti il prodotto scalare ω(f(t)) · f ′ (t) altro non è che la funzione integranda che abbiamo<br />

scritto prima X(x(t), y(t)x ′ (t) + Y (x(t), y(t))y ′ (t).<br />

Ora cerchiamo <strong>di</strong> vedere cosa succede se facciamo l’integrale <strong>di</strong> una forma <strong>di</strong>fferenziale<br />

su una curva +γ o sulla curva opposta −γ. Ve<strong>di</strong>amolo con un esempio.<br />

Esempio<br />

Es. 9.2.1 Sia ω = yx 2 dx + sin (πy)dy. Quin<strong>di</strong> X(x, y) = yx 2 , e Y (x, y) = sin (πy).<br />

La curva +γ sia il segmento che va dal punto (0, 2) al punto (1, 4).<br />

La curva +γ in forma parametrica può essere scritta come<br />

x = t, y = 2t + 2, 0 ≤ t ≤ 1<br />

Per t = 0 si ha (0, 2), per t = 1 si ha (1, 4).<br />

Calcoliamo ∫ +γω. Si ha<br />

∫<br />

+γ<br />

ω =<br />

=<br />

∫ 1<br />

0<br />

∫ 1<br />

0<br />

(<br />

y(t)x(t) 2 x ′ (t) + sin (πy(t))y ′ (t) ) ∫ 1<br />

(<br />

dt = (2t + 2)t 2 + sin (π(2t + 2))2 ) dt<br />

(<br />

2t 3 + 2t 2 + 2 sin (π(2t + 2)) ) dt = 2 t4 4 + 2t3 3 − 1 π<br />

= 1 2 + 2 3 − 1 π + 1 π = 7 6<br />

0<br />

cos (π(2t + 2))|t=1 t=0<br />

Ve<strong>di</strong>amo ora cosa succede se integriamo lungo la curva opposta −γ (ricor<strong>di</strong>amo che quando<br />

abbiamo definito l’integrale curvilineo <strong>di</strong> una funzione lungo una curva γ, integrando<br />

lungo la curva, cioè rispetto all’ascissa curvilinea ds, abbiamo detto che l’integrale non<br />

<strong>di</strong>pende dall’orientamento della curva. In questo caso invece, le cose cambiano):<br />

La curva opposta −γ ha equazioni parametriche<br />

x = −t, y = −2t + 2, −1 ≤ t ≤ 0<br />

Per t = −1 si ha (1, 4), per t = 0 si ha (0, 2).<br />

Si ha dunque<br />

∫<br />

−γ<br />

ω =<br />

=<br />

∫ 0<br />

−1<br />

∫ 0<br />

−1<br />

yx 2 dx + sin (πy)dy =<br />

∫ 0<br />

−1<br />

(<br />

(−2t + 2)(−t) 2 (−1) + sin (π(−2t + 2))(−2) ) dt<br />

(<br />

2t 3 − 2t 2 − 2 sin (π(−2t + 2)) ) dt = 2 t4 4 − 2t3 3 − 1 π<br />

= − 1 π − 1 2 − 2 3 + 1 π = −7 6<br />

cos (π(−2t + 2))|t=0 t=−1<br />

Osserviamo dunque che il valore dell’integrale che abbiamo ottenuto sulla curva opposta<br />

−γ è l’opposto dell’integrale che avevamo ottenuto sulla curva +γ.<br />

141


9. FORME DIFFERENZIALI<br />

Vale infatti il seguente teorema<br />

Teorema 9.2.1 Data una forma <strong>di</strong>fferenziale ω e una curva regolare +γ si ha<br />

∫ ∫<br />

ω = − ω<br />

−γ<br />

+γ<br />

Dimostrazione. Dimostriamo questo teorema considerando che se una curva +γ è data<br />

da f = (x(t), y(t)) con a ≤ t ≤ b, la curva opposta si può scrivere come −γ con F = (˜x(t), ỹ(t)) =<br />

(x(−t), y(−t)) con −b ≤ t ≤ −a Quin<strong>di</strong> ˜x ′ (t) è uguale alla derivata della funzione x(−t) che va<br />

vista come la funzione composta x(h(t)) con h(t) = −t. Derivando, quin<strong>di</strong>, si ha la derivata <strong>di</strong><br />

x valutata in h(t) = −t per la derivata <strong>di</strong> h(t) che vale −1, da cui: ˜x ′ (t) = x ′ (−t)(−1) = −x ′ (−t).<br />

Analogamente, vale ỹ(−t) = −y ′ (−t).<br />

Allora<br />

∫ ∫ −a<br />

ω = (X(˜x(t), ỹ(t))˜x ′ (t) + Y (˜x(t), ỹ(t)), ỹ ′ (t)) dt<br />

−γ<br />

=<br />

=<br />

−b<br />

∫ −a<br />

−b<br />

∫ −a<br />

−b<br />

(X(x(−t), y(−t))(−x ′ (−t)) + Y (x(−t), y(−t)), (−y ′ (−t))) dt<br />

− (X(x(−t), y(−t))x ′ (−t) + Y (x(−t), y(−t))y ′ (−t)) dt<br />

facendo il cambiamento <strong>di</strong> variabili u = −t, du = −dt<br />

e considerando che per t = −b, u = b, e per t = −a, u = a<br />

=<br />

∫ a<br />

b<br />

∫ b<br />

= −<br />

∫<br />

= −<br />

(X(x(u), y(u))x ′ (u) + Y (x(u), y(u))y ′ (u)) du<br />

a<br />

+γ<br />

(X(x(u), y(u))x ′ (u) + Y (x(u), y(u))y ′ (u)) du<br />

ω<br />

✔<br />

Quin<strong>di</strong> nel fare gli integrali curvilinei delle forme <strong>di</strong>fferenziali occorre prestare molta attenzione<br />

all’orientamento della curva. Per questo motivo, gli integrali curvilinei delle forme<br />

<strong>di</strong>fferenziali sono detti integrali orientati.<br />

Invece, anche per le forme <strong>di</strong>fferenziali, l’integrale curvilineo non <strong>di</strong>pende dal tipo <strong>di</strong><br />

rappresentazione utilizzata per la curva, cioè non <strong>di</strong>pende dalla scelta della rappresentazione<br />

parametrica.<br />

Si ha infatti la seguente proposizione<br />

Proposizione 9.2.1 L’integrale curvilineo ∫ ω non <strong>di</strong>pende dalla particolare rappresentazione<br />

della curva regolare<br />

+γ<br />

+γ.<br />

Dimostrazione. Sia data la curva +γ tramite la funzione f = (x(t), y(t)), con a ≤ t ≤ b o,<br />

in maniera equivalente, tramite la funzione F = (x F (u), y F (u)), con α ≤ u ≤ β . Sappiamo che,<br />

dovendo rappresentare la medesima curva, le due funzioni f e F sono legate tra loro me<strong>di</strong>ante<br />

una funzione φ : [α, β] ⇒ [a, b] con φ ′ (u) > 0, tale che φ(α) = a, φ(β) = b e F(u) = f(φ(u))<br />

Torniamo all’integrale curvilineo. Da una parte<br />

∫<br />

+γ<br />

ω =<br />

∫ b<br />

a<br />

(X(x(t), y(t))x ′ (t) + Y (x(t), y(t))y ′ (t)) dt<br />

142


9.3. Applicazione delle forme <strong>di</strong>fferenziali<br />

Dall’altra si ha:<br />

∫ ∫ β<br />

ω = (X(x F (u), y F (u))x ′ F (u) + Y (x F (u), y F (u))y F ′ (u)) du<br />

+γ<br />

α<br />

Ma per la relazione che lega F a f si ha:<br />

F(u) = f(φ(u))<br />

(x F (u), y F (u)) = (x(φ(u), y(φ(u))<br />

+γ<br />

x ′ F (u) = x ′ (φ(u))φ ′ (u)<br />

y ′ F (u) = y ′ (φ(u))φ ′ (u)<br />

Quin<strong>di</strong> si ha<br />

∫ ∫ β<br />

ω = (X(x F (u), y F (u))x ′ F (u) + Y (x F (u), y F (u))y F ′ (u)) du<br />

=<br />

α<br />

∫ β<br />

α<br />

(X(x(φ(u)), y(φ(u)))x ′ (φ(u))φ ′ (u) + Y (x(φ(u)), y(φ(u)))y ′ (φ(u))φ ′ (u)) du<br />

mettendo in evidenza φ ′ (u)<br />

=<br />

∫ β<br />

α<br />

(X(x(φ(u)), y(φ(u)))x ′ (φ(u)) + Y (x(φ(u)), y(φ(u)))y ′ (φ(u))) φ ′ (u)du<br />

operando il cambiamento <strong>di</strong> variabili t = φ(u)<br />

e considerando dt = φ ′ (u)du<br />

e il cambiamento agli estremi u = α ⇒ t = a, u = β ⇒ t = b<br />

=<br />

∫ b<br />

a<br />

(X(x(t), y(t))x ′ (t) + Y (x(t), y(t))y ′ (t)) dt<br />

Abbiamo provato che la rappresentazione parametrica della curva non influisce sul risultato<br />

finale perchè gli integrali coincidono qualunque sia la rappresentazione parametrica per<br />

descrivere la stessa curva. ✔<br />

Per gli integrali curvilinei sulle forme <strong>di</strong>fferenziali valgono anche le seguenti proprietà:<br />

G se c ∈ R, ∫ +γ cω = c ∫ +γ ω<br />

G ∫ +γ ω 1 + ω 2 = ∫ +γ ω 1 + ∫ +γ ω 2<br />

G se la curva +γ viene sud<strong>di</strong>visa in un certo numero k <strong>di</strong> curve regolari, tali che +γ =<br />

+γ 1 ∪+γ 2 ∪. . .∪+γ k o se la curva è regolare a tratti, allora ∫ +γ ω = ∫ +γ 1<br />

ω+ ∫ +γ 2<br />

ω+. . .+ ∫ +γ k<br />

ω<br />

9.3 Applicazione delle forme <strong>di</strong>fferenziali<br />

In molte applicazioni soprattutto nella fisica, ci si trova a lavorare con funzioni vettoriali<br />

da integrare su curve. Sia F ⃗ = X(x, y)⃗i + Y (x, y)⃗j una funzione vettoriale (scritta in funzione<br />

dei versori <strong>degli</strong> assi x e y rispettivamente). Sia data una curva regolare +γ data da ⃗r =<br />

x(t)⃗i + y(t)⃗j (è la stessa cosa <strong>di</strong> scrivere f = (x(t), y(t)))) con a ≤ t ≤ b.<br />

Si definisce integrale curvilineo del vettore F ⃗ lungo la curva +γ l’integrale<br />

∫<br />

∫ b<br />

⃗F · d⃗r = ⃗F (⃗r) · ⃗r ′ (t)dt<br />

+γ<br />

a<br />

Poichè F ⃗ (⃗r) = F ⃗ (x(t), y(t)) = X(x(t), y(t))⃗i + Y (x(t), y(t))⃗j e ⃗r ′ (t) = x ′ (t)⃗i + y ′ (t)⃗j, risulta<br />

∫<br />

∫ b<br />

⃗F · d⃗r = (X(x(t), y(t))⃗i + Y (x(t), y(t))⃗j) · (x ′ (t)⃗i + y ′ (t)⃗j)dt<br />

+γ<br />

=<br />

a<br />

∫ b<br />

a<br />

(X(x(t), y(t))x ′ (t) + Y (x(t), y(t))y ′ (t)) dt<br />

143


9. FORME DIFFERENZIALI<br />

Abbiamo ritrovato la definizione <strong>di</strong> integrale curvilineo <strong>di</strong> una forma <strong>di</strong>fferenziale, dove i<br />

coefficienti della forma <strong>di</strong>fferenziale sono le componenti del vettore ⃗ F .<br />

Un esempio in cui ve<strong>di</strong>amo applicata una forma <strong>di</strong>fferenziale in fisica è il lavoro compiuto<br />

da un campo <strong>di</strong> forze. Se consideriamo una particella che si muove lungo una curva, in<strong>di</strong>cando<br />

con ⃗s la <strong>di</strong>stanza percorsa dalla particella lungo la curva +γ, e con ⃗ F = (X, Y ) una<br />

forza che agisce sulla particella mentre essa si sposta <strong>di</strong> d⃗s, si definisce lavoro elementare<br />

eseguito da ⃗ F il prodotto scalare:<br />

dL = ⃗ F · d⃗s<br />

In coor<strong>di</strong>nate cartesiane, e limitandoci al caso bi<strong>di</strong>mensionale, si può scrivere<br />

dL = Xdx + Y dy<br />

Il lavoro elementare è dunque una forma <strong>di</strong>fferenziale.<br />

Il lavoro totale lungo tutta la curva +γ è invece definito tramite l’integrale della forma<br />

<strong>di</strong>fferenziale dL:<br />

∫ ∫ b<br />

L = dL = X(x(t), y(t))dx + Y (x(t), y(t))dy<br />

+γ<br />

a<br />

9.4 Teorema fondamentale per gli integrali curvilinei<br />

Teorema 9.4.1 Assegnata una funzione f(x, y), si consideri la forma <strong>di</strong>fferenziale data dal<br />

suo <strong>di</strong>fferenziale: ω = df = f x dx + f y dy.<br />

Data una curva regolare +γ espressa me<strong>di</strong>ante rappresentazione parametrica da (x(t), y(t))<br />

(o me<strong>di</strong>ante la funzione vettoriale ⃗r) , si ha<br />

∫<br />

df = f(x(b), y(b)) − f(x(a), y(a))<br />

✔<br />

+γ<br />

Questo risultato equivale anche a <strong>di</strong>re che<br />

∫<br />

∇f · d⃗r = f(x(b), y(b)) − f(x(a), y(a))<br />

+γ<br />

Dimostrazione.<br />

Si ha<br />

∫ ∫ b<br />

df = (f x (x(t), y(t))x ′ (t) + f y (x(t), y(t))y ′ (t)) dt<br />

+γ<br />

a<br />

per le regole <strong>di</strong> derivazione delle funzioni composte<br />

=<br />

∫ b<br />

a<br />

df(x(t), y(t))<br />

dt<br />

dt<br />

= f(x(t), y(t))| t=b<br />

t=a<br />

= f(x(b), y(b)) − f(x(a), y(a))<br />

9.5 Forme <strong>di</strong>fferenziali lineari esatte<br />

Definizione 9.5.1 Una forma <strong>di</strong>fferenziale ω = Xdx + Y dy (definita in un insieme aperto e <strong>di</strong><br />

classe C 0 ) si <strong>di</strong>ce esatta se esiste almeno una funzione F (<strong>di</strong> classe C 1 ) tale che dF = ω vale a<br />

<strong>di</strong>re se F x = X e F y = Y .<br />

144


9.5. Forme <strong>di</strong>fferenziali lineari esatte<br />

Figura 9.1: A, B e C sono esempi <strong>di</strong> insiemi connessi.<br />

Figura 9.2: L’insieme A costituito dall’unione dei tre insiemi non è un insieme connesso.<br />

Si <strong>di</strong>ce anche che F è una primitiva <strong>di</strong> ω.<br />

Ve<strong>di</strong>amo ora un particolare tipo <strong>di</strong> insieme che ci permette <strong>di</strong> stabilire alcune importanti<br />

proprietà per le forme <strong>di</strong>fferenziali, se definite su questi insiemi. Si tratta <strong>degli</strong> insiemi<br />

connessi.<br />

Definizione 9.5.2 Un insieme aperto A ⊂ R 2 si <strong>di</strong>ce connesso se, qualunque siano i punti P<br />

e Q presi in A, esiste una linea poligonale che è contenuta tutta in A e che ha P e Q come<br />

estremi.<br />

Per funzioni definite su insiemi connessi vale questo Lemma.<br />

Lemma 9.5.1 Sia f una funzione <strong>di</strong> classe C 1 definita in un insieme aperto e connesso A <strong>di</strong><br />

R 2 . Se, per ogni (x, y) ∈ A risulta f x (x, y) = f y (x, y) = 0, allora f è una funzione costante in A.<br />

145


9. FORME DIFFERENZIALI<br />

Dimostrazione. Consideriamo due punti, P = (x, y) e P 0 = (x 0 , y 0 ) in A. Dalla definizione<br />

<strong>di</strong> insieme connesso, sappiamo che esiste una linea poligonale che congiunge P e P 0 e che<br />

si trova all’interno <strong>di</strong> A. Per semplicità supponiamo che la linea poligonale sia il segmento<br />

congiungente i due punti. Allora, per il teorema <strong>di</strong> Lagrange, si ha<br />

f(P ) = f(P 0 ) + f x (Q)(x − x 0 ) + f y (Q)(y − y 0 )<br />

con Q punto che non conosciamo, che si trova sul segmento congiungente P e P 0 . Poichè<br />

f x (Q) = f y (Q) = 0 (e questo qualunque sia il punto Q), si ha<br />

f(P ) = f(P 0 )<br />

Possiamo variare il punto P , lasciando fisso P 0 ma avremo sempre lo stesso risultato, quin<strong>di</strong><br />

la funzione assume valore costante.<br />

Se, al posto <strong>di</strong> un segmento congiungente P e P 0 , abbiamo una linea spezzata, si ripete il<br />

ragionamento su ciascun segmento arrivando alla stessa conclusione. ✔<br />

Per le forme <strong>di</strong>fferenziali, vale il seguente lemma.<br />

Lemma 9.5.2 Se F e G sono primitive, <strong>di</strong> classe C 1 , definite in un insieme aperto e connesso,<br />

della stessa forma <strong>di</strong>fferenziale lineare ω, allora <strong>di</strong>fferiscono per una costante.<br />

Dimostrazione. Poichè, per ipotesi, F e G sono primitive <strong>di</strong> ω = Xdx + Y dy, vuol <strong>di</strong>re che<br />

F x = G x = X, F y = G y = Y . Consideriamo la funzione f = F − G. Questa funzione è definita<br />

in un insieme aperto e connesso (come la forma lineare) ed è <strong>di</strong> classe C 1 (essendolo F e G).<br />

Si ha f x = F x − G x = X − X = 0 e f y = F y − G y = Y − Y = 0, e questo qualunque sia (x, y) preso<br />

nell’insieme <strong>di</strong> definizione. Ma, allora, sono sod<strong>di</strong>sfatte le ipotesi del lemma precedente e<br />

quin<strong>di</strong> f è una funzione costante: f(x, y) = cost. Di conseguenza, F (x, y) − G(x, y) = cost, cioè<br />

F e G <strong>di</strong>fferiscono per una costante: F (x, y) = G(x, y) + cost. ✔<br />

Consideriamo ora i seguenti teoremi sulle forme <strong>di</strong>fferenziali lineari esatte.<br />

Teorema 9.5.1 Data ω = Xdx + Y dy una forma <strong>di</strong>fferenziale lineare, <strong>di</strong> classe C 0 e definita<br />

in un insieme aperto e connesso, se F è una sua primitiva, allora ogni primitiva <strong>di</strong> ω è del tipo<br />

F + cost con cost una costante.<br />

Dimostrazione. Se F è una primitiva <strong>di</strong> ω, la funzione G = F +cost è anch’essa primitiva,<br />

in quanto G x = F x = X e G y = F y = Y (poichè la derivata <strong>di</strong> una costante rispetto a x e a y<br />

vale zero).<br />

Supponendo <strong>di</strong> conoscere un’altra primitiva <strong>di</strong> ω, G, poichè si ha sempre G x = X e<br />

G y = Y , per il lemma precedente, si ha ancora che G e F <strong>di</strong>fferiscono per una costante,<br />

quin<strong>di</strong> G = F + cost. ✔<br />

L’insieme delle primitive <strong>di</strong> una forma <strong>di</strong>fferenziale lineare ω in un insieme aperto e connesso<br />

prende il nome <strong>di</strong> integrale indefinito, propriò perchè, nota una primitiva, tutte le altre<br />

<strong>di</strong>fferiscono per una costante.<br />

Teorema 9.5.2 Dato A ⊂ R 2 aperto e connesso e data una forma <strong>di</strong>fferenziale lineare ω <strong>di</strong><br />

classe C 0 in A, le seguenti proposizioni sono equivalenti:<br />

1. ω è esatta.<br />

2. Se P 0 e P sono due punti qualunque in A e +γ 1 e +γ 2 sono due curve generalmente<br />

regolari orientate contenute in A, che hanno entrambe come primo estremo P 0 e come<br />

secondo estremo P , allora<br />

∫ ∫<br />

ω = ω<br />

+γ 1 +γ 2<br />

146<br />

vale a <strong>di</strong>re l’integrale curvilineo <strong>di</strong>pende solo dagli estremi P 0 e P e non dal cammino<br />

percorso.


9.5. Forme <strong>di</strong>fferenziali lineari esatte<br />

Figura 9.3: Le curve +γ 1 e +γ 2 hanno gli stessi estremi P 0 e P . La curva −γ 2 opposta a +γ 2<br />

ha come estremi P e P 0 .<br />

3. Se γ è una qualunque curva generalmente regolare, chiusa e contenuta in A, allora<br />

∫<br />

ω = 0<br />

+γ<br />

Dimostrazione. Di questo teorema, <strong>di</strong>mostriamo che (1) ⇒ (2), (2) ⇒ (3) e (3) ⇒ (2).<br />

(1) ⇒ (2) Sia per ipotesi ω = Xdx + Y dy esatta. Siano dati due punti P 0 e P in A e<br />

sia +γ una curva generalmente regolare che ha P 0 come primo estremo e P come secondo<br />

estremo. In forma parametrica, le equazioni della curva +γ siano<br />

x = x(t) y = y(t) a ≤ t ≤ b<br />

Quin<strong>di</strong> (x(a), y(a)) = (x 0 , y 0 ) = P 0 , e (x(b), y(b)) = (x, y) = P .<br />

Sia F una primitiva <strong>di</strong> ω (esiste perchè ω è esatta: vuol <strong>di</strong>re che dF = ω, poichè F x = X e<br />

F y = Y .<br />

Ma allora per il teorema fondamentale del calcolo <strong>degli</strong> integrali (si veda teorema 9.4.1)<br />

∫ ∫<br />

ω = dF = F (P ) − F (P 0 )<br />

+γ<br />

+γ<br />

L’integrale non <strong>di</strong>pende dalla particolare curva +γ ma solo dagli estremi della curva e dalla<br />

primitiva F . Perciò, date due curve +γ 1 e +γ 2 il risultato dell’integrale non cambia (si veda<br />

Figura 9.3). La (2) è provata.<br />

(2) ⇒ (3) Sia +γ una curva generalmente regolare chiusa data da equazioni<br />

parametriche<br />

x = x(t) y = y(t) a ≤ t ≤ b<br />

Si fissi un punto t ′ interno all’intervallo [a, b] e si considerino le due curve che si ottengono<br />

da +γ facendo variare il parametro t in [a, t ′ ] e in [t ′ , b] in modo che +γ sia dato dall’unione<br />

<strong>di</strong> queste due curve, che chiamiamo, rispettivamente +γ 1 e +γ 2 . La curva +γ 1 ha come<br />

primo estremo P 0 e come secondo estremo il punto T = (x(t ′ ), y(t ′ ). La curva +γ 2 ha come<br />

primo estremo T e come secondo estremo P 0 (essendo la curva chiusa e quin<strong>di</strong> (x(a), y(a)) =<br />

(x(b), y(b))).<br />

La curva opposta a +γ 2 è la curva −γ 2 e ha, quin<strong>di</strong>, come primo estremo P 0 e come<br />

secondo estremo T .<br />

Dunque, le curve +γ 1 e −γ 2 hanno gli stessi estremi P 0 e T . Ora, per l’ipotesi (2) sappiamo<br />

che ∫ ∫<br />

ω = ω<br />

+γ 1 −γ 2<br />

147


9. FORME DIFFERENZIALI<br />

Ma sappiamo anche che<br />

∫ ∫<br />

ω = −<br />

−γ 2<br />

Quin<strong>di</strong><br />

∫ ∫<br />

ω = −<br />

+γ 1<br />

+γ 2<br />

ω<br />

+γ 2<br />

ω<br />

da cui<br />

∫ ∫<br />

ω + ω = 0<br />

+γ 1 +γ 2<br />

Torniamo all’integrale su tutta la curva +γ: poichè +γ = +γ 1 ∪ +γ 2 si ha<br />

∫<br />

ω =<br />

+γ<br />

∫<br />

ω +<br />

+γ 1<br />

∫<br />

ω<br />

+γ 2<br />

Ma la somma <strong>di</strong> questi due integrali vale zero, quin<strong>di</strong><br />

∫<br />

ω = 0<br />

+γ<br />

L’asserto è dunque provato.<br />

(3) ⇒ (2) Siano date due curve +γ 1 e +γ 2 due curve generalmente regolari che hanno<br />

gli stessi estremi P 0 e P . Allora la curva +γ 1 ∪ −γ 2 è una curva chiusa generalmente regolare.<br />

Per la (3) vale<br />

∫<br />

+γ 1∪−γ 2<br />

ω = 0<br />

Ma<br />

∫ ∫ ∫<br />

ω = ω +<br />

+γ 1∪−γ 2 +γ 1<br />

Quin<strong>di</strong><br />

∫ ∫<br />

ω + ω = 0<br />

+γ 1 −γ 2<br />

−γ 2<br />

ω<br />

da cui<br />

∫ ∫ ∫ ∫<br />

ω = − ω ⇒ ω = ω<br />

+γ 1 −γ 2 +γ 1 +γ 2<br />

Abbiamo verificato il punto (2).<br />

Per completare la <strong>di</strong>mostrazione del teorema, andrebbe <strong>di</strong>mostrato che (2) ⇒ (1). Poichè<br />

la <strong>di</strong>mostrazione è abbastanza complicata, la tralasciamo. ✔<br />

Come corollario si ha<br />

Proposizione 9.5.1 Siano A ⊂ R 2 un insieme aperto e connesso e ω una forma <strong>di</strong>fferenziale<br />

lineare <strong>di</strong> classe C 0 in A, con F primitiva. Allora, se +γ è una curva generalmente regolare e<br />

orientata contenuta in A, che ha come primo estremo P 0 e come secondo estremo P , si ha<br />

∫<br />

ω = F (P ) − F (P 0 )<br />

+γ<br />

Dimostrazione.<br />

precedente. ✔<br />

148<br />

Questo risultato lo abbiamo <strong>di</strong>mostrato al punto (1) ⇒ (2) del teorema


9.6. Le forme <strong>di</strong>fferenziali lineari chiuse<br />

9.6 Le forme <strong>di</strong>fferenziali lineari chiuse<br />

Definizione 9.6.1 Una forma <strong>di</strong>fferenziale lineare ω = Xdx + Y dy <strong>di</strong> classe C 1 in A, insieme<br />

aperto <strong>di</strong> R 2 , si <strong>di</strong>ce chiusa se per ogni punto P <strong>di</strong> A risulta<br />

∂X<br />

∂y = ∂Y<br />

∂x<br />

Teorema 9.6.1 Data ω = Xdx+Y dy una forma <strong>di</strong>fferenziale lineare <strong>di</strong> classe C 1 in un insieme<br />

aperto A ⊂ R 2 , ω esatta =⇒ ω chiusa.<br />

Dimostrazione. Se ω è esatta, vuol <strong>di</strong>re che esiste una primitiva, F , tale che F x = X<br />

e F y = Y . Per ipotesi ω è <strong>di</strong> classe C 1 , cioè le derivate parziali <strong>di</strong> X e Y sono continue. Di<br />

conseguenza F è <strong>di</strong> classe C 2 (poichè le sue derivate parziali del secondo or<strong>di</strong>ne coincidono<br />

con le derivate parziali prime <strong>di</strong> X e Y ). Inoltre si ha<br />

∂F 2<br />

∂x∂y = ∂X<br />

∂y<br />

e<br />

∂F 2<br />

∂y∂x = ∂Y<br />

∂x<br />

Per il teorema <strong>di</strong> Schwartz, le derivate parziali miste <strong>di</strong> F coincidono,<br />

risulta<br />

∂X<br />

∂y = ∂Y<br />

∂x<br />

∂F 2<br />

∂x∂y = ∂F 2<br />

∂y∂x , quin<strong>di</strong><br />

L’asserto è provato. ✔<br />

Osserviamo che il viceversa non vale sempre. Si possono avere forme <strong>di</strong>fferenziali chiuse che<br />

non sono esatte.<br />

Per poter avere l’implicazione ω chiusa ⇒ ω esatta, la forma <strong>di</strong>fferenziale lineare deve<br />

essere definita in un insieme particolare. Introduciamo, perciò, la definizione <strong>di</strong> insieme<br />

semplicemente connesso.<br />

Definizione 9.6.2 Un sottoinsieme <strong>di</strong> R 2 , A aperto, si <strong>di</strong>ce semplicemente connesso se<br />

G è connesso<br />

G ogni curva generalmente regolare, chiusa e semplice contenuta in A è la frontiera <strong>di</strong> un<br />

insieme limitato contenuto in A.<br />

Dire che A è un insieme semplicemente connesso vuol <strong>di</strong>re che l’insieme è ”senza buchi“,<br />

in quanto ogni curva chiusa e semplice, generalmente regolare, può essere deformata con<br />

continuità fino a ridursi ad un singolo punto. Una corona circolare ha ”buchi“ e, infatti,<br />

non è semplicemente connesso. Il piano privato <strong>di</strong> un punto non è semplicemente connesso.<br />

L’interno <strong>di</strong> un cerchio è semplicemente connesso. La circonferenza non è semplicemente<br />

connesso.<br />

Teorema 9.6.2 Sia ω una forma <strong>di</strong>fferenziale lineare <strong>di</strong> classe C 1 in A aperto e semplicemente<br />

connesso. Allora se ω è chiusa, ω è esatta.<br />

149


Bibliografia<br />

[1] DAWKINS, P. (2007), Calculus I, Class <strong>Note</strong>s, http://tutorial.math.lamar.edu/<br />

terms.aspx.<br />

[2] DAWKINS, P. (2007), Calculus II, Class <strong>Note</strong>s, http://tutorial.math.lamar.edu/<br />

terms.aspx.<br />

[3] DAWKINS, P. (2007), Calculus III, Class <strong>Note</strong>s, http://tutorial.math.lamar.edu/<br />

terms.aspx.<br />

[4] GUICHARD, D. (2012), Calculus, Late Trascendentals, Creative Commons Attribution<br />

Non-Commercial-ShareAlike License, https://www.whitman.edu/mathematics/<br />

multivariable_late/.<br />

[5] KEISLER, H. J. (2009), Elementary Calculus, An Infinitesimal Approach, Creative Commons<br />

Attribution Non-Commercial-ShareAlike License, http://www.math.wisc.edu/<br />

~Keisler/calc.html.<br />

[6] STEWAR T, J. (2003), Calculus, Thomson-Brooks/Cole.<br />

[7] STEWAR T, J. (2007), Calculus, Early Transcendentals, Thomson,Brooks/Cole.<br />

[8] STRANG, G. (1991), Calculus, Wellesley-Cambridge Press.<br />

[9] TRENCH, W. F. (2012), Introduction to Real Analysis, Free Hyperlinked E<strong>di</strong>tion 2.00,<br />

February 2012.<br />

151

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!